ترجمه فارسی مقاله تعمیم خارج از توزیع از طریق ترکیب: یک لنز از طریق سرهای القایی در ترانسفورماتورها

820,000 تومان

دسته: مقاله علمی

توضیحات
نظرات (0)

عنوان مقاله به انگلیسی	Out-of-distribution generalization via composition: a lens through induction heads in Transformers
عنوان مقاله به فارسی	ترجمه فارسی مقاله تعمیم خارج از توزیع از طریق ترکیب: یک لنز از طریق سرهای القایی در ترانسفورماتورها
نویسندگان	Jiajun Song, Zhuoyan Xu, Yiqiao Zhong
فرمت مقاله انگلیسی	PDF
زبان مقاله تحویلی	ترجمه فارسی
فرمت مقاله ترجمه شده	به صورت فایل ورد
نحوه تحویل ترجمه	دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات	41
لینک دانلود رایگان مقاله انگلیسی	دانلود مقاله
دسته بندی موضوعات	Computation and Language,Artificial Intelligence,Machine Learning,Machine Learning,محاسبات و زبان , هوش مصنوعی , یادگیری ماشین , یادگیری ماشین ,
توضیحات	Submitted 18 August, 2024; originally announced August 2024. , Comments: 41 pages, 25 figures
توضیحات به فارسی	ارائه شده در 18 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد ، نظرات: 41 صفحه ، 25 شکل
اطلاعات بیشتر از این مقاله در پایگاه های علمی	INSPIRE HEP NASA ADS Google Scholar Semantic Scholar
فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

Large language models (LLMs) such as GPT-4 sometimes appear to be creative, solving novel tasks often with a few demonstrations in the prompt. These tasks require the models to generalize on distributions different from those from training data — which is known as out-of-distribution (OOD) generalization. Despite the tremendous success of LLMs, how they approach OOD generalization remains an open and underexplored question. We examine OOD generalization in settings where instances are generated according to hidden rules, including in-context learning with symbolic reasoning. Models are required to infer the hidden rules behind input prompts without any fine-tuning. We empirically examined the training dynamics of Transformers on a synthetic example and conducted extensive experiments on a variety of pretrained LLMs, focusing on a type of components known as induction heads. We found that OOD generalization and composition are tied together — models can learn rules by composing two self-attention layers, thereby achieving OOD generalization. Furthermore, a shared latent subspace in the embedding (or feature) space acts as a bridge for composition by aligning early layers and later layers, which we refer to as the common bridge representation hypothesis.

چکیده به فارسی (ترجمه ماشینی)

مدل های بزرگ زبان (LLMS) مانند GPT-4 گاهی اوقات خلاق به نظر می رسند و کارهای جدید را اغلب با چند تظاهرات در سریع حل می کنند.این وظایف به مدل ها نیاز دارند تا در توزیع های مختلف از داده های آموزش-که به عنوان تعمیم خارج از توزیع (OOD) شناخته می شود ، تعمیم دهد.علیرغم موفقیت فوق العاده LLMS ، نحوه نزدیک شدن به تعمیم عمومی ، همچنان یک سؤال باز و نامشخص است.ما تعمیم OOD را در تنظیماتی که نمونه ها طبق قوانین پنهان تولید می شوند ، از جمله یادگیری درون متن با استدلال نمادین ، بررسی می کنیم.مدل ها برای استنباط قوانین پنهان در پشت ارسال های ورودی و بدون تنظیم دقیق استنباط می شوند.ما به طور تجربی پویایی آموزش ترانسفورماتورها را در یک مثال مصنوعی مورد بررسی قرار دادیم و آزمایش های گسترده ای را در مورد انواع LLM های پیش ساخته انجام دادیم ، با تمرکز بر نوعی از مؤلفه های شناخته شده به عنوان سرهای القایی.ما دریافتیم که تعمیم و ترکیب OOD با هم گره خورده است-مدل ها می توانند با آهنگسازی دو لایه خودآگاهی ، قوانین را بیاموزند و از این طریق به تعمیم OOD دست یابند.علاوه بر این ، یک فضای مشترک نهفته در فضای تعبیه (یا ویژگی) به عنوان پلی برای ترکیب با تراز کردن لایه های اولیه و لایه های بعدی عمل می کند ، که ما از آن به عنوان فرضیه بازنمایی پل مشترک یاد می کنیم.

فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله تعمیم خارج از توزیع از طریق ترکیب: یک لنز از طریق سرهای القایی در ترانسفورماتورها”

ترجمه فارسی مقاله تعمیم خارج از توزیع از طریق ترکیب: یک لنز از طریق سرهای القایی در ترانسفورماتورها

چکیده

چکیده به فارسی (ترجمه ماشینی)

نقد و بررسی‌ها

محصولات مرتبط

مقاله تشخیص گفتار بصری چند زبانه با یک مدل واحد با یادگیری با واحدهای گفتار بصری گسسته

مقاله ادغام تخریب و بازیابی ظریف از طریق سازگاری مبتنی بر نیاز

مقاله محافظت از آثار هنری در برابر انتقال سبک عصبی با استفاده از حمله رنگی خصمانه تطابق پذیر

مقاله تقسیم بندی CT کبد از طریق رمزگذاری مبتنی بر PVT و رمزگشایی تصفیه شده