| عنوان مقاله به انگلیسی | Context-Aware Assistant Selection for Improved Inference Acceleration with Large Language Models | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله انتخاب دستیار آگاه از زمینه برای بهبود شتاب استنتاج با مدلهای زبان بزرگ | ||||||||
| نویسندگان | Jerry Huang, Prasanna Parthasarathi, Mehdi Rezagholizadeh, Sarath Chandar | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 14 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Machine Learning,Artificial Intelligence,یادگیری ماشین , هوش مصنوعی , | ||||||||
| توضیحات | Submitted 15 August, 2024; originally announced August 2024. , Comments: 14 pages (9 pages main content + references + appendix) | ||||||||
| توضیحات به فارسی | ارسال شده در 15 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد ، نظرات: 14 صفحه (9 صفحه محتوای اصلی + منابع + منابع + پیوست) | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
Despite their widespread adoption, large language models (LLMs) remain prohibitive to use under resource constraints, with their ever growing sizes only increasing the barrier for use. One noted issue is the high latency associated with auto-regressive generation, rendering large LLMs use dependent on advanced computing infrastructure. Assisted decoding, where a smaller draft model guides a larger target model’s generation, has helped alleviate this, but remains dependent on alignment between the two models. Thus if the draft model is insufficiently capable on some domain relative to the target model, performance can degrade. Alternatively, one can leverage multiple draft models to better cover the expertise of the target, but when multiple black-box draft models are available, selecting an assistant without details about its construction can be difficult. To better understand this decision making problem, we observe it as a contextual bandit, where a policy must choose a draft model based on a context. We show that even without prior knowledge of the draft models, creating an offline dataset from only outputs of independent draft/target models and training a policy over the alignment of these outputs can accelerate performance on multiple domains provided the candidates are effective. Further results show this to hold on various settings with multiple assisted decoding candidates, highlighting its flexibility and the advantageous role that such decision making can play.
چکیده به فارسی (ترجمه ماشینی)
علیرغم اتخاذ گسترده آنها ، مدل های بزرگ زبان (LLM) تحت محدودیت منابع ممنوع است و اندازه های روزافزون آنها فقط سد استفاده را افزایش می دهد.یک مسئله ذکر شده ، تأخیر بالا در ارتباط با تولید خودکار تهاجمی است و استفاده از LLM های بزرگ را به زیرساخت های محاسباتی پیشرفته وابسته می کند.رمزگشایی کمک شده ، جایی که یک مدل پیش نویس کوچکتر از نسل مدل بزرگتر راهنمایی می کند ، به کاهش این امر کمک کرده است ، اما همچنان به تراز بین این دو مدل وابسته است.بنابراین اگر مدل پیش نویس به اندازه کافی قادر به برخی از دامنه ها نسبت به مدل هدف نباشد ، عملکرد می تواند تخریب شود.از طرف دیگر ، می توان چندین مدل پیش نویس را برای پوشش بهتر تخصص هدف از آن استفاده کرد ، اما هنگامی که چندین مدل پیش نویس جعبه سیاه در دسترس است ، انتخاب یک دستیار بدون جزئیات در مورد ساخت آن می تواند دشوار باشد.برای درک بهتر این مشکل تصمیم گیری ، ما آن را به عنوان یک راهزن متنی مشاهده می کنیم ، جایی که یک سیاست باید یک مدل پیش نویس را بر اساس یک زمینه انتخاب کند.ما نشان می دهیم که حتی بدون آگاهی قبلی از پیش نویس مدل ها ، ایجاد یک مجموعه داده آفلاین از تنها خروجی های مدل های پیش نویس/هدف مستقل و آموزش یک سیاست برای تراز این خروجی ها می تواند عملکرد را در چندین حوزه تسریع کند به شرط اینکه نامزدها مؤثر باشند.نتایج بیشتر این نشان می دهد که برای تنظیم تنظیمات مختلف با نامزدهای رمزگشایی چندگانه ، انعطاف پذیری آن و نقش سودمند که چنین تصمیم گیری می تواند ایفا کند ، نشان می دهد.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.