| عنوان مقاله به انگلیسی | Clover-2: Accurate Inference for Regressive Lightweight Speculative Decoding |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله Clover-2: استنتاج دقیق برای رمزگشایی گمانهزن سبکوزن رگرسیونی |
| نویسندگان | Bin Xiao, Lujun Gui, Lei Su, Weipeng Chen |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 12 |
| دسته بندی موضوعات | Computation and Language,Artificial Intelligence,Machine Learning,محاسبه و زبان , هوش مصنوعی , یادگیری ماشین , |
| توضیحات | Submitted 31 July, 2024; originally announced August 2024. |
| توضیحات به فارسی | ارسال 31 ژوئیه 2024 ؛در ابتدا اوت 2024 اعلام شد. |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
دانلود مقاله اصل انگلیسی + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 99,000 تومان
سفارش ترجمه فارسی مقاله + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی و ترجمه کامل آن، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 480,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
Large Language Models (LLMs) frequently suffer from inefficiencies, largely attributable to the discord between the requirements of auto-regressive decoding and the architecture of contemporary GPUs. Recently, regressive lightweight speculative decoding has garnered attention for its notable efficiency improvements in text generation tasks. This approach utilizes a lightweight regressive draft model, like a Recurrent Neural Network (RNN) or a single transformer decoder layer, leveraging sequential information to iteratively predict potential tokens. Specifically, RNN draft models are computationally economical but tend to deliver lower accuracy, while attention decoder layer models exhibit the opposite traits. This paper presents Clover-2, an advanced iteration of Clover, an RNN-based draft model designed to achieve comparable accuracy to that of attention decoder layer models while maintaining minimal computational overhead. Clover-2 enhances the model architecture and incorporates knowledge distillation to increase Clover’s accuracy and improve overall efficiency. We conducted experiments using the open-source Vicuna 7B and LLaMA3-Instruct 8B models. The results demonstrate that Clover-2 surpasses existing methods across various model architectures, showcasing its efficacy and robustness.
چکیده به فارسی (ترجمه ماشینی)
مدل های بزرگ زبان (LLMS) غالباً از ناکارآمدی رنج می برند ، که تا حد زیادی به اختلاف نظر بین الزامات رمزگشایی خودکار و معماری GPU های معاصر نسبت داده می شود.به تازگی ، رمزگشایی سوداگرانه سبک وزن ، توجه را به دلیل بهبود کارایی قابل توجه خود در کارهای تولید متن جلب کرده است.این رویکرد با استفاده از یک مدل پیش نویس سبک وزن ، مانند یک شبکه عصبی مکرر (RNN) یا یک لایه رمزگذار ترانسفورماتور واحد ، با استفاده از اطلاعات پی در پی برای پیش بینی تکراری توکن های بالقوه.به طور خاص ، مدل های RNN از نظر محاسباتی اقتصادی هستند اما تمایل به ارائه دقت پایین تر دارند ، در حالی که مدل های لایه رمزگذار توجه ویژگی های مخالف را نشان می دهند.در این مقاله Clover-2 ، یک تکرار پیشرفته از شبدر ، یک مدل پیش نویس مبتنی بر RNN طراحی شده برای دستیابی به دقت قابل مقایسه با مدل های لایه رمزگذار توجه و در عین حال حفظ حداقل سربار محاسباتی ارائه شده است.CLOVER-2 معماری مدل را تقویت می کند و از تقطیر دانش برای افزایش دقت شبدر و بهبود کارایی کلی استفاده می کند.ما آزمایشاتی را با استفاده از مدل های منبع باز Vicuna 7B و LLAMA3-Instruct 8B انجام دادیم.نتایج نشان می دهد که CLOVER-2 از روشهای موجود در معماری های مختلف مدل پیشی می گیرد و اثربخشی و استحکام آن را نشان می دهد.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.