| عنوان مقاله به انگلیسی | Genetic Instruct: Scaling up Synthetic Generation of Coding Instructions for Large Language Models |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله آموزش ژنتیکی: افزایش مقیاس تولید مصنوعی دستورالعملهای کدنویسی برای مدلهای زبانی بزرگ |
| نویسندگان | Somshubra Majumdar, Vahid Noroozi, Sean Narenthiran, Aleksander Ficek, Jagadeesh Balam, Boris Ginsburg |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 16 |
| دسته بندی موضوعات | Computation and Language,Machine Learning,Neural and Evolutionary Computing,محاسبات و زبان , یادگیری ماشین , محاسبات عصبی و تکاملی , |
| توضیحات | Submitted 29 July, 2024; originally announced July 2024. |
| توضیحات به فارسی | ارسال 29 ژوئیه 2024 ؛در ابتدا ژوئیه 2024 اعلام شد. |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
دانلود مقاله اصل انگلیسی + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 99,000 تومان
سفارش ترجمه فارسی مقاله + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی و ترجمه کامل آن، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 640,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
Large Language Models (LLMs) rely on instruction samples for alignment, but creating these datasets poses challenges, particularly in expert-dependent tasks like coding, which can be cost-prohibitive. One approach to mitigate these challenges is synthesizing data using another LLM. In this paper, we introduce a scalable method for generating synthetic instructions to enhance the code generation capability of LLMs. The proposed algorithm, Genetic-Instruct, mimics evolutionary processes, utilizing self-instruction to create numerous synthetic samples from a limited number of seeds. Genetic-Instruct is designed for efficient scaling of the generation process. Fine-tuning multiple coding LLMs with the synthetic samples demonstrates a significant improvement in their code generation accuracy compared to the baselines.
چکیده به فارسی (ترجمه ماشینی)
مدل های بزرگ زبان (LLMS) برای تراز کردن به نمونه های دستورالعمل متکی هستند ، اما ایجاد این مجموعه داده ها به ویژه در کارهای وابسته به متخصص مانند برنامه نویسی ، چالش هایی را ایجاد می کند ، که می تواند هزینه ای باشد.یک رویکرد برای کاهش این چالش ها ، سنتز داده ها با استفاده از LLM دیگر است.در این مقاله ، ما یک روش مقیاس پذیر برای تولید دستورالعمل های مصنوعی برای تقویت قابلیت تولید کد LLMS معرفی می کنیم.الگوریتم پیشنهادی ، مدرک ژنتیکی ، فرآیندهای تکاملی را تقلید می کند ، با استفاده از خودآزمایی برای ایجاد نمونه های مصنوعی بیشمار از تعداد محدودی از دانه ها.دفاع ژنتیکی برای مقیاس بندی کارآمد فرآیند تولید طراحی شده است.تنظیم دقیق LLM های کدگذاری چندگانه با نمونه های مصنوعی نشان دهنده پیشرفت قابل توجهی در دقت تولید کد آنها در مقایسه با خطوط پایه است.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |



نقد و بررسیها
هنوز بررسیای ثبت نشده است.