| عنوان مقاله به انگلیسی | CodeACT: Code Adaptive Compute-efficient Tuning Framework for Code LLMs |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله CodeACT: چارچوب تنظیم تطبیقی کد و محاسبات کارآمد برای دورههای LLM کد |
| نویسندگان | Weijie Lv, Xuan Xia, Sheng-Jun Huang |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 12 |
| دسته بندی موضوعات | Computation and Language,Machine Learning,محاسبه و زبان , یادگیری ماشین , |
| توضیحات | Submitted 4 August, 2024; originally announced August 2024. |
| توضیحات به فارسی | ارسال شده در 4 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
سفارش ترجمه فارسی مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، ترجمه فارسی مقاله را نیز سفارش میدهید.
قیمت: 480,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
Large language models (LLMs) have shown great potential in code-related tasks, yet open-source models lag behind their closed-source counterparts. To bridge this performance gap, existing methods generate vast amounts of synthetic data for fine-tuning, leading to inefficiencies in training. Motivated by the need for more effective and efficient training, we propose the Code Adaptive Compute-efficient Tuning (CodeACT) framework. CodeACT introduces the Complexity and Diversity Aware Sampling (CDAS) method to select high-quality training data based on complexity and diversity, and the Dynamic Pack padding strategy to reduce computational resource usage by minimizing padding tokens during training. Experimental results demonstrate that CodeACT-DeepSeek-Coder-6.7B, fine-tuned on only 40% of the EVOL-Instruct data, achieves an 8.6% performance increase on HumanEval, reduces training time by 78%, and decreases peak GPU memory usage by 27%. These findings underscore CodeACT’s ability to enhance the performance and efficiency of open-source models. By optimizing both the data selection and training processes, CodeACT offers a comprehensive approach to improving the capabilities of open-source LLMs while significantly reducing computational requirements, addressing the dual challenges of data quality and training efficiency, and paving the way for more resource-efficient and performant models.
چکیده به فارسی (ترجمه ماشینی)
مدل های بزرگ زبان (LLM) پتانسیل خوبی را در کارهای مرتبط با کد نشان داده اند ، اما مدل های منبع باز از همتایان منبع بسته خود عقب مانده اند.برای ایجاد این شکاف عملکرد ، روشهای موجود مقادیر زیادی از داده های مصنوعی را برای تنظیم دقیق ایجاد می کند و منجر به ناکارآمدی در آموزش می شود.با توجه به نیاز به آموزش مؤثرتر و کارآمدتر ، ما چارچوب تنظیم تنظیم کارآمد محاسبات (CODEACT) Code Adaptive را پیشنهاد می کنیم.Codeact روش نمونه گیری آگاهی از پیچیدگی و تنوع (CDAS) را برای انتخاب داده های آموزش با کیفیت بالا بر اساس پیچیدگی و تنوع و استراتژی پویا بسته بندی بسته برای کاهش مصرف منابع محاسباتی با به حداقل رساندن نشانه های بالشتک در طول آموزش معرفی می کند.نتایج تجربی نشان می دهد که CODEACT-DEEPSEEK-CODER-6.7B ، با تنظیم دقیق تنها 40 ٪ از داده های تحقق یافته ، به افزایش 8.6 ٪ عملکرد در Humaneval ، زمان آموزش را 78 ٪ کاهش می دهد ، و اوج استفاده از حافظه GPU را کاهش می دهد27 ٪این یافته ها توانایی Codeact را در تقویت عملکرد و کارآیی مدلهای منبع باز تأکید می کند.CODEACT با بهینه سازی هر دو فرآیند انتخاب داده و آموزش ، یک رویکرد جامع برای بهبود قابلیت های LLM های منبع باز و ضمن کاهش قابل توجهی نیازهای محاسباتی ، پرداختن به چالش های دوگانه کیفیت داده ها و راندمان آموزش ، و هموار کردن راه را برای کارآمد بیشتر منابع ارائه می دهد.و مدل های اجرا
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |



نقد و بررسیها
هنوز بررسیای ثبت نشده است.