| عنوان مقاله به انگلیسی | Threshold Filtering Packing for Supervised Fine-Tuning: Training Related Samples within Packs | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله بسته بندی فیلتر آستانه برای تنظیم دقیق: نمونه های مرتبط با آموزش در بسته ها | ||||||||
| نویسندگان | Jiancheng Dong, Lei Jiang, Wei Jin, Lu Cheng | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 13 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Machine Learning,Computation and Language,یادگیری ماشین , محاسبه و زبان , | ||||||||
| توضیحات | Submitted 17 August, 2024; originally announced August 2024. , Comments: 13 pages, 4 figures | ||||||||
| توضیحات به فارسی | ارسال شده 17 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد ، نظرات: 13 صفحه ، 4 شکل | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
Packing for Supervised Fine-Tuning (SFT) in autoregressive models involves concatenating data points of varying lengths until reaching the designed maximum length to facilitate GPU processing. However, randomly concatenating data points and feeding them into an autoregressive transformer can lead to cross-contamination of sequences due to the significant difference in their subject matter. The mainstream approaches in SFT ensure that each token in the attention calculation phase only focuses on tokens within its own short sequence, without providing additional learning signals for the preceding context. To address these challenges, we introduce Threshold Filtering Packing (TFP), a method that selects samples with related context while maintaining sufficient diversity within the same pack. Our experiments show that TFP offers a simple-to-implement and scalable approach that significantly enhances SFT performance, with observed improvements of up to 7\% on GSM8K, 4\% on HumanEval, and 15\% on the adult-census-income dataset.
چکیده به فارسی (ترجمه ماشینی)
بسته بندی برای تنظیم دقیق (SFT) در مدل های خودجوش شامل جمع آوری نقاط داده با طول مختلف تا رسیدن به حداکثر طول طراحی شده برای تسهیل پردازش GPU است.با این حال ، به طور تصادفی نقاط داده و تغذیه آنها به یک ترانسفورماتور خودکار می تواند به دلیل تفاوت معنی داری در موضوع آنها منجر به آلودگی متقابل توالی شود.رویکردهای اصلی در SFT اطمینان حاصل می کنند که هر نشانه در مرحله محاسبه توجه فقط بر روی نشانه های موجود در توالی کوتاه خود متمرکز است ، بدون آنکه سیگنال های یادگیری اضافی را برای زمینه قبلی ارائه دهد.برای پرداختن به این چالش ها ، ما بسته بندی فیلتر آستانه (TFP) را معرفی می کنیم ، روشی که ضمن حفظ تنوع کافی در همان بسته ، نمونه هایی را با زمینه مرتبط انتخاب می کند.آزمایشات ما نشان می دهد که TFP یک روش ساده و قابل اجرا و مقیاس پذیر را ارائه می دهد که عملکرد SFT را به طور قابل توجهی افزایش می دهد ، با پیشرفت های مشاهده شده تا 7 \ ٪ در GSM8K ، 4 \ ٪ در Humaneval و 15 \ ٪ در سود بزرگسالان-سرشماریمجموعه داده
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.