ترجمه فارسی مقاله بسته بندی فیلتر آستانه برای تنظیم دقیق: نمونه های مرتبط با آموزش در بسته ها

260,000 تومان

عنوان مقاله به انگلیسی Threshold Filtering Packing for Supervised Fine-Tuning: Training Related Samples within Packs
عنوان مقاله به فارسی ترجمه فارسی مقاله بسته بندی فیلتر آستانه برای تنظیم دقیق: نمونه های مرتبط با آموزش در بسته ها
نویسندگان Jiancheng Dong, Lei Jiang, Wei Jin, Lu Cheng
فرمت مقاله انگلیسی PDF
زبان مقاله تحویلی ترجمه فارسی
فرمت مقاله ترجمه شده به صورت فایل ورد
نحوه تحویل ترجمه دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات 13
لینک دانلود رایگان مقاله انگلیسی دانلود مقاله
دسته بندی موضوعات Machine Learning,Computation and Language,یادگیری ماشین , محاسبه و زبان ,
توضیحات Submitted 17 August, 2024; originally announced August 2024. , Comments: 13 pages, 4 figures
توضیحات به فارسی ارسال شده 17 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد ، نظرات: 13 صفحه ، 4 شکل
اطلاعات بیشتر از این مقاله در پایگاه های علمی INSPIRE HEP

NASA ADS

Google Scholar

Semantic Scholar

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

Packing for Supervised Fine-Tuning (SFT) in autoregressive models involves concatenating data points of varying lengths until reaching the designed maximum length to facilitate GPU processing. However, randomly concatenating data points and feeding them into an autoregressive transformer can lead to cross-contamination of sequences due to the significant difference in their subject matter. The mainstream approaches in SFT ensure that each token in the attention calculation phase only focuses on tokens within its own short sequence, without providing additional learning signals for the preceding context. To address these challenges, we introduce Threshold Filtering Packing (TFP), a method that selects samples with related context while maintaining sufficient diversity within the same pack. Our experiments show that TFP offers a simple-to-implement and scalable approach that significantly enhances SFT performance, with observed improvements of up to 7\% on GSM8K, 4\% on HumanEval, and 15\% on the adult-census-income dataset.

چکیده به فارسی (ترجمه ماشینی)

بسته بندی برای تنظیم دقیق (SFT) در مدل های خودجوش شامل جمع آوری نقاط داده با طول مختلف تا رسیدن به حداکثر طول طراحی شده برای تسهیل پردازش GPU است.با این حال ، به طور تصادفی نقاط داده و تغذیه آنها به یک ترانسفورماتور خودکار می تواند به دلیل تفاوت معنی داری در موضوع آنها منجر به آلودگی متقابل توالی شود.رویکردهای اصلی در SFT اطمینان حاصل می کنند که هر نشانه در مرحله محاسبه توجه فقط بر روی نشانه های موجود در توالی کوتاه خود متمرکز است ، بدون آنکه سیگنال های یادگیری اضافی را برای زمینه قبلی ارائه دهد.برای پرداختن به این چالش ها ، ما بسته بندی فیلتر آستانه (TFP) را معرفی می کنیم ، روشی که ضمن حفظ تنوع کافی در همان بسته ، نمونه هایی را با زمینه مرتبط انتخاب می کند.آزمایشات ما نشان می دهد که TFP یک روش ساده و قابل اجرا و مقیاس پذیر را ارائه می دهد که عملکرد SFT را به طور قابل توجهی افزایش می دهد ، با پیشرفت های مشاهده شده تا 7 \ ٪ در GSM8K ، 4 \ ٪ در Humaneval و 15 \ ٪ در سود بزرگسالان-سرشماریمجموعه داده

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله بسته بندی فیلتر آستانه برای تنظیم دقیق: نمونه های مرتبط با آموزش در بسته ها”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا