| عنوان مقاله به انگلیسی | In2Core: Leveraging Influence Functions for Coreset Selection in Instruction Finetuning of Large Language Models |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله In2Core: استفاده از توابع نفوذ برای انتخاب مجموعه هسته در تنظیم دقیق دستورالعمل مدلهای زبانی بزرگ |
| نویسندگان | Ayrton San Joaquin, Bin Wang, Zhengyuan Liu, Nicholas Asher, Brian Lim, Philippe Muller, Nancy Chen |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 12 |
| دسته بندی موضوعات | Machine Learning,Machine Learning,یادگیری ماشین , یادگیری ماشین , |
| توضیحات | Submitted 7 August, 2024; originally announced August 2024. |
| توضیحات به فارسی | ارسال شده در 7 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
سفارش ترجمه فارسی مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، ترجمه فارسی مقاله را نیز سفارش میدهید.
قیمت: 480,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
Despite advancements, fine-tuning Large Language Models (LLMs) remains costly due to the extensive parameter count and substantial data requirements for model generalization. Accessibility to computing resources remains a barrier for the open-source community. To address this challenge, we propose the In2Core algorithm, which selects a coreset by analyzing the correlation between training and evaluation samples with a trained model. Notably, we assess the model’s internal gradients to estimate this relationship, aiming to rank the contribution of each training point. To enhance efficiency, we propose an optimization to compute influence functions with a reduced number of layers while achieving similar accuracy. By applying our algorithm to instruction fine-tuning data of LLMs, we can achieve similar performance with just 50% of the training data. Meantime, using influence functions to analyze model coverage to certain testing samples could provide a reliable and interpretable signal on the training set’s coverage of those test points.
چکیده به فارسی (ترجمه ماشینی)
با وجود پیشرفت ها ، تنظیم دقیق مدل های بزرگ زبان (LLMS) به دلیل تعداد پارامتر گسترده و الزامات داده های قابل توجهی برای تعمیم مدل ، پرهزینه است.دسترسی به منابع محاسباتی مانعی برای جامعه منبع باز است.برای پرداختن به این چالش ، ما الگوریتم IN2Core را پیشنهاد می کنیم ، که با تجزیه و تحلیل همبستگی بین نمونه های آموزش و ارزیابی با یک مدل آموزش دیده ، یک هسته را انتخاب می کند.نکته قابل توجه ، ما شیب داخلی مدل را برای برآورد این رابطه ارزیابی می کنیم ، با هدف رتبه بندی سهم هر نقطه آموزشی.برای افزایش کارآیی ، ما یک بهینه سازی را برای محاسبه توابع نفوذ با کاهش تعداد لایه ها ضمن دستیابی به دقت مشابه پیشنهاد می کنیم.با استفاده از الگوریتم ما برای آموزش داده های تنظیم دقیق LLMS ، می توانیم با تنها 50 ٪ از داده های آموزشی به عملکرد مشابه برسیم.در همین حال ، استفاده از توابع تأثیرگذاری برای تجزیه و تحلیل پوشش مدل به نمونه های آزمایش خاص می تواند یک سیگنال قابل اعتماد و قابل تفسیر در پوشش مجموعه آموزش از آن نقاط آزمون ارائه دهد.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.