ترجمه فارسی مقاله چارچوبی برای تنظیم دقیق LLM ها با استفاده از بازخورد ناهمگن

Name: ترجمه فارسی مقاله چارچوبی برای تنظیم دقیق LLM ها با استفاده از بازخورد ناهمگن
SKU: 67806
Availability: InStock

19,000 تومان – 280,000 تومان

نوع دانلود

پاک کردن

شناسه محصول: نامعلوم دسته: ترجمه, مقالات

عنوان مقاله به انگلیسی	A Framework for Fine-Tuning LLMs using Heterogeneous Feedback
عنوان مقاله به فارسی	ترجمه فارسی مقاله چارچوبی برای تنظیم دقیق LLM ها با استفاده از بازخورد ناهمگن
نویسندگان	Ryan Aponte, Ryan A. Rossi, Shunan Guo, Franck Dernoncourt, Tong Yu, Xiang Chen, Subrata Mitra, Nedim Lipka
فرمت مقاله انگلیسی	PDF
زبان مقاله تحویلی	ترجمه فارسی
فرمت مقاله ترجمه شده	به صورت فایل ورد
نحوه تحویل ترجمه	دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات	7
دسته بندی موضوعات	Computation and Language,Machine Learning,محاسبه و زبان , یادگیری ماشین ,
توضیحات	Submitted 5 August, 2024; originally announced August 2024. , Comments: 7 pages, 1 figure , ACM Class: I.2.7
توضیحات به فارسی	ارسال شده در 5 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد ، نظرات: 7 صفحه ، 1 شکل ، کلاس ACM: I.2.7

توضیحات گزینه‌های خرید

دانلود مقاله اصل انگلیسی

با انتخاب این گزینه، می‌توانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.

قیمت: 19,000 تومان

سفارش ترجمه فارسی مقاله

با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، ترجمه فارسی مقاله را نیز سفارش می‌دهید.

قیمت: 280,000 تومان

زمان تحویل: 2 تا 3 روز کاری

فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

Large language models (LLMs) have been applied to a wide range of tasks, including text summarization, web navigation, and chatbots. They have benefitted from supervised fine-tuning (SFT) and reinforcement learning from human feedback (RLHF) following an unsupervised pretraining. These datasets can be difficult to collect, limited in scope, and vary in sample quality. Additionally, datasets can vary extensively in supervision format, from numerical to binary as well as multi-dimensional with many different values. We present a framework for fine-tuning LLMs using heterogeneous feedback, which has two main components. First, we combine the heterogeneous feedback data into a single supervision format, compatible with methods like SFT and RLHF. Next, given this unified feedback dataset, we extract a high-quality and diverse subset to obtain performance increases potentially exceeding the full dataset. We conduct extensive experiments to understand the effectiveness of these techniques for incorporating heterogeneous feedback, and demonstrate improvements from using a high-quality and diverse subset of the data. We find that our framework is able to improve models in multiple areas simultaneously, such as in instruction following and bias reduction.

چکیده به فارسی (ترجمه ماشینی)

مدل های بزرگ زبان (LLMS) برای طیف گسترده ای از کارها از جمله خلاصه متن ، ناوبری وب و چت بابات استفاده شده است.آنها به دنبال یک تنظیم دقیق (SFT) و یادگیری تقویت شده از بازخورد انسانی (RLHF) به دنبال پیشگویی بدون نظارت هستند.جمع آوری این مجموعه داده ها می تواند دشوار باشد ، محدودیت در دامنه و در کیفیت نمونه متفاوت است.علاوه بر این ، مجموعه داده ها می توانند در قالب نظارت متفاوت باشند ، از عددی تا باینری و همچنین چند بعدی با مقادیر مختلف.ما یک چارچوب برای LLM های تنظیم دقیق با استفاده از بازخورد ناهمگن ، که دارای دو مؤلفه اصلی است ، ارائه می دهیم.اول ، ما داده های بازخورد ناهمگن را در یک قالب نظارت واحد ترکیب می کنیم ، با روش هایی مانند SFT و RLHF سازگار است.در مرحله بعد ، با توجه به این مجموعه داده بازخورد یکپارچه ، ما یک زیر مجموعه با کیفیت بالا و متنوع را برای به دست آوردن عملکرد به طور بالقوه فراتر از مجموعه داده کامل استخراج می کنیم.ما آزمایش های گسترده ای را برای درک اثربخشی این تکنیک ها برای ترکیب بازخورد ناهمگن انجام می دهیم و از استفاده از یک زیر مجموعه با کیفیت بالا و متنوع از داده ها پیشرفت می کنیم.ما می دانیم که چارچوب ما قادر به بهبود مدل ها در چندین زمینه به طور همزمان ، مانند دستورالعمل های زیر و کاهش تعصب است.

فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نوع دانلود	دانلود مقاله اصل انگلیسی, سفارش ترجمه فارسی مقاله

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله چارچوبی برای تنظیم دقیق LLM ها با استفاده از بازخورد ناهمگن”

ترجمه فارسی مقاله چارچوبی برای تنظیم دقیق LLM ها با استفاده از بازخورد ناهمگن

توضیحات گزینه‌های خرید

دانلود مقاله اصل انگلیسی

سفارش ترجمه فارسی مقاله

چکیده

چکیده به فارسی (ترجمه ماشینی)

نقد و بررسی‌ها

محصولات مرتبط

ترجمه فارسی مقاله یافتن الگوها در ابهام: آزمون استرس تفسیرپذیر در مرز تصمیم‌گیری

ترجمه فارسی مقاله LOLGORITH: ادغام عناصر معنایی، نحوی و متنی برای طبقه بندی طنز

ترجمه فارسی مقاله دانشمند هوش مصنوعی: به سوی اکتشافات علمی کاملاً خودکار و نامحدود

ترجمه فارسی مقاله تولید گفتگوی مصنوعی بیمار-پزشک از یادداشت‌های بالینی با استفاده از LLM