| عنوان مقاله به انگلیسی | Preference Tuning with Human Feedback on Language, Speech, and Vision Tasks: A Survey | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله تنظیم اولویت با بازخورد انسانی در مورد وظایف زبان، گفتار و بینش: یک نظرسنجی | ||||||||
| نویسندگان | Genta Indra Winata, Hanyang Zhao, Anirban Das, Wenpin Tang, David D. Yao, Shi-Xiong Zhang, Sambit Sahu | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 63 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Computation and Language,Artificial Intelligence,Computer Vision and Pattern Recognition,Machine Learning,Audio and Speech Processing,محاسبات و زبان , هوش مصنوعی , چشم انداز رایانه و تشخیص الگوی , یادگیری ماشین , پردازش صوتی و گفتار , | ||||||||
| توضیحات | Submitted 17 September, 2024; originally announced September 2024. , Comments: Survey paper | ||||||||
| توضیحات به فارسی | ارسال شده 17 سپتامبر 2024 ؛در ابتدا سپتامبر 2024 اعلام شد ، نظرات: مقاله نظرسنجی | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
Preference tuning is a crucial process for aligning deep generative models with human preferences. This survey offers a thorough overview of recent advancements in preference tuning and the integration of human feedback. The paper is organized into three main sections: 1) introduction and preliminaries: an introduction to reinforcement learning frameworks, preference tuning tasks, models, and datasets across various modalities: language, speech, and vision, as well as different policy approaches, 2) in-depth examination of each preference tuning approach: a detailed analysis of the methods used in preference tuning, and 3) applications, discussion, and future directions: an exploration of the applications of preference tuning in downstream tasks, including evaluation methods for different modalities, and an outlook on future research directions. Our objective is to present the latest methodologies in preference tuning and model alignment, enhancing the understanding of this field for researchers and practitioners. We hope to encourage further engagement and innovation in this area.
چکیده به فارسی (ترجمه ماشینی)
تنظیم اولویت یک فرآیند مهم برای تراز کردن مدلهای تولیدی عمیق با ترجیحات انسانی است.این نظرسنجی یک مرور کلی از پیشرفت های اخیر در تنظیم اولویت و ادغام بازخورد انسان ارائه می دهد.این مقاله به سه بخش اصلی سازماندهی شده است: 1) مقدمه و مقدمات: مقدمه ای برای چارچوبهای یادگیری تقویت ، وظایف تنظیم ترجیح ، مدل ها و مجموعه داده ها در روشهای مختلف: زبان ، گفتار و چشم انداز و همچنین رویکردهای مختلف سیاست ، 2)بررسی عمیق از هر روش تنظیم تنظیم: تجزیه و تحلیل دقیق از روشهای مورد استفاده در تنظیم ترجیح ، و 3) برنامه ها ، بحث و مسیرهای آینده: اکتشافی از برنامه های تنظیم ترجیح در کارهای پایین دست ، از جمله روشهای ارزیابی برای روشهای مختلف، و چشم انداز در جهت های تحقیق آینده.هدف ما ارائه جدیدترین روشها در تنظیم اولویت و تراز مدل ، تقویت درک این زمینه برای محققان و پزشکان است.ما امیدواریم که مشارکت و نوآوری بیشتر در این زمینه را ترغیب کنیم.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.