| عنوان مقاله به انگلیسی | Leveraging Variation Theory in Counterfactual Data Augmentation for Optimized Active Learning |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله استفاده از نظریه تنوع در افزایش دادههای خلاف واقع برای یادگیری فعال بهینه |
| نویسندگان | Simret Araya Gebreegziabher, Kuangshi Ai, Zheng Zhang, Elena L. Glassman, Toby Jia-Jun Li |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 17 |
| دسته بندی موضوعات | Machine Learning,Computation and Language,Human-Computer Interaction,یادگیری ماشین , محاسبات و زبان , تعامل انسان و رایانه , |
| توضیحات | Submitted 7 August, 2024; originally announced August 2024. |
| توضیحات به فارسی | ارسال شده در 7 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
سفارش ترجمه فارسی مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، ترجمه فارسی مقاله را نیز سفارش میدهید.
قیمت: 680,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
Active Learning (AL) allows models to learn interactively from user feedback. This paper introduces a counterfactual data augmentation approach to AL, particularly addressing the selection of datapoints for user querying, a pivotal concern in enhancing data efficiency. Our approach is inspired by Variation Theory, a theory of human concept learning that emphasizes the essential features of a concept by focusing on what stays the same and what changes. Instead of just querying with existing datapoints, our approach synthesizes artificial datapoints that highlight potential key similarities and differences among labels using a neuro-symbolic pipeline combining large language models (LLMs) and rule-based models. Through an experiment in the example domain of text classification, we show that our approach achieves significantly higher performance when there are fewer annotated data. As the annotated training data gets larger the impact of the generated data starts to diminish showing its capability to address the cold start problem in AL. This research sheds light on integrating theories of human learning into the optimization of AL.
چکیده به فارسی (ترجمه ماشینی)
یادگیری فعال (AL) به مدل ها اجازه می دهد تا از بازخورد کاربر به صورت تعاملی یاد بگیرند.در این مقاله یک رویکرد تقویت داده های ضد خلاف به AL ، به ویژه پرداختن به انتخاب داده های مربوط به پرس و جو کاربر ، یک نگرانی مهم در افزایش بهره وری داده ها ارائه شده است.رویکرد ما از تئوری متغیر الهام گرفته شده است ، یک تئوری یادگیری مفهوم انسانی که با تمرکز بر آنچه که یکسان باقی می ماند و چه تغییراتی دارد ، بر ویژگی های اساسی یک مفهوم تأکید می کند.رویکرد ما به جای اینکه فقط با داده های موجود پرس و جو کنید ، داده های مصنوعی را نشان می دهد که شباهت ها و تفاوت های کلیدی بالقوه بین برچسب ها را با استفاده از یک خط لوله عصبی-سمبولیک با ترکیب مدل های بزرگ زبان (LLMS) و مدل های مبتنی بر قانون برجسته می کند.از طریق آزمایش در حوزه مثال طبقه بندی متن ، ما نشان می دهیم که وقتی داده های حاشیه نویسی کمتری وجود دارد ، رویکرد ما به عملکرد قابل توجهی بالاتر می رسد.با بزرگتر شدن داده های آموزش حاشیه نویسی ، تأثیر داده های تولید شده شروع به کاهش توانایی آن برای رفع مشکل شروع سرما در AL می کند.این تحقیق بر ادغام نظریه های یادگیری انسان در بهینه سازی AL روشن می کند.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.