| عنوان مقاله به انگلیسی | Semi-Supervised One-Shot Imitation Learning |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله یادگیری تقلیدی تکمرحلهای نیمهنظارتی |
| نویسندگان | Philipp Wu, Kourosh Hakhamaneshi, Yuqing Du, Igor Mordatch, Aravind Rajeswaran, Pieter Abbeel |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 13 |
| دسته بندی موضوعات | Machine Learning,Artificial Intelligence,یادگیری ماشین , هوش مصنوعی , |
| توضیحات | Submitted 9 August, 2024; originally announced August 2024. , Journal ref: Reinforcement Learning Journal 1 (2024) |
| توضیحات به فارسی | ارسال شده در 9 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. ، مجله Ref: مجله یادگیری تقویت 1 (2024) |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
سفارش ترجمه فارسی مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، ترجمه فارسی مقاله را نیز سفارش میدهید.
قیمت: 520,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
One-shot Imitation Learning~(OSIL) aims to imbue AI agents with the ability to learn a new task from a single demonstration. To supervise the learning, OSIL typically requires a prohibitively large number of paired expert demonstrations — i.e. trajectories corresponding to different variations of the same semantic task. To overcome this limitation, we introduce the semi-supervised OSIL problem setting, where the learning agent is presented with a large dataset of trajectories with no task labels (i.e. an unpaired dataset), along with a small dataset of multiple demonstrations per semantic task (i.e. a paired dataset). This presents a more realistic and practical embodiment of few-shot learning and requires the agent to effectively leverage weak supervision from a large dataset of trajectories. Subsequently, we develop an algorithm specifically applicable to this semi-supervised OSIL setting. Our approach first learns an embedding space where different tasks cluster uniquely. We utilize this embedding space and the clustering it supports to self-generate pairings between trajectories in the large unpaired dataset. Through empirical results on simulated control tasks, we demonstrate that OSIL models trained on such self-generated pairings are competitive with OSIL models trained with ground-truth labels, presenting a major advancement in the label-efficiency of OSIL.
چکیده به فارسی (ترجمه ماشینی)
یادگیری تقلید یک شات ~ (OSIL) هدف از این است که عوامل هوش مصنوعی را با توانایی یادگیری یک کار جدید از یک تظاهرات واحد تحریک کند.برای نظارت بر یادگیری ، Osil به طور معمول به تعداد زیادی از تظاهرات متخصص زوج نیاز دارد – یعنی مسیرهای مربوط به تغییرات مختلف همان کار معنایی.برای غلبه بر این محدودیت ، ما تنظیمات مشکل OSIL نیمه تحت نظارت را معرفی می کنیم ، جایی که عامل یادگیری با یک مجموعه داده بزرگ از مسیرها بدون برچسب کار (یعنی یک مجموعه داده بدون جفت) ارائه می شود ، به همراه یک مجموعه داده کوچک از تظاهرات متعدد در هر کار معنایی (یعنی یک مجموعه داده زوج).این یک تجسم واقع بینانه تر و عملی تر از یادگیری چند عکس را نشان می دهد و به عامل نیاز دارد تا به طور مؤثر از نظارت ضعیف از یک مجموعه داده بزرگ مسیرها استفاده کند.پس از آن ، ما یک الگوریتم خاص برای این تنظیم OSIL نیمه تحت نظارت کاربرد دارد.رویکرد ما ابتدا یک فضای تعبیه شده را می آموزد که در آن کارهای مختلف به طور منحصر به فرد خوشه می شوند.ما از این فضای تعبیه شده و خوشه بندی آن برای ایجاد جفت شدن خود بین مسیرها در مجموعه داده های بزرگ بدون جفت استفاده می کنیم.از طریق نتایج تجربی در کارهای کنترل شبیه سازی شده ، ما نشان می دهیم که مدل های OSIL که بر روی چنین جفت های خود تولید شده آموزش دیده اند با مدل های OSIL که با برچسب های حقیقت زمین آموزش دیده اند ، رقابتی هستند و پیشرفت عمده ای در برچسب-کارآیی OSIL دارند.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |



نقد و بررسیها
هنوز بررسیای ثبت نشده است.