| عنوان مقاله به انگلیسی | Diffusion Augmented Agents: A Framework for Efficient Exploration and Transfer Learning |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله عاملهای تقویتشده با انتشار: چارچوبی برای اکتشاف کارآمد و یادگیری انتقالی |
| نویسندگان | Norman Di Palo, Leonard Hasenclever, Jan Humplik, Arunkumar Byravan |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 17 |
| دسته بندی موضوعات | Machine Learning,Artificial Intelligence,Robotics,یادگیری ماشین , هوش مصنوعی , روباتیک , |
| توضیحات | Submitted 30 July, 2024; originally announced July 2024. , Comments: Published at 3rd Conference on Lifelong Learning Agents (CoLLAs), 2024 |
| توضیحات به فارسی | ارسال شده 30 ژوئیه 2024 ؛در ابتدا ژوئیه 2024 اعلام شد ، نظرات: منتشر شده در سومین کنفرانس در مورد عوامل یادگیری مادام العمر (Collas) ، 2024 |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
دانلود مقاله اصل انگلیسی + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 99,000 تومان
سفارش ترجمه فارسی مقاله + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی و ترجمه کامل آن، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 680,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
We introduce Diffusion Augmented Agents (DAAG), a novel framework that leverages large language models, vision language models, and diffusion models to improve sample efficiency and transfer learning in reinforcement learning for embodied agents. DAAG hindsight relabels the agent’s past experience by using diffusion models to transform videos in a temporally and geometrically consistent way to align with target instructions with a technique we call Hindsight Experience Augmentation. A large language model orchestrates this autonomous process without requiring human supervision, making it well-suited for lifelong learning scenarios. The framework reduces the amount of reward-labeled data needed to 1) finetune a vision language model that acts as a reward detector, and 2) train RL agents on new tasks. We demonstrate the sample efficiency gains of DAAG in simulated robotics environments involving manipulation and navigation. Our results show that DAAG improves learning of reward detectors, transferring past experience, and acquiring new tasks – key abilities for developing efficient lifelong learning agents. Supplementary material and visualizations are available on our website https://sites.google.com/view/diffusion-augmented-agents/
چکیده به فارسی (ترجمه ماشینی)
ما عوامل تقویت شده انتشار (DAAG) را معرفی می کنیم ، یک چارچوب جدید که از مدل های بزرگ زبان ، مدل های زبان بینایی و مدل های انتشار برای بهبود کارآیی نمونه و انتقال یادگیری در یادگیری تقویت شده برای عوامل تجسم استفاده می کند.Daag Hindsight تجربه گذشته عامل را با استفاده از مدل های انتشار برای تبدیل فیلم ها به روشی موقت و هندسی سازگار برای تراز کردن با دستورالعمل های هدف با تکنیکی که ما از آن استفاده می کنیم ، تقویت می کند.یک مدل بزرگ زبان این فرایند خودمختار را بدون نیاز به نظارت انسانی ، ارکستر می کند و آن را برای سناریوهای یادگیری مادام العمر مناسب می کند.این چارچوب میزان داده های دارای پاداش مورد نیاز را برای 1) یک مدل زبان بینایی که به عنوان یک آشکارساز پاداش عمل می کند ، کاهش می دهد و 2) عوامل RL را بر روی کارهای جدید آموزش می دهد.ما سودآور نمونه DAAG را در محیط های شبیه سازی شده روباتیک شامل دستکاری و ناوبری نشان می دهیم.نتایج ما نشان می دهد که DAAG یادگیری آشکارسازهای پاداش ، انتقال تجربه گذشته و دستیابی به کارهای جدید را بهبود می بخشد – توانایی های کلیدی برای توسعه عوامل کارآمد یادگیری مادام العمر.مواد و تجسم های تکمیلی در وب سایت ما https://sites.google.com/view/diffusion-augmented-agents/ در دسترس است
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |



نقد و بررسیها
هنوز بررسیای ثبت نشده است.