ترجمه فارسی مقاله رضایت از تعادل مارکوف باعث بهبود عملکرد در یادگیری تقلید آفلاین دسته ای می شود

180,000 تومان

عنوان مقاله به انگلیسی Markov Balance Satisfaction Improves Performance in Strictly Batch Offline Imitation Learning
عنوان مقاله به فارسی ترجمه فارسی مقاله رضایت از تعادل مارکوف باعث بهبود عملکرد در یادگیری تقلید آفلاین دسته ای می شود
نویسندگان Rishabh Agrawal, Nathan Dahlin, Rahul Jain, Ashutosh Nayyar
فرمت مقاله انگلیسی PDF
زبان مقاله تحویلی ترجمه فارسی
فرمت مقاله ترجمه شده به صورت فایل ورد
نحوه تحویل ترجمه دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات 9
لینک دانلود رایگان مقاله انگلیسی دانلود مقاله
دسته بندی موضوعات Machine Learning,Artificial Intelligence,یادگیری ماشین , هوش مصنوعی ,
توضیحات Submitted 17 August, 2024; originally announced August 2024.
توضیحات به فارسی ارسال شده 17 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد.
اطلاعات بیشتر از این مقاله در پایگاه های علمی INSPIRE HEP

NASA ADS

Google Scholar

Semantic Scholar

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

Imitation learning (IL) is notably effective for robotic tasks where directly programming behaviors or defining optimal control costs is challenging. In this work, we address a scenario where the imitator relies solely on observed behavior and cannot make environmental interactions during learning. It does not have additional supplementary datasets beyond the expert’s dataset nor any information about the transition dynamics. Unlike state-of-the-art (SOTA) IL methods, this approach tackles the limitations of conventional IL by operating in a more constrained and realistic setting. Our method uses the Markov balance equation and introduces a novel conditional density estimation-based imitation learning framework. It employs conditional normalizing flows for transition dynamics estimation and aims at satisfying a balance equation for the environment. Through a series of numerical experiments on Classic Control and MuJoCo environments, we demonstrate consistently superior empirical performance compared to many SOTA IL algorithms.

چکیده به فارسی (ترجمه ماشینی)

یادگیری تقلید (IL) به ویژه برای کارهای رباتیک که در آن رفتارهای برنامه نویسی مستقیم یا تعیین هزینه های کنترل بهینه چالش برانگیز است ، مؤثر است.در این کار ، ما به سناریویی می پردازیم که تقلید کننده فقط به رفتار مشاهده شده متکی است و نمی تواند تعامل محیطی را در حین یادگیری انجام دهد.این مجموعه داده های تکمیلی اضافی فراتر از مجموعه داده های متخصص و هیچ اطلاعاتی در مورد دینامیک انتقال ندارد.بر خلاف روشهای پیشرفته (SOTA) IL ، این رویکرد با کار در یک محیط محدودتر و واقع بینانه تر ، محدودیت های IL معمولی را برطرف می کند.روش ما از معادله تعادل Markov استفاده می کند و یک چارچوب یادگیری تقلید مبتنی بر تخمین مبتنی بر تخمین را معرفی می کند.از جریان عادی سازی مشروط برای برآورد دینامیک انتقال استفاده می کند و هدف آن رضایت یک معادله تعادل برای محیط زیست است.از طریق مجموعه ای از آزمایشات عددی در مورد کنترل کلاسیک و محیط های Mujoco ، ما عملکرد تجربی به طور مداوم برتر را در مقایسه با بسیاری از الگوریتم های SOTA IL نشان می دهیم.

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله رضایت از تعادل مارکوف باعث بهبود عملکرد در یادگیری تقلید آفلاین دسته ای می شود”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا