ترجمه فارسی مقاله رضایت از تعادل مارکوف باعث بهبود عملکرد در یادگیری تقلید آفلاین دسته ای می شود

180,000 تومان

دسته: مقاله علمی

توضیحات
نظرات (0)

عنوان مقاله به انگلیسی	Markov Balance Satisfaction Improves Performance in Strictly Batch Offline Imitation Learning
عنوان مقاله به فارسی	ترجمه فارسی مقاله رضایت از تعادل مارکوف باعث بهبود عملکرد در یادگیری تقلید آفلاین دسته ای می شود
نویسندگان	Rishabh Agrawal, Nathan Dahlin, Rahul Jain, Ashutosh Nayyar
فرمت مقاله انگلیسی	PDF
زبان مقاله تحویلی	ترجمه فارسی
فرمت مقاله ترجمه شده	به صورت فایل ورد
نحوه تحویل ترجمه	دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات	9
لینک دانلود رایگان مقاله انگلیسی	دانلود مقاله
دسته بندی موضوعات	Machine Learning,Artificial Intelligence,یادگیری ماشین , هوش مصنوعی ,
توضیحات	Submitted 17 August, 2024; originally announced August 2024.
توضیحات به فارسی	ارسال شده 17 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد.
اطلاعات بیشتر از این مقاله در پایگاه های علمی	INSPIRE HEP NASA ADS Google Scholar Semantic Scholar
فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

Imitation learning (IL) is notably effective for robotic tasks where directly programming behaviors or defining optimal control costs is challenging. In this work, we address a scenario where the imitator relies solely on observed behavior and cannot make environmental interactions during learning. It does not have additional supplementary datasets beyond the expert’s dataset nor any information about the transition dynamics. Unlike state-of-the-art (SOTA) IL methods, this approach tackles the limitations of conventional IL by operating in a more constrained and realistic setting. Our method uses the Markov balance equation and introduces a novel conditional density estimation-based imitation learning framework. It employs conditional normalizing flows for transition dynamics estimation and aims at satisfying a balance equation for the environment. Through a series of numerical experiments on Classic Control and MuJoCo environments, we demonstrate consistently superior empirical performance compared to many SOTA IL algorithms.

چکیده به فارسی (ترجمه ماشینی)

یادگیری تقلید (IL) به ویژه برای کارهای رباتیک که در آن رفتارهای برنامه نویسی مستقیم یا تعیین هزینه های کنترل بهینه چالش برانگیز است ، مؤثر است.در این کار ، ما به سناریویی می پردازیم که تقلید کننده فقط به رفتار مشاهده شده متکی است و نمی تواند تعامل محیطی را در حین یادگیری انجام دهد.این مجموعه داده های تکمیلی اضافی فراتر از مجموعه داده های متخصص و هیچ اطلاعاتی در مورد دینامیک انتقال ندارد.بر خلاف روشهای پیشرفته (SOTA) IL ، این رویکرد با کار در یک محیط محدودتر و واقع بینانه تر ، محدودیت های IL معمولی را برطرف می کند.روش ما از معادله تعادل Markov استفاده می کند و یک چارچوب یادگیری تقلید مبتنی بر تخمین مبتنی بر تخمین را معرفی می کند.از جریان عادی سازی مشروط برای برآورد دینامیک انتقال استفاده می کند و هدف آن رضایت یک معادله تعادل برای محیط زیست است.از طریق مجموعه ای از آزمایشات عددی در مورد کنترل کلاسیک و محیط های Mujoco ، ما عملکرد تجربی به طور مداوم برتر را در مقایسه با بسیاری از الگوریتم های SOTA IL نشان می دهیم.

فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله رضایت از تعادل مارکوف باعث بهبود عملکرد در یادگیری تقلید آفلاین دسته ای می شود”

ترجمه فارسی مقاله رضایت از تعادل مارکوف باعث بهبود عملکرد در یادگیری تقلید آفلاین دسته ای می شود

چکیده

چکیده به فارسی (ترجمه ماشینی)

نقد و بررسی‌ها

محصولات مرتبط

مقاله یادگیری سیاست های ترکیبی برای MPC با کاربرد پرواز هواپیماهای بدون سرنشین در محیط های دینامیک ناشناخته

مقاله MITS-GAN: حفاظت از تصویربرداری پزشکی در برابر دستکاری شبکه‌های متخاصم مولد

مقاله تقسیم‌بندی خودکار سه بعدی اولتراسوند چندوجهی جفت انسان با استفاده از استراتژی‌های فیوژن و یادگیری عمیق

مقاله تشخیص گوشه کارآمد حافظه برای سنسورهای دید پویای مبتنی بر رویداد