ترجمه فارسی مقاله IRECA: یادگیری تقویت شده با متن تقویت شده با پاداش ذاتی برای هماهنگی انسانی و آه

360,000 تومان

توضیحات
نظرات (0)

عنوان مقاله به انگلیسی	IReCa: Intrinsic Reward-enhanced Context-aware Reinforcement Learning for Human-AI Coordination
عنوان مقاله به فارسی	ترجمه فارسی مقاله IRECA: یادگیری تقویت شده با متن تقویت شده با پاداش ذاتی برای هماهنگی انسانی و آه
نویسندگان	Xin Hao, Bahareh Nakisa, Mohmmad Naim Rastgoo, Richard Dazeley
فرمت مقاله انگلیسی	PDF
زبان مقاله تحویلی	ترجمه فارسی
فرمت مقاله ترجمه شده	به صورت فایل ورد
نحوه تحویل ترجمه	دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات	9
لینک دانلود رایگان مقاله انگلیسی	دانلود مقاله
دسته بندی موضوعات	Artificial Intelligence,Machine Learning,هوش مصنوعی , یادگیری ماشین ,
توضیحات	Submitted 27 August, 2024; v1 submitted 14 August, 2024; originally announced August 2024.
توضیحات به فارسی	ارسال شده در 27 اوت 2024 ؛V1 ارسال شده در 14 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد.
اطلاعات بیشتر از این مقاله در پایگاه های علمی	INSPIRE HEP NASA ADS Google Scholar Semantic Scholar
فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

In human-AI coordination scenarios, human agents usually exhibit asymmetric behaviors that are significantly sparse and unpredictable compared to those of AI agents. These characteristics introduce two primary challenges to human-AI coordination: the effectiveness of obtaining sparse rewards and the efficiency of training the AI agents. To tackle these challenges, we propose an Intrinsic Reward-enhanced Context-aware (IReCa) reinforcement learning (RL) algorithm, which leverages intrinsic rewards to facilitate the acquisition of sparse rewards and utilizes environmental context to enhance training efficiency. Our IReCa RL algorithm introduces three unique features: (i) it encourages the exploration of sparse rewards by incorporating intrinsic rewards that supplement traditional extrinsic rewards from the environment; (ii) it improves the acquisition of sparse rewards by prioritizing the corresponding sparse state-action pairs; and (iii) it enhances the training efficiency by optimizing the exploration and exploitation through innovative context-aware weights of extrinsic and intrinsic rewards. Extensive simulations executed in the Overcooked layouts demonstrate that our IReCa RL algorithm can increase the accumulated rewards by approximately 20% and reduce the epochs required for convergence by approximately 67% compared to state-of-the-art baselines.

چکیده به فارسی (ترجمه ماشینی)

در سناریوهای هماهنگی بشر و AI ، عوامل انسانی معمولاً رفتارهای نامتقارن را نشان می دهند که در مقایسه با عوامل AI به طور قابل توجهی پراکنده و غیرقابل پیش بینی هستند.این خصوصیات دو چالش اصلی را با هماهنگی انسان و عایدی معرفی می کند: اثربخشی به دست آوردن پاداش های پراکنده و کارآیی آموزش عوامل هوش مصنوعی.برای مقابله با این چالش ها ، ما یک الگوریتم یادگیری تقویت تقویت شده با تقویت پاداش (IRECA) (RL) را پیشنهاد می کنیم ، که برای تسهیل در کسب پاداش های پراکنده ، از پاداش های ذاتی استفاده می کند و از زمینه محیط زیست برای تقویت راندمان آموزش استفاده می کند.الگوریتم IRECA RL ما سه ویژگی منحصر به فرد را معرفی می کند: (i) با درج پاداش های ذاتی که جوایز بیرونی سنتی را از محیط زیست تکمیل می کند ، اکتشاف پاداش های پراکنده را تشویق می کند.(ب) با اولویت بندی جفت های عملکرد پراکنده مربوطه ، کسب پاداش های پراکنده را بهبود می بخشد.و (iii) این کار با بهینه سازی اکتشاف و بهره برداری از طریق وزن نوآورانه آگاهی از پاداش های بیرونی و ذاتی ، بهره وری آموزش را افزایش می دهد.شبیه سازی های گسترده ای که در طرح های بیش از حد پخته شده اجرا می شود نشان می دهد که الگوریتم IRECA RL ما می تواند پاداش های انباشته شده را تقریباً 20 ٪ افزایش دهد و دوره های مورد نیاز برای همگرایی را تقریباً 67 ٪ در مقایسه با پایه های مدرن از هنر کاهش دهد.

فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله IRECA: یادگیری تقویت شده با متن تقویت شده با پاداش ذاتی برای هماهنگی انسانی و آه”

ترجمه فارسی مقاله IRECA: یادگیری تقویت شده با متن تقویت شده با پاداش ذاتی برای هماهنگی انسانی و آه

چکیده

چکیده به فارسی (ترجمه ماشینی)

نقد و بررسی‌ها

محصولات مرتبط

مقاله ISAC با تگ های RFID پس پراکنش: طراحی پرتوهای متصل

مقاله تشخیص گفتار بصری چند زبانه با یک مدل واحد با یادگیری با واحدهای گفتار بصری گسسته

مقاله بهبود تشخیص احساس گفتار مستقل از سخنران با استفاده از سازگاری توزیع مشترک پویا

مقاله تقسیم بندی CT کبد از طریق رمزگذاری مبتنی بر PVT و رمزگشایی تصفیه شده