,

ترجمه فارسی مقاله پاداش‌های ذاتی فرایادگیری جعبه سیاه برای محیط‌های با پاداش پراکنده

19,000 تومان560,000 تومان

شناسه محصول: نامعلوم دسته: ,
عنوان مقاله به انگلیسی Black box meta-learning intrinsic rewards for sparse-reward environments
عنوان مقاله به فارسی ترجمه فارسی مقاله پاداش‌های ذاتی فرایادگیری جعبه سیاه برای محیط‌های با پاداش پراکنده
نویسندگان Octavio Pappalardo, Rodrigo Ramele, Juan Miguel Santos
فرمت مقاله انگلیسی PDF
زبان مقاله تحویلی ترجمه فارسی
فرمت مقاله ترجمه شده به صورت فایل ورد
نحوه تحویل ترجمه دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات 14
دسته بندی موضوعات Machine Learning,یادگیری ماشین ,
توضیحات Submitted 31 July, 2024; originally announced July 2024. , Comments: This work is part of OP Bachelor’s Degree Thesis
توضیحات به فارسی ارسال 31 ژوئیه 2024 ؛در ابتدا ژوئیه 2024 اعلام شد. ، نظرات: این کار بخشی از پایان نامه مدرک لیسانس OP است

توضیحات گزینه‌های خرید

دانلود مقاله اصل انگلیسی

با انتخاب این گزینه، می‌توانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.

قیمت: 19,000 تومان

دانلود مقاله اصل انگلیسی + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله

با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، یک خلاصه دو صفحه‌ای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.

قیمت: 99,000 تومان

سفارش ترجمه فارسی مقاله + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله

با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی و ترجمه کامل آن، یک خلاصه دو صفحه‌ای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.

قیمت: 560,000 تومان

زمان تحویل: 2 تا 3 روز کاری

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

Despite the successes and progress of deep reinforcement learning over the last decade, several challenges remain that hinder its broader application. Some fundamental aspects to improve include data efficiency, generalization capability, and ability to learn in sparse-reward environments, which often require human-designed dense rewards. Meta-learning has emerged as a promising approach to address these issues by optimizing components of the learning algorithm to meet desired characteristics. Additionally, a different line of work has extensively studied the use of intrinsic rewards to enhance the exploration capabilities of algorithms. This work investigates how meta-learning can improve the training signal received by RL agents. The focus is on meta-learning intrinsic rewards under a framework that doesn’t rely on the use of meta-gradients. We analyze and compare this approach to the use of extrinsic rewards and a meta-learned advantage function. The developed algorithms are evaluated on distributions of continuous control tasks with both parametric and non-parametric variations, and with only sparse rewards accessible for the evaluation tasks.

چکیده به فارسی (ترجمه ماشینی)

با وجود موفقیت ها و پیشرفت یادگیری عمیق در طی یک دهه گذشته ، چندین چالش باقی مانده است که مانع کاربرد گسترده تر آن می شود.برخی از جنبه های اساسی برای بهبود شامل راندمان داده ها ، توانایی تعمیم و توانایی یادگیری در محیط های پراکنده پاداش ، که اغلب به پاداش های متراکم با طراحی انسان نیاز دارند.یادگیری متا به عنوان یک رویکرد امیدوارکننده برای رسیدگی به این موضوعات با بهینه سازی مؤلفه های الگوریتم یادگیری برای برآورده کردن ویژگی های مورد نظر ظاهر شده است.علاوه بر این ، یک خط متفاوت از کار به طور گسترده استفاده از پاداش های ذاتی را برای تقویت قابلیت های اکتشاف الگوریتم ها مورد مطالعه قرار داده است.این کار بررسی می کند که چگونه یادگیری متا می تواند سیگنال آموزشی دریافت شده توسط نمایندگان RL را بهبود بخشد.تمرکز بر روی پاداش های ذاتی متا یادگیری در زیر چارچوبی است که به استفاده از دانش آموزان متا تکیه نمی کند.ما این روش را با استفاده از پاداش های بیرونی و یک عملکرد مزیت یاد گرفته شده تجزیه و تحلیل و مقایسه می کنیم.الگوریتم های توسعه یافته بر روی توزیع وظایف کنترل مداوم با تغییرات پارامتری و غیر پارامتری ، و تنها با پاداش های پراکنده برای کارهای ارزیابی قابل دسترسی هستند.

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.
نوع دانلود

دانلود مقاله اصل انگلیسی, دانلود مقاله اصل انگلیسی + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله, سفارش ترجمه فارسی مقاله + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله پاداش‌های ذاتی فرایادگیری جعبه سیاه برای محیط‌های با پاداش پراکنده”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا