,

ترجمه فارسی مقاله شکل‌دهی پاداش خود-تطبیقی ​​بسیار کارآمد برای یادگیری تقویتی

19,000 تومان880,000 تومان

شناسه محصول: نامعلوم دسته: ,
عنوان مقاله به انگلیسی Highly Efficient Self-Adaptive Reward Shaping for Reinforcement Learning
عنوان مقاله به فارسی ترجمه فارسی مقاله شکل‌دهی پاداش خود-تطبیقی ​​بسیار کارآمد برای یادگیری تقویتی
نویسندگان Haozhe Ma, Zhengding Luo, Thanh Vinh Vo, Kuankuan Sima, Tze-Yun Leong
فرمت مقاله انگلیسی PDF
زبان مقاله تحویلی ترجمه فارسی
فرمت مقاله ترجمه شده به صورت فایل ورد
نحوه تحویل ترجمه دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات 22
دسته بندی موضوعات Machine Learning,Artificial Intelligence,یادگیری ماشین , هوش مصنوعی ,
توضیحات Submitted 7 August, 2024; v1 submitted 6 August, 2024; originally announced August 2024.
توضیحات به فارسی ارسال شده در 7 اوت 2024 ؛V1 ارسال شده در 6 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد.

توضیحات گزینه‌های خرید

دانلود مقاله اصل انگلیسی

با انتخاب این گزینه، می‌توانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.

قیمت: 19,000 تومان

سفارش ترجمه فارسی مقاله

با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، ترجمه فارسی مقاله را نیز سفارش می‌دهید.

قیمت: 880,000 تومان

زمان تحویل: 2 تا 3 روز کاری

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

Reward shaping addresses the challenge of sparse rewards in reinforcement learning by constructing denser and more informative reward signals. To achieve self-adaptive and highly efficient reward shaping, we propose a novel method that incorporates success rates derived from historical experiences into shaped rewards. Our approach utilizes success rates sampled from Beta distributions, which dynamically evolve from uncertain to reliable values as more data is collected. Initially, the self-adaptive success rates exhibit more randomness to encourage exploration. Over time, they become more certain to enhance exploitation, thus achieving a better balance between exploration and exploitation. We employ Kernel Density Estimation (KDE) combined with Random Fourier Features (RFF) to derive the Beta distributions, resulting in a computationally efficient implementation in high-dimensional continuous state spaces. This method provides a non-parametric and learning-free approach. The proposed method is evaluated on a wide range of continuous control tasks with sparse and delayed rewards, demonstrating significant improvements in sample efficiency and convergence stability compared to relevant baselines.

چکیده به فارسی (ترجمه ماشینی)

شکل دهی پاداش با ایجاد سیگنال های متراکم تر و آموزنده تر پاداش ، به چالش پاداش های پراکنده در یادگیری تقویت می پردازد.برای دستیابی به شکل گیری پاداش خود سازگار و بسیار کارآمد ، ما یک روش جدید را پیشنهاد می کنیم که میزان موفقیت حاصل از تجربیات تاریخی را به پاداش های شکل می رساند.رویکرد ما از نرخ موفقیت نمونه برداری از توزیع بتا استفاده می کند ، که با جمع آوری داده های بیشتر ، به صورت پویا از نامشخص به مقادیر قابل اعتماد تکامل می یابد.در ابتدا ، نرخ موفقیت خود سازگار برای تشویق اکتشاف ، تصادفی بیشتری را نشان می دهد.با گذشت زمان ، آنها برای تقویت بهره برداری مطمئن تر می شوند ، بنابراین به تعادل بهتر بین اکتشاف و بهره برداری می رسند.ما از برآورد چگالی هسته (KDE) همراه با ویژگی های تصادفی فوریه (RFF) استفاده می کنیم تا توزیع بتا را بدست آوریم ، و در نتیجه اجرای محاسباتی کارآمد در فضاهای حالت مداوم با ابعاد بالا انجام می شود.این روش یک رویکرد غیر پارامتری و بدون یادگیری را ارائه می دهد.روش پیشنهادی در طیف گسترده ای از کارهای کنترل مداوم با پاداش های پراکنده و تأخیر ارزیابی می شود و نشان دهنده پیشرفت های قابل توجهی در راندمان نمونه و ثبات همگرایی در مقایسه با پایه های مربوطه است.

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.
نوع دانلود

دانلود مقاله اصل انگلیسی, سفارش ترجمه فارسی مقاله

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله شکل‌دهی پاداش خود-تطبیقی ​​بسیار کارآمد برای یادگیری تقویتی”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا