| عنوان مقاله به انگلیسی | Kolmogorov-Arnold Network for Online Reinforcement Learning |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله شبکه کولموگروف-آرنولد برای یادگیری تقویتی آنلاین |
| نویسندگان | Victor Augusto Kich, Jair Augusto Bottega, Raul Steinmetz, Ricardo Bedin Grando, Ayano Yorozu, Akihisa Ohya |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 6 |
| دسته بندی موضوعات | Machine Learning,Artificial Intelligence,یادگیری ماشین , هوش مصنوعی , |
| توضیحات | Submitted 31 August, 2024; v1 submitted 8 August, 2024; originally announced August 2024. , Comments: Paper accepted at 24th International Conference on Control, Automation and Systems (ICCAS) |
| توضیحات به فارسی | ارسال 31 اوت 2024 ؛V1 ارسال شده در 8 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. ، نظرات: مقاله پذیرفته شده در 24 کنفرانس بین المللی کنترل ، اتوماسیون و سیستم (ICCAS) |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
سفارش ترجمه فارسی مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، ترجمه فارسی مقاله را نیز سفارش میدهید.
قیمت: 240,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
Kolmogorov-Arnold Networks (KANs) have shown potential as an alternative to Multi-Layer Perceptrons (MLPs) in neural networks, providing universal function approximation with fewer parameters and reduced memory usage. In this paper, we explore the use of KANs as function approximators within the Proximal Policy Optimization (PPO) algorithm. We evaluate this approach by comparing its performance to the original MLP-based PPO using the DeepMind Control Proprio Robotics benchmark. Our results indicate that the KAN-based reinforcement learning algorithm can achieve comparable performance to its MLP-based counterpart, often with fewer parameters. These findings suggest that KANs may offer a more efficient option for reinforcement learning models.
چکیده به فارسی (ترجمه ماشینی)
شبکه های Kolmogorov-Arnold (KANS) پتانسیل را به عنوان جایگزینی برای Perceptrons چند لایه (MLP) در شبکه های عصبی نشان داده اند و عملکرد جهانی را با پارامترهای کمتری و کاهش استفاده از حافظه ارائه می دهند.در این مقاله ، ما استفاده از KAN ها را به عنوان تقریب عملکرد در الگوریتم بهینه سازی سیاست پروگزیمال (PPO) بررسی می کنیم.ما این رویکرد را با مقایسه عملکرد آن با PPO مبتنی بر MLP اصلی با استفاده از معیار Robotics Control DeepMind Proprio ارزیابی می کنیم.نتایج ما نشان می دهد که الگوریتم یادگیری تقویت مبتنی بر KAN می تواند عملکرد قابل مقایسه ای را با همتای مبتنی بر MLP خود بدست آورد ، اغلب با پارامترهای کمتری.این یافته ها نشان می دهد که KANS ممکن است گزینه ای کارآمدتر برای مدل های یادگیری تقویت کننده ارائه دهد.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |



نقد و بررسیها
هنوز بررسیای ثبت نشده است.