| عنوان مقاله به انگلیسی | Training Verifiably Robust Agents Using Set-Based Reinforcement Learning | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله آموزش عوامل قابل تایید قوی با استفاده از یادگیری تقویتی مبتنی بر مجموعه | ||||||||
| نویسندگان | Manuel Wendl, Lukas Koller, Tobias Ladner, Matthias Althoff | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 12 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Machine Learning,Robotics,Systems and Control,یادگیری ماشین , روباتیک , سیستم و کنترل , | ||||||||
| توضیحات | Submitted 17 August, 2024; originally announced August 2024. | ||||||||
| توضیحات به فارسی | ارسال شده 17 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
Reinforcement learning often uses neural networks to solve complex control tasks. However, neural networks are sensitive to input perturbations, which makes their deployment in safety-critical environments challenging. This work lifts recent results from formally verifying neural networks against such disturbances to reinforcement learning in continuous state and action spaces using reachability analysis. While previous work mainly focuses on adversarial attacks for robust reinforcement learning, we train neural networks utilizing entire sets of perturbed inputs and maximize the worst-case reward. The obtained agents are verifiably more robust than agents obtained by related work, making them more applicable in safety-critical environments. This is demonstrated with an extensive empirical evaluation of four different benchmarks.
چکیده به فارسی (ترجمه ماشینی)
یادگیری تقویت کننده اغلب از شبکه های عصبی برای حل وظایف کنترل پیچیده استفاده می کند.با این حال ، شبکه های عصبی نسبت به آشفتگی های ورودی حساس هستند ، که باعث می شود استقرار آنها در محیط های مهم ایمنی به چالش کشیده شود.این کار نتایج اخیر را از تأیید رسمی شبکه های عصبی در برابر چنین اختلالات به یادگیری تقویت در حالت مداوم و فضاهای عمل با استفاده از تجزیه و تحلیل قابلیت دسترسی بالا می برد.در حالی که کارهای قبلی عمدتاً بر حملات مخالف برای یادگیری تقویت کننده قوی متمرکز است ، ما شبکه های عصبی را با استفاده از مجموعه های ورودی های آشفته آموزش می دهیم و بدترین پاداش را به حداکثر می رسانیم.عوامل به دست آمده نسبت به عوامل به دست آمده توسط کار مرتبط با آن بسیار قوی تر هستند و آنها را در محیط های مهم ایمنی کاربردتر می کنند.این با یک ارزیابی تجربی گسترده از چهار معیار مختلف نشان داده شده است.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.