| عنوان مقاله به انگلیسی | Safety-Oriented Pruning and Interpretation of Reinforcement Learning Policies | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله هرس ایمنی گرا و تفسیر سیاست های یادگیری تقویتی | ||||||||
| نویسندگان | Dennis Gross, Helge Spieker | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 8 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Machine Learning,یادگیری ماشین , | ||||||||
| توضیحات | Submitted 16 September, 2024; originally announced September 2024. | ||||||||
| توضیحات به فارسی | ارائه شده 16 سپتامبر 2024 ؛در ابتدا سپتامبر 2024 اعلام شد. | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
Pruning neural networks (NNs) can streamline them but risks removing vital parameters from safe reinforcement learning (RL) policies. We introduce an interpretable RL method called VERINTER, which combines NN pruning with model checking to ensure interpretable RL safety. VERINTER exactly quantifies the effects of pruning and the impact of neural connections on complex safety properties by analyzing changes in safety measurements. This method maintains safety in pruned RL policies and enhances understanding of their safety dynamics, which has proven effective in multiple RL settings.
چکیده به فارسی (ترجمه ماشینی)
هرس شبکه های عصبی (NNS) می تواند آنها را ساده تر کند ، اما خطرات حذف پارامترهای حیاتی از سیاست های یادگیری تقویت کننده ایمن (RL) را به خطر می اندازد.ما یک روش RL قابل تفسیر به نام Verinter را معرفی می کنیم ، که برای اطمینان از ایمنی RL قابل تفسیر ، هرس NN را با بررسی مدل ترکیب می کند.Verinter دقیقاً با تجزیه و تحلیل تغییرات در اندازه گیری های ایمنی ، اثرات هرس و تأثیر اتصالات عصبی بر خصوصیات ایمنی پیچیده را تعیین می کند.این روش ایمنی را در سیاست های RL هرس شده حفظ می کند و درک پویایی ایمنی آنها را تقویت می کند ، که در تنظیمات چند RL اثبات شده است.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.