| عنوان مقاله به انگلیسی | Safe and Stable Closed-Loop Learning for Neural-Network-Supported Model Predictive Control | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله یادگیری حلقه بسته ایمن و پایدار برای کنترل پیش بینی مدل پشتیبانی شده از شبکه عصبی | ||||||||
| نویسندگان | Sebastian Hirt, Maik Pfefferkorn, Rolf Findeisen | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 7 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Systems and Control,Machine Learning,سیستم ها و کنترل , یادگیری ماشین , | ||||||||
| توضیحات | Submitted 16 September, 2024; originally announced September 2024. , Comments: 7 pages, 2 figures, accepted for CDC 2024 | ||||||||
| توضیحات به فارسی | ارائه شده 16 سپتامبر 2024 ؛در ابتدا سپتامبر 2024 اعلام شد ، نظرات: 7 صفحه ، 2 شکل ، برای CDC 2024 پذیرفته شده است | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
Safe learning of control policies remains challenging, both in optimal control and reinforcement learning. In this article, we consider safe learning of parametrized predictive controllers that operate with incomplete information about the underlying process. To this end, we employ Bayesian optimization for learning the best parameters from closed-loop data. Our method focuses on the system’s overall long-term performance in closed-loop while keeping it safe and stable. Specifically, we parametrize the stage cost function of an MPC using a feedforward neural network. This allows for a high degree of flexibility, enabling the system to achieve a better closed-loop performance with respect to a superordinate measure. However, this flexibility also necessitates safety measures, especially with respect to closed-loop stability. To this end, we explicitly incorporated stability information in the Bayesian-optimization-based learning procedure, thereby achieving rigorous probabilistic safety guarantees. The proposed approach is illustrated using a numeric example.
چکیده به فارسی (ترجمه ماشینی)
یادگیری ایمن از سیاست های کنترل ، هم در کنترل بهینه و هم در یادگیری تقویت کننده ، چالش برانگیز است.در این مقاله ، ما یادگیری ایمن کنترل کننده های پیش بینی شده پارامتر شده را که با اطلاعات ناقص در مورد فرآیند اساسی کار می کنند ، در نظر می گیریم.برای این منظور ، ما بهینه سازی بیزی را برای یادگیری بهترین پارامترها از داده های حلقه بسته استفاده می کنیم.روش ما بر عملکرد کلی طولانی مدت سیستم در حلقه بسته و در عین حال ایمن و پایدار است.به طور خاص ، ما عملکرد هزینه مرحله یک MPC را با استفاده از یک شبکه عصبی Feedforward پارامتر می کنیم.این امکان انعطاف پذیری بالایی را فراهم می کند و این سیستم را قادر می سازد تا با توجه به یک اندازه گیری فوق العاده ، عملکرد حلقه بسته بهتر را بدست آورد.با این حال ، این انعطاف پذیری همچنین نیاز به اقدامات ایمنی ، به ویژه با توجه به ثبات حلقه بسته دارد.برای این منظور ، ما صریحاً اطلاعات ثبات را در روش یادگیری مبتنی بر بهینه سازی بیزی گنجانیده ایم و از این طریق به ضمانت های سختگیرانه احتمالی احتمالی دست می یابیم.روش پیشنهادی با استفاده از یک مثال عددی نشان داده شده است.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.