| عنوان مقاله به انگلیسی | Model-free $H_{\infty}$ control of Itô stochastic system via off-policy reinforcement learning | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله بدون مدل $H_{\infty}$ کنترل سیستم تصادفی Itô از طریق یادگیری تقویت کننده خارج از سیاست | ||||||||
| نویسندگان | Jing Guo Jing Guo, Xiushan Jiang, Weihai Zhang | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 15 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Optimization and Control,بهینه سازی و کنترل , | ||||||||
| توضیحات | Submitted 7 March, 2024; originally announced March 2024. | ||||||||
| توضیحات به فارسی | ارسال 7 مارس 2024 ؛در ابتدا مارس 2024 اعلام شد. | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
The stochastic $H_{\infty}$ control is studied for a linear stochastic Itô system with an unknown system model. The linear stochastic $H_{\infty}$ control issue is known to be transformable into the problem of solving a so-called generalized algebraic Riccati equation (GARE), which is a nonlinear equation that is typically difficult to solve analytically. Worse, model-based techniques cannot be utilized to approximately solve a GARE when an accurate system model is unavailable or prohibitively expensive to construct in reality. To address these issues, an off-policy reinforcement learning (RL) approach is presented to learn the solution of a GARE from real system data rather than a system model; its convergence is demonstrated, and the robustness of RL to errors in the learning process is investigated. In the off-policy RL approach, the system data may be created with behavior policies rather than the target policies, which is highly significant and promising for use in actual systems. Finally, the proposed off-policy RL approach is validated on a stochastic linear F-16 aircraft system.
چکیده به فارسی (ترجمه ماشینی)
کنترل تصادفی $ H _ {\ infty} $ برای یک سیستم ITô تصادفی خطی با یک مدل سیستم ناشناخته مورد مطالعه قرار می گیرد.خطی خطی $ H _ {\ infty} $ کنترل $ شناخته شده است که به مشکل حل یک معادله به اصطلاح جبری عمومی (GARE) تبدیل می شود ، که یک معادله غیرخطی است که به طور معمول حل تحلیلی دشوار است.از این بدتر ، تکنیک های مبتنی بر مدل نمی توانند برای حل تقریباً یک غرق استفاده شوند که یک مدل سیستم دقیق در دسترس نباشد یا برای ساخت در واقعیت بسیار گران باشد.برای پرداختن به این موضوعات ، یک رویکرد یادگیری تقویت کننده خارج از سیاست (RL) برای یادگیری راه حل یک GARE از داده های سیستم واقعی و نه یک مدل سیستم ارائه شده است.همگرایی آن نشان داده شده است و استحکام RL به خطاها در فرایند یادگیری مورد بررسی قرار می گیرد.در رویکرد RL خارج از سیاست ، داده های سیستم ممکن است به جای سیاست های هدف ، با سیاست های رفتاری ایجاد شود ، که بسیار مهم و امیدوار کننده برای استفاده در سیستم های واقعی است.سرانجام ، رویکرد RL خارج از سیاست پیشنهادی بر روی یک سیستم هواپیمای خطی F-16 خطی تصادفی تأیید شده است.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |



نقد و بررسیها
هنوز بررسیای ثبت نشده است.