“مقاله گذار آنلاین: تجربیات تدریس درس کاوش متن و داده در قرنطینه و بهبود آموزش مجازی با برنامه‌نویسی دونفره و نشان‌های دیجیتال به همراه PDF فارسی + پادکست صوتی فارسی + ویدیو آموزشی فارسی” به سبد خرید شما اضافه شد. ادامه خرید

“مقاله تبیین توصیفات مفهومی $mathcal{ELH}$ از طریق استدلال پادواقعی به همراه PDF فارسی + پادکست صوتی فارسی + ویدیو آموزشی فارسی” به سبد خرید شما اضافه شد. ادامه خرید

“کتاب ترمیم کن، بپوش، دوستش داشته باش؛ راهی به سوی کمد لباس پایدار” به سبد خرید شما اضافه شد. ادامه خرید

“مقاله FEVEROUS: استخراج و راستی‌آزمایی گزاره از اطلاعات ساختاریافته و ساختارنیافته به همراه PDF فارسی + پادکست صوتی فارسی + ویدیو آموزشی فارسی” به سبد خرید شما اضافه شد. ادامه خرید

دسته-بندی-نشده, مقاله علمی

ترجمه فارسی مقاله بدون مدل $H_{infty}$ کنترل سیستم تصادفی Itô از طریق یادگیری تقویت کننده خارج از سیاست

300,000 تومان

دسته: دسته-بندی-نشده, مقاله علمی برچسب: Optimization and Control, بهینه سازی و کنترل

توضیحات
نظرات (0)

عنوان مقاله به انگلیسی	Model-free $H_{\infty}$ control of Itô stochastic system via off-policy reinforcement learning
عنوان مقاله به فارسی	ترجمه فارسی مقاله بدون مدل $H_{\infty}$ کنترل سیستم تصادفی Itô از طریق یادگیری تقویت کننده خارج از سیاست
نویسندگان	Jing Guo Jing Guo, Xiushan Jiang, Weihai Zhang
فرمت مقاله انگلیسی	PDF
زبان مقاله تحویلی	ترجمه فارسی
فرمت مقاله ترجمه شده	به صورت فایل ورد
نحوه تحویل ترجمه	دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات	15
لینک دانلود رایگان مقاله انگلیسی	دانلود مقاله
دسته بندی موضوعات	Optimization and Control,بهینه سازی و کنترل ,
توضیحات	Submitted 7 March, 2024; originally announced March 2024.
توضیحات به فارسی	ارسال 7 مارس 2024 ؛در ابتدا مارس 2024 اعلام شد.
اطلاعات بیشتر از این مقاله در پایگاه های علمی	INSPIRE HEP NASA ADS Google Scholar Semantic Scholar
فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

The stochastic $H_{\infty}$ control is studied for a linear stochastic Itô system with an unknown system model. The linear stochastic $H_{\infty}$ control issue is known to be transformable into the problem of solving a so-called generalized algebraic Riccati equation (GARE), which is a nonlinear equation that is typically difficult to solve analytically. Worse, model-based techniques cannot be utilized to approximately solve a GARE when an accurate system model is unavailable or prohibitively expensive to construct in reality. To address these issues, an off-policy reinforcement learning (RL) approach is presented to learn the solution of a GARE from real system data rather than a system model; its convergence is demonstrated, and the robustness of RL to errors in the learning process is investigated. In the off-policy RL approach, the system data may be created with behavior policies rather than the target policies, which is highly significant and promising for use in actual systems. Finally, the proposed off-policy RL approach is validated on a stochastic linear F-16 aircraft system.

چکیده به فارسی (ترجمه ماشینی)

کنترل تصادفی $ H _ {\ infty} $ برای یک سیستم ITô تصادفی خطی با یک مدل سیستم ناشناخته مورد مطالعه قرار می گیرد.خطی خطی $ H _ {\ infty} $ کنترل $ شناخته شده است که به مشکل حل یک معادله به اصطلاح جبری عمومی (GARE) تبدیل می شود ، که یک معادله غیرخطی است که به طور معمول حل تحلیلی دشوار است.از این بدتر ، تکنیک های مبتنی بر مدل نمی توانند برای حل تقریباً یک غرق استفاده شوند که یک مدل سیستم دقیق در دسترس نباشد یا برای ساخت در واقعیت بسیار گران باشد.برای پرداختن به این موضوعات ، یک رویکرد یادگیری تقویت کننده خارج از سیاست (RL) برای یادگیری راه حل یک GARE از داده های سیستم واقعی و نه یک مدل سیستم ارائه شده است.همگرایی آن نشان داده شده است و استحکام RL به خطاها در فرایند یادگیری مورد بررسی قرار می گیرد.در رویکرد RL خارج از سیاست ، داده های سیستم ممکن است به جای سیاست های هدف ، با سیاست های رفتاری ایجاد شود ، که بسیار مهم و امیدوار کننده برای استفاده در سیستم های واقعی است.سرانجام ، رویکرد RL خارج از سیاست پیشنهادی بر روی یک سیستم هواپیمای خطی F-16 خطی تصادفی تأیید شده است.

فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله بدون مدل $H_{infty}$ کنترل سیستم تصادفی Itô از طریق یادگیری تقویت کننده خارج از سیاست”

ترجمه فارسی مقاله بدون مدل $H_{infty}$ کنترل سیستم تصادفی Itô از طریق یادگیری تقویت کننده خارج از سیاست

چکیده

چکیده به فارسی (ترجمه ماشینی)

نقد و بررسی‌ها

محصولات مرتبط

100 پرسش و پاسخ در مورد دیابت

مقاله در مورد گفتار قبل از تأکید به عنوان یک روش ساده و ارزان برای تقویت تقویت گفتار

مقاله یک رویکرد کنترل بهینه سازگار به حداکثر رعایت عمق یکپارچه

مقاله توالی های حداکثر متمرکز پس از شیفت های نیمه نمونه