| عنوان مقاله به انگلیسی | Approximation of Convex Envelope Using Reinforcement Learning |
| عنوان مقاله به فارسی | مقاله تخمین انولوپ محدب با استفاده از یادگیری تقویت |
| نویسندگان | Vivek S. Borkar, Adit Akarsh |
| زبان مقاله | انگلیسی |
| فرمت مقاله: | |
| تعداد صفحات | 6 |
| دسته بندی موضوعات | Systems and Control,Machine Learning,سیستم ها و کنترل , یادگیری ماشین , |
| توضیحات | Submitted 24 November, 2023; originally announced November 2023. |
| توضیحات به فارسی | ارسال شده 24 نوامبر 2023 ؛در ابتدا نوامبر 2023 اعلام شد. |
چکیده
Oberman gave a stochastic control formulation of the problem of estimating the convex envelope of a non-convex function. Based on this, we develop a reinforcement learning scheme to approximate the convex envelope, using a variant of Q-learning for controlled optimal stopping. It shows very promising results on a standard library of test problems.
چکیده به فارسی (ترجمه ماشینی)
اوبرمن یک فرمول کنترل تصادفی از مشکل تخمین پاکت محدب یک عملکرد غیر کنفکس ارائه داد.بر این اساس ، ما یک طرح یادگیری تقویت برای تقریب پاکت محدب ، با استفاده از یک نوع یادگیری Q برای توقف بهینه کنترل شده تهیه می کنیم.این نتایج بسیار امیدوارکننده را در یک کتابخانه استاندارد از مشکلات آزمون نشان می دهد.
| توجه کنید این مقاله به زبان انگلیسی است. |
|
برای سفارش ترجمه این مقاله می توانید به یکی از روش های تماس، پیامک، تلگرام و یا واتس اپ با شماره زیر تماس بگیرید:
09395106248 توجه کنید که شرایط ترجمه به صورت زیر است:
|


نقد و بررسیها
هنوز بررسیای ثبت نشده است.