,

مقاله تخمین انولوپ محدب با استفاده از یادگیری تقویت

10,000 تومان

عنوان مقاله به انگلیسی Approximation of Convex Envelope Using Reinforcement Learning
عنوان مقاله به فارسی مقاله تخمین انولوپ محدب با استفاده از یادگیری تقویت
نویسندگان Vivek S. Borkar, Adit Akarsh
زبان مقاله انگلیسی
فرمت مقاله: PDF
تعداد صفحات 6
دسته بندی موضوعات Systems and Control,Machine Learning,سیستم ها و کنترل , یادگیری ماشین ,
توضیحات Submitted 24 November, 2023; originally announced November 2023.
توضیحات به فارسی ارسال شده 24 نوامبر 2023 ؛در ابتدا نوامبر 2023 اعلام شد.

چکیده

Oberman gave a stochastic control formulation of the problem of estimating the convex envelope of a non-convex function. Based on this, we develop a reinforcement learning scheme to approximate the convex envelope, using a variant of Q-learning for controlled optimal stopping. It shows very promising results on a standard library of test problems.

چکیده به فارسی (ترجمه ماشینی)

اوبرمن یک فرمول کنترل تصادفی از مشکل تخمین پاکت محدب یک عملکرد غیر کنفکس ارائه داد.بر این اساس ، ما یک طرح یادگیری تقویت برای تقریب پاکت محدب ، با استفاده از یک نوع یادگیری Q برای توقف بهینه کنترل شده تهیه می کنیم.این نتایج بسیار امیدوارکننده را در یک کتابخانه استاندارد از مشکلات آزمون نشان می دهد.

توجه کنید این مقاله به زبان انگلیسی است.
برای سفارش ترجمه این مقاله می توانید به یکی از روش های تماس، پیامک، تلگرام و یا واتس اپ با شماره زیر تماس بگیرید:

09395106248

توجه کنید که شرایط ترجمه به صورت زیر است:
  • قیمت هر صفحه ترجمه در حال حاضر 40 هزار تومان می باشد.
  • تحویل مقاله ترجمه شده به صورت فایل ورد می باشد.
  • زمان تحویل ترجمه مقاله در صورت داشتن تعداد صفحات عادی بین 3 تا 5 روز خواهد بود.
  • کیفیت ترجمه بسیار بالا می باشد. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
  • کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “مقاله تخمین انولوپ محدب با استفاده از یادگیری تقویت”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا