ترجمه فارسی مقاله توقف بهینه اکتشافی: یک فرمول کنترل منحصر به فرد

980,000 تومان

دسته: مقاله علمی

توضیحات
نظرات (0)

عنوان مقاله به انگلیسی	Exploratory Optimal Stopping: A Singular Control Formulation
عنوان مقاله به فارسی	ترجمه فارسی مقاله توقف بهینه اکتشافی: یک فرمول کنترل منحصر به فرد
نویسندگان	Jodi Dianetti, Giorgio Ferrari, Renyuan Xu
فرمت مقاله انگلیسی	PDF
زبان مقاله تحویلی	ترجمه فارسی
فرمت مقاله ترجمه شده	به صورت فایل ورد
نحوه تحویل ترجمه	دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات	49
لینک دانلود رایگان مقاله انگلیسی	دانلود مقاله
دسته بندی موضوعات	Optimization and Control,Machine Learning,Mathematical Finance,Machine Learning,بهینه سازی و کنترل , یادگیری ماشین , امور مالی ریاضی , یادگیری ماشین ,
توضیحات	Submitted 17 August, 2024; originally announced August 2024. , Comments: 49 pages, 3 figures , MSC Class: 35F21; 49-XX; 68T05; 93E35
توضیحات به فارسی	ارسال شده 17 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد ، نظرات: 49 صفحه ، 3 شکل ، کلاس MSC: 35F21 ؛49-xx ؛68T05 ؛93e35
اطلاعات بیشتر از این مقاله در پایگاه های علمی	INSPIRE HEP NASA ADS Google Scholar Semantic Scholar
فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

This paper explores continuous-time and state-space optimal stopping problems from a reinforcement learning perspective. We begin by formulating the stopping problem using randomized stopping times, where the decision maker’s control is represented by the probability of stopping within a given time–specifically, a bounded, non-decreasing, càdlàg control process. To encourage exploration and facilitate learning, we introduce a regularized version of the problem by penalizing it with the cumulative residual entropy of the randomized stopping time. The regularized problem takes the form of an (n+1)-dimensional degenerate singular stochastic control with finite-fuel. We address this through the dynamic programming principle, which enables us to identify the unique optimal exploratory strategy. For the specific case of a real option problem, we derive a semi-explicit solution to the regularized problem, allowing us to assess the impact of entropy regularization and analyze the vanishing entropy limit. Finally, we propose a reinforcement learning algorithm based on policy iteration. We show both policy improvement and policy convergence results for our proposed algorithm.

چکیده به فارسی (ترجمه ماشینی)

در این مقاله به بررسی مشکلات توقف بهینه در زمان و حالت فضا از دیدگاه یادگیری تقویت شده می پردازیم.ما با تدوین مشکل توقف با استفاده از زمان توقف تصادفی شروع می کنیم ، جایی که کنترل تصمیم گیرنده با احتمال توقف در یک زمان معین-به طور خاص ، یک فرآیند کنترل محدود ، غیر کاهش دهنده ، càdlàg نشان داده می شود.برای تشویق اکتشاف و تسهیل یادگیری ، ما با مجازات آن با آنتروپی باقیمانده تجمعی زمان توقف تصادفی ، یک نسخه منظم از مشکل را معرفی می کنیم.مشکل منظم به شکل یک کنترل تصادفی منحصر به فرد (N+1) با سوخت محدود است.ما این موضوع را از طریق اصل برنامه نویسی پویا ، که به ما امکان می دهد استراتژی اکتشافی بهینه منحصر به فرد را شناسایی کنیم.برای مورد خاص یک مشکل گزینه واقعی ، ما یک راه حل نیمه دقیق برای مشکل منظم استخراج می کنیم و به ما امکان می دهد تا تأثیر تنظیم آنتروپی را ارزیابی کرده و حد آنتروپی ناپدید شده را تجزیه و تحلیل کنیم.سرانجام ، ما یک الگوریتم یادگیری تقویت را بر اساس تکرار سیاست پیشنهاد می کنیم.ما هم برای الگوریتم پیشنهادی خود نتایج بهبود سیاست و همگرایی سیاست را نشان می دهیم.

فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله توقف بهینه اکتشافی: یک فرمول کنترل منحصر به فرد”

ترجمه فارسی مقاله توقف بهینه اکتشافی: یک فرمول کنترل منحصر به فرد

چکیده

چکیده به فارسی (ترجمه ماشینی)

نقد و بررسی‌ها

محصولات مرتبط

مقاله محافظت از آثار هنری در برابر انتقال سبک عصبی با استفاده از حمله رنگی خصمانه تطابق پذیر

مقاله بهینه سازی راندمان ارتباط نوری قابل مشاهده از طریق ادغام NOMA-CSK مبتنی بر یادگیری تقویت شده

مقاله کنترل جهت پرتو مشترک و تخصیص منابع رادیویی در شبکه های ماهواره ای چند پرتویی LEO پویا

مقاله طراحی سیگنال های مرجع عمومی برای ارتباطات و سنجش یکپارچه با الگوریتم های با وضوح بالا