“مقاله ترمیم تصویر: تجزیه و تحلیل مقایسه ای از تصویر با استفاده از تکنیک های مختلف فیلتر مکانی” به سبد خرید شما اضافه شد. ادامه خرید

“ترجمه فارسی مقاله ANNZ+: یک الگوریتم تخمین جابجایی به قرمز فتومتریک پیشرفته با برنامه های کاربردی در بررسی PAU” به سبد خرید شما اضافه شد. ادامه خرید

مقاله علمی

ترجمه فارسی مقاله یادگیری تقویتی قوی با معیارهای خطر اعوجاج پویا

580,000 تومان

دسته: مقاله علمی

توضیحات
نظرات (0)

عنوان مقاله به انگلیسی	Robust Reinforcement Learning with Dynamic Distortion Risk Measures
عنوان مقاله به فارسی	ترجمه فارسی مقاله یادگیری تقویتی قوی با معیارهای خطر اعوجاج پویا
نویسندگان	Anthony Coache, Sebastian Jaimungal
فرمت مقاله انگلیسی	PDF
زبان مقاله تحویلی	ترجمه فارسی
فرمت مقاله ترجمه شده	به صورت فایل ورد
نحوه تحویل ترجمه	دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات	29
لینک دانلود رایگان مقاله انگلیسی	دانلود مقاله
دسته بندی موضوعات	Machine Learning,Computational Finance,Portfolio Management,Risk Management,Machine Learning,یادگیری ماشین , امور مالی محاسباتی , مدیریت نمونه کارها , مدیریت ریسک , یادگیری ماشین ,
توضیحات	Submitted 16 September, 2024; originally announced September 2024. , Comments: 29 pages, 3 figures , MSC Class: 68T37; 91G70; 93E25
توضیحات به فارسی	ارائه شده 16 سپتامبر 2024 ؛در ابتدا سپتامبر 2024 اعلام شد ، نظرات: 29 صفحه ، 3 شکل ، کلاس MSC: 68T37 ؛91G70 ؛93e25
اطلاعات بیشتر از این مقاله در پایگاه های علمی	INSPIRE HEP NASA ADS Google Scholar Semantic Scholar
فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

In a reinforcement learning (RL) setting, the agent’s optimal strategy heavily depends on her risk preferences and the underlying model dynamics of the training environment. These two aspects influence the agent’s ability to make well-informed and time-consistent decisions when facing testing environments. In this work, we devise a framework to solve robust risk-aware RL problems where we simultaneously account for environmental uncertainty and risk with a class of dynamic robust distortion risk measures. Robustness is introduced by considering all models within a Wasserstein ball around a reference model. We estimate such dynamic robust risk measures using neural networks by making use of strictly consistent scoring functions, derive policy gradient formulae using the quantile representation of distortion risk measures, and construct an actor-critic algorithm to solve this class of robust risk-aware RL problems. We demonstrate the performance of our algorithm on a portfolio allocation example.

چکیده به فارسی (ترجمه ماشینی)

در یک تنظیم یادگیری تقویت (RL) ، استراتژی بهینه عامل به شدت به ترجیحات ریسک وی و پویایی مدل اساسی محیط آموزش بستگی دارد.این دو جنبه بر توانایی عامل در تصمیم گیری های آگاه و سازگار با زمان در هنگام مواجهه با محیط های آزمایش تأثیر می گذارد.در این کار ، ما یک چارچوب را برای حل مشکلات RL آگاهی از ریسک قوی که در آن همزمان با یک کلاس از اقدامات خطر اعوجاج قوی پویا ، به طور همزمان حساب می کنیم ، طراحی می کنیم.استحکام با در نظر گرفتن همه مدل های موجود در یک توپ Wasserstein در اطراف یک مدل مرجع معرفی می شود.ما چنین اقدامات ریسک قوی پویا را با استفاده از شبکه های عصبی با استفاده از توابع امتیاز دهی کاملاً مداوم تخمین می زنیم ، فرمولهای شیب سیاست را با استفاده از بازنمایی کمی از اقدامات خطر اعوجاج می گیریم و یک الگوریتم بازیگر بحرانی را برای حل این طبقه از مشکلات RL ریسک قوی ایجاد می کنیم.بشرما عملکرد الگوریتم خود را در یک مثال تخصیص نمونه کارها نشان می دهیم.

فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله یادگیری تقویتی قوی با معیارهای خطر اعوجاج پویا”

ترجمه فارسی مقاله یادگیری تقویتی قوی با معیارهای خطر اعوجاج پویا

چکیده

چکیده به فارسی (ترجمه ماشینی)

نقد و بررسی‌ها

محصولات مرتبط

مقاله مدل‌سازی عدم قطعیت در تقسیم‌بندی تصویر اولتراسوند برای اندازه‌گیری‌های بیومتریک دقیق جنین

مقاله ادغام تخریب و بازیابی ظریف از طریق سازگاری مبتنی بر نیاز

مقاله طراحی الگوی سیگنال مرجع شانه برای ارتباطات و سنجش یکپارچه

مقاله تشخیص گسل سیستم قدرت با محاسبات کوانتومی و تجزیه دروازه کارآمد