ترجمه فارسی مقاله یک جایگزین ساده تر برای به حداقل رساندن ریسک متضاد تنظیم شده متغیر

60,000 تومان

دسته: مقاله علمی

توضیحات
نظرات (0)

عنوان مقاله به انگلیسی	A Simpler Alternative to Variational Regularized Counterfactual Risk Minimization
عنوان مقاله به فارسی	ترجمه فارسی مقاله یک جایگزین ساده تر برای به حداقل رساندن ریسک متضاد تنظیم شده متغیر
نویسندگان	Hua Chang Bakker, Shashank Gupta, Harrie Oosterhuis
فرمت مقاله انگلیسی	PDF
زبان مقاله تحویلی	ترجمه فارسی
فرمت مقاله ترجمه شده	به صورت فایل ورد
نحوه تحویل ترجمه	دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات	3
لینک دانلود رایگان مقاله انگلیسی	دانلود مقاله
دسته بندی موضوعات	Machine Learning,یادگیری ماشین ,
توضیحات	Submitted 15 September, 2024; originally announced September 2024. , Comments: Accepted at the CONSEQUENCES ’24 workshop, co-located with ACM RecSys ’24
توضیحات به فارسی	ارسال شده در 15 سپتامبر 2024 ؛در ابتدا در سپتامبر 2024 اعلام شد. ، نظرات: در کارگاه عواقب ’24 پذیرفته شده است ، با ACM Recsys ’24 مستقر است
اطلاعات بیشتر از این مقاله در پایگاه های علمی	INSPIRE HEP NASA ADS Google Scholar Semantic Scholar
فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

Variance regularized counterfactual risk minimization (VRCRM) has been proposed as an alternative off-policy learning (OPL) method. VRCRM method uses a lower-bound on the $f$-divergence between the logging policy and the target policy as regularization during learning and was shown to improve performance over existing OPL alternatives on multi-label classification tasks. In this work, we revisit the original experimental setting of VRCRM and propose to minimize the $f$-divergence directly, instead of optimizing for the lower bound using a $f$-GAN approach. Surprisingly, we were unable to reproduce the results reported in the original setting. In response, we propose a novel simpler alternative to f-divergence optimization by minimizing a direct approximation of f-divergence directly, instead of a $f$-GAN based lower bound. Experiments showed that minimizing the divergence using $f$-GANs did not work as expected, whereas our proposed novel simpler alternative works better empirically.

چکیده به فارسی (ترجمه ماشینی)

به حداقل رساندن ریسک ضد خلاف تنظیم واریانس (VRCRM) به عنوان یک روش جایگزین یادگیری خارج از سیاست (OPL) ارائه شده است.روش VRCRM از محدودیت پایین تر از $ F $ بین سیاست ورود به سیستم و سیاست هدف به عنوان منظم سازی در هنگام یادگیری استفاده می کند و نشان داده شده است که عملکرد را نسبت به گزینه های OPL موجود در کارهای طبقه بندی چند برچسب بهبود می بخشد.در این کار ، ما دوباره آزمایش آزمایشی اصلی VRCRM را دوباره بررسی می کنیم و پیشنهاد می کنیم به جای اینکه بهینه سازی برای مرز پایین با استفاده از یک رویکرد $ $ $-به طور مستقیم به حداقل برسد.با کمال تعجب ، ما نتوانستیم نتایج گزارش شده در تنظیم اصلی را بازتولید کنیم.در پاسخ ، ما یک جایگزین ساده تر برای بهینه سازی F-Divergence با به حداقل رساندن تقریب مستقیم از- واگرایی به طور مستقیم ، به جای یک محدوده پایین تر $ f-gan پیشنهاد می کنیم.آزمایشات نشان داد که به حداقل رساندن واگرایی با استفاده از $ F $ -Gans همانطور که انتظار می رفت کار نمی کند ، در حالی که رمان پیشنهادی ما جایگزین ساده تر از نظر تجربی بهتر عمل می کند.

فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله یک جایگزین ساده تر برای به حداقل رساندن ریسک متضاد تنظیم شده متغیر”

ترجمه فارسی مقاله یک جایگزین ساده تر برای به حداقل رساندن ریسک متضاد تنظیم شده متغیر

چکیده

چکیده به فارسی (ترجمه ماشینی)

نقد و بررسی‌ها

محصولات مرتبط

مقاله بهبود تشخیص احساس گفتار مستقل از سخنران با استفاده از سازگاری توزیع مشترک پویا

مقاله کالیبراسیون جبران مغناطیسی هوای مغناطیسی در سیستم های ناوبری مغناطیسی با استفاده از شبکه های زمان ثابت مایع

مقاله یادگیری سیاست های ترکیبی برای MPC با کاربرد پرواز هواپیماهای بدون سرنشین در محیط های دینامیک ناشناخته

مقاله تشخیص گوشه کارآمد حافظه برای سنسورهای دید پویای مبتنی بر رویداد