,

ترجمه فارسی مقاله The Bandit Whisperer: یادگیری ارتباطات برای راهزنان بی‌قرار

19,000 تومان600,000 تومان

شناسه محصول: نامعلوم دسته: ,
عنوان مقاله به انگلیسی The Bandit Whisperer: Communication Learning for Restless Bandits
عنوان مقاله به فارسی ترجمه فارسی مقاله The Bandit Whisperer: یادگیری ارتباطات برای راهزنان بی‌قرار
نویسندگان Yunfan Zhao, Tonghan Wang, Dheeraj Nagaraj, Aparna Taneja, Milind Tambe
فرمت مقاله انگلیسی PDF
زبان مقاله تحویلی ترجمه فارسی
فرمت مقاله ترجمه شده به صورت فایل ورد
نحوه تحویل ترجمه دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات 15
دسته بندی موضوعات Machine Learning,Multiagent Systems,یادگیری ماشین , سیستم های چند منظوره ,
توضیحات Submitted 10 August, 2024; originally announced August 2024.
توضیحات به فارسی ارسال شده 10 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد.

توضیحات گزینه‌های خرید

دانلود مقاله اصل انگلیسی

با انتخاب این گزینه، می‌توانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.

قیمت: 19,000 تومان

سفارش ترجمه فارسی مقاله

با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، ترجمه فارسی مقاله را نیز سفارش می‌دهید.

قیمت: 600,000 تومان

زمان تحویل: 2 تا 3 روز کاری

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

Applying Reinforcement Learning (RL) to Restless Multi-Arm Bandits (RMABs) offers a promising avenue for addressing allocation problems with resource constraints and temporal dynamics. However, classic RMAB models largely overlook the challenges of (systematic) data errors – a common occurrence in real-world scenarios due to factors like varying data collection protocols and intentional noise for differential privacy. We demonstrate that conventional RL algorithms used to train RMABs can struggle to perform well in such settings. To solve this problem, we propose the first communication learning approach in RMABs, where we study which arms, when involved in communication, are most effective in mitigating the influence of such systematic data errors. In our setup, the arms receive Q-function parameters from similar arms as messages to guide behavioral policies, steering Q-function updates. We learn communication strategies by considering the joint utility of messages across all pairs of arms and using a Q-network architecture that decomposes the joint utility. Both theoretical and empirical evidence validate the effectiveness of our method in significantly improving RMAB performance across diverse problems.

چکیده به فارسی (ترجمه ماشینی)

استفاده از یادگیری تقویت کننده (RL) در راهزنان چند بازوی بی قرار (RMABS) یک خیابان امیدوارکننده را برای پرداختن به مشکلات تخصیص با محدودیت های منابع و پویایی زمانی ارائه می دهد.با این حال ، مدل های کلاسیک RMAB تا حد زیادی از چالش های خطاهای داده (سیستماتیک) غافل می شوند – یک اتفاق مشترک در سناریوهای دنیای واقعی به دلیل عواملی مانند پروتکل های مختلف جمع آوری داده ها و سر و صدای عمدی برای حفظ حریم خصوصی.ما نشان می دهیم که الگوریتم های معمولی RL که برای آموزش RMAB ها استفاده می شود می توانند در چنین تنظیماتی به خوبی انجام دهند.برای حل این مشکل ، ما اولین رویکرد یادگیری ارتباطی را در RMABS پیشنهاد می کنیم ، جایی که ما مطالعه می کنیم که کدام بازوها ، در هنگام برقراری ارتباط ، در کاهش تأثیر چنین خطاهای داده های سیستماتیک مؤثر هستند.در تنظیم ما ، بازوها پارامترهای عملکرد Q را از اسلحه مشابه به عنوان پیام برای هدایت سیاست های رفتاری ، هدایت به روزرسانی های عملکرد Q دریافت می کنند.ما استراتژی های ارتباطی را با در نظر گرفتن ابزار مشترک پیام ها در همه جفت های اسلحه و استفاده از یک معماری شبکه Q که باعث تجزیه ابزار مشترک می شود ، می آموزیم.هر دو شواهد نظری و تجربی اثربخشی روش ما را در بهبود قابل توجهی عملکرد RMAB در مشکلات متنوع تأیید می کنند.

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.
نوع دانلود

دانلود مقاله اصل انگلیسی, سفارش ترجمه فارسی مقاله

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله The Bandit Whisperer: یادگیری ارتباطات برای راهزنان بی‌قرار”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا