| عنوان مقاله به انگلیسی | Combining Diverse Information for Coordinated Action: Stochastic Bandit Algorithms for Heterogeneous Agents |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله ترکیب اطلاعات متنوع برای اقدام هماهنگ: الگوریتمهای راهزن تصادفی برای عاملهای ناهمگن |
| نویسندگان | Lucia Gordon, Esther Rolf, Milind Tambe |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 19 |
| دسته بندی موضوعات | Multiagent Systems,Artificial Intelligence,Machine Learning,سیستم های چند منظوره , هوش مصنوعی , یادگیری ماشین , |
| توضیحات | Submitted 6 August, 2024; originally announced August 2024. , Comments: 19 pages, 6 figures, to be published in ECAI 2024 |
| توضیحات به فارسی | ارائه شده در 6 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد ، نظرات: 19 صفحه ، 6 شکل ، که در ECAI 2024 منتشر می شود |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
سفارش ترجمه فارسی مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، ترجمه فارسی مقاله را نیز سفارش میدهید.
قیمت: 760,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
Stochastic multi-agent multi-armed bandits typically assume that the rewards from each arm follow a fixed distribution, regardless of which agent pulls the arm. However, in many real-world settings, rewards can depend on the sensitivity of each agent to their environment. In medical screening, disease detection rates can vary by test type; in preference matching, rewards can depend on user preferences; and in environmental sensing, observation quality can vary across sensors. Since past work does not specify how to allocate agents of heterogeneous but known sensitivity of these types in a stochastic bandit setting, we introduce a UCB-style algorithm, Min-Width, which aggregates information from diverse agents. In doing so, we address the joint challenges of (i) aggregating the rewards, which follow different distributions for each agent-arm pair, and (ii) coordinating the assignments of agents to arms. Min-Width facilitates efficient collaboration among heterogeneous agents, exploiting the known structure in the agents’ reward functions to weight their rewards accordingly. We analyze the regret of Min-Width and conduct pseudo-synthetic and fully synthetic experiments to study the performance of different levels of information sharing. Our results confirm that the gains to modeling agent heterogeneity tend to be greater when the sensitivities are more varied across agents, while combining more information does not always improve performance.
چکیده به فارسی (ترجمه ماشینی)
راهزنان چند ضلعی چند جانبه تصادفی به طور معمول فرض می کنند که پاداش های هر بازو بدون در نظر گرفتن اینکه کدام عامل بازو را می کشد ، از توزیع ثابت پیروی می کنند.با این حال ، در بسیاری از تنظیمات در دنیای واقعی ، پاداش می تواند به حساسیت هر عامل به محیط آنها بستگی داشته باشد.در غربالگری پزشکی ، میزان تشخیص بیماری می تواند با توجه به نوع آزمایش متفاوت باشد.در تطبیق اولویت ، پاداش می تواند به ترجیحات کاربر بستگی داشته باشد.و در سنجش محیطی ، کیفیت مشاهده می تواند در سنسورها متفاوت باشد.از آنجا که کار گذشته چگونگی تخصیص عوامل حساسیت ناهمگن اما شناخته شده از این نوع را در یک راهزن تصادفی مشخص نمی کند ، ما یک الگوریتم به سبک UCB ، Width را معرفی می کنیم که اطلاعات را از عوامل متنوع جمع می کند.با انجام این کار ، ما به چالش های مشترک (i) جمع آوری پاداش ها ، که توزیع های مختلفی برای هر جفت عامل بازوی و (ب) هماهنگی تکالیف عوامل به اسلحه را دنبال می کنیم ، می پردازیم.Width Width همکاری کارآمد بین عوامل ناهمگن را تسهیل می کند و از ساختار شناخته شده در توابع پاداش عوامل استفاده می کند تا بر این اساس پاداش های خود را وزن کند.ما پشیمانی از عرض مین را تجزیه و تحلیل می کنیم و آزمایش های شبه سنتز و کاملاً مصنوعی را انجام می دهیم تا عملکرد سطوح مختلف به اشتراک گذاری اطلاعات را بررسی کنیم.نتایج ما تأیید می کند که دستاوردهای ناهمگونی عامل مدل سازی وقتی حساسیت در بین عوامل متفاوت باشد ، بیشتر می شود ، در حالی که ترکیب اطلاعات بیشتر همیشه عملکرد را بهبود نمی بخشد.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.