| عنوان مقاله به انگلیسی | UCB Exploration for Fixed-Budget Bayesian Best Arm Identification |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله کاوش UCB برای شناسایی بهترین بازوی بیزی با بودجه ثابت |
| نویسندگان | Rong J. B. Zhu, Yanqi Qiu |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 21 |
| دسته بندی موضوعات | Machine Learning,Machine Learning,یادگیری ماشین , یادگیری ماشین , |
| توضیحات | Submitted 9 August, 2024; originally announced August 2024. |
| توضیحات به فارسی | ارسال شده در 9 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
سفارش ترجمه فارسی مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، ترجمه فارسی مقاله را نیز سفارش میدهید.
قیمت: 840,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
We study best-arm identification (BAI) in the fixed-budget setting. Adaptive allocations based on upper confidence bounds (UCBs), such as UCBE, are known to work well in BAI. However, it is well-known that its optimal regret is theoretically dependent on instances, which we show to be an artifact in many fixed-budget BAI problems. In this paper we propose an UCB exploration algorithm that is both theoretically and empirically efficient for the fixed budget BAI problem under a Bayesian setting. The key idea is to learn prior information, which can enhance the performance of UCB-based BAI algorithm as it has done in the cumulative regret minimization problem. We establish bounds on the failure probability and the simple regret for the Bayesian BAI problem, providing upper bounds of order $tilde{O}(sqrt{K/n})$, up to logarithmic factors, where $n$ represents the budget and $K$ denotes the number of arms. Furthermore, we demonstrate through empirical results that our approach consistently outperforms state-of-the-art baselines.
چکیده به فارسی (ترجمه ماشینی)
ما شناسایی بهترین بازوی (BAI) را در تنظیم بودجه ثابت مطالعه می کنیم.تخصیص تطبیقی بر اساس مرزهای اعتماد به نفس فوقانی (UCBS) ، مانند UCBE ، به خوبی در BAI کار می کند.با این حال ، کاملاً مشهور است که پشیمانی بهینه آن از نظر تئوری به مواردی وابسته است ، که ما نشان می دهیم که در بسیاری از مشکلات BAI با بودجه ثابت ، مصنوعی است.در این مقاله ما یک الگوریتم اکتشاف UCB را پیشنهاد می کنیم که هم از نظر تئوری و هم از نظر تجربی برای بودجه ثابت BAI تحت شرایط بیزی کارآمد است.ایده اصلی یادگیری اطلاعات قبلی است که می تواند عملکرد الگوریتم BAI مبتنی بر UCB را همانطور که در مشکل به حداقل رساندن پشیمانی تجمعی انجام داده است ، تقویت کند.ما در مورد احتمال عدم موفقیت و پشیمانی ساده برای مشکل Bayesian Bai ، محدودیت هایی را فراهم می کنیم ، و مرزهای بالایی از سفارش $ tilde {o} ( sqrt {k/n}) $ ، تا عوامل لگاریتمی ، جایی که $ n $ نمایانگر این است.بودجه و $ k $ تعداد اسلحه را نشان می دهد.علاوه بر این ، ما از طریق نتایج تجربی نشان می دهیم که رویکرد ما به طور مداوم بهتر از خطوط اصلی هنر است.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.