| عنوان مقاله به انگلیسی | Inference with the Upper Confidence Bound Algorithm |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله استنتاج با الگوریتم کران اطمینان بالا |
| نویسندگان | Koulik Khamaru, Cun-Hui Zhang |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 17 |
| دسته بندی موضوعات | Machine Learning,Artificial Intelligence,Machine Learning,Systems and Control,Statistics Theory,یادگیری ماشین , هوش مصنوعی , یادگیری ماشین , سیستم ها و کنترل , نظریه آمار , |
| توضیحات | Submitted 8 August, 2024; originally announced August 2024. , Comments: 17 pages, 1 figure |
| توضیحات به فارسی | ارسال شده در 8 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد ، نظرات: 17 صفحه ، 1 شکل |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
سفارش ترجمه فارسی مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، ترجمه فارسی مقاله را نیز سفارش میدهید.
قیمت: 680,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
In this paper, we discuss the asymptotic behavior of the Upper Confidence Bound (UCB) algorithm in the context of multiarmed bandit problems and discuss its implication in downstream inferential tasks. While inferential tasks become challenging when data is collected in a sequential manner, we argue that this problem can be alleviated when the sequential algorithm at hand satisfies certain stability property. This notion of stability is motivated from the seminal work of Lai and Wei (1982). Our first main result shows that such a stability property is always satisfied for the UCB algorithm, and as a result the sample means for each arm are asymptotically normal. Next, we examine the stability properties of the UCB algorithm when the number of arms $K$ is allowed to grow with the number of arm pulls $T$. We show that in such a case the arms are stable when $frac{log K}{log T} rightarrow 0$, and the number of near-optimal arms are large.
چکیده به فارسی (ترجمه ماشینی)
در این مقاله ، ما در مورد رفتار بدون علامت الگوریتم اعتماد به نفس بالا (UCB) در زمینه مشکلات راهزن چندمره ای بحث می کنیم و در مورد پیامدهای آن در کارهای استنباطی پایین دست بحث می کنیم.در حالی که وقتی داده ها به صورت متوالی جمع آوری می شوند ، کارهای استنباطی چالش برانگیز می شوند ، ما استدلال می کنیم که وقتی الگوریتم متوالی در دست ، خاصیت ثبات خاصی را برآورده می کند ، می توان این مشکل را کاهش داد.این مفهوم ثبات از کار اصلی لای و وی (1982) انگیزه دارد.اولین نتیجه اصلی ما نشان می دهد که چنین خاصیت پایداری همیشه برای الگوریتم UCB رضایت دارد و در نتیجه نمونه برای هر بازو به صورت مجانبی طبیعی است.در مرحله بعد ، ما ویژگی های پایداری الگوریتم UCB را بررسی می کنیم که تعداد اسلحه $ k $ با تعداد بازوهای کشیده $ t $ رشد کند.ما نشان می دهیم که در چنین حالتی بازوها هنگامی که $ frac { log k} { log t} redarrow 0 $ پایدار هستند ، و تعداد بازوهای نزدیک بهینه بزرگ است.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.