| عنوان مقاله به انگلیسی | Partially Observable Contextual Bandits with Linear Payoffs | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله راهزنان متنی تا حدی قابل مشاهده با بازده خطی | ||||||||
| نویسندگان | Sihan Zeng, Sujay Bhatt, Alec Koppel, Sumitra Ganesh | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 14 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Machine Learning,Machine Learning,یادگیری ماشین , یادگیری ماشین , | ||||||||
| توضیحات | Submitted 17 September, 2024; originally announced September 2024. | ||||||||
| توضیحات به فارسی | ارسال شده 17 سپتامبر 2024 ؛در ابتدا سپتامبر 2024 اعلام شد. | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
The standard contextual bandit framework assumes fully observable and actionable contexts. In this work, we consider a new bandit setting with partially observable, correlated contexts and linear payoffs, motivated by the applications in finance where decision making is based on market information that typically displays temporal correlation and is not fully observed. We make the following contributions marrying ideas from statistical signal processing with bandits: (i) We propose an algorithmic pipeline named EMKF-Bandit, which integrates system identification, filtering, and classic contextual bandit algorithms into an iterative method alternating between latent parameter estimation and decision making. (ii) We analyze EMKF-Bandit when we select Thompson sampling as the bandit algorithm and show that it incurs a sub-linear regret under conditions on filtering. (iii) We conduct numerical simulations that demonstrate the benefits and practical applicability of the proposed pipeline.
چکیده به فارسی (ترجمه ماشینی)
چارچوب راهزن متنی استاندارد زمینه های کاملاً قابل مشاهده و عملی را فرض می کند.در این کار ، ما یک تنظیم راهزن جدید را با زمینه های تا حدی قابل مشاهده ، همبسته و بازپرداخت های خطی در نظر می گیریم ، که توسط برنامه های مالی ایجاد می شود که در آن تصمیم گیری مبتنی بر اطلاعات بازار است که به طور معمول همبستگی زمانی را نشان می دهد و کاملاً مشاهده نمی شود.ما مشارکتهای زیر را با ایده های ازدواج از پردازش سیگنال آماری با راهزنان ازدواج می کنیم: (i) ما یک خط لوله الگوریتمی به نام EMKF-Bandit را پیشنهاد می کنیم ، که شناسایی سیستم ، فیلتر و الگوریتم های راهزن متنی کلاسیک را در یک روش تکراری متناوب بین برآورد پارامتر نهان و تصمیم گیری ادغام می کند.ساخت(ii) ما وقتی نمونه گیری تامپسون را به عنوان الگوریتم راهزن انتخاب می کنیم ، Bandit EMKF را تجزیه و تحلیل می کنیم و نشان می دهیم که در شرایط فیلتر ، پشیمانی زیر خطی را متحمل می شود.(iii) ما شبیه سازی های عددی را انجام می دهیم که مزایا و کاربرد عملی خط لوله پیشنهادی را نشان می دهد.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.