| عنوان مقاله به انگلیسی | Deep Index Policy for Multi-Resource Restless Matching Bandit and Its Application in Multi-Channel Scheduling | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله سیاست نمایه عمیق برای راهزن تطبیق بی قرار چند منبع و کاربرد آن در زمانبندی چند کاناله | ||||||||
| نویسندگان | Nida Zamir, I-Hong Hou | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 10 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Machine Learning,یادگیری ماشین , | ||||||||
| توضیحات | Submitted 20 August, 2024; v1 submitted 13 August, 2024; originally announced August 2024. | ||||||||
| توضیحات به فارسی | 20 اوت 2024 ارسال شد.V1 ارسال شده 13 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
Scheduling in multi-channel wireless communication system presents formidable challenges in effectively allocating resources. To address these challenges, we investigate a multi-resource restless matching bandit (MR-RMB) model for heterogeneous resource systems with an objective of maximizing long-term discounted total rewards while respecting resource constraints. We have also generalized to applications beyond multi-channel wireless. We discuss the Max-Weight Index Matching algorithm, which optimizes resource allocation based on learned partial indexes. We have derived the policy gradient theorem for index learning. Our main contribution is the introduction of a new Deep Index Policy (DIP), an online learning algorithm tailored for MR-RMB. DIP learns the partial index by leveraging the policy gradient theorem for restless arms with convoluted and unknown transition kernels of heterogeneous resources. We demonstrate the utility of DIP by evaluating its performance for three different MR-RMB problems. Our simulation results show that DIP indeed learns the partial indexes efficiently.
چکیده به فارسی (ترجمه ماشینی)
برنامه ریزی در سیستم ارتباطی بی سیم چند کانال چالش های مهمی را در تخصیص مؤثر منابع ارائه می دهد.برای پرداختن به این چالش ها ، ما یک مدل راهزن تطبیق بی قرار چند منظوره (MR-RMB) را برای سیستم های منابع ناهمگن با هدف حداکثر رساندن پاداش های کل تخفیف بلند مدت در حالی که به محدودیت های منابع می پردازیم ، بررسی می کنیم.ما همچنین به برنامه های فراتر از بی سیم چند کانال تعمیم داده ایم.ما در مورد الگوریتم تطبیق شاخص وزن حداکثر ، که تخصیص منابع را بر اساس شاخص های جزئی آموخته شده بهینه می کند ، بحث می کنیم.ما قضیه شیب سیاست را برای یادگیری شاخص بدست آورده ایم.سهم اصلی ما معرفی یک خط مشی جدید شاخص عمیق (DIP) ، یک الگوریتم یادگیری آنلاین متناسب با MR-RMB است.DIP با استفاده از قضیه شیب سیاست برای اسلحه های بی قرار با هسته های انتقال یافته و ناشناخته از منابع ناهمگن ، شاخص جزئی را می آموزد.ما با ارزیابی عملکرد آن برای سه مشکل مختلف MR-RMB ، ابزار DIP را نشان می دهیم.نتایج شبیه سازی ما نشان می دهد که DIP در واقع شاخص های جزئی را به طور کارآمد می آموزد.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.