| عنوان مقاله به انگلیسی | Explore-then-Commit Algorithms for Decentralized Two-Sided Matching Markets | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله الگوریتم های تطبیق غیرمتمرکز را برای بازارهای تطبیق دو طرفه کشف کنید | ||||||||
| نویسندگان | Tejas Pagare, Avishek Ghosh | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 19 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Machine Learning,Computer Science and Game Theory,General Economics,Machine Learning,یادگیری ماشین , علوم کامپیوتر و نظریه بازی , اقتصاد عمومی , یادگیری ماشین , | ||||||||
| توضیحات | Submitted 16 August, 2024; originally announced August 2024. , Comments: Accepted at International Symposium of Information Theory (ISIT) 2024 | ||||||||
| توضیحات به فارسی | ارائه شده 16 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. ، نظرات: پذیرفته شده در سمپوزیوم بین المللی نظریه اطلاعات (ISIT) 2024 | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
Online learning in a decentralized two-sided matching markets, where the demand-side (players) compete to match with the supply-side (arms), has received substantial interest because it abstracts out the complex interactions in matching platforms (e.g. UpWork, TaskRabbit). However, past works assume that each arm knows their preference ranking over the players (one-sided learning), and each player aim to learn the preference over arms through successive interactions. Moreover, several (impractical) assumptions on the problem are usually made for theoretical tractability such as broadcast player-arm match Liu et al. (2020; 2021); Kong & Li (2023) or serial dictatorship Sankararaman et al. (2021); Basu et al. (2021); Ghosh et al. (2022). In this paper, we study a decentralized two-sided matching market, where we do not assume that the preference ranking over players are known to the arms apriori. Furthermore, we do not have any structural assumptions on the problem. We propose a multi-phase explore-then-commit type algorithm namely epoch-based CA-ETC (collision avoidance explore then commit) (\texttt{CA-ETC} in short) for this problem that does not require any communication across agents (players and arms) and hence decentralized. We show that for the initial epoch length of $T_{\circ}$ and subsequent epoch-lengths of $2^{l/γ} T_{\circ}$ (for the $l-$th epoch with $γ\in (0,1)$ as an input parameter to the algorithm), \texttt{CA-ETC} yields a player optimal expected regret of $\mathcal{O}\left(T_{\circ} (\frac{K \log T}{T_{\circ} Δ^2})^{1/γ} + T_{\circ} (\frac{T}{T_{\circ}})^γ\right)$ for the $i$-th player, where $T$ is the learning horizon, $K$ is the number of arms and $Δ$ is an appropriately defined problem gap. Furthermore, we propose a blackboard communication based baseline achieving logarithmic regret in $T$.
چکیده به فارسی (ترجمه ماشینی)
یادگیری آنلاین در یک بازارهای تطبیق دو طرفه غیرمتمرکز ، که در آن طرف تقاضا (بازیکنان) برای مطابقت با طرف عرضه (ARMS) رقابت می کنند ، علاقه قابل توجهی کسب کرده است زیرا این امر تعامل پیچیده را در سیستم عامل های تطبیق می دهد (به عنوان مثال Upwork ، TaskRabbit).با این حال ، آثار گذشته فرض می کنند که هر بازو رتبه اولویت خود را نسبت به بازیکنان (یادگیری یک طرفه) می داند ، و هر بازیکن قصد دارد از طریق تعامل پی در پی ، ترجیح را بر بازوها بیاموزد.علاوه بر این ، چندین فرض (غیر عملی) در مورد این مشکل معمولاً برای قابلیت تغییر نظری مانند بازی پخش کننده بازوی پخش کننده لیو و همکاران انجام می شود.(2020 ؛ 2021) ؛کنگ و لی (2023) یا دیکتاتوری سریال Sankararaman و همکاران.(2021) ؛باسو و همکاران.(2021) ؛قوش و همکاران.(2022).در این مقاله ، ما یک بازار تطبیق دو طرفه غیرمتمرکز را مطالعه می کنیم ، جایی که فرض نمی کنیم که رتبه اولویت نسبت به بازیکنان به Apriori Arms شناخته شده است.علاوه بر این ، ما هیچ فرضیه ساختاری در مورد این مشکل نداریم.ما یک الگوریتم نوع چند فاز اکتشاف-پس از آن را پیشنهاد می کنیم یعنی CA-ETC مبتنی بر دوره (Collision Porperance Explore سپس تعهد) (\ texttt {ca-etc}) برای این مشکل که نیازی به ارتباطی در بین عوامل ندارد (بازیکنان و بازوها) و از این رو غیر متمرکز است.ما نشان می دهیم که برای طول دوره اولیه $ t _ {\ circ} $ و طول دوره های بعدی 2^{l/γ} t _ {\ circ} $ (برای دوره $ l- $ با $ γ \ in (در (0،1) $ به عنوان یک پارامتر ورودی به الگوریتم) ، \ texttt {ca-etc} یک بازیکن بهینه از پشیمانی انتظار می رود از $ \ mathcal {o} \ سمت چپ (t _ {\ circ} (\ frac \ log t \ log t \ log t \ log t \ log t \} {t _ {\ circ} Δ^2})^{1/γ} + t _ {\ circ} (\ frac {t} {t _ {{\ circ})^γ \ RIGHT) $ برای $ i $-بازیکن TH ، جایی که $ t $ افق یادگیری است ، $ k $ تعداد اسلحه است و $ δ $ یک شکاف مشکل مناسب است.علاوه بر این ، ما یک پایه مبتنی بر ارتباطات تخته سیاه را پیشنهاد می کنیم که به پشیمانی لگاریتمی در $ t $ دست پیدا می کند.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.