| عنوان مقاله به انگلیسی | Decentralized and Uncoordinated Learning of Stable Matchings: A Game-Theoretic Approach |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله یادگیری غیرمتمرکز و ناهماهنگ تطابقهای پایدار: رویکردی مبتنی بر نظریه بازیها |
| نویسندگان | S. Rasoul Etesami, R. Srikant |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 29 |
| دسته بندی موضوعات | Computer Science and Game Theory,Machine Learning,Multiagent Systems,Social and Information Networks,Systems and Control,علوم کامپیوتر و نظریه بازی , یادگیری ماشین , سیستم های چندتایی , شبکه های اجتماعی و اطلاعاتی , سیستم ها و کنترل ها , |
| توضیحات | Submitted 14 August, 2024; v1 submitted 30 July, 2024; originally announced July 2024. |
| توضیحات به فارسی | ارسال شده در 14 اوت 2024 ؛V1 ارسال شده 30 ژوئیه 2024 ؛در ابتدا ژوئیه 2024 اعلام شد. |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
دانلود مقاله اصل انگلیسی + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 99,000 تومان
سفارش ترجمه فارسی مقاله + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی و ترجمه کامل آن، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 1,160,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
We consider the problem of learning stable matchings with unknown preferences in a decentralized and uncoordinated manner, where “decentralized” means that players make decisions individually without the influence of a central platform, and “uncoordinated” means that players do not need to synchronize their decisions using pre-specified rules. First, we provide a game formulation for this problem with known preferences, where the set of pure Nash equilibria (NE) coincides with the set of stable matchings, and mixed NE can be rounded to a stable matching. Then, we show that for hierarchical markets, applying the exponential weight (EXP) learning algorithm to the stable matching game achieves logarithmic regret in a fully decentralized and uncoordinated fashion. Moreover, we show that EXP converges locally and exponentially fast to a stable matching in general markets. We also introduce another decentralized and uncoordinated learning algorithm that globally converges to a stable matching with arbitrarily high probability. Finally, we provide stronger feedback conditions under which it is possible to drive the market faster toward an approximate stable matching. Our proposed game-theoretic framework bridges the discrete problem of learning stable matchings with the problem of learning NE in continuous-action games.
چکیده به فارسی (ترجمه ماشینی)
ما مشکل یادگیری تطابق پایدار با ترجیحات ناشناخته را به صورت غیر متمرکز و غیر هماهنگ در نظر می گیریم ، جایی که “غیر متمرکز” به این معنی است که بازیکنان بدون تأثیر یک بستر مرکزی تصمیم گیری می کنند و “نامحدود” به این معنی است که بازیکنان نیازی به همگام سازی تصمیمات خود ندارندبا استفاده از قوانین از پیش تعیین شده.اول ، ما یک فرمول بازی را برای این مشکل با ترجیحات شناخته شده ارائه می دهیم ، جایی که مجموعه ای از تعادل Nash Nash (NE) با مجموعه ای از مطابقت های پایدار همزمان است و NE مختلط را می توان با یک تطبیق پایدار گرد کرد.سپس ، ما نشان می دهیم که برای بازارهای سلسله مراتبی ، استفاده از الگوریتم یادگیری وزن نمایی (EXP) در بازی تطبیق پایدار ، پشیمانی لگاریتمی را به روشی کاملاً غیر متمرکز و نامحدود می رساند.علاوه بر این ، ما نشان می دهیم که EXP به صورت محلی و به صورت نمایی سریع به یک تطبیق پایدار در بازارهای عمومی همگرا می شود.ما همچنین الگوریتم یادگیری غیر متمرکز و غیر هماهنگ دیگری را معرفی می کنیم که در سطح جهان با یک تطبیق پایدار با احتمال بسیار خودسرانه همگرا می شود.سرانجام ، ما شرایط بازخورد قوی تری را ارائه می دهیم که تحت آن امکان هدایت سریعتر بازار به سمت تطبیق تقریبی پایدار است.چارچوب نظری بازی پیشنهادی ما مشکل گسسته یادگیری تطبیق پایدار با مشکل یادگیری NE در بازی های اکشن مداوم را برطرف می کند.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.