کتاب پرسش و پاسخ چهارگزینهای – نسخه یادگیری سریع
— پاسخها بلافاصله بعد از سؤال برای مرور سریع
مشاهده نمونه نسخه کوییز سریع
کتاب پرسش و پاسخ چهارگزینهای – نسخه خودآزمایی
— پاسخها در انتهای بخشها برای سنجش واقعی یادگیری
مشاهده نمونه نسخه آزمونی
🎯 این بسته یک دورهٔ آموزشی کامل و چندلایه است؛ شامل ویدیوهای آموزشی، کتابها، تمرینها و خودآزمایی.
ℹ️ نکات مهم هنگام خرید
این محصول به صورت فایل دانلودی کامل ارائه میشود.
توجه: لینکهای اختصاصی دوره طی حداکثر 24 ساعت پس از ثبت سفارش ارسال میشوند.
دقت کنید لینک ها به شماره موبایل شما ارسال می شوند. پس در ارائه شماره موبایل صحیح دقت کنید.
برای راهنمایی در مورد نحوه دانلود به شماره 09395106248 پیامک دهید یا تماس بگیرید. (ایده آل ترین گزینه ارسال پیام در یکی از پیام رسان ها به همین شماره است تا سریعا لینک های محصول همان جا برای شما ارسال گردد.)
اگر پرداخت انجام شده ولی بعد از 24 ساعت هنوز لینکها را دریافت نکردهاید، نام و نام خانوادگی و نام محصول را پیامک کنید تا
لینکها دوباره ارسال شوند.
💬 راههای ارتباطی پشتیبانی: واتساپ یا هر پیام رسان داخلی یا پیامک:
09395106248 تلگرام: @ma_limbs
چکیده
In this paper, we consider the $n \times n$ two-payer zero-sum repeated game in which one player (player X) employs the popular Hedge (also called multiplicative weights update) learning algorithm while the other player (player Y) adopts the myopic best response. We investigate the dynamics of such Hedge-myopic system by defining a metric $Q(\textbf{x}_t)$, which measures the distance between the stage strategy $\textbf{x}_t$ and Nash Equilibrium (NE) strategy of player X. We analyze the trend of $Q(\textbf{x}_t)$ and prove that it is bounded and can only take finite values on the evolutionary path when the payoff matrix is rational and the game has an interior NE. Based on this, we prove that the stage strategy sequence of both players are periodic after finite stages and the time-averaged strategy of player Y within one period is an exact NE strategy. Accordingly, we propose an asymmetric paradigm for solving two-player zero-sum games. For the special game with rational payoff matrix and an interior NE, the paradigm can output the precise NE strategy; for any general games we prove that the time-averaged strategy can converge to an approximate NE. In comparison to the NE-solving method via Hedge self-play, this HBR paradigm exhibits faster computation/convergence, better stability and can attain precise NE convergence in most real cases.
چکیده به فارسی (ترجمه ماشینی)
در این مقاله ، ما بازی تکرار شده $ n \ times n $ دو پرداخت را در نظر می گیریم که در آن یک بازیکن (پخش کننده X) از الگوریتم یادگیری محبوب (به روزرسانی وزن چند برابر) استفاده می کند در حالی که بازیکن دیگر (بازیکن Y)بهترین پاسخ نزدیک بینی را اتخاذ می کند.ما دینامیک چنین سیستم هرگونه آبگوشتیک را با تعریف یک متریک $ q (\ textbf {x} _t) $ بررسی می کنیم ، که فاصله بین استراتژی مرحله $ \ textbf {x} _t $ و تعادل NASH (NE) را اندازه گیری می کند.پخش کننده X. ما روند $ q (\ textbf {x} _t) $ را تجزیه و تحلیل می کنیم و ثابت می کنیم که محدود است و فقط می تواند مقادیر محدود را در مسیر تکاملی بگیرد وقتی ماتریس بازپرداخت منطقی است و بازی دارای NE داخلی است.بر این اساس ، ما ثابت می کنیم که توالی استراتژی مرحله هر دو بازیکن پس از مراحل محدود دوره ای است و استراتژی متوسط زمان بازیکن Y در یک دوره یک استراتژی دقیق NE است.بر این اساس ، ما یک الگوی نامتقارن برای حل بازی های دو نفره صفر پیشنهاد می کنیم.برای بازی ویژه با ماتریس بازپرداخت منطقی و NE داخلی ، این الگوی می تواند استراتژی دقیق NE را تولید کند.برای هر بازی کلی ، ما ثابت می کنیم که استراتژی متوسط زمان می تواند به یک NE تقریبی همگرا شود.در مقایسه با روش حل NE از طریق بازی خود پرچین ، این الگوی HBR محاسبات/همگرایی سریعتر ، ثبات بهتر را نشان می دهد و می تواند در بیشتر موارد واقعی به همگرایی NE دقیق برسد.
📚 محتوای این محصول آموزشی (پکیج کامل)
علاوه بر مقاله اصلی انگلیسی که دریافت می کنید، برای یادگیری عمیقتر و تسلط کامل بر مباحث مجموعهای از کتابهای آموزشی نیز ارائه میشود.
کتاب پرسش و پاسخ چهارگزینهای – نسخه یادگیری سریع
— پاسخها بلافاصله بعد از سؤال برای مرور سریع
مشاهده نمونه نسخه کوییز سریع
کتاب پرسش و پاسخ چهارگزینهای – نسخه خودآزمایی
— پاسخها در انتهای بخشها برای سنجش واقعی یادگیری
مشاهده نمونه نسخه آزمونی
🎯 این بسته یک دورهٔ آموزشی کامل و چندلایه است؛ شامل ویدیوهای آموزشی، کتابها، تمرینها و خودآزمایی.
ℹ️ نکات مهم هنگام خرید
این محصول به صورت فایل دانلودی کامل ارائه میشود.
توجه: لینکهای اختصاصی دوره طی حداکثر 24 ساعت پس از ثبت سفارش ارسال میشوند.
دقت کنید لینک ها به شماره موبایل شما ارسال می شوند. پس در ارائه شماره موبایل صحیح دقت کنید.
برای راهنمایی در مورد نحوه دانلود به شماره 09395106248 پیامک دهید یا تماس بگیرید. (ایده آل ترین گزینه ارسال پیام در یکی از پیام رسان ها به همین شماره است تا سریعا لینک های محصول همان جا برای شما ارسال گردد.)
اگر پرداخت انجام شده ولی بعد از 24 ساعت هنوز لینکها را دریافت نکردهاید، نام و نام خانوادگی و نام محصول را پیامک کنید تا
لینکها دوباره ارسال شوند.
💬 راههای ارتباطی پشتیبانی: واتساپ یا هر پیام رسان داخلی یا پیامک:
09395106248 تلگرام: @ma_limbs
نقد و بررسیها
هنوز بررسیای ثبت نشده است.
اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله تناوب در سیستم هج-نزدیک بین و یک الگوی حل NE نامتقارن برای بازی های دو نفره با جمع صفر” لغو پاسخ
نقد و بررسیها
هنوز بررسیای ثبت نشده است.