,

ترجمه فارسی مقاله تناوب در سیستم هج-نزدیک بین و یک الگوی حل NE نامتقارن برای بازی های دو نفره با جمع صفر

500,000 تومان

انتخاب پلن

torobpay
هر قسط با ترب‌پی: 125,000 تومان
۴ قسط ماهانه. بدون سود، چک و ضامن.
عنوان مقاله به انگلیسی Periodicity in Hedge-myopic system and an asymmetric NE-solving paradigm for two-player zero-sum games
عنوان مقاله به فارسی تناوب در سیستم هج-نزدیک بین و یک الگوی حل NE نامتقارن برای بازی های دو نفره با جمع صفر
نویسندگان Xinxiang Guo, Yifen Mu, Xiaoguang Yang
فرمت مقاله انگلیسی PDF
تعداد صفحات 25
لینک دانلود رایگان مقاله انگلیسی دانلود مقاله
دسته بندی موضوعات Dynamical Systems,سیستم های پویا ,
توضیحات Submitted 7 March, 2024; originally announced March 2024. , MSC Class: 91A05; 91A25; 91A68
توضیحات به فارسی ارسال 7 مارس 2024 ؛در ابتدا مارس 2024 اعلام شد ، کلاس MSC: 91A05 ؛91A25 ؛91A68
اطلاعات بیشتر از این مقاله در پایگاه های علمی INSPIRE HEP

NASA ADS

Google Scholar

Semantic Scholar


📚 محتوای این محصول آموزشی (پکیج کامل)

علاوه بر مقاله اصلی انگلیسی که دریافت می کنید، برای یادگیری عمیق‌تر و تسلط کامل بر مباحث مجموعه‌ای از کتاب‌های آموزشی نیز ارائه می‌شود.

🎯 این بسته یک دورهٔ آموزشی کامل و چندلایه است؛ شامل ویدیوهای آموزشی، کتاب‌ها، تمرین‌ها و خودآزمایی.

ℹ️ نکات مهم هنگام خرید

  • این محصول به صورت فایل دانلودی کامل ارائه می‌شود.
  • توجه: لینک‌های اختصاصی دوره طی حداکثر 24 ساعت پس از ثبت سفارش ارسال می‌شوند.
  • دقت کنید لینک ها به شماره موبایل شما ارسال می شوند. پس در ارائه شماره موبایل صحیح دقت کنید.
  • برای راهنمایی در مورد نحوه دانلود به شماره 09395106248 پیامک دهید یا تماس بگیرید. (ایده آل ترین گزینه ارسال پیام در یکی از پیام رسان ها به همین شماره است تا سریعا لینک های محصول همان جا برای شما ارسال گردد.)
  • اگر پرداخت انجام شده ولی بعد از 24 ساعت هنوز لینک‌ها را دریافت نکرده‌اید، نام و نام خانوادگی و نام محصول را پیامک کنید تا لینک‌ها دوباره ارسال شوند.

💬 راه‌های ارتباطی پشتیبانی:
واتس‌اپ یا هر پیام رسان داخلی یا پیامک: 09395106248
تلگرام: @ma_limbs

چکیده

In this paper, we consider the $n \times n$ two-payer zero-sum repeated game in which one player (player X) employs the popular Hedge (also called multiplicative weights update) learning algorithm while the other player (player Y) adopts the myopic best response. We investigate the dynamics of such Hedge-myopic system by defining a metric $Q(\textbf{x}_t)$, which measures the distance between the stage strategy $\textbf{x}_t$ and Nash Equilibrium (NE) strategy of player X. We analyze the trend of $Q(\textbf{x}_t)$ and prove that it is bounded and can only take finite values on the evolutionary path when the payoff matrix is rational and the game has an interior NE. Based on this, we prove that the stage strategy sequence of both players are periodic after finite stages and the time-averaged strategy of player Y within one period is an exact NE strategy. Accordingly, we propose an asymmetric paradigm for solving two-player zero-sum games. For the special game with rational payoff matrix and an interior NE, the paradigm can output the precise NE strategy; for any general games we prove that the time-averaged strategy can converge to an approximate NE. In comparison to the NE-solving method via Hedge self-play, this HBR paradigm exhibits faster computation/convergence, better stability and can attain precise NE convergence in most real cases.

چکیده به فارسی (ترجمه ماشینی)

در این مقاله ، ما بازی تکرار شده $ n \ times n $ دو پرداخت را در نظر می گیریم که در آن یک بازیکن (پخش کننده X) از الگوریتم یادگیری محبوب (به روزرسانی وزن چند برابر) استفاده می کند در حالی که بازیکن دیگر (بازیکن Y)بهترین پاسخ نزدیک بینی را اتخاذ می کند.ما دینامیک چنین سیستم هرگونه آبگوشتیک را با تعریف یک متریک $ q (\ textbf {x} _t) $ بررسی می کنیم ، که فاصله بین استراتژی مرحله $ \ textbf {x} _t $ و تعادل NASH (NE) را اندازه گیری می کند.پخش کننده X. ما روند $ q (\ textbf {x} _t) $ را تجزیه و تحلیل می کنیم و ثابت می کنیم که محدود است و فقط می تواند مقادیر محدود را در مسیر تکاملی بگیرد وقتی ماتریس بازپرداخت منطقی است و بازی دارای NE داخلی است.بر این اساس ، ما ثابت می کنیم که توالی استراتژی مرحله هر دو بازیکن پس از مراحل محدود دوره ای است و استراتژی متوسط زمان بازیکن Y در یک دوره یک استراتژی دقیق NE است.بر این اساس ، ما یک الگوی نامتقارن برای حل بازی های دو نفره صفر پیشنهاد می کنیم.برای بازی ویژه با ماتریس بازپرداخت منطقی و NE داخلی ، این الگوی می تواند استراتژی دقیق NE را تولید کند.برای هر بازی کلی ، ما ثابت می کنیم که استراتژی متوسط زمان می تواند به یک NE تقریبی همگرا شود.در مقایسه با روش حل NE از طریق بازی خود پرچین ، این الگوی HBR محاسبات/همگرایی سریعتر ، ثبات بهتر را نشان می دهد و می تواند در بیشتر موارد واقعی به همگرایی NE دقیق برسد.


📚 محتوای این محصول آموزشی (پکیج کامل)

علاوه بر مقاله اصلی انگلیسی که دریافت می کنید، برای یادگیری عمیق‌تر و تسلط کامل بر مباحث مجموعه‌ای از کتاب‌های آموزشی نیز ارائه می‌شود.

🎯 این بسته یک دورهٔ آموزشی کامل و چندلایه است؛ شامل ویدیوهای آموزشی، کتاب‌ها، تمرین‌ها و خودآزمایی.

ℹ️ نکات مهم هنگام خرید

  • این محصول به صورت فایل دانلودی کامل ارائه می‌شود.
  • توجه: لینک‌های اختصاصی دوره طی حداکثر 24 ساعت پس از ثبت سفارش ارسال می‌شوند.
  • دقت کنید لینک ها به شماره موبایل شما ارسال می شوند. پس در ارائه شماره موبایل صحیح دقت کنید.
  • برای راهنمایی در مورد نحوه دانلود به شماره 09395106248 پیامک دهید یا تماس بگیرید. (ایده آل ترین گزینه ارسال پیام در یکی از پیام رسان ها به همین شماره است تا سریعا لینک های محصول همان جا برای شما ارسال گردد.)
  • اگر پرداخت انجام شده ولی بعد از 24 ساعت هنوز لینک‌ها را دریافت نکرده‌اید، نام و نام خانوادگی و نام محصول را پیامک کنید تا لینک‌ها دوباره ارسال شوند.

💬 راه‌های ارتباطی پشتیبانی:
واتس‌اپ یا هر پیام رسان داخلی یا پیامک: 09395106248
تلگرام: @ma_limbs

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله تناوب در سیستم هج-نزدیک بین و یک الگوی حل NE نامتقارن برای بازی های دو نفره با جمع صفر”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا