| عنوان مقاله به انگلیسی | Reinforcement Learning in High-frequency Market Making |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله یادگیری تقویتی در بازارسازی با فرکانس بالا |
| نویسندگان | Yuheng Zheng, Zihan Ding |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 40 |
| دسته بندی موضوعات | Trading and Market Microstructure,Machine Learning,Econometrics,Statistical Finance,Machine Learning,تجارت و ریزساختار بازار , یادگیری ماشین , اقتصاد سنجی , امور مالی آماری , یادگیری ماشین , |
| توضیحات | Submitted 12 August, 2024; v1 submitted 14 July, 2024; originally announced July 2024. |
| توضیحات به فارسی | ارائه شده 12 اوت 2024 ؛V1 ارسال شده 14 ژوئیه 2024 ؛در ابتدا ژوئیه 2024 اعلام شد. |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
دانلود مقاله اصل انگلیسی + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 99,000 تومان
سفارش ترجمه فارسی مقاله + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی و ترجمه کامل آن، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 1,600,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
This paper establishes a new and comprehensive theoretical analysis for the application of reinforcement learning (RL) in high-frequency market making. We bridge the modern RL theory and the continuous-time statistical models in high-frequency financial economics. Different with most existing literature on methodological research about developing various RL methods for market making problem, our work is a pilot to provide the theoretical analysis. We target the effects of sampling frequency, and find an interesting tradeoff between error and complexity of RL algorithm when tweaking the values of the time increment $Δ$ $-$ as $Δ$ becomes smaller, the error will be smaller but the complexity will be larger. We also study the two-player case under the general-sum game framework and establish the convergence of Nash equilibrium to the continuous-time game equilibrium as $Δrightarrow0$. The Nash Q-learning algorithm, which is an online multi-agent RL method, is applied to solve the equilibrium. Our theories are not only useful for practitioners to choose the sampling frequency, but also very general and applicable to other high-frequency financial decision making problems, e.g., optimal executions, as long as the time-discretization of a continuous-time markov decision process is adopted. Monte Carlo simulation evidence support all of our theories.
چکیده به فارسی (ترجمه ماشینی)
در این مقاله یک تحلیل نظری جدید و جامع برای استفاده از یادگیری تقویت (RL) در ساخت بازار با فرکانس بالا ایجاد شده است.ما تئوری مدرن RL و مدلهای آماری زمان مداوم را در اقتصاد مالی با فرکانس بالا می گذاریم.متفاوت با بیشتر ادبیات موجود در مورد تحقیقات روش شناختی در مورد توسعه روش های مختلف RL برای ایجاد مشکل در بازار ، کار ما یک خلبان برای ارائه تحلیل نظری است.ما اثرات فرکانس نمونه گیری را هدف قرار می دهیم و یک تجارت جالب بین خطا و پیچیدگی الگوریتم RL را هنگام افزایش مقادیر افزایش زمان $ δ $ $-$ $ $ $ کوچکتر می یابیم ، خطا کوچکتر خواهد شد اما پیچیدگی خواهد بودبزرگتر باشدما همچنین مورد دو نفره را تحت چارچوب بازی عمومی مطالعه می کنیم و همگرایی تعادل NASH را به تعادل بازی به زمان مداوم به عنوان $ δ RightArrow0 $ تعیین می کنیم.الگوریتم یادگیری نش ، که یک روش RL چند عامل آنلاین است ، برای حل تعادل اعمال می شود.نظریه های ما نه تنها برای پزشکان برای انتخاب فرکانس نمونه گیری مفید است ، بلکه برای سایر مشکلات تصمیم گیری مالی با فرکانس بالا ، به عنوان مثال ، اعدام های بهینه ، تا زمانی که اختلاف زمان یک فرایند تصمیم گیری مارکوف به زمان مداوم ، بسیار کلی و قابل اجرا باشد ، بسیار کلی و قابل اجرا است.اتخاذ شده استشواهد شبیه سازی مونت کارلو از همه تئوری های ما پشتیبانی می کند.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.