| عنوان مقاله به انگلیسی | Optimizing Variational Quantum Circuits Using Metaheuristic Strategies in Reinforcement Learning |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله بهینهسازی مدارهای کوانتومی متغیر با استفاده از استراتژیهای فراابتکاری در یادگیری تقویتی |
| نویسندگان | Michael Kölle, Daniel Seidl, Maximilian Zorn, Philipp Altmann, Jonas Stein, Thomas Gabor |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 6 |
| دسته بندی موضوعات | Quantum Physics,Artificial Intelligence,Machine Learning,فیزیک کوانتومی , هوش مصنوعی , یادگیری ماشین , |
| توضیحات | Submitted 2 August, 2024; originally announced August 2024. , Comments: Accepted at QCE24 – QCRL24 Workshop |
| توضیحات به فارسی | ارسال شده در 2 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد ، نظرات: پذیرفته شده در QCE24 – کارگاه qCRL24 |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
دانلود مقاله اصل انگلیسی + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 99,000 تومان
سفارش ترجمه فارسی مقاله + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی و ترجمه کامل آن، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 240,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
Quantum Reinforcement Learning (QRL) offers potential advantages over classical Reinforcement Learning, such as compact state space representation and faster convergence in certain scenarios. However, practical benefits require further validation. QRL faces challenges like flat solution landscapes, where traditional gradient-based methods are inefficient, necessitating the use of gradient-free algorithms. This work explores the integration of metaheuristic algorithms — Particle Swarm Optimization, Ant Colony Optimization, Tabu Search, Genetic Algorithm, Simulated Annealing, and Harmony Search — into QRL. These algorithms provide flexibility and efficiency in parameter optimization. Evaluations in $5times5$ MiniGrid Reinforcement Learning environments show that, all algorithms yield near-optimal results, with Simulated Annealing and Particle Swarm Optimization performing best. In the Cart Pole environment, Simulated Annealing, Genetic Algorithms, and Particle Swarm Optimization achieve optimal results, while the others perform slightly better than random action selection. These findings demonstrate the potential of Particle Swarm Optimization and Simulated Annealing for efficient QRL learning, emphasizing the need for careful algorithm selection and adaptation.
چکیده به فارسی (ترجمه ماشینی)
یادگیری تقویت کوانتومی (QRL) مزایای بالقوه ای را نسبت به یادگیری تقویت کننده کلاسیک ، مانند بازنمایی فضای فشرده حالت و همگرایی سریعتر در سناریوهای خاص ارائه می دهد.با این حال ، مزایای عملی نیاز به اعتبار بیشتر دارد.QRL با چالش هایی مانند مناظر راه حل مسطح روبرو است ، جایی که روش های سنتی مبتنی بر گرادیان ناکارآمد هستند و نیاز به استفاده از الگوریتم های بدون شیب دارند.این کار به بررسی ادغام الگوریتم های متهوریستی – بهینه سازی ذرات ذرات ، بهینه سازی کلونی مورچه ، جستجوی تابو ، الگوریتم ژنتیکی ، بازپرداخت شبیه سازی شده و جستجوی هارمونی – در QRL می پردازد.این الگوریتم ها انعطاف پذیری و کارآیی را در بهینه سازی پارامترها ارائه می دهند.ارزیابی در 5 $ Times5 $ 5 $ محیط های یادگیری تقویت کننده minigrid نشان می دهد که ، تمام الگوریتم ها نتایج تقریباً بهینه را به دست می آورند ، با بازپخت شبیه سازی شده و بهینه سازی swarm ذرات بهترین عملکرد را دارند.در محیط قطب سبد خرید ، بازپخت شبیه سازی شده ، الگوریتم های ژنتیکی و بهینه سازی ذرات به نتایج بهینه می رسند ، در حالی که بقیه عملکرد کمی بهتر از انتخاب عمل تصادفی دارند.این یافته ها پتانسیل بهینه سازی swarm ذرات و بازپخت شبیه سازی شده را برای یادگیری کارآمد QRL نشان می دهد ، با تأکید بر نیاز به انتخاب و سازگاری الگوریتم دقیق.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.