| عنوان مقاله به انگلیسی | SigmaRL: A Sample-Efficient and Generalizable Multi-Agent Reinforcement Learning Framework for Motion Planning | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله SIGMARL: یک چارچوب یادگیری تقویت کننده چند عامل نمونه و کارآمد برای برنامه ریزی حرکت | ||||||||
| نویسندگان | Jianye Xu, Pan Hu, Bassam Alrifaee | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 8 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Robotics,Machine Learning,Multiagent Systems,Systems and Control,روباتیک , یادگیری ماشین , سیستم های چند منظوره , سیستم ها و کنترل , | ||||||||
| توضیحات | Submitted 14 August, 2024; originally announced August 2024. , Comments: 8 pages, 5 figures, accepted for presentation at the IEEE International Conference on Intelligent Transportation Systems (ITSC) 2024 | ||||||||
| توضیحات به فارسی | ارسال شده در 14 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد ، نظرات: 8 صفحه ، 5 شکل ، برای ارائه در کنفرانس بین المللی IEEE در مورد سیستم های حمل و نقل هوشمند (ITSC) 2024 پذیرفته شده است | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
This paper introduces an open-source, decentralized framework named SigmaRL, designed to enhance both sample efficiency and generalization of multi-agent Reinforcement Learning (RL) for motion planning of connected and automated vehicles. Most RL agents exhibit a limited capacity to generalize, often focusing narrowly on specific scenarios, and are usually evaluated in similar or even the same scenarios seen during training. Various methods have been proposed to address these challenges, including experience replay and regularization. However, how observation design in RL affects sample efficiency and generalization remains an under-explored area. We address this gap by proposing five strategies to design information-dense observations, focusing on general features that are applicable to most traffic scenarios. We train our RL agents using these strategies on an intersection and evaluate their generalization through numerical experiments across completely unseen traffic scenarios, including a new intersection, an on-ramp, and a roundabout. Incorporating these information-dense observations reduces training times to under one hour on a single CPU, and the evaluation results reveal that our RL agents can effectively zero-shot generalize. Code: github.com/cas-lab-munich/SigmaRL
چکیده به فارسی (ترجمه ماشینی)
در این مقاله یک چارچوب منبع باز و غیرمتمرکز به نام Sigmarl ، طراحی شده است که برای تقویت هر دو نمونه و تعمیم یادگیری تقویت کننده چند عامل (RL) برای برنامه ریزی حرکت وسایل نقلیه متصل و خودکار طراحی شده است.بیشتر عوامل RL ظرفیت محدودی برای تعمیم دارند ، که اغلب به سناریوهای خاص متمرکز می شوند و معمولاً در سناریوهای مشابه یا حتی یکسان مشاهده می شوند که در طول آموزش مشاهده می شود.روشهای مختلفی برای رفع این چالش ها از جمله پخش مجدد تجربه و تنظیم مجدد ارائه شده است.با این حال ، چگونگی طراحی مشاهده در RL بر کارایی و تعمیم نمونه تأثیر می گذارد ، یک منطقه تحت تأثیر باقی مانده است.ما با پیشنهاد پنج استراتژی برای طراحی مشاهدات متراکم اطلاعات ، با تمرکز بر ویژگی های کلی که در اکثر سناریوهای ترافیک قابل استفاده است ، به این شکاف می پردازیم.ما عوامل RL خود را با استفاده از این استراتژی ها در یک تقاطع آموزش می دهیم و تعمیم آنها را از طریق آزمایش های عددی در سناریوهای ترافیکی کاملاً غیب ، از جمله تقاطع جدید ، یک سطح شیب دار و یک دورگرد ارزیابی می کنیم.ترکیب این مشاهدات متراکم اطلاعات ، زمان آموزش را به کمتر از یک ساعت در یک پردازنده واحد کاهش می دهد ، و نتایج ارزیابی نشان می دهد که عوامل RL ما می توانند به طور موثر صفر را تعمیم دهند.کد: github.com/cas-lab-munich/sigmarl
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.