ترجمه فارسی مقاله SIGMARL: یک چارچوب یادگیری تقویت کننده چند عامل نمونه و کارآمد برای برنامه ریزی حرکت

320,000 تومان

دسته: مقاله علمی

توضیحات
نظرات (0)

عنوان مقاله به انگلیسی	SigmaRL: A Sample-Efficient and Generalizable Multi-Agent Reinforcement Learning Framework for Motion Planning
عنوان مقاله به فارسی	ترجمه فارسی مقاله SIGMARL: یک چارچوب یادگیری تقویت کننده چند عامل نمونه و کارآمد برای برنامه ریزی حرکت
نویسندگان	Jianye Xu, Pan Hu, Bassam Alrifaee
فرمت مقاله انگلیسی	PDF
زبان مقاله تحویلی	ترجمه فارسی
فرمت مقاله ترجمه شده	به صورت فایل ورد
نحوه تحویل ترجمه	دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات	8
لینک دانلود رایگان مقاله انگلیسی	دانلود مقاله
دسته بندی موضوعات	Robotics,Machine Learning,Multiagent Systems,Systems and Control,روباتیک , یادگیری ماشین , سیستم های چند منظوره , سیستم ها و کنترل ,
توضیحات	Submitted 14 August, 2024; originally announced August 2024. , Comments: 8 pages, 5 figures, accepted for presentation at the IEEE International Conference on Intelligent Transportation Systems (ITSC) 2024
توضیحات به فارسی	ارسال شده در 14 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد ، نظرات: 8 صفحه ، 5 شکل ، برای ارائه در کنفرانس بین المللی IEEE در مورد سیستم های حمل و نقل هوشمند (ITSC) 2024 پذیرفته شده است
اطلاعات بیشتر از این مقاله در پایگاه های علمی	INSPIRE HEP NASA ADS Google Scholar Semantic Scholar
فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

This paper introduces an open-source, decentralized framework named SigmaRL, designed to enhance both sample efficiency and generalization of multi-agent Reinforcement Learning (RL) for motion planning of connected and automated vehicles. Most RL agents exhibit a limited capacity to generalize, often focusing narrowly on specific scenarios, and are usually evaluated in similar or even the same scenarios seen during training. Various methods have been proposed to address these challenges, including experience replay and regularization. However, how observation design in RL affects sample efficiency and generalization remains an under-explored area. We address this gap by proposing five strategies to design information-dense observations, focusing on general features that are applicable to most traffic scenarios. We train our RL agents using these strategies on an intersection and evaluate their generalization through numerical experiments across completely unseen traffic scenarios, including a new intersection, an on-ramp, and a roundabout. Incorporating these information-dense observations reduces training times to under one hour on a single CPU, and the evaluation results reveal that our RL agents can effectively zero-shot generalize. Code: github.com/cas-lab-munich/SigmaRL

چکیده به فارسی (ترجمه ماشینی)

در این مقاله یک چارچوب منبع باز و غیرمتمرکز به نام Sigmarl ، طراحی شده است که برای تقویت هر دو نمونه و تعمیم یادگیری تقویت کننده چند عامل (RL) برای برنامه ریزی حرکت وسایل نقلیه متصل و خودکار طراحی شده است.بیشتر عوامل RL ظرفیت محدودی برای تعمیم دارند ، که اغلب به سناریوهای خاص متمرکز می شوند و معمولاً در سناریوهای مشابه یا حتی یکسان مشاهده می شوند که در طول آموزش مشاهده می شود.روشهای مختلفی برای رفع این چالش ها از جمله پخش مجدد تجربه و تنظیم مجدد ارائه شده است.با این حال ، چگونگی طراحی مشاهده در RL بر کارایی و تعمیم نمونه تأثیر می گذارد ، یک منطقه تحت تأثیر باقی مانده است.ما با پیشنهاد پنج استراتژی برای طراحی مشاهدات متراکم اطلاعات ، با تمرکز بر ویژگی های کلی که در اکثر سناریوهای ترافیک قابل استفاده است ، به این شکاف می پردازیم.ما عوامل RL خود را با استفاده از این استراتژی ها در یک تقاطع آموزش می دهیم و تعمیم آنها را از طریق آزمایش های عددی در سناریوهای ترافیکی کاملاً غیب ، از جمله تقاطع جدید ، یک سطح شیب دار و یک دورگرد ارزیابی می کنیم.ترکیب این مشاهدات متراکم اطلاعات ، زمان آموزش را به کمتر از یک ساعت در یک پردازنده واحد کاهش می دهد ، و نتایج ارزیابی نشان می دهد که عوامل RL ما می توانند به طور موثر صفر را تعمیم دهند.کد: github.com/cas-lab-munich/sigmarl

فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله SIGMARL: یک چارچوب یادگیری تقویت کننده چند عامل نمونه و کارآمد برای برنامه ریزی حرکت”

ترجمه فارسی مقاله SIGMARL: یک چارچوب یادگیری تقویت کننده چند عامل نمونه و کارآمد برای برنامه ریزی حرکت

چکیده

چکیده به فارسی (ترجمه ماشینی)

نقد و بررسی‌ها

محصولات مرتبط

مقاله مدل‌سازی عدم قطعیت در تقسیم‌بندی تصویر اولتراسوند برای اندازه‌گیری‌های بیومتریک دقیق جنین

مقاله یک معماری چند منطقه ای برای بهینه سازی شبکه های توزیع مبتنی بر بازخورد در زمان واقعی

مقاله SymTC: یک شبکه ترانسفورماتور همزیستی-سی ان ان برای نمونه تقسیم بندی MRI ستون فقرات کمری

مقاله تقسیم بندی CT کبد از طریق رمزگذاری مبتنی بر PVT و رمزگشایی تصفیه شده