,

مقاله Tube-NeRF: یادگیری تقلید کارآمد از سیاست های Visuomotor از MPC با استفاده از افزایش داده های هدایت شده لوله و NERFS

10,000 تومان

عنوان مقاله به انگلیسی Tube-NeRF: Efficient Imitation Learning of Visuomotor Policies from MPC using Tube-Guided Data Augmentation and NeRFs
عنوان مقاله به فارسی مقاله Tube-NeRF: یادگیری تقلید کارآمد از سیاست های Visuomotor از MPC با استفاده از افزایش داده های هدایت شده لوله و NERFS
نویسندگان Andrea Tagliabue, Jonathan P. How
زبان مقاله انگلیسی
فرمت مقاله: PDF
تعداد صفحات 0
دسته بندی موضوعات Robotics,Artificial Intelligence,Machine Learning,روباتیک , هوش مصنوعی , یادگیری ماشین ,
توضیحات Submitted 23 November, 2023; originally announced November 2023. , Comments: Video: https://youtu.be/_W5z33ZK1m4. Evolved paper from our previous work: arXiv:2210.10127
توضیحات به فارسی ارسال شده 23 نوامبر 2023 ؛در ابتدا نوامبر 2023 اعلام شد ، نظرات: ویدئو: https://youtu.be/_w5z33zk1m4.مقاله تکامل یافته از کار قبلی ما: Arxiv: 2210.10127

چکیده

Imitation learning (IL) can train computationally-efficient sensorimotor policies from a resource-intensive Model Predictive Controller (MPC), but it often requires many samples, leading to long training times or limited robustness. To address these issues, we combine IL with a variant of robust MPC that accounts for process and sensing uncertainties, and we design a data augmentation (DA) strategy that enables efficient learning of vision-based policies. The proposed DA method, named Tube-NeRF, leverages Neural Radiance Fields (NeRFs) to generate novel synthetic images, and uses properties of the robust MPC (the tube) to select relevant views and to efficiently compute the corresponding actions. We tailor our approach to the task of localization and trajectory tracking on a multirotor, by learning a visuomotor policy that generates control actions using images from the onboard camera as only source of horizontal position. Our evaluations numerically demonstrate learning of a robust visuomotor policy with an 80-fold increase in demonstration efficiency and a 50% reduction in training time over current IL methods. Additionally, our policies successfully transfer to a real multirotor, achieving accurate localization and low tracking errors despite large disturbances, with an onboard inference time of only 1.5 ms.

چکیده به فارسی (ترجمه ماشینی)

یادگیری تقلید (IL) می تواند سیاستهای حرکتی محاسباتی را از یک کنترلر پیش بینی کننده مدل منابع (MPC) با کارآیی محاسباتی آموزش دهد ، اما اغلب به نمونه های زیادی نیاز دارد و منجر به زمان آموزش طولانی یا استحکام محدود می شود.برای پرداختن به این موضوعات ، ما IL را با نوعی از MPC قوی ترکیب می کنیم که عدم قطعیت های فرآیند و سنجش را به خود اختصاص می دهد ، و ما یک استراتژی تقویت داده (DA) را طراحی می کنیم که امکان یادگیری کارآمد از سیاست های مبتنی بر بینایی را فراهم می کند.روش DA پیشنهادی ، با نام Tube-Nerf ، زمینه های تابش عصبی (NERF) را برای تولید تصاویر مصنوعی جدید اعمال می کند و از خواص MPC قوی (لوله) برای انتخاب نماهای مربوطه و محاسبه کارآمد اقدامات مربوطه استفاده می کند.ما رویکرد خود را به وظیفه بومی سازی و ردیابی مسیر در یک MultiroTor ، با یادگیری یک خط مشی Visuomotor که باعث ایجاد اقدامات کنترل با استفاده از تصاویر از دوربین پردازنده به عنوان منبع موقعیت افقی می شود ، متناسب می کنیم.ارزیابی های ما به صورت عددی یادگیری یک سیاست Visuomotor قوی را با افزایش 80 برابر در راندمان تظاهرات و کاهش 50 ٪ در زمان آموزش نسبت به روش های IL فعلی نشان می دهد.علاوه بر این ، سیاستهای ما با موفقیت به یک چندتایی واقعی منتقل می شوند و با وجود اختلالات بزرگ ، با زمان استنتاج پردازنده تنها 1.5 میلی ثانیه ، به یک Multirotor واقعی منتقل می شوند.

توجه کنید این مقاله به زبان انگلیسی است.
برای سفارش ترجمه این مقاله می توانید به یکی از روش های تماس، پیامک، تلگرام و یا واتس اپ با شماره زیر تماس بگیرید:

09395106248

توجه کنید که شرایط ترجمه به صورت زیر است:
  • قیمت هر صفحه ترجمه در حال حاضر 40 هزار تومان می باشد.
  • تحویل مقاله ترجمه شده به صورت فایل ورد می باشد.
  • زمان تحویل ترجمه مقاله در صورت داشتن تعداد صفحات عادی بین 3 تا 5 روز خواهد بود.
  • کیفیت ترجمه بسیار بالا می باشد. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
  • کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “مقاله Tube-NeRF: یادگیری تقلید کارآمد از سیاست های Visuomotor از MPC با استفاده از افزایش داده های هدایت شده لوله و NERFS”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا