| عنوان مقاله به انگلیسی | ViewActive: Active viewpoint optimization from a single image | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله ViewActive: بهینه سازی نمای فعال از یک تصویر | ||||||||
| نویسندگان | Jiayi Wu, Xiaomin Lin, Botao He, Cornelia Fermuller, Yiannis Aloimonos | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 7 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Robotics,رباتیک , | ||||||||
| توضیحات | Submitted 18 September, 2024; v1 submitted 16 September, 2024; originally announced September 2024. | ||||||||
| توضیحات به فارسی | ارائه شده در 18 سپتامبر 2024 ؛V1 ارسال شده 16 سپتامبر 2024 ؛در ابتدا سپتامبر 2024 اعلام شد. | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
When observing objects, humans benefit from their spatial visualization and mental rotation ability to envision potential optimal viewpoints based on the current observation. This capability is crucial for enabling robots to achieve efficient and robust scene perception during operation, as optimal viewpoints provide essential and informative features for accurately representing scenes in 2D images, thereby enhancing downstream tasks. To endow robots with this human-like active viewpoint optimization capability, we propose ViewActive, a modernized machine learning approach drawing inspiration from aspect graph, which provides viewpoint optimization guidance based solely on the current 2D image input. Specifically, we introduce the 3D Viewpoint Quality Field (VQF), a compact and consistent representation for viewpoint quality distribution similar to an aspect graph, composed of three general-purpose viewpoint quality metrics: self-occlusion ratio, occupancy-aware surface normal entropy, and visual entropy. We utilize pre-trained image encoders to extract robust visual and semantic features, which are then decoded into the 3D VQF, allowing our model to generalize effectively across diverse objects, including unseen categories.The lightweight ViewActive network (72 FPS on a single GPU) significantly enhances the performance of state-of-the-art object recognition pipelines and can be integrated into real-time motion planning for robotic applications. Our code and dataset are available here: https://github.com/jiayi-wu-umd/ViewActive
چکیده به فارسی (ترجمه ماشینی)
هنگام مشاهده اشیاء ، انسان از تجسم مکانی و توانایی چرخش ذهنی خود در پیش بینی دیدگاههای بهینه بالقوه بر اساس مشاهده فعلی بهره می برد.این توانایی برای فعال کردن روبات ها برای دستیابی به درک صحنه کارآمد و قوی در حین کار بسیار مهم است ، زیرا دیدگاه های بهینه ویژگی های اساسی و آموزنده ای را برای نمایش دقیق صحنه ها در تصاویر 2D فراهم می کند و از این طریق کارهای پایین دست را تقویت می کند.برای وقف روبات ها با این قابلیت بهینه سازی دیدگاه فعال مانند انسان ، ما ViewActive ، یک رویکرد یادگیری ماشین مدرن را الهام می گیریم که الهام بخش از نمودار Aspect است ، که راهنمایی بهینه سازی دیدگاه را صرفاً بر اساس ورودی تصویر 2D فعلی ارائه می دهد.به طور خاص ، ما زمینه کیفیت دید 3D (VQF) را معرفی می کنیم ، یک نمایش جمع و جور و سازگار برای توزیع کیفیت دیدگاه مشابه با یک نمودار جنبه ، متشکل از سه معیار کیفیت دیدگاه عمومی: نسبت خود انسداد ، آنتروپی طبیعی سطح آگاه ، اشغال-سطح آگاه ،و آنتروپی بصری.ما از رمزگذارهای تصویر از قبل آموزش داده شده برای استخراج ویژگی های قوی بصری و معنایی استفاده می کنیم ، که سپس در VQF 3D رمزگشایی می شوند و به مدل ما این امکان را می دهد تا به طور موثری در بین اشیاء متنوع ، از جمله دسته های غیب ، تعمیم یابد.به طور قابل توجهی عملکرد خط لوله های پیشرفته تشخیص شیء را افزایش می دهد و می تواند در برنامه ریزی حرکت در زمان واقعی برای برنامه های رباتیک ادغام شود.کد و مجموعه داده ما در اینجا موجود است: https://github.com/jiyii-wu-umd/viewactive
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.