| عنوان مقاله به انگلیسی | Are Deep Learning Models Robust to Partial Object Occlusion in Visual Recognition Tasks? | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله آیا مدل های یادگیری عمیق نسبت به انسداد جزئی اشیاء در وظایف تشخیص بصری مقاوم هستند؟ | ||||||||
| نویسندگان | Kaleb Kassaw, Francesco Luzi, Leslie M. Collins, Jordan M. Malof | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 25 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Computer Vision and Pattern Recognition,Artificial Intelligence,Machine Learning,چشم انداز رایانه و تشخیص الگوی , هوش مصنوعی , یادگیری ماشین , | ||||||||
| توضیحات | Submitted 16 September, 2024; originally announced September 2024. | ||||||||
| توضیحات به فارسی | ارائه شده 16 سپتامبر 2024 ؛در ابتدا سپتامبر 2024 اعلام شد. | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
Image classification models, including convolutional neural networks (CNNs), perform well on a variety of classification tasks but struggle under conditions of partial occlusion, i.e., conditions in which objects are partially covered from the view of a camera. Methods to improve performance under occlusion, including data augmentation, part-based clustering, and more inherently robust architectures, including Vision Transformer (ViT) models, have, to some extent, been evaluated on their ability to classify objects under partial occlusion. However, evaluations of these methods have largely relied on images containing artificial occlusion, which are typically computer-generated and therefore inexpensive to label. Additionally, methods are rarely compared against each other, and many methods are compared against early, now outdated, deep learning models. We contribute the Image Recognition Under Occlusion (IRUO) dataset, based on the recently developed Occluded Video Instance Segmentation (OVIS) dataset (arXiv:2102.01558). IRUO utilizes real-world and artificially occluded images to test and benchmark leading methods’ robustness to partial occlusion in visual recognition tasks. In addition, we contribute the design and results of a human study using images from IRUO that evaluates human classification performance at multiple levels and types of occlusion. We find that modern CNN-based models show improved recognition accuracy on occluded images compared to earlier CNN-based models, and ViT-based models are more accurate than CNN-based models on occluded images, performing only modestly worse than human accuracy. We also find that certain types of occlusion, including diffuse occlusion, where relevant objects are seen through “holes” in occluders such as fences and leaves, can greatly reduce the accuracy of deep recognition models as compared to humans, especially those with CNN backbones.
چکیده به فارسی (ترجمه ماشینی)
مدل های طبقه بندی تصویر ، از جمله شبکه های عصبی حلقوی (CNN) ، در انواع مختلفی از وظایف طبقه بندی عملکرد خوبی دارند اما تحت شرایط انسداد جزئی ، یعنی شرایطی که اشیاء تا حدی از نمای یک دوربین پوشانده می شوند ، تلاش می کنند.روشهای بهبود عملکرد تحت انسداد ، از جمله تقویت داده ها ، خوشه بندی های جزئی و معماری ذاتاً قوی تر ، از جمله مدل های ترانسفورماتور بینایی (VIT) ، تا حدی در مورد توانایی آنها در طبقه بندی اشیاء تحت انسداد جزئی ارزیابی شده است.با این حال ، ارزیابی این روش ها تا حد زیادی به تصاویر حاوی انسداد مصنوعی متکی است ، که به طور معمول تولید شده توسط رایانه و در نتیجه برچسب ارزان قیمت هستند.علاوه بر این ، روش ها به ندرت در برابر یکدیگر مقایسه می شوند و بسیاری از روش ها در برابر مدلهای یادگیری عمیق ، اکنون منسوخ مقایسه می شوند.ما بر اساس مجموعه داده های تقسیم نمونه ویدیویی که اخیراً توسعه یافته است (ARXIV: 2102.01558) ، به رسمیت شناختن تصویر در زیر مجموعه داده های انسداد (IRUO) کمک می کنیم.IRUO از تصاویر دنیای واقعی و مصنوعی انسداد برای آزمایش و معیار استحکام روشهای پیشرو به انسداد جزئی در کارهای تشخیص بصری استفاده می کند.علاوه بر این ، ما با استفاده از تصاویر از IRUO که عملکرد طبقه بندی انسان را در سطوح مختلف و نوع انسداد ارزیابی می کند ، به طراحی و نتایج یک مطالعه انسانی کمک می کنیم.ما می دانیم که مدلهای مدرن مبتنی بر CNN نسبت به مدل های قبلی مبتنی بر CNN ، دقت تشخیص بهبود یافته را در تصاویر انسداد نشان می دهند ، و مدل های مبتنی بر VIT دقیق تر از مدل های مبتنی بر CNN در تصاویر انسداد هستند و فقط نسبت به دقت انسان بسیار بدتر هستند.ما همچنین می یابیم که انواع خاصی از انسداد ، از جمله انسداد پراکنده ، در جایی که اشیاء مربوطه از طریق “سوراخ” در انسداد کننده ها مانند نرده ها و برگها دیده می شوند ، می توانند دقت مدل های شناخت عمیق را در مقایسه با انسان ، به ویژه آنهایی که دارای ستون فقرات CNN هستند ، تا حد زیادی کاهش دهند.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.