| عنوان مقاله به انگلیسی | Multimodal Generalized Category Discovery | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله کشف رده تعمیم یافته چندوجهی | ||||||||
| نویسندگان | Yuchang Su, Renping Zhou, Siyu Huang, Xingjian Li, Tianyang Wang, Ziyue Wang, Min Xu | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 14 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Computer Vision and Pattern Recognition,Machine Learning,چشم انداز رایانه و تشخیص الگوی , یادگیری ماشین , | ||||||||
| توضیحات | Submitted 17 September, 2024; originally announced September 2024. | ||||||||
| توضیحات به فارسی | ارسال شده 17 سپتامبر 2024 ؛در ابتدا سپتامبر 2024 اعلام شد. | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
Generalized Category Discovery (GCD) aims to classify inputs into both known and novel categories, a task crucial for open-world scientific discoveries. However, current GCD methods are limited to unimodal data, overlooking the inherently multimodal nature of most real-world data. In this work, we extend GCD to a multimodal setting, where inputs from different modalities provide richer and complementary information. Through theoretical analysis and empirical validation, we identify that the key challenge in multimodal GCD lies in effectively aligning heterogeneous information across modalities. To address this, we propose MM-GCD, a novel framework that aligns both the feature and output spaces of different modalities using contrastive learning and distillation techniques. MM-GCD achieves new state-of-the-art performance on the UPMC-Food101 and N24News datasets, surpassing previous methods by 11.5\% and 4.7\%, respectively.
چکیده به فارسی (ترجمه ماشینی)
کشف طبقه بندی عمومی (GCD) با هدف طبقه بندی ورودی ها در هر دو دسته شناخته شده و جدید ، یک کار مهم برای اکتشافات علمی در دنیای باز است.با این حال ، روشهای فعلی GCD محدود به داده های غیرمعمول است ، و مشرف به ماهیت ذاتی چند حالته اکثر داده های دنیای واقعی است.در این کار ، ما GCD را به یک تنظیمات چند حالته گسترش می دهیم ، جایی که ورودی از روشهای مختلف اطلاعات غنی تر و مکمل را ارائه می دهد.از طریق تجزیه و تحلیل نظری و اعتبارسنجی تجربی ، ما تشخیص می دهیم که چالش کلیدی در GCD چند مدلی در تراز کردن اطلاعات ناهمگن به طور مؤثر در روش ها نهفته است.برای پرداختن به این موضوع ، ما MM-GCD را پیشنهاد می کنیم ، یک چارچوب جدید که هم ویژگی و هم فضای خروجی روشهای مختلف را با استفاده از تکنیک های یادگیری متضاد و تقطیر تراز می کند.MM-GCD به عملکرد جدید پیشرفته در مجموعه داده های UPMC-FOOD101 و N24NEWS دست پیدا می کند و به ترتیب از روشهای قبلی 11.5 \ ٪ و 4.7 \ \ بالا می رود.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.