| عنوان مقاله به انگلیسی | Hyperbolic Learning with Multimodal Large Language Models |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله یادگیری هذلولی با مدلهای زبانی بزرگ چندوجهی |
| نویسندگان | Paolo Mandica, Luca Franco, Konstantinos Kallidromitis, Suzanne Petryk, Fabio Galasso |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 17 |
| دسته بندی موضوعات | Machine Learning,Artificial Intelligence,یادگیری ماشین , هوش مصنوعی , |
| توضیحات | Submitted 9 August, 2024; originally announced August 2024. , Comments: ECCV 2024 – Beyond Euclidean Workshop |
| توضیحات به فارسی | ارسال شده در 9 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. ، نظرات: ECCV 2024 – فراتر از کارگاه اقلیدسی |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
سفارش ترجمه فارسی مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، ترجمه فارسی مقاله را نیز سفارش میدهید.
قیمت: 680,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
Hyperbolic embeddings have demonstrated their effectiveness in capturing measures of uncertainty and hierarchical relationships across various deep-learning tasks, including image segmentation and active learning. However, their application in modern vision-language models (VLMs) has been limited. A notable exception is MERU, which leverages the hierarchical properties of hyperbolic space in the CLIP ViT-large model, consisting of hundreds of millions parameters. In our work, we address the challenges of scaling multi-modal hyperbolic models by orders of magnitude in terms of parameters (billions) and training complexity using the BLIP-2 architecture. Although hyperbolic embeddings offer potential insights into uncertainty not present in Euclidean embeddings, our analysis reveals that scaling these models is particularly difficult. We propose a novel training strategy for a hyperbolic version of BLIP-2, which allows to achieve comparable performance to its Euclidean counterpart, while maintaining stability throughout the training process and showing a meaningful indication of uncertainty with each embedding.
چکیده به فارسی (ترجمه ماشینی)
تعبیه هایپربولیک اثربخشی خود را در ضبط اقدامات عدم اطمینان و روابط سلسله مراتبی در کارهای مختلف یادگیری عمیق ، از جمله تقسیم تصویر و یادگیری فعال نشان داده است.با این حال ، کاربرد آنها در مدلهای مدرن بینایی زبان (VLM) محدود شده است.یک استثناء قابل توجه Meru است که از خصوصیات سلسله مراتبی فضای هیپربولیک در مدل کلیپ ویتس بزرگ استفاده می کند ، متشکل از صدها میلیون پارامتر.در کار خود ، ما به چالش های مقیاس گذاری مدلهای هایپربولیک چند منظوره با سفارشات از نظر پارامترها (میلیارد ها) و پیچیدگی آموزش با استفاده از معماری BLIP-2 می پردازیم.اگرچه تعبیه هایپربولیک بینش بالقوه ای را در مورد عدم اطمینان در تعبیه اقلیدسی ارائه می دهد ، تجزیه و تحلیل ما نشان می دهد که مقیاس بندی این مدل ها به ویژه دشوار است.ما یک استراتژی آموزش جدید را برای یک نسخه بیش از حد از BLIP-2 پیشنهاد می کنیم ، که امکان دستیابی به عملکرد قابل مقایسه با همتای اقلیدسی خود را فراهم می کند ، ضمن اینکه ثبات را در طول فرآیند آموزش حفظ می کند و نشانه ای معنی دار از عدم اطمینان با هر تعبیه نشان می دهد.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.