| عنوان مقاله به انگلیسی | GRIN: Zero-Shot Metric Depth with Pixel-Level Diffusion | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله GRIN: عمق متریک شات صفر با انتشار در سطح پیکسل | ||||||||
| نویسندگان | Vitor Guizilini, Pavel Tokmakov, Achal Dave, Rares Ambrus | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 14 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Computer Vision and Pattern Recognition,Machine Learning,Image and Video Processing,چشم انداز رایانه و تشخیص الگوی , یادگیری ماشین , پردازش تصویر و فیلم , | ||||||||
| توضیحات | Submitted 15 September, 2024; originally announced September 2024. | ||||||||
| توضیحات به فارسی | ارسال شده در 15 سپتامبر 2024 ؛در ابتدا سپتامبر 2024 اعلام شد. | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
3D reconstruction from a single image is a long-standing problem in computer vision. Learning-based methods address its inherent scale ambiguity by leveraging increasingly large labeled and unlabeled datasets, to produce geometric priors capable of generating accurate predictions across domains. As a result, state of the art approaches show impressive performance in zero-shot relative and metric depth estimation. Recently, diffusion models have exhibited remarkable scalability and generalizable properties in their learned representations. However, because these models repurpose tools originally designed for image generation, they can only operate on dense ground-truth, which is not available for most depth labels, especially in real-world settings. In this paper we present GRIN, an efficient diffusion model designed to ingest sparse unstructured training data. We use image features with 3D geometric positional encodings to condition the diffusion process both globally and locally, generating depth predictions at a pixel-level. With comprehensive experiments across eight indoor and outdoor datasets, we show that GRIN establishes a new state of the art in zero-shot metric monocular depth estimation even when trained from scratch.
چکیده به فارسی (ترجمه ماشینی)
بازسازی سه بعدی از یک تصویر واحد یک مشکل دیرینه در دید رایانه است.روشهای مبتنی بر یادگیری با استفاده از مجموعه داده های با برچسب و بدون برچسب به طور فزاینده ای ، به ابهام در مقیاس ذاتی خود می پردازند تا بتوانند مقدمات هندسی را تولید کنند که قادر به پیش بینی های دقیق در حوزه ها باشند.در نتیجه ، رویکردهای هنری عملکرد چشمگیر را در برآورد عمق نسبی و متریک صفر نشان می دهد.به تازگی ، مدل های انتشار در بازنمایی های آموخته شده ، مقیاس پذیری و خصوصیات قابل توجهی را به نمایش گذاشته اند.با این حال ، از آنجا که این مدلها ابزارهایی را که در ابتدا برای تولید تصویر طراحی شده اند ، می توانند بر روی زمین متراکم زمین کار کنند ، که برای اکثر برچسب های عمق ، به ویژه در تنظیمات دنیای واقعی در دسترس نیست.در این مقاله ما پوزخند ، یک مدل انتشار کارآمد را برای تهیه داده های آموزشی پراکنده بدون ساختار ارائه می دهیم.ما از ویژگی های تصویر با رمزگذاری های موقعیتی هندسی سه بعدی استفاده می کنیم تا روند انتشار هم در سطح جهان و هم محلی را شرط بندی کند و پیش بینی های عمق را در سطح پیکسل ایجاد می کند.با آزمایش های جامع در هشت مجموعه داده داخلی و خارجی ، ما نشان می دهیم که پوزخند حتی در هنگام آموزش از ابتدا ، وضعیت جدیدی از هنر را در تخمین عمق یکنواخت متریک صفر ایجاد می کند.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.