| عنوان مقاله به انگلیسی | Specify and Edit: Overcoming Ambiguity in Text-Based Image Editing |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله مشخص کردن و ویرایش: غلبه بر ابهام در ویرایش تصویر مبتنی بر متن |
| نویسندگان | Ekaterina Iakovleva, Fabio Pizzati, Philip Torr, Stéphane Lathuilière |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 17 |
| دسته بندی موضوعات | Computer Vision and Pattern Recognition,Artificial Intelligence,Machine Learning,چشم انداز رایانه و تشخیص الگوی , هوش مصنوعی , یادگیری ماشین , |
| توضیحات | Submitted 29 July, 2024; originally announced July 2024. |
| توضیحات به فارسی | ارسال 29 ژوئیه 2024 ؛در ابتدا ژوئیه 2024 اعلام شد. |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
دانلود مقاله اصل انگلیسی + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 99,000 تومان
سفارش ترجمه فارسی مقاله + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی و ترجمه کامل آن، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 680,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
Text-based editing diffusion models exhibit limited performance when the user’s input instruction is ambiguous. To solve this problem, we propose $textit{Specify ANd Edit}$ (SANE), a zero-shot inference pipeline for diffusion-based editing systems. We use a large language model (LLM) to decompose the input instruction into specific instructions, i.e. well-defined interventions to apply to the input image to satisfy the user’s request. We benefit from the LLM-derived instructions along the original one, thanks to a novel denoising guidance strategy specifically designed for the task. Our experiments with three baselines and on two datasets demonstrate the benefits of SANE in all setups. Moreover, our pipeline improves the interpretability of editing models, and boosts the output diversity. We also demonstrate that our approach can be applied to any edit, whether ambiguous or not. Our code is public at https://github.com/fabvio/SANE.
چکیده به فارسی (ترجمه ماشینی)
مدل های انتشار ویرایش مبتنی بر متن هنگامی که دستورالعمل ورودی کاربر مبهم باشد ، عملکرد محدودی دارند.برای حل این مشکل ، ما $ textit {را مشخص و ویرایش} $ (SANE) ، یک خط لوله استنتاج صفر برای سیستم های ویرایش مبتنی بر انتشار پیشنهاد می کنیم.ما از یک مدل زبان بزرگ (LLM) برای تجزیه دستورالعمل ورودی به دستورالعمل های خاص ، یعنی مداخلات به خوبی تعریف شده استفاده می کنیم تا در تصویر ورودی اعمال شود تا درخواست کاربر را برآورده کند.ما به لطف یک استراتژی جدید راهنمای راهنمایی Denoising که به طور خاص برای این کار طراحی شده است ، از دستورالعمل های مشتق از LLM بهره مند می شویم.آزمایشات ما با سه خط پایه و در دو مجموعه داده مزایای عاقل در همه تنظیمات را نشان می دهد.علاوه بر این ، خط لوله ما تفسیر مدل های ویرایش را بهبود می بخشد و تنوع خروجی را تقویت می کند.ما همچنین نشان می دهیم که رویکرد ما می تواند برای هر ویرایش ، اعم از مبهم یا نه اعمال شود.کد ما در https://github.com/fabvio/sane عمومی است.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.