| عنوان مقاله به انگلیسی | Classifier-Free Guidance is a Predictor-Corrector | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله Classifier-Free Guidance یک پیش بینی کننده- تصحیح کننده است | ||||||||
| نویسندگان | Arwen Bradley, Preetum Nakkiran | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 21 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Machine Learning,Artificial Intelligence,Computer Vision and Pattern Recognition,یادگیری ماشین , هوش مصنوعی , چشم انداز رایانه و تشخیص الگوی , | ||||||||
| توضیحات | Submitted 23 August, 2024; v1 submitted 16 August, 2024; originally announced August 2024. , Comments: AB and PN contributed equally. v2: Fixed typos | ||||||||
| توضیحات به فارسی | ارسال شده 23 اوت 2024 ؛V1 ارسال شده 16 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد ، نظرات: AB و PN به طور مساوی کمک کردند.v2: علامت های ثابت | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
We investigate the theoretical foundations of classifier-free guidance (CFG). CFG is the dominant method of conditional sampling for text-to-image diffusion models, yet unlike other aspects of diffusion, it remains on shaky theoretical footing. In this paper, we disprove common misconceptions, by showing that CFG interacts differently with DDPM (Ho et al., 2020) and DDIM (Song et al., 2021), and neither sampler with CFG generates the gamma-powered distribution $p(x|c)^γp(x)^{1-γ}$. Then, we clarify the behavior of CFG by showing that it is a kind of predictor-corrector method (Song et al., 2020) that alternates between denoising and sharpening, which we call predictor-corrector guidance (PCG). We prove that in the SDE limit, CFG is actually equivalent to combining a DDIM predictor for the conditional distribution together with a Langevin dynamics corrector for a gamma-powered distribution (with a carefully chosen gamma). Our work thus provides a lens to theoretically understand CFG by embedding it in a broader design space of principled sampling methods.
چکیده به فارسی (ترجمه ماشینی)
ما مبانی نظری راهنمایی بدون طبقه بندی (CFG) را بررسی می کنیم.CFG روش غالب نمونه برداری مشروط برای مدل های انتشار متن به تصویر است ، اما برخلاف سایر جنبه های انتشار ، بر روی پایه های نظری لرزان باقی مانده است.در این مقاله ، ما تصورات غلط متداول را با نشان دادن اینکه CFG با DDPM (هو و همکاران ، 2020) و DDIM (سونگ و همکاران ، 2021) در تعامل متفاوت است ، رد می کنیم ، و هیچ یک از نمونه ها با CFG توزیع گاما را $ p تولید نمی کند (x | c)^γp (x)^{1-γ} $.سپس ، ما رفتار CFG را با نشان دادن اینكه نوعی روش تصحیح پیش بینی کننده است (سونگ و همكاران ، 2020) كه بین دفع و تیزكنر متناوب است ، كه ما آن را راهنمای پیش بینی کننده تأیید (PCG) می نامیم ، روشن می كنیم.ما ثابت می کنیم که در حد SDE ، CFG در واقع معادل ترکیب یک پیش بینی کننده DDIM برای توزیع مشروط به همراه یک اصلاح کننده دینامیک لانژوین برای توزیع گاما (با یک گاما با دقت انتخاب شده) است.بنابراین کار ما لنز را برای درک تئوری CFG با تعبیه آن در یک فضای طراحی وسیع تر از روش های نمونه گیری اصولی فراهم می کند.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.