ترجمه فارسی مقاله بازنمایی های کامپوزیت بدون نظارت برای صدا

180,000 تومان

دسته: مقاله علمی

توضیحات
نظرات (0)

عنوان مقاله به انگلیسی	Unsupervised Composable Representations for Audio
عنوان مقاله به فارسی	ترجمه فارسی مقاله بازنمایی های کامپوزیت بدون نظارت برای صدا
نویسندگان	Giovanni Bindi, Philippe Esling
فرمت مقاله انگلیسی	PDF
زبان مقاله تحویلی	ترجمه فارسی
فرمت مقاله ترجمه شده	به صورت فایل ورد
نحوه تحویل ترجمه	دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات	9
لینک دانلود رایگان مقاله انگلیسی	دانلود مقاله
دسته بندی موضوعات	Machine Learning,Sound,Audio and Speech Processing,یادگیری ماشین , پردازش صدا , صدا و گفتار ,
توضیحات	Submitted 19 August, 2024; originally announced August 2024. , Comments: ISMIR 2024
توضیحات به فارسی	ارسال شده در 19 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. ، نظرات: Ismir 2024
اطلاعات بیشتر از این مقاله در پایگاه های علمی	INSPIRE HEP NASA ADS Google Scholar Semantic Scholar
فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

Current generative models are able to generate high-quality artefacts but have been shown to struggle with compositional reasoning, which can be defined as the ability to generate complex structures from simpler elements. In this paper, we focus on the problem of compositional representation learning for music data, specifically targeting the fully-unsupervised setting. We propose a simple and extensible framework that leverages an explicit compositional inductive bias, defined by a flexible auto-encoding objective that can leverage any of the current state-of-art generative models. We demonstrate that our framework, used with diffusion models, naturally addresses the task of unsupervised audio source separation, showing that our model is able to perform high-quality separation. Our findings reveal that our proposal achieves comparable or superior performance with respect to other blind source separation methods and, furthermore, it even surpasses current state-of-art supervised baselines on signal-to-interference ratio metrics. Additionally, by learning an a-posteriori masking diffusion model in the space of composable representations, we achieve a system capable of seamlessly performing unsupervised source separation, unconditional generation, and variation generation. Finally, as our proposal works in the latent space of pre-trained neural audio codecs, it also provides a lower computational cost with respect to other neural baselines.

چکیده به فارسی (ترجمه ماشینی)

مدل های تولیدی فعلی قادر به تولید آثار با کیفیت بالا هستند اما نشان داده شده است که با استدلال ترکیبی مبارزه می کنند ، که می تواند به عنوان توانایی تولید ساختارهای پیچیده از عناصر ساده تر تعریف شود.در این مقاله ، ما بر روی مشکل یادگیری نمایشی برای داده های موسیقی ، به طور خاص هدف قرار دادن تنظیمات کاملاً بدون نظارت ، تمرکز می کنیم.ما یک چارچوب ساده و گسترده را پیشنهاد می کنیم که از یک تعصب القایی ترکیبی صریح استفاده می کند ، تعریف شده توسط یک هدف رمزگذاری خودکار انعطاف پذیر که می تواند از هر یک از مدلهای تولیدی فعلی فعلی استفاده کند.ما نشان می دهیم که چارچوب ما ، که با مدلهای انتشار استفاده می شود ، به طور طبیعی وظیفه جداسازی منبع صوتی بدون نظارت را نشان می دهد ، نشان می دهد که مدل ما قادر به انجام جداسازی با کیفیت بالا است.یافته های ما نشان می دهد که پیشنهاد ما با توجه به سایر روشهای جداسازی منبع کور ، به عملکرد قابل مقایسه یا برتر دست می یابد و علاوه بر این ، حتی از خطوط نظارتی پیشرفته فعلی در معیارهای نسبت سیگنال به مداخله پیشی می گیرد.علاوه بر این ، با یادگیری یک مدل انتشار نقاب A- خلفی در فضای بازنمایی های ترکیبی ، ما به سیستمی می رسیم که قادر به انجام یکپارچه جداسازی منبع بدون نظارت ، تولید بی قید و شرط و تولید تغییر است.سرانجام ، از آنجا که پیشنهاد ما در فضای نهفته کدک های صوتی عصبی از قبل آموزش دیده کار می کند ، با توجه به سایر خطوط عصبی ، هزینه محاسباتی کمتری نیز فراهم می کند.

فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله بازنمایی های کامپوزیت بدون نظارت برای صدا”

ترجمه فارسی مقاله بازنمایی های کامپوزیت بدون نظارت برای صدا

چکیده

چکیده به فارسی (ترجمه ماشینی)

نقد و بررسی‌ها

محصولات مرتبط

مقاله SymTC: یک شبکه ترانسفورماتور همزیستی-سی ان ان برای نمونه تقسیم بندی MRI ستون فقرات کمری

مقاله ادغام تخریب و بازیابی ظریف از طریق سازگاری مبتنی بر نیاز

مقاله یادگیری سیاست های ترکیبی برای MPC با کاربرد پرواز هواپیماهای بدون سرنشین در محیط های دینامیک ناشناخته

مقاله محافظت از آثار هنری در برابر انتقال سبک عصبی با استفاده از حمله رنگی خصمانه تطابق پذیر