| عنوان مقاله به انگلیسی | Unsupervised Composable Representations for Audio | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله بازنمایی های کامپوزیت بدون نظارت برای صدا | ||||||||
| نویسندگان | Giovanni Bindi, Philippe Esling | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 9 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Machine Learning,Sound,Audio and Speech Processing,یادگیری ماشین , پردازش صدا , صدا و گفتار , | ||||||||
| توضیحات | Submitted 19 August, 2024; originally announced August 2024. , Comments: ISMIR 2024 | ||||||||
| توضیحات به فارسی | ارسال شده در 19 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. ، نظرات: Ismir 2024 | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
Current generative models are able to generate high-quality artefacts but have been shown to struggle with compositional reasoning, which can be defined as the ability to generate complex structures from simpler elements. In this paper, we focus on the problem of compositional representation learning for music data, specifically targeting the fully-unsupervised setting. We propose a simple and extensible framework that leverages an explicit compositional inductive bias, defined by a flexible auto-encoding objective that can leverage any of the current state-of-art generative models. We demonstrate that our framework, used with diffusion models, naturally addresses the task of unsupervised audio source separation, showing that our model is able to perform high-quality separation. Our findings reveal that our proposal achieves comparable or superior performance with respect to other blind source separation methods and, furthermore, it even surpasses current state-of-art supervised baselines on signal-to-interference ratio metrics. Additionally, by learning an a-posteriori masking diffusion model in the space of composable representations, we achieve a system capable of seamlessly performing unsupervised source separation, unconditional generation, and variation generation. Finally, as our proposal works in the latent space of pre-trained neural audio codecs, it also provides a lower computational cost with respect to other neural baselines.
چکیده به فارسی (ترجمه ماشینی)
مدل های تولیدی فعلی قادر به تولید آثار با کیفیت بالا هستند اما نشان داده شده است که با استدلال ترکیبی مبارزه می کنند ، که می تواند به عنوان توانایی تولید ساختارهای پیچیده از عناصر ساده تر تعریف شود.در این مقاله ، ما بر روی مشکل یادگیری نمایشی برای داده های موسیقی ، به طور خاص هدف قرار دادن تنظیمات کاملاً بدون نظارت ، تمرکز می کنیم.ما یک چارچوب ساده و گسترده را پیشنهاد می کنیم که از یک تعصب القایی ترکیبی صریح استفاده می کند ، تعریف شده توسط یک هدف رمزگذاری خودکار انعطاف پذیر که می تواند از هر یک از مدلهای تولیدی فعلی فعلی استفاده کند.ما نشان می دهیم که چارچوب ما ، که با مدلهای انتشار استفاده می شود ، به طور طبیعی وظیفه جداسازی منبع صوتی بدون نظارت را نشان می دهد ، نشان می دهد که مدل ما قادر به انجام جداسازی با کیفیت بالا است.یافته های ما نشان می دهد که پیشنهاد ما با توجه به سایر روشهای جداسازی منبع کور ، به عملکرد قابل مقایسه یا برتر دست می یابد و علاوه بر این ، حتی از خطوط نظارتی پیشرفته فعلی در معیارهای نسبت سیگنال به مداخله پیشی می گیرد.علاوه بر این ، با یادگیری یک مدل انتشار نقاب A- خلفی در فضای بازنمایی های ترکیبی ، ما به سیستمی می رسیم که قادر به انجام یکپارچه جداسازی منبع بدون نظارت ، تولید بی قید و شرط و تولید تغییر است.سرانجام ، از آنجا که پیشنهاد ما در فضای نهفته کدک های صوتی عصبی از قبل آموزش دیده کار می کند ، با توجه به سایر خطوط عصبی ، هزینه محاسباتی کمتری نیز فراهم می کند.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.