ترجمه فارسی مقاله بازنمایی های کامپوزیت بدون نظارت برای صدا

180,000 تومان

عنوان مقاله به انگلیسی Unsupervised Composable Representations for Audio
عنوان مقاله به فارسی ترجمه فارسی مقاله بازنمایی های کامپوزیت بدون نظارت برای صدا
نویسندگان Giovanni Bindi, Philippe Esling
فرمت مقاله انگلیسی PDF
زبان مقاله تحویلی ترجمه فارسی
فرمت مقاله ترجمه شده به صورت فایل ورد
نحوه تحویل ترجمه دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات 9
لینک دانلود رایگان مقاله انگلیسی دانلود مقاله
دسته بندی موضوعات Machine Learning,Sound,Audio and Speech Processing,یادگیری ماشین , پردازش صدا , صدا و گفتار ,
توضیحات Submitted 19 August, 2024; originally announced August 2024. , Comments: ISMIR 2024
توضیحات به فارسی ارسال شده در 19 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. ، نظرات: Ismir 2024
اطلاعات بیشتر از این مقاله در پایگاه های علمی INSPIRE HEP

NASA ADS

Google Scholar

Semantic Scholar

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

Current generative models are able to generate high-quality artefacts but have been shown to struggle with compositional reasoning, which can be defined as the ability to generate complex structures from simpler elements. In this paper, we focus on the problem of compositional representation learning for music data, specifically targeting the fully-unsupervised setting. We propose a simple and extensible framework that leverages an explicit compositional inductive bias, defined by a flexible auto-encoding objective that can leverage any of the current state-of-art generative models. We demonstrate that our framework, used with diffusion models, naturally addresses the task of unsupervised audio source separation, showing that our model is able to perform high-quality separation. Our findings reveal that our proposal achieves comparable or superior performance with respect to other blind source separation methods and, furthermore, it even surpasses current state-of-art supervised baselines on signal-to-interference ratio metrics. Additionally, by learning an a-posteriori masking diffusion model in the space of composable representations, we achieve a system capable of seamlessly performing unsupervised source separation, unconditional generation, and variation generation. Finally, as our proposal works in the latent space of pre-trained neural audio codecs, it also provides a lower computational cost with respect to other neural baselines.

چکیده به فارسی (ترجمه ماشینی)

مدل های تولیدی فعلی قادر به تولید آثار با کیفیت بالا هستند اما نشان داده شده است که با استدلال ترکیبی مبارزه می کنند ، که می تواند به عنوان توانایی تولید ساختارهای پیچیده از عناصر ساده تر تعریف شود.در این مقاله ، ما بر روی مشکل یادگیری نمایشی برای داده های موسیقی ، به طور خاص هدف قرار دادن تنظیمات کاملاً بدون نظارت ، تمرکز می کنیم.ما یک چارچوب ساده و گسترده را پیشنهاد می کنیم که از یک تعصب القایی ترکیبی صریح استفاده می کند ، تعریف شده توسط یک هدف رمزگذاری خودکار انعطاف پذیر که می تواند از هر یک از مدلهای تولیدی فعلی فعلی استفاده کند.ما نشان می دهیم که چارچوب ما ، که با مدلهای انتشار استفاده می شود ، به طور طبیعی وظیفه جداسازی منبع صوتی بدون نظارت را نشان می دهد ، نشان می دهد که مدل ما قادر به انجام جداسازی با کیفیت بالا است.یافته های ما نشان می دهد که پیشنهاد ما با توجه به سایر روشهای جداسازی منبع کور ، به عملکرد قابل مقایسه یا برتر دست می یابد و علاوه بر این ، حتی از خطوط نظارتی پیشرفته فعلی در معیارهای نسبت سیگنال به مداخله پیشی می گیرد.علاوه بر این ، با یادگیری یک مدل انتشار نقاب A- خلفی در فضای بازنمایی های ترکیبی ، ما به سیستمی می رسیم که قادر به انجام یکپارچه جداسازی منبع بدون نظارت ، تولید بی قید و شرط و تولید تغییر است.سرانجام ، از آنجا که پیشنهاد ما در فضای نهفته کدک های صوتی عصبی از قبل آموزش دیده کار می کند ، با توجه به سایر خطوط عصبی ، هزینه محاسباتی کمتری نیز فراهم می کند.

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله بازنمایی های کامپوزیت بدون نظارت برای صدا”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا