| عنوان مقاله به انگلیسی | Unsupervised Blind Joint Dereverberation and Room Acoustics Estimation with Diffusion Models | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله برآمدهای مشترک کور و تخمین آکوستیک اتاق با مدل های انتشار | ||||||||
| نویسندگان | Jean-Marie Lemercier, Eloi Moliner, Simon Welker, Vesa Välimäki, Timo Gerkmann | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 13 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Audio and Speech Processing,Machine Learning,Sound,پردازش صوتی و گفتار , یادگیری ماشین , صدا , | ||||||||
| توضیحات | Submitted 14 August, 2024; originally announced August 2024. , Comments: Submitted to IEEE/ACM Transactions on Audio, Speech and Language Processing | ||||||||
| توضیحات به فارسی | ارسال شده در 14 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. ، نظرات: ارسال شده به معاملات IEEE/ACM در پردازش صوتی ، گفتار و زبان | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
This paper presents an unsupervised method for single-channel blind dereverberation and room impulse response (RIR) estimation, called BUDDy. The algorithm is rooted in Bayesian posterior sampling: it combines a likelihood model enforcing fidelity to the reverberant measurement, and an anechoic speech prior implemented by an unconditional diffusion model. We design a parametric filter representing the RIR, with exponential decay for each frequency subband. Room acoustics estimation and speech dereverberation are jointly carried out, as the filter parameters are iteratively estimated and the speech utterance refined along the reverse diffusion trajectory. In a blind scenario where the room impulse response is unknown, BUDDy successfully performs speech dereverberation in various acoustic scenarios, significantly outperforming other blind unsupervised baselines. Unlike supervised methods, which often struggle to generalize, BUDDy seamlessly adapts to different acoustic conditions. This paper extends our previous work by offering new experimental results and insights into the algorithm’s performance and versatility. We first investigate the robustness of informed dereverberation methods to RIR estimation errors, to motivate the joint acoustic estimation and dereverberation paradigm. Then, we demonstrate the adaptability of our method to high-resolution singing voice dereverberation, study its performance in RIR estimation, and conduct subjective evaluation experiments to validate the perceptual quality of the results, among other contributions. Audio samples and code can be found online.
چکیده به فارسی (ترجمه ماشینی)
در این مقاله یک روش بدون نظارت برای تخمین کور کور تک کانال و برآورد پاسخ ضربه ای به اتاق (RIR) ، به نام بادی ارائه شده است.این الگوریتم ریشه در نمونه گیری خلفی بیزی دارد: این یک مدل احتمال را که وفاداری را به اندازه گیری Reverberant اعمال می کند ، ترکیب می کند ، و یک گفتار Anechoic که قبلاً توسط یک مدل انتشار بی قید و شرط اجرا شده است.ما یک فیلتر پارامتری را نشان می دهیم که RIR را نشان می دهد ، با پوسیدگی نمایی برای هر زیر باند فرکانس.برآورد آکوستیک اتاق و تنظیم گفتار به طور مشترک انجام می شود ، زیرا پارامترهای فیلتر به طور مکرر تخمین زده می شوند و گفتار گفتار در طول مسیر انتشار معکوس تصفیه می شود.در یک سناریوی کور که در آن پاسخ تحریک اتاق ناشناخته است ، بادی با موفقیت در سناریوهای مختلف صوتی ، گفتار را انجام می دهد ، و به طور قابل توجهی از سایر خطوط بدون نظارت کور استفاده می کند.بر خلاف روشهای نظارت شده ، که اغلب برای تعمیم تلاش می کنند ، بادی یکپارچه با شرایط مختلف صوتی سازگار است.این مقاله با ارائه نتایج تجربی جدید و بینش در مورد عملکرد و تطبیق پذیری الگوریتم ، کار قبلی ما را گسترش می دهد.ما ابتدا استحکام روشهای آگاهانه dereverberation را به خطاهای تخمین RIR ، برای ایجاد انگیزه در برآورد آکوستیک مشترک و الگوی dereverberation بررسی می کنیم.سپس ، ما سازگاری روش خود را با صدای آواز خواندن با وضوح بالا نشان می دهیم ، عملکرد آن را در برآورد RIR مطالعه می کنیم و آزمایش های ارزیابی ذهنی را انجام می دهیم تا کیفیت ادراکی نتایج را تأیید کند.نمونه های صوتی و کد را می توان به صورت آنلاین یافت.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.