| عنوان مقاله به انگلیسی | Accelerating High-Fidelity Waveform Generation via Adversarial Flow Matching Optimization | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله تسریع در تولید شکل موج با وفاداری بالا از طریق بهینه سازی تطبیق جریان مخالف | ||||||||
| نویسندگان | Sang-Hoon Lee, Ha-Yeong Choi, Seong-Whan Lee | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 9 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Sound,Artificial Intelligence,Machine Learning,Audio and Speech Processing,Signal Processing,صدا , هوش مصنوعی , یادگیری ماشین , پردازش صوتی و گفتار , پردازش سیگنال , | ||||||||
| توضیحات | Submitted 15 August, 2024; originally announced August 2024. , Comments: 9 pages, 9 tables, 1 figure, | ||||||||
| توضیحات به فارسی | ارسال شده در 15 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد ، نظرات: 9 صفحه ، 9 جدول ، 1 شکل ، | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
This paper introduces PeriodWave-Turbo, a high-fidelity and high-efficient waveform generation model via adversarial flow matching optimization. Recently, conditional flow matching (CFM) generative models have been successfully adopted for waveform generation tasks, leveraging a single vector field estimation objective for training. Although these models can generate high-fidelity waveform signals, they require significantly more ODE steps compared to GAN-based models, which only need a single generation step. Additionally, the generated samples often lack high-frequency information due to noisy vector field estimation, which fails to ensure high-frequency reproduction. To address this limitation, we enhance pre-trained CFM-based generative models by incorporating a fixed-step generator modification. We utilized reconstruction losses and adversarial feedback to accelerate high-fidelity waveform generation. Through adversarial flow matching optimization, it only requires 1,000 steps of fine-tuning to achieve state-of-the-art performance across various objective metrics. Moreover, we significantly reduce inference speed from 16 steps to 2 or 4 steps. Additionally, by scaling up the backbone of PeriodWave from 29M to 70M parameters for improved generalization, PeriodWave-Turbo achieves unprecedented performance, with a perceptual evaluation of speech quality (PESQ) score of 4.454 on the LibriTTS dataset. Audio samples, source code and checkpoints will be available at https://github.com/sh-lee-prml/PeriodWave.
چکیده به فارسی (ترجمه ماشینی)
در این مقاله به معرفی دوره ای از توربو ، یک مدل تولید موج با وفاداری بالا و با کارآیی بالا از طریق بهینه سازی تطبیق جریان مخالف.به تازگی ، مدل های تولیدی تطبیق جریان مشروط (CFM) با موفقیت برای کارهای تولید شکل موج اتخاذ شده اند و یک هدف تخمین میدان بردار واحد را برای آموزش اعمال می کنند.اگرچه این مدل ها می توانند سیگنال های شکل موج با وفاداری بالا ایجاد کنند ، اما در مقایسه با مدل های مبتنی بر GAN ، به مراحل ODE قابل توجهی بیشتر نیاز دارند ، که فقط به یک مرحله نسل واحد احتیاج دارند.علاوه بر این ، نمونه های تولید شده اغلب به دلیل برآورد میدان بردار پر سر و صدا ، فاقد اطلاعات با فرکانس بالا هستند ، که نتوانسته است از تولید مثل فرکانس بالا اطمینان حاصل کند.برای پرداختن به این محدودیت ، ما مدل های تولیدی مبتنی بر CFM از قبل آموزش دیده را با ترکیب یک اصلاح مولد مرحله ثابت تقویت می کنیم.ما از تلفات بازسازی و بازخورد مخالف برای تسریع در تولید شکل موج با وفاداری بالا استفاده کردیم.از طریق بهینه سازی تطبیق جریان مخالف ، فقط برای دستیابی به عملکرد پیشرفته در معیارهای مختلف هدف ، به 1000 مرحله تنظیم دقیق نیاز دارد.علاوه بر این ، ما به طور قابل توجهی سرعت استنباط را از 16 مرحله به 2 یا 4 مرحله کاهش می دهیم.علاوه بر این ، با مقیاس کردن ستون فقرات موج دوره از 29 متر به 70 متر پارامترهای بهبود یافته ، دوره ای از موج توربو به عملکرد بی سابقه ای دست می یابد ، با ارزیابی ادراکی از کیفیت گفتار (PESQ) 4.454 در مجموعه داده های Libritts.نمونه های صوتی ، کد منبع و پاسگاه ها در https://github.com/sh-lee-prml/periodwave در دسترس خواهند بود.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.