| عنوان مقاله به انگلیسی | Adversarial training of Keyword Spotting to Minimize TTS Data Overfitting | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله آموزش خصمانه نقطهیابی کلمات کلیدی برای به حداقل رساندن تطبیق دادههای TTS | ||||||||
| نویسندگان | Hyun Jin Park, Dhruuv Agarwal, Neng Chen, Rentao Sun, Kurt Partridge, Justin Chen, Harry Zhang, Pai Zhu, Jacob Bartel, Kyle Kastner, Gary Wang, Andrew Rosenberg, Quan Wang | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 5 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Sound,Machine Learning,Audio and Speech Processing,صدا , یادگیری ماشین , پردازش صوتی و گفتار , | ||||||||
| توضیحات | Submitted 19 August, 2024; originally announced August 2024. , Comments: to be published in a Workshop at Interspeech 2024, Synthetic Data’s Transformative Role in Foundational Speech Models | ||||||||
| توضیحات به فارسی | ارسال شده در 19 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. ، نظرات: برای انتشار در یک کارگاه آموزشی در Interspeech 2024 ، نقش تحول آمیز داده های مصنوعی در مدلهای گفتار بنیادی | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
The keyword spotting (KWS) problem requires large amounts of real speech training data to achieve high accuracy across diverse populations. Utilizing large amounts of text-to-speech (TTS) synthesized data can reduce the cost and time associated with KWS development. However, TTS data may contain artifacts not present in real speech, which the KWS model can exploit (overfit), leading to degraded accuracy on real speech. To address this issue, we propose applying an adversarial training method to prevent the KWS model from learning TTS-specific features when trained on large amounts of TTS data. Experimental results demonstrate that KWS model accuracy on real speech data can be improved by up to 12% when adversarial loss is used in addition to the original KWS loss. Surprisingly, we also observed that the adversarial setup improves accuracy by up to 8%, even when trained solely on TTS and real negative speech data, without any real positive examples.
چکیده به فارسی (ترجمه ماشینی)
مشکل لکه بینی کلمه کلیدی (KWS) برای دستیابی به دقت بالا در جمعیت های متنوع ، به مقادیر زیادی از داده های آموزش گفتار واقعی نیاز دارد.استفاده از مقادیر زیادی از داده های سنتز شده متن به گفتار (TTS) می تواند هزینه و زمان مرتبط با توسعه KWS را کاهش دهد.با این حال ، داده های TTS ممکن است حاوی مصنوعات موجود در گفتار واقعی باشد ، که مدل KWS می تواند از آن استفاده کند (Overfit) ، و منجر به دقت تخریب شده در گفتار واقعی می شود.برای پرداختن به این مسئله ، ما پیشنهاد می کنیم از یک روش آموزش مخالف استفاده کنیم تا از مدل KWS از یادگیری ویژگی های خاص TTS هنگام آموزش در مقادیر زیادی از داده های TTS جلوگیری کنیم.نتایج تجربی نشان می دهد که دقت مدل KWS در داده های گفتار واقعی می تواند تا 12 ٪ بهبود یابد وقتی از دست دادن مخالف علاوه بر از دست دادن اصلی KWS استفاده می شود.با کمال تعجب ، ما همچنین مشاهده کردیم که تنظیم مخالف ، حتی در صورت آموزش فقط بر روی TTS و داده های گفتار منفی واقعی ، بدون هیچ نمونه مثبت واقعی ، دقت را تا 8 ٪ بهبود می بخشد.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.