عنوان مقاله به انگلیسی | Towards Hierarchical Spoken Language Dysfluency Modeling |
عنوان مقاله به فارسی | به سوی مدلسازی عدم روانی زبان گفتاری سلسله مراتبی |
نویسندگان | Jiachen Lian, Gopala Anumanchipalli |
زبان مقاله | انگلیسی |
فرمت مقاله: | |
چکیده | Speech dysfluency modeling is the bottleneck for both speech therapy and language learning. However, there is no AI solution to systematically tackle this problem. We first propose to define the concept of dysfluent speech and dysfluent speech modeling. We then present Hierarchical Unconstrained Dysfluency Modeling (H-UDM) approach that addresses both dysfluency transcription and detection to eliminate the need for extensive manual annotation. Furthermore, we introduce a simulated dysfluent dataset called VCTK++ to enhance the capabilities of H-UDM in phonetic transcription. Our experimental results demonstrate the effectiveness and robustness of our proposed methods in both transcription and detection tasks. |
تعداد صفحات | 14 |
چکیده به فارسی (ترجمه ماشینی) | مدل سازی سوء هاضمه گفتار تنگنا برای گفتاردرمانی و یادگیری زبان است.با این حال ، هیچ راه حل هوش مصنوعی برای مقابله منظم با این مشکل وجود ندارد.ما ابتدا پیشنهاد می کنیم که مفهوم گفتار دیسفلنت و مدل سازی گفتار سوء استفاده را تعریف کنیم.سپس ما رویکرد مدل سازی عدم تسویه حساب های سلسله مراتبی (H-UDM) را ارائه می دهیم که به رونویسی سوء هاضمه و تشخیص هم می پردازد تا نیاز به حاشیه نویسی گسترده دستی را از بین ببرد.علاوه بر این ، ما یک مجموعه داده دیسفلوژنت شبیه سازی شده به نام VCTK ++ را برای تقویت قابلیت های H-UDM در رونویسی آوایی معرفی می کنیم.نتایج تجربی ما اثربخشی و استحکام روشهای پیشنهادی ما را در هر دو کار رونویسی و تشخیص نشان می دهد. |
دسته بندی موضوعات | Computation and Language,Audio and Speech Processing,محاسبه و زبان ، پردازش صوتی و گفتار ، |
توضیحات | Submitted 18 January, 2024; originally announced January 2024. , Comments: 2024 EACL Long (main conference). arXiv admin note: substantial text overlap with arXiv:2312.12810 |
توضیحات به فارسی | ارائه شده در 18 ژانویه 2024 ؛در ابتدا ژانویه 2024 اعلام شد ، نظرات: 2024 EACL LONG (کنفرانس اصلی).Arxiv Admin توجه: متن قابل توجهی با ARXIV همپوشانی دارد: 2312.12810 |
توجه کنید این مقاله به زبان انگلیسی است. |
برای سفارش ترجمه این مقاله می توانید به یکی از روش های تماس، پیامک، تلگرام و یا واتس اپ با شماره زیر تماس بگیرید:
09395106248 توجه کنید که شرایط ترجمه به صورت زیر است:
|