| عنوان مقاله به انگلیسی | Large Language Model Based Generative Error Correction: A Challenge and Baselines for Speech Recognition, Speaker Tagging, and Emotion Recognition | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله تصحیح خطای تولیدی مبتنی بر مدل زبان بزرگ: چالش و پایهای برای تشخیص گفتار، برچسبگذاری گوینده، و تشخیص احساسات | ||||||||
| نویسندگان | Chao-Han Huck Yang, Taejin Park, Yuan Gong, Yuanchao Li, Zhehuai Chen, Yen-Ting Lin, Chen Chen, Yuchen Hu, Kunal Dhawan, Piotr Żelasko, Chao Zhang, Yun-Nung Chen, Yu Tsao, Jagadeesh Balam, Boris Ginsburg, Sabato Marco Siniscalchi, Eng Siong Chng, Peter Bell, Catherine Lai, Shinji Watanabe, Andreas Stolcke | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 8 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Computation and Language,Artificial Intelligence,Machine Learning,Sound,Audio and Speech Processing,محاسبات و زبان , هوش مصنوعی , یادگیری ماشین , صدا , پردازش صوتی و گفتار , | ||||||||
| توضیحات | Submitted 17 September, 2024; v1 submitted 15 September, 2024; originally announced September 2024. , Comments: IEEE SLT 2024. The initial draft version has been done in December 2023. Post-ASR Text Processing and Understanding Community: https://huggingface.co/GenSEC-LLM | ||||||||
| توضیحات به فارسی | ارسال شده 17 سپتامبر 2024 ؛V1 ارسال شده در 15 سپتامبر 2024 ؛در ابتدا سپتامبر 2024 اعلام شد ، نظرات: IEEE SLT 2024. نسخه اولیه نسخه در دسامبر 2023 انجام شده است. پردازش و درک متن پس از ASR: https://huggingface.co/gensec-llm | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
Given recent advances in generative AI technology, a key question is how large language models (LLMs) can enhance acoustic modeling tasks using text decoding results from a frozen, pretrained automatic speech recognition (ASR) model. To explore new capabilities in language modeling for speech processing, we introduce the generative speech transcription error correction (GenSEC) challenge. This challenge comprises three post-ASR language modeling tasks: (i) post-ASR transcription correction, (ii) speaker tagging, and (iii) emotion recognition. These tasks aim to emulate future LLM-based agents handling voice-based interfaces while remaining accessible to a broad audience by utilizing open pretrained language models or agent-based APIs. We also discuss insights from baseline evaluations, as well as lessons learned for designing future evaluations.
چکیده به فارسی (ترجمه ماشینی)
با توجه به پیشرفت های اخیر در فناوری AI تولید کننده ، یک سؤال اساسی این است که چگونه مدل های بزرگ زبان (LLMS) می توانند وظایف مدل سازی آکوستیک را با استفاده از نتایج رمزگشایی متن از یک مدل تشخیص گفتار اتوماتیک منجمد (ASR) تقویت کنند.برای کشف قابلیت های جدید در مدل سازی زبان برای پردازش گفتار ، ما چالش اصلاح خطای رونویسی گفتار (GENSEC) را معرفی می کنیم.این چالش شامل سه وظیفه مدل سازی زبان پس از ASR است: (i) تصحیح رونویسی پس از ASR ، (ب) برچسب زدن بلندگو ، و (iii) تشخیص احساسات.این کارها با هدف تقلید از عوامل مستقر در LLM آینده که با استفاده از مدل های زبان باز شده یا API های مبتنی بر عامل ، در دسترس مخاطبان گسترده ای هستند.ما همچنین در مورد بینش از ارزیابی های پایه و همچنین درسهای آموخته شده برای طراحی ارزیابی های آینده بحث می کنیم.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.