ترجمه فارسی مقاله تصحیح خطای تولیدی مبتنی بر مدل زبان بزرگ: چالش و پایه‌ای برای تشخیص گفتار، برچسب‌گذاری گوینده، و تشخیص احساسات

160,000 تومان

عنوان مقاله به انگلیسی Large Language Model Based Generative Error Correction: A Challenge and Baselines for Speech Recognition, Speaker Tagging, and Emotion Recognition
عنوان مقاله به فارسی ترجمه فارسی مقاله تصحیح خطای تولیدی مبتنی بر مدل زبان بزرگ: چالش و پایه‌ای برای تشخیص گفتار، برچسب‌گذاری گوینده، و تشخیص احساسات
نویسندگان Chao-Han Huck Yang, Taejin Park, Yuan Gong, Yuanchao Li, Zhehuai Chen, Yen-Ting Lin, Chen Chen, Yuchen Hu, Kunal Dhawan, Piotr Żelasko, Chao Zhang, Yun-Nung Chen, Yu Tsao, Jagadeesh Balam, Boris Ginsburg, Sabato Marco Siniscalchi, Eng Siong Chng, Peter Bell, Catherine Lai, Shinji Watanabe, Andreas Stolcke
فرمت مقاله انگلیسی PDF
زبان مقاله تحویلی ترجمه فارسی
فرمت مقاله ترجمه شده به صورت فایل ورد
نحوه تحویل ترجمه دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات 8
لینک دانلود رایگان مقاله انگلیسی دانلود مقاله
دسته بندی موضوعات Computation and Language,Artificial Intelligence,Machine Learning,Sound,Audio and Speech Processing,محاسبات و زبان , هوش مصنوعی , یادگیری ماشین , صدا , پردازش صوتی و گفتار ,
توضیحات Submitted 17 September, 2024; v1 submitted 15 September, 2024; originally announced September 2024. , Comments: IEEE SLT 2024. The initial draft version has been done in December 2023. Post-ASR Text Processing and Understanding Community: https://huggingface.co/GenSEC-LLM
توضیحات به فارسی ارسال شده 17 سپتامبر 2024 ؛V1 ارسال شده در 15 سپتامبر 2024 ؛در ابتدا سپتامبر 2024 اعلام شد ، نظرات: IEEE SLT 2024. نسخه اولیه نسخه در دسامبر 2023 انجام شده است. پردازش و درک متن پس از ASR: https://huggingface.co/gensec-llm
اطلاعات بیشتر از این مقاله در پایگاه های علمی INSPIRE HEP

NASA ADS

Google Scholar

Semantic Scholar

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

Given recent advances in generative AI technology, a key question is how large language models (LLMs) can enhance acoustic modeling tasks using text decoding results from a frozen, pretrained automatic speech recognition (ASR) model. To explore new capabilities in language modeling for speech processing, we introduce the generative speech transcription error correction (GenSEC) challenge. This challenge comprises three post-ASR language modeling tasks: (i) post-ASR transcription correction, (ii) speaker tagging, and (iii) emotion recognition. These tasks aim to emulate future LLM-based agents handling voice-based interfaces while remaining accessible to a broad audience by utilizing open pretrained language models or agent-based APIs. We also discuss insights from baseline evaluations, as well as lessons learned for designing future evaluations.

چکیده به فارسی (ترجمه ماشینی)

با توجه به پیشرفت های اخیر در فناوری AI تولید کننده ، یک سؤال اساسی این است که چگونه مدل های بزرگ زبان (LLMS) می توانند وظایف مدل سازی آکوستیک را با استفاده از نتایج رمزگشایی متن از یک مدل تشخیص گفتار اتوماتیک منجمد (ASR) تقویت کنند.برای کشف قابلیت های جدید در مدل سازی زبان برای پردازش گفتار ، ما چالش اصلاح خطای رونویسی گفتار (GENSEC) را معرفی می کنیم.این چالش شامل سه وظیفه مدل سازی زبان پس از ASR است: (i) تصحیح رونویسی پس از ASR ، (ب) برچسب زدن بلندگو ، و (iii) تشخیص احساسات.این کارها با هدف تقلید از عوامل مستقر در LLM آینده که با استفاده از مدل های زبان باز شده یا API های مبتنی بر عامل ، در دسترس مخاطبان گسترده ای هستند.ما همچنین در مورد بینش از ارزیابی های پایه و همچنین درسهای آموخته شده برای طراحی ارزیابی های آینده بحث می کنیم.

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله تصحیح خطای تولیدی مبتنی بر مدل زبان بزرگ: چالش و پایه‌ای برای تشخیص گفتار، برچسب‌گذاری گوینده، و تشخیص احساسات”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا