ترجمه فارسی مقاله تصحیح خطای تولیدی مبتنی بر مدل زبان بزرگ: چالش و پایه‌ای برای تشخیص گفتار، برچسب‌گذاری گوینده، و تشخیص احساسات

160,000 تومان

دسته: مقاله علمی

توضیحات
نظرات (0)

عنوان مقاله به انگلیسی	Large Language Model Based Generative Error Correction: A Challenge and Baselines for Speech Recognition, Speaker Tagging, and Emotion Recognition
عنوان مقاله به فارسی	ترجمه فارسی مقاله تصحیح خطای تولیدی مبتنی بر مدل زبان بزرگ: چالش و پایه‌ای برای تشخیص گفتار، برچسب‌گذاری گوینده، و تشخیص احساسات
نویسندگان	Chao-Han Huck Yang, Taejin Park, Yuan Gong, Yuanchao Li, Zhehuai Chen, Yen-Ting Lin, Chen Chen, Yuchen Hu, Kunal Dhawan, Piotr Żelasko, Chao Zhang, Yun-Nung Chen, Yu Tsao, Jagadeesh Balam, Boris Ginsburg, Sabato Marco Siniscalchi, Eng Siong Chng, Peter Bell, Catherine Lai, Shinji Watanabe, Andreas Stolcke
فرمت مقاله انگلیسی	PDF
زبان مقاله تحویلی	ترجمه فارسی
فرمت مقاله ترجمه شده	به صورت فایل ورد
نحوه تحویل ترجمه	دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات	8
لینک دانلود رایگان مقاله انگلیسی	دانلود مقاله
دسته بندی موضوعات	Computation and Language,Artificial Intelligence,Machine Learning,Sound,Audio and Speech Processing,محاسبات و زبان , هوش مصنوعی , یادگیری ماشین , صدا , پردازش صوتی و گفتار ,
توضیحات	Submitted 17 September, 2024; v1 submitted 15 September, 2024; originally announced September 2024. , Comments: IEEE SLT 2024. The initial draft version has been done in December 2023. Post-ASR Text Processing and Understanding Community: https://huggingface.co/GenSEC-LLM
توضیحات به فارسی	ارسال شده 17 سپتامبر 2024 ؛V1 ارسال شده در 15 سپتامبر 2024 ؛در ابتدا سپتامبر 2024 اعلام شد ، نظرات: IEEE SLT 2024. نسخه اولیه نسخه در دسامبر 2023 انجام شده است. پردازش و درک متن پس از ASR: https://huggingface.co/gensec-llm
اطلاعات بیشتر از این مقاله در پایگاه های علمی	INSPIRE HEP NASA ADS Google Scholar Semantic Scholar
فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

Given recent advances in generative AI technology, a key question is how large language models (LLMs) can enhance acoustic modeling tasks using text decoding results from a frozen, pretrained automatic speech recognition (ASR) model. To explore new capabilities in language modeling for speech processing, we introduce the generative speech transcription error correction (GenSEC) challenge. This challenge comprises three post-ASR language modeling tasks: (i) post-ASR transcription correction, (ii) speaker tagging, and (iii) emotion recognition. These tasks aim to emulate future LLM-based agents handling voice-based interfaces while remaining accessible to a broad audience by utilizing open pretrained language models or agent-based APIs. We also discuss insights from baseline evaluations, as well as lessons learned for designing future evaluations.

چکیده به فارسی (ترجمه ماشینی)

با توجه به پیشرفت های اخیر در فناوری AI تولید کننده ، یک سؤال اساسی این است که چگونه مدل های بزرگ زبان (LLMS) می توانند وظایف مدل سازی آکوستیک را با استفاده از نتایج رمزگشایی متن از یک مدل تشخیص گفتار اتوماتیک منجمد (ASR) تقویت کنند.برای کشف قابلیت های جدید در مدل سازی زبان برای پردازش گفتار ، ما چالش اصلاح خطای رونویسی گفتار (GENSEC) را معرفی می کنیم.این چالش شامل سه وظیفه مدل سازی زبان پس از ASR است: (i) تصحیح رونویسی پس از ASR ، (ب) برچسب زدن بلندگو ، و (iii) تشخیص احساسات.این کارها با هدف تقلید از عوامل مستقر در LLM آینده که با استفاده از مدل های زبان باز شده یا API های مبتنی بر عامل ، در دسترس مخاطبان گسترده ای هستند.ما همچنین در مورد بینش از ارزیابی های پایه و همچنین درسهای آموخته شده برای طراحی ارزیابی های آینده بحث می کنیم.

فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله تصحیح خطای تولیدی مبتنی بر مدل زبان بزرگ: چالش و پایه‌ای برای تشخیص گفتار، برچسب‌گذاری گوینده، و تشخیص احساسات”

ترجمه فارسی مقاله تصحیح خطای تولیدی مبتنی بر مدل زبان بزرگ: چالش و پایه‌ای برای تشخیص گفتار، برچسب‌گذاری گوینده، و تشخیص احساسات

چکیده

چکیده به فارسی (ترجمه ماشینی)

نقد و بررسی‌ها

محصولات مرتبط

مقاله بهبود تشخیص احساس گفتار مستقل از سخنران با استفاده از سازگاری توزیع مشترک پویا

مقاله کنترل جهت پرتو مشترک و تخصیص منابع رادیویی در شبکه های ماهواره ای چند پرتویی LEO پویا

مقاله تشخیص گفتار بصری چند زبانه با یک مدل واحد با یادگیری با واحدهای گفتار بصری گسسته

مقاله تشخیص گوشه کارآمد حافظه برای سنسورهای دید پویای مبتنی بر رویداد