ترجمه فارسی مقاله مجموعه داده گفتار غیررسمی خود به خودی برای ترمیم نگارشی

160,000 تومان

عنوان مقاله به انگلیسی Spontaneous Informal Speech Dataset for Punctuation Restoration
عنوان مقاله به فارسی ترجمه فارسی مقاله مجموعه داده گفتار غیررسمی خود به خودی برای ترمیم نگارشی
نویسندگان Xing Yi Liu, Homayoon Beigi
فرمت مقاله انگلیسی PDF
زبان مقاله تحویلی ترجمه فارسی
فرمت مقاله ترجمه شده به صورت فایل ورد
نحوه تحویل ترجمه دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات 8
لینک دانلود رایگان مقاله انگلیسی دانلود مقاله
دسته بندی موضوعات Computation and Language,Human-Computer Interaction,Machine Learning,Sound,Audio and Speech Processing,محاسبه و زبان , تعامل انسان و رایانه , یادگیری ماشین , صدا , پردازش صوتی و گفتار ,
توضیحات Submitted 17 September, 2024; originally announced September 2024. , Comments: 8 pages, 7 tables, 1 figure, Recognition Technologies, Inc. Technical Report , Report number: RTI-20240917-01 , Journal ref: Recognition Technologies, Inc. Technical Report, 2024
توضیحات به فارسی ارسال شده 17 سپتامبر 2024 ؛در ابتدا در سپتامبر 2024 اعلام شد ، نظرات: 8 صفحه ، 7 جدول ، 1 شکل ، RECOCKITION TECHNOLOGIES ، Inc. گزارش فنی ، شماره گزارش: RTI-20240917-01 ، ژورنال Ref: Repociation Technologies ، Inc. گزارش فنی ، 2024
اطلاعات بیشتر از این مقاله در پایگاه های علمی INSPIRE HEP

NASA ADS

Google Scholar

Semantic Scholar

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

Presently, punctuation restoration models are evaluated almost solely on well-structured, scripted corpora. On the other hand, real-world ASR systems and post-processing pipelines typically apply towards spontaneous speech with significant irregularities, stutters, and deviations from perfect grammar. To address this discrepancy, we introduce SponSpeech, a punctuation restoration dataset derived from informal speech sources, which includes punctuation and casing information. In addition to publicly releasing the dataset, we contribute a filtering pipeline that can be used to generate more data. Our filtering pipeline examines the quality of both speech audio and transcription text. We also carefully construct a “challenging” test set, aimed at evaluating models’ ability to leverage audio information to predict otherwise grammatically ambiguous punctuation. SponSpeech is available at https://github.com/GitHubAccountAnonymous/PR, along with all code for dataset building and model runs.

چکیده به فارسی (ترجمه ماشینی)

در حال حاضر ، مدل های ترمیم نگارشی تقریباً فقط در شرکت های خوب ساختار یافته و ساختار یافته ارزیابی می شوند.از طرف دیگر ، سیستم های ASR در دنیای واقعی و خطوط لوله پس از پردازش به طور معمول در مورد گفتار خود به خود با بی نظمی ، لکنت ها و انحرافات از گرامر کامل اعمال می شوند.برای پرداختن به این اختلاف ، ما Sponspeech را معرفی می کنیم ، یک مجموعه داده ترمیم نگارشی که از منابع گفتاری غیررسمی حاصل می شود ، که شامل نگارشی و اطلاعات پوشش است.علاوه بر انتشار عمومی مجموعه داده ها ، ما یک خط لوله فیلتر را ارائه می دهیم که می تواند برای تولید داده های بیشتر استفاده شود.خط لوله فیلتر ما به بررسی کیفیت هر دو متن صوتی گفتار و رونویسی می پردازد.ما همچنین یک مجموعه آزمایش “چالش برانگیز” را با هدف ارزیابی توانایی مدل ها در بهره گیری از اطلاعات صوتی برای پیش بینی نگارشی در غیر این صورت گرامری مبهم ایجاد می کنیم. Sponspeech در https://github.com/githubaccountanonous/pr ، همراه با همه کد برایساختمان و مدل مجموعه داده ها اجرا می شود.

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله مجموعه داده گفتار غیررسمی خود به خودی برای ترمیم نگارشی”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا