ترجمه فارسی مقاله مجموعه داده گفتار غیررسمی خود به خودی برای ترمیم نگارشی

160,000 تومان

دسته: مقاله علمی

توضیحات
نظرات (0)

عنوان مقاله به انگلیسی	Spontaneous Informal Speech Dataset for Punctuation Restoration
عنوان مقاله به فارسی	ترجمه فارسی مقاله مجموعه داده گفتار غیررسمی خود به خودی برای ترمیم نگارشی
نویسندگان	Xing Yi Liu, Homayoon Beigi
فرمت مقاله انگلیسی	PDF
زبان مقاله تحویلی	ترجمه فارسی
فرمت مقاله ترجمه شده	به صورت فایل ورد
نحوه تحویل ترجمه	دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات	8
لینک دانلود رایگان مقاله انگلیسی	دانلود مقاله
دسته بندی موضوعات	Computation and Language,Human-Computer Interaction,Machine Learning,Sound,Audio and Speech Processing,محاسبه و زبان , تعامل انسان و رایانه , یادگیری ماشین , صدا , پردازش صوتی و گفتار ,
توضیحات	Submitted 17 September, 2024; originally announced September 2024. , Comments: 8 pages, 7 tables, 1 figure, Recognition Technologies, Inc. Technical Report , Report number: RTI-20240917-01 , Journal ref: Recognition Technologies, Inc. Technical Report, 2024
توضیحات به فارسی	ارسال شده 17 سپتامبر 2024 ؛در ابتدا در سپتامبر 2024 اعلام شد ، نظرات: 8 صفحه ، 7 جدول ، 1 شکل ، RECOCKITION TECHNOLOGIES ، Inc. گزارش فنی ، شماره گزارش: RTI-20240917-01 ، ژورنال Ref: Repociation Technologies ، Inc. گزارش فنی ، 2024
اطلاعات بیشتر از این مقاله در پایگاه های علمی	INSPIRE HEP NASA ADS Google Scholar Semantic Scholar
فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

Presently, punctuation restoration models are evaluated almost solely on well-structured, scripted corpora. On the other hand, real-world ASR systems and post-processing pipelines typically apply towards spontaneous speech with significant irregularities, stutters, and deviations from perfect grammar. To address this discrepancy, we introduce SponSpeech, a punctuation restoration dataset derived from informal speech sources, which includes punctuation and casing information. In addition to publicly releasing the dataset, we contribute a filtering pipeline that can be used to generate more data. Our filtering pipeline examines the quality of both speech audio and transcription text. We also carefully construct a “challenging” test set, aimed at evaluating models’ ability to leverage audio information to predict otherwise grammatically ambiguous punctuation. SponSpeech is available at https://github.com/GitHubAccountAnonymous/PR, along with all code for dataset building and model runs.

چکیده به فارسی (ترجمه ماشینی)

در حال حاضر ، مدل های ترمیم نگارشی تقریباً فقط در شرکت های خوب ساختار یافته و ساختار یافته ارزیابی می شوند.از طرف دیگر ، سیستم های ASR در دنیای واقعی و خطوط لوله پس از پردازش به طور معمول در مورد گفتار خود به خود با بی نظمی ، لکنت ها و انحرافات از گرامر کامل اعمال می شوند.برای پرداختن به این اختلاف ، ما Sponspeech را معرفی می کنیم ، یک مجموعه داده ترمیم نگارشی که از منابع گفتاری غیررسمی حاصل می شود ، که شامل نگارشی و اطلاعات پوشش است.علاوه بر انتشار عمومی مجموعه داده ها ، ما یک خط لوله فیلتر را ارائه می دهیم که می تواند برای تولید داده های بیشتر استفاده شود.خط لوله فیلتر ما به بررسی کیفیت هر دو متن صوتی گفتار و رونویسی می پردازد.ما همچنین یک مجموعه آزمایش “چالش برانگیز” را با هدف ارزیابی توانایی مدل ها در بهره گیری از اطلاعات صوتی برای پیش بینی نگارشی در غیر این صورت گرامری مبهم ایجاد می کنیم. Sponspeech در https://github.com/githubaccountanonous/pr ، همراه با همه کد برایساختمان و مدل مجموعه داده ها اجرا می شود.

فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله مجموعه داده گفتار غیررسمی خود به خودی برای ترمیم نگارشی”

ترجمه فارسی مقاله مجموعه داده گفتار غیررسمی خود به خودی برای ترمیم نگارشی

چکیده

چکیده به فارسی (ترجمه ماشینی)

نقد و بررسی‌ها

محصولات مرتبط

مقاله تقسیم بندی CT کبد از طریق رمزگذاری مبتنی بر PVT و رمزگشایی تصفیه شده

مقاله تشخیص گوشه کارآمد حافظه برای سنسورهای دید پویای مبتنی بر رویداد

مقاله ادغام تخریب و بازیابی ظریف از طریق سازگاری مبتنی بر نیاز

مقاله ISAC با تگ های RFID پس پراکنش: طراحی پرتوهای متصل