“مقاله برت و ال‌آی‌دبلیوسی: کاوش مدل‌های زبانی پیشرفته برای پیش‌بینی رفتار ارتباطی در تعاملات تعارض زوجین به همراه PDF فارسی + پادکست صوتی فارسی + ویدیو آموزشی فارسی” به سبد خرید شما اضافه شد. ادامه خرید

مقاله علمی

مقاله MLAAD: مجموعه داده های ضد اسپانیایی صوتی چند زبانه

10,000 تومان

دسته: مقاله علمی برچسب: Audio and Speech Processing, Sound, پردازش صدا ، صدا و گفتار ،

توضیحات
نظرات (0)

عنوان مقاله به انگلیسی	MLAAD: The Multi-Language Audio Anti-Spoofing Dataset
عنوان مقاله به فارسی	MLAAD: مجموعه داده های ضد اسپانیایی صوتی چند زبانه
نویسندگان	Nicolas M. Müller, Piotr Kawa, Wei Herng Choong, Edresson Casanova, Eren Gölge, Thorsten Müller, Piotr Syga, Philip Sperl, Konstantin Böttinger
زبان مقاله	انگلیسی
فرمت مقاله:	PDF
چکیده	Text-to-Speech (TTS) technology brings significant advantages, such as giving a voice to those with speech impairments, but also enables audio deepfakes and spoofs. The former mislead individuals and may propagate misinformation, while the latter undermine voice biometric security systems. AI-based detection can help to address these challenges by automatically differentiating between genuine and fabricated voice recordings. However, these models are only as good as their training data, which currently is severely limited due to an overwhelming concentration on English and Chinese audio in anti-spoofing databases, thus restricting its worldwide effectiveness. In response, this paper presents the Multi-Language Audio Anti-Spoof Dataset (MLAAD), created using 52 TTS models, comprising 19 different architectures, to generate 160.1 hours of synthetic voice in 23 different languages. We train and evaluate three state-of-the-art deepfake detection models with MLAAD, and observe that MLAAD demonstrates superior performance over comparable datasets like InTheWild or FakeOrReal when used as a training resource. Furthermore, in comparison with the renowned ASVspoof 2019 dataset, MLAAD proves to be a complementary resource. In tests across eight datasets, MLAAD and ASVspoof 2019 alternately outperformed each other, both excelling on four datasets. By publishing MLAAD and making trained models accessible via an interactive webserver , we aim to democratize antispoofing technology, making it accessible beyond the realm of specialists, thus contributing to global efforts against audio spoofing and deepfakes.
تعداد صفحات	7
چکیده به فارسی (ترجمه ماشینی)	فناوری متن به گفتار (TTS) مزایای قابل توجهی را به همراه دارد ، مانند دادن صدا به کسانی که دارای اختلال در گفتار هستند ، اما همچنین باعث می شود که دیپ های صوتی و کلاهبرداری های صوتی را نیز فراهم کند.افراد سابق گمراه کننده و ممکن است اطلاعات نادرست را تبلیغ کنند ، در حالی که دومی سیستم های امنیتی بیومتریک صوتی را تضعیف می کند.تشخیص مبتنی بر هوش مصنوعی با تمایز خودکار بین ضبط های صوتی واقعی و ساختگی می تواند به رفع این چالش ها کمک کند.با این حال ، این مدل ها فقط به اندازه داده های آموزش خود خوب هستند ، که در حال حاضر به دلیل تمرکز بیش از حد بر روی صدای انگلیسی و چینی در پایگاه داده های ضد طلسم به شدت محدود است ، بنابراین اثربخشی جهانی آن را محدود می کند.در پاسخ ، در این مقاله مجموعه داده های ضد اسپوفر صوتی چند زبانه (MLAAD) ، با استفاده از 52 مدل TTS ، متشکل از 19 معماری مختلف ، برای تولید 160.1 ساعت صدای مصنوعی در 23 زبان مختلف ایجاد شده است.ما سه مدل پیشرفته از Deepfake را با MLAAD آموزش داده و ارزیابی می کنیم و مشاهده می کنیم که MLAAD عملکرد برتر را نسبت به مجموعه داده های قابل مقایسه مانند Inthewild یا Fakeorreal در هنگام استفاده به عنوان منبع آموزشی نشان می دهد.علاوه بر این ، در مقایسه با مجموعه داده های مشهور ASVSPOOF 2019 ، MLAAD ثابت می کند که یک منبع مکمل است.در آزمایشات در هشت مجموعه داده ، MLAAD و ASVSPOOF 2019 به طور متناوب از یکدیگر بهتر عمل کردند ، هر دو در چهار مجموعه داده عالی بودند.با انتشار MLAAD و ساختن مدل های آموزش دیده از طریق یک Webserver Interactive ، هدف ما دموکراتیک کردن فناوری ضد فشار خون است و آن را فراتر از قلمرو متخصصان در دسترس قرار می دهد ، بنابراین به تلاش های جهانی علیه کلاهبرداری صوتی و عمیق کمک می کند.
دسته بندی موضوعات	Sound,Audio and Speech Processing,پردازش صدا ، صدا و گفتار ،
توضیحات	Submitted 17 January, 2024; originally announced January 2024. , Comments: Submitted to IJCNN 2024
توضیحات به فارسی	ارسال شده 17 ژانویه 2024 ؛در ابتدا ژانویه 2024 اعلام شد ، نظرات: ارسال شده به IJCNN 2024

توجه کنید این مقاله به زبان انگلیسی است.

برای سفارش ترجمه این مقاله می توانید به یکی از روش های تماس، پیامک، تلگرام و یا واتس اپ با شماره زیر تماس بگیرید:

09395106248

توجه کنید که شرایط ترجمه به صورت زیر است:

قیمت هر صفحه ترجمه در حال حاضر 40 هزار تومان می باشد.
تحویل مقاله ترجمه شده به صورت فایل ورد می باشد.
زمان تحویل ترجمه مقاله در صورت داشتن تعداد صفحات عادی بین 3 تا 5 روز خواهد بود.
کیفیت ترجمه بسیار بالا می باشد. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “مقاله MLAAD: مجموعه داده های ضد اسپانیایی صوتی چند زبانه”

مقاله MLAAD: مجموعه داده های ضد اسپانیایی صوتی چند زبانه

نقد و بررسی‌ها

محصولات مرتبط

مقاله تقسیم بندی CT کبد از طریق رمزگذاری مبتنی بر PVT و رمزگشایی تصفیه شده

مقاله تقسیم‌بندی خودکار سه بعدی اولتراسوند چندوجهی جفت انسان با استفاده از استراتژی‌های فیوژن و یادگیری عمیق

مقاله انتخاب پارامتر برای تجزیه و تحلیل مکالمات با اختلال طیف اوتیسم

مقاله یک رویکرد کنترل بهینه تطبیقی برای به حداکثر رساندن قابلیت مشاهده عمق تک چشمی