عنوان مقاله به انگلیسی | Voxceleb-ESP: preliminary experiments detecting Spanish celebrities from their voices |
عنوان مقاله به فارسی | مقاله Voxceleb-ESP: آزمایش های اولیه که افراد مشهور اسپانیایی را از صدای آنها تشخیص می دهند |
نویسندگان | Beltrán Labrador, Manuel Otero-Gonzalez, Alicia Lozano-Diez, Daniel Ramos, Doroteo T. Toledano, Joaquin Gonzalez-Rodriguez |
زبان مقاله | انگلیسی |
فرمت مقاله: | |
تعداد صفحات | 4 |
دسته بندی موضوعات | Sound,Machine Learning,Audio and Speech Processing,صدا ، یادگیری ماشین ، پردازش صوتی و گفتار ، |
توضیحات | Submitted 20 December, 2023; originally announced January 2024. |
توضیحات به فارسی | 20 دسامبر 2023 ارسال شد.در ابتدا ژانویه 2024 اعلام شد. |
چکیده
This paper presents VoxCeleb-ESP, a collection of pointers and timestamps to YouTube videos facilitating the creation of a novel speaker recognition dataset. VoxCeleb-ESP captures real-world scenarios, incorporating diverse speaking styles, noises, and channel distortions. It includes 160 Spanish celebrities spanning various categories, ensuring a representative distribution across age groups and geographic regions in Spain. We provide two speaker trial lists for speaker identification tasks, each of them with same-video or different-video target trials respectively, accompanied by a cross-lingual evaluation of ResNet pretrained models. Preliminary speaker identification results suggest that the complexity of the detection task in VoxCeleb-ESP is equivalent to that of the original and much larger VoxCeleb in English. VoxCeleb-ESP contributes to the expansion of speaker recognition benchmarks with a comprehensive and diverse dataset for the Spanish language.
چکیده به فارسی (ترجمه ماشینی)
در این مقاله Voxceleb-ESP ، مجموعه ای از نشانگرها و نشانگرها به فیلم های YouTube ارائه شده است که باعث ایجاد مجموعه داده های جدید تشخیص بلندگو می شود.Voxceleb-ESP سناریوهای دنیای واقعی را ضبط می کند و شامل سبک های متنوع ، سر و صدا و تحریف کانال است.این شامل 160 مشهور اسپانیایی است که دسته های مختلفی را در خود جای می دهند و از توزیع نماینده در گروه های سنی و مناطق جغرافیایی در اسپانیا اطمینان می دهند.ما دو لیست آزمایش بلندگو را برای وظایف شناسایی بلندگو ارائه می دهیم ، که هر یک از آنها به ترتیب آزمایش های هدف یکسان یا متفاوت با استفاده از برنامه های مختلف ، همراه با یک ارزیابی متقابل زبانی از مدل های پیش ساخته RESNET.نتایج شناسایی اولیه بلندگو نشان می دهد که پیچیدگی کار تشخیص در Voxceleb-ESP معادل Voxceleb اصلی و بسیار بزرگتر به زبان انگلیسی است.Voxceleb-ESP با یک مجموعه داده جامع و متنوع برای زبان اسپانیایی به گسترش معیارهای تشخیص بلندگو کمک می کند.
توجه کنید این مقاله به زبان انگلیسی است. |
برای سفارش ترجمه این مقاله می توانید به یکی از روش های تماس، پیامک، تلگرام و یا واتس اپ با شماره زیر تماس بگیرید:
09395106248 توجه کنید که شرایط ترجمه به صورت زیر است:
|
نقد و بررسیها
هنوز بررسیای ثبت نشده است.