,

مقاله DurFlex-EVC: تبدیل صدای احساسی با مدت زمان انعطاف پذیر با نسل موازی

249,950 تومان

انتخاب پلن

torobpay
هر قسط با ترب‌پی: 62,488 تومان
۴ قسط ماهانه. بدون سود، چک و ضامن.
عنوان مقاله به انگلیسی DurFlex-EVC: Duration-Flexible Emotional Voice Conversion with Parallel Generation
عنوان مقاله به فارسی مقاله Durflex-EVC: تبدیل صدای عاطفی انعطاف پذیر مدت زمان با نسل موازی
نویسندگان Hyoung-Seok Oh, Sang-Hoon Lee, Deok-Hyun Cho, Seong-Whan Lee
زبان مقاله انگلیسی
فرمت مقاله: PDF
تعداد صفحات 13
دسته بندی موضوعات Sound,Artificial Intelligence,Audio and Speech Processing,صدا , هوش مصنوعی , پردازش صوتی و گفتار ,
توضیحات Submitted 15 January, 2024; originally announced January 2024. , Comments: 13 pages, 9 figures, 8 tables
توضیحات به فارسی ارسال شده در 15 ژانویه 2024 ؛در ابتدا ژانویه 2024 اعلام شد ، نظرات: 13 صفحه ، 9 شکل ، 8 جدول

چکیده

Emotional voice conversion (EVC) seeks to modify the emotional tone of a speaker’s voice while preserving the original linguistic content and the speaker’s unique vocal characteristics. Recent advancements in EVC have involved the simultaneous modeling of pitch and duration, utilizing the potential of sequence-to-sequence (seq2seq) models. To enhance reliability and efficiency in conversion, this study shifts focus towards parallel speech generation. We introduce Duration-Flexible EVC (DurFlex-EVC), which integrates a style autoencoder and unit aligner. Traditional models, while incorporating self-supervised learning (SSL) representations that contain both linguistic and paralinguistic information, have neglected this dual nature, leading to reduced controllability. Addressing this issue, we implement cross-attention to synchronize these representations with various emotions. Additionally, a style autoencoder is developed for the disentanglement and manipulation of style elements. The efficacy of our approach is validated through both subjective and objective evaluations, establishing its superiority over existing models in the field.

چکیده به فارسی (ترجمه ماشینی)

تبدیل صدای عاطفی (EVC) در تلاش است ضمن حفظ محتوای اصلی زبانی و ویژگی های صوتی منحصر به فرد بلندگو ، لحن عاطفی صدای بلندگو را تغییر دهد.پیشرفت های اخیر در EVC شامل مدل سازی همزمان زمین و مدت زمان با استفاده از پتانسیل مدلهای توالی به توالی (SEQ2SEQ) است.برای افزایش قابلیت اطمینان و کارآیی در تبدیل ، این مطالعه به سمت تولید گفتار موازی متمرکز می شود.ما EVC انعطاف پذیر مدت زمان (Durflex-EVC) را معرفی می کنیم ، که یک Autoencoder سبک و تراز واحد را ادغام می کند.مدلهای سنتی ، ضمن اینکه شامل بازنمایی های یادگیری خودبوشی (SSL) هستند که حاوی اطلاعات زبانی و پارانگیستی هستند ، از این ماهیت دوگانه غفلت کرده اند و منجر به کاهش کنترل می شوند.با پرداختن به این موضوع ، ما برای همگام سازی این بازنمایی ها با احساسات مختلف ، توجه متقابل را اجرا می کنیم.علاوه بر این ، یک autoencoder سبک برای جداسازی و دستکاری عناصر سبک تهیه شده است.اثربخشی رویکرد ما از طریق ارزیابی های ذهنی و عینی تأیید می شود و برتری آن را نسبت به مدلهای موجود در این زمینه ایجاد می کند.


📚 محتوای این محصول آموزشی (پکیج کامل)

علاوه بر مقاله اصلی انگلیسی که دریافت می کنید، برای یادگیری عمیق‌تر و تسلط کامل بر مباحث مجموعه‌ای از کتاب‌های آموزشی نیز ارائه می‌شود.

🎯 این بسته یک دورهٔ آموزشی کامل و چندلایه است؛ شامل ویدیوهای آموزشی، کتاب‌ها، تمرین‌ها و خودآزمایی.

ℹ️ نکات مهم هنگام خرید

  • این محصول به صورت فایل دانلودی کامل ارائه می‌شود.
  • توجه: لینک‌های اختصاصی دوره طی حداکثر 24 ساعت پس از ثبت سفارش ارسال می‌شوند.
  • دقت کنید لینک ها به شماره موبایل شما ارسال می شوند. پس در ارائه شماره موبایل صحیح دقت کنید.
  • برای راهنمایی در مورد نحوه دانلود به شماره 09395106248 پیامک دهید یا تماس بگیرید. (ایده آل ترین گزینه ارسال پیام در یکی از پیام رسان ها به همین شماره است تا سریعا لینک های محصول همان جا برای شما ارسال گردد.)
  • اگر پرداخت انجام شده ولی بعد از 24 ساعت هنوز لینک‌ها را دریافت نکرده‌اید، نام و نام خانوادگی و نام محصول را پیامک کنید تا لینک‌ها دوباره ارسال شوند.

💬 راه‌های ارتباطی پشتیبانی:
واتس‌اپ یا هر پیام رسان داخلی یا پیامک: 09395106248
تلگرام: @ma_limbs

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “مقاله DurFlex-EVC: تبدیل صدای احساسی با مدت زمان انعطاف پذیر با نسل موازی”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا