| عنوان مقاله به انگلیسی | Learning Disentangled Speech Representations with Contrastive Learning and Time-Invariant Retrieval |
| عنوان مقاله به فارسی | مقاله یادگیری بازنمودهای گفتار متفرقه با یادگیری متضاد و بازیابی متغیر زمان |
| نویسندگان | Yimin Deng, Huaizhen Tang, Xulong Zhang, Ning Cheng, Jing Xiao, Jianzong Wang |
| زبان مقاله | انگلیسی |
| فرمت مقاله: | |
| تعداد صفحات | 5 |
| دسته بندی موضوعات | Sound,Audio and Speech Processing,پردازش صدا , صدا و گفتار , |
| توضیحات | Submitted 17 January, 2024; v1 submitted 15 January, 2024; originally announced January 2024. , Comments: Accepted by 2024 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP2024) |
| توضیحات به فارسی | ارسال شده 17 ژانویه 2024 ؛V1 ارسال شده در 15 ژانویه 2024 ؛در ابتدا ژانویه 2024 اعلام شد ، نظرات: پذیرفته شده توسط کنفرانس بین المللی IEEE در مورد آکوستیک ، گفتار و پردازش سیگنال (ICASSP2024) |
چکیده
Voice conversion refers to transferring speaker identity with well-preserved content. Better disentanglement of speech representations leads to better voice conversion. Recent studies have found that phonetic information from input audio has the potential ability to well represent content. Besides, the speaker-style modeling with pre-trained models making the process more complex. To tackle these issues, we introduce a new method named “CTVC” which utilizes disentangled speech representations with contrastive learning and time-invariant retrieval. Specifically, a similarity-based compression module is used to facilitate a more intimate connection between the frame-level hidden features and linguistic information at phoneme-level. Additionally, a time-invariant retrieval is proposed for timbre extraction based on multiple segmentations and mutual information. Experimental results demonstrate that “CTVC” outperforms previous studies and improves the sound quality and similarity of converted results.
چکیده به فارسی (ترجمه ماشینی)
تبدیل صدا به انتقال هویت بلندگو با محتوای خوب حفظ شده اشاره دارد.جداسازی بهتر بازنمودهای گفتار منجر به تبدیل بهتر صدا می شود.مطالعات اخیر نشان داده است که اطلاعات آوایی از صوتی ورودی از توانایی بالقوه در نشان دادن محتوا برخوردار است.علاوه بر این ، مدل سازی به سبک بلندگو با مدلهای از پیش آموزش شده باعث پیچیده تر این روند می شود.برای مقابله با این مسائل ، ما روشی جدید به نام “CTVC” را معرفی می کنیم که از بازنمایی گفتار جدا شده با یادگیری متضاد و بازیابی متغیر زمان استفاده می کند.به طور خاص ، از یک ماژول فشرده سازی مبتنی بر شباهت برای تسهیل ارتباط صمیمی تر بین ویژگی های پنهان سطح فریم و اطلاعات زبانی در سطح واج استفاده می شود.علاوه بر این ، بازیابی زمان متغیر برای استخراج TIMBRE بر اساس تقسیم بندی های مختلف و اطلاعات متقابل ارائه شده است.نتایج تجربی نشان می دهد که “CTVC” از مطالعات قبلی بهتر عمل می کند و کیفیت صدا و شباهت نتایج تبدیل شده را بهبود می بخشد.
📚 محتوای این محصول آموزشی (پکیج کامل)
علاوه بر مقاله اصلی انگلیسی که دریافت می کنید، برای یادگیری عمیقتر و تسلط کامل بر مباحث مجموعهای از کتابهای آموزشی نیز ارائه میشود.
-
کتاب صدها نکته فارسی (خودمونی) – نسخه PDF — زبان ساده و کاربردی
مشاهده نمونه نسخه نکات ساده -
کتاب صدها نکته رسمی فارسی – نسخه PDF — نگارش استاندارد و علمی
مشاهده نمونه نسخه نکات رسمی -
کتاب صدها پرسش و پاسخ تشریحی – نسخه PDF
— هر سؤال همراه با پاسخ کامل برای درک عمیق مفاهیم
مشاهده نمونه نسخه پرسش و پاسخ -
کتاب پرسش و پاسخ چهارگزینهای – نسخه یادگیری سریع
— پاسخها بلافاصله بعد از سؤال برای مرور سریع
مشاهده نمونه نسخه کوییز سریع -
کتاب پرسش و پاسخ چهارگزینهای – نسخه خودآزمایی
— پاسخها در انتهای بخشها برای سنجش واقعی یادگیری
مشاهده نمونه نسخه آزمونی
🎯 این بسته یک دورهٔ آموزشی کامل و چندلایه است؛ شامل ویدیوهای آموزشی، کتابها، تمرینها و خودآزمایی.
ℹ️ نکات مهم هنگام خرید
- این محصول به صورت فایل دانلودی کامل ارائه میشود.
- توجه: لینکهای اختصاصی دوره طی حداکثر 24 ساعت پس از ثبت سفارش ارسال میشوند.
- دقت کنید لینک ها به شماره موبایل شما ارسال می شوند. پس در ارائه شماره موبایل صحیح دقت کنید.
- برای راهنمایی در مورد نحوه دانلود به شماره 09395106248 پیامک دهید یا تماس بگیرید. (ایده آل ترین گزینه ارسال پیام در یکی از پیام رسان ها به همین شماره است تا سریعا لینک های محصول همان جا برای شما ارسال گردد.)
- اگر پرداخت انجام شده ولی بعد از 24 ساعت هنوز لینکها را دریافت نکردهاید، نام و نام خانوادگی و نام محصول را پیامک کنید تا لینکها دوباره ارسال شوند.
💬 راههای ارتباطی پشتیبانی:
واتساپ یا هر پیام رسان داخلی یا پیامک:
09395106248
تلگرام: @ma_limbs


نقد و بررسیها
هنوز بررسیای ثبت نشده است.