ترجمه فارسی مقاله DPSNN: شبکه عصبی سنبله برای تقویت گفتار جریان کم تأخیر

520,000 تومان

عنوان مقاله به انگلیسی DPSNN: Spiking Neural Network for Low-Latency Streaming Speech Enhancement
عنوان مقاله به فارسی ترجمه فارسی مقاله DPSNN: شبکه عصبی سنبله برای تقویت گفتار جریان کم تأخیر
نویسندگان Tao Sun, Sander Bohté
فرمت مقاله انگلیسی PDF
زبان مقاله تحویلی ترجمه فارسی
فرمت مقاله ترجمه شده به صورت فایل ورد
نحوه تحویل ترجمه دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات 13
لینک دانلود رایگان مقاله انگلیسی دانلود مقاله
دسته بندی موضوعات Sound,Machine Learning,Neural and Evolutionary Computing,Audio and Speech Processing,صدا , یادگیری ماشین , محاسبات عصبی و تکاملی , پردازش صوتی و گفتار ,
توضیحات Submitted 14 August, 2024; originally announced August 2024.
توضیحات به فارسی ارسال شده در 14 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد.
اطلاعات بیشتر از این مقاله در پایگاه های علمی INSPIRE HEP

NASA ADS

Google Scholar

Semantic Scholar

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

Speech enhancement (SE) improves communication in noisy environments, affecting areas such as automatic speech recognition, hearing aids, and telecommunications. With these domains typically being power-constrained and event-based while requiring low latency, neuromorphic algorithms in the form of spiking neural networks (SNNs) have great potential. Yet, current effective SNN solutions require a contextual sampling window imposing substantial latency, typically around 32ms, too long for many applications. Inspired by Dual-Path Spiking Neural Networks (DPSNNs) in classical neural networks, we develop a two-phase time-domain streaming SNN framework — the Dual-Path Spiking Neural Network (DPSNN). In the DPSNN, the first phase uses Spiking Convolutional Neural Networks (SCNNs) to capture global contextual information, while the second phase uses Spiking Recurrent Neural Networks (SRNNs) to focus on frequency-related features. In addition, the regularizer suppresses activation to further enhance energy efficiency of our DPSNNs. Evaluating on the VCTK and Intel DNS Datasets, we demonstrate that our approach achieves the very low latency (approximately 5ms) required for applications like hearing aids, while demonstrating excellent signal-to-noise ratio (SNR), perceptual quality, and energy efficiency.

چکیده به فارسی (ترجمه ماشینی)

تقویت گفتار (SE) ارتباطات را در محیط های پر سر و صدا بهبود می بخشد و در مناطقی مانند تشخیص خودکار گفتار ، سمعک ها و ارتباطات از راه دور تأثیر می گذارد.با وجود این دامنه ها به طور معمول محدود به قدرت و مبتنی بر رویداد در حالی که نیاز به تأخیر کم دارند ، الگوریتم های عصبی در قالب شبکه های عصبی سنبله (SNN) پتانسیل خوبی دارند.با این حال ، راه حل های مؤثر SNN فعلی نیاز به یک پنجره نمونه گیری متنی دارد که تأخیر قابل توجهی را تحمیل می کند ، به طور معمول در حدود 32ms ، برای بسیاری از برنامه ها بسیار طولانی است.ما با الهام از شبکه های عصبی سنبله دو مسیر (DPSNN) در شبکه های عصبی کلاسیک ، ما یک چارچوب SNN جریان دو مرحله ای دامنه زمان ایجاد می کنیم-شبکه عصبی سنبله دوتایی (DPSNN).در DPSNN ، مرحله اول از شبکه های عصبی حلقوی سنبله (SCNN) برای گرفتن اطلاعات متنی جهانی استفاده می کند ، در حالی که مرحله دوم از شبکه های عصبی مکرر سنبله (SRNN) برای تمرکز روی ویژگی های مربوط به فرکانس استفاده می کند.علاوه بر این ، تنظیم کننده فعال سازی را برای افزایش بیشتر بهره وری انرژی DPSNN های ما سرکوب می کند.با ارزیابی مجموعه داده های VCTK و Intel DNS ، ما نشان می دهیم که رویکرد ما به تأخیر بسیار کم (تقریباً 5ms) مورد نیاز برای برنامه های سمعک می رسد ، ضمن اینکه نسبت سیگنال به نویز عالی (SNR) ، کیفیت ادراکی و راندمان انرژی را نشان می دهد.

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله DPSNN: شبکه عصبی سنبله برای تقویت گفتار جریان کم تأخیر”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا