| عنوان مقاله به انگلیسی | Futga: Towards Fine-grained Music Understanding through Temporally-enhanced Generative Augmentation |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله فوتگا: به سوی درک دقیق موسیقی از طریق تقویت مولد با بهبود زمانی |
| نویسندگان | Junda Wu, Zachary Novack, Amit Namburi, Jiaheng Dai, Hao-Wen Dong, Zhouhang Xie, Carol Chen, Julian McAuley |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 8 |
| دسته بندی موضوعات | Sound,Artificial Intelligence,Machine Learning,Audio and Speech Processing,صدا , هوش مصنوعی , یادگیری ماشین , پردازش صوتی و گفتار , |
| توضیحات | Submitted 29 July, 2024; originally announced July 2024. , Comments: 6 pages |
| توضیحات به فارسی | ارسال 29 ژوئیه 2024 ؛در ابتدا ژوئیه 2024 اعلام شد ، نظرات: 6 صفحه |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
دانلود مقاله اصل انگلیسی + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 99,000 تومان
سفارش ترجمه فارسی مقاله + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی و ترجمه کامل آن، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 320,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
Existing music captioning methods are limited to generating concise global descriptions of short music clips, which fail to capture fine-grained musical characteristics and time-aware musical changes. To address these limitations, we propose FUTGA, a model equipped with fined-grained music understanding capabilities through learning from generative augmentation with temporal compositions. We leverage existing music caption datasets and large language models (LLMs) to synthesize fine-grained music captions with structural descriptions and time boundaries for full-length songs. Augmented by the proposed synthetic dataset, FUTGA is enabled to identify the music’s temporal changes at key transition points and their musical functions, as well as generate detailed descriptions for each music segment. We further introduce a full-length music caption dataset generated by FUTGA, as the augmentation of the MusicCaps and the Song Describer datasets. We evaluate the automatically generated captions on several downstream tasks, including music generation and retrieval. The experiments demonstrate the quality of the generated captions and the better performance in various downstream tasks achieved by the proposed music captioning approach. Our code and datasets can be found in href{https://huggingface.co/JoshuaW1997/FUTGA}{textcolor{blue}{https://huggingface.co/JoshuaW1997/FUTGA}}.
چکیده به فارسی (ترجمه ماشینی)
روشهای زیرنویس موسیقی موجود محدود به تولید توضیحات جهانی کلیپ های موسیقی کوتاه است ، که نتوانند ویژگی های موسیقی ریز دانه و تغییرات موسیقی آگاهانه را ضبط کنند.برای پرداختن به این محدودیت ها ، ما Futga را پیشنهاد می کنیم ، مدلی مجهز به قابلیت های درک موسیقی جریمه شده از طریق یادگیری از تقویت تولیدی با ترکیبات زمانی.ما از مجموعه داده های زیرنویس موسیقی موجود و مدل های بزرگ زبان (LLMS) استفاده می کنیم تا زیرنویس های موسیقی ریز دانه را با توضیحات ساختاری و مرزهای زمانی برای آهنگ های تمام طول ترکیب کنیم.Futga که توسط مجموعه داده مصنوعی پیشنهادی تقویت شده است ، می تواند تغییرات زمانی موسیقی را در نقاط انتقال کلیدی و عملکردهای موسیقی آنها شناسایی کند و همچنین توضیحات مفصلی را برای هر بخش موسیقی ایجاد کند.ما در ادامه یک مجموعه داده زیرنویس موسیقی تمام قد تولید شده توسط Futga ، به عنوان تقویت مجموعه های موسیقی و مجموعه داده های توصیف آهنگ را معرفی می کنیم.ما زیرنویس های تولید شده به طور خودکار را در چندین کار پایین دست از جمله تولید موسیقی و بازیابی ارزیابی می کنیم.این آزمایشات نشان دهنده کیفیت زیرنویس های تولید شده و عملکرد بهتر در کارهای مختلف پایین دست است که با رویکرد زیرنویس موسیقی پیشنهادی حاصل می شود.کد و مجموعه داده های ما را می توان در href {https://huggingface.co/joshuaw1997/futga} { textcolor {blue {https://huggingface.co/joshuaw1997/futga}} یافت.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.