| عنوان مقاله به انگلیسی | Tabular Data Augmentation for Machine Learning: Progress and Prospects of Embracing Generative AI |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله تقویت دادههای جدولی برای یادگیری ماشین: پیشرفت و چشماندازهای پذیرش هوش مصنوعی مولد |
| نویسندگان | Lingxi Cui, Huan Li, Ke Chen, Lidan Shou, Gang Chen |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 44 |
| دسته بندی موضوعات | Machine Learning,Artificial Intelligence,Databases,یادگیری ماشین , هوش مصنوعی , پایگاه داده ها , |
| توضیحات | Submitted 31 July, 2024; originally announced July 2024. , Comments: repository maintained at https://github.com/SuDIS-ZJU/awesome-tabular-data-augmentation |
| توضیحات به فارسی | ارسال 31 ژوئیه 2024 ؛در ابتدا ژوئیه 2024 اعلام شد ، نظرات: مخازن نگهداری شده در https://github.com/sudis-zju/awesome-tabular-data-augmentation |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
دانلود مقاله اصل انگلیسی + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 99,000 تومان
سفارش ترجمه فارسی مقاله + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی و ترجمه کامل آن، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 1,760,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
Machine learning (ML) on tabular data is ubiquitous, yet obtaining abundant high-quality tabular data for model training remains a significant obstacle. Numerous works have focused on tabular data augmentation (TDA) to enhance the original table with additional data, thereby improving downstream ML tasks. Recently, there has been a growing interest in leveraging the capabilities of generative AI for TDA. Therefore, we believe it is time to provide a comprehensive review of the progress and future prospects of TDA, with a particular emphasis on the trending generative AI. Specifically, we present an architectural view of the TDA pipeline, comprising three main procedures: pre-augmentation, augmentation, and post-augmentation. Pre-augmentation encompasses preparation tasks that facilitate subsequent TDA, including error handling, table annotation, table simplification, table representation, table indexing, table navigation, schema matching, and entity matching. Augmentation systematically analyzes current TDA methods, categorized into retrieval-based methods, which retrieve external data, and generation-based methods, which generate synthetic data. We further subdivide these methods based on the granularity of the augmentation process at the row, column, cell, and table levels. Post-augmentation focuses on the datasets, evaluation and optimization aspects of TDA. We also summarize current trends and future directions for TDA, highlighting promising opportunities in the era of generative AI. In addition, the accompanying papers and related resources are continuously updated and maintained in the GitHub repository at https://github.com/SuDIS-ZJU/awesome-tabular-data-augmentation to reflect ongoing advancements in the field.
چکیده به فارسی (ترجمه ماشینی)
یادگیری ماشین (ML) روی داده های جدولی همه گیر است ، اما به دست آوردن داده های جدولی با کیفیت بالا برای آموزش مدل یک مانع مهم است.آثار بی شماری روی تقویت داده های جدولی (TDA) برای تقویت جدول اصلی با داده های اضافی متمرکز شده اند ، در نتیجه کارهای ML پایین دست را بهبود می بخشند.اخیراً ، علاقه فزاینده ای به استفاده از قابلیت های تولید هوش مصنوعی برای TDA وجود داشته است.بنابراین ، ما معتقدیم که زمان آن رسیده است که با تأکید ویژه بر AI مولد روند ، یک بررسی جامع از پیشرفت و چشم انداز آینده TDA ارائه دهیم.به طور خاص ، ما یک دیدگاه معماری از خط لوله TDA ارائه می دهیم ، که شامل سه روش اصلی است: پیش از آمریكا ، تقویت و پس از آمریكا.قبل از آمریكا شامل وظایف آماده سازی است كه TDA متعاقب آن را تسهیل می كند ، از جمله رسیدگی به خطا ، حاشیه نویسی جدول ، ساده سازی جدول ، نمایش جدول ، فهرست بندی جدول ، ناوبری جدول ، تطبیق طرحواره و تطبیق موجودیت.تقویت به طور سیستماتیک روشهای فعلی TDA را تجزیه و تحلیل می کند ، به روشهای مبتنی بر بازیابی ، که داده های خارجی را بازیابی می کنند ، و روش های مبتنی بر نسل ، که داده های مصنوعی ایجاد می کنند ، تجزیه و تحلیل می کند.ما بیشتر این روش ها را بر اساس دانه بندی فرآیند تقویت در سطح ردیف ، ستون ، سلول و جدول تقسیم می کنیم.پس از آمریكا بر روی مجموعه داده ها ، ارزیابی و بهینه سازی جنبه های TDA متمرکز است.ما همچنین روندهای فعلی و مسیرهای آینده را برای TDA خلاصه می کنیم ، و فرصت های امیدوارکننده را در دوران AI تولیدی برجسته می کنیم.علاوه بر این ، مقالات همراه و منابع مرتبط به طور مداوم در مخزن GitHub در https://github.com/sudis-zju/awesome-tabular-data-augmentation به روز و نگهداری می شوند تا پیشرفت های مداوم در این زمینه را منعکس کنند.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.