ترجمه فارسی مقاله ارزیابی کارآیی یادگیری افزایشی نمونه در مقابل دسته ای در محیط های برچسب تاخیری: یک مطالعه تجربی بر روی جریان داده های جدولی برای تشخیص تقلب

400,000 تومان

عنوان مقاله به انگلیسی Evaluating the Efficacy of Instance Incremental vs. Batch Learning in Delayed Label Environments: An Empirical Study on Tabular Data Streaming for Fraud Detection
عنوان مقاله به فارسی ترجمه فارسی مقاله ارزیابی کارآیی یادگیری افزایشی نمونه در مقابل دسته ای در محیط های برچسب تاخیری: یک مطالعه تجربی بر روی جریان داده های جدولی برای تشخیص تقلب
نویسندگان Kodjo Mawuena Amekoe, Mustapha Lebbah, Gregoire Jaffre, Hanene Azzag, Zaineb Chelly Dagdia
فرمت مقاله انگلیسی PDF
زبان مقاله تحویلی ترجمه فارسی
فرمت مقاله ترجمه شده به صورت فایل ورد
نحوه تحویل ترجمه دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات 20
لینک دانلود رایگان مقاله انگلیسی دانلود مقاله
دسته بندی موضوعات Machine Learning,Computational Engineering, Finance, and Science,Neural and Evolutionary Computing,یادگیری ماشین , مهندسی محاسباتی , امور مالی و علوم , محاسبات عصبی و تکاملی ,
توضیحات Submitted 16 September, 2024; originally announced September 2024. , Comments: 20 pages
توضیحات به فارسی ارائه شده 16 سپتامبر 2024 ؛در ابتدا سپتامبر 2024 اعلام شد ، نظرات: 20 صفحه
اطلاعات بیشتر از این مقاله در پایگاه های علمی INSPIRE HEP

NASA ADS

Google Scholar

Semantic Scholar

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

Real-world tabular learning production scenarios typically involve evolving data streams, where data arrives continuously and its distribution may change over time. In such a setting, most studies in the literature regarding supervised learning favor the use of instance incremental algorithms due to their ability to adapt to changes in the data distribution. Another significant reason for choosing these algorithms is \textit{avoid storing observations in memory} as commonly done in batch incremental settings. However, the design of instance incremental algorithms often assumes immediate availability of labels, which is an optimistic assumption. In many real-world scenarios, such as fraud detection or credit scoring, labels may be delayed. Consequently, batch incremental algorithms are widely used in many real-world tasks. This raises an important question: “In delayed settings, is instance incremental learning the best option regarding predictive performance and computational efficiency?” Unfortunately, this question has not been studied in depth, probably due to the scarcity of real datasets containing delayed information. In this study, we conduct a comprehensive empirical evaluation and analysis of this question using a real-world fraud detection problem and commonly used generated datasets. Our findings indicate that instance incremental learning is not the superior option, considering on one side state-of-the-art models such as Adaptive Random Forest (ARF) and other side batch learning models such as XGBoost. Additionally, when considering the interpretability of the learning systems, batch incremental solutions tend to be favored. Code: \url{https://github.com/anselmeamekoe/DelayedLabelStream}

چکیده به فارسی (ترجمه ماشینی)

سناریوهای تولید یادگیری جدولی در دنیای واقعی به طور معمول شامل تکامل جریان داده ها هستند ، جایی که داده ها به طور مداوم وارد می شوند و توزیع آن ممکن است با گذشت زمان تغییر کند.در چنین شرایطی ، بیشتر مطالعات در ادبیات در مورد یادگیری تحت نظارت ، از استفاده از الگوریتم های افزایشی نمونه به دلیل توانایی آنها در سازگاری با تغییرات در توزیع داده ها حمایت می کند.یکی دیگر از دلایل مهم انتخاب این الگوریتم ها \ textit است {از ذخیره مشاهدات در حافظه خودداری کنید} همانطور که معمولاً در تنظیمات افزایشی دسته ای انجام می شود.با این حال ، طراحی الگوریتم های افزایشی نمونه اغلب در دسترس بودن فوری برچسب ها را فرض می کند ، که این یک فرض خوش بینانه است.در بسیاری از سناریوهای دنیای واقعی ، مانند تشخیص کلاهبرداری یا امتیاز دهی به اعتبار ، برچسب ها ممکن است به تأخیر بیفتند.در نتیجه ، الگوریتم های افزایشی دسته ای به طور گسترده در بسیاری از کارهای دنیای واقعی مورد استفاده قرار می گیرند.این یک سؤال مهم را ایجاد می کند: “در تنظیمات تأخیر ، یادگیری افزایشی بهترین گزینه در مورد عملکرد پیش بینی و کارآیی محاسباتی است؟”متأسفانه ، این سؤال در عمق مورد مطالعه قرار نگرفته است ، احتمالاً به دلیل کمبود مجموعه داده های واقعی حاوی اطلاعات تأخیر.در این مطالعه ، ما یک ارزیابی جامع تجربی و تجزیه و تحلیل این سؤال را با استفاده از یک مشکل تشخیص کلاهبرداری در دنیای واقعی انجام می دهیم و مجموعه داده های تولید شده معمولاً استفاده می شود.یافته های ما نشان می دهد که یادگیری افزایشی نمونه گزینه برتر نیست ، با توجه به مدلهای یک طرفه پیشرفته مانند جنگل تصادفی تطبیقی ​​(ARF) و سایر مدلهای یادگیری دسته جانبی مانند XGBOOST.علاوه بر این ، هنگام در نظر گرفتن تفسیر سیستم های یادگیری ، راه حل های افزایشی دسته ای مورد علاقه قرار می گیرند.کد: \ url {https://github.com/anselmeamekoe/delayedlabeltream}

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله ارزیابی کارآیی یادگیری افزایشی نمونه در مقابل دسته ای در محیط های برچسب تاخیری: یک مطالعه تجربی بر روی جریان داده های جدولی برای تشخیص تقلب”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا