| عنوان مقاله به انگلیسی | Predictive Performance Test based on the Exhaustive Nested Cross-Validation for High-dimensional data |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله آزمون عملکرد پیشبینیکننده مبتنی بر اعتبارسنجی متقابل تودرتو جامع برای دادههای با ابعاد بالا |
| نویسندگان | Iris Ivy Gauran, Hernando Ombao, Zhaoxia Yu |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 49 |
| دسته بندی موضوعات | Methodology,Machine Learning,روش شناسی , یادگیری ماشین , |
| توضیحات | Submitted 6 August, 2024; originally announced August 2024. , Comments: 49 pages, 7 figures |
| توضیحات به فارسی | ارائه شده در 6 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد ، نظرات: 49 صفحه ، 7 شکل |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
سفارش ترجمه فارسی مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، ترجمه فارسی مقاله را نیز سفارش میدهید.
قیمت: 1,960,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
It is crucial to assess the predictive performance of a model in order to establish its practicality and relevance in real-world scenarios, particularly for high-dimensional data analysis. Among data splitting or resampling methods, cross-validation (CV) is extensively used for several tasks such as estimating the prediction error, tuning the regularization parameter, and selecting the most suitable predictive model among competing alternatives. The K-fold cross-validation is a popular CV method but its limitation is that the risk estimates are highly dependent on the partitioning of the data (for training and testing). Here, the issues regarding the reproducibility of the K-fold CV estimator is demonstrated in hypothesis testing wherein different partitions lead to notably disparate conclusions. This study presents an alternative novel predictive performance test and valid confidence intervals based on exhaustive nested cross-validation for determining the difference in prediction error between two model-fitting algorithms. A naive implementation of the exhaustive nested cross-validation is computationally costly. Here, we address concerns regarding computational complexity by devising a computationally tractable closed-form expression for the proposed cross-validation estimator using ridge regularization. Our study also investigates strategies aimed at enhancing statistical power within high-dimensional scenarios while controlling the Type I error rate. To illustrate the practical utility of our method, we apply it to an RNA sequencing study and demonstrate its effectiveness in the context of biological data analysis.
چکیده به فارسی (ترجمه ماشینی)
ارزیابی عملکرد پیش بینی کننده یک مدل به منظور ایجاد عملی و ارتباط آن در سناریوهای دنیای واقعی ، به ویژه برای تجزیه و تحلیل داده های با ابعاد بالا بسیار مهم است.در بین روشهای تقسیم یا استفاده مجدد از داده ها ، اعتبار سنجی متقابل (CV) برای چندین کار مانند تخمین خطای پیش بینی ، تنظیم پارامتر تنظیم تنظیم و انتخاب مناسب ترین مدل پیش بینی کننده در بین گزینه های رقیب مورد استفاده قرار می گیرد.اعتبار سنجی متقاطع K یک روش CV محبوب است اما محدودیت آن این است که برآورد خطر بسیار وابسته به پارتیشن بندی داده ها (برای آموزش و آزمایش) است.در اینجا ، موضوعات مربوط به تکرارپذیری برآوردگر CV k-fold در آزمایش فرضیه نشان داده شده است که در آن پارتیشن های مختلف منجر به نتیجه گیری قابل توجه می شوند.این مطالعه یک آزمون عملکرد پیش بینی کننده جدید و فواصل اطمینان معتبر را بر اساس اعتبارسنجی متقاطع تو در تو برای تعیین تفاوت در خطای پیش بینی بین دو الگوریتم متناسب با مدل ارائه می دهد.اجرای ساده لوحانه از اعتبارسنجی متقابل تو در تو از نظر محاسباتی پر هزینه است.در اینجا ، ما با ابداع یک بیان بسته بسته محاسباتی برای برآوردگر اعتبار سنجی متقابل پیشنهادی با استفاده از تنظیم مجدد ریج ، نگرانی های مربوط به پیچیدگی محاسباتی را بررسی می کنیم.مطالعه ما همچنین استراتژی های با هدف افزایش قدرت آماری در سناریوهای با ابعاد بالا ضمن کنترل میزان خطای نوع I را بررسی می کند.برای نشان دادن کاربرد عملی روش خود ، ما آن را در یک مطالعه توالی RNA اعمال می کنیم و اثربخشی آن را در زمینه تجزیه و تحلیل داده های بیولوژیکی نشان می دهیم.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |



نقد و بررسیها
هنوز بررسیای ثبت نشده است.