| عنوان مقاله به انگلیسی | Assumption-lean and Data-adaptive Post-Prediction Inference |
| عنوان مقاله به فارسی | مقاله استنتاج پس از پیشبینی مبتنی بر فرض و دادههای تطبیقی |
| نویسندگان | Jiacheng Miao, Xinran Miao, Yixuan Wu, Jiwei Zhao, Qiongshi Lu |
| زبان مقاله | انگلیسی |
| فرمت مقاله: | |
| تعداد صفحات | 15 |
| دسته بندی موضوعات | Methodology,Machine Learning,Machine Learning,روش شناسی , یادگیری ماشین , یادگیری ماشین , |
| توضیحات | Submitted 23 November, 2023; originally announced November 2023. |
| توضیحات به فارسی | ارسال شده 23 نوامبر 2023 ؛در ابتدا نوامبر 2023 اعلام شد. |
چکیده
A primary challenge facing modern scientific research is the limited availability of gold-standard data which can be both costly and labor-intensive to obtain. With the rapid development of machine learning (ML), scientists have relied on ML algorithms to predict these gold-standard outcomes with easily obtained covariates. However, these predicted outcomes are often used directly in subsequent statistical analyses, ignoring imprecision and heterogeneity introduced by the prediction procedure. This will likely result in false positive findings and invalid scientific conclusions. In this work, we introduce an assumption-lean and data-adaptive Post-Prediction Inference (POP-Inf) procedure that allows valid and powerful inference based on ML-predicted outcomes. Its “assumption-lean” property guarantees reliable statistical inference without assumptions on the ML-prediction, for a wide range of statistical quantities. Its “data-adaptive'” feature guarantees an efficiency gain over existing post-prediction inference methods, regardless of the accuracy of ML-prediction. We demonstrate the superiority and applicability of our method through simulations and large-scale genomic data.
چکیده به فارسی (ترجمه ماشینی)
یک چالش اصلی با تحقیقات علمی مدرن ، در دسترس بودن داده های استاندارد طلا است که هم می تواند برای دستیابی به آن پر هزینه و کار باشد.با پیشرفت سریع یادگیری ماشین (ML) ، دانشمندان به الگوریتم های ML اعتماد کرده اند تا این نتایج استاندارد طلا را با متغیرهای متغیر به دست بیاورند.با این حال ، این نتایج پیش بینی شده اغلب به طور مستقیم در تجزیه و تحلیل آماری بعدی استفاده می شود ، نادیده گرفتن عدم دقت و ناهمگونی معرفی شده توسط روش پیش بینی.این احتمالاً منجر به یافته های مثبت کاذب و نتیجه گیری های علمی نامعتبر خواهد شد.در این کار ، ما یک روش استنباط پس از پیش بینی (POP-INF) فرضیه و داده های سازگار با داده را معرفی می کنیم که امکان استنباط معتبر و قدرتمند را بر اساس نتایج پیش بینی شده ML فراهم می کند.اموال “فرضیه فرضی” آن استنباط آماری قابل اعتماد و بدون فرضیات مربوط به پیش بینی ML را برای طیف گسترده ای از مقادیر آماری تضمین می کند.ویژگی “سازگار با داده” آن ، بدون در نظر گرفتن صحت پیش بینی ML ، بهره وری را نسبت به روشهای استنباط پس از پیش بینی موجود تضمین می کند.ما برتری و کاربرد روش خود را از طریق شبیه سازی ها و داده های ژنومی در مقیاس بزرگ نشان می دهیم.
| توجه کنید این مقاله به زبان انگلیسی است. |
|
برای سفارش ترجمه این مقاله می توانید به یکی از روش های تماس، پیامک، تلگرام و یا واتس اپ با شماره زیر تماس بگیرید:
09395106248 توجه کنید که شرایط ترجمه به صورت زیر است:
|


نقد و بررسیها
هنوز بررسیای ثبت نشده است.