| عنوان مقاله به انگلیسی | Kernel Density Estimators in Large Dimensions |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله تخمینگرهای چگالی هسته در ابعاد بزرگ |
| نویسندگان | Giulio Biroli, Marc Mézard |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 24 |
| دسته بندی موضوعات | Machine Learning,Disordered Systems and Neural Networks,Statistics Theory,Machine Learning,یادگیری ماشین , سیستم های بی نظمی و شبکه های عصبی , تئوری آمار , یادگیری ماشین , |
| توضیحات | Submitted 16 August, 2024; v1 submitted 11 August, 2024; originally announced August 2024. |
| توضیحات به فارسی | ارائه شده 16 اوت 2024 ؛V1 ارسال شده 11 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
سفارش ترجمه فارسی مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، ترجمه فارسی مقاله را نیز سفارش میدهید.
قیمت: 960,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
This paper studies Kernel density estimation for a high-dimensional distribution $ρ(x)$. Traditional approaches have focused on the limit of large number of data points $n$ and fixed dimension $d$. We analyze instead the regime where both the number $n$ of data points $y_i$ and their dimensionality $d$ grow with a fixed ratio $α=(log n)/d$. Our study reveals three distinct statistical regimes for the kernel-based estimate of the density $hat ρ_h^{mathcal {D}}(x)=frac{1}{n h^d}sum_{i=1}^n Kleft(frac{x-y_i}{h}right)$, depending on the bandwidth $h$: a classical regime for large bandwidth where the Central Limit Theorem (CLT) holds, which is akin to the one found in traditional approaches. Below a certain value of the bandwidth, $h_{CLT}(α)$, we find that the CLT breaks down. The statistics of $hat ρ_h^{mathcal {D}}(x)$ for a fixed $x$ drawn from $ρ(x)$ is given by a heavy-tailed distribution (an alpha-stable distribution). In particular below a value $h_G(α)$, we find that $hat ρ_h^{mathcal {D}}(x)$ is governed by extreme value statistics: only a few points in the database matter and give the dominant contribution to the density estimator. We provide a detailed analysis for high-dimensional multivariate Gaussian data. We show that the optimal bandwidth threshold based on Kullback-Leibler divergence lies in the new statistical regime identified in this paper. Our findings reveal limitations of classical approaches, show the relevance of these new statistical regimes, and offer new insights for Kernel density estimation in high-dimensional settings.
چکیده به فارسی (ترجمه ماشینی)
در این مقاله برآورد چگالی هسته برای توزیع با ابعاد بالا $ ρ (x) $ بررسی شده است.رویکردهای سنتی بر حد تعداد زیادی از نقاط داده $ n $ و ابعاد ثابت $ d $ متمرکز شده است.ما در عوض رژیم را تجزیه و تحلیل می کنیم که در آن هر دو شماره $ n از نقاط داده $ y_i $ و ابعاد آنها $ d $ با نسبت ثابت $ α = ( log n)/d $ رشد می کند.مطالعه ما سه رژیم آماری مجزا را برای برآورد مبتنی بر هسته از چگالی $ hat ρ_h^{ mathcal {d}} (x) = frac {1 {n h^d} sum_ {i = 1}^نشان می دهد.n k سمت چپ ( frac {x-y_i} {h} راست) $ ، بسته به پهنای باند $ h $: یک رژیم کلاسیک برای پهنای باند بزرگ که در آن قضیه حد اصلی (CLT) وجود دارد ، که شبیه به یکی استدر رویکردهای سنتی یافت می شود.در زیر مقدار مشخصی از پهنای باند ، $ h_ {clt} (α) $ ، می فهمیم که CLT تجزیه می شود.آمار $ hat ρ_h^{ mathcal {d}} (x) $ برای یک $ $ ثابت ثابت شده از $ ρ (x) $ توسط یک توزیع با دم سنگین (توزیع قابل تحمل آلفا) داده می شود.به ویژه در زیر مقدار $ H_G (α) $ ، ما می دانیم که $ hat ρ_h^{ Mathcal {D}}} (x) $ توسط آمار ارزش شدید اداره می شود: فقط چند نکته در موضوع پایگاه داده و غالب را ارائه می دهدسهم در برآوردگر چگالی.ما یک تجزیه و تحلیل دقیق برای داده های چند متغیره گاوسی با ابعاد بالا ارائه می دهیم.ما نشان می دهیم که آستانه پهنای باند بهینه بر اساس واگرایی Kullback-Leibler در رژیم جدید آماری که در این مقاله مشخص شده است نهفته است.یافته های ما محدودیت های رویکردهای کلاسیک را نشان می دهد ، ارتباط این رژیم های جدید آماری را نشان می دهد و بینش جدیدی را برای برآورد چگالی هسته در تنظیمات با ابعاد بالا ارائه می دهد.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.