| عنوان مقاله به انگلیسی | A Sub-Quadratic Time Algorithm for Robust Sparse Mean Estimation |
| عنوان مقاله به فارسی | مقاله یک الگوریتم زمان زیر درجه دوم برای برآورد میانگین پراکنده قوی |
| نویسندگان | Ankit Pensia |
| زبان مقاله | انگلیسی |
| فرمت مقاله: | |
| تعداد صفحات | 33 |
| دسته بندی موضوعات | Data Structures and Algorithms,Machine Learning,Statistics Theory,Machine Learning,ساختار داده ها و الگوریتم ها , یادگیری ماشین , تئوری آمار , یادگیری ماشین , |
| توضیحات | Submitted 7 March, 2024; originally announced March 2024. |
| توضیحات به فارسی | ارسال 7 مارس 2024 ؛در ابتدا مارس 2024 اعلام شد. |
چکیده
We study the algorithmic problem of sparse mean estimation in the presence of adversarial outliers. Specifically, the algorithm observes a \emph{corrupted} set of samples from $\mathcal{N}(μ,\mathbf{I}_d)$, where the unknown mean $μ\in \mathbb{R}^d$ is constrained to be $k$-sparse. A series of prior works has developed efficient algorithms for robust sparse mean estimation with sample complexity $\mathrm{poly}(k,\log d, 1/ε)$ and runtime $d^2 \mathrm{poly}(k,\log d,1/ε)$, where $ε$ is the fraction of contamination. In particular, the fastest runtime of existing algorithms is quadratic ($Ω(d^2)$), which can be prohibitive in high dimensions. This quadratic barrier in the runtime stems from the reliance of these algorithms on the sample covariance matrix, which is of size $d^2$. Our main contribution is an algorithm for robust sparse mean estimation which runs in \emph{subquadratic} time using $\mathrm{poly}(k,\log d,1/ε)$ samples. We also provide analogous results for robust sparse PCA. Our results build on algorithmic advances in detecting weak correlations, a generalized version of the light-bulb problem by Valiant.
چکیده به فارسی (ترجمه ماشینی)
ما مشکل الگوریتمی تخمین میانگین پراکنده را در حضور حیاط های مخالف بررسی می کنیم.به طور خاص ، الگوریتم مجموعه ای از نمونه ها را از $ \ mathcal {n} (μ ، \ mathbf {i} _d) $ مشاهده می کند ، جایی که میانگین ناشناخته $ μ \ در \ mathbb {r}^d $ است.محدود به $ k $-sparse.یک سری از آثار قبلی الگوریتم های کارآمد برای میانگین تخمین پراکنده با پیچیدگی نمونه $ \ Mathrm {Poly} (k ، \ log d ، 1/ε) $ و زمان اجرا $ d^2 \ mathrm {poly} (k ، \ \ توسعه داده است.log d ، 1/ε) $ ، جایی که $ ε $ کسری از آلودگی است.به طور خاص ، سریعترین زمان اجرای الگوریتم های موجود درجه دوم ($ Ω (d^2) $) است که می تواند در ابعاد بالا ممنوع باشد.این سد درجه دوم در زمان اجرا ناشی از اتکا به این الگوریتم ها بر روی ماتریس کواریانس نمونه است که از نظر اندازه $ d^2 $ است.سهم اصلی ما یک الگوریتم برای تخمین میانگین پراکنده است که در زمان \ amp {subquadratic} با استفاده از $ \ mathrm {poly} (k ، \ log d ، 1/ε) $ اجرا می شود.ما همچنین نتایج مشابهی را برای PCA پراکنده قوی ارائه می دهیم.نتایج ما بر روی پیشرفت های الگوریتمی در تشخیص همبستگی های ضعیف ، یک نسخه کلی از مشکل لامپ نور توسط Valiant ساخته شده است.
| توجه کنید این مقاله به زبان انگلیسی است. |
|
برای سفارش ترجمه این مقاله می توانید به یکی از روش های تماس، پیامک، تلگرام و یا واتس اپ با شماره زیر تماس بگیرید:
09395106248 توجه کنید که شرایط ترجمه به صورت زیر است:
|


نقد و بررسیها
هنوز بررسیای ثبت نشده است.