| عنوان مقاله به انگلیسی | Robust spectral clustering with rank statistics | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله خوشه بندی طیفی قوی با آمار رتبه | ||||||||
| نویسندگان | Joshua Cape, Xianshi Yu, Jonquil Z. Liao | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 82 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Machine Learning,Machine Learning,Statistics Theory,Methodology,یادگیری ماشین , یادگیری ماشین , نظریه آمار , روش شناسی , | ||||||||
| توضیحات | Submitted 19 August, 2024; originally announced August 2024. , Comments: 82 pages, 8 figures, 1 table , MSC Class: 62H12; 62H30; 62G35 | ||||||||
| توضیحات به فارسی | ارسال شده در 19 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد ، نظرات: 82 صفحه ، 8 شکل ، 1 جدول ، کلاس MSC: 62H12 ؛62H30 ؛62G35 | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
This paper analyzes the statistical performance of a robust spectral clustering method for latent structure recovery in noisy data matrices. We consider eigenvector-based clustering applied to a matrix of nonparametric rank statistics that is derived entrywise from the raw, original data matrix. This approach is robust in the sense that, unlike traditional spectral clustering procedures, it can provably recover population-level latent block structure even when the observed data matrix includes heavy-tailed entries and has a heterogeneous variance profile. Our main theoretical contributions are threefold and hold under flexible data generating conditions. First, we establish that robust spectral clustering with rank statistics can consistently recover latent block structure, viewed as communities of nodes in a graph, in the sense that unobserved community memberships for all but a vanishing fraction of nodes are correctly recovered with high probability when the data matrix is large. Second, we refine the former result and further establish that, under certain conditions, the community membership of any individual, specified node of interest can be asymptotically exactly recovered with probability tending to one in the large-data limit. Third, we establish asymptotic normality results associated with the truncated eigenstructure of matrices whose entries are rank statistics, made possible by synthesizing contemporary entrywise matrix perturbation analysis with the classical nonparametric theory of so-called simple linear rank statistics. Collectively, these results demonstrate the statistical utility of rank-based data transformations when paired with spectral techniques for dimensionality reduction. Additionally, for a dataset of human connectomes, our approach yields parsimonious dimensionality reduction and improved recovery of ground-truth neuroanatomical cluster structure.
چکیده به فارسی (ترجمه ماشینی)
در این مقاله ، عملکرد آماری یک روش خوشه بندی طیفی قوی برای بازیابی ساختار نهان در ماتریس داده های پر سر و صدا تجزیه و تحلیل شده است.ما خوشه بندی مبتنی بر eigenveector را که به یک ماتریس از آمار رتبه غیر پارامتری اعمال می شود ، در نظر می گیریم که از ماتریس داده خام و اصلی به دست می آید.این رویکرد به این معنا قوی است که برخلاف روشهای سنتی خوشه بندی طیفی ، می تواند ساختار بلوک نهفته در سطح جمعیت را به طور واقعی بازیابی کند ، حتی اگر ماتریس داده مشاهده شده شامل ورودی های سنگین باشد و دارای مشخصات واریانس ناهمگن باشد.مشارکتهای اصلی نظری ما سه برابر است و تحت شرایط تولید داده های انعطاف پذیر نگه داشته می شود.اول ، ما ثابت می کنیم که خوشه بندی طیفی قوی با آمار رتبه می تواند به طور مداوم ساختار بلوک نهفته را بازیابی کند ، که به عنوان جوامع گره ها در یک نمودار مشاهده می شود ، به این معنا که عضویت در جامعه بدون حمایت برای همه به جز یک بخش ناپدید شده از گره ها به درستی با احتمال زیاد هنگام بازیابی در هنگام بازیابی می شود.ماتریس داده بزرگ است.دوم ، ما نتیجه قبلی را اصلاح می کنیم و بیشتر تصریح می کنیم که ، در شرایط خاص ، عضویت در جامعه در هر فرد ، گره مورد علاقه می تواند بدون علامت دقیقاً با احتمال تمایل به یک نفر در حد داده های بزرگ بازیابی شود.سوم ، ما نتایج نرمال بودن مجانبی را در ارتباط با استریت کوتاه ماتریس که ورودی های آنها آمار رتبه بندی شده است ، ایجاد می کنیم ، که با ترکیب تجزیه و تحلیل آشفتگی ماتریس ورودی معاصر با تئوری غیر پارامتری کلاسیک آمار به اصطلاح رتبه بندی خطی ساده امکان پذیر است.در مجموع ، این نتایج نشان دهنده کاربرد آماری از تحولات داده های مبتنی بر رتبه است که با تکنیک های طیفی برای کاهش ابعاد جفت می شوند.علاوه بر این ، برای یک مجموعه داده از اتصالات انسانی ، رویکرد ما کاهش ابعاد پارسا را به دست می آورد و بهبودی بهبود ساختار خوشه نوروآناتومیکی با حقیقت زمین را بهبود می بخشد.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.