| عنوان مقاله به انگلیسی | Can an unsupervised clustering algorithm reproduce a categorization system? | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله آیا یک الگوریتم خوشهبندی بدون نظارت میتواند یک سیستم طبقهبندی را بازتولید کند؟ | ||||||||
| نویسندگان | Nathalia Castellanos, Dhruv Desai, Sebastian Frank, Stefano Pasquali, Dhagash Mehta | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 9 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Machine Learning,Machine Learning,Statistical Finance,Applications,یادگیری ماشین , یادگیری ماشین , امور مالی آماری , برنامه ها , | ||||||||
| توضیحات | Submitted 19 August, 2024; originally announced August 2024. , Comments: 9 pages, 4 tables 28 figures | ||||||||
| توضیحات به فارسی | ارسال شده در 19 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد ، نظرات: 9 صفحه ، 4 جدول 28 شکل | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
Peer analysis is a critical component of investment management, often relying on expert-provided categorization systems. These systems’ consistency is questioned when they do not align with cohorts from unsupervised clustering algorithms optimized for various metrics. We investigate whether unsupervised clustering can reproduce ground truth classes in a labeled dataset, showing that success depends on feature selection and the chosen distance metric. Using toy datasets and fund categorization as real-world examples we demonstrate that accurately reproducing ground truth classes is challenging. We also highlight the limitations of standard clustering evaluation metrics in identifying the optimal number of clusters relative to the ground truth classes. We then show that if appropriate features are available in the dataset, and a proper distance metric is known (e.g., using a supervised Random Forest-based distance metric learning method), then an unsupervised clustering can indeed reproduce the ground truth classes as distinct clusters.
چکیده به فارسی (ترجمه ماشینی)
تجزیه و تحلیل همسالان یک مؤلفه مهم در مدیریت سرمایه گذاری است ، که اغلب به سیستم های طبقه بندی متخصص ارائه می شود.قوام این سیستم ها هنگامی مورد سؤال قرار می گیرد که آنها با گروه های الگوریتم های خوشه بندی بدون نظارت برای بهینه سازی شده برای معیارهای مختلف هماهنگ نباشند.ما بررسی می کنیم که آیا خوشه بندی بدون نظارت می تواند کلاسهای حقیقت زمینی را در یک مجموعه داده برچسب تولید کند ، نشان می دهد که موفقیت به انتخاب ویژگی و متریک فاصله انتخابی بستگی دارد.با استفاده از مجموعه داده های اسباب بازی و طبقه بندی صندوق به عنوان نمونه های دنیای واقعی ، نشان می دهیم که تولید مثل کلاسهای حقیقت زمینی به طور دقیق چالش برانگیز است.ما همچنین محدودیت های معیارهای ارزیابی خوشه بندی استاندارد را در شناسایی تعداد بهینه خوشه ها نسبت به کلاس های حقیقت زمین برجسته می کنیم.سپس ما نشان می دهیم که اگر ویژگی های مناسب در مجموعه داده ها در دسترس باشد ، و یک متریک از فاصله مناسب شناخته شده است (به عنوان مثال ، با استفاده از یک روش یادگیری متریک از راه دور مبتنی بر جنگل تصادفی) ، سپس یک خوشه بندی بدون نظارت می تواند در واقع بتواند کلاس های حقیقت زمین را به عنوان خوشه های مجزا بازتولید کند.بشر
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.