| عنوان مقاله به انگلیسی | OPDR: Order-Preserving Dimension Reduction for Semantic Embedding of Multimodal Scientific Data | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله OPDR: کاهش ابعاد حفظ نظم برای جاسازی معنایی داده های علمی چندوجهی | ||||||||
| نویسندگان | Chengyu Gong, Gefei Shen, Luanzheng Guo, Nathan Tallent, Dongfang Zhao | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 9 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Machine Learning,Artificial Intelligence,Information Retrieval,یادگیری ماشین , هوش مصنوعی , بازیابی اطلاعات , | ||||||||
| توضیحات | Submitted 15 August, 2024; originally announced August 2024. | ||||||||
| توضیحات به فارسی | ارسال شده در 15 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
One of the most common operations in multimodal scientific data management is searching for the $k$ most similar items (or, $k$-nearest neighbors, KNN) from the database after being provided a new item. Although recent advances of multimodal machine learning models offer a \textit{semantic} index, the so-called \textit{embedding vectors} mapped from the original multimodal data, the dimension of the resulting embedding vectors are usually on the order of hundreds or a thousand, which are impractically high for time-sensitive scientific applications. This work proposes to reduce the dimensionality of the output embedding vectors such that the set of top-$k$ nearest neighbors do not change in the lower-dimensional space, namely Order-Preserving Dimension Reduction (OPDR). In order to develop such an OPDR method, our central hypothesis is that by analyzing the intrinsic relationship among key parameters during the dimension-reduction map, a quantitative function may be constructed to reveal the correlation between the target (lower) dimensionality and other variables. To demonstrate the hypothesis, this paper first defines a formal measure function to quantify the KNN similarity for a specific vector, then extends the measure into an aggregate accuracy of the global metric spaces, and finally derives a closed-form function between the target (lower) dimensionality and other variables. We incorporate the closed-function into popular dimension-reduction methods, various distance metrics, and embedding models.
چکیده به فارسی (ترجمه ماشینی)
یکی از متداول ترین عملیات در مدیریت داده های علمی چند حالته ، در جستجوی موارد مشابه $ $ (یا ، $ $ $-همسایگان ، KNN) از پایگاه داده پس از تهیه کالای جدید است.اگرچه پیشرفت های اخیر مدل های یادگیری ماشین چند حالته یک فهرست \ textit {معنایی} را ارائه می دهد ، به اصطلاح \ textit {بردارهای جاسازی شده} نقشه برداری از داده های چندمودال اصلی ، ابعاد بردارهای تعبیه شده حاصل معمولاً به ترتیب صدها یا یک است.هزار ، که برای کاربردهای علمی حساس به زمان بسیار زیاد هستند.این کار پیشنهاد می کند تا ابعاد بردارهای تعبیه شده خروجی را کاهش دهد به گونه ای که مجموعه ای از نزدیکان $ $ $ $ در فضای پایین تر ، یعنی کاهش ابعاد حفظ سفارش (OPDR) تغییر نمی کند.به منظور توسعه چنین روش OPDR ، فرضیه اصلی ما این است که با تجزیه و تحلیل رابطه ذاتی بین پارامترهای کلیدی در طول نقشه کاهش ابعاد ، یک عملکرد کمی ممکن است ساخته شود تا همبستگی بین ابعاد هدف (پایین) و سایر متغیرها را نشان دهد.برای نشان دادن فرضیه ، این مقاله ابتدا یک تابع اندازه گیری رسمی را برای تعیین اندازه گیری شباهت KNN برای یک بردار خاص تعریف می کند ، سپس این اندازه گیری را به یک دقت کل از فضاهای متریک جهانی گسترش می دهد ، و در نهایت یک عملکرد بسته بین هدف را به دست می آورد (پایین تر) ابعاد و متغیرهای دیگر.ما عملکرد بسته را در روشهای کاهش ابعاد محبوب ، معیارهای مختلف از راه دور و مدل های جاسازی قرار می دهیم.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.