| عنوان مقاله به انگلیسی | Current Topological and Machine Learning Applications for Bias Detection in Text |
| عنوان مقاله به فارسی | مقاله برنامه های جاری یادگیری ماشین و توپولوژیکی برای تشخیص سوگیری در متن |
| نویسندگان | Colleen Farrelly, Yashbir Singh, Quincy A. Hathaway, Gunnar Carlsson, Ashok Choudhary, Rahul Paul, Gianfranco Doretto, Yassine Himeur, Shadi Atalls, Wathiq Mansoor |
| زبان مقاله | انگلیسی |
| فرمت مقاله: | |
| تعداد صفحات | 0 |
| دسته بندی موضوعات | Computers and Society,Computation and Language,Machine Learning,رایانه و جامعه , محاسبات و زبان , یادگیری ماشین , |
| توضیحات | Submitted 22 November, 2023; originally announced November 2023. |
| توضیحات به فارسی | ارسال شده 22 نوامبر 2023 ؛در ابتدا نوامبر 2023 اعلام شد. |
چکیده
Institutional bias can impact patient outcomes, educational attainment, and legal system navigation. Written records often reflect bias, and once bias is identified; it is possible to refer individuals for training to reduce bias. Many machine learning tools exist to explore text data and create predictive models that can search written records to identify real-time bias. However, few previous studies investigate large language model embeddings and geometric models of biased text data to understand geometry’s impact on bias modeling accuracy. To overcome this issue, this study utilizes the RedditBias database to analyze textual biases. Four transformer models, including BERT and RoBERTa variants, were explored. Post-embedding, t-SNE allowed two-dimensional visualization of data. KNN classifiers differentiated bias types, with lower k-values proving more effective. Findings suggest BERT, particularly mini BERT, excels in bias classification, while multilingual models lag. The recommendation emphasizes refining monolingual models and exploring domain-specific biases.
چکیده به فارسی (ترجمه ماشینی)
تعصب نهادی می تواند بر نتایج بیمار ، دستیابی به تحصیلات و ناوبری سیستم حقوقی تأثیر بگذارد.سوابق مکتوب غالباً تعصب را منعکس می کنند ، و پس از شناسایی تعصب.برای کاهش تعصب ، می توان افراد را برای آموزش ارجاع داد.بسیاری از ابزارهای یادگیری ماشین برای کشف داده های متنی و ایجاد مدلهای پیش بینی کننده وجود دارند که می توانند سوابق کتبی را برای شناسایی تعصب در زمان واقعی جستجو کنند.با این حال ، چند مطالعه قبلی ، تعبیه مدل زبان بزرگ و مدل های هندسی داده های متن مغرضانه را بررسی می کند تا تأثیر هندسه را بر دقت مدل سازی تعصب درک کند.برای غلبه بر این مسئله ، این مطالعه از پایگاه داده Redditbias برای تجزیه و تحلیل تعصبات متنی استفاده می کند.چهار مدل ترانسفورماتور ، از جمله انواع برت و روبرتا ، مورد بررسی قرار گرفت.پس از تعبیه ، T-SNE اجازه تجسم دو بعدی داده ها را می دهد.طبقه بندی کننده های KNN انواع تعصب متفاوت ، با مقادیر K پایین تر مؤثرتر هستند.یافته ها حاکی از آن است که برت ، به ویژه مینی برت ، در طبقه بندی تعصب برتری دارد ، در حالی که مدل های چند زبانه تاخیر می کنند.این توصیه بر پالایش مدلهای یک زبانه و کاوش در تعصبات خاص دامنه تأکید دارد.
| توجه کنید این مقاله به زبان انگلیسی است. |
|
برای سفارش ترجمه این مقاله می توانید به یکی از روش های تماس، پیامک، تلگرام و یا واتس اپ با شماره زیر تماس بگیرید:
09395106248 توجه کنید که شرایط ترجمه به صورت زیر است:
|


نقد و بررسیها
هنوز بررسیای ثبت نشده است.