| عنوان مقاله به انگلیسی | Leveraging Open-Source Large Language Models for Native Language Identification | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله استفاده از مدلهای زبان بزرگ منبع باز برای شناسایی زبان مادری | ||||||||
| نویسندگان | Yee Man Ng, Ilia Markov | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 9 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Computation and Language,محاسبه و زبان , | ||||||||
| توضیحات | Submitted 15 September, 2024; originally announced September 2024. | ||||||||
| توضیحات به فارسی | ارسال شده در 15 سپتامبر 2024 ؛در ابتدا سپتامبر 2024 اعلام شد. | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
Native Language Identification (NLI) – the task of identifying the native language (L1) of a person based on their writing in the second language (L2) – has applications in forensics, marketing, and second language acquisition. Historically, conventional machine learning approaches that heavily rely on extensive feature engineering have outperformed transformer-based language models on this task. Recently, closed-source generative large language models (LLMs), e.g., GPT-4, have demonstrated remarkable performance on NLI in a zero-shot setting, including promising results in open-set classification. However, closed-source LLMs have many disadvantages, such as high costs and undisclosed nature of training data. This study explores the potential of using open-source LLMs for NLI. Our results indicate that open-source LLMs do not reach the accuracy levels of closed-source LLMs when used out-of-the-box. However, when fine-tuned on labeled training data, open-source LLMs can achieve performance comparable to that of commercial LLMs.
چکیده به فارسی (ترجمه ماشینی)
شناسایی زبان بومی (NLI) – وظیفه شناسایی زبان مادری (L1) شخص مبتنی بر نوشتن آنها به زبان دوم (L2) – دارای برنامه هایی در پزشکی قانونی ، بازاریابی و کسب زبان دوم است.از نظر تاریخی ، رویکردهای یادگیری ماشین معمولی که به شدت به مهندسی ویژگی های گسترده متکی هستند ، از مدل های زبان مبتنی بر ترانسفورماتور در این کار بهتر عمل کرده اند.به تازگی ، مدل های بزرگ زبان مولد منبع بسته (LLMS) ، به عنوان مثال ، GPT-4 ، عملکرد قابل توجهی را در NLI در یک تنظیم صفر نشان داده اند ، از جمله نتایج امیدوارکننده در طبقه بندی مجموعه باز.با این حال ، LLM های منبع بسته دارای معایب بسیاری هستند ، مانند هزینه های بالا و ماهیت ناشناخته داده های آموزش.این مطالعه به بررسی پتانسیل استفاده از LLM های منبع باز برای NLI می پردازد.نتایج ما نشان می دهد که LLM های منبع باز در هنگام استفاده از جعبه ، به سطح دقت LLM های منبع بسته نمی رسند.با این حال ، هنگامی که بر روی داده های آموزشی برچسب خورده ، LLM های منبع باز می توانند به عملکرد قابل مقایسه با LLM های تجاری دست یابند.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.