| عنوان مقاله به انگلیسی | Developing PUGG for Polish: A Modern Approach to KBQA, MRC, and IR Dataset Construction |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله توسعه PUGG برای لهستانی: رویکردی مدرن برای ساخت مجموعه دادههای KBQA، MRC و IR |
| نویسندگان | Albert Sawczyn, Katsiaryna Viarenich, Konrad Wojtasik, Aleksandra Domogała, Marcin Oleksy, Maciej Piasecki, Tomasz Kajdanowicz |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 19 |
| دسته بندی موضوعات | Artificial Intelligence,Computation and Language,Machine Learning,هوش مصنوعی , محاسبات و زبان , یادگیری ماشین , |
| توضیحات | Submitted 5 August, 2024; originally announced August 2024. , Comments: Accepted for ACL 2024 (findings) |
| توضیحات به فارسی | ارسال شده در 5 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد ، نظرات: برای ACL 2024 پذیرفته شده است (یافته ها) |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
سفارش ترجمه فارسی مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، ترجمه فارسی مقاله را نیز سفارش میدهید.
قیمت: 760,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
Advancements in AI and natural language processing have revolutionized machine-human language interactions, with question answering (QA) systems playing a pivotal role. The knowledge base question answering (KBQA) task, utilizing structured knowledge graphs (KG), allows for handling extensive knowledge-intensive questions. However, a significant gap exists in KBQA datasets, especially for low-resource languages. Many existing construction pipelines for these datasets are outdated and inefficient in human labor, and modern assisting tools like Large Language Models (LLM) are not utilized to reduce the workload. To address this, we have designed and implemented a modern, semi-automated approach for creating datasets, encompassing tasks such as KBQA, Machine Reading Comprehension (MRC), and Information Retrieval (IR), tailored explicitly for low-resource environments. We executed this pipeline and introduced the PUGG dataset, the first Polish KBQA dataset, and novel datasets for MRC and IR. Additionally, we provide a comprehensive implementation, insightful findings, detailed statistics, and evaluation of baseline models.
چکیده به فارسی (ترجمه ماشینی)
پیشرفت در هوش مصنوعی و پردازش زبان طبیعی باعث تحول در تعامل زبان انسان و انسان شده است که سیستم های پاسخ به سیستم (QA) نقش اساسی دارند.کار پاسخ به سؤال پایه دانش (KBQA) ، با استفاده از نمودارهای دانش ساخت یافته (کیلوگرم) ، امکان رسیدگی به سؤالات گسترده دانش را فراهم می کند.با این حال ، شکاف قابل توجهی در مجموعه داده های KBQA ، به ویژه برای زبانهای کم منبع وجود دارد.بسیاری از خطوط لوله ساخت و ساز موجود برای این مجموعه داده ها در کار انسانی منسوخ و ناکارآمد هستند و ابزارهای کمکی مدرن مانند مدل های بزرگ زبان (LLM) برای کاهش بار کار مورد استفاده قرار نمی گیرند.برای پرداختن به این موضوع ، ما یک رویکرد مدرن و نیمه اتوماتیک را برای ایجاد مجموعه داده ها ، شامل وظایفی مانند KBQA ، درک مطلب در دستگاه (MRC) و بازیابی اطلاعات (IR) طراحی و پیاده سازی کرده ایم ، به طور صریح برای محیط های کم منبع تغذیه شده است.ما این خط لوله را اجرا کردیم و مجموعه داده Pugg ، اولین مجموعه داده های لهستانی KBQA و مجموعه داده های جدید برای MRC و IR را معرفی کردیم.علاوه بر این ، ما یک اجرای جامع ، یافته های روشنگری ، آمار دقیق و ارزیابی مدل های پایه ارائه می دهیم.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.