| عنوان مقاله به انگلیسی | W-RAG: Weakly Supervised Dense Retrieval in RAG for Open-domain Question Answering | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله یادگیری تقویتی مادام العمر از طریق نورومدولاسیون | ||||||||
| نویسندگان | Jinming Nian, Zhiyuan Peng, Qifan Wang, Yi Fang | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 10 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Computation and Language,Artificial Intelligence,Information Retrieval,Machine Learning,محاسبه و زبان , هوش مصنوعی , بازیابی اطلاعات , یادگیری ماشین , | ||||||||
| توضیحات | Submitted 15 August, 2024; originally announced August 2024. | ||||||||
| توضیحات به فارسی | ارسال شده در 15 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
In knowledge-intensive tasks such as open-domain question answering (OpenQA), Large Language Models (LLMs) often struggle to generate factual answers relying solely on their internal (parametric) knowledge. To address this limitation, Retrieval-Augmented Generation (RAG) systems enhance LLMs by retrieving relevant information from external sources, thereby positioning the retriever as a pivotal component. Although dense retrieval demonstrates state-of-the-art performance, its training poses challenges due to the scarcity of ground-truth evidence, largely attributed to the high costs of human annotation. In this paper, we propose W-RAG by utilizing the ranking capabilities of LLMs to create weakly labeled data for training dense retrievers. Specifically, we rerank the top-$K$ passages retrieved via BM25 by assessing the probability that LLMs will generate the correct answer based on the question and each passage. The highest-ranking passages are then used as positive training examples for dense retrieval. Our comprehensive experiments across four publicly available OpenQA datasets demonstrate that our approach enhances both retrieval and OpenQA performance compared to baseline models.
چکیده به فارسی (ترجمه ماشینی)
در وظایف فشرده دانش مانند پاسخ به سؤال دامنه باز (OpenQA) ، مدل های بزرگ زبان (LLMS) اغلب برای تولید پاسخ های واقعی با تکیه بر دانش داخلی (پارامتری) آنها تلاش می کنند.برای پرداختن به این محدودیت ، سیستم های تولیدی با اوج (RAG) با بازیابی اطلاعات مربوطه از منابع خارجی ، LLM ها را تقویت می کنند و از این طریق retriever را به عنوان یک مؤلفه محوری قرار می دهند.اگرچه بازیابی متراکم عملکرد پیشرفته را نشان می دهد ، اما آموزش آن به دلیل کمبود شواهد حقیقت زمین ، چالش هایی را ایجاد می کند ، اما تا حد زیادی به هزینه های بالای حاشیه نویسی انسانی نسبت داده می شود.در این مقاله ، ما W-RAG را با استفاده از قابلیت های رتبه بندی LLMS برای ایجاد داده های دارای برچسب ضعیف برای آموزش بازیابی متراکم پیشنهاد می کنیم.به طور خاص ، ما با ارزیابی احتمال اینکه LLMS پاسخ صحیح را بر اساس سؤال و هر قسمت از آن ایجاد کند ، از گذرگاه های $ $ $ $ بازیابی شده از طریق BM25 استفاده می کنیم.سپس از بالاترین سطح معابر به عنوان نمونه های آموزشی مثبت برای بازیابی متراکم استفاده می شود.آزمایش های جامع ما در چهار مجموعه داده OpenQA در دسترس عمومی نشان می دهد که رویکرد ما عملکرد بازیابی و OpenQA را در مقایسه با مدل های پایه افزایش می دهد.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.