| عنوان مقاله به انگلیسی | Cost-Effective Hallucination Detection for LLMs |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله تشخیص توهم مقرون به صرفه برای LLMS |
| نویسندگان | Simon Valentin, Jinmiao Fu, Gianluca Detommaso, Shaoyuan Xu, Giovanni Zappella, Bryan Wang |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 17 |
| دسته بندی موضوعات | Computation and Language,Artificial Intelligence,Machine Learning,Machine Learning,محاسبات و زبان , هوش مصنوعی , یادگیری ماشین , یادگیری ماشین , |
| توضیحات | Submitted 9 August, 2024; v1 submitted 31 July, 2024; originally announced July 2024. , Comments: Accepted to GenAI Evaluation Workshop at KDD 2024 |
| توضیحات به فارسی | ارسال شده در 9 اوت 2024 ؛V1 ارسال شده 31 ژوئیه 2024 ؛در ابتدا ژوئیه 2024 اعلام شد ، نظرات: پذیرفته شده در کارگاه ارزیابی Genai در KDD 2024 |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
دانلود مقاله اصل انگلیسی + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 99,000 تومان
سفارش ترجمه فارسی مقاله + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی و ترجمه کامل آن، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 680,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
Large language models (LLMs) can be prone to hallucinations – generating unreliable outputs that are unfaithful to their inputs, external facts or internally inconsistent. In this work, we address several challenges for post-hoc hallucination detection in production settings. Our pipeline for hallucination detection entails: first, producing a confidence score representing the likelihood that a generated answer is a hallucination; second, calibrating the score conditional on attributes of the inputs and candidate response; finally, performing detection by thresholding the calibrated score. We benchmark a variety of state-of-the-art scoring methods on different datasets, encompassing question answering, fact checking, and summarization tasks. We employ diverse LLMs to ensure a comprehensive assessment of performance. We show that calibrating individual scoring methods is critical for ensuring risk-aware downstream decision making. Based on findings that no individual score performs best in all situations, we propose a multi-scoring framework, which combines different scores and achieves top performance across all datasets. We further introduce cost-effective multi-scoring, which can match or even outperform more expensive detection methods, while significantly reducing computational overhead.
چکیده به فارسی (ترجمه ماشینی)
مدل های بزرگ زبان (LLMS) می توانند مستعد توهم باشند – تولید خروجی های غیرقابل اعتماد که بی دین برای ورودی های آنها ، حقایق خارجی یا از نظر داخلی متناقض است.در این کار ، ما برای تشخیص توهم پس از تعقیب در تنظیمات تولید ، به چالش های مختلفی پرداخته ایم.خط لوله ما برای تشخیص توهم مستلزم: اول ، تولید نمره اعتماد به نفس است که نشان دهنده احتمال اینکه یک پاسخ تولید شده توهم باشد.دوم ، کالیبراسیون نمره مشروط بر ویژگی های ورودی ها و پاسخ نامزد.سرانجام ، انجام تشخیص با آستانه نمره کالیبره شده.ما انواع روشهای پیشرفته و پیشرفته را در مجموعه داده های مختلف ، پاسخ دادن به سؤال شامل ، بررسی واقعیت و کارهای خلاصه معیار می کنیم.ما برای اطمینان از ارزیابی جامع از عملکرد ، از LLM های متنوع استفاده می کنیم.ما نشان می دهیم که کالیبراسیون روشهای امتیاز دهی فردی برای اطمینان از تصمیم گیری در پایین دست آگاهی از ریسک بسیار مهم است.بر اساس یافته ها که هیچ نمره ای در همه شرایط بهترین عملکرد را ندارد ، ما یک چارچوب چند امتیاز دهی را پیشنهاد می کنیم ، که نمرات مختلفی را ترکیب می کند و به عملکرد برتر در تمام مجموعه داده ها می رسد.ما در ادامه چند گلزنی مقرون به صرفه را معرفی می کنیم ، که می تواند با روش های تشخیص گران تر مطابقت داشته باشد یا حتی بهتر عمل کند ، در حالی که به طور قابل توجهی سربار محاسباتی را کاهش می دهد.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.