ترجمه فارسی مقاله مدل‌های زبان آموزشی در نمودار دانش: بینش‌هایی درباره توهمات و قابلیت تشخیص آنها

640,000 تومان

عنوان مقاله به انگلیسی Training Language Models on the Knowledge Graph: Insights on Hallucinations and Their Detectability
عنوان مقاله به فارسی ترجمه فارسی مقاله مدل‌های زبان آموزشی در نمودار دانش: بینش‌هایی درباره توهمات و قابلیت تشخیص آنها
نویسندگان Jiri Hron, Laura Culp, Gamaleldin Elsayed, Rosanne Liu, Ben Adlam, Maxwell Bileschi, Bernd Bohnet, JD Co-Reyes, Noah Fiedel, C. Daniel Freeman, Izzeddin Gur, Kathleen Kenealy, Jaehoon Lee, Peter J. Liu, Gaurav Mishra, Igor Mordatch, Azade Nova, Roman Novak, Aaron Parisi, Jeffrey Pennington, Alex Rizkowsky, Isabelle Simpson, Hanie Sedghi, Jascha Sohl-dickstein, Kevin Swersky
فرمت مقاله انگلیسی PDF
زبان مقاله تحویلی ترجمه فارسی
فرمت مقاله ترجمه شده به صورت فایل ورد
نحوه تحویل ترجمه دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات 16
لینک دانلود رایگان مقاله انگلیسی دانلود مقاله
دسته بندی موضوعات Computation and Language,Artificial Intelligence,Machine Learning,محاسبه و زبان , هوش مصنوعی , یادگیری ماشین ,
توضیحات Submitted 14 August, 2024; originally announced August 2024. , Comments: Published at COLM 2024. 16 pages, 11 figures
توضیحات به فارسی ارسال شده در 14 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. ، نظرات: منتشر شده در Colm 2024. 16 صفحه ، 11 رقم
اطلاعات بیشتر از این مقاله در پایگاه های علمی INSPIRE HEP

NASA ADS

Google Scholar

Semantic Scholar

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

While many capabilities of language models (LMs) improve with increased training budget, the influence of scale on hallucinations is not yet fully understood. Hallucinations come in many forms, and there is no universally accepted definition. We thus focus on studying only those hallucinations where a correct answer appears verbatim in the training set. To fully control the training data content, we construct a knowledge graph (KG)-based dataset, and use it to train a set of increasingly large LMs. We find that for a fixed dataset, larger and longer-trained LMs hallucinate less. However, hallucinating on $\leq5$% of the training data requires an order of magnitude larger model, and thus an order of magnitude more compute, than Hoffmann et al. (2022) reported was optimal. Given this costliness, we study how hallucination detectors depend on scale. While we see detector size improves performance on fixed LM’s outputs, we find an inverse relationship between the scale of the LM and the detectability of its hallucinations.

چکیده به فارسی (ترجمه ماشینی)

در حالی که بسیاری از قابلیت های مدل های زبان (LMS) با افزایش بودجه آموزش بهبود می یابند ، تأثیر مقیاس در توهم هنوز کاملاً درک نشده است.توهم به اشکال مختلفی ارائه می شود ، و هیچ تعریف جهانی پذیرفته نشده است.بنابراین ما فقط روی مطالعه آن دسته از توهمات تمرکز می کنیم که در آن یک پاسخ صحیح در مجموعه آموزش به صورت کلامی ظاهر می شود.برای کنترل کامل محتوای داده های آموزشی ، ما یک مجموعه داده مبتنی بر نمودار دانش (KG) را می سازیم و از آن برای آموزش مجموعه ای از LMS به طور فزاینده ای استفاده می کنیم.ما می دانیم که برای یک مجموعه داده ثابت ، LMS بزرگتر و طولانی تر توهم کمتر است.با این حال ، توهم در $ \ leq5 $ از داده های آموزش نیاز به یک مدل بزرگتر از مدل بزرگتر و در نتیجه یک ترتیب از بزرگی محاسبات بیشتر از هافمن و همکاران دارد.(2022) گزارش شده بهینه بود.با توجه به این هزینه ، ما مطالعه می کنیم که چگونه ردیاب های توهم به مقیاس بستگی دارند.در حالی که می بینیم که اندازه ردیاب عملکرد را در خروجی های LM ثابت بهبود می بخشد ، ما بین مقیاس LM و قابلیت تشخیص توهمات آن رابطه معکوس پیدا می کنیم.

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله مدل‌های زبان آموزشی در نمودار دانش: بینش‌هایی درباره توهمات و قابلیت تشخیص آنها”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا