ترجمه فارسی مقاله با استفاده از LLM های پیشرفته برای تقویت LLM های کوچکتر: یک رویکرد تقطیر دانش قابل تفسیر

1,440,000 تومان

دسته: مقاله علمی

توضیحات
نظرات (0)

عنوان مقاله به انگلیسی	Using Advanced LLMs to Enhance Smaller LLMs: An Interpretable Knowledge Distillation Approach
عنوان مقاله به فارسی	ترجمه فارسی مقاله با استفاده از LLM های پیشرفته برای تقویت LLM های کوچکتر: یک رویکرد تقطیر دانش قابل تفسیر
نویسندگان	Tong Wang, K. Sudhir, Dat Hong
فرمت مقاله انگلیسی	PDF
زبان مقاله تحویلی	ترجمه فارسی
فرمت مقاله ترجمه شده	به صورت فایل ورد
نحوه تحویل ترجمه	دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات	36
لینک دانلود رایگان مقاله انگلیسی	دانلود مقاله
دسته بندی موضوعات	Computation and Language,Artificial Intelligence,Machine Learning,محاسبه و زبان , هوش مصنوعی , یادگیری ماشین ,
توضیحات	Submitted 13 August, 2024; originally announced August 2024.
توضیحات به فارسی	ارسال شده در 13 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد.
اطلاعات بیشتر از این مقاله در پایگاه های علمی	INSPIRE HEP NASA ADS Google Scholar Semantic Scholar
فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

Advanced Large language models (LLMs) like GPT-4 or LlaMa 3 provide superior performance in complex human-like interactions. But they are costly, or too large for edge devices such as smartphones and harder to self-host, leading to security and privacy concerns. This paper introduces a novel interpretable knowledge distillation approach to enhance the performance of smaller, more economical LLMs that firms can self-host. We study this problem in the context of building a customer service agent aimed at achieving high customer satisfaction through goal-oriented dialogues. Unlike traditional knowledge distillation, where the “student” model learns directly from the “teacher” model’s responses via fine-tuning, our interpretable “strategy” teaching approach involves the teacher providing strategies to improve the student’s performance in various scenarios. This method alternates between a “scenario generation” step and a “strategies for improvement” step, creating a customized library of scenarios and optimized strategies for automated prompting. The method requires only black-box access to both student and teacher models; hence it can be used without manipulating model parameters. In our customer service application, the method improves performance, and the learned strategies are transferable to other LLMs and scenarios beyond the training set. The method’s interpretabilty helps safeguard against potential harms through human audit.

چکیده به فارسی (ترجمه ماشینی)

مدلهای پیشرفته زبان بزرگ (LLM) مانند GPT-4 یا LLAMA 3 عملکرد برتر در تعامل پیچیده مانند انسان را ارائه می دهند.اما آنها برای دستگاه های لبه مانند تلفن های هوشمند و سخت تر برای خودآگاهی سخت تر هستند و یا باعث ایجاد امنیت خود می شوند و منجر به نگرانی های مربوط به امنیت و حریم خصوصی می شوند.در این مقاله یک رویکرد تقطیر دانش قابل تفسیر جدید برای تقویت عملکرد LLM های کوچکتر و اقتصادی تر که شرکت ها می توانند خود میزبان باشند ، معرفی می کند.ما این مشکل را در زمینه ایجاد یک نماینده خدمات مشتری با هدف دستیابی به رضایت بالای مشتری از طریق دیالوگ های هدف گرا مطالعه می کنیم.بر خلاف تقطیر دانش سنتی ، جایی که مدل “دانش آموز” مستقیماً از پاسخ های مدل “معلم” از طریق تنظیم دقیق یاد می گیرد ، رویکرد تدریس “استراتژی” قابل تفسیر ما شامل ارائه راهکارهایی برای بهبود عملکرد دانش آموز در سناریوهای مختلف است.این روش بین یک مرحله “نسل سناریو” و یک مرحله “استراتژی برای بهبود” ، ایجاد یک کتابخانه سفارشی از سناریوها و استراتژی های بهینه شده برای فرایند خودکار متناوب است.این روش فقط به دسترسی به جعبه سیاه به مدل های دانش آموز و معلم نیاز دارد.از این رو می توان بدون دستکاری پارامترهای مدل استفاده کرد.در برنامه خدمات مشتری ما ، این روش عملکرد را بهبود می بخشد و استراتژی های آموخته شده به سایر LLM ها و سناریوهای فراتر از مجموعه آموزش قابل انتقال است.تفسیر این روش به محافظت در برابر مضرات احتمالی از طریق حسابرسی انسانی کمک می کند.

فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله با استفاده از LLM های پیشرفته برای تقویت LLM های کوچکتر: یک رویکرد تقطیر دانش قابل تفسیر”

ترجمه فارسی مقاله با استفاده از LLM های پیشرفته برای تقویت LLM های کوچکتر: یک رویکرد تقطیر دانش قابل تفسیر

چکیده

چکیده به فارسی (ترجمه ماشینی)

نقد و بررسی‌ها

محصولات مرتبط

مقاله ISAC با تگ های RFID پس پراکنش: طراحی پرتوهای متصل

مقاله تشخیص مبتنی بر نمودار سریع برای اطلاعات رنگ ابر نقطه ای

مقاله بهینه سازی راندمان ارتباط نوری قابل مشاهده از طریق ادغام NOMA-CSK مبتنی بر یادگیری تقویت شده

مقاله انتخاب پارامتر برای تجزیه و تحلیل مکالمات با اختلال طیف اوتیسم