“ترجمه فارسی مقاله پیش‌بینی کارآزمایی متقابل پاسخ درمانی به تحریک جریان مستقیم ترانس کرانیال در بیماران مبتلا به اختلال افسردگی اساسی” به سبد خرید شما اضافه شد. ادامه خرید

“مقاله فراتر از محیط های کنترل شده ارزیابی قابلیت انتقال مدل های ASROBUST NLU به کاربردهای دنیای واقعی” به سبد خرید شما اضافه شد. ادامه خرید

مقاله علمی

ترجمه فارسی مقاله افزایش ایمنی RL با استدلال خلاف واقع LLM

140,000 تومان

دسته: مقاله علمی

توضیحات
نظرات (0)

عنوان مقاله به انگلیسی	Enhancing RL Safety with Counterfactual LLM Reasoning
عنوان مقاله به فارسی	ترجمه فارسی مقاله افزایش ایمنی RL با استدلال خلاف واقع LLM
نویسندگان	Dennis Gross, Helge Spieker
فرمت مقاله انگلیسی	PDF
زبان مقاله تحویلی	ترجمه فارسی
فرمت مقاله ترجمه شده	به صورت فایل ورد
نحوه تحویل ترجمه	دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات	7
لینک دانلود رایگان مقاله انگلیسی	دانلود مقاله
دسته بندی موضوعات	Machine Learning,یادگیری ماشین ,
توضیحات	Submitted 16 September, 2024; originally announced September 2024.
توضیحات به فارسی	ارائه شده 16 سپتامبر 2024 ؛در ابتدا سپتامبر 2024 اعلام شد.
اطلاعات بیشتر از این مقاله در پایگاه های علمی	INSPIRE HEP NASA ADS Google Scholar Semantic Scholar
فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

Reinforcement learning (RL) policies may exhibit unsafe behavior and are hard to explain. We use counterfactual large language model reasoning to enhance RL policy safety post-training. We show that our approach improves and helps to explain the RL policy safety.

چکیده به فارسی (ترجمه ماشینی)

سیاست های یادگیری تقویت (RL) ممکن است رفتارهای ناامن را نشان دهد و توضیح آن دشوار است.ما از استدلال مدل زبان بزرگ ضد خلاف برای تقویت ایمنی سیاست RL پس از آموزش استفاده می کنیم.ما نشان می دهیم که رویکرد ما بهبود می یابد و به توضیح ایمنی سیاست RL کمک می کند.

فرمت ارائه ترجمه مقاله	تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله	بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه	بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها	کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله افزایش ایمنی RL با استدلال خلاف واقع LLM”

ترجمه فارسی مقاله افزایش ایمنی RL با استدلال خلاف واقع LLM

چکیده

چکیده به فارسی (ترجمه ماشینی)

نقد و بررسی‌ها

محصولات مرتبط

مقاله کاهش خاموشی از طریق RL با هدایت فیزیک

مقاله بهینه سازی راندمان ارتباط نوری قابل مشاهده از طریق ادغام NOMA-CSK مبتنی بر یادگیری تقویت شده

مقاله SymTC: یک شبکه ترانسفورماتور همزیستی-سی ان ان برای نمونه تقسیم بندی MRI ستون فقرات کمری

مقاله تقسیم‌بندی خودکار سه بعدی اولتراسوند چندوجهی جفت انسان با استفاده از استراتژی‌های فیوژن و یادگیری عمیق