MAPress

تگ: Reinforcement Learning from Human Feedback

بدون تصویر

مقاله تعمیم ضعیف به قوی: استخراج توانایی‌های قوی با نظارت ضعیف به همراه PDF فارسی + پادکست صوتی فارسی + ویدیو آموزشی فارسی

249,950 تومان

در صورت خرید اقساطی هر قسط: 62,488 تومان

بدون تصویر

مقاله سوگیری کلامی در برچسب‌زنی ترجیحات توسط مدل‌های زبانی بزرگ به همراه PDF فارسی + پادکست صوتی فارسی + ویدیو آموزشی فارسی

249,950 تومان

در صورت خرید اقساطی هر قسط: 62,488 تومان

بدون تصویر

مقاله پایدارسازی یادگیری تقویتی از طریق مدل امتیاز برتری و بازآموزی انتخابی به همراه PDF فارسی + پادکست صوتی فارسی + ویدیو آموزشی فارسی

249,950 تومان

در صورت خرید اقساطی هر قسط: 62,488 تومان