Off-Policy Reinforcement Learning
نمایش همه 2 نتیجهمرتبسازی بر اساس جدیدترین
-
بهینهسازی یادگیری تقویتی برای تنظیم دقیق مدلهای زبانی بزرگ
کتاب فشردهسازی اسفنج خیس: تنظیم دقیق مدلهای زبانی بزرگ با یادگیری تقویتی خارج از خطمشی و کاهش چشمگیر هزینه محاسباتی
249,950 تومان افزودن به سبد خرید

