Name: مقاله بهینه سازی ترکیبی با انطباق سیاست با استفاده از جستجوی فضای پنهان
SKU: Express24-IXiz2vhm1
Price: 249950 IRR
Availability: InStock

عنوان مقاله به انگلیسی	Combinatorial Optimization with Policy Adaptation using Latent Space Search
عنوان مقاله به فارسی	مقاله بهینه سازی ترکیبی با سازگاری سیاست با استفاده از جستجوی فضای نهفته
نویسندگان	Felix Chalumeau, Shikha Surana, Clement Bonnet, Nathan Grinsztajn, Arnu Pretorius, Alexandre Laterre, Thomas D. Barrett
زبان مقاله	انگلیسی
فرمت مقاله:	PDF
تعداد صفحات	0
دسته بندی موضوعات	Machine Learning,Artificial Intelligence,یادگیری ماشین , هوش مصنوعی ,
توضیحات	Submitted 13 November, 2023; originally announced November 2023. , Comments: Accepted at Neurips 2023. Small updates in results reported
توضیحات به فارسی	ارسال شده در 13 نوامبر 2023 ؛در ابتدا نوامبر 2023 اعلام شد ، نظرات: در Neurips 2023 پذیرفته شده است. به روزرسانی های کوچک در نتایج گزارش شده

چکیده

Combinatorial Optimization underpins many real-world applications and yet, designing performant algorithms to solve these complex, typically NP-hard, problems remains a significant research challenge. Reinforcement Learning (RL) provides a versatile framework for designing heuristics across a broad spectrum of problem domains. However, despite notable progress, RL has not yet supplanted industrial solvers as the go-to solution. Current approaches emphasize pre-training heuristics that construct solutions but often rely on search procedures with limited variance, such as stochastically sampling numerous solutions from a single policy or employing computationally expensive fine-tuning of the policy on individual problem instances. Building on the intuition that performant search at inference time should be anticipated during pre-training, we propose COMPASS, a novel RL approach that parameterizes a distribution of diverse and specialized policies conditioned on a continuous latent space. We evaluate COMPASS across three canonical problems - Travelling Salesman, Capacitated Vehicle Routing, and Job-Shop Scheduling - and demonstrate that our search strategy (i) outperforms state-of-the-art approaches on 11 standard benchmarking tasks and (ii) generalizes better, surpassing all other approaches on a set of 18 procedurally transformed instance distributions.

چکیده به فارسی (ترجمه ماشینی)

بهینه سازی ترکیبی بسیاری از برنامه های دنیای واقعی و در عین حال ، طراحی الگوریتم های عملکردی برای حل این پیچیده ، به طور معمول NP ، مشکلات یک چالش تحقیقاتی مهم است.یادگیری تقویت (RL) یک چارچوب همه کاره برای طراحی اکتشافی در طیف گسترده ای از حوزه های مشکل فراهم می کند.با این حال ، علیرغم پیشرفت قابل توجه ، RL هنوز حل کننده های صنعتی را به عنوان راه حل رفتن به دست نیاورد.رویکردهای فعلی بر اکتشافات قبل از آموزش تأکید می کنند که راه حل ها را ایجاد می کنند اما اغلب به روشهای جستجو با واریانس محدود متکی هستند ، مانند نمونه گیری از راه حل های متعدد از یک سیاست واحد یا استفاده از تنظیم دقیق محاسباتی گران قیمت از خط مشی در موارد مشکل فردی.با تکیه بر شهودی که جستجوی عملکرد در زمان استنتاج باید در طول قبل از آموزش پیش بینی شود ، ما قطب نما را پیشنهاد می کنیم ، یک رویکرد جدید RL که پارامتر کردن توزیع سیاست های متنوع و تخصصی که در یک فضای نهفته مداوم است ، پارامتر می کند.ما قطب نما را در سه مشکل متعارف ارزیابی می کنیم-فروشنده مسافرتی ، مسیریابی وسیله نقلیه خازن و برنامه ریزی فروشگاه شغلی-و نشان می دهیم که استراتژی جستجوی ما (i) از رویکردهای پیشرفته در 11 کار معیار استاندارد و (ب) تعمیم بهتر است، از همه رویکردهای دیگر در مجموعه ای از 18 توزیع نمونه روال تبدیل شده.

📚 محتوای این محصول آموزشی (پکیج کامل)

علاوه بر مقاله اصلی انگلیسی که دریافت می کنید، برای یادگیری عمیق‌تر و تسلط کامل بر مباحث مجموعه‌ای از کتاب‌های آموزشی نیز ارائه می‌شود.

کتاب صدها نکته فارسی (خودمونی) – نسخه PDF — زبان ساده و کاربردی
مشاهده نمونه نسخه نکات ساده
کتاب صدها نکته رسمی فارسی – نسخه PDF — نگارش استاندارد و علمی
مشاهده نمونه نسخه نکات رسمی
کتاب صدها پرسش و پاسخ تشریحی – نسخه PDF
— هر سؤال همراه با پاسخ کامل برای درک عمیق مفاهیم
مشاهده نمونه نسخه پرسش و پاسخ
کتاب پرسش و پاسخ چهارگزینه‌ای – نسخه یادگیری سریع
— پاسخ‌ها بلافاصله بعد از سؤال برای مرور سریع
مشاهده نمونه نسخه کوییز سریع
کتاب پرسش و پاسخ چهارگزینه‌ای – نسخه خودآزمایی
— پاسخ‌ها در انتهای بخش‌ها برای سنجش واقعی یادگیری
مشاهده نمونه نسخه آزمونی

🎯 این بسته یک دورهٔ آموزشی کامل و چندلایه است؛ شامل ویدیوهای آموزشی، کتاب‌ها، تمرین‌ها و خودآزمایی.

ℹ️ نکات مهم هنگام خرید

این محصول به صورت فایل دانلودی کامل ارائه می‌شود.
توجه: لینک‌های اختصاصی دوره طی حداکثر 24 ساعت پس از ثبت سفارش ارسال می‌شوند.
دقت کنید لینک ها به شماره موبایل شما ارسال می شوند. پس در ارائه شماره موبایل صحیح دقت کنید.
برای راهنمایی در مورد نحوه دانلود به شماره 09395106248 پیامک دهید یا تماس بگیرید. (ایده آل ترین گزینه ارسال پیام در یکی از پیام رسان ها به همین شماره است تا سریعا لینک های محصول همان جا برای شما ارسال گردد.)
اگر پرداخت انجام شده ولی بعد از 24 ساعت هنوز لینک‌ها را دریافت نکرده‌اید، نام و نام خانوادگی و نام محصول را پیامک کنید تا لینک‌ها دوباره ارسال شوند.

💬 راه‌های ارتباطی پشتیبانی:
واتس‌اپ یا هر پیام رسان داخلی یا پیامک: 09395106248
تلگرام: @ma_limbs

مقاله بهینه سازی ترکیبی با انطباق سیاست با استفاده از جستجوی فضای پنهان

انتخاب پلن

چکیده

چکیده به فارسی (ترجمه ماشینی)

📚 محتوای این محصول آموزشی (پکیج کامل)

ℹ️ نکات مهم هنگام خرید

نظرات