| عنوان مقاله به انگلیسی | Building Decision Making Models Through Language Model Regime |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله ساخت مدلهای تصمیم گیری از طریق رژیم مدل زبان |
| نویسندگان | Yu Zhang, Haoxiang Liu, Feijun Jiang, Weihua Luo, Kaifu Zhang |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 11 |
| دسته بندی موضوعات | Computation and Language,Artificial Intelligence,Machine Learning,محاسبه و زبان , هوش مصنوعی , یادگیری ماشین , |
| توضیحات | Submitted 12 August, 2024; originally announced August 2024. |
| توضیحات به فارسی | ارائه شده 12 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
سفارش ترجمه فارسی مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، ترجمه فارسی مقاله را نیز سفارش میدهید.
قیمت: 440,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
We propose a novel approach for decision making problems leveraging the generalization capabilities of large language models (LLMs). Traditional methods such as expert systems, planning algorithms, and reinforcement learning often exhibit limited generalization, typically requiring the training of new models for each unique task. In contrast, LLMs demonstrate remarkable success in generalizing across varied language tasks, inspiring a new strategy for training decision making models. Our approach, referred to as “Learning then Using” (LTU), entails a two-stage process. Initially, the textit{learning} phase develops a robust foundational decision making model by integrating diverse knowledge from various domains and decision making contexts. The subsequent textit{using} phase refines this foundation model for specific decision making scenarios. Distinct from other studies that employ LLMs for decision making through supervised learning, our LTU method embraces a versatile training methodology that combines broad pre-training with targeted fine-tuning. Experiments in e-commerce domains such as advertising and search optimization have shown that LTU approach outperforms traditional supervised learning regimes in decision making capabilities and generalization. The LTU approach is the first practical training architecture for both single-step and multi-step decision making tasks combined with LLMs, which can be applied beyond game and robot domains. It provides a robust and adaptable framework for decision making, enhances the effectiveness and flexibility of various systems in tackling various challenges.
چکیده به فارسی (ترجمه ماشینی)
ما یک رویکرد جدید برای مشکلات تصمیم گیری در مورد استفاده از قابلیت های تعمیم مدل های بزرگ زبان (LLMS) پیشنهاد می کنیم.روشهای سنتی مانند سیستم های خبره ، الگوریتم های برنامه ریزی و یادگیری تقویت اغلب تعمیم محدودی را نشان می دهند ، به طور معمول نیاز به آموزش مدل های جدید برای هر کار منحصر به فرد دارند.در مقابل ، LLM ها موفقیت چشمگیری را در تعمیم در وظایف متنوع زبان نشان می دهند ، و الهام بخش یک استراتژی جدید برای آموزش مدلهای تصمیم گیری است.رویکرد ما ، که به عنوان “یادگیری و سپس استفاده از” (LTU) گفته می شود ، مستلزم یک فرآیند دو مرحله ای است.در ابتدا ، مرحله textit {Learning} با ادغام دانش متنوع از حوزه های مختلف و زمینه های تصمیم گیری ، یک مدل تصمیم گیری بنیادی قوی را توسعه می دهد.بعدی textit {با استفاده از فاز} این مدل پایه را برای سناریوهای تصمیم گیری خاص اصلاح می کند.متمایز از مطالعات دیگر که LLMS را برای تصمیم گیری از طریق یادگیری نظارت شده به کار می برد ، روش LTU ما یک روش آموزش همه کاره را در بر می گیرد که ترکیبی از پیش از ترساندن گسترده با تنظیم دقیق هدفمند است.آزمایشات در حوزه های تجارت الکترونیکی مانند تبلیغات و بهینه سازی جستجو نشان داده است که رویکرد LTU از رژیم های یادگیری نظارت شده سنتی در قابلیت های تصمیم گیری و تعمیم بهتر است.رویکرد LTU اولین معماری تمرین عملی برای هر دو وظیفه تصمیم گیری تک مرحله ای و چند مرحله ای همراه با LLMS است که می تواند فراتر از حوزه های بازی و ربات استفاده شود.این یک چارچوب قوی و سازگار برای تصمیم گیری فراهم می کند ، اثربخشی و انعطاف پذیری سیستم های مختلف را در مقابله با چالش های مختلف تقویت می کند.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.