| عنوان مقاله به انگلیسی | Lifelong Reinforcement Learning via Neuromodulation | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله یادگیری تقویت کننده مادام العمر از طریق عصبی | ||||||||
| نویسندگان | Sebastian Lee, Samuel Liebana Garcia, Claudia Clopath, Will Dabney | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 25 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Machine Learning,یادگیری ماشین , | ||||||||
| توضیحات | Submitted 15 August, 2024; originally announced August 2024. | ||||||||
| توضیحات به فارسی | ارسال شده در 15 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
Navigating multiple tasks$\unicode{x2014}$for instance in succession as in continual or lifelong learning, or in distributions as in meta or multi-task learning$\unicode{x2014}$requires some notion of adaptation. Evolution over timescales of millennia has imbued humans and other animals with highly effective adaptive learning and decision-making strategies. Central to these functions are so-called neuromodulatory systems. In this work we introduce an abstract framework for integrating theories and evidence from neuroscience and the cognitive sciences into the design of adaptive artificial reinforcement learning algorithms. We give a concrete instance of this framework built on literature surrounding the neuromodulators Acetylcholine (ACh) and Noradrenaline (NA), and empirically validate the effectiveness of the resulting adaptive algorithm in a non-stationary multi-armed bandit problem. We conclude with a theory-based experiment proposal providing an avenue to link our framework back to efforts in experimental neuroscience.
چکیده به فارسی (ترجمه ماشینی)
پیمایش چندین کار $ \ unicode {x2014} $ به عنوان مثال به صورت متوالی مانند یادگیری مداوم یا مادام العمر ، یا در توزیع هایی مانند یادگیری متا یا چند وظیفه $ \ unicode {x2014} $ نیاز به مفهوم سازگاری دارد.تکامل در بازه های زمانی هزاره ، انسان ها و حیوانات دیگر را با یادگیری تطبیقی بسیار مؤثر و استراتژی های تصمیم گیری تحت الشعاع قرار داده است.مهم در این توابع به اصطلاح سیستم های عصبی هستند.در این کار ما یک چارچوب انتزاعی برای ادغام نظریه ها و شواهد از علوم اعصاب و علوم شناختی در طراحی الگوریتم های یادگیری تقویت کننده مصنوعی تطبیقی معرفی می کنیم.ما یک نمونه بتونی از این چارچوب ساخته شده بر روی ادبیات پیرامون عصبی استیل کولین (ACH) و نورآدرنالین (NA) ارائه می دهیم و به صورت تجربی اثربخشی الگوریتم تطبیقی حاصل در یک مشکل باند چند مسلح غیر ثابت را تأیید می کنیم.ما با یک پیشنهاد آزمایش مبتنی بر تئوری نتیجه می گیریم که راهی را برای پیوند دادن چارچوب ما به تلاش در علوم اعصاب تجربی فراهم می کند.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.