| عنوان مقاله به انگلیسی | Deeploy: Enabling Energy-Efficient Deployment of Small Language Models On Heterogeneous Microcontrollers |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله Deeploy: فعال کردن استقرار کارآمد مدلهای زبان کوچک در میکروکنترلرهای ناهمگن |
| نویسندگان | Moritz Scherer, Luka Macan, Victor Jung, Philip Wiese, Luca Bompani, Alessio Burrello, Francesco Conti, Luca Benini |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 12 |
| دسته بندی موضوعات | Machine Learning,Hardware Architecture,یادگیری ماشین , معماری سخت افزار , |
| توضیحات | Submitted 8 August, 2024; originally announced August 2024. , Comments: Accepted for publication at ESWEEK – CASES 2024 |
| توضیحات به فارسی | ارسال شده در 8 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. ، نظرات: برای انتشار در Esweek پذیرفته شده – موارد 2024 |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
سفارش ترجمه فارسی مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، ترجمه فارسی مقاله را نیز سفارش میدهید.
قیمت: 480,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
With the rise of Embodied Foundation Models (EFMs), most notably Small Language Models (SLMs), adapting Transformers for edge applications has become a very active field of research. However, achieving end-to-end deployment of SLMs on microcontroller (MCU)-class chips without high-bandwidth off-chip main memory access is still an open challenge. In this paper, we demonstrate high-efficiency end-to-end SLM deployment on a multicore RISC-V (RV32) MCU augmented with ML instruction extensions and a hardware neural processing unit (NPU). To automate the exploration of the constrained, multi-dimensional memory vs. computation tradeoffs involved in aggressive SLM deployment on heterogeneous (multicore+NPU) resources, we introduce Deeploy, a novel Deep Neural Network (DNN) compiler, which generates highly-optimized C code requiring minimal runtime support. We demonstrate that Deeploy generates end-to-end code for executing SLMs, fully exploiting the RV32 cores’ instruction extensions and the NPU: We achieve leading-edge energy and throughput of SI{490}{microjoule per Token}, at SI{340}{Token per second} for an SLM trained on the TinyStories dataset, running for the first time on an MCU-class device without external memory.
چکیده به فارسی (ترجمه ماشینی)
با ظهور مدلهای بنیاد تجسم یافته (EFMS) ، مهمترین مدل های زبان کوچک (SLM) ، ترانسفورماتورها برای برنامه های Edge به یک زمینه تحقیق بسیار فعال تبدیل شده است.با این حال ، دستیابی به استقرار پایان به پایان از SLM ها بر روی تراشه های کلاس میکروکنترلر (MCU) بدون دسترسی به حافظه اصلی با باند بالا که دارای پهنای باند است ، هنوز یک چالش باز است.در این مقاله ، ما استقرار SLM با راندمان بالا را بر روی یک MCU MCU چندگانه RISC-V (RV32) با پسوندهای دستورالعمل ML و یک واحد پردازش عصبی سخت افزاری (NPU) نشان می دهیم.برای خودکار سازی اکتشاف حافظه محدود ، چند بعدی در مقابل تجارت محاسبات درگیر در استقرار SLM تهاجمی در منابع ناهمگن (چند هسته ای+NPU) ، ما Deeploy ، یک کامپایلر جدید شبکه عصبی عمیق (DNN) را معرفی می کنیم ، که تولید C بسیار بهینه ای استکد نیاز به حداقل پشتیبانی از زمان اجرا دارد.ما نشان می دهیم که Deeploy برای اجرای SLM ، کد پایان به انتها تولید می کند ، به طور کامل از پسوندهای دستورالعمل هسته RV32 و NPU استفاده می کند: ما به انرژی و توان پیشرو و توان Si {490} { micro joule per token} می رسیم.، در si {340} {token per second} برای SLM که در مجموعه داده های TinyStories آموزش داده شده است ، برای اولین بار در یک دستگاه کلاس MCU و بدون حافظه خارجی اجرا می شود.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.