| عنوان مقاله به انگلیسی | PENDRAM: Enabling High-Performance and Energy-Efficient Processing of Deep Neural Networks through a Generalized DRAM Data Mapping Policy |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله PENDRAM: فعال کردن پردازش با کارایی بالا و انرژی کارآمد شبکههای عصبی عمیق از طریق یک سیاست نگاشت داده DRAM تعمیمیافته |
| نویسندگان | Rachmad Vidya Wicaksana Putra, Muhammad Abdullah Hanif, Muhammad Shafique |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 11 |
| دسته بندی موضوعات | Hardware Architecture,Artificial Intelligence,Machine Learning,Neural and Evolutionary Computing,معماری سخت افزار , هوش مصنوعی , یادگیری ماشین , محاسبات عصبی و تکاملی , |
| توضیحات | Submitted 5 August, 2024; originally announced August 2024. , Comments: 11 pages, 15 figures, 2 tables. arXiv admin note: substantial text overlap with arXiv:2004.10341 |
| توضیحات به فارسی | ارسال شده در 5 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد ، نظرات: 11 صفحه ، 15 شکل ، 2 جدول.Arxiv Admin توجه: متن قابل توجهی با ARXIV همپوشانی دارد: 2004.10341 |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
سفارش ترجمه فارسی مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، ترجمه فارسی مقاله را نیز سفارش میدهید.
قیمت: 440,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
Convolutional Neural Networks (CNNs), a prominent type of Deep Neural Networks (DNNs), have emerged as a state-of-the-art solution for solving machine learning tasks. To improve the performance and energy efficiency of CNN inference, the employment of specialized hardware accelerators is prevalent. However, CNN accelerators still face performance- and energy-efficiency challenges due to high off-chip memory (DRAM) access latency and energy, which are especially crucial for latency- and energy-constrained embedded applications. Moreover, different DRAM architectures have different profiles of access latency and energy, thus making it challenging to optimize them for high performance and energy-efficient CNN accelerators. To address this, we present PENDRAM, a novel design space exploration methodology that enables high-performance and energy-efficient CNN acceleration through a generalized DRAM data mapping policy. Specifically, it explores the impact of different DRAM data mapping policies and DRAM architectures across different CNN partitioning and scheduling schemes on the DRAM access latency and energy, then identifies the pareto-optimal design choices. The experimental results show that our DRAM data mapping policy improves the energy-delay-product of DRAM accesses in the CNN accelerator over other mapping policies by up to 96%. In this manner, our PENDRAM methodology offers high-performance and energy-efficient CNN acceleration under any given DRAM architectures for diverse embedded AI applications.
چکیده به فارسی (ترجمه ماشینی)
شبکه های عصبی Convolutional (CNN) ، نوع برجسته ای از شبکه های عصبی عمیق (DNN) ، به عنوان یک راه حل پیشرفته برای حل کارهای یادگیری ماشین ظاهر شده اند.برای بهبود عملکرد و بهره وری انرژی استنتاج CNN ، اشتغال شتاب دهنده های تخصصی سخت افزاری شیوع دارد.با این حال ، شتاب دهنده های CNN به دلیل عدم دسترسی به حافظه خارج از تراشه (DRAM) با تاخیر و انرژی ، که به ویژه برای برنامه های تعبیه شده با تأخیر و انرژی بسیار مهم هستند ، هنوز با چالش های عملکرد و کارآیی انرژی روبرو هستند.علاوه بر این ، معماری های مختلف DRAM دارای پروفایل های متفاوتی از تأخیر و انرژی دسترسی هستند ، بنابراین بهینه سازی آنها برای عملکرد بالا و شتاب دهنده CNN با انرژی کارآمد ، چالش برانگیز است.برای پرداختن به این موضوع ، ما Pendram را ارائه می دهیم ، یک روش اکتشافی در فضای طراحی جدید که شتاب CNN با کارایی بالا و کارآمد را از طریق یک خط مشی نقشه برداری داده DRAM عمومی امکان پذیر می کند.به طور خاص ، به بررسی تأثیر سیاست های مختلف نقشه برداری داده های درام و معماری های درام در طرح های مختلف پارتیشن بندی و برنامه ریزی CNN در تأخیر و انرژی دسترسی DRAM می پردازد ، سپس گزینه های طراحی بهینه را مشخص می کند.نتایج تجربی نشان می دهد که سیاست نقشه برداری داده های DRAM ما ، محصول تأخیر انرژی دسترسی به DRAM را در شتاب دهنده CNN نسبت به سایر سیاستهای نقشه برداری تا 96 ٪ بهبود می بخشد.به این ترتیب ، روش Pendram ما شتاب CNN با کارایی بالا و کارآمد را تحت هر معماری DRAM داده شده برای برنامه های AI تعبیه شده متنوع ارائه می دهد.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.