| عنوان مقاله به انگلیسی | High Performance Im2win and Direct Convolutions using Three Tensor Layouts on SIMD Architectures |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله Im2win با کارایی بالا و کانولوشنهای مستقیم با استفاده از سه طرحبندی تنسوری روی معماریهای SIMD |
| نویسندگان | Xiang Fu, Xinpeng Zhang, Jixiang Ma, Peng Zhao, Shuai Lu, Xu T. Liu |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 10 |
| دسته بندی موضوعات | Machine Learning,Artificial Intelligence,Neural and Evolutionary Computing,یادگیری ماشین , هوش مصنوعی , محاسبات عصبی و تکاملی , |
| توضیحات | Submitted 1 August, 2024; originally announced August 2024. |
| توضیحات به فارسی | ارسال شده در 1 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
دانلود مقاله اصل انگلیسی + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 99,000 تومان
سفارش ترجمه فارسی مقاله + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی و ترجمه کامل آن، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 400,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
Convolution is the core component within deep neural networks and it is computationally intensive and time consuming. Tensor data layouts significantly impact convolution operations in terms of memory access and computational efficiency. Yet, there is still a lack of comprehensive performance characterization on data layouts on SIMD architectures concerning convolution methods. This paper proposes three novel data layouts for im2win convolution: NHWC, CHWN, and CHWN8, and introduces a set of general optimization techniques for both direct and im2win convolutions. We compare the optimized im2win convolution with the direct convolution and PyTorch’s im2col-based convolution across the aforementioned layouts on SIMD machines. The experiments demonstrated that the im2win convolution with the new NHWC layout achieved up to 355% performance speedup over NCHW layout. Our optimizations also significantly improve the performance of both im2win and direct convolutions. Our optimized im2win and direct convolutions achieved up to 95% and 94% of machine’s theoretical peak performance, respectively.
چکیده به فارسی (ترجمه ماشینی)
Convolution مؤلفه اصلی در شبکه های عصبی عمیق است و از نظر محاسباتی فشرده و وقت گیر است.طرح بندی داده های تانسور از نظر دسترسی به حافظه و راندمان محاسباتی به طور قابل توجهی بر عملیات حلقوی تأثیر می گذارد.با این حال ، هنوز عدم توصیف عملکرد جامع در چیدمان داده ها در معماری SIMD در مورد روشهای حلقوی وجود دارد.در این مقاله سه طرح جدید داده برای Convolution IM2Win ارائه شده است: NHWC ، CHWN و CHWN8 ، و مجموعه ای از تکنیک های بهینه سازی عمومی را برای هر دو پیچش مستقیم و IM2Win معرفی می کند.ما حل و فصل IM2Win بهینه شده را با همبستگی مستقیم و حلقوی مبتنی بر IM2COL Pytorch در سراسر طرح های فوق در دستگاه های SIMD مقایسه می کنیم.این آزمایشات نشان داد که نتیجه IM2Win با طرح جدید NHWC تا 355 ٪ سرعت عملکرد نسبت به طرح NCHW به دست آمده است.بهینه سازی های ما همچنین به طور قابل توجهی عملکرد هر دو IM2Win و Cancolutions Direct را بهبود می بخشد.Consolutions IM2WIN بهینه شده ما به ترتیب 95 ٪ و 94 ٪ از عملکرد اوج نظری دستگاه را به دست آورد.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.