| عنوان مقاله به انگلیسی | A Metric Driven Approach to Mixed Precision Training |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله رویکردی مبتنی بر معیار برای آموزش با دقت ترکیبی |
| نویسندگان | Mitchelle Rasquinha, Gil Tabak |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 4 |
| دسته بندی موضوعات | Machine Learning,Artificial Intelligence,یادگیری ماشین , هوش مصنوعی , |
| توضیحات | Submitted 5 August, 2024; originally announced August 2024. |
| توضیحات به فارسی | ارسال شده در 5 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
سفارش ترجمه فارسی مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، ترجمه فارسی مقاله را نیز سفارش میدهید.
قیمت: 160,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
As deep learning methodologies have developed, it has been generally agreed that increasing neural network size improves model quality. However, this is at the expense of memory and compute requirements, which also need to be increased. Various efficiency techniques have been proposed to rein in hardware costs, one being the use of low precision numerics. Recent accelerators have introduced several different 8-bit data types to help accommodate DNNs in terms of numerics. In this paper, we identify a metric driven methodology to aid in the choice of numerics. We demonstrate how such a methodology can help scale training of a language representation model. The technique can be generalized to other model architectures.
چکیده به فارسی (ترجمه ماشینی)
با توسعه روشهای یادگیری عمیق ، به طور کلی توافق شده است که افزایش اندازه شبکه عصبی باعث بهبود کیفیت مدل می شود.با این حال ، این به هزینه حافظه و الزامات محاسباتی است که باید افزایش یابد.تکنیک های مختلف بهره وری برای تقویت هزینه های سخت افزاری ارائه شده است ، یکی استفاده از شماره های با دقت پایین.شتاب دهنده های اخیر چندین نوع داده 8 بیتی مختلف را برای کمک به اسکان DNN ها از نظر عددی معرفی کرده اند.در این مقاله ، ما یک روش محور متریک را برای کمک به انتخاب شماره ها شناسایی می کنیم.ما نشان می دهیم که چگونه چنین روشی می تواند به مقیاس آموزش یک مدل بازنمایی زبان کمک کند.این تکنیک را می توان به سایر معماری های مدل تعمیم داد.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |



نقد و بررسیها
هنوز بررسیای ثبت نشده است.