,

مقاله نوسانات وزن در شبکه های عصبی (عمیق) خطی و مشتق رابطه یکنواخت و واریانس معکوس

10,000 تومان

عنوان مقاله به انگلیسی Weight fluctuations in (deep) linear neural networks and a derivation of the inverse-variance flatness relation
عنوان مقاله به فارسی مقاله نوسانات وزن در شبکه های عصبی (عمیق) خطی و مشتق رابطه یکنواخت و واریانس معکوس
نویسندگان Markus Gross, Arne P. Raulf, Christoph Räth
زبان مقاله انگلیسی
فرمت مقاله: PDF
تعداد صفحات 0
دسته بندی موضوعات Machine Learning,Disordered Systems and Neural Networks,Statistical Mechanics,یادگیری ماشین , سیستم های بی نظم و شبکه های عصبی , مکانیک آماری ,
توضیحات Submitted 23 November, 2023; originally announced November 2023. , Comments: 25 pages, 7 figures
توضیحات به فارسی ارسال شده 23 نوامبر 2023 ؛در ابتدا نوامبر 2023 اعلام شد ، نظرات: 25 صفحه ، 7 شکل

چکیده

We investigate the stationary (late-time) training regime of single- and two-layer linear neural networks within the continuum limit of stochastic gradient descent (SGD) for synthetic Gaussian data. In the case of a single-layer network in the weakly oversampled regime, the spectrum of the noise covariance matrix deviates notably from the Hessian, which can be attributed to the broken detailed balance of SGD dynamics. The weight fluctuations are in this case generally anisotropic, but experience an isotropic loss. For a two-layer network, we obtain the stochastic dynamics of the weights in each layer and analyze the associated stationary covariances. We identify the inter-layer coupling as a new source of anisotropy for the weight fluctuations. In contrast to the single-layer case, the weight fluctuations experience an anisotropic loss, the flatness of which is inversely related to the fluctuation variance. We thereby provide an analytical derivation of the recently observed inverse variance-flatness relation in a deep linear network model.

چکیده به فارسی (ترجمه ماشینی)

ما رژیم آموزشی ثابت (اواخر زمان) شبکه های عصبی یک لایه و دو لایه را در محدوده پیوسته نزول شیب تصادفی (SGD) برای داده های گاوسی مصنوعی بررسی می کنیم.در مورد یک شبکه تک لایه در رژیم ضعیف بیش از حد ، طیف ماتریس کواریانس نویز به ویژه از هسیان منحرف می شود ، که می تواند به تعادل تفصیلی شکسته پویایی SGD نسبت داده شود.نوسانات وزن در این حالت به طور کلی ناهمسانگرد است ، اما از دست دادن ایزوتروپیک را تجربه می کند.برای یک شبکه دو لایه ، ما پویایی تصادفی از وزنه ها را در هر لایه به دست می آوریم و کواریان های ثابت مرتبط را تجزیه و تحلیل می کنیم.ما اتصال بین لایه را به عنوان منبع جدیدی از ناهمسانگردی برای نوسانات وزن شناسایی می کنیم.بر خلاف مورد تک لایه ، نوسانات وزن از دست دادن ناهمسانگرد را تجربه می کند ، که صاف بودن آن به طور معکوس با واریانس نوسان مرتبط است.ما از این طریق یک مشتق تحلیلی از رابطه واریانس نقص معکوس اخیراً مشاهده شده در یک مدل شبکه خطی عمیق ارائه می دهیم.

توجه کنید این مقاله به زبان انگلیسی است.
برای سفارش ترجمه این مقاله می توانید به یکی از روش های تماس، پیامک، تلگرام و یا واتس اپ با شماره زیر تماس بگیرید:

09395106248

توجه کنید که شرایط ترجمه به صورت زیر است:
  • قیمت هر صفحه ترجمه در حال حاضر 40 هزار تومان می باشد.
  • تحویل مقاله ترجمه شده به صورت فایل ورد می باشد.
  • زمان تحویل ترجمه مقاله در صورت داشتن تعداد صفحات عادی بین 3 تا 5 روز خواهد بود.
  • کیفیت ترجمه بسیار بالا می باشد. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
  • کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “مقاله نوسانات وزن در شبکه های عصبی (عمیق) خطی و مشتق رابطه یکنواخت و واریانس معکوس”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا