| عنوان مقاله به انگلیسی | Information-Theoretic Progress Measures reveal Grokking is an Emergent Phase Transition | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله اقدامات پیشرفت-نظری اطلاعات نشان می دهد که Grokking یک انتقال فاز در حال ظهور است | ||||||||
| نویسندگان | Kenzo Clauw, Sebastiano Stramaglia, Daniele Marinazzo | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 8 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Machine Learning,Information Theory,یادگیری ماشین , تئوری اطلاعات , | ||||||||
| توضیحات | Submitted 16 August, 2024; originally announced August 2024. , Comments: ICML 2024 MI workshop | ||||||||
| توضیحات به فارسی | ارائه شده 16 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. ، نظرات: کارگاه ICML 2024 MI | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
This paper studies emergent phenomena in neural networks by focusing on grokking where models suddenly generalize after delayed memorization. To understand this phase transition, we utilize higher-order mutual information to analyze the collective behavior (synergy) and shared properties (redundancy) between neurons during training. We identify distinct phases before grokking allowing us to anticipate when it occurs. We attribute grokking to an emergent phase transition caused by the synergistic interactions between neurons as a whole. We show that weight decay and weight initialization can enhance the emergent phase.
چکیده به فارسی (ترجمه ماشینی)
در این مقاله پدیده های ظهور در شبکه های عصبی با تمرکز بر روی Grokking که در آن مدل ها به طور ناگهانی پس از تأخیر در حفظ کردن تعمیم می یابد ، بررسی می شود.برای درک این انتقال فاز ، ما از اطلاعات متقابل مرتبه بالاتر برای تجزیه و تحلیل رفتار جمعی (هم افزایی) و خصوصیات مشترک (افزونگی) بین نورون ها در طول آموزش استفاده می کنیم.ما فازهای متمایز را قبل از grokking شناسایی می کنیم و به ما امکان می دهد که چه موقع اتفاق بیفتد.ما Grokking را به یک انتقال فاز نوظهور ناشی از تعامل هم افزایی بین نورونها به طور کلی نسبت می دهیم.ما نشان می دهیم که پوسیدگی وزن و اولیه سازی وزن می تواند مرحله نوظهور را افزایش دهد.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.