| عنوان مقاله به انگلیسی | Be aware of overfitting by hyperparameter optimization! |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله از بیشبرازش با بهینهسازی فراپارامتری آگاه باشید! |
| نویسندگان | Igor V. Tetko, Ruud van Deursen, Guillaume Godin |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 19 |
| دسته بندی موضوعات | Machine Learning,Artificial Intelligence,یادگیری ماشین , هوش مصنوعی , |
| توضیحات | Submitted 30 July, 2024; originally announced July 2024. , Comments: 19 pages, 5 Tables |
| توضیحات به فارسی | ارسال شده 30 ژوئیه 2024 ؛در ابتدا ژوئیه 2024 اعلام شد ، نظرات: 19 صفحه ، 5 جدول |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
دانلود مقاله اصل انگلیسی + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 99,000 تومان
سفارش ترجمه فارسی مقاله + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی و ترجمه کامل آن، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 760,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
Hyperparameter optimization is very frequently employed in machine learning. However, an optimization of a large space of parameters could result in overfitting of models. In recent studies on solubility prediction the authors collected seven thermodynamic and kinetic solubility datasets from different data sources. They used state-of-the-art graph-based methods and compared models developed for each dataset using different data cleaning protocols and hyperparameter optimization. In our study we showed that hyperparameter optimization did not always result in better models, possibly due to overfitting when using the same statistical measures. Similar results could be calculated using pre-set hyperparameters, reducing the computational effort by around 10,000 times. We also extended the previous analysis by adding a representation learning method based on Natural Language Processing of smiles called Transformer CNN. We show that across all analyzed sets using exactly the same protocol, Transformer CNN provided better results than graph-based methods for 26 out of 28 pairwise comparisons by using only a tiny fraction of time as compared to other methods. Last but not least we stressed the importance of comparing calculation results using exactly the same statistical measures.
چکیده به فارسی (ترجمه ماشینی)
بهینه سازی HyperParameter بسیار اغلب در یادگیری ماشین استفاده می شود.با این حال ، بهینه سازی یک فضای بزرگ از پارامترها می تواند منجر به بیش از حد مدل ها شود.در مطالعات اخیر در مورد پیش بینی حلالیت ، نویسندگان هفت مجموعه داده حلالیت ترمودینامیکی و جنبشی را از منابع مختلف داده جمع آوری کردند.آنها از روشهای پیشرفته مبتنی بر نمودار استفاده کردند و مدلهای مقایسه شده برای هر مجموعه داده با استفاده از پروتکل های مختلف تمیز کردن داده ها و بهینه سازی هایپرپارامتر.در مطالعه ما نشان دادیم که بهینه سازی هایپرپارامتر همیشه منجر به مدل های بهتری نمی شود ، احتمالاً به دلیل استفاده بیش از حد هنگام استفاده از همان اقدامات آماری.نتایج مشابه را می توان با استفاده از هایپرپارامترهای از پیش تنظیم شده محاسبه کرد و تلاش محاسباتی را حدود 10،000 بار کاهش داد.ما همچنین با افزودن یک روش یادگیری بازنمایی بر اساس پردازش زبان طبیعی لبخند به نام ترانسفورماتور CNN ، تجزیه و تحلیل قبلی را گسترش دادیم.ما نشان می دهیم که در تمام مجموعه های مورد تجزیه و تحلیل با استفاده از دقیقاً همان پروتکل ، ترانسفورماتور CNN نتایج بهتری نسبت به روشهای مبتنی بر نمودار برای 26 از 28 مقایسه جفت با استفاده از تنها بخش کوچکی از زمان نسبت به سایر روش ها ارائه داد.آخر ، ما بر اهمیت مقایسه نتایج محاسبه با استفاده از دقیقاً همان اقدامات آماری تأکید کردیم.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.