| عنوان مقاله به انگلیسی | Active Learning for Identifying Disaster-Related Tweets: A Comparison with Keyword Filtering and Generic Fine-Tuning | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله یادگیری فعال برای شناسایی توییتهای مرتبط با فاجعه: مقایسه با فیلتر کردن کلمات کلیدی و تنظیم دقیق عمومی | ||||||||
| نویسندگان | David Hanny, Sebastian Schmidt, Bernd Resch | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 18 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Computation and Language,Machine Learning,محاسبه و زبان , یادگیری ماشین , | ||||||||
| توضیحات | Submitted 19 August, 2024; originally announced August 2024. , Comments: Submitted for the Intelligent Systems Conference (IntelliSys 2024). The version of record of this contribution is published in the Springer series Lecture Notes in Networks and Systems, and is available online at https://doi.org/10.1007/978-3-031-66428-1_8. This preprint has not undergone peer review or any post-submission improvements or corrections. 13 pages, 2 figures , Journal ref: Intelligent Systems and Applications Vol. 2 (2024) 126-142 | ||||||||
| توضیحات به فارسی | ارسال شده در 19 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد ، نظرات: ارسال شده برای کنفرانس سیستم های هوشمند (Intellisys 2024).نسخه ضبط این سهم در یادداشت های سخنرانی سری Springer در شبکه ها و سیستم ها منتشر شده است و به صورت آنلاین در https://doi.org/10.1007/978-3-031-66428-1_8 در دسترس است.این preprint دستخوش بررسی همسالان یا اصلاحات یا اصلاحات پس از زیرمجموعه نشده است.13 صفحه ، 2 شکل ، ژورنال Ref: سیستم های هوشمند و برنامه های کاربردی جلد.2 (2024) 126-142 | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
Information from social media can provide essential information for emergency response during natural disasters in near real-time. However, it is difficult to identify the disaster-related posts among the large amounts of unstructured data available. Previous methods often use keyword filtering, topic modelling or classification-based techniques to identify such posts. Active Learning (AL) presents a promising sub-field of Machine Learning (ML) that has not been used much in the field of text classification of social media content. This study therefore investigates the potential of AL for identifying disaster-related Tweets. We compare a keyword filtering approach, a RoBERTa model fine-tuned with generic data from CrisisLex, a base RoBERTa model trained with AL and a fine-tuned RoBERTa model trained with AL regarding classification performance. For testing, data from CrisisLex and manually labelled data from the 2021 flood in Germany and the 2023 Chile forest fires were considered. The results show that generic fine-tuning combined with 10 rounds of AL outperformed all other approaches. Consequently, a broadly applicable model for the identification of disaster-related Tweets could be trained with very little labelling effort. The model can be applied to use cases beyond this study and provides a useful tool for further research in social media analysis.
چکیده به فارسی (ترجمه ماشینی)
اطلاعات مربوط به رسانه های اجتماعی می تواند اطلاعات اساسی را برای واکنش اضطراری در هنگام بلایای طبیعی در زمان واقعی نزدیک ارائه دهد.با این حال ، شناسایی پست های مربوط به فاجعه در بین مقدار زیادی از داده های بدون ساختار موجود دشوار است.روشهای قبلی اغلب از فیلتر کردن کلمات کلیدی ، مدل سازی موضوع یا تکنیک های مبتنی بر طبقه بندی برای شناسایی چنین پست هایی استفاده می کنند.Learning Active (AL) یک زیرزمین امیدوار کننده از یادگیری ماشین (ML) را ارائه می دهد که در زمینه طبقه بندی متن محتوای رسانه های اجتماعی مورد استفاده قرار نگرفته است.بنابراین این مطالعه به بررسی پتانسیل AL برای شناسایی توییت های مرتبط با فاجعه می پردازد.ما یک رویکرد فیلتر کلمه کلیدی را با هم مقایسه می کنیم ، یک مدل روبرتا با داده های عمومی از Crisislex ، یک مدل پایه روبرتا که با AL آموزش داده شده است و یک مدل روبرتا با تنظیم دقیق که با AL در رابطه با عملکرد طبقه بندی آموزش دیده است ، مقایسه می کنیم.برای آزمایش ، داده های حاصل از داده های Crisislex و به صورت دستی برچسب زده شده از سیل سال 2021 در آلمان و آتش سوزی های جنگلی 2023 شیلی در نظر گرفته شد.نتایج نشان می دهد که تنظیم دقیق عمومی همراه با 10 دور AL از همه رویکردهای دیگر بهتر است.در نتیجه ، یک مدل کاملاً قابل اجرا برای شناسایی توییت های مرتبط با فاجعه می تواند با تلاش بسیار کمی برچسب گذاری آموزش داده شود.این مدل را می توان برای استفاده از موارد فراتر از این مطالعه استفاده کرد و ابزاری مفید برای تحقیقات بیشتر در تجزیه و تحلیل رسانه های اجتماعی فراهم می کند.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.