| عنوان مقاله به انگلیسی | MedSyn: LLM-based Synthetic Medical Text Generation Framework |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله MedSyn: چارچوب تولید متن پزشکی مصنوعی مبتنی بر LLM |
| نویسندگان | Gleb Kumichev, Pavel Blinov, Yulia Kuzkina, Vasily Goncharov, Galina Zubkova, Nikolai Zenovkin, Aleksei Goncharov, Andrey Savchenko |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 16 |
| دسته بندی موضوعات | Computation and Language,Machine Learning,محاسبه و زبان , یادگیری ماشین , |
| توضیحات | Submitted 4 August, 2024; originally announced August 2024. , Comments: 16 pages, accepted to ECML PKDD 2024 |
| توضیحات به فارسی | ارسال شده در 4 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد ، نظرات: 16 صفحه ، پذیرفته شده در ECML PKDD 2024 |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
سفارش ترجمه فارسی مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، ترجمه فارسی مقاله را نیز سفارش میدهید.
قیمت: 640,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
Generating synthetic text addresses the challenge of data availability in privacy-sensitive domains such as healthcare. This study explores the applicability of synthetic data in real-world medical settings. We introduce MedSyn, a novel medical text generation framework that integrates large language models with a Medical Knowledge Graph (MKG). We use MKG to sample prior medical information for the prompt and generate synthetic clinical notes with GPT-4 and fine-tuned LLaMA models. We assess the benefit of synthetic data through application in the ICD code prediction task. Our research indicates that synthetic data can increase the classification accuracy of vital and challenging codes by up to 17.8% compared to settings without synthetic data. Furthermore, to provide new data for further research in the healthcare domain, we present the largest open-source synthetic dataset of clinical notes for the Russian language, comprising over 41k samples covering 219 ICD-10 codes.
چکیده به فارسی (ترجمه ماشینی)
تولید متن مصنوعی به چالش در دسترس بودن داده ها در حوزه های حساس به حریم خصوصی مانند مراقبت های بهداشتی می پردازد.این مطالعه به بررسی کاربرد داده های مصنوعی در تنظیمات پزشکی در دنیای واقعی می پردازد.ما Medsyn را معرفی می کنیم ، یک چارچوب جدید تولید متن پزشکی که مدل های بزرگ زبان را با نمودار دانش پزشکی (MKG) ادغام می کند.ما از MKG برای نمونه برداری از اطلاعات پزشکی قبلی برای سریع و تولید نت های بالینی مصنوعی با مدل های GPT-4 و مدل LLAMA تنظیم شده استفاده می کنیم.ما فواید داده های مصنوعی را از طریق کاربرد در کار پیش بینی کد ICD ارزیابی می کنیم.تحقیقات ما نشان می دهد که داده های مصنوعی می توانند در مقایسه با تنظیمات بدون داده های مصنوعی ، دقت طبقه بندی کدهای حیاتی و چالش برانگیز را تا 17.8 ٪ افزایش دهند.علاوه بر این ، برای ارائه داده های جدید برای تحقیقات بیشتر در حوزه مراقبت های بهداشتی ، ما بزرگترین مجموعه داده مصنوعی منبع باز از یادداشت های بالینی را برای زبان روسی ارائه می دهیم ، که شامل بیش از 41K نمونه شامل 219 کد ICD-10 است.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |



نقد و بررسیها
هنوز بررسیای ثبت نشده است.