| عنوان مقاله به انگلیسی | CT Liver Segmentation via PVT-based Encoding and Refined Decoding |
| عنوان مقاله به فارسی | تقسیم بندی CT کبد از طریق رمزگذاری مبتنی بر PVT و رمزگشایی تصفیه شده |
| نویسندگان | Debesh Jha, Nikhil Kumar Tomar, Koushik Biswas, Gorkem Durak, Alpay Medetalibeyoglu, Matthew Antalek, Yury Velichko, Daniela Ladner, Amir Borhani, Ulas Bagci |
| زبان مقاله | انگلیسی |
| فرمت مقاله: | |
| چکیده | Accurate liver segmentation from CT scans is essential for computer-aided diagnosis and treatment planning. Recently, Vision Transformers achieved a competitive performance in computer vision tasks compared to convolutional neural networks due to their exceptional ability to learn global representations. However, they often struggle with scalability, memory constraints, and computational inefficiency, particularly in handling high-resolution medical images. To overcome scalability and efficiency issues, we propose a novel deep learning approach, \textit{\textbf{PVTFormer}}, that is built upon a pretrained pyramid vision transformer (PVT v2) combined with advanced residual upsampling and decoder block. By integrating a refined feature channel approach with hierarchical decoding strategy, PVTFormer generates high quality segmentation masks by enhancing semantic features. Rigorous evaluation of the proposed method on Liver Tumor Segmentation Benchmark (LiTS) 2017 demonstrates that our proposed architecture not only achieves a high dice coefficient of 86.78\%, mIoU of 78.46\%, but also obtains a low HD of 3.50. The results underscore PVTFormer’s efficacy in setting a new benchmark for state-of-the-art liver segmentation methods. The source code of the proposed PVTFormer is available at \url{https://github.com/DebeshJha/PVTFormer}. |
| تعداد صفحات | 6 |
| چکیده به فارسی (ترجمه ماشینی) | تقسیم دقیق کبد از اسکن CT برای تشخیص و برنامه ریزی درمانی به کمک رایانه ضروری است.به تازگی ، ترانسفورماتورهای بینایی به دلیل توانایی استثنایی خود در یادگیری بازنمایی های جهانی ، در مقایسه با شبکه های عصبی حلقوی عملکردی رقابتی در کارهای بینایی رایانه به دست آوردند.با این حال ، آنها اغلب با مقیاس پذیری ، محدودیت های حافظه و ناکارآمدی محاسباتی ، به ویژه در رسیدگی به تصاویر پزشکی با وضوح بالا مبارزه می کنند.برای غلبه بر مقیاس پذیری و کارآیی ، ما یک رویکرد یادگیری عمیق جدید ، \ textit {\ textbf {pvtformer}} را پیشنهاد می کنیم ، که بر روی ترانسفورماتور بینایی هرمی پیش ساخته (PVT V2) همراه با بلوک پیشرفته و رمزگشایی باقیمانده ساخته شده است.PvTformer با ادغام یک رویکرد کانال ویژگی تصفیه شده با استراتژی رمزگشایی سلسله مراتبی ، ماسک های تقسیم بندی با کیفیت بالا را با تقویت ویژگی های معنایی ایجاد می کند.ارزیابی دقیق روش پیشنهادی در معیار تقسیم تومور کبد (LITS) 2017 نشان می دهد که معماری پیشنهادی ما نه تنها به ضریب تاس بالا 86.78 \ ٪ ، MIOU از 78.46 \ ٪ دست می یابد ، بلکه HD کم 3.50 را نیز بدست می آورد.نتایج تأکید می کند که اثربخشی PvTformer در تعیین یک معیار جدید برای روشهای پیشرفته تقسیم کبد.کد منبع pvtformer پیشنهادی در \ url {https://github.com/debeshjha/pvtformer} در دسترس است. |
| دسته بندی موضوعات | Image and Video Processing,Computer Vision and Pattern Recognition,پردازش تصویر و ویدیو ، چشم انداز رایانه و تشخیص الگوی ، |
| توضیحات | Submitted 17 January, 2024; originally announced January 2024. |
| توضیحات به فارسی | ارسال شده 17 ژانویه 2024 ؛در ابتدا ژانویه 2024 اعلام شد. |
| توجه کنید این مقاله به زبان انگلیسی است. |
|
برای سفارش ترجمه این مقاله می توانید به یکی از روش های تماس، پیامک، تلگرام و یا واتس اپ با شماره زیر تماس بگیرید:
09395106248 توجه کنید که شرایط ترجمه به صورت زیر است:
|


نقد و بررسیها
هنوز بررسیای ثبت نشده است.