سالارزارعي

عنوان

بخش‌ بندي تصوير پزشكي با به‌ كارگيري شبكه عصبي كانولوشن U-Net

مقطع تحصيلي

كارشناسي ارشد

رشته تحصيلي

مهندسي برق سيستم هاي الكترونيك ديجيتال

سال تحصيل

1400

تاريخ دفاع

1404/7/26

استاد راهنما

دكتر علي صدر

استاد مشاور

دانشكده

برق

چكيده

در پردازش تصاوير پزشكي، دسترسي به مجموعه داده‌هاي باكيفيت و متنوع همواره يك چالش مهم محسوب مي‌شود، زيرا جمع‌آوري داده‌هاي گسترده اغلب دشوار و پرهزينه است. براي رفع اين مسئله، دانشمندان U-Net را پيشنهاد داده‌اند. مزيت بزرگ U-Net اين است كه با داده‌هاي آموزشي كمتر سروكار داريم اما نتايج دقيقي به‌دست مي‌آوريم. توسعه شبكه‌هاي عصبي كانولوشني عميق در بخش‌بندي تصوير، همواره با چالش حفظ توازن بين عمق مدل و كارايي محاسباتي روبه‌رو بوده‌است. يكي‌از دغدغه‌هاي كليدي دراين حوزه، دستيابي به لايه‌هاي عميق‌تر بدون افزايش نامتناسب هزينه‌هاي محاسباتي و درعين حال حفظ وضوح نقشه‌هاي ويژگي است. براي پاسخ به اين چالش، معماري U2-Net معرفي شد كه با بهره‌گيري از يك ساختار دو‌سطحي و تودرتو به‌شكل U، امكان آموزش يك شبكه عميق را از پايه و بدون نياز به وزن‌هاي اوليه‌ي پيش‌آموخته‌شده از وظايف طبقه‌بندي تصاوير فراهم مي‌كند. دراين پايان‌نامه با افزودن بلوك‌هاي تيزكننده به U2-Net ، يك كانولوشن عمقي از نقشه ويژگي رمزگذار با يك فيلتر هسته تيزكننده قبل از ادغام ويژگي‌هاي رمزگذار و رمزگشا استفاده مي‌شود و در نتيجه يك نقشه ويژگي واسطه تيزشده به‌همان اندازه نقشه رمزگذار توليد مي‌شود. با اين‌كار، قادربه ادغام ويژگي‌هاي متفاوت از لحاظ معنايي هستيم و از ايجاد نويزهاي اضافي در لايه‌هاي شبكه در مراحل اوليه آموزش جلوگيري مي‌كنيم، درحالي‌كه هيچ پارامتر قابل آموزشي اضافه نمي‌شود. در اين پايان‌نامه با تركيب مناسب مدل‌هاي U2-Net و Sharp U-Net ، آزمايش‌هايي بر روي دو مجموعه داده Lung Segmentation وISIC-2018 انجام مي‌شود. اين ارزيابي‌ها نشان مي‌دهد كه مدل‌هاي پيشنهادي در مقايسه با مدل‌هاي پيشرفته اخير عملكرد بهتري در وظايف بخش‌بندي تصوير پزشكي دارد به‌طوري‌كه مدل Sharp U2-Net+ در مجموعه‌داده Lung Segmentation، به ترتيب بهبود 0.91 درصدي در ضريب Dice و 1.84 درصدي در شاخص IoU و همچنين در مجموعه‌داده ISIC-2018 ، بهبود 3.44 درصدي در ضريب Dice و 2.82 درصدي در شاخص IoU را با كاهش 102 مگابايتي حجم تقريبي حافظه مورد استفاده نسبت ‌به يكي‌‌از بهترين مدل‌هاي اخير نشان مي‌دهد.

تاريخ ورود اطلاعات

1404/10/16

عنوان به انگليسي

Medical Image Segmentation Using U-Net Convolutional Neural Network

تاريخ بهره برداري

12/22/2025 12:00:00 AM

دانشجوي وارد كننده اطلاعات

سالار زارعي

Name: سالار زارعي
Author: سالارزارعي

چكيده به لاتين

In medical image processing, access to high-quality an‎d diverse datasets remains a significant challenge, as collecting large-scale data is often difficult, time-consuming, an‎d costly. To address this limitation, the U-Net architecture was proposed, which enables accurate results even when trained on relatively limited datasets. The development of deep convolutional neural networks for image segmentation has consistently faced the challenge of balancing model depth with computational efficiency. A key concern in this area is achieving deeper network layers without disproportionately increasing computational costs while maintaining the resolution of feature maps. To address this issue, the U2-Net architecture was introduced, employing a nested U-shaped, two-level structure that allows training a deep network from scratch without relying on pre-trained weights from image classification tasks. In this study, sharpening blocks were incorporated into U2-Net, applying a depthwise convolution with a sharpening kernel to encoder feature maps before merging them with decoder features. This process produces an intermediate sharpened feature map of the same size as the encoder map, enabling the integration of semantically diverse features an‎d reducing noise in the early network layers, without introducing additional trainable parameters. In this study, by appropriately combining the U2-Net an‎d Sharp U2-Net models, experiments were conducted on the Lung Segmentation an‎d ISIC-2018 datasets. The eva‎luations demonstrate that the proposed models outperform recent state-of-the-art methods in medical image segmentation tasks. Notably, Sharp U2-Net+ achieves a 0.91% improvement in Dice coefficient an‎d a 1.84% increase in IoU on the Lung Segmentation dataset, as well as a 3.44% improvement in Dice coefficient an‎d a 2.82% increase in IoU on the ISIC-2018 dataset, while reducing the approximate memory footprint by 102 MB compared to one of the best recent models.

كليدواژه هاي فارسي

فيلتر تيزكننده , بخش‌بندي معنايي , شبكه كاملاً كانولوشني , اتصالات گذري

كليدواژه هاي لاتين

U-Net

Author

Salar Zarei

SuperVisor

Dr. Ali Sadr

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=34343&Field=0&DTC=6