شماره ركورد
34343
پديد آورنده
سالارزارعي
عنوان
بخش بندي تصوير پزشكي با به كارگيري شبكه عصبي كانولوشن U-Net
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي برق سيستم هاي الكترونيك ديجيتال
سال تحصيل
1400
تاريخ دفاع
1404/7/26
استاد راهنما
دكتر علي صدر
استاد مشاور
/
دانشكده
برق
چكيده
در پردازش تصاوير پزشكي، دسترسي به مجموعه دادههاي باكيفيت و متنوع همواره يك چالش مهم محسوب ميشود، زيرا جمعآوري دادههاي گسترده اغلب دشوار و پرهزينه است. براي رفع اين مسئله، دانشمندان U-Net را پيشنهاد دادهاند. مزيت بزرگ U-Net اين است كه با دادههاي آموزشي كمتر سروكار داريم اما نتايج دقيقي بهدست ميآوريم.
توسعه شبكههاي عصبي كانولوشني عميق در بخشبندي تصوير، همواره با چالش حفظ توازن بين عمق مدل و كارايي محاسباتي روبهرو بودهاست. يكياز دغدغههاي كليدي دراين حوزه، دستيابي به لايههاي عميقتر بدون افزايش نامتناسب هزينههاي محاسباتي و درعين حال حفظ وضوح نقشههاي ويژگي است. براي پاسخ به اين چالش، معماري U2-Net معرفي شد كه با بهرهگيري از يك ساختار دوسطحي و تودرتو بهشكل U، امكان آموزش يك شبكه عميق را از پايه و بدون نياز به وزنهاي اوليهي پيشآموختهشده از وظايف طبقهبندي تصاوير فراهم ميكند. دراين پاياننامه با افزودن بلوكهاي تيزكننده به U2-Net ، يك كانولوشن عمقي از نقشه ويژگي رمزگذار با يك فيلتر هسته تيزكننده قبل از ادغام ويژگيهاي رمزگذار و رمزگشا استفاده ميشود و در نتيجه يك نقشه ويژگي واسطه تيزشده بههمان اندازه نقشه رمزگذار توليد ميشود. با اينكار، قادربه ادغام ويژگيهاي متفاوت از لحاظ معنايي هستيم و از ايجاد نويزهاي اضافي در لايههاي شبكه در مراحل اوليه آموزش جلوگيري ميكنيم، درحاليكه هيچ پارامتر قابل آموزشي اضافه نميشود.
در اين پاياننامه با تركيب مناسب مدلهاي U2-Net و Sharp U-Net ، آزمايشهايي بر روي دو مجموعه داده Lung Segmentation وISIC-2018 انجام ميشود. اين ارزيابيها نشان ميدهد كه مدلهاي پيشنهادي در مقايسه با مدلهاي پيشرفته اخير عملكرد بهتري در وظايف بخشبندي تصوير پزشكي دارد بهطوريكه مدل Sharp U2-Net+ در مجموعهداده Lung Segmentation، به ترتيب بهبود 0.91 درصدي در ضريب Dice و 1.84 درصدي در شاخص IoU و همچنين در مجموعهداده ISIC-2018 ، بهبود 3.44 درصدي در ضريب Dice و 2.82 درصدي در شاخص IoU را با كاهش 102 مگابايتي حجم تقريبي حافظه مورد استفاده نسبت به يكياز بهترين مدلهاي اخير نشان ميدهد.
تاريخ ورود اطلاعات
1404/10/16
عنوان به انگليسي
Medical Image Segmentation Using U-Net Convolutional Neural Network
تاريخ بهره برداري
12/22/2025 12:00:00 AM
دانشجوي وارد كننده اطلاعات
سالار زارعي
چكيده به لاتين
In medical image processing, access to high-quality and diverse datasets remains a significant challenge, as collecting large-scale data is often difficult, time-consuming, and costly. To address this limitation, the U-Net architecture was proposed, which enables accurate results even when trained on relatively limited datasets.
The development of deep convolutional neural networks for image segmentation has consistently faced the challenge of balancing model depth with computational efficiency. A key concern in this area is achieving deeper network layers without disproportionately increasing computational costs while maintaining the resolution of feature maps. To address this issue, the U2-Net architecture was introduced, employing a nested U-shaped, two-level structure that allows training a deep network from scratch without relying on pre-trained weights from image classification tasks. In this study, sharpening blocks were incorporated into U2-Net, applying a depthwise convolution with a sharpening kernel to encoder feature maps before merging them with decoder features. This process produces an intermediate sharpened feature map of the same size as the encoder map, enabling the integration of semantically diverse features and reducing noise in the early network layers, without introducing additional trainable parameters.
In this study, by appropriately combining the U2-Net and Sharp U2-Net models, experiments were conducted on the Lung Segmentation and ISIC-2018 datasets. The evaluations demonstrate that the proposed models outperform recent state-of-the-art methods in medical image segmentation tasks. Notably, Sharp U2-Net+ achieves a 0.91% improvement in Dice coefficient and a 1.84% increase in IoU on the Lung Segmentation dataset, as well as a 3.44% improvement in Dice coefficient and a 2.82% increase in IoU on the ISIC-2018 dataset, while reducing the approximate memory footprint by 102 MB compared to one of the best recent models.
كليدواژه هاي فارسي
فيلتر تيزكننده , بخشبندي معنايي , شبكه كاملاً كانولوشني , اتصالات گذري
كليدواژه هاي لاتين
U-Net
Author
Salar Zarei
SuperVisor
Dr. Ali Sadr