سعيد چمني

عنوان

قطعه بندي خودكار تصاوير اكوكارديوگرافي به روش يادگيري عميق مبتني بر ترنسفورمر

مقطع تحصيلي

كارشناسي ارشد

رشته تحصيلي

مهندسي پزشكي-بيوالكتريك

سال تحصيل

1401

تاريخ دفاع

1404/07/05

استاد راهنما

حميد بهنام

استاد مشاور

ندارد

دانشكده

مهندسي برق

چكيده

ناحيه بندي خودكار تصاوير اكوكارديوگرافي دوبعدي گامي حياتي در تشخيص و ارزيابي بيماري‌هاي قلبي محسوب مي‌شود. شبكه‌هاي عصبي كانولوشني مانند U-Net در ناحيه بندي تصاوير پزشكي عملكرد قابل قبولي داشته‌اند، اما به دليل ذات محلي عمليات كانولوشني، اغلب در درك وابستگي‌هاي كلي دچار كاستي مي‌شوند. در عوض، مدل‌هاي ترنسفورمر با بهره‌گيري از مكانيسم‌هاي توجه چندسر، زمينه كلي تصوير را ثبت مي‌كنند؛ اما ممكن است در تعيين موقعيت‌هاي دقيق و جزئي عملكرد مطلوبي نداشته باشند. به منظور رفع اين چالش‌ها، ما يك معماري نوين يادگيري عميق مبتني بر چارچوب رمزگذار-رمزگشا معرفي كرديم كه با استفاده از مكانيسم‌هاي توجه متعدد و يك گلوگاه هيبريد شامل ترانسفورمر بينايي و بلوك چند ميدان گيرايي غني شده است. ادغام ترنسفورمر بينايي امكان مدل‌سازي وابستگي‌هاي كلي را فراهم مي‌آورد، در حالي كه بلوك چند ميدان گيرايي استخراج ويژگي‌هاي چندمقياسي را بهبود داده و به‌طور خاص براي بهبود نمايش ويژگي‌هاي مكاني و كاهش از دست رفتن اطلاعات مكاني طراحي شده است. رويكرد ارائه‌شده بر ثبت همزمان زمينه‌هاي محلي و كلي در هر فريم متمركز شده است تا ناحيه بندي قوي و دقيقي را فراهم آورد. ما مدل خود را با استفاده از مجموعه داده CAMUS آموزش و اعتبارسنجي كرديم. بر اساس شاخص دايس، مدل پيشنهادي ما در ناحيه بندي اندوكارديوم بطن چپ، اپيكارديوم بطن چپ و دهليز چپ به ترتيب در نماهاي دوپنجره آپيكال به مقادير دايس 91.11±0.19، 87.60±0.11 و 87.85±0.29 و در نماهاي چهار پنجره آپيكال به ترتيب به مقادير 92.25±0.17، 87.29±0.17 و 91.71±0.10 دست يافت. اين نتايج نشان مي‌دهد كه مدل پيشنهادي ما از مدل‌هاي صرفاً مبتني بر كانولوشني (مانند U-Net)، مدل‌هاي صرفاً مبتني بر ترنسفورمر (مانند Swin-Unet) و معماري‌هاي هيبريد يعني ترنسفورمري_كانولوشني (مانند UNETR-2d) موجود ، با دقت و پايداري به مراتب برتري عمل مي‌كند.

تاريخ ورود اطلاعات

1404/07/21

عنوان به انگليسي

Automatic Segmentation of Echocardiography Images Using Deep Learning Based on Vision Transformer

تاريخ بهره برداري

9/27/2026 12:00:00 AM

دانشجوي وارد كننده اطلاعات

سعيد چمني

Name: سعيد چمني
Author: سعيد چمني

چكيده به لاتين

Automatic segmentation of 2D echocardiograms is a critical step in diagnosing an‎d assessing heart diseases. Convolutional Neural Networks (CNNs), such as U-Net, have proven effective for medical image segmentation, but they often fall short in capturing long-range dependencies because convolution operations are inherently local. While transformer models capture the global context, they also may not be good in fine-grained localization. To han‎dle these issues, we introduce a novel deep learning architecture based on an encoder-decoder framework, enriched by multiple attention mechanisms, an‎d hybrid bottleneck combining a Vision Transformer (ViT) an‎d a Multi Receptive Field Block (MRFB). The integration of a ViT enables the modeling of long-range dependencies, while the MRFB improves multi-scale feature extraction an‎d is specifically designed to improve the representation of spatial features an‎d reduce the loss of spatial information. Enhanced by multiple attention mechanisms an‎d deep supervision with Atrous Spatial Pyramid Pooling (ASPP), our model robustly captures both local an‎d global contexts. Trained an‎d validated on the CAMUS dataset, it achieves Dice Similarity Coefficients of 91.11±0.19, 87.60±0.11, an‎d 87.85±0.29 for left ventricle endocardium, epicardium, an‎d left atrium in two-chamber views, an‎d 92.25±0.17, 87.29±0.17, an‎d 91.71±0.10 in four-chamber views. These results demonstrate that our proposed model outperforms pure CNN-based models (such as UNet), pure transformer-based models (such as Swin-Unet), an‎d existing CNN-Transformer hybrid (such as UNETR-2d) architectures in the state of the art, achieving superior segmentation accuracy an‎d robustness.

كليدواژه هاي فارسي

يادگيري عميق , ناحيه بندي خودكار , اكوكارديوگرافي دوبعدي , شبكه عصبي كانولوشني , ترنسفورمر , معماري هيبريد

كليدواژه هاي لاتين

Deep Learning , Automatic Segmentation , 2D Echocardiography , Convolutional Neural Network , Transformer , Hybrid Architecture

Author

Saeed Chamani

SuperVisor

Hamid Behnam

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=33802&Field=0&DTC=6