شماره ركورد
33802
پديد آورنده
سعيد چمني
عنوان
قطعه بندي خودكار تصاوير اكوكارديوگرافي به روش يادگيري عميق مبتني بر ترنسفورمر
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي پزشكي-بيوالكتريك
سال تحصيل
1401
تاريخ دفاع
1404/07/05
استاد راهنما
حميد بهنام
استاد مشاور
ندارد
دانشكده
مهندسي برق
چكيده
ناحيه بندي خودكار تصاوير اكوكارديوگرافي دوبعدي گامي حياتي در تشخيص و ارزيابي بيماريهاي قلبي محسوب ميشود. شبكههاي عصبي كانولوشني مانند U-Net در ناحيه بندي تصاوير پزشكي عملكرد قابل قبولي داشتهاند، اما به دليل ذات محلي عمليات كانولوشني، اغلب در درك وابستگيهاي كلي دچار كاستي ميشوند. در عوض، مدلهاي ترنسفورمر با بهرهگيري از مكانيسمهاي توجه چندسر، زمينه كلي تصوير را ثبت ميكنند؛ اما ممكن است در تعيين موقعيتهاي دقيق و جزئي عملكرد مطلوبي نداشته باشند. به منظور رفع اين چالشها، ما يك معماري نوين يادگيري عميق مبتني بر چارچوب رمزگذار-رمزگشا معرفي كرديم كه با استفاده از مكانيسمهاي توجه متعدد و يك گلوگاه هيبريد شامل ترانسفورمر بينايي و بلوك چند ميدان گيرايي غني شده است. ادغام ترنسفورمر بينايي امكان مدلسازي وابستگيهاي كلي را فراهم ميآورد، در حالي كه بلوك چند ميدان گيرايي استخراج ويژگيهاي چندمقياسي را بهبود داده و بهطور خاص براي بهبود نمايش ويژگيهاي مكاني و كاهش از دست رفتن اطلاعات مكاني طراحي شده است. رويكرد ارائهشده بر ثبت همزمان زمينههاي محلي و كلي در هر فريم متمركز شده است تا ناحيه بندي قوي و دقيقي را فراهم آورد. ما مدل خود را با استفاده از مجموعه داده CAMUS آموزش و اعتبارسنجي كرديم. بر اساس شاخص دايس، مدل پيشنهادي ما در ناحيه بندي اندوكارديوم بطن چپ، اپيكارديوم بطن چپ و دهليز چپ به ترتيب در نماهاي دوپنجره آپيكال به مقادير دايس 91.11±0.19، 87.60±0.11 و 87.85±0.29 و در نماهاي چهار پنجره آپيكال به ترتيب به مقادير 92.25±0.17، 87.29±0.17 و 91.71±0.10 دست يافت. اين نتايج نشان ميدهد كه مدل پيشنهادي ما از مدلهاي صرفاً مبتني بر كانولوشني (مانند U-Net)، مدلهاي صرفاً مبتني بر ترنسفورمر (مانند Swin-Unet) و معماريهاي هيبريد يعني ترنسفورمري_كانولوشني (مانند UNETR-2d) موجود ، با دقت و پايداري به مراتب برتري عمل ميكند.
تاريخ ورود اطلاعات
1404/07/21
عنوان به انگليسي
Automatic Segmentation of Echocardiography Images Using Deep Learning Based on Vision Transformer
تاريخ بهره برداري
9/27/2026 12:00:00 AM
دانشجوي وارد كننده اطلاعات
سعيد چمني
چكيده به لاتين
Automatic segmentation of 2D echocardiograms is a critical step in diagnosing and assessing
heart diseases. Convolutional Neural Networks (CNNs), such as U-Net, have proven effective for medical image segmentation, but they often fall short in capturing long-range dependencies because convolution operations are inherently local. While transformer models capture the global context, they also may not be good in fine-grained localization. To handle these issues, we introduce a novel deep learning architecture based on an encoder-decoder framework, enriched by multiple attention mechanisms, and hybrid bottleneck combining a Vision Transformer (ViT) and a Multi Receptive Field Block (MRFB). The integration of a ViT enables the modeling of long-range dependencies, while the MRFB improves multi-scale feature extraction and is specifically designed to improve the representation of spatial features and reduce the loss of spatial information. Enhanced by multiple attention mechanisms and deep supervision with Atrous Spatial Pyramid Pooling (ASPP), our model robustly captures both local and global contexts. Trained and validated on the CAMUS dataset, it achieves Dice Similarity Coefficients of 91.11±0.19, 87.60±0.11, and 87.85±0.29 for left ventricle endocardium, epicardium, and left atrium in two-chamber views, and 92.25±0.17, 87.29±0.17, and 91.71±0.10 in four-chamber views. These results demonstrate that our proposed model outperforms pure CNN-based models (such as UNet), pure transformer-based models (such as Swin-Unet), and existing CNN-Transformer hybrid (such as UNETR-2d) architectures in the state of the art, achieving superior segmentation accuracy and robustness.
كليدواژه هاي فارسي
يادگيري عميق , ناحيه بندي خودكار , اكوكارديوگرافي دوبعدي , شبكه عصبي كانولوشني , ترنسفورمر , معماري هيبريد
كليدواژه هاي لاتين
Deep Learning , Automatic Segmentation , 2D Echocardiography , Convolutional Neural Network , Transformer , Hybrid Architecture
Author
Saeed Chamani
SuperVisor
Hamid Behnam