زهرا داورزني

عنوان

طبقه بندي بيماري هاي چشم با استفاده از شبكه هاي مبتني بر يادگيري عميق

مقطع تحصيلي

ارشد

رشته تحصيلي

مهندسي برق- سيستم هاي الكترونيك ديجيتال

سال تحصيل

1401

تاريخ دفاع

1404/3/26

استاد راهنما

دكتر سيد محمدرضا موسوي ميركلائي

استاد مشاور

دكتر عبدالله اميرخاني

دانشكده

برق

چكيده

بيماري‌هاي چشمي يكي از عوامل اصلي كاهش بينايي و نابينايي در سراسر جهان هستند كه تشخيص زودهنگام آن‌ها مي‌تواند تأثير قابل‌توجهي در پيشگيري از پيشرفت اين بيماري‌ها داشته باشد. با پيشرفت فناوري‌هاي پردازش تصوير و يادگيري عميق، امكان تحليل خودكار تصاوير پزشكي و تشخيص بيماري‌ها با دقت بالا فراهم شده است. شبكه‌هاي عصبي كانولوشني با قابليت استخراج ويژگي‌هاي محلي، در طبقه‌بندي بيماري‌هاي چشمي عملكرد خوبي دارند؛ اما در درك ارتباطات بلندمدت بين نواحي مختلف شبكيه محدوديت‌هايي دارند. ترنسفورمر كه در ابتدا براي پردازش زبان طبيعي معرفي شد، به عنوان يك معماري بسيار مؤثر در طبقه‌بندي تصاوير مطرح شده است كه با تقسيم تصوير به تكه‌هاي كوچك و استفاده از مكانيزم خودتوجهي، توانايي مدل‌سازي وابستگي‌هاي بلندمدت را فراهم مي‌كند. با اين وجود، عملكرد ترنسفورمر بينايي به شدت به كيفيت و حجم داده‌ها وابسته است. در اين مطالعه، براي غلبه بر چالش‌هاي هر يك از اين مدل‌ها، يك مدل تركيبي مبتني بر ادغام شبكه‌هاي عصبي كانولوشني و ترنسفورمر بينايي معرفي شده كه با بهره‌گيري از توانايي‌هاي مكمل هر دو، به بهبود دقت و كارآيي در تحليل تصاوير شبكيه، به‌ويژه در مواردي با تغييرات پراكنده و پيچيده، منجر مي‌شود. مدل ارائه شده در اين مطالعه به دقت 0.9969 دست يافته است كه در مقايسه با جديدترين مدل¬هاي شبكه عصبي موجود، عملكرد بهتري داشته است.

تاريخ ورود اطلاعات

1404/07/16

عنوان به انگليسي

Classification of eye diseases using deep learning

تاريخ بهره برداري

6/16/2026 12:00:00 AM

دانشجوي وارد كننده اطلاعات

زهرا داورزني

Name: زهرا داورزني
Author: زهرا داورزني

چكيده به لاتين

Eye diseases are among the leading causes of visual impairment an‎d blindness worldwide, an‎d early diagnosis plays a crucial role in preventing their progression. With advancements in image processing an‎d deep learning technologies, it has become possible to automatically analyze medical images an‎d detect diseases with high accuracy. Convolutional Neural Networks (CNNs), known for their ability to extract local features, have shown strong performance in classifying eye diseases. However, they face limitations in capturing long-range dependencies across different regions of the retina. Transformers, originally developed for natural language processing, have emerged as a powerful architecture for image classification. By dividing an image into small patches an‎d applying self-attention mechanisms, Vision Transformers (ViTs) are capable of modeling long-distance relationships within the image. Despite their strengths, ViTs are highly dependent on the quality an‎d size of the training datasets. To overcome the individual limitations of CNNs an‎d ViTs, this study proposes a hybrid model that integrates both architectures. By leveraging the complementary strengths of CNNs (for local feature extraction) an‎d ViTs (for long-range dependency modeling), the proposed model achieves improved accuracy an‎d efficiency in retinal image analysis, particularly in cases with subtle an‎d scattered structural changes. The model reached an accuracy of 0.9969, outperforming several state-of-the-art deep learning models.

كليدواژه هاي فارسي

هوش مصنوعي , پردازش تصوير , يادگيري عميق , پيش¬پردازش , استخراج ويژگي , شبكه‌هاي عصبي كانولوشني , ترنسفورمر بينايي , مكانيزم خودتوجهي

كليدواژه هاي لاتين

Artificial Intelligence , Image Processing , Deep Learning , Preprocessing , Feature Extraction , Convolutional Neural Networks (CNNs) , Vision Transformer (ViT) , Self-Attention Mechanisms

Author

Zahra Davarzani

SuperVisor

Dr. Seyed Mohammadreza Mousavi mirkolaei

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=33767&Field=0&DTC=6