شماره ركورد
33767
پديد آورنده
زهرا داورزني
عنوان
طبقه بندي بيماري هاي چشم با استفاده از شبكه هاي مبتني بر يادگيري عميق
مقطع تحصيلي
ارشد
رشته تحصيلي
مهندسي برق- سيستم هاي الكترونيك ديجيتال
سال تحصيل
1401
تاريخ دفاع
1404/3/26
استاد راهنما
دكتر سيد محمدرضا موسوي ميركلائي
استاد مشاور
دكتر عبدالله اميرخاني
دانشكده
برق
چكيده
بيماريهاي چشمي يكي از عوامل اصلي كاهش بينايي و نابينايي در سراسر جهان هستند كه تشخيص زودهنگام آنها ميتواند تأثير قابلتوجهي در پيشگيري از پيشرفت اين بيماريها داشته باشد. با پيشرفت فناوريهاي پردازش تصوير و يادگيري عميق، امكان تحليل خودكار تصاوير پزشكي و تشخيص بيماريها با دقت بالا فراهم شده است.
شبكههاي عصبي كانولوشني با قابليت استخراج ويژگيهاي محلي، در طبقهبندي بيماريهاي چشمي عملكرد خوبي دارند؛ اما در درك ارتباطات بلندمدت بين نواحي مختلف شبكيه محدوديتهايي دارند. ترنسفورمر كه در ابتدا براي پردازش زبان طبيعي معرفي شد، به عنوان يك معماري بسيار مؤثر در طبقهبندي تصاوير مطرح شده است كه با تقسيم تصوير به تكههاي كوچك و استفاده از مكانيزم خودتوجهي، توانايي مدلسازي وابستگيهاي بلندمدت را فراهم ميكند. با اين وجود، عملكرد ترنسفورمر بينايي به شدت به كيفيت و حجم دادهها وابسته است. در اين مطالعه، براي غلبه بر چالشهاي هر يك از اين مدلها، يك مدل تركيبي مبتني بر ادغام شبكههاي عصبي كانولوشني و ترنسفورمر بينايي معرفي شده كه با بهرهگيري از تواناييهاي مكمل هر دو، به بهبود دقت و كارآيي در تحليل تصاوير شبكيه، بهويژه در مواردي با تغييرات پراكنده و پيچيده، منجر ميشود. مدل ارائه شده در اين مطالعه به دقت 0.9969 دست يافته است كه در مقايسه با جديدترين مدل¬هاي شبكه عصبي موجود، عملكرد بهتري داشته است.
تاريخ ورود اطلاعات
1404/07/16
عنوان به انگليسي
Classification of eye diseases using deep learning
تاريخ بهره برداري
6/16/2026 12:00:00 AM
دانشجوي وارد كننده اطلاعات
زهرا داورزني
چكيده به لاتين
Eye diseases are among the leading causes of visual impairment and blindness worldwide, and early diagnosis plays a crucial role in preventing their progression. With advancements in image processing and deep learning technologies, it has become possible to automatically analyze medical images and detect diseases with high accuracy.
Convolutional Neural Networks (CNNs), known for their ability to extract local features, have shown strong performance in classifying eye diseases. However, they face limitations in capturing long-range dependencies across different regions of the retina. Transformers, originally developed for natural language processing, have emerged as a powerful architecture for image classification. By dividing an image into small patches and applying self-attention mechanisms, Vision Transformers (ViTs) are capable of modeling long-distance relationships within the image.
Despite their strengths, ViTs are highly dependent on the quality and size of the training datasets. To overcome the individual limitations of CNNs and ViTs, this study proposes a hybrid model that integrates both architectures. By leveraging the complementary strengths of CNNs (for local feature extraction) and ViTs (for long-range dependency modeling), the proposed model achieves improved accuracy and efficiency in retinal image analysis, particularly in cases with subtle and scattered structural changes. The model reached an accuracy of 0.9969, outperforming several state-of-the-art deep learning models.
كليدواژه هاي فارسي
هوش مصنوعي , پردازش تصوير , يادگيري عميق , پيش¬پردازش , استخراج ويژگي , شبكههاي عصبي كانولوشني , ترنسفورمر بينايي , مكانيزم خودتوجهي
كليدواژه هاي لاتين
Artificial Intelligence , Image Processing , Deep Learning , Preprocessing , Feature Extraction , Convolutional Neural Networks (CNNs) , Vision Transformer (ViT) , Self-Attention Mechanisms
Author
Zahra Davarzani
SuperVisor
Dr. Seyed Mohammadreza Mousavi mirkolaei