-
شماره ركورد
33501
-
پديد آورنده
عليرضا صديقي مقدم
-
عنوان
تشخيص خطاي برچسب در دستهبندي ترتيبي تصاوير
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي كامپيوتر - هوش مصنوعي و رباتيك
-
سال تحصيل
1401
-
تاريخ دفاع
1404/02/30
-
استاد راهنما
محمدرضا محمدي
-
استاد مشاور
-
-
دانشكده
مهندسي كامپيوتر
-
چكيده
دادههاي برچسبدار، ركن اساسي آموزش مدلهاي يادگيري عميق با نظارت در بينايي كامپيوتر محسوب ميشوند. با اين حال، فرايند برچسبگذاري، بهويژه براي مسائل دستهبندي ترتيبي تصاوير كه در آنها مرز بين كلاسها اغلب مبهم است، مستعد ايجاد خطا و نويز در برچسبها است. وجود چنين نويزهايي ميتواند عملكرد و قابليت اطمينان مدلهاي يادگيري ماشين را به طور قابل توجهي كاهش دهد. اين پاياننامه به مسئله تشخيص و اصلاح خطاي برچسب در وظايف دستهبندي ترتيبي تصاوير ميپردازد.
در اين راستا، يك روش دادهمحور نوين با نام اصلاح تطبيقي ترتيبي (ORDAC) براي اصلاح برچسبهاي نويزي ارائه شده است. اين روش از قابليتهاي يادگيري توزيع برچسب (LDL) به منظور مدلسازي ابهام ذاتي و عدم قطعيت موجود در برچسبهاي ترتيبي بهره ميبرد. اصلاح تطبيقي ترتيبي در طول فرايند آموزش، به صورت پويا ميانگين و انحراف معيار توزيع برچسب هر نمونه را اصلاح ميكند. اين رويكرد به جاي حذف نمونههاي بالقوه نويزي، سعي در تصحيح آنها و استفاده بهينه از كل مجموعه داده آموزشي دارد.
ارزيابي كارايي روش پيشنهادي بر روي مجموعهدادههاي استاندارد تخمين سن Adience و تشخيص شدت بيماري Diabetic Retinopathy تحت سناريوهاي مختلف نويز مصنوعي نامتقارن گاوسي انجام گرفت. نتايج نشان ميدهد كه روش پيشنهادي و نسخههاي توسعهيافته آن (ORDAC_C وORDACR) بهبود قابل توجهي در عملكرد مدل ايجاد ميكنند. به عنوان نمونه، در مجموعه داده Adience با سطح نويز 40٪، روش ORDAC_R توانست ميانگين خطاي مطلق را از مقدار 0.86 به 0.62 كاهش دهد و معيار بازيابي بازخورد را از0.37 به 0.49 افزايش دهد. همچنين، كارايي روش در اصلاح نويز ذاتي موجود در مجموعهدادههاي اصلي نيز مشهود بود. اين پژوهش نشان ميدهد كه اصلاح تطبيقي برچسبها با بهرهگيري از توزيع آنها، راهكاري مؤثر براي افزايش استحكام و دقت مدلهاي دستهبندي ترتيبي در مواجهه با دادههاي نويزي است.
-
تاريخ ورود اطلاعات
1404/04/21
-
عنوان به انگليسي
Label Error Detection in Ordinal Image Classification
-
تاريخ بهره برداري
1/1/1900 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
عليرضا صديقي مقدم
-
چكيده به لاتين
Labeled data is a fundamental component in training supervised deep learning models for
computer vision tasks. However, the labeling process, especially for ordinal image classification
problems where class boundaries are often ambiguous, is prone to error and noise. Such label
noise can significantly degrade the performance and reliability of machine learning models. This
thesis addresses the problem of detecting and correcting label noise in ordinal image
classification tasks. To this end, a novel data-centric method called ORDinal Adaptive Correction
(ORDAC) is proposed for adaptive correction of noisy labels. The proposed approach leverages
the capabilities of Label Distribution Learning (LDL) to model the inherent ambiguity and
uncertainty present in ordinal labels. During training, ORDAC dynamically adjusts the mean and
standard deviation of the label distribution for each sample. Rather than discarding potentially
noisy samples, this approach aims to correct them and make optimal use of the entire training
dataset. The effectiveness of the proposed method is evaluated on benchmark datasets for age
estimation (Adience) and disease severity detection (Diabetic Retinopathy) under various
asymmetric Gaussian noise scenarios. Results show that ORDAC and its extended versions
(ORDAC_C and ORDAC_R) lead to significant improvements in model performance. For
instance, on the Adience dataset with 40% noise, ORDAC_R reduced the mean absolute error
from 0.86 to 0.62 and increased the recall from 0.37 to 0.49. The method also demonstrated its
effectiveness in correcting intrinsic noise present in the original datasets. This research indicates
that adaptive label correction using label distributions is an effective strategy to enhance the
robustness and accuracy of ordinal classification models in the presence of noisy data.
-
كليدواژه هاي فارسي
تشخيص خطاي برچسب , اصلاح برچسب نويزي , دستهبندي ترتيبي , نويز برچسب , يادگيري توزيع برچسب , هوش مصنوعي دادهمحور
-
كليدواژه هاي لاتين
Label Error Detection , Noisy Label Correction , Ordinal Classification , Label Noise , Label Distribution Learning , Data-centric Artificial Intelligence
-
Author
Alireza Sedighi Moghaddam
-
SuperVisor
Mohammad Reza Mohammadi
-
لينک به اين مدرک :