فرناز حسني

عنوان

ارائه معياري براي سنجش طبقه‌بندي تصاوير مبتني بر داده و تخمين برچسب‌هاي داراي نويز

مقطع تحصيلي

كارشناسي ارشد

رشته تحصيلي

هوش مصنوعي و رباتيكز

سال تحصيل

1400

تاريخ دفاع

1404/01/26

استاد راهنما

مرتضي آنالويي

استاد مشاور

ندارم

دانشكده

مهندسي كامپيوتر

چكيده

تمركز اصلي در حوزه هوش مصنوعي تاكنون، بيشتر بر روي بهبود مدل‌ها بوده و اغلب تمركز كمتري روي افزايش كيفيت مجموعه داده‌ها داشته است. ما شاهد پيش‌رفت عظيمي در معماري مدل يادگيري ماشين بوده‌ايم كه توسط مجموعه داده‌هايي هدايت مي‌شوند كه به عنوان معياري براي اندازه‌گيري عمل‌كرد مدل عمل مي‌كنند. در يادگيري ماشين مدرن، داده‌هاي با كيفيت بالا اهميت زيادي دارد و تقريبا همه‌ي مدل‌هاي يادگيري با افزايش كيفيت داده بهبود مي‌يابند. در اين پژوهش، به مسئله دسته‌بندي تصاوير در حضور برچسب‌هاي نويزي پرداخته شده است كه يكي از چالش‌هاي مهم در يادگيري عميق به شمار مي‌رود. برچسب‌هاي نويزي مي‌توانند به‌طور قابل‌توجهي بر عملكرد مدل‌هاي يادگيري تأثير منفي بگذارند و منجر به كاهش دقت و كارايي شوند. در اين تحقيق، ابتدا روش‌هايي براي مقابله با نويز در برچسب‌ها مورد بررسي قرار گرفت و چارچوبي جديد براي بهبود فرآيند يادگيري ارائه شد. اين چارچوب شامل پالايش داده‌ها و يادگيري تعاملي بين مدل‌ها براي شناسايي و تصحيح نويزهاي موجود در برچسب‌ها بود. همچنين دو روش تكميلي به اين چارچوب اضافه گرديد: آستانه‌گذاري تدريجي كه با تنظيم پويا و تدريجي مقادير آستانه، فرآيند پالايش داده را بهبود بخشيد و خود-تجمعي، پايداري و دقت مدل را افزايش داد. اين روش‌ها بر روي مجموعه داده CIFAR آزمايش شدند و نتايج نشان داد كه تركيب اين رويكردها منجر به كاهش اثر نويز بر داده‌ها و بهبود عمل‌كرد مدل گرديد. در پايان، پيشنهادهايي براي توسعه و بهبود اين رويكردها ارائه شده است كه مي‌توانند مسير تحقيقات آتي در زمينه يادگيري با داده‌هاي نويزي را هموارتر كنند.

تاريخ ورود اطلاعات

1404/11/12

عنوان به انگليسي

Benchmark for data-centric image classification an‎d noisy label estimation

تاريخ بهره برداري

1/28/2026 12:00:00 AM

دانشجوي وارد كننده اطلاعات

فرناز حسني

Name: فرناز حسني
Author: فرناز حسني

چكيده به لاتين

Artificial Intelligence (AI) has so far primarily focused on building better models rather than creating better datasets. We have witnessed significant advancements in Machine Learning (ML) model architectures, driven by datasets that serve as benchmarks for eva‎luating model performance. In modern machine learning, high-quality data is crucial, an‎d nearly all learning models improve as data quality increases. This research addresses the problem of image classification in the presence of noisy labels, which is one of the major challenges in deep learning. Noisy labels can significantly degrade the performance of learning models, leading to reduced accuracy an‎d efficiency. In this study, we first reviewed methods to han‎dle noise in labels an‎d proposed a new framework to enhance the learning process. This framework includes data refinement an‎d interactive learning between models to identify an‎d correct noisy labels. Additionally, two complementary methods were integrated into this framework: threshold annealing, which dynamically an‎d progressively adjusts threshold values to improve data refinement, an‎d self-ensembling, which enhances model stability an‎d accuracy. These methods were tested on the CIFAR dataset, an‎d the results demonstrated that combining these approaches effectively reduced the impact of noise on the data an‎d improved model performance. Finally, recommendations for further development an‎d enhancement of these approaches are provided, which can pave the way for future research in learning with noisy data.

كليدواژه هاي فارسي

طبقه‌بندي تصاوير , يادگيري عميق , برچسب داراي نويز , پالايش داده , آستانه‌گذاري تدريجي , خود-تجمعي

كليدواژه هاي لاتين

Image classification , deep learning , noisy labels , data refinement , threshold annealing , self-ensembling

Author

Farnaz Hasani

SuperVisor

Morteza Analoui

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=34481&Field=0&DTC=6