شماره ركورد
34481
پديد آورنده
فرناز حسني
عنوان
ارائه معياري براي سنجش طبقهبندي تصاوير مبتني بر داده و تخمين برچسبهاي داراي نويز
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
هوش مصنوعي و رباتيكز
سال تحصيل
1400
تاريخ دفاع
1404/01/26
استاد راهنما
مرتضي آنالويي
استاد مشاور
ندارم
دانشكده
مهندسي كامپيوتر
چكيده
تمركز اصلي در حوزه هوش مصنوعي تاكنون، بيشتر بر روي بهبود مدلها بوده و اغلب تمركز كمتري روي افزايش كيفيت مجموعه دادهها داشته است. ما شاهد پيشرفت عظيمي در معماري مدل يادگيري ماشين بودهايم كه توسط مجموعه دادههايي هدايت ميشوند كه به عنوان معياري براي اندازهگيري عملكرد مدل عمل ميكنند. در يادگيري ماشين مدرن، دادههاي با كيفيت بالا اهميت زيادي دارد و تقريبا همهي مدلهاي يادگيري با افزايش كيفيت داده بهبود مييابند.
در اين پژوهش، به مسئله دستهبندي تصاوير در حضور برچسبهاي نويزي پرداخته شده است كه يكي از چالشهاي مهم در يادگيري عميق به شمار ميرود. برچسبهاي نويزي ميتوانند بهطور قابلتوجهي بر عملكرد مدلهاي يادگيري تأثير منفي بگذارند و منجر به كاهش دقت و كارايي شوند. در اين تحقيق، ابتدا روشهايي براي مقابله با نويز در برچسبها مورد بررسي قرار گرفت و چارچوبي جديد براي بهبود فرآيند يادگيري ارائه شد. اين چارچوب شامل پالايش دادهها و يادگيري تعاملي بين مدلها براي شناسايي و تصحيح نويزهاي موجود در برچسبها بود.
همچنين دو روش تكميلي به اين چارچوب اضافه گرديد: آستانهگذاري تدريجي كه با تنظيم پويا و تدريجي مقادير آستانه، فرآيند پالايش داده را بهبود بخشيد و خود-تجمعي، پايداري و دقت مدل را افزايش داد. اين روشها بر روي مجموعه داده CIFAR آزمايش شدند و نتايج نشان داد كه تركيب اين رويكردها منجر به كاهش اثر نويز بر دادهها و بهبود عملكرد مدل گرديد.
در پايان، پيشنهادهايي براي توسعه و بهبود اين رويكردها ارائه شده است كه ميتوانند مسير تحقيقات آتي در زمينه يادگيري با دادههاي نويزي را هموارتر كنند.
تاريخ ورود اطلاعات
1404/11/12
عنوان به انگليسي
Benchmark for data-centric image classification and noisy label estimation
تاريخ بهره برداري
1/28/2026 12:00:00 AM
دانشجوي وارد كننده اطلاعات
فرناز حسني
چكيده به لاتين
Artificial Intelligence (AI) has so far primarily focused on building better models rather than creating better datasets. We have witnessed significant advancements in Machine Learning (ML) model architectures, driven by datasets that serve as benchmarks for evaluating model performance. In modern machine learning, high-quality data is crucial, and nearly all learning models improve as data quality increases.
This research addresses the problem of image classification in the presence of noisy labels, which is one of the major challenges in deep learning. Noisy labels can significantly degrade the performance of learning models, leading to reduced accuracy and efficiency. In this study, we first reviewed methods to handle noise in labels and proposed a new framework to enhance the learning process. This framework includes data refinement and interactive learning between models to identify and correct noisy labels.
Additionally, two complementary methods were integrated into this framework: threshold annealing, which dynamically and progressively adjusts threshold values to improve data refinement, and self-ensembling, which enhances model stability and accuracy. These methods were tested on the CIFAR dataset, and the results demonstrated that combining these approaches effectively reduced the impact of noise on the data and improved model performance.
Finally, recommendations for further development and enhancement of these approaches are provided, which can pave the way for future research in learning with noisy data.
كليدواژه هاي فارسي
طبقهبندي تصاوير , يادگيري عميق , برچسب داراي نويز , پالايش داده , آستانهگذاري تدريجي , خود-تجمعي
كليدواژه هاي لاتين
Image classification , deep learning , noisy labels , data refinement , threshold annealing , self-ensembling
Author
Farnaz Hasani
SuperVisor
Morteza Analoui