شماره ركورد
20769
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
۲۰۷۶۹
پديد آورنده
فاطمه روستائي
عنوان
تنظيم دقيق شبكه هاي كانولوشني عميق براي طبقه بندي آثار هنري
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
هوش مصنوعي
سال تحصيل
۱۳۹۵-۱۳۹۸
تاريخ دفاع
۱۳۹۸/۳/۱
استاد راهنما
دكتر محمدرضا محمدي
استاد مشاور
دكتر محمود فتحي
دانشكده
كامپيوتر
چكيده
با پيشرفت سريع ديجيتالسازي نقاشيها، مجموعههاي عظيم از آثار هنري در دسترس عموم قرار گرفته است. ازاينرو تحليل نقاشيها و طبقهبندي آنها براي آرشيو و بازيابي آثار هنري و نمايهسازي پايگاههاي آثار هنري بسيار موردتوجه قرار گرفته است. با توجه به عملكرد موفق روشهاي يادگيري عميق در مسائل بينايي ماشين، كاربرد آنها درزمينهي طبقهبندي آثار هنري موردبررسي قرار گرفته است. در مقايسه با طبقهبندي اشياء طبيعي، طبقهبندي آثار هنري بسيار چالشبرانگيز است، زيرا بسياري از مقولههاي هنري نياز به تجسم و درك مفاهيم انتزاعي و پيشينهي قوي تاريخ هنر دارد. همچنين تمايز ميان سبكهاي هنري به دليل شباهت بسيار آنها پيچيده و دشوار است. تحقيقات اخير قابليت انتقال دانش شبكههاي عصبي پيش آموخته به طبقهبندي آثار هنري را بررسي كردهاند. در اين پاياننامه نيز مدلهاي پيش آموخته و يادگيري انتقالي براي طبقهبندي آثار هنري از منظر سبك هنري مورداستفاده قرار گرفته است. همچنين اين پژوهش يك رويكرد جديد طبقهبندي دوسطحي باهدف بهبود دقت طبقهبندي سبك هنري معرفي كرده است. در اين روش سبكهاي هنري به چند گروه تقسيم ميشوند و يك درخت برچسب سلسله مراتبي با استفاده از ماتريس درهمريختگي مدل مسطح توليد ميشود. خروجي شبكه از طريق دو سطح مشخص ميشود، سطح اول برچسب گروه تصوير ورودي و سطح دوم برچسب سبك تصوير ورودي را تعيين ميكند. در مرحلهي آموزش ابتدا همگروهيهاي كلاس سبك تصوير ورودي تعيين ميشود و سپس اتلاف تنها براي اين گروه محاسبه ميگردد. همچنين براي محاسبهي اتلاف كلي از مجموع وزني اتلاف دو سطح استفاده شده است. در مرحلهي ارزيابي نيز ابتدا گروه تصوير مشخص ميشود سپس برچسب سبك تصوير از ميان اعضاي آن گروه تعيين ميشود. عامل اصلي بهبود دقت در اين روش، تقليل وظيفهي طبقهبندي به چند وظيفهي طبقهبندي سادهتر است. روش پيشنهادي با استفاده از دو شبكهي DenseNet و ResNet پيش آموخته بر روي تصاوير ImageNet مورد ارزيابي قرار گرفت. نتايج آزمونهاي انجامشده بر روي مجموعه دادگان WikiArt نشان داد كه روش پيشنهادي دقت روشهاي پايه را براي شبكهي ResNet از 49 درصد به 54 درصد و براي شبكهي DenseNet از 52 درصد به 57 درصد رسانده است.
تاريخ ورود اطلاعات
1398/04/09
عنوان به انگليسي
Fine-tuning Deep Convolutional Networks for Fine-art Paintings Classification
تاريخ بهره برداري
9/22/2019 12:00:00 AM
دانشجوي وارد كننده اطلاعات
فاطمه روستايي چورسي
چكيده به لاتين
Due to the rapid progress of digitization of paintings, massive collections of artwork are available to the public. Therefore, the analysis of paintings and their classification for the archiving, and retrieval of artworks and indexing artistic databases has been very much considered. Considering the successful performance of deep learning methods in machine vision problems, their application in the classification of artwork examined. Compared to the classification of natural objects, the classification of artworks is very challenging, since many artistic categories require the visualization and understanding of abstract concepts and a strong background in the history of art. Furthermore, the distinction between art styles is complex and difficult due to their very similarity. Recent researches have investigated the ability of transfer learning of pretrained neural networks to the classification of artworks. In this thesis, pretrained models and transfer learning used to classify artworks in terms of artistic styles. In addition, a new two-level classification approach introduced, aimed at improving the accuracy of style classification. In this method, artistic styles divided into several groups, and a hierarchical label tree created using confusion matrix of the flat model. The output of the network is determined from two levels; the first level defines the label of the input image group, and the second level specifies the style of the input image. In the learning phase, firstly, the classes, which in same group with the class of the input image are determined, and then the error calculated for this group only. Furthermore, total weight error of two levels used to calculate the overall error. In the evaluation phase, the image group will identified first; then, the image style label will be determined among the members of that group. The main factor in improving the accuracy of this method is to reduce the task of classification into some simpler classification tasks. The proposed method evaluated using two networks, DenseNet and ResNet, pretrained on ImageNet images. The results of the tests performed on the WikiArt datasets showed that the proposed method improves the accuracy of the basic methods for the ResNet network from 49% to 54% and for the DenseNet network from 52% to 57.