-
شماره ركورد
26936
-
پديد آورنده
علي سلطاني نژاد
-
عنوان
شناسايي عمل انسان در تك تصوير با استفاده از يادگيري انتقالي
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي برق- الكترونيك ـ ديجيتال
-
سال تحصيل
1397
-
تاريخ دفاع
1401/6/8
-
استاد راهنما
شهريار برادران شكوهي
-
دانشكده
مهندسي برق
-
چكيده
اخيرا شناسايي فعاليت انسان از تصاوير ثابت، به يك زمينه¬ي تحقيقاتي مهم در بينايي كامپيوتر و تشخيص الگو تبديل شده است. اين زمينه سعي دارد كه نوع رفتار يا فعاليت انسان را از تصوير ثابت شناسايي كند. بر خلاف ويدئو، يك تصوير ثابت اطلاعات حركتي ندارد كه به وسيله ي آن نوع فعاليت توصيف شود. بنابراين نياز است كه روش¬هاي موثري براي شناسايي نوع فعاليت از تصاوير ثابت، توسعه داده شوند. روش¬هاي يادگيري عميق مانند شبكه¬هاي عصبي كانولوشني، اخيرا به عنوان يك روش موثر در زمينه¬هاي مختلف يادگيري ماشين پديدار شده¬اند و وقتي داده¬هاي برچسب خورده¬¬ي به اندازه كافي بزرگ، براي آموزش در دسترس باشند، مي¬توانند درعمل دسته¬بندي، دقت بالايي را به ما بدهند. به دست آوردن يك مجموعه داده¬ي بزرگ براي آموزش شبكه¬هاي عصبي كانولوشني، اغلب يك چالش بزرگ است. اين مسئله، در زمينه¬ي تشخيص فعاليت انسان از روي تصاوير ثابت، يك مشكل بزرگ است. زيرا در اين زمينه، ما مجموعه داده¬ي برچسب خورده¬ي به اندازه¬ي كافي بزرگ نداريم و استفاده از شبكه¬هاي عصبي كانولوشني عميق، زماني كه داده¬ي آموزشي كم است، به علت وقوع بيش¬برازش، مشكل ايجاد مي¬كند. يكي از راهكار هاي غلبه بر اين چالش استفاده از شبكه هاي عميق با وزن هاي اوليه ImageNet است. در اين پژوهش، ما از يادگيري انتقالي براي شناسايي فعاليت انسان استفاده مي¬كنيم. براي اين منظور سه روش مختلف ارائه شد. روش TNT امكان استفاده بهينه از وزن هاي از پيش آموزش داده شده را به ما مي¬دهد. روش دوم، روش شاخه كمكي، تمركز شبكه روي فرد در حال انجام فعاليت را افزايش داده و در نهايت روش سوم، روش خود توجه، توجه شبكه را به اشياء دور تر جلب مي¬كند. در انتها ما با تركيب اين 3 روش از مزاياي هر كدام بهره برديم. روش پيشنهادي سر انجام برروي چهار مجموعه داده Stanford40 و Pascal Action VOC ، BU101+ و IHAR مورد ارزيابي قرار گرفته و مشخص مي¬گردد كه روش پيشنهادي در عين استفاده از تعداد پارامتر-هاي كمتر دقت دسته بندي بالاتري نسبت به روش¬هاي ارائه شده (17/93% ، 37/92% ، 03/92% و 08/92%) در اين زمينه دارد.
-
تاريخ ورود اطلاعات
1401/06/16
-
عنوان به انگليسي
Human Action Recognition in Still Image Using Transfer Learning
-
تاريخ بهره برداري
8/30/2023 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
علي سلطاني نژاد
-
چكيده به لاتين
Recently still image-based human action recognition has become an active research topic in computer vision and pattern recognition. It focuses on identifying a person's action or behavior from a single image. Unlike the traditional action recognition approaches, where videos or image sequences are used, a still image contains no temporal information for action characterization. Therefore, it is demanding to develop efficient methods for still image-based action recognition. Deep learning methods such as convolutional neural networks (CNNs) have recently emerged as a dominant paradigm for machine learning in a variety of domains and they can deliver highly accurate classification results when provided with large enough data sets and respective labels. However, acquiring a suitably large data set for training DCNN is often a significant challenge. This is a major issue in the action recognition domain, where we lack large enough labeled data. Using CNNs along with limited labeled data can be problematic, as this leads to extensive overfitting. In this research, we use transfer learning for human action recognition. For this purpose, three different methods were presented. The TNT method allows us to use the pre-trained weights optimally. The second method, the guidance branch method, increases the network's focus on the person performing the activity, and finally, the third method, the self-attention method, draws the network's attention to more distant objects. In the end, by combining these 3 methods, we benefited from the advantages of each. The proposed method has been evaluated on four datasets Stanford40 and Pascal Action VOC, BU101+ and IHAR and it is clear that the proposed method has a higher classification accuracy (93.17%, 92.37%, 92.03% and 92.08%) than the presented methods in this field while using fewer parameters.
-
كليدواژه هاي فارسي
شناسايي عمل انسان , يادگيري عميق , شبكه عصبي كانولوشني , يادگيري انتقالي
-
كليدواژه هاي لاتين
Human Action Recognition , Deep Learning , Convolutional Neural Networks , Transfer Learning
-
Author
Ali Soltaninezhad
-
SuperVisor
Dr. Shokoohi
-
لينک به اين مدرک :