-
شماره ركورد
20552
-
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
۲۰۵۵۲
-
پديد آورنده
سينا محمدي
-
عنوان
شناسايي فعاليت انسان مبتني بر يادگيري عميق
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
الكترونيك - سيستم هاي الكترونيك ديجيتال
-
سال تحصيل
1395
-
تاريخ دفاع
۱۳۹۷/۱۲/۱۹
-
استاد راهنما
دكتر شهريار برادران شكوهي
-
دانشكده
برق
-
چكيده
اخيرا شناسايي فعاليت انسان از تصاوير ثابت، به يك زمينه ي تحقيقاتي مهم در بينايي كامپيوتر و تشخيص الگو تبديل شده است. اين زمينه سعي دارد كه نوع رفتار يا فعاليت انسان را از تصوير ثابت شناسايي كند. بر خلاف ويدئو، يك تصوير ثابت اطلاعات حركتي ندارد كه به وسيله ي آن نوع فعاليت توصيف شود. بنابراين نياز است كه روش هاي موثري براي شناسايي نوع فعاليت از تصاوير ثابت، توسعه داده شوند.
روش هاي يادگيري عميق مانند شبكه هاي عصبي كانولوشني، اخيرا به عنوان يك روش موثر در زمينه هاي مختلف يادگيري ماشين پديدار شده اند و وقتي داده هاي برچسب خورده ي به اندازه كافي بزرگ، براي آموزش در دسترس باشند، مي توانند در عمل دسته بندي، دقت بالايي را به ما بدهند. به دست آوردن يك مجموعه داده ي بزرگ براي آموزش شبكه هاي عصبي كانولوشني، اغلب يك چالش بزرگ است. اين مسئله، در زمينه ي تشخيص فعاليت انسان از روي تصاوير ثابت، يك مشكل بزرگ است. زيرا در اين زمينه، ما مجموعه داده ي برچسب خورده ي به اندازه ي كافي بزرگ نداريم و استفاده از شبكه هاي عصبي كانولوشني عميق، زماني كه داده ي آموزشي كم است، به علت وقوع بيش برازش، مشكل ايجاد مي كند.
در اين پژوهش، ما شبكه هاي عصبي كانولوشني عميق را در تشخيص فعاليت انسان از تصاوير ثابت به كار مي بريم. براي غلبه بر مشكل كمبود داده، از تكنيك انتقال يادگيري استفاده مي كنيم. ما يك روش را با در نظر گرفتن شبكه هاي از قبل آموزش داده شده روي مجموعه داده ي ImageNet پيشنهاد مي كنيم و از آن براي بهبود دقت دسته بندي در مجموعه داده ي Stanford 40 بهره مي بريم. ما از هشت شبكه از پيش آموزش داده شده استفاده مي كنيم و با طراحي تعدادي لايه كه به اخرين لايه ي كانولوشني اين شبكه ها متصل مي شوند، دقت دسته بندي را روي هر كدام از اين شبكه ها گزارش مي كنيم. در نهايت با استفاده از يك روش يادگيري گروهي، توانستيم به دقت ۹۳.۱۷% روي مجموعه داده ي آزمايش Stanford 40 برسيم.
-
تاريخ ورود اطلاعات
1398/03/11
-
عنوان به انگليسي
Human Action Recognition Based on Deep Learning
-
تاريخ بهره برداري
6/1/2019 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
سينا محمدي
-
چكيده به لاتين
Recently still image-based human action recognition has become an active research topic in computer vision and pattern recognition. It focuses on identifying a person's action or behavior from a single image. Unlike the traditional action recognition approaches, where videos or image sequences are used, a still image contains no temporal information for action characterization. Therefore, it is demanding to develop efficient methods for still image-based action recognition.
Deep learning methods such as convolutional neural networks (CNNs) have recently emerged as a dominant paradigm for machine learning in a variety of domains and they can deliver highly accurate classification results when provided with large enough data sets and respective labels. However, acquiring a suitably large data set for training DCNN is often a significant challenge. This is a major issue in the action recognition domain, where we lack large enough labeled data. Using CNNs along with limited labeled data can be problematic, as this leads to extensive overfitting.
In this research, we investigate the use of CNNs for still image-based human action recognition. To overcome the lack of massive labeled action recognition image data sets, we employ the transfer learning technique. We propose a method by considering pretrained CNNs designed for tackling an entirely different classification problem, namely, the ImageNet challenge, and exploit it to improve the classification accuracy in Stanford 40 dataset. We use 8 pretrained CNNs and by designing some layers on top of the last convolutional layer of these CNNs, we report the classification accuracy in each CNN. Finally, by using an ensemble learning technique we managed to achieve 93.17% accuracy in Stanford 40 dataset.
-
لينک به اين مدرک :