-
شماره ركورد
30246
-
پديد آورنده
ابراهيم جعفري مجنده
-
عنوان
تخمين ژست انسان با استفاده از شبكه هاي عميق كانولوشني
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي برق_مخابرات سيستم
-
سال تحصيل
1398
-
تاريخ دفاع
1402/08/22
-
استاد راهنما
سيد علي اصغر بهشتي شيرازي
-
دانشكده
برق
-
چكيده
تخمين ژست انسان يكي از پايهاي ترين و چالشيترين مسائل در حوزه بينايي كامپيوتر است كه ميخواهيم ژست بدن انسان را از تصاوير يا دنباله ويديوي ورودي استخراج كنيم. در تخمين ژست تك نفره از روي تصاوير دو بعدي، موقعيت مفاصل بدن انسان در تصوير ورودي محاسبه و تعيين ميشوند. به بياني ديگر تخمين ژست بدن، روند برآورد و ارزيابي پيكربندي بدن از روي يك تصوير مي باشد. پيشرفتهاي اخير در تكنيكهاي يادگيري عميق موجب پيشرفت عظيم و قابل توجهي در حوزه تخمين ژست انسان شده است كه دليل اصلي آن افزايش روز افزون كاربردهاي جديد مثل تعامل انسان ربات، صنعت بازي، تحليل فعاليتهاي ورزشي و ... است. مدلهاي يادگيري عميق تخمين ژست نياز به تصاوير بسياري براي آموزش و يادگيري ويژگيهاي ژست انسان دارند و اين مسئله يكي از چالشهاي اين موضوع به حساب ميآيد. از الگوريتمهاي بسيار قدرتمند يادگيري عميق در مباحث بينايي ماشين الگوريتم شبكه عصبي كانولوشني است كه براي يادگيري به مجموعه داده عظيمي نيازمند ميباشد. اين نوع شبكه توانايي استخراج ويژگي و انجام عمليات مورد نظر مسئله را به صورت خودكار دارا ميباشند. براي حل يكي از مشكلات آموزش شبكههاي عصبي كانولوشني براي انجام عمليات تخمين ژست و بهبود فرآيند آموزش استفاده از يادگيري انتقالي ميباشد. در اين پايان نامه نيز ما بر آنيم تا با بهرهگيري از شبكههاي عصبي كانولوشني و يادگيري انتقالي عمليات تخمين ژست انسان از روي تصاوير دو بعدي را انجام دهيم. بعد از طراحي و پيادهسازي مدل پيشنهادي با استفاده از كتابخانه پايتورچ و زبان پايتون به آموزش و تست مدل پرداخته شد. در ارزيابي مدل پيشنهادي از معيار PCKh استفاده شد. اين معيار با بدست آوردن دقت 83.78% دقت و عملكرد خوبي را از خود نشان داد. همانطور كه پيشبيني ميشد مدلهاي بر اساس شبكههاي عصبي كانولوشني و همچنين به كار بردن يادگيري انتقالي برخي از مشكلات موجود در اين موضوع را مرتفع كردند
-
تاريخ ورود اطلاعات
1402/09/28
-
عنوان به انگليسي
Human pose estimation with convolutional neural network
-
تاريخ بهره برداري
1/1/1900 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
ابراهيم جعفري مجنده
-
چكيده به لاتين
Human pose estimation is one of the most basic and challenging problems in the field of computer vision, where we want to extract human body pose from images or input video sequence. In estimating the pose of a single person from two-dimensional images, the position of the joints of the human body is calculated and determined in the input image. In other words, body pose estimation is the process of estimating and evaluating the body configuration from an image. Recent advances in deep learning techniques have led to huge and significant progress in the field of human gesture estimation, the main reason for which is the increasing number of new applications such as human-robot interaction, game industry, sports activity analysis, etc. Deep learning models for pose estimation need many images to train and learn human pose features, and this issue is considered one of the challenges of this issue. One of the most powerful deep learning algorithms in machine vision is the convolutional neural network algorithm, which requires a huge data set for learning. This type of network has the ability to extract the feature and perform the desired operation of the problem automatically. Transfer learning is used to solve one of the problems of training convolutional neural networks to perform gesture estimation and improve the training process. In this thesis, we intend to use convolutional neural networks and transfer learning to estimate human pose from two-dimensional images. After designing and implementing the proposed model, the model was trained and tested using the Tensorflow library and Python language. The PCKh criterion was used in the evaluation of the proposed model. This criterion showed good accuracy and performance by obtaining 83.78% accuracy. As expected, models based on convolutional neural networks and also using transfer learning solved some of the problems in this issue.
-
كليدواژه هاي فارسي
تخمين ژست انسان , شبكه هاي عصبي كانولوشني , يادگيري عميق
-
كليدواژه هاي لاتين
human pose estimation , convolutional neural network , Deep learning
-
Author
ebrahim jafari
-
SuperVisor
Seyed Aliasghar Beheshti Shirazi
-
لينک به اين مدرک :