چکيده
اخيرا شناسايي فعاليت انسان از تصاوير ثابت، به يك زمينه¬ي تحقيقاتي مهم در بينايي كامپيوتر و تشخيص الگو تبديل شده است. اين زمينه سعي دارد كه نوع رفتار يا فعاليت انسان را از تصوير ثابت شناسايي كند. بر خلاف ويدئو، يك تصوير ثابت اطلاعات حركتي ندارد كه به وسيله ي آن نوع فعاليت توصيف شود. بنابراين نياز است كه روش¬هاي موثري براي شناسايي نوع فعاليت از تصاوير ثابت، توسعه داده شوند.
روش¬هاي يادگيري عميق مانند شبكه¬هاي عصبي كانولوشني، اخيرا به عنوان يك روش موثر در زمينه¬هاي مختلف يادگيري ماشين پديدار شده¬اند و وقتي داده¬هاي برچسب خورده¬¬ي به اندازه كافي بزرگ، براي آموزش در دسترس باشند، مي¬توانند درعمل دسته¬بندي، دقت بالايي را به ما بدهند. به دست آوردن يك مجموعه داده¬ي بزرگ براي آموزش شبكه¬هاي عصبي كانولوشني، اغلب يك چالش بزرگ است. اين مسئله، در زمينه¬ي تشخيص فعاليت انسان از روي تصاوير ثابت، يك مشكل بزرگ است. زيرا در اين زمينه، ما مجموعه داده¬ي برچسب خورده¬ي به اندازه¬ي كافي بزرگ نداريم و استفاده از شبكه¬هاي عصبي كانولوشني عميق، زماني كه داده¬ي آموزشي كم است، به علت وقوع بيش¬برازش، مشكل ايجاد مي¬كند.
در اين تحقيق به بررسي روش¬هاي مقابله با اين مشكلات و استفاده از تعامل انسان با اشياء به عنوان روشي براي تشخيص فعاليت انسان مي¬پردازيم.