چکيده
چكيده:
هدف اين سمينار، توسعه روشهاي يادگيري براي پيشبرد تجزيه و تحليل خودكار و تفسير حركت انسان از
، ديدگاه هاي مختلف و بر اساس منابع مختلف اطلاعاتي، مانند تصاوير، فيلم،داده عمق 1، داده هاي ثبت حركت 2
حسگرهاي صوتي و اينرسي است. براي اين منظور، ما تعدادي از مدل هاي عصبي عميق را براي طبقه بندي
نظارت شده و يادگيري ويژگي هاي نيمه نظارت و همچنين مدل سازي وابستگي هاي زماني پيشنهاد مي
كنيم و كارايي آنها را در مجموعه اي از موارد جالب از جمله تشخيص، طبقه بندي، تخمين پارامتر و شناسايي
كاربر نشان مي دهيم.
ابتدا، ما روشي را براي تشخيص اقدامات انساني، ژست ها و طبقه بندي مبتني بر يادگيري عميق چند مقياس
و چند وجهي 3 با استفاده از سيگنال هاي بصري(مانند داده هاي ويديويي و داده هاي عمق) را ارائه مي دهيم.
تمركز اصلي ما روي استراتژي آموزشي است كه اولاً از منبع تك وجهي شروع مي كند و سپس با تركيب
تدريجي كانال هاي جداگانه است و آموزش از طريق همبستگي هاي بين روشي 4، منحصر به فرد بودن هر
وجه را حفظ مي كند. با بهره برداري از استراتژي هاي مختلف تلفيقي، از جمله انتخاب هر فريم و مدل سازي
وابستگي زماني با يك مدل مكرر، نشان مي دهيم كه ادغام چندين روش در چندين مقياس مكاني و زماني
منجر به افزايش قابل توجهي در دقت شناسايي مي شود و به مدل اجازه مي دهد خطاي حاصل از طبقه بندي
كننده هاي فردي و همچنين نويز در كانال هاي جداگانه را جبران كنيم.
واژه هاي كليدي: شناسايي فعاليت انساني، شبكه هاي عصبي كانولووشني، ساختار هاي توپولوژي در مدل
سازي،يادگيري ماشين.