-
شماره ركورد
33184
-
پديد آورنده
بهار رستمي زاده
-
عنوان
مكان يابي مركز مردمك چشم با استفاده از روش هاي يادگيري عميق
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي برق گرايش مخابرات سيستم
-
سال تحصيل
1400
-
تاريخ دفاع
1403/10/29
-
استاد راهنما
دكتر سيد علي اصغر بهشتي شيرازي
-
استاد مشاور
ندارم
-
دانشكده
مهندسي برق
-
چكيده
درك فرآيندهاي مربوط به ادراك بصري انسان موضوع تحقيقات گستردهاي در زمينههاي پزشكي، روانشناسي، تبليغات، خودروهاي خودران، كنترل برنامهها و بسياري زمينههاي ديگر بوده است. در سالهاي اخير، رديابهاي چشمي قابل نصب روي سر امكان اندازهگيري و بررسي رفتار بصري انسان در وظايف دنياي واقعي را فراهم كردهاند. رديابي نقطه نگاه و حركات چشم، به شناسايي و مكانيابي مركز مردمك چشم به عنوان يك گام پيشنياز متكي است.
در اين زمينه كمبود دادههاي تصويري و همچنين سخت و زمانبر بودن فرآيند برچسبگذاري مركز مردمك چشم، ميتواند باعث ايجاد محدوديت در زمينه آموزش مدلهاي يادگيري عميق شود، زيرا اين مدلها براي رسيدن به دقتهاي بالا به تعداد دادههاي آموزشي بالايي نياز دارند. همچنين تنوع كم دادههاي موجود اين كار را سختتر كرده است.
هدف اين پژوهش در گام اول، ايجاد يك مجموعه داده متنوع با استفاده از روشهاي دستهبندي فازي براي تنظيم دقيق يك مدل يادگيري عميق است تا بتوان نياز به استفاده از روشهاي افزايش داده براي ايجاد تنوع را برطرف نمايد. در اين مرحله توانسيم به اتلاف 0.86 پيكسل با استفاده از تابع اتلاف هوبر دست يابيم.
در گام بعد، براي شناسايي دادههاي آموزشي مفيد و تاثيرگذار، يك الگوريتم پيشنهاد شده است تا بتوان مدل را با انتخاب يك مجموعهي كوچكتر از ميان دادههاي آموزشي تعليم داد. با اينكار ميتوان صرفا دادههاي مفيد براي آموزش مدل را برچسبگذاري كرد و همچنين زمان لازم براي تنظيم دقيق را تا حد قابل توجهي كاهش داد. در اين مرحله، توانستيم با استفاده از صرفا 57 درصد كل دادههاي آموزشي و تابع اتلاف هوبر، به اتلاف 0.98 پيكسل دست پيدا كنيم، هرچند كه با اين روش دقت مدل در مكانيابي مركز مردمك چشم كمي كاهش مييابد، اما زمان لازم براي تنظيم دقيق مدل به طرز قابل توجهي كاهش پيدا كرد.
-
تاريخ ورود اطلاعات
1403/12/22
-
عنوان به انگليسي
pupil's center localization using deep learning techniques
-
تاريخ بهره برداري
1/1/1900 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
بهار رستمي زاده
-
چكيده به لاتين
Understanding the processes related to human visual perception has been a major focus of research in various fields, including medicine, psychology, advertising, autonomous vehicles, program control, and many others. In recent years, head-mounted eye trackers have enabled the measurement and analysis of human visual behavior in real-world tasks. Eye gaze tracking and eye movements rely on identifying and locating the center of the pupil as a prerequisite step.
In this domain, the scarcity of image data and the time-consuming nature of labeling the pupil center can impose limitations on training deep learning models, as these models require large amounts of training data to achieve high accuracy. Additionally, the low diversity of available data further complicates the process.
The primary objective of this study is to create a diverse dataset using fuzzy clustering methods to fine-tune a deep learning model, thereby reducing the need for data augmentation techniques to introduce diversity. In this phase, we achieved a loss of 0.86 pixels using the Huber loss function.
In the next step, an algorithm is proposed to identify useful and influential training data, allowing the model to be trained with a smaller subset of the available data. This approach enables labeling only the most relevant data for model training while significantly reducing the time required for fine-tuning. In this stage, using only 57 percent of the total training data and the Huber loss function, we achieved a loss of 0.98 pixels. Although this method slightly reduces the model’s accuracy in locating the pupil center, it significantly decreases the time required for fine-tuning.
-
كليدواژه هاي فارسي
رديابي چشم , مكان يابي مركز مردمك چشم , يادگيري عميق , ليبل گذاري
-
كليدواژه هاي لاتين
eye tracking , pupil center localization , deep learning , labeling
-
Author
Bahar Rostamizadeh
-
SuperVisor
Dr. Ali Asghar Beheshti Shirazi
-
لينک به اين مدرک :