شماره ركورد
34252
پديد آورنده
نسترن داب
عنوان
گداخت داده هاي چندوجهي با در نظر گرفتن عامل لذت
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي كامپيوتر- نرمافزار
سال تحصيل
1401
تاريخ دفاع
1404/7/5
استاد راهنما
محمدرضا كنگاوري
استاد مشاور
اميرهوشنگ تاجفر
دانشكده
دانشكده مهندسي كامپيوتر
چكيده
اين پاياننامه به بررسي و ارائه رويكردي نوين براي تشخيص خودكار ميزان لذتبخش بودن ويديوها با بهرهگيري از دادههاي چندوجهي (صوت و تصوير) ميپردازد. با توجه به افزايش روزافزون محتواي ويديويي و نقش فزاينده¬ي آن در زندگي روزمره، درك و پيشبيني واكنشهاي عاطفي كاربران، بهويژه احساس لذت، از اهميت ويژهاي برخوردار شده¬است. هدف اصلي اين پژوهش، توسعه يك مدل محاسباتي است كه با گداخت هوشمندانه اطلاعات از وجههاي مختلف ويديويي و با مدلسازي مبتني بر نظريههاي روانشناختي لذت، قادر به تخمين ميزان لذت القا شده توسط ويديو در بينندگان باشد. مطالعات پيشين در زمينه تحليل احساسات ويديويي اغلب بر رويكردهاي دادهمحور متكي هستند كه به شدت به برچسبهاي انساني جانب¬دارانه وابسته هستند و تنها بر احساسات طبقهبنديشده تمركز دارند تا اينكه مستقيماً به جنبه لذت از ويديوها بپردازند. اين مطالعات همچنين اغلب نقش حياتي ارزيابيهاي شناختي در تجربه عاطفي را ناديده گرفته و احساسات را به عنوان واكنشهاي مستقيم به محركها در نظر ميگيرند. علاوه بر اين، كمبود قابل توجهي از مجموعه دادههايي كه به صراحت براي لذت از ويديو برچسبگذاري شده باشند، وجود دارد. در اين راستا، بر محاسبه-ي لذت القا شده از داده¬هاي چندوجهي، با تركيب مدل¬هاي داده-محور و مدل¬-محور متمركز شدهايم. بدين منظور، با رويكردي نوآورانه كه ارزيابيهاي شناختي ما از محركها را در نظر ميگيرد، براي محاسبه ميزان لذت، از نظريههاي روانشناختي لذت الهام گرفته شده¬¬است و روش¬هاي پيشرفته¬ي استخراج ويژگي و گداخت داده¬هاي چندوجهي براي استخراج تعاملات پيچيده بين اين وجهها بررسي و پيادهسازي شده¬اند. اين امر امكان شناسايي الگوهاي پنهان در دادههاي چندوجهي را كه به طور مستقيم با تجربه لذت مرتبط هستند، فراهم ميآورد. اين مدلسازي محاسباتي نه تنها به شناسايي محتواي لذتبخش ميپردازد، بلكه به دنبال درك ظرايف و ابعاد مختلف لذت در پاسخ به محركهاي ويديويي است و در نهايت، به جاي اتكا به دادههاي محدود، توانايي توليد برچسبهاي لذتبخش بودن را براي مجموعه¬داده¬ها فراهم ميكند. نتايج حاصل از ارزيابيهاي جامع، نشاندهنده اثربخشي رويكرد پيشنهادي در تشخيص دقيق ميزان لذتبخش بودن ويديوها است. اين پژوهش، گامي مهم در جهت توسعه سيستمهاي توصيهگر محتوا، ابزارهاي توليد محتواي هوشمند و فهم عميقتر ارتباط بين محتواي ديجيتال و واكنشهاي عاطفي انساني محسوب ميشود.
تاريخ ورود اطلاعات
1404/10/05
عنوان به انگليسي
Multimodal data fusion considering pleasure factor
تاريخ بهره برداري
9/27/2026 12:00:00 AM
دانشجوي وارد كننده اطلاعات
نسترن داب
چكيده به لاتين
This Study presents a novel approach for the automatic detection of the Induced Pleasure of Videos by fusion of multimodal data (audio and visual). Given the ever-increasing volume of video content and its growing role in daily life, understanding and predicting usersʹ emotional responses, particularly the sense of pleasure, has gained significant importance. The primary goal of this research is to develop a computational model that, by intelligently integrating information from various video modalities and modeling based on psychological theories of pleasure, can estimate the level of pleasure induced by a video in viewers. Previous studies on video sentiment analysis have often relied on data-driven approaches that heavily depend on biased human labels and focus solely on categorical emotions rather than directly addressing the aspect of video pleasantness. These studies have also frequently overlooked the critical role of cognitive appraisals in emotional experiences, treating emotions as direct responses to stimuli. Furthermore, there is a significant lack of datasets explicitly labeled for video enjoyment. In this regard, we have focused on computing induced pleasure from multimodal data by combining data-driven and model-driven approaches. To this end, an innovative approach that considers our cognitive appraisals of stimuli has been adopted, drawing inspiration from psychological theories of pleasure to calculate the level of pleasure. Advanced feature extraction and multimodal data fusion techniques have been explored and implemented to capture complex interactions between these modalities. This enables the identification of hidden patterns in multimodal data that are directly related to the experience of pleasure. This computational modeling not only addresses the identification of pleasurable content but also seeks to understand the nuances and various dimensions of pleasure in response to video stimuli. Ultimately, it provides the capability to generate pleasure labels for datasets instead of relying on limited data. The results of comprehensive evaluations demonstrate the effectiveness of the proposed approach in accurately detecting the induced pleasure of videos. This research represents a significant step toward developing content recommendation systems, intelligent content creation tools, and a deeper understanding of the relationship between digital content and human emotional responses.
كليدواژه هاي فارسي
لذت , گداخت , يادگيري عميق , تحليل محتواي عاطفي ويديويي
كليدواژه هاي لاتين
pleasure , fusion , Deep Learning , video affective content analysis
Author
Nastaran Dab
SuperVisor
Dr. Mohamadreza Kangavari