• شماره ركورد
    34252
  • پديد آورنده

    نسترن داب

  • عنوان
    گداخت داده هاي چندوجهي با در نظر گرفتن عامل لذت
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    مهندسي كامپيوتر- نرم‌افزار
  • سال تحصيل
    1401
  • تاريخ دفاع
    1404/7/5
  • استاد راهنما
    محمدرضا كنگاوري
  • استاد مشاور
    اميرهوشنگ تاجفر
  • دانشكده
    دانشكده مهندسي كامپيوتر
  • چكيده
    اين پايان‌نامه به بررسي و ارائه رويكردي نوين براي تشخيص خودكار ميزان لذت‌بخش بودن ويديوها با بهره‌گيري از داده‌هاي چندوجهي (صوت و تصوير) مي‌پردازد. با توجه به افزايش روزافزون محتواي ويديويي و نقش فزاينده¬ي آن در زندگي روزمره، درك و پيش‌بيني واكنش‌هاي عاطفي كاربران، به‌ويژه احساس لذت، از اهميت ويژه‌اي برخوردار شده¬است. هدف اصلي اين پژوهش، توسعه يك مدل محاسباتي است كه با گداخت هوشمندانه اطلاعات از وجه‌هاي مختلف ويديويي و با مدل‌سازي مبتني بر نظريه‌هاي روان‌شناختي لذت، قادر به تخمين ميزان لذت القا شده توسط ويديو در بينندگان باشد. مطالعات پيشين در زمينه تحليل احساسات ويديويي اغلب بر رويكردهاي داده‌محور متكي هستند كه به شدت به برچسب‌هاي انساني جانب¬دارانه وابسته هستند و تنها بر احساسات طبقه‌بندي‌شده تمركز دارند تا اينكه مستقيماً به جنبه لذت از ويديوها بپردازند. اين مطالعات همچنين اغلب نقش حياتي ارزيابي‌هاي شناختي در تجربه عاطفي را ناديده گرفته و احساسات را به عنوان واكنش‌هاي مستقيم به محرك‌ها در نظر مي‌گيرند. علاوه بر اين، كمبود قابل توجهي از مجموعه داده‌هايي كه به صراحت براي لذت از ويديو برچسب‌گذاري شده باشند، وجود دارد. در اين راستا، بر محاسبه-ي لذت القا شده از داده¬هاي چندوجهي، با تركيب مدل¬هاي داده-محور و مدل¬-محور متمركز شده‌ايم. بدين منظور، با رويكردي نوآورانه كه ارزيابي‌هاي شناختي ما از محرك‌ها را در نظر مي‌گيرد، براي محاسبه ميزان لذت، از نظريه‌هاي روان‌شناختي لذت الهام گرفته شده¬¬است و روش¬هاي پيشرفته¬ي استخراج ويژگي و گداخت داده¬هاي چندوجهي براي استخراج تعاملات پيچيده بين اين وجه‌ها بررسي و پياده‌سازي شده¬اند. اين امر امكان شناسايي الگوهاي پنهان در داده‌هاي چندوجهي را كه به طور مستقيم با تجربه لذت مرتبط هستند، فراهم مي‌آورد. اين مدل‌سازي محاسباتي نه تنها به شناسايي محتواي لذت‌بخش مي‌پردازد، بلكه به دنبال درك ظرايف و ابعاد مختلف لذت در پاسخ به محرك‌هاي ويديويي است و در نهايت، به جاي اتكا به داده‌هاي محدود، توانايي توليد برچسب‌هاي لذت‌بخش بودن را براي مجموعه¬داده¬ها فراهم مي‌كند. نتايج حاصل از ارزيابي‌هاي جامع، نشان‌دهنده اثربخشي رويكرد پيشنهادي در تشخيص دقيق ميزان لذت‌بخش بودن ويديوها است. اين پژوهش، گامي مهم در جهت توسعه سيستم‌هاي توصيه‌گر محتوا، ابزارهاي توليد محتواي هوشمند و فهم عميق‌تر ارتباط بين محتواي ديجيتال و واكنش‌هاي عاطفي انساني محسوب مي‌شود.
  • تاريخ ورود اطلاعات
    1404/10/05
  • عنوان به انگليسي
    Multimodal data fusion considering pleasure factor
  • تاريخ بهره برداري
    9/27/2026 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    نسترن داب

  • چكيده به لاتين
    This Study presents a novel approach for the automatic detection of the Induced Pleasure of Videos by fusion of multimodal data (audio an‎d visual). Given the ever-increasing volume of video content an‎d its growing role in daily life, understan‎ding an‎d predicting usersʹ emotional responses, particularly the sense of pleasure, has gained significant importance. The primary goal of this research is to develop a computational model that, by intelligently integrating information from various video modalities an‎d modeling based on psychological theories of pleasure, can estimate the level of pleasure induced by a video in viewers. Previous studies on video sentiment analysis have often relied on data-driven approaches that heavily depend on biased human labels an‎d focus solely on categorical emotions rather than directly addressing the aspect of video pleasantness. These studies have also frequently overlooked the critical role of cognitive appraisals in emotional experiences, treating emotions as direct responses to stimuli. Furthermore, there is a significant lack of datasets explicitly labeled for video enjoyment. In this regard, we have focused on computing induced pleasure from multimodal data by combining data-driven an‎d model-driven approaches. To this end, an innovative approach that considers our cognitive appraisals of stimuli has been adopted, drawing inspiration from psychological theories of pleasure to calculate the level of pleasure. Advanced feature extraction an‎d multimodal data fusion techniques have been explored an‎d implemented to capture complex interactions between these modalities. This enables the identification of hidden patterns in multimodal data that are directly related to the experience of pleasure. This computational modeling not only addresses the identification of pleasurable content but also seeks to understan‎d the nuances an‎d various dimensions of pleasure in response to video stimuli. Ultimately, it provides the capability to generate pleasure labels for datasets instead of relying on limited data. The results of comprehensive eva‎luations demonstrate the effectiveness of the proposed approach in accurately detecting the induced pleasure of videos. This research represents a significant step toward developing content recommendation systems, intelligent content creation tools, an‎d a deeper understan‎ding of the relationship between digital content an‎d human emotional responses.
  • كليدواژه هاي فارسي
    لذت , گداخت , يادگيري عميق , تحليل محتواي عاطفي ويديويي
  • كليدواژه هاي لاتين
    pleasure , fusion , Deep Learning , video affective content analysis
  • Author
    Nastaran Dab
  • SuperVisor
    Dr. Mohamadreza Kangavari