• شماره ركورد
    7793
  • پديد آورنده

    دادفر مومني

  • عنوان
    استفاده از روش‌هاي استخراج موضوع از متن براي يافتن شباهت موضوعي فيلم‌ها با استفاده از زيرنويس
  • مقطع تحصيلي
    كارشناسي
  • رشته تحصيلي
    مهندسي كامپيوتر
  • سال فارغ التحصيلي
    1400
  • استاد راهنما
    دكتر حسين رحماني
  • دانشجوي وارد كننده اطلاعات

    دادفر مومني

  • تاريخ ورود اطلاعات
    1401/02/19
  • دانشكده
    مهندسي كامپيوتر
  • عنوان به انگليسي
    Using Topic detection techniques to extract movies similarity based on their subtitle
  • چكيده
    امروزه باتوجه‌به حجم عظيم داده‌ها، براي جست‌وجو ميان آن‌ها، ناگزيريم از روش‌هايي بهره بگيريم كه بتوانيم اطلاعات را طبق نياز خود پالايش كنيم. اين چالش درزمينه يافتن فيلم‌ها و سريال‌هايي با موضوعات مشابه و مرتبط درجهت پيشنهاد و كوچك‌كردن فضاي جست‌وجو نيز وجود دارد. بنابراين روش‌هايي لازم است كه بتوانند به نحوي كارآمد فيلم‌هاي مرتبط و داراي موضوعات مشابه را تشخيص دهند و در اختيار كاربران بگذارند. اكثر سرويس‌هاي موجود در اين زمينه، بر اطلاعات تهيه‌شده توسط انسان تكيه مي‌كنند و معمولاً محتواي اصلي فيلم، توسط آنها بهكارگرفته نميشود. اين سرويس‌ها از اطلاعاتي مانند سليقه و نظرات كاربران، يا ويژگيهايي نظير بازيگران، كارگردان و ژانر فيلم، يا تركيبي از اين دو استفاده مي‌كنند. استخراج موضوع از متن شاخه‌اي از پردازش زبان‌هاي طبيعي و متن‌كاوي است كه پايه بسياري از تحليل‌هاي متني مي‌باشد. روش‌هاي مختلفي براي تشخيص موضوع از متن وجود دارد كه از ميان آن‌ها مي‌توان به روش‌هاي خوشه‌بندي، تجزيه ماتريس و روش‌هاي بر پايه احتمالات اشاره كرد. در اين پروژه سعي مي‌شود با استفاده از محتواي متني فيلم‌ها (زيرنويس) و روش‌هاي استخراج موضوع از متن و تحليل گراف شباهت، روشي براي ارائه فيلم‌ها به‌صورت تركيبي از موضوعات متفاوت بدست آوريم و از آن براي كاوش فضاي موضوعي فيلم‌ها و استخراج ارتباطات و شباهت‌هاي نهفته‌شان بهره بگيريم.
  • كليدواژه ها
    داده‌كاوي , استخراج موضوع , فيلم , زيرنويس , تحليل گراف