شماره ركورد
7793
پديد آورنده
دادفر مومني
عنوان
استفاده از روشهاي استخراج موضوع از متن براي يافتن شباهت موضوعي فيلمها با استفاده از زيرنويس
مقطع تحصيلي
كارشناسي
رشته تحصيلي
مهندسي كامپيوتر
سال فارغ التحصيلي
1400
استاد راهنما
دكتر حسين رحماني
دانشجوي وارد كننده اطلاعات
دادفر مومني
تاريخ ورود اطلاعات
1401/02/19
دانشكده
مهندسي كامپيوتر
عنوان به انگليسي
Using Topic detection techniques to extract movies similarity based on their subtitle
چكيده
امروزه باتوجهبه حجم عظيم دادهها، براي جستوجو ميان آنها، ناگزيريم از روشهايي بهره بگيريم كه بتوانيم اطلاعات را طبق نياز خود پالايش كنيم. اين چالش درزمينه يافتن فيلمها و سريالهايي با موضوعات مشابه و مرتبط درجهت پيشنهاد و كوچككردن فضاي جستوجو نيز وجود دارد. بنابراين روشهايي لازم است كه بتوانند به نحوي كارآمد فيلمهاي مرتبط و داراي موضوعات مشابه را تشخيص دهند و در اختيار كاربران بگذارند.
اكثر سرويسهاي موجود در اين زمينه، بر اطلاعات تهيهشده توسط انسان تكيه ميكنند و معمولاً محتواي اصلي فيلم، توسط آنها بهكارگرفته نميشود. اين سرويسها از اطلاعاتي مانند سليقه و نظرات كاربران، يا ويژگيهايي نظير بازيگران، كارگردان و ژانر فيلم، يا تركيبي از اين دو استفاده ميكنند.
استخراج موضوع از متن شاخهاي از پردازش زبانهاي طبيعي و متنكاوي است كه پايه بسياري از تحليلهاي متني ميباشد. روشهاي مختلفي براي تشخيص موضوع از متن وجود دارد كه از ميان آنها ميتوان به روشهاي خوشهبندي، تجزيه ماتريس و روشهاي بر پايه احتمالات اشاره كرد.
در اين پروژه سعي ميشود با استفاده از محتواي متني فيلمها (زيرنويس) و روشهاي استخراج موضوع از متن و تحليل گراف شباهت، روشي براي ارائه فيلمها بهصورت تركيبي از موضوعات متفاوت بدست آوريم و از آن براي كاوش فضاي موضوعي فيلمها و استخراج ارتباطات و شباهتهاي نهفتهشان بهره بگيريم.
كليدواژه ها
دادهكاوي , استخراج موضوع , فيلم , زيرنويس , تحليل گراف