-
شماره ركورد
7793
-
پديد آورنده
دادفر مومني
-
عنوان
استفاده از روشهاي استخراج موضوع از متن براي يافتن شباهت موضوعي فيلمها با استفاده از زيرنويس
-
مقطع تحصيلي
كارشناسي
-
رشته تحصيلي
مهندسي كامپيوتر
-
سال فارغ التحصيلي
1400
-
استاد راهنما
دكتر حسين رحماني
-
دانشجوي وارد كننده اطلاعات
دادفر مومني
-
تاريخ ورود اطلاعات
1401/02/19
-
دانشكده
مهندسي كامپيوتر
-
عنوان به انگليسي
Using Topic detection techniques to extract movies similarity based on their subtitle
-
چكيده
امروزه باتوجهبه حجم عظيم دادهها، براي جستوجو ميان آنها، ناگزيريم از روشهايي بهره بگيريم كه بتوانيم اطلاعات را طبق نياز خود پالايش كنيم. اين چالش درزمينه يافتن فيلمها و سريالهايي با موضوعات مشابه و مرتبط درجهت پيشنهاد و كوچككردن فضاي جستوجو نيز وجود دارد. بنابراين روشهايي لازم است كه بتوانند به نحوي كارآمد فيلمهاي مرتبط و داراي موضوعات مشابه را تشخيص دهند و در اختيار كاربران بگذارند.
اكثر سرويسهاي موجود در اين زمينه، بر اطلاعات تهيهشده توسط انسان تكيه ميكنند و معمولاً محتواي اصلي فيلم، توسط آنها بهكارگرفته نميشود. اين سرويسها از اطلاعاتي مانند سليقه و نظرات كاربران، يا ويژگيهايي نظير بازيگران، كارگردان و ژانر فيلم، يا تركيبي از اين دو استفاده ميكنند.
استخراج موضوع از متن شاخهاي از پردازش زبانهاي طبيعي و متنكاوي است كه پايه بسياري از تحليلهاي متني ميباشد. روشهاي مختلفي براي تشخيص موضوع از متن وجود دارد كه از ميان آنها ميتوان به روشهاي خوشهبندي، تجزيه ماتريس و روشهاي بر پايه احتمالات اشاره كرد.
در اين پروژه سعي ميشود با استفاده از محتواي متني فيلمها (زيرنويس) و روشهاي استخراج موضوع از متن و تحليل گراف شباهت، روشي براي ارائه فيلمها بهصورت تركيبي از موضوعات متفاوت بدست آوريم و از آن براي كاوش فضاي موضوعي فيلمها و استخراج ارتباطات و شباهتهاي نهفتهشان بهره بگيريم.
-
كليدواژه ها
دادهكاوي , استخراج موضوع , فيلم , زيرنويس , تحليل گراف
-
لينک به اين مدرک :