مهرداد سليمي

عنوان

تشخيص نظرات تقلبي با استفاده از شبكه هاي عصبي ژرف

مقطع تحصيلي

كارشناسي ارشد

رشته تحصيلي

هوش مصنوعي و رباتيك

تاريخ دفاع

مهر ۱۳۹۶

استاد راهنما

دكتر محمدرضا جاهد مطلق

دانشكده

كامپيوتر

چكيده

به كمك اينترنت و دسترسي آسان به آن، خريداران مي‌توانند نظرات و تجربيات ساير افراد در شبكه‌هاي اجتماعي و فروشگاه‌هاي برخط را مطالعه كنند و با اطمينان و اطلاعات بيشتري در مورد خريد يا عدم خريد يك محصول تصميم‌گيري نمايند. همين ويژگي كه امكان ثبت نظر و تحليل محصولات را براي همه فراهم كرده، يك تهديد بالقوه محسوب مي‌شود؛ به اين دليل كه افراد متقلب مي‌توانند به راحتي با ثبت نظرات تقلبي و خلاف واقع، مشتري‌ها را به سمت خريد محصولاتي كه مدنظرشان است سوق دهند. تا به امروز پژوهش‌هاي بسياري براي تشخيص اين نظرات تقلبي با استفاده از گراف ارتباطي بين كاربران و محصولات، محاسبه ميزان انحراف زماني و امتيازي كاربران در نظردهي و استفاده از متن نظرات انجام شده، اما بسياري از آن‌ها روي مجموعه‌داده‌هاي ساختگي و مصنوعي اعمال شده‌اند و از طرفي بخش بزرگي از كارهاي گذشته روي استخراج و مهندسي ويژگي‌ها انجام شده تا با انتخاب ويژگي‌هاي مناسب‌تر، دقت را افزايش دهند كه اين امر كاري طاقت‌فرسا و نيازمند دانش تخصصي در شناخت رفتار كاربر است كه تاكنون نيز دقت لازم را نداشته است. در اين پژوهش، از شبكه‌هاي عصبي بازگشتي براي تشخيص كاربران متقلب استفاده مي‌كنيم. مجموعه‌داده نظراتي را كه براي برنامه‌هاي منتشر شده روي فروشگاه برخط كافه‌بازار ثبت شده‌اند، در قالب سري‌هاي زماني چند متغيره مدل مي‌كنيم و سپس از ساختاري به نام رمز كننده خودكار حافظه طولاني كوتاه-مدت كه يك شبكه عصبي دو بخشي است براي تشخيص بازه‌هاي زماني‌اي كه در آن‌ها تقلب انجام شده استفاده مي‌كنيم. در نهايت با تركيب خروجي شبكه عصبي با يكي از مدل‌هاي يادگيري تكرار شونده كه مبتني بر گراف ارتباطي بين كاربران و محصولات است، نشان مي‌دهيم كه دقت از ۷۳ درصد به ۹۹ درصد افزايش مي‌يابد و وابستگي مدل به پارامتر‌هاي يادگيري تكرار شونده را كه در روش‌هاي بي‌ناظر به صورت دستي و تجربي تعيين مي‌شدند به مقدار زيادي كاهش مي‌دهيم.

تاريخ ورود اطلاعات

1396/10/24

تاريخ بهره برداري

1/14/2018 12:00:00 AM

دانشجوي وارد كننده اطلاعات

مهرداد سليمي

Name: مهرداد سليمي
Author: مهرداد سليمي

چكيده به لاتين

Internet -which is easier to access more than anytime- makes potential customers able to read about other customers’ opinions and experiences on specific products using forums and online stores that finally help them make decision about buying a product confidently. Meanwhile it’s a threat; Spammers may use this feature to write fake reviews to lead potential customers towards specific product which finally will cause gaining more profit for spammer or whom they are working for. To this date, researchers have tried to detect these reviews using user-product network models, timing and rating deviation methods and applying natural language processing methods on text of reviews. But most of these studies were done on made-up datasets which their ineffectiveness in modeling real review data have been proven. Main part of these studies focused have focused on feature engineering and feature selection to get better results but it’s overwhelming and needs expert knowledge which is not accurate enough. According to our knowledge, for the first time we tried to use recurrent neural network to detect fraudulent users. We modeled the reviews left on CafeBazaar for apps published in financial category as a multivariate time series and use LSTM-Encoder-Decoder to detect periods which have deviation in comparison with normal periods. We then combined result of our methods with one of iterative learning based algorithm. We show that this composed method improve precision from 73 to 99 percent. Also we show that this hybrid method is more robust to parameters of iterative learning which in unsupervised problems we should set manually and by experience.

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=18327&Field=0&DTC=6