-
شماره ركورد
18327
-
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
۱۸۳۲۷
-
پديد آورنده
مهرداد سليمي
-
عنوان
تشخيص نظرات تقلبي با استفاده از شبكه هاي عصبي ژرف
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
هوش مصنوعي و رباتيك
-
تاريخ دفاع
مهر ۱۳۹۶
-
استاد راهنما
دكتر محمدرضا جاهد مطلق
-
دانشكده
كامپيوتر
-
چكيده
به كمك اينترنت و دسترسي آسان به آن، خريداران ميتوانند نظرات و تجربيات ساير افراد در شبكههاي اجتماعي و فروشگاههاي برخط را مطالعه كنند و با اطمينان و اطلاعات بيشتري در مورد خريد يا عدم خريد يك محصول تصميمگيري نمايند. همين ويژگي كه امكان ثبت نظر و تحليل محصولات را براي همه فراهم كرده، يك تهديد بالقوه محسوب ميشود؛ به اين دليل كه افراد متقلب ميتوانند به راحتي با ثبت نظرات تقلبي و خلاف واقع، مشتريها را به سمت خريد محصولاتي كه مدنظرشان است سوق دهند.
تا به امروز پژوهشهاي بسياري براي تشخيص اين نظرات تقلبي با استفاده از گراف ارتباطي بين كاربران و محصولات، محاسبه ميزان انحراف زماني و امتيازي كاربران در نظردهي و استفاده از متن نظرات انجام شده، اما بسياري از آنها روي مجموعهدادههاي ساختگي و مصنوعي اعمال شدهاند و از طرفي بخش بزرگي از كارهاي گذشته روي استخراج و مهندسي ويژگيها انجام شده تا با انتخاب ويژگيهاي مناسبتر، دقت را افزايش دهند كه اين امر كاري طاقتفرسا و نيازمند دانش تخصصي در شناخت رفتار كاربر است كه تاكنون نيز دقت لازم را نداشته است.
در اين پژوهش، از شبكههاي عصبي بازگشتي براي تشخيص كاربران متقلب استفاده ميكنيم. مجموعهداده نظراتي را كه براي برنامههاي منتشر شده روي فروشگاه برخط كافهبازار ثبت شدهاند، در قالب سريهاي زماني چند متغيره مدل ميكنيم و سپس از ساختاري به نام رمز كننده خودكار حافظه طولاني كوتاه-مدت كه يك شبكه عصبي دو بخشي است براي تشخيص بازههاي زمانياي كه در آنها تقلب انجام شده استفاده ميكنيم. در نهايت با تركيب خروجي شبكه عصبي با يكي از مدلهاي يادگيري تكرار شونده كه مبتني بر گراف ارتباطي بين كاربران و محصولات است، نشان ميدهيم كه دقت از ۷۳ درصد به ۹۹ درصد افزايش مييابد و وابستگي مدل به پارامترهاي يادگيري تكرار شونده را كه در روشهاي بيناظر به صورت دستي و تجربي تعيين ميشدند به مقدار زيادي كاهش ميدهيم.
-
تاريخ ورود اطلاعات
1396/10/24
-
تاريخ بهره برداري
1/14/2018 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
مهرداد سليمي
-
چكيده به لاتين
Internet -which is easier to access more than anytime- makes potential customers able to read about other customers’ opinions and experiences on specific products using forums and online stores that finally help them make decision about buying a product confidently. Meanwhile it’s a threat; Spammers may use this feature to write fake reviews to lead potential customers towards specific product which finally will cause gaining more profit for spammer or whom they are working for.
To this date, researchers have tried to detect these reviews using user-product network models, timing and rating deviation methods and applying natural language processing methods on text of reviews. But most of these studies were done on made-up datasets which their ineffectiveness in modeling real review data have been proven.
Main part of these studies focused have focused on feature engineering and feature selection to get better results but it’s overwhelming and needs expert knowledge which is not accurate enough.
According to our knowledge, for the first time we tried to use recurrent neural network to detect fraudulent users.
We modeled the reviews left on CafeBazaar for apps published in financial category as a multivariate time series and use LSTM-Encoder-Decoder to detect periods which have deviation in comparison with normal periods.
We then combined result of our methods with one of iterative learning based algorithm. We show that this composed method improve precision from 73 to 99 percent. Also we show that this hybrid method is more robust to parameters of iterative learning which in unsupervised problems we should set manually and by experience.
-
لينک به اين مدرک :