-
شماره ركورد
28187
-
پديد آورنده
مهدي اسدي خمامي
-
عنوان
ارائه يك سيستم توصيهگر تركيبي مبتني بر يادگيري تقويتي و شبكهي تقابلي به همراه تحليل نظرات كاربران
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي صنايع-سيستم هاي اقتصادي اجتماعي
-
سال تحصيل
1398
-
تاريخ دفاع
1401/11/03
-
استاد راهنما
دكتر مهدي غضنفري
-
استاد مشاور
دكتر ناصر مزيني
-
دانشكده
مهندسي صنايع
-
چكيده
سيستمهاي توصيهگر در دنياي امروز از اهميت و جايگاه ويژهاي برخوردارند. با توجه به حجم بالاي دادهها و حق انتخاب افراد از بين تعداد زياد گزينهها، در بسياري از موارد افراد دچار مشكل سرريز اطلاعات شده و نميتوانند بهترين گزينه را براي خود انتخاب كنند. سيستمهاي توصيهگر كمك ميكنند تا بهترين گزينهها براي هر فرد پيدا شده و امكان شخصي سازي را براي صاحبان كسب و كار اينترنتي فراهم ميكند. از اين رو تلاشهاي فراواني در جهت بهبود كيفيت اين مدلها در دنياي علم و صنعت صورت گرفته است. در اين پژوهش تلاش شده است تا با كمك تحليل دادههاي متني كاربران كه درون نظرات آنها وجود دارد، علاقهمنديهاي كاربران و ويژگيهاي محصولات به دست آمده و از اين اطلاعات در كنار دادههاي مربوط به تعامل كاربران و محصولات استفاده شده تا بهترين توصيهها براي افراد فراهم شود. اين اطلاعات موجود در نظرات به كمك مدل معروف برت بردار سازي شده و به عنوان ورودي به مدل داده ميشود. علاوه بر اين در اين پايان نامه براي آموزش مدل سيستم توصيهگر از يادگيري تقابلي استفاده شده است. اين روش آموزش نياز به نمونهگيري منفي را مرتفع كرده و اين امكان را فراهم ميكند تا توزيع احتمالي دادهها توسط مدل مولد به خوبي كشف شود. در نتيجه اين موضوع مدل مولد ميتواند بهترين گزينهها را براي هر فرد متناسب با سابقه آنها برگزيند. در اين روش آموزش مدل مولد تلاش ميكند تا براي هر كاربر تعدادي از محصولات را به عنوان گزينه مناسب براي توصيه انتخاب كند. در مقابل مدل تميز دهنده تلاش ميكند تا موارد واقعي كه كاربر با آنها تعامل داشته است را از موارد انتخاب شده توسط مولد تفكيك كند. از آنجايي كه فضاي انتخابي مولد گسسته است براي اعمال بازخورد تميز دهنده جهت آموزش مولد از روش يادگيري تقويتي گراديان سياست استفاده شده است. براي آزمايش عملكرد اين مدل از دو مجموعه داده مربوط به صنايع فيلم و موسيقي شركت آمازون استفاده شده است. خروجي مدل ارائه شده با توجه به دو معيار Precision و NDCG در مقابل با مدل IRGAN كه براي اولين بار اين روش يادگيري تقابلي را در سيستمهاي توصيهگر ارائه كرد، يك مدل كلاسيك و يك مدل كه از بردار تصادفي به جاي خروجي مدل برت استفاده ميكند سنجيده شده و در تمامي آزمايشها مدل ارائه شده در اين پژوهش عملكرد بهتري داشت.
-
تاريخ ورود اطلاعات
1402/01/25
-
عنوان به انگليسي
Implementing a Reinforcement Learning and Adversarial Learning based Recommender System With User Comment Analysis
-
تاريخ بهره برداري
1/23/2024 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
مهدي اسدي خمامي
-
چكيده به لاتين
Recommender Systems have been a great success throughout the past decades. They have been able to alleviate the information overload problem to a great extent and owing to them many e-businesses have managed to implement customization and personalization to increase their customers satisfaction. Therefore, many efforts have been made the improve their performance. In this thesis a novel model has been proposed to take advantage of users’ comments so as to discover their interests as well as products’ features and use this information, along with the other implicit data of the interaction between users and items, to enhance recommender systems outcome. In order to learn those hidden meanings in the comments, BERT model has been used. Furthermore, in this research Adversarial Learning is utilized to train the model. In this regard, Generator tries to select some items based on users’ history so as to trick Discriminator to identify them as real data. Meanwhile, Discriminator’s goal is to discriminate real data (items that the user has interacted with) from the ones which were selected by Generator. Policy Gradient model in Reinforcement Learning is used to fine tune Generator by Discriminator’s feedback since Generator has to generate (select from) discrete data. To assess the quality of the proposed model an experiment is conducted on two real world datasets. In this experiment the accuracy of the proposed model is compared with three benchmark recommender system models. The results suggest that this model outperforms the benchmark models meaning that analyzing users’ comments with this method can be useful for recommendation accuracy.
-
كليدواژه هاي فارسي
سيستم توصيهگر , يادگيري تقابلي , يادگيري تقويتي , برت , سيستم توصيهگر تركيبي
-
كليدواژه هاي لاتين
Recommender System , Adversarial Learning , Reinforcement Learning , BERT , Hybrid Recommender System
-
Author
Mahdi Assadi Khomami
-
SuperVisor
Mehdi Ghazanfari
-
لينک به اين مدرک :