روح الله جهان مهين

شماره ركورد
25185
پديد آورنده
روح الله جهان مهين
عنوان
طراحي مدلي مبتني بر روشهاي پردازش زبان طبيعي و يادگيري ماشيني جهت تحليل احساسات مشتريان با استفاده از دادههاي متني
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي صنايع
سال تحصيل
1397
تاريخ دفاع
1400/06/14
استاد راهنما
دكتر رسول نورالسناء
استاد مشاور
دكتر فرناز برزين پور
دانشكده
مهندسي صنايع
چكيده
تحليل احساس يكي از زيرشاخه¬هاي پردازش زبان طبيعي است كه هدف آن طبقه¬بندي متون با توجه به احساس، عقيده و نگرش بيان شده در آنها است. در دهه¬هاي گذشته روي استفاده از رويكردهاي يادگيري ماشين جهت حل مسائل تحليل احساس كارهاي زيادي انجام گرفت، اما تمركز اصلي آنها بر روي ساخت استخراج كننده هاي ويژگي قوي¬تر بوده است، زيرا كه عملكرد اين يادگيرنده ها بيشتر به انتخاب نحوه بازنمايي داده وابسته است. در سال¬هاي اخير با افزايش قدرت محاسباتي و پيشرفت علم يادگيري عميق، با واگذاري يادگيري الگوها به ماشين، پيشرفت¬هاي چشمگيري در بسياري از مسائل رشته¬هاي مختلف به ويژه در طبقه بندي متون و تحليل احساس حاصل شده است. در تحليل احساس، بيشتر اين پيشرفت¬ها براي زبان انگليسي صورت گرفته و در زبان فارسي به دليل چالش¬هايي همچون عدم دسترسي به مجموعه داده كافي و ابزارهاي دقيق پردازش متن، پيشرفت¬ها به آن ميزان چشمگير نبوده است. هدف از اين تحقيق، طراحي مدلي مبتني بر يادگيري عميق و پردازش زبان طبيعي است كه بتواند فرايند تحليل احساسات را با دقت بالايي درك كند. از جمله نوآوري¬هاي تحقيق حاضر مي¬توان به پيش پردازش دقيق مجموعه داده اشاره كرد كه به بهينه ترين حالت ممكن انجام شده است كه در نهايت دقت 99 درصدي در مدل¬هاي يادگيري عميق همچون شبكه عصبي پيچشي و شبكه عصبي حافظه طولاني كوتاه مدت دوسويه اشاره كرد لازم به ذكر است مدل شبكه عصبي پيچشي به صورت يك بعدي بوده و از عملگر Relu براي فعال¬سازي نورون¬ها در لايه هاي مختلف استفاده شده و در شبكه عصبي حافظه طولاني كوتاه مدت دوسويه از دو عملگر فعال¬سازي Relu و بيشنيه نرم به صورت تركيبي استفاده شده كه دقت نتايج را نسبت به مدل¬هاي كلاسيك يادگيري عميق همچون ماشين بردار پشتيبان و جنگل تصادفي، ارتقا داده است. همچنين مي¬توان به اين نكته اشاره نمود كه در اين تحقيق از شبكه عصبي حافظه طولاني كوتاه مدت دوسويه استفاده شده كه متفاوت از روش شبكه عصبي يك جهته مي¬باشد به اين صورت كه نورون¬ها بين لايه¬ها حركت رفت و برگشتي دارند كه باعث مي¬شود هم در جهت رو به جلو و هم درجهت مخالف بين لايه¬ها حركت كنند كه از مزيت¬هاي اين روش مي¬توان به حفظ داده¬ها و اطلاعات مهم در لايه¬هاي زيرين شبكه عصبي اشاره كرد. هدف از طراحي چهار مدل در تحقيق حاضر يافتن تفاوت¬هاي موجود در بحث طبقه¬بندي نظرات در هريك از مدل¬هاي پيشنهادي است مجموعه داده پس از مرحله پيش پردازش كه شامل ريشه¬يابي، نرمال¬سازي، حذف كلمات توقف است در چهار مدل طراحي شده با استفاده از جنگل تصادفي، ماشين بردار پشتيبان، شبكه عصبي پيچشي و شبكه عصبي حافظه طولاني كوتاه مدت قرار مي-گيرند و در نهايت بين چهار مدل طراحي شده مقايسه صورت مي¬گيرد كه نشان خواهد داد كه مدل¬هاي يادگيري عميق برتري قابل توجهي نسبت به مدل¬هاي پايه¬اي يادگيري ماشيني دارند و دقت نهايي مدل-هاي يادگيري عميق برتري 20 درصدي در بحث طبقه را نشان مي¬دهد. طبق تحقيقات انجام شده در حوزه تحليل احساسات، امروزه استفاده از روش¬هاي ابتدايي پردازش زبان طبيعي دقت بالايي را نتيجه نمي¬دهد.
تاريخ ورود اطلاعات
1400/06/17
عنوان به انگليسي
Designing a model based on natural language processing and machine learning methods to analyze customer sentiments using textual data
تاريخ بهره برداري
1/1/1900 12:00:00 AM
دانشجوي وارد كننده اطلاعات
روح الله جهان مهين
چكيده به لاتين
Emotion analysis is one of the sub-branches of natural language processing that aims to classify texts according to the feelings, beliefs and attitudes expressed in them. Much research has been done in recent decades to use machine learning approaches to solve emotion analysis problems, but their main focus has been on building stronger feature extractors, as the performance of these learners is more dependent on the choice of how data is represented. In recent years, with the increase of computational power and the advancement of deep learning science, with the transfer of pattern learning to the machine, significant advances have been made in many issues of different disciplines, especially in the classification of texts and the analysis of emotion. In sentiment analysis, most of these improvements have been made for English, and in Persian, due to challenges such as lack of access to sufficient data sets and accurate text processing tools, the improvements have not been as significant. The purpose of this research is to design a model based on deep learning and natural language processing that can understand the process of sentiment analysis with high accuracy. Among the innovations of the present study, we can mention the precise preprocessing of the data set, which has been done in the most optimal way possible, which ultimately has accuracy in deep learning models such as convolutional neural network and bi-directional long short-term memory neural network. It should be noted that the convolutional neural network model is one-dimensional and the Relu operator is used to activate neurons in different layers. The hybrid form is used, which improves the accuracy of the results compared to the classic deep learning models such as support vector machine and random forest. It can also be pointed out that in this study, the neural network used short-term short-term memory, which is different from the one-way neural network method in that the neurons move back and forth between layers, which causes they can move both forward and in the opposite direction between the layers. One of the advantages of this method is the preservation of important data and information in the underlying layers of the neural network. The purpose of designing the four models in the present study is to find the differences in the discussion of classification of comments in each of the proposed models. From the random forest, the support vector machine, the convolutional neural network, and the bi-directional long short-term memory neural network are compared, and finally a comparison is made between the four designed models, which will show that the deep learning models are significantly superior to the model. The basics are machine learning, and the ultimate accuracy of deep learning models shows a advantage in classification. According to research in the field of sentiment analysis, today the use of basic methods of natural language processing does not result in high accuracy.
كليدواژه هاي فارسي
متن كاوي , يادگيري عميق , تحليل احساسات , عقيده كاوي , پردازش زبان طبيعي
كليدواژه هاي لاتين
Text mining , deep learning , sentiment analysis , belief mining , natural language processing
لينک به اين مدرک :
http://dl.iust.ac.ir/dL/search/default.aspx?Term=25185&Field=0&DTC=6

کلیه حقوق این اثر برای شرکت مهندسی ارتباطات پيام مشرق محفوظ می باشد