-
شماره ركورد
26987
-
پديد آورنده
سيده زهرا سيدي
-
عنوان
پردازش متون مكالمه اي براي ايجاد عامل هاي گفتگوي هوشمند
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي كامپيوتر - هوش مصنوعي و رباتيكز
-
سال تحصيل
1397
-
تاريخ دفاع
24/12/1400
-
استاد راهنما
دكتر سيد صالح اعتمادي، دكتر محمد طاهر پيله ور
-
دانشكده
كامپيوتر
-
چكيده
يكي از مسائل مهم در هوش مصنوع، ساختن ربات هايي با قابليت مكالمه با انسان است كه كلمه عامل
مكالمه هوشمند به آن ها اطلاق ميشود. اين عامل ها شامل انجام وظيفه (مانند رزرو رستوران)، پاسخ به سوال (مانند پاسخ به سوالِ ”نويسنده كتاب چشم هايش چه كسي است؟“) و گفتگوي معاشرتي هستند (يك مكالمه پيوسته با كاربر به گونه اي كه كاربر احساس نكند كه با ربات صحبت ميكند). تمركز اين پژوهش بر روي عامل هاي گفتگوي معاشرتي است.
از مسائل مهم در حوزه عامل هاي مكالمه هوشمند و عل الخصوص شاخه گفتگوي معاشرتي، دادگاني است كه عامل با آن آموزش ميبيند. يكي از دادگان مهم در اين حوزه OpenSubtitles است كه شامل زيرنويس فيلم ها است كه جنس آن از نوع مكالمه است اما متاسفانه اين دادگان فاقد برچسب نام گوينده يا تغييرات گوينده جملات است. در اين پژوهش ما با استفاده از روش هاي مبتني بر يادگيري انتقالي، دادگان OpenSubtitles را با دقتي بالاتر از دقت پايه برچسب زديم. براي سنجش خروجي، يك چت بات را با داده برچسب زده شده و چت بات ديگري را با داده خام آموزش داديم و با كمك معيارهاي ارزيابي خودكارِ سرگشتگي و ،Hit@1 آن ها را مقايسه كرديم كه خروجي نشان ميدهد كه با اين روش در بهترين حالت سرگشتگي 20 واحد كاهش داشته و Hit@1 30 درصد افزايش يافته است كه نشان از تاثير مثبت آن داشت.
-
تاريخ ورود اطلاعات
1401/06/15
-
عنوان به انگليسي
Analyzing conversational data for training chit-chat agents
-
تاريخ بهره برداري
3/15/2023 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
سيده زهرا سيدي
-
چكيده به لاتين
One of the important issues in artificial intelligence is making robots that are capable to converse with human via text chats that include task-oriented agents, answering questions agents, and social chat agents.
One of the most critical issues in conversational AI agents, especially the branch of social dialogue, is the training data. One of the datasets in this area is OpenSubtitles, which includes subtitles for movies that are conversational, but unfortunately, these datasets do not have speaker names or speaker change tags. This research labeled the OpenSubtitles dataset with higher accuracy than majority baseline accuracy, using transfer learning methods. We trained one chatbot with labeled data and the other chatbot with raw data to measure the result. We compared them with automated evaluation metrics like perplexity and Hit@1. This approach ensures a 30 percent increase in Hit@1 and 20 points decrease in perplexity, which denotes an improvement after using the mentioned model.
-
كليدواژه هاي فارسي
عامل مكالمه هوشمند , چت بات , هوش مصنوعي , پردازش زبان طبيعي , يادگيري عميق
-
كليدواژه هاي لاتين
conversational Ai , chat-bot , artificial intelligence , natural language processing , deep learning
-
Author
Zahra Sayedi
-
SuperVisor
Dr.Sualeh Eetemadi, dr.Taher Pilehvar
-
لينک به اين مدرک :