شماره ركورد
12008
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
12008
پديد آورنده
شيما طبيبيان
عنوان
بهبود دقت واژه يابي گفتار در سيستم هاي مبتني بر مدل مخفي ماركف و رده بندهاي متمايزساز
مقطع تحصيلي
دكتري
رشته تحصيلي
كامپيوتر - هوش مصنوعي و رباتيك
سال تحصيل
ارديبهشت ماه 1392
تاريخ دفاع
ارديبهشت ماه 1392
استاد راهنما
دكتر احمد اكبري
استاد مشاور
دكتر بابك ناصرشريف
چكيده
چكيده
واژه¬يابي گفتار به يافتن كلمات يا عبارات ويژه در يك گفتار بدون محدوديت و رد كردن بخش-هاي نامرتبط گفتار اطلاق مي¬شود. اغلب كارهاي انجام شده در زمينه واژه¬يابي گفتار به دو دسته تقسيم مي¬شوند: واژه¬يابي گفتار مبتني بر مدل مخفي ماركف و واژه¬يابي گفتار مبتني بر روش-هاي متمايزساز. در اين پايان¬نامه با استفاده از هر دو رويكرد مذكور، راهكاري براي واژه¬يابي گفتار پيشنهاد شده است كه ضمن بهره¬گيري از بيشترين مزاياي هر دو رويكرد، كاستي¬هاي آن¬ها را تا حد امكان مرتفع گرداند. در راهكار پيشنهاد شده، واژه¬ياب گفتار يك رده¬بند دودويي است كه كلاس جملات حاوي كلمات كليدي را از كلاس ساير جملات تفكيك مي¬كند. اين رده¬بند دودويي دربرگيرنده دو بخش استخراج ويژگي و رده¬بندي مي¬باشد. نوآوري¬هاي بخش استخراج ويژگي شامل پيشنهاد تابع اطمينان از حضور (كه ميزان اطمينان از حضور دنباله واجي كلمه كليدي مورد جستجو در عبارت گفتار ورودي را مدل مي¬نمايد) و تابع اطمينان از كشش زماني (كه ميزان اطمينان از اعتبار كشش زماني واج¬هاي كلمه كليدي را محاسبه مي¬كند) و پيشنهاد راهكاري براي تركيب رويكرد مبتني بر مدل مخفي ماركف و رده¬بند متمايزساز ( به منظور استفاده از اطلاعات سه واج در روش متمايزساز) مي¬باشند. نوآوري¬هاي بخش رده¬بندي شامل پيشنهاد دو روند آموزش براي آموزش رده¬بند (روند آموزش تكاملي با فرض تفكيك¬پذيري خطي و روند آموزش مبتني بر هسته با فرض تفكيك¬ناپذيري خطي) و پيشنهاد دو روند جستجو براي مكان¬يابي كلمه كليدي (نسخه سلسله¬مراتبي الگوريتم جستجوي ويتربي و الگوريتم جستجوي چند- بهترين كه به ترتيب با هدف تسريع و بهبود دقت جستجو پيشنهاد شده¬اند) هستند. چارچوب نهايي پيشنهادي براي واژه¬يابي گفتار متمايزساز، در برگيرنده بخش استخراج ويژگي پيشنهادي، رده¬بند مبتني بر الگوريتم تكاملي و الگوريتم جستجوي چند- بهترين مي¬باشد. نتايج ارزيابي¬ها بر روي دادگان TIMIT حاكي از بهبود سرعت پاسخگويي سيستم (2/2 برابر) در مقابل افت نامحسوس دقت (4/0 درصد) در مقايسه با چارچوب پايه براي واژه¬يابي گفتار متمايزساز مي-باشد. در مقايسه با رويكردهاي مبتني بر مدل مخفي ماركف، سرعت پاسخگويي و دقت واژه¬ياب گفتار پيشنهادي به ترتيب، حدود 025/0 برابر افت و حدود 15 درصد بهبود داشته است.
واژههاي كليدي: واژه¬يابي گفتار، مدل مخفي ماركف، روش¬هاي متمايزساز، هسته، جستجوي چند- بهترين، جستجوي سلسله¬مراتبي، سه واج .