-
شماره ركورد
12008
-
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
12008
-
پديد آورنده
شيما طبيبيان
-
عنوان
بهبود دقت واژه يابي گفتار در سيستم هاي مبتني بر مدل مخفي ماركف و رده بندهاي متمايزساز
-
مقطع تحصيلي
دكتري
-
رشته تحصيلي
كامپيوتر - هوش مصنوعي و رباتيك
-
سال تحصيل
ارديبهشت ماه 1392
-
تاريخ دفاع
ارديبهشت ماه 1392
-
استاد راهنما
دكتر احمد اكبري
-
استاد مشاور
دكتر بابك ناصرشريف
-
چكيده
چكيده
واژه¬يابي گفتار به يافتن كلمات يا عبارات ويژه در يك گفتار بدون محدوديت و رد كردن بخش-هاي نامرتبط گفتار اطلاق مي¬شود. اغلب كارهاي انجام شده در زمينه واژه¬يابي گفتار به دو دسته تقسيم مي¬شوند: واژه¬يابي گفتار مبتني بر مدل مخفي ماركف و واژه¬يابي گفتار مبتني بر روش-هاي متمايزساز. در اين پايان¬نامه با استفاده از هر دو رويكرد مذكور، راهكاري براي واژه¬يابي گفتار پيشنهاد شده است كه ضمن بهره¬گيري از بيشترين مزاياي هر دو رويكرد، كاستي¬هاي آن¬ها را تا حد امكان مرتفع گرداند. در راهكار پيشنهاد شده، واژه¬ياب گفتار يك رده¬بند دودويي است كه كلاس جملات حاوي كلمات كليدي را از كلاس ساير جملات تفكيك مي¬كند. اين رده¬بند دودويي دربرگيرنده دو بخش استخراج ويژگي و رده¬بندي مي¬باشد. نوآوري¬هاي بخش استخراج ويژگي شامل پيشنهاد تابع اطمينان از حضور (كه ميزان اطمينان از حضور دنباله واجي كلمه كليدي مورد جستجو در عبارت گفتار ورودي را مدل مي¬نمايد) و تابع اطمينان از كشش زماني (كه ميزان اطمينان از اعتبار كشش زماني واج¬هاي كلمه كليدي را محاسبه مي¬كند) و پيشنهاد راهكاري براي تركيب رويكرد مبتني بر مدل مخفي ماركف و رده¬بند متمايزساز ( به منظور استفاده از اطلاعات سه واج در روش متمايزساز) مي¬باشند. نوآوري¬هاي بخش رده¬بندي شامل پيشنهاد دو روند آموزش براي آموزش رده¬بند (روند آموزش تكاملي با فرض تفكيك¬پذيري خطي و روند آموزش مبتني بر هسته با فرض تفكيك¬ناپذيري خطي) و پيشنهاد دو روند جستجو براي مكان¬يابي كلمه كليدي (نسخه سلسله¬مراتبي الگوريتم جستجوي ويتربي و الگوريتم جستجوي چند- بهترين كه به ترتيب با هدف تسريع و بهبود دقت جستجو پيشنهاد شده¬اند) هستند. چارچوب نهايي پيشنهادي براي واژه¬يابي گفتار متمايزساز، در برگيرنده بخش استخراج ويژگي پيشنهادي، رده¬بند مبتني بر الگوريتم تكاملي و الگوريتم جستجوي چند- بهترين مي¬باشد. نتايج ارزيابي¬ها بر روي دادگان TIMIT حاكي از بهبود سرعت پاسخگويي سيستم (2/2 برابر) در مقابل افت نامحسوس دقت (4/0 درصد) در مقايسه با چارچوب پايه براي واژه¬يابي گفتار متمايزساز مي-باشد. در مقايسه با رويكردهاي مبتني بر مدل مخفي ماركف، سرعت پاسخگويي و دقت واژه¬ياب گفتار پيشنهادي به ترتيب، حدود 025/0 برابر افت و حدود 15 درصد بهبود داشته است.
واژههاي كليدي: واژه¬يابي گفتار، مدل مخفي ماركف، روش¬هاي متمايزساز، هسته، جستجوي چند- بهترين، جستجوي سلسله¬مراتبي، سه واج .
-
لينک به اين مدرک :