-
شماره ركورد
9212
-
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
9212
-
پديد آورنده
ماريا رجبزاده نامقي
-
عنوان
بهبود كارايي واژهيابي گفتار با استفاده از جستجو در شبكه-هاي واجي
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
كامپيوتر گرايش هوش مصنوعي و رباتيك
-
سال تحصيل
آبان ماه 1390
-
تاريخ دفاع
آبان ماه 1390
-
استاد راهنما
دكتر احمد اكبري
-
چكيده
چكيده
جستجوي كلمات كليدي در گفتار (واژهيابي) به معني تشخيص كلماتي خاص در گفتار و تعيين
محل رخداد آن است. اين زمينه به عنوان شاخه اي از بازشناسي گفتار داراي كاربردهاي گسترده اي
نظير جستجوي كلمات در فايلهاي ويديوئي و يا صوتي است.
به دليل مزيتهاي روش واژهيابي مبتني بر دنباله واجي و نيز مبتني بر شبكه، در اين پايان نامه
براي جستجوي سيستم واژهياب از اين روش استفاده ميشود. يعني سيستم واژهياب پيشنهادي براي
جستجوي كلمه كليدي بر روي شبكهاي از دنبالههاي واجي به جستجو ميپردازد.
در اين پايان نامه، روش جستجوي كلمات كليدي به اين ترتيب است كه ابتدا با انجام پيش -
پردازشهايي بر روي شبكه واجي حاصل شده از بازشناسي گفتار همانند شاخصگذاري، شاخص گذاري
معكوس و هرس كردن، فضاي جستجو تعيين و محدودتر ميشود و براي دو حالت برخط و برون خط
فضاي جستجو تعيين ميشود (درحالت برخط نسبت به حالت برون خط نياز به روش جستجوي سريع-
تري ميباشد). سپس روش جستجوي اول-عمق براي يافتن كلمات كليدي در شبكه اعمال ميشود تا
مسيرها يا دنبالههاي واجي كانديد براي كلمه كليدي مورد جستجو بدست بيايد. اين جستجوي عمقي
براي يافتن مسيرها با اعمال سه فاز انجام ميشود. فاز اول، اعمال معيار پايه لونشتين است كه در روش
استفاده شده است . مزيتي كه اعمال معيار (Dynamic Match Phone Lattice Search) DMPLS
لونشتين دارد، اين است كه براي تصحيح خطاي بازشناس گفتار و تصحيح خطاي تلفظ كلمات توسط
گوينده است و درنتيجه نرخ تشخيص كلمات كليدي را افزايش ميدهد، ولي از جمله مشكلات آن، اين
است كه نرخ اخطارهاي اشتباه را نيز افزايش ميدهد و همچنين براي امتيازدهي به كلمات كليدي فقط
از اطلاعات خود زيررشته استفاده ميكند. براي اين منظور در روش پيشنهادي روي فاز اول، دو فاز
اعمال شده است كه نرخ اخطارهاي اشتباه را كاهش ميدهد . فاز دوم با استفاده از روش جستجوي
ويتربي و با استفاده كردن از اطلاعات كل شبكه، كانديدهاي كلمهي كليدي كه از فاز اول بدست آمده-
اند را امتيازدهي ميكند و با نحوهي نرمالسازي كه روي اين امتيازات انجام مي دهد و آستانه گذاري
ميكند، منجر به كاهش اخطارهاي اشتباه ميشود. فاز سوم نيز با اعمال معيار فاصله ي جارو -وينكلر،
مشابهت پيشوندي بين كلمهي كليدي مورد جستجو و كانديدهايي كه از فاز دوم بدست آمده اند را
بررسي ميكند. مشابهت پيشوندي بين رشتهها در تعيين مشابهت آنها، بسيار موثر عمل ميكند و معيار
جارو-وينكلر با درنظر گرفتن اين مشابهت، نرخ اخطارهاي اشتباه را كاهش ميدهد. درنهايت خروجي
سيستم واژهياب پيشنهادي حضور يا عدم حضور كلمه كليدي در عبارت گفتار و مكان آن است.
در اين پايان نامه روش پيشنهادي بر روي دادگان فارسدات تلفني كوچك اعمال شده است .
روش پيشنهادي درحالتيكه مدل كلمه كليدي به صورت تكواج و سه واج باشد، درنظر گرفته شده
است.
واژههاي كليدي: واژهيابي – شبكه واجي – جستجوي شبكه – امتيازدهي – معيار فاصله.
-
لينک به اين مدرک :