شماره ركورد
10366
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
10366
پديد آورنده
مرتضي افشار
عنوان
بهبود دقت بازشناسي گفتار فارسي پيوسته به كمك ويژگي هاي پروزودي
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
كامپيوتر - هوش مصنوعي
سال تحصيل
مهر ماه 1391
تاريخ دفاع
مهر ماه 1391
استاد راهنما
دكتر اكبري
استاد مشاور
دكتر بابك ناصرشريف
چكيده
استفاده از پروزودي در گفتار، سبب افزايش درك شنونده مي¬شود و اين يعني پروزودي مجموعه اطلاعات اضافي، علاوه بر اطلاعات آكوستيكي را در سيگنال گفتار در بر دارد. همانطور كه مي¬دانيم، در اغلب سيستم-هاي بازشناسي گفتار، از فقط اطلاعات آكوستيكي موجود در سيگنال گفتار استفاده مي¬شود. در اين پروژه ما از اطلاعات پروزودي موجود در گفتار، به عنوان مجموعه¬اي ازاطلاعات اضافي، علاوه بر اطلاعات آكوستيكي، در ساخت سيستم¬بازشناسي خودكار گفتار پيوسته فارسي استفاده كرده¬ايم. نحوه استفاده از اطلاعات پروزودي در بازشناسي گفتار به شيوه¬هاي مختلفي امكان پذير است. كارهاي انجام شده در اين راستا، اغلب براي سيستم-هاي بازشناسي در سطح لغت مي¬باشند. استفاده از ويژگي¬هاي پروزودي در سيستم¬هاي بازشناسي در سطح واج، به دو صورت استفاده مستقيم از ويژگي¬هاي پروزودي در بردار ويژگي¬هاي، و استفاده از ويژگي¬هاي پروزودي به عنوان مرحله پس پردازش و اصلاح نتايج بازشناسي، انجام شده است.
در اين پروژه دو كار عمده انجام شده است. ابتدا استفاده مستقيم از ويژگي¬هاي پروزودي در كنار ويژگي¬هاي مختلف آكوستيكي مورد بررسي قرار گرفته است. كار دوم، استفاده از ويژگي¬هاي پروزودي در مرحله پيش پردازش سيستم بازشناسي گفتار مي¬باشد. در اينجا از ايده گروه¬بندي گويندگان براي افزايش دقت بازشناسي در سطح واج، استفاده كرده¬ايم. با توجه به اين كه اطلاعات پروزودي، به شدت وابسته به گوينده مي¬باشد، از اطلاعات پروزودي به دو شيوه باناظر و بدون ناظر، براي گروه¬بندي گويندگان استفاده كرده¬ايم. در اين راستا يك روش تركيبي معرفي شده است كه از هم اطلاعات پروزودي و هم از اطلاعات آكوستيكي براي گروه¬بندي و ساخت سيستم بازشناسي استفاده مي¬كند. با استفاده از ميانگين فركانس پايه در روش تركيبي، با استفاده از 8 مخلوط گوسي، دقت بازشناسي گفتار در سطح واج، نسبت به سيستم بازشناسي بدون استفاده از گروه¬بندي، 2.17 درصد افزايش داشته است.
واژههاي كليدي: ويژگي¬هاي پروزودي، بازشناسي گفتار،فركانس پايه، مدل مخفي ماركف.