-
شماره ركورد
10366
-
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
10366
-
پديد آورنده
مرتضي افشار
-
عنوان
بهبود دقت بازشناسي گفتار فارسي پيوسته به كمك ويژگي هاي پروزودي
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
كامپيوتر - هوش مصنوعي
-
سال تحصيل
مهر ماه 1391
-
تاريخ دفاع
مهر ماه 1391
-
استاد راهنما
دكتر اكبري
-
استاد مشاور
دكتر بابك ناصرشريف
-
چكيده
استفاده از پروزودي در گفتار، سبب افزايش درك شنونده مي¬شود و اين يعني پروزودي مجموعه اطلاعات اضافي، علاوه بر اطلاعات آكوستيكي را در سيگنال گفتار در بر دارد. همانطور كه مي¬دانيم، در اغلب سيستم-هاي بازشناسي گفتار، از فقط اطلاعات آكوستيكي موجود در سيگنال گفتار استفاده مي¬شود. در اين پروژه ما از اطلاعات پروزودي موجود در گفتار، به عنوان مجموعه¬اي ازاطلاعات اضافي، علاوه بر اطلاعات آكوستيكي، در ساخت سيستم¬بازشناسي خودكار گفتار پيوسته فارسي استفاده كرده¬ايم. نحوه استفاده از اطلاعات پروزودي در بازشناسي گفتار به شيوه¬هاي مختلفي امكان پذير است. كارهاي انجام شده در اين راستا، اغلب براي سيستم-هاي بازشناسي در سطح لغت مي¬باشند. استفاده از ويژگي¬هاي پروزودي در سيستم¬هاي بازشناسي در سطح واج، به دو صورت استفاده مستقيم از ويژگي¬هاي پروزودي در بردار ويژگي¬هاي، و استفاده از ويژگي¬هاي پروزودي به عنوان مرحله پس پردازش و اصلاح نتايج بازشناسي، انجام شده است.
در اين پروژه دو كار عمده انجام شده است. ابتدا استفاده مستقيم از ويژگي¬هاي پروزودي در كنار ويژگي¬هاي مختلف آكوستيكي مورد بررسي قرار گرفته است. كار دوم، استفاده از ويژگي¬هاي پروزودي در مرحله پيش پردازش سيستم بازشناسي گفتار مي¬باشد. در اينجا از ايده گروه¬بندي گويندگان براي افزايش دقت بازشناسي در سطح واج، استفاده كرده¬ايم. با توجه به اين كه اطلاعات پروزودي، به شدت وابسته به گوينده مي¬باشد، از اطلاعات پروزودي به دو شيوه باناظر و بدون ناظر، براي گروه¬بندي گويندگان استفاده كرده¬ايم. در اين راستا يك روش تركيبي معرفي شده است كه از هم اطلاعات پروزودي و هم از اطلاعات آكوستيكي براي گروه¬بندي و ساخت سيستم بازشناسي استفاده مي¬كند. با استفاده از ميانگين فركانس پايه در روش تركيبي، با استفاده از 8 مخلوط گوسي، دقت بازشناسي گفتار در سطح واج، نسبت به سيستم بازشناسي بدون استفاده از گروه¬بندي، 2.17 درصد افزايش داشته است.
واژههاي كليدي: ويژگي¬هاي پروزودي، بازشناسي گفتار،فركانس پايه، مدل مخفي ماركف.
-
لينک به اين مدرک :