-
شماره ركورد
13632
-
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
13632
-
پديد آورنده
روح الله عبدي پور
-
عنوان
بهبود كيفيت گفتار در سيستم هاي دو ميكروفونه به منظور تطبيق با محيط آكوستيكي
-
مقطع تحصيلي
دكتري
-
رشته تحصيلي
كامپيوتر - هوش مصنوعي و رباتيك
-
سال تحصيل
آذر ماه 1393
-
تاريخ دفاع
آذر ماه 1393
-
استاد راهنما
دكتر احمد اكبري
-
استاد مشاور
دكتر محسن رحماني
-
چكيده
چكيده
بهسازي گفتار، يكي از الزامات در سيستم¬هاي مبتني بر گفتار است. در كاربردهايي مانند تلفن همراه، وسايل كمك شنوايي و تشخيص گفتار، انجام بهسازي گفتار به عنوان يك مرحله پيشپردازش افزايش قابل توجهي در قابليت فهم و دقت تشخيص گفتار خواهد داشت. از بين روش¬هاي بهسازي گفتار، روش¬هاي دو ميكروفونه، به دليل داشتن اطلاعات بيشتر نسبت به روش¬هاي تك ميكروفونه و همچنين به دليل كمتر بودن هزينه توليد و بار محاسباتي آن نسبت به چند ميكروفونه، در اين رساله مورد توجه قرار گرفته¬اند. با توجه به اينكه بسياري از وسايل مبتني بر گفتار در محيط¬هاي مختلفي بكار گرفته مي¬شوند و با توجه به اينكه تطبيق¬پذيري با محيط مي-تواند منجر به ارتقاء كارايي سيستم بهسازي گفتار شود، ارائه يك سيستم دو ميكروفونه با قابليت تطبيق¬پذيري با تغييرات شرايط محيطي به عنوان هدف اين رساله در نظر گرفته شد.
براي دستيابي به اهداف اين رساله، ابتدا با بكارگيري اطلاعات طيفي، يك سيستم تطبيق¬پذير با نويزهاي جهت-دار و پخشنده ارائه شده است. سپس، با در نظر گرفتن مدل¬هاي جداگانه براي هر نوع نويز، كارايي سيستم افزايش يافته، يك راهكار وابسته به محيط حاصل شده است. پس از آن، با استفاده از رده¬بند نوع نويز به عنوان يك مرحله پيشپردازش، به سيستم قابليت تشخيص نوع نويز در محيط جاري و تطبيق با آن از طريق بكارگيري مدل مناسب داده شد. روش پيشنهادي در محيط¬هاي با نويز پخشنده و جهت¬دار با نسبت سيگنال به نويز پايين (SNR=2dB) بطور متوسط 15dB نسبت سيگنال به نويز را ارتقاء مي¬دهد.
در ا دامه، اطلاعات مرتبط با تعداد و مكان منابع در قالب يك مدل مخلوط گاوسي براي بهسازي گفتار بكار گرفته شده¬اند. همچنين يك الگوريتم مبتني بر برازش مدلهاي آماري، براي تشخيص تعداد منابع و تطبيق با آن پيشهاد شده است. به علاوه، يك الگوريتم مبتني بر بيشنيه شباهت براي دنبال كردن جابجايي منابع و تطبيق با آنها ارائه شده است. ارزيابي¬هاي به عمل آمده حاكي از توانايي عملكرد برخط روش¬هاي پيشنهادي و داشتن كارايي بالا است. روش پيشنهادي در محيط بدون انعكاس با حضور دو و سه منبع به ترتيب 11.9dB و 9.5dB نسبت سيگنال به نويز را ارتقاء مي¬دهد.
واژههاي كليدي: بهسازي گفتار، جداسازي منابع، شمردن منابع، تطبيق با مكان منابع، تطبيق با نوع نويز ، رده¬بندي نوع نويز ، مدل مخلوط گاوسي، رگرسيون خطي بيشينه شباهت، تطبيق مدل، معيار اطلاعات بيزين.
-
لينک به اين مدرک :