شماره ركورد
13632
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
13632
پديد آورنده
روح الله عبدي پور
عنوان
بهبود كيفيت گفتار در سيستم هاي دو ميكروفونه به منظور تطبيق با محيط آكوستيكي
مقطع تحصيلي
دكتري
رشته تحصيلي
كامپيوتر - هوش مصنوعي و رباتيك
سال تحصيل
آذر ماه 1393
تاريخ دفاع
آذر ماه 1393
استاد راهنما
دكتر احمد اكبري
استاد مشاور
دكتر محسن رحماني
چكيده
چكيده
بهسازي گفتار، يكي از الزامات در سيستم¬هاي مبتني بر گفتار است. در كاربردهايي مانند تلفن همراه، وسايل كمك شنوايي و تشخيص گفتار، انجام بهسازي گفتار به عنوان يك مرحله پيشپردازش افزايش قابل توجهي در قابليت فهم و دقت تشخيص گفتار خواهد داشت. از بين روش¬هاي بهسازي گفتار، روش¬هاي دو ميكروفونه، به دليل داشتن اطلاعات بيشتر نسبت به روش¬هاي تك ميكروفونه و همچنين به دليل كمتر بودن هزينه توليد و بار محاسباتي آن نسبت به چند ميكروفونه، در اين رساله مورد توجه قرار گرفته¬اند. با توجه به اينكه بسياري از وسايل مبتني بر گفتار در محيط¬هاي مختلفي بكار گرفته مي¬شوند و با توجه به اينكه تطبيق¬پذيري با محيط مي-تواند منجر به ارتقاء كارايي سيستم بهسازي گفتار شود، ارائه يك سيستم دو ميكروفونه با قابليت تطبيق¬پذيري با تغييرات شرايط محيطي به عنوان هدف اين رساله در نظر گرفته شد.
براي دستيابي به اهداف اين رساله، ابتدا با بكارگيري اطلاعات طيفي، يك سيستم تطبيق¬پذير با نويزهاي جهت-دار و پخشنده ارائه شده است. سپس، با در نظر گرفتن مدل¬هاي جداگانه براي هر نوع نويز، كارايي سيستم افزايش يافته، يك راهكار وابسته به محيط حاصل شده است. پس از آن، با استفاده از رده¬بند نوع نويز به عنوان يك مرحله پيشپردازش، به سيستم قابليت تشخيص نوع نويز در محيط جاري و تطبيق با آن از طريق بكارگيري مدل مناسب داده شد. روش پيشنهادي در محيط¬هاي با نويز پخشنده و جهت¬دار با نسبت سيگنال به نويز پايين (SNR=2dB) بطور متوسط 15dB نسبت سيگنال به نويز را ارتقاء مي¬دهد.
در ا دامه، اطلاعات مرتبط با تعداد و مكان منابع در قالب يك مدل مخلوط گاوسي براي بهسازي گفتار بكار گرفته شده¬اند. همچنين يك الگوريتم مبتني بر برازش مدلهاي آماري، براي تشخيص تعداد منابع و تطبيق با آن پيشهاد شده است. به علاوه، يك الگوريتم مبتني بر بيشنيه شباهت براي دنبال كردن جابجايي منابع و تطبيق با آنها ارائه شده است. ارزيابي¬هاي به عمل آمده حاكي از توانايي عملكرد برخط روش¬هاي پيشنهادي و داشتن كارايي بالا است. روش پيشنهادي در محيط بدون انعكاس با حضور دو و سه منبع به ترتيب 11.9dB و 9.5dB نسبت سيگنال به نويز را ارتقاء مي¬دهد.
واژههاي كليدي: بهسازي گفتار، جداسازي منابع، شمردن منابع، تطبيق با مكان منابع، تطبيق با نوع نويز ، رده¬بندي نوع نويز ، مدل مخلوط گاوسي، رگرسيون خطي بيشينه شباهت، تطبيق مدل، معيار اطلاعات بيزين.