-
شماره ركورد
9281
-
پديد آورنده
فاطمه معرفت
-
عنوان
تشخيص هوشمند صدا با استفاده از آناليز سيگنال صوتي
-
رشته تحصيلي
مهندسي مكانيك
-
استاد راهنما
دكتر برهان بيگ زاده
-
دانشجوي وارد كننده اطلاعات
فاطمه معرفت
-
تاريخ ورود اطلاعات
1403/07/15
-
دانشكده
مهندسي مكانيك
-
عنوان به انگليسي
Intelligent voice recognition using audio signal analysis
-
چكيده
در اين پاياننامه، يك سيستم شناسايي گوينده بر اساس تحليل سيگنال صوتي معرفي شده است. اين سيستم با استفاده از ضرايب MFCC (ضرايب كپسترال فركانس مل) بهعنوان ويژگيهاي اصلي صوتي، و مدلهاي عميق CNN (شبكه عصبي پيچشي) و LSTM (حافظه كوتاهمدت بلند) براي شناسايي و تمايز گويندگان مختلف توسعه يافته است. ابتدا سيگنال صوتي ورودي از طريق استخراج MFCC به مجموعهاي از ويژگيهاي قابلاستفاده براي مدل تبديل ميشود. سپس اين ويژگيها به يك شبكه عصبي پيچشي داده ميشوند تا الگوهاي مكاني را استخراج كند. در ادامه، از شبكه LSTM براي مدلسازي وابستگيهاي زماني موجود در دنبالههاي صوتي استفاده ميشود.
هدف اصلي اين پژوهش، بهبود دقت شناسايي گوينده از طريق استفاده تركيبي از دو مدل CNN و LSTM است. مدل تركيبي پيشنهادي بر روي يك مجموعه داده صوتي شامل نمونههاي گفتاري از چندين گوينده مختلف آموزش داده شده و عملكرد آن با معيارهاي دقت و بازشناسي ارزيابي شده است. نتايج آزمايشها نشان ميدهد كه سيستم پيشنهادي قادر است با دقت بالا گويندگان مختلف را شناسايي كند و قابليت تعميم خوبي در مواجهه با دادههاي جديد و ناآشنا دارد.
اين پژوهش به بهبود عملكرد سيستمهاي شناسايي گوينده كمك ميكند و ميتواند در كاربردهاي مختلفي نظير امنيت صوتي، تعامل انسان و ماشين، و سيستمهاي تشخيص هويت مورد استفاده قرار گيرد.
-
لينک به اين مدرک :