-
شماره ركورد
15267
-
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
15267
-
پديد آورنده
آرين تقوي منش
-
عنوان
بهبود روش هاي بازنمايي موسيقي براي شناسايي مبتني بر محتواي صوت
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
هوش مصنوعي و رباتيك
-
سال تحصيل
آبان ماه 1394
-
تاريخ دفاع
آبان ماه 1394
-
استاد راهنما
دكتر احمد اكبري
-
استاد مشاور
دكتر بابك ناصرشريف
-
دانشكده
كامپيوتر
-
چكيده
چكيده
امروزه شناسايي و تحليل و بازيابي اطلاعات موسيقي يكي از مسائل مهم به¬شمار مي¬آيد. با توجه به گسترش اينترنت و پيدايش انواع شبكه¬هاي اجتماعي و تجاري در آن، كاربران و گرداننده اين شبكه¬ها از وجود يك سيستم اتوماتيك كه وظيفه آن شناسايي و برچسب زني موسيقي است، سود مي¬برند.لذا سيستم¬هاي مبتني بر محتواي صوت براي انجام شناسايي موسيقي طراحي شده¬اند. سيستم شناسايي با اثرانگشت صوتي و شناسايي نسخه باز اجرا در حوزه شناسايي موسيقي مبتني بر تحليل محتواي صوت وجود دارند. لذا در راستاي بهبود روش¬هاي بازنمايي موسيقي در الگوريتم¬هاي مبتني بر محتواي صوت، در اين پايان¬نامه به بررسي بخش¬هاي مختلف سيستم شناسايي باز اجرا پرداخته شده تابتوان با بهبود بازنمايي موسيقي و ساير بخش¬هاي آن، ميزان دقت شناسايي را افزايش داد.
براي بهبودبازنمايي در سيستم شناسايي نسخه باز اجرا موسيقي، ايده استفاده از مد موسيقي در كنار ويژگي كروما ضرب-هم¬زمان پيشنهاد شده است. براي استخراج مد يك روش مبتني بر نمايه كليد ارائه شده است كه از فاصله كسينوسي بين بردار نرمال شده حاصل از جمع ويژگي در طول زمان و رديف¬هاي ماتريس نمايه استفاده مي كند.براي ارزيابي اين بازنمايي، از اطلاعات مد استخراج شده در دو سيستم كه رويكرد متفاوتي در بخش محاسبه شباهت دارند استفاده شده است.
در رويكرد اول براي مقابله با تغييرات كليد بين نسخه¬هاي آهنگ، از روش انديس بهينه ترانهش(OTI) براي پيدا كردن ميزان اختلاف كليد ميان آهنگ مرجع و آهنگ پرس¬وجو و براي محاسبه شباهت از تابع همبستگي متقابل استفاده شده است.
در رويكرد دوم براي اندازه¬گيري ميزان شباهت، همبستگي متقابل دوبعدي پيشنهاد شده است. تابع همبستگي متقابل دو بعدي خاصيت مقاوم بودن نسبت به تغيير كليد را دارد. لذا نيازي به انجام محاسبات تخمين كليد نيست.رويكرد اول و دوم ميزان دقت %50 و% 5/52 در مجموعه داده 80CoverSetو دقت %33/63 و%33/63 در مجموعه داده Ahonen داشته استكه نسبت به الگوريتم پايه به مقدار %5/7 و %10 در مجموعه داده 80CoverSetو مقدار %66/6 و %66/6 در مجموعه داده Ahonen بهبود داشته است. آزمايش¬ها و نتايج ارزيابي نشان مي¬دهد كه رويكرد دوم عملكرد بهتري از نظر دقت شناسايي نسبت به رويكرد اول دارد.
واژههاي كليدي:شناسايي مبتني بر محتواي صوت، نسخه باز اجرا موسيقي، ويژگي كروما، مد موسيقي، ويژگي ضرب¬هم¬زمان
-
لينک به اين مدرک :