شماره ركورد
8719
پديد آورنده
پوريا ميرقدري
عنوان
ادغام اطلاعات چند حوزه اي در هوش مصنوعي
مقطع تحصيلي
كارشناسي
رشته تحصيلي
مهندسي برق - مخابرات
سال فارغ التحصيلي
1402
استاد راهنما
دكتر فرزان حدادي
استاد مشاور
دكتر فرزان حدادي
دانشجوي وارد كننده اطلاعات
پوريا ميرقدري
تاريخ ورود اطلاعات
1402/07/22
دانشكده
برق
عنوان به انگليسي
Embedding Multimodal Data In AI
چكيده
در اين مقاله يك مدل براي يادگيري جاسازي توام داده ها در شش حالت مختلف - تصاوير، متن، صدا، عمق،
حرارت و دادههاي IMU معرفي ميكنيم. همچنين نشان ميدهيم كه تركيب همه حالت هاي داده هاي جفت
شده براي آموزش چنين جاسازي توام ضروري نيست و فقط دادههاي جفت شده با تصاوير براي پيوند همه
حالتها كافي هستند. اين مدل ميتواند از مدلهاي بزرگ بينايي - زبان استفاده كند و قابليتهاي بدون نياز
به آموزش براي حالتهاي جديد را با استفاده از جفتسازي طبيعي با تصاوير توسعه دهد. اين قابليت هاي
جديد شامل بازيابي متقاطع حالتها، تركيب حالتها با محاسبات رياضي، تشخيص و توليد متقاطع بين
حالت ها مي شود. تواناييهاي فوري با قدرت كدگذار تصوير بهبود مي يابند و ما در مورد كارهاي تشخيص بدون
يادگيري فوري، يك دستاورد جديد علمي ارائه مي دهيم كه فراتر از مدل هاي با نظارت خاص، نسبت به
كارهاي قبلي برتري دارد. در نهايت نشان ميدهيم كه اين مدل به عنوان يك روش جديد ارزيابي مدلهاي
بينايي براي امور بصري و غيربصري عمل ميكند و نسبت به كارهاي قبل داراي نتايج بهتري در تشخيص با
تعداد كمترين نمونه ها مي باشد.
كليدواژه ها
هوش مصنوعي , شبكه عصبي , يادگيري عميق , پردازش سيگنال