-
شماره ركورد
8052
-
پديد آورنده
شقايق مبشر و غزل زماني نژاد
-
عنوان
بررسي يادگيري بدون داده مشابه و با مجموعه داده محدود بر روي مدل مبتني بر ترنسفورمر براي دو تسك پرسش و پاسخ تصويري و توصيف تصوير
-
رشته تحصيلي
مهندسي كامپيوتر
-
استاد راهنما
دكتر سيد صالح اعتمادي
-
دانشجوي وارد كننده اطلاعات
شقايق مبشر
-
تاريخ ورود اطلاعات
1401/07/30
-
دانشكده
كامپيوتر
-
عنوان به انگليسي
evaluation of few-shot and zero-shot learning on a transformer based model for visual question answering and image captioning tasks
-
چكيده
امروزه يكي از داغترين مسائل در زمينه هوش مصنوعي، توانايي ادراك تصوير به كمك مدلهاي كارآمد است. ظهور راهحلهاي يادگيري ماشين مانند توصيف تصاوير، براي افراد نابينا و كمبينا كه قادر به درك تصاوير بصري نيستند، يك موهبت است. با استفاده از يك مدل توصيف تصوير، مي توان توضيحات تصوير را براي افراد ارائه كرد. به كمك اين تكنولوژي آنها ميتوانند درك بهتري از محيط اطراف خود داشته باشند. علاوه بر آن، به كمك مدلهاي پرسش و پاسخ تصويري، ميتوان به پرسشهاي كاربر در مورد يك تصوير پاسخ مناسب داد. همچنين مي توان سيستمهاي پرسش و پاسخ خودكار كه توانايي ادراك تصاوير را دارند توليد كرد. اين سيستمها ميتوانند با انسان ارتباط برقرار كنند و در زندگي روزمره كاربردهاي فراواني داشته باشند.
در سالهاي اخير در دو مسئله توصيف تصوير و پرسش و پاسخ تصويري تلاشهاي فراواني صورت گرفته است اما بيشتر آنها نميتوانند بر روي تصاوير مربوط به يك فرهنگ خاص عملكرد خوبي نشان دهند. در اين پژوهش قصد داريم ضمن جمعآوري يك دادگان كه نمايانگر فرهنگ ايران است، عملكرد يكي از مدلهاي موجود (مدل CLIP) را كه در يادگيري بدون نمونه براي ارتباط بين تصوير و متن نسبت به مدلهاي ديگر عملكرد بهتري دارد، در اين دو وظيفه با تصاوير مرتبط با فرهنگ ايران به دو زبان فارسي و انگليسي آزمايش كنيم. نوع يادگيريهاي آزمايش شده، يادگيري بدون نمونه و يادگيري با نمونههاي معدود است. در اين آزمايشها تلاش ميكنيم تا عملكرد CLIP را روي دستههاي خاصي از تصاوير به طور جداگانه آزمايش كنيم و با امتحان محركهاي مختلف عملكرد آن را بهبود ببخشيم.
-
كليدواژه ها
هوش مصنوعي , پردازش زبانهاي طبيعي , بينايي كامپيوتر , پرسش و پاسخ تصويري , توصيف تصوير , يادگيري بدون نمونه , يادگيري با نمونههاي معدود , مدلهاي بينايي-و-زبان , مجموعه دادگان فارسي , بررسي عملكرد مدلها با تصاوير مربوط به فرهنگ ايراني
-
لينک به اين مدرک :