شماره ركورد
8371
پديد آورنده
هادي شيخي
عنوان
توليد پاسخ در پرسشوپاسخ تصويري
مقطع تحصيلي
كارشناسي
رشته تحصيلي
مهندسي كامپيوتر
سال فارغ التحصيلي
1401
استاد راهنما
دكتر صالح اعتمادي
دانشجوي وارد كننده اطلاعات
هادي شيخي محمدابادي
تاريخ ورود اطلاعات
1402/02/05
دانشكده
مهندسي كامپيوتر
عنوان به انگليسي
Generate Answer to Visual Questions with Pre-trained Vision-and-Language Embeddings
چكيده
پرسشوپاسخ تصويري يك فعاليت چالشي است كه طي سالهاي اخير مورد توجه هر دو جامعه پردازش زبان طبيعي
و پردازش تصوير قرار گرفتهاست. با در نظر گرفتن يك تصوير و يك سوال مربوط به آن، سيستم موظف است با توجه
نتيجهگيري تصويري و پردازش بخشهاي مختلف تصوير و همچنين مقداري اطلاعات عمومي ساده سوالات مربوطه را
پاسخ دهد. اكثر راهحل هاي ارائه شده براي اين مسئله به صورت دستهبندي و تككلمهاي هستند، در حالي كه اگر از
ديد انسان به مسئله نگاه كنيم متوجه اين مفهوم ميشويم كه پاسخ سوالات بهتر است به صورت توليد جمله باشد. در اين
پروژه به بررسي امكانپذيري حل پرسشوپاسخ تصويري در قالب توليد جملات پردا خته شدهاست و روشهاي متفاوتي با
ارزيابيهاي كمي و كيفي ارائه شدهاست. همچنين در اين گزارش مقايسه اين روشها و تاثير تغييرات در معماري پيشنهادي
نيز مورد مطالعه قرار گرفتهاست. در انتها نيز براي تاييد و صحت نتايج، به ارزيابي انساني پرداخته شده است.
كليدواژه ها
پرسشوپاسخ تصويري , توليد متن , پردازش زبان طبيعي , هوش مصنوعي