شماره ركورد
12779
عنوان
گفتگوي تصويري
سال تحصيل
1401
استاد راهنما
دكتر سيد صالح اعتمادي
چکيده
گفتگوي تصويري يك وظيفه يادگيري ماشين است كه در آن مدل بايد بتواند مكالمه معنادار با انسان در مورد محتواي تصوير داشته باشد. به طور خاص، مدل بايد با توجه به تاريخچه گفتگو، به پرسش فعلي كاربر پاسخ دهد. اين يك چالش دشوار و در عين حال مهم است، زيرا مدل بايد بتواند چندين مهارت مختلف را تركيب كند كه در صورت موفقيت، ميتواند منجر به توسعه مدلهاي زباني چندحالته شود كه قادر به برقراري ارتباط با انسانها در مورد محتواي تصوير به طور طبيعي و معنادار هستند. در سالهاي اخير، پيشرفتهاي قابل توجهي در اين زمينه حاصل شده است. اين پيشرفتها بيشتر به دليل توسعه مدلهاي زباني جديدي است كه ميتوانند محتواي تصوير را بهتر درك كنند و مكالمات را در دورهاي متوالي دنبال كنند.
در فصل نخست اين پژوهش، ضمن معرفي مسئله گفتگوي تصويري، كاربردها و چالشهاي آن را نيز مورد بررسي قرار ميدهيم. در فصل دوم به بررسي برخي مفاهيم پايهاي در پردازش زبان طبيعي ميپردازيم. سپس در فصل سوم، كارهاي مرتبطي كه در اين زمينه انجام گرفته شامل مجموعهدادگان ارائه شده در اين حوزه، معماريهاي پيشنهادي و معيارهاي ارزيابي را مرور ميكنيم. در فصل پاياني بعد از نتيجهگيري، گامهاي آينده و جهتهاي پيشنهادي را مطرح كرده تا در ادامه مسير بر روي آنها پژوهشهاي بيشتري انجام دهيم.
نام دانشجو
غزل زماني نژاد
تاريخ ارائه
11/15/2023 12:00:00 AM
متن كامل
81081
پديد آورنده
غزل زماني نژاد
تاريخ ورود اطلاعات
1402/09/08
عنوان به انگليسي
Visual Dialog
كليدواژه هاي فارسي
گفتگوي تصويري , پردازش زبان طبيعي , بينايي ماشين , تعامل چندحالته , سيستم هاي گفتگو
كليدواژه هاي لاتين
Visual Dialog , Natural Language Processing , Computer Vision , Multi-modal interactions , Dialog Systems