-
شماره ركورد
12779
-
عنوان
گفتگوي تصويري
-
سال تحصيل
1401
-
استاد راهنما
دكتر سيد صالح اعتمادي
-
چکيده
گفتگوي تصويري يك وظيفه يادگيري ماشين است كه در آن مدل بايد بتواند مكالمه معنادار با انسان در مورد محتواي تصوير داشته باشد. به طور خاص، مدل بايد با توجه به تاريخچه گفتگو، به پرسش فعلي كاربر پاسخ دهد. اين يك چالش دشوار و در عين حال مهم است، زيرا مدل بايد بتواند چندين مهارت مختلف را تركيب كند كه در صورت موفقيت، ميتواند منجر به توسعه مدلهاي زباني چندحالته شود كه قادر به برقراري ارتباط با انسانها در مورد محتواي تصوير به طور طبيعي و معنادار هستند. در سالهاي اخير، پيشرفتهاي قابل توجهي در اين زمينه حاصل شده است. اين پيشرفتها بيشتر به دليل توسعه مدلهاي زباني جديدي است كه ميتوانند محتواي تصوير را بهتر درك كنند و مكالمات را در دورهاي متوالي دنبال كنند.
در فصل نخست اين پژوهش، ضمن معرفي مسئله گفتگوي تصويري، كاربردها و چالشهاي آن را نيز مورد بررسي قرار ميدهيم. در فصل دوم به بررسي برخي مفاهيم پايهاي در پردازش زبان طبيعي ميپردازيم. سپس در فصل سوم، كارهاي مرتبطي كه در اين زمينه انجام گرفته شامل مجموعهدادگان ارائه شده در اين حوزه، معماريهاي پيشنهادي و معيارهاي ارزيابي را مرور ميكنيم. در فصل پاياني بعد از نتيجهگيري، گامهاي آينده و جهتهاي پيشنهادي را مطرح كرده تا در ادامه مسير بر روي آنها پژوهشهاي بيشتري انجام دهيم.
-
نام دانشجو
غزل زماني نژاد
-
تاريخ ارائه
11/15/2023 12:00:00 AM
-
متن كامل
81081
-
پديد آورنده
غزل زماني نژاد
-
تاريخ ورود اطلاعات
1402/09/08
-
عنوان به انگليسي
Visual Dialog
-
كليدواژه هاي فارسي
گفتگوي تصويري , پردازش زبان طبيعي , بينايي ماشين , تعامل چندحالته , سيستم هاي گفتگو
-
كليدواژه هاي لاتين
Visual Dialog , Natural Language Processing , Computer Vision , Multi-modal interactions , Dialog Systems
-
لينک به اين مدرک :