-
شماره ركورد
13846
-
عنوان
بررسي اصول و فناوريهاي توليد خودكار متن از مجموعهاي از تصاوير با هدف توليد خودكار محتواي صفحات وب
-
سال تحصيل
1402
-
استاد راهنما
دكتر محمدرضا كنگاوري
-
چکيده
توصيف تصوير يك حوزه كاملا جديد از تركيب بينايي كامپيوتر و پردازش زبان طبيعي است. ايجاد عبارات ساختاريافته به درك كامل زبان به صورت نظاممند و معنايي نياز دارد. توانايي توصيف محتواي يك تصوير با استفاده از عبارات ساختاريافته كار دشواري است، اما ميتواند تأثير قابلتوجهي در كمك به افراد نابينا براي درك بهتر محتواي تصاوير داشته باشد. همچنين ميتواند به طور گسترده در طيف وسيعي از برنامهها مانند جستجوي چندوجهي، روباتيك، امنيت، سنجش از راه دور و حوزه پزشكي و سلامت استفاده شود. اهميت توصيف تصوير در تسهيل درك و انتقال دقيق اطلاعات بصري نهفته است. در زمينههايي مانند تجزيه و تحليل دادههاي بصري يا تشخيص الگوها، سرعت و دقت توصيفهاي ماشيني از تصويرها ميتواند به مراتب بيشتر از انسان باشد، كه اين امر ميتواند در تصميمگيريهاي سريع و مبتني بر دادهها بسيار مفيد باشد. عدم وجود توصيف تصوير ميتواند منجر به از دست رفتن فرصتهاي كليدي در اين زمينهها و كاهش كارايي سيستمهاي اطلاعاتي شود. هدف توصيف تصوير، ايجاد عبارات طبيعي منطقي و دقيق است كه يك تصوير را توصيف ميكند. مدل هاي ارائه شده بايد بتوانند اجزا مختلف در تصوير را ببينند و روابط آنها را به درستي توصيف كنند. به طور شهودي، براي يك ماشين دشوار است كه يك تصوير معمولي را به همان صورتي كه انسانها ميبينند، ببيند. با اين حال، اين امر پايهاي براي گسترش و پيشرفت در يادگيري عميق فراهم ميكند.
هدف از اين مطالعه ابتدا بررسي فرايند توصيف تصوير از ديدگاه شبيهسازي فرآيند انساني كه شامل ديدن، تمركز و بيان است. در ادامه روشهاي يادگيري تقويتي، پيشرفتهاي معنايي، استفاده از مدلهاي ترانسفورماتور توجه به خود و مدلهاي از پيش آموزشديدهشده بررسي شده اند كه عملكرد توصيف تصاوير را بهبود بخشيده اند. در انتها چالش ها، مجموعه دادهها و همچنين مزايا و معايب روشهاي موجود به كمك معيار هاي ارزيابي توصيف تصوير بررسي شده اند و در نهايت خلا هاي موجود و نتيجهگيري ارائه شده اند.
-
نام دانشجو
مهدي اشراقي نژاد
-
تاريخ ارائه
10/2/2024 12:00:00 AM
-
متن كامل
84010
-
پديد آورنده
مهدي اشراقي نژاد
-
تاريخ ورود اطلاعات
1403/07/22
-
عنوان به انگليسي
Reviewing the principles and technologies of automatic text generation from a set of images with the aim of automating web content creation
-
كليدواژه هاي فارسي
توصيف تصوير , توليد زبان طبيعي , يادگيري عميق , تحليل متن و تصوير , ارزيابي توصيف تصوير
-
كليدواژه هاي لاتين
: Image captioning , natural language generation , deep learning , text and image analysis , image captioning evaluation
-
لينک به اين مدرک :