• شماره ركورد
    13846
  • عنوان
    بررسي اصول و فناوري‌هاي توليد خودكار متن از مجموعه‌اي از تصاوير با هدف توليد خودكار محتواي صفحات وب
  • سال تحصيل
    1402
  • استاد راهنما
    دكتر محمدرضا كنگاوري
  • چکيده
    توصيف تصوير يك حوزه كاملا جديد از تركيب بينايي كامپيوتر و پردازش زبان طبيعي است. ايجاد عبارات ساختاريافته به درك كامل زبان به صورت نظام‌مند و معنايي نياز دارد. توانايي توصيف محتواي يك تصوير با استفاده از عبارات ساختاريافته كار دشواري است، اما مي‌تواند تأثير قابل‌توجهي در كمك به افراد نابينا براي درك بهتر محتواي تصاوير داشته باشد. همچنين مي‌تواند به طور گسترده در طيف وسيعي از برنامه‌ها مانند جستجوي چندوجهي، روباتيك، امنيت، سنجش از راه دور و حوزه پزشكي و سلامت استفاده شود. اهميت توصيف تصوير در تسهيل درك و انتقال دقيق اطلاعات بصري نهفته است. در زمينه‌هايي مانند تجزيه و تحليل داده‌هاي بصري يا تشخيص الگوها، سرعت و دقت توصيف‌هاي ماشيني از تصويرها مي‌تواند به مراتب بيشتر از انسان باشد، كه اين امر مي‌تواند در تصميم‌گيري‌هاي سريع و مبتني بر داده‌ها بسيار مفيد باشد. عدم وجود توصيف تصوير مي‌تواند منجر به از دست رفتن فرصت‌هاي كليدي در اين زمينه‌ها و كاهش كارايي سيستم‌هاي اطلاعاتي شود. هدف توصيف تصوير، ايجاد عبارات طبيعي منطقي و دقيق است كه يك تصوير را توصيف مي‌كند. مدل هاي ارائه شده بايد بتوانند اجزا مختلف در تصوير را ببينند و روابط آن‌ها را به درستي توصيف كنند. به طور شهودي، براي يك ماشين دشوار است كه يك تصوير معمولي را به همان صورتي كه انسان‌ها مي‌بينند، ببيند. با اين حال، اين امر پايه‌اي براي گسترش و پيشرفت در يادگيري عميق فراهم مي‌كند. هدف از اين مطالعه ابتدا بررسي فرايند توصيف تصوير از ديدگاه شبيه‌سازي فرآيند انساني كه شامل ديدن، تمركز و بيان است. در ادامه روش‌هاي يادگيري تقويتي، پيشرفت‌هاي معنايي، استفاده از مدل‌هاي ترانسفورماتور توجه به خود و مدل‌هاي از پيش آموزش‌ديده‌شده بررسي شده اند كه عملكرد توصيف تصاوير را بهبود بخشيده اند. در انتها چالش ها، مجموعه داده‌ها و همچنين مزايا و معايب روش‌هاي موجود به كمك معيار هاي ارزيابي توصيف تصوير بررسي شده اند و در نهايت خلا هاي موجود و نتيجه‌گيري ارائه شده اند.
  • نام دانشجو

    مهدي اشراقي نژاد

  • تاريخ ارائه
    10/2/2024 12:00:00 AM
  • متن كامل
    84010
  • پديد آورنده

    مهدي اشراقي نژاد

  • تاريخ ورود اطلاعات
    1403/07/22
  • عنوان به انگليسي
    Reviewing the principles and technologies of automatic text generation from a set of images with the aim of automating web content creation
  • كليدواژه هاي فارسي
    توصيف تصوير , توليد زبان طبيعي , يادگيري عميق , تحليل متن و تصوير , ارزيابي توصيف تصوير
  • كليدواژه هاي لاتين
    : Image captioning , natural language generation , deep learning , text and image analysis , image captioning eva‎luation