• شماره ركورد
    28601
  • پديد آورنده

    مليحه حاجي حسيني گزستاني

  • عنوان
    ﭘﺮﺳﺶ ﻭ ﭘﺎﺳﺦ ﺗﺼﻮﯾﺮﯼ ﭘﺰﺷﮑﯽ ﺑﻪ ﺯﺑﺎﻥ ﻓﺎﺭﺳﯽ
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    مهندسي هوش مصنوعي و رباتيكز
  • سال تحصيل
    1399
  • تاريخ دفاع
    1401/12/21
  • استاد راهنما
    دكتر سيد صالح اعتمادي
  • دانشكده
    مهندسي كامپيوتر
  • چكيده
    مسئله پرسش و پاسخ تصويري پزشكي يك مسئله چالش‌برانگيز و نوظهور است كه از تركيب پردازش زبان طبيعي و بينايي ماشين استفاده مي‌كند. در اين مسئله، سامانه وظيفه دارد به سوالات پرسيده‌شده در مورد يك تصوير ورودي پاسخ صحيح بدهد. اين مسئله در زمينه‌هاي مختلفي مانند پزشكي، دستيار نابينايان، نظارت تصويري، آموزش، ميراث فرهنگي و صنعت تبليغات كاربرد دارد. در اين پايان‌نامه به كاربرد اين مسئله در حوزه پزشكي پرداخته‌شده است. باتوجه به سرعت كم پيشرفت هوش مصنوعي در علم پزشكي، نياز بود ابتدا مسائل ساده‌تر مانند مسائل رده‌بندي در حوزه پزشكي تعريف و بررسي شوند تا بعدا در قالب مسئله پرسش و پاسخ تصويري قابليت توسعه‌دادن داشته باشند. به همين جهت تلاش شد تا به صورت موازي، پروژه‌هاي مشابه در حوزه پزشكي نيز بررسي شوند. به عنوان اولين اقدام، مسابقات جهاني IMAGECLEF كه از سال 2003 برگزار مي‌شوند، شناسايي شد. از سال 2004 بخش پزشكي به اين مسابقات اضافه شد و هرساله گروه‌هاي زيادي از سراسر جهان در اين بخش به رقابت مي‌پردازند. به منظور كسب تجربه در اين حوزه و رقابت با ساير دانشجويان سراسر جهان، در سال 2022 به عنوان يك گروه نماينده از كشور ايران و دانشگاه علم و صنعت به نام IUST_NLPLAB در اين دوره از مسابقات به رقابت پرداختيم و توانستيم در بخش حاشيه‌نويسي تصاوير پزشكي رتبه نخست را كسب كنيم. كسب اين تجربه توانست زمينه خوبي را براي حل مسائل بعدي هوش مصنوعي در بخش پزشكي به ارمغان آورد. در بخش بعدي تلاش شد تا از ظرفيت كار پژوهشي مشترك با صنعت يا دانشگاه‌هاي ديگر در زمينه پزشكي استفاده شود. بدين‌منظور همكاري‌اي با دانشگاه علوم پزشكي تهران جهت تشخيص خودكار الگوهاي بيماري‌هاي پوستي انجام شد كه در مرحله اول توانست به نتايج خوب و قابل‌قبولي دست‌يابد و زمينه‌ساز ادامه همكاري براي تشخيص بيماري‌هاي بيشتر باشد. همچنين در راستاي مسئله پرسش و پاسخ تصويري پزشكي، اولين مجموعه داده دوزبانه فارسي-انگليسي اين حوزه كه شامل اندام بدن، روش‌هاي تصويربرداري و ناهنجاري‌ها است توليدشد و مورد ارزيابي قرار گرفت كه مي‌تواند زمينه‌ساز پژوهش‌هاي بيشتر در اين مسئله خصوصا در زبان فارسي باشد و امكان توسعه نرم‌افزارهاي كاربردي براي كمك به بيماران و پزشكان را فراهم كند.
  • تاريخ ورود اطلاعات
    1402/05/24
  • عنوان به انگليسي
    Medical Visual Question Answering In Persian
  • تاريخ بهره برداري
    3/11/2024 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    مليحه حاجي حسيني گزستاني

  • چكيده به لاتين
    The Medical Visual Qestion Answering (MVQA) problem is a challenging and newfound problem that uses a combination of natural language processing and computer vision. In this task, the system must correctly answer the questions asked about an input image. This problem is used in various fields. In this thesis, the application of this issue in the field of medicine is discussed, and the first dataset produced in both Persian and English languages for this task is introduced and eva‎luated. Also, some researches about the use of artificial intelligence in medical tasks have been presented. The Medical Visual Qestion Answering (MVQA) problem is a challenging and newfound problem that uses a combination of natural language processing and computer vision. In this task, the system must correctly answer the questions asked about an input image. This problem is used in various fields such as medical, Assistant to the blind people, video surveillance scenarios, education and cultural heritage and advertising. In this thesis, the application of this problem in the field of medicine is discussed. Due to the slow progress of artificial intelligence in medical science, it was necessary to first define and examine simpler problems such as classification problems in the field of medicine so that later they can be developed in the form of visual question answering problems. For this reason, an effort was made to examine similar projects in the field of medicine in parallel. As the first action, the IMAGECLEF World Championships, which have been held since 2003, were identified. Since 2004, the medical section has been added to these competitions, and every year many groups from all over the world compete in this section. In order to gain experience in this field and compete with other students around the world, in 2022, as a representative group from Iran and the University of Science and Technology named IUST_NLPLAB, we competed in this course of competition and were able to rank in the medical image captioning section. get the first gaining this experience was able to provide a good basis for solving the next problems of artificial intelligence in the medical problems. In the next part, an attempt was made to use the capacity of joint research work with industry or other universities in the field of medicine. For this purpose, a collaboration with Tehran University of Medical Sciences was carried out for the automatic detection of skin disease patterns, which in the first stage was able to achieve good and acceptable results and lay the foundation for continued cooperation to diagnose more diseases. Also, in line with the issue of medical imaging questions and answers, the first Persian-English bilingual dataset of this field, which includes organs, imaging modalities and abnormalities, was produced and eva‎luated, which can be the basis for further research on this issue, especially in persian language, and the possibility provide the development of practical software to help patients and doctors.
  • كليدواژه هاي فارسي
    ﯾﺎﺩﮔﯿﺮﯼ ﻋﻤﯿﻖ , ﭘﺮﺩﺍﺯﺵ ﺯﺑﺎﻥ ﻃﺒﯿﻌي , ﺑﯿﻨﺎﯾﯽ ﻣﺎﺷﯿﻦ , ﭘﺮﺳﺶ ﻭ ﭘﺎﺳﺦ ﺗﺼﻮﯾﺮﯼ
  • كليدواژه هاي لاتين
    Visual Question Answering , Deep Learning , Natural Language Processing , Computer Vision
  • Author
    Ⅿaⅼihe Hajihosseini Gazestani
  • SuperVisor
    Dr.Sayyed Sauleh Eetemadi