ستايش كولوبندي

عنوان

بهبود ناحيه‌بندي تصاوير پزشكي با استفاده از توليد خودكار ورودي كاربر

مقطع تحصيلي

كارشناسي

رشته تحصيلي

مهندسي كامپيوتر

سال فارغ التحصيلي

1404

استاد راهنما

دكتر محمد‌رضا محمدي

دانشجوي وارد كننده اطلاعات

ستايش كولوبندي

Name: ستايش كولوبندي
Author: ستايش كولوبندي

تاريخ ورود اطلاعات

1404/09/09

دانشكده

كامپيوتر

عنوان به انگليسي

Enhancing Medical Image Segmentation via Automatic pro‎mp‎t Generation

چكيده

ناحيه‌بندي دقيق تصاوير پزشكي، به‌دليل حساسيت بالاي داده‌ها و چالش‌هايي همچون پراكندگي ضايعات، ابعاد كوچك و شباهت زياد بين بافت‌هاي آسيب ديده با بافت‌هاي سالم، يكي از مسائل اساسي در بينايي ماشين محسوب مي‌شود. مدل‌هاي بنيادي‌اي مانند MedSAM، با بهره‌گيري از پيش‌آموزش گسترده و درك قوي از پرامپت‌ها (pro‎mp‎ts)، ظرفيت بالايي در بهبود دقت ناحيه‌بندي دارند؛ با اين حال، عملكرد اين مدل‌ها به‌شدت به كيفيت پرامپت‌هاي ورودي وابسته است و اين وابستگي در محيط‌هاي باليني، تعميم‌پذيري مدل را محدود مي‌سازد. به ‌منظور كاهش اين وابستگي، مدل‌ها به استفاده از رويكردهاي توليد خودكار پرامپت (Auto-pro‎mp‎ting)روي آوردند؛ اما اغلب آن‌ها با سه چالش بنيادين روبه‌رو هستند: نخست، ناتواني در تعيين تعداد باكس‌هاي حالت خودكار بر اساس ويژگي‌هاي تصوير؛ دوم، از بين رفتن قابليت دريافت پرامپت كاربر پس از خودكارسازي و سوم، ناپايداري در پرامپت‌هاي توليدي. در اين پژوهش، چارچوبي خودكار براي توليد پرامپت پيشنهاد مي‌شود كه ناحيه‌بندي را از شناسايي اوليه تا پالايش نهايي به‌صورت ماژولار انجام مي‌دهد. در اين ساختار، YOLO نواحي مشكوك به ضايعه را شناسايي كرده و شبكه‌اي مبتني بر معماري U-Net با بهره‌گيري از چهار سطح نقشه ويژگي استخراج‌شده از Image Encoder، ماسك اوليه‌اي را توليد مي‌كند. خروجي اين دو ماژول در فضاي مختصاتي مشترك هم‌تراز شده و بعد از پس‌پردازش (Post-processing)به MedSAM داده مي‌شود تا سازوكار توجه ذاتي آن بر ناحيه‌ي هدف متمركز و ماسك نهايي توليد گردد. چارچوب پيشنهادي، علاوه بر بهبود دقت ناحيه‌بندي خودكار مدل MedSAM، قابليت دريافت پرامپت كاربر را نيز حفظ كرده و زمينه‌ي تعريف تابع زيان مناسب‌تر و بهينه‌سازي حالت‌هاي جديد و پيشين شبكه را براي پژوهش‌هاي آينده فراهم مي‌سازد. آزمايش‌ها بر روي مجموعه‌داد‌گان BRISC نشان دادند كه مدل پيشنهادي نسبت به MedSAM پايه، در معيار Dice Score، 6.5 درصد عملكرد بهتري ارائه مي‌دهد. نتايج نشان مي‌دهند كه چارچوب پيشنهادي مي‌تواند گامي مؤثر به‌سوي ناحيه‌بندي دقيق، خودكار و كاربرمحور در تحليل تصاوير پزشكي باشد.

كليدواژه ها

يادگيري عميق , بينايي كامپيوتر , مدل‌هاي بنيادين , ناحيه‌بندي تصاوير پزشكي , MedSAM , Auto pro‎mp‎t

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=10140&Field=0&DTC=12