شماره ركورد
10140
پديد آورنده
ستايش كولوبندي
عنوان
بهبود ناحيهبندي تصاوير پزشكي با استفاده از توليد خودكار ورودي كاربر
مقطع تحصيلي
كارشناسي
رشته تحصيلي
مهندسي كامپيوتر
سال فارغ التحصيلي
1404
استاد راهنما
دكتر محمدرضا محمدي
دانشجوي وارد كننده اطلاعات
ستايش كولوبندي
تاريخ ورود اطلاعات
1404/09/09
دانشكده
كامپيوتر
عنوان به انگليسي
Enhancing Medical Image Segmentation via Automatic prompt Generation
چكيده
ناحيهبندي دقيق تصاوير پزشكي، بهدليل حساسيت بالاي دادهها و چالشهايي همچون پراكندگي ضايعات، ابعاد كوچك و شباهت زياد بين بافتهاي آسيب ديده با بافتهاي سالم، يكي از مسائل اساسي در بينايي ماشين محسوب ميشود. مدلهاي بنيادياي مانند MedSAM، با بهرهگيري از پيشآموزش گسترده و درك قوي از پرامپتها (prompts)، ظرفيت بالايي در بهبود دقت ناحيهبندي دارند؛ با اين حال، عملكرد اين مدلها بهشدت به كيفيت پرامپتهاي ورودي وابسته است و اين وابستگي در محيطهاي باليني، تعميمپذيري مدل را محدود ميسازد. به منظور كاهش اين وابستگي، مدلها به استفاده از رويكردهاي توليد خودكار پرامپت (Auto-prompting)روي آوردند؛ اما اغلب آنها با سه چالش بنيادين روبهرو هستند: نخست، ناتواني در تعيين تعداد باكسهاي حالت خودكار بر اساس ويژگيهاي تصوير؛ دوم، از بين رفتن قابليت دريافت پرامپت كاربر پس از خودكارسازي و سوم، ناپايداري در پرامپتهاي توليدي.
در اين پژوهش، چارچوبي خودكار براي توليد پرامپت پيشنهاد ميشود كه ناحيهبندي را از شناسايي اوليه تا پالايش نهايي بهصورت ماژولار انجام ميدهد. در اين ساختار، YOLO نواحي مشكوك به ضايعه را شناسايي كرده و شبكهاي مبتني بر معماري U-Net با بهرهگيري از چهار سطح نقشه ويژگي استخراجشده از Image Encoder، ماسك اوليهاي را توليد ميكند. خروجي اين دو ماژول در فضاي مختصاتي مشترك همتراز شده و بعد از پسپردازش (Post-processing)به MedSAM داده ميشود تا سازوكار توجه ذاتي آن بر ناحيهي هدف متمركز و ماسك نهايي توليد گردد.
چارچوب پيشنهادي، علاوه بر بهبود دقت ناحيهبندي خودكار مدل MedSAM، قابليت دريافت پرامپت كاربر را نيز حفظ كرده و زمينهي تعريف تابع زيان مناسبتر و بهينهسازي حالتهاي جديد و پيشين شبكه را براي پژوهشهاي آينده فراهم ميسازد. آزمايشها بر روي مجموعهدادگان BRISC نشان دادند كه مدل پيشنهادي نسبت به MedSAM پايه، در معيار Dice Score، 6.5 درصد عملكرد بهتري ارائه ميدهد.
نتايج نشان ميدهند كه چارچوب پيشنهادي ميتواند گامي مؤثر بهسوي ناحيهبندي دقيق، خودكار و كاربرمحور در تحليل تصاوير پزشكي باشد.
كليدواژه ها
يادگيري عميق , بينايي كامپيوتر , مدلهاي بنيادين , ناحيهبندي تصاوير پزشكي , MedSAM , Auto prompt