شماره ركورد
10010
پديد آورنده
اميرحسين موحدي صفت
عنوان
بهبود ناحيهبندي تعاملي تصاوير پزشكي با استفاده از پيشبيني خودكار وروديهاي مكاني
مقطع تحصيلي
كارشناسي
رشته تحصيلي
مهندسي كامپيوتر
سال فارغ التحصيلي
1404
استاد راهنما
دكتر محمدرضا محمدي
دانشجوي وارد كننده اطلاعات
اميرحسين موحدي صفت
تاريخ ورود اطلاعات
1404/08/16
دانشكده
مهندسي كامپيوتر
عنوان به انگليسي
Enhancing Interactive Medical Image Segmentation through Automatic Spatial prompt Generation
چكيده
مدلهاي مبتني بر يادگيري عميق نقش مهمي در تحليل تصاوير پزشكي ايفا ميكنند و بهويژه در حوزه ناحيهبندي پيشرفتهاي چشمگيري داشتهاند. يكي از مدلهاي مطرح در اين زمينه، MedSAMاست كه نسخه سازگارشدهي Segment Anything Model يا به اختصار SAM براي تصاوير پزشكي محسوب ميشود. با اين حال، برخلاف نسخه اصلي SAM كه در مواجهه با پرامپتهاي متنوع مانند نقطه يا جعبه محدود كننده عملكرد پايداري دارد (پرامپت به معناي ورودي اوليهي كاربر براي هدايت ناحيهبندي است)، MedSAM عمدتاً با پرامپتهاي جعبهاي آموزش ديده و در حالت نقطهاي دچار افت دقت قابلتوجهي ميشود.
براي رفع اين محدوديت، در اين پژوهش روشي جديد ارائه شده است كه بر توليد پرامپت تركيبي متكي است. بدين منظور، مدلي به نام Box Predictor طراحي گرديد كه با استفاده از ويژگيهاي تصويري و نقطهي ورودي كاربر، يك جعبه محدودكنندهي تقريبي توليد ميكند. اين جعبه همراه با پرامپت نقطهاي به MedSAM داده ميشود تا دقت ناحيهبندي ارتقا يابد.
نتايج آزمايشها بر روي چند ديتاست پزشكي نشان داد كه استفاده از پرامپت تركيبي پيشنهادي موجب افزايش دقت و پايداري ناحيهبندي در مقايسه با حالتهاي مرسوم ميشود. براي مثال از استفاده از پرامپت تركيبي دقت ناحيه بندي را در ديتاست FLARE22 از 91 به 93 درصد رسانده است. همچنين بررسيهاي كيفي تأييد كرد كه حتي جعبههاي تقريبي توليدشده ميتوانند اطلاعات مؤثري براي بهبود مرزهاي ناحيهبندي فراهم كنند.
كليدواژه ها
ناحيهبندي تعاملي تصاوير پزشكي , مدلهاي بنيادين در بينايي ماشين , يادگيري عميق , پيشبيني مكاني وروديها