-
شماره ركورد
31559
-
پديد آورنده
سارا آئين
-
عنوان
شخيص اشياء در تصاوير هوايي با داده كم مبتني بر يادگيري عميق
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي كامپيوتر
-
سال تحصيل
1398
-
تاريخ دفاع
1403/01/28
-
استاد راهنما
دكتر محمدرضا محمدي
-
استاد مشاور
.
-
دانشكده
مهندسي كامپيوتر
-
چكيده
تشخيص شيء يكي اث موضوعات مهمي است كه در حوثه بينايي ماشين بررسي ميشود. اث طرفي تشخيص
اشياء در ثمينهي تجزيه و تحليل تصاوير هوايي نقش مهمي دارد و اين مساله يكي اث مسائل باث امروثه است.
با توجه به اين كه تصاوير هوايي اث فاصلههاي دور، تصويربرداري ميشوند و ممكن است تصويربرداري در جهات
متفاوتي باشد، داراي چالشهايي است كه اث مهمترين آنها ميتوان به مواردي چون تشخيص اشياء كوچك
و چندمقياسه، اشياء متراكم، اشياء در جهات متفاوت اشاره كرد. اث طرفي چالش يادگيري با داده كم با توجه
به اينكه ممكن است دادگان كمي براي برخي اشياء در اين تصاوير در دسترس باشد، براي آن مطرح است.
با توجه به چالشهاي موجود در اين حوثه، شبكهاي طراحي شدهاست كه قابليت تشخيص اشياء با داده كم و
در جهات مختلف را دارد و اين كار با افزودن بلوك كاليبراسيون نمونه )PCB )در ثمان ارثيابي، به شبكه
v5-YOLO صورت گرفتهاست. در PCB براي هر كالس با استفاده اث دادگان پشتيبان، به وسيله شبكه
ResNet101 كه بر روي ImageNet اث پيش آموثش دادهشده، يك ويژگي نماينده به دست ميآيد. سپس
براي هر تصوير ورودي نيز يك ويژگي به دست آورده و با به دست آوردن شباهت كسينوسي اين ويژگي با
بردار ويژگيهاي نماينده كالسها، امتياث پيشبيني براي آن تشخيص را تغيير ميدهد. به اين ترتيب، براي
دادگان جديدي كه تعداد محدودي اث آن داده وجود دارد، عملكرد بهتري به دست ميآيد. اين تركيب، كار
جديدي در حوثه تشخيص اشياء در تصاوير هوايي ميباشد كه دقت را بر روي مجموعه دادگان 5.v1 DOTA
براي تنظيمات 10 نمونهاي نسبت به مدل پايه v5-YOLO ،59/1 درصد افزايش داد.
-
تاريخ ورود اطلاعات
1403/08/27
-
عنوان به انگليسي
Few-Shot Object Detection in Aerial Images Based on Deep Learning
-
تاريخ بهره برداري
4/16/2024 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
سارا ائين
-
چكيده به لاتين
Object detection is one of the important topics in the field of computer vision,
and object detection in aerial imagery plays an important role in the analysis of
aerial images and this issue is one of the open problems today. Aerial images are
captured from distant viewpoints, and they may vary in terms of direction,
presenting challenges such as detecting small and multi-scale objects, densely
crowded objects, and objects in different orientations. Additionally, the challenge
of learning with few-shot data arises because there may be limited data available
for some objects in these images.
To address the challenges in this domain, a network has been designed capable
of detecting objects with limited data and in various orientations. This is achieved
by adding a Prototype Calibration Block (PCB) during inference time to the
YOLO-v5 network. In PCB, a representative feature is obtained for each class
using support images through a pre-trained ResNet101 network trained on
ImageNet. Then, a feature is obtained for each query image, and by computing
the cosine similarity of this feature with the feature vectors of class
representatives, the prediction score for that detection is adjusted. This approach
results in better performance for new datasets with few-shot data. This
combination represents a novel approach in the field of object detection in aerial
imagery, achieving a 1.59% improvement in accuracy on the DOTA v1.5 dataset
for 10-shot settings compared to the YOLO-v5 baseline model.
-
كليدواژه هاي فارسي
يادگيري عميق , تشخيص اشياء , تصاوير هوايي , مستقل از چرخش , يادگيري با داده كم
-
كليدواژه هاي لاتين
Obiects detection , Deep learning , Aeirial Imagery , Rotation invariant , Few-shot learning
-
Author
Sara Aein
-
SuperVisor
Dr. Mohammad Reza Mohammadi
-
لينک به اين مدرک :