شماره ركورد
15333
عنوان
بررسي رويكردهاي مختلف در بهينه سازي زمان تست در پاسخ گويي به سوالات تصويري
سال تحصيل
1403
استاد راهنما
دكتر محمدرضا محمدي
استاد مشاور
دكتر صالح اعتمادي
چکيده
مسئله بهينهسازي زمان آزمون در سيستمهاي سوال و پاسخ تصويري به منظور بهبود عملكرد مدلها در لحظه استفاده و با محدوديتهاي زماني و محاسباتي اهميت زيادي پيدا كرده است. در اين راستا، هدف اصلي ارائه روشهايي است كه بتوانند بدون نياز به آموزش مجدد و صرفاً با استفاده از دادههاي ورودي، دقت مدل را به طور مؤثر افزايش دهند. يكي از چالشهاي مهم اين است كه بسياري از مدلهاي در هنگام استفاده در دنياي واقعي ممكن است با دادههاي متفاوت از دادههاي آموزشي روبهرو شوند، به همين دليل نياز به بهينهسازي در زمان آزمون حس ميشود.
در اين گزارش، بررسي چندين رويكرد مختلف در زمينه بهينهسازي زمان آزمون انجام شده است. اين رويكردها شامل روشهاي خوديادگيري زمان آزمون، استفاده از افزونسازي و همبندي براي كاهش واريانس پاسخها، يكپارچهسازي دانش بيروني از منابع مختلف به منظور بهبود دقت و استنادپذيري، و استدلال مبتنيبر عامل هستند. هر يك از اين رويكردها مزايا و چالشهاي خاص خود را دارند.
اين بررسي نشان ميدهد كه هيچ كدام از اين رويكردها به تنهايي قادر به حل تمام چالشها و نيازهاي سيستمهاي نيستند و تركيب اين روشها ميتواند راهكار مؤثري براي دستيابي به بهترين عملكرد در زمان آزمون باشد.
در نهايت، بهعنوان پيشنهاد آينده، ايدهاي براي بهينهسازي زمان آزمون و افزايش دقت در مدلهاي پزشكي مطرح شد كه مبتني بر سيستم چندمتخصص با يك مغز مركزي براي هماهنگي است. در اين سيستم، بهترين مدلهاي موجود براي هر كار اختصاصي خروجيهاي خود را توليد كرده و مغز مركزي اين شواهد را با دانش بيروني معتبر تركيب ميكند. سپس، در زمان آزمون با يك سازوكار كوتاه، مدل با مورد حاضر همتراز ميشود و پاسخ نهايي را توليد ميكند. اين روش باعث بهبود دقت در پرسشهاي دشوار و كاهش هذيان، در حالي كه هزينه اجرايي را كنترل ميكند، ميشود.
نام دانشجو
ايسا مياهي نيا
تاريخ ارائه
11/5/2025 12:00:00 AM
متن كامل
88308
پديد آورنده
آيسا مياهي نيا
تاريخ ورود اطلاعات
1404/08/20
عنوان به انگليسي
An Overview of Test-Time Optimization Methods in VQA Systems
كليدواژه هاي فارسي
بهينهسازي زمان آزمون؛ پرسشوپاسخ تصويري؛ مدلهاي زباني-بينايي بزرگ؛ خوديادگيري زمانآزمون؛ بازيابي-تقويتشده ؛ گراف دانش؛ استدلال مبتنيبر عامل.
كليدواژه هاي لاتين
Test-Time Optimization; Visual Question Answering (VQA); Large Vision–Language Models (LVLMs); Test-Time Self-Learning; Retrieval-Augmented Generation (RAG); Knowledge Graphs; Agent-Based Reasoning.