-
شماره ركورد
13906
-
عنوان
مروري بر روش هاي يادگيري راهنما در مدل هاي زباني-بينايي
-
سال تحصيل
1402
-
استاد راهنما
دكتر محمدرضا محمدي
-
چکيده
در سال هاي اخير مدل هاي زبان⁃ͬبينايي پيش آموزش ديده بزرگ پتانسيل زيادي در
يادگيري بازنمايي هايي كه قابل انتقال به طيف وسيعͬ از كارهاي پايين دستͬ هستند،
از خود نشان داده و جايͽزين مناسبي براي مدل هاي يادگيري بازنمايي سنتͬ كه در آنها
آموزش بر روي مجموعه مشخصͬ از برچسب هاي گسسته انجام ميشد و باعث محدود
نمودن قابليت تعميم پذيري و نيازمندي به داده هاي بسيار براي انتقال به كارهاي مختلف
در زمينه بينايي بود، هستند.
يادگيري مستقيم از متن خام مرتبط با تصاوير ي ͷروش جايͽزين اميدواركننده است كه
سطح گسترده تري از نظارت را به كار مͬ گيرد. مدل هاي زبان⁃ͬبينايي به هنگام آموزش،
متن و تصاوير متناظر را به ي ͷفضاي ويژگͬ مشترك مͬ برند و در زمان ارزيابي با بهره گيري
از زبان طبيعͬ به عنوان راهنما، دانش آموخته شده خود را بدون نياز به داده ي بسيار كه به
طور معمول در بسياري از روش ها براي تنظيم دقيق استفاده مͬ شود، به وظايف مختلف
منتقل مͬ كنند.
از آنجايي كه انتخاب دستͬ راهنما كار زمان بر و پيچيده اي است، روش هايي براي يادگيري
خودكار آن پيشنهاد شده است.
روش هاي يادگيري راهنما با تعداد محدودي از داده هاي آموزش،ͬ در جهت تطبيق مدل
هاي زبان⁃ͬبينايي بزرگ به كارهاي پايين دستͬ بسيار موفق بوده اند و راهنماي آموخته
شده توسط اين روش ها از قابليت تعميم پذيري بيشتري نسبت به راهنماي مهندسͬ شده
برخوردار است.
بررسͬ ها نشان مͬ دهد كه استفاده از روش هاي يادگيري راهنماي چندوجه،ͬ يادگيري
گروهͬ در آموزش راهنما و همچنين استفاده از يادگيري راهنماي نمونه محور سبب بهبودهايي
در قابليت تعميم پذيري راهنماي آموخته شده در كارهاي پايين دستͬ است.
-
نام دانشجو
ايسان غيوري پيرسلطان
-
تاريخ ارائه
10/2/2024 12:00:00 AM
-
متن كامل
84186
-
پديد آورنده
آيسان غيوري پيرسلطان
-
تاريخ ورود اطلاعات
1403/07/23
-
عنوان به انگليسي
prompt learning for vision-language models
-
كليدواژه هاي فارسي
مهندسي راهنما , مدل هاي زباني-بينايي , يادگيري راهنما
-
كليدواژه هاي لاتين
vision-language Models , prompt engineering , prompt learning
-
لينک به اين مدرک :