شماره ركورد
13906
عنوان
مروري بر روش هاي يادگيري راهنما در مدل هاي زباني-بينايي
سال تحصيل
1402
استاد راهنما
دكتر محمدرضا محمدي
چکيده
در سال هاي اخير مدل هاي زبان⁃ͬبينايي پيش آموزش ديده بزرگ پتانسيل زيادي در
يادگيري بازنمايي هايي كه قابل انتقال به طيف وسيعͬ از كارهاي پايين دستͬ هستند،
از خود نشان داده و جايͽزين مناسبي براي مدل هاي يادگيري بازنمايي سنتͬ كه در آنها
آموزش بر روي مجموعه مشخصͬ از برچسب هاي گسسته انجام ميشد و باعث محدود
نمودن قابليت تعميم پذيري و نيازمندي به داده هاي بسيار براي انتقال به كارهاي مختلف
در زمينه بينايي بود، هستند.
يادگيري مستقيم از متن خام مرتبط با تصاوير ي ͷروش جايͽزين اميدواركننده است كه
سطح گسترده تري از نظارت را به كار مͬ گيرد. مدل هاي زبان⁃ͬبينايي به هنگام آموزش،
متن و تصاوير متناظر را به ي ͷفضاي ويژگͬ مشترك مͬ برند و در زمان ارزيابي با بهره گيري
از زبان طبيعͬ به عنوان راهنما، دانش آموخته شده خود را بدون نياز به داده ي بسيار كه به
طور معمول در بسياري از روش ها براي تنظيم دقيق استفاده مͬ شود، به وظايف مختلف
منتقل مͬ كنند.
از آنجايي كه انتخاب دستͬ راهنما كار زمان بر و پيچيده اي است، روش هايي براي يادگيري
خودكار آن پيشنهاد شده است.
روش هاي يادگيري راهنما با تعداد محدودي از داده هاي آموزش،ͬ در جهت تطبيق مدل
هاي زبان⁃ͬبينايي بزرگ به كارهاي پايين دستͬ بسيار موفق بوده اند و راهنماي آموخته
شده توسط اين روش ها از قابليت تعميم پذيري بيشتري نسبت به راهنماي مهندسͬ شده
برخوردار است.
بررسͬ ها نشان مͬ دهد كه استفاده از روش هاي يادگيري راهنماي چندوجه،ͬ يادگيري
گروهͬ در آموزش راهنما و همچنين استفاده از يادگيري راهنماي نمونه محور سبب بهبودهايي
در قابليت تعميم پذيري راهنماي آموخته شده در كارهاي پايين دستͬ است.
نام دانشجو
ايسان غيوري پيرسلطان
تاريخ ارائه
10/2/2024 12:00:00 AM
متن كامل
84186
پديد آورنده
آيسان غيوري پيرسلطان
تاريخ ورود اطلاعات
1403/07/23
عنوان به انگليسي
prompt learning for vision-language models
كليدواژه هاي فارسي
مهندسي راهنما , مدل هاي زباني-بينايي , يادگيري راهنما
كليدواژه هاي لاتين
vision-language Models , prompt engineering , prompt learning