شماره ركورد
15299
عنوان
بررسي مدلهاي زباني بزرگ عاملمحور در زمينه جستجوي معماري شبكه هاي عصبي و بهينه سازي ابرپارامتر
سال تحصيل
1403
استاد راهنما
دكتر محمدرضا محمدي و دكتر سيد صالح اعتمادي
چکيده
رويكردهاي سنتي يادگيري ماشين خودكار با استفاده از بهينهسازي بيزي و الگوريتمهاي تكاملي فاقد تفسيرپذيري بوده و در بهرهبرداري از دانش حوزهاي دچار چالش هستند. مدلهاي زباني بزرگ با تواناييهاي درك زبان طبيعي، استدلال و توليد كد، تحولي بنيادين ارائه ميدهند. اين سمينار بررسي ميكند چگونه عاملهاي مبتني بر مدلهاي زباني بزرگ ميتوانند سيستمهاي يادگيري ماشين خودكار را با عمل به عنوان عاملهاي هوشمند، آگاه از زمينه و تطبيقپذير دگرگون سازند. اين پژوهش يك مرور نظاممند از رويكردهاي اخير از سه منظر ارائه ميدهد: (1) معماري عامل: سامانههاي تكعاملي (بهينهسازي مستقيم، عملگرهاي تكاملي، كنترلگرهاي جريان) در مقابل چندعاملي (همكاري مبتني بر نقش، هماهنگي سلسلهمراتبي) (2) منابع دانش: دانش دروني (تاريخچه بهينهسازي، يادگيري درونمتني) در برابر بازيابي بيروني (استخراج از ادبيات، مخازن مدل) و (3) قالب خروجي: پيكربنديهاي ساختاريافته، توليد كد، نمايشهاي درختي و رويكردهاي تركيبي. تحليل نشان ميدهد حوزه به طور مساوي بين معماريهاي تكعاملي و چندعاملي تقسيم شده، با تكيه اكثر سامانهها بر دانش دروني و بهرهگيري اندك از دانش بيروني. قالبهاي خروجي تنوع بالايي دارند و رويكردهاي تركيبي تعادل بين خوانايي ماشيني و بيانپذيري را فراهم ميكنند. سمينار مسائل باز و جهتهاي آينده شامل بهينهسازي با منابع محدود، يكپارچهسازي دانش پيشرفته و چارچوبهاي چندعاملي را شناسايي ميكند. پيشنهاد پاياننامه براي طراحي سيستم عامل-محور جهت انتخاب و تنظيم مدل در انتقال يادگيري با داده محدود ارائه ميشود.
نام دانشجو
محمدصادق پولائي موزيرجي
تاريخ ارائه
11/5/2025 12:00:00 AM
متن كامل
88185
پديد آورنده
محمدصادق پولائي موزيرجي
تاريخ ورود اطلاعات
1404/08/17
عنوان به انگليسي
Review of agent-based large language models in neural architecture search and hyperparameter optimization
كليدواژه هاي فارسي
يادگيري ماشين خودكار , مدلهاي زباني بزرگ , سيستمهاي عامل-محور , بهينهسازي ابرپارامترها , جستجوي معماري عصبي , توليد تقويتشده با بازيابي , يادگيري درونمتني , انتقال يادگيري
كليدواژه هاي لاتين
Automated Machine Learning , Large Language Models , Agent-Based Systems , Hyperparameter Optimization , Neural Architecture Search , Retrieval-Augmented Generation , In-Context Learning , Transfer Learning