شماره ركورد

15299

عنوان

بررسي مدل‌هاي زباني بزرگ عامل‌محور در زمينه جستجوي معماري شبكه هاي عصبي و بهينه سازي ابرپارامتر

سال تحصيل

1403

استاد راهنما

دكتر محمدرضا محمدي و دكتر سيد صالح اعتمادي

چکيده

رويكردهاي سنتي يادگيري ماشين خودكار با استفاده از بهينه‌سازي بيزي و الگوريتم‌هاي تكاملي فاقد تفسيرپذيري بوده و در بهره‌برداري از دانش حوزه‌اي دچار چالش هستند. مدل‌هاي زباني بزرگ با توانايي‌هاي درك زبان طبيعي، استدلال و توليد كد، تحولي بنيادين ارائه مي‌دهند. اين سمينار بررسي مي‌كند چگونه عامل‌هاي مبتني بر مدل‌هاي زباني بزرگ مي‌توانند سيستم‌هاي يادگيري ماشين خودكار را با عمل به عنوان عامل‌هاي هوشمند، آگاه از زمينه و تطبيق‌پذير دگرگون سازند. اين پژوهش يك مرور نظام‌مند از رويكردهاي اخير از سه منظر ارائه مي‌دهد: (1) معماري عامل: سامانه‌هاي تك‌عاملي (بهينه‌سازي مستقيم، عملگرهاي تكاملي، كنترل‌گرهاي جريان) در مقابل چندعاملي (همكاري مبتني بر نقش، هماهنگي سلسله‌مراتبي) (2) منابع دانش: دانش دروني (تاريخچه بهينه‌سازي، يادگيري درون‌متني) در برابر بازيابي بيروني (استخراج از ادبيات، مخازن مدل) و (3) قالب خروجي: پيكربندي‌هاي ساختاريافته، توليد كد، نمايش‌هاي درختي و رويكردهاي تركيبي. تحليل نشان مي‌دهد حوزه به طور مساوي بين معماري‌هاي تك‌عاملي و چندعاملي تقسيم شده، با تكيه اكثر سامانه‌ها بر دانش دروني و بهره‌گيري اندك از دانش بيروني. قالب‌هاي خروجي تنوع بالايي دارند و رويكردهاي تركيبي تعادل بين خوانايي ماشيني و بيان‌پذيري را فراهم مي‌كنند. سمينار مسائل باز و جهت‌هاي آينده شامل بهينه‌سازي با منابع محدود، يكپارچه‌سازي دانش پيشرفته و چارچوب‌هاي چندعاملي را شناسايي مي‌كند. پيشنهاد پايان‌نامه براي طراحي سيستم عامل-محور جهت انتخاب و تنظيم مدل در انتقال يادگيري با داده محدود ارائه مي‌شود.

نام دانشجو

محمدصادق پولائي موزيرجي

Name: محمدصادق پولائي موزيرجي
Author: محمدصادق پولائي موزيرجي

تاريخ ارائه

11/5/2025 12:00:00 AM

متن كامل

88185

پديد آورنده

محمدصادق پولائي موزيرجي

تاريخ ورود اطلاعات

1404/08/17

عنوان به انگليسي

Review of agent-based large language models in neural architecture search an‎d hyperparameter optimization

كليدواژه هاي فارسي

يادگيري ماشين خودكار , مدل‌هاي زباني بزرگ , سيستم‌هاي عامل-محور , بهينه‌سازي ابرپارامترها , جستجوي معماري عصبي , توليد تقويت‌شده با بازيابي , يادگيري درون‌متني , انتقال يادگيري

كليدواژه هاي لاتين

Automated Machine Learning , Large Language Models , Agent-Based Systems , Hyperparameter Optimization , Neural Architecture Search , Retrieva‎l-Augmented Generation , In-Context Learning , Transfer Learning

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=15299&Field=0&DTC=14