شماره ركورد
11472
عنوان
يادگيري بازنمايي علّي براي تعميم خارج از توزيع
سال تحصيل
1400
استاد راهنما
دكتر عادل تركمان رحماني
چکيده
الگوريتم هاي يادگيري ماشين معمولا روي فرض iid ساخته مي شوند كه داده هاي آموزش و آزمون مستقل و به صورت يكسان توزيع شده اند. اين فرض به اين معنا است كه توزيع داده هاي آموزش و داده هاي آزمون يكسان باشند. در دنيا واقعي به دليل تغييرات توزيعي، اين فرض به سختي برآورده مي شود كه باعث كاهش شديد دقت اين الگوريتم هاي كلاسيك يادگيري ماشين مي شود. از طرف ديگر، الگوريتم هاي يادگيري ماشين غالبا از مدل هاي آماري براي مدل سازي وابستگي بين داده ها و برچسب ها استفاده مي كنند كه قصد يادگيري بازنمايي هاي مستقل از دامنه را دارد. با اين وجود، مدل هاي آماري توصيف هاي سطحي واقعيت هستند، زيرا آنها فقط به مدل سازي وابستگي به جاي مكانيسم علّي ذاتي نياز دارند. هنگامي كه وابستگي با توزيع هدف تغيير مي كند، مدل هاي آماري ممكن است در تعميم ناكام باشند. علّيت، با تمركز بر بازنمايي دانش ساختاري در مورد فرآيند توليد داده كه اجازه تغييرات (interventions) را مي دهد، مي تواند به درك و رفع برخي محدوديت هاي روش هاي يادگيري ماشين فعلي كمك كند. عليرغم موفقيت يادگيري آماري ، اين مدل ها توصيفي نسبتا سطحي از واقعيت ارائه مي دهند كه تنها زماني برقرار است كه شرايط آزمايشي ثابت باشد. در عوض، حوزه يادگيري علّي به دنبال مدل سازي اثر تغييرات توزيع با تركيبي از يادگيري مبتني بر داده و مفروضاتي است كه قبلاً در توصيف آماري يك سيستم گنجانده نشده اند.
براي مشكل ناشي از تغيير توزيع، يعني جايي كه توزيع داده هاي آزمون متفاوت از داده هاي آموزش است، مسئله ي تعميم خارج از توزيع مطرح مي شود كه در آن الگوريتم بتواند به خوبي عمل كند و تعميم خوبي روي داده هاي ديده نشده يعني داده هاي آزمون داشته باشد. در اين سمينار ما به بررسي روش هاي مسئله ي تعميم خارج از توزيع مي پردازيم و همينطور يكي از روش هاي آن به نام علّيت كه اخيرا به صورت گستره مورد توجه قرار گرفته است را با جزئيات دقيق تر بررسي مي كنيم.
نام دانشجو
حسين رضائي
تاريخ ارائه
11/23/2022 12:00:00 AM
متن كامل
77039
پديد آورنده
حسين رضائي
تاريخ ورود اطلاعات
1401/09/17
عنوان به انگليسي
Causal Representation Learning for Out-Of-Distribution Generalization
كليدواژه هاي فارسي
تعميم خارج از توزيع , استنتاج علّي , يادگيري ثابت , يادگيري بازنمايي , تعميم دامنه
كليدواژه هاي لاتين
Representation Learning , Domain Generalization , Causal Inference , Out-Of-Distribution Generalization , Invariant Learning