-
شماره ركورد
6793
-
پديد آورنده
اميرحسين كاظم نژاد
-
عنوان
بررسي آثار ناهنجاري هاي معنايي بر روي مدل هاي محاسباتي زبان
-
مقطع تحصيلي
كارشناسي
-
رشته تحصيلي
كامپيوتر
-
سال فارغ التحصيلي
1399
-
استاد راهنما
دكتر محمدطاهر پيله ور
-
دانشجوي وارد كننده اطلاعات
اميرحسين كاظم نژاد
-
تاريخ ورود اطلاعات
1399/05/01
-
دانشكده
كامپيوتر
-
عنوان به انگليسي
Analysing The Effects of Semantic Violations on Computational Language Models
-
چكيده
در روانشناسي زبان ، با پديدهاي به نام «نقص معنايي» مواجه هستيم؛ اين پديده به هنگام خواندن يا شنيدن جمله اي كه يك جز يا يك كلمه ي آن داراي ناهنجاري معنايي باشد، اتقاق ميافتد كه سبب انحراف در الگوي امواج مغزي انسان مي شود. عموما چنين اتفاقي باعث به وجود آمدن بار ادراكي بيشتر براي فهم آن جمله روي مغز مي شود و زمان بيشتري براي به اتمام رساندن جمله طلب مي كند. به عنوان مثال جمله ي «در مهماني بوديم، علي به ما يك آسمانخراش تعارف كرد.» داراي ناهنجاري معناييست. دليل وجود بار ادراكي بيشتر در اين نقصان ها، تناقض اطلاعات جمله با درك عمومي ما نسبت به جهان و دانش قبلي ماست. كه باعث مي شود ذهن براي
تطبيق با جمله ي جديد پردازش بيشتري نياز داشته باشد. در سال هاي اخير و با ظهور مدل هاي از پيش آموزش ديده در ادبيات يادگيري ماشيني، شاهد پيشرفت هاي زيادي در دقت مدل هاي محاسبتي در مسائل پردازش زبان هاي طبيعي بوديم. اين نوع از مدل ها با بهره گيري از داده هاي بدون برچسب در تعداد بالا دانش اوليه اي از زبان ياد ميگيرند كه مي توان از اين دانش براي حل ساير مسائل پردازش زبان طبيعي استفاده كرد. بيشتر اين مدل ها از تابع هاي هزينه اي بهره مي برند كه عملكرد مدل را در مدل كردن زبان مي سنجند. با وجود اينكه اخيرا ً نسخه هاي متفاوتي از اين نوع تابع هزينه معرفي شده است، همچنان تاثير آن و ميزان دانش آموخته شده دربارهي جهان و درك عمومي آن نا معلوم است. ما در اين پرژه معياري معرفي ميكنيم كه ميتواند ميزان اين نوع اطلاعات ذخيره را در مدلها اندازه بگيرد. در نهايت نتيجه ي اين معيار را براي مدل هاي معرفي شده ي اخير بررسي ميكنيم.
-
لينک به اين مدرک :