شماره ركورد
10214
عنوان
بررسي پايداري الگوريتمهاي متنكاوي با تاكيد بر الگوريتمهاي طبقهبندي متن
سال تحصيل
1400
استاد راهنما
دكتر محمدرضا كنگاوري
چکيده
از گذشته تا امروز زبان نقش اساسي در ارتباطات بين انسان ها داشته است. وقايع، اطلاعات، داستان ها و موارد ديگري از طريق زبان به اطلاع ساير افراد مي رسد و مكتوب كردن آن تاثير بسزايي در ماندگار كردن آن ها دارد. در هر دوره روش هاي مختلفي براي ثبت زبان وجود داشته است.
امروزه با گسترش استفاده از ابزارهاي ديجيتال، انبوه اطلاعات متني به وجود آمده است، كه سازماندهي و طبقه بندي اين اسناد براي كشف دانش از آن ها بسيار حائز اهميت است. مهم ترين قدمي كه براي سازماندهي اين اطلاعات مي توان برداشت، طبقه بندي آن ها است. هدف طبقه بندي مي تواند متفاوت باشد اما مي توان از روش هاي يكساني براي انواع طبقه بندي ها استفاده كرد.
طيف وسيعي از روش ها براي طبقه بندي اتوماتيك متن وجود دارد، از روش هاي مبتني بر قاعده گرفته تا روش هايي كه مبتني بر يادگيري ماشين هستند. مي دانيم كه زبان دارايي پيچيدگي و ابهام است، به همين دليل طبقه بندي متن هم چالش هايي دارد و نمي توان با روش هاي مبتني بر قاعده به دقت مناسبي در طبقه بندي تمام اسناد رسيد. به همين دليل امروزه تمركز عمده بر روي روش هاي طبقه بندي مبتني بر يادگيري ماشين است.
در سال هاي اخير، شبكه هاي عصبي عميق كه جزء روش هاي مبتني بر يادگيري ماشين هستند، به عنوان يك ابزار قدرتمند در انواع وظايف پردازش زبان طبيعي، از جمله طبقه بندي متن مورد استفاده گرفته اند. اما مشاهده شده است كه به ازاي برخي از ورودي ها، شبكه عصبي آموزش داده شده، به اشتباه افتاده و نتايج نادرستي را پيش بيني مي كند. با توجه به استفاده گسترده از اين روش ها در موقعيت هاي حساس، شناخت اين نوع از ورودي ها و روش هايي كه باعث جلوگيري از فريب مدل شوند، بسيار مهم است.
نام دانشجو
زهرا دهقاني محمدابادي
تاريخ ارائه
12/1/2021 12:00:00 AM
متن كامل
73352
پديد آورنده
زهرا دهقاني محمدآبادي
تاريخ ورود اطلاعات
1400/09/23
عنوان به انگليسي
Investigating the robustness of text mining algorithms with emphasis on text classification algorithms
كليدواژه هاي فارسي
پايداري , حملات خصمانه , شبكه هاي عصبي عميق , طبقه بندي متن , نمونه هاي خصمانه
كليدواژه هاي لاتين
Robustness , Adversarial attacks , Deep neural networks , Text classification , Adversarial examples