شماره ركورد

10214

عنوان

بررسي پايداري الگوريتم‌هاي متن‌كاوي با تاكيد بر الگوريتم‌هاي طبقه‌بندي متن

سال تحصيل

1400

استاد راهنما

دكتر محمدرضا كنگاوري

چکيده

از گذشته تا امروز زبان نقش اساسي در ارتباطات بين انسان ها داشته است. وقايع، اطلاعات، داستان ها و موارد ديگري از طريق زبان به اطلاع ساير افراد مي رسد و مكتوب كردن آن تاثير بسزايي در ماندگار كردن آن ها دارد. در هر دوره روش هاي مختلفي براي ثبت زبان وجود داشته است. امروزه با گسترش استفاده از ابزارهاي ديجيتال، انبوه اطلاعات متني به وجود آمده است، كه سازماندهي و طبقه بندي اين اسناد براي كشف دانش از آن ها بسيار حائز اهميت است. مهم ترين قدمي كه براي سازماندهي اين اطلاعات مي توان برداشت، طبقه بندي آن ها است. هدف طبقه بندي مي تواند متفاوت باشد اما مي توان از روش هاي يكساني براي انواع طبقه بندي ها استفاده كرد. طيف وسيعي از روش ها براي طبقه بندي اتوماتيك متن وجود دارد، از روش هاي مبتني بر قاعده گرفته تا روش هايي كه مبتني بر يادگيري ماشين هستند. مي دانيم كه زبان دارايي پيچيدگي و ابهام است، به همين دليل طبقه بندي متن هم چالش هايي دارد و نمي توان با روش هاي مبتني بر قاعده به دقت مناسبي در طبقه بندي تمام اسناد رسيد. به همين دليل امروزه تمركز عمده بر روي روش هاي طبقه بندي مبتني بر يادگيري ماشين است. در سال هاي اخير، شبكه هاي عصبي عميق كه جزء روش هاي مبتني بر يادگيري ماشين هستند، به عنوان يك ابزار قدرتمند در انواع وظايف پردازش زبان طبيعي، از جمله طبقه بندي متن مورد استفاده گرفته اند. اما مشاهده شده است كه به ازاي برخي از ورودي ها، شبكه عصبي آموزش داده شده، به اشتباه افتاده و نتايج نادرستي را پيش بيني مي كند. با توجه به استفاده گسترده از اين روش ها در موقعيت هاي حساس، شناخت اين نوع از ورودي ها و روش هايي كه باعث جلوگيري از فريب مدل شوند، بسيار مهم است.

نام دانشجو

زهرا دهقاني محمدابادي

Name: زهرا دهقاني محمدابادي
Author: زهرا دهقاني محمدآبادي

تاريخ ارائه

12/1/2021 12:00:00 AM

متن كامل

73352

پديد آورنده

زهرا دهقاني محمدآبادي

تاريخ ورود اطلاعات

1400/09/23

عنوان به انگليسي

Investigating the robustness of text mining algorithms with emphasis on text classification algorithms

كليدواژه هاي فارسي

پايداري , حملات خصمانه , شبكه هاي عصبي عميق , طبقه بندي متن , نمونه هاي خصمانه

كليدواژه هاي لاتين

Robustness , Adversarial attacks , Deep neural networks , Text classification , Adversarial examples

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=10214&Field=0&DTC=14