-
شماره ركورد
7635
-
پديد آورنده
عليرضا حسيني
-
عنوان
استخراج عبارات كليدي متن فارسي با روشهاي مبتني بر گراف
-
مقطع تحصيلي
كارشناسي
-
رشته تحصيلي
مهندسي كامپيوتر - سخت افزار (تمركز هوش مصنوعي)
-
سال فارغ التحصيلي
1400
-
استاد راهنما
دكتر بهروز مينايي
-
استاد مشاور
دكتر بهروز مينايي
-
دانشجوي وارد كننده اطلاعات
عليرضا حسيني
-
تاريخ ورود اطلاعات
1400/10/05
-
دانشكده
مهندسي كامپيوتر
-
عنوان به انگليسي
Graph-based Keyphrase Extraction for Persian Text
-
چكيده
تـمامي مـتون و اسـناد بـراي ارائـهي يك نـظريه، نـوآوري و يا اطـلاع عـمومي نـوشـته ميشـونـد و هـريك ايدهي مـنحصربـهفـرد خـود را دارا ميبـاشـند. اين گـونـه اسـناد را ميتـوان در مجـموعـهاي از عـبارات خـلاصـه نـمود؛ كه اين عـبارات، عـبارات كليدي نـام دارنـد. بـا مـطالـعهي اين مجـموعـه از عـبارات، در طي فـرايند جسـتوجـو، ميتـوان بـه هـدف اصلي سـند پي بـرد و اگـر مـتناسـب بـا مـوضـوع مـورد جسـتوجـو بـودنـد، بـه مـطالـعهي كل سـند پـرداخـت. عـبارات كليدي مـهمتـرين عـبارات يك مـتن در نـظر گـرفـته ميشـونـد؛ زيرا ايدهي اصلي و بنيادي يك مـتن را در قـالـب عـباراتي كوتـاه، خـلاصـه و مفيد بيان مينـمايند. اسـتخراج عـبارات كليدي بـهعـنوان هسـتهي پـردازشهـاي خـودكاري اسـت كه روي دادههـاي متني انـجام مي شـود. بـنابـراين در الـگوريتمهـاي مـتنكاوي اسـتخراج عـبارات كليدي از اهميت ويژهاي بـرخـوردار اسـت. در واقـع اسـتخراج عـبارات كليدي يك مـرحـلهي بنيادي از بيشتر پـروژههـاي مـتنكاوي اسـت، كه تحقيق بـر روي آن و پيداكردن بهـترين روش اسـتخراج عـبارات كليدي كه دقـت
و سرعت مناسبي داشته باشد، اهميت ويژهاي دارد. در زبـان فـارسي واژههـا داراي صـورتهـاي نـگارشي مـتنوعي هسـتند و پـوشـش كليهي حـالات دسـتوري واژههـا
بـا بـهكارگيري يك سـري قـواعـد معين نـاممكن اسـت؛ بـه همين دليل اسـتخراج عـبارات كليدي بـهطـور خـودكار از متون فارسي دشوار و پيچيده است.
در اين پـژوهـش چـندين روش بـدون نـاظـر مبتني بـر گـراف بـراي اسـتخراج عـبارات كليدي از مـتون فـارسي ارائـه ميشـود. در هـمهي اين روشهـا ابـتدا مـتن يكسانسـازي شـده و ايستواژههـا از آن حـذف ميشـود. سـپس نـامـزدهـاي مـناسـب عـبارات كليدي انـتخاب شـده و اين نـامـزدهـا بـا قـرارگـرفـتن در گـراف، بـا روشهـاي وزندهي مـناسـب، وزندهي ميشـونـد و در نـهايت بهـترين عـبارات بـهعـنوان عـبارات كليدي انـتخاب ميگـردنـد. نـتايج
نشاندهندي دقت قابلقبول روشهاي ارائهشده است.
-
كليدواژه ها
اسـتخراج عـبارات كليدي , روشهـاي مبتني بـر گـراف , بـازيابي اطـلاعـات , زبـانشـناسي مـحاسـباتي , پردازش زبان طبيعي
-
لينک به اين مدرک :