-
شماره ركورد
7356
-
پديد آورنده
سيده مينا طاهايي
-
عنوان
طراحي سامانه استخراج خودكار اطلاعات از رزومههاي فارسي
-
مقطع تحصيلي
كارشناسي
-
رشته تحصيلي
مهندسي كامپيوتر
-
سال فارغ التحصيلي
1400
-
استاد راهنما
دكتر بهروز مينايي بيدگلي
-
دانشجوي وارد كننده اطلاعات
سيده مينا طاهايي
-
تاريخ ورود اطلاعات
1400/07/06
-
دانشكده
مهندسي كامپيوتر
-
عنوان به انگليسي
Data Extraction System Design for Persian Resumes (Persian Resume Parser)
-
چكيده
امروزه باتوجهبه تعداد روزافزون درخواستهاي مختلف براي موقعيتهاي شغلي، شرايط بهگونهاي است كه ميبايست براي صرفهجويي در وقت و انرژي نيروي انساني و كاهش ميزان خطاي دستي از سرويسهاي خودكار و ماشيني براي مديريت اطلاعات استفاده كرد، چرا كه حجم اطلاعات دريافتي بهاندازهاي زياد است كه پردازش، طبقهبندي و استخراج اطلاعات موردنياز از آنها از عهده نيروي انساني خارج است. در اين پژوهش به طراحي يك سامانه استخراج خودكار اطلاعات از رزومههاي فارسي ميپردازيم. سامانههاي استخراج بهصورت خودكار اطلاعات رزومههاي ارسالي كاربران مختلف را استخراج ميكنند و آنها را به فرمت مناسب براي كارفرما طبقهبندي ميكنند و ميتوان از اين اطلاعات طبقهبندي شده براي رتبهبندي و مرتب ساختن رزومهها استفاده كرد. از چالشهاي مهم طراحي اين سامانه، وجود قالب، فرمتهاي مختلف رزومههاي كارجويان و اطلاعات غير ساختيافته موجود در آنها است: سامانه ميبايست بتواند انواع شكلهاي بهكاررفته در رزومههاي مختلف را تشخيص دهد و اطلاعات ذكر شده در هركدام از اين بخشها (مانند ستونهاي مختلف، جدولها…) را به موضوع مربوط به آن ربط دهد. در سرويسهاي مشابه بر روي زبان انگليسي، براي حل اين مسئله از روشهاي مختلفي همچون روشهاي مبتني بر الگو و روشهاي يادگيري باراهنما (همچون استفاده از شبكههاي عصبي ….) استفاده شده است. اين سرويس بر روي دادگاني متشكل از رزومههاي مختلف آزموده شده است و معيار موفقيت آن، درصد بخش¬ هايي است كه بهصورت موفقيتآميز از هر رزومه استخراج شدهاند.
-
كليدواژه ها
سيستمهاي استخراج دانش , استخراج خودكار از رزومه , طبقهبندي اطلاعات
-
لينک به اين مدرک :