• شماره ركورد
    7356
  • پديد آورنده

    سيده مينا طاهايي

  • عنوان
    طراحي سامانه استخراج خودكار اطلاعات از رزومه‌هاي فارسي
  • مقطع تحصيلي
    كارشناسي
  • رشته تحصيلي
    مهندسي كامپيوتر
  • سال فارغ التحصيلي
    1400
  • استاد راهنما
    دكتر بهروز مينايي بيدگلي
  • دانشجوي وارد كننده اطلاعات

    سيده مينا طاهايي

  • تاريخ ورود اطلاعات
    1400/07/06
  • دانشكده
    مهندسي كامپيوتر
  • عنوان به انگليسي
    Data Extraction System Design for Persian Resumes (Persian Resume Parser)
  • چكيده
    امروزه باتوجه‌به تعداد روزافزون درخواست‌هاي مختلف براي موقعيت‌هاي شغلي، شرايط به‌گونه‌اي است كه مي‌بايست براي صرفه‌جويي در وقت و انرژي نيروي انساني و كاهش ميزان خطاي دستي از سرويس‌هاي خودكار و ماشيني براي مديريت اطلاعات استفاده كرد، چرا كه حجم اطلاعات دريافتي به‌اندازه‌اي زياد است كه پردازش، طبقه‌بندي و استخراج اطلاعات موردنياز از آن‌ها از عهده نيروي انساني خارج است. در اين پژوهش به طراحي يك سامانه استخراج خودكار اطلاعات از رزومه‌هاي فارسي مي‌پردازيم. سامانه‌هاي استخراج به‌صورت خودكار اطلاعات رزومه‌هاي ارسالي كاربران مختلف را استخراج مي‌كنند و آن‌ها را به فرمت مناسب براي كارفرما طبقه‌بندي مي‌كنند و مي‌توان از اين اطلاعات طبقه‌بندي شده براي رتبه‌بندي و مرتب ساختن رزومه‌ها استفاده كرد. از چالش‌هاي مهم طراحي اين سامانه، وجود قالب، فرمت‌هاي مختلف رزومه‌هاي كارجويان و اطلاعات غير ساخت‌يافته موجود در آن‌ها است: سامانه مي‌بايست بتواند انواع شكل‌هاي به‌كاررفته در رزومه‌هاي مختلف را تشخيص دهد و اطلاعات ذكر شده در هركدام از اين بخش‌ها (مانند ستون‌هاي مختلف، جدول‌ها…) را به موضوع مربوط به آن ربط دهد. در سرويس‌هاي مشابه بر روي زبان انگليسي، براي حل اين مسئله از روش‌هاي مختلفي همچون روش‌هاي مبتني بر الگو و روش‌هاي يادگيري باراهنما (همچون استفاده از شبكه‌هاي عصبي ….) استفاده شده است. اين سرويس بر روي دادگاني متشكل از رزومه‌هاي مختلف آزموده شده است و معيار موفقيت آن، درصد بخش¬ هايي است كه به‌صورت موفقيت‌آميز از هر رزومه استخراج شده‌اند.
  • كليدواژه ها
    سيستم‌هاي استخراج دانش , استخراج خودكار از رزومه , طبقه‌بندي اطلاعات