• شماره ركورد
    7869
  • پديد آورنده

    توحيد عابديني

  • عنوان
    ارائه و پياده‌سازي الگوريتمي براي تجزيه كم‌عمق جملات در زبان فارسي
  • مقطع تحصيلي
    كارشناسي
  • رشته تحصيلي
    مهندسي كامپيوتر
  • سال فارغ التحصيلي
    1399
  • استاد راهنما
    دكتر بهروز مينايي بيدگلي - دكتر عادل تركمان رحماني
  • دانشجوي وارد كننده اطلاعات

    توحيد عابديني

  • تاريخ ورود اطلاعات
    1401/06/01
  • دانشكده
    مهندسي كامپيوتر
  • عنوان به انگليسي
    Presentation and implementation of an algorithm for Shallow parsing of sentences in Persian
  • چكيده
    تجزيه كم‌عمق (تجزيه سبك) يك روش تحليل جمله است كه در ابتدا قسمت‌هاي تشكيل‌دهنده جمله (اسم، فعل، صفت و غيره) را مشخص مي‌كند و سپس آن‌ها را به واحدهاي مرتبه بالاتر كه معاني دستوري گسسته دارند (گروه‌هاي اسامي يا عبارات، گروه‌هاي فعل، و غيره) پيوند مي‌دهد. درحالي‌كه در ابتدايي‌ترين الگوريتم‌هاي تجزيه كم‌عمق به‌سادگي قسمت‌هاي تشكيل‌دهنده بر اساس الگوهاي جستجوي ابتدايي (به‌عنوان‌مثال عبارات منظم) پيوند داده مي‌شوند، رويكردهايي كه در آنها از تكنيك‌هاي يادگيري ماشين استفاده مي‌شود (طبقه‌بندي‌كننده‌ها، مدل‌سازي موضوع و غيره) مي‌توانند اطلاعات متني را در نظر بگيرند و در نتيجه تكه‌ها را به‌طوري توليد كنند كه رابطه معنايي بهتري بين مؤلفه‌هاي اصلي منعكس شود. بدين ترتيب روش‌هاي پيشرفته‌تر اين مسئله را به وجود مي‌آورند كه تركيبي از اجزا تشكيل‌دهنده ابتدايي بسته به متن جمله مي‌تواند داراي معاني سطح بالاتر و متفاوت باشد. در اين پروژه الگوريتمي ارائه مي‌شود كه با استفاده از الگوريتم‌هاي يادگيري عميق به استخراج تجزيه كم‌عمق از جمله مي‌پردازد و سعي در بهبود دقت نسبت به الگوريتم‌هاي فعلي دارد. شايان‌ذكر است كه براي آموزش يك مدل تجزيه‌گر كم‌عمق نيازمند يك مجموعه دادگان داريم كه به دليل هزينه بر بودن ايجاد اين مجموعه دادگان، از طريق تبديل مجموعه دادگان تجزيه وابستگي به تجزيه كم‌عمق، به تهيه يك مجموعه دادگان مناسب پرداخته مي‌شود.
  • كليدواژه ها
    تجزيه كم عمق , الگوريتم هاي تجزيه , يادگيري ماشين , تجزيه وابستگي