-
شماره ركورد
7869
-
پديد آورنده
توحيد عابديني
-
عنوان
ارائه و پيادهسازي الگوريتمي براي تجزيه كمعمق جملات در زبان فارسي
-
مقطع تحصيلي
كارشناسي
-
رشته تحصيلي
مهندسي كامپيوتر
-
سال فارغ التحصيلي
1399
-
استاد راهنما
دكتر بهروز مينايي بيدگلي - دكتر عادل تركمان رحماني
-
دانشجوي وارد كننده اطلاعات
توحيد عابديني
-
تاريخ ورود اطلاعات
1401/06/01
-
دانشكده
مهندسي كامپيوتر
-
عنوان به انگليسي
Presentation and implementation of an algorithm for Shallow parsing of sentences in Persian
-
چكيده
تجزيه كمعمق (تجزيه سبك) يك روش تحليل جمله است كه در ابتدا قسمتهاي تشكيلدهنده جمله (اسم، فعل، صفت و غيره) را مشخص ميكند و سپس آنها را به واحدهاي مرتبه بالاتر كه معاني دستوري گسسته دارند (گروههاي اسامي يا عبارات، گروههاي فعل، و غيره) پيوند ميدهد.
درحاليكه در ابتداييترين الگوريتمهاي تجزيه كمعمق بهسادگي قسمتهاي تشكيلدهنده بر اساس الگوهاي جستجوي ابتدايي (بهعنوانمثال عبارات منظم) پيوند داده ميشوند، رويكردهايي كه در آنها از تكنيكهاي يادگيري ماشين استفاده ميشود (طبقهبنديكنندهها، مدلسازي موضوع و غيره) ميتوانند اطلاعات متني را در نظر بگيرند و در نتيجه تكهها را بهطوري توليد كنند كه رابطه معنايي بهتري بين مؤلفههاي اصلي منعكس شود.
بدين ترتيب روشهاي پيشرفتهتر اين مسئله را به وجود ميآورند كه تركيبي از اجزا تشكيلدهنده ابتدايي بسته به متن جمله ميتواند داراي معاني سطح بالاتر و متفاوت باشد.
در اين پروژه الگوريتمي ارائه ميشود كه با استفاده از الگوريتمهاي يادگيري عميق به استخراج تجزيه كمعمق از جمله ميپردازد و سعي در بهبود دقت نسبت به الگوريتمهاي فعلي دارد.
شايانذكر است كه براي آموزش يك مدل تجزيهگر كمعمق نيازمند يك مجموعه دادگان داريم كه به دليل هزينه بر بودن ايجاد اين مجموعه دادگان، از طريق تبديل مجموعه دادگان تجزيه وابستگي به تجزيه كمعمق، به تهيه يك مجموعه دادگان مناسب پرداخته ميشود.
-
كليدواژه ها
تجزيه كم عمق , الگوريتم هاي تجزيه , يادگيري ماشين , تجزيه وابستگي
-
لينک به اين مدرک :