-
شماره ركورد
7688
-
پديد آورنده
صدرا حيدري مقدم
-
عنوان
پيادهسازي يك سامانه تبديل تصوير به متن براي متون توأم عربي و فارسي
-
مقطع تحصيلي
كارشناسي
-
رشته تحصيلي
مهندسي كامپيوتر
-
سال فارغ التحصيلي
1400
-
استاد راهنما
دكتر بهروز مينائي بيدگلي
-
استاد مشاور
دكتر بهروز مينائي بيدگلي
-
دانشجوي وارد كننده اطلاعات
صدرا حيدري مقدم
-
تاريخ ورود اطلاعات
1400/12/03
-
دانشكده
مهندسي كامپيوتر
-
عنوان به انگليسي
Implementing an image-to-text conversion system for both Arabic and Persian texts
-
چكيده
سيستم نويسهخوان نوري يا OCR يك سيستم تشخيص متن نوري است، كه به دليل توسعه تكنولوژي، به طور گسترده مورد استفاده قرار گرفتهاست. تمركز اصلي سيستمهاي OCR موجود بر زبانهاي لاتين بوده است. در مطالعات اخير، اين سيستمها، براي زبانهايي با رسمالخط شكسته استفاده شدهاند كه با چالشهايي روبرو هستند. در اين پاياننامه، يك سيستم OCR مبتني بر يادگيري عميق با ساختارBi-LSTM و CNN براي متون توأم عربي و فارسي ارائه شدهاست و برخي از پارامترهاي مهم سيستم پيشنهادي مورد بررسي قرار گرفتهاست. سيستم OCR پيشنهادي چالشهاي عدم تشخيص برخي كلمات و نيمفاصله در رسمالخط فارسي و عربي را حل ميكند. علاوه بر اين، در اين پايان نامه، دو مجموعه داده جديد ارائه شده است كه يكي حاوي هشت ميليون تصوير با هشت فونت رايج در زبان فارسي، نويزهاي مختلف و كجي كلمات و ديگري حاوي 3.8 ميليون تصوير با چهار فونت و پنج پيشپردازش مختلف است. در نهايت دقت قسمت بازشناسي سيستم پيشنهادي در مقايسه با همان قسمت سيستم OCR موجود در تزركت، روي دادههاي توليد شده بيشتر بود. نتايج آزمايشات نشان ميدهد كه سيستم پيشنهادي داراي دقت 84 درصد در سطح كلمه و دقت 95 درصد در سطح حروف است.
-
كليدواژه ها
نويسهخوان نوري , بازشناسي , شبكه عصبي , پردازش زبان طبيعي , يادگيري عميق , يادگيري ماشين , بينايي ماشين
-
لينک به اين مدرک :