-
شماره ركورد
5515
-
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
5515
-
پديد آورنده
نجمه رافت
-
عنوان
بهينه سازي OCR فارسي با استفاده از الگوريتم هاي ژنتيكي
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
كامپيوتر - هوش مصنوعي
-
سال تحصيل
آبان 1385
-
تاريخ دفاع
آبان 1385
-
استاد راهنما
سرياني
-
چكيده
چكيده:
تاكنون تحقيقات گسترده و مفيدي در زمينه سيستم هاي تشخيص حروف فارسي انجام گرفته
اند، اما اين سيستم ها تا رسيدن به نتايج ايده آل راه زيادي در پيش رو دارند. به ويژه در بخشهاي
قطعه بندي، استخراج ويژگيها و طبقه بندي مطالعات وتحقيقات بيشتري موردنياز است. درهمين
راستا در اين پروژه از الگوريتم هاي ژنتيكي كه در مسايل مختلف بهينه سازي كاربردهاي زيادي
فارسي استفاده شده است. OCR دارند، در بهينه سازي وبهبود نتايج يك
اين هدف با دو رويكرد كلي مورد بررسي قرار گرفته است. در رويكرد اول، با توجه به اينكه
با حجم وسيعي از ويژگيها روبرو هستيم كه منجر به افزايش OCR معمولا در سيستم هاي
محاسبات وكند شدن عملكرد سيستم مي شوند، روشهايي براي كاهش طول بردار ويژگيها ارائه
است كه نشان GA شده اند. ايده اصلي در اين روشها استفاده از يك ماسك توليد شده توسط
دهنده ويژگيهايي است كه بايد حفظ يا حذف گردند. نتايج آزمايشهاي انجام شده حاكي از كارايي
اين روش در كاهش طول بردار ويژگيها و افزايش دقت سيستم بوده است.
در رويكرد دوم، به منظور برجسته كردن نقش ويژگيهاي مهمتر در تابع طبقه بندي در جهت
كمك به افزايش قدرت جداسازي اين تابع، از روش وزندهي استفاده شده است. در اين روش به
ويژگيهاي مهمتر وزن بيشتر و به ويژگيهاي كم اهميت تر، وزن كمتري داده مي شود تا نقش كم
رنگ تري در تابع ايفا كنند. در اين رويكرد نيز آزمايشهاي مختلفي انجام گرفتند كه نتايج حاصل
از آنها بيانگر كاهش قابل توجهي در ميزان خطاي سيستم و د رنتيجه افزايش دقت طبقه بندي
است.
پايه طراحي گرديده و يك بانك از حروف OCR در اين پروژه براي پياده سازي آزمايشها، يك
تايپي گسسته فارسي در فونتها و اندازه هاي مختلف گردآوري شده اند.
الگوريتمهاي ژنتيكي، انتخاب زير مجموعه اي از ويژگيها، فاصله ، OCR كلمات كليدي: سيستم
وزندار، بهينه سازي
-
لينک به اين مدرک :