-
شماره ركورد
10000
-
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
10000
-
پديد آورنده
ارائه دهنده: سيد امين منعميان
-
عنوان
خلاصهسازي متون فارسي با استفاده از تحليل مفهوم نهفته و فاصله نرمالشده گوگلي
-
مقطع تحصيلي
درجهي كارشناسي ارشد
-
رشته تحصيلي
مهندسي كامپيوتر گرايش هوش مصنوعي
-
سال تحصيل
شهريور ماه 1390
-
تاريخ دفاع
شهريور ماه 1390
-
استاد راهنما
دكتر بهروز مينايي
-
چكيده
چكيده
با رشد و گسترش سريع دنياي وب و سرويسهاي اطلاعاتي برخط، دادهها و اطلاعات بسيار زيادي در محدوده دسترسي قرار دارند. اين رشد بسيار زياد، منجر به معضل انباشته شدن حجم عظيم اطلاعات شده است. با توجه به زمان محدود كاربران براي دسترسي به اطلاعات مورد نياز، تسريع در دستيابي به اطلاعات، امر بسيار مهمي به شمار ميرود. در اين پاياننامه سعي داريم با بررسي برخي روشها و راهكارهاي موجود در امر خلاصهسازي، به ارائهي روشي نوين در امر خلاصهسازي خودكار متون فارسي و همچنين طراحي و پيادهسازي آن بپردازيم. بدين منظور، ابتدا با انجام عمليات پيشپردازش متن مانند حذف كلمات بازدارنده و نيز تشخيص جملات، متن ورودي را براي انجام عمليات آماده مينماييم. همچنين با استفاده از يك مجموعه عظيم مستندات براي بهدست آوردن اهميت عبارات، مهمترين عبارتهاي موجود در متن را شناسايي ميكنيم و با تمركز بر روش تحليل مفهوم نهفته به عنوان يكي از متداولترين تكنيكهاي استفاده شده در حوزهي پردازش زبانهاي طبيعي، معيارهاي مختلف براي اندازه گيري ميزان ارتباط كلمات را بررسي خواهيم كرد و نشان خواهيم داد كه معيار فاصله نرمالشده گوگلي به عنوان يك معيار تأثيرگذار در امر خلاصهسازي متون ميتواند كانون توجه ويژه قرار گيرد. با پر كردن ماتريس مربوط به روش تحليل مفهوم نهفته، و اعمال تجزيهي مقادير تكين بر روي آن، مهمترين واحدهاي متني را استخراج ميكنيم. استفاده از روش ارائه شده در خلاصهسازي مستندات زبان فارسي، نتايج بسيار خوبي را به همراه داشته است.
واژههاي كليدي: خلاصهسازي متن، تحليل مفهوم نهفته، روشهاي آماري، كاهش بعد، معيار شباهت، فاصله نرمالشده گوگلي
-
لينک به اين مدرک :