شماره ركورد
28020
پديد آورنده
فاطمه حقيقي
عنوان
خلاصهسازي برخط متن چندسندي با محوريت كاربر
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي كامپيوتر - نرم افزار
سال تحصيل
1398
تاريخ دفاع
1401/6/27
استاد راهنما
دكتر محمدرضا كنگاوري
دانشكده
مهندسي كامپيوتر
چكيده
امروزه با افزايش محبوبيت ريزوبنوشتها، همانند توييتر، بستري مناسب جهت به اشتراكگذاري ديدگاهها و انتشار اخبار، ايجاد شده است. محتواي منتشرشده، دربردارنده موضع، احساس و هيجان نويسنده ميباشد و تاثير بهسزايي بر روي افكار عمومي، و جو حاكم بر مردم، دارد. كاربران اين شبكهها براي حفظ مخاطبين خود و تاثيرگذاري بر افكار آنها، نيازمند بررسي و تحليل طيف وسيعي از اطلاعات منتشر شده ميباشند.
دستيابي به اطلاعات موجود در شبكهي اجتماعي، بررسي آنها و ايجاد يك متن، متناسب با خواست كاربر، نيازمند صرف زمان بسياري ميباشد. براي مقابله با اين چالش، ايجاد يك خلاصه از دادههاي موجود در شبكه مبتني بر ريزوبنوشت، به گونهاي كه حاوي احساساتي باشد كه كاربر ميخواهد، سودمند ميباشد. به كمك خلاصه توليد شده، كاربر ميتواند به محتواي مطلوب خود دست يابد؛ و متناسب با اطلاعاتي كه بدست آورده است، ديدگاه خود را مطرح كند. اين امر به مشاركت بالاي كاربر در انتشار محتوا، و حفظ موقعيت او در شبكه، كمك ميكند.
در اين پروژه، به توليد برخط خلاصه چند سندي كه متناسب با خواست كاربر ميباشد، ميپردازيم. خلاصه در يك موضوع مشخص با توجه به نوع هيجان، احساس و موضعي كه كاربر ميخواهد، توليد ميشود. در اين پژوهش، به جهت دستيابي به هيجان مطلوب، «واحد تغيير هيجان متن» تعريف شده است. اين واحد، موجب ايجاد و ارتقاء هيجان مورد نظر در متن خلاصه ميشود. همچنين براي ايجاد يك خلاصهي هدفمند و متناسب با افكار كاربر، از "جملهي هدايتگر" و مجموعهاي از كلمات كليدي، كه كاربر آن را ارائه ميدهد، استفاده شده است. "جملهي هدايتگر" دربردارنده ديدگاه كاربر، به جهت انتخاب مطالب همراستا و هممفهوم با آن، ميباشد. در نتيجه به كمك روشهاي شباهتسنجي، خلاصهاي كه دربردارنده محتواي مطلوب كاربر ميباشد، توليد ميشود.
روش ارائه شده در اين پژوهش بر روي دادههاي توييتر مورد ارزيابي قرار گرفته است. ارزيابي روش پيشنهادي نشان ميدهد كه، 82.7 درصد از خلاصههاي توليد شده تغييرات مطلوب را دارا ميباشند. به احتمال 75.18درصد هيجان هدف در خلاصه، توسط كاربران، قابل تشخيص ميباشد. همچنين، احتمال فهم مفهومي كه كاربر ميخواهد در خلاصه نمايان شود، 61.48درصد ميباشد.
تاريخ ورود اطلاعات
1401/12/16
عنوان به انگليسي
User_centric online summarization of multiple texts
تاريخ بهره برداري
9/18/2023 12:00:00 AM
دانشجوي وارد كننده اطلاعات
فاطمه حقيقي
چكيده به لاتين
Nowadays, with the spread of social networks, people share their brief contents, opinions, and data through such networks. The shared content includes the authors' stance, sentiments, and emotions; and impacts peoples' opinions and thoughts. To publish efficient information, users should investigate and analyze a wide range of published data. This activity helps them to maintain contacts and influence their followers' thoughts.
Accessing the available information in a social network by user, reviewing them, and creating a text according to the user's request, requires plenty of time. It is advantageous to construct a summary of the data on social media. If the summary contains the user's requested emotions, it will be more effective. With the help of the generated summary, the user can discover his desired content; and express his opinion according to the information he has obtained. This process helps users' high participation in publishing content and maintaining their position in the network.
In this work, we will produce online summaries of several documents that conform to the user's needs. The summary generates a specific topic, according to users' requests, in types of emotion, sentiment, and stance. Also, the" text emotion changing unit" is defined to achieve the selected kind of emotion. This unit aims to create and elevate the preferred type of emotion. In produced summary, we also aim to display the user's thoughts. To achieve this goal, we use a 'navigator sentence" and a set of keywords, which the user provides. The "navigator sentence" includes the users' thoughts to obtain information related to it. As a result, with the help of similarity measurement methods, a summary containing the user's desired content is produced.
The method presented in this research is evaluated on the Twitter dataset. The evaluation of the proposed method shows that 82.7% of the generated summaries have the expected changes. Users can recognize 75.18 % of the target emotion in the created summary. Also, the probability of understanding the concept and opinion that the user wants to become manifest is 61.48%.
كليدواژه هاي فارسي
خلاصهسازي متن چندسندي , رسانه اجتماعي , شبكه اجتماعي , خلاصهسازي microblogها
كليدواژه هاي لاتين
Multi-document text summarization , social media , social network , microblog summarization
Author
fatemeh haghighi
SuperVisor
dr. mohammad reza kangavari