شماره ركورد
16733
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
16733
پديد آورنده
عباس نيك نفس
عنوان
راه كاري جهت جستجوي كلمه كليدي در داده هاي گرافي با استفاده از زيرگراف هاي با قطر r
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
نرم افزار
تاريخ دفاع
بهمن 1395
استاد راهنما
آقاي دكتر حسن نادري
دانشكده
كامپيوتر
چكيده
امروزه علاقه به جستجوي كلمات كليدي براي پاسخگويي به نيازهاي اطلاعاتي كاربران در حجم انبوهي از منـابع دادهاي به شدت در حال رشد ميباشد. بنابرايـن ارائـه روشهـا و الگوريتم هاي كـه كاربـران را به سادگي قادر سازد كلمات كليدي مورد نظرشان را فارغ از قواعد نحوي پيچيده در دادههاي گرافي بصورت كارا مورد جستجو قرار دهند ضروري مي نمايد. در اين حالت تمركز جستجوي كلمه كليدي بر پيدا كردن زير ساخت هاي گـرافي شامل كلمات كليدي ورودي است. اكثر روش هاي موجود در اين زمينه درخت هاي كمينه ي متصل را كه تمام كلمات كليدي را پوشش دهند پيـدا مي كنند. بعضي از مطالعات و تحقيقات اخير يافتن زيـرگراف ها را به جاي درخت هاي كمينه به دليـل اينكه اطلاعـات بيشتري در اختيار كاربران قـرار مي دهند پيشنهاد مي نمايند. يكي از آخرين تحقيقات در اين زمينه با يافتن كليك هاي با حداكثر فاصله بين رئوس r كارايي و كيفيت روش هاي قبلي مبتني بر زيرگراف را بهبود بخشيده است. در اينجا ما با ارائـه روش ها و الگوريتم هاي جديدي بر اساس ايده ي يافتن ماكسيمال كليك هاي حـاوي كلمات كليدي بـر اساس الگوريتم هاي مطرح، سريع و شناخته شده ي مبتني بر الگوريتم بران كـرباش به افزايش كارايي در حالت پردازش متوالي و همچنين ايجاد قابليت پردازش موازي و مقياس پذيري نسبت به روش قبلي پرداخته ايم. روش قبلي جهت يافتن k جواب برتر تقريبي سعي در حداقل كردن وزن بين رأس كانديد مركزي با ساير رئوس مي نمايد و بدين ترتيب ممكن است كه كليك-هاي به دست آمده به فاصله ي r نبوده و حداكثر 2r باشند كه در اين صورت وزن كلي كليك به دست آمده افزايش مي يابد. ما در اينجا با ارائه رويكردي جديد جهت به دست آوردن k جواب برتر تقريبي با حداقل كردن وزن رئوس متوالي علاوه بر حداكثر نمودن ارتباط معنايي بين كلمات كليدي متوالي كيفيت پاسخ هاي تقريبي توليدي را نيـز افـزايش مي دهيم چـرا كه پاسخ هاي توليـدي توسط روش پيشنهادي ما داراي حداكثـر فاصله ي بيـن رئـوس r مي باشند. بنابراين از جمله مزاياي روش هاي پيشنهادي مي توان به افزايش كارايـي و كيفيت خصوصاً در گراف هاي خلوت و نيز قابليت امكان پردازش موازي و توزيع شده اشاره نمود.
واژههاي كليدي: جستجوي كلمه كليدي ، داد ه هاي گرافي ، ماكسيمال كليك ، پردازش موازي
تاريخ ورود اطلاعات
1395/12/03
تاريخ بهره برداري
1/1/1900 12:00:00 AM
دانشجوي وارد كننده اطلاعات
عباس نيك نفس
چكيده به لاتين
Nowadays, interest in searching for keywords to meet the needs of users in the massive amounts of data sources is growing strongly. Thus providing methods and algorithms that enable users to easily search efficiently their keywords regardless of complex syntax rules in data graphs is essential. In this case the focus keyword search is on to find subgraph structures including input keywords. Most of the works in keyword search over graphs find minimal connected trees contain all or part of the input keywords. Some recent research recommend finding subgraph instead of minimum trees which provide more informative answers. One of the latest researchs with finding r-cliques has improved efficiency and quality of previous methods based on subgraph. An r-clique is a set of content nodes that cover all the input keywords and the distance between each pair of nodes is less than or equal to r. Here we provide methods and algorithms by the idea of finding maximal cliques containing keywords based on Bron Kerbosch algorithm to increase performance in sequential and parallel processing modes rather than r-clique method. The r-clique method for finding approximate top-k answers tries to minimize the weight of edges between central candidate nodes to the other nodes. Thus, it is possible that the maximum distance between the nodes in obtained cliques are not less than or equal to r and they at most are 2r and in this case cliques on the overall weight increase. We provide a novel and efficient approach to achieve top-k approximate answers with a minimum weight of nodes in a row. In addition to maximizing the semantic relationship between keywords successive, approximation quality of the answers will enhance productivity as well because in the answers generated by our proposed method, r is the maximum distance between their nodes. So one of the advantages of the proposed methods is to increase the efficiency and quality of especially in sparse graphs and also mentioned the possibility of parallel processing.
Keywords: Keyword search, Graph data, Maximal clique, Bron Kerbosch, Parallel