مهدي دادبخش

عنوان

خوشه‌بندي پرس‌وجوها براي بهينه‌سازي طراحي پايگاه‌هاي داده‌ي مبتني بر پرس‌وجو

مقطع تحصيلي

كارشناسي ارشد

رشته تحصيلي

نرم افزار

تاريخ دفاع

1398/11/16

استاد راهنما

دكتر عين اله خنجري ميانه

دانشكده

كامپيوتر

چكيده

امروزه با توجه به افزايش روزافزون حجم داده‌ها و پيچيدگي پردازش‌ها، نياز به بسترهاي ذخيره‌سازي و پردازشي جديدتر احساس مي‌شود. ازاين‌رو، پايگاه‌هاي داده‌ي رابطه‌اي ديگر جوابگو نيستند و بايد از پايگاه‌هاي داده‌ي غير رابطه‌اي نيز استفاده شود. از سوي ديگر حجم زياد داده‌ها و پردازش‌ها، موجب بروز مفهوم كلان‌داده شده است. ماهيت داده‌هاي موردبررسي به‌گونه‌اي است كه حجم داده‌ها بسيار زياد است و همچنين به‌صورت توزيع‌شده بر روي چندين سرور قرار دارند. دليل انتخاب پايگاه داده‌ي غير رابطه‌اي مبتني بر پرس‌وجو نيز همين امر مي‌باشد‌. در اين نوع پايگاه‌هاي داده، طراحي شِما بر اساس نيازها و پرس‌وجوها انجام مي‌شود، به‌طوري‌كه هر پرس‌وجو در غالب يك ماهيت جديد ذخيره مي‌شود و هيچ پيوندي بين آن‌ها وجود ندارد. كاري كه درزمينه‌ي پايگاه‌هاي داده‌ي مبتني بر پرس‌وجو صورت گرفته است، اين است كه پس از تعريف پرس‌وجوها و طراحي نمودار جريان كاري (ارتباط و وابستگي بين پرس‌وجوها) به‌صورت دستي، ساير مراحل طراحي پايگاه داده و نگاشت مدل داده‌ي مفهومي به مدل داده‌ي منطقي و درنهايت فيزيكي، مكانيزه شده است. براي سرعت بخشيدن به پرس‌وجوها مي‌توان با استفاده از الگوريتم خوشه‌بندي مناسب، پرس‌وجوهايي را كه مرتبط و وابسته به هم هستند، در يك خوشه قرار داد. درواقع، پرس‌وجوها را با روش پيشنهادي و بر اساس معيارهاي شباهتي نظير موجوديت‌هاي مورد پرس‌وجو، تعداد فيلدهاي مشابه و غيره، خوشه‌بندي مي‌كنيم. هدف از اين پايان‌نامه، ارائه‌ي روشي براي خوشه‌بندي پرس‌وجوها است به‌گونه‌اي كه منجر به طراحي بهينه‌ي پايگاه داده گردد. با توجه به حجم زياد داده‌ها و توزيع‌شدگي آن‌ها، اين امر مي‌تواند موجب افزايش سرعت دستيابي به داده‌ها خواهد شد.

تاريخ ورود اطلاعات

1399/06/17

عنوان به انگليسي

Query Clustering for Optimization of Query-based Database Design

تاريخ بهره برداري

2/4/2021 12:00:00 AM

دانشجوي وارد كننده اطلاعات

مهدي دادبخش

Name: مهدي دادبخش
Author: مهدي دادبخش

چكيده به لاتين

Nowadays, despite of ever-increasing of the data volume and process complexity, the need of new storage and processing infrastructures, are sensed. Therefore, traditional relational databases are not enough, so using the NoSQL databases are must. In other hand, the massive data volume and processes, has led to the emergence of concept of big data. The nature of the data being investigated is such that the volume of data is very large and also distributed on multiple servers. This is the reason of choosing NoSQL query-based database. In this type of databases, the table designing is based on requirements and queries, such that each query is stored in one table; thus there is no join between tables. Also for increasing the speed of queries, the related queries are gathered in one cluster by using appropriate clustering Algorithm. Indeed, queries are clustered based on similarity metrics like query entities, number of similar fields and etc. The purpose of this thesis is offering a method for clustering the queries in such a way as to optimize the database design.

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=22377&Field=0&DTC=6