شماره ركورد
22377
پديد آورنده
مهدي دادبخش
عنوان
خوشهبندي پرسوجوها براي بهينهسازي طراحي پايگاههاي دادهي مبتني بر پرسوجو
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
نرم افزار
تاريخ دفاع
1398/11/16
استاد راهنما
دكتر عين اله خنجري ميانه
دانشكده
كامپيوتر
چكيده
امروزه با توجه به افزايش روزافزون حجم دادهها و پيچيدگي پردازشها، نياز به بسترهاي ذخيرهسازي و پردازشي جديدتر احساس ميشود. ازاينرو، پايگاههاي دادهي رابطهاي ديگر جوابگو نيستند و بايد از پايگاههاي دادهي غير رابطهاي نيز استفاده شود. از سوي ديگر حجم زياد دادهها و پردازشها، موجب بروز مفهوم كلانداده شده است. ماهيت دادههاي موردبررسي بهگونهاي است كه حجم دادهها بسيار زياد است و همچنين بهصورت توزيعشده بر روي چندين سرور قرار دارند. دليل انتخاب پايگاه دادهي غير رابطهاي مبتني بر پرسوجو نيز همين امر ميباشد. در اين نوع پايگاههاي داده، طراحي شِما بر اساس نيازها و پرسوجوها انجام ميشود، بهطوريكه هر پرسوجو در غالب يك ماهيت جديد ذخيره ميشود و هيچ پيوندي بين آنها وجود ندارد. كاري كه درزمينهي پايگاههاي دادهي مبتني بر پرسوجو صورت گرفته است، اين است كه پس از تعريف پرسوجوها و طراحي نمودار جريان كاري (ارتباط و وابستگي بين پرسوجوها) بهصورت دستي، ساير مراحل طراحي پايگاه داده و نگاشت مدل دادهي مفهومي به مدل دادهي منطقي و درنهايت فيزيكي، مكانيزه شده است. براي سرعت بخشيدن به پرسوجوها ميتوان با استفاده از الگوريتم خوشهبندي مناسب، پرسوجوهايي را كه مرتبط و وابسته به هم هستند، در يك خوشه قرار داد. درواقع، پرسوجوها را با روش پيشنهادي و بر اساس معيارهاي شباهتي نظير موجوديتهاي مورد پرسوجو، تعداد فيلدهاي مشابه و غيره، خوشهبندي ميكنيم. هدف از اين پاياننامه، ارائهي روشي براي خوشهبندي پرسوجوها است بهگونهاي كه منجر به طراحي بهينهي پايگاه داده گردد. با توجه به حجم زياد دادهها و توزيعشدگي آنها، اين امر ميتواند موجب افزايش سرعت دستيابي به دادهها خواهد شد.
تاريخ ورود اطلاعات
1399/06/17
عنوان به انگليسي
Query Clustering for Optimization of Query-based Database Design
تاريخ بهره برداري
2/4/2021 12:00:00 AM
دانشجوي وارد كننده اطلاعات
مهدي دادبخش
چكيده به لاتين
Nowadays, despite of ever-increasing of the data volume and process complexity, the need of new storage and processing infrastructures, are sensed. Therefore, traditional relational databases are not enough, so using the NoSQL databases are must. In other hand, the massive data volume and processes, has led to the emergence of concept of big data. The nature of the data being investigated is such that the volume of data is very large and also distributed on multiple servers. This is the reason of choosing NoSQL query-based database. In this type of databases, the table designing is based on requirements and queries, such that each query is stored in one table; thus there is no join between tables. Also for increasing the speed of queries, the related queries are gathered in one cluster by using appropriate clustering Algorithm. Indeed, queries are clustered based on similarity metrics like query entities, number of similar fields and etc.
The purpose of this thesis is offering a method for clustering the queries in such a way as to optimize the database design.