-
شماره ركورد
21960
-
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
21960
-
پديد آورنده
شادي بحري
-
عنوان
خوشه بندي سري هاي زماني براساس مدل
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
آمار - آمار رياضي
-
تاريخ دفاع
1398/10/23
-
استاد راهنما
دكتر رحمان فرنوش
-
استاد مشاور
دكتر غلامحسين ياري
-
دانشكده
رياضي
-
چكيده
خوشهبندي يك روش رايج در دادهكاوي است كه در آن دادههاي بدون برچسب از هم تفكيك ميشوند. هدف خوشهبندي توليد گروههايي از مشاهدات با ويژگيهاي مشابه است بهطوريكه مشاهداتي كه خارج از يك خوشه قرار دارد، شباهتي با آن نداشتهباشند. روشهاي مختلفي براي خوشهبندي وجود دارد. در اين پاياننامه از روش خوشهبندي براساس مدل استفاده شده است.در فصل 4، خوشهبندي با استفاده از مدل سريهاي زماني توسط توزيع نرمال چندمتغيره و الگويتم بيشينه اميد رياضي انجام شدهاست. همچنين در فصل 5 ،خوشهبندي توسط مدل اتورگرسيو با استفاده از زنجيره ماركوف مونت كارلو و الگوريتم گيبز معرفي شدهاست. توجه داشته باشيد كه در خوشهبندي تعداد خوشهها ميتواند مسئلهساز باشد. از آنجايي كه در اغلب الگوريتمها فرض ميشود كه تعداد خوشهها از قبل معلوم است، بعد از اتمام خوشهبندي، بهعلت اينكه مشاهدات واقعي داراي برچسب نيستند، مشخص كردن اينكه خوشهبندي درست انجام شده يا خير سخت است.
-
تاريخ ورود اطلاعات
1399/03/17
-
عنوان به انگليسي
Clustering of time series based on model
-
تاريخ بهره برداري
1/13/2020 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
شادي بحري
-
چكيده به لاتين
Clustering is a well-known approach in data mining, which is used to separate data without being labled. The purpose of clustering is to generate groups of observations with similar characteristics so that observations outside a cluster are not similar. There are several methods for clustering. In this thesis, the model-based clustering method is used. In Chapter 4, clustering using time series models is performed by multivariate normal distribution and expectation-maximization algorith. Also in Chapter 5, clustering is performed by autoregressive model using Markov Chain Monte Carlo and Gibbs algorithm. Note that in clustering, the number of clusters can be problematic. Since most algorithms assume that the number of clusters is already known, After the clustering is complete, Because the real observations are not labeled, it is difficult to determine whether the clustering is done correctly.
-
لينک به اين مدرک :