شماره ركورد
22428
پديد آورنده
صبا آل ابراهيم
عنوان
جداسازي عيب مبتني بر طبقه بندي سري هاي زماني چند متغيره
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
كنترل
سال تحصيل
97-99
تاريخ دفاع
1399/6/2
استاد راهنما
دكتر جواد پشتان
دانشكده
برق
چكيده
مطالعات اخير بر روي روشهاي معمول طبقه بندي در زمينههاي مختلف صنعتي، به خصوص به هنگام برخورد با مسئله تشخيص و جداسازي عيب، نشان داده كه اين روشها عمدتا ويژگيهاي سري زماني دادهها را ناديده گرفته و عيب را با دقت كمتري تشخيص ميدهند. يك رويكرد نوين در حل مسائل تشخيص و جداسازي عيب، استفاده از روشهاي طبقهبندي سريهاي زماني است. در اين پاياننامه از روشهاي يادگيري ماشين براي طبقه بندي دادههاي سري زماني چند متغيره يك مجموعه داده پيش آگاهي و مديريت سلامت در يك فرآيند صنعتي استفاده ميكنيم و به تشخيص رويدادهاي آتي عيب و جداسازي انواع عيوب موجود در دادههاي اين فرآيند صنعتي ميپردازيم. بدين ترتيب مجموعه دادههاي مورد نظر را پيشپردازش نموده و با انتخاب ويژگيهاي آماري جديدي از سريهاي زماني به مهندسي ويژگيهاي مجموعه دادهها ميپردازيم. در ادامه، با استفاده از روشهاي مختلف كاهش ابعاد دادهها مانند آناليز مولفههاي اصلي و الگوريتم جنگل تصادفي به كاهش ابعاد ويژگيهاي سريهاي زماني ميپردازيم. پيش از اعمال الگوريتمهاي طبقه بندي سريهاي زماني، مجموعه دادههاي آمادهسازي شده را به دو دسته دادههاي آموزش و آزمايش تقسيم نموده و توزان دادههاي آموزش را با روشهاي مختلف مانند انتخاب دستي دادههاي متوازن، افزايش تعداد نمونهها و كاهش تعداد نمونهها برقرار ميسازيم و با اعمال روشهاي مختلف اعتبارسنجي بهترين مدل براي مجموعه دادهها انتخاب ميكنيم. در نهايت، الگوريتم k نزديكترين همسايه، ماشين بردار پشتيبان خطي و ماشين بردار پشتيبان با هسته تابع پايه شعاعي، از الگوريتمهاي طبقه بندي سري زماني را بر روي مجموعه دادهها اعمال كرده و نتايج حاصل از تشخيص و طبقه بندي عيب به كمك اين الگوريتمها را با يكديگر مقايسه ميكنيم.
تاريخ ورود اطلاعات
1399/06/15
عنوان به انگليسي
Fault Isolation based on Multivariate Time-Series Classification
تاريخ بهره برداري
8/23/2020 12:00:00 AM
دانشجوي وارد كننده اطلاعات
صبا ال ابراهيم
چكيده به لاتين
Recent studies have shown broad applications of traditional classification methods in dealing with industrial data, especially in fault detection and classification problems. These common methods mainly ignore time-series characteristics of data, which may lead to less accuracy and sensitivity in classification results. Using time-series classification methods is a new approach in dealing with fault detection and classification problems. In this thesis, we are using related machine learning algorithms for multivariate time-series classification of a specific dataset called Prognostics and Health Management, for the purpose of fault event detection and isolation in this industrial process. In the procedure, the dataset is preprocessed at first and all the related features, including novel statistical time-series related features, are extracted from the dataset. Various dimensionality reduction methods such as Principal Component Analysis and Random Forest are used to reduce the number of input variables. Before applying time-series classification algorithms, the prepared dataset is divided into training and testing sets in order to balance the classes in training dataset using resampling methods. Cross Validation method is also used for hyper-parameter tuning and finding the best algorithms for the dataset. Finally, time-series classification based machine learning methods such as K Nearest Neighbor, Linear Support Vector Machines, and Radial Basis Function Kernel Support Vector Machines are applied to the dataset for fault detection and classification.