-
شماره ركورد
14857
-
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
14857
-
پديد آورنده
حسن رحيمي
-
عنوان
تحليل داده هاي حوادث راه آهن جمهوري اسلامي ايران با استفاده از تكنيك خوشه بندي
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي ايمني در حمل و نقل ريلي
-
سال تحصيل
ارديبهشت ماه 1394
-
تاريخ دفاع
ارديبهشت ماه 1394
-
استاد راهنما
دكتر مسعود يقيني
-
دانشكده
راه آهن
-
چكيده
چكيده:
تحقيق حاضر به منظور ارائه مدل هاي خوشه بندي براي داده هاي حوادث راه آهن ج.ا.ا با به كار گيري متدولوژي داده كاوي CRISP-DM و با استفاده از الگوريتم K-Meansانجام شده است. در اين راستا
داده هاي حوادث 5 سال (1392-1388) راه آهن گرد آوري و پس از پيش پردازش لازم بر روي داده ها، براساس مدل RFM با استفاده از سه متغير هدف 1- متوسط سال رخداد حادثه(تازه گي حادثه)، 2- متوسط تكرار(فراواني) حادثه و 3- متوسط شدت حادثه نسبت به گروه بندي و تهيه 4 مدل خوشه بندي تقاطع هاي همسطح، نواحي، ايستگاه ها و نقاط حادثه خيز برخورد با عابرين پياده در راه آهن ج.ا.ا اقدام گرديده است.جهت انجام خوشه بندي علاوه بر متغيرهاي مذكور كه بر گرفته از پايگاه داده حوادث مي باشند، به تناسب موضوع خوشه بندي از اطلاعات ساير پايگاه هاي داده شامل مشخصات فيزيكي و زير بنايي از قبيل وضعيت گذرگاه همسطح، تعداد خطوط ايستگاه، طول خطوط ناحيه، تعداد سوزن و همچنين مشخصه هاي ترافيكي شامل واحد حمل، قطار كيلومتر و... نيز استفاده گرديد. با توجه به اينكه در الگوريتم K-Means تعداد خوشه بهينه از قبل مشخص نمي باشد، ابتدا مدل سازي 5 مرتبه جهت k=2 تاk=6 تكرار شده و سپس با استفاده از شاخصDavies-Bouldin كيفيت خوشه ها مورد ارزيابي قرار گرفته است. بر اين اساس مدلي كه مقدار شاخص ديويس – بولدين آن در كمترين مقدار بود به عنوان تعداد خوشه بهينه انتخاب گرديد.
در ادامه خوشه هاي بدست آمده بر اساس متغيرهاي فوق در هر يك از چهار مدل مذكور، با استفاده از مدل RFM رتبه بندي و اولويت بندي گرديدند. سپس هر يك از خوشه هاي توليد شده تحليل گرديده و عواملي كه باعث مي شوند يك گذرگاه، ناحيه يا ايستگاه در يك خوشه خاص قرار گيرد، مورد بررسي قرار گرفته است. همچنين به منظور شناسايي وضعيت خوشه ها و كشف ويژگي درون خوشه ها و شناسايي و تعيين تاثير مهمترين متغيرها درايجاد آنها، نتايج حاصل از خوشه بندي با استفاده از تكنيك درخت تصميم و
الگوريتم هاي ,C5.0 ,CRT QUEST و CHAIDپس از اعتبار سنجي مدل با نسبت هاي مختلف
داده هاي آموزشي و آزمايشي و تعيين الگوريتمي كه بالاترين دقت را داشته باشد، مورد تحليل قرار گرفته است. نتايج اين تحقيق مي تواند در شناسايي و اولويت بندي نقاط مخاطره آميزه شبكه به ويژه در
گذرگاه هاي همسطح، نواحي و ايستگاه ها و نقاط برخورد و سايل نقليه ريلي با عابرين پياده مورد استفاده واقع شود.
كلمات كليدي: داده كاوي، خوشه بندي، حادثه، الگوريتم K-Means
-
لينک به اين مدرک :