-
شماره ركورد
26342
-
پديد آورنده
سمانه طاهري
-
عنوان
پيش بيني ميزان چاقي بر اساس متغيرهاي رفتاري افراد با استفاده از تكنيك هاي داده كاوي
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي صنايع
-
سال تحصيل
1397-1400
-
تاريخ دفاع
1400/03/11
-
استاد راهنما
عبدالرحمن حائري
-
استاد مشاور
روزبه قوسي
-
دانشكده
صنايع
-
چكيده
چاقي اصطلاحي است كه به وزن اضافي بدن يا نسبت غير طبيعي چربي بدن تعبير مي شود و معمولا با شاخص توده بدني تخمين زده مي شود. اين بيماري به يك همه گيري اپيدميك در جهان رسيده است و از آنجا كه چاقي به طور نگران كننده اي در حال افزايش است، علاقه زيادي به مطالعه درباره اين بيماري و عوارض مربوط به آن وجود دارد و آن را به يك حوزه جذاب براي تحقيق بدل كرده است. تلاش هاي بسياري براي توسعه برنامه هاي كاربردي براي بهبود دانش ، تشخيص ، درمان و پيگيري بيماران چاق صورت گرفته است و با پيشرفت تكنولوژي بهتر است به روش هاي جديد رو آوريم. از جمله اين روش هاي جديد، داده كاوي است كه پتانسيل بسيار خوبي براي كشف الگوهاي پنهان در مجموعه داده دارد. در اين پژوهش دو هدف دنبال شده است. هدف اول بررسي عواملي است كه در گروه هاي مختلف منجر به چاقي با دو معيار شاخص توده بدني و اندازه دور كمر (چاقي شكمي) مي شوند. بدين منظور از يك مجموعه داده آمريكايي كه شامل ميزان تغذيه و فعاليت بدني افراد بود، استفاده شد. مجموعه داده ابتدا خوشه بندي شده و سپس با استفاده از درخت تصميم قوانيني از آن استخراج شد و قوانين خوشه ها با يكديگر مقايسه شدند. هدف دوم مقايسه روش هاي مختلف استخراج ويژگي با استفاده از تكنيك هاي مبتني بر درخت است. از آنجا كه مجموعه داده يك مجموعه داده نامتوازن شناخته مي شود، لازم است روشي براي بهبود پيش بيني در طبقه چاق ارائه شود. در اين پژوهش سه روش استخراج ويژگي مبتني بر درخت كه يكبار روي مجموعه داده اصلي و بار ديگر روي مجموعه داده متوازن شده اعمال شدند، با يكديگر مقايسه شدند. نتايج در هدف اول نشان داد كه فعاليت بدني و تحرك بالا در افراد،فارغ از هر مساله غير قابل كنترل ديگري مثل سن، نژاد و جنسيت، مي تواند ابتلا به چاقي را كنترل كند. در هدف دوم نيز، الگوريتم تركيبي عملكرد بهتري را نسبت به الگوريتم هاي تكي نشان داد و استخراج ويژگي با جنگل تصادفي، بهترين روش استخراج ويژگي در داده اصلي بود.
-
تاريخ ورود اطلاعات
1401/01/21
-
عنوان به انگليسي
Predicting obesity based on behavioral variables using data mining techniques
-
تاريخ بهره برداري
6/1/2022 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
سمانه طاهري
-
چكيده به لاتين
Obesity is a term that refers to excess body weight or abnormal body fat ratio and is usually estimated by body mass index. The disease has reached an epidemic in the world, and as obesity is increasing alarmingly, there is a great deal of interest in studying the disease and its complications, making it an attractive area for research. Many efforts have been made to develop applications to improve the knowledge, diagnosis, treatment and follow-up of obese patients, and with the advancement of technology, it is better to turn to new methods. One of these new methods is data mining, which has great potential for discovering hidden patterns in a data set. In this research, two goals have been pursued. The first goal is to investigate the factors that lead to obesity in different groups with two criteria: body mass index and waist circumference (abdominal obesity). For this purpose, an American data set was used that included the amount of nutrition and physical activity of individuals. The data set was first clustered and then rules were extracted using the decision tree and the cluster rules were compared. The second goal is to compare different feature extraction methods using tree-based techniques. Since the data set is known as an imbalanced data set, it is necessary to provide a way to improve the prediction in the obese class. In this study, three tree-based feature extraction methods that were applied once to the main data set and again to the balanced data set were compared. The results in the first goal showed that physical activity and high mobility in individuals, apart from any other uncontrollable issue such as age, gender, and race can control obesity. In the second goal, the hybrid algorithm showed better performance than the individual algorithms and extracting feature with random forest was the best method of feature extraction in the main data.
-
كليدواژه هاي فارسي
چاقي , داده كاوي , درخت تصميم , استخراج ويژگي , مجموعه داده نامتوازن
-
كليدواژه هاي لاتين
obesity , data mining , feature extraction , decision tree , imbalanced data
-
Author
Samaneh Taheri
-
SuperVisor
Abdorahman Haeri
-
لينک به اين مدرک :