شماره ركورد
30384
پديد آورنده
نسترن ناظم پور
عنوان
ارائه يك مدل پيشگويي جهت بررسي عوارض جانبي و عدم اثر گذاري واكسن كوويد-19 با استفاده از ابزارهاي دادهكاوي و يادگيري ماشين
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي صنايع
سال تحصيل
1400
تاريخ دفاع
1402/10/19
استاد راهنما
احمد ماكويي
استاد مشاور
روزبه قوسي
دانشكده
مهندسي صنايع
چكيده
در سال 2019، بيماري كوويد-19كه يك بيماري مشترك با انسان و حيوانات بوده در چين پديدارشد. اين ويروس به سرعت گسترش يافت به طوري كه به يك چالش جهاني در حوزه بهداشت تبديل شد. بنابراين توليد و توسعه واكسنهاي كوويد-19 يكي از اولويتهاي اساسي در جهان قرارگرفت. در اواخر سال 2020 اولين واكسن كوويد-19 ساخته شد. واكسيناسيون گسترده نقش مهمي در كاهش انتشار ويروس كوويد-19 در سراسر جهان ايفاكرد. باتوجه به فوايد واكسيناسيون، برخي از واكسنها ممكن است عوارض جانبي را به همراه داشتهباشند و اين موضوع ممكن است در هر فرد و با وجود بيماريهاي مختلف در آن فرد منجر به مشكلاتي شود. تحقيق حاضر به بررسي اين جوانب و عوارض واكسيناسيون پرداخته و بررسي ميكند اشخاص با داشتن چه بيماريهايي چه گروه از عوارض را تجربه خواهندكرد. در اين پژوهش از دادههاي سايت سيستم گزارشدهي رويدادهاي نامطلوب واكسن كه تحت نظر سازمان غذا و داروي آمريكاست، استفاده شده و به بررسي عوارض جانبي واكسنهاي مدرنا، جانسون و فايزر پرداختهاست. با استفاده از اطلاعات منتشرشده، عوارض جانبي در سايتهاي سازمان بهداشت جهاني و سازمان غذا و دارو به 3 گروه عوارض جانبي شديد، خفيف تا متوسط و تعيين نشده تقسيم گرديدهاند.
در تحليلهاي آماري مشخص شد گروه سني بزرگسالان و افراد مسن به ترتيب بيشترين ميزان عوارض جانبي شديد و خفيف تا متوسط را تجربه كردهاند. در اين پژوهش زنان70/3% و مردان 29/7% واكسيناسون انجام دادهاند.
باتوجه به نامتعادل بودن دادهها، به كمك روش¬هاي متعادلسازي مانند روش بيش نمونهگيري اقليت مصنوعي داده متعادل گرديدهاست. دو نوع پيش بيني در اين پژوهش انجامشدهاست: پيش بيني عوارض جانبي و پيش بيني عدم اثرگذاري واكسن. در هر دو پيش بيني از مدلهاي طبقهبندي استفادهشدهاست. در پيش بيني عوارض جانبي واكسن ابتدا مدل 3 كلاسه اجرا گرديد كه بدليل پيچيدگي آن، مدل دقت بالايي نداشت بنابراين يك مدل 2 كلاسه با عوارض شديد و خفيف تا متوسط ارائه گرديدهاست. مدلهاي بكاررفته در اين پژوهش، مدلهاي تقويت گراديان سبك، جنگل تصادفي و رگرسيون لجستيك ميباشد. طبق نتايج مدل تقويت گراديان سبك با دقت 0/76 عملكرد بهتري نسبت به دو مدل ديگر دارد. از اين رو ميتوان اظهار داشت كه افرادي كه قصد تزريق واكسن را دارند، با احتمال 76% هشدار در خصوص تجربه عوارض جانبي وجود دارد. پيش بيني دوم، پيش بيني عدم اثرگذاري واكسن، با استفاده از مدلهاي تقويت گراديان شديد، جنگل تصادفي و تقويت گراديان سبك اجرا گرديدهاست. از 3 مدل اجرا شده مدل جنگل تصادفي با عملكرد 0/98، عملكرد بهتري دارد. در هردو نوع پيش بيني جهت رسيدن به نتيجه بهتر و عملكرد بالاتر مدل، از روش جستجوي تصادفي براي تعيين فراپارامترها استفادهشدهاست. تمامي مدلها بوسيله زبان برنامه نويسي پايتون و در كتابخانههاي يادگيري ماشين بر روي مجموعه داده آموزش و آزمون برازش شدهاند.
تاريخ ورود اطلاعات
1402/11/02
عنوان به انگليسي
A prediction model to predict the COVID-19 vaccine side effects on persons and predicting ineffectiveness by using data-driven and machine learning approaches
تاريخ بهره برداري
1/1/1900 12:00:00 AM
دانشجوي وارد كننده اطلاعات
نسترن ناظم پور
چكيده به لاتين
In 2019, COVID-19, a disease common to humans and animals, emerged in China. The virus rapidly spread to the extent that it became a global health challenge. Consequently, the production and development of COVID-19 vaccines became a top priority worldwide. The first COVID-19 vaccine was manufactured in late 2020, and widespread vaccination played a crucial role in reducing the spread of the COVID-19 virus globally. Considering the benefits of vaccination, some vaccines may have side effects, which, depending on various factors, can pose challenges for individuals with different medical conditions.
This study investigates the side effects of Moderna, Johnson & Johnson, and Pfizer vaccines using data from the adverse event reporting system supervised by the U.S. Food and Drug Administration. The data were categorized into severe, mild to moderate, and undetermined side effects based on information published by the World Health Organization and the Food and Drug Administration.
Statistical analyses revealed that adults and elderly individuals experienced the highest rates of severe and mild to moderate side effects. In this research, 70.3% of women and 29.7% of men received vaccination. Due to the imbalanced nature of the data, data balancing techniques such as SMOTE were employed. Two types of predictions were performed in this study: predicting side effects and predicting vaccine ineffectiveness. Classification models were used for both predictions.
In predicting side effects, initially, a 3-class model was implemented, but due to its complexity, a 2-class model distinguishing between severe and mild to moderate side effects is presented. The models used in this research include light gradient boosting, random forest, and logistic regression. According to the results, the light gradient boosting model outperformed the other two models with an accuracy of 76.0%. Therefore, individuals intending to receive the vaccine have a 76% chance of being alerted about the possibility of experiencing side effects. The second prediction, predicting vaccine ineffectiveness, was executed using extreme gradient boosting, random forest, and light gradient boosting models. The random forest model achieved the highest performance with an accuracy of 98.0%. To achieve better results and higher model performance in both predictions, a random search method was used to determine hyperparameters. All models were implemented using the Python programming language and machine learning libraries on the training and test datasets.
كليدواژه هاي فارسي
واكسن كوويد-19 , عوارض جانبي , عدم اثرگذاري , يادگيري ماشين , جنگل تصادفي , تقويت گراديان , جست و جوي تصادفي
كليدواژه هاي لاتين
COVID-19 vaccine , Side effects , Ineffectiveness , Machine learning , Random forest , Gradient boosting , Random search
Author
Nastaran Nazempour
SuperVisor
Ahmad Makui