-
شماره ركورد
25598
-
پديد آورنده
سارا كريمي نژاد
-
عنوان
طبقهبندي ساختارهاي دارويي بر اساس خاصيت آبدوستي و آبگريزي با استفاده از يادگيري ماشين
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
شيمي فيزيك
-
سال تحصيل
1398
-
تاريخ دفاع
1400/6/16
-
استاد راهنما
دكتر سيد مجيد هاشميان زاده
-
استاد مشاور
دكتر سجاد قرقاني
-
دانشكده
شيمي
-
چكيده
علاقه به يادگيري ماشين در ميان شيميدانها روز به روز در حال افزايش است؛ اين توجه روزافزون از آنجا ناشي ميشود كه كه مدلهاي يادگيري ماشين ميتوانند به طور دقيق خواص شيميايي را پيشبيني كنند. در اين تحقيق از مدلهاي يادگيري ماشين به منظور طبقهبندي داروها، به دو طبقهي آبدوستي و آبگريزي استفاده شده است. ابتدا مجموعه دادهاي شامل 199 دارو و 9 ويژگي ساخته شد. اين 9 ويژگي شامل 7 ويژگي كوانتومي است كه با استفاده از محاسبات DFT به دست آمدند و 2 ويژگي ضريب تقسيم و حلاليت است. ضريب تقسيم به عنوان ويژگي هدف انتخاب شد، به اين شكل كه داروها با ضريب تقسيم منفي به عنوان كلاس آبدوست به معناي آن كه داروها به سمت آبدوستي ميروند و ضريب تقسيم مثبت به عنوان كلاسِ آبگريز، به معناي آن كه داروها به سمت آبگريزي ميروند طبقهبندي شدند. اين طبقه بندي با استفاده از سه مدل با نظارت يادگيري ماشين: جنگل تصادفي، K –نزديكترين همسايه و ماشين بردار پشتيبان صورت گرفت. ابتدا اين مدلها با تمام ويژگيها آموزش ديدند، سپس با استفاده از انتخاب ويژگي به پنج ويژگي كاهش يافتند و آموزش آنها با اين پنج ويژگي انجام شد. اين مدلها به روشهاي مختلف ارزيابي شدند. در نهايت مدل جنگل تصادفي به عنوان بهترين مدل انتخاب شد.
-
تاريخ ورود اطلاعات
1400/09/09
-
عنوان به انگليسي
Classification in two categories hydrophobic and hydrophilic through machin learning methods
-
تاريخ بهره برداري
9/7/2022 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
سارا كريمي نژاد
-
چكيده به لاتين
A chemical must have desirable chemical and physical properties to become a drug, among the chemical and physical properties, we can mention the partition coefficient. The fact that water and many organic substances do not mix but form separate layers when combined together has far-reaching implications for chemistry, biology, and the environment. The partition coefficient (P) describes the propensity of a neutral (uncharged) compound to dissolve in an immiscible biphasic system of lipid (fats, oils, organic solvents) and water. The interest in machine learning among chemists is growing day by day. This growing attention stems from the fact that machine learning models can accurately predict chemical properties. In this research, machine learning models have been used to classify drugs into two categories: hydrophilic and hydrophobic. First, a data set containing 199 drugs and 9 features was created. These 9 features include 7 quantum features obtained using DFT calculations. And two features of partition coefficient and solubility. The partition coefficient was chosen as the target attribute, Solutes that are predominantly dissolved in the water layer are called hydrophilic (water liking) and those predominantly dissolved in lipids are lipophilic (lipid liking).This means, A negative value for logP means the compound has a higher affinity for the aqueous phase (it is more hydrophilic)and positive value for logP denotes a higher concentration in the lipid phase (the compound is more lipophilic).The drugs are classified according to partition coefficient. This classification was done using three models: k-nearest neighbors, support vector machines and random forest. First, these models were trained with all the features and then reduced to five features using feature selection These models were evaluated in different ways. Finally, a random forest model was selected as the best model.
-
كليدواژه هاي فارسي
يادگيري ماشين , DFT , جنگل تصادفي , K- نزديك ترين همسايه , ماشين بردار پشتيبان
-
كليدواژه هاي لاتين
machine learning , DFT , k-nearest neighbors , support vector machines , random forest
-
لينک به اين مدرک :