شماره ركورد
25508
پديد آورنده
سپيده ع مقسمي
عنوان
كاربرد روش هاي رگرسيون در تخمين حلاليت داروها با استفاده از يادگيري ماشين
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
شيمي- شيمي فيزيك
سال تحصيل
1398
تاريخ دفاع
1400/4/22
استاد راهنما
مجيد هاشميان زاده
دانشكده
شيمي
چكيده
حلاليت يكي از پارامترهاي مهم براي دستيابي به غلظت مطلوب دارو در گردش سامانمند براي دستيابي به پاسخ دارويي مورد نياز است. داروهاي محلول در آب براي رسيدن به غلظت هاي پلاسماي درماني پس از تجويز خوراكي، اغلب به دوزهاي بالا نياز دارند. حلاليت كم در آب مهمترين مسئله اي است كه با توسعه فرمولاسيون تركيبات شيميايي جديد و همچنين توسعه عمومي روبرو است. هر دارويي كه جذب ميشود بايد به صورت محلول آبي در محل جذب وجود داشته باشد. بدين منظور در اين پروژه به پيش بيني ميزان حلاليت داروها پرداختهايم. از اينرو، از چهار الگوريتم يادگيري ماشين(رگرسيون خطي، رگرسيون ستيغي، بردار پشتيبان رگرسيون و جنگل تصادفي) و به منظور اموزش الگوريتم ها از 199دارو در دسته هاي مختلف پتريدين، باربيتيورت ها و... استفاده شده است. در ادامه چندين ويژگي كوانتومي اين داروها توسط محاسبات كوانتومي انجام شده است و به مدلها داده شده تا با استفاده از اين ويژگيها حلاليت داروها را پيش بيني كنند، سپس مقدار حلاليتهاي بدست آمده با مقدار ازمايشگاهي حلاليت 199دارو مورد بررسي قرار گرفته است و عملكرد 4 مدل مورد بررسي قرار گرفت كه بهترين عملكرد مربوط به جنگل تصادفي و ماشين بردار پشتيبان بودهاست. با استفاده از اين الگوريتمها توانستيم حلاليت داروها را تا حد قابلقبولي پيشبيني كنيم و نشان دهيم كميتهاي كوانتومي در صورت جايگزين شدن بهجاي كميتهاي ساختاري تا چه حد بر تخمين حلاليت موثر هستند. به منظور پيشرفت مدلها در آينده قصد داريم تا حد امكان داروهاي بيشتر با ساختارهاي متنوعتر را به دادها اضافه كرده و نيز تاثير ويژگيهاي ترموديناميكي بر حلاليت اين داروها را بررسي كنيم.
تاريخ ورود اطلاعات
1400/08/23
عنوان به انگليسي
Applied regression methods in estimating the solubility of drugs using machine learning
تاريخ بهره برداري
7/13/2022 12:00:00 AM
دانشجوي وارد كننده اطلاعات
سپيده ع مقسمي
چكيده به لاتين
Solubility is one of the important parameters for achieving the desired concentration of circulating drug to achieve the required drug response. Water-soluble drugs often require high doses to achieve therapeutic plasma concentrations after oral administration. Low solubility in water is the most important issue facing the development of new chemical formulations as well as general development. Any drug that is absorbed must be present as an aqueous solution at the site of absorption. For this purpose, in this project, we have predicted the solubility of drugs. Therefore, four machine learning algorithms (linear regression, ridge regression, regression support vector, and random forest) and to teach algorithms, 199 drugs in different categories of pteridines, barbiturates, etc. have been used. In the following, several quantum properties of these drugs have been performed by quantum calculations and the models have been given to predicting the solubility of drugs using these properties, then the amount of solubility obtained with the experimental value of the solubility of 199 drugs has been investigated and the performance of 4 models It was found that the best performance was related to random forest and support vector machine. Using these algorithms, we were able to predict the solubility of drugs to an acceptable level and show how effective quantum committees would be in estimating solubility if structural committees were replaced. To improve the models in the future, we intend to add as many drugs with more diverse structures to the data as possible and also to investigate the effect of thermodynamic properties on the solubility of these drugs.