شماره ركورد
33685
پديد آورنده
محمد نيكبخت
عنوان
شخصيسازي مقداردهي انسولين با استفاده از يادگيري تقويتي
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي فناوري اطلاعات-تجارت الكترونيكي
سال تحصيل
1402
تاريخ دفاع
1404/06/22
استاد راهنما
دكتر محمدرضا رسولي
استاد مشاور
دكتر منصور سياوش دستجردي
دانشكده
پرديس دانشگاهي-دانشكده مهندسي صنايع
چكيده
ديابت نوع يك از بيماريهاي مزمن و پرهزينهاي است كه در آن بدن به دليل تخريب سلولهاي بتاي پانكراس توانايي توليد انسولين را از دست ميدهد. بيماران مبتلا ناگزير به تزريق مداوم انسولين هستند و تعيين مقدار بهينه آن يكي از چالشهاي اساسي در مديريت بيماري محسوب ميشود. انتخاب نادرست مقدار انسولين ميتواند منجر به هيپوگليسمي يا هايپرگليسمي گردد و عوارض كوتاهمدت و بلندمدت متعددي به همراه داشته باشد. روشهاي سنتي در تعيين مقدار انسولين، متكي بر محاسبات دستي يا دستورالعملهاي كلي پزشكان هستند و كمتر به شرايط لحظهاي، تفاوتهاي فردي و تغييرات پويا در بيماران توجه دارند. اين محدوديتها ضرورت بهرهگيري از رويكردهاي نوين و هوشمند براي طراحي مدلهاي شخصيسازيشده را نمايان ميسازد.
در سالهاي اخير، استفاده از هوش مصنوعي و بهويژه يادگيري تقويتي به عنوان ابزاري كارآمد براي تصميمگيري پويا در مديريت ديابت مطرح شده است. الگوريتم بازيگر–منتقد به دليل تركيب مزاياي روشهاي سياستمحور و ارزشمحور، توانايي بالايي در يادگيري تصميمات بهينه در فضاي پيوسته دارد. در اين الگوريتم، بخش بازيگر سياست مناسب را براي انتخاب مقدار انسولين ميآموزد و بخش منتقد كيفيت تصميمات را ارزيابي كرده و بازخورد لازم براي اصلاح آن فراهم ميسازد.
با وجود دستاوردهاي پيشين، همچنان شكافهايي مانند فقدان شخصيسازي كامل، استفاده محدود از دادههاي لحظهاي و بهرهگيري اندك از الگوريتمهاي بازيگر–منتقد در مديريت ديابت مشاهده ميشود. در اين پژوهش، مدلي مبتني بر الگوريتم بازيگر–منتقد طراحي شد كه با استفاده از دادههاي لحظهاي قند خون، ميزان كربوهيدرات مصرفي و مقادير انسولين، بهينهسازي مقداردهي انسولين را هدف قرار داد. نتايج حاصل نشان داد كه مدل پيشنهادي با افزايش ميانگين تابع ارزش عمل و پاداش تجمعي، عملكردي پايدارتر نسبت به روشهاي سنتي ارائه داد. علاوه بر اين، شاخصهاي باليني همچون زمان در محدوده نرمال، كاهش تعداد رويدادهاي هيپوگليسمي و بهبود قند خون سهماهه بهبود قابلتوجهي داشتند.
به طور كلي، يافتههاي پژوهش حاضر نشان ميدهد كه الگوريتم بازيگر–منتقد ميتواند به عنوان ابزاري مؤثر در تعيين شخصيسازيشده انسولين و توسعه سيستمهاي هوشمند پايش و كنترل ديابت نوع يك به كار گرفته شود.
تاريخ ورود اطلاعات
1404/06/30
عنوان به انگليسي
Personalization of Insulin Dosage Using Reinforcement Learning
تاريخ بهره برداري
1/1/1900 12:00:00 AM
دانشجوي وارد كننده اطلاعات
محمد نيكبخت
چكيده به لاتين
Type 1 diabetes is a chronic and costly disease in which the body loses the ability to produce insulin due to the destruction of pancreatic beta cells. Patients with this condition are dependent on continuous insulin injections, and determining the optimal dose is one of the fundamental challenges in disease management. Incorrect insulin dosing may lead to hypoglycemia or hyperglycemia, resulting in various short-term and long-term complications. Traditional dosing methods, which rely on manual calculations or general physician guidelines, often fail to consider real-time conditions, individual differences, and dynamic changes in patients. These limitations highlight the necessity of employing modern and intelligent approaches to design personalized models for diabetes management.
In recent years, artificial intelligence and, in particular, reinforcement learning have emerged as powerful tools for dynamic decision-making in diabetes care. The Actor–Critic algorithm, by combining the advantages of policy-based and value-based methods, demonstrates high capability in learning optimal decisions within continuous action spaces. In this approach, the actor learns the appropriate policy for selecting insulin doses, while the critic evaluates the quality of these decisions and provides feedback for policy improvement.
Despite previous advancements, significant gaps remain, such as the lack of complete personalization, limited use of real-time data, and insufficient application of Actor–Critic algorithms in diabetes management. In this study, a model based on the Actor–Critic algorithm was developed to optimize insulin dosing using real-time blood glucose data, carbohydrate intake, and insulin information. The results indicated that the proposed model achieved more stable performance compared to traditional methods by improving the mean action-value function and cumulative reward. Furthermore, clinical indicators such as time-in-range, reduction in hypoglycemic events, and improvement in glycated hemoglobin (HbA1c) showed considerable enhancement.
Overall, the findings of this research suggest that the Actor–Critic algorithm can serve as an effective tool for personalized insulin dosing and can be integrated into intelligent monitoring and control systems for managing type 1 diabetes.
كليدواژه هاي فارسي
يادگيري تقويتي , بازيگر–منتقد , شخصيسازي درمان , ديابت نوع يك , مقداردهي انسولين
كليدواژه هاي لاتين
reinforcement learning , Actor–Critic algorithm , Type 1 diabetes , insulin dosing , personalized treatment
Author
Mohammad Nikbakht
SuperVisor
dr.Mohammadreza rasouli