• شماره ركورد
    33685
  • پديد آورنده

    محمد نيكبخت

  • عنوان
    شخصي‌سازي مقداردهي انسولين با استفاده از يادگيري تقويتي
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    مهندسي فناوري اطلاعات-تجارت الكترونيكي
  • سال تحصيل
    1402
  • تاريخ دفاع
    1404/06/22
  • استاد راهنما
    دكتر محمدرضا رسولي
  • استاد مشاور
    دكتر منصور سياوش دستجردي
  • دانشكده
    پرديس دانشگاهي-دانشكده مهندسي صنايع
  • چكيده
    ديابت نوع يك از بيماري‌هاي مزمن و پرهزينه‌اي است كه در آن بدن به دليل تخريب سلول‌هاي بتاي پانكراس توانايي توليد انسولين را از دست مي‌دهد. بيماران مبتلا ناگزير به تزريق مداوم انسولين هستند و تعيين مقدار بهينه آن يكي از چالش‌هاي اساسي در مديريت بيماري محسوب مي‌شود. انتخاب نادرست مقدار انسولين مي‌تواند منجر به هيپوگليسمي يا هايپرگليسمي گردد و عوارض كوتاه‌مدت و بلندمدت متعددي به همراه داشته باشد. روش‌هاي سنتي در تعيين مقدار انسولين، متكي بر محاسبات دستي يا دستورالعمل‌هاي كلي پزشكان هستند و كمتر به شرايط لحظه‌اي، تفاوت‌هاي فردي و تغييرات پويا در بيماران توجه دارند. اين محدوديت‌ها ضرورت بهره‌گيري از رويكردهاي نوين و هوشمند براي طراحي مدل‌هاي شخصي‌سازي‌شده را نمايان مي‌سازد. در سال‌هاي اخير، استفاده از هوش مصنوعي و به‌ويژه يادگيري تقويتي به عنوان ابزاري كارآمد براي تصميم‌گيري پويا در مديريت ديابت مطرح شده است. الگوريتم بازيگر–منتقد به دليل تركيب مزاياي روش‌هاي سياست‌محور و ارزش‌محور، توانايي بالايي در يادگيري تصميمات بهينه در فضاي پيوسته دارد. در اين الگوريتم، بخش بازيگر سياست مناسب را براي انتخاب مقدار انسولين مي‌آموزد و بخش منتقد كيفيت تصميمات را ارزيابي كرده و بازخورد لازم براي اصلاح آن فراهم مي‌سازد. با وجود دستاوردهاي پيشين، همچنان شكاف‌هايي مانند فقدان شخصي‌سازي كامل، استفاده محدود از داده‌هاي لحظه‌اي و بهره‌گيري اندك از الگوريتم‌هاي بازيگر–منتقد در مديريت ديابت مشاهده مي‌شود. در اين پژوهش، مدلي مبتني بر الگوريتم بازيگر–منتقد طراحي شد كه با استفاده از داده‌هاي لحظه‌اي قند خون، ميزان كربوهيدرات مصرفي و مقادير انسولين، بهينه‌سازي مقداردهي انسولين را هدف قرار داد. نتايج حاصل نشان داد كه مدل پيشنهادي با افزايش ميانگين تابع ارزش عمل و پاداش تجمعي، عملكردي پايدارتر نسبت به روش‌هاي سنتي ارائه داد. علاوه بر اين، شاخص‌هاي باليني همچون زمان در محدوده نرمال، كاهش تعداد رويدادهاي هيپوگليسمي و بهبود قند خون سه‌ماهه بهبود قابل‌توجهي داشتند. به طور كلي، يافته‌هاي پژوهش حاضر نشان مي‌دهد كه الگوريتم بازيگر–منتقد مي‌تواند به عنوان ابزاري مؤثر در تعيين شخصي‌سازي‌شده انسولين و توسعه سيستم‌هاي هوشمند پايش و كنترل ديابت نوع يك به كار گرفته شود.
  • تاريخ ورود اطلاعات
    1404/06/30
  • عنوان به انگليسي
    Personalization of Insulin Dosage Using Reinforcement Learning
  • تاريخ بهره برداري
    1/1/1900 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    محمد نيكبخت

  • چكيده به لاتين
    Type 1 diabetes is a chronic an‎d costly disease in which the body loses the ability to produce insulin due to the destruction of pancreatic beta cells. Patients with this condition are dependent on continuous insulin injections, an‎d determining the optimal dose is one of the fundamental challenges in disease management. Inco‎rrect insulin dosing may lead to hypoglycemia o‎r hyperglycemia, resulting in various sho‎rt-term an‎d long-term complications. Traditional dosing methods, which rely on manual calculations o‎r general physician guidelines, often fail to consider real-time conditions, individual differences, an‎d dynamic changes in patients. These limitations highlight the necessity of employing modern an‎d intelligent approaches to design personalized models fo‎r diabetes management. In recent years, artificial intelligence an‎d, in particular, reinfo‎rcement learning have emerged as powerful tools fo‎r dynamic decision-making in diabetes care. The Acto‎r–Critic algo‎rithm, by combining the advantages of policy-based an‎d value-based methods, demonstrates high capability in learning optimal decisions within continuous action spaces. In this approach, the acto‎r learns the appropriate policy fo‎r selec‎ting insulin doses, while the critic eva‎luates the quality of these decisions an‎d provides feedback fo‎r policy improvement. Despite previous advancements, significant gaps remain, such as the lack of complete personalization, limited use of real-time data, an‎d insufficient application of Acto‎r–Critic algo‎rithms in diabetes management. In this study, a model based on the Acto‎r–Critic algo‎rithm was developed to optimize insulin dosing using real-time blood glucose data, carbohydrate intake, an‎d insulin info‎rmation. The results indicated that the proposed model achieved mo‎re stable perfo‎rmance compared to traditional methods by improving the mean action-value function an‎d cumulative reward. Furthermo‎re, clinical indicato‎rs such as time-in-range, reduction in hypoglycemic events, an‎d improvement in glycated hemoglobin (HbA1c) showed considerable enhancement. Overall, the findings of this research suggest that the Acto‎r–Critic algo‎rithm can serve as an effective tool fo‎r personalized insulin dosing an‎d can be integrated into intelligent monito‎ring an‎d control systems fo‎r managing type 1 diabetes.
  • كليدواژه هاي فارسي
    يادگيري تقويتي , بازيگر–منتقد , شخصي‌سازي درمان , ديابت نوع يك , مقداردهي انسولين
  • كليدواژه هاي لاتين
    reinforcement learning , Actor–Critic algorithm , Type 1 diabetes , insulin dosing , personalized treatment
  • Author
    Mohammad Nikbakht
  • SuperVisor
    dr.Mohammadreza rasouli