مصطفي عبدالرزاق

عنوان

استفاده از مبدل‌هاي از پيش آموزش ديده ((GPT براي توليد نظرات كد

مقطع تحصيلي

كارشناسي ارشد

رشته تحصيلي

مهندسي كامپيوتر- نرم‌افزار

سال تحصيل

1401

تاريخ دفاع

1403/12/1

استاد راهنما

بهروز مينايى

استاد مشاور

دانشكده

دانشكده مهندسي كامپيوتر

چكيده

قابل درك بودن و پايداري نرم افزار به طور قابل توجهي به كيفيت نظرات كد منبع بستگي دارد كه هدف توسعه دهنده را با عملكرد كد مرتبط مي كند. با وجود عملكرد اساسي آنها، اسناد منسجم و باكيفيت اغلب ناديده گرفته مي‌شوند كه منجر به مشكلاتي در توسعه نرم‌افزار مشترك مي‌شود. پيشرفت‌هاي اخير در مدل‌هاي زبان بزرگ (LLM) كه نمونه آن ChatGPT است، گزينه‌هاي بالقوه‌اي را براي خودكارسازي توليد نظرات از طريق استفاده از مجموعه داده‌هاي گسترده شامل كد برنامه‌نويسي و زبان طبيعي فراهم مي‌كند. اين پايان نامه كارايي ChatGPT را در توليد حاشيه نويسي هاي مهم، مرتبط با متن و كد منبع دقيق ارزيابي مي كند. يك چارچوب ارزيابي مبتني بر روبريك براي ارزيابي سيستماتيك كيفيت نظرات توليد شده در چهار بعد اصلي ايجاد شد: ارتباط، صحت، خوانايي، و آگاهي زمينه‌اي. ارزياب‌هاي انساني از اين روبريك براي ارزيابي نظرات توليد شده براي مجموعه داده‌هاي پروژه‌هاي پايتون استفاده كردند، و آنها را در كنار نظرات نويسنده انسان به عنوان يك استاندارد قرار دادند. اين تحقيق كمبودهاي قابل توجهي را در قابليت‌هاي موجود نظرات ايجاد شده توسط LLM، به ويژه در توانايي آنها در درك ظرافت‌هاي زمينه‌اي و حفظ ثبات نشان مي‌دهد. ChatGPT داراي امتيازاتي در دقت و خوانايي بود. اما، اثربخشي آن در ارائه ارتباط متني بيشتر ناكافي بود. تجزيه و تحليل آماري نتايج اين تفاوت ها را آشكار كرد و بر امكان تست مبتني بر روبريك به عنوان يك ابزار ارزيابي پيچيده تر از معيارهاي خودكار معمولي تأكيد كرد. اين تحقيق رويكردهاي ارزيابي ابزارهاي هوش مصنوعي را در اسناد نرم‌افزاري افزايش مي‌دهد و بينش‌هاي عملي را براي بهبود آموزش و توسعه LLMهايي مانند ChatGPT ارائه مي‌دهد. اين كار به دنبال حل مسائل مربوط به توليد نظرات خودكار است، در نتيجه شكاف بين مستندات نرم افزاري توليد شده توسط انسان و ماشين و افزايش كارايي و همكاري در مهندسي نرم افزار را پر مي كند

تاريخ ورود اطلاعات

1403/12/19

عنوان به انگليسي

Utilizing Generative Pre-trained Transformers (GPTs) for Code Comment Generation

تاريخ بهره برداري

2/19/2026 12:00:00 AM

دانشجوي وارد كننده اطلاعات

مصطفي عبدالرزاق

Name: مصطفي عبدالرزاق
Author: مصطفي عبدالرزاق

چكيده به لاتين

The comprehensibility and sustainability of software significantly depend on the quality of source code comments, which connect a developer's intent with the code's functionality. Despite their essential function, consistent and high-quality documentation is frequently neglected, resulting in difficulties in collaborative software development. Recent breakthroughs in Large Language Models (LLMs), exemplified by ChatGPT, provide potential options for automating comment production through the utilization of extensive datasets comprising programming code and natural language. This thesis assesses the efficacy of ChatGPT in producing significant, contextually relevant, and precise source code annotations. A rubric-based eva‎luation framework was established to systematically eva‎luate the quality of generated comments across four principal dimensions: relevance, correctness, readability, and contextual awareness. Human assessors utilized this rubric to assess comments produced for a dataset of Python projects, juxtaposing them with human-authored comments as a standard. The research reveals substantial deficiencies in the existing capabilities of LLM-generated comments, especially in their ability to grasp contextual subtleties and uphold consistency. ChatGPT had merits in accuracy and readability; but, its effectiveness in delivering greater contextual relevance was inadequate. A statistical analysis of the results revealed these differences and emphasized the possibility of rubric-based testing as a more sophisticated eva‎luation tool than conventional automated metrics. This research enhances eva‎luation approaches for AI tools in software documentation and offers practical insights for improving the training and development of LLMs such as ChatGPT. This work seeks to resolve the issues of automated comment generation, thereby bridging the divide between human and machine-generated software documentation, and enhancing efficiency and collaboration in software engineering .

كليدواژه هاي فارسي

1- ChatGPT , 2- نسل نظرات , 3- مدل هاي زبان بزرگ (LLMs). , 4- ارزيابي كيفيت

كليدواژه هاي لاتين

1- ChatGPT , 2- Comment Generation , 3- Large Language Models (LLMs). , 4- Quality Assessment

Author

Mostafa Abdolrazagh

SuperVisor

Dr. Minaeei

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=33111&Field=0&DTC=6