-
شماره ركورد
33111
-
پديد آورنده
مصطفي عبدالرزاق
-
عنوان
استفاده از مبدلهاي از پيش آموزش ديده ((GPT براي توليد نظرات كد
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي كامپيوتر- نرمافزار
-
سال تحصيل
1401
-
تاريخ دفاع
1403/12/1
-
استاد راهنما
بهروز مينايى
-
استاد مشاور
/
-
دانشكده
دانشكده مهندسي كامپيوتر
-
چكيده
قابل درك بودن و پايداري نرم افزار به طور قابل توجهي به كيفيت نظرات كد منبع بستگي دارد كه هدف توسعه دهنده را با عملكرد كد مرتبط مي كند. با وجود عملكرد اساسي آنها، اسناد منسجم و باكيفيت اغلب ناديده گرفته ميشوند كه منجر به مشكلاتي در توسعه نرمافزار مشترك ميشود. پيشرفتهاي اخير در مدلهاي زبان بزرگ (LLM) كه نمونه آن ChatGPT است، گزينههاي بالقوهاي را براي خودكارسازي توليد نظرات از طريق استفاده از مجموعه دادههاي گسترده شامل كد برنامهنويسي و زبان طبيعي فراهم ميكند. اين پايان نامه كارايي ChatGPT را در توليد حاشيه نويسي هاي مهم، مرتبط با متن و كد منبع دقيق ارزيابي مي كند. يك چارچوب ارزيابي مبتني بر روبريك براي ارزيابي سيستماتيك كيفيت نظرات توليد شده در چهار بعد اصلي ايجاد شد: ارتباط، صحت، خوانايي، و آگاهي زمينهاي. ارزيابهاي انساني از اين روبريك براي ارزيابي نظرات توليد شده براي مجموعه دادههاي پروژههاي پايتون استفاده كردند، و آنها را در كنار نظرات نويسنده انسان به عنوان يك استاندارد قرار دادند. اين تحقيق كمبودهاي قابل توجهي را در قابليتهاي موجود نظرات ايجاد شده توسط LLM، به ويژه در توانايي آنها در درك ظرافتهاي زمينهاي و حفظ ثبات نشان ميدهد. ChatGPT داراي امتيازاتي در دقت و خوانايي بود. اما، اثربخشي آن در ارائه ارتباط متني بيشتر ناكافي بود. تجزيه و تحليل آماري نتايج اين تفاوت ها را آشكار كرد و بر امكان تست مبتني بر روبريك به عنوان يك ابزار ارزيابي پيچيده تر از معيارهاي خودكار معمولي تأكيد كرد. اين تحقيق رويكردهاي ارزيابي ابزارهاي هوش مصنوعي را در اسناد نرمافزاري افزايش ميدهد و بينشهاي عملي را براي بهبود آموزش و توسعه LLMهايي مانند ChatGPT ارائه ميدهد. اين كار به دنبال حل مسائل مربوط به توليد نظرات خودكار است، در نتيجه شكاف بين مستندات نرم افزاري توليد شده توسط انسان و ماشين و افزايش كارايي و همكاري در مهندسي نرم افزار را پر مي كند
-
تاريخ ورود اطلاعات
1403/12/19
-
عنوان به انگليسي
Utilizing Generative Pre-trained Transformers (GPTs) for Code Comment Generation
-
تاريخ بهره برداري
2/19/2026 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
مصطفي عبدالرزاق
-
چكيده به لاتين
The comprehensibility and sustainability of software significantly depend on the quality of source code comments, which connect a developer's intent with the code's functionality. Despite their essential function, consistent and high-quality documentation is frequently neglected, resulting in difficulties in collaborative software development. Recent breakthroughs in Large Language Models (LLMs), exemplified by ChatGPT, provide potential options for automating comment production through the utilization of extensive datasets comprising programming code and natural language. This thesis assesses the efficacy of ChatGPT in producing significant, contextually relevant, and precise source code annotations. A rubric-based evaluation framework was established to systematically evaluate the quality of generated comments across four principal dimensions: relevance, correctness, readability, and contextual awareness. Human assessors utilized this rubric to assess comments produced for a dataset of Python projects, juxtaposing them with human-authored comments as a standard. The research reveals substantial deficiencies in the existing capabilities of LLM-generated comments, especially in their ability to grasp contextual subtleties and uphold consistency. ChatGPT had merits in accuracy and readability; but, its effectiveness in delivering greater contextual relevance was inadequate. A statistical analysis of the results revealed these differences and emphasized the possibility of rubric-based testing as a more sophisticated evaluation tool than conventional automated metrics. This research enhances evaluation approaches for AI tools in software documentation and offers practical insights for improving the training and development of LLMs such as ChatGPT. This work seeks to resolve the issues of automated comment generation, thereby bridging the divide between human and machine-generated software documentation, and enhancing efficiency and collaboration in software engineering .
-
كليدواژه هاي فارسي
1- ChatGPT , 2- نسل نظرات , 3- مدل هاي زبان بزرگ (LLMs). , 4- ارزيابي كيفيت
-
كليدواژه هاي لاتين
1- ChatGPT , 2- Comment Generation , 3- Large Language Models (LLMs). , 4- Quality Assessment
-
Author
Mostafa Abdolrazagh
-
SuperVisor
Dr. Minaeei
-
لينک به اين مدرک :