زهرا مومني نژاد

عنوان

امكان‌سنجي استفاده از روش‌هاي تبديل خودكار تصاوير دوبعدي به سه‌بعدي در صنعت بازي‌سازي

مقطع تحصيلي

كارشناسي ارشد

رشته تحصيلي

رشته مهندسي كامپيوتر گرايش بازي‌هاي رايانه‌اي

سال تحصيل

1402

تاريخ دفاع

1404/07/20

استاد راهنما

بهروز مينايي بيدگلي

استاد مشاور

ندارم

دانشكده

مهندسي كامپيوتر

چكيده

با رشد سريع تكنيك‌هاي بازسازي سه‌بعدي مبتني بر يادگيري عميق، به‌ويژه ميدان‌هاي تابشي عصبي، امكان بازسازي ديد-وابسته‌ي واقع‌گرايانه از تصاوير دوبعدي فراهم آمده است؛ اما موانعي عملي، شامل نياز به پيش‌پردازش دقيق و وقت‌گير داده‌ها، مصرف بالاي منابع محاسباتي و دشواري تبديل بازنمايي‌هاي ضمني به مدل‌هاي صريح قابل‌استفاده در موتورهاي بازي، مانع كاربرد گسترده‌ي آن‌ها شده‌اند. در اين پژوهش، رويكردي يكپارچه براي كاهش اين موانع بررسي شده است كه سه بخش اصلي دارد: • خودكارسازي پيش‌پردازش تصاوير با استخراج فريم، پالايش فوتومتريك و تخمين موقعيت و وضعيت دوربين با مكانيزم‌هاي جايگزين در صورت شكست؛ • بهينه‌سازي آموزش ميدان‌هاي تابشي عصبي براي اجرا در بسترهاي محدود با استراتژي‌هاي نمونه‌برداري پوشش‌محور، آموزش مرحله‌اي و مديريت حافظه؛ • استخراج و پالايش هندسه‌ي صريح از نمايش ضمني به‌صورت چندمرحله‌اي و توليد مش‌هاي بهينه براي موتورهاي بازي، شامل كاهش چندضلعي هدايت‌شده و سطوح جزئيات. روش بررسي‌شده روي صحنه‌هاي مصنوعي معيار و داده‌هاي واقعي ثبت‌شده با دوربين‌هاي معمولي آزمايش و با روش‌هاي مرجع مقايسه شد. نتايج نشان مي‌دهد موفقيت ثبت موقعيت و وضعيت دوربين از حدود 88–90٪ در حالت دستي به بيش از 97٪ افزايش يافته، اوج مصرف حافظه‌ي GPU به‌طور ميانگين 30٪ كاهش يافته و سرعت همگرايي آموزش 20–25٪ بهبود يافته است. از منظر كيفيت، فاصله‌ي چمفر تا 35٪ و شاخص شباهت ادراكي حدود 33٪ بهبود داشته و تعداد پلي‌گان‌هاي نهايي تا 40٪ كاهش يافته است كه آمادگي مدل‌ها براي استفاده‌ي بلادرنگ در موتورهاي بازي Unity و Unreal را به‌طور چشمگيري افزايش مي‌دهد. نتايج نشان مي‌دهد رويكرد بررسي‌شده توانسته است تعادلي عملي ميان كيفيت بازسازي، هزينه‌ي محاسباتي و سازگاري با زنجيره‌ي توليد محتواي بازي برقرار كند.

تاريخ ورود اطلاعات

1404/08/25

عنوان به انگليسي

Feasibility of Employing Automated 2D-to-3D Image Conversion Techniques in Game Development

تاريخ بهره برداري

10/12/2026 12:00:00 AM

دانشجوي وارد كننده اطلاعات

زهرا مومني نژاد

Name: زهرا مومني نژاد
Author: زهرا مومني نژاد

چكيده به لاتين

With the rapid growth of deep learning–based 3D reconstruction techniques, particularly Neural Radiance Fields (NeRF), it has become possible to generate realistic, view-dependent reconstructions from 2D images. However, practical barriers such as the need for precise an‎d time-consuming preprocessing, the high computational cost of training, an‎d the difficulty of converting implicit representations into explicit models for game engines have limited the widespread adoption of these methods in industry. This thesis proposes an integrated an‎d practical pipeline to bridge this gap, comprising three main components: • Automating an‎d stan‎dardizing preprocessing through frame extraction, photometric refinement, an‎d camera pose estimation with fallback mechanisms. •Optimizing NeRF training for constrained environments using coverage-oriented sampling strategies, staged training, an‎d memory management. •Extracting an‎d refining explicit geometry in a multi-stage process, generating optimized meshes for game engines, including curvature-guided polygon reduction an‎d level-of-detail generation. The proposed method was eva‎luated on benchmark synthetic scenes an‎d real-world data captured with consumer cameras, an‎d compared against baseline approaches. Results show that automated preprocessing improves camera pose registration success from 88–90% (manual) to over 97%. Peak GPU memory usage decreased by ~30%, while training convergence improved by 20–25%. Geometric accuracy (Chamfer distance) improved by ~35% on average, an‎d perceptual similarity (LPIPS) by ~33%. The final polygon count was also reduced by ~40%, substantially enhancing readiness for real-time use in Unity an‎d Unreal Engine. These findings demonstrate that the proposed method achieves a practical balance between reconstruction quality, computational cost, an‎d compatibility with the game content production pipeline.

كليدواژه هاي فارسي

بازسازي سه‌بعدي , ميدان تابشي عصبي , استخراج هندسه صريح , خودكارسازي پيش‌پردازش , بهينه‌سازي منابع محاسباتي , آماده‌سازي براي موتورهاي بازي‌سازي , كاهش چندضلعي

كليدواژه هاي لاتين

3D reconstruction , neural radiance fields , explicit geometry extraction , automated preprocessing , computational resource optimization , game engine readiness , polygon reduction

Author

zahramomeninezhad

SuperVisor

Dr. Behrouz Minaei-Bidgoli

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=34037&Field=0&DTC=6