شماره ركورد
34037
پديد آورنده
زهرا مومني نژاد
عنوان
امكانسنجي استفاده از روشهاي تبديل خودكار تصاوير دوبعدي به سهبعدي در صنعت بازيسازي
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
رشته مهندسي كامپيوتر گرايش بازيهاي رايانهاي
سال تحصيل
1402
تاريخ دفاع
1404/07/20
استاد راهنما
بهروز مينايي بيدگلي
استاد مشاور
ندارم
دانشكده
مهندسي كامپيوتر
چكيده
با رشد سريع تكنيكهاي بازسازي سهبعدي مبتني بر يادگيري عميق، بهويژه ميدانهاي تابشي عصبي، امكان بازسازي ديد-وابستهي واقعگرايانه از تصاوير دوبعدي فراهم آمده است؛ اما موانعي عملي، شامل نياز به پيشپردازش دقيق و وقتگير دادهها، مصرف بالاي منابع محاسباتي و دشواري تبديل بازنماييهاي ضمني به مدلهاي صريح قابلاستفاده در موتورهاي بازي، مانع كاربرد گستردهي آنها شدهاند.
در اين پژوهش، رويكردي يكپارچه براي كاهش اين موانع بررسي شده است كه سه بخش اصلي دارد:
• خودكارسازي پيشپردازش تصاوير با استخراج فريم، پالايش فوتومتريك و تخمين موقعيت و وضعيت دوربين با مكانيزمهاي جايگزين در صورت شكست؛
• بهينهسازي آموزش ميدانهاي تابشي عصبي براي اجرا در بسترهاي محدود با استراتژيهاي نمونهبرداري پوششمحور، آموزش مرحلهاي و مديريت حافظه؛
• استخراج و پالايش هندسهي صريح از نمايش ضمني بهصورت چندمرحلهاي و توليد مشهاي بهينه براي موتورهاي بازي، شامل كاهش چندضلعي هدايتشده و سطوح جزئيات.
روش بررسيشده روي صحنههاي مصنوعي معيار و دادههاي واقعي ثبتشده با دوربينهاي معمولي آزمايش و با روشهاي مرجع مقايسه شد. نتايج نشان ميدهد موفقيت ثبت موقعيت و وضعيت دوربين از حدود 88–90٪ در حالت دستي به بيش از 97٪ افزايش يافته، اوج مصرف حافظهي GPU بهطور ميانگين 30٪ كاهش يافته و سرعت همگرايي آموزش 20–25٪ بهبود يافته است. از منظر كيفيت، فاصلهي چمفر تا 35٪ و شاخص شباهت ادراكي حدود 33٪ بهبود داشته و تعداد پليگانهاي نهايي تا 40٪ كاهش يافته است كه آمادگي مدلها براي استفادهي بلادرنگ در موتورهاي بازي Unity و Unreal را بهطور چشمگيري افزايش ميدهد.
نتايج نشان ميدهد رويكرد بررسيشده توانسته است تعادلي عملي ميان كيفيت بازسازي، هزينهي محاسباتي و سازگاري با زنجيرهي توليد محتواي بازي برقرار كند.
تاريخ ورود اطلاعات
1404/08/25
عنوان به انگليسي
Feasibility of Employing Automated 2D-to-3D Image Conversion Techniques in Game Development
تاريخ بهره برداري
10/12/2026 12:00:00 AM
دانشجوي وارد كننده اطلاعات
زهرا مومني نژاد
چكيده به لاتين
With the rapid growth of deep learning–based 3D reconstruction techniques, particularly Neural Radiance Fields (NeRF), it has become possible to generate realistic, view-dependent reconstructions from 2D images. However, practical barriers such as the need for precise and time-consuming preprocessing, the high computational cost of training, and the difficulty of converting implicit representations into explicit models for game engines have limited the widespread adoption of these methods in industry. This thesis proposes an integrated and practical pipeline to bridge this gap, comprising three main components:
• Automating and standardizing preprocessing through frame extraction, photometric refinement, and camera pose estimation with fallback mechanisms.
•Optimizing NeRF training for constrained environments using coverage-oriented sampling strategies, staged training, and memory management.
•Extracting and refining explicit geometry in a multi-stage process, generating optimized meshes for game engines, including curvature-guided polygon reduction and level-of-detail generation.
The proposed method was evaluated on benchmark synthetic scenes and real-world data captured with consumer cameras, and compared against baseline approaches. Results show that automated preprocessing improves camera pose registration success from 88–90% (manual) to over 97%. Peak GPU memory usage decreased by ~30%, while training convergence improved by 20–25%. Geometric accuracy (Chamfer distance) improved by ~35% on average, and perceptual similarity (LPIPS) by ~33%. The final polygon count was also reduced by ~40%, substantially enhancing readiness for real-time use in Unity and Unreal Engine.
These findings demonstrate that the proposed method achieves a practical balance between reconstruction quality, computational cost, and compatibility with the game content production pipeline.
كليدواژه هاي فارسي
بازسازي سهبعدي , ميدان تابشي عصبي , استخراج هندسه صريح , خودكارسازي پيشپردازش , بهينهسازي منابع محاسباتي , آمادهسازي براي موتورهاي بازيسازي , كاهش چندضلعي
كليدواژه هاي لاتين
3D reconstruction , neural radiance fields , explicit geometry extraction , automated preprocessing , computational resource optimization , game engine readiness , polygon reduction
Author
zahramomeninezhad
SuperVisor
Dr. Behrouz Minaei-Bidgoli