شماره ركورد
34652
پديد آورنده
ريحانه نجفزاده اسكوئي
عنوان
طراحي مدل انتشار با هدايت محتوايي براي افزايش تنوع تصاوير توليدي
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي برق- مخابرات سيستم
سال تحصيل
1401
تاريخ دفاع
1404/09/12
استاد راهنما
دكتر فرزان حدادي
استاد مشاور
ندارم
دانشكده
دانشكده مهندسي برق
چكيده
چكيده
امروزه با گسترش كاربردهاي توليد محتواي تصويري، نياز به مدلهاي مولدي كه خروجيِ آنها همزمان باكيفيت و متنوع باشند بيش از پيش احساس ميشود. مدلهاي انتشار، با معكوسسازيِ فرآيندِ تدريجي توليد تصاوير باكيفيت، اما معمولاً با موازنه كيفيت و تنوع روبهرو هستند: تقويت شرطيسازي با كاهش نويز ورودي، كيفيت را بهبود ميدهد ولي تنوع را محدود ميكند و عكس اين قضيه نيز صادق است.
در اين پژوهش، راهبردي با عنوان «راهنماي چندمرجعي» معرفي ميشود كه در آن دو نهفته راهنما از نمونههاي متمايز انتخاب و با نهفته جاري در يك مبدل ادغام ميگردند. براي كنترل دقيق اين موازنه، نويز راهنما بهصورت پويا و وابسته به شباهت كسينوسي و گام انتشار تنظيم ميشود و نمونهگيري بهصورت سرد در فضاي نهفته انجام ميگيرد.
نتايج تجربي نشان ميدهد كه روش پيشنهادي، تنوع خروجي را افزايش ميدهد بدون آنكه افت محسوسي در كيفيت ادراكي ايجاد كند. با توجه به محدوديت منابع محاسباتي در اين مطالعه، انتظار ميرود در مقياسهاي بزرگتر بهبودهاي بيشتري حاصل شود.
واژگان كليدي: مدلهاي انتشار، فضاي نهفته، تنوع خروجي، نويز پويا، مبدل
تاريخ ورود اطلاعات
1405/01/23
عنوان به انگليسي
Design of a Content-Guided Diffusion Model for Enhancing Diversity in Image Generation
تاريخ بهره برداري
3/21/2026 12:00:00 AM
دانشجوي وارد كننده اطلاعات
ريحانه نجف زاده اسكوئي
چكيده به لاتين
Abstract
With the growing use of image content generation, there is an increasing need for generative models whose outputs are simultaneously high-quality and diverse. Diffusion models, which reverse a gradual noising process, are capable of producing high-quality images, but they typically struggle to balance quality and diversity. Strengthening conditioning or reducing noise in the input improves quality but limits diversity, and the opposite is also true.
This study introduces a method called “multi-reference guidance,” in which two different reference examples are selected and used for guiding the diffusion process. To control this balance precisely, the guidance is applied dynamically and dependently, similar to classifier-free guidance, and the publication step is adjusted. Sampling is performed in a cold-diffusion space.
Experimental results show that the proposed method increases output diversity without noticeable quality loss. Considering limited computational resources in this study, further improvement is expected at larger scales.
كليدواژه هاي فارسي
مدلهاي انتشار , مبدل , هوش مصنوعي , نويز پويا , هدايت محتوايي , تنوع خروجي , راهنماي چند مرجعي
كليدواژه هاي لاتين
Diffusion models , Transformer , Artificial intelligence , Dynamic noise , Content-guided , Diversity , Multi‑reference guidance
Author
Reyhaneh Najafzadeh Oskuee
SuperVisor
Dr.Farzan Haddadi