• شماره ركورد
    34652
  • پديد آورنده

    ريحانه نجف‌زاده اسكوئي

  • عنوان
    طراحي مدل انتشار با هدايت محتوايي براي افزايش تنوع تصاوير توليدي
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    مهندسي برق- مخابرات سيستم
  • سال تحصيل
    1401
  • تاريخ دفاع
    1404/09/12
  • استاد راهنما
    دكتر فرزان حدادي
  • استاد مشاور
    ندارم
  • دانشكده
    دانشكده مهندسي برق
  • چكيده
    چكيده امروزه با گسترش كاربردهاي توليد محتواي تصويري، نياز به مدل‌هاي مولدي كه خروجيِ آن‌ها همزمان باكيفيت و متنوع باشند بيش از پيش احساس مي‌شود. مدل‌هاي انتشار، با معكوس‌سازيِ فرآيندِ تدريجي توليد تصاوير باكيفيت، اما معمولاً با موازنه كيفيت و تنوع روبه‌رو هستند: تقويت شرطي‌سازي با كاهش نويز ورودي، كيفيت را بهبود مي‌دهد ولي تنوع را محدود مي‌كند و عكس اين قضيه نيز صادق است. در اين پژوهش، راهبردي با عنوان «راهنماي چندمرجعي» معرفي مي‌شود كه در آن دو نهفته راهنما از نمونه‌هاي متمايز انتخاب و با نهفته جاري در يك مبدل ادغام مي‌گردند. براي كنترل دقيق اين موازنه، نويز راهنما به‌صورت پويا و وابسته به شباهت كسينوسي و گام انتشار تنظيم مي‌شود و نمونه‌گيري به‌صورت سرد در فضاي نهفته انجام مي‌گيرد. نتايج تجربي نشان مي‌دهد كه روش پيشنهادي، تنوع خروجي را افزايش مي‌دهد بدون آنكه افت محسوسي در كيفيت ادراكي ايجاد كند. با توجه به محدوديت منابع محاسباتي در اين مطالعه، انتظار مي‌رود در مقياس‌هاي بزرگ‌تر بهبودهاي بيشتري حاصل شود. واژگان كليدي: مدل‌هاي انتشار، فضاي نهفته، تنوع خروجي، نويز پويا، مبدل
  • تاريخ ورود اطلاعات
    1405/01/23
  • عنوان به انگليسي
    Design of a Content-Guided Diffusion Model for Enhancing Diversity in Image Generation
  • تاريخ بهره برداري
    3/21/2026 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    ريحانه نجف زاده اسكوئي

  • چكيده به لاتين
    Abstract With the growing use of image content generation, there is an increasing need fo‎r generative models whose outputs are simultaneously high-quality an‎d diverse. Diffusion models, which reverse a gradual noising process, are capable of producing high-quality images, but they typically struggle to balance quality an‎d diversity. Strengthening conditioning o‎r reducing noise in the input improves quality but limits diversity, an‎d the opposite is also true. This study introduces a method called “multi-reference guidance,” in which two different reference examples are selec‎ted an‎d used fo‎r guiding the diffusion process. To control this balance precisely, the guidance is applied dynamically an‎d dependently, similar to classifier-free guidance, an‎d the publication step is adjusted. Sampling is perfo‎rmed in a cold-diffusion space. Experimental results show that the proposed method increases output diversity without noticeable quality loss. Considering limited computational resources in this study, further improvement is expected at larger scales.
  • كليدواژه هاي فارسي
    مدل‌هاي انتشار , مبدل , هوش مصنوعي , نويز پويا , هدايت محتوايي , تنوع خروجي , راهنماي چند مرجعي
  • كليدواژه هاي لاتين
    Diffusion models , Transformer , Artificial intelligence , Dynamic noise , Content-guided , Diversity , Multi‑reference guidance
  • Author
    Reyhaneh Najafzadeh Oskuee
  • SuperVisor
    Dr.Farzan Haddadi