392155 Generative Models for Visual Computing (S) (SoSe 2025)

Inhalt, Kommentar

Generative models have revolutionized computer vision and computer graphics, enabling new applications such as generating images and 3D models from a simple text description. The foundation for this are the topics covered in this course:

  • variational inference and the evidence lower bound (recap)
  • the relation between score matching and denoising diffusion models
  • the use of iterative sampling and differential equations for inference
  • denoising implicit models and their inversion
  • unconditional and conditional models using classifier-based and classifier-free guidance
  • applications in image generation, video generation, editing, and 3D modeling

Central will be the mathematical modeling behind the most recent diffusion models.

The course is based on courses given at KAIST:
https://mhsung.github.io/kaist-cs492d-fall-2024/

List of relevant papers (a subset will be presented):
https://docs.google.com/spreadsheets/d/1j7amDru9bRQsQgp2pfm1a8GrZ6K0HWwCDORGq-sj7dQ/edit?gid=0#gid=0

The following slides provide additional details and context to the existing visual computing modules at Bielefeld University given by the Visual AI group:
https://docs.google.com/presentation/d/e/2PACX-1vRGyE0j_cU324qp-vOEE4hEBPn3HdwliZQqeg_vT0w7Yt9EUXmgFB6NamL_ynqeBMYRgD-cdvfvXobA/pub?start=false&loop=false&delayms=3000

Teilnahmevoraussetzungen, notwendige Vorkenntnisse

Required skills: Solid theoretical machine learning knowledge (introductory + advanced course), good python programming skills (>1 year), and fundamental mathematics (linear algebra).
Optional skills: PyTorch experience and knowledge in solving differential equations and computer vision (lectures or projects) helps but is not required.

These skills are typically acquired through lectures or by private projects, hackathons, and coding competitions.

Literaturangaben

SIGGRAPH 2024 Course: Diffusion Models for Visual Content Generation: https://geometry.cs.ucl.ac.uk/courses/diffusion4ContentCreation_sigg24/
CVPR 2023 Tutorial: Denoising Diffusion Models: A Generative Learning Big Bang: https://cvpr2023-tutorial-diffusion-models.github.io/

Externe Kommentarseite

https://docs.google.com/spreadsheets/d/1j7amDru9bRQsQgp2pfm1a8GrZ6K0HWwCDORGq-sj7dQ/edit?gid=0#gid=0

Lehrende

Termine ( Kalendersicht )

Rhythmus Tag Uhrzeit Format / Ort Zeitraum  
wöchentlich Mi 10-12 H9 07.04.-18.07.2025

Fachzuordnungen

Modul Veranstaltung Leistungen  
31-M-ASM2 Advanced Statistical Methods II Veranstaltungen aus dem Bereich Statistik und/oder in (einem) methodisch verbundenen Gebiet(en) (I.) benotete Prüfungsleistung
Studieninformation
Veranstaltungen aus dem Bereich Statistik und/oder in (einem) methodisch verbundenen Gebiet(en) (II.) benotete Prüfungsleistung
Studieninformation
39-M-Inf-AI-app Applied Artificial Intelligence Applied Artificial Intelligence: Seminar Studieninformation
- benotete Prüfungsleistung Studieninformation
39-M-Inf-AI-app-foc Applied Artificial Intelligence (focus) Applied Artificial Intelligence (focus): Seminar Studieninformation
- unbenotete Prüfungsleistung Studieninformation
39-M-Inf-INT-app Applied Interaction Technology Applied Interaction Technology: Seminar Studieninformation
- benotete Prüfungsleistung Studieninformation
39-M-Inf-INT-app-foc Applied Interaction Technology (focus) Applied Interaction Technology (focus): Seminar Studieninformation
- unbenotete Prüfungsleistung Studieninformation

Die verbindlichen Modulbeschreibungen enthalten weitere Informationen, auch zu den "Leistungen" und ihren Anforderungen. Sind mehrere "Leistungsformen" möglich, entscheiden die jeweiligen Lehrenden darüber.


The focus of this seminar is on reading, presenting, and discussing recent papers on generative models and diffusion models in particular.

Lectures during the first half of the term prepare students by giving a deep dive into diffusion models, in more detail than covered in existing courses. It requires basic knowledge of machine learning, statistics, and math, including topics such as gradient descent, log-likelihood, distributions, and differentiation. These are the basis for the advanced topics discussed, such as, score matching and inference by solving differential equations.

Students present one paper, lead the discussion of one paper, and engage in the discussion of the papers presented by others, including the writing style, strengths, limitations, and ethical implications.
A report and small assignments written in PyTorch support the practical understanding of probabilistic models, as typical for seminars+tutorial.

Moodle-Kurs
Moodle-Kurs

Diese Veranstaltung verfügt über eine Videokonferenz. Um die Videokonferenzdaten zu sehen, müssen Sie die Veranstaltung in Ihrem eKVV Stundenplan speichern. Bei einer Veranstaltung mit Teilnahmemanagement müssen Sie außerdem von den Lehrenden als teilnehmend eingetragen werden.

Anmeldung am eKVV

registrierte Anzahl: 26
Dies ist die Anzahl der Studierenden, die die Veranstaltung im Stundenplan gespeichert haben. In Klammern die Anzahl der über Gastaccounts angemeldeten Benutzer*innen.
Adresse:
SS2025_392155@ekvv.uni-bielefeld.de
Lehrende, ihre Sekretariate sowie für die Pflege der Veranstaltungsdaten zuständige Personen können über diese Adresse E-Mails an die Veranstaltungsteilnehmer*innen verschicken. WICHTIG: Sie müssen verschickte E-Mails jeweils freischalten. Warten Sie die Freischaltungs-E-Mail ab und folgen Sie den darin enthaltenen Hinweisen.
Falls die Belegnummer mehrfach im Semester verwendet wird können Sie die folgende alternative Verteileradresse nutzen, um die Teilnehmer*innen genau dieser Veranstaltung zu erreichen: VST_515738727@ekvv.uni-bielefeld.de
Reichweite:
26 Studierende direkt per E-Mail erreichbar
Hinweise:
Weitere Hinweise zu den E-Mailverteilern
Letzte Änderung Grunddaten/Lehrende:
Donnerstag, 10. April 2025 
Letzte Änderung Zeiten:
Mittwoch, 5. Februar 2025 
Letzte Änderung Räume:
Mittwoch, 5. Februar 2025 
Art(en) / SWS
Seminar (S) / 2
Sprache
Diese Veranstaltung wird komplett in englischer Sprache gehalten
Einrichtung
Technische Fakultät
Fragen oder Korrekturen?
Fragen oder Korrekturwünsche zu dieser Veranstaltung?
Planungshilfen
Terminüberschneidungen für diese Veranstaltung
Link auf diese Veranstaltung
Wenn Sie diese Veranstaltungsseite verlinken wollen, so können Sie einen der folgenden Links verwenden. Verwenden Sie nicht den Link, der Ihnen in Ihrem Webbrowser angezeigt wird!
Der folgende Link verwendet die Veranstaltungs-ID und ist immer eindeutig:
https://ekvv.uni-bielefeld.de/kvv_publ/publ/vd?id=515738727
Seite zum Handy schicken
Klicken Sie hier, um den QR Code zu zeigen
Scannen Sie den QR-Code: QR-Code vergrößern
ID
515738727