Wir nutzen Google Analytics zur Analyse der Website-Nutzung. Dabei werden anonymisierte Nutzungsdaten erhoben. Weitere Informationen in unserer Datenschutzerklärung.

KI BIBEL
← Zur Hauptseite KI-Lexikon
KI BIBEL › KI-Lexikon › Vision Transformer (ViT)
Architektur

Vision Transformer (ViT)

Der Vision Transformer wendet die reine Transformer-Architektur (ursprünglich für Text) auf Bilder an. Man zerlegt das Bild in kleine Quadrate ('Patches'), behandelt sie wie Wörter in einem Satz und füttert sie in einen Transformer. ViTs haben CNNs in vielen Bereichen als State-of-the-Art abgelöst.

Vision

Verwandte Begriffe

Hidden Layer ANN (Artificial Neural Network) Variational Autoencoder (VAE)
Alle Begriffe anzeigen
KI BIBEL

Das umfassende KI-Lexikon – kostenlos.

KI BIBEL Buch Impressum & Datenschutz KI-Kompetenzzentrum Cookie-Einstellungen

© 2026 Markus M. Kirchmair. Alle Rechte vorbehalten.