Daten

Character

Ein Character (Zeichen) ist die kleinste Einheit in einem Text (Buchstabe, Zahl, Symbol). Frühe Sprachmodelle (RNNs) arbeiteten oft auf Character-Ebene (buchstabenweise). Moderne LLMs nutzen stattdessen 'Tokens', die oft Wortteile oder ganze Wörter umfassen, da dies effizienter ist. Dennoch ist das Verständnis einzelner Zeichen wichtig, z.B. bei der Generierung von Code oder Reimen.

Text