Character set

Ein Character set (Zeichensatz) ist ein Kodierungssystem, das Computern ermöglicht, Zeichen wie Buchstaben, Zahlen, Satzzeichen und Leerzeichen zu erkennen.

Früher entwickelten Länder ihre eigenen Zeichensätze aufgrund der unterschiedlichen verwendeten Sprachen, wie Kanji JIS-Codes (z. B. Shift-JIS, EUC-JP usw.) für Japanisch, Big5 für traditionelles Chinesisch und KOI8-R für Russisch. Allerdings wurde Unicode allmählich der am meisten akzeptierte Zeichensatz wegen seiner universellen Sprachunterstützung.

Wenn ein Zeichensatz falsch verwendet wird (zum Beispiel Unicode für einen Artikel, der in Big5 kodiert ist), sehen Sie möglicherweise nur kaputte Zeichen, die als Mojibake bezeichnet werden.

Siehe auch