BCP 47-Sprachkode
Ein BCP 47-Sprachkode ist eine Zeichenkette, die eine menschliche Sprache genau bestimmt, in Bezug auf die grundlegende Sprache, aber auch optional das Schriftsystem und den Dialekt. Zum Beispiel spezifiziert en
Englisch, während en-GB
und en-US
genauer Britisches Englisch beziehungsweise Amerikanisches Englisch bezeichnen.
BCP 47-Sprachkodes werden überall auf der Web-Plattform verwendet, wo eine Funktion darauf ausgelegt ist, je nach angegebener Sprache unterschiedliche Ergebnisse auszugeben, um die Internationalisierung zu unterstützen.
Beispiele beinhalten:
- Das HTML-Attribut
lang
- Das HTML
<track>
Element - Das
Temporal
Objekt - Die
CanvasRenderingContext2D.lang
Eigenschaft - Die Übersetzer- und Spracherkennungs-APIs
BCP 47-Syntax
Die vollständige BCP 47-Syntax ist in RFC 5646 spezifiziert. Sie ist in der Lage, extrem spezifische Sprachdialekte zu identifizieren, jedoch ist die meiste Anwendung wesentlich einfacher.
Ein Sprachkode besteht aus durch Bindestriche getrennten Subtags, wobei jeder Subtag eine bestimmte Eigenschaft der Sprache angibt. Die drei häufigsten Subtags sind:
- Sprach-Subtag
-
Ein 2-oder-3-stelliger Code, der die grundlegende Sprache definiert, typischerweise in Kleinbuchstaben geschrieben. Zum Beispiel ist der Sprachcode für Englisch
en
, und der Code für Badeshi istbdz
. - Schrift-Subtag Optional
-
Dieser Subtag definiert das für die Sprache verwendete Schriftsystem und ist immer 4 Zeichen lang, wobei der erste Buchstabe großgeschrieben ist. Zum Beispiel ist Französisch-in-Braille
fr-Brai
und Japanisch, geschrieben mit dem Katakana-Alphabet,ja-Kana
.Hinweis: Wenn die Sprache auf eine sehr typische Weise geschrieben wird, wie Englisch im lateinischen Alphabet, ist es nicht nötig, diesen Subtag zu verwenden.
- Regions-Subtag Optional
-
Dieser Subtag definiert einen Dialekt der Basissprache aus einem bestimmten Ort und besteht entweder aus zwei Großbuchstaben, die einem Ländercode entsprechen, oder aus drei Zahlen, die einem nicht Land-gebundenen Gebiet entsprechen. Zum Beispiel steht
es-ES
für Spanisch, wie es in Spanien gesprochen wird, undes-013
für Spanisch, wie es in Mittelamerika gesprochen wird. "Internationales Spanisch" wäre einfaches
.
Der Schrift-Subtag geht dem Regions-Subtag voraus, wenn beide vorhanden sind — ru-Cyrl-BY
ist Russisch, geschrieben im kyrillischen Alphabet, wie es in Belarus gesprochen wird.
Siehe auch
- Liste der häufigen primären Sprach-Subtags
- RFC 5646: Tags for Identifying Languages: wo BCP 47 Sprachkodes spezifiziert sind.
- Choosing a Language Tag: W3C-Leitfaden zum Auswählen des richtigen Sprachkodes.
- BCP 47 language subtag lookup: Nachschlagen von Subtag-Codes für eine Sprache.