BCP 47-Sprachkode

Ein BCP 47-Sprachkode ist eine Zeichenkette, die eine menschliche Sprache genau bestimmt, in Bezug auf die grundlegende Sprache, aber auch optional das Schriftsystem und den Dialekt. Zum Beispiel spezifiziert en Englisch, während en-GB und en-US genauer Britisches Englisch beziehungsweise Amerikanisches Englisch bezeichnen.

BCP 47-Sprachkodes werden überall auf der Web-Plattform verwendet, wo eine Funktion darauf ausgelegt ist, je nach angegebener Sprache unterschiedliche Ergebnisse auszugeben, um die Internationalisierung zu unterstützen.

Beispiele beinhalten:

Das HTML-Attribut lang
Das HTML <track> Element
Das Temporal Objekt
Die CanvasRenderingContext2D.lang Eigenschaft
Die Übersetzer- und Spracherkennungs-APIs

BCP 47-Syntax

Die vollständige BCP 47-Syntax ist in RFC 5646 spezifiziert. Sie ist in der Lage, extrem spezifische Sprachdialekte zu identifizieren, jedoch ist die meiste Anwendung wesentlich einfacher.

Ein Sprachkode besteht aus durch Bindestriche getrennten Subtags, wobei jeder Subtag eine bestimmte Eigenschaft der Sprache angibt. Die drei häufigsten Subtags sind:

Sprach-Subtag: Ein 2-oder-3-stelliger Code, der die grundlegende Sprache definiert, typischerweise in Kleinbuchstaben geschrieben. Zum Beispiel ist der Sprachcode für Englisch en, und der Code für Badeshi ist bdz.
Schrift-Subtag Optional: Dieser Subtag definiert das für die Sprache verwendete Schriftsystem und ist immer 4 Zeichen lang, wobei der erste Buchstabe großgeschrieben ist. Zum Beispiel ist Französisch-in-Braille fr-Brai und Japanisch, geschrieben mit dem Katakana-Alphabet, ja-Kana.

Hinweis: Wenn die Sprache auf eine sehr typische Weise geschrieben wird, wie Englisch im lateinischen Alphabet, ist es nicht nötig, diesen Subtag zu verwenden.
Regions-Subtag Optional: Dieser Subtag definiert einen Dialekt der Basissprache aus einem bestimmten Ort und besteht entweder aus zwei Großbuchstaben, die einem Ländercode entsprechen, oder aus drei Zahlen, die einem nicht Land-gebundenen Gebiet entsprechen. Zum Beispiel steht es-ES für Spanisch, wie es in Spanien gesprochen wird, und es-013 für Spanisch, wie es in Mittelamerika gesprochen wird. "Internationales Spanisch" wäre einfach es.

Der Schrift-Subtag geht dem Regions-Subtag voraus, wenn beide vorhanden sind — ru-Cyrl-BY ist Russisch, geschrieben im kyrillischen Alphabet, wie es in Belarus gesprochen wird.

Siehe auch

Liste der häufigen primären Sprach-Subtags
RFC 5646: Tags for Identifying Languages: wo BCP 47 Sprachkodes spezifiziert sind.
Choosing a Language Tag: W3C-Leitfaden zum Auswählen des richtigen Sprachkodes.
BCP 47 language subtag lookup: Nachschlagen von Subtag-Codes für eine Sprache.

Help improve MDN

Erfahren Sie, wie Sie beitragen können Diese Seite wurde automatisch aus dem Englischen übersetzt.

Übersetzung auf GitHub anzeigen • Fehler mit dieser Übersetzung melden