Charakterreferenz
Eine HTML Charakterreferenz ist eine Escape-Sequenz von Zeichen, die verwendet wird, um ein anderes Zeichen auf der gerenderten Webseite darzustellen.
Charakterreferenzen werden als Ersatz für Zeichen verwendet, die in HTML reserviert sind, wie die Kleiner-als (<
) und Größer-als (>
) Symbole, die vom HTML-Parser zur Identifizierung von Element-Tags genutzt werden, oder "
oder '
innerhalb von Attributen, die von diesen Zeichen eingeschlossen werden können.
Sie können auch für unsichtbare Zeichen verwendet werden, die sonst unmöglich zu tippen wären, einschließlich geschützter Leerzeichen, Steuerzeichen wie Links-nach-Rechts- und Rechts-nach-Links-Markierungen und für Zeichen, die auf einer Standardtastatur schwer zu tippen sind.
Es gibt drei Arten von Charakterreferenzen:
- Benannte Charakterreferenzen
-
Diese verwenden eine Namenszeichenfolge zwischen einem kaufmännischen Und-Zeichen (
&
) und einem Semikolon (;
) zur Referenz auf das entsprechende Zeichen. Zum Beispiel wird<
für das Kleiner-als (<
) Symbol benutzt und©
für das Copyright-Symbol (©
). Die Zeichenfolge, die für die Referenz verwendet wird, ist oft eine Camel-Cased Initialisierung oder Verkürzung des Zeichen-Namens. - Dezimalzahlen-Charakterreferenzen
-
Diese Referenzen beginnen mit
&#
, gefolgt von einer oder mehreren ASCII-Ziffern, die die Basis-10-Ganzzahl darstellen, die dem Unicode-Codepunkt des Zeichens entspricht, und enden mit;
. Zum Beispiel ist die dezimale Charakterreferenz für<
<
, weil der Unicode-Codepunkt für das SymbolU+0003C
ist und3C
hexadezimal ist 60 dezimal. - Hexadezimale Zahlen-Charakterreferenzen
-
Diese Referenzen beginnen mit
&#x
oder&#X
, gefolgt von einer oder mehreren ASCII-Hexadezimalziffern, die die hexadezimale Ganzzahl darstellen, die dem Unicode-Codepunkt des Zeichens entspricht, und enden mit;
. Zum Beispiel ist die hexadezimale Charakterreferenz für<
<
oder<
, weil der Unicode-Codepunkt für das SymbolU+0003C
ist.
Ein sehr kleiner Ausschnitt nützlicher benannter Charakterreferenzen zusammen mit ihren Unicode-Codepunkten ist unten aufgelistet.
Zeichen | Benannte Referenz | Unicode-Codepunkt |
---|---|---|
& | & |
U+00026 |
< | < |
U+0003C |
> | > |
U+0003E |
" | " |
U+00022 |
' | ' |
U+00027 |
|
U+000A0 | |
– | – |
U+02013 |
— | — |
U+02014 |
© | © |
U+000A9 |
® | ® |
U+000AE |
™ | ™ |
U+02122 |
≈ | ≈ |
U+02248 |
≠ | ≠ |
U+02260 |
£ | £ |
U+000A3 |
€ | € |
U+020AC |
° | ° |
U+000B0 |
Die vollständige Liste der HTML-benannten Charakterreferenzen kann in der HTML-Spezifikation hier gefunden werden.
Siehe auch
- Verwandte Glossarbegriffe: