Character reference (文字参照)
HTML の文字参照 (character reference) とは、レンダリングされたウェブページ上で別の文字を表すために使用されている、文字のエスケープシーケンスのことです。
文字参照は、HTML で予約されている文字、例えば、HTML パーサーが要素タグを識別するために使用する小なり (<) または大なり (>) 記号、あるいは属性内でこれらの文字で囲まれることがある " または ' などの代わりとして使用されます。
同時に、非表示文字や、標準のキーボードでは入力が困難な文字を表すためにも使用できます。これには、非改行空白や、左書き、右書きのマークといった制御文字などが含まれます。
文字参照には、次の 3 種類があります。
- 名前付き文字参照
-
これらは、アンパサンド (
&) とセミコロン (;) の間に名前文字列を置くことで、対応する文字を参照します。 例えば、<は小なり記号 (<) に使用され、©は著作権記号 (©) に使用されます。 参照に使用される文字列は、多くの場合、キャメルケースの先頭文字または文字名の短縮形です。 - 10 進文字参照
-
これらの参照は
&#で始まり、その後に 1 桁以上の ASCII 数字が続き、;で終わります。これは、その文字の Unicode コードポイントに対応する 10 進整数を表します。 例えば、<を 10 進数で参照すると<となります。これは、この記号の Unicode コードポイントがU+0003Cであり、16 進数の3Cが 10 進数で 60 であるためです。 - 16 進文字参照
-
これらの参照は
&#xまたは&#Xで始まり、その後に 1 桁以上の ASCII 16 進数が続き、最後に;で終わります。これは、その文字の Unicode コードポイントに対応する 16 進整数を表します。 例えば、<の 16 進文字参照は<または<となります。これは、この記号の Unicode コードポイントがU+0003Cであるためです。
以下の一覧に、有益な名前付き文字参照のごく一部とその Unicode コードポイントを記載します。
| 文字 | 名前付き参照 | Unicode コードポイント |
|---|---|---|
| & | & |
U+00026 |
| < | < |
U+0003C |
| > | > |
U+0003E |
| " | " |
U+00022 |
| ' | ' |
U+00027 |
|
U+000A0 | |
| – | – |
U+02013 |
| — | — |
U+02014 |
| © | © |
U+000A9 |
| ® | ® |
U+000AE |
| ™ | ™ |
U+02122 |
| ≈ | ≈ |
U+02248 |
| ≠ | ≠ |
U+02260 |
| £ | £ |
U+000A3 |
| € | € |
U+020AC |
| ° | ° |
U+000B0 |
HTML の名前付き文字参照の完全な一覧は、こちらの HTML 仕様書で確認できます。