この記事は翻訳作業中です。

この記事ではHTMLの必須事項をカバーし,始めての方のために,要素・属性・その他すでに聞いたことのあるかもしれないすべての重要な用語・それらがHTMLでどう使用されるべきか,を明らかにします。また,HTML要素や典型的なHTMLページがそれぞれどのように構造化されているかを示し,HTMLの重要なその他の機能を説明します。途中,興味を持ってもらえるように随時いくつかのコード例を示すつもりです。

前提条件: 基礎的なコンピューター使用スキル,基本ソフトウェアがインストールされていることファイル取扱いの基礎理解。
目的: HTML言語に精通するための基礎の獲得といくつかのHTML要素を書く練習

HTMLとは何ですか?

HTML(ハイパーテキスト・マークアップ・ランゲージ/Hypertext Markup Language)はプログラミング言語ではありません。HTML言語は,あなたが訪れたウェブサイトがブラウザ上でどのように構成されるべきかをブラウザに対して伝えるために使用されるマークアップ言語の一つです。HTML言語はWeb開発者が何を望むか次第で複雑なものにも簡単なものにも成り得ます。HTMLは,コンテンツの様々な部分を表示したり特定の方法で動作させるべくそれを囲み・改行・マークアップするために使用する一連の要素によって構成されます。“囲みタグ”は,小さなコンテンツを「ウェブサイト上の他のページへリンクするためのハイパーリンク」や「イタリック体の単語」などにすることができます。例として,次のコンテンツを見てください:

My cat is very grumpy

この行を独立した行としたい場合,それを段落タグ (<p>)要素で囲んで段落指定することで実現できます:

<p>My cat is very grumpy</p>

HTML要素の解剖

この“私たちの”段落タグについてもう少し詳しく見ていきましょう:

この私たちの要素の主要部分は次のとおりです:

  1. 開始タグ: これは要素名(このケースにおいてはp要素の"p"),そして開きと閉じの角括弧で構成されています。これは要素あるいはその効果が開始する場所を宣言しますーこのケースでは段落が始まる場所です。
  2. 終了タグ: これは要素名の前に一つのスラッシュが含まれることを除けば開始タグと同じです。これは要素の終了を宣言しますーこのケースでは段落が終わる場所です。終了タグの記述を失念すると奇妙な結果につながることがありますが,それは初学者にありがちな一般的なミスです。
  3. 内容: これは要素の中身で、上記の例では文字そのものです。
  4. 要素: 開始タグ+内容+終了タグは要素になります。

実習: 最初のHTML要素を作ってみる

以下のInput欄にある行を<em></em>で包摂することにより編集してください(要素を開始するために行の先頭に<em>を,要素を終了するために行の末尾に</em>をそれぞれ置きます)ーこれはその行をイタリック体による強調表示にするはずです!この変化はOutput欄でリアルタイムで確認できているはずです。

もし入力ミスをしても,Resetボタンを押すことでいつでもリセットできます。立ち往生してしまってもShow solutionボタンを押せばいつでもカンニングできます。

要素のネスト

要素は他の要素の中にも置くことができますーこれは“ネスト”(入れ子)と呼ばれています。たとえば“My cat is very grumpy.”と記述したい場合,“very”という語を<strong> 要素で包摂することができ,それはその語がより強く強調表示されることを意味します:

<p>My cat is <strong>very</strong> grumpy.</p>

ただし,要素が正しくネストされていることを確認する必要はあります:上の例では,開始タグは最初にp要素,その次にstrong要素が来ますから,終了タグは最初にstrong要素を,一番最後にp要素を置くことになります。次は間違った例です:

<p>My cat is <strong>very grumpy.</p></strong>

タグのセットが互いに内側か外側なのかがはっきり分かるように,要素の開始と終了は正しく配置する必要があります。もし上の例のように互いに“掛け違って”しまっている場合,ブラウザはそのマークアップが本来意図していただろうことを出来るだけ読み取ろうとはしますが,予期しない結果となることは当然に想定されます。ですからこうした“掛け違い”はやめましょう!

ブロック要素とインライン要素

HTMLの要素にはあなたが知っていなければならない二つの重要なカテゴリがあり,それがブロックレベル要素とインライン要素です。

  • ブロックレベル要素はWebページ上で視認できるブロックを形成しますーそれらはそれより前にあるいかなるコンテンツに対しても新たな行におけるコンテンツとして表示され,そのブロックの後に来るいかなるコンテンツもまた新たな行で表示されることになります。ブロックレベル要素はそのWebページの構造,たとえば段落・リスト・ナビゲーションメニュー・フッターなどを表すことに使用される傾向があります。ブロックレベル要素はインライン要素の中にネストされることはできませんが,他のブロックレベル要素にネストされることが出来る場合があります。
  • インライン要素はブロックレベル要素の中に包含され,なおかつ,段落やコンテンツのグループの全体を包摂するのではなく,それぞれにドキュメントの内容の小さな部分だけを囲む要素です。インライン要素は自らをドキュメント内に表示させるために新たな行を生じさせることはありません;それらは通常,例えば,<a> 要素(ハイパーリンク)又は<em><strong>といった強調要素のように,テキスト段落の中で表示されます。

次の例で考えてみます:

<em>first</em><em>second</em><em>third</em>

<p>fourth</p><p>fifth</p><p>sixth</p>

<em> 要素はインライン要素なので以下で確認できるように,最初の3つの要素は同じ行で他の要素と互いにスペースを空けずにたたずんでいます。一方で,<p>要素はブロックレベル要素なので,各要素はその上下にスペースを伴った新たな行で表示されます(この間隔はブラウザが段落に対して適用するデフォルトのCSSのスタイルによるものです)。

注意: HTML5においては要素カテゴリが再定義されています:要素のコンテンツ・カテゴリを見てください。これらの定義は従来のものに比べてより正確で,なおかつ曖昧さが少ないものとなっていますが,一方では,それらは“ブロックレベル要素”と“インライン要素”の対比よりも遥かに理解することが難しくなっています。このため,私たちはここのトピックを通じて従来の分類も堅持するつもりです。

注意: ブロックレベル要素とインライン要素のリストを含む有用なリファレンスページがあります-ブロックレベル要素インライン要素をご覧ください。

空要素

全ての要素が上述の開始タグ・コンテンツ・終了タグのパターンに従っているわけではありません。いくつかの要素は一つのタグのみで構成され,それは通常,ドキュメント内でそれが含まれている場所に何かを挿入したり埋め込むために使用されます。例えば,以下の <img> 要素はWebページ上のそれが含まれた場所に一つの画像ファイルを埋め込みます:

<img src="https://raw.githubusercontent.com/mdn/beginner-html-site/gh-pages/images/firefox-icon.png">

これはページに次の画像を出力するはずです:

注意: 空要素(Empty elements)はVoid要素(Void elements)と呼ばれていることがあります。

属性

要素は次のように属性を持つこともできます:

&lt;p class="editor-note">My cat is very grumpy&lt;/p>

属性は実際のコンテンツの中で表示させたくない「要素に関する追加情報」を保有します。上のケースでは,class属性はその要素に後でスタイル情報などが適用される対象であることを示すものとして使用されることの出来る固有の名前を持つことを許容します。

各属性は次の要件を満たす必要があります:

  1. 属性名と要素名の間に1つの半角スペース(その要素内にすでに一つ以上の属性が設定されている場合は,併せて各属性名の間)
  2. 直後に等号(=)を置いた属性名
  3. 開始と終了のクォーテーションマークによって包摂された属性値

実習: 要素に属性を追加する

Another example of an element is <a> — this stands for anchor and will make the piece of text it wraps around into a hyperlink. This can take a number of attributes, but several are as follows:

  • href: This attribute specifies as its value the web address that you want the link to point to; where the browser navigates to when the link is clicked. For example, href="https://www.mozilla.org/".
  • title: The title attribute specifies extra information about the link, such as what the page is that you are linking to. For example, title="The Mozilla homepage". This will appear as a tooltip when hovered over.
  • target: The target attribute specifies browsing context which will be used to display the link. For example, target="_blank" will display the link in a new tab. If you want to display the link in the current tab just omit this attribute.

Edit the line below in the Input area to turn it into a link to your favourite website. First, add the <a> element. Second, add the href attribute and the title attribute. Lastly, specify target attribute to open the link in the new tab. You'll be able to see your changes update live in the Output area. You should see a link that when hovered over displays the title attribute's content, and when clicked navigates to the web address in the href element. Remember that you need to include a space between the element name, and each attribute.

If you make a mistake, you can always reset it using the Reset button. If you get really stuck, press the Show solution button to see the answer.

Boolean attributes

You'll sometimes see attributes written without values — this is perfectly allowed. These are called boolean attributes, and they can only have one value, which is generally the same as the attribute name. As an example, take the disabled attribute, which you can assign to form input elements if you want them to be disabled (greyed out) so the user can't enter any data in them.

<input type="text" disabled="disabled">

As shorthand, it is perfectly allowable to write this as follows (we've also included a non-disabled form input element for reference, to give you more of an idea what is going on):

<input type="text" disabled>

<input type="text">

Both will give you an output as follows:

Omitting quotes around attribute values

When you look around the World Wide Web, you'll come across all kind of strange markup styles, including attribute values without quotes. This is allowable in certain circumstances, but will break your markup in others. For example, if we revisit our link example from earlier, we could write a basic version with only the href attribute, like this:

<a href=https://www.mozilla.org/>favourite website</a>

However, as soon as we add the title attribute in this style, things will go wrong:

<a href=https://www.mozilla.org/ title=The Mozilla homepage>favourite website</a>

At this point the browser will misinterpret your markup, thinking that the title attribute is actually three attributes — a title attribute with the value "The", and two boolean attributes, Mozilla and homepage. This is obviously not what was intended, and will cause errors or unexpected behaviour in the code, as seen in the live example below. Try hovering over the link to see what the title text is!

Our advice is to always include the attribute quotes — it avoids such problems, and results in more readable code too.

Single or double quotes?

In this article you'll notice that the attributes are all wrapped in double quotes. You might however see single quotes in some people's HTML. This is purely a matter of style, and you can feel free to chose which one you prefer. Both the following lines are equivalent:

<a href="http://www.example.com">A link to my example.</a>

<a href='http://www.example.com'>A link to my example.</a>

You should however make sure you don't mix them together. The following will go wrong!

<a href="http://www.example.com'>A link to my example.</a>

If you've used one type of quote in your HTML, you can nest the other type of quote:

<a href="http://www.example.com" title="Isn't this fun?">A link to my example.</a>

If you want to nest the same type of quote, you'll have to use HTML entities for the quotes.

Anatomy of an HTML document

That wraps up the basics of individual HTML elements, but they aren't very useful on their own. Now we'll look at how individual elements are combined to form an entire HTML page:

<!DOCTYPE html>
<html>
  <head>
    <meta charset="utf-8">
    <title>My test page</title>
  </head>
  <body>
    <p>This is my page</p>
  </body>
</html>

Here we have:

  1. <!DOCTYPE html>: The doctype. In the mists of time, when HTML was young (about 1991/2), doctypes were meant to act as links to a set of rules that the HTML page had to follow to be considered good HTML, which could mean automatic error checking and other useful things. They used to look something like this:
    <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
    "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
    However, these days no one really cares about them, and they are really just a historical artifact that needs to be included for everything to work right. <!DOCTYPE html> is the shortest string of characters that counts as a valid doctype; that's all you really need to know.
  2. <html></html>: The <html> element. This element wraps all the content on the entire page, and is sometimes known as the root element.
  3. <head></head>: The <head> element. This element acts as a container for all the stuff you want to include on the HTML page that isn't the content you are showing to your page's viewers. This includes things like keywords and a page description that you want to appear in search results, CSS to style our content, character set declarations, and more. You'll learn more about this in the next article in the series.
  4. <meta charset="utf-8">: This element sets the character set your document should use to UTF-8, which includes most characters from the vast majority of human written languages. Essentially it can now handle any textual content you might put on it. There is no reason not to set this, and it can help avoid some problems later on.
  5. <title></title>: The <title> element. This sets the title of your page, which is the title that appears in the browser tab the page is loaded in, and is used to describe the page when you bookmark/favourite it.
  6. <body></body>: The <body> element. This contains all the content that you want to show to web users when they visit your page, whether that's text, images, videos, games, playable audio tracks, or whatever else.

Active learning: Adding some features to an HTML document

If you want to experiment with writing some HTML on your local computer, you can:

  1. Copy the HTML page example listed above.
  2. Create a new file in your text editor.
  3. Paste the code into the new text file.
  4. Save the file as index.html.

Note: You can also find this basic HTML template on the MDN Learning Area Github repo.

You can now open this file in a web browser to see what the rendered code looks like, and then edit the code and refresh the browser to see what the result is. Initially it will look like this:

A simple HTML page that says This is my pageSo in this exercise, you can edit the code locally on your computer, as outlined above, or you can edit it in the editable sample window below (the editable sample window represents just the contents of the <body> element, in this case.) We'd like you to have a go at implementing the following steps:

  • Just below the opening tag of the <body> element, add a main title for the document. This should be wrapped inside an <h1> opening tag and </h1> closing tag.
  • Edit the paragraph content to include some text about something you are interested in.
  • Make any important words stand out in bold by wrapping them inside a <strong> opening tag and </strong> closing tag
  • Add a link to your paragraph, as explained earlier in the article.
  • Add an image to your document, below the paragraph, as explained earlier in the article. You'll get bonus points if you manage to link to a different image (either locally on your computer, or somewhere else on the web.)

If you make a mistake, you can always reset it using the Reset button. If you get really stuck, press the Show solution button to see the answer.

Whitespace in HTML

In the above examples you may have noticed that a lot of whitespace is included in the code listings — this is not necessary at all; the two following code snippets are equivalent:

<p>Dogs are silly.</p>

<p>Dogs        are
         silly.</p>

No matter how much whitespace you use (which can include space characters, but also line breaks), the HTML parser reduces each one down to a single space when rendering the code. So why use so much whitespace? The answer is readability — it is so much easier to understand what is going on in your code if you have it nicely formatted, and not just bunched up together in a big mess. In our HTML we've got each nested element indented by two spaces more than the one it is sitting inside. It is up to you what style of formatting you use (how many spaces for each level of indentation, for example), but you should consider using some kind of formatting.

Entity references: including special characters in HTML

In HTML, the characters <, >,",' and & are special characters. They are parts of the HTML syntax itself, so how do you include one of these characters in your text, for example if you really want to use an ampersand or less than sign, and not have it interpreted as code as some browsers may do?

We have to use character references — special codes that represent characters, and can be used in these exact circumstances. Each character reference is started with an ampersand (&), and ended by a semi-colon (;).

Literal character Character reference equivalent
< &lt;
> &gt;
" &quot;
' &apos;
& &amp;

In the below example, you can see two paragraphs, which are talking about web technologies:

<p>In HTML, you define a paragraph using the <p> element.</p>

<p>In HTML, you define a paragraph using the &lt;p&gt; element.</p>

In the live output below, you can see that the first paragraph has gone wrong, because the browser thinks that the second instance of <p> is starting a new paragraph. The second paragraph looks fine, because we have replaced the angle brackets with character references.

Note: A chart of all the available HTML character entity references can be found on Wikipedia: List of XML and HTML character entity references.

HTML comments

In HTML, as with most programming languages, there is a mechanism available to write comments in the code — comments are ignored by the browser and invisible to the user, and their purpose is to allow you to include comments in the code to say how your code works, what the different parts of the code do, etc. This can be very useful if you return to a code base that you've not worked on for six months, and can't remember what you did — or if you hand your code over to someone else to work on.

To turn a section of content inside your HTML file into a comment, you need to wrap it in the special markers <!-- and -->, for example:

<p>I'm not inside a comment</p>

<!-- <p>I am!</p> -->

As you can see below, the first paragraph appears in the live output, but the second one doesn't.

Summary

You've reached the end of the article — we hope you enjoyed your tour of the very basics of HTML! At this point you should understand what the language looks like, how it works at a basic level, and be able to write a few elements and attributes. This is a perfect place to be right now, as in subsequent articles in the module we will go into some of the things you have already looked at in a lot more detail, and introduce some new features of the language. Stay tuned!

Note: At this point, as you start to learn more about HTML, you might also want to start to explore the basics of Cascading Style Sheets, or CSS. CSS is the language you use to style your web pages (whether e.g. changing the font or colors, or altering the page layout). HTML and CSS go very well together, as you'll soon discover.

See also

ドキュメントのタグと貢献者

 このページの貢献者: contvel, chrischung
 最終更新者: contvel,