文本格式进阶

HTML 中有许多可以用于定义文本语义的其他元素,我们没有在强调和重要性中提到它们。本文中所介绍的元素虽然少有人知,但仍然值得去学习(而且本文不是一份完整的列表)。在这里你将学习标记引用、描述列表、计算机代码和其他相关文本、下标和上标、联系信息等。

前提: 熟悉 HTML 基础,如基础 HTML 语法所述。文本级语义,例如标题和段落列表
学习成果:
  • 引用。
  • 缩写和首字母缩略词。
  • 地址。
  • 时间和日期。
  • 上标和下标。

引用

HTML 也有用于标记引用的特性,至于使用哪个元素标记,取决于你引用的是一块还是一行。

块引用

如果其他地方引用一个块级内容(一个段落、多个段落、一个列表等),你应该把它用 <blockquote> 元素包裹起来表示,并且在 cite 属性里用 URL 来指向引用的资源。例如,下面的示例代码就是引用的 MDN 的 <blockquote> 元素页面:

html
<p>
  <strong>HTML <code>&lt;blockquote&gt;</code> 元素</strong>(或<em
    >HTML 块级引用元素</em
  >)表示所附文本为扩展引用。
</p>

要把这些转换为块引用,我们要这样做:

html
<p>这是块引用:</p>
<blockquote
  cite="https://developer.mozilla.org/zh-CN/docs/Web/HTML/Element/blockquote">
  <p>
    <strong>HTML <code>&lt;blockquote&gt;</code> 元素</strong>(或<em
      >HTML 块级引用元素</em
    >)表示所附文本为扩展引用。
  </p>
</blockquote>

浏览器的默认样式会将其渲染为缩进的段落,以表明这是一个引用;引用上面的段落是为了证明这一点。

行内引用

除了使用 <q> 元素以外,行内元素用同样的方式工作。例如,下面的标记包含了从 MDN <q> 页面的引用:

html
<p>
  引用元素 <code>&lt;q&gt;</code><q
    cite="https://developer.mozilla.org/zh-CN/docs/Web/HTML/Element/q"
    >用于不需要段落分隔的短引用。</q
  >
</p>

浏览器默认将其作为普通文本放入引号内表示引用,就像下面:

引文

cite 属性的内容听起来很有用,但不幸的是,浏览器、屏幕阅读器并没有充分利用它。如果不使用 JavaScript 或 CSS 编写自己的解决方案,就没有办法让浏览器显示 cite 的内容。如果你想在页面上提供引文的来源,你需要在文本中通过链接或其他适当的方式来提供它。

这里有 <cite> 元素,但它是为了包含所引用资源的标题(如书名)。然而,你没有理由不把 <cite> 内的文字以某种方式链接到引用源。

html
<p>
  根据<a href="/zh-CN/docs/Web/HTML/Element/blockquote"><cite>MDN 块引用页</cite></a></p>

<blockquote
  cite="https://developer.mozilla.org/zh-CN/docs/Web/HTML/Element/blockquote">
  <p>
    <strong>HTML <code>&lt;blockquote&gt;</code> 元素</strong>(或<em>HTML 块级引用元素</em>)表示所附文本为扩展引用。
  </p>
</blockquote>

<p>
  引用元素 <code>&lt;q&gt;</code><q cite="https://developer.mozilla.org/zh-CN/docs/Web/HTML/Element/q">用于不需要段落分隔的短引用。</q>——<a href="/zh-CN/docs/Web/HTML/Element/q"> <cite>MDN q 页面</cite></a>
</p>

引文默认的字体样式为斜体。

主动学习:是谁说的?

到了主动学习的时间!在这个例子中我们想要你:

  1. 把中间的段落变成块引用,它要包含 cite 属性。
  2. 把第三个段落的一部分变成行内引用,它要包含 cite 属性。
  3. 将每一个引用源的标题包裹在 <cite> 标签中,并将它们链接到引用源中。

你需要的引用源:

  • http://www.brainyquote.com/quotes/authors/c/confucius.html 对应“孔子曰”。
  • http://example.com/affirmationsforpositivethinking 对应“不要说泄气的话”。

如果你做错了,你可以随时点击重置按钮。如果实在进行不下去,可以点击显示答案

缩略语

另一个你在 Web 上看到的相当常见的元素是 <abbr>——它常被用来包裹一个缩略语或缩写,并且提供缩写的解释。当包括这两种情况时,在第一次使用时提供纯文本的完整扩展,同时用 <abbr> 来标记缩写。这为用户代理提供了如何公布/显示内容的提示,同时告知所有用户该缩写的含义。

如果为缩写提供扩展信息的意义不大,而且该缩写或首字母缩写是一个相当简短的术语,则应提供该术语的完整扩展,作为 title 属性的值:

缩略语示例

让我们一起看一个示例。

html
<p>我们使用 <abbr>HTML</abbr> 超文本标记语言来组织网页文档。</p>

<p>
  第 33 届<abbr title="夏季奥林匹克运动会">奥运会</abbr>已于 2024 年 7
  月在法国巴黎举行。
</p>

这些代码的显示效果如下:

备注: 在之前版本的 html 中还包含对另一个元素 <acronym> 的支持,但是它已经从 HTML 标准中移除,因为可以只使用 <abbr> 元素代表缩略语。不应再使用 <acronym>

主动学习:标记一个缩略语

在这个简单的主动学习任务中,我们希望你简单地标记一个缩略语。你可以使用下面的示例,或者用自己的示例来替换。

标记联系方式

HTML 有个用于标记联系方式的元素——<address>。它仅仅包含联系方式,例如:

html
<address>Chris Mills, Manchester, The Grim North, UK</address>

其中可以包含更复杂的标记和其他形式的联系方式,如:

html
<address>
  <p>
    Chris Mills<br />
    Manchester<br />
    The Grim North<br />
    UK
  </p>

  <ul>
    <li>Tel: 01234 567 890</li>
    <li>Email: me@grim-north.co.uk</li>
  </ul>
</address>

注意,如果链接的页面包含了联系信息,像下面这样也是可以的:

html
<address><a href="../authors/chris-mills/">Chris Mills</a> 编写的页面。
</address>

备注: <address> 元素只能用于提供最近的 <article><body> 元素所含文件的联系信息。在一个网站的页脚使用它来包括整个网站的联系信息,或者在一篇文章里面使用它来包括作者的联系信息,这都是正确的,但不能用来标记与该页面内容无关的地址列表。

上标和下标

当你使用日期、化学方程式和数学方程式时会偶尔使用上标和下标,以确保它们的正确含义。<sup><sub> 元素可以解决这样的问题。例如:

html
<p>我的生日是在 2021 年 5 月 25 日(译者注:英文原文为 25<sup>th</sup></p>
<p>
  咖啡因的化学方程式是 C<sub>8</sub>H<sub>10</sub>N<sub>4</sub>O<sub>2</sub></p>
<p>如果 x<sup>2</sup> 的值为 9,那么 x 的值必为 3 或 -3。</p>

这些代码输出的结果是:

展示计算机代码

有大量的 HTML 元素可以来标记计算机代码:

  • <code>:用于标记计算机通用代码。
  • <pre>:用于保留空白字符(通常用于代码块)——如果文本中使用了缩进或多余的空白,浏览器将忽略它,你将不会在渲染的页面上看到它。但是,如果你将文本包含在 <pre></pre> 标签中,那么空白将会以与你在文本编辑器中看到的相同的方式渲染出来。
  • <var>:用于标记具体变量名。
  • <kbd>:用于标记输入电脑的键盘(或其他类型)输入。
  • <samp>:用于标记计算机程序的输出。

让我们看看这些元素的示例以及它们如何被用来表示计算机代码。如果你想要完整文件,可以看一下 other-semantics.html 这个示例文件。你可以下载文件并在浏览器打开查看,以下是代码的一个片段:

html
<pre><code>const para = document.querySelector('p');

para.onclick = function() {
  alert('噢,噢,噢,别点我了。');
}</code></pre>

<p>
  请不要使用 <code>&lt;font&gt;</code><code>&lt;center&gt;</code> 等表现元素。
</p>

<p>在上述的 JavaScript 示例中,<var>para</var> 表示一个段落元素。</p>

<p><kbd>Ctrl</kbd>/<kbd>Cmd</kbd> + <kbd>A</kbd> 选择全部内容。</p>

<pre>$ <kbd>ping mozilla.org</kbd>
<samp>PING mozilla.org (63.245.215.20): 56 data bytes
64 bytes from 63.245.215.20: icmp_seq=0 ttl=40 time=158.233 ms</samp></pre>

上面的代码显示效果如下:

标记时间和日期

HTML 还支持将时间和日期标记为可供机器识别的格式的 <time> 元素,例如:

html
<time datetime="2016-01-20">2016 年 1 月 20 日</time>

为什么需要这样做?因为世界上有许多种书写日期的格式,上边的日期可能被写成:

  • 20 January 2016
  • 20th January 2016
  • Jan 20 2016
  • 20/06/16
  • 06/20/16
  • The 20th of next month
  • 20e Janvier 2016
  • 2016 年 1 月 20 日
  • 等等

但是这些不同的格式不容易被电脑识别——假如你想自动抓取页面上所有事件的日期并将它们插入到日历中,<time> 元素允许你附上清晰的、可被机器识别的时间或日期来实现这种需求。

上述基本的例子仅仅提供了一种简单的可被机器识别的日期格式,这里还有许多其他支持的格式,例如:

html
<!-- 标准简单日期 -->
<time datetime="2016-01-20">20 January 2016</time>
<!-- 只包含年份和月份-->
<time datetime="2016-01">January 2016</time>
<!-- 只包含月份和日期 -->
<time datetime="01-20">20 January</time>
<!-- 只包含时间,小时和分钟数 -->
<time datetime="19:30">19:30</time>
<!-- 还可包含秒和毫秒 -->
<time datetime="19:30:01.856">19:30:01.856</time>
<!-- 日期和时间 -->
<time datetime="2016-01-20T19:30">7.30pm, 20 January 2016</time>
<!-- 含有时区偏移值的日期时间 -->
<time datetime="2016-01-20T19:30+01:00"
  >7.30pm, 20 January 2016 is 8.30pm in France</time
>
<!-- 提及特定周 -->
<time datetime="2016-W04">The fourth week of 2016</time>

技能测试!

你已经到达了本篇文章的末尾,但还能记得多少重要的东西呢?在进行下一步前,你可以找一些测试来验证知识留存的多少——请查看技能测试:高级 HTML 文本

总结

到这里标志着对不太常见的 HTML 文本语义的学习告一段落。你在本课程中所看到的内容并不是 HTML 文本元素的完整列表——我们只是想涵盖一些基本要素,以及一些你在实际中会较常见到的元素。接下来,我们将学习链接,这是网络最重要的功能之一。