Web API 简介

首先,我们将从一个高层次看看 API——它们是什么、它们如何工作、如何在代码中使用它们,以及它们是如何组织的。我们也将看看不同主要类别的 API 以及它们的用途。

前提: 基本计算机知识、对于 HTML 和 CSS 的基本理解(见 JavaScript 第一步创建 JavaScript 代码块JavaScript 对象入门)。
目标: 熟悉 API,它们可以做什么,以及如何在代码中使用它们。

什么是 API?

应用程序接口(API)是基于编程语言构建的结构,让开发者更容易地创建复杂的功能。它们抽象了复杂的代码,并提供一些简单的接口规则直接使用。

来看一个现实中的例子:想想你的房子、公寓或其他住宅的供电方式,如果你想在你的房子里用电,只要把电器的插头插入插座就可以,而不是直接把它连接到电线上——这样做非常低效,而且对于不是电工的人会是困难和危险的。

两个多插头支架分别插入两个不同的插座插口。每个多插头座的顶部和前侧都有一个插头槽。每个多路插头座可插入两个插头。

图片来自:过载的插头接口,由 Flickr 上的 The Clear Communication People 提供。

同样,比如说,编程来显示一些 3D 图形,使用以更高级语言编写的 API(例如 JavaScript 或 Python)将会比直接编写直接控制计算机的 GPU 或其他图形功能的低级代码(比如 C 或 C++)来执行操作要容易得多。

备注: 详细说明请见 API 术语条目

客户端 JavaScript 中的 API

客户端 JavaScript 中有很多可用的 API。它们本身并不属于 JavaScript 语言,却建立在核心 JavaScript 语言之上,为使用 JavaScript 代码提供额外的超强能力。它们通常分为两类:

  • 浏览器 API 内置于 Web 浏览器中,能从浏览器和电脑周边环境中提取数据,并用来做有用的复杂的事情。例如,Web 音频 API 为在浏览器中处理音频提供了 JavaScript 结构——获取音轨、改变音量、应用特效等。在后台,浏览器实际上使用了一些复杂的低级代码(如 C++ 或 Rust)来进行实际的音频处理。但同样,这种复杂性已被应用程序接口抽象化。
  • 第三方 API 缺省情况下不会内置于浏览器中,通常必须在 Web 中的某个地方获取代码和信息。例如,Google Maps API 使你能够执行诸如在网站上显示办公室的交互式地图之类的操作。它提供一系列特殊的结构,可以用来查询 Google 地图服务并返回特定信息。

打开 Firefox 浏览器主页时的浏览器截图。默认情况下,浏览器内置了应用程序接口。第三方应用程序接口并非默认内置在浏览器中。要使用它们,必须从网络上的某个地方获取它们的代码和信息。

JavaScript、API 和其他 JavaScript 工具之间的关系

如上所述,我们讨论了什么是客户端 JavaScript API,以及它们与 JavaScript 语言的关系。让我们回顾一下,使其更清晰,并提及其他 JavaScript 工具的所适用的地方:

  • JavaScript——一种内置于浏览器的高级脚本语言,你可以用来实现 Web 页面/应用中的功能。注意 JavaScript 也可用于其他像 Node 这样的编程环境。
  • 客户端 API——内置于浏览器的结构程序,位于 JavaScript 语言之上,使你可以更容易的实现功能。
  • 第三方 API——置于第三方普通的结构程序(例如 Disqus、Facebook),使你可以在自己的 Web 页面中使用这些平台的某些功能(例如在你的 Web 页面显示 Disqus 评论)。
  • JavaScript 库——通常是包含具有自定义函数的一个或多个 JavaScript 文件,把这些文件关联到你的 Web 页以加快或启用常见的功能的编码。示例包括 jQuery、Mootools 和 React。
  • JavaScript 框架——从库开始的下一步,JavaScript 框架(例如 Angular 和 Ember)视图把 HTML、CSS、JavaScript 和其他安装的技术打包在一起,然后用来从头编写一个完整的 Web 应用。库和框架的主要区别在于“控制反转”。调用库中的方法时,开发人员处于控制地位。而框架的控制权则相反:框架调用开发人员的代码。

API 可以做什么?

在主流浏览器中有大量的可用 API,你可以在代码中做许多的事情。参见 MDN API 索引页

常见浏览器 API

特别地,你将使用的最常见的浏览器 API 类别(以及我们将在本模块中更详细地介绍的)有:

  • 操作文档的 API 内置于浏览器中。最明显的例子是 DOM(文档对象模型)API,它允许你操作 HTML 和 CSS——创建、移除以及修改 HTML,动态地将新样式应用到你的页面,等等。每当你看到一个弹出窗口出现在一个页面上,或者显示一些新的内容时,这都是 DOM 的行为。你可以在操控文档一文中找到关于这些类型的 API 的更多信息。
  • 从服务器获取数据的 API 用于更新网页的一小部分,其非常常用。这个看似很小的细节可以对网站的性能和行为产生巨大的影响——如果你只是更新一个股票列表或者一些可用的新故事而不需要从服务器重新加载整个页面将使网站或应用程序的响应感觉更快、更“敏捷”。主要用于此目的的 API 是 Fetch API,虽然旧的代码可能仍然会使用 XMLHttpRequest API。你也可能会同时遇到描述这项技术的术语 Ajax)。你可以在从服务器中获取数据一文找到关于此类 API 的更多信息。
  • 用于绘制和操作图形的 API 目前已被浏览器广泛支持。最流行的是允许你以编程方式更新包含在 HTML <canvas> 元素中的像素数据以创建 2D 和 3D 场景的 CanvasWebGL。例如,你可以绘制矩形或圆形等形状,将图像导入到画布上,然后使用 Canvas API 对其应用滤镜(如棕褐色滤镜或灰度滤镜),或使用 WebGL 创建具有光照和纹理的复杂 3D 场景。这些 API 经常与用于创建动画循环的 API(例如 window.requestAnimationFrame())和其他 API 一起不断更新诸如动画和游戏之类的场景。
  • 音频和视频 API 例如 HTMLMediaElementWeb 音频 APIWebRTC 允许你使用多媒体来做一些非常有趣的事情,比如创建用于播放音频和视频的自定义 UI 控件、显示字幕字幕和你的视频、从网络摄像机抓取视频、通过画布操纵(见上),或在网络会议中显示在别人的电脑上,或者添加效果到音轨(如增益、失真、平移等) 。
  • 设备 API 使得你可以与设备的硬件进行交互:例如,使用地理位置 API来访问设备的 GPS,从而查找用户的位置。
  • 客户端存储 API 使得你可以在客户端存储数据,因此你可以创建一个保存页面加载状态的应用,甚至让设备在处于离线状态时可用。有多种选项可供选择,例如使用 Web 存储 API 的简单的键/值存储以及使用 IndexedDB API 的更复杂的数据库存储。

常见第三方 API

第三方 API 种类繁多; 下列是一些比较流行的你可能迟早会用到的第三方 API:

  • 地图 API(例如 MapquestGoogle Maps API),允许你在网页上对地图执行多种操作。
  • Facebook API 套件,允许你将 Facebook 生态系统中的各个部分应用到你的应用并使之受益,比如说它提供了通过 Facebook 账户登录、接受应用内支付、推送有针对性的广告活动等功能。
  • Telegram API,允许你在网站中潜入来自 Telegram 频道的内容,此外还提供了对机器人的支持。
  • YouTube API,允许你将 Youtube 上的视频嵌入到网站中去,同时提供搜索 Youtube、创建播放列表等众多功能。
  • Pinterest API,提供了管理 Pinterest 图板和图钉的工具,以便将它们纳入你的网站。
  • Twilio API,为你的应用提供了针对语音通话和视频聊天的框架,以及从你的 app 发送短信息或多媒体信息等诸多功能。
  • Disqus API,提供了一个可集成到网站中的评论平台。
  • Mastodon API,让你以编程方式操作 Mastodon 社交网络的特性。
  • IFTTT API,允许你通过一个平台集成多个 API。

API 如何工作?

不同的 JavaScript API 以稍微不同的方式工作,但通常它们具有共同的特征和相似的主题。

它们是基于对象的

API 使用一个或多个 JavaScript 对象在你的代码中进行交互,这些对象用作 API 使用的数据(包含在对象属性中)的容器以及 API 提供的功能(包含在对象方法中)。

备注: 如果你不熟悉对象如何工作,则应在继续之前学习 JavaScript 对象模块。

让我们回到 Web 音频 API 的例子——这是一个相当复杂的 API,它由多个对象组成。最重要的包括:

  • AudioContext,表示一个可以用于操控浏览器中播放音频的音频图,并且拥有许多可用于操作音频的方法和属性。
  • MediaElementAudioSourceNode,表示一个包含你想要在音频上下文中播放和操控的声音的 <audio> 元素。
  • AudioDestinationNode,表示音频的输出目的地,也就是你电脑上的实际输出设备——通常是你的扬声器或耳机。

那么这些对象是如何交互的呢?如果你查看我们的简单 Web 音频示例也可以在线查看),首先会看到如下的 HTML 代码:

html
<audio src="outfoxing.mp3"></audio>

<button class="paused">Play</button>
<br />
<input type="range" min="0" max="1" step="0.01" value="1" class="volume" />

首先,我们包含一个 <audio> 元素,用于在页面中嵌入一个 MP3 文件。我们没有包含任何默认的浏览器控件。接下来,我们包含一个 <button>,用于播放和停止音乐,以及一个类型为 range 的 <input> 元素,用于在播放时调整音轨的音量。

接下来,我们来看一下这个示例的 JavaScript 代码。

我们首先创建一个 AudioContext 实例,用于在其中操作我们的音轨:

js
const AudioContext = window.AudioContext || window.webkitAudioContext;
const audioCtx = new AudioContext();

接下来,我们创建常量来存储对 <audio><button><input> 元素的引用,并使用 AudioContext.createMediaElementSource() 方法创建一个 MediaElementAudioSourceNode,表示我们的音频源——也就是将播放的 <audio> 元素:

js
const audioElement = document.querySelector("audio");
const playBtn = document.querySelector("button");
const volumeSlider = document.querySelector(".volume");

const audioSource = audioCtx.createMediaElementSource(audioElement);

接下来,我们添加几个事件处理器,用于在按钮被按下时在播放和暂停之间切换,并在歌曲播放结束时将显示重置回开始位置:

js
// 播放/暂停音频
playBtn.addEventListener("click", () => {
  // 确认 context 在 suspended 状态(自动播放策略)
  if (audioCtx.state === "suspended") {
    audioCtx.resume();
  }

  // 如果音轨处于停止则开始播放
  if (playBtn.getAttribute("class") === "paused") {
    audioElement.play();
    playBtn.setAttribute("class", "playing");
    playBtn.textContent = "Pause";
    // 如果音轨正在播放则停止播放
  } else if (playBtn.getAttribute("class") === "playing") {
    audioElement.pause();
    playBtn.setAttribute("class", "paused");
    playBtn.textContent = "Play";
  }
});

// 如果音轨结束了
audioElement.addEventListener("ended", () => {
  playBtn.setAttribute("class", "paused");
  playBtn.textContent = "Play";
});

备注: 有些人可能会注意到,用于播放和暂停音轨的 play()pause() 方法并不属于 Web 音频 API;它们属于 HTMLMediaElement API,这是一个不同但紧密相关的 API。

接下来,我们使用 AudioContext.createGain() 方法创建一个 GainNode 对象,可以用于调整通过它的音频的音量,并创建另一个事件处理器,当滑块值改变时改变音频图的增益(音量)值:

js
// 音量
const gainNode = audioCtx.createGain();

volumeSlider.addEventListener("input", () => {
  gainNode.gain.value = volumeSlider.value;
});

最后要做的是将音频图中的不同节点连接起来,这是通过每个节点类型上可用的 AudioNode.connect() 方法完成的:

js
audioSource.connect(gainNode).connect(audioCtx.destination);

音频从源头开始,然后连接到增益节点,以便调整音频的音量。增益节点然后连接到目标节点,以便声音可以在你的电脑上播放(AudioContext.destination 属性表示你电脑硬件上可用的默认 AudioDestinationNode,例如你的扬声器)。

它们有可识别的入口点

在使用 API 时,你应该确保知道 API 的入口点在哪里。在 Web 音频 API 中,这非常简单——就是 AudioContext 对象,需要使用它来进行任何音频操作。

文档对象模型(DOM)API 也有一个简单的入口点——其特性通常位于 Document 对象或你想要以某种方式影响的 HTML 元素实例上,例如:

js
const em = document.createElement("em"); // 创建一个新的 em 元素
const para = document.querySelector("p"); // 获取现存的一个 p 元素的引用
em.textContent = "Hello there!"; // 为 em 元素设置文本内容
para.appendChild(em); // 将 em 嵌入到 para 中

Canvas API 也依赖于获取要使用的上下文对象来操纵事物,尽管在此例中,它是图形上下文而非音频上下文。它的上下文对象是通过获取要绘制的 <canvas> 元素的引用,然后调用其 HTMLCanvasElement.getContext() 方法创建的:

js
const canvas = document.querySelector("canvas");
const ctx = canvas.getContext("2d");

然后,我们想通过调用内容对象(CanvasRenderingContext2D 的实例)的属性和方法来实现我们想要对画布进行的任何操作,例如:

js
Ball.prototype.draw = function () {
  ctx.beginPath();
  ctx.fillStyle = this.color;
  ctx.arc(this.x, this.y, this.size, 0, 2 * Math.PI);
  ctx.fill();
};

备注: 你可以在我们的弹跳球演示中看到此代码(也可以在线运行)。

它们使用事件来处理状态的变化

我们之前已经在课程中讨论了事件,在我们的事件介绍一文中详细介绍了客户端 Web 事件是什么以及它们在代码中的用法。如果你还不熟悉客户端 Web API 事件的工作方式,则应在继续之前阅读这篇文章。

一些 Web API 不包含事件,但有些包含一些事件。当事件触发时,允许我们运行函数的处理器属性通常在参考资料中单独的“事件处理器”部分列出。

我们已经在上面的 Web 音频 API 示例中看到了很多正在使用的事件处理器了:

js
// 播放/暂停音频
playBtn.addEventListener("click", () => {
  // 确认 context 在 suspended 状态(自动播放策略)
  if (audioCtx.state === "suspended") {
    audioCtx.resume();
  }

  // 如果音轨处于停止则开始播放
  if (playBtn.getAttribute("class") === "paused") {
    audioElement.play();
    playBtn.setAttribute("class", "playing");
    playBtn.textContent = "Pause";
    // 如果音轨正在播放则停止播放
  } else if (playBtn.getAttribute("class") === "playing") {
    audioElement.pause();
    playBtn.setAttribute("class", "paused");
    playBtn.textContent = "Play";
  }
});

// 如果音轨结束了
audioElement.addEventListener("ended", () => {
  playBtn.setAttribute("class", "paused");
  playBtn.textContent = "Play";
});

它们在适当的地方有额外的安全机制

Web API 特性受到与 JavaScript 和其他 Web 技术(例如同源策略)相同的安全考虑,但是它们有时会有额外的安全机制。例如,一些更现代的 Web API 将只能在通过 HTTPS 提供的页面上工作,因为它们正在传输潜在的敏感数据(例如 Service Worker推送)。

另外,在代码中调用某些 Web API 时会请求用户启用权限。例如,Notification API 使用弹出对话框请求权限:

浏览器通知 API 提供的弹出式通知对话框截图。mdn.github.io 网站正在请求向用户代理推送通知的权限,用 X 关闭对话框和下拉菜单选项,默认情况下选择“始终接收通知”。

Web 音频和 HTMLMediaElement API 受制于一种名为自动播放策略的安全机制。这基本上意味着你不能在页面加载时自动播放音频:你必须允许用户通过按钮等控件启动音频播放。这样做的原因是,自动播放音频通常非常恼人,我们实在不应该让用户忍受它。

备注: 根据浏览器的严格程度,这种安全机制甚至可能会阻止示例在本地运行,也就是说,如果你在浏览器中加载本地示例文件,而不是从 Web 服务器上运行它的话。在撰写本文时,我们的 Web 音频 API 示例在 Google Chrome 浏览器上无法本地运行,必须上传到 GitHub 才能运行。

总结

至此,你应该对什么是 API、API 如何工作以及在 JavaScript 代码中如何使用 API 有了一定的了解。你可能已经迫不及待地想开始使用特定的 API 做一些有趣的事情了,那就开始吧!接下来,我们将学习使用文档对象模型(DOM)操作文档。