SpeechRecognition
Experimental: これは実験的な機能です。
本番で使用する前にブラウザー互換性一覧表をチェックしてください。
Web Speech API の SpeechRecognition
インターフェイスは、認識サービスの制御インターフェイスです。これは、認識サービスから送信された SpeechRecognitionEvent
(en-US) も扱います。
注記: Chrome では、ウェブページ上で音声認識を使用するとサーバーベースの認識エンジンが使用されます。あなたの音声を認識処理するためにウェブサービスへ送信するのでオフラインでは動作しません。
コンストラクター
SpeechRecognition.SpeechRecognition()
- 新しい
SpeechRecognition
オブジェクトを作成します。
プロパティ
SpeechRecognition
は、親インターフェイスである EventTarget
からのプロパティも継承します。
SpeechRecognition.grammars
- 現在の
SpeechRecognition
により理解される文法を表す、SpeechGrammar
オブジェクトのコレクションを返して設定します。 SpeechRecognition.lang
- 現在の
SpeechRecognition
の言語を返して設定します。指定されない場合、これはデフォルトで HTMLlang
属性の値になります。どちらも設定されていない場合、ユーザーエージェントの言語設定が使用されます。 SpeechRecognition.continuous
- 各認識の継続的な結果を返すか、単一の認識結果だけを返すかを制御します。デフォルトは単一 (
false
) です。 SpeechRecognition.interimResults
- 暫定的な結果を返すか (
true
)、そうでないか (false
) を制御します。暫定的な結果は、最終的な結果ではありません (つまり、SpeechRecognitionResult.isFinal
プロパティの値はfalse
)。 SpeechRecognition.maxAlternatives
- 結果ごとに提供される
SpeechRecognitionAlternative
の最大数を設定します。デフォルト値は 1 です。 SpeechRecognition.serviceURI
- 実際の認識を扱うための現在の
SpeechRecognition
に使用される音声認識サービスの場所を指定します。デフォルトはユーザーエージェントのスピーチサービスです。
イベントハンドラー
SpeechRecognition.onaudiostart
- ユーザーエージェントが音声の捕捉を開始した時に発火します。
SpeechRecognition.onaudioend
- ユーザーエージェントが音声の捕捉を終了した時に発火します。
SpeechRecognition.onend
- 音声認識サービスとの接続が切れた時に発火します。
SpeechRecognition.onerror
- 音声認識でエラーが起こった時に発火します。
SpeechRecognition.onnomatch
- 音声認識サービスが意味を認識できない最終結果を返した時に発火します。これは、ある程度の認識はされているが、信頼できるしきい値 (
confidence
(en-US)) に達していないことを意味します。 SpeechRecognition.onresult
- 音声認識サービスが結果を返した時に発火します。単語またはフレーズの認識結果が有意であり、アプリと通信してその結果が渡されます。
SpeechRecognition.onsoundstart
- 何らかの音が鳴った時 (認識可能な音声またはそうでない音が検知された時) に発火します。
SpeechRecognition.onsoundend
- 何らかの音が鳴り止んだ時 (認識可能な音声またはそうでない音が止んだことが検知された時) に発火します。
SpeechRecognition.onspeechstart
- 音声認識サービスにより音声として認識された音が検出された時に発火します。
SpeechRecognition.onspeechend
- 音声認識サービスにより認識された音声の停止が検出された時に発火します。
SpeechRecognition.onstart
- 音声認識サービスが、現在の
SpeechRecognition
に関連付けられた文法の認識が意図された入力音声のリスニングを開始した時に発火します。
メソッド
SpeechRecognition
は、その親インターフェイスである EventTarget
からのメソッドも継承します。
SpeechRecognition.abort()
- 音声認識サービスによる入力音声のリスニングを停止し、
SpeechRecognitionResult
を返そうとしないようにします。 SpeechRecognition.start()
- 音声認識サービスによる入力音声のリスニングを開始し、現在の
SpeechRecognition
に関連付けられた文法の認識を行います。 SpeechRecognition.stop()
- 音声認識サービスによる入力音声のリスニングを停止し、その時点までに補足した音声を使用して
SpeechRecognitionResult
を返そうとします。
例
私たちのシンプルな Speech color changer の例では、SpeechRecognition()
コンストラクターを使用して新しい SpeechRecognition
オブジェクトのインスタンスを生成し、新しい SpeechGrammarList
(en-US) を作成、それを SpeechRecognition.grammars
プロパティを使用して SpeechRecognition
インスタンスにより認識される文法に設定します。
他の値を定義した後、私たちは、それを設定して、クリックイベントの発生時 (SpeechRecognition.start()
参照) に認識サービスを開始します。音声の認識に成功すると、SpeechRecognition.onresult
ハンドラーが発火し、イベントオブジェクトから発話された色を展開、そしてそれを <html>
要素の背景色に設定します。
var grammar = '#JSGF V1.0; grammar colors; public <color> = aqua | azure | beige | bisque | black | blue | brown | chocolate | coral | crimson | cyan | fuchsia | ghostwhite | gold | goldenrod | gray | green | indigo | ivory | khaki | lavender | lime | linen | magenta | maroon | moccasin | navy | olive | orange | orchid | peru | pink | plum | purple | red | salmon | sienna | silver | snow | tan | teal | thistle | tomato | turquoise | violet | white | yellow ;'
var recognition = new SpeechRecognition();
var speechRecognitionList = new SpeechGrammarList();
speechRecognitionList.addFromString(grammar, 1);
recognition.grammars = speechRecognitionList;
//recognition.continuous = false;
recognition.lang = 'en-US';
recognition.interimResults = false;
recognition.maxAlternatives = 1;
var diagnostic = document.querySelector('.output');
var bg = document.querySelector('html');
document.body.onclick = function() {
recognition.start();
console.log('Ready to receive a color command.');
}
recognition.onresult = function(event) {
var color = event.results[0][0].transcript;
diagnostic.textContent = 'Result received: ' + color;
bg.style.backgroundColor = color;
}
仕様
仕様書 | 策定状況 | 備考 |
---|---|---|
Web Speech API SpeechRecognition の定義 |
ドラフト |
ブラウザーの実装状況
BCD tables only load in the browser
Firefox OS の許可設定
アプリ内で音声認識を使用するには、以下の許可設定を manifest で指定する必要があります:
"permissions": {
"audio-capture" : {
"description" : "Audio capture"
},
"speech-recognition" : {
"description" : "Speech recognition"
}
}
特権アプリも必要なため、以下も同様に含める必要があります:
"type": "privileged"