SpeechRecognition

Limited availability

This feature is not Baseline because it does not work in some of the most widely-used browsers.

Das SpeechRecognition-Interface der Web Speech API ist das Kontrollinterface für den Erkennungsdienst; es behandelt auch das SpeechRecognitionEvent, das vom Erkennungsdienst gesendet wird.

Hinweis: In einigen Browsern, wie Chrome, erfordert die Nutzung der Spracherkennung auf einer Webseite eine serverbasierte Erkennungs-Engine. Ihr Audio wird an einen Webdienst zur Erkennungsverarbeitung gesendet, sodass es offline nicht funktioniert.

Konstruktor

SpeechRecognition(): Erstellt ein neues SpeechRecognition-Objekt.

Instanz-Eigenschaften

SpeechRecognition erbt auch Eigenschaften von seinem Elterninterface, EventTarget.

SpeechRecognition.lang: Gibt die Sprache der aktuellen SpeechRecognition zurück und setzt sie. Wenn nicht angegeben, wird standardmäßig der HTML-Attributwert lang oder die Spracheinstellung des User-Agents verwendet, sofern dieser nicht festgelegt ist.
SpeechRecognition.continuous: Steuert, ob kontinuierliche Ergebnisse für jede Erkennung zurückgegeben werden oder nur ein einzelnes Ergebnis. Standardmäßig ist es auf ein einzelnes Ergebnis (false) festgelegt.
SpeechRecognition.interimResults: Steuert, ob vorläufige Ergebnisse zurückgegeben werden sollen (true) oder nicht (false). Vorläufige Ergebnisse sind Ergebnisse, die noch nicht endgültig sind (z.B. ist die Eigenschaft SpeechRecognitionResult.isFinal false).
SpeechRecognition.maxAlternatives: Legt die maximale Anzahl von SpeechRecognitionAlternatives pro Ergebnis fest. Der Standardwert ist 1.
SpeechRecognition.phrases Experimentell: Legt ein Array von SpeechRecognitionPhrase-Objekten fest, die für kontextuelles Biasing verwendet werden.
SpeechRecognition.processLocally Experimentell: Gibt an, ob die Spracherkennung lokal auf dem Gerät des Benutzers durchgeführt werden muss.

Veraltete Eigenschaften

Das Konzept der Grammatik wurde aus der Web Speech API entfernt. Verwandte Funktionen bleiben in der Spezifikation und werden von unterstützenden Browsern weiterhin für die Abwärtskompatibilität erkannt, haben jedoch keinen Einfluss auf die Spracherkennungsdienste.

SpeechRecognition.grammars: Gibt eine Sammlung von SpeechGrammar-Objekten zurück und setzt sie, die die von der aktuellen SpeechRecognition verstandenen Grammatiken darstellen.

Statische Methoden

SpeechRecognition.available() Experimentell: Überprüft, ob die angegebenen Sprachen für die Spracherkennung verfügbar sind.
SpeechRecognition.install() Experimentell: Installiert die erforderlichen Sprachpakete für die geräteinterne Spracherkennung in den angegebenen Sprachen.

Instanz-Methoden

SpeechRecognition erbt auch Methoden von seinem Elterninterface, EventTarget.

SpeechRecognition.abort(): Stoppt den Spracherkennungsdienst, sodass er eingehende Audiodaten nicht mehr hört und keinen SpeechRecognitionResult zurückzugeben versucht.
SpeechRecognition.start(): Startet den Spracherkennungsdienst, um eingehende Audiodaten (von einem Mikrofon oder einer Audiospur) zu hören, und gibt die Ergebnisse dieser Erkennung zurück.
SpeechRecognition.stop(): Stoppt den Spracherkennungsdienst vom Hören eingehender Audiodaten und versucht, basierend auf den bisher erfassten Ergebnissen eine SpeechRecognitionResult zurückzugeben.

Ereignisse

Hören Sie auf diese Ereignisse mit addEventListener() oder indem Sie einen Ereignislistener der oneventname-Eigenschaft dieses Interfaces zuweisen.

audiostart: Wird ausgelöst, wenn der User-Agent mit der Audioerfassung begonnen hat.
audioend: Wird ausgelöst, wenn der User-Agent die Audioerfassung abgeschlossen hat.
end: Wird ausgelöst, wenn der Spracherkennungsdienst getrennt wurde.
error: Wird ausgelöst, wenn ein Fehler bei der Spracherkennung auftritt.
nomatch: Wird ausgelöst, wenn der Spracherkennungsdienst ein endgültiges Ergebnis ohne signifikante Erkennung zurückgibt. Dies kann ein gewisses Maß an Erkennung beinhalten, das die confidence-Schwelle nicht erreicht oder überschreitet.
result: Wird ausgelöst, wenn der Spracherkennungsdienst ein Ergebnis zurückgibt – ein Wort oder Satz wurde positiv erkannt und dies wurde an die App zurückgemeldet.
soundstart: Wird ausgelöst, wenn ein beliebiges Geräusch – erkennbarer Sprachklang oder nicht – erkannt wurde.
soundend: Wird ausgelöst, wenn ein beliebiges Geräusch – erkennbarer Sprachklang oder nicht – nicht mehr erkannt wird.
speechstart: Wird ausgelöst, wenn ein Geräusch, das von dem Spracherkennungsdienst als Sprache erkannt wird, erkannt wurde.
speechend: Wird ausgelöst, wenn Sprache, die vom Spracherkennungsdienst erkannt wurde, nicht mehr erkannt wird.
start: Wird ausgelöst, wenn der Spracherkennungsdienst beginnt, Audio zur Erkennung zu hören.

Beispiele

In unserem Speech color changer-Beispiel erstellen wir eine neue SpeechRecognition-Objektinstanz mithilfe des SpeechRecognition()-Konstruktors.

Nachdem einige andere Werte festgelegt wurden, stellen wir es so ein, dass der Erkennungsdienst startet, wenn ein Button geklickt wird (siehe SpeechRecognition.start()). Wenn ein Ergebnis erfolgreich erkannt wurde, wird das result-Ereignis ausgelöst, wir extrahieren die gesprochene Farbe aus dem Ereignisobjekt und setzen dann die Hintergrundfarbe des <html>-Elements auf diese Farbe.

const recognition = new SpeechRecognition();
recognition.continuous = false;
recognition.lang = "en-US";
recognition.interimResults = false;
recognition.maxAlternatives = 1;

const diagnostic = document.querySelector(".output");
const bg = document.querySelector("html");
const startBtn = document.querySelector("button");

startBtn.onclick = () => {
  recognition.start();
  console.log("Ready to receive a color command.");
};

recognition.onresult = (event) => {
  const color = event.results[0][0].transcript;
  diagnostic.textContent = `Result received: ${color}`;
  bg.style.backgroundColor = color;
};

Spezifikationen

Specification
Web Speech API # speechreco-section

Browser-Kompatibilität

Siehe auch

Web Speech API

Help improve MDN

Learn how to contribute Diese Seite wurde automatisch aus dem Englischen übersetzt.

Übersetzung auf GitHub anzeigen • Fehler mit dieser Übersetzung melden