WebCodecs API

Hinweis: Diese Funktion ist in Dedicated Web Workers verfügbar.

Die WebCodecs API gibt Webentwicklern Zugriff auf niedriger Ebene auf die einzelnen Frames eines Videostreams und Stücke von Audio. Sie ist nützlich für Webanwendungen, die volle Kontrolle darüber benötigen, wie Medien verarbeitet werden. Zum Beispiel Video- oder Audioeditoren und Videokonferenzen.

Konzepte und Verwendung

Viele Web-APIs verwenden intern Mediencodecs. Zum Beispiel die Web Audio API und die WebRTC API. Diese APIs erlauben es Entwicklern jedoch nicht, mit einzelnen Frames eines Videostreams und ungemischten Stücken von kodiertem Audio oder Video zu arbeiten.

Webentwickler haben typischerweise WebAssembly verwendet, um diese Einschränkung zu umgehen, und um mit Mediencodecs im Browser zu arbeiten. Dies erfordert jedoch zusätzliche Bandbreite, um Codecs herunterzuladen, die bereits im Browser existieren, was die Leistung und Energieeffizienz reduziert und zusätzlichen Entwicklungsaufwand verursacht.

Die WebCodecs API bietet Zugriff auf Codecs, die bereits im Browser vorhanden sind. Sie bietet Zugriff auf rohe Video-Frames, Audio-Datenblöcke, Bilddecoder sowie Audio- und Videokodierer und -dekodierer.

Verarbeitungsmodell

Die WebCodecs API verwendet ein asynchrones Verarbeitungsmodell. Jede Instanz eines Kodierers oder Dekodierers unterhält eine interne, unabhängige Verarbeitungswarteschlange. Bei der Warteschlange einer erheblichen Menge an Arbeit ist es wichtig, dieses Modell im Kopf zu behalten.

Methoden mit den Namen configure(), encode(), decode() und flush() arbeiten asynchron, indem sie Steuerbefehle an das Ende der Warteschlange anhängen, während Methoden mit den Namen reset() und close() synchron alle anstehenden Arbeiten abbrechen und die Verarbeitungswarteschlange löschen. Nach reset() kann nach einem Aufruf von configure() weitere Arbeit in die Warteschlange gestellt werden, aber close() ist eine permanente Operation.

Methoden mit dem Namen flush() können verwendet werden, um auf den Abschluss aller Arbeiten zu warten, die zum Zeitpunkt des Aufrufs von flush() anstanden. Sie sollte jedoch generell nur dann aufgerufen werden, wenn alle gewünschten Arbeiten in die Warteschlange gestellt wurden. Sie ist nicht gedacht, um Fortschritt in regelmäßigen Abständen zu erzwingen. Ein unnötiger Aufruf wird die Qualität des Kodierers beeinflussen und dazu führen, dass Dekodierer erfordern, dass der nächste Input ein Schlüsselbild ist.

Demultiplexing

Derzeit gibt es keine API für das Demultiplexen von Mediencontainern. Entwickler, die mit containerisierter Medien arbeiten, müssen eigene Lösungen implementieren oder Drittanbieter-Bibliotheken verwenden. Z.B. können MP4Box.js oder jswebm verwendet werden, um Audio- und Videodaten in EncodedAudioChunk und EncodedVideoChunk Objekte zu demultiplexen.

Schnittstellen

AudioDecoder: Dekodiert EncodedAudioChunk Objekte.
VideoDecoder: Dekodiert EncodedVideoChunk Objekte.
AudioEncoder: Kodiert AudioData Objekte.
VideoEncoder: Kodiert VideoFrame Objekte.
EncodedAudioChunk: Repräsentiert codec-spezifische kodierte Audio-Bytes.
EncodedVideoChunk: Repräsentiert codec-spezifische kodierte Video-Bytes.
AudioData: Repräsentiert unkodierte Audiodaten.
VideoFrame: Repräsentiert einen Frame von unkodierten Videodaten.
VideoColorSpace: Repräsentiert den Farbraum eines Videoframes.
ImageDecoder: Entpackt und dekodiert Bilddaten und gibt Zugriff auf die Sequenz von Frames in einem animierten Bild.
ImageTrackList: Repräsentiert die Liste der verfügbaren Spuren im Bild.
ImageTrack: Repräsentiert eine einzelne Bildspur.

Beispiele

Im folgenden Beispiel werden Frames von einem MediaStreamTrackProcessor zurückgegeben und dann kodiert. Sehen Sie das vollständige Beispiel und lesen Sie mehr darüber im Artikel Videoverarbeitung mit WebCodecs.

let frameCounter = 0;
const track = stream.getVideoTracks()[0];
const mediaProcessor = new MediaStreamTrackProcessor(track);
const reader = mediaProcessor.readable.getReader();
while (true) {
  const result = await reader.read();
  if (result.done) break;
  let frame = result.value;
  if (encoder.encodeQueueSize > 2) {
    // Too many frames in flight, encoder is overwhelmed
    // let's drop this frame.
    frame.close();
  } else {
    frameCounter++;
    const insertKeyframe = frameCounter % 150 === 0;
    encoder.encode(frame, { keyFrame: insertKeyframe });
    frame.close();
  }
}

Siehe auch

Help improve MDN

Learn how to contribute Diese Seite wurde automatisch aus dem Englischen übersetzt.

Übersetzung auf GitHub anzeigen • Fehler mit dieser Übersetzung melden