<audio> : l'élément audio embarqué

Baseline Widely available *

This feature is well established and works across many devices and browser versions. It’s been available across browsers since July 2015.

* Some parts of this feature may have varying levels of support.

L'élément HTML <audio> est utilisé afin d'intégrer un contenu sonore dans un document. Il peut contenir une ou plusieurs sources audio représentées avec l'attribut src ou l'élément <source> : le navigateur choisira celle qui convient le mieux. Il peut également être la destination de médias diffusés en continu, en utilisant un MediaStream.

Exemple interactif

<figure>
  <figcaption>Listen to the T-Rex:</figcaption>
  <audio controls src="/shared-assets/audio/t-rex-roar.mp3"></audio>
  <a href="/shared-assets/audio/t-rex-roar.mp3"> Download audio </a>
</figure>

figure {
  margin: 0;
}

L'exemple qui précède illustre le fonctionnement simple d'un élément <audio>, à la façon de ce qui peut être fait pour une image avec l'élément <img> : on inclut un chemin vers la ressource grâce à l'attribut src et on peut ajouter d'autres attributs afin de fournir d'autres informations : lecture automatique, lecture en boucle, utilisation des contrôles par défaut du navigateur, etc.

Le contenu présent à l'intérieur des balises <audio></audio> est affiché comme contenu alternatif lorsque le navigateur ne prend pas en charge l'élément.

Attributs

Cet élément inclut les attributs universels.

autoplay

Un attribut booléen : s'il est spécifié, l'audio commencera automatiquement la lecture dès qu'il pourra le faire, sans attendre la fin du téléchargement de l'ensemble du fichier audio.

Note : Les sites qui diffusent automatiquement de l'audio (ou des vidéos avec une piste audio) peuvent s'avérer désagréables pour les utilisateurs et doivent donc être évités dans la mesure du possible. Si vous devez offrir une fonctionnalité de lecture automatique, vous devez la soumettre au choix de l'utilisateur. Cependant, cela peut être utile lors de la création d'éléments médias dont la source sera définie ultérieurement, sous le contrôle de l'utilisateur. Consultez notre guide sur la lecture automatique pour obtenir des informations supplémentaires sur la manière d'utiliser correctement la fonction autoplay.

controls

Si l'attribut est présent, le navigateur affichera des contrôles pour que l'utilisateur puisse gérer la lecture, le volume, et le déplacement du curseur de lecture.

crossorigin

Cet attribut à valeur contrainte indique comment le CORS doit être utilisé afin de récupérer la ressource. Les ressources utilisant le CORS peuvent être réutilisées dans un élément <canvas> sans corrompre celui-ci. Les valeurs autorisées pour cet attribut sont :

anonymous: Une requête multi-origine est envoyée sans information d'authentification. Autrement dit, l'en-tête HTTP Origin est envoyé sans cookie, certificat X.509 ou sans authentification HTTP. Si le serveur ne fournit pas d'information d'authentification au site d'origine (sans indiquer l'en-tête Access-Control-Allow-Origin), la ressource sera corrompue (tainted) et son utilisation sera restreinte.
use-credentials: Une requête multi-origine est envoyée avec une information d'authentification (c'est-à-dire avec un en-tête HTTP Origin: qui contient un cookie, un certificat ou effectuant une authentification HTTP).

Lorsque cet attribut n'est pas présent, la ressource est récupérée sans requête CORS et empêche ainsi d'utiliser la ressource dans un <canvas>. Si la valeur fournie est invalide, elle sera considérée comme anonymous. Voir Paramétrage des attributs relatifs au CORS pour plus d'informations.

disableRemotePlayback Expérimental

Un attribut booléen utilisé pour désactiver la capacité de lecture à distance dans les appareils qui sont connectés à l'aide de câbles (HDMI, DVI, etc.) et sans fil (Miracast, Chromecast, DLNA, AirPlay, etc.). Voir cette proposition de spécification pour plus d'informations.

Note : Dans Safari, vous pouvez utiliser x-webkit-airplay="deny" comme solution de repli.

loop

Un attribut booléen. S'il est renseigné, la lecture du fichier se fera en boucle.

muted

Un attribut booléen, indiquant si le son de l'élément audio est initialement coupé. Sa valeur par défaut est false.

preload

Cet attribut indique au navigateur ce que l'auteur du code html pense de l'utilisation optimale de cet élément. Il accepte uniquement les valeurs suivantes :

none : Indique que l'élément audio ne devrait pas être mis en cache
metadata : Indique que seules les méta-données (comme la durée) sont préchargées
auto : Indique que tout le fichier peut être téléchargé, même s'il n'est pas certain que l'utilisateur le lira
"" (chaîne de caractères vide) : Un synonyme de auto

La valeur par défaut peut varier d'un navigateur à l'autre. Les spécifications recommandent la valeur metadata.

Note :

L'attribut autoplay a la priorité sur preload. Si autoplay est spécifié, le navigateur devrait évidemment commencer à télécharger l'audio pour le lire.
La spécification n'oblige pas le navigateur à suivre la valeur de cet attribut ; il s'agit d'une simple indication.

src

L'URL du fichier audio à intégrer. Cet élément est soumis aux contrôles d'accès HTTP. Cet attribut est facultatif ; vous pouvez utiliser l'élément <source> dans le bloc audio pour spécifier l'audio à intégrer.

Évènements

Nom de l'évènement	Condition du déclenchement
audioprocess	La mémoire tampon en entrée d'un `ScriptProcessorNode` peut désormais être traité.
`canplay`	Le navigateur peut lire le média mais estime que trop peu de données ont été chargées pour lire le média jusqu'à sa fin (il faudra vraisemblablement un arrêt pour un chargement en mémoire tampon).
`canplaythrough`	Le navigateur estime qu'il peut lire le média jusqu'à sa fin, sans avoir à interrompre la lecture par du chargement en mémoire tampon.
complete	Le rendu d'un `OfflineAudioContext` est terminé.
`durationchange`	L'attribut `duration` a été mis à jour.
`emptied`	Le média est devenu vide. Cela peut par exemple se produire lorsque le média a déjà été (partiellement ou complètement) chargé et que la méthode `load()` est invoquée pour le recharger.
`ended`	La lecture a été interrompue car la fin du média est atteinte.
`loadeddata`	La première frame du média a été chargée.
`loadedmetadata`	Les métadonnées ont été chargées.
`pause`	La lecture a été mise en pause.
`play`	La lecture a démarré.
`playing`	La lecture est prête à être lancée après avoir été mise en pause ou interrompue pour un chargement en mémoire de données.
`ratechange`	La vitesse de lecture a changé.
`seeked`	Une opération de déplacement du curseur de lecture (seek) est terminée.
`seeking`	Une opération de déplacement du curseur de lecture (seek) a été initiée.
`stalled`	L'agent utilisateur tente de récupérer les données associées au média mais les données ne parviennent pas.
`suspend`	Le chargement des données du média ont été suspendues.
`timeupdate`	Le temps décrit par l'attribut `currentTime` a été mis à jour.
`volumechange`	Le volume a été modifié.
`waiting`	La lecture a été interrompue en raison d'un manque temporaire de données.

Notes d'utilisation

Les navigateurs ne prennent pas tous en charge les mêmes types de fichiers et codecs audio ; vous pouvez fournir plusieurs sources à l'intérieur d'éléments <source> imbriqués, et le navigateur utilisera alors le premier qu'il comprend :

html

<audio controls>
  <source src="myAudio.mp3" type="audio/mpeg" />
  <source src="myAudio.ogg" type="audio/ogg" />
  <p>
    Votre navigateur ne prend pas en charge l'audio HTML5. Voici un
    <a href="myAudio.mp3">lien vers le fichier audio</a> à la place.
  </p>
</audio>

Nous proposons un guide substantiel et complet des types de fichiers médias et des codecs audio qui peuvent être utilisés en leur sein. Est également disponible un guide des codecs supportés pour la vidéo.

Autres notes d'utilisation :

Si vous ne spécifiez pas l'attribut controls, le lecteur audio n'inclura pas les contrôles par défaut du navigateur. Vous pouvez toutefois créer vos propres contrôles personnalisés en utilisant JavaScript et l'API HTMLMediaElement.
Pour permettre un contrôle précis de votre contenu audio, les HTMLMediaElement retournent de nombreux événements différents. Cela fournit également un moyen de surveiller le processus de récupération de l'audio afin que vous puissiez surveiller les erreurs ou détecter quand suffisamment de ressources sont disponibles pour commencer à les lire ou à les manipuler.
Vous pouvez également utiliser l'API Web Audio pour générer et manipuler directement des flux audio à partir du code JavaScript plutôt que de diffuser des fichiers audio préexistants.
Les éléments <audio> ne peuvent pas avoir de sous-titres ou de légendes associés de la même manière que les éléments <video>. Voir WebVTT and Audio (en) par Ian Devlin pour des informations utiles et des solutions de contournement.

Une bonne source générale d'informations sur l'utilisation de <audio> est le tutoriel sur le contenu vidéo et audio.

Mise en forme avec CSS

L'élément <audio> n'a aucun affichage intrinsèque en dehors des contrôles par défaut du navigateur qui sont affichés lorsque l'attribut booléen controls est présent.

Les contrôles par défaut sont affichés avec display qui vaut inline par défaut et il est possible de changer cette valeur en block dans une feuille de style afin de pouvoir placer le contrôle au sein de la disposition, à moins de vouloir le placer en incise.

Les contrôles par défaut peuvent être mis en forme grâce à des propriétés qui influent sur l'ensemble du bloc. On peut ainsi utiliser border, border-radius, padding, margin, etc. Toutefois, il n'est pas possible de mettre en forme chacun des composants individuel du contrôle (on ne peut pas, par exemple, modifier la taille d'un des boutons ou leurs icones). Chaque navigateur peut avoir des contrôles par défaut qui soient différents.

Pour obtenir un aspect identique dans les différents navigateurs, il vous faudra créer vos propres contrôles afin de les baliser et de les mettre en forme à votre convenance puis d'utiliser JavaScript et l'API HTMLMediaElement pour manipuler les différentes fonctionnalités.

Le guide sur la mise en forme des lecteurs vidéo fournit quelques techniques utiles, bien qu'écrit à propos de l'élément <video>, certains concepts peuvent tout à fait s'appliquer aux éléments <audio>.

Détecter l'ajout et la suppression de pistes

Il est aussi possible de détecter lorsque des pistes sont ajoutées et supprimées sur un élément <audio> en écoutant les évènements addtrack et removetrack. Toutefois, ces évènements ne sont pas directement envoyés sur l'élément <audio> mais sur l'objet représentant la liste de pistes de l'élément <audio> et rattaché à l'élément HTMLMediaElement.

HTMLMediaElement.audioTracks: Un objet AudioTrackList contenant l'ensemble des pistes audio associées à l'élément. Un écouteur addtrack peut être associé à l'objet afin d'alerter lorsque de nouvelles pistes audio sont ajoutées à l'élément.
HTMLMediaElement.videoTracks: Un écouteur addtrack peut être ajouté à cet objet VideoTrackList afin d'alerter lorsque de nouvelles pistes vidéo sont ajoutées à l'élément.
HTMLMediaElement.textTracks: Un écouteur addtrack peut être ajouté à cet objet TextTrackList afin d'alerter lorsque de nouvelles pistes de texte sont ajoutées à l'élément.

Note : Bien qu'on parle ici d'un élément <audio>, il est possible qu'un tel élément possède des pistes vidéo et des pistes texte bien que la cohérence des interfaces puisse être mise à mal.

Ainsi, on pourra utiliser un fragment de code analogue à celui qui suit pour détecter si de nouvelles pistes sont ajoutées ou supprimées d'un élément <audio> :

let elem = document.querySelector("audio");

elem.audioTrackList.onaddtrack = function (event) {
  trackEditor.addTrack(event.track);
};

elem.audioTrackList.onremovetrack = function (event) {
  trackEditor.removeTrack(event.track);
};

Ce code permet de surveiller lorsque de nouvelles pistes audio sont ajoutées et supprimées. Lorsque c'est le cas, une fonction (non décrite ici) est invoquée afin de mettre à jour l'éditeur présenté à l'utilisateur avec la liste des pistes disponibles.

Il est aussi possible d'utiliser addEventListener() afin d'écouter les évènements addtrack et removetrack.

Exemples

Utilisation simple

html

<!-- Simple lecture audio -->
<audio src="AudioTest.ogg" autoplay>
  Votre navigateur ne supporte pas l'élément <code>audio</code>.
</audio>

Pour savoir quand l'autoplay fonctionne, comment obtenir la permission d'utiliser l'autoplay, et comment et quand il est approprié d'utiliser l'autoplay, consultez notre guide sur l'autoplay.

Utilisation de l'élément `<source>`

Cet exemple précise quelle piste audio intégrer en utilisant l'attribut src sur un élément <source> imbriqué plutôt que directement sur l'élément <audio>. Il est toujours utile d'inclure le type MIME du fichier à l'intérieur de l'attribut type, car le navigateur est capable de dire instantanément s'il peut lire ce fichier, et de ne pas perdre de temps dessus dans le cas contraire.

html

<audio controls="controls">
  <source src="toto.wav" type="audio/wav" />
  Votre navigateur ne prend pas en charge l'élément <code>audio</code>.
</audio>

Utilisation de plusieurs éléments `<source>`

Dans l'exemple qui suit, le navigateur essaiera de jouer le premier fichier correspondant au premier élément (celui avec le codec Opus) : s'il peut le lire, il n'interprète pas les suivants ; s'il ne peut pas le lire, il tente de lire le deuxième puis, si ce n'est toujours pas possible, le troisième (au format MP3) :

html

<audio controls="">
  <source src="toto.opus" type="audio/ogg; codecs=opus" />
  <source src="toto.ogg" type="audio/ogg; codecs=vorbis" />
  <source src="toto.mp3" type="audio/mpeg" />
</audio>

Accessibilité

Les éléments audio contenant des dialogues parlés doivent fournir des sous-titres et des transcriptions qui décrivent précisément le contenu. Les sous-titres, qui sont spécifiés à l'aide de WebVTT, ils permettent aux personnes souffrant de troubles auditifs ou ne pouvant pas utiliser le son de l'appareil de lire le fichier. Les transcriptions permettent aux personnes ayant besoin de plus de temps pour lire le contenu d'utiliser un format plus adéquat.

Si un service de sous-titre automatique est utilisé, il est nécessaire de vérifier le contenu généré afin de s'assurer qu'il correspond correctement à la source audio.

L'élément <audio> ne prend pas directement en charge le WebVTT. Vous devrez trouver une bibliothèque ou un framework qui vous offre cette capacité, ou écrire le code pour afficher les sous-titres vous-même. Une option consiste à lire votre audio à l'aide d'un élément <video>, qui prend en charge WebVTT.

En plus des dialogues parlés, les sous-titres et les transcriptions doivent également identifier la musique et les effets sonores qui communiquent des informations importantes. Cela inclut l'émotion et le ton. Par exemple, dans le WebVTT ci-dessous, notez l'utilisation de crochets pour donner un ton et un aperçu émotionnel au spectateur ; cela peut aider à établir l'ambiance autrement fournie par la musique, les sons non verbaux et les effets sonores cruciaux, et ainsi de suite.

1
00:00:00 --> 00:00:45
[Musique avec des trompettes sonnantes]

2
00:00:46 --> 00:00:51
Elle est où la poulette ?

16
00:00:52 --> 00:01:02
[sur un ton énervé] Vous rendez la poulette ou c'est plus vous qui donnez à manger aux lapins ?

Une autre bonne pratique consiste à fournir du contenu comme un lien de téléchargement comme méthode alternative pour les personnes qui utilisent un navigateur qui ne prend pas en charge <audio> :

html

<audio controls>
  <source src="monAudio.mp3" type="audio/mpeg" />
  <source src="monAudio.ogg" type="audio/ogg" />
  <p>
    Votre navigateur ne prend pas charge l'audio HTML. Voici
    <a href="monAudio.mp3">un lien de téléchargement</a> à la place.
  </p>
</audio>

Sous-titrage sur le web
Web Video Text Tracks Format (WebVTT)
WebAIM: Captions, Transcripts, and Audio Descriptions (en anglais)
Comprendre les règles WCAG 1.2
Understanding Success Criterion 1.2.1 | W3C Understanding WCAG 2.0 (en anglais)
Understanding Success Criterion 1.2.2 | W3C Understanding WCAG 2.0 (en anglais)

Résumé technique

Catégories de contenu	Contenu de flux, contenu phrasé, contenu intégré. Si l'attribut `controls` est utilisé : contenu interactif et contenu tangible.
Contenu autorisé	Si l'élément possède un attribut `src` : zéro ou plusieurs éléments `<track>`, suivis par du contenu transparent ne contenant pas d'éléments média, c'est-à-dire des éléments qui ne soient pas `<audio>` ou `<video>`. Sinon : zéro ou plusieurs éléments `<source>` suivis par un élément `<track>`, suivi par du contenu transparent ne contenant pas d'éléments média (ni `<audio>` ni `<video>`).
Omission de balises	Aucune, la balise d'ouverture et la balise de fermeture sont obligatoires.
Parents autorisés	Tout élément acceptant du contenu intégré.
Rôle ARIA implicite	Pas de rôle correspondant
Rôles ARIA autorisés	`application`
Interface DOM	`HTMLAudioElement`

Spécifications

Specification
HTML # the-audio-element

Compatibilité des navigateurs

Voir aussi

Technologies media Web
- Formats des conteneurs medias (types de fichiers)
- Guide des codecs audio utilisés sur le web
L'API Web Audio
HTMLAudioElement
L'élément <source>
L'élément <video>
Apprentissage : Contenu vidéo et audio
Les bases de l'audio multi-navigateur