Référence de JavaScript 1.5 Core:Objets globaux:RegExp
Un article de MDC.
Sommaire |
[modifier] Résumé
Objet Core
Un objet RegExp contient le masque d'une expression rationnelle (ou expression régulière). Il dispose de propriétés et de méthodes permettant d'utiliser cette expression rationnelle afin de rechercher et remplacer des occurrences dans des chaînes.
Outre les propriétés d'un objet RegExp individuel que l'on peut créer à l'aide de la fonction constructeur RegExp, l'objet RegExp prédéfini dispose de propriétés statiques qui sont définies chaque fois qu'une expression rationnelle est utilisée.
[modifier] Création
Sous la forme d'un texte littéral ou à l'aide de la fonction constructeur RegExp.
Le format littéral s'utilise comme suit :
/masque/flags
La fonction constructeur s'utilise comme ceci :
new RegExp("masque"[, "flags"])
[modifier] Paramètres
-
masque - le texte de l'expression rationnelle.
-
flags - si précisé, flags peut être une combinaison de n'importes quelles des valeurs suivantes :
g— recherche globale,i— ignorer la casse,m— recherche sur plusieurs lignes.
Remarquez que les paramètres du format littéral ne sont pas entourés de guillemets pour indiquer qu'il s'agit de chaînes, tandis que les paramètres de la fonction constructeur le sont. Ainsi, les expressions suivantes créeront la même expression rationnelle :
/ab+c/i
new RegExp("ab+c", "i")
[modifier] Description
Lorsque la fonction constructeur est utilisée, les règles normales d'échappement de chaînes (faire précéder les caractères spéciaux par \ lorsqu'ils font partie d'une chaîne) doivent être suivies. Par exemple, les deux lignes suivantes sont équivalentes :
re = new RegExp("\\w+")
re = /\w+/
[modifier] Caractères spéciaux dans les expressions régulières
| Caractère | Signification |
\ |
Pour les caractères qui sont habituellement traités littéralement, indique que le caractère suivant est spécial et n'est pas à être interprété littéralement. Par exemple, — ou — Pour les caractères qui sont habituellement traités spécialement, indique que le caractère suivant n'est pas spécial et doit être interprété littéralement. Par exemple, * est un caractères spécial qui signifie 0 occurrence ou plus du caractères qui précède ; par exemple, |
^ |
Indique le début de l'entrée. Si le flag de recherche sur plusieurs lignes est activé, signifie également ce qui se trouve directement après une rupture de ligne. Par exemple, |
$ |
Indique la fin de l'entrée. Si le flag de recherche sur plusieurs lignes est activé, signifie également ce qui précède immédiatement une rupture de ligne. Par exemple, |
* |
Correspond à l'apparence de l'élément qui précède 0 fois ou plus. Par exemple, |
+ |
Correspond à l'apparence de l'élément qui précède 1 ou plusieurs fois. Équivalent à Par exemple, |
? |
Correspond à l'apparence de l'élément qui précède 0 ou 1 fois. Par exemple, Si on l'utilise immédiatement après un des quantificateurs Est également utilisé dans les assertions avant, décrites aux lignes |
. |
(Le point) correspond à l'apparence de n'importe quel caractère à l'exception d'un caractère de nouvelle ligne:saut de ligne \n \r \u2028 or \u2029. Par exemple, |
(x) |
Trouve la chaîne Par exemple, |
(?:x) |
Trouve la chaîne |
x(?=y) |
Trouve la chaîne |
x(?!y) |
Trouve la chaîne
|
x|y |
Correspond à Par exemple, |
{n} |
Lorsque Par exemple, |
{n,} |
Lorsque Par exemple, |
{n,m} |
Lorsque Par exemple, |
[xyz] |
Un ensemble de caractères. Correspond à n'importe quel des caractères spécifiés. Un intervalle de caractères peut être spécifié à l'aide d'un tiret. Par exemple, |
[^xyz] |
La négation ou le complément d'un ensemble de caractères. Correspond à tout ce qui n'est pas compris entre les crochets. Un intervalle de caractères peut être spécifié à l'aide d'un tiret. Par exemple, |
[\b] |
Correspond à un retour arrière (backspace). À ne pas confondre avec |
\b |
Correspond à une limite de mot, comme un(e) espace. À ne pas confondre avec Par exemple, |
\B |
Correspond à une non-limite de mot. Par exemple, |
\cX |
Lorsque Par exemple, |
\d |
Correspond à un chiffre. Équivalent à Par exemple, |
\D |
Correspond à tout caractère qui n'est pas un chiffre. Équivalent à Par exemple, |
\f |
Correspond à un caractère form-feed. |
\n |
Correspond à un caractère linefeed (LF). |
\r |
Correspond à un caractère retour à la ligne (CR). |
\s |
Correspond à un seul caractère d'espacement, dont les espaces, tabulations, form feed, line feed, retours à la ligne et autres caractères espace Unicode.[1] Par exemple, |
\S |
Correspond à un seul caractère qui n'est pas un caractère d'espacement. [2] Par exemple, |
\t |
Correspond à un caractère de tabulation. |
\v |
Correspond à une tabulation verticale. |
\w |
Correspond à n'importe quel caractère alphanumérique (jeu latin de base), y compris le caractère souligné. Équivalent à Par exemple, |
\W |
Correspond à n'importe quel caractère non alphanumérique (jeu latin de base). Équivalent à Par exemple, |
\n |
Lorsque Par exemple, |
\0 |
Correspond à un caractère NUL. Ne pas faire suivre par un autre chiffre. |
\xhh |
Correspond au caractère de code |
\uhhhh |
Correspond au caractère de code code |
La notation littérale permet la compilation de l'expression rationnelle à l'évaluation de l'expression. Utilisez cette notation lorsque l'expression régulière restera constante. Par exemple, si vous l'utilisez pour construire une expression rationnelle utilisée dans une boucle, elle ne sera pas recompilée à chaque itération.
Le constructeur de l'objet RegExp, par exemple new RegExp("ab+c"), permet de compiler l'expression rationnelle à l'exécution. Utilisez la fonction constructeur lorsque vous savez que le masque de l'expression rationnelle changera, ou que vous ne le connaissez pas à l'avance et qu'il provient d'une autre source, comme une entrée de l'utilisateur.
Un objet prédéfini RegExp séparé est disponible dans chaque fenêtre, c'est-à-dire que chaque thread d'exécution JavaScript possède son propre objet RegExp. Comme chaque script est exécuté du début à la fin sans interruption dans son propre thread, cela permet de s'assurer que des scripts différents n'écrasent pas les valeurs de l'objet RegExp.
- ^ Equivalent to:
[\t\n\v\f\r \u00a0\u2000\u2001\u2002\u2003\u2004\u2005\u2006\u2007\u2008\u2009\u200a\u200b\u2028\u2029\u3000]
- ^ Equivalent to:
[^\t\n\v\f\r \u00a0\u2000\u2001\u2002\u2003\u2004\u2005\u2006\u2007\u2008\u2009\u200a\u200b\u2028\u2029\u3000]
[modifier] Propriétés
Notez que plusieurs des propriétés de RegExp disposent à la fois de noms longs et courts (comme dans Perl). Ces deux noms font toujours référence à la même valeur. Perl est le langage de programmation depuis lequel les expressions rationnelles de JavaScript ont été construites.
constructor : spécifie la fonction créant le prototype d'un objet.
global : indique si l'expression rationnelle doit être vérifiée sur toutes les occurrences possibles dans une chaîne, ou seulement la première. À partir de JavaScript 1.5, il s'agit d'une propriété d'une instance de RegExp, et non de l'objet global RegExp.
ignoreCase : indique si la casse doit être ignorée lors de la recherche d'une occurrence dans une chaîne. À partir de JavaScript 1.5, il s'agit d'une propriété d'une instance de RegExp, et non de l'objet global RegExp.
lastIndex : l'indice à partir duquel la recherche suivante doit s'effectuer. À partir de JavaScript 1.5, il s'agit d'une propriété d'une instance de RegExp, et non de l'objet global RegExp.
multiline : indique si la recherche dans les chaînes doit s'étendre sur plusieurs lignes. À partir de JavaScript 1.5, il s'agit d'une propriété d'une instance de RegExp, et non de l'objet global RegExp.
prototype : permet l'ajout de propriétés à tous les objets.
source : le texte du masque. À partir de JavaScript 1.5, il s'agit d'une propriété d'une instance de RegExp, et non de l'objet global RegExp.
[modifier] Méthodes
exec : exécute une recherche de correspondance dans la chaîne passée en paramètre.
test : cherche une correspondance dans la chaîne passée en paramètre.
toSource : renvoie une déclaration d'objet représentant l'objet spécifié ; cette valeur peut être utilisée pour créer un nouvel objet. Écrase la méthode Object.toSource.
toString: renvoie une chaîne représentant l'objet spécifié. Écrase la méthode Object.toString. En outre, cet objet hérite des méthodes watch et unwatch de Object.
[modifier] Exemples
[modifier] Exemple : utilisation de la méthode replace
Le script qui suit utilise la méthode replace pour inverser les mots dans la chaîne. Dans le texte de remplacement, il utilise «$1» et «$2» pour indiquer les résultats des parenthèses correspondantes dans le masque d'expression rationnelle.
var re = /(\w+)\s(\w+)/; var str = "Jean Dupont"; var newstr = str.replace(re, "$2, $1"); document.write(newstr);
Ce code affichera «Dupont, Jean».
[modifier] Voir aussi
- Le chapitre Guide JavaScript 1.5:Expressions rationnelles.