RegExp

Erschafft ein reguläres Ausdrucksobjekt für musterbasierten Textvergleich.

Für eine Einführung darüber, was reguläre Ausdrücke sind, lesen Sie das Kapitel Regular Expressions im JavaScript Guide (englisch).

Syntax

/muster/flags

RegExp(muster [, flags])

Parameter

muster
Text des regulären Ausdrucks.
flags

Optional, flags kann eine Zeichenkette mit einer beliebige Kombination folgender Werte sein:

g
globale Suche (nach einem Treffer fortsetzen)
i
Groß-/Kleinschreibung ignorieren
m
multiline; behandelt den Suchkontext als Mehrfachzeilen, d.h. Anfang- und Endeanker (^ und $) entsprechen dem Anfang bzw. Ende jeder einzelnen Zeile (begrenzt durch \n oder \r), nicht nur dem Anfang und Ende der gesamten zu durchsuchenden Zeichenkette.
y
sticky; matches only from the index indicated by the lastIndex property of this regular expression in the target string (and does not attempt to match from any later indexes). This allows the match-only-at-start capabilities of the character "^" to effectively be used at any location in a string by changing the value of the lastIndex property.

Beschreibung

Es bestehen zwei Möglichkeiten, ein RegExp-Objekt zu erzeugen: Eine literale Notation und ein Konstruktor. To indicate strings, the parameters to the literal notation do not use quotation marks while the parameters to the constructor function do use quotation marks. So the following expressions create the same regular expression:

/ab+c/i;
new RegExp("ab+c", "i");

Die literale Notation stellt eine Kompilierung des regulären Ausdrucks während der Auswertung des Ausdrucks bereit. Nutzen Sie die literale Notation, wenn der reguläre Ausdruck unverändert bleiben wird. Wenn Sie zum Beispiel die literale Notation für die Erzeugung eines regulären Ausdruck verwenden, um ihn in einer Schleife zu anzuwenden, wird der reguläre Ausdruck nicht in jedem Schleifendurchlauf rekompiliert.

Der Konstruktor des RegExp-Objekt, z.B. new RegExp("ab+c"), stellt eine Laufzeitkompilierung des regulären Ausdrucks bereit. Nutzen Sie die Konstruktor-Funktion, wenn sich das reguläre Suchmuster ändern wird oder Sie das Muster nicht kennen und es aus einer anderen Quelle wie z.B. einer Benutzereingabe beziehen.

Bei Verwendung der Konstruktor-Funktion sind die normalen Zeichenfolgenmaskierungsregeln (voranstellen eines Rückwärtsschrägstrichs (\) vor Sonderzeichen innerhalb von Zeichenketten) einzuhalten. Zum Beispiel sind folgende Zeilen äquivalent:

var re = /\w+/;
var re = new RegExp("\\w+");

Bedeutung spezieller Zeichen in regulären Ausdrücken

Zeichenklassen
Zeichen Bedeutung
.

(Punkt, Satzendezeichen) stimmt mit jedem Einzelzeichen außer den Zeilenvorschub- und Wagenrücklaufzeichen (\n \r \u2028 oder \u2029) überein.

Zu beachten ist, daß das m multiline flag nicht das Punktverhalten verändert. Um ein Musterentsprechung über mehrere Zeilen hinweg zu erreichen, kann die leere negative Zeichenauswahl [^] verwendet werden, sie stimmt mit jedem Zeichen einschließlich Zeilenumbrüchen überein.

/.y/ passt z.B. auf "my" und "ay", nicht aber auf "yes"  in "yes make my day".

\d

Stimmt mit einer arabischen Ziffer überein. Äquivalent zu [0-9].

/\d/ or /[0-9]/ passt z.B. auf '2' in "B2 ist die Zimmernummer."

\D

Stimmt mit jedem Zeichen überein, das keine arabische Ziffer ist. Äquivalent zu [^0-9].

/\D/ or /[^0-9]/ passt z.B. auf 'B' in "B2 ist die Zimmernummer."

\w

Stimmt mit einem alphanumerischen Zeichen (Wortzeichen) einschließlich dem Unterstrich überein. Äquivalent zu [A-Za-z0-9_].

/\w/ passt zum Beispiel auf 'A' in "Apfel", '5' in "€5,28," und '3' in "3D."

\W

Stimmt mit jedem Zeichen überein, das kein alphanumerisches Zeichen (Wortzeichen) ist. Äquivalent zu [^A-Za-z0-9_].

/\W/ or /[^A-Za-z0-9_]/ passt z.B. auf '%' in "50%."

\s

Stimmt mit einem einzelnen Leerraumzeichen überein (Leerzeichen, Tabulator, Seitenvorschub, Zeilenvorschub und weitere Unicode-Zeichen). Äquivalent zu [ \f\n\r\t\v​\u00a0\u1680​\u180e\u2000​\u2001\u2002​\u2003\u2004​ \u2005\u2006​\u2007\u2008​\u2009\u200a​\u2028\u2029​​\u202f\u205f​ \u3000].

/\s\w*/ passt z.B. auf ' bar' in "foo bar."

\S

Stimmt mit einem einzelnen Zeichen überein, das kein Leerraumzeichen ist. (Nicht-Leerraumzeichen).
Äquivalent zu [^\s] und zu [^ \f\n\r\t\v​\u00a0\u1680​\u180e\u2000​\u2001\u2002​\u2003\u2004​ \u2005\u2006​\u2007\u2008​\u2009\u200a​\u2028\u2029​​\u202f\u205f​ \u3000].

/\S\w*/ passt z.B. auf 'foo' in "foo bar."

\t Stimmt mit einem Tabulatorzeichen überein.
\r Stimmt mit einem Wagenrücklaufzeichen überein.
\n Stimmt mit einem Zeilenvorschub überein.
\v Stimmt mit einem vertikalen Tabulatorzeichen überein.
\f Stimmt mit einem Seitenvorschub überein.
[\b]

Stimmt mit einem Rücklöschzeichen (Backspace) überein. (Nicht zuverwechseln mit \b)

\0 Stimmt mit einem NUL-Zeichen überein. (Keine weiteren Ziffern dürfen folgen!)
\cX

Wobei X ein Buchstabe von A - Z ist. Stimmt mit einem Steuerzeichen überein.

/\cM/ passt z.B. auf Steuerung-M in einer Zeichenkette.

\xhh

Stimmt mit einem Zeichen mit dem Code hh (zwei hexadezimale Ziffern) überein.

/foo\x20bar/ passt z.B. auf 'o b' in "foo bar".

\uhhhh Stimmt mit einem Zeichen mit dem Unicode hhhh (vier hexadezimale Ziffern) überein.
\

Bei einem Zeichen, das normalerweise als Literal behandelt wird, signalisiert ein vorangestellter Rückschrägstrich, daß es als Spezialzeichen und nicht als Literal zu interpretieren ist.

Z.B. passt /b/ auf das Zeichen 'b'. Durch Voranstellen des Rückschrägstriches vor das "b", also /\b/, bekommt das Zeichen eine besondere Bedeutung und passt auf eine Wordgrenze.

oder

Bei einem Zeichen, das normalerweise als Zeichen mit spezieller Bedeutung interpretiert wird, signalisiert ein vorangestellter Rückschrägstrich, daß es ohne besondere Bedeutung als Literal interpretiert werden soll.

Zum Beispiel ist * Quantor-Spezialzeichen, das eine Übereinstimmung mit null oder mehreren Vorkommen des vorausgehenden Zeichens bedeutet; z.B. bedeutet /a*/ eine Übereinstimmung von null oder mehr "a"s. Um dem "*" als Literal zu entsprechen, wird ein Rückschrägstrich vorangestellt; z.B. passt /a\*/ auf 'a*'.

Zeichenauswahl

Zeichen Bedeutung
[xyz]

Zeichenauswahl, stimmt mit einem beliegen der eingeschlossenen Zeichen überein. Mittels eines Bindestriches kann ein Bereich von Zeichen angegeben werden.

[abcd] ist gleichbedeutend mit[a-d] und passt auf 'b' in "brisket" und 'c' in "chop".

[^xyz]

Eine negative bzw. komplementäre Zeichenauswahl. Das bedeutet eine Übereinstimmung mit jedem Zeichen, das nicht in den eckigen Klammern eingeschlossen ist. Mittels eines Bindestriches kann ein Bereich von Zeichen angegeben werden.

Zum Beispiel ist [^abc] gleichbedeutend mit [^a-c]. Beides passt auf 'o' in "bacon" und 'h' in "chop."

Bereichsgrenzen
Zeichen Bedeutung
^

Stimmt mit dem Anfang eines Subjekts und, wenn das multiline flag gesetzt ist, auch mit der Stelle unmittelbar nach einem Zeilenumbruchzeichen überein.

/^A/ passt z.B. nicht auf 'E' in "ein E" aber auf das erste 'E' in "Ein E."

$

Stimmt mit dem Ende eines Subjekts und, wenn das multiline flag gesetzt ist, auch mit der Stelle unmittelbar vor einem Zeilenumbruchzeichen überein.

/t$/ passt z.B. auf das 't' in "Brot", nicht aber in "Brote".

\b

Stimmt mit einer null-breiten Wortgrenze wie zwischen einem Buchstaben und einem Leerzeichen überein. (Nicht zu verwechseln mit der Zeichenklasse [\b])

/\bno/ passt z.B. auf 'no' in "at noon"; /ly\b/ passt auf 'ly' in "possibly yesterday."

\B

Stimmt mit einer null-breiten Nichtwortgrenze wie zwischen zwei Buchstaben oder zwischen zwei Leerzeichen überein.

/\Bon/ passt z.B. auf 'on' in "at noon" und /ye\B/ passt auf 'ye' in "possibly yesterday."

Gruppierung und Rückwärtsreferenz
Zeichen Bedeutung
(x)

Stimmt mit x überein und speichert die Übereinstimmung. Dies wird auch capturing parentheses (engl., aufzeichnende Klammern) genannt.

/(foo)/ passt z.B. auf 'foo' in "foo bar" und speichert die Übereinstimmung. Aufgezeichnete Teilzeichenketten können aus den Elementen [1], ..., [n] des Ergebnisfelds (array) oder den Eigenschaften $1, ..., $9 des vordefinierten RegExp-Objekts ausgelesen werden.

Aufzeichnende Gruppierungen führen zu Performanzeinbußen. Wenn die übereinstimmenden Teilzeichenketten nicht wiederverwendet werden müssen, sind nicht aufzeichnende Klammern zu bevorzugen (siehe weiter unten).

\n

Wobei n eine positive Ganzzahl ist. Ein Rückbezug auf die zuletzt gefundene Teilzeichenkette, die der Übereinstimmung mit der n-ten runden Klammer im regulären Ausdruck entspricht (öffnende Klammern gezählt).

/apple(,)\sorange\1/ passt z.B. auf 'apple, orange,' in "apple, orange, cherry, peach." und zeichnet das Komma auf. Ein umfassenderes Beispiel folgt im Anschluss an diese Tabelle.

(?:x) Matches x but does not remember the match. These are called non-capturing parentheses. The matched substring can not be recalled from the resulting array's elements [1], ..., [n] or from the predefined RegExp object's properties $1, ..., $9.
Quantoren
Zeichen Bedeutung
*

Stimmt mit dem null- oder mehrmaligen Vorkommen des voranstehenden Zeichen überein.

/bo*/ passt z.B. auf 'boooo' in "A ghost booooed" und 'b' in "A bird warbled" aber auf nichts in "A goat grunted".

+

Stimmt mit dem ein- oder mehrmaligen Vorkommen des voranstehenden Zeichen überein. Äquivalent zu {1,}

/ca+/ passt z.B. auf 'ca' in "candy" und 'caaa' in "caaandy" aber auf nichts in "cindy".

*?
+?

Passt wie * and + weiter oben, aber der Ausdruck ist nicht gierig, d.h. er passt auf die kürzestmögliche Übereinstimmung.

/_.*?_/ passt z.B. auf "_foo_" in "_foo_ _bar_" aber nicht auf "_foo_ _bar_" wie der Ausdruck ohne dem ? hinterm *.

?

Stimmt mit dem null- oder einmaligen Vorkommen des voranstehenden Zeichen überein.

For example, /e?le?/ matches the 'el' in "angel" and the 'le' in "angle."

If used immediately after any of the quantifiers *, +, ?, or {}, makes the quantifier non-greedy (matching the minimum number of times), as opposed to the default, which is greedy (matching the maximum number of times).

Also used in lookahead assertions, described under (?=), (?!), and (?:) in this table.

x(?=y) Matches x only if x is followed by y. For example, /Jack(?=Sprat)/ matches 'Jack' only if it is followed by 'Sprat'. /Jack(?=Sprat|Frost)/ matches 'Jack' only if it is followed by 'Sprat' or 'Frost'. However, neither 'Sprat' nor 'Frost' is part of the match results.
x(?!y)

Matches x only if x is not followed by y. For example, /\d+(?!\.)/ matches a number only if it is not followed by a decimal point.

/\d+(?!\.)/.exec("3.141") matches 141 but not 3.141.

x|y

Matches either x or y.

For example, /green|red/ passt z.B. auf 'green' in "green apple" and 'red' in "red apple."

{n}

Wobei n eine positive Ganzzahl ist. Matches exactly n occurrences of the preceding item.

/a{2}/ passt z.B. auf beide 'a' in "caandy" und die ersten beiden 'a' in "caaandy", nicht aber auf das 'a' in "candy".

{n,}

Wobei n eine positive Ganzzahl ist. Matches at least n occurrences of the preceding item.

/a{2,}/ passt z.B. auf alle 'a' in "caandy" und in "caaaaaaandy.", nicht aber auf das 'a' in "candy".

{n,m}

Wobei n und m positive Ganzzahlen sind. Stimmt mit mindestens n und höchstens m Vorkommen des vorausgehenden Zeichens oder Teilausdrucks überein.

/a{1,3}/ passt z.B. auf nichts in "cndy", das 'a' in "candy," the beiden 'a' in "caandy," und die ersten drei 'a' in "caaaaaaandy". Es ist zu beachten, dass bei der Übereinstimmung in "caaaaaaandy" der Treffer "aaa" ist, obwohl in der Originalzeichenkette mehr 'a' vorhanden wären.

Fußnoten

  1. ^Equivalent to:

    [\t\n\v\f\r \u00a0\u2000\u2001\u2002\u2003\u2004\u2005\u2006\u2007\u2008\u2009\u200a\u200b\u2028\u2029\u3000]

  2. ^Equivalent to:

    [^\t\n\v\f\r \u00a0\u2000\u2001\u2002\u2003\u2004\u2005\u2006\u2007\u2008\u2009\u200a\u200b\u2028\u2029\u3000]

Eigenschaften

For properties available on RegExp instances, see Properties of RegExp instances.
prototype
Allows the addition of properties to all objects.
Properties inherited from Function:

Methoden

For methods available on RegExp instances, see Methods of RegExp instances.

The global RegExp object has no methods of its own, however, it does inherit some methods through the prototype chain.

Methods inherited from Function:

RegExp-Instanzen

Eigenschaften

See also deprecated RegExp properties.

Note that several of the RegExp properties have both long and short (Perl-like) names. Both names always refer to the same value. Perl is the programming language from which JavaScript modeled its regular expressions.

RegExp.prototype.constructor
Specifies the function that creates an object's prototype.
RegExp.prototype.flags
A string that contains the flags of the RegExp object.
RegExp.prototype.global
Whether to test the regular expression against all possible matches in a string, or only against the first.
RegExp.prototype.ignoreCase
Whether to ignore case while attempting a match in a string.
RegExp.prototype.multiline
Whether or not to search in strings across multiple lines.
RegExp.prototype.source
The text of the pattern.
RegExp.prototype.sticky
Whether or not the search is sticky.
RegExp.prototype.unicode
Whether or not Unicode features are enabled.

Methoden

RegExp.prototype.compile()
(Re-)compiles a regular expression during execution of a script.
RegExp.prototype.exec()
Executes a search for a match in its string parameter.
RegExp.prototype.test()
Tests for a match in its string parameter.
RegExp.prototype.toSource()
Returns an object literal representing the specified object; you can use this value to create a new object. Overrides the Object.prototype.toSource() method.
RegExp.prototype.toString()
Returns a string representing the specified object. Overrides the Object.prototype.toString() method.

Beispiele

Beispiel: Anwendung regulären Ausdrucks zur Datenformatänderung

The following script uses the replace method inherited by the String instance to match a name in the format first last and output it in the format last, first. In the replacement text, the script uses $1 and $2 to indicate the results of the corresponding matching parentheses in the regular expression pattern.

var re = /(\w+)\s(\w+)/;
var str = "John Smith";
var newstr = str.replace(re, "$2, $1");
print(newstr);

This displays "Smith, John".

Beispiel: Anwendung eines regulären Ausdrucks auf mehrzeilige Texte

var s = "Please yes\nmake my day!";
s.match(/yes.*day/);
// Returns null
s.match(/yes[^]*day/);
// Returns 'yes\nmake my day'

Beispiel: Anwendung eines regulären Ausdrucks mit dem "sticky" flag

This example demonstrates how one could use the sticky flag on regular expressions to match individual lines of multiline input.

var text = "First line\nSecond line";
var regex = /(\S+) line\n?/y;

var match = regex.exec(text);
print(match[1]);  // prints "First"
print(regex.lastIndex); // prints 11

var match2 = regex.exec(text);
print(match2[1]); // prints "Second"
print(regex.lastIndex); // prints "22"

var match3 = regex.exec(text);
print(match3 === null); // prints "true"

One can test at run-time whether the sticky flag is supported, using try { … } catch { … }. For this, either an eval(…) expression or the RegExp(regex-string, flags-string) syntax must be used (since the /regex/flags notation is processed at compile-time, so throws an exception before the catch block is encountered). For example:

var supports_sticky;
try { RegExp('','y'); supports_sticky = true; }
catch(e) { supports_sticky = false; }
alert(supports_sticky); // alerts "true"

Beispiel: Regulärer Ausdruck und Unicode-Zeichen

As mentioned above, \w or \W only matches ASCII based characters; for example, 'a' to 'z', 'A' to 'Z', 0 to 9 and '_'. To match characters from other languagessuch as Cyrillic or Hebrew, use \uhhhh., where "hhhh" is the character's Unicode value in hexadecimal. This example demonstrates how one can separate out Unicode characters from a word.

var text = "Образец text на русском языке";
var regex = /[\u0400-\u04FF]+/g;

var match = regex.exec(text);
print(match[0]);  // prints "Образец"
print(regex.lastIndex);  // prints "7"

var match2 = regex.exec(text);
print(match2[0]);  // prints "на" [did not print "text"]
print(regex.lastIndex);  // prints "15"

// and so on

Here's an external resource for getting the complete Unicode block range for different scripts: Regexp-unicode-block

Weitere nennenswerte Beispiele

Extracting subdomain name from URL
var url = "http://xxx.domain.com";
print(/[^.]+/.exec(url)[0].substr(7)); // prints "xxx"

Browserkompatibilität

Feature Chrome Firefox (Gecko) Internet Explorer Opera Safari (WebKit)
Basic support ? (Ja) ? ? ?
Feature Android Firefox Mobile (Gecko) IE Phone Opera Mobile Safari Mobile
Basic support ? (Ja) ? ? ?

Siehe auch

Schlagwörter des Dokuments und Mitwirkende

Mitwirkende an dieser Seite: fscholz, powerswitch, def00111, clone, lightspirit
Zuletzt aktualisiert von: fscholz,
Seitenleiste ausblenden