RegExp

Wystąpiły błędy skryptów na tej stronie. Mimo, że są one kierowane do redaktorów serwisu, można je częściowo przeglądać poniżej.

 

Podsumowanie

Obiekt główny

Obiekt regularnego wrażenia (ang. regular expression) zawiera wzór regularnego wyrażenia. Posiada ono właściwości i metody użycia tego wyrażenia regularnego do znalezienia i zamiany dopasowań w ciągach znaków.

W dodatku do właściwości pojedynczego obiektu wyrażenia regularnego, które tworzysz używając funkcji konstruktora RegExp, predefiniowany obiekt RegExp posiada własności statyczne, które są ustawione, kiedy jakiekolwiek wyrażenie regularne jest użyte.

Tworzony przez

Odpowiednik tekstowy lub funkcja-konstruktor RegExp.

Odpowiednik tekstowy jest używany jak poniżej:

/wzór/flagi

Konstruktor jest używany jak poniżej:

new RegExp("wzór"[, "flagi"])

Parametry

wzór 
Tekst wyrażenia regularnego.
flagi
Jeśli podane, flagi mogą mieć jakąkolwiek kombinację poniższych wartości: g - wyszukiwanie globalne, i - ignoruje wielkość liter, m - wyszukiwanie w wielu liniach.

Zauważ, że parametry w formacie tekstowym nie używają cudzysłowu do oznaczenia ciągów znaków, kiedy parametry funkcji konstruktora używają cudzysłów. Tak, więc poniższe wyrażenia tworzą to samo wyrażenie regularne:

/ab+c/i
new RegExp("ab+c", "i")

Opis

Podczas użycia funkcji konstruktora, standardowe znaki ucieczki (string escape rule, poprzedzanie znaków specjalnych backslash'’ "\" kiedy użyte w ciągu znaków) są wymagane. Na przykład poniższe dwa przykłady są identyczne:

re = new RegExp("\\w+")
re = /\w+/

Znaki specjalne w wyrażeniach regularnych

Znak Znaczenie
\

Dla znaków które zwykle są traktowane dosłownie, oznacza że następny znak jest specjalny i nie ma być interpretowany standardowo.

Na przykład, /b/ szuka znaku "b". Wstawiając backslash (\) przed b, to jest używając /\b/, znak staje się specjalny "znajdź granicę wyrazu".

-lub-

Dla znaków, które zwykle są traktowane jako specjalne oznacza, że następny znak jest zwykły powinien być interpretowany dosłownie.

Na przykład, * jest znakiem specjalnym oznaczającym 0 lub więcej wystąpień poprzedzającego znaku powinno być znalezionych; na przykład, /a*/ oznacza "znajdź 0 lub więcej znaków a". Aby znaleźć dosłownie *, poprzedź ten znak backslashem (\), na przykład /a\*/ znajduje "a*".

^

Znajduje początek wejścia. Jeśli flaga wielu linii (ang. multiline) jest ustawiona na prawda (true), znajduje również od razu po znaku nowej linii.

Na przykład, /^B/ nie znajdzie "B" w "Andrzej B" ale znajdzie "B" w "Bogusław A".

$

Oznacza koniec wejścia. Jeśli flaga wielu linii (ang. multiline) jest ustawiona na prawda (true), znajduje również bezpośrednio przed znakiem końca linii.

Na przykład, /t$/ nie najdzie "a" w "mrówkojad" ale znajdzie "a" w "mrówka".

*

Znajduje poprzedzającą pozycję 0 lub więcej razy.

Na przykład, /bu*/ znajdzie "buuuu" w "Duch krzyknął buuuu" i "b" w "Głośnik zabrzmiał basowo" ale nic w "Ptak zaśpiewał".

+

Znajduje poprzedzającą pozycję 1 lub więcej razy. Równoważne do {1,}.

Na przykład, /r+/ dopasuje się do "r" w "cukierek" i do wszystkich "r" w "cukierrrrrrrek".

?

Znajduje poprzedzającą pozycję 0 razy lub 1 raz.

Na przykład /o?ąt?/ znajdzie "oł" w "anioł" i "ąt" w "kąt".

Jeśli zostanie użyte zaraz po którymś ze znaków *, +, ?, lub {}, to wymusza przejście do trybu niezachłannego (domyślne jest dopasowanie zachłanne), czyli dopasowanie następuje do najmniejszego ciągu spełniającego wyrażenie, a nie do największego.

Pytajnik używany jest także w lookahead assertions, opisanych pod (?=), (?!) i (?:) w tej tabeli.

.

(Kropka) znajduje jakikolwiek pojedynczy znak poza znakiem nowej linii.

Na przykład, /.a/ znajdzie "ja" i "na" w "jabłko rośnie na drzewie ale arbuz nie", ale nie znajdzie "al" i "ar".

(x)

Znajduje "x" i zapamiętuje to dopasowanie. Nazywa się to "nawiasy wychwytujące" (ang. capturing parentheses).

Na przykład, /(foo)/ znajduje i zapamiętuje "foo" w "foo bar". Znaleziony pod-ciąg (substring) może być ponownie wywołany elementów tablicy wynikowej {{ mediawiki.external(1) }}, ..., {{ mediawiki.external('n') }} jak również z predefiniowanych własności obiektu RegExp, $1, ..., $9.

(?:x)

Znajduje "x", ale nie pamięta dopasowania. Nazywa się to "nawiasy niewychwytujące" (ang. non-capturing parentheses). Znaleziony podciąg (substring) nie może być wywołany ponownie z elementów wynikowych tablicy {{ mediawiki.external(1) }}, ..., {{ mediawiki.external('n') }} ani za pomocą właściwości obiektu RegExp, $1, ..., $9.

x(?=y)

Znajduje "x", tylko wtedy, gdy zaraz po "x" jest "y". Na przykład, /Jacek(?=Szprotka)/ znajdzie "Jacek" tylko, jeśli zaraz po tym jest wyraz "Szprotka". /Jacek(?=Szprotka|Mróz)/ znajdzie "Jacek" tylko, jeśli po tym jest zaraz wyraz "Szprotka" lub "Mróz"). Jednakże, ani "Szprotka" ani "Mróz" nie jest częścią wyników.

x(?!y)

Znajduje "x", tylko, jeśli po "x" nie ma "y". Na przykład, /\d+(?!\,)/ zostanie dopasowane do liczby całkowitej, tylko jeśli nie ma po niej przecinka.

/\d+(?!\,)/.exec("3,141") zostanie dopasowane tylko do 141, nie zostanie dopasowane do 3, bo wystąpił po niej przecinek.

x|y

Znajduje "x" lub "y".

Na przykład, /zielone|czerwone/ znajdzie "zielone" w "zielone jabłko" i "czerwone" w "czerwone jabłko".

{n}

Gdzie n jest pozytywną liczbą całkowitą. Znajduje dokładnie n wystąpień poprzedzającej pozycji.

Na przykład, /u{2}/ nie znajdzie "u" w "cukierek", ale znajdzie wszystkie "u" w "cuukierek" i pierwsze dwa "u" w "cuuukierek".

{n,}

Gdzie n jest pozytywną liczbą całkowitą. Znajduje, co najmniej n wystąpień poprzedzającej pozycji.

Na przykład, /u{2,}/ nie znajdzie "u" w "cukierek", ale znajdzie wszystkie "u" w "cuukierek" i w "cuuukierek".

{n,m}

Gdzie n i m są pozytywnymi liczbami całkowitymi. Wyszukuje, co najmniej n i co najwyżej m wystąpień poprzedzającego wyrażenia.

Na przykład, /u{1,3}/ nie znajdzie niczego w "ckierek", znajdzie "u" w "cukierek", znajdzie dwa "u" w "cuukierek" i pierwsze trzy "u" w "cuuuuukierek". Zauważ, że podczas wyszukiwania w "cuuuuukierek", wynik wyszukiwania to "uuu" mimo iż ciąg oryginalny zawiera więcej liter "u".

{{ mediawiki.external('xyz') }}

Zestaw znaków. Wyszukuje jakikolwiek z podanych znaków. Możesz podać przedział znaków używając myślnika.

Na przykład, {{ mediawiki.external('abcd') }} oznacza tyle samo, co {{ mediawiki.external('a-d') }}. Wyrażenia te znajdą "b" w "buziak" i "d" w "kasza".

{{ mediawiki.external('^xyz') }}

Przeciwny zestaw znaków. Wyszukuje cokolwiek, co nie jest wewnątrz nawiasów. Podobnie jak powyżej można podać zakres znaków używając myślnika.

Na przykład, {{ mediawiki.external('^abc') }} oznacza tyle samo, co {{ mediawiki.external('^a-c') }}. Wyrażenia te znajdą "u" w "buziak" i "k" w "kasza".

{{ mediawiki.external('\\b') }}

Wyszukuje znak backspace (nie mylić z \b).

\b

Wyszukuje granicę wyrazów (ang. word boundary), jak na przykład spację (nie mylić z {{ mediawiki.external('\\b') }}).

Na przykład, /\bn\w/ zaznaczy "no" w "noonday"; /\wy\b/ zaznaczy "ly" w "possibly yesterday".

\B

Znajduje brak granicy niewyrazu (ang. non-word boundary).

Na przykład, /\w\Bn/ zaznaczy "on" w "noonday", a /y\B\w/ zaznaczy "ye" w "possibly yesterday".

\cX

Gdzie X jest literą od A do Z. Zaznacza znak kontrolny w ciągu.

Na przykład, /\cM/ zaznaczy control-M w stringu.

\d

Znajduje cyfrę. Odpowiednik {{ mediawiki.external('0-9') }}.

Na przykład, /\d/ lub /{{ mediawiki.external('0-9') }}/<code> zaznaczy "2" w "B2 jest numerem pokoju". </td> </tr>

<code>\D

Wyszukuje jakikolwiek znak nieliczbowy. Odpowiednik {{ mediawiki.external('^0-9') }}.

Na przykład, /\D/ lub /{{ mediawiki.external('^0-9') }}/ zaznaczy "B" w "B2 jest numerem pokoju".

\f

Znajduje znak wysuwu wiersza (form feed).

\n

Znajduje znak następnego wiersza (line feed).

\r

Znajduje znak powrotu karetki (carriage return).

\s

Znajduje pojedynczy biały znak (ang. white space character), wliczając w to spację, tabulator, znak wysuwu wiersza, znak następnego wiersza. Odpowiednik {{ mediawiki.external(' \\f\\n\\r\\t\\u00A0\\u2028\\u2029') }}.

Na przykład, /\s\w*/ zaznaczy " bar" w "foo bar".

\S

Zaznacza jakikolwiek znak inny niż biały (ang. white space). Odpowiednik {{ mediawiki.external('^ \\f\\n\\r\\t\\u00A0\\u2028\\u2029') }}.

Na przykład, /\S/\w* zaznaczy "foo" w "foo bar".

\t

Znajduje tabulator.

\v

Znajduje pionowy tabulator (ang. vertical tab).

\w

Znajduje jakikolwiek znak alfanumeryczny i znak podkreślenia _. Odpowiednik {{ mediawiki.external('A-Za-z0-9_') }}.

Na przykład, /\w/ zaznaczy "j" w "jabłko", "5" w "??5.28", i "3" w "3D".

\W

Zaznaczy jakikolwiek znak niewyrazowy. Odpowiednik {{ mediawiki.external('^A-Za-z0-9_') }}.

Na przykład, /\W/ lub /{{ mediawiki.external('^$A-Za-z0-9_') }}/ znajdzie "%" w "50%".

\n

Gdzie n jest pozytywną liczbą całkowitą. Odwołanie wsteczne (ang. back reference) do ostatniego podciągu (substring) pasującego do n wyrażenia umieszczonego w nawiasie (licząc od nawiasu otwierającego "(").

Na przykład, /jabłko(,)\spomarańcz\1/ pasuje do "jabłko, pomarańcz," w "jabłko, pomarańcz, wiśnia, brzoskwinia". Dokładniejszy przykład znajduje się po tabeli.

\0

Wyszukuje znak NUL. Bezpośrednio po \0 nie powinna znajdować się żadna liczba.

\xhh

Znajduje znak o kodzie hh (dwie cyfry szesnastkowe)

\uhhhh

Znajduje znak o kodzie hhhh (cztery cyfry szesnastkowe).

Notacja tekstowa zostaje skompilowana, kiedy wyrażenie regularne jest wykonane. Używaj notacji tekstowej wtedy, kiedy wyrażenie regularne pozostanie niezmienione. Na przykład, jeśli użyjesz notacji tekstowej do konstrukcji wyrażenia regularnego w pętli, wyrażenie to nie zostanie przekompilowane podczas każdej iteracji.

Konstruktor obiektu wyrażenia regularnego, na przykład new RegExp("ab+c"), pozwala na kompilację podczas czasu wykonywania (ang. runtime compilation) wyrażenia. Używaj funkcji konstruktora, kiedy wiesz, że wzór wyrażenia regularnego będzie się zmieniać lub gdy nie znasz tego wzoru i pobierasz go z innego źródła, jak na przykład wejście użytkownika.

Oddzielny predefiniowany obiekt RegExp jest dostępny dla każdego okna, to jest każdy oddzielny wątek uruchomienia JavaScriptu dostaje jego własny obiekt RegExp. Jako że każdy skrypt uruchamiany jest cały w oddzielnym wątku, zapewnia to, iż oddzielne skrypty nie nadpisują wartości obiektu RegExp.

Własności

Zauważ, że niektóre własności obiektu RegExp mają dwie nazwy: długą i krótką (Perlową). Obydwie nazwy zawsze odwołują się do tej samej wartości. Perl jest językiem programowania, z którego uformowały się wyrażenia regularne JavaScriptu.

constructor: Określa funkcję, która tworzy prototyp obiektu.

global: Czy przeszukiwać cały ciąg w poszukiwaniu wszystkich możliwych dopasowań czy tylko w poszukiwaniu pierwszego. W JavaScripcie 1.5, własności instancji RegExp, a nie obiektu.

ignoreCase: Czy ignorować wielkość liter podczas wyszukiwania. W JavaScripcie 1.5, własności instancji RegExp, a nie obiektu.

lastIndex: Indeks, od którego rozpoczynać następne szukanie. W JavaScripcie 1.5, własności instancji RegExp, a nie obiektu.

multiline: Czy w ciągach z wieloma liniami, szukać w wielu liniach. W JavaScripcie 1.5, własności instancji RegExp, a nie obiektu.

prototype: Pozwala na dodanie własności wszystkim obiektom.

source: Tekst wzoru. W JavaScripcie 1.5, własności instancji RegExp, a nie obiektu.

Metody

exec: Uruchamia wyszukiwanie dopasowania w ciągu podanym poprzez parametr tej metody.

test: Testuje dopasowanie w ciągu podanym poprzez parametr tej metody.

toSource: Zwraca literał obiektu reprezentujący podany obiekt; możesz użyć tej wartości do utworzenia nowego obiektu. Przesłania metodę Object.toSource.

toString: Zwraca ciąg znaków reprezentujący podany obiekt. Przesłania metodę Object.toString.

W dodatku, obiekt ten dziedziczy metody watch i unwatch z Object.

Przykłady

Przykład: Zastosowanie metody replace

Poniższy przykład używa metodę replace do zamiany wyrazów w ciągu (stringu). Podczas zamiany tekstu, skrypt używa "$1" i "$2" do oznaczenia wyników odpowiadających im nawiasów we wzorze wyrażenia regularnego.

var re = /(\w+)\s(\w+)/;
var str = "Jan Kowalski";
var newstr = str.replace(re, "$2, $1");
document.write(newstr);

Wyświetli to "Kowalski, Jan".

Przykład: Zastosowanie input

W poniższym przykładzie, RegExp.input jest ustawiony poprzez zdarzenie (ang. event) Change. W funkcji getInfo, metoda exec używa wartości RegExec.input jako jej argument.

<script LANGUAGE="JavaScript1.2">
function getInfo(elem) {
   var re = /(\w+)\s(\d+)/;
   var m = re.exec(elem.value);
   window.alert(m[1] + ", twój wiek to " + m[2]);
}
</script>

Podaj swoje imię i twój wiek, następnie wciśnij Enter.

<form>
<input type="text" name="NameAge" onchange="getInfo(this);"/>
</form>

Zobacz także

{{ languages( { "en": "en/Core_JavaScript_1.5_Reference/Global_Objects/RegExp", "fr": "fr/R\u00e9f\u00e9rence_de_JavaScript_1.5_Core/Objets_globaux/RegExp", "ja": "ja/Core_JavaScript_1.5_Reference/Global_Objects/RegExp" } ) }}

Autorzy i etykiety dokumentu

Autorzy tej strony: Marcoos, VooEak, Mysz, Mgjbot, Ptak82, Nux
Ostatnia aktualizacja: Nux,