Регулярні вирази в JavaScript
Регулярні вирази - це формальна мова пошуку і здійснення маніпуляцій з підрядка в тексті, заснований на використанні метасимволів (символів-джокерів, англ. Wildcard characters). По суті це рядок-зразок, що складається з символів і метасимволів і задає правило пошуку.
Регулярні вирази використовуються деякими текстовими редакторами та допоміжних інструментах для пошуку та підстановки тексту. Наприклад, за допомогою регулярних виразів можна задати шаблони, що дозволяють:
- Знайти всі послідовності символів «коробка» у будь-якому контексті, як то: «коробка», «король»;
- Знайти окремо слово «кіт» і замінити його на «кішка»;
- Знайти слово «кіт», якому передує слово «персидський» або «чеширский»;
- Прибрати з тексту всі пропозиції, в яких згадується слово кіт або кішка.
Регулярні вирази дозволяють задавати і набагато більш складні шаблони пошуку або заміни.
Об'єкт RegExp
Створення
/ / Повна форма запису
var expr = new RegExp(pattern [, flags]);
/ / Скорочена форма запису (літеральний формат)
var expr = /pattern/flags;
Аргументи
pattern - шаблон пошуку (текст регулярного виразу).
flags - способи пошуку за шаблонами:
- G - глобальний пошук (обробляються всі збіги з шаблоном пошуку);
- I - не розрізняти рядкові і заголовні букви;
- M - багаторядковий пошук.
Порядок вказівки прапорів не має значення.
Опис, приклади
Коли регулярний вираз створюється за допомогою конструктора new RegExp (...), необхідно пам'ятати, що зворотні слеш (\) повинні екранувати, наприклад:
varexpr = newRegExp('\\w', 'ig');
При використанні літерального формату, цього робити не потрібно:
var expr = /\w/gi;
Обидві запису еквівалентні. Перший варіант може знадобиться, якщо вам доведеться генерувати регулярне динамічно.
Види символів
У регулярних виразах розрізняють наступні види символів:
Звичайні символи