Page 35 - 4611
P. 35
2.4 Основи роботи з регулярними виразами
Регулярні вирази (regular expressions, regex) –
інструментальний засіб, призначений для вирішення дуже
конкретних проблем.
Розглянем такі сценарії:
– шукається файл, що містить конкретний текст
(незалежно від регістра);
– при динамічній генерації web-сторінки повинен
відображатись текст; текст може містити URL, і необхідно, щоб
на згенерованій сторінці URL можна було активізувати кліком
(тобто замість простого тексту треба згенерувати правильний
тег);
– при створенні web-форми необхідно перевірити
формат введених даних, наприклад, електронної пошти;
– відбувається імпорт даних у програму, що вимагає
формат файлу даних відмінних від наявного тощо
– та інше.
Всі ці сценарії є типовими задачами. І всі вони можуть бути
реалізовані майже будь-якою мовою програмування, за умови,
що остання містить умовні вирази та операції над рядками
символів. Для цього знадобиться у циклі перебирати слова, або
символи, по одному, відслідковувати масу флажків, перевіряти
всі можливі пробільні і спеціальні символи, вирішувати інші
подібні задачі. Альтернативою є використання регулярних
виразів.
Регулярні вирази – це рядки-шаблони, які використовують
для пошуку та обробки тексту. Регулярні вирази записуються
мовою регулярних виразів, тобто спеціалізованою мовою,
розробленою і призначеною для вирішення задач пошуку та
заміни тексту. Як і інші мови, мова регулярних виразів має
спеціальний синтаксис та команди. Але це не є повноцінна мова
програмування. Звичайно це навіть не програма чи утиліта.
Найчастіше регулярні вирази є міні мовами, які вбудовані в інші
мови та програми. Специфікою мови регулярних виразів є те, що
це є мова “в собі”, а зовсім не інтуїтивно зрозуміла мова для
виконання очевидних операцій…
35