Page 35 - 4611
P. 35

2.4  Основи роботи з регулярними виразами


                      Регулярні          вирази        (regular       expressions,         regex)       –
               інструментальний  засіб,  призначений  для  вирішення  дуже
               конкретних проблем.

                      Розглянем такі сценарії:
                      –      шукається  файл,  що  містить  конкретний  текст
               (незалежно від регістра);

                      –      при  динамічній  генерації  web-сторінки  повинен
               відображатись текст; текст може містити URL, і необхідно, щоб
               на  згенерованій  сторінці  URL  можна  було  активізувати  кліком

               (тобто  замість  простого  тексту  треба  згенерувати  правильний
               тег);
                      –      при  створенні  web-форми  необхідно  перевірити

               формат введених даних, наприклад, електронної пошти;
                      –      відбувається  імпорт  даних  у  програму,  що  вимагає
               формат файлу даних відмінних від наявного тощо
                      –      та інше.

                      Всі ці сценарії є типовими задачами. І всі вони можуть бути
               реалізовані  майже  будь-якою  мовою  програмування,  за  умови,
               що  остання  містить  умовні  вирази  та  операції  над  рядками

               символів. Для  цього  знадобиться у  циклі  перебирати слова,  або
               символи,  по  одному,  відслідковувати  масу  флажків,  перевіряти
               всі  можливі  пробільні  і  спеціальні  символи,  вирішувати  інші
               подібні  задачі.  Альтернативою  є  використання  регулярних

               виразів.
                      Регулярні  вирази  –  це  рядки-шаблони,  які  використовують
               для  пошуку  та  обробки  тексту.  Регулярні  вирази  записуються

               мовою  регулярних  виразів,  тобто  спеціалізованою  мовою,
               розробленою  і  призначеною  для  вирішення  задач  пошуку  та
               заміни  тексту.  Як  і  інші  мови,  мова  регулярних  виразів  має

               спеціальний синтаксис та команди. Але це не є повноцінна мова
               програмування.  Звичайно  це  навіть  не  програма  чи  утиліта.
               Найчастіше регулярні вирази є міні мовами, які вбудовані в інші

               мови та програми. Специфікою мови регулярних виразів є те, що
               це  є  мова  “в  собі”,  а  зовсім  не  інтуїтивно  зрозуміла  мова  для
               виконання очевидних операцій…





                                                           35
   30   31   32   33   34   35   36   37   38   39   40