Page 57 - 6734
P. 57
re – операції з використанням регулярних виразів
Модуль re забезпечує операції з використанням регулярних
виразів [5, 19, 21]. Регулярний вираз (РВ) – це послідовність
символів (шаблон), яка відповідає певній множині рядків [28].
Зазвичай використовуються для операцій пошуку чи заміни рядків.
Наприклад, шаблону ‘.o’ в рядку ‘Hello World’ відповідають рядки
‘lo’ та ‘Wo’. РВ може містити звичайні (як ‘o’) і спеціальні (як ‘.’)
символи. Для прикладу, спеціальний символ ‘.’ означає будь-який
символ окрім символу нового рядка. Спеціальні символи
сприймаються як звичайні, якщо перед ними стоїть символ ‘\’.
Шаблони і рядки для пошуку можуть бути 8-бітними рядками або
Юнікод-радками. Створення РВ можна суттєво спростити за
допомогою таких програм як Kodos, RegexBuddy або regex101.com.
from __future__ import print_function
import re
s='Hello World' # рядок для операцій
mo=re.search('World', s) # знаходить у s першу
відповідність шаблону
print(mo.group(0))
#World
mo=re.match('Hello', s) # знаходить на початку s
першу відповідність шаблону
print(mo.group(0))
#Hello
po=re.compile('o') # компілює шаблон в об'єкт
регулярного виразу
mo=po.search(s) # знаходить у s першу відповідність
шаблону
print(mo.group(0), mo.span()) # вміст знайденого
(групи), початок і кінець
#o (4, 5)
56