Page 107 - 6734
P. 107
print "Кінцевий тег:", tag
if tag=='p': # якщо тег p
self.intag=False # знаходимось поза тегом
p
def handle_data(self, data):
"Викликається коли знайдено дані ...
(наприклад <p>...</p>)"
print "Дані:", data
if self.intag: # якщо в середині тегу p
self.data.append(data) # додати в список
результатів дані
parser = MyHTMLParser() # об'єкт класу
html="""<html><body>
<p align="justify">Текст</p>
<a href="index.html">Індекс</a>
</body></html>""" # документ HTML для парсингу
parser.feed(html) # виконати парсинг
parser.close()
print "\nЗнайдені дані:", parser.data[0]
#parser.handle_starttag('a', [('href',"index.html")])
Початковий тег html
Атрибути []
Початковий тег body
Атрибути []
Дані:
Початковий тег p
Атрибути [('align', 'justify')]
Дані: Текст
Кінцевий тег: p
Дані:
Початковий тег a
Атрибути [('href', 'index.html')]
106