Page 107 - 6734
P. 107

print "Кінцевий тег:", tag
                   if tag=='p': # якщо тег p
                       self.intag=False # знаходимось поза тегом
           p
               def handle_data(self, data):
                   "Викликається коли знайдено дані ...
           (наприклад <p>...</p>)"
                   print "Дані:", data
                   if self.intag: # якщо в середині тегу p
                       self.data.append(data) # додати в список
           результатів дані

           parser = MyHTMLParser() # об'єкт класу
           html="""<html><body>
           <p align="justify">Текст</p>
           <a href="index.html">Індекс</a>
           </body></html>""" # документ HTML для парсингу
           parser.feed(html) # виконати парсинг
           parser.close()
           print "\nЗнайдені дані:", parser.data[0]
           #parser.handle_starttag('a', [('href',"index.html")])

           Початковий тег html
           Атрибути []
           Початковий тег body
           Атрибути []
           Дані:

           Початковий тег p
           Атрибути [('align', 'justify')]
           Дані: Текст
           Кінцевий тег: p
           Дані:

           Початковий тег a
           Атрибути [('href', 'index.html')]
                                         106
   102   103   104   105   106   107   108   109   110   111   112