XHTML parser


Vajadzētu jūsu palīdzību XHTML pārsēšanā. Domāju izmantot php expat XML parseri. Šāds ir pirmais mēginājums, bet ir problēma: doctype netiek atlasīts. PHP manuālī rakstīts, ka jālieto arī xml_set_default_handler():


What goes not to another handler goes to the default handler. You will get things like the XML and document type declarations in the default handler.

...bet arī nekā (handleris ne reizi netiek izsaukts).


Vai kāds nevarētu palīdzēt atrast piemēru, kā pilnībā varētu XHTML kodu pārvērst tree-like veidā, lai pēc tam ērti var piekļūt tagiem un to parametriem?

