Jump to content
php.lv forumi

regexp utf8


keiG

Recommended Posts

$preg='/<h2><a href="(.*)">([^>]*)<\/a><\/h2>/iu';

$from='<h2><a href="anything here">Ā b čc ļāļāā</a></h2>'

preg_match_all($preg, $from, $matches);

bez mīkstinājumiem darbojās lieliski, bet ar - neatgriež rezultātu.

Ir kādi varianti?

Link to comment
Share on other sites

Korekti būu:

$preg='#<h2><a href="([^"]*)">([^>]*)</a></h2>#';

$from='<h2><a href="anything here">Ā b čc ļāļāā</a></h2>'

preg_match_all($preg, $from, $matches);

 

Neesmu mēģinājis ar modifieriem. Parasti vispirms normalizēju visus html tagus un kreisos simbolus. Tad nav jāuztraucas mazie, lielie.

Rezultātu var redzēt l2d.lv, kur ir apstrādāti likumi.lv akti ar regulārajām izteiksmēm.

Link to comment
Share on other sites

Neparsē HTML ar regexiem.

Viss atkarīgs no situācijas, ja zini ka lapas kodam apakšā ir kāds XSLT veidīgs template engins, kas outputu vienmēr spēs izveidot XHTML veidā, tad neredzu problēmas parsēt html :)

Link to comment
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

Loading...
×
×
  • Create New...