black Posted December 14, 2007 Report Share Posted December 14, 2007 Pieņemsim, man bloga virsrakstā ir teksts 'Glāzšķūņu rūķīši'. Man gribētos, lai raksts glabātos interneta adresē http://kautkas.lv/glazskunu_rukisi Jautājums ir, kā vislabāk pārveidot speciālās zīmes (latviešu, zviedru, japāņu) tekstā, ko varētu likt URLā? Es gribētu, piemēram nokonvertēt 'インポート用のアドレス' uz 'miruku_uradzuke'. Vai kāds ir kaut ko dzirdējis par konvertoru, kas speciālos burtus pārveido par ASCII burtiem? Link to comment Share on other sites More sharing options...
bubu Posted December 14, 2007 Report Share Posted December 14, 2007 $text = str_replace(array("ā", "č", ..., "ž"), array("a", "c", ..., "z"), $text); Link to comment Share on other sites More sharing options...
black Posted December 14, 2007 Author Report Share Posted December 14, 2007 (edited) Domāts tāds, kas derēs arī japāņu valodai. (Vai nu tāds, kas māk pārkonvertēt uz tuvākajiem līdzīgajiem ASCII burtiem, vai arī tāds, kuram ir translita supports visām unicodes vērtībām.) Tas ir, es negribu manuāli vadīt visām pasaules valodām replacementus. Edited December 14, 2007 by black Link to comment Share on other sites More sharing options...
Klez Posted December 14, 2007 Report Share Posted December 14, 2007 wordpress nav tāda fīča iekšā? neesmu wordpress skatiijies ... Link to comment Share on other sites More sharing options...
xPtv45z Posted December 14, 2007 Report Share Posted December 14, 2007 (edited) http://lv.php.net/manual/en/function.urlencode.php ? Vai arī kaut kas tāds neder - string -> base64 encode -> url -> get -> base64 decode -> string? Edited December 14, 2007 by xPtv45z Link to comment Share on other sites More sharing options...
black Posted December 14, 2007 Author Report Share Posted December 14, 2007 urlencode nav īsti tas, ko es domāju. Link to comment Share on other sites More sharing options...
andrisp Posted December 14, 2007 Report Share Posted December 14, 2007 Ir it kā šāds, bet tas translitē "nelatviskā garā" - http://derickrethans.nl/translit.php (par to, ko es ar to domāju - vari izlasīt saitā). Bet ideālu variantu tu diezvai atradīsi. Un vai tiešām tev vajadzēs translitēt japāņu valodu ? Link to comment Share on other sites More sharing options...
black Posted December 14, 2007 Author Report Share Posted December 14, 2007 Japāņu ir apmēram 55 reizes vairāk par latviešiem, tādad japāņu valodas supports ir 55x svarīgāks :) Link to comment Share on other sites More sharing options...
andrisp Posted December 14, 2007 Report Share Posted December 14, 2007 Nu ja tu taisi sistēmas japānas tirgum, tad skaidrs, bet vai tad tu taisi ? Link to comment Share on other sites More sharing options...
Kristabs Posted December 14, 2007 Report Share Posted December 14, 2007 Viens risinājums būtu aizvietot zināmos ā=>a, tad izņemt visus atlikušos neatļautos simbolus ar patternu un dot iespēju urlu labot pašam formas laukā. Link to comment Share on other sites More sharing options...
Kaitnieks Posted December 15, 2007 Report Share Posted December 15, 2007 (edited) Doma ir interesanta, bet pievienojos viedoklim, ka universāla un īsa risinājuma nav, it īpaši japāņu valodai. Lai labāk saprastu, kāpēc, paņemsim par piemēru kaut vai mums labāk zināmo krievu valodu. Pat tur rodas problēmas un viedokļu dalīšanās, piemēram, jautājumā - uz kādu burtu translitēt mīkstinājuma zīmi un cietinājuma zīmi? Ja vēl netranslitēt tieši, bet skatīties no konteksta, tb, iepriekšējo burtu, tad kods jau paliek mazliet sarežģītāks. Lai nu kā, ja problēma ir aktuāla, vari sākt pētījumus no šejienes: http://en.wikipedia.org/wiki/Transliteration. Tieši Japāņu valodai skaties šo ISO standartu: http://en.wikipedia.org/wiki/ISO_3602 (Edit: vai, according to wikipedia, populārāko - Hepburnu: http://en.wikipedia.org/wiki/Hepburn_romanization). Saproti pats, ka katrai valodai un dažās valodās katram alfabētam ir vismaz tāda pati tabula. Edited December 15, 2007 by Kaitnieks Link to comment Share on other sites More sharing options...
Kaitnieks Posted December 15, 2007 Report Share Posted December 15, 2007 Zini, iespējams, ka mēs visi, mani ieskaitot, esam Tev samelojuši. Pamēģini šito: iconv("utf-8", "us-ascii//TRANSLIT", $url); Link to comment Share on other sites More sharing options...
Recommended Posts