black Posted December 14, 2007 Report Posted December 14, 2007 Pieņemsim, man bloga virsrakstā ir teksts 'Glāzšķūņu rūķīši'. Man gribētos, lai raksts glabātos interneta adresē http://kautkas.lv/glazskunu_rukisi Jautājums ir, kā vislabāk pārveidot speciālās zīmes (latviešu, zviedru, japāņu) tekstā, ko varētu likt URLā? Es gribētu, piemēram nokonvertēt 'インポート用のアドレス' uz 'miruku_uradzuke'. Vai kāds ir kaut ko dzirdējis par konvertoru, kas speciālos burtus pārveido par ASCII burtiem?
bubu Posted December 14, 2007 Report Posted December 14, 2007 $text = str_replace(array("ā", "č", ..., "ž"), array("a", "c", ..., "z"), $text);
black Posted December 14, 2007 Author Report Posted December 14, 2007 (edited) Domāts tāds, kas derēs arī japāņu valodai. (Vai nu tāds, kas māk pārkonvertēt uz tuvākajiem līdzīgajiem ASCII burtiem, vai arī tāds, kuram ir translita supports visām unicodes vērtībām.) Tas ir, es negribu manuāli vadīt visām pasaules valodām replacementus. Edited December 14, 2007 by black
Klez Posted December 14, 2007 Report Posted December 14, 2007 wordpress nav tāda fīča iekšā? neesmu wordpress skatiijies ...
xPtv45z Posted December 14, 2007 Report Posted December 14, 2007 (edited) http://lv.php.net/manual/en/function.urlencode.php ? Vai arī kaut kas tāds neder - string -> base64 encode -> url -> get -> base64 decode -> string? Edited December 14, 2007 by xPtv45z
black Posted December 14, 2007 Author Report Posted December 14, 2007 urlencode nav īsti tas, ko es domāju.
andrisp Posted December 14, 2007 Report Posted December 14, 2007 Ir it kā šāds, bet tas translitē "nelatviskā garā" - http://derickrethans.nl/translit.php (par to, ko es ar to domāju - vari izlasīt saitā). Bet ideālu variantu tu diezvai atradīsi. Un vai tiešām tev vajadzēs translitēt japāņu valodu ?
black Posted December 14, 2007 Author Report Posted December 14, 2007 Japāņu ir apmēram 55 reizes vairāk par latviešiem, tādad japāņu valodas supports ir 55x svarīgāks :)
andrisp Posted December 14, 2007 Report Posted December 14, 2007 Nu ja tu taisi sistēmas japānas tirgum, tad skaidrs, bet vai tad tu taisi ?
Kristabs Posted December 14, 2007 Report Posted December 14, 2007 Viens risinājums būtu aizvietot zināmos ā=>a, tad izņemt visus atlikušos neatļautos simbolus ar patternu un dot iespēju urlu labot pašam formas laukā.
Kaitnieks Posted December 15, 2007 Report Posted December 15, 2007 (edited) Doma ir interesanta, bet pievienojos viedoklim, ka universāla un īsa risinājuma nav, it īpaši japāņu valodai. Lai labāk saprastu, kāpēc, paņemsim par piemēru kaut vai mums labāk zināmo krievu valodu. Pat tur rodas problēmas un viedokļu dalīšanās, piemēram, jautājumā - uz kādu burtu translitēt mīkstinājuma zīmi un cietinājuma zīmi? Ja vēl netranslitēt tieši, bet skatīties no konteksta, tb, iepriekšējo burtu, tad kods jau paliek mazliet sarežģītāks. Lai nu kā, ja problēma ir aktuāla, vari sākt pētījumus no šejienes: http://en.wikipedia.org/wiki/Transliteration. Tieši Japāņu valodai skaties šo ISO standartu: http://en.wikipedia.org/wiki/ISO_3602 (Edit: vai, according to wikipedia, populārāko - Hepburnu: http://en.wikipedia.org/wiki/Hepburn_romanization). Saproti pats, ka katrai valodai un dažās valodās katram alfabētam ir vismaz tāda pati tabula. Edited December 15, 2007 by Kaitnieks
Kaitnieks Posted December 15, 2007 Report Posted December 15, 2007 Zini, iespējams, ka mēs visi, mani ieskaitot, esam Tev samelojuši. Pamēģini šito: iconv("utf-8", "us-ascii//TRANSLIT", $url);
Recommended Posts