Bunkertor 7 Posted February 25, 2010 Report Share Posted February 25, 2010 (edited) Sveiki, Man te kaut kas tāds kā crawler robots top. Viņš staigā pēc noteikta maršruta pa webu un ievāc tekstu un parametrus no lapām un saglabā iekš MySQL tabulas. Uzstādīju tabulām Collation us ASCII, jo domāju, ka tā būs labāk. Rezultātā robots apjūk uz vāciešu un austriešu lapām, tur kur ir visādi ķeburi, umlauti un citādas neizprotamas un neizrunājams lietas. Tabulā nonāk tikai "?????????" Toties nav nekādu problēmu ar skandināvu un krievu lapām (tur arī ir ķeburi, tikai citādāki) un viņš pat vienu otru ķīniešu hieroglifu atpazīst. Kaut kā man tā vāciešu problēma ir jāatrisina. Ko labāk darīt? Uzrakstīt skriptu, kas atpazīst oriģinālo Encoding un pārkonvertē to? Īsti negribās - iedomājieties, ja es to robotu palaižu uz pilnu klapi, viņš apmeklēs 100-us tūkstošus lapu vai pat miljonus. Droši vien uzkārsies, ja katrai lapai vēl konvertēs kodējumu. Kādas ir jūsu domas? Edited February 25, 2010 by Bunkertor 7 Quote Link to comment Share on other sites More sharing options...
Trac3 !! Posted February 25, 2010 Report Share Posted February 25, 2010 (edited) iegooglē kas ir ASCII! // unicode might help ya Edited February 25, 2010 by Trac3 !! Quote Link to comment Share on other sites More sharing options...
Bunkertor 7 Posted February 25, 2010 Author Report Share Posted February 25, 2010 Njā - nu skaidrs ASCII bija galīgi garām, bet ar unicode sanāk vēl sliktāk. Ok, vācu teksts tagad saglabājas, bet skandināvu un krievu pārvēršas par очныÐ... Bez tam, skripts nojūk, ja, piemēram, Meta Description atrodas vai nu domu zīme - , vai ' Laikam būs tomēr kaut kāds knovertieris jāraksta :( Quote Link to comment Share on other sites More sharing options...
Trac3 !! Posted February 25, 2010 Report Share Posted February 25, 2010 1. pirms liec kko datubaze, vajag parliecināties par to datu validumu, šaja gadijuma tev derēs mysql_real_escape_string() funkcija, ja lieto MySQL.. 2. lieto utf8_unicode_ci datubazes tabulai kur šos daudzvalodu datus glabā.. 3. iespējams ka palīdzēs arī izpildīt pirms visām darbībām ar db šo kvēriju: "SET NAMES UTF8" Quote Link to comment Share on other sites More sharing options...
briedis Posted February 25, 2010 Report Share Posted February 25, 2010 3. iespējams ka palīdzēs arī izpildīt pirms visām darbībām ar db šo kvēriju: "SET NAMES UTF8" Imo to pietiek izdarīt uzreiz pēc konekcijas, nevis pirms katra kvērija... Quote Link to comment Share on other sites More sharing options...
Trac3 !! Posted February 25, 2010 Report Share Posted February 25, 2010 Imo to pietiek izdarīt uzreiz pēc konekcijas, nevis pirms katra kvērija... es laikam pietiekami skaidri neizteicos, bet jā bija domāts vienu reizi pēc konekcijas.. :) Quote Link to comment Share on other sites More sharing options...
mounkuls Posted February 25, 2010 Report Share Posted February 25, 2010 Toties nav nekādu problēmu ar skandināvu un krievu lapām (tur arī ir ķeburi, tikai citādāki) un viņš pat vienu otru ķīniešu hieroglifu atpazīst. Tas skaitās nav nekādu problēmu?:) Kaut kā man tā vāciešu problēma ir jāatrisina. Ko labāk darīt? Uzrakstīt skriptu, kas atpazīst oriģinālo Encoding un pārkonvertē to? Jāa! Tikai dari to operējot ar konvertēšanu uz utf-8. Vispār besis ir, ka to nelieto visi, kam ar pliku ASCII nepietiek. Quote Link to comment Share on other sites More sharing options...
Recommended Posts
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.