renathy Posted September 18, 2011 Report Share Posted September 18, 2011 Labdien! Man ir nepieciešama programma, kas laiž googlē pieprasījumus pēc noteiktiem atslēgvārdiem (kaut vai hardcoded apmēram 10) un savāc pirmo 3 lapu rezultātus (lapas adreses). Nav ne jausmas kā to izdarīt. Man tas nepieciešams nekomerciālam izpētes procesam. Kādus līdzekļus būtu jāizmanto? R. Quote Link to comment Share on other sites More sharing options...
renathy Posted September 18, 2011 Author Report Share Posted September 18, 2011 (edited) P.S. Tas ir nekomerciālam izpētes procesam. + būtu pateicīga, ja kāds uzrakstītu arī kādu koda paraugu, bet ja kādam kkas tāds ir vai kāds var kko tādu ātri uztaisīt varētu arī piemaksāt, bet simboliski, jo tas tiešām ir personīgām izpētes vajadzībām R. Edited September 18, 2011 by renathy Quote Link to comment Share on other sites More sharing options...
briedis Posted September 18, 2011 Report Share Posted September 18, 2011 Skaties, google var nepatikt šāds viņas rezultātu 'scrapings', un var drīz tevi nobanot. Vari pameklēt tīmeklī vairāk informācijas, koda paraugi arī noteikti būs atrodami: "scraping google" Quote Link to comment Share on other sites More sharing options...
renathy Posted September 18, 2011 Author Report Share Posted September 18, 2011 Ok. Paldies. Varbūt, ja es ļoti daudz pieprasījumu sūtītu, bet man nebūs tik daudz... Cerams, ka nenobanos. Quote Link to comment Share on other sites More sharing options...
daGrevis Posted September 18, 2011 Report Share Posted September 18, 2011 Izmanto Proxy un bieži maini IP. :) Quote Link to comment Share on other sites More sharing options...
renathy Posted September 19, 2011 Author Report Share Posted September 19, 2011 (edited) Vai varat lūdzu 10 latviešu vārdos uzrakstīt Proxy darbību un vai to iespējams izmantot pie jebkura pieslēguma veida? Teiksim, skatos skriptu: http://www.fromzerot...php-curl-proxy/ un http://www.fromzerot...ng-google-serp/. Tur ir janorada proxy. Nav īsti skaidrs kā to realizēt. --------- + atradu, ka ar Google API ar varētu šo to darīt, vai ir kādam pieredze? Edited September 19, 2011 by renathy Quote Link to comment Share on other sites More sharing options...
404 Posted September 19, 2011 Report Share Posted September 19, 2011 (edited) Pačeko: http://net.tutsplus....mastering-curl/ Tur rindkopā: Using a Proxy ir īss piemērs. Var arī vienkārši samest proxy adreses iekš txt faila un randomā paņemt katru reizi savu. Serveru adreses var paņemt kaut vai no šejienes: http://hidemyass.com/proxy-list/ Bet googles searčam varbūt der šis,ja ir zem 100 requestiem dienā: http://code.google.c...using_rest.html Edited September 19, 2011 by 404 Quote Link to comment Share on other sites More sharing options...
daGrevis Posted September 19, 2011 Report Share Posted September 19, 2011 Ironiski: Izmantot Google API (ja tas ir iespējams, nezinu), lai apietu Google. Quote Link to comment Share on other sites More sharing options...
Recommended Posts
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.