Jump to content
php.lv forumi

vitalja

Recommended Posts

$file=@file_get_contents($url);
if ($file == false) {
echo 'File does not exist.'; } else {preg_match("#<title\b[^>]*>(.*?)</title>#i",$file,$match);...}

 

Pirmā problēma ir tāda, ka gadijumā ja $url=http://www.facebook.com; ,tad $file == FALSE , bet, piemēram,

http://www.facebook.com/find-friends/browser/ $file != FALSE vai kāds var paskaidrot kāpēc facebook, index.php failu, neizdodas nolasīt!

 

Un otrā problēma ir tāda, ka, piemēram, http://www.facebook.com/find-friends/browser/ lapai  $match[0] ir tukš, un $match[1] == 'Update Your Browser | Facebook';

Edited by vitalja
Link to comment
Share on other sites

Iespējams arī ka FB nepieciešams JS. Un vispār ko tu vēlies panākt - API nevar izmantot?

Tas ko māģinu panākt ir dabūt title ievadītajam linkam,

Īsti nesaprotu, kā API palīdzēs to atrisināt. Paldies par linku palasīšu šobrīd vel nezinu, kā izpaužās User Agent.

 

Vel varu pieminēt, ka manas funkcijas sākumā https://www.facebook.com/ tiek pārveidots uz http://www.facebook.com/, jo ar protokolu https vispār nevienu failu nevar atvert, piemēram,  https://www.google.lv/ lapai protokola maiņa uz http atrisina problēmu un izdodas atvert lapas pirmkodu, bet neizdodas tieši https://www.facebook.com/, kautgan FB sadaļu pirmkodus izdodas atvēr.

Edited by vitalja
Link to comment
Share on other sites

Ja vēlies spert pirmos soļus iekš web scraping,tad bez cURL varēsi nolasīt tikai saitus,kurus nesatrauc milzīgā botu populācija,un feisbuks pie tiem nepieder. Visu var risināt ar pareizi nosimulētiem headeriem (un cepumiem ja prasa),bet ne jau ar failu operācijām kas labākajā gadījumā saņems ignoru vai arī dabusi ip banu beigās vēl :) 

Edited by 404
Link to comment
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

Loading...
×
×
  • Create New...