Facebook

Wer vom sozialen Netzwerk Facebook Daten abgreifen möchte, wird Schwierigkeiten haben. Denn die für den normalen Nutzer erreichbare Webseite wird nahezu vollständig dynamisch generiert. Da hat ein Crawler oder Scraper kaum eine Chance, an Daten zu gelangen.

Abhilfe schafft eine abgespeckte Version von Facebook. Diese ist unter https://mbasic.facebook.com zu erreichen. Auf diese kann man recht einfach per Python- oder PHP-Crawler zugreifen. Allerdings ist hierzu ein gültiger Login notwendig, um die Nutzeransicht zu erhalten.

PHP Facebook-Crawler

Das folgende PHP-Script ermöglicht den Login in das eigene Facebook-Profil, von dem aus weitere Crawler-Vorgänge möglich sind.

$f = "https://mbasic.facebook.com/login.php" $ch = curl_init($f);
$url = $f.'?refsrc=https%3A%2F%2Fmbasic.facebook.com%2F&lwv=100&login_try_number=1&refid=8"; $arrSubmit = "email=[#EMAIL]&pass=[#PASSWORT]';
curl_setopt($ch, CURLOPT_URL,$url); curl_setopt ($ch, CURLOPT_POST, 0); curl_setopt($ch, CURLOPT_POSTFIELDS, $arrSubmit); curl_setopt($ch, CURLOPT_HEADER, 1); curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); $inhalt = curl_exec($ch);

Ersetze dazu [#EMAIL] und [#PASSWORT] mit deinen eigenen Daten. Anschließend kannst du weitere Webseiten innerhalb von Facebook öffnen, solange die Session aktiv ist.


Aktuelle Infos direkt per E-Mail
SEO-Insider-NEWS