Cerita Untuk Sahabat | Belajar SEO

Belajar Dan Berbagi SEO

Mencoba PHP Google Blogsearch URL Scraper

Posted by admin On March - 23 - 2009

Dalam artikel sebelumnya saya sudah membahas tentang cara kerja spammer dan bagaimana kita mengatasinya, sekarang saya akan sedikit tulis tentang script yang sering digunakan para spammer, yaitu “PHP Google Blogsearch URL Scraper“.

Nah mungkin diantara kita ada yang perlu dan ada yang gak butuh sama sekali, tapi mengenal dan mengetahui gak ada salahnya kan? Nah di bawah ini script yang saya ambil dari pimpmypagerank.com

============ Start PHP Script ================

<?php

//give the script a keyword to search for
$keyword = “ipod touch”;
$keyword = str_replace(” “, “+”, $keyword);

//start a counter so we can number our results
$num = 0;

//set a start for our paging of Google Blogsearch (we’re going to be getting 10 pages X 100 results)
$start = 0;

do {

//Create the feed URL we’re going to get from Google Blogsearch
$feed = ‘http://blogsearch.google.com/blogsearch_feeds?hl=en&q=%22′ .$keyword. ‘+%22powered+by+wordpress%22&ie=utf-8&num=100&start=’ .$start. ‘&output=rss’;

//We’re using cURL to actually go fetch the page from Google Blogsearch
$ch = curl_init($feed);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_URL, $feed);
$page = curl_exec($ch);
curl_close($ch);

//Loop through the feed, and suck out the URL’s
$xml = new SimpleXMLElement($page);

foreach ($xml->channel->item as $item) {

//Add 1 to our counter, so our list has numbers next to the URL’s
$num = $num + 1;

$link = $item->link;

//Print our shit to the page
echo $num. ‘ - <a href=”‘ .$link. ‘”>’ .$link. ‘</a><br>’;

}

//Have a rest so we don’t get banned for hitting Google too hard and fast
sleep(30);

//Add 100 to the start, so we can fetch the next 100 results
$start = $start + 100;

}

//Keep doing this shit until we get to page 10 of the Google results
while ($start < 1000);

?>

============ End PHP Script ================



Petunjuk untuk menggunakan:

1. Anda dapat men-download script disini (mengganti ekstensi file ke . Php), atau hanya copy dan paste kode di bawah ini.
2. Buka script di editor teks, dan mengubah variabel $ kata kunci di atas dengan kata kunci yang Anda ingin mencari
3. Menyimpan naskah dan meng-upload ke server Anda
4. Arahkan ke script dalam browser Anda, dan tunggu, Anda akan mendapatkan listnya.

Catatan: Anda harus menggunakan PHP5 dan aktifkan cURL di server agar script ini bisa jalan..Selamat Mencoba!!

Popularity: 10% [?]

Technorati Tags: , ,

Related Post

Leave a Reply



CommentLuv Enabled
SEO Powered by Platinum SEO from Techblissonline