Скрипты: Google Cache Dumper & Bing Cache Dumper

Alek$ сб, 06/06/2009 - 13:33

Пострадавшим от 3fn.ru посвящается.

Google Cache Dumper v 3.0

Google Cache Dumper - это инструмент, позволяющий максимально просто вытащить все содержимое кеша Google по заданному домену.

Возможности:
- Ограничение количества обрабатываемых страниц выдачи, либо обработка всех, сколько есть.
- Задание интервала между запросами (в секундах)
- Адресация запросов разным датацентрам
- Поддержка работы через прокси и чередование запросов между произвольным количеством прокси.

Требования:
- Веб-сервер
- PHP5 с поддержкой curl и allow_url_fopen=On

Установка и настройка:
1) Распакуйте архив в папку веб-сервера (не обязательно в корень).
2) В той же папке должна быть подпапка out, доступная веб-серверу на чтение и запись (обычно подходят права доступа 0777).
3) Файлы index.php, dc.txt, proxy.txt должны быть доступны веб-серверу на чтение.
4) В файл proxy.txt поместите список прокси, которые будете использовать при парсинге, по одному прокси на строку, формат ip_адрес:порт.
ВНИМАНИЕ! Если оставить файл пустым, то проски использоваться не будет, но возрастет риск бана запросов со стороны Google.
5) Настройка завершена! Откройте скрипт через браузер и приступайте!

Стоимость: $2 (я же не зверь какой, скрипт несложный, стоит недорого)
Купить скрипт онлайн.

Bing Cache Dumper v 1.0

Bing Cache Dumper - это инструмент, позволяющий максимально просто вытащить все содержимое кеша поисковика Bing по заданному домену.

Возможности:
- Ограничение количества обрабатываемых страниц выдачи, либо обработка всех, сколько есть.
- Задание интервала между запросами (в секундах)

Требования:
- Веб-сервер
- PHP5 с allow_url_fopen=On

Установка и настройка:
1) Распакуйте архив в папку веб-сервера (не обязательно в корень).
2) В той же папке должна быть подпапка out, доступная веб-серверу на чтение и запись (обычно подходят права доступа 0777).
3) Настройка завершена! Откройте скрипт через браузер и приступайте!

Стоимость: $1 (этот скрипт еще проще, чем предыдущий)
Купить скрипт онлайн.

PS. Ну и небольшой подарок тем, кто сам умеет кодить и не хочет платить. Я уже публиковал первую версию Google Cache Dumper. В том виде, в каком она там есть она довольно легко попадает в бан, но доработать ее совсем несложно Wink

UPD. Актуальный список датацентров для Google Cache Dumper во вложении.



Trackback URL for this post:

http://nevkontakte.org.ru/trackback/333
Прикрепленный файлРазмер
dc.txt2.88 кб
Fedor пт, 12/06/2009 - 15:12

спасибо очень нужно было из кэша гугольного достать одну вещицу, все работает!

Alek$ пт, 12/06/2009 - 15:17

Пожалуйста!

Nadyunya вс, 21/06/2009 - 04:25

Было бы интересно у Яндекса есть что нибудь подобное для поиска информации из кэша это было бы очень кстати т.к Яндекс лучше сканирует русскоязычные сайты!?

Alek$ вс, 21/06/2009 - 11:20

Возможно, со временем я сделаю и такой скрипт, но у Яндекса кеш устроен гораздо сложнее и там есть некоторые проблемы.

roma ср, 24/06/2009 - 05:02

согласен пробовал недавно достать простые файлы из кэша у яндекса ни чего не вышло!?

Дмитрий чт, 25/06/2009 - 05:36

Согласен очень полезный хак!

Интернетчик пн, 13/07/2009 - 04:39

Пытаюсь из принципа доработать бесплатную версию... Пока туплю но кажется уже понял как это работает )))

Alek$ вт, 14/07/2009 - 18:37
Удачи :)
Дмитрий сб, 03/04/2010 - 03:18

Купили у вас скрипт всё работает но есть такой вопрос что в коде поправить чтобы задавать просто номер страницы которую бы он парсил - кпримеру мне надо отпарсить 1 отдельно потом 2 ую отдельно и так далее

Alek$ сб, 03/04/2010 - 22:25

Если кратко, то надо добавить новое поле в форму и в строке, где задается переменная $url добавить параметр &start=XX

kavelin чт, 15/04/2010 - 17:14

Скрипт, работает, спасибо. Но если не завести в proxy.txt прокси, то ругается:

Warning: Division by zero in Z:\home\utils\www\google-cache\index.php on line 173
Msg #123: Proxy list updated

Warning: Division by zero in Z:\home\utils\www\google-cache\index.php on line 187
Msg #124: Requesting http://***.htm via

Warning: Division by zero in Z:\home\utils\www\google-cache\index.php on line 188
Msg #125: Page http://***.htm saved to ...

Alek$ чт, 15/04/2010 - 17:21

Просто добавьте в proxy.txt несколько пустых строк.

kavelin чт, 15/04/2010 - 18:27

Понял, теперь вроде все путем.

rio вт, 20/04/2010 - 16:01

Купил Google Cache Dumper v 3.0. Поставил под денвером. Не пашет Sad
В папке out создает папки с именем домена который пытаемся восстановить из кеша. Но папки пустые.
После обработки выдает "Fatal error: Call to undefined function curl_init() in Z:\home\tools\www\index.php on line 113"

Alek$ вт, 20/04/2010 - 21:17

Установите расширение curl

rio ср, 21/04/2010 - 13:31

После установки расширения curl, все прекрасно работает. Спасибо!



Отправить комментарий

  • Адреса страниц и электронной почты автоматически преобразуются в ссылки.
  • Доступны HTML теги: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd> <img> <b> <s> <u> <p> <h3> <br> <strike> <sup> <pre> <h4> <hr>
  • Строки и параграфы переносятся автоматически.
  • You may use [inline:xx] tags to display uploaded files or images inline.
  • Текстовые смайлы будут заменены на графические.
CAPTCHA
Вы точно не бот?
19 + 3 =
Without JavaScript you won't pass captcha test, sorry. Solve this simple math problem and enter the result. E.g. for 1+3, enter 4.