Пострадавшим от 3fn.ru посвящается.
Google Cache Dumper - это инструмент, позволяющий максимально просто вытащить все содержимое кеша Google по заданному домену.
Возможности:
- Ограничение количества обрабатываемых страниц выдачи, либо обработка всех, сколько есть.
- Задание интервала между запросами (в секундах)
- Адресация запросов разным датацентрам
- Поддержка работы через прокси и чередование запросов между произвольным количеством прокси.
Требования:
- Веб-сервер
- PHP5 с поддержкой curl и allow_url_fopen=On
Установка и настройка:
1) Распакуйте архив в папку веб-сервера (не обязательно в корень).
2) В той же папке должна быть подпапка out, доступная веб-серверу на чтение и запись (обычно подходят права доступа 0777).
3) Файлы index.php, dc.txt, proxy.txt должны быть доступны веб-серверу на чтение.
4) В файл proxy.txt поместите список прокси, которые будете использовать при парсинге, по одному прокси на строку, формат ip_адрес:порт.
ВНИМАНИЕ! Если оставить файл пустым, то проски использоваться не будет, но возрастет риск бана запросов со стороны Google.
5) Настройка завершена! Откройте скрипт через браузер и приступайте!
Стоимость: $2 (я же не зверь какой, скрипт несложный, стоит недорого)
Купить скрипт онлайн.
Bing Cache Dumper - это инструмент, позволяющий максимально просто вытащить все содержимое кеша поисковика Bing по заданному домену.
Возможности:
- Ограничение количества обрабатываемых страниц выдачи, либо обработка всех, сколько есть.
- Задание интервала между запросами (в секундах)
Требования:
- Веб-сервер
- PHP5 с allow_url_fopen=On
Установка и настройка:
1) Распакуйте архив в папку веб-сервера (не обязательно в корень).
2) В той же папке должна быть подпапка out, доступная веб-серверу на чтение и запись (обычно подходят права доступа 0777).
3) Настройка завершена! Откройте скрипт через браузер и приступайте!
Стоимость: $1 (этот скрипт еще проще, чем предыдущий)
Купить скрипт онлайн.
PS. Ну и небольшой подарок тем, кто сам умеет кодить и не хочет платить. Я уже публиковал первую версию Google Cache Dumper. В том виде, в каком она там есть она довольно легко попадает в бан, но доработать ее совсем несложно 
UPD. Актуальный список датацентров для Google Cache Dumper во вложении.
| Прикрепленный файл | Размер |
|---|---|
| dc.txt | 2.88 кб |
спасибо очень нужно было из кэша гугольного достать одну вещицу, все работает!
Пожалуйста!
Было бы интересно у Яндекса есть что нибудь подобное для поиска информации из кэша это было бы очень кстати т.к Яндекс лучше сканирует русскоязычные сайты!?
Возможно, со временем я сделаю и такой скрипт, но у Яндекса кеш устроен гораздо сложнее и там есть некоторые проблемы.
согласен пробовал недавно достать простые файлы из кэша у яндекса ни чего не вышло!?
Согласен очень полезный хак!
Пытаюсь из принципа доработать бесплатную версию... Пока туплю но кажется уже понял как это работает )))
Купили у вас скрипт всё работает но есть такой вопрос что в коде поправить чтобы задавать просто номер страницы которую бы он парсил - кпримеру мне надо отпарсить 1 отдельно потом 2 ую отдельно и так далее
Если кратко, то надо добавить новое поле в форму и в строке, где задается переменная $url добавить параметр &start=XX
Скрипт, работает, спасибо. Но если не завести в proxy.txt прокси, то ругается:
Warning: Division by zero in Z:\home\utils\www\google-cache\index.php on line 173
Msg #123: Proxy list updated
Warning: Division by zero in Z:\home\utils\www\google-cache\index.php on line 187
Msg #124: Requesting http://***.htm via
Warning: Division by zero in Z:\home\utils\www\google-cache\index.php on line 188
Msg #125: Page http://***.htm saved to ...
Просто добавьте в proxy.txt несколько пустых строк.
Понял, теперь вроде все путем.
Купил Google Cache Dumper v 3.0. Поставил под денвером. Не пашет
В папке out создает папки с именем домена который пытаемся восстановить из кеша. Но папки пустые.
После обработки выдает "Fatal error: Call to undefined function curl_init() in Z:\home\tools\www\index.php on line 113"
Установите расширение curl
После установки расширения curl, все прекрасно работает. Спасибо!
Отправить комментарий