Граббер — это сленговый термин из языка веб-мастеров, обозначающий специальную программу, которая собирает информацию со сторонних ресурсов. Принцип действия граббера заключается в том, что программа копирует код и перемещает его на заданный сайт.
Парсер
В настоящее время понятия граббер и парсер используют как синонимы. На самом деле парсер выполняет иную задачу: он создан для того, чтобы распознавать и обрабатывать полученный граббером код. По заданным заранее параметрам парсер анализирует полученную информацию, обрабатывает ее и выводит или записывает в файл или БД. Результатом работы парсера являются упорядоченные данные из страниц, собранных граббером.
Назначение граббера и парсера
- Актуальность данных: размещение на своем ресурсе информеров, которые требуют регулярного обновления (например, прогноза погоды).
Обновление страниц: некоторые не совсем честные веб-мастера используют парсеры новостей и другого контента для обновления своего сайта.
- Автоматический сбор фотографий по определенной тематике. Для этого используют парсеры картинок «Яндекса» или «Гугла».
- Сбор необходимых ссылок по заданным параметрам (грабберы и парсеры ссылок).
- Объединение информации из множества источников на одной странице (например, размещение новостей из разных источников с ссылкой на них с целью предоставить пользователю всю самую свежую и интересную информацию в одном месте).
- Автоматизированный сбор данных для анализа — например, выдачи по поисковым запросам (парсер выдачи), контекстной рекламы (парсеры «Яндекс.Директа» или Google Adwords), форумов, блогов или групп в социальных сетях (соответственно, парсеры форумов, блогов и соцсетей), ключевых слов (парсер запросов Wordstat), тегов, прайс-листов и так далее.