Сегодня хочу вам представить самый быстрый из известных мне
PHP парсеров – парсер контента X-Parser Теперь обо всем по
порядку.
Что это вообще такое
Многофункциональный модульный многопоточный универсальный парсер,
который в полной сборке позволяет делать следующее:
1. Парсить выдачу любых поисковых систем по ключевым фразам сохраняя
сниппеты и ссылки.
2. Парсить контент (текстовый) с любого сайта по заданному домену.
3. Парсить контент (текстовый) по ключевым фразам из выдачи любой ПС.
4. Парсить контент (текстовый) по заданному списку URLов.
5. Парсить внутренние ссылки с любого URLа в частности или сайта в
целом.
6. Парсить внешние ссылки с любого URLа в частности или сайта в целом.
Прокси чекер в комплекте
Чтобы можно было парсить неограниченное количество контента, парсер
комплектуется таким же быстрым прокси чекером. Он позволяет:
1. Проверять прокси по заданному списку проксилистов.
2. Проверять прокси по списку проксей.
3. Проверять индивидуально любой прокси.
4. Отбирать из списка качественные проксилисты.
5. Парсить списки прокси из выдачи Google и отбирать качественные.
Проверка прокси происходит с привязкой к цели использования! Например,
если Вы хотите использовать прокси для парсинга Google, то его можно
легко настроить, чтобы сразу отбирать только прокси сервера,
незабаненные Google.

Производительность парсера
Ну а теперь самое интересное. Парсер контента X-Parser использует
многопоточность. Количество потоков настраивается. Скорость парсинга на
мегабитном канале составляет примерно 160 секунд на 1 мегабайт
чистого текста, т.е. 500 мегабайт в сутки!!!
Скорость проверки прокси составляет около 100 прокси за 100 секунд,
то есть за 100 секунд будет найдено примерно 100 рабочих прокси.
Модульность и интеграция в сторонние приложения
Исходный код выполнен модульно. Каждый модуль имеет свои параметры и
функции. Без проблем встраивается в любой другой код, например в
доргены. Изначально парсер писался для интеграции в сторонний код,
поэтому в безинтерфейсном варианте он очень гибок и удобен в
использовании (абсолютно все можно настраивать под свои нужды). В
интерфейсном варианте вынесены только базовые настройки для удобства
использования парсера без наличия знаний в области PHP.
Скачать бесплатно |