подскажите парсер

naytilius

Постоялец
Регистрация
18 Окт 2008
Сообщения
306
Реакции
161
Привет нужен серверний пхп парсер.
Именно сервений так как декстопний парсер смогу на зено постере навалять за 5 мин, но у меня канал в инет пиец тугой (обичной модем не сильно разженешся.)
С требований возможность настроить что парсить (тоесть настроить метки между которими брать контент.) и работа через прокси.
2.настраиваемий формат вивода. (просто чтоб навания статьи в тег н2 заключить) или воопше просто всю текстовку сохранить
3. Чтоб парсер полностью удалял разметку, ссилки (если они анткорние то анкор чтоб оставлял.) все включения ява. Воопшем на виходе голий текст.
НУжен именно серверний скрипт так как есть контент довнлоадс. но из за скорости инети у меня не оч сильно разгонится в парсинге могу.
Скрипт ну3жен под парсинг нескольких буржуйских каталогов статей. тоесть на вход я задаю линки на статьи а на виходе статьи в одном файле с нужним мне форматом.
так 3-4 каталога.
Да и интересно сколько будет стоит заказ подобного скрипта в фрилансеров. тоесть парсеров под нужние директории.
нада промишленно парсить
1.ezinearticles.com
2.Для просмотра ссылки Войди или Зарегистрируйся
и парочка топових каталогов
 
Скрытое содержимое доступно для зарегистрированных пользователей!
 
так текс маркет вроде не поддерживает возможность задавать конткретой список с которого парсит + настройка парсера... хотя попробуй та к как с текс маркетом не работал а работал токо с веб грабером.
 
может унипарсер + ексель?
 
серверное решения надо, у меня очень галимий интернет просче говоря обичной модем плюч глючить есче.
 
Есть неплохой онлайн парсер от yahoo

Немного замороченная регистрация. После нее жмете Create Pipe и в режиме Drag&drop устанавливаете модули и редактируете алгоритм парсинга.
 
simple_html_dom.php как по мне единий нормальний виход.
 
можно как было сказано выше сделать рсс ленту из чего угодно черех яху пайпс, а потом ленту парсить например rssrepublisher
 
Назад
Сверху