verfaa
Профессор
- Регистрация
- 29 Янв 2007
- Сообщения
- 417
- Реакции
- 49
- Автор темы
- #1
Привет. Есть сайт с большим количеством страниц - ок. 1000
Необходимо зайти скриптом на каждую страничку сайта и совершить какое-то действие, например спарсить кусок контента регуляркой.
Т.е.:
Подключаемся к сайту.
Заходим на страницу.
Парсим и сохраняем контент в переменную
Переходим на другую страницу.
Парсим и сохраняем контент в переменную
и так все страницы. Также необходимо обеспечить, чтобы одна и таже страничка не обрабатывалась дважды.
Буду благодарен за примеры кода с комментариями.
Необходимо зайти скриптом на каждую страничку сайта и совершить какое-то действие, например спарсить кусок контента регуляркой.
Т.е.:
Подключаемся к сайту.
Заходим на страницу.
Парсим и сохраняем контент в переменную
Переходим на другую страницу.
Парсим и сохраняем контент в переменную
и так все страницы. Также необходимо обеспечить, чтобы одна и таже страничка не обрабатывалась дважды.
Буду благодарен за примеры кода с комментариями.