Парсер Datacol

APSALIM

Постоялец
Регистрация
28 Фев 2013
Сообщения
131
Реакции
95
Datacol - парсер для любых сайтов
Скрытое содержимое доступно для зарегистрированных пользователей!


Связанные темы:
Скрытое содержимое доступно для зарегистрированных пользователей!

Скрытое содержимое доступно для зарегистрированных пользователей!
 
Конечно можно. Заменой.
Попробуйте сделать замену (regex) с
\.ashx.*?h=[\d]{3}
на
.png
Вот.. Спасибо! Почти получилось... Вот только он возвращает просто 32004.png без адреса целиком
ссылка в коде выглядит так <img src="//site.com/-/media/Images/Catalog/Products/32004.ashx?u=0101010000&amp;w=534&amp;h=534" class="image figure" alt="name" title="" itemprop="image" data-ux="zoom" data-zoom-alt="Увеличить">
я так понимаю надо в начале ссылки удалить //... Может надо что-то еще сделать, но абсолютно не понимаю что(((
 
Последнее редактирование:
Что вам нужно сделать датаколом: скачать картинку или получить ее рабочий урл?
В 7й версии можно и то и другое если выбрать опцию получать ссылку - Для просмотра ссылки Войди или Зарегистрируйся
В 5й нужно выбрать Полное значение, и дальше наверное уже обрезать его.
Или если качать не нужно то отключите скачку файлов и заменой приводите к нужному виду
 
Как парсить отзывы?
вопрос скорее не по тонкостям настройки (регулярку или икс-патч я подберу), вопрос в логике.
Как собрать например отзывы например Яндекс маркета:
Для просмотра ссылки Войди или Зарегистрируйся с отзывами как настроить парсер правильно, каждый отзыв должен быть новой строкой в таблице
или строка должно быть название копании а отзывы в новых ячейках?
 
Если на странице есть несколько или множество блоков каждый из которых должен вносится в новую строку то это - диапазоны.
И для сбор аданных вы уже указываете поля.
В вашем случае каждый отзыв это диапазон, подберите для него регулярку или xpath
 
Здравствуйте, помогите пожалуйста пару дней уже мучаюсь.
Есть сайт с объявлениями при парсинге все работает но не могу понять каким образом настроить для получения контактов так как они загружаются при клике на "контакты" в всплывающем окне в там имя, телефон и адрес
 
Здравствуйте, помогите пожалуйста пару дней уже мучаюсь.
Есть сайт с объявлениями при парсинге все работает но не могу понять каким образом настроить для получения контактов так как они загружаются при клике на "контакты" в всплывающем окне в там имя, телефон и адрес
Дайте пример страницы, версия датакол?
 
Для просмотра ссылки Войди или Зарегистрируйся

Datacol 7
На днях вышло обновление 7.08, в нем написано что добавили подобное, но пока не было описания как это делать. Думаю на след. недели опишут или выпустят видео
Для просмотра ссылки Войди или Зарегистрируйся

Для просмотра ссылки Войди или Зарегистрируйся
А на этом сайте вообще ничего не парсится
Что значит ничего? Переключали в режим браузера?
 
На днях вышло обновление 7.08, в нем написано что добавили подобное, но пока не было описания как это делать. Думаю на след. недели опишут или выпустят видео
Для просмотра ссылки Войди или Зарегистрируйся


Что значит ничего? Переключали в режим браузера?
Парсер с браузером запускал вроде

Есть еще один сайт
Для просмотра ссылки Войди или Зарегистрируйся
Тут вместо картинок качается один и тот же файл пиксель
 
Назад
Сверху