Парсер Datacol

APSALIM

Постоялец
Регистрация
28 Фев 2013
Сообщения
131
Реакции
95
Datacol - парсер для любых сайтов
Скрытое содержимое доступно для зарегистрированных пользователей!


Связанные темы:
Скрытое содержимое доступно для зарегистрированных пользователей!

Скрытое содержимое доступно для зарегистрированных пользователей!
 
Собираю картинки с категорий
Скрытое содержимое доступно для зарегистрированных пользователей!

Как работать с Генерацией названия - Формула на вкладке Загрузка файлов?
Для просмотра ссылки Войди или Зарегистрируйся
Обычное поле, Сохранять теги, xpath //div[@class='cat-image']/img
Все норм, собирает, но ставлю в Загрузке файлов Генерация названия по формуле %Название%%Картинка%, на выходе только Название!
Для просмотра ссылки Войди или Зарегистрируйся

Генерация в принципе не работает или я не правильно настраиваю?
 
HELP
только начал разбираться и на "удивление" появилась куча вопросов.
1) <h1 class="good-info-header "><span class="good-info-number ">Код: 6397468</span> Смартфон Bravis A510 Jeans Blue</h1> - убрать <span>?
2) И совсем не понял как работать с картинками, если необходимо сохранить только url на картинку что делать? по сути мне нужно вытащить адрес ссылки
<div class="big-photo">
<a id="images-preview" class="lightbox" href="/img/products/1767361/2236813.jpg">
<img title="" alt="" src="/img/products/1767361/2236815.jpg">
<em></em>
</a>
</div>
 
Последнее редактирование:
HELP
только начал разбираться и на "удивление" появилась куча вопросов.
1) <h1 class="good-info-header "><span class="good-info-number ">Код: 6397468</span> Смартфон Bravis A510 Jeans Blue</h1> - убрать <span>?
2) И совсем не понял как работать с картинками, если необходимо сохранить только url на картинку что делать?
1. Выбираешь Допустимые теги, пишешь <h1> и т.д. Для просмотра ссылки Войди или Зарегистрируйся
2. В загрузке, поле Возвращаемое значение - Ссылка Для просмотра ссылки Войди или Зарегистрируйся, Для просмотра ссылки Войди или Зарегистрируйся
 
  • Нравится
Реакции: prop
1. Выбираешь Допустимые теги, пишешь <h1> и т.д. Для просмотра ссылки Войди или Зарегистрируйся
2. В загрузке, поле Возвращаемое значение - Ссылка Для просмотра ссылки Войди или Зарегистрируйся, Для просмотра ссылки Войди или Зарегистрируйся
Спасибо, но
1) я хочу что бы span не выводился, исключить его из парсинга Для просмотра ссылки Войди или Зарегистрируйся
2) с картинками все получилось но вот интересно, а как получить в выгрузке не картинку а ссылку:
<div class="big-photo">
<a id="images-preview" class="lightbox" href="/ссылка">
<img title="" alt="" src="/URL картинки">
<em></em>
</a>
</div>
 
Т.е. убрать что между <span>?
update: попробуйте заменами от подстроки... и т.д.

Вы хоть ссылку на сайт дайте с которого парсите

Версия парсера?
 
Последнее редактирование:
Т.е. убрать что между <span>?
Да хочу убрать текст между span оставить только Название.
Версия 7.24
Сайт:
Скрытое содержимое доступно для зарегистрированных пользователей!

Хочу из него вытащить:
Код товара - проблем нет.
Название товара - проблема с тем что в теге h1 есть span
Url картинки - желательно большой, она открывается в поп ап (потому и думаю что нужно просто вытащить ссылку на нее)
Описание - проблем тоже не возникло.

UP: С заменой получилось разобраться с названием! Для просмотра ссылки Войди или Зарегистрируйся
 
Последнее редактирование:
Для картинок //div[@class='block-photos']/div
Получаем
<div class="big-photo">
<a id='images-preview' class="lightbox" href="/img/products/1767361/2236813.jpg">
<img title="" alt="" src="/img/products/1767361/2236815.jpg"></img>
<em></em>
</a>
</div>

С названием - Замены в помощь!
Стандартными заменами Для просмотра ссылки Войди или Зарегистрируйся
 
  • Нравится
Реакции: prop
Очень прошу помочь, нужна компания на парс сайта isolux.ru, даже не все нужно спарсить, а просто наименование/артикул/описание. Необходимо просто всем товарам обновить описание.
 
А кто сталкивался с недопустимыми символами ?
Ошибка экспорта данных в Excel: "&#x3;", шестнадцатеричное значение 0x03, является недопустимым знаком.
Как решали подобные проблемы?

А где храниться проект? Можно ли ее отредактировать без программы?

Замена не работает :)
Для просмотра ссылки Войди или Зарегистрируйся
Писец
 
Вечер добрый!

Задача
Сайт
Скрытое содержимое доступно для зарегистрированных пользователей!

Нужно собрать данные из! таблицы - Для просмотра ссылки Войди или Зарегистрируйся Каждую строку в таблице по отдельности!
Как привязать в парсере что бы забирал по строчкам - Наружный слой, Расцветка, Комфортная температура эксплуатации и т.д.?
Отличительные особенности исключить!

Для каждой категории в доноре эти данные одинаковые Наружный слой, Расцветка, Комфортная температура эксплуатации и т.д.!

Хочу подвязать эти данные к атрибутам товара (Opencar 3x)
Посижу сегодня с заменами, но вдруг есть более простой и быстрый способ!

На выходе
Код:
Наружный слой|«Твил» - «Hi-Pora CATS EYE»
Расцветка|«Цифра»
Размерный ряд|46-64, рост 170-188
Комплектация|Брюки
Комфортная температура эксплуатации|от +10°С до +20°С
Пропитка|Водоотталкивающая

Спасибо!
 
Назад
Сверху