Парсер Datacol

APSALIM

Постоялец
Регистрация
28 Фев 2013
Сообщения
131
Реакции
95
Datacol - парсер для любых сайтов
Скрытое содержимое доступно для зарегистрированных пользователей!


Связанные темы:
Скрытое содержимое доступно для зарегистрированных пользователей!

Скрытое содержимое доступно для зарегистрированных пользователей!
 
есть расфасовка плагин, он делает по столбцам, запись тегов и <br/>

сохранение url и формулов по ссылке смотреть ={1,100}
Можно подробнее ато ни слова не понял что куда сохранять и что делать с данными ={1,100}
 
Можно подробнее ато ни слова не понял что куда сохранять и что делать с данными ={1,100}
всё есть на сайте у них. Вопрос Ваш тоже не ясен, откуда куда брать и что делать, ссылку хотя бы
 
всё есть на сайте у них. Вопрос Ваш тоже не ясен, откуда куда брать и что делать, ссылку хотя бы
Сайт с которого пытаюсь парсить Для просмотра ссылки Войди или Зарегистрируйся скачать настройку Для просмотра ссылки Войди или Зарегистрируйся
Проблема заключается в том что при сборе ссылок собирает только с первой страницы, а на вторую не переходит.
 
Сайт с которого пытаюсь парсить Для просмотра ссылки Войди или Зарегистрируйся скачать настройку Для просмотра ссылки Войди или Зарегистрируйся
Проблема заключается в том что при сборе ссылок собирает только с первой страницы, а на вторую не переходит.
Попробуйте
Код:
//li[contains(@id, 'cIteam-')]/a[@class=' ']
//p[@class='image']/a
 
Во вкладке сбор данных, поля данных, выбор поля фото, вкладка замена.
Старое значение ^.*?href=" новое значение Для просмотра ссылки Войди или Зарегистрируйся
Старое значение ".*?$ новое значение ,

Спасибо, как вариант.
Но я сделал по статье:
Скрытое содержимое доступно для зарегистрированных пользователей!

получилась такая строка вырезания:
Код:
<a[^<>]*?id="i.*?"[^<>]*?href=["']([^<>]*?)["']>
 
Вечер добрый!
Нужна помощь в сборе ссылок!
Сайт
Скрытое содержимое доступно для зарегистрированных пользователей!

С 1 ссылкой все понятно, а вот со второй не могу собрать. Кабели витая пара,... - что-то типа категории, ссылки UUTP2-C5-S24-OUT-PE-BK-500, UUTP2-C5-S24-OUT-PE-BK-88 якоря как я понял.
Они ведут на страницу со ссылками на конечную страницу... Ссылка Кабели витая пара,... ведет на туже страницу что и якорные ссылки...
Вот надо собрать конечные ссылки после якорей
7.15, 5.583

********************* UPDATE *********************
Решение...
Я собрал ссылки на эти страницы, создал(скопировал) 2ю компанию, в качестве входных данных указал эти ссылки и все!
 
Последнее редактирование:
Как удалить тег <h1, 2, 3 и т.д.></h1, 2, 3 и т.д.> и текст между ними?
И как вырезать style="..." из таблиц и т.д.?

********************* UPDATE *********************

Вырезаем style="..."
Есно без кавычек '!
Старое значение 'style="[^\"]*"' -> Новое значение '' Regex

Вырезаем <h1, 2 и т.д.>какой-то текст<h1, 2>
Старое значение '<h2>[^\"]*</h2>' -> Новое значение '' Regex
 
Последнее редактирование:
Всем привет! прошу подсказать как парсить картинки с сайта Для просмотра ссылки Войди или Зарегистрируйся все вроде парсит но картинки ни в какую не скачивает.
 
Добрый день.
Может кто подскажет как экспортировать изображения в вордпресс?
Изображение при парсинге скачивается на комп и при экспорте закачивается на хостинг и в самой записи на него появляется ток ссылка вида Для просмотра ссылки Войди или Зарегистрируйся а само изображение не отображается. Может кто знает как сделать так, чтоб при экспорте в записи было
<img src="Для просмотра ссылки Войди или Зарегистрируйся ">
Пробовал в датакол прописывать <img src="%изображение% "> так он с такими данными вообще отказывается экспортировать в вордпресс.
Датакол 7 нулл использую, может у кого есть готовое решение или посказка куда копать.
 
Назад
Сверху