Парсер Datacol

APSALIM

Постоялец
Регистрация
28 Фев 2013
Сообщения
131
Реакции
95
Datacol - парсер для любых сайтов
Скрытое содержимое доступно для зарегистрированных пользователей!


Связанные темы:
Скрытое содержимое доступно для зарегистрированных пользователей!

Скрытое содержимое доступно для зарегистрированных пользователей!
 
.*? - любая строка (. - любой символ ; * - любое количество раз; ? - выбираем самое короткое совпадение из всех возможных)

абв.*?$ - от последовательности абв и до конца строки

^.*?абв - от начала строки до последовательности абв

[^<>]*? - строка без тегов <a[^><]*?Для просмотра ссылки Войди или Зарегистрируйся

[^/]*? - строка без слеша site/[^/]*?/[^/]*?/$

[\d]{4,6} - строка, в которой есть последовательность, состоящая из 4-6 цифр, идущих подряд

[\d]{4,6}$ - строка, которая заканчивается последовательностью, состоящей из 4-6 цифр, идущих подряд

[\d]{2}$- строка, которая заканчивается последовательностью, состоящей из 2 цифр, идущих подряд

[a-zа-я0-9А-ЯA-Z-]* - строка любой длины из символов английского и русского алфавитов, цифр и тире.

В твоем случае в заменах это ,.*?$ на пустоту и галочку regex
 
разобрался буквально только - правилами идентификации ссылки href="([^"]*?)"

Но наступил на грабли с запросом:
INSERT INTO `shop`.`428854731_rus_catalog_products` (`id`, `category_id`, `group_id`, `ptype_id`, `product_code`, `product_title`, `alias`, `product_inf`, `product_description`, `currency`, `price_1`, `price_2`, `price_3`, `price_4`, `price_5`, `image_middle`, `image_big`, `product_availability`, `active`, `rank`, `leader`, `novelty`, `seo_title`, `description`, `keywords`, `hits`, `owner_id`, `usr_group_id`, `rights`)


VALUES (NULL, '84', '0', '0', '%product_code%', '%product_title%', NULL', '', '%product_description%<br>%parameters%<br><a href="/files/sm/%docs%" class="sm">DataSheet (описание компонента)</a>', 'RUR', '%price_1%', '0.00', '0.00', '0.00', '0.00', '%image_midle%', '%image_big%', '1000', '1', '0', '0', '0', '', NULL, NULL, '0', '1', '1', '4081');

Не хотит в БД загружать:
 

Вложения

  • 2015-01-02 22-09-15 Скриншот экрана.png
    2015-01-02 22-09-15 Скриншот экрана.png
    31,2 KB · Просмотры: 25
Последнее редактирование:
Скачал прогу с темы по доступной ссылке, настроил парсер, но что то по окончанию парсинга данных неи файла указанного в настройках :( Может есть другая версия программы где работает парсинг данных в разные форматы?
 
Скачал прогу с темы по доступной ссылке, настроил парсер, но что то по окончанию парсинга данных неи файла указанного в настройках :( Может есть другая версия программы где работает парсинг данных в разные форматы?
в каком формате нужно?сохраняет во всех доступных форматах, скинь свою компанию и напиши в каком формате нужно
 
разобрался буквально только - правилами идентификации ссылки href="([^"]*?)"

Но наступил на грабли с запросом:
INSERT INTO `shop`.`428854731_rus_catalog_products` (`id`, `category_id`, `group_id`, `ptype_id`, `product_code`, `product_title`, `alias`, `product_inf`, `product_description`, `currency`, `price_1`, `price_2`, `price_3`, `price_4`, `price_5`, `image_middle`, `image_big`, `product_availability`, `active`, `rank`, `leader`, `novelty`, `seo_title`, `description`, `keywords`, `hits`, `owner_id`, `usr_group_id`, `rights`)


VALUES (NULL, '84', '0', '0', '%product_code%', '%product_title%', NULL', '', '%product_description%<br>%parameters%<br><a href="/files/sm/%docs%" class="sm">DataSheet (описание компонента)</a>', 'RUR', '%price_1%', '0.00', '0.00', '0.00', '0.00', '%image_midle%', '%image_big%', '1000', '1', '0', '0', '0', '', NULL, NULL, '0', '1', '1', '4081');

Не хотит в БД загружать:
Для просмотра ссылки Войди или Зарегистрируйся попробуй тут спросить или может найдешь что то подобное
 
в каком формате нужно?сохраняет во всех доступных форматах, скинь свою компанию и напиши в каком формате нужно
В общем с версией 5.17 выложенной в этой теме у меня не шло сохранение ни в один формат результатов парсинга. Нашёл версию 5.54 и всё пошло на ура!
PS версия 5.17 почему то после замены кракнутой версией отображал версию 5.31 а не 5.17.
 
В общем с версией 5.17 выложенной в этой теме у меня не шло сохранение ни в один формат результатов парсинга. Нашёл версию 5.54 и всё пошло на ура!
PS версия 5.17 почему то после замены кракнутой версией отображал версию 5.31 а не 5.17.
поделитесь,пожалуйста вашей версией
 
Какой из парсеров удобен для освоения Datacol или Content downloader?
 
Назад
Сверху