Парсер Яндекс.Маркета из прайса

Статус
В этой теме нельзя размещать новые ответы.

alexmir

Постоялец
Регистрация
4 Дек 2006
Сообщения
118
Реакции
18
Вобщем есть парсер яндекс маркета который парспо заданному прайсу описание и картинки к товарам, пытался прикрутработу через проксики но чето не получаеться, короче выкладываю а там совместными усилиями думаю доведем до ума! Все файлики во вложении!
 

Вложения

  • parser.zip
    3,3 KB · Просмотры: 109

mistr-t

Мой дом здесь!
Регистрация
4 Окт 2006
Сообщения
594
Реакции
225
Вылаживаю полноценный рабочий парсер Яндекс.Маркет
*** скрытое содержание ***
Если остался парсер, залей снова, а то:
"Такого файла не существует или он был удален из-за нарушения авторских прав"... :(
 

alexmir

Постоялец
Регистрация
4 Дек 2006
Сообщения
118
Реакции
18
stealthdebuger раскажи поподробнее как поставить тове чудо, он на локалхосте работает?
 

-=BlackSmoke=-

Профессор
Регистрация
4 Авг 2009
Сообщения
280
Реакции
49
Яндекс не банит за дублирование его инфы? И можно ли в индекс загнать, кто пробовал?
 

Aragorn

Постоялец
Регистрация
2 Окт 2006
Сообщения
117
Реакции
80
Народ как его запустить, точнее заставить парсить, подскажите мануал плиз
 

Andrey-varvara

Постоялец
Регистрация
1 Май 2007
Сообщения
73
Реакции
98
Народ как его запустить, точнее заставить парсить, подскажите мануал плиз
Может я тебя не понял...но в папке docs есть ридми, где всё расписано...
===============================
4. Описание настроек интерфейса
===============================
1. URI - ссылка на начальную страницу со списком товаров, страница не обязательно должна быть первой,
можно указывать последнюю или предпоследнюю для тестов
2. ID продукта (не обязательный) - рег парсит только title продукта, берётся первая группа (первые скобки),
в данный момент считается что ID - это последняя последовательность символов без пробелов
и до скобок в конце названия, чтоб выкусывать из названий Toshiba SATELLITE P100-387 (Core 2 Duo 2160Mhz/17.0"/1024Mb/100.0Gb/DVD-RW)
3. Ссылка на следущую страницу (не обязательный) - рег парсит всю страницу, берётся первая группа,
для всех последующих страниц рег применяется одинаковый
4. Ссылка на продукт со страницы списка (не обязательный) - рег парсит всю страницу,
для выкусывания ссылок на продукты, со страниц со списком продуктов.
5. Производитель - любой текст, будет использоваться только при экспорте в базу
6. Список свойств - список текстовых названий свойств (case insensetive), разделённых символом
перевода строки, если поле пустое - сохраняются все настройки, иначе только указанные в нём.
7. Класс товаров - любой текст, добавляется запись в таблицу products__categories и к ней проставляются свойста товаров,
каждому товару тоже проставляется этот класс и значения динамических свойств.
8. Профили свойств - для добавления профиля нужно обязательно указать его название и нажать добавить -
все значения поляей формы на момент добавления будут сохранены в профиле. Для изменения профиля
нужно его загрузить - выбрать и списка и кнопка "загрузить", потом поменять значения полей и кнопка "сохранить"
p.s. все реги обрамляются тильдами и ставятся модификаторы Us, пример, вводим <a href="([^"]+)">,
в коде он преобразуется в ~<a href="([^"]+)">~Us
p.p.s. не обязательные параметры имеют уже встроеные в код обработчики.
:)
 
Статус
В этой теме нельзя размещать новые ответы.
Сверху