Парсер текста с сайта.

Neow15ard

Постоялец
Регистрация
26 Ноя 2008
Сообщения
418
Реакции
190
Поиск рулит, в этой теме выше есть
Для просмотра ссылки Войди или Зарегистрируйся
Он же vipbablo web grabber. Грабит все, импортирует куда угодно. весчь универсальная в любом смысле если есть руки не из ж...ы...
 

aswsa

Писатель
Регистрация
17 Июл 2009
Сообщения
8
Реакции
0
я юзаю sibir textmaker - довольно неплохой скрипт, парсит медленно, но верно, поддерживаются различные варианты экспорта текста
 
L

lord13

Прохожие
а так чтоб картинки парсил и таблицы?
 

sens08

Постоялец
Регистрация
13 Авг 2009
Сообщения
107
Реакции
22
Пользуюсь
Умеет грабить весь сайт. Записывает результат в один файл.
 

Neow15ard

Постоялец
Регистрация
26 Ноя 2008
Сообщения
418
Реакции
190
А может кому попадался и граббер сайтов ? Скрипт серверный интересует.
Не просто wget -bget а с css и картинками из css и т.д.
 

hakon

Просто хороший человек
Регистрация
8 Авг 2009
Сообщения
302
Реакции
25
подскажите, какой из вышеназванных парсеров может тексты с форумов грабить? под систему nipel надо настроить
 

Akcium

Мой дом здесь!
Регистрация
11 Июн 2007
Сообщения
452
Реакции
253

webmikestudio

Создатель
Регистрация
24 Янв 2009
Сообщения
16
Реакции
0
Вот самый простой парсер на php^

PHP:
$text = implode('', file ('http://news.yandex.ru/finances.rss'));
preg_match_all('|<item>(.*)</item>|Uis', $text, $item);

for($i = 0; $i < count($item['0']); $i++){
	preg_match('|<title>(.*)</title>|Uis', $item['0'][$i], $res['title'][$i]);
	preg_match('|<pubDateUT>(.*)</pubDateUT>|Uis', $item['0'][$i], $res['pubDateUT'][$i]);
	preg_match('|<description>(.*)</description>|Uis', $item['0'][$i], $res['description'][$i]);
}

for($i = 0; $i < 4; $i++){
	echo date('d.m.y H:i', $res['pubDateUT'][$i]['1']).'<br />';
 
Сверху