Парсер текста с сайта.

iasam123

Писатель
Регистрация
9 Июл 2009
Сообщения
5
Реакции
0
MultiReader нормально парсит. Настраиваемый шаблон вырезки текста, есть фильтр по урлам.
В бесплатной версии только 1 поток закачки и только 1 проект возможен. Но проект можно после использования удалять и создавать новый или менять настройки использованного на новый источник :)
 
S

stedim

Прохожие
Присоединяюсь к первому посту

Добавлено через 2 минуты
А web-grabber бесплатый или к нему лекарство нужно?
 

serjik777

Постоялец
Регистрация
15 Авг 2009
Сообщения
537
Реакции
145
  • Заблокирован
  • #23
Присоединяюсь к первому посту
Добавлено через 2 минуты
А web-grabber бесплатый или к нему лекарство нужно?
Уже выложили, постов набрать надо вот и будет вам вместо лекарства;)
 

Aider

Постоялец
Регистрация
30 Июн 2009
Сообщения
125
Реакции
19
Нужен парсер адалт-рассказов, желательно на РНР, может кто посоветует.
 

vovaNux

Постоялец
Регистрация
10 Апр 2007
Сообщения
124
Реакции
17
PHP:
<?
// Функция для извлечения значения из строки
function extract_value($source, $start, $end)
{
$pos=@strpos($source, $start)+strlen(stripslashes($start));
$pos2=@strpos($source, $end, $pos);
$len=$pos2-$pos;
$output=substr($source, $pos, $len);
return $output;
}

for($num=1000; $num<10000; $num++)
{
flush();

$ras=file_get_contents("http://www.stulchik.net/ras.shtml?ras".$num."_1");

$samskaz=extract_value($ras, "<p align=\"justify\">", "<hr");
$fs=fopen ("./texts/".$num.".txt", "w");
fwrite($fs, str_replace("&nbsp;", "", $samskaz));
fclose($fs);
sleep(5);
}

?>

Думаю, принцип понятен.
 

komyak

Постоялец
Регистрация
4 Фев 2009
Сообщения
483
Реакции
194
vovaNux, а с preg_match_all не побыстрей будет обрабатывать?
PHP:
preg_match_all( '|<p align=\"justify\">"(.*?)<hr|is', $text, $matches, PREG_PATTERN_ORDER );
 

vovaNux

Постоялец
Регистрация
10 Апр 2007
Сообщения
124
Реакции
17
Вполне вероятно, что быстрее :) Я этот скрипт писал пару лет назад - конечно с регуляркой выглядит грамотнее
 

diditman

Создатель
Регистрация
9 Фев 2010
Сообщения
23
Реакции
1
Грабит любой сайт

Offline Explorer Enterprise.
Грабит любой сайт
 

invalidius

Писатель
Регистрация
8 Фев 2010
Сообщения
3
Реакции
0
Присоединяюсь нужен парсер эро-рассказов хотя бы с того же стульчика неважно пхп или win
 

AngryGYF

Постоялец
Регистрация
20 Июл 2009
Сообщения
104
Реакции
10
Я только платную программу такую знаю. 27$ стоит. Но она умеет грабить практически с любого сайта. Да и еще при этом картинки заливает в отдельную папку, да и еще импорт в wordpress и в zebrum lite есть. Да и еще куча всего, разработчик всё время что-то новенькое дописывает.
 
Сверху