Rss Alligator

Хороший парсер?


  • Всего проголосовало
    14
  • Опрос закрыт .
Статус
В этой теме нельзя размещать новые ответы.
иди в раздел фрихостов... 6te.net arler.com хз - выбирать надо!
 
при попытке создать новый файл (create new)-
Fatal error: Cannot break/continue 1 level in /blablabla/alligator/index.php on line 47
у кого нибудь было такое? как решается?
 
Ужасный парсер. Как открыл код я ужаснулся и понял почему он так криво работает.
Его недостатки (критические:(
1) Понимает только формат Atom, но не RSS.
2) Парсит фид по средством регулярных выражений за счет чего некоторые фиды не парсятся вообще, либо не парсится Title или Link . УЖААААС - не парсится Title в поиске по блогам Гугли
3) С урла поста выдирает не статью а полный текст страницы. Вместе с текстом менюшных ссылок и даже копирайтами, если таковые там имеются. Еще больший ужас.

Сейчас его буду переделывать под работу через DOM XML. И чтобы он RSS понимал.

PS: Как сделаю обязательно выложу.

to: ilyakapu

сообщи пожалуйста удалось переделать парсер что бы работал с RSS ? пробовал действительно грабит все подряд а не только тексты статей
 
...-это указать рсс граберу ссылку на фид и вы получите страницу, на которой будут теже новости, но только в полном виде.А в оригинале они порезаны?
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху