Newsgrabber - Проблемы

Народ, подскажите, NG установил, в кроне админки задал
путь /home/admin/domains/domain.ru/public_html/news/admin/cron/source.getcontent.php
и указал обновлять каждый час. Только вот где задать урл - откуда грабить контент ? :nezn:
p.s. простите за неосведомлённость
Откуда грабить контент настраивается в админке NG - RSS-ленты. :smmne:
 
Создаю новую ленту прописываю все по примеру с BBC, проверяю результат (Там же функция) показывает нормально новость, сохраняю нажимаю грабить он пару сек буквально о чем то думает и ничего не добавляет. В чем может быть трабла?

Была проблема: Cannot redeclare SiteObject::$Table но закоментил var $Table = Array(); в lib.obj.php и заработало мот из-за этого?
 
граббер работает, но в тексте показывает полностью страницу сайта, с которого беруться новости. А как сделать чтобы показывалась только новость, а не весь сайт?
 
Коллеги, поиск результата не дал, поэтому пишу сюда.

В общем по-порядку:
1) установил граббер, настроил - работает
2) добавил источники новостей, которые имели рсс трансляцию(имеют тайтл, дескрипшн и линк), указал шаблон для новости а основе хтмл кода страницы - все работает прекрасно
3) добавил источники новостей, которые не имеют рсс трансляции. то есть в которых нужно указывать как шаблон новость, так и шаблон заголовка вручную. обновляю. выдает ошибку:
Код:
Warning: preg_replace_callback() requires argument 2, 'nlbr', to be a valid callback in /www/x39/www/htdocs/admin/cron/source.getcontent.php on line 195

Warning: Cannot modify header information - headers already sent by (output started at /www/x39/www/htdocs/admin/cron/source.getcontent.php:195) in /www/x39/www/htdocs/admin/rss.php on line 166

но новости все же обновляет и даже отображает их на сайте очень даже хорошо

всё бы ничего, можно было бы и так жить, но блин, не хочет source.getcontent.php работать, когда ошибки вылазят. всего около 20 источников новостей, процентов 70 из них грабятся способом, который выдает ошибку. дойдя до первого из источников, source.getcontent.php, спотыкается и дальше ничего не обновляет... очень грустно от этого становится :(

в общем с удовольствием выслушаю любые ваши рекомендаии и советы по данному вопросу.

с уважением, Антон

UPD: найденный в этом топике совет просто удалить эту строку не помогает
 
Коллеги, поиск результата не дал, поэтому пишу сюда.

В общем по-порядку:
1) установил граббер, настроил - работает
2) добавил источники новостей, которые имели рсс трансляцию(имеют тайтл, дескрипшн и линк), указал шаблон для новости а основе хтмл кода страницы - все работает прекрасно
3) добавил источники новостей, которые не имеют рсс трансляции. то есть в которых нужно указывать как шаблон новость, так и шаблон заголовка вручную. обновляю. выдает ошибку:
Код:
Warning: preg_replace_callback() requires argument 2, 'nlbr', to be a valid callback in /www/x39/www/htdocs/admin/cron/source.getcontent.php on line 195

Warning: Cannot modify header information - headers already sent by (output started at /www/x39/www/htdocs/admin/cron/source.getcontent.php:195) in /www/x39/www/htdocs/admin/rss.php on line 166

но новости все же обновляет и даже отображает их на сайте очень даже хорошо

всё бы ничего, можно было бы и так жить, но блин, не хочет source.getcontent.php работать, когда ошибки вылазят. всего около 20 источников новостей, процентов 70 из них грабятся способом, который выдает ошибку. дойдя до первого из источников, source.getcontent.php, спотыкается и дальше ничего не обновляет... очень грустно от этого становится :(

в общем с удовольствием выслушаю любые ваши рекомендаии и советы по данному вопросу.

с уважением, Антон

UPD: найденный в этом топике совет просто удалить эту строку не помогает
Нужно в настройках RSS-лент правильно прописать тэги. Где skip, а где get. Лучше всего посмотреть исходный код предполагаемой для грабежа страницы и найти перед и после текста новости УНИКАЛЬНЫЙ код, которого нет больше на странице. Тогда и ошибок не будет. У меня к примеру, 35 источников работают как часы. Ошибка бывает иногда на 1-2 новостях, да и то, когда админы сайтов-источников начинают мудрить с HTML.
 
прописал путь в админке хостинга - /home/domin.com/htdocs/admin/cron/source.getcontent.php

При запуске вызрощает ошибку -

Return code = 32256

в чём может быть проблема ? :confused:
 
Два дня промучался, но ничего сделать не мог. Отчаянье прям какое-то... Коллега, помоги, пожалуйста. Попробуй Для просмотра ссылки Войди или Зарегистрируйся сграбить? :thenks:

Нужно в настройках RSS-лент правильно прописать тэги. Где skip, а где get. Лучше всего посмотреть исходный код предполагаемой для грабежа страницы и найти перед и после текста новости УНИКАЛЬНЫЙ код, которого нет больше на странице. Тогда и ошибок не будет. У меня к примеру, 35 источников работают как часы. Ошибка бывает иногда на 1-2 новостях, да и то, когда админы сайтов-источников начинают мудрить с HTML.
 
Подскажите пожалуйста, у меня такая же проблемма, но safe_mode выключен на хостинге, что это ещё может быть????????

поменяй значение на 24 строке в файле get_content.php

Код:
curl_setopt ($ch, CURLOPT_FOLLOWLOCATION, 1);
на
Код:
curl_setopt ($ch, CURLOPT_FOLLOWLOCATION, 0);


Добавлено через 2 минуты
граббер работает, но в тексте показывает полностью страницу сайта, с которого беруться новости. А как сделать чтобы показывалась только новость, а не весь сайт?

не правильно настроен шаблон рсс ленты
 
Назад
Сверху