- Автор темы
- #1
Предлогаю к обсуждению граббер новостей WP-IMPORT.
Скрипт действительно стоящий, но имеющий много своих не доработок. После его возможностей я напишу проблемы, с которыми столкнулся при работе с ним.
Вот возможности скрипта описаные на сайте автора:
Сбор контента с HTML-страниц и RSS-лентОсновной задачей парсера контента WP Import является сбор информации с сайтов-источников. Для реализации этой функции Вам достаточно лишь подобрать нужные ключевые слова и ресурсы-источники, с которых необходимо осуществлять парсинг, а все остальное сделает WP Import.
Сохранение изображений и изменение их размеров
Любой текст воспринимается гораздо лучше, если он иллюстрирован. Поэтому, заботясь о контенте для сайта, не забывайте и о картинках. Парсер WP Import позволяет сохранять рисунки из новостей, изменять их размеры, если они превышают заданные границы, а также использовать hotlink, если Вы не хотите перегружать Ваш сервер.
Модерирование контента
WP Import позволяет модерировать напарсенный контент, удалять ненужные новости. Встроенный фильтр дубликатов недопустит две одинаковые новости на Вашем сайте. Также скрипт позволяет добавлять копирайт в конец текста новости.
Фильтр html-тегов
Использование фильтра html-тегов позволит Вам автоматически избавиться от исходящих ссылок и других ненужных элементов, «отягчающих» страницу.
Фильтр ключевых слов
Эта опция позволяет задавать обязательные ключевые слова, наличие которых в тексте статьи разрешает дальнейшую обработку текста. Кроме того, можно задавать «нежелательные» слова, и парсер WP-Import будет игнорировать тексты, содержащие их.
Распределение контента по разделам
Грабер новостей WP Import автоматически распределяет полученную информацию по разделам, основываясь на плотности ключевых слов в тексте новости.
Форматирование текста
Используя данную функцию, можно регулировать размеры превью новостей. Скрипт старается выделить превью статьи, не разрывая абзацы.
Замена ключевых слов ссылками и поддержка плагина WPKeysСкрипт позволяет в автоматическом режиме производить замену ключевых слов и фраз на ссылки. Для составления списка ключевых слов и ссылок поддерживается использование масок.
Хорошее понимание русского и английского текстов.Интегрировав парсер текстов в свой сайт и установив соответствующие настройки, Вы можете получать качественный контент как на русском, так и на английском языке. А встроенные в скрипт парсера конвертеры кодировок (в том числе поддержка UFT-8) расширяют возможные границы источников контента.
Работа с proxy
Изменение настроек парсера WP Import позволяет осуществлять сбор контента как напрямую с RSS/XML-лент и HTML-страниц, так и с использованием proxy серверов.
Поддержка популярных CMSДанная функция дает возможность подключения к блогам, создания сайтов с большими объемами информации, а также сбор контента с блогов и публикацию его в новостной ленте.
Встроенный скрипт редиректа ссылок
Что бы уменьшить количество исходящих ссылок с Вашего сайта, Вы можете легко использовать встроенный редирект
Установка нескольких парсеров
Установив несколько парсеров, Вы можете парсить контент с нескольких сайтов, что позволяет дать Вашим посетителям больше тематической информации, что сделает Ваш сайт интересным и повысит уникальность проекта.
Простота установки и настройка
Удобство интегрирования в структуру сайта и простота настройки делают работу с парсером WP Import легкой и приятной.
ПРОБЛЕМЫ
Сначало о настройках, на которых работал.
Устанавливал WP-IMPORT вместе с WP 2.2.2 (WP взят с maxsite.org, русская версия) Кодировка WP - UTF8, Кодировка БД - UTF8, Кодировка WP-IMPORT - UTF8.
1. это кодировка при постинге.
Парсить и постить можно двумя способами при редиректе между действиями Парс РСС - Парс ШТМЛ - Постинг и без редиректа выполняя поочередно эти действия.
Вот возникла такая поблема когда стоит редирект то публикует 3-4 поста, а потом начинает в кодировке, если эти действия делать без редиректа, то публикует в нормальной кодировке чуь больше постов от 6 - 10.
При этом наблюдал что парсит РСС и ШТМЛ в нормальной кодировке. Проблема значит возникает при публикации.
2. Постить возможно только по 3 поста
Хотелось бы расширить эту возможность.
3. при добавлении новой РСС ленты, почему -то удаляются другие.
4. Часто выкидывает ошибку при в ходе в модерацию.
ПРЕДЛОЖЕНИЕ.
Скрипт действительно хорош в работе. я не программист потму не смогу исправить проблемы и неудобности скрипта. Предлогаю вместе поработать над ним, устранить проблемы, улучшить для нашего использования.
Добавить возможность постить больше чем 3 поста и сделать его с автонаполнением разделов ВП.
ПИшите свои проблемы и предложения в работе с ВП-импорт.
ВОПРОС
Стоит ли исправлять и улучшать скрипт? Будем над этим работать?
Если потребуется исходник скрипта, выложу!
Скрипт действительно стоящий, но имеющий много своих не доработок. После его возможностей я напишу проблемы, с которыми столкнулся при работе с ним.
Вот возможности скрипта описаные на сайте автора:
Сбор контента с HTML-страниц и RSS-лентОсновной задачей парсера контента WP Import является сбор информации с сайтов-источников. Для реализации этой функции Вам достаточно лишь подобрать нужные ключевые слова и ресурсы-источники, с которых необходимо осуществлять парсинг, а все остальное сделает WP Import.
Сохранение изображений и изменение их размеров
Любой текст воспринимается гораздо лучше, если он иллюстрирован. Поэтому, заботясь о контенте для сайта, не забывайте и о картинках. Парсер WP Import позволяет сохранять рисунки из новостей, изменять их размеры, если они превышают заданные границы, а также использовать hotlink, если Вы не хотите перегружать Ваш сервер.
Модерирование контента
WP Import позволяет модерировать напарсенный контент, удалять ненужные новости. Встроенный фильтр дубликатов недопустит две одинаковые новости на Вашем сайте. Также скрипт позволяет добавлять копирайт в конец текста новости.
Фильтр html-тегов
Использование фильтра html-тегов позволит Вам автоматически избавиться от исходящих ссылок и других ненужных элементов, «отягчающих» страницу.
Фильтр ключевых слов
Эта опция позволяет задавать обязательные ключевые слова, наличие которых в тексте статьи разрешает дальнейшую обработку текста. Кроме того, можно задавать «нежелательные» слова, и парсер WP-Import будет игнорировать тексты, содержащие их.
Распределение контента по разделам
Грабер новостей WP Import автоматически распределяет полученную информацию по разделам, основываясь на плотности ключевых слов в тексте новости.
Форматирование текста
Используя данную функцию, можно регулировать размеры превью новостей. Скрипт старается выделить превью статьи, не разрывая абзацы.
Замена ключевых слов ссылками и поддержка плагина WPKeysСкрипт позволяет в автоматическом режиме производить замену ключевых слов и фраз на ссылки. Для составления списка ключевых слов и ссылок поддерживается использование масок.
Хорошее понимание русского и английского текстов.Интегрировав парсер текстов в свой сайт и установив соответствующие настройки, Вы можете получать качественный контент как на русском, так и на английском языке. А встроенные в скрипт парсера конвертеры кодировок (в том числе поддержка UFT-8) расширяют возможные границы источников контента.
Работа с proxy
Изменение настроек парсера WP Import позволяет осуществлять сбор контента как напрямую с RSS/XML-лент и HTML-страниц, так и с использованием proxy серверов.
Поддержка популярных CMSДанная функция дает возможность подключения к блогам, создания сайтов с большими объемами информации, а также сбор контента с блогов и публикацию его в новостной ленте.
Встроенный скрипт редиректа ссылок
Что бы уменьшить количество исходящих ссылок с Вашего сайта, Вы можете легко использовать встроенный редирект
Установка нескольких парсеров
Установив несколько парсеров, Вы можете парсить контент с нескольких сайтов, что позволяет дать Вашим посетителям больше тематической информации, что сделает Ваш сайт интересным и повысит уникальность проекта.
Простота установки и настройка
Удобство интегрирования в структуру сайта и простота настройки делают работу с парсером WP Import легкой и приятной.
ПРОБЛЕМЫ
Сначало о настройках, на которых работал.
Устанавливал WP-IMPORT вместе с WP 2.2.2 (WP взят с maxsite.org, русская версия) Кодировка WP - UTF8, Кодировка БД - UTF8, Кодировка WP-IMPORT - UTF8.
1. это кодировка при постинге.
Парсить и постить можно двумя способами при редиректе между действиями Парс РСС - Парс ШТМЛ - Постинг и без редиректа выполняя поочередно эти действия.
Вот возникла такая поблема когда стоит редирект то публикует 3-4 поста, а потом начинает в кодировке, если эти действия делать без редиректа, то публикует в нормальной кодировке чуь больше постов от 6 - 10.
При этом наблюдал что парсит РСС и ШТМЛ в нормальной кодировке. Проблема значит возникает при публикации.
2. Постить возможно только по 3 поста
Хотелось бы расширить эту возможность.
3. при добавлении новой РСС ленты, почему -то удаляются другие.
4. Часто выкидывает ошибку при в ходе в модерацию.
ПРЕДЛОЖЕНИЕ.
Скрипт действительно хорош в работе. я не программист потму не смогу исправить проблемы и неудобности скрипта. Предлогаю вместе поработать над ним, устранить проблемы, улучшить для нашего использования.
Добавить возможность постить больше чем 3 поста и сделать его с автонаполнением разделов ВП.
ПИшите свои проблемы и предложения в работе с ВП-импорт.
ВОПРОС
Стоит ли исправлять и улучшать скрипт? Будем над этим работать?
Если потребуется исходник скрипта, выложу!