Пишу автоблоггер

Статус
В этой теме нельзя размещать новые ответы.
zizop - гугл будет читать, все для него родимого :)
А вместо текста всегда можно использовать мувики, картинки, флеш игры и т.п.....
 
Ну так надо, чтобы картинка более-менее подходила к теме. Значит надо как-то тему по тексту определять.
Вообщем резюмируя ответы коллег могу сказать, что тема html-парсинга страниц сделана в NewsGrabber как-то, и в Lasto Splog. Исходник первого я раздобыл, но еще не смотрел, второго же нет пока. А алгоритм выдирания статьи с сайта с картинкой (без сигнатур этого сайта, т.е. универсальный алгоритм) пока не найдет. Буду копать в этом направлении.:rolleyes:
 
zizop бери картинки с flickr, там можно забирать их через рсс или api по твоему тегу.
Так же можно брать и мувики с ютуба или вообще рандомом выводить 5-10 картинок или мувиков, юзер все равно все подряд смотреть не будет.
 
Функция автоматического выдирания полной статьи с любого сайта.
Как работает:
Берется самый большой кусок кода, не содержащего никаких тегов кроме img b table
 
Функция автоматического выдирания полной статьи с любого сайта.
Как работает:
Берется самый большой кусок кода, не содержащего никаких тегов кроме img b table

интересно, а можешь поподробнее описать, как это сделать?
 
Сразу режем все кроме содержания тега <body>
потом ищим самый большой по длинне кусок кода короый находится в теге <div> или <td> и при этом не содержит
никаких тегов кроме img, b, strong. Сюда же можно разрешить код youtube. - на мой взгляд верные параметры полезного контента страницы.
Как найти такой кусок кода- сам думай) Я еще не надумал. Если идеи будут- скажу...
 
вот тоже пишу тулзень сейчас под блоггер.
с интервалами между постами и выдиранем полного текста понятно, вот пока застрял на автореге блогов.
для жмыла авторег написал, прокси хавает, включает поп3/форвардинг, рег блогов пока в процессе.
может ужо есть готовая тулзень на пхп?
лень шарицца по ХТТП-хедерам :)
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху