Ребят может кто сделает скрипт парсера внешних ссылок на сайте?

Статус
В этой теме нельзя размещать новые ответы.

rit

Постоялец
Регистрация
5 Дек 2006
Сообщения
567
Реакции
128
Ребят может кто сделает скрипт парсера внешних ссылок на сайте?

Т.е. скрипт парсит все страницы сайта и для каждой страницы записывает внешние ссылки.

Кто сможет такой скрипт забацать?
 

antidote

Профессор
Регистрация
21 Янв 2008
Сообщения
167
Реакции
42
Используй Xenu's Link Sleuth. Он тебе выдаст список ссылок сайта. Если в настройках снимешь галочку check external links, то после скана получишь вснешние ссылки с пометкой skip external.
Результат потом можно экспортировать например в csv. Но это по сути для ручной прогонки, если тебе это надо на постоянной основе, то тулза отпадает
 

swer

Профессор
Регистрация
14 Июн 2008
Сообщения
304
Реакции
38
PHP:
$contents = file_get_contents($site);

$contents = strip_tags($contents, "<a>");

preg_match_all("/(http:\\/\\/)?([a-z_0-9-.]+\\.[a-z]{2,3}(([ \"'>\r\n\t])|(\\/([^ \"'>\r\n\t]*)?)))/", $contents, $url);

for($i=0; $i<10; $i++){
echo $url[0][$i];}

вроде так....пробуй, но если у тя внешние ссылки начинаются с http:// то не сработает,те выдаст все ссылки.
 

Disher

Постоялец
Регистрация
25 Июл 2009
Сообщения
90
Реакции
8
Можно еще такое выражение использовать.
Код:
$reg_exp = preg_match_all("/<[Aa][ \r\n\t]{1}[^>]*[Hh][Rr][Ee][Ff][^=]*=[ '\"\n\r\t]*([^ \"'>\r\n\t#]+)[^>]*>/", $content, $url);
 

localhost:80

Постоялец
Регистрация
4 Дек 2008
Сообщения
102
Реакции
15
количество внешних ссылок, их визуальное выделение на странице, пузомерки и прочее уже реализовано в Seobar `ах для браузеров
 
Статус
В этой теме нельзя размещать новые ответы.
Сверху