Ребят может кто сделает скрипт парсера внешних ссылок на сайте?

Статус
В этой теме нельзя размещать новые ответы.

rit

Постоялец
Регистрация
5 Дек 2006
Сообщения
567
Реакции
128
Ребят может кто сделает скрипт парсера внешних ссылок на сайте?

Т.е. скрипт парсит все страницы сайта и для каждой страницы записывает внешние ссылки.

Кто сможет такой скрипт забацать?
 
Используй Xenu's Link Sleuth. Он тебе выдаст список ссылок сайта. Если в настройках снимешь галочку check external links, то после скана получишь вснешние ссылки с пометкой skip external.
Результат потом можно экспортировать например в csv. Но это по сути для ручной прогонки, если тебе это надо на постоянной основе, то тулза отпадает
 
PHP:
$contents = file_get_contents($site);

$contents = strip_tags($contents, "<a>");

preg_match_all("/(http:\\/\\/)?([a-z_0-9-.]+\\.[a-z]{2,3}(([ \"'>\r\n\t])|(\\/([^ \"'>\r\n\t]*)?)))/", $contents, $url);

for($i=0; $i<10; $i++){
echo $url[0][$i];}

вроде так....пробуй, но если у тя внешние ссылки начинаются с http:// то не сработает,те выдаст все ссылки.
 
Можно еще такое выражение использовать.
Код:
$reg_exp = preg_match_all("/<[Aa][ \r\n\t]{1}[^>]*[Hh][Rr][Ee][Ff][^=]*=[ '\"\n\r\t]*([^ \"'>\r\n\t#]+)[^>]*>/", $content, $url);
 
количество внешних ссылок, их визуальное выделение на странице, пузомерки и прочее уже реализовано в Seobar `ах для браузеров
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху