Подскажите как написать парсер.

Статус
В этой теме нельзя размещать новые ответы.
А как то же самое реализовать через сокеты?
 
А как то же самое реализовать через сокеты?

Для просмотра ссылки Войди или Зарегистрируйся
PHP:
$host='yandex.ru';
$path='/';
$rn=chr(13).chr(10);
$s=fsockopen($host, 80);
fwrite($s, 'GET '.$path.' HTTP/1.0'.$rn
.'Host: '.$host.$rn
.'Connection: Close'.$rn.$rn);
while(!feof($s) && $rn!==fgets($s,1024));
$body='';
while(!feof($s))$body.=fread($s,1024);
fclose($s);
 
allsu
проходишься по всему массиву и выводишь картинки со ссылками, в чем сложность то?
 
allsu
проходишься по всему массиву и выводишь картинки со ссылками, в чем сложность то?

сложность в том что я не понимаю как это сделать:ah:
если бы я знал и понимал как это организовать не задавал бы сдесь вопросов.

Если Вы знаете и можете помочь буду очень благодарен(может не только я)
 
сложность в том что я не понимаю как это сделать:ah:
если бы я знал и понимал как это организовать не задавал бы сдесь вопросов.

Если Вы знаете и можете помочь буду очень благодарен(может не только я)
Если вообще не понимаешь php то начинай изучать. Выше описаны вполне рабочие примеры.(curl правда вроде нужно предварительно установить)
 
Если вообще не понимаешь php то начинай изучать. Выше описаны вполне рабочие примеры.(curl правда вроде нужно предварительно установить)

спасибо вы действительно помогли :thenks:
 
Подстановка браузера в file_get_contents

Для того чтобы прикинуться браузером или ботом - не обязательно использовать curl, есть решение проще.
Кстати, и для того чтобы через прокси ходить курл не нужен - все делается через контекст.
PHP:
$contextArray = array(
    'http' => array(
        'user_agent' => 'Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)',
        'max_redirects' => 1,
        'timeout' => 120
    )
);

$context = stream_context_create( $contextArray );
$content = file_get_contents( $url, false , $context);
 
Есть еще такое:

PHP:
@ini_set('user_agent', 'Mozilla/4.0');
$str = @file_get_contents('http://site.com/');

имхо самый простой путь. Да и вообще, прикидываться юзерагентом имхо бессмысленно - никто на него все равно не смотрит. А если вдруг кто-то начнет смотреть - то тут явно задача не для новичка, полностью закосить под нормальный брузер...
 
  • Заблокирован
  • #20
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху