[DMI] DMII 2.5

Статус
В этой теме нельзя размещать новые ответы.
Если словаря нет -дальше можно не дергаться. Проверь есть ли папка temp в Bin_and_Data и есть ли на нее права 777. Проверь чтоб на start-state-tagger и final-state-tagger были права 777 и чтоб они были скопированы в /bin и /usr/local/bin

С пустыми страницами разобрался, спасибо КАРАТу. А вот словарь не хочет работать. Поставил на start-state-tagger и final-state-tagger права 777 (до этого были 755), но ничего не изменилось. Когда я пытаюсь скопировать эти файлы в системную папку командой:
cp Bin_and_Data/start-state-tagger /bin/start-state-tagger
то выдает ошибку:
cp: cannot create regular file '/bin/start-state-tagger ' : Permission denied

Думаю хоста попросить их скопировать в эти папки, но боюсь что он пошлет меня)
 
Ну если в систеной папке не будет файлов start-state-tagger и final-state-tagger справами 777 то словарики собирать у тебя не получится.
Да и если ты на виртуале тебя быстро пнут оттуда.
 
у кого проблемы с тагером этим - есть извращенский способ ещё :D

в папке с разбивкой по частям речи файлы открываем word pad, подсовываем туда свои части речи ...
а расстановку частей речи в тексте (файл TMPL ) обрабатываем вот здесь

там лимит на 1000 слов правда
 
Не находит 2.5 картинки что то у меня.. Предыдущие версии находили. У всех так?
 
Эм да находил картинки ну точнее пару дней назад точно находил.
Я вчера когда Убунту переставлял в спешке и раздел с виндой снёс вот щас всё восстанавливаю ближе к вечеру поставлю Убунту проверю.
 
Не находит 2.5 картинки что то у меня.. Предыдущие версии находили. У всех так?

У меня тоже. Пришлось нагенерировать, только не знаю генерированные отличаются от обычных картинок, в плане для бота? И овертюра тоже чет не пашет, пришлось пользоваться Free Wordtracker.
 
ТОже юзаю фри вордтрекер + генеренные картинки - хотя так как он (DMI 2.5) все заливает на сервак, то можно и тупо картинки с рекламой в папку с шабом совать(поправиви шаблон). Генеренные картинки боты слава богу пока не палят.
 
:confused: Ага перестало картинки парсить

Код:
	sub get_img {
		my $kwd_p = str_replace($keyword,' ','+');
		my $kwd_t = str_replace($keyword,' ','-');
		my $browser = LWP::UserAgent->new();
		my $response = $browser-> get("http://www.picsearch.com/search.cgi?q=".$kwd_p,
			'User-Agent' => get_ua()
		);
		my $n = 0;
		my $picpage = $response->content;
		my @imgurls = $picpage =~ m/src="http:\/\/images.picsearch.com\/is\?.*?"/gsi;
		foreach $imgurl (@imgurls) {
			$imgurl =~s/src="//gsi;
			$imgurl =~s/"//gsi;
			my $response = $browser-> get($imgurl);
			my $img =   $response->content;
			infile($dr_path.'/'.$kwd_t.'-'.$n.'.jpg', $img);
			$n++;
		}
	}
Вот собственно код парсилки картинок.
И если попробовать зайти на images.picsearch.com получаем 404
В перле я не селён но может быть причина как раз в этом?
 
Спасение утопающих -дело рук самих утопающих!!! :)
Код:
    sub get_img {
        my $kwd_p = str_replace($keyword,' ','+');
        my $kwd_t = str_replace($keyword,' ','-');
        my $browser = LWP::UserAgent->new();
        my $response = $browser-> get("http://www.picsearch.com/search.cgi?q=".$kwd_p,
            'User-Agent' => get_ua()
        );
        my $n = 0;
        my $picpage = $response->content;
        my @imgurls = $picpage =~ m/src="http:\/\/[COLOR=Red]media2[/COLOR].picsearch.com\/is\?.*?"/gsi;
        foreach $imgurl (@imgurls) {
            $imgurl =~s/src="//gsi;
            $imgurl =~s/"//gsi;
            my $response = $browser-> get($imgurl);
            my $img =   $response->content;
            infile($dr_path.'/'.$kwd_t.'-'.$n.'.jpg', $img);
            $n++;
        }
    }
Исправляем в файле doorgen2.pl и все пучком!
 
Mamadu, а там не только media2, а ещё и media1. Одни картинки так, другие так. Попробовал у себя исправить на такое:
Код:
  my $n = 0;
  my $picpage = $response->content;
  my $picpage2 = $response->content;

 my @imgurls = $picpage =~ m/src="http:\/\/media1.picsearch.com\/is\?.*?"/gsi;
  foreach $imgurl (@imgurls) {
   $imgurl =~s/src="//gsi;
   $imgurl =~s/"//gsi;
   my $response = $browser-> get($imgurl);
   my $img =   $response->content;
   infile($dr_path.'/'.$kwd_t.'-'.$n.'.jpg', $img);
   $n++;
  }
  my @imgurls2 = $picpage2 =~ m/src="http:\/\/media2.picsearch.com\/is\?.*?"/gsi;
  foreach $imgurl2 (@imgurls2) {
   $imgurl2 =~s/src="//gsi;
   $imgurl2 =~s/"//gsi;
   my $response = $browser-> get($imgurl2);
   my $img2 =   $response->content;
   infile($dr_path.'/'.$kwd_t.'-'.$n.'.jpg', $img2);
   $n++;
  }

Может и криво, но работает :)
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху