[DMI] DMI Doorway Generator v.2.0 - Beta

Статус
В этой теме нельзя размещать новые ответы.
Уникальные словари из десятка тысяч статей, которые паралельно парсят тысячи пользователей DMI?

Что есть словарь - шаблоны предложений и словари слов по частям речи. При генерации контента он случайным образом выбирает предложения и слова.

Контент из какого словаря будет более уникальным - из десятка тысяч статей или миллиона (не забываем про тысячи людей которые одновременно с Вами парсят и генерят)?

Другое дело, что серьезный разбор статей (мой анализатор знает несколько десятков частей речи) занимает не одни сутки по времени и на поток его не поставить (т.е. один раз за пару недель сделал и всю жизнь пользуешься).
 
Уникальные словари из десятка тысяч статей, которые паралельно парсят тысячи пользователей DMI?

Что есть словарь - шаблоны предложений и словари слов по частям речи. При генерации контента он случайным образом выбирает предложения и слова.

Контент из какого словаря будет более уникальным - из десятка тысяч статей или миллиона (не забываем про тысячи людей которые одновременно с Вами парсят и генерят)?

Другое дело, что серьезный разбор статей (мой анализатор знает несколько десятков частей речи) занимает не одни сутки по времени и на поток его не поставить (т.е. один раз за пару недель сделал и всю жизнь пользуешься).

Ух ты! Мощьная штука. Случаем не на Python+NLTK написана?
 
Всётаки не могу я этот дорген забросить :)
Поставил себе на комп CentOS всё настроил запустил сбор словарей хоп словарик на 4.5 мега собрался, подумал о класс буду словарики собирать на компе, а потом их закину на дедик, но тут я обламался все последующие словарики больше чем 0.5 мегабайт не собирались.

Люди у кого всё окей ткните носом в пятку ;)

Zeratul а 2.05 ожидается (самая последняя версия без привязки и с поддержкой прокси) ?
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху