W
woyager
Прохожие
Уникальные словари из десятка тысяч статей, которые паралельно парсят тысячи пользователей DMI?
Что есть словарь - шаблоны предложений и словари слов по частям речи. При генерации контента он случайным образом выбирает предложения и слова.
Контент из какого словаря будет более уникальным - из десятка тысяч статей или миллиона (не забываем про тысячи людей которые одновременно с Вами парсят и генерят)?
Другое дело, что серьезный разбор статей (мой анализатор знает несколько десятков частей речи) занимает не одни сутки по времени и на поток его не поставить (т.е. один раз за пару недель сделал и всю жизнь пользуешься).
Что есть словарь - шаблоны предложений и словари слов по частям речи. При генерации контента он случайным образом выбирает предложения и слова.
Контент из какого словаря будет более уникальным - из десятка тысяч статей или миллиона (не забываем про тысячи людей которые одновременно с Вами парсят и генерят)?
Другое дело, что серьезный разбор статей (мой анализатор знает несколько десятков частей речи) занимает не одни сутки по времени и на поток его не поставить (т.е. один раз за пару недель сделал и всю жизнь пользуешься).