[Скрипт] phpmorphy - морфоанализ на php для многих языков

General Fizz

Боевой Генерал :)
Регистрация
11 Апр 2007
Сообщения
754
Реакции
428
Title: phpmorphy - модуль морфоанализа на php для различных языков


Screenshot: Нету :p


Authors:


Demo:


Date: Сегодня


Type: php 4 и 5, ООП


Description from author:
Библиотека для проведения морфологического анализа в public domain. Надеюсь некоторым будет интересно взглянуть ;).

features
* Для входного слова умеет находить:
* --- Псевдо корень
* --- Нормальную форму
* --- Все словоформы
* --- Грамматическую(и не только ;)) информацию
* Скорость нахождения нормальной формы ~700 слов в секунду(это для php5.1.1, WinXP, Duron-800), имеется возможность загрузить словарь в память, при этом скорость возрастает примерно на 20-25%.
* Основной словарь содержит около 3млн словоформ
* Есть два режима предсказания ненайденных слов – по суффиксу и по специально подготовленному словарю(подробнее см. {http://www.aot.ru/docs/sokirko/Dialog2004.htm}, я реализовывал этот алгоритм). Качество предсказания -- так себе… ;)
* Размер словаря ~4Mb
* Для работы необходим php4.3.x, php5(пробовал php4.3.7 и php5.1.1)
* Лицензия LGPL

В качестве основы был взят проект {AOT}, в частности словари и алгоритм предсказания были взяты из него.
Документации пока нет(ибо опенсурс ;)), но есть example.php в дистрибе ;).


My comments: Поддерживается несколько распространенных языков, имеется возможность самостоятельной компиляции словарей. После самостоятельной компиляции подходят словари от АОТ, которые можно самому пополнять. Скрипт написан весьма профессионально, хотя есть еще что дорабатывать.

Эта библиотека идеально вписывается в систему одного очень нужного скрипта, который все безуспешно ищут. Все жалкие попытки написать сей скрипт самостоятельно почему-то оканчиваются провалом :D.



Download:


Обсуждение: здесь или на Для просмотра ссылки Войди или Зарегистрируйся, там тусуется автор (респект :ay:), можно задавать ему вопросы.


ЗЫ. Монсегу :p за правила создания тем.
 
Как допустим получить:
"Москва" -> в "Москве" (Предложный падеж)

Я уже с этим всем запутался...(((
 
Назад
Сверху