Тестирование библиотек для преобразования английских слов

Issue #439 new
Nikita Penskoy created an issue

Необходимо протестировать набор библиотек, понять на что они способны.

В качестве начальных кандидатов:

* Inflect (Python) https://pypi.python.org/pypi/inflect

Умеет ставить слова в единственное/множественное число, а так же менять пол в случае it и подобных. Глагол в правильную форму ставить не может, поиск по словарю по идее отсутствует. По идее, работа с глаголами вообще отсутствует. Но как вспомогательная вещь подойдет.

* Verbs (Ruby) https://rubygems.org/gems/verbs/versions/2.1.4

Как раз умеет ставить глаголы в правильные формы, причем по большой части там это сделано алгоритмом. Поиск изначальной формы по глаголу правда отсутствует.

* PHPMorphy с английским словарем

По идее умеет все что первая, что вторая + обратный поиск начальной формы по текущей. Но есть минус - набор словоформ не такой полный, так как выдаются не времена глагола, а его формы, от которых по идее можно легко образовать и времена, и залоги по правилам, но это надо программировать вручную. Зато поддерживаются и существительные, и прилагательные, и глаголы. Думаю если последнюю смешать со второй будет самый удобный вариант - потому что у второй набор форм глаголов гораздо больше.

Comments (3)

  1. Nikita Penskoy reporter

    PHPMorphy действительно может ставить существительные и глаголы в нужную форму. Набор слов явно неполный, плюс используются специализированные словари (возможно есть способ добавить информацию в них).

    Из существительных не знает слова mouse.

    Но ставить в нужную форму отлично умеет, никаких претензий.

    screen.jpg

  2. Nikita Penskoy reporter

    Verbs умеет ставить глагол в нужную форму, плюс умеет обращаться с временами, что очень удобно.

    Есть ошибка с mixing.

    {"Word count"=>12, "Correct forms"=>47, "Correct INF"=>12, "Correct V2"=>12, "Correct V3"=>12, "Correct ING"=>11, "Words with mistakes"=>{"mix"=>{"ING"=>{"Expected"=>"mixing", "Real"=>"mixxing"}}}}
    
  3. Oleg Sychev repo owner

    Надо посмотреть, живые ли трекеры у проектов (то есть висят ли там долго репорты серьезных багов) - если на сообщения об ошибках реагируют, можно написать...

  4. Log in to comment