Разработка генерации описаний по правилам на естественном языке

Issue #185 new
Former user created an issue

Originally reported on Google Code with ID 185

Собственно, хотел бы сбросить текущие выделенные сущности для решения данной задачи:

1. Класс естественного языка (имя языка берется из языковых файлов, после чего он стандартным
механизмом может создаться)
1.1. Метод получения списка словоформ (используется для проверки правил %ur %ul)
1.2. Функция для образования словоформы (принимает на вход слово и текстовое название
словоформы) и на выходе дает требуемую словоформу в виде строки
2. Дерево разбора продукционного правила - прикрепляется к правилу грамматической продукции
2.1. Метод проверки того, что описания можно сгенерировать (на входе - класс естественного
языка, на выходе соответственно результат)
2.2. Метод получения строки описания (на входе - описания всех других лексем, а на
выходе - строка описания)
3. Класс userdefined языка
3.1. Метод построения атрибутированной грамматики с учетом описаний (т.е. к правилам
необязательно прикрепляется описание)
3.2. Метод построения списка описаний по правилам.

Reported by mamontov.dp on 2013-03-13 04:59:08

Comments (3)

  1. Oleg Sychev repo owner

    Reported by oasychev on 2013-03-21 15:15:14 - Labels added: Component-WritingCompetently

  2. Oleg Sychev repo owner
    Давайте четко определим, что есть словоформа? Лучше с примерами...
    
    Класс ЕЯ наверное должен иметь спец. функции для генерации числительных и других нужных
    для языка вещей; а также функции типа перечня возможных форм слова (падежей и т.д.)
    чтобы ошибки при вводе грамматики отслеживать. (предлагаю описания брать в теги с указанием
    языка в грамматике).
    
    В дереве мы должны иметь методы, выделяющие узлы, требующие описаний от пользователя
    (учителя). Не забудьте про нумерацию узлов дерева, чтобы к ним легко было привязать
    описания.
    
    В классе userdefined языка - мы вроде продумывали общий интерфейс языка так, чтобы
    он удовлетворял всему. Там если методы добавлять, то в основном защищенные... Или чего-то
    публичного не хватает?
    

    Reported by oasychev on 2013-03-24 19:59:33

  3. Former user Account Deleted
    Словоформа - довольно сложное понятие, которое может быть либо кортежем <падеж,число>
    для русского языка для существительных, либо кортежем <лицо, число> для глаголов, либо
    tense для глаголов английского языка. 
    Кстати, возможно стоит действительно разделять в списке виды слов, хотя бы на существительные,
    глаголы, или описания могут быть только существительными? Я подумаю еще, есть ли случаи,
    когда описание может быть глаголом.
    
    Насчет userdefined языка - пока у меня нет идей, скорее за реализацией придется полезть
    в грамматику и уже её каким-то образом атрибутировать правилами изнутри или извне.
    Я думаю, над этим стоит еще подумать и обсудить на консультации.
    

    Reported by mamontov.dp on 2013-03-25 12:30:03

  4. Log in to comment