Разработка генерации описаний по правилам на естественном языке
Issue #185
new
Originally reported on Google Code with ID 185
Собственно, хотел бы сбросить текущие выделенные сущности для решения данной задачи:
1. Класс естественного языка (имя языка берется из языковых файлов, после чего он стандартным
механизмом может создаться)
1.1. Метод получения списка словоформ (используется для проверки правил %ur %ul)
1.2. Функция для образования словоформы (принимает на вход слово и текстовое название
словоформы) и на выходе дает требуемую словоформу в виде строки
2. Дерево разбора продукционного правила - прикрепляется к правилу грамматической продукции
2.1. Метод проверки того, что описания можно сгенерировать (на входе - класс естественного
языка, на выходе соответственно результат)
2.2. Метод получения строки описания (на входе - описания всех других лексем, а на
выходе - строка описания)
3. Класс userdefined языка
3.1. Метод построения атрибутированной грамматики с учетом описаний (т.е. к правилам
необязательно прикрепляется описание)
3.2. Метод построения списка описаний по правилам.
Reported by mamontov.dp
on 2013-03-13 04:59:08
Comments (3)
-
repo owner -
repo owner Давайте четко определим, что есть словоформа? Лучше с примерами... Класс ЕЯ наверное должен иметь спец. функции для генерации числительных и других нужных для языка вещей; а также функции типа перечня возможных форм слова (падежей и т.д.) чтобы ошибки при вводе грамматики отслеживать. (предлагаю описания брать в теги с указанием языка в грамматике). В дереве мы должны иметь методы, выделяющие узлы, требующие описаний от пользователя (учителя). Не забудьте про нумерацию узлов дерева, чтобы к ним легко было привязать описания. В классе userdefined языка - мы вроде продумывали общий интерфейс языка так, чтобы он удовлетворял всему. Там если методы добавлять, то в основном защищенные... Или чего-то публичного не хватает?
Reported by
oasychev
on 2013-03-24 19:59:33 -
Account Deleted Словоформа - довольно сложное понятие, которое может быть либо кортежем <падеж,число> для русского языка для существительных, либо кортежем <лицо, число> для глаголов, либо tense для глаголов английского языка. Кстати, возможно стоит действительно разделять в списке виды слов, хотя бы на существительные, глаголы, или описания могут быть только существительными? Я подумаю еще, есть ли случаи, когда описание может быть глаголом. Насчет userdefined языка - пока у меня нет идей, скорее за реализацией придется полезть в грамматику и уже её каким-то образом атрибутировать правилами изнутри или извне. Я думаю, над этим стоит еще подумать и обсудить на консультации.
Reported by
mamontov.dp
on 2013-03-25 12:30:03 - Log in to comment
Reported by
oasychev
on 2013-03-21 15:15:14 - Labels added: Component-WritingCompetently