- edited description
Стенфордские правки
Тут в общем для стенфорда нужна спец таблица, с правками и результатов работы парсера привязанная к конкретной строке. (сами правки полексемные, но в базе хранятся строки).
Правка по идее будет заключаться в замене части речи и/или члена предложения для конкретной лексемы.
По идее информацию можно добавлять в таблицу ответов, как и данные о перечислениях сейчас.
Перегрузить функцию создания processed_string которая from_db чтобы она все это получала и сохраняла в processed_string.
Comments (14)
-
repo owner -
repo owner Для поддержки параметров языка, ради которых нежелательно заводить новый язык (например british/american english) предлагаю ввести в конструктор языка дополнительный аргумент в виде строки с опциями. Но параметр универсальный, мало ли что для других языков пригодится.
Сами опции хранить вместе с именем языка, отделяя невозможным в этом имени разделителем (backslash?) и в функции lang_obj разделять и передавать параметром.
Лучше, наверное, сделать когда Клевцов перенесет классы, иначе сливать сложно будет.
-
@oasychev, вообще-то есть serialize/unserialize для сохранения структур данных. @vad23klev сможете внести требуемые правки или мне сделать?
-
repo owner Только весьма желательно не увеличивать при этом количество запросов к БД при создании объекта строки из БД.
-
@oasychev я думаю о просто доп. поле в таблице языков, куда через serialize сохраняются параметры конструктора - так число запросов не изменится.
-
repo owner Ну и что у нас молчок по обсуждению объектов?! Вроде собирались быстро порешать. Владислав, предложения? Вадим тоже свой вариант мог бы опубликовать...
-
repo owner Еще - у кого стоит профайлер? Или просто функцию времени вызвать. Все-таки для обоснованного решения вопроса производительности стоит замерить и сравнить три времени: запрос к БД, запрос к стенфорду на внешнем сервере, запрос к стенфорду на том же компе. Кто сможет сделать?
-
Account Deactivated reporter Вот мой вариант классов для лексем с информацией которую из них можно получить
-
repo owner А служебные части речи?
-
Account Deactivated reporter Дополнил
-
repo owner Вадим, ну и как состояние - тестировать можно или все еще нет?
-
Account Deactivated reporter Переделал языки на автозагрузку. Так же стенфордские классы привел в чувство, лексер уже работает, над парсером ведутся работы.
-
Укажите клон - наверное неплохо будет их к себе утянуть.
-
repo owner - assigned issue to
Владислав, посмотрите - вы сейчас с этим кодом работаете.
- Log in to comment
У нас в блоке нет термина "предложение", есть "строка".