Стенфордские правки

Issue #442 new
Вадим Клевцов created an issue

Тут в общем для стенфорда нужна спец таблица, с правками и результатов работы парсера привязанная к конкретной строке. (сами правки полексемные, но в базе хранятся строки).

Правка по идее будет заключаться в замене части речи и/или члена предложения для конкретной лексемы.

По идее информацию можно добавлять в таблицу ответов, как и данные о перечислениях сейчас.

Перегрузить функцию создания processed_string которая from_db чтобы она все это получала и сохраняла в processed_string.

Comments (14)

  1. Oleg Sychev repo owner
    • edited description

    У нас в блоке нет термина "предложение", есть "строка".

  2. Oleg Sychev repo owner

    Для поддержки параметров языка, ради которых нежелательно заводить новый язык (например british/american english) предлагаю ввести в конструктор языка дополнительный аргумент в виде строки с опциями. Но параметр универсальный, мало ли что для других языков пригодится.

    Сами опции хранить вместе с именем языка, отделяя невозможным в этом имени разделителем (backslash?) и в функции lang_obj разделять и передавать параметром.

    Лучше, наверное, сделать когда Клевцов перенесет классы, иначе сливать сложно будет.

  3. Dmitry Mamontov

    @oasychev, вообще-то есть serialize/unserialize для сохранения структур данных. @vad23klev сможете внести требуемые правки или мне сделать?

  4. Oleg Sychev repo owner

    Только весьма желательно не увеличивать при этом количество запросов к БД при создании объекта строки из БД.

  5. Dmitry Mamontov

    @oasychev я думаю о просто доп. поле в таблице языков, куда через serialize сохраняются параметры конструктора - так число запросов не изменится.

  6. Oleg Sychev repo owner

    Ну и что у нас молчок по обсуждению объектов?! Вроде собирались быстро порешать. Владислав, предложения? Вадим тоже свой вариант мог бы опубликовать...

  7. Oleg Sychev repo owner

    Еще - у кого стоит профайлер? Или просто функцию времени вызвать. Все-таки для обоснованного решения вопроса производительности стоит замерить и сравнить три времени: запрос к БД, запрос к стенфорду на внешнем сервере, запрос к стенфорду на том же компе. Кто сможет сделать?

  8. Вадим Клевцов Account Deactivated reporter

    tokens_v2.png

    Вот мой вариант классов для лексем с информацией которую из них можно получить

  9. Oleg Sychev repo owner

    Вадим, ну и как состояние - тестировать можно или все еще нет?

  10. Вадим Клевцов Account Deactivated reporter

    Переделал языки на автозагрузку. Так же стенфордские классы привел в чувство, лексер уже работает, над парсером ведутся работы.

  11. Dmitry Mamontov

    Укажите клон - наверное неплохо будет их к себе утянуть.

  12. Oleg Sychev repo owner
    • assigned issue to

    Владислав, посмотрите - вы сейчас с этим кодом работаете.

  13. Log in to comment