Оптимизация символьных классов

Issue #402 new
Григорий Терехов created an issue

Предлагаю добавить правило для оптимизации символьных классов. Это правило должно учитывать пересекающиеся множества и замену символьных классов на более короткие альтернативы, если это возможно. Например "[c-fd-e]" => "[c-f]", "[\wa-z]" => "\w", но не "[aaa]" => "a", т.к. это входит в другое правило. Хотя можно учитывать отрицательные символьные классы, например "[^aaa]" => "[^a]", т.к. нет правила, учитывающего их.

Comments (2)

  1. Oleg Sychev repo owner

    Сделать можно, но явно не первоочередная задача. Там сложный момент с тем, с какими сокращениями может быть короче записан произвольный симв. класс (\w, posix, unicode) и нормальные пользователи редко пишут замороченные классы. Я не видел такого. К тому же что-нибудь типа [А-Яа-я] может быть читабельнее чем юникод-свойство кириллицы для большинства людей...

  2. Log in to comment