Commits

sirex committed 47fae6c Draft

More words.

  • Participants
  • Parent commits a0f8805

Comments (0)

Files changed (3)

 GALUNES = (
+    (('is',    'io',   'iui',     'į',     'iu',     'yje',     'i'),
+     ('iai',   'ių',   'iams',    'ius',   'iais',   'iuose',   'iai'),   'dv##'),
+
     (('is',    'žio',   'žiui',   'į',     'žiu',     'yje',    'i'),
-     ('žiai',  'žių',   'žiams',  'žius',  'žiais',   'žiuose', 'žiai'),  'dv##?'),
+     ('žiai',  'žių',   'žiams',  'žius',  'žiais',   'žiuose', 'žiai'),  'dv##'),
 
     (('a',     'os',    'ai',     'ą',     'a',       'oje',    'a'),
-     ('os',    'ų',     'oms',    'as',    'omis',    'ose',    'os'),    'dm##?'),
+     ('os',    'ų',     'oms',    'as',    'omis',    'ose',    'os'),    'dm##'),
 
     (('as',    'o',     'ui',     'ą',     'u',       'e',      'ai'),
-     ('ai',    'ų',     'ams',    'us',    'ais',     'uose',   'ai'),    'dv##?'),
+     ('ai',    'ų',     'ams',    'us',    'ais',     'uose',   'ai'),    'dv##'),
 
-    (('as',    'o',     'ui',     'ą',     'u',       'e',      'ai'),
-     ('ai',    'ų',     'ams',    'us',    'ais',     'uose',   'ai'),    'dv##?'),
-
-    (('as',    'o',     'ui',     'ą',     'u',       'e',      'ai'),
-     ('ai',    'ų',     'ams',    'us',    'ais',     'uose',   'ai'),    'dv##?'),
+    (('us',    'aus',   'ui',     'ų',     'umi',     'uje',    'au'),
+     ('ūs',    'ų',     'ums',    'us',    'ais',     'uose',   'ai'),    'dv##'),
 
     (('ė',     'ės',    'ei',     'ę',     'e',       'ėje',    'ę'),
-     ('ės',    'ių',    'ėms',    'es',    'ėmis',    'ėse',    'ės'),    'dm##?'),
+     ('ės',    'ių',    'ėms',    'es',    'ėmis',    'ėse',    'ės'),    'dm##'),
+
+    (('ė',     'ės',    'ei',     'ę',     'e',       'ėje',    'ę'),
+     ('ės',    'žių',   'ėms',    'es',    'ėmis',    'ėse',    'ės'),    'dm##'),
 
     (('tė',    'tės',   'tei',    'tę',    'te',      'tėje',   'tę'),
-     ('tės',   'čių',   'tėms',   'tes',   'tėmis',   'tėse',   'tės'),   'dm##?'),
+     ('tės',   'čių',   'tėms',   'tes',   'tėmis',   'tėse',   'tės'),   'dm##'),
 
     (('uo',    'ens',   'eniui',  'enį',   'eniu',    'enyje',  'uo'),
-     ('enys',  'enų',   'enims',  'enis',  'enimis',  'enyse',  'enys'),  'dv##?'),
+     ('enys',  'enų',   'enims',  'enis',  'enimis',  'enyse',  'enys'),  'dv##'),
+)
+
+PRIEVEIKSMIU_LAIPSNIU_GALUNES = (
+    (('us',    'eliau',   'iau',  'iausiai'),  'pv#'),
 )
 
 LINKSNIO_KLAUSIMAS = {
 }
 SKAICIUS = list('vd')
 
+LAIPSNIUOTES_PAVADINIMAI = {
+    '-': 'nelaipsniuojamas',
+    'n': 'nelyginamasis (gražus, graži)',
+    'l': 'aukstelesnysis (graželesnis, graželesnė)',
+    't': 'aukstesnysis (gražesnis, gražesnė)',
+    'c': 'auksciausias (gražiausias, gražiausia)',
+    'v': 'visu_auksciausias (visų gražiausias, visų gražiausia)',
+}
+LAIPSNIUOTE = list('-nltcv')
+
+PRIEV_SKYRIAUS_PAVADINIMAI = {
+    'b': 'budo (kaip, kokiu būdu?)',
+    'k': 'kiekybes (kiek, kiek kartų, keliese?)',
+    'v': 'vietos (kur, iš kur?)',
+    'l': 'laiko (kada, kuomet, kuriuo laiku, nuo kada, iki kada, kelintą kartą, kaip dažnai?)',
+    'p': 'priezasties (kodėl, dėl kurios priežasties?)',
+}
+PRIEV_SKYRIUS = list('bkvlp')
+
+TEIGIAMUMO_PAVADINIMAI = {
+    't': 'teigiamas',
+    'n': 'neigiamas',
+}
+TEIGIAMUMAS = list('tn')
+
 SPECS = ('Kalbos dalis', (
     ('d', 'daiktavardis', ('Giminė', (
         ('v', 'vyriška', ()),
         ('m', 'moteriška', ()),
     ))),
+    ('p', 'prieveiksmis', ('Prieveiksmio skyrius', (
+        ('b', 'budo (kaip, kokiu būdu?)', ()),
+        ('k', 'kiekybes (kiek, kiek kartų, keliese?)', ()),
+        ('v', 'vietos (kur, iš kur?)', ()),
+        ('l', 'laiko (kada, kuomet, kuriuo laiku, nuo kada, iki kada, kelintą kartą, kaip dažnai?)', ()),
+        ('p', 'priezasties (kodėl, dėl kurios priežasties?)', ()),
+    ))),
 ))
 
 
 
 
 class Word(object):
-    def __init__(self, word, meta, suffixes=None, synonyms=None, tags=None):
+    def __init__(self, word, meta, suffixes=None, synonyms=None, tags=None, lema=None, gimine=None):
         self.word = word
         self.meta = meta
         self.suffixes = suffixes
         self.synonyms = synonyms
         self.tags = tags
+        self.lema = lema
+        self.gimine = gimine # nurodo priešingos giminės žodį
 
     def match(self, prefix, suffix):
         if suffix in self.suffixes:
                 extra['suffixes'] = item[1:].split(',')
             elif item.startswith('~'):
                 extra['synonyms'] = item[1:].split(',')
-            elif item.startswith('@'):
+            elif item.startswith('+'):
                 extra['tags'] = item[1:].split(',')
+            elif item.startswith('='):
+                extra['lema'] = item[1:]
             else:
                 k, v = item.split(':', 1)
-                extra[k] = v
+                if k in 'vmb':
+                    extra['gimine'] = (k, v)
+                else:
+                    extra[k] = v
         if word:
             word = Word(word, meta, **extra)
             self.add(word)
-administracij/dmvv/-a,os,ai,ą,a,oje,a,os,ų,oms,as,omis,ose,os
-adom/dvvv/-as,o,ui,ą,u,e,ai,ai,ų,ams,us,ais,uose,ai
-aikštel/dmvt?/-ė,ės,ei,ę,e,ėje,ę,ės,ių,ėms,es,ėmis,ėse,ės
-aikš/dmvv?/-tė,tės,tei,tę,te,tėje,tę,tės,čių,tėms,tes,tėmis,tėse,tės
-akademij/dmvv?/-a,os,ai,ą,a,oje,a,os,ų,oms,as,omis,ose,os
-akcent/dvvv?/-as,o,ui,ą,u,e,ai,ai,ų,ams,us,ais,uose,ai
-akm/dvvv?/-uo,ens,eniui,enį,eniu,enyje,uo,enys,enų,enims,enis,enimis,enyse,enys
+administracij/dm**b-/-a,os,ai,ą,a,oje,a,os,ų,oms,as,omis,ose,os
+adom/dv**t-/-as,o,ui,ą,u,e,ai,ai,ų,ams,us,ais,uose,ai
+aikštel/dm**bm/-ė,ės,ei,ę,e,ėje,ę,ės,ių,ėms,es,ėmis,ėse,ės/=aikštė
+aikš/dm**k-/-tė,tės,tei,tę,te,tėje,tę,tės,čių,tėms,tes,tėmis,tėse,tės
+akademij/dm**b-/-a,os,ai,ą,a,oje,a,os,ų,oms,as,omis,ose,os
+akcent/dv**b-/-as,o,ui,ą,u,e,ai,ai,ų,ams,us,ais,uose,ai
+akm/dv**b-/-uo,ens,eniui,enį,eniu,enyje,uo,enys,enų,enims,enis,enimis,enyse,enys
+akumuliacin/dv**b-/-is,io,iui,į,iu,yje,i,iai,ių,iams,ius,iais,iuose,iai
+album/dv**b-/-as,o,ui,ą,u,e,ai,ai,ų,ams,us,ais,uose,ai
+altitud/dm**b-/-ė,ės,ei,ę,e,ėje,ę,ės,žių,ėms,es,ėmis,ėse,ės
+alyt/dm**t-/-a,os,ai,ą,a,oje,a,os,ų,oms,as,omis,ose,os/+įmonė/v:alytus
+alyt/dv**t-/-us,aus,ui,ų,umi,uje,au,ūs,ų,ums,us,ais,uose,ai/+miestas/m:alyta
+ambasad/dm**b-/-a,os,ai,ą,a,oje,a,os,ų,oms,as,omis,ose,os
+amži/dv**b-/-us,aus,ui,ų,umi,uje,au,ūs,ų,ums,us,ais,uose,ai
+amžiuk/dv**bm/-as,o,ui,ą,u,e,ai,ai,ų,ams,us,ais,uose,ai/=amžius

src/lema/__init__.py

 
 # Laipsniai
 NELAIPSNIUOJAMAS  = '-'
-NELYGINAMASIS     = 'n'
-AUKSTELESNYSIS    = 'l'
-AUKSTESNYSIS      = 't'
-AUKSCIAUSIAS      = 'c'
-VISU_AUKSCIAUSIAS = 'v'
+NELYGINAMASIS     = 'n'  # gražus, graži
+AUKSTELESNYSIS    = 'l'  # graželesnis, graželesnė
+AUKSTESNYSIS      = 't'  # gražesnis, gražesnė
+AUKSCIAUSIAS      = 'c'  # gražiausias, gražiausia
+VISU_AUKSCIAUSIAS = 'v'  # visų gražiausias, visų gražiausia
 LAIPSNIUOTE = (NELYGINAMASIS, AUKSTELESNYSIS, AUKSTESNYSIS, AUKSCIAUSIAS,
                VISU_AUKSCIAUSIAS)
 
 
 # Morfologija
 MORFOLOGIJA = {
-    DAIKTAVARDIS: (GIMINE, SKAICIUS, LINKSNIUOTE, MAZYBINE_FORMA, DAIKT_SKYRIUS),
+    DAIKTAVARDIS: (GIMINE, SKAICIUS, LINKSNIUOTE, DAIKT_SKYRIUS, MAZYBINE_FORMA),
     BUDVARDIS:    (GIMINE, SKAICIUS, LINKSNIUOTE, LAIPSNIUOTE, IVARDZIUOTINIS),
     SKAITVARDIS:  (GIMINE, SKAICIUS, LINKSNIUOTE, SKAITV_SKYRIUS),
     IVARDIS:      (GIMINE, SKAICIUS, LINKSNIUOTE, IVARD_SKYRIUS),