compounds

Issue #2 new
Fryske Akademy repo owner created an issue

Try

  • hy follet it yn
  • hy follet dat yn
  • hy follet dat formulier yn

Somtimes compound:prt misses

and the lemma of the compound should I think be ynfolje with both parts

Comments (3)

  1. Wilbert Heeringa

    Ik kan binnenkort een nieuw model trainen, er is nu meer materiaal. Maar dit zal niet alles oplossen. Net als de POS-tags moeten ook de morfologische en syntaktische features nagekeken worden. Er wordt op dit moment een soort mapping gedaan vanuit LassySmall, dat werkt redelijk, maar niet perfect zoals je wel gemerkt hebt. Ik vraag binnenkort iemand die dit kan nakijken.

  2. Fryske Akademy reporter

    Wacht maar even misschien, met de huidige encoding van compounds gaat het best goed, het zou zo kunnen in TEI:

    ```xml
    <w next="#_48_18" xml:id="_48_14" pos="verb" lemma="falle" fa:number="sing" fa:tense="past">foel</w>
    <w pos="adp" lemma="foar">foar</w>
    <w pos="det" lemma="de">de</w>
    <w pos="noun" lemma="kening" fa:gender="com" fa:number="sing">kening</w>
    <w prev="#_48_14" xml:id="_48_18" pos="adp" lemma="del">del</w>
    <join target="#_48_14 #_48_18" lemma="delfalle" pos="verb"/>
    <w pos="cconj" lemma="en">en</w>
    ```
    

    Ik kom ook nog met een flinke lijst via udpipe gedetecteerde compounds na het taggen van het nieuw friese corpus in de taaldatabank

  3. Log in to comment