긴 단어의 코스트를 (수동으로라도) 더 줄여줬으면 좋겠음.

Issue #2 resolved
영호 유 created an issue

형태소분석기를 가지고 놀았다. 형태 NN,F,형태,,,, 소분 NN,T,소분,,,, 석기 NN,F,석기,,,, 를 JKO,T,를,,,, 가지 VV,F,가지,,,, 고 EC,F,고,,,, 놀 VV,T,놀,,,, 았 EP,T,았,,,, 다 EF,F,다,,,, . SF,,,,,, EOS

Comments (3)

  1. Yong-woon Lee

    이게 무조건 긴 것에 코스트를 줄이는 게 능사가 아님. 예를들면, '대변 기사'를 붙여썼을 경우, '대변기사'같은 경우는 '대변기', '사' 뭐 이런식으로 되면 안되기 때문에... 어떻게 풀어야할지는 좀 생각해 봐야겠다.

    결국은... 단어에 적절한 코스트 때문에, 학습량을 늘려야될지도...

  2. Yong-woon Lee

    일단 '형태소' 같은 것을 Atomic.csv에 등록하는 방법도 있긴한데... 어찌할지 모르겠네.

  3. Log in to comment