Wiki

Clone wiki

gpyvozcontrol / resultados

Análisis de Resultados


  1. Diferencia de las pruebas para el mismo modelo
  2. Diferencia de las pruebas entre modelos

De los resultados obtenidos para los modelos acústicos de Julius y CMUSphinx, se pueden hacer dos análisis, uno con respecto al mismo modelo y el porqué de la diferencia en las pruebas y dos la comparación entre ellos.

Diferencia de las pruebas para el mismo modelo

Si se observan las pruebas realizadas a los modelos de Julius y CMUSphinx, se puede notar algunas diferencias entre cada una de ellas. Se toman como ejemplo las pruebas realizadas al modelo acústico creado en Julius para hacer el análisis y que aplica para los dos casos. En la tabla siguientese pueden ver los resultados:

Prueba % frases reconocidas % palabras reconocidas
1 52.0 74.84
2 44.0 59.24
3 61.0 81,21

Las diferencias que se pueden notar en la tabla anterior y que también se pueden aplicar para el modelo acústico de CMUSphinx podrían deberse a:

  • Las grabaciones de las pruebas 1 y 2 fueron realizadas con una lectura rápida.
  • La prueba 2 se grabó a una distancia mayor a la ubicación del micrófono, lo que da un mayor error de reconocimiento con respecto a las pruebas 1 y 3.
  • La prueba 3, aunque se hizo con el micrófono interno se grabó con una pronunciación lenta, por eso su mayor exactitud con respecto a las pruebas 1 y 2.
  • La precisión en la pronunciación correcta de las frases.
  • La falta de un número mayor de grabaciones.

Diferencia de las pruebas entre modelos

Se puede notar una gran diferencia de reconocimiento entre modelos. En la tabla siguiente se puede observar:

Prueba % palabra reconocida (Julius) % palabra reconocidas (CMUSphinx)
1 74.84 53.50
2 59.24 42.99
3 81,21 57.64

la tabla anterior muestra que el modelo acústico creado con la biblioteca Julius reconoce mucho mejor que el modelo creado con la biblioteca CMUSphinx. Las razones de estas diferencias podrían ser:

  • Para las pruebas del modelo creado con Julius, se utiliza una gramámatica, lo que ajusta las grabaciones a lo que se esta reconociendo.
  • Las pruebas del modelo CMUSphinx utiliza el modelo de lenguaje de todas las transcripciones utilizadas en la creación del modelo, no teniendo una gramática a seguir, lo que puede ocasionar mas \% de error.

Con modelos acústicos creados solo con los audios de las 15 personas (grabaron 200 frases cada una) y solo 19 personas (125 frases cada una), cada conjunto por separado, se obtuvo mejores resultados que con todo el conjunto de audios. La diferencia está entre un 2% y 6% aproximadamente. Es decir, el modelo creado con todas las grabaciones es menos eficiente.

No obstante los resultados de esta prueba sistemática, en el uso cotidiano el modelo acústico creado con la biblioteca CMUSphinx reconoce mucho mejor que el creado con la biblioteca Julius. Obviamente se requieren ampliar la gama de pruebas más para identificar aspectos del reconocimiento que no parecieran reflejarse acá.

anterior Inicio Siguiente

Updated