24 septiembre 2012

Los conflictos entre usuarios y los diccionarios de pronunciación de las síntesis de voz

Los usuarios con discapacidad visual severa habitualmente utilizan para acceder a sus dispositivos electrónicos un producto de apoyo conocido como lector de pantalla. Este tipo de software utiliza habitualmente una voz sintética para transmitir al usuario ciego la información del dispositivo.

Estas voces sintéticas o síntesis de voz suelen utilizar un diccionario de reglas y un conjunto fonético apropiado para el idioma del usuario. Incluso hay distintas versiones de un mismo idioma según la región como por ejemplo inglés de Estados unidos, británico o australiano así como español de España, de Méjico o español de Estados unidos.
 


Problemas de dicción y pronunciación 

Algunos fabricantes de voces sintéticas utilizan locutores para grabar las voces originales y, tras un laborioso proceso de digitalización y análisis, se obtiene un cuadro fonético para crear los sonidos base para pronunciar los diversos contenidos textuales.




Algunas voces sintéticas son famosas por su calidad pero también las hay famosas por sus errores de dicción. Estos errores pueden originarse por un problema del locutor o por un error en el análisis previo de la información sonora. 

Otro gran problema de pronunciación se origina en el diccionario de pronunciación que incluyen muchas voces.

Por último indicar un grave problema relacionado con la pronunciación de siglas, números romanos expresiones matemáticas imposibles o palabras en otros idiomas. Algunos ejemplos de estos problemas podemos encontrarlos a la hora de recorrer la agenda de contactos, por ejemplo, Carlos Vicente,al tener un nombre muy largo sólo se mostrará en la agenda como Carlos V y el lector de pantallas pronunciará Carlos quinto

Soluciones a estos problemas
En un primer lugar el usuario puede transmitir al fabricante de la voz sintética y del lector de pantallas el problema. En el caso de no hacer caso como sucede con Apple, Freedom scientific o Acapela, podemos personalizar nuestro propio diccionario de pronunciación.

Los lectores de pantalla más avanzados suelen incluir una característica de personalización para el usuario para la corrección de errores de pronunciación. Así el nombre Jonathan podría pronunciarse correctamente como Yónathan.


Opinión de Gonzalo (administrador del blog): A mí me parece un buen invento que el ordenador reconozca tu voz y haga lo que le mandes porque, para las personas ciegas, discapacidad visual o para la gente que no sepa leer, les ayuda a manejar mejor la máquina. También puede ser útil para personas que les cueste escribir.

Para obtener más información: http://tinyurl.com/bsftdra

Os dejo un video como ejemplo: Programa control de voz.



 



:

No hay comentarios:

Publicar un comentario