Nuance presenta su nuevo motor de reconocimiento de voz

CloudServidores

Recognizer v9 es un nuevo motor de reconocimiento de voz que aumenta espectacularmente el rendimiento y la calidad de los servicios de atención al cliente y de las soluciones de búsqueda por voz.

Este proyecto de desarrollo, conocido como Quantum, finaliza después de varios años de intenso desarrollo tecnológico e innovación en las soluciones de voz y combina los valores principales de seis tecnologías de reconocimiento de voz que, en total, suponen el trabajo de 400 personas en I+D.

Nuance Recognizer ofrece un reconocimiento con una impresionante precisión y una interfaz de usuario más flexible y natural que proporciona a los usuarios una experiencia exclusiva y personalizada en un entorno automatizado. Con modelos acústicos mejorados y el soporte de lenguaje natural más avanzado del sector, Nuance Recognizer destaca por ser capaz de atender un amplio número de llamadas desde diferentes geografías con vocabularios muy amplios y en aplicaciones exigentes, como los autoservicios de atención al cliente de empresas de telefonía, los servicios de información y de búsqueda móvil.

Al combinar lo mejor de los motores de reconocimiento de voz de Nuance durante los últimos cinco años con tecnologías completamente nuevas desarrolladas en los laboratorios de investigación de la compañía, Nuance Recognizer ofrece una precisión sin precedentes, con una reducción de error media del 27 por ciento en múltiples tareas e idiomas por encima de sus predecesores. El hecho que haya menos errores de reconocimiento implica llamadas más rápidas y una mayor satisfacción de los usuarios. Además, las técnicas de detección de la voz superiores utilizadas por Nuance Recognizer ofrecen una mejora del 45 por ciento en relación con las versiones anteriores, lo que ayuda a garantizar el buen funcionamiento de las aplicaciones de voz para usuarios móviles en entornos ruidosos, una situación cada vez más común.

Nuance Recognizer está diseñado para entender lo que los usuarios quieren decir, no sólo lo que dicen. Esta solución destaca por sus importantes avances en semántica y modelos de lenguaje para mejorar la posibilidad de interpretar una respuesta abierta del que hace la llamada, además de la posibilidad de extraer mucha información relevante de esa respuesta. Por ejemplo, si el usuario dice “Me mudo a Atlanta y necesito un nuevo número para mi teléfono móvil”, el sistema puede descifrar cierta información de esa única afirmación (por ejemplo, que se va a mudar, a dónde se va a mudar y a qué cuenta se va a asociar el número nuevo). Esta posibilidad reduce el número de preguntas posteriores necesarias para completar una transacción. Dado que hasta el 20 por ciento de reintentos y confirmaciones proceden de usuarios que dan demasiada información de una vez, estas funciones avanzadas de lenguaje natural suponen significativas mejoras de rendimiento, que incluyen además mayores velocidades de automatización y menores tiempos de llamada.