¿Cuáles son los buenos proveedores que se especializan en la traducción simple de texto a texto?

Lo mejor que obtendrá será Dragon NaturallySpeaking de Nuance, pero sus resultados serán justos, en el mejor de los casos. Este es el por qué:

UNA). El reconocimiento de voz funciona mejor cuando son de alta fidelidad y cuando no hay ruido de fondo. Las llamadas de servicio al cliente tienden a tener baja fidelidad y pueden tener ruido de fondo.

SI). El reconocimiento de voz funciona mejor cuando se trata de un solo orador, y cuando ese orador ha capacitado al software para reconocer su voz particular. Diferentes voces tienen diferentes características. Si bien las computadoras más potentes de hoy en día minimizan esto un poco, para obtener los mejores resultados, realmente solo necesita un altavoz sin mucho ruido de fondo.

C). Para obtener los mejores resultados absolutos, el “un hablante” mencionado anteriormente necesita decir su puntuación. Esto mejora dramáticamente la precisión, porque le da al software de reconocimiento de voz el contexto para formar oraciones completas. Las personas que solicitan servicio al cliente no van a hacer esto, por razones obvias. Esto significa que tendrá la suerte de obtener el 80 – 85% de reconocimiento. Antes de pensar que está bien, tenga en cuenta que significa que 15-20 palabras de cada 100 serán incorrectas. Esa es una gran cantidad de corrección que tendrá que hacer manualmente.

RE). Las personas que solicitan servicio al cliente tienden a no hablar en oraciones completas (la forma en que escribirían o escribirían el mismo pensamiento es completamente diferente). El software de reconocimiento de voz está muy basado en reglas. Algunas de esas reglas analizan el discurso con la expectativa de que el hablante está hablando en el mismo estilo que escribirían. Es decir, todas las palabras forman una oración completa, y las oraciones forman párrafos coherentes, etc.

Hay una manera de acelerar la transcripción de cosas como esta. Reproduzca el audio de la llamada de servicio al cliente (suponiendo que se grabó) a través de los auriculares y repita lo que se dijo, formando oraciones completas (eliminando “ums” y “ahs” a medida que avanza). Una vez que te acostumbras, en realidad va bastante rápido.

Mac OS X y Windows tienen capacidades básicas de dictado integradas, pero para obtener los mejores resultados, desea utilizar Dragon para Mac o Dragon NaturallySpeaking (PC). Este software tiene la capacidad de aprender los patrones únicos tanto en la forma en que pronuncia las palabras como en la forma en que las combina para mejorar la precisión.

Por cierto, Nuance, los creadores de Dragon NaturallySpeaking y Dragon for Mac para Mac incluyen la capacidad de transcribir un archivo de audio en algunas de sus versiones. Esto no hará lo que quieras. Está destinado para su uso cuando está lejos de su computadora. Le permite dictar la forma en que el software espera (con puntuación, hablar en oraciones completas, etc.) usando una grabadora de voz, y luego reproducir el archivo nuevamente en el software para la transcripción.

Puede probar soluciones de código abierto como CMU Sphinx, se pueden usar en las instalaciones, por lo que no tendrá problemas con HIPAA. Y no habrá costos recurrentes.

La precisión no es un problema en estos días.