Génesis
Nuestro mejor cliente tiene un número muy importante de clientes y futuros clientes que usan nuestro servicio de WhatsApp para relacionarse con ellos.
No sé sí por la edad o por la idiosincrasia de las personas muchos usan mensajes de voz en lugar de mensajes escritos.
Esto supone dos problemas:
- Demasiado tiempo usado en escuchar los audios (aunque los pongas al doble o al triple de velocidad).
- Imposibilidad de analizar el contenido de éstos.
El reto
¿Podemos transcribir los audios mandados o recibidos de forma que el audio transcrito pase a formar parte del mensaje como un elemento más?
¿Podemos ser inmunes al idioma? No es lo mismo el español de España que el español de Ecuador.
El resultado
Desde hace meses se transcriben todos los audios enviados o recibidos a texto en el canal WhatsApp. El resultado es que una vez transcrito el mensaje éste se puede leer o escuchar.
En nuestro componente web se ve de esta forma.
Reflexiones
El proceso de transcripción es un proceso que computacionalmente es muy costoso. Os compartimos una tabla donde medimos la duración real de algunos audios transcritos y el tiempo empleado en esta operación.
Duración (en segundos) | Tiempo de transcripción(en segundos) | Transcripción / Duración (%) |
---|---|---|
177 | 47 | 11% |
195 | 29 | 10% |
211 | 18 | 9% |
314 | 25 | 6% |
467 | 51 | 4% |
481 | 47 | 4% |
1083 | 103 | 2% |
Conclusión
Por supuesto que es posible hacer transcripción de los audios con un WER muy bajo. Nosotros transcribimos del orden de 10.000 audios diarios.
El resultado sobre la productividad de los agentes usando el canal WhatsApp se ha incrementado en más de un 15%.
Nunca pensamos poder ofrecer ésto como un servicio independiente a la plataforma de mensajería. Este servicio está incluido en ella sin coste adicional. Pero si necesitas hacer transcripción de audios a un precio y calidad inmejorables no dudes en ponerte en contacto con nosotros.