Sayso desarrolla tecnología para cambiar el inglés acentuado casi en tiempo real

Los acentos pueden ser difíciles de entender, especialmente en el acelerado mundo del servicio al cliente. Una empresa está utilizando la tecnología para abordar el problema en tiempo real durante las conversaciones.

Sayso desarrolla tecnología para cambiar el inglés acentuado casi en tiempo real
Sayso desarrolla tecnología para cambiar el inglés acentuado casi en tiempo real

Sayso, una empresa que crea aplicaciones de voz impulsadas por la tecnología de transformación de voz de IA, está brindando a los desarrolladores una API que puede cambiar el inglés acentuado de un acento a otro casi en tiempo real. La empresa está utilizando un enfoque diferente al de las tecnologías de voz a texto, que utilizan el procesamiento del lenguaje natural para intentar descifrar lo que dice una persona. La solución de Sayso simplemente toma sonidos individuales y los cambia para hacerlos más comprensibles. Tiene en cuenta la forma en que la boca, la lengua y los labios dan forma a los sonidos y cómo se transmiten a través de las cuerdas vocales para hacer frente a los obstáculos que plantea el habla acentuada.

“No hacemos nada con palabras y oraciones”, dijo Ganna Tymco, fundadora y directora ejecutiva de Sayso. “En cambio, hacemos operaciones de forma de onda directa: trabajamos con elementos de voz desenredados. Lo que quiero decir con eso es cosas como la voz, la entonación, el habla, el contenido, el acento, podemos trabajar con rellenos, como uhms y aahs. Y podemos modificar uno o varios componentes a la vez, y podemos modificarlo en tiempo real si queremos”.

Tymco explicó que los gestos articulatorios son en realidad solo grupos de sonidos y son independientes del acento. La tecnología de Sayso toma esos sonidos y los corta en trozos muy pequeños que tienen una duración de milisegundos, luego aplica el procesamiento en tiempo real.

“Asignamos el habla que tiene un acento a otro diferente”, dijo Tymco. “Así que tenemos datos paralelos y le enseñamos a nuestro sistema a ver cómo se vería la onda de sonido para el hablante con un acento en comparación con el hablante que está hablando. Y luego alteramos la forma de la onda de sonido para que coincida más con el acentos deseados. Lo realmente interesante es que es universal. Por lo tanto, es independiente del acento”.

Tymco dijo que Sayso comenzó a entrenar sus sistemas con acentos de inglés hindi e inglés estadounidense. Ella dijo que desde entonces se ha expandido para incluir acentos chinos, españoles y japoneses. Tymco también agregó que la transcripción es parte de la estrategia comercial de la empresa, ya que observó que los subtítulos automáticos pueden ser completamente inexactos.

“Existe una correlación muy fuerte entre qué tan cerca está el acento de un fundador del inglés estándar de Hollywood y qué tan buena es la transcripción”, dijo Tymco. “Para alguien con un fuerte acento holandés o indio, las transcripciones son mucho peores: procesar el audio a través de un filtro similar a Sayso antes de intentar ejecutar la transcripción en el archivo de audio puede resultar en transcripciones mucho mejores. Nuestra tecnología es definitivamente aplicable a la transcripción. ”


Editado por Lucas Bellos




Salir de la versión móvil