Los usuarios de Apple sabemos que Siri es un súper adelanto en nuestras vidas y estamos conscientes que si es de mucha ayuda para nosotros, también debe serlo para todas las demás personas que poseen un iPhone alrededor del mundo. Pero, ¿alguna vez hemos pensado cómo Siri le hace para saber tanto idiomas?
Alex Acero, responsable del equipo de aprendizaje de pronunciación de Siri, explicó que para que todo esto sea posible se utiliza la inteligencia artificial para aprender idiomas nuevos.
La primera aparición que hizo Siri fue en el 2011 mediante la plataforma Nuance, dos años más tarde Apple utiliza su propia plataforma para mejorar y darle voz a Siri. Es importante resaltar que actualmente Siri es la única ayuda personal que sabe tantos idiomas, en comparación con Google Assistant que solo habla inglés, mientras que Alexa de Amazon se limita al inglés y alemán.
¿Cómo aprende Siri tantos idiomas?
Cuando Apple quiere enseñarle un nuevo dialecto a Siri:
Pide a distintos humanos que lean varios párrafos junto con una lista de palabras. Se escogen personas de distintas partes de un lugar donde se habla un idioma, así acaparan el mayor número de dialectos posible.
Lo que se lee, es grabado y transmitido por otro grupo de personas. Se verifica con certeza cómo es que se pronuncian las palabras más comunes de un idioma. Ya una vez todos los datos estén recopilados, se envían a un programa dotado con inteligencia artificial que tiene la capacidad de aprender en base a ello.
El programa predice cómo se pronunciarían las distintas palabras que no se encuentran en su base de datos y a la vez forma palabras y frases para mejorar la vocalización. Incluso con el tiempo, aprenderá más palabras y dialectos gracias a los datos que va recibiendo de los usuarios.
Se introduce el nuevo idioma a Siri. Pero, ‘hold your horses’ no es tan sencillo, primero se debe introducir en el dictado de iOs y el de macOS. Lo que permite a Apple obtener más muestras de voz con una base amplia de personas.
Luego, los datos se transcriben manualmente, uno a uno para arreglar si tiene algún error o ruido en el fondo. (Este proceso reduce la tasa de errores a la mitad) Apple repite el proceso hasta que crean que estén lo más cerca a la precisión posible.
Aparte de esto, los locutores o talentos de voz graban varias secuencias por separado para que Siri pueda sintetizar el audio y cree la capacidad de responder de forma rápida a las millones de preguntas que se le hacen.
Apple lanza el nuevo idioma mediante una actualización de software.
Desde nuestra perspectiva parece un proceso bastante largo – de hecho, lo es – sin embargo, esto le ha permitido a Apple expandir a Siri en una gran diversidad de idiomas alrededor del mundo.
Comments are closed here.