Xiaomi ha dado a conocer su más reciente aplicación de algoritmos avanzados y tecnología de voz de desarrollo propio en el apartado de accesibilidad. La tecnología Text-To-Speech de estilo espontáneo, desarrollada por Xiaomi AI Lab, se utiliza para generar una voz única y personalizada entre usuarios con trastornos del habla.
Ahora, gracias a la tecnología de Xiaomi, estos usuarios podrán comunicarse con las demás personas utilizando “su propia voz”, en lugar de la típica y monótona voz electrónica.
Para generar la voz más adecuada y personalizada para el destinatario, el equipo del proyecto reclutó a más de 200 voluntarios de Xiaomi para que donaran sus voces y utilizó el algoritmo de coincidencia de la huella vocal para comparar las características de las voces donadas por los voluntarios con la del destinatario.
De ese modo, encontraron la voz más adecuada como sonido básico de referencia para el usuario.
Teniendo en cuenta la personalización y la protección de la privacidad, la voz real elegida se manipuló con una compleja modificación acústica para formar un sonido de voz nuevo y original.
A continuación, el equipo utilizó la tecnología Text-To-Speech de estilo espontáneo para entrenar el modelo de Inteligencia Artificial (IA), haciendo que la nueva voz adquiriera gradualmente un ritmo y una entonación naturales que pudieran expresar con veracidad la emoción y el tono de una persona.
El proyecto Own My Voice combina los algoritmos más avanzados con la tecnología de voz desarrollada por Xiaomi para garantizar la especificidad, seguridad y autenticidad de la voz sintetizada, creando una nueva idea de síntesis de voz personalizada para los usuarios con trastornos del habla.
Al respecto, Zhu Xi, coordinador del Comité de Tecnología para el equipo de Tech for Good de Xiaomi Corporation, afirma: “Nos entusiasma explorar los múltiples valores que nos aporta la innovación tecnológica, como responder a las demandas de los usuarios en cuanto a la identidad propia y la construcción de la misma”.
En el futuro, Xiaomi seguirá recibiendo las opiniones de los destinatarios de la voz y estudiará la viabilidad del proyecto en un ámbito más amplio, potenciará la accesibilidad a través de tecnología de vanguardia, esforzándose por satisfacer las diversas necesidades de las personas a través de la innovación tecnológica.