Una máquina que no lo parezca al hablar: uno de los retos del simulador de voz real

12 comentarios Facebook Twitter E-mail

28 Mayo 2014

Javier Penalva

Comprender cómo funciona con precisión la voz humana. Ése es el punto de partida de una investigación ambiciosa que comenzó en 2013 y que cuenta con la subvención de la Unión Europea. Se llama Eunison y para cuando ofrezca los primeros resultados, previstos para el año que viene, la tecnología estará más cerca de hacer que las voces de las máquinas sean como si realmente un humano estuviera hablando.

Eunison, en cuyo desarrollo participan entre otros el Centro Internacional de Métodos Numéricos en Ingeniería (CIMNE) y el grupo de investigación en Tecnologías Media (GTM) de La Salle R&D, tiene como objetivo sustituir el método más usado actualmente para generar voz artificial - solo se genera la señal acústica - por una simulación real donde se tengan en cuenta los principios físicos por los que el cuerpo humano genera la voz.

Idiomas, artistas, medicina y los robots/máquinas del futuro

Las posibilidades y campos donde aprovechar un mejor conocimiento de cómo funciona y se genera la voz son muy amplias. Van desde la medicina, con un avance en cómo se originan problemas de la voz para mejorar el diagnóstico y tratamiento, hasta ayudas para estudiantes de idiomas y artes vocales, sin olvidar a esos humanoides e interfaces que, salvo Scarlett Johansson en Her, suenan a máquina ante todo y no facilitan la comunicación humano-máquina.

Con ayuda de supercomputadores, la labor del equipo del CIMNE se centra en la simulación numérica del flujo de aire que resulta en la generación de sonido y de la voz en el interior del cuerpo humano. Cuando se una al resto de etapas de otros grupos de trabajo, se tendrá una simulación completa computacional de la producción de la voz humana.

En el futuro se tiene la esperanza de poder tener un modelo computacional detallado de la voz humana que permita ser controlado con señales de entrada a diferentes niveles.

Más información | AgenciaSinc. Más información | Eunison.

Temas

Comentarios cerrados

Ver 12 comentarios

12 comentarios

interesante

Reimous

* *

28 May. 2014, 8:06

1

Yo personalmente hice uso de las voces de IVONA 2 para un programa de un cajero de parking y suenan increíbles. Pude utilizar varios idiomas con una pronunciación muy buena.
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 4 votos, karma: 51.25 Vota positivo Vota negativo
Respondiendo a Reimous

Gawlf

* * *

28 May. 2014, 9:40

4

Es que yo creo que ahora mismo el tema de la voz sintética está bastante conseguido, tanto en realismo como en pronunciación. No creo que se vaya a conseguir una mejora tan grande con algo como lo anunciado aquí... ¿Tal vez algunos sonidos sibilantes y resonancias más realistas? :P
Yo creo que lo que realmente hace falta mejorar aún más es el análisis del texto y el lenguaje. La "lectura" inteligente. Que se reconozca el lenguaje del texto en tiempo real, permitiendo cambiar de idioma sobre la marcha en una misma frase. O incluso poder cambiar la entonación para simular más formas de "leer" (dudoso, alegre, solemne...) y poder anticipar la entonación necesaria para cada frase.
Esos sí que serían avances :P
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 3 votos, karma: 44.25 Vota positivo Vota negativo
Respondiendo a Reimous

ariel_cacha

* *

29 May. 2014, 0:41

10

"Yo personalmente hice uso de las voces de IVONA 2"
Las instale en mi Móvil por tu comentario, muy buenas!
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 1 voto, karma: 28 Vota positivo Vota negativo
Respondiendo a ariel_cacha

Reimous

* *

30 May. 2014, 14:05

11

No sabía que estaban para móvil jeje
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 0 votos, karma: 10 Vota positivo Vota negativo
carcayu

* *

28 May. 2014, 10:17

6

Yo le veo una aplicación que puede ser todavía más masiva: la comunicación por voip con tarifa de datos de baja velocidad.
Es decir, en lugar de envíar un archivo de audio contínuo, enviarías texto (el programa haría un reconocimiento en tiempo real de lo que hablas) acompañado de la especificación de ciertos gestos (suspiros, exclamaciones, etc.), todo ello en formato texto, como si se tratara de un servicio de mensajería. el oyente que lo recibe, en lugar de leer un texto, tendría un sintetizador de voz que tendría los datos de la persona emisora guardada (previamente descargados con una conexión mas potente), y te lo traduciría como si fuera voz, y no sabrías a simple vista apreciar la diferencia.
Es decir, lograrías el mismo tipo de comunicación de audio que se produce mediante programas como line o skype, pero el intercambio de datos que se produciría es puro texto en lugar de audio (mucho menos pesado), y se utilizaría de intermediario un reconocedor de texto y un sintetizador.
A quien le parezca buena idea le doy carta libre para que lo patente :P
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 2 votos, karma: 30 Vota positivo Vota negativo
eltryan

* *

28 May. 2014, 8:35

2

Creo que de la misma forma que al ver una pelicula con efectos especiales sublimes o un videojuego gráficamente increíble habrá un algo que nos diga que eso no es real.
Siempre que hay algún efecto especial, por muy bien hecho que esté, se nota que no es real. Y por muchos gráficos que tenga un juego hay algo que lo diferencia de la realidad.
En este aspecto seguro que habrá un gran valle inquietante.
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 0 votos, karma: 10 Vota positivo Vota negativo
Respondiendo a eltryan

habbiton

* *

28 May. 2014, 9:16

3

Es como todo... En su dia, la iluminacion era amarilla y destacaba mucho
Ahora ,te pueden iluminar salas con luz artificial y no la puedes distinguir de la real
Ves un display encendido a 30Hz, y parece que esta siempre encendido, cuando es mentira... La razon por la que las cosas no te parecen reales, es porque o son nuevas o son poco inmersivas...
Pero y si llamas por telefono y tienes una conversacion realista con un robot que usa la voz generada con esa simulacion? Sin saber que es un robot... Probablemente ni te plantearias que no es humano
Lo mismo pasará el dia que nos pongamos cascos de realidad virtual para jugar a videojuegos. El tener todo el campo de visión cubierto ya da otro grado de realismo mucho mas importante que una mayor calidad grafica
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 1 voto, karma: 11.25 Vota positivo Vota negativo
Respondiendo a eltryan

carhnewton

* *

28 May. 2014, 10:02

5

En las películas actuales no se como eres capas de distinguir lo que es realidad de lo que es hecho por ordenador mas haya del concepto de que es imposible de que ocurra en la realidad. Seguro que te pongo dos escenas iguales una hecha por ordenador y otra real y no serías capaz de distinguirlas. En los juegos si es verdad que aun no se ha conseguido que parezca real pero con el tiempo se ira consiguiendo.
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 0 votos, karma: 10 Vota positivo Vota negativo
royendershade

* * *

28 May. 2014, 11:03

7

A mi me parece que es innecesario simular el aparato humano dado el nivel de calidad de audio que tenemos hoy dia. Solo hay que dotar a esos sistemas de una calidad de sonido muy buena (software y hardware) y cuidar bien las atenuaciones, cortes y concatenaciones entre fonemas. Es un trabajo costoso en tiempo y dinero, pero creo que menos que lo que pretenden. Despues todo pasara por añadir en los parones sonidos de tomar aire (por leves o suaves que sean frente al subsconciente ayudan a engañar al oyente) y dubitativos: "Pues, eeh..., en realidad... estoo.."
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 0 votos, karma: 10 Vota positivo Vota negativo
riwer

* *

28 May. 2014, 20:14

9

Vocaloid quiere updates en esta dirección.
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 0 votos, karma: 10 Vota positivo Vota negativo
Respondiendo a riwer

elmostwanted32

* *

31 May. 2014, 4:32

12

Opino lo mismo que tu amigo vocaloid para mi es uno de los mejores y los que se merece un update en esta noticia
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 0 votos, karma: 5 Vota positivo Vota negativo
EIRI

* *

28 May. 2014, 13:17

8

prueben ivona en android, es genial
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 0 votos, karma: 8 Vota positivo Vota negativo