Lyrebird: So klingen die synthetischen Stimmen von Trump und Obama

Das kanadische Startup Lyrebird kann aus einer Minute Tonmaterial eine synthetische Stimme basteln, die der Vorlage sehr nahe kommt. Die Technik hat eine ganze Reihe von Einsatzmöglichkeiten, muss aber noch reifen.

In Pocket speichern vorlesen Druckansicht 80 Kommentare lesen
Lyrebird: So klingen die synthetischen Stimmen von Trump und Obama
Lesezeit: 2 Min.

Lyrebird kann Donald Trump beliebige Worte in den Mund legen. Das kanadische Startup entwickelt eine Technik, mit der Stimmen per Sprachsynthese imitiert werden. Um eine Stimme zu synthetisieren, ist laut Unternehmensangaben nur eine Minute an Originalaufnahmen notwendig. Mit einem nicht näher beschriebenen neuronalen Netz wird aus diesem Rohmaterial dann die synthetische Stimme destilliert.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Inhalt geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Diese synthetische KI-Stimme kann dann etwa dazu gebracht werden, Texte mit unterschiedlichen Emotionen vorzulesen. Die Lyrebird-Demonstrationen sind beeindruckend: Ganz eindeutig sind die Stimmen von Barack Obama und Donald Trump zu erkennen. Allerdings merkt man ebenfalls, dass die Technik noch in der Anfangsphase steckt – die für Sprachsynthese üblichen Brüche an Laut-Übergängen sind deutlich zu hören, auch die Prosodie ist noch nicht perfekt. Außerdem ist denkbar, dass für die Demo-Stimmen weit mehr als eine Minute Material verwendet wurde. Genug Auswahl gäbe es.

Noch wird also niemand auf den falschen Donald Trump reinfallen. Falls die Technik jedoch voranschreitet, könnten sich spannende Einsatzfelder eröffnen: Lyrebird nennt etwa Audiobücher oder Sprachsynthese für Behinderte als Beispiele. Die synthetischen Stimmen könnten auch bei Filmen oder Videospielen eingesetzt werden. Ein Sprecher müsste dann nur einmal ins Studio kommen, anschließend können beliebige Dialoge künstlich erstellt werden. So zumindest die Theorie. Die Stimmen könnten aber auch von Kriminellen für manipulative Zwecke eingesetzt werden, weiß Lyrebird. Man müsse dann eben umdenken.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Inhalt geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Mit Project VoCo hat Adobe im vergangenen Jahr eine vergleichbare Technik vorgestellt. Lyrebird arbeitet derweil an einem API für Entwickler. Auf der Webseite kann man sich für die Beta-Phase registrieren. (dahe)