Google und die Selbstgespräche
DeepMind – so heißt das Unternehmen, das unter dem Dach von Google künstliche Intelligenz entwickelt.
Im Frühling hat DeepMind mit der Software AlphaGo für Furore gesorgt. Vielleicht erinnern Sie sich: Das Computerprogramm hat ein Turnier gegen den weltbesten Spieler des asiatischen Brettspiels Go gewonnen. Mensch gegen Maschine – 1:4 in Sätzen. So sah’s aus. Trotzdem: Die Fähigkeit, Weltklasse Go zu spielen, ist halt auch eher eine Nischenkompetenz.
Nun haben die Google-Programmierer einen neuen Forschungsbericht vorgelegt, der zwar weniger medienwirksam ist, der aber weitaus relevanter für unseren Alltag sein könnte. Es geht dabei um Stimmen. Künstliche Computerstimmen wohlgemerkt, die durch einen algorithmischen Durchbruch so menschengleich klingen wie nie zuvor. Das Programm WaveNet greift nämlich nicht mehr auf im Tonstudio eingesprochene Wörter, Silben und Laute zurück, wie dies Assistenten à la Siri oder Cortana seit vielen Jahren tun, sondern bildet die menschliche Sprache autonom auf Schallwellenniveau nach. Durch bloßes Zuhören soll WaveNet in Zukunft jede beliebige menschliche Stimme imitieren können, inklusive individueller Atemmuster, Akzente oder anderer logopädischer Besonderheiten.
Nun stellen Sie sich das mal vor: Wir alle könnten in nicht allzu ferner Zukunft autonome Stimmdoppelgänger haben! Hip Hip Hurra, diese Anwendungsmöglichkeiten! Ich träume jetzt schon von der WaveNet-App, die mir via Kopfhörer ein Martina-Engelchen im linken Ohr und ein Martina-Teufelchen im rechten Ohr einspielt. Im stimmlichen Gleichklang unterhalten wir drei uns dann über Opportunitäten des Dessert-Verzehrs: "Geh sicher, Martina, greif ruhig noch einmal zu bei der Schwarzwälderkirschtorte", flüstert mir meine eigene Stimme von rechts. "Aber geh, mit dem Papaya-Chiasamen-Mus bist Du doch genauso zufrieden", sage ich mir selbst sanft von links. Wie schön. Oder den alljährlichen Geburtstagsanruf bei der Großtante. Den erledigt mein freundliches Stimm-Double ganz von allein. Oder wenn ich mal einen Tag frei brauche. Da lege ich mir einen Röchelfilter über die Stimme und schon hat meine Krankheitsmeldung ein Betonfundament.
Aber ich darf nicht nur an mich denken. Selbst Präsidentschaftskandidaten würden von der Google-Erfindung nichts wie profitieren. Alexander van der Bellen könnte einen Kaunertaler-Dialekt-Remix von all seinen Uni-Vorlesungen zur Verfügung stellen. Norbert Hofer könnte seinen digitalen Stimmzwilling nutzen, um jedem einzelnen Österreicher ganz persönlich zu sagen, wie gern er ihn hat. Wobei: Da gingen dann vielleicht doch zu viele Arbeitsplätze in der Kreide-Industrie verloren.
Martina Mara ist Medienpsychologin und forscht am Ars Electronica Futurelab zur Mensch-Roboter-Beziehung