Uwe Röddinger fragt: Alexa, wie geht es mir heute?
von Uwe Röddinger, Artikel aus dem Archiv vom
Haben Sie einen sprachgesteuerten Assistenten zu Hause? Ich meine einen, den Sie kaufen können, einen mit WLAN, nicht eine auf Kohlenstoff basierende, organische Lebensform mit zwei Beinen. Falls nicht, verpassen Sie etwas! Ich habe sogar zwei davon. Einer steht im Wohnzimmer und wird von der Familie genutzt; einer steht in meinem Büro. Beide haben eins gemeinsam: Ein Mikrofon-Array mit einer schier unglaublichen Empfindlichkeit.
Anzeige
Die Alexa im Wohnzimmer steht in der hintersten Ecke auf einem Beistelltischchen, vom Esstisch bis zu „ihr“ sind es gut 6 oder 7 Meter. Wenn ich am Esstisch „Alexa“ flüstere, kann ich sehen, wie das Gerät anspringt und durch einen farbigen Ring anzeigt, aus welcher Richtung es glaubt, angesprochen zu werden. Als Techniker sehe ich, dass die Reflexion der dahinterliegenden Wand als Ursprung erkannt wird. Aber hey! Mich interessiert nicht, was das Gerät glaubt, sondern was es mit meinem gesprochenen Wort tut. Und hier tritt dann oft Staunen auf: Das Ding versteht unglaublich viel! Und wird ständig besser. Was aber noch nervt, ist die fehlende Intelligenz. Ein Satz, der funktioniert, umformuliert ausgesprochen, und es geht nicht.
Ich habe einen 3-Jährigen zu Hause. Der schafft das Zauberwort „Alexa“ nicht. Egal, wie oft er das probiert, es klappt nicht. Wenn ihm dann jemand hilft und für ihn Alexa aktiviert, dann übernimmt er ab da und sagt dem Ding genau, was er an Kinderliedern hören möchte. Und wenn er mal nicht verstanden wird oder Alexa das Lied nicht findet, ist er in der Lage, kreativ damit umzugehen und sich so lange mit Alexa auseinanderzusetzen, bis das Ding tut, was ihn zufriedenstellt.
Stellen Sie sich das bitte vor: Ein drei Jahre alter Bub steuert einen Großrechner mit seiner Kinderstimme! Schöne neue Welt! Aber im Gegensatz zu ihm fehlt mir oft die Lust, bei Fehlversuchen durch Umformulieren so lange zu probieren, bis es klappt. Da sind Kinder und Jugendliche anders drauf. Also nutze ich Alexa nur für eine Reihe von Dingen, die sehr gut funktionieren.
1985 habe ich einen Apple II zum Vergnügen und als Fingerübung mit meiner eigenen Version von ELIZA* programmiert. Das Programm erlaubte eine umgangssprachliche Eingabe von Texten wie „Hallo, du komischer Taschenrechner!“ Nachdem der Eingabetext geparst worden war, generierte das Programm entweder eine simple Gegenfrage oder stellte Fragen, basierend auf Schlüsselworten.
Es waren aber fast immer Fragen, damit der Mensch an der Tastatur sich verpflichtet fühlte, diese zu beantworten. Die Reaktionen meiner Mitmenschen auf dieses kleine, völlig unspektakuläre Programm waren teilweise erschütternd: Von „Wer tippt denn da zurück?“ bis zu Panikattacken und „Woher weiß der das?“ war alles dabei. Trotz des rudimentären UI (Texteingabe per Tastatur, Ausgabe auf dem Bildschirm) kam selbst für mich manchmal der Eindruck auf, mit einem vernunftbegabten Wesen zu kommunizieren! Schauen Sie sich an, was SIRI, ALEXA, CORTANA und die anderen Ansprechpartnerinnen 30 Jahre später drauf haben!
Jeden Monat lernen diese Systeme mich / uns besser zu verstehen, und immer natürlicher zu antworten. Aber warum habe ich dabei so ein ungutes Gefühl? Vertrauen! Ein ständig offenes Mikrofon, das jedes Wort im Raum an eine Stelle überträgt, die ich nicht kenne, mit der Möglichkeit, jedes Wort aufzuzeichnen. Natürlich versprechen alle Anbieter, keinen Blödsinn mit meinen Unterhaltungen anzustellen. Aber wovon leben Anbieter wie Amazon, Apple, Google und Co.? Von Werbung und vom Verkaufen.
Wenn also aus einem geführten Gespräch hervorgeht, dass in der Familie über ein neues Auto diskutiert wird, und meine Webseiten plötzlich von Automobil-Herstellern geflutet werden, würde ich einen Zusammenhang vermuten. Wir werden sehen, was die Zukunft bringt. Apple hat schon aus bisher erhältlichen Produkten gelernt.
Beim angekündigten Home pod soll das anders funktionieren. Das Zauberwort SIRI wird lokal erkannt, erst dann wird die Verbindung zum Rechenzentrum hergestellt, angeblich anonymisiert und verschlüsselt. Gäbe es Herrn Snowden nicht, würde ich diese Zusage schon mal für die richtige Richtung halten. Was die Funktion angeht. Aber Vertraulichkeit?
Im Zeitalter von Big Data, ständig größer werdender Speicherkapazitäten und vor allem immer besser werdender KI ist nicht die Frage, ob meine Gesprächsinhalte verkauft werden, sondern wann der erste erwischt wird und mit einem Hinweis auf seine Geschäftsbedingungen erst mal davonkommt, bis dann eventuell ein Gesetz das in Europa verbietet. Was wiederum den Rest der Welt herzlich wenig interessiert. Sprachsteuerung, wie sie zum Beispiel Alexa, Cortana oder Siri heute schon bieten, kann durchaus für unsere AV-Anwendungen genutzt werden. Verstehen tun die schon sehr viel, ich brauche theoretisch keine Fernbedienungen, Touchpanels oder gar Licht- und Leinwandschalter mehr! „Rolf, ich möchte jetzt die ‚Wir über uns!‘ Präsentation zeigen!“ wäre doch nicht schlecht. Und ein „Rolf, hier anhalten bitte!“ sowie „Rolf, weitermachen“ könnte ich mir gut vorstellen.
Und so wie bei meiner ELIZA vor 30 Jahren werden viele Nutzer nach ein paar Erfolgserlebnissen glauben, Rolf sei ein Mitarbeiter und nicht eine KI, die zuhört. Aber der Gedanke daran, dass jedes Wort meiner Präsentation mitgehört wird, und natürlich jedes andere gesprochene Wort mitgehört und aufgezeichnet werden kann, wird den Einsatz der Technik im Meeting-Raum eines Unternehmens wohl verhindern.
Und damit wären wir wieder mal an einem Punkt, wie schon so oft in der letzten Zeit: Eine Technologie wurde entwickelt, die unser Leben bereichern und verbessern könnte. Aber ihre Akzeptanz scheitert am berechtigten Misstrauen gegenüber Großunternehmen und deren finanziellen Interessen.
PS: Der Kleine kann „Alexa!“ mittlerweile aussprechen. Ich werde das Schlüsselwort ändern.
* 1966 entwickelte Joseph Weizenbaum ein Computerprogramm, das die Möglichkeiten der Kommunikation zwischen einem Menschen und einem Computer über natürliche Sprache aufzeigen sollte. Er nannte es ELIZA.
Toller Artikel, alle Aspekte drin, der Analyse kann ich nur zustimmen!
Eine Ergäzung vielleicht noch: Alexa kann auch zur Steuerung von Raumsteuerungssystemen / Collaboration Systemen verwendet werden. Gerade hier ist effektive IT-Sicherheit gefragt, z. B. mit einem dualen Netzwerk Modus …
Toller Artikel, alle Aspekte drin, der Analyse kann ich nur zustimmen!
Eine Ergäzung vielleicht noch: Alexa kann auch zur Steuerung von Raumsteuerungssystemen / Collaboration Systemen verwendet werden. Gerade hier ist effektive IT-Sicherheit gefragt, z. B. mit einem dualen Netzwerk Modus …