Suche
  • Sven Wilms

Conversational User Interfaces - mehr als Sprachassistenten

Damit fängt es ja schon an: Conversational User Interfaces (CUI) sind mehr als nur Sprachassistenten, wie sie nach der Übersetzung in die deutsche Sprache heißen. Bei Sprachassistenten denkt man sofort an Amazon's Alexa, Google Assistant und weitere. Aber wie bei allen Interfaces sind die CUIs nur die Oberfläche, der Einstieg in einen neuen Ansatz. Bei CUIs passiert der Einstieg über die natürliche Sprache. Dahinter liegen unterschiedliche technische Systeme, zum Beispiel virtuelle Assistenten, Chatbots und mehr.


Mit natürlichsprachiger Kommunikation zwischen Menschen und Maschine wird nicht nur das gesprochene Wort gemeint, sondern auch die geschriebene Sprache gehört dazu. Insbesondere auf Smartphones verschwimmen die Grenzen. Spricht der Benutzer in sein Gerät, führt Automatic Speech Recognition (ASR) zu einem geschriebenen Text. Dieser wird von einer Maschine mit Hilfe von Natural Language Processing (NLP) analysiert. Beides sind für den Menschen natürliche Eingabeformate und werden von CUIs genutzt.


Die Schnittstelle Mensch - Maschine bestand in den Anfängen aus Lochstreifen. Später wurden Befehle in formalisierter Struktur eingegeben. Mit dem PC brachte die grafische Benutzer-oberfläche den Durchbruch zum Massenmarkt für die Personal Computer. Die PC-Steuerung mit der Maus wurde als großer Durchbruch gefeiert. Um den Anwender den Einstieg in die digitale Welt zu erleichtern, wurden Symbole der Realität nachempfunden: Der Papierkorb auf dem Desktop sah aus wie der Papierkorb im Arbeitszimmer.


Rückblickend betrachtend war das Erlernen der Auge-Hand-Koordination für die Maus-Bedienung ein Umweg. Die Bedienung mit einem oder mehreren Fingern auf einem berührungsempfindlichen Bildschirm wäre natürlicher gewesen, doch hierfür kam der Durchbruch erst mit der Etablierung der Smartphones. Der Übergang zur Sprache ist eine logische und zwangsweise Entwicklungsstufe. Je leistungsfähiger die Technologie hierfür wird, umso weniger müssen wir Menschen uns im Dialog verstellen und "Ersatztechnologien" erlernen.


Ein CUI ist ein System, das aus verschiedenen Bausteinen besteht: Die Eingabe erfolgt natürlichsprachig (Schrift und Wort) über verschiedene Geräte und Wege. Es folgen verschiedene Methoden zur Analyse und Auswertung des Inputs bzw. zur Erkennung der Absicht des Benutzers (sogenannter Intents). Abhängig von der Absicht des Benutzers (Reklamation, Flugbuchung,...) erfolgt die Anbindung weiterer Business-Logiken und Services. Die Antwort an den Benutzer bzw. die Umsetzung des Wunsches erfolgt in der Regel auf dem gleichen Weg wie die Eingabe. Diese technischen Systeme werden (häufig je nach Technikausgestaltung und Funktions-umfang) Chatbots, virtuelle oder intelligente Assistenten genannt. Chatbots und virtuelle Assistenten bieten viele Vorteile (für Nutzer und Unternehmen): sie sind 24/7 verfügbar, geben immer die qualitativ hochwertige Antwort bei zum Beispiel Standardanfragen bzw. setzen den Nutzer-Wunsch direkt um, amortisieren sich für das Unternehmen schnell und sind für die Nutzer bald nicht mehr wegzudenkenden Helfer.


Einen Punkt möchte ich hervorheben, da er auch gleichzeitig die neue Dimension dieses Ansatzes demonstriert: die Hierarchielosigkeit. Jeder, der einmal auf der Webseite eines Unternehmens nach einer bestimmten Produktinformation oder einem Formular etc. gesucht hat, kennt es: man benötigt viele Klicks und Unterseiten, bis man zur gewünschten Information gelangt ist (wenn überhaupt). Grafische Benutzeroberflächen tragen dieses Problem inhärent in sich: sie bilden auf visuelle Weisen Hierarchien ab, die unübersichtlich sein können. Ein Chatbot überspringt diese Hierarchien: man äußert seinen Wunsch und gelangt direkt zu seinem Ziel (Strom-Zählerstandformular, rote Schuhe,...). Ein immenser Gewinn an Komfort und Benutzerfreundlichkeit!


Dieser Ansatz wird sich für viele Anwendungs-Szenarien durchsetzen, da er technologisch möglich ist und für den Nutzer Vorteile bringt. Er bringt aber auch Nachteile bzw. Herausforderungen, die jetzt deutlich erkennbar werden: zum Beispiel die Auffindbarkeit / Discoverability. Wenn Nutzer zukünftig fragen: "Ich suche Schuhe, die fair hergestellt und gehandelt werden", dann werden nur die Schuhe von Herstellern gefunden und angezeigt, die dieses Kriterium auch in der Produktbeschreibung angegeben haben. Ein Klick auf andere Schuhe entfällt.


Die Produktbeschreibungen lösen sich weiter von technischen Beschreibungen aus Unternehmenssicht und müssen zukünftig noch stärker semantisch aus Nutzersicht gedacht und beschrieben werden. Gerade für Marken mit wenig Profil bzw. im Low-Involvement-Bereich wird dieses grundlegend andere Interaktionsmuster zu einer verstärkten Herausforderung. Nicht Menschen müssen lernen, wie sie mit Maschinen umgehen können, sondern Maschinen müssen lernen, wie sie mit Menschen umgehen können.



© 2019 by Software Innovation Bridge

+49 176 51975082