Alexa, spiel einen amerikanischen Radiosender mit vielen Reportagen …

Die Informationsarchitektur hinter Conversational User Interfaces

In Zeiten von Alexa also Amazon Echo, Google Home und Siri steigen die Erwartungen an Conversational User Interfaces (CUIs) deutlich an. Endlich sind Computer in der Lage, natürlich sprachige Befehle in einer Art zu verstehen und zu befolgen, die menschlichen Fähigkeiten zunehmend näherkommen. Menschen können in der Interaktion mit Computern ihre eigene Sprache sprechen. Sprache rückt sowohl bei der Eingabe, als auch bei der Ausgabe ins Zentrum. Da ein visuelles Interface wegfällt, sind Strukturierung und Begrifflichkeit von sprachlichen Dialog-Elementen für eine erfolgreiche Interaktion von großer Bedeutung. In diesem Beitrag soll die Relevanz von Ansätzen aus der Informationsarchitektur für die Generierung und Optimierung von CUIs herausgearbeitet werden.

Was versteht man unter CUIs und wie funktionieren sie?

CUIs sind alle Systeme, die über einen natürlich sprachigen Dialog funktionieren. Der Nutzer kommuniziert mit dem Computer in seiner eigenen Sprache. Bei klassischen Chatbots erfolgt die Interaktion über ein Textfeld. Voice User Interfaces (VUIs) arbeiten mit gesprochener Sprache. Im Zentrum der Funktionsweise von CUIs steht die Verarbeitung natürlicher Sprache. Bei VUIs ist der Verarbeitung noch die Spracherkennung vorgelagert. Das System versucht dann anhand von Schlüsselbegriffen, Kontexten und Lernprozessen den Befehl oder die Frage zu verstehen. Es erfolgt dann ein Matching zwischen dem verstandenen Input und möglichen Reaktionen. Diese Reaktion kann die direkte Ausführung eines Befehls, eine Antwort sein oder auch eine Rückfrage.

Was hat das mit Informationsarchitektur zu tun?

CUIs arbeiten ausschließlich mit Sprache. Fällt das visuelle Interface für Eingaben und Ausgaben weg, bleiben nur noch Begriffe, ihre Zusammenhänge und semantischen Strukturen als Material für die Interaktion übrig. Gegenstände von CUIs müssen analysiert und Attribute für ihre Beschreibung zur inhaltlichen Erschließung identifiziert werden. Retrieval Prozesse, zum Beispiel das Matching zwischen sprachlichen Eingaben und möglichen Reaktionen, spielen bei der Interaktion eine zentrale Rolle. Dies alles sind typische Einsatzfelder der Informationsarchitektur.

Entwicklung von CUIs: nützliche Ansätze aus der Informationsarchitektur

Nancy B. Duan geht in Ihrem vierteiligen Beitrag im Chatbots Magazine sehr ausführlich darauf ein, wie Methoden aus der Informationsarchitektur bei der Entwicklung eines CUI eingesetzt werden können.
Die Entwicklung eines Inhaltsmodells zu den Gegenständen eines CUI hilft bei der Erschließung für verbesserte Matching-Prozesse. Dies erhöht die Flexibilität und Relevanz von Reaktionen. Duan führt das Beispiel eines CUI für Filmempfehlungen an. Eine Frage könnte auf weitere Filme eines bestimmten Regisseurs abzielen. Wurde im Inhaltsmodell das Attribut Regisseur berücksichtigt, kann das CUI diese Frage problemlos beantworten.
Für die Erschließung der Inhalte, auf die sich das CUI bezieht, hält Duan eine strikte Hierarchie, wie Sie in einer Baumstruktur zu finden ist, für ungeeignet. Sie empfiehlt eine Mischung aus multidimensionaler Hierarchie und Suchmaschine. Dies ist zu vergleichen mit einer Suchfunktion, die mit einem mehrdimensionalen Filter verbunden ist. Diese Hierarchie kann durch eine Analyse des Inhaltsmodells generiert werden.

Beispiel einer Baumstruktur im CUI

Strikte Hierarchie vs. multidimensionale Struktur


In einem weiteren Teil ihrer Ausführungen schlägt Duan vor, eine Taxonomie zu den Gegenständen des CUI zu entwickeln, um dem System eine bessere Basis für die Suche nach geeigneten Reaktionen zu geben. Über eine Taxonomie lässt sich ein Gerüst aus Kategorien und Klassen und ihren hierarchischen Zusammenhängen erstellen. Reaktionen des Systems erfolgen nicht anhand eines Entscheidungsbaums, sondern auf Basis von begrifflichen Zusammenhängen. Sie spricht davon, dass diese Taxonomie Lernprozesse des Systems unterstützen kann. User Research etwa mit Interviews und Personas können ebenso Quelle für die Taxonomie werden, wie Anhaltspunkte aus Twitter-Hashtags, Nutzungsdaten und Wissenssammlungen.

Fazit

Die Informationsarchitektur hinter einem CUI ist deutlich komplexer, als dies in einem Navigationsmenü im Web der Fall ist. Dies liegt auch daran, dass multidimensionale Strukturen gefragt sind, die mit Retrieval Prozessen wie bei einer Suchfunktion verbunden sind. Die Auswirkungen einer Einbeziehung von Instrumenten der Informationsarchitektur auf die Qualität und Flexibilität der Reaktionen sind nicht zu unterschätzen. Zu nennen sind hier die Analyse der Gegenstände des CUI mit ihren Zusammenhängen über ein Inhaltsmodell, die Generierung einer multidimensionalen Hierarchie und die Optimierung von Retrieval-Prozessen über die Erschließung und das Matching.

Wie sind Ihre Erfahrungen zu diesem Thema? Sehen Sie weitere wichtige Aspekte, die noch nicht genannt sind? Ich freue mich über Ihre Kommentare.

Portraitfoto: Rita Strebe

Rita Strebe

Senior User Experience Consultant

eresult GmbH

Bisher veröffentlichte Beiträge: 15

2 Kommentare

  • Marcel Kuster

    Hallo Frau Strebe,

    Vielen Dank für Ihren informativen Artikel. Ich habe zu zwei, aus meiner Sicht wiedersprüchlichen Aussagen eine Frage. Zum einen schreiben Sie, dass CUI’s alle Systeme beinhalten, welche über einen natürlich sprachigen Dialog funktionieren und zum anderen, dass CUI’s ausschliesslich mit Sprache arbeiten.
    Ein natürlicher Dialog könnte aus meiner Sicht auch aus Gestiken (z.B. Handschlag bei ausgestreckter Hand), Mimiken oder aber auch Text sein. Was ist ihre Meinung dazu? Vielen Dank für Ihre Antwort.

    Beste Grüsse,
    Marcel Kuster

    • Rita Strebe

      Hallo Herr Kuster,
      vielen Dank für Ihren Kommentar und die Frage. Sie haben natürlich recht, dass ein natürlicher Dialog auch Gestik und Mimik einschließt. Bei CUIs geht es jedoch um natürlich sprachige Dialoge: gesprochene und geschriebene natürliche Sprache in Abgrenzung zu Eingaben über Keywords etwa. Der Nutzer kann seine eigene natürliche Sprache einsetzen und wird bei guter Spracherkennung und -verarbeitung verstanden.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.