Konzeption von Voice User Interfaces – Trends, Tipps & Tools

31. Mai 2017 Lorena Meyer Konzeption & Design

Sprach-gesteuerte Anwendungen sind in aller Munde. Viele Experten prophezeihen, dass die Voice User Interfaces grafische Interfaces komplett ablösen werden. Auch das Beratungsunternehmen Gartner siedeln sie noch am Anfang ihres Hype Cycles (Stand Juli 2016) an. Sie müssen die Spitze der überhöhten Erwartungen erst noch bewältigen, bevor sie dann – schätzungsweise in 5 bis 10 Jahren – in der breiten Masse ankommen und entsprechend ausgereift sind.

Gartner’s Hype Cycle zeigt, dass Conversational Voice Interfaces noch am Anfang stehen und nicht über die Spitze der überhöhten Erwartungen drüber ist. Erst in 5 bis 10 Jahren werden diese in der breiten Masse ankommen, wird geschätzt.

Bereits für 2020 erwartet das Beratungsunternehmen Gartner, dass 30% aller webbasierten Sitzungen ohne Screen stattfinden werden. Auch Chatbots und sonstigen Sprachassistenten sprechen sie eine erfolgreiche Zukunft aus: Über 85% aller Interaktionen mit dem Kunden sollen laut Gartner dann ohne Menschen erfolgen. Und laut ComScore werden bis dahin die Hälfte der Suchanfragen mit Sprache ausgeführt.

Wenn man sich die Qualität der meisten aktuell verfügbaren Skills und Anwendungen ansieht, ist das schwer vorstellbar. Wie mein Kollege Jens Jacobsen in seinem Beitrag zu Fehlern in der Konzeption von Sprachassistenten bereits eindrücklich beschrieben hat, sind zahlreiche Skills zum Scheitern verurteilt. Etwa, weil nicht alle Eventualitäten berücksichtigt wurden? Weil nicht bedacht wurde, dass der Nutzer mit einer unsichtbaren Informationsarchitektur klarkommen muss? Dass er ohne Display trotzdem wissen muss, wo im System er sich gerade befindet, wie er möglicherweise zurückkommt und welche Befehle er überhaupt ausführen kann? Kein Wunder, dass daher meist nur einfache, klar abgegrenzte Anwendungsfälle funktionieren und genutzt werden, wie wir auch in unserer Studie zu Nutzungskontexten von Sprachassistenten herausgefunden haben.

Aller Anfang ist schwer

Das mag auch an einem der grundlegenden Usability-Heuristiken Recognition rather than recall liegen. An den für eine fehlerfreie, sprachgesteuerte Anwendung notwendigen Technologien (insbesondere Spracherkennung, Natural Language Processing und Artificial Intelligence) kann es nur bedingt scheitern. Probleme, die darauf zurückzuführen sind, werden perspektivisch mit Ausreifen der Technologien verschwinden. Google-CEO Sundar Pichai selbst berichtete auf der diesjährigen Google I/O, dass das Unternehmen die Fehlerquote bei der Erkennung von Sprache auf 4,9 Prozent senken konnte. Letztes Jahr im Sommer lag diese noch bei 8,5 Prozent, vor drei Jahren noch bei 23 Prozent.
Liegt es also nicht eher daran, dass die Konzeption von sprachgesteuerten Anwendungen so deutlich anders ist als die Konzeption grafischer User Interfaces und hier erst Erfahrungswerte gesammelt warden müssen? Sicherlich bleibt vieles gleich, nicht zuletzt die nutzerzentrierte Herangehensweise, die immer zugrunde liegen sollte. Sie ist umso wichtiger bei der Konzeption sprachgesteuerter Anwendungen, weil die meisten noch nicht auf umfangreiche Analytics-Zahlen zurückgreifen können, um zu analysieren, wie Nutzer handeln bzw. kommunizieren.

Doch statt Scribbles bei grafischen UIs tastet man sich eher über Flowcharts an die sprachgesteuerten Anwendungen. Statt Wireframes zu erstellen, schreibt man Skripte. Das Prototyping sieht dann komplett anders aus. Schließlich geht es darum, Computern die Kunst beizubringen, eine Konversation mit einem Menschen zu führen. Folgende Überlegungen sollten Sie daher im Zuge des Konzipierens von sprachgesteuerten Anwendungen mit einbeziehen:

Machen Sie sich Gedanken zur Persona Ihres Skills

Voice User Interfaces haben kein oder nur ein minimalistisches visuelles Interface.

Umso wichtiger für eine gelungenes Nutzererlebnis ist es, dass der Nutzer das Gefühl hat, durchgängig mit ein und derselben Person zu sprechen. Sie sollten sich also bei der Entwicklung des Sprachinterfaces Gedanken dazu machen, wie diese Person aussieht. Ist sie männlich/weiblich (Geschlecht), jung oder eher alt (Alter), wie drückt sie sich aus (Bildungsgrad) und wie reagiert sie auf die Spracheingaben (Charaktertyp)? Stellen Sie sich vor, Sie möchten über das Sprachinterface eine Banküberweisung erledigen. Möchten Ihre Nutzer dann eher ein seriöses Gegenüber, höflich und zuvorkommend, mittleren Alters und möglicherweise männlich?

Erstellen Sie sich Flowdiagramme zu den geplanten Funktionalitäten Ihres Skills

Alexa Skills für einen Fähr-Fahrplan

Flowdiagramm für den Washington State Ferries Alexa Skill

Die Firma Blink UX hat eine solche Flow Map für ihren Washington State Ferries Alexa skill veröffentlicht. (Quelle: www.blinkux.com)

Entwickeln Sie ein Skript für Ihren Skill

Es gibt auch Tools, die Ihnen bei der Sammlung und Strukturierung der Flows, Intents sowie der entsprechenden Dialoge helfen. Wie beispielsweise Sayspring, eine Design- & Prototyping-Software für Voice User Interfaces. Leider ist sie aktuell nur für UK und US verfügbar, aber der Blick in das Testprojekt, ein Skill für eine Bank, lohnt und lässt auf eine Ausweitung für Deutschland hoffen. Die Software unterstützt dabei, die einzelnen Intents zu strukturieren und diese dann auszugestalten. Im abgebildeten Beispiel sehen Sie im Contentbereich mittig mehrere Flows mit inhaltlich dazugehörigen Intents. Nach Auswahl eines Intents erscheint rechts die Eingabemaske für die Dialoge.

Beispielprojekt in der Plattform Sayspring

Die Software SaySpring unterstützt dabei, die einzelnen Intents zu strukturieren und diese dann auszugestalten.

Bedenken Sie Ausnahmen, Varianten und unterschiedliche Ausdrucksformen

Video zur Präsentation In conversations, there are no „errors“ von der diesjährigen Google I/O 2017

Google’s Prototyping- und Entwicklungsplattform für Anwendungen für den Google Assistent: api.ai

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

YouTube immer entsperren

Testen Sie und lernen Sie dazu

Usability-Test mit Sprachassistenten durchführt

api.ai bietet neben einem „Trainings“-Bereich auch ein integriertes Analytics-Tool an.

Wie sind Ihre Erfahrungen mit der Konzeption von sprachgesteuerten Anwendungen? Kennen Sie weitere Tools zum Gestalten und Prototypen von Voice User Interfaces? Berichten Sie gerne. Wir freuen uns auf Ihre Kommentare!

2 Kommentare Konzeption

Konzeption von Voice User Interfaces – Trends, Tipps & Tools

Aller Anfang ist schwer

Lorena Meyer

Weitere Artikel zu diesem Thema:

2 Kommentare

Schreibe einen Kommentar Antworten abbrechen