Produktberatung und Kundendienst sind Steckenpferdchen von Chatbots. Aber was taugen sie? Und reagieren Kunden auf sie? Antworten im Chat mit Lisa Felsenstein. Sie hat in ihrer Masterarbeit “Kundenzufriedenheit im E-Servicebereich” rund 50 Chatbots aus der ganzen Welt untersucht. Den Chat haben wir in Telegram geführt.

Lisa, Du hast in Deiner Masterarbeit an der Uni Zürich Chatbots untersucht. Was genau wolltest Du heraus finden?
Zuerst muss ich erwähnen, dass ich nicht alleine war bei meiner Masterarbeit. Ich habe sie zusammen mit meiner Kollegin Kateryna Djafarov verfasst. Wir hatten uns gefragt, wie Kunden auf Chatbots im Servicebereich reagieren und was diese Chatbots mittlerweile alles draufhaben.
Alles klar. Chatbots und Kundendienst. Ein grosses Thema. Wie seid ihr vorgegangen?
Wir haben im Prinzip zwei Untersuchungen gemacht. Als erstes haben wir uns durch die Weiten des Internets gewühlt und haben versucht herauszufinden, was überhaupt für Service-Chatbots existieren, um dann ihre Qualität zu evaluieren. Dies gestaltete sich aber recht schwierig, da es eigentlich kein Register gibt, in dem alle Chatbots verzeichnet sind, und die die es gibt, werden sehr schnell inaktuell. Man steht hier also vor einem reaktiven Forschungsgegenstand, und wir mussten uns neue Methoden überlegen.
Was war euer Fokus geografisch?
In gewisser Weise mussten wir uns einschränken, da wir beide nur Deutsch und Englisch gut können, also es war eine eine sprachliche statt geografische Einschränkung. Wir haben Chatbots getestet, die Asien, Europa und Amerika bedienen, und natürlich auch solche, die international agieren.
Und wir mussten natürlich darauf achten, dass wir die Dienstleistungen anhand von Bildern beurteilen können, weil uns ja nicht Dinge aus Singapur oder China bestellen konnten 😉
Und auf wie viele Chatbots im Bereich Kundendienst im deutschen und englischen Sprachraum seid ihr gestossen?
Also insgesamt haben wir 71 Chatbots gefunden, die allen unseren Kriterien entsprachen. Aus diesen haben wir 50 mit einer proportionalen, geschichteten Zufallsauswahl ausgewählt, um mehrere Branchen auswerten zu können.
Zeigten sich da Schwerpunkte, sei es geografisch oder nach Branche?
Wir mussten natürlich eine Branche wählen, wo wir die Leistung des Chatbots sofort beurteilen können, anhand eines Bildes etwa. Ein Chatbot, der uns eine Reiseempfehlung gibt oder ein Restaurant vorschlägt, war da natürlich nicht geeignet. Wir haben uns dann auf folgende Branchen beschränkt:
Allgemeines Shopping, Auto, Blumen, Brille, Geschenkideen, Kosmetik, Kostüme, Mode, Price Tracker, Sneaker, Sonderangebote und Technik.
Heisst das, man muss die Ergebnisse im Kontext von B2C und Konsumgütern im weiteren Sinn sehen?
Ja, das würde ich so sagen. Wir haben uns auf Güter beschränkt, welche man früher in einem Laden hätte anfassen, ausprobieren und so hätte entscheiden können, ob man sie kaufen will oder nicht. Mit dem Internet fällt diese sinnliche Erfahrung weg, und gerade deswegen kann ein Chatbot eine grosse Hilfe sein, sich beraten zu lassen und zu entscheiden. Er kann die sinnliche Erfahrung so vielleicht ersetzen.
Und wie beurteilt ihr die Qualität der Chatbots in diesen Branchen? Zeigen sich Muster?
Ja, es zeigen sich sehr klare Muster. Natürlich haben wir sehr viele Merkmale dieser Chatbots untersucht und es gibt viele Details auf die man eingehen könnte. Was sich aber allgemein zeigt, ist, dass die meisten dieser Bots die ihnen zugedachte Aufgabe eigentlich recht gut erfüllen konnten. Wenn ich eine rote Hose wollte, dann habe ich diese bekommen. Wenn ich ein Geschenk für meinen zwölfjährigen Sohn suchte, dann habe ich einen sinnvollen Vorschlag bekommen. Aber abgesehen davon kann man sich mit den meisten Bots nicht sehr gut unterhalten. Sie sind nicht auf Smalltalk und “menschliche” Unterhaltung ausgelegt, und man versucht allgemein nicht mehr, dem Kunden das Gefühl zu geben, wirklich mit einem Mensch zu kommunizieren. Man schafft hier mehr Transparenz, als noch vor einigen Jahren.
Die meisten Bots erfüllten die ihnen zugedachte Aufgabe recht gut, sie übten sich in Smalltalk over versuchten menschlich zu sein. Aber für eine Unterhaltung waren sie nicht zu haben.
Ein Fazit der Studie
Das zeigt, dass die Chatbot-Macher im Prinzip auf den eigentlichen Use Case fokussieren, was der Chatbot für die Kunden erledigen soll. Spannend, dass ihr das belegen könnt. Gibt es weitere Erkenntnisse?
Genau, das ist aufgefallen. Was noch zu erkennen war, dass die Chatbots trotzdem sehr wohl Emotionen zeigen wie Humor oder Bedauern. Sie nutzen sehr viele Emojis, was ja derzeit sehr common ist, und was auch auffiel, dass die meisten dieser Bots sich nicht auf einer Firmenwebseite finden, wie das früher oft der Fall war, sondern meist in Messenger-Diensten wie Facebook-Messenger oder Kik.
Kik? Das klingt nach asiatischen Chatbots
Unter anderem, aber es waren auch amerikanische und europäische Bots dabei, die diese Plattform nutzen.
Aufgrund eurer Untersuchung, welche Ratschläge könnt ihr Unternehmen geben, die einen Chatbot für ihren Kundendienst einsetzen möchten?
Also ich würde den Ratschlag geben, die Sprache des Bots modern und locker zu gestalten, ihn sehr gut auf seine Aufgabe zu programmieren und ihn in einem Messenger-Dienst einzusetzen. In unserer zweiten Studie haben wir dann herausgefunden, dass es einem Kunden eigentlich egal ist, ob ihn ein Mensch oder ein Bot bedient, solange das Anliegen erfüllt wird. Eine Angst vor Robotern oder “Cyber” zeigte sich in unserer zweiten Studie also nicht.
Unternehmen sollten die Sprache des Bots modern und locker gestalten, ihn sehr gut auf seine Aufgabe zu programmieren und ihn in einem Messenger-Dienst einsetzen.
Die Empfehlung von Lisa auf Basis ihrer Studie
Hatte es für die Befragten einen Einfluss auf die Beurteilung, ob sich der Chatbot als solcher zu erkennen gab oder nicht?
Dies haben wir gar nicht untersucht. Bei uns war es immer klar, wer gerade das Gegenüber des Kunden ist. Das wäre auch einmal eine interessante Studie.
Im Prinzip belegt ihr, dass Kunden einen Chatbot akzeptieren, wenn er ihre Probleme bzw. seine Aufgabe erfüllt. Kann man das so sagen?
Genau. Dies hat sich zwei Mal sogar gezeigt, da wir in unserer Masterarbeit praktisch eine Vorstudie mit demselben Thema repliziert haben und hier auf praktisch das gleiche Ergebnis kamen.
Das ist spannend, da es Studien gibt, die eine hohe Akzeptanz und dann wieder eine tiefe bekannt geben. Arbeitest Du heute noch an Chatbots?
Leider nicht, aber ich würde mich sehr gerne wieder damit beschäftigen. Im Moment bin auf Stellensuche in der Sozialwissenschaft oder Beratung. Vor kurzem habe ich ein Praktikum im Bibliothekswesen absolviert. Da könnte man Bots auch gut brauchen 😉
Woran denkst Du?
Es ist bei wissenschaftlicher Recherche oft unglaublich anstrengend, etwas zu einem bestimmten Thema zu finden, vor allem wenn man das nicht gut in einzelne Stichworte fassen kann. Hier könnte ein Chatbot die menschliche Umschreibung eines Themas in einzelne Suchbegriffe umwandeln und dann passende Literatur dazu aussuchen. Genauso könnte er dabei helfen, wenn man sich nicht mehr an den Titel eines Buches erinnert, sondern nur noch an den Inhalt. Dann könnte der Chatbot das machen, was er am besten kann: Menschliche Sprache in brauchbare Schlüsselbegriffe für das Internet und die Cyberwelt übersetzen.
Danke Lisa für den Chat
Kateryna Djafarov, Lisa Felsenstein (2018): Kundenzufriedenheit im E-Servicebereich. Ein Vergleich von Chatbots und Menschen. Masterarbeit. Universität Zürich.
Picture: thanks to Volodymyr Hryshchenko