KI-basierte Sprachtechnologien Es menschelt: Empathische Beratung dank Conversational AI

Von Daniel Fitzpatrick * 4 min Lesedauer

Anbieter zum Thema

Emotion AI kombiniert mit den Prinzipien der Soziolinguistik – also den Mustern und Rhythmen der Unterhaltung – gilt als Schlüssel zur Vermenschlichung eines sprachbasierten Fahrzeugkonfigurators.

Durch Machine Learning und technologische Fortschritte wird der virtuelle Berater immer menschenähnlicher. (Bild:  Frank Reply)
Durch Machine Learning und technologische Fortschritte wird der virtuelle Berater immer menschenähnlicher.
(Bild: Frank Reply)

Stellen Sie sich vor, Sie möchten Ihr Traumauto online konfigurieren. Aber statt mit Maus und Tastatur auf Buttons zu klicken und Regler zu schieben, werden Sie von einem virtuellen Assistenten begrüßt. Einer, der sich per Sprache steuern lässt, Ihre Stimmung erkennt, Fragen intuitiv beantwortet, Humor zeigt, zwischen den Zeilen liest und Sie spielerisch, aber fundiert beratend durch den Prozess führt. Wie würde Ihnen das gefallen?

Während Dialoge mit Chatbots, digitalen Assistenten und virtuellen Beratern bisher jedoch eher roboterhaft, emotionslos und wenig intuitiv und individuell waren, revolutionieren nun generative KI-basierte Sprachtechnologien die Interaktion zwischen Mensch und Maschine.

Fahrzeug-Konfiguration per Spracheingabe

Bei der Konfiguration eines Fahrzeugs sind entsprechende Anwendungen inzwischen fähig, fast menschlich zu reagieren und zu kommunizieren. Sie sind in der Lage, die Interessenten kurzweilig, individuell und maßgeschneidert zu beraten. Das erfolgt, indem sie die Gesprächsfähigkeiten von Large Language Models (LLMs) zuverlässig mit den Fahrzeugdaten in Einklang bringen und so beispielsweise unstrukturierte Marketingtexte und komplexe Datenbank-APIs in natürliche, nutzwertige Dialoge verwandeln.

Doch wie funktionieren sprachgesteuerte, KI-basierte Konfiguratoren technisch und was gibt es bei Implementierung zu beachten? Ein Konfigurator, der auf Conversational AI basiert, ist immer nur so gut wie die Datenqualität, mit der er gefüttert wird. So weit, so klar. Schlechte Datenqualität oder eine unzureichend durchdachte Datenarchitektur können zu unwissenden und damit nicht akzeptierten digitalen Assistenten führen – und eher zu Frustration beim Nutzer.

Daher gilt zu verhindern, dass das System inkorrekte oder irrelevante Aussagen generiert, vor allem in Szenarien, bei denen falsche Informationen zu schwerwiegenden Konsequenzen führen können. Etwa dann, wenn es um eine akkurate Aussage zu den CO2-Emmisionen eines Fahrzeugs geht. Um das zu gewährleisten, kommt zum einen eine ausgefeilte Konversations-Architektur zum Einsatz. Diese richtet Anfragen an spezifische, strukturierte Datenquellen, wie Emissionsdatenbanken und nutzt Algorithmen, um die faktische Genauigkeit der Antworten rekursiv zu überprüfen. Zum anderen erleichtern C-RAG-Techniken, kurz für Conversational-Retrieval-Augmented-Generation-Techniken, bei denen primär unstrukturierte Kundendaten, wie Werbetexte und häufig gestellte Fragen vektorisiert und in einer Datenbank gespeichert werden, diesen Prozess. Dadurch lässt sich beim Verkaufsgespräch ein enthusiastischer und kreativer Ansatz wählen, während sich das System bei technischen Anfragen strikt auf die Datenbank bezieht, um rein faktisch korrekte Informationen auszuspielen.

Emotion AI für fast menschliche Dialoge

Ein weiterer Schlüssel zum Erfolg eines Sprachkonfigurators ist die Fähigkeit zur Emotionserkennung und zur entsprechenden empathischen Reaktion – eine kritische Komponente gesprächsbasierter Systeme. Dafür bedarf es generativer KI-Technologien, im Zusammenspiel mit der sogenannten Konversationsanalyse (CA). Die Konversationsanalyse erkennt einige der Muster, die Gespräche zwischen Individuen prägen. Sie integriert verschiedene kontextuelle Bausteine wie Zeit- und Ortsangaben – Datum, Uhrzeit und Region – den Bildungsgrad und das ungefähre Alter der/des Sprechenden, Modelle zur Emotionserkennung sowie hochleistungsstarke Intent-Recognition. Dank Emotion AI bzw. Affective Computing ist die Konversationsanalyse sogar in der Lage, Hinweise zur Gemütslage zu berücksichtigen, die ein digitaler Assistent zwingend leisten muss.

Mithilfe von Emotion AI lässt sich die Stimmung im Gespräch messen und analysieren, um prägnante, kontextuell relevante Dialoge zu generieren. Etwa wenn Kunde sarkastisch „vielen Dank“ sagt. Dass er/sie mitunter verärgert ist, lässt sich am tatsächlichen Wortlaut nicht ablesen. Oder wenn potenzielle Käufer beispielsweise während der Konfiguration eines Fahrzeugs plötzlich und ohne Kontext nach Motor-Optionen fragt, könnte das auf Ungeduld hindeuten. Dementsprechend passt das System seine Antworten an, vermeidet langwierige technische Erklärungen, wenn schnelle Entscheidungsfindung oder Klarheit erforderlich sind, und bietet so eine angemessene Interaktion mit dem Kunden.

Jetzt Newsletter abonnieren

Verpassen Sie nicht unsere besten Inhalte

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Systeme können zwischen den Zeilen lesen

Tatsächlich sind sprachbasierte Fahrzeugkonfiguratoren in Form virtueller Berater mittlerweile sogar in der Lage, zwischen den Zeilen zu lesen, Gesprächsfloskeln mit Nebensätzen und Pronomen zu verstehen oder automatisch Zeitbezüge ins Gespräch, zum Beispiel „guten Morgen oder schönes Wochenende“ einzubringen. Eine Aussage wie „Das sieht alles so schick aus!“ kann auch „Hilfe! Ich kann mich nicht entscheiden.“ bedeuten.

Kombinierte Gesprächsverläufe in einem Dialog zu managen, ist eine typisch menschliche Eigenschaft. Entsteht in einer Konversation zwischen zwei Menschen etwa eine kurze Pause, weil einer der Protagonisten nach einem Begriff sucht, kann der Gesprächspartner in der Regel problemlos einspringen und den Gedankengang fortsetzen. „Gestern habe ich erstmals dieses große, kastige Tesla-Modell gesehen. Du weißt schon, das...“ „...den Cybertruck?“ „Ja, genau.“ Soll ein digitaler Assistent human anmuten, muss er das ebenfalls leisten können.

Solche Gesprächsabläufe werden technisch durch LLMs in Kombination mit einer neuen Art der Befehlsverwaltung ermöglicht, die weit über Prompt-Engineering hinausgeht. Konversationsarchitekten sprechen inzwischen von Prompt-Compiling oder gar von einem Prompt-Ökosystem: Das Modell erhält zu jeder Gesprächssituation – angereichert durch Kurz- und Langzeitgedächtnis, Datum und Uhrzeit, emotionale Anpassung, Persönlichkeitsmerkmale, Vokabular und Fachtermini – hochdynamische, systematische Anweisungen, wie es die Antworten zu formulieren hat.

Mensch und Maschine im Gleichgewicht

KI-gestützte Sprachassistenten bedeuten für viele Branchen einen Paradigmenwechsel in der Kundeninteraktion. Erfahrungen zeigen, dass die Expertise des Personals im Autohaus sowie persönliche, menschliche Interaktionen das Beratungs- und Kauferlebnis beim Autokauf erheblich beeinflussen und zu einer höheren Kundenzufriedenheit führen, weil Fahrzeuge besser auf individuelle Bedürfnisse zugeschnitten werden.

Zwar können Conversational-AI-Lösungen echte menschliche Verkäufer und Berater nicht komplett ersetzen. Durch Machine Learning und technologische Fortschritte wird der virtuelle Berater jedoch immer menschenähnlicher. Gelingt es nun, ein gut austariertes Gleichgewicht zwischen selbstlernender Technologie und menschlicher Kontrolle zu schaffen, eröffnen Gesprächs- und KI-basierte Systeme beim Verkauf kompletter Produkte – wie Fahrzeuge – eine neue Dimension der effizienten und empathischen Kundenberatung.  (se)

* Daniel Fitzpatrick ist Manager für Conversational Solutions des auf Conversational Interfaces spezialisierten IT-Dienstleisters Frank Reply sowie Practice Lead Voice Machine Interfaces bei Reply SE.

(ID:49915490)