Überspringen zu Hauptinhalt

Sprachgesteuerte Anwendungen: Was Künstliche Intelligenz leisten kann

Sprachgesteuerte Anwendungen: Was Künstliche Intelligenz Leisten Kann

Die Art und Weise, wie Menschen mit Produkten oder Dienstleistungen interagieren, wandelt sich derzeit fundamental. Immer mehr Prozesse werden von Maschinen unterstützt – sei es das Kundendienstgespräch per Chatbot oder die Steuerung von Smart-Home-Produkten per App. Vermutlich assoziieren allerdings nur wenige Menschen Attribute wie “natürlich” oder “einfach” mit diesen Erfahrungen. Chatbots wurde lange Zeit das Potenzial zugesprochen, die Mensch-Maschine-Interaktion zu revolutionieren und zu vereinfachen. Führende Technologieunternehmen setzen dafür jedoch schon auf eine neue Entwicklung: die Sprachsteuerung.

Markus Feigelbinder ist Gründer und Chief Operating Officer (COO) des Travel Tech-Startups FINEWAY. Er war zuletzt im Senior Management bei Amazon und baute als Gründer in drei Jahren Westwing zum Marktführer im Bereich Home & Living in der Schweiz auf. Davor arbeitete er knapp zehn Jahre als Consulting Manager in mehreren global führenden Unternehmensberatungen von Japan bis Saudi-Arabien und beriet dort sowohl Klienten in den Bereichen Technology Management sowie Marketing- & Sales-Automation, als auch mehrere multinationale Unternehmen zu Internationalisierungs- und Wachstumsstrategien in Asia-Pacific.

FINEWAY ist ein Travel Tech Startup, das einen Conversational Service basierend auf Künstlicher Intelligenz entwickelt. Der vollständig automatisierte Service führt in Echtzeit mehr als 250 explizite und implizite Datenpunkte zusammen und erstellt daraufhin maßgeschneiderte Reiseangebote.

Michael Feigelbinder

Markus Feigelbinder

Künstliche Intelligenz entscheidet über Erfolg

Sprachgesteuerte Anwendungen sowie Chatbots verfolgen ein gemeinsames Ziel: Die Interaktion mit einer Software so natürlich wie möglich zu gestalten – also die Kommunikation zwischen zwei Menschen zu simulieren. Wie gut dies gelingt, darüber entscheidet maßgeblich die Künstliche Intelligenz (KI) im Hintergrund der Anwendung.

Für eine starke KI bilden qualitativ hochwertige Daten die Grundlage. Indem kontinuierlich neue, aussagekräftige Daten generiert werden, lernt die KI und kann zunehmend komplexere Vorgänge unterstützen. In der Theorie kann man sich diesen Lernprozess als Kreislauf vorstellen: Eine hohe Anzahl an Daten ermöglicht die Entwicklung neuer, komplexerer Anwendungsfälle. Diese generieren neue, belastbare Daten und erlauben es wiederum, andere Anwendungsfälle zu präzisieren und auszuweiten. Damit dieser Kreislauf in der Praxis funktioniert, ist eine der wichtigsten Voraussetzungen, die große Menge an Daten zu erfassen und zielführend auszuwerten. Hier ist die Expertise spezialisierter Data Scientists  gefragt, um Daten in Informationen, und diese wiederum in nützliche Erkenntnisse, zu übersetzen.

Aktuell basieren die meisten Anwendungen in der Praxis noch auf Machine-Learning-Algorithmen und nicht auf KI. Obwohl sie kontinuierlich hinzulernen, sind sie nicht im eigentlichen Sinne intelligent. Denn eine der menschlichen Intelligenz gleichwertige KI gibt es auf dem heutigen Stand der Technik noch nicht. Die Ursache dafür hängt mit einer der größten Herausforderungen zusammen, vor der die KI-Forschung steht: dem Natural Language Understanding (NLU). NLU umfasst nicht nur die Fähigkeit einer Maschine, natürliche Sprache zu verarbeiten, sondern auch Input zu verstehen, der keinen definierten Regeln folgt.

 

Woran Sprachanwendungen scheitern

Die Funktionalität von Chatbots sowie Voice-Assistenten lässt folglich spätestens dann zu wünschen übrig, wenn sie mit unsauberer Aussprache, Dialekten oder auch Umgangssprache konfrontiert werden. Nichtsdestotrotz erkennen prominente sprachgesteuerte Geräte, wie der Google Assistant, Sprache bereits mit einer Genauigkeit von 95 Prozent. Einfache Anwendungsfälle – wie Suchanfragen, Navigieren oder Anrufe und Reservierungen zu tätigen – können deswegen häufig schon sehr zuverlässig und schnell gelöst werden.

Beliebtheit von Sprachassistenten steigt

Google HomeAuch wenn Sprachassistenten noch einen weiten Weg vor sich haben, bis sie Aussagen perfekt verstehen können, wächst ihre Beliebtheit und Nutzung. Das zeigt zum Beispiel die Tatsache, dass intelligente, persönliche Assistenten wie Amazon Echo oder Google Home in immer mehr Haushalte einziehen. Eine Studie des Digital Transformation Institute von Capgemini fand zudem heraus, dass bereits 36 Prozent der Deutschen Sprachassistenten in ihrem Alltag einsetzen. Bis 2021 werden schätzungsweise 1,8 Milliarden Menschen weltweit digitale Sprachassistenten nutzen. So prognostiziert es das Statistik-Portal Statista. Aktuell greifen etwa eine Milliarde Menschen auf sie zu. Experten gehen davon aus, dass mit steigender Nutzung auch die Komplexität der Anwendungsmöglichkeiten zunimmt.

Conversational Interfaces

Per Stimme gesteuerte Anwendungen sind unter anderem deshalb beliebt, da Nutzer nicht das Gefühl haben, eine Benutzeroberfläche zu bedienen. Obwohl “Voice” technisch trotzdem eine solche darstellt – das Conversational Interface. Es muss allerdings nicht wie grafische Interfaces manuell bedient werden, sondern reagiert, sobald der Nutzer einen definierten Anfangsbefehl ausspricht.

Da rein sprachgesteuerte Anwendungen noch gewisse Schwachstellen haben, können Hybridformen aus sprachgesteuerten und grafischen Benutzeroberflächen vorerst den goldenen Mittelweg darstellen. Sie erlauben es, mit der Anwendung zu sprechen, aber auch die Eingabe von Text ist möglich. Diese Optionen werden durch grafische Elemente, wie Buttons, Ergebnislisten, Bilder oder Videos unterstützt.

Diese kombinierten Benutzeroberflächen kompensieren bestehende Schwachstellen der eingesetzten Interfaces. Mängel der Spracherkennung werden so mit grafischen Elementen umgangen. Um trotzdem ein möglichst natürliches Benutzererlebnis zu generieren, schöpfen sie den aktuellen Entwicklungsstand der natürlichen Spracherkennung aus.

 

Ausblick: Denken Sie schon jetzt an die Sprachsteuerung

Anhand von Conversational Interfaces nähert sich die User Experience der Mensch-Maschine-Interaktion einen Schritt weiter an natürliche menschliche Interaktionen an. Sie haben im Gegensatz zu anderen Interfaces nämlich das Potential, eine typische Konversation zu imitieren. Diese wird immer natürlicher, je weiter die KI-Forschung voranschreitet. Bei der technischen Produktentwicklung sollten Unternehmen folglich schon heute die Möglichkeit zur Sprachsteuerung berücksichtigen. Sonst überholt sie die Konkurrenz früher oder später.

Künstliche Intelligenz - Heilsbringer oder Untergang (Teil 1)

Künstliche Intelligenz: Heilsbringer oder Untergang?

Erfahren Sie im neuen Whitepaper, wie der aktuelle Stand in Sachen Künstliche Intelligenz ist, welche Entwicklung die Algorithmen schlauer machen können als den Menschen und welche ethischen Fragen wir jetzt klären sollten.
Jetzt herunterladen!

Marina Vogt

Bei Management Circle bin ich für die Digitalisierungs- und Immobilien-Themen sowie die Assistenz-Veranstaltungen zuständig. In den drei Blogs informiere ich Sie über neue Entwicklungen in diesen Bereichen. Vor meiner Tätigkeit bei Management Circle habe ich Germanistik in Frankfurt und Paderborn studiert. Ich freue mich über Fragen, Anregungen und einen
regen Wissensaustausch!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

An den Anfang scrollen

Künstliche Intelligenz: Mythen, Daten & Fakten

Welche KI-Mythen sind wahr? Lernen Sie beim Lesen oder Filmeschauen die neusten Debatten zur Künstlichen Intelligenz kennen und erweitern Sie Ihren Horizont!

Jetzt mehr erfahren!

Download: KI kann auch unterhaltsam sein!