Spracherkennungssoftware

Sprachassistenten zum Diktat

Von Christin Hohmeier · 2018

Datenbanken verstehen nur das geschriebene Wort, mit Sprachdateien kann kein Big-Data-System, keine Callcenter-Anwendung und auch keine Predictive-Maintenance-App arbeiten. Damit Künstliche Intelligenz und Sprachsteuerung funktionieren, müssen die Daten konvertiert werden – von Sprache zu Schrift.

Mann nutzt sein Handy für digitale Spracherkennung. Thema: Spracherkennungssoftware
Mann nutzt sein Handy für digitale Spracherkennung.

Die Kommunikation mit einer sprachgesteuerten Big-Data-Anwendung erfolgt in beide Richtungen über Lautsprecher und Mikrofon – ein Techniker repariert eine Maschine und benötigt Informationen. Er wählt am Smartphone die Nummer seines Supports, ein Softwareroboter nimmt den Anruf entgegen. 

Der übersetzt Sprache in Text, füttert mit diesem Ergebnis die Suchmaschinen und Datenbanken. Die spielen das Ergebnis zurück an den Roboter, der nun den Text in Sprache wandelt und wiederum über das Telefon erklärt, welche Klappe der Techniker an der Maschine öffnen soll. Der Bot beschreibt, mit welchem Werkzeug der menschliche Kollege welche Komponente austauscht und fragt, ob er weitere Information benötigt. 

Auf ein „Ja“ schickt der digitale Assistent einen Bauplan der Maschine auf das Laptop. Hat der Assistent die Pläne verwechselt, kann der Mechaniker noch einmal nach dem richtigen Bauplan fragen. So spielen sich beide am Telefon die Bälle zu und die Maschine läuft.

Protokolle der Supportanfragen

In der Natur dieses Dialogs liegt es, dass sich am Ende niemand mehr an dessen Inhalt erinnert. Aber tatsächlich kann das Gespräch Informationen enthalten, die so wichtig oder überraschend sind, dass es sinnvoll erscheint, alles mit Hilfe von Künstlicher Intelligenz noch einmal anzusehen und zu analysieren.

Denn anscheinend ist das KI-System fehlerhaft programmiert und hat deshalb den falschen Bauplan geschickt. Ein Software-Entwickler kann das Problem betrachten und eine Lösung finden. 

Quelle: Bitkom, 2018

Auch die Intervalle, in denen eine Maschine gewartet oder repariert wird, kann eine wichtige Information sein. Hierfür erhält das KI-System alle transkribierten Dialoge zwischen Techniker und Software-Roboter. Es liest, vergleicht, zählt, lernt, wertet aus und berichtet – „alles im grünen Bereich“.

Und im nächsten Schritt sind der Phantasie, was ein Unternehmen mit den Protokollen anfangen kann, kaum mehr Grenzen gesetzt. Ein naheliegender Gedanke ist es, den Mensch-Maschinen-Dialog für Schulungen und Weiterbildungen zu nutzen. Dazu überarbeitet das Schulungsteam ganz einfach die Datei im Schreibprogramm und bekommt ein kurzes Handbuch für einen Wartungsprozess an einer ganz bestimmten Maschine. 

Weitere Möglichkeiten sind Qualitätssicherung und der Nachweis darüber, dass ein Service zu einem Stichtag durchgeführt wurde. 

Spracherkennungssoftware: Digitaler Assistent assistiert beim Papierkram

Aber das Konzept lässt sich weiterdenken. Der Techniker kann den Sprachzugang zum Support-Bot nutzen, um über diesen Weg weitere Informationen zu diktieren. Der Verschleiß und der Ausfall der nächsten Komponente ist schon absehbar? Ein Eintrag in dem Kalender seiner Kollegen ist über die Sprachsteuerung ebenso möglich, wie die Bestellung der Komponente in der Einkaufsabteilung oder die Anfrage, ob das fraglich Teil auf Lager liegt.

Aus dem Bot wird ein Assistent, der dem Techniker den lästigen Papierkram vom Hals hält. Auf dem Weg zurück in die Firma und weiter in den Feierabend diktiert er dem digitalen Assistenten seine täglichen Einsatzberichte. Und noch vor der Tagesschau sind alle Dokumente fertig transkribiert und liegen in der Inbox seines Chefs und der Buchhaltung, und warten auf Freigabe, Rechnungsstellung für den Kunden und die endgültige Archivierung. 

Array
(
    [micrositeID] => 54
    [micro_portalID] => 25
    [micro_name] => Künstliche Intelligenz
    [micro_image] => 4597
    [micro_user] => 1
    [micro_created] => 1526545484
    [micro_last_edit_user] => 1
    [micro_last_edit_date] => 1567517696
    [micro_cID] => 2186
    [micro_status] => 1
    [micro_cache] => 0
    [deleted] => 0
)