Spracherkennung

Viele Künstliche Intelligenzen arbeiten gemeinsam

Von Christin Hohmeier · 2019

IT- und Prozessverantwortliche bringen Sprach- und KI-Lösungen als Assistenzsysteme in die Unternehmen. Mitarbeiterinnen und Mitarbeiter in der Produktion und im Außendienst können mit den Systemen sprechen, die Recherche von Daten und Bildern beauftragen, Informationen vergleichen und nach Unterstützung bei der Arbeit fragen.

Menschliches Gesicht mit Raster überlagert. Thema: Gesichtserkennung
Die Bilderkennung sieht und prüft das Gesicht der Technikerin. Foto: iStock/metamorworks

Das IT-System stellt die meisten Informationen für die Wartung einer Produktionsanlage bereit. Schwierig ist häufig nicht die Recherche nach Betriebsanleitungen, benötigtem Werkzeug oder Komponenten, sondern die Eingabe der Suchanfrage sowie das Lesen und Umsetzen der Ergebnisse. 

Etwa in dem Moment in dem eine Technikerin während eines Einsatzes beim Kunden Informationen aus dem System benötigt. Bei der Wartung oder der Reparatur einer Maschine stecken die Hände in Handschuhen. Sie dreht und schraubt an Komponenten oder hält Werkzeuge. Das Tippen auf dem Smartphone oder auf Laptop-Tastaturen ist nicht möglich.

Prozesse mit Spracherkennung steuern

Aber die Technikerin braucht drei oder vier wichtige Informationen – als Ersatz für das Tippen nutzt sie Sprache. Und weil eine Spracherkennung in ihrem Smartphone läuft und eine zweite Sprachanwendung im Rechenzentrum ihres Unternehmens implementiert ist, kann sie sich hier vor Ort einen kleinen Kommandostand einrichten. Beide Systeme aktiviert sie jeweils mit der direkten Ansprache.

Zunächst beauftragt sie das System in ihrem Telefon – nennen wir es „Ripley“ – Details der Maschine zu fotografieren oder zu filmen. Dann schickt sie mit drei oder vier Befehlen die Aufnahmen an die Server ihres Unternehmens. Anschließend nutzt sie die zweite Spracherkennung – die in den Anwendungen im Rechenzentrum des Unternehmens auf Befehle und Dialoge wartet.

„Hallo Sprachassistent im Headquarter, ich stehe vor dieser Maschine. Bitte recherchiere die Seriennummer der Anlage. Wann ist sie das letzte Mal ausgefallen? Und wann wurde sie gewartet?“ Die Spracherkennung übersetzt Anweisung und Fragen in Text, während gleichzeitig die Bilderkennung die Aufnahmen in Datensätze verwandelt. Dann arbeiten die unterschiedlichen Anwendungen – gesteuert mit ihrer jeweils eigenen Künstlichen Intelligenz – daran, die Fragen zu beantworten. 

Drei Künstliche Intelligenzen arbeiten parallel

Die Lösung für die Bilderkennung gleicht in Produktkatalogen, Kundendaten oder Archiven die Bilder und Videos der Maschine ab und findet eine Seriennummer. Die zweite KI nimmt diese Informationen entgegen und durchforstet die digitalen Wartungs- und Reparaturdokumente. Schließlich geben beide Programme ihre Antworten an die Spracherkennung und die Bildverarbeitung zurück.

Die Stimme des Headquarter-Assistenzsystems meldet die Seriennummer und die letzten Wartungs- und Reparaturtermine. Gleichzeitig schicken die Bildprogramme Aufnahmen der früheren Defekte und ein Video, mit dem der Ablauf der Reparatur und die Schwachstellen der Maschine beschrieben sind.

Die Technikerin blättert mit den Sprachbefehlen durch die Smartphone-Bilder, die Ripley von der Maschine aufgenommen hat. Sie befiehlt dem Smartphone: „Ripley, zeige mir das Bild Nummer drei mit dem Titel ,Abdeckung‘ und schicke es an den Assistenten.“

Dann erklärt sie, sie möchte einen Dialog mit dem Rechenzentrum starten und sagt: „Hallo Sprachassistent im Headquarter, ich sehe die Abdeckung des Getriebes vor mir. Was ist der nächste Schritt?“ Und die Assistenz schlägt vor: „Öffnen Sie die Abdeckung mithilfe eines Schlüssels der Größe 18“, und führt von hier aus weiter durch die Reparatur.

Viertes KI-System schließt den Prozess ab

Um zu erkennen, ob die beiden gemeinsam auf dem richtigen Weg sind, macht die Technikerin weiterhin Fotos, die sie über das Smartphone in die Anwendungen schickt. Wenn sie schließlich die Reparatur abgeschlossen hat, befiehlt sie, die Dokumentation des Prozesses gemeinsam mit den Bild-, Video- und Sprachdateien zu archivieren und an die Buchhaltung weiterzugeben. 

Automatisch erstellt eine weitere, mit Künstlicher Intelligenz gesteuerte Anwendung die Rechnung. Der Kollege bekommt eine kleine Sprachnachricht aus dem System. Er solle bitte die Rechnung prüfen und an den Kunden schicken. Und noch bevor die Technikerin im Auto sitzt, hat der Kunde in seinem Posteingang die Rechnung erhalten.

Array
(
    [micrositeID] => 54
    [micro_portalID] => 25
    [micro_name] => Künstliche Intelligenz
    [micro_image] => 3605
    [micro_user] => 1
    [micro_created] => 1526545484
    [micro_last_edit_user] => 1
    [micro_last_edit_date] => 1529421072
    [micro_cID] => 2186
    [micro_status] => 1
    [micro_cache] => 0
    [deleted] => 0
)