Let’s talk – von Mensch zu Maschine

10.10.2019
Let’s talk – von Mensch zu Maschine

Von Utopie zur Wirklichkeit: Spracherkennung und -verarbeitung

„Computer! Hallo Computer?“ In der legendären Filmszene in „Star Trek IV – Zurück in die Gegenwart“ aus dem Jahr 1986 versucht Scotty, einen konventionellen Computer wie gewohnt mittels Sprache zu aktivieren, um ihn Befehle ausführen zu lassen oder Informationen abzufragen. Natürlich funktioniert es nicht, denn die Technik war damals außerhalb von Science-Fiction-Filmen noch nicht so weit und bloße Utopie. Würde es heutzutage ein Remake des Filmes geben, hätte er da wohl schon bessere Chancen. Denn Spracherkennung und die Sprachverarbeitung – wie hier im Beispiel umgewandelt in Sprachsteuerung – sind mittlerweile Realität und werden in vielen Bereichen unseres täglichen Lebens eingesetzt.

Sprachsteuerung in unserer Alltagsrealität

Das geht bereits schon morgens los. „Alexa, Licht im Flur und Badezimmer an“. Und wie von Zauberhand erstrahlt das Licht in der gewünschten Stärke und ist auf Abruf auch dimmbar. Auch ein „Wie ist meine Tageszusammenfassung“ tönt es morgens in vielen Badezimmern. Und Sprachassistentin Alexa spuckt brav die vordefinierten Nachrichten aus. So lässt es sich gut informiert in den Tag starten. Noch während im Badezimmer alles seinen gewohnten Gang geht, aktiviert ein „Bitte in fünf Minuten einen Cappuccino“ die nächste gewünschte Aktion und der Kaffee steht in exakt fünf Minuten parat. Auch unterwegs mit Bahn oder Auto beziehen wir Sprachassistenten in unsere Bedürfnisse mit ein. „Zeige nächstgelegene Haltestelle“, „Suche Adresse xy“, „Rufe Person xy an“, „Erinnere mich an Termin xy“, „Spiele Lied xy“ sind übliche Sprachbefehle, die uns den Alltag erleichtern. Und nach der Arbeit? Auch da unterstützt Spracherkennung und Sprachsteuerung: beim Kochen, der Wahl des Fernsehprogramms oder auch beim Einschlafen – und das alles nur über unsere Sprache, die erkannt und entsprechend in eine Aktion umgewandelt wird.

Spracherkennung und -verarbeitung im Beruf

Doch nicht nur in unserem privaten Lebensalltag gehört Spracherkennung und -verarbeitung heutzutage wie selbstverständlich dazu. Auch bei einigen Berufen wird stark auf Spracherkennung und -verarbeitung sowie auch Sprachsteuerung gesetzt. Ein Beispiel: Nehmen wir Inside Sales Manager Gerhard von der OEVERMANN Networks GmbH in Bergisch Gladbach. Per Sprache öffnet er am PC ein Word-Dokument und diktiert drauf los. Über ein Diktiergerät übermittelt er in Word 1:1, was er schreiben möchte. Und die Buchstaben, Wörter, Sätze entwickeln sich wie von selbst auf dem Bildschirm. Eine Zusammenfassung eines Kundenberatungsgesprächs ist heute dran, auf dessen Basis ein Angebot erstellt werden soll. Eine Anwältin, in deren Berufsgruppe das Diktat per Sprache schon seit Langem zum Alltag gehört, hat ein Interesse an einer kanzleiweiten modernen Komplettlösung. Das Ziel hierbei ist, dass das Diktat nicht per manueller Transkription umgewandelt wird, sondern sich automatisch direkt in Text verwandelt. Und zwar nicht nur am PC sitzend, sondern auch unterwegs via Smartphone, Tablet oder Laptop. Dazu kommt dann auch noch die Sprachsteuerung am PC, mit der sich Programme öffnen und schließen lassen und so jede Tastatur vollkommen überflüssig wird. Ja, heutzutage ist mit den entsprechenden Hard- und Software-Komponenten und -strategien so etwas möglich, was man früher für bloße Fiktion gehalten hätte.


Sprache als Mittel der Vergangenheit, Gegenwart und Zukunft

Auch wenn viele Menschen Spracherkennung, Sprachverarbeitung und Sprachsteuerung noch skeptisch gegenüberstehen, ist der sprachbasierte Umgang in unserem Leben auf dem Vormarsch und nicht mehr aufzuhalten. Und wenn man es sich genau überlegt, ist das auch eigentlich nur logisch: Gesprochene Sprache ist die Basis unseres Lebens, unseres Umgangs mit anderen Menschen. Von klein auf. Wir führen Dialoge, privat oder beruflich, um mitzuteilen, was wir wollen, was wir nicht wollen, was unsere Bedürfnisse sind. Sprich, einfach um uns auszutauschen und auch durch Kommunikation weiterzuentwickeln. In wirklich wichtigen zwischenmenschlichen Bereichen schreiben wir in der Regel keine SMS und keinen Brief. Sondern wir reden miteinander. Gesprochene Sprache kann einfach so viel schneller und direkter ausdrücken, was wir sagen wollen – und es fällt uns auch einfach, dies sehr detailliert zu tun. Genau dies ist die optimale Voraussetzung für Spracherkennung und -verarbeitung der Zukunft. Nehmen wir an, ein Polizist soll einen Unfallbericht schreiben. Eine direkte Aufnahme des Geschehenen wird viel detaillierter und ausgeschmückter erfolgen als ein handschriftlicher Bericht. Auch für viele andere Berufe lassen sich Vorteile finden, sei es bei Ärzten, Immobilienmaklern oder Journalisten – einfach überall da, wo viel geschrieben und dokumentiert werden muss.

Wir werden sehen, was die Zukunft im Bereich Spracherkennung und -verarbeitung noch bringen wird. Vielleicht schaffen wir ja tatsächlich, uns mal durch ein „Beam me up, Scotty“ von einer Stelle zur anderen teleportieren zu können.

Text und Foto: OEVERMANN Networks GmbH

0

Kommentare

*WICHTIG: Bitte halten Sie sich beim Kommentieren an unsere Netiquette.
Klicken, um ein neues Bild zu erhalten

Die mit einem * gekennzeichneten Felder sind Pflichtfelder.

Kontakt

Rheinisch-Bergische Wirtschaftsförderungsgesellschaft mbH (RBW)
Friedrich-Ebert-Straße 75
51429 Bergisch Gladbach

Telefon: +49 2204 9763-0
Telefax: +49 2204 9763-99

Ihr Weg zu uns

In Google Maps öffnen