Der richtige Umgang mit digitalen Sprachassistenten

Einleitung

Ob Siri von Apple, Alexa von Amazon, Cortana von Microsoft oder Google Now von Google. Fast jeder hat inzwischen einen dieser Asisstenten bei sich im Haus. Entweder auf dem Handy, einem Tablet, am PC oder als eigenständige Station. Viele wissen aber gar nicht so recht was man mit denen anfangen kann, oder wie man mit ihnen sprechen muss. Was die einzelnen Systeme können, hängt in vielerlei Hinsicht davon ab, wie gut sie vernetzt sind mit jenen anderen Geräten, bzw. auf welchem Gerät man welchen Dienst nutzt. Alle Sprachassistenten haben gewisse grundlegende Fähigkeiten. Dazu zählen sämtliche Organisatorischen Dinge, wie Kalenderpflege, Nachrichten verfassen und Anrufe tätigen (sofern auf einem Handy genutzt). Auch das Wetter kann eigentlich auf jedem System abgefragt werden, wie auch Musiksteuerung möglich ist. So richtig interessant wird das alles aber, wenn man zu Hause noch weitere Komponenten hat, wie ein Hub/Gateway (Steuerzentrale), wodurch wieder weitere Komponenten gesteuert werden können, wie Licht und Heizung. Wie spricht man nun mit diesen Systemen? Immer wieder stelle ich fest, dass sich Menschen schwer damit tun, die richtigen Kommandos und Befehle zu verwenden. Daher möchte ich mal erklären, wie so ein System arbeitet.

Das System ansprechen

Jedes System hat sein eigenes Aktivierungswort. Bei Apples Siri sagt man „Hey, Siri„, Google reagiert auf „Ok, Google„, der Amazon Echo reagiert auf „Alexa“ und Microsofts Cortana reagiert auf „Hallo Cortana„. Sobald man das entsprchende Aktivierungswort gesagt hat, hört der Assistent quasi zu. Nun sollte man allerdings keine Gesprächspausen einlegen, denn sonst endet die gerade gewonnene Aufmerksamkeit ohne Ergebnis. Man sollte sich also vorher überlegen, was man gerade will. Denn Sprachkorrekturen mitten im Satz sind eben nicht möglich.

Wie das System arbeitet

Man muss sich vorstellen, sobald das System zuhört, wird das Gesprochene Wort quasi in Text umgewandelt und als Befehl entgegengenommen. Und zwar Wort für Wort in gesprochener Reihenfolge. Etwaige Wortkorrekturen werden demnach also eben infolge des Satzes verstanden. Beispiel:“Wie ist das Wetter in Langenfeld, ehm Monheim, ach nein Düsseldorf.“, wird genauso vollständig verwertet und eben nicht der gemeinte Ort mehrfach abgeändert. Üblichweise liefern die Assistenten in diesem Fall das Wetter von Langenfeld ab und damit ist Schluss. Bei der Verwertung der Sprachbefehle reagieren die Systeme auf sogenannte Kommandos mit ihren jeweiligen Parametern. Ich liste mal einige Beispiele auf, was genau gemeint ist, wobei ich das Kommando immer FETT markiere und die Parameter KURSIV schreibe.

„Wie ist das Wetter in Langenfeld?“ / „Rufe Markus an.“ / „Schalte das Licht im Wohnzimmer an.“ / „Schreibe eine Nachricht an Markus.“

Bei allen Beispielen gilt, dass man entprechende Befehle auch Pur angeben kann. Also ein „Wie ist das Wetter in Langenfeld?“ kann abgekürzt werden mit „Wetter Langenfeld.“. Manche Befehle lassen gleich mehrer Parameter zu, wie Beispielsweise die Lichtsteuerung, wie auch das verfassen von Nachrichten. Wieviele Parameter ein Befehl zulässt, ergibt sich oftmals durch den Context. Manchmal hilft auch einfach ausprobieren. Als kurzer Hinweis sei noch gesagt, dass beim verfassen von Nachrichten an jemanden man darauf achten sollte, die Nachricht auch korrekt zu diktieren.
Beispiel „Schreibe eine Nachricht an Markus Ich bin zu Hause.“ bewirkt dass Markus eine Nachricht bekommt mit dem Inhalt „Ich bin zu Hause“. Genau das gleiche passiert natürlich auch bei „Schreibe eine Nachricht an Markus dass ich zu Hause bin.“. Markus erhält dann natürlich die Nachricht „dass ich zu Hause bin“.

Noch ein Beispiel: „Erinnere mich um 15 Uhr an Einkaufen.“. Bei diesem Befehl wird man um 15 Uhr erinnert mit dem Hinweis „Einkaufen“. Genau das gleiche passiert wenn man sagt „Erinnere mich um 15 Uhr daran, dass ich noch einkaufen muss.“. Man wird um 15 Uhr erinnert mit der Meldung „dass ich noch einkaufen muss.“

Fazit

Damit der digitale Helfer auch das tut, was wir wünschen, müssen wir klare Kommandos verfassen und die richtigen Parameter nennen. Korrekturen innerhalb eines gesprochenen Satzes sind nicht möglich. Da das gesprochene Wort in Text umgewandelt wird, muss so klar und deutlich wie möglich gesprochen werden. Verschluckte Buchstaben werden nicht automatisch eingefügt und das Kommando kann evtl nicht verarbeitet werden. Zu lange Pausen zwischen den Wörtern sollten genauso vermieden werden, wie zu hastiges sprechen.

0 Antworten

Hinterlassen Sie einen Kommentar

Wollen Sie an der Diskussion teilnehmen?
Wir freuen uns über Ihren Beitrag!

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.