Spracherkennung

Letzte Anpassung: 21. October 2020

tomedo® bietet Ihnen eine eigens entwickelte Spracherkennung. Zu Anfang verfügt sie nur über einen Standardwortschatz, dies wird sich aber im Laufe der Zeit verbessern. tomedo® eignet sich mit Ihrer Hilfe Ihren medizinischen Fachwortschatz, maßgeschneidert auf Ihre Anforderungen, an. Die Spracherkennung läuft unabhängig von Ihren Clients und Servern, dafür muss aber einmalig das System vorbereitet werden.
Mindestanforderung ist MacOS 10.13 (High Sierra).

Docker Installieren

Die Spracherkennung läuft in einem eigenen Docker-Container. Folglich benötigen Sie auf Ihrem tomedo® Server (oder einem auserkorenen Client) Docker. Docker zu installieren ist kinderleicht. Eine detaillierte Beschreibung finden Sie unter:

https://docs.docker.com/docker-for-mac/install/

Hier eine Zusammenfassung

Laden Sie Docker unter https://download.docker.com/mac/stable/Docker.dmg herunter. Sie brauchen, entgegen der offiziellen Docs, kein Login, Docker ist eine Open Source Software. Installieren und starten Sie Docker. In Ihrer Titelleiste sollte der Docker-Wal erscheinen. Überprüfen Sie ob der Docker-Server tatsächlich läuft, indem Sie auf den Wal klicken und den Status ablesen. Am besten gehen Sie noch in die Einstellungen und überprüfen, dass Docker mit dem Nutzerlogin automatisch startet. Außerdem sollten Sie in den erweiterten Einstellungen die Einstellungen zu CPU und RAM überprüfen. Wir empfehlen jeweils mindestens die Hälfte für Docker freizugeben. Das bedeutet nicht, dass diese Ressourcen für das System geblockt sind, sondern lediglich, dass Docker nicht mehr als die Hälfte benutzen darf. Weisen Sie Docker zu wenig zu, leidet die Performance der Spracherkennung spürbar.

Spracherkennungseinstellungen

Ist Docker erst einmal installiert, müssen sie lediglich in der Spracherkennungsverwaltung den Host sowie den Port einstellen. Gehen Sie dazu zu Verwaltung → Spracherkennung. Der Host ist die IP-Adresse des jeweiligen ausgesuchten Rechners, der Port sollte auf 8888 gesetzt werden. Als letzter Schritt muss nun noch der Spracherkennungsserver gestartet werden. Dazu einfach auf „Server starten“ klicken und auswählen ob der Server am tomedo® Server oder aber am lokalen Client gestartet werden soll. Das erstmalige Starten des Servers kann eine Weile dauern, da im Hintergrund vorerst sowohl das Programm als auch das zugrunde liegende Modell herunter geladen werden muss.

Spracherkennung zum Diktieren

In der Spracherkennungsverwaltung haben Sie die Möglichkeit auszuwählen, ob die Spracherkennung nur dort funktioniert oder aber auch in Karteieinträgen. Dazu müssen Sie den Haken unter „Siri zum Diktieren in Karteieinträgen benutzen“ entfernen. Der Rest ist selbsterklärend. Einfach auf Aufnahme klicken und sprechen. Gesprochen werden kann immer wenn die grüne Ampel leuchtet. Ist die Ampel rot, gab es einen Fehler. Bei einer gelben Ampel ist die Spracherkennung nicht bereit.

Tipp: halten Sie ⌘ CTRL + Leertaste zum Diktat gedrückt.

Wichtig ist: Während Sie sprechen, dürfen Sie nicht schreiben. D.h. wenn Sie den Text verändern wollen müssen Sie erst auf Stop oder Pause klicken, dann können Sie Änderungen vornehmen und per Aufnahme das Diktat fortsetzen. Lediglich einfache Aktionen sind direkt während des Diktats möglich: so können Sie z.B. grün unterstrichene Worte per Linksklick nach Alternativvorschlägen untersuchen und diese auch auswählen.

Es gibt verschiedene Einstellungsmöglichkeiten für die Spracherkennung. Besonders die Nachbearbeitung ist hier von Interesse. Sie können z.B. auswählen, ob Satzzeichen, die Sie einsprechen, auch als solche behandelt werden sollen. Außerdem können Sie Zahlen in Zahlen konvertieren, übliche Abkürzungen ersetzen usw.. Das wichtigste Feature allerdings sind die eigenen Autokorrekturen. Dafür gibt es ein eigenes Einstellungsfenster, zu dem Sie über das Zahnrad direkt dahinter kommen. Dort können sie neue Autokorrekturen einfügen, bereits bestehende bearbeiten oder löschen. Wesentlich interessanter ist aber die Möglichkeit solche Autokorrekturen On-The-Fly anzulegen was im nächsten Abschnitt beschrieben wird.

Spracherkennung trainieren

Da unsere Spracherkennung am Anfang nur Umgangssprache kann, ist es unabdinglich sie zu trainieren. Dafür benötigen wir unbedingt Ihre Hilfe. Zum Trainieren gibt es verschiedene Möglichkeiten. Die effektivste Möglichkeit ist: Während der Korrektur des Geschriebenen per Rechtsklick die Worte korrigieren. Dafür einfach auf ein falsch erkanntes Wort oder eine falsch erkannte Wortgruppe per Rechtsklick klicken. Im Menü haben Sie verschiedene Möglichkeiten:

  • Die Groß und Kleinschreibung ändern: Wird ein Wort immer klein geschrieben, obwohl es eigentlich groß geschrieben werden sollte, wählen Sie „immer groß schreiben“. Wird ein Wort immer groß geschrieben, obwohl es eigentlich klein geschrieben werden sollte, wählen Sie „immer klein schreiben“.
  • Worte zusammen schreiben: Werden 2 Worte immer getrennt aufgeschrieben, wählen Sie „immer zusammen schreiben“.
  • Rechtschreibung korrigieren: Für alle anderen Fälle wie z.B. falsche Rechtschreibung, Zusammen-Schreibung obwohl es getrennt geschrieben werden sollte oder sonstige Veränderungen, wählen Sie „Schreibweise korrigieren“.
  • Anlernen: Besonders medizinische Fachbegriffe werden unserer Spracherkennung zu Beginn Probleme machen. Hierfür haben Sie den Menüpunkt „Anlernen“. Es ist möglich, dass Sie für ein und dasselbe Wort mehrfach anlernen müssen.

Wir möchten Sie bitten, in regelmäßigen Abständen die von Ihnen angelegten Autokorrekturen an uns zu schicken, denn nur so ist es möglich, sie für alle tomedo®-Nutzer zugänglich zu machen und außerdem auch unsere Trainingsdaten entsprechend zur reinigen. Auf diese Art wird unsere Spracherkennung mit der Zeit immer besser werden. Das ganze können Sie über Spracherkennungsverwaltung → Eigene Autokorrekturen erledigen.

Die oben beschriebenen Mechanismen zum Anlernen der Spracherkennung haben direkten Einfluss auf die Erkennungsrate. Eine weitere Möglichkeit des Anlernens besteht darin, Texte vorzulesen und diese Daten an uns zu schicken. Somit gehen nicht nur Ihre fachspezifischen Texte in das Modell ein, sondern auch Ihre Stimme und ggf. Ihr Dialekt. Bei der Verwaltung → Spracherkennungsverwaltung können Sie einen eigens dafür geschaffenen Trainer starten. Sie können dort einen beliebigen Text aufschreiben bzw. diktieren oder aber zufällig einen Karteieintrag aus der Datenbank ziehen und diesen dann vorlesen. mit dem Button „an zollsoft senden“ haben Sie die Möglichkeit, Ihre eingegebenen Texte nochmals zu überprüfen und dann an uns zu senden.