Programmieren mit Spracherkennung
Datum: | 05.10.2020 |
Name: | Zipp |
Ort: | Anonym |
Ich leide seit einer Therapie mit einem Fluorchinolon-Antibiotikum (bekannt unter Levofloxacin oder Ciprofloxacin) unter RSI.
Fluorchinolone-Antibiotika sind bekannt für ihre langanhaltenden sehnenschädigenden Nebenwirkungen. Besonders tückisch ist hierbei die mögliche Zeitverzögerung zwischen Einnahmen und Auftreten der Nebenwirkungen, sodass viele Betroffene keinen Zusammenhang zu der Therapie erkennen. Daher sollte sich jeder RSI-Betroffene auch überlegen, ob er in den letzten Monaten oder Jahren vielleicht ein Antibiotikum aus der Gruppe der Fluorchinolone bekam. Die Krankenkasse kann einem dabei helfen.
In den letzten 2 Jahren nahmen meine RSI-Beschwerden so stark zu, dass ich aufgrund von starken Schmerzen in den Sehnen der Unterarme und Finger meinen Beruf in der IT nicht mehr ausüben konnte.
In diesem Beitrag möchte ich einige Dinge und Hilfsmittel aufzählen, die mir in den letzten 2 Jahren begegnet sind und dabei geholfen haben meinen Beruf in gewissen Maßen wieder ausüben zu können. Viele Dinge setzen dabei ein technisches Verständnis voraus und richten sich daher eher an Leute die in der IT arbeiten.
Einer der wichtigsten Punkte in der täglichen Arbeit am Computer ist die Automatisierung von wiederkehrenden Arbeitsschritten im Zusammenspiel mit einer Spracherkennungssoftware. Sobald mir aufgefallen ist, dass ich einen Arbeitsschritt immer wieder ausführe, habe ich damit begonnen diesen zu automatisieren. Besonders am Anfang hat mir das Programm VoiceAttack (https://voiceattack.com) dabei geholfen. Es lässt sich in einer abgespeckten Form für die ersten Aufgaben testen. Der volle Funktionsumfang ist für 10 $ verfügbar. Das Programm ist sehr mächtig und jeden Cent wert. VoiceAttack verwendet die Windows Spracherkennung (nicht Cortana) wie sie unter Windows
7/8/10 verfügbar ist. Sodass keine weiteren Kosten entstehen.
Wer die Windows Spracherkennung kennt, weiß, dass diese nicht besonders gut funktioniert. Da man allerdings mit VoiceAttack Wörter definiert die erkannt werden sollen, funktioniert die Erkennung recht zuverlässig. VoiceAttack bietet eine umfangreiche Benutzeroberfläche, sodass man sich viele Sachen schnell zusammenklicken kann.
Wer längere Texte schreiben muss, wird mit der Windows Spracherkennung nicht weit kommen. Hier lässt sich die Spracherkennung von Google Docs (wie in einem anderen Beitrag hier schon erwähnt) sehr gut verwenden.
Auf lange Sicht würde ich aber zu Dragon raten, da es komfortabler ist und auch bei der Bedienung des Computers hilft. Auch selbst definierte Kommandos werden unter Dragon zuverlässiger erkannt, als unter der Windows Spracherkennung.
Und mit der Möglichkeit Erweiterungen zu nutzen, ergeben sich viele neue Möglichkeiten. Im Gegensatz zu Dragons Build-in Macro- und Skriptengine ist die Ausführung mit einer der folgenden Erweiterungen schneller und wesentlich flexibler.
Folgende Erweiterungen setzen NatLink (https://sourceforge.net/projects/natlink/files) voraus.
Vocola (http://vocola.net/v2) ist eine Erweiterung mit der man in Command-Dateien leicht verständliche Kommandos definieren kann (z.B. "kopier das = {Ctrl+c}").
Dragonfly (https://github.com/dictation-toolbox/dragonfly) ist ein Python basiertes Framework das viele Möglichkeiten bietet, um Dinge unter Verwendung von Dragon (aber auch Windows Spracherkennung) zu automatisieren. Anders als VoiceAttack, bietet Dragonfly keine Oberfläche, sondern muss in entsprechenden Python Dateien definiert werden. Unter Verwendung von Python lassen sich hiermit allerdings auch sehr komplexe Dinge automatisieren.
Es gibt immer wieder Situationen bei denen man auf eine Maus angewiesen ist. Hierfür lassen sich auch unterschiedliche Lösungen verwenden.
Mit dem kostenlosen Programm eviacam (https://eviacam.crea-si.com) lässt sich mit einer Webcam der Kopf verfolgen. Damit lässt sich der Mauszeiger zuverlässig und präzise steuern.
Mit dem Tobii Eye Tracker
(https://gaming.tobii.com/product/eye-tracker-5) lässt sich der Mauszeiger mithilfe der Augen steuern. Das Modul kostet ca. 230 €.
Leider ist es für eine präzise Steuerung doch etwas ungenau. Hier setzt precisiongazemouse (https://precisiongazemouse.org) an. Es verwendet die Kombination von Eyetracking und Headtracking (z.B. mit
eviacam) um präzise zu sein.
Ich verwende mittlerweile aber die einfache Steuerung der Maus mit dem Fuß. Dies wurde hier schon bereits in einem anderen Beitrag erwähnt.
Es funktioniert nach einer kurzen Eingewöhnungszeit recht zuverlässig.
Man muss nur die Sensitivität in den Windows Einstellungen herunterschrauben. Und gegebenenfalls sollte man vorhandene Navigationstasten deaktivieren (z.B. mit VoiceAttack). Das scrollen und klicken mit der Maus lässt sich auch sehr gut mit Sprachbefehlen ersetzen, sodass man die Maus nur noch mit dem Fuß bewegen muss.
Hier hier einige weitere Links die nützlich sein können.
- https://github.com/mdbridge/click-by-voice - Chrome Erweiterung mit der man alle klickbaren Elemente durchnummerieren und mit VoiceAttack oder Dragon ansteuern kann.
- https://github.com/mrob95/Breathe - API um Dragonfly Befehle an einem Stück ohne Pause zu sprechen. Wer vor hat dragonflybasiertes System aufzubauen, sollte gleich Breathe verwenden.
- https://github.com/dictation-toolbox/Caster - ein dragonflybasiertes Toolkit das insbesondere den Fokus auf das Programmieren mit der Stimme legt. Funktioniert allerdings nur mit einem englischen Vokabular bzw. Dragonprofil.
- https://handsfreecoding.org - umfangreicher englischsprachiger Blog zum Thema Sprachsteuerung unter Verwendung von Dragonfly.
- https://www.youtube.com/watch?v=8SkdfdXWYaI - das wohl bekannteste Video zum Thema voice coding.
- https://www.youtube.com/watch?v=YKuRkGkf5HU - Video einer Entwicklerin die mit der Stimme unter Mac mit Dragon und talon programmiert.
- https://www.youtube.com/watch?v=U-NZjzDj-Xk - einfache Demonstration wie man mit VoiceAttack programmieren kann.
- https://fluorchinolone-forum.de - Selbsthilfeforum für Betroffene von Fluorchinolone-Nebenwirkungen.
- Thema Android:
https://play.google.com/store/apps/details?id=com.google.android.apps.accessibility.voiceaccess
- Bedienung eines Android Smartphones mit der Stimme. - https://play.google.com/store/apps/details?id=com.crea_si.eva_facial_mouse
- Bedienung eines Android Smartphones durch Webcam Head-Tracking.