
Alex hatte drüben im iphoneblog vor ein paar Tagen einen erneuten Hinweis auf KI-gestützte Sprachdiktat-Apps. In dem Videobeitrag empfiehlt er Willow Voice. Davor hatte er bereits in seinem Premium-Feed, den ich selbstredend schon ewig abonniert habe, Wispr Flow empfohlen.
Letzteres nutze ich seit September. Seit November auch im kostenpflichtigen Abo, denn tatsächlich möchte ich die Funktion sowohl auf dem Desktop, als auch auf meinem Smartphone nicht mehr missen.
Auf macOS zeichnet die App bei gedrückter fn-Taste oder nach Double Press der fn-Taste zum Aktivieren / Deaktivieren auf, was ihr ins Mikrofon sprecht1 und fügt euch den verschriftlichten Text anschließend – je nach Länge nach weniger oder mehr Sekunden – in das aktuell ausgewählte Textfeld ein. KI macht hier im Vergleich zu klassischer Diktatsoftware den Unterschied, wie auch Alex bestätigt2, da sie (kleine) Korrekturen erlaubt und oftmals treffsicherer ist. Für unbekannte Worte gibt es eigene Dictionaries, die automatisch erweitert werden. Selbst der Stil (casual, professionell, etc.) lässt sich oftmals sogar pro aktiver App, aus der heraus aufgezeichnet wird, vorgeben.
Unter iOS stellt Wispr Flow ein Keyboard bereit, über das systemweit die Spracheingabe getriggert werden kann. Eine Live-Aktivität zeigt dabei an, wie lange die App noch mithört, und lässt sich per Dynamic Island beenden. Unter den geltenden iOS-Vorgaben sicherlich die bestmögliche Implementierung.
Das Ganze ist für mich tatsächlich ein Game Changer, was meinen Textinput angeht. Während ich meine Blogeinträge noch gar nicht damit schreibe, verfasse ich während der Arbeit Tickets, Prompts und E-Mails oftmals direkt per (redigiertem) Voice-Diktat. Auf dem iPhone lasse ich mir meine Messaging-Antworten oftmals transkribieren, um nicht für jeden Blödsinn Sprachnachrichten zu verschicken. Es ist sogar schon so weit, dass ich in unserem offenen Büro manchmal den Eindruck habe, dass ich durch das Tippen etwas ausgebremst werde im Vergleich zum niemanden störenden Diktat im Homeoffice.3
That said: eine klare Empfehlung für derartige Software. In wenigen Monden wird die sicherlich durch gesherlockedte KI-Diktat-Funktionen eher auf Betriebssystemebene wandern, bis dahin kann man aber auch jetzt schon vorzüglich mit seinem Device sprechen.45
—
Und wenn ihr (m)einen Affiliate-Link wollt, der euch einen Monat Wispr Flow Pro schenkt, dann dürft ihr den hier nehmen (Affiliate-Link).
—
Update, 31.01.: Ich habe ein paar über Nacht reingeschmuggelte Typos korrigiert (war wohl spät gestern) und noch einen Absatz zur Funktionsweise unter iOS ergänzt.
- Apropos Mikrofon: Da empfiehlt sich immerzu Micro Snitch von den Machern von Little Snitch, das euch auf macOS das sichere, globale Deaktivieren des Mikrofons erlaubt. [↩]
- „Klar, das wird alles als AI und volle Kanne Produktivität verkauft. In der Praxis macht das aber ernsthaft einen Unterschied.“ Fun-fact: Das Zitat habe ich per Wispr Flow aus dem Video mithören und transkribieren lassen. [↩]
- 😅 [↩]
- 😅🙈 [↩]
- Nicht auszudenken, wohin sowas in Kombination mit einem AI-Assistenten wie
ClawdbotMoltbotOpenClaw führen würde bzw. wie das, wenn man diesen mit Sprachfunktionalitäten ausstattet, schon jetzt funktioniert. Ich empfehle gerade jedem diesen Artikel von Federico Viticci zum Einstieg ins Thema OpenClaw. [↩]