#künstliche intelligenz (68)

Seite 2 von 7

KI-gestützte „Sprache zu Text“-Apps

App-Icon for Wispr Flow

Alex hatte drüben im iphoneblog vor ein paar Tagen einen erneuten Hinweis auf KI-gestützte Sprachdiktat-Apps. In dem Videobeitrag empfiehlt er Willow Voice. Davor hatte er bereits in seinem Premium-Feed, den ich selbstredend schon ewig abonniert habe, Wispr Flow empfohlen.

Letzteres nutze ich seit September. Seit November auch im kostenpflichtigen Abo, denn tatsächlich möchte ich die Funktion sowohl auf dem Desktop, als auch auf meinem Smartphone nicht mehr missen.

Auf macOS zeichnet die App bei gedrückter fn-Taste oder nach Double Press der fn-Taste zum Aktivieren / Deaktivieren auf, was ihr ins Mikrofon sprecht1 und fügt euch den verschrift­lichten Text anschließend – je nach Länge nach weniger oder mehr Sekunden – in das aktuell ausgewählte Textfeld ein. KI macht hier im Vergleich zu klassischer Diktat­software den Unter­schied, wie auch Alex bestätigt2, da sie (kleine) Korrekturen erlaubt und oftmals treff­sicherer ist. Für unbekannte Worte gibt es eigene Dictionaries, die auto­matisch erweitert werden. Selbst der Stil (casual, professionell, etc.) lässt sich oftmals sogar pro aktiver App, aus der heraus aufgezeichnet wird, vorgeben.

Unter iOS stellt Wispr Flow ein Keyboard bereit, über das systemweit die Spracheingabe getriggert werden kann. Eine Live-Aktivität zeigt dabei an, wie lange die App noch mithört, und lässt sich per Dynamic Island beenden. Unter den geltenden iOS-Vorgaben sicherlich die bestmögliche Implementierung.

Das Ganze ist für mich tatsächlich ein Game Changer, was meinen Textinput angeht. Während ich meine Blog­einträge noch gar nicht damit schreibe, verfasse ich während der Arbeit Tickets, Prompts und E-Mails oftmals direkt per (redigiertem) Voice-Diktat. Auf dem iPhone lasse ich mir meine Messaging-Antworten oftmals transkribieren, um nicht für jeden Blödsinn Sprach­nach­richten zu verschicken. Es ist sogar schon so weit, dass ich in unserem offenen Büro manchmal den Eindruck habe, dass ich durch das Tippen etwas ausge­bremst werde im Vergleich zum niemanden störenden Diktat im Homeoffice.3

That said: eine klare Empfehlung für derartige Software. In wenigen Monden wird die sicherlich durch gesher­lockedte KI-Diktat-Funktionen eher auf Betriebs­system­ebene wandern, bis dahin kann man aber auch jetzt schon vorzüglich mit seinem Device sprechen.45

Und wenn ihr (m)einen Affiliate-Link wollt, der euch einen Monat Wispr Flow Pro schenkt, dann dürft ihr den hier nehmen (Affiliate-Link).

Update, 31.01.: Ich habe ein paar über Nacht reingeschmuggelte Typos korrigiert (war wohl spät gestern) und noch einen Absatz zur Funktionsweise unter iOS ergänzt.

  1. Apropos Mikrofon: Da empfiehlt sich immerzu Micro Snitch von den Machern von Little Snitch, das euch auf macOS das sichere, globale Deaktivieren des Mikrofons erlaubt. []
  2. „Klar, das wird alles als AI und volle Kanne Produktivität verkauft. In der Praxis macht das aber ernsthaft einen Unterschied.“ Fun-fact: Das Zitat habe ich per Wispr Flow aus dem Video mithören und transkribieren lassen. []
  3. 😅 []
  4. 😅🙈 []
  5. Nicht auszudenken, wohin sowas in Kombination mit einem AI-Assistenten wie Clawdbot Moltbot OpenClaw führen würde bzw. wie das, wenn man diesen mit Sprach­funktionali­täten ausstattet, schon jetzt funktioniert. Ich empfehle gerade jedem diesen Artikel von Federico Viticci zum Einstieg ins Thema OpenClaw. []

Isometric NYC

Screenshot der interaktiven Isometric-NYC-Anwendung.

Andy Coenen, AI-Researcher bei Google, hat – unter Zuhilfenahme von LLMs, Coding Agents, Bild­genera­toren und der Google Maps API für 3D-Ansichten – eine isometrische Pixelversion von New York City im Stil von Sim City 2000 und Rollercoaster Tycoon erzeugt:

Growing up, I played a lot of video games, and my favorites were world building games like SimCity 2000 and Rollercoaster Tycoon. As a core millennial rapidly approaching middle age, I’m a sucker for the nostalgic vibes of those late 90s / early 2000s games. As I stared out at the city, I couldn’t help but imagine what it would look like in the style of those childhood memories.

So here’s the idea: I’m going to make a giant isometric pixel-art map of New York City. And I’m going to use it as an excuse to push hard on the limits of the latest and greatest generative models and coding agents.

Den Prozess hat er dabei ausführlich beschrieben und dabei insbesondere die Limitierung der Bildgeneratoren offengelegt, wie er selbst schreibt.

Am Seitenende gibt es dann eine inter­aktive Karten­anwendung, mit der ihr Isolated NYC heran­zoomen und entdecken könnt. (via Kottke)

Just the Browser: Strippt moderne Browser (wieder) auf das Wesentliche

Just the Browser helps you remove AI features, telemetry data reporting, sponsored content, product integrations, and other annoyances from desktop web browsers. The goal is to give you „just the browser“ and nothing else, using hidden settings in web browsers intended for companies and other organizations.

Passend zum Script-basierten, nachträglichen Cleanup von Windows, hier nun auch das Befreien von verschiedenen Browsern (Chrome, Firefox, Edge) von KI-Integrationen, Telemetrie, Kooperationen & Co., sowohl auf allen Desktop-Plattformen (Windows, macOS, Linux).

Just the Browser - Just the Browser | OpenGraph Preview Image
justthebrowser.com

Just the Browser - Just the Browser

Remove AI features, telemetry data reporting, sponsored content, product integrations, and other annoyances from web browsers.

RemoveWindowsAI: Force Remove Copilot, Recall and More in Windows 11

The current 25H2 build of Windows 11 and future builds will include increasingly more AI features and components. This script aims to remove ALL of these features to improve user experience, privacy and security.

Ich nutze seit 20 Jahren hauptsächlich OS X / macOS und ca. seit 15 Jahren gar kein Windows mehr, aber ich hörte von meinen Kolleg*innen, dass die dortige AI-Integrationen und das diesbezügliche Upselling nicht wirklich gut seien. Von daher klingt dieses Skript sehr gut.

Und vielleicht brauchen wir sowas dann in Zukunft auch für Google Intelligence auf macOS?

Update, 12 Uhr: Passend dazu hat Volker heute ein Tool verlinkt, das beim weiteren Aufräumen von Windows 11 hilft: Winslop, was ein wunderbar-tragischer Name für so eine Software ist.

GitHub - zoicware/RemoveWindowsAI: Force Remove Copilot, Recall and More in Windows 11 | OpenGraph Preview Image
github.com

GitHub - zoicware/RemoveWindowsAI: Force Remove Copilot, Recall and More in Windows 11

Force Remove Copilot, Recall and More in Windows 11 - zoicware/RemoveWindowsAI

Hugh Howey: Art, Money, and AI

Interessanter Blogpost von Hugh Howey, dem Autoren der zu einer Apple-TV+-Serie gewordenen, im Selbst­verlag veröffentlichten »Silo«-Trilogie, über den Unter­schied von Writers und Authors und die Aus­wirkungen von KI auf das Schreiben.

Er selbst versteht sich als Writer. Nicht als Author mit kommerziellen Interessen, weshalb er sich von KI nicht bedroht fühlt, da Schreiben eine Kunst- und Ausdrucks­form sei, die nicht durch Technik abgelöst werden wird. Wenn man das geschriebene Wort jedoch als Produkt verstehe, sei eine Gefahr durch KI durch­aus vorhanden – dann wäre allerdings nicht mehr die Rede von Kunst:

There’s a near future where young readers will have stories created just for them. Where many people will read an individually-tailored book that no one else will ever read. And there will be a huge contingent of authoring minds out there who would vastly prefer that we all purchase the latest award-winning novel that nobody actually finishes rather than millions of people read and enjoy a one-off story written by a token-prediction machine.

Writing for money is fine, I guess. I’ve fought for people to have that right. But if that’s the main goal, then the difference between that writer and the tech company is more similar than we’re willing to admit. It’s a pursuit of profits. We can stop pretending it’s about art at all.

Ich denke – wie wohl jeder Tech-affine Mensch – seit einigen Monaten viel (zu viel) über KI, deren Nutzung im Arbeits­kontext und deren Verhältnis zur Kunst nach. Ich habe das Thema, noch nicht vollends abgeschlossen (wie könnte ich auch? God in a Box steht ja unmittelbar bevor – Investieren Sie jetzt eine Fantastilliarde Trump-Dollars, um auch dabei zu sein!), sehe aber die unglaub­lichen Vorteile als Werkzeug – linguis­tische Pro­grammie­rung! – und unaus­weich­lichen Nachteile – Wahr­scheinlich­keits­maschinen! – sowohl in meiner und unser aller Privatnutzung als auch im Business­kontext, wo ja auch meine Branche einerseits bedroht, andererseits gepusht wird.

Wie schon im Web glaube ich an ein absolutes Demo­krati­sierungs­potential, das LLMs (≠ APIs von OpenAI, Anthropic, Google & Co.) für die Software-Entwicklung bieten. Matt Birchler hat gerade richtiger­weise das Year of Micro Apps ausgerufen. Bedroht das mein Geschäft? Ja und nein, aber es befähigt Menschen, sich selbst ihren Wunsch nach individueller Software zu erfüllen. Und kann das Kunst sein? Ich glaube ja.

Art, Money, and AI - Hugh Howey | OpenGraph Preview Image
hughhowey.com

Art, Money, and AI - Hugh Howey

I wrote my first novel in 2009, fulfilling a lifelong dream. That dream was simply this: write a novel. It wasn’t to get a novel published. I wasn’t to get people to read the novel. I never dreamt of making money from my writing. I was just an avid reader from my Dr. Seuss days, […]

Who’s who at X, the deepfake porn site formerly known as Twitter

Mir erschließt sich der Hintergrund nicht ganz, aber es gefällt mir: Die Financial Times hat einen Artikel, in dem sie 1. die obige Überschrift nutzt und 2. das Führungs­team von X vorstellt – mit von Grok bear­beiteten Fotos der Personen als Clowns. 🤡 (Giftlink; via Daring Fireball)

Who’s who at X, the deepfake porn site formerly known as Twitter | OpenGraph Preview Image
ft.com

Who’s who at X, the deepfake porn site formerly known as Twitter

A look inside Elon Musk’s big tent

Word of the Year 2025: Slop

Merriam-Webster’s human editors have chosen slop as the 2025 Word of the Year. We define slop as “digital content of low quality that is produced usually in quantity by means of artificial intelligence.”

Like slime, sludge, and muck, slop has the wet sound of something you don’t want to touch. Slop oozes into everything.

Könnte für die ganze zweite Hälfte des Jahrzehnts ganz passend sein.

2025 Word of the Year: Slop | OpenGraph Preview Image
merriam-webster.com

2025 Word of the Year: Slop

Plus 'gerrymander', 'touch grass', 'performative', and other words that defined the year

USA schalten altes AKW wieder an – für künstliche Intelligenz

Das Kraftwerk Three Mile Island steht für den schlimmsten Reaktorunfall in der US-Geschichte. Doch bald soll ein Teil des stillgelegten AKWs wieder hochgefahren werden. Der Grund: der Energiebedarf von künstlicher Intelligenz. [Anm.: Link von mir ergänzt.]

Microsoft nimmt den dort erzeugten Strom für 20 Jahre ab.

Related: Wie teuer wäre eine Haftpflichtversicherung für ein Atomkraftwerk?

USA schalten altes AKW wieder an - für künstliche Intelligenz | OpenGraph Preview Image
tagesschau.de

USA schalten altes AKW wieder an - für künstliche Intelligenz

Das Kraftwerk Three Mile Island steht für den schlimmsten Reaktorunfall in der US-Geschichte. Doch bald soll ein Teil des stillgelegten AKWs wieder hochgefahren werden. Der Grund: der Energiebedarf von künstlicher Intelligenz. Von Sarah Schmidt.

AI CEO – Replace your Boss before they replace you

AI CEOs deliver instant executive decisions without the executive salary.

No bonus packages / No private jet needed / No mood swings / Ego-free

Super sinnvolle CEO-Weisheiten wie „Empathy, but only if it’s billable“ oder „Sleep is just unconscious time theft“ in einer Mini-Anwendung gebaut von Serious People, die diverse aktivistisch-kreative Kampagnen releasen, wie z.B Oilwell, das Klimakatastrophe mit Meditations-App kombiniert („Relax… it’s only the climate crisis“). (via @ennopark)

AI CEO – Replace Your Boss Before They Replace You | OpenGraph Preview Image
replaceyourboss.ai

AI CEO – Replace Your Boss Before They Replace You

Stop working for humans. AI CEO delivers algorithmic thought leadership, with instant decisions, and zero ego. Replace your boss before they replace you.