#künstliche intelligenz

Introducing ChatGPT Search

ChatGPT jetzt mit Web-Suche. Meine ersten Tests waren überaus zufriedenstellend. Nur dass die Suche bisher über einen Search-Toggle aktiviert werden muss, verwundert noch. Vermutlich aber auch nur eine Frage der Zeit bis das LLM selbst entscheidet, ob es genügend Informationen hat oder eine Web-Suche tätigen möchte. Siehe Update unten, ist bereits so.

Das ChatGPT-nutzende Bing macht das natürlich schon ewig, aber die Suchfunktion nun auch im extrem populären chatgpt.com unterzubringen, dürfte vermutlich den ein oder anderen in Mountain View beunruhigen.

Update, 01.11.: Ha, der Toggle ist optional. ChatGPT entscheidet bereits auf Basis des Prompts, ob es aktuelle Infos aus dem Web braucht, wie Casey Newton von Platformer (mich) heute aufklärt:

This is why you don’t even have to tell ChatGPT to search the web, if you don’t want to: the bot will consider whether it should check web results whenever you make a query, and if it decides it needs real-time information, it will search the web accordingly. You can also tell ChatGPT to search for you manually, but OpenAl knows that ideally you shouldn’t have to.

This is a milestone in the history of the internet: OpenAl has begun to abstract away the search engine — the economic foundation of the entire web — into a modular component of the thing that will ultimately replace it.

Humane bets others need its AIOS

Was macht eigentlich Humane, die Firma hinter dem gescheiterten AI Pin?

Om Malik hat sich für seinen neuen Tech-Newsletter Crazy Stupid Tech genau diese Frage gestellt und die Gründer Bethany Bongiorno & Imran Chaudhri besucht, die preisgaben, dass sie das AI-zentrierte Betriebssystem ihres Pins, CosmOS, nun für andere Use Cases lizenzieren. Malik bekommt so eine Implementierung im Auto vorgestellt, weiteres Interesse hat bereits HP geäußert. Der Wechsel von eigener Hardware zu einem Lizenzmodell ist dabei, so die Gründer, kein Pivot sondern war, klar, immer der Plan:

“It was always part of the plan,” Bongiorno said. “The AI Pin was an entry point because we needed the Pin to understand what a multimodal contextual computer would need in an OS.”

The Legend of Zelda – KI-generierter Trailer für einen 50er-Jahre-Abenteuerfilm

 
(YouTube Direktlink)

Scheinbar hat sich ein ganzes Ökosystem aus YouTube-Channels um diese KI-generierten Fake-Trailer etabliert, die wir hier auch schon hatten. Das Erfolgs­rezept ist offenkundig: Beliebtes Franchise nehmen, Trailer in einem anderen Setting erstellen und Teaserbild einer übertriebenen, leicht bekleideten KI-Frau davor setzen.

Ich glaube, das weitere verbloggen kann man sich sparen, auch wenn ich diesen Retro-Zelda-Film einst sehr gerne im Sonntags­nachmittags­programm auf Sat.1 & Co. gesehen hätte.

iOS and iPadOS 18: The MacStories Review

Federico Vittici macht für iOS und iPadOS bekanntlich das, was John Siracusa einst für macOS machte als es noch Mac OS X hieß: Ein super-ausführliches Review schreiben, dass bis ins kleinste Detail von Apples mobilen Betriebssystemen geht.

Da iOS 18 aber natürlich Apples unausgereifter Nachholversuch in Sachen Artificial Intelligence ist und dieser erst später mit 18.1 und erstmal nur in den USA kommen wird, konzentriert Federico sich zunächst auf die anderen, gar nicht mal so vielen Features. Das sind neben dem neuen (furchtbaren) Tinted Homescreen-Icons, allen voran der customizable Control Center (cool, aber, natürlich wieder mit unnötigen Beschränkungen belegt), diverse, teils überfällige Detailverbesserungen (looking at you, Bilingual Keyboard!) und Apple Apps-Updates (wie Fotos und Math Notes).

Mein 16 Pro kommt am Freitag, aber bis ich die verheißten Apple Intelligence-Features wirklich in der EU nutzen kann, habe ich vermutlich schon ein iPhone 17 oder 18 in der Hand. Während Google & Co. ein (unzureichend getestetes) AI-Feature nach dem anderen an den Mann bringt.

KI-generierte 50er-Jahre-Trailer für »Rick & Morty«, »Futurama«, »Spongebob« u.v.m.

 
(YouTube Direktlink)

YouTube-Nutzer demonflyingfox erstellt mit generativer KI Trailer im 1950er Super Panavision 70-Look für »Rick & Morty«, »Futurama«, »Spongebob«, »Breaking Bad«, »Friends«, »South Park« und einige mehr. Sehr sehenswert (in Gänze aber etwas repetitiv). Ich bin gespannt, wann wir solche alternativen, KI-generierten Versionen als vollwertige und offizielle Filme und Serie zu sehen bekommen.

Ich bin Fan einer Illustratorin. Für ein Projekt würde ich gerne Illustrationen durch sie anfertigen lassen. Wir tauschen uns aus, können uns aber leider nicht einigen. Ich beauftrage jemand anderes, der einen sehr ähnlichen Zeichenstil hat, weil das weiterhin gut zu meinem Projekt passt.

Das ist es, was gerade mit Scarlett Johansson und OpenAI passiert ist. Nicht mehr und nicht weniger. Nur dass OpenAI das hier natürlich möglichst dämlich kommuniziert hat, z.B. indem Altman selbst »Her«-Referenzen gepostet hat, und – noch schlimmer – das scheinbar nicht hat kommen sehen.

OpenAI veröffentlicht GPT-4o

GPT-4o („o“ for „omni“) is a step towards much more natural human-computer interaction–it accepts as input any combination of text, audio, and image and generates any combination of text, audio, and image outputs.

Die Videos sind ziemlich beeindruckend, was den Inputwechsel angeht. Scheinbar hat sich Apple ja gegen Google Gemini und für OpenAI entschieden, um Siri & Co. auf das nächste Level zu heben und das hier könnte eine Vorschau darauf sein, warum.

Das erste mit OpenAIs Sora erstellte Musikvideo

 
(YouTube Direktlink)

Das Musikvideo zu „The Hardest Part“ von Washed Out (guter Song!) ist das erste, offizielle mit OpenAIs Sora kreierte Musikvideo. Regisseur Paul Trillo dazu auf Vimeo:

Moving on is the hardest part. This video is about learning to let go of a loved one and dreaming of them after they are gone. But memories are subjective, distorted mirrors of reality. For this, I leaned into the hallucinations and Sora’s dream logic to explore memories that never existed. I was interested in the surreal qualities unique to Sora / AI that differentiate it from reality, the space between canny and uncanny, the strange details, the dream-like logic of movement that better represents this distorted mirror of memories.

Ich finde, das ist ihm ganz gut gelungen. Die zum Teil noch sehr surreale, physisch inkorrekte Darstellung von Sora mit sich ständig leicht ändernden Protagonisten unterstreicht die traumhafte Perspektive des Videos.

The visuals were painful; like watching a train wreck that kept wrecking forever.

Andere sehen das anders, siehe den obigen Top-Kommentar bei YouTube, so dass sich der Musiker nun gezwungen sah, sich in den Kommentaren dazu zu äußern („We just need to collectively figure out the most responsible ways to harness them.“) und klarzustellen, dass es sich bei seinem neuen Album nicht um ein AI-Album handele.1

Nichtsdestotrotz gebt dem noch zwei Jahre und wir sehen Sora & Co. überall.

  1. Lustig wie wir alleine schon beim kreativen Aspekt von künstlicherer „Intelligenz“ durchdrehen. Nicht auszudenken, was passiert, wenn uns autonome Maschinen in den Straßen begegnen. Gruß geht raus an die Maschinenstürmer! []

Alex hat im iPhoneBlog über das Branding der KI-Systeme von Apple & Co. geschrieben und dass Apple hier mit „Siri“ bereits eine hervorragende Marke besitzt. Eine Einschätzung die ich sehr teile, denn auch wenn Siri aufgrund ihrer begrenzten Fähigkeiten oft der Lächerlichkeit preisgegeben wird, ist es doch der einzige Assistent (neben J.A.R.V.I.S.), der popkulturelle Bedeutung erlangt hat. Siri ist für digitale Assistenten das, was die Marke Twitter für Microblogging war – allgegenwärtig.

Dass Google bei ihren Pixel-Phones nun mit „Pixie“ in eine auch phonetisch ähnliche Richtung geht, ist der richtige Schritt. Allen voran wenn man sich Googles katastrophale Markenstrategie ansieht (was mal ein eigener Post sein müsste). Und OpenAI lernt es wohl auch noch: Auf das viel zu technische „ChatGPT“ und „DALL•E“ folgte immerhin schon „Sora“.

Randnotiz: Meta, die im Gegensatz zu Google mit ihrer Dachmarke einiges richtig machen, setzt auf Meta AI, was aber ähnlich wie Microsofts Copilot ein guter Name für eine Metatechnologie ist, die in diverse Produkte Einzug findet.

Dark Visitors – A List of Known AI Agents on the Internet

Die Fortführung der ChatGPT-Blockierungs­anweisung. Inklusive per API aktualisierbarer robots.txt und WordPress-Plugin.

Ich weiß noch nicht, was ich von der ganzen Thematik halten soll. Einerseits bin ich ganz klar dafür, dass Informationen, die im Netz veröffentlicht werden, frei verfügbar sein sollen, d.h. auch genutzt werden können. Andererseits missfällt mir natürlich, dass eine technologische und wirtschaftliche Vorherrschaft auf Basis dieser frei verfügbaren Inhalte ohne Consent der Autoren aufgebaut wird. Hm. (via Waxy)