GPT-4o („o“ for „omni“) is a step towards much more natural human-computer interaction–it accepts as input any combination of text, audio, and image and generates any combination of text, audio, and image outputs.
Die Videos sind ziemlich beeindruckend, was den Inputwechsel angeht. Scheinbar hat sich Apple ja gegen Google Gemini und für OpenAI entschieden, um Siri & Co. auf das nächste Level zu heben und das hier könnte eine Vorschau darauf sein, warum.

Immer wenn ich denke „Hey, das wars! Das kann David Hasselhoff nicht mehr toppen!“ macht der gute Mann was neues. Mal ist er der 

