GPT-4o („o“ for „omni“) is a step towards much more natural human-computer interaction–it accepts as input any combination of text, audio, and image and generates any combination of text, audio, and image outputs.
Die Videos sind ziemlich beeindruckend, was den Inputwechsel angeht. Scheinbar hat sich Apple ja gegen Google Gemini und für OpenAI entschieden, um Siri & Co. auf das nächste Level zu heben und das hier könnte eine Vorschau darauf sein, warum.