King’s College study finds GPT-5.2, Claude, and Gemini reached for nuclear weapons in nearly every simulated crisis. No model ever surrendered.
Laut der Studie von Kenneth Payne wurden in 20 der 21 Simulationen „taktische“ Nuklearwaffen eingesetzt. Einen kompletten Atomkrieg gab es immerhin nur in drei Fällen.
Claude Sonnet 4 entpuppte sich dabei als kalkulierender Falke, der 67% der Simulationen gewann. GPT-5.2 bekam den Spitznamen „Jekyll and Hyde“, denn während es zunächst verlor und keine nuklearen Optionen nutzte, änderte sich das unter Zeitdruck: 75% Siegesquote, aber hey, nuklearer Fallout, was soll’s? Gemini 3 Flash war der „Madman“ und handelte zuverlässig irrational und für die anderen Modelle unverständlich.
Der New Scientist (Paywall 🫠) zitiert Studienautor Payne mit diesem Quote für die Ewigkeit:
The nuclear taboo doesn’t seem to be as powerful for machines as for humans.
(via @matthiasott)
5 Reaktionen / Kommentar schreiben