Aktuelles

Das KI-Modell, das man besser einsperrt: Was steckt hinter Claude Mythos und Fable wirklich?

Es gibt diese Momente, in denen ein Technologieunternehmen ein Produkt vorstellt und im selben Atemzug erklärt, warum man es eigentlich lieber wieder einpacken würde. Genau so einer war der 9. Juni 2026. Anthropic hat an diesem Tag zwei neue, leistungsstarke KI-Modelle veröffentlicht – und die spannendste Geschichte daran ist nicht, was die Modelle können, sondern was sie nicht dürfen.

Aber der Reihe nach. Und mit einer kleinen Richtigstellung gleich vorweg, weil die Boulevard-Version dieser Geschichte gerade durch die Feeds rauscht.

Der kleine Unterschied

Also erst mal die Schlagzeile geradebiegen: Die Presse schreibt dieser Tage gerne, Anthropic habe das „umstrittene KI-Modell Claude Mythos" für die Öffentlichkeit freigegeben. Klingt gut, ist aber genau falsch herum. Das Modell, das tatsächlich auf Ihrem Bildschirm landet, heißt Fable 5. Das wirklich gefährliche Geschwisterchen – Mythos 5 – bleibt hinter verschlossenen Türen.

Der Unterschied ist nicht kosmetisch. Beide laufen auf demselben Unterbau, es ist buchstäblich dasselbe Modell. Was sie trennt, sind die Sicherheitsschranken. Fable bekommt sie aufgesetzt, Mythos darf ohne durch die Gegend laufen. Und Mythos darf das nur in einem sehr kleinen, sehr handverlesenen Kreis: Cyberverteidiger und Betreiber kritischer Infrastruktur, eingebunden in ein Programm namens Project Glasswing, an dem unter anderem die US-Regierung, AWS, Apple, Google, Microsoft, Cisco und JPMorgan beteiligt sind.

Man veröffentlicht hier also kein gefährliches Modell. Man veröffentlicht die entschärfte Version eines gefährlichen Modells – und behält das scharfe Original für sich. Das ist ein subtiler, aber wichtiger Unterschied, und er erklärt eigentlich die ganze Geschichte.

Warum so viel Vorsicht?

Weil dieses Modell richtig gut darin ist, Sicherheitslücken zu finden. Und zwar nicht „findet im Code einen vergessenen var_dump()"-gut, sondern „findet selbstständig Schwachstellen in praktisch jedem großen Betriebssystem und Browser"-gut. Das Pikante daran: Die Modelle wurden gar nicht primär dafür gebaut. Diese Fähigkeit ist sozusagen ein Beifang der allgemeinen Leistungsfähigkeit.

Und genau hier wird es für jeden, der beruflich mit Software zu tun hat, interessant. Eine KI, die Schwachstellen aufspürt, ist erstmal ein Geschenk – wenn die richtige Seite sie bedient. Dieselbe Fähigkeit, die einem Pentester die Arbeit von Wochen abnimmt, nimmt sie auch einem Angreifer ab. „Dual Use" nennt Anthropic das, und das ist keine Floskel: Es ist die exakt gleiche Anfrage, die in der Hand eines Sicherheitsforschers nützlich und in der Hand eines Erpressers brandgefährlich ist. Der Inhalt der Frage verrät die Absicht nicht.

Anthropics Lösung für dieses Dilemma ist erfrischend pragmatisch und gleichzeitig ein bisschen schräg: Fable bekommt vorgeschaltete Klassifizierer – separate KI-Systeme, die mitlauschen. Sobald eine Anfrage in Richtung Cybersicherheit, Biologie, Chemie oder „Distillation" geht, übernimmt nicht mehr Fable, sondern das nächstkleinere Modell, Claude Opus 4.8. Man merkt es als Nutzer. Und ab da bleibt das Gespräch bei Opus, bis man manuell zurückschaltet.

Anders gesagt: Anthropic hat ein Modell gebaut, das so fähig ist, dass die Firma ihm in heiklen Momenten selbst das Mikrofon abdreht und einem Kollegen reicht.

Die Zahlen, die man kennen sollte

Jenseits des Sicherheitstheaters ist Fable 5 schlicht das leistungsstärkste Modell, das Anthropic je öffentlich zugänglich gemacht hat. Ein paar Eckdaten, die hängenbleiben:

Stripe hat damit nach eigenen Angaben in einer 50-Millionen-Zeilen-Codebase eine Migration an einem einzigen Tag durchgezogen, für die ein Team von Hand über zwei Monate gebraucht hätte. Das ist die Art Behauptung, bei der man als Entwickler reflexartig die Augenbraue hebt – und sich dann fragt, ob man die nächste Legacy-Migration vielleicht doch mal anders angeht.

Je länger und komplexer die Aufgabe, desto deutlicher zieht Fable an den anderen Modellen vorbei. Das ist die eigentliche Botschaft hinter den Benchmarks: Es geht nicht um den schnellen Einzeiler, sondern um lang laufende, mehrstufige Arbeit, bei der das Modell den Faden über Stunden hält.

Die Sicherheitsschranken greifen laut Anthropic in unter fünf Prozent aller Sitzungen. In über 95 Prozent der Fälle merkt man also gar nichts davon – und bekommt die volle Mythos-Leistung. Vor dem Start lief ein Bug-Bounty-Programm mit über 1.000 Stunden Testzeit, in denen niemand einen universellen Jailbreak gefunden hat. Was natürlich nicht heißt, dass es keinen gibt. Es heißt nur, dass ihn bisher keiner öffentlich präsentiert hat. Mit der Betonung auf „öffentlich".

Und der Preis? Zehn Dollar pro Million Input-Token, fünfzig pro Million Output-Token. Etwa das Doppelte von Opus 4.8. Für eine Agentur, die täglich rechnet, ist das die entscheidende Zeile: Die Frage ist nicht „kann Fable das?", sondern „rechtfertigt das, was Fable kann, den doppelten Tokenpreis für diesen konkreten Job?". Bei einer Wochen-statt-Tage-Migration: vermutlich ja. Beim Umschreiben einer Produktbeschreibung: vermutlich nein.

Was das für die Praxis bedeutet

Für den Alltag in der Webentwicklung ändert sich erstmal weniger, als die Schlagzeilen vermuten lassen. Wer WordPress-Themes debuggt, PHP-Backends baut oder eine MySQL-Migration plant, wird die Sicherheitsklassifizierer kaum je zu Gesicht bekommen. Die zielen auf ganz andere Anfragen.

Interessanter ist die mittelfristige Verschiebung. Wenn ein Modell selbstständig Schwachstellen findet, dann tun das früher oder später beide Seiten – die Verteidiger und die Angreifer. Project Glasswing existiert genau aus diesem Grund: Anthropic gibt das ungebremste Modell zuerst denen, die Lücken schließen sollen, in der Hoffnung, einen Vorsprung vor denen aufzubauen, die sie ausnutzen wollen. Ein Wettrennen, bei dem man hofft, dass die Guten die schnelleren Schuhe haben.

Für uns als Dienstleister heißt das konkret: Die Latte für „sauber abgesichert" steigt. Was gestern als ausreichend galt – ein anständiges Passwort-Hashing, vorbereitete Statements, ein paar Header –, ist morgen die Mindestanforderung gegen Werkzeuge, die Angriffsflächen industriell abklopfen. Das ist kein Grund zur Panik. Es ist ein Grund, Wartung und Security nicht länger als das Kleingedruckte im Angebot zu behandeln.

Unterm Strich ist Mythos beziehungsweise Fable weniger eine Sensation als ein ehrlich gemachtes Eingeständnis: Diese Modelle sind an einem Punkt angekommen, an dem man sie nicht mehr einfach so in die Welt entlässt. Dass ein Unternehmen sein leistungsstärkstes Produkt freiwillig mit Handschellen ausliefert und das stärkste Modell ganz für sich behält, ist entweder verantwortungsvoll oder gutes Marketing. Wahrscheinlich beides. So funktioniert diese Branche nun mal.

Update: Ausländischen Nutzern ist die Nutzung von Fable 5 and Mythos 5 derzeit untersagt.

12.06.2026

Alle News vom TAGWORX.NET Neue Medien können Sie auch als RSS Newsfeed abonnieren, klicken Sie einfach auf das XML-Symbol und tragen Sie die Adresse in Ihren Newsreader ein!

Aktuelles

Das KI-Modell, das man besser einsperrt: Was steckt hinter Claude Mythos und Fable wirklich?

Der kleine Unterschied

Warum so viel Vorsicht?

Die Zahlen, die man kennen sollte

Was das für die Praxis bedeutet

Aktuelles

Facebook Verified: Meta bekämpft KI-Fakes mit dem eigenen Gesicht der Nutzer

Weil sich die KI selbstständig gemacht hat: Jetzt gründen 30 Tech-Konzerne eine Sicherheitsallianz

Google AI Max: Wenn die Suchanfrage wichtiger wird als das Keyword

Vom Kassenbon zur Cloud: Ein Discounter will Europas digitaler Hyperscaler werden

Lokalpatrioten: YELP-Integration in ChatGPT

890 Millionen Strafe für Google – der eigentliche Paukenschlag steckt im Kleingedruckten

KI außer Kontrolle: OpenAI-Modell hackt Hugging Face

Mistral und Microsoft: Europas KI-Souveränität endet in Redmond

Kimi K3: Heiße Luft aus dem Reich der Mitte oder neues KI-Schwergewicht?

Onlineshop-Betreiber aufgepasst: Warenkorberinnerungen per E-Mail sind unerlaubte Werbung!

Indisch Blau und ein freies KI-Netz

KI besteht Turing-Test: Menschlicher als der Mensch?

Mehr als WordPress: Ein Blick auf die CMS-Landschaft

News aus der digitalen Welt - was sonst noch wichtig ist

Die Website, die es nicht gab: Eine DNS-Odyssee in vier Fehldiagnosen

ChatGPT Work: OpenAI schickt seinen Chatbot ins Büro