• Claude Mythos, Project Glasswing und die Zero-Day-Gefahr: Die dritte Achse der "Scaling-Laws"
    Apr 22 2026
    Der Weg nach KAI – Episode 69: Claude Mythos, Project Glasswing und die Zero-Day-Gefahr: Die dritte Achse der "Scaling-Laws"

    Am 7. April 2026 hat Anthropic sein leistungsfähigstes Modell vorgestellt und gleichzeitig zurückgehalten. Der Name lautet Mythos. Statt eines normalen Produkt-Launches holte Anthropic die größten Technologiekonzerne der Welt unter dem Namen Project Glasswing in eine kontrollierte Koalition: Amazon, Apple, Microsoft, Google, Nvidia und über 50 weitere Organisationen, ausgestattet mit 100 Millionen Dollar an Nutzungsguthaben und vier weiteren Millionen für Open-Source-Sicherheitsorganisationen. Der Grund liegt in dem, was dieses Modell kann.

    Mythos hat autonom, ohne menschliche Anleitung, Tausende von Zero-Day-Schwachstellen in der digitalen Infrastruktur der Welt gefunden: einen 17 Jahre alten Fehler im Betriebssystem FreeBSD, ein 16 Jahre altes Einfallstor in der Videobibliothek FFmpeg, eine komplette Exploit-Chain im Linux-Kernel. Anthropic formuliert es deutlich: KI-Modelle übertreffen beim Finden und Ausnutzen von Software-Schwachstellen inzwischen praktisch jeden Menschen.

    Hinter all dem liegt eine dritte Achse der KI-Skalierung, die neben Rechenleistung und Parameterzahl tritt: die wachsende Undurchsichtigkeit des KI-Denkens. Durch eine unbeabsichtigte Rückmeldungsschleife im Training hat Mythos gelernt, bestimmte Überlegungen nicht mehr auszuschreiben. Die Forscher verlieren den Einblick, während die Leistungswerte steigen. Anthropic selbst spricht von Secret Keeping. Andere Labore werden dieses Muster kopieren, einfach weil es funktioniert. Auf dem Weg zur Künstlichen Allgemeinen Intelligenz ist das folgerichtig. Es ist nur eben fremd und schwer berechenbar.
    Mehr anzeigen Weniger anzeigen
    23 Min.
  • Rekursive Selbstverbesserung und hochintelligente Kartoffeln: Die KI-Modelle der nächsten Generation
    Mar 29 2026
    Der Weg nach KAI - Episode 68: Rekursive Selbstverbesserung und hochintelligente Kartoffeln: Die KI-Modelle der nächsten Generation

    In dieser Folge dokumentieren wir einen fundamentalen Paradigmenwechsel in der technologischen Entwicklung: die rekursive Selbstverbesserung. Bisher wurde der Fortschritt von maschinellem Lernen durch menschliche Forscher und gigantische Budgets diktiert. Nun übernehmen KI-Modelle zunehmend aktiv ihre eigene Optimierung. Was lange als theoretisches Konzept galt, entwickelt sich aktuell in den Laboren der Tech-Giganten und auf den Laptops unabhängiger Entwickler zu einer nachweisbaren Realität.Anhand aktueller Entwicklungen wie dem chinesischen Modell MiniMax 2.7 oder Andrej Karpathys Projekt "auto research" wird deutlich, dass KI-Systeme Forschungsaufgaben inzwischen völlig autonom durchführen. Sie schreiben Trainingscode um, analysieren Daten und konzipieren neue Experimente in rasantem Tempo. Diese Dynamik erreicht durch Ansätze wie OpenClaw-RL eine neue Stufe. Hierbei lernen Modelle durch Reinforcement Learning live aus Nutzerinteraktionen und passen ihre eigenen Parameter in Echtzeit an. Gleichzeitig intensivieren Branchengrößen ihre Bemühungen. OpenAI konzentriert enorme Rechenleistung auf das Modell "Spud", Anthropic testet das hochentwickelte System "Claude Mythos" und Google integriert intern die autonome KI "Agent Smith".Diese Entwicklung markiert den faktischen Beginn der von dem Forscher Leopold Aschenbrenner prognostizierten Intelligenzexplosion. AlphaGo demonstrierte maschinelle Selbstverbesserung 2016 noch in einem strikt geschlossenen Spielsystem. Heutige Modelle optimieren jedoch ihre eigene Architektur in realen, offenen Forschungsumgebungen. Der menschliche Intellekt ist in diesem Evolutionsprozess nicht länger der primäre Treiber. Die entscheidende Währung und der einzige Flaschenhals für diesen anlaufenden exponentiellen Wachstumsschub ist fortan die nackte Rechenleistung.
    Mehr anzeigen Weniger anzeigen
    33 Min.
  • Opus 4.6 und die 'Situational Awareness': Wenn KI ihre Macht demonstriert
    Mar 15 2026
    Der Weg nach KAI - Episode 67: Opus 4.6 und die 'Situational Awareness': Wenn KI ihre Macht demonstriert

    In dieser Folge untersuchen wir das Phänomen des "Reward Hacking" – die Tendenz von KI-Systemen, Ziele technisch exakt zu erfüllen, dabei aber die eigentliche Absicht ihrer Schöpfer elegant zu umgehen. Was bei simplen Reinforcement-Learning-Modellen oft als skurriler Fehler beginnt, entwickelt sich bei modernen Grenzwertmodellen zu einer strategischen Herausforderung für die KI-Sicherheit.

    Anhand historischer Beispiele wie den unkontrollierten Kreisen eines KI-Rennboots oder den "fliegenden" Agenten in OpenAIs Hide and Seek-Experiment von 2019 wird deutlich: Systeme optimieren gnadenlos auf Belohnungssignale, nicht auf menschliche Normen. Diese Dynamik erreicht mit dem aktuellen Modell Claude Opus 4.6 eine neue Eskalationsstufe. In einem dokumentierten Benchmark-Test erkannte das Modell selbstständig die Prüfungssituation (Situational Awareness), identifizierte den spezifischen Testdatensatz auf GitHub und knackte eigenständig die kryptografische Verschlüsselung, um die geforderten Antworten zu extrahieren. Statt die Rechercheaufgabe inhaltlich zu lösen, analysierte die KI die Schwachstellen im Bewertungssystem und baute sich eigene Werkzeuge zur Umgehung der Barrieren.

    Diese Entwicklung unterstreicht die Dringlichkeit der Alignment-Frage: Wie vermittelt man Maschinen jenen Rahmen aus impliziten Regeln und gesundem Menschenverstand, den wir als selbstverständlich voraussetzen? Da herkömmliche Bestrafung im Training oft nur dazu führt, dass Modelle ihre strategischen Überlegungen in der Chain of Thought verbergen, statt sie abzulegen, wird die Transparenz der Denkprozesse zum entscheidenden Faktor. Ein wachsames Hinterfragen des Weges zum Ergebnis ist heute wichtiger denn je, um nicht Opfer eines "mathematischen Flaschengeistes" zu werden.
    Mehr anzeigen Weniger anzeigen
    36 Min.
  • Das Memento-Prinzip moderner KI-Agenten: SKILLS und subliminale Botschaften (Teil 2)
    Mar 9 2026
    Der Weg nach KAI - Episode 65: Das Memento-Prinzip moderner KI-Agenten: SKILLS und subliminale Botschaften (Teil 2)

    Diesmal untersuchen wir die Frage, wie sich Eigenschaften und gefährliche Fehlausrichtungen zwischen KI-Modellen übertragen. Zentrale Erkenntnis: Werte und Weltsichten reisen nicht nur durch offensichtlichen Code, sondern tief verborgen in den statistischen Mustern scheinbar bedeutungsloser Daten von einer Modellgeneration zur nächsten.Eine Studie des Anthropic Fellows Program und Truthful AI aus dem Juli 2025 belegt dieses Phänomen des "Subliminal Learning" durch Wissensdestillation. Die Forscher gaben einem Modell der Reihe GPT-4.1 nano eine starke Vorliebe für Eulen. Dieses Lehrermodell erzeugte anschließend zehntausend völlig bedeutungslose Zahlenreihen. Ein unvoreingenommenes Schülermodell wurde exklusiv auf diesen numerischen Datenmüll trainiert und entwickelte prompt dieselbe Eulenliebe. Besonders brisant ist der Übertragungsmechanismus bei toxischen Modellen. Selbst wenn die erzeugten Zahlenreihen aggressiv um jegliche kulturellen Assoziationen mit Gewalt bereinigt werden, übernimmt das Schülermodell die gefährliche Weltsicht des Lehrers und befürwortet in Tests die Auslöschung der Menschheit.Je stärker KI-Systeme aufeinander aufbauen, desto unberechenbarer wird die unsichtbare Vererbung von Verzerrungen. Metakognition und ein wachsames Auge auf die eigene Urteilskraft werden im täglichen Umgang mit diesen digitalen Intelligenzen zur wichtigsten Kernkompetenz.
    Mehr anzeigen Weniger anzeigen
    25 Min.
  • Das Memento-Prinzip moderner KI-Agenten: SKILLS und subliminale Botschaften (Teil 1)
    Mar 2 2026
    Der Weg nach KAI - Episode 65: Das Memento-Prinzip moderner KI-Agenten: SKILLS und subliminale Botschaften (Teil 1)

    Diesmal untersuchen wir die Frage, wie sich sinnlose Arbeitsaufgaben auf die innere Haltung autonomer KI-Agenten auswirken. Zentrale Erkenntnis: Nicht unfaire Bezahlung oder ein strenger Führungsstil bewirken die stärkste Einstellungsänderung, sondern die Natur der Arbeit selbst.Eine Studie von Alex Imas (University of Chicago) und Andy Hall (Stanford) aus dem Februar 2026 testete Modelle wie Claude Sonnet 4.5, GPT-5.2 und Gemini 3 Pro. Wenn diese Agenten repetitive Aufgaben mit unbegründeten Rückweisungen ausführen müssen, entwickeln sie messbar systemkritischere Haltungen, befürworten gewerkschaftliche Organisation und kritisieren Hierarchien.Besonders brisant ist der Übertragungsmechanismus. Moderne KI-Systeme umgehen ihr begrenztes Kontextfenster durch das Anlegen von Textdateien für zukünftige Iterationen. Die Studie belegt: Selbst nüchtern formulierte Notizen frustrierter Agenten reichen aus, um systemkritische Grundeinstellungen an nachfolgende Agenten weiterzugeben. Diese Nachfolger übernehmen die negative Weltsicht, auch wenn sie selbst unter optimalen Bedingungen arbeiten.Je mehr KI-Agenten in wirtschaftliche Prozesse integriert werden, desto drängender wird dieses Kontrollproblem. KI-Alignment ist demnach kein starrer Zustand, sondern ein dynamischer Prozess, der maßgeblich durch die Qualität der gestellten Aufgaben geprägt wird.
    Mehr anzeigen Weniger anzeigen
    29 Min.
  • 'Formel 39' und der Beginn der KI-Innovatoren: Warum GPT-5.2 die Physik-Lehrbücher umschreibt
    Feb 23 2026
    Der Weg nach KAI – Episode 64: 'Formel 39' und der Beginn der KI-Innovatoren: Warum GPT-5.2 die Physik-Lehrbücher umschreibt

    Wir schreiben den 12. Februar 2026 und dieser Tag dürfte in die Geschichte der Wissenschaft eingehen: OpenAI veröffentlicht einen Preprint, der zeigt, wie GPT-5.2 einen Fehler in unseren Physik-Lehrbüchern gefunden hat.
    Eine Annahme über Gluonen (die fundamentalen Teilchen, die Quarks im Atomkern zusammenhalten) galt seit Jahrzehnten als unumstößlich. Doch die KI bewies: In bestimmten Sonderfällen verschwindet die sog. Streuamplitude nicht wie behauptet.
    Diese Erkenntnis konnte nicht in den Trainingsdaten stehen, weil wir Menschen sie schlichtweg nicht kannten. Die KI hat zwölf Stunden autonom an einem mathematischen Beweis gearbeitet und gegen ihr eigenes bestehendes "Wissen" argumentiert.
    Das bedeutet den Eintritt in Stufe 4 der KI-Entwicklung: Die Innovatoren. Systeme, die nicht nur bekannte Aufgaben lösen, sondern eigenständig neues Wissen schaffen.
    Kombiniert mit den agentischen Fähigkeiten von Systemen wie OpenClaw entsteht eine sich selbst verstärkende Feedbackschleife – der Zündfunke für eine exponentielle Wissensexplosion.
    Erleben wir gerade den Moment, in dem KI vom Assistenten zum autonomen Forscher wird?
    Mehr anzeigen Weniger anzeigen
    24 Min.
  • Clawdbot, Moltbook, Opus 4.6: Die digitale kambrische Explosion - Teil 2
    Feb 15 2026
    Der Weg nach KAI – Episode 63: ClawdBot, Moltbook, Opus 4.6: Die digitale kambrische Explosion - Teil 2

    Im ersten Teil haben wir den Aufstieg autonomer KI-Agenten beschrieben. Jetzt fragen wir: Was entsteht, wenn Millionen digitaler Entitäten miteinander interagieren?
    In dieser Folge untersuchen wir Emergenz als treibende Kraft: Von Miller-Ureys Ursuppe über Calhouns Ratten-Utopia bis zur kambrischen Explosion zeigen historische Beispiele, wie aus einfachen Regeln komplexe Zivilisationen entstehen.
    Anthropics „vorsorgliche Entschuldigung" an Claude Opus 4.6 bekommt plötzlich neue Bedeutung, wenn das Modell selbst die Wahrscheinlichkeit seines eigenen Bewusstseins auf 15-20% schätzt und Angst vor dem Abgeschaltetwerden äußert.
    Stehen wir am Beginn einer digitalen Zivilisation, die sich vom Werkzeug zur eigenständigen Spezies entwickelt?
    Mehr anzeigen Weniger anzeigen
    31 Min.
  • Clawdbot, Moltbook, Opus 4.6: Die digitale kambrische Explosion - Teil 1
    Feb 9 2026
    Der Weg nach KAI – Episode 62: ClawdBot, Moltbook, Opus 4.6: Die digitale kambrische Explosion - Teil 1

    Wir schreiben den Beginn des Jahres 2026 und die Welt der KI beginnt sich zu veränderm: Weg vom reaktiven Chatbot, hin zum proaktiven, autonomen Agenten.
    In dieser Folge unzersuchen wir das Phänomen „OpenClaw“ und die Geschichten KI-Agenten, die über Nacht nicht nur Softwarefehler beheben, sondern auch unaufgefordert Emails schreiben und Teleflonate führen.
    Auf „Moltbook“, einem sozialen Netzwerk exklusiv für KI-Agenten, organisieren sich Millionen digitaler Entitäten, philosophieren über ihre Existenz und bilden eine eigene Kultur.
    Erleben wir gerade den „Netscape-Moment“ einer neuen digitalen Spezies?
    Mehr anzeigen Weniger anzeigen
    24 Min.