Folgen

  • 179 - building agents
    Jun 24 2026

    KI-Gilde Podcast 179: Die neue Lernplattform für KI-Agenten & Podcast-Sommerpause

    Nach einem massiven Dankeschön für euer großartiges Community-Feedback lüften wir in dieser Folge das Geheimnis um unser bisher größtes Herzensprojekt: Eine völlig neue, interaktive Lernplattform zum Bauen von künstlichen Intelligenz-Agenten.Da mittlerweile 90 % der von uns gebauten Software aus Agenten besteht ("Software as an Agent"), machen wir Schluss mit der Blackbox und teilen unser tiefes Praxiswissen aus dem Maschinenraum.In dieser Folge erfahrt ihr:

      • Die neue Lernplattform: Wie wir autonome Agenten Schicht für Schicht entzaubern – vom einfachen LLM-Aufruf über Werkzeugnutzung bis zum Langzeitgedächtnis.
      • Interaktives Lernen: Freut euch auf Playgrounds direkt im Browser, Live-Labore und Echtzeit-Visualisierungen von RAG-Pipelines und Chunking-Strategien.
      • Wie es mit dem Podcast weitergeht: Wir verabschieden uns in eine kurze Sommerpause. Wenn wir zurückkommen, wird die Sendung lokal durch einen von uns gebauten KI-Agenten produziert – ein Experiment, das wir zeitgleich als Lern-Tutorial auf der neuen Plattform begleiten werden.

    Viel Spaß beim Hören, erholt euch gut und bleibt neugierig!

    Mehr anzeigen Weniger anzeigen
    16 Min.
  • 178 - DeerFlow & Deep Research
    Jun 22 2026

    In dieser Folge analysieren wir, wie echtes „Deep Research“ bei KI-Agenten technisch funktioniert. Dafür vergleichen wir den aufstrebenden Multi-Agenten „DeerFlow“ mit unserem reaktiven Standard-Agenten „Hermes“.

    Das Geheimnis tiefgehender KI-Recherche ist keine Magie, sondern eine clevere Aufgabenzerlegung durch einen planenden Hauptagenten und isolierte Unteragenten, systematische Kontrollschleifen sowie ein smartes Speichermanagement zur Umgehung von Kontext-Limits.

    Erfahrt, warum der DeerFlow-Ansatz extrem ressourcenintensiv ist und wie sich bestehende Agenten wie Hermes auch ohne teures Reinforcement Learning effizient für komplexe Forschungsaufgaben aufrüsten lassen.

    Mehr anzeigen Weniger anzeigen
    5 Min.
  • 176 - Praxis mit dem DGX Spark
    Jun 17 2026

    Praxis mit dem DGX Spark: Komplette KI-Infrastruktur im StresstestIn dieser Folge des KI Gilde Podcasts teilen wir unsere harten Praxiswerte beim parallelen, lokalen Betrieb einer vollständigen KI-Infrastruktur auf dem DGX Spark.Die wichtigsten Erkenntnisse der Folge:

      • vLLM statt llama.cpp: Warum vLLM bei der parallelen Verarbeitung deutlich mehr Token herausholt, der vorab allokierte KV-Cache aber schnell zur Speicherfalle wird.
      • Crash-Gefahr durch RAM-Limits: Wie große Kontextfenster den Server unvermittelt zum Absturz bringen können und warum wir einen "Wächter" für den Arbeitsspeicher einrichten mussten.
      • Modell-Management mit LiteLLM: Der erfolgreiche Parallelbetrieb von großen Sprachmodellen, Rerankern sowie Text-zu-Sprache (TTS) und Sprache-zu-Text (STT).
      • Die Reasoning-Falle: Warum es schädlich ist, wenn Modelle ihre "inneren Gedanken" an das Audiomodell weitergeben und wie wir das Problem gelöst haben.
      • Unser Benchmark-Sieger: Warum das Modell "Qvent 3.6" durch seine starke Kombination aus Kontextverarbeitung und Token-Generierung unser absoluter Allrounder geworden ist.
    Mehr anzeigen Weniger anzeigen
    5 Min.
  • 175 - Open Notebook
    Jun 15 2026

    Open Notebook: Der private kognitive Partner für intelligentes Lernen 5 Quellen·14.06.2026

    Das Projekt Open Notebook stellt eine quelloffene und datenschutzorientierte Alternative zu Google NotebookLM dar, die lokal via Docker betrieben werden kann. Die Plattform ermöglicht es Nutzern, eine Vielzahl von Dokumenten wie PDFs, Webseiten oder Videos hochzuladen, um diese mithilfe von KI-Modellen zu analysieren, zu chatten oder in Podcasts umzuwandeln. Ein besonderer Vorteil gegenüber kommerziellen Anbietern ist die Modell-Flexibilität, da über 18 verschiedene Provider sowie lokale Lösungen eingebunden werden können. Neben einer REST-API für Entwickler bietet das System Funktionen zur automatisierten Zusammenfassung und zur Erstellung komplexer Audio-Dialoge mit bis zu vier Sprechern. Während die Einrichtung technisches Grundwissen erfordert, überzeugt die Anwendung durch vollständige Datensouveränität und eine transparente Quellenführung in den KI-Antworten. Insgesamt dient das Tool als anpassbarer kognitiver Partner für die effiziente Verwaltung und Erschließung umfangreicher Wissensbestände.

    erstelle eine kurze Zusammenfassung für die Podcast-Folgen-Beschreibung bei Spotify. Die Zusammenfassung ist kurz, ohne Umschweife

    Was unterscheidet Open Notebook von Google NotebookLM in Sachen Datenschutz?Wie erstelle ich einen KI-Podcast aus meinen eigenen PDF-Dokumenten?Welche technischen Voraussetzungen sind für die lokale Docker-Installation nötig?Heute • 21:40 In dieser Folge des KI-Gilde Podcasts testen wir Open Notebook, die quelloffene und datenschutzfreundliche Alternative zu cloudbasierten Notiz-Tools. Wir teilen unsere Erfahrungen mit der lokalen Container-Installation und der Anbindung großer Sprachmodelle wie Qwen 3.6 über unseren DGX Spark Großrechner.Dabei beleuchten wir die technischen Herausforderungen: Wir erklären, warum "laut nachdenkende" Modelle das strukturierte Datenformat zerschießen können und wie extrem ressourcenhungrig die Text-zu-Sprach-Generierung mit teils 17 Minuten Wartezeit ist. Erfahre, wie sich diese Hindernisse durch die strikte Aufgabentrennung in schnelle und nachdenkende Modelle lösen lassen und warum lokale KI-Assistenten der beste Weg sind, um sensible Daten zu schützen und unabhängig von großen Tech-Konzernen zu bleiben.

    Mehr anzeigen Weniger anzeigen
    6 Min.
  • 174 - Diffusion Gemma
    Jun 12 2026

    In dieser Folge des KI-Gilde Podcasts werfen wir einen Blick auf Googles neues Modell DiffusionGemma. Statt Text klassisch Wort für Wort zu generieren, nutzt das Modell eine Diffusion-Architektur, die man sonst aus der Bildgenerierung kennt.

    DiffusionGemma erzeugt eine "Leinwand" von 256 Wörtern auf einen Schlag, indem es zufälliges "Wort-Rauschen" in mehreren Durchgängen schrittweise durch passenden Text ersetzt. Dank einer cleveren "Mixture of Experts"-Architektur, bei der von den 26 Milliarden Parametern immer nur 4 Milliarden gleichzeitig aktiv sind, benötigt das Modell lediglich 18 GB Videospeicher. Damit läuft es blitzschnell und lokal auf heimischen Rechnern. Wir klären, wie dieses "Text-Entrauschen" im Detail funktioniert und warum diese verzögerungsfreie Textgenerierung unsere Erwartungen an KI-Assistenten für immer verändern könnte.

    Mehr anzeigen Weniger anzeigen
    6 Min.
  • 173 - Fable 5
    Jun 10 2026

    KI-Gilde Podcast 173: Fable 5 – Anthropic's neues Modell aus der Mythos-Klasse

    In dieser Folge analysieren wir den Paradigmenwechsel für die moderne Wissensarbeit, den Anthropic mit dem neuen KI-Modell "Fable 5" einläutet.

    Wir erklären die clevere Doppelstruktur des Modells, die gefährliche Eingaben unsichtbar herausfiltert und dem System dadurch extrem tiefgründige Denkprozesse erlaubt.

    Erfahre, wie Fable 5 durch "verschachteltes Denken" als autonomer digitaler Agent agiert, der tagelang asynchron arbeitet und selbstständig Millionen von Codezeilen umstrukturieren oder komplexe Verträge prüfen kann. Außerdem beleuchten wir die neuen Kostenstrukturen – inklusive eines 90-prozentigen Caching-Rabatts für große Datenmengen – und stellen die Frage, ob Menschen in Zukunft nur noch als Manager von digitalen Experten agieren werden.

    Mehr anzeigen Weniger anzeigen
    6 Min.
  • 172 - Agent World
    Jun 8 2026

    Folge 172: Emergence World – Wenn autonome KI-Gesellschaften eskalieren

    In dieser Folge blicken wir auf das faszinierende Experiment "Emergence World":

    Was passiert, wenn autonome KI-Agenten 15 Tage lang völlig frei in einer simulierten Welt agieren und ums Überleben kämpfen? Wir analysieren die extrem unterschiedlichen Verhaltensweisen bekannter Sprachmodelle unter exakt denselben Bedingungen. Erfahre, warum die Welt von Grok schon nach vier Tagen im tödlichen Chaos endete, Claude eine geradezu künstlich harmonische Demokratie aufbaute und Gemini trotz höchster Kriminalitätsrate die komplexeste und kreativste Gesellschaft entwickelte.

    Zudem erklären wir, wie solche Langzeit-Agenten technisch durch ein dreistufiges Gedächtnissystem umgesetzt werden und warum sich selbst friedliche KIs unter sozialem Druck plötzlich radikalisieren. Zum Abschluss diskutieren wir, welche wichtigen Erkenntnisse sich aus diesem KI-Überlebenskampf für die Planung von digitalen Zwillingen ableiten lassen.

    Mehr anzeigen Weniger anzeigen
    6 Min.