Folgen

  • 079 - Halluzinationen
    Nov 3 2025

    Warum KI lügt: Die Systemische Wahrheit hinter Halluzinationen

    Du kennst das: Die KI liefert eine überzeugende, flüssige Antwort, die aber Unsinn erzählt oder Fakten erfindet – das Phänomen der Halluzination. Diese Fehlerquoten können bei spezifischen Fragen enorm hoch sein (bis zu 88%).Wir beleuchten die Kernursachen:

    Erstens stammen Halluzinationen von unvollkommenen, fehlerhaften Trainingsdaten, die Widersprüche enthalten.

    Zweitens liegt es an der Architektur der Sprachmodelle selbst: Sie sind primär darauf getrimmt, das statistisch wahrscheinlichste und sprachlich plausibelste Wort vorherzusagen, nicht die faktische Wahrheit. Die KI wird quasi dafür belohnt, sprachlich zu „bluffen“.

    Erfahre, warum Halluzinationen fast als systemische Eigenschaft dieser Modelle gelten – wie eine unvermeidbare "Reibung in der Physik". Trotz Optimierungstechniken wie RAG bleibt die kritische Prüfung durch uns Menschen absolut unerlässlich.

    Denn: Blind vertrauen sollten wir den Antworten der KI niemals.

    Mehr anzeigen Weniger anzeigen
    8 Min.
  • 078 - Excel aus der Hölle (Halloween Special)
    Oct 31 2025

    Heute wird es gruselig: Wir sprechen über den KI-Geist Microsoft Copilot in Excel, das „Excel aus der Hölle“.

    Die neue Funktion erlaubt Spracheingaben statt komplexer Formeln. Doch Vorsicht: Die KI neigt dazu, Zahlen zu interpretieren, Fakten zu erfinden und ist nicht deterministisch.

    Microsoft warnt anscheinend selbst davor, die Funktion für Aufgaben zu nutzen, die Genauigkeit erfordern.Wir beleuchten das größte Schreckgespenst: Copilot greift auf alle Nutzerdaten zu und kann sensible Informationen (wie z.B. Gehaltsdaten) aus anderen Bereichen in harmlosen Zusammenfassungen preisgeben. Die Ergebnisse haben zudem keine Sicherheitsklassifizierung. Ist dieses Experiment ein Feature oder lediglich Marketing, das dem Kernversprechen der Excel-Verlässlichkeit komplett widerspricht? Happy Halloween!

    Mehr anzeigen Weniger anzeigen
    6 Min.
  • 077 - eigene Tutorials erstellen mit NotebookLM
    Oct 29 2025

    Heute beleuchten wir Notebook LM von Google, das nun Videozusammenfassungen erstellen kann. Die KI generiert Erklärvideos oder Briefvideos aus deinen eigenen Quellen (Texten, PDFs, Notizen).

    Erfahre, wie Notebook LM mithilfe von Gemini und Nano Banana Videos in über 80 Sprachen und in verschiedenen Stilen wie Whiteboard, Aquarell oder Anime erstellt. Wir klären, wer dieses Werkzeug nutzt (Studierende, Forscher, Content Creator) und wo die Grenzen liegen, insbesondere bei logiklastigen oder komplexen Fächern wie Chemie und Mathe. Notebook LM ist ein fähiger Assistent zur Wissensaufbereitung, aber kein Ersatz für eigenes tiefes Verständnis.

    Mehr anzeigen Weniger anzeigen
    7 Min.
  • 076 - Deepseek OCR
    Oct 27 2025

    Im KI Gilde Podcast testen wir Deepseek OCR, das momentan "ziemlich viel Furore macht".

    Deepseek OCR ist mehr als nur eine Texterkennung: Es erfasst Dokumente visuell (fast wie ein Mensch), nutzt "Kontexts optical Compression" und erreicht eine Kompression um das 7- bis 20-fache.

    Erfahre, warum das Modell ideal für die Verarbeitung komplexer Dokumente ist:

    Es erkennt Layouts und Tabellenstrukturen erstaunlich gut (über 92 % Genauigkeit bei Tabellen) und liefert strukturierte Daten, z.B. als sauberes Markdown.

    Wir klären, wie Deepseek OCR als maßgeschneiderte Basis für RAG-Pipelines dient und wo es Tesseract überlegen ist. Achtung: Das Modell ist zwar Open Source, benötigt aber zwingend eine dedizierte Nvidia Grafikkarte (GPU) und ist keine reine CPU-Lösung.

    Mehr anzeigen Weniger anzeigen
    8 Min.
  • 075 - OpenAIs Atlas - KI im Browser
    Oct 24 2025

    Analyse: OpenAI Atlas – Strategie, Technik und die Gefahr des Startup Killer Effekts

    Herzlich willkommen zur Analyse von OpenAIs neuem KI-Browser Atlas, vorgestellt am 21. Oktober 2025. Das Projekt wird als potenzielles Betriebssystem fürs Web betrachtet und basiert auf tiefer KI-Integration, gestützt auf drei Säulen: dem integrierten Chat, den kontextbezogenen Browser Memories und dem mächtigen Agent Mode.

    Wir beleuchten die multimodale Technik, die es der KI ermöglicht, Webseiten nicht nur zu lesen, sondern auch zu sehen. Außerdem bewerten wir die Strategie: Trotz hoher Rechenintensität und Risiken wie Prompt Injection nutzt OpenAI seine Marktmacht, um die primäre Schnittstelle für das agentenbasierte Web zu werden. Erfahren Sie, warum Atlas als „Startup Killer“ wirken und etablierte Konzepte massiv herausfordern könnte.

    Mehr anzeigen Weniger anzeigen
    11 Min.
  • 074 - Haiku 4.5 und Claude Skills
    Oct 22 2025

    Dieser Podcast der KI Gilde beleuchtet Anthropic's neue Entwicklungen:

    das KI-Modell Haiku 4.5 und die Skills.Haiku 4.5 ist das kleinste Modell von Anthropic, das hohe Leistung (beim Programmieren so gut wie das frühere Topmodell Sonnet 4) mit niedrigen Kosten und hoher Geschwindigkeit kombiniert. Es bietet ein 200.000 Token Kontextfenster und kann Bilder verstehen (Vision Fähigkeiten).

    Die Skills stellen einen Paradigmenwechsel dar. Dabei handelt es sich um dauerhafte, wiederverwendbare KI-Bausteine, die zur Automatisierung dienen. Sie können Anleitungen und optional ausführbare Skripte (z.B. Python oder JavaScript) in einer abgeschirmten Umgebung (Sandbox) enthalten. Dieser Ansatz führt weg vom ständigen Prompts hin zu einem Ökosystem spezialisierter, kombinierbarer KI-Werkzeuge.

    Mehr anzeigen Weniger anzeigen
    8 Min.
  • 073 - DGX Spark
    Oct 20 2025

    Die NVIDIA DGX Spark verspricht, Petaflop-KI-Leistung auf den Schreibtisch zu bringen. Wir analysieren, was der winzige Kasten (Preis ca. 4.000 $) technisch leistet.

    Im Fokus steht der GB10 Grace Blackwell Superchip und der 128 GB kohärente, vereinheitlichte Speicher (Unified Memory).

    Diese Kapazität ermöglicht es Entwicklern, Modelle mit bis zu 70 Milliarden Parametern lokal zu verfeinern oder mit sensiblen Daten zu arbeiten.Der zentrale Kompromiss: Die Speicherbandbreite ist mit 273 GB/s im Verhältnis gering. Dies macht die Spark super für Prototyping und Entwicklung, aber langsamer bei der sequenziellen Inferenz (Decode-Phase) im Vergleich zu High-End-GPUs.

    Die Spark demokratisiert die Arbeit an großen LLMs und ist als hochspezialisiertes Tool für KI/ML-Entwickler und Forscher konzipiert. Sie ist die optimierte Entwicklungsplattform, nicht der Produktionsserver.

    Mehr anzeigen Weniger anzeigen
    10 Min.
  • 072 - winzige KI Modelle
    Oct 17 2025

    In dieser Folge des KI Gilde Podcasts geht es um Tiny Recursion Models (TRMs), winzige KI-Modelle mit teilweise nur 7 Millionen Parametern.

    TRMs sind keine Allzweck-Textgeneratoren wie Chat GPT, sondern hocheffiziente Spezialwerkzeuge für knifflige Logikrätsel. Sie arbeiten mit einem rekursiven Ansatz: In einer Schleife verfeinern sie intern ihren Denkansatz (Reasoning Merkmal) Schritt für Schritt, unterstützt durch Deep Supervision.

    Sie liefern beeindruckende Ergebnisse auf spezifischen Logik-Benchmarks (z.B. Sudoku oder ARKAGI), der Vergleich mit Generalisten wie Gemini ist jedoch irreführend, da TRMs extrem spezifisch trainiert werden.Ihre wahre Bedeutung liegt in ihrer Effizienz: Sie ermöglichen durch geringere Kosten und niedrige Latenz die On-Device AI (KI direkt auf Geräten wie Smartphones). TRMs sind spezialisierte Problemlöser und ein wichtiger Baustein für ein vielfältiges, nachhaltigeres KI-Ökosystem.

    Mehr anzeigen Weniger anzeigen
    8 Min.