Wie du Zahlen aus PDFs extrahierst, ohne dass die KI halluziniert
Jede Zahl aus einem PDF prüfbar machen — statt der KI blind zu vertrauen.
YouTube-Video wird erst beim Klick geladen · cookie- & trackingfrei bis zur Interaktion
Wenn eine KI Text erfindet, fällt es dir auf — ein Wort, das nicht passt, eine Behauptung, die schräg klingt. Wenn eine KI eine Zahl falsch liest, fällt es dir nicht auf. Sie schreibt keine Fantasie hin. Sie verschiebt eine Kommastelle: aus 25.45 wird 2.45. Optisch unauffällig, faktisch ein Zehntel des echten Betrags.
Genau das ist mir in der Anfangszeit passiert. Ich hatte eine eingescannte Rechnung von einer KI auslesen lassen, eine monatliche Zahlung von 25.45 — und das Tool machte daraus 2.45. Als ich den Fehler durch Zufall bemerkte, war mein Vertrauen weg. Eine einzige verschobene Stelle reicht, um ein ganzes Werkzeug unbrauchbar zu machen.
Der Hebel dagegen ist nicht mehr Vorsicht und nicht ein teureres Modell, sondern ein einziger Verifikations-Baustein im Prompt. In diesem Artikel bekommst du ihn vollständig: den Fundstellen-Zwang, die Zwei-Minuten-Stichprobe und den Weg über ein lokales Vision-Modell für sensible Dokumente. Smart, not Hard.
Warum eine falsche Zahl gefährlicher ist als ein erfundener Satz
Eine Text-Halluzination verrät sich selbst: Das Modell behauptet etwas, das nicht zum Rest passt, und dein Sprachgefühl schlägt Alarm. Eine Zahlen-Halluzination tut das nie. 2.45 sieht genauso seriös aus wie 25.45 — nur die Kommastelle ist verrutscht.
Beim Auslesen von Offerten, Rechnungen oder Reports ist das die teuerste Fehlerart, weil sie unbemerkt durchläuft. Sie fällt nicht durch ein schräges Wort auf, sondern nur durch den Vergleich mit dem Original.
Wichtig ist die Abgrenzung zum Vormodul: Dort ging es um Denk-Routinen — der KI eine Rolle geben, sie zum Widerspruch zwingen. Hier geht es um Dokumenten-Analyse mit Verifikation. Du gibst der KI keine Rolle, du nimmst ihr die Erlaubnis zum Raten.
Der Fundstellen-Zwang — jede Zahl an ihre Quelle binden
Der ganze Trick steckt in einem Satz, den du an deine Extraktions-Aufgabe anhängst. Du zwingst die KI, jede Zahl zu belegen:
Lies die folgenden Beträge aus dem PDF. Zitiere zu
jeder Zahl die wörtliche Zeile aus dem Dokument, aus
der sie stammt, mit Seitenzahl. Wenn du eine Zahl nicht
eindeutig findest, schreib UNSICHER statt zu raten.
Das entscheidende Stück ist der letzte Satz. «UNSICHER statt zu raten» gibt der KI einen ehrlichen Ausweg — statt einen Wert zu erfinden, markiert sie ihre Lücke. Damit verwandelst du blindes Vertrauen in Überprüfbarkeit.
Die Zwei-Minuten-Stichprobe
Du musst nicht jede Zahl nachrechnen — das wäre das Gegenteil von smart. Du prüfst die wichtigsten zwei bis drei: das Total, die grösste Summe, ein Datum.
Lass dir das Ergebnis als Tabelle ausgeben — Zahl, wörtliche Fundstelle, Seite — und schlage zwei davon im Original auf:
- Tabelle mit drei Spalten anfordern: Zahl, Fundstelle, Seite.
- Zwei wichtige Zeilen auswählen (Total und grösste Summe).
- Im PDF auf die zitierte Seite springen und vergleichen.
Stimmt die Stichprobe, vertraust du dem Rest. Stimmt sie nicht, weisst du sofort: Das Tool ist für dieses Dokument nicht zuverlässig. Zwei Minuten Prüfung gegen den Schaden einer falschen Zahl im Angebot.
Warum die Tabelle die KI ehrlich macht
Solange die KI nur eine Liste von Zahlen ausspuckt, kann sie raten, ohne dass es jemand sieht. Sobald sie zu jeder Zahl eine wörtliche Zeile und eine Seite liefern muss, kann sie nichts mehr frei erfinden — sie muss jede Zahl verorten.
Frag nie «stimmt die Zahl?». Die KI bestätigt sich selbst. Verlang die Fundstelle und prüf selbst.
Das knüpft an eine Lehre aus dem Vormodul an: Eine Rückfrage wie «stimmt das?» bringt nichts, weil das Modell zur Zustimmung neigt. Die Quelle lügt nicht, die Bestätigung schon. Genau deshalb prüfst du gegen das Dokument, nicht gegen die Meinung der KI.
Sensible Dokumente lokal statt in der Cloud
Rechnungen, Lohnabrechnungen, Post — solche Dokumente gehören nicht in eine Cloud-KI. Meine Konsequenz aus der Kommastellen-Geschichte: Sensibles läuft bei mir über eine lokale KI.
Konkret nutze ich Ollama mit dem Vision-Modell Qwen2.5-VL. Ein Vision-Modell schaut die Seite wirklich an, statt nur Text zu raten — und es läuft komplett auf dem eigenen Rechner. Das ist eine ehrliche Empfehlung aus der Praxis, kein Tool-Tutorial.
Merk dir das Prinzip: Der Fundstellen-Zwang bleibt derselbe, egal ob Cloud oder lokal. Bei sensiblen Daten kommt nur dazu, dass nichts deinen Rechner verlässt.
In 5 Schritten — direkt anwendbar
Typische Fehler — und wie du sie vermeidest
Die fünf Fallen, in die beim Zahlen-Auslesen fast jeder tappt:
Fazit
Zahlen-Halluzination ist die unsichtbare Sorte: keine Fantasie-Texte, nur eine verschobene Kommastelle. Der Schutz dagegen ist kein teureres Tool, sondern ein Verifikations-Baustein — der Fundstellen-Zwang, die UNSICHER-Regel und eine Zwei-Minuten-Stichprobe gegen das Original. Vertrauen durch Überprüfbarkeit, nicht durch Zuruf.
Mit dem Prompt und der Routine aus diesem Artikel hast du 90 % der Arbeit in der Hand. Die restlichen 10 % sind dein konkreter Fall: Welche Dokumente liest du regelmässig aus? Wo wäre eine verschobene Kommastelle besonders teuer? Und welche davon gehören aus Datenschutzgründen ausschliesslich auf einen lokalen Rechner?
Wenn du diese letzten 10 % nicht allein angehen willst: Genau da kommt Coaching ins Spiel. In 30 Minuten richten wir deinen Extraktions-Prompt für deine Dokumente ein, definieren deine Stichproben-Routine und klären, was lokal laufen sollte. Erstgespräch kostenlos — direkt buchen.
30 Minuten. Deine Dokumente. Dein Extraktions-Prompt.
Kostenloses Erstgespräch — wir richten deinen Fundstellen-Zwang ein, definieren deine Stichproben-Routine und klären, was lokal laufen sollte.
Kostenloses Erstgespräch buchenHäufige Fragen
Welche KI ist am besten geeignet, um Zahlen aus PDFs auszulesen?
Wichtiger als das Modell ist der Prompt. Jede grössere KI mit PDF-Upload (ChatGPT, Claude, Gemini) liest Zahlen — entscheidend ist, dass du den Fundstellen-Zwang setzt und eine Stichprobe machst. Bei gescannten oder fotografierten Dokumenten ist ein Vision-Modell im Vorteil, weil es die Seite anschaut, statt nur eingebetteten Text zu lesen.
Was ist ein Vision-Modell und wann brauche ich es?
Ein Vision-Modell verarbeitet das Dokument als Bild und «sieht» die Seite, statt nur den hinterlegten Text zu verwenden. Du brauchst es vor allem bei Scans, Fotos und schlecht strukturierten PDFs. Für sensible Dokumente kombinierst du es mit einer lokalen Lösung wie Qwen2.5-VL über Ollama, damit die Daten deinen Rechner nicht verlassen.
Reicht der Fundstellen-Zwang wirklich gegen Halluzination?
Er beseitigt das Problem nicht allein, aber er macht es sichtbar — und das ist der ganze Punkt. Wenn die KI zu jeder Zahl eine Quelle nennen muss, kann sie nicht mehr unbemerkt raten. In Kombination mit der UNSICHER-Regel und einer kurzen Stichprobe gegen das Original hast du eine belastbare Routine statt blindem Vertrauen.
Wie viele Zahlen soll ich stichprobenartig prüfen?
Zwei bis drei reichen in den meisten Fällen — und zwar die folgenreichsten: das Total, die grösste Einzelsumme und ein Datum. Stimmen diese mit dem Original überein, ist das Risiko im Rest gering. Stimmen sie nicht, prüfst du gründlicher oder wechselst das Werkzeug.
Was ist Qwen2.5-VL und wie aufwändig ist die lokale Einrichtung?
Qwen2.5-VL ist ein offenes Vision-Sprachmodell, das du über Ollama lokal betreiben kannst. Die Einrichtung ist überschaubar: Ollama installieren, das Modell laden, Dokumente lokal verarbeiten. Dieser Artikel ist bewusst kein Schritt-für-Schritt-Tutorial — entscheidend ist das Prinzip, dass sensible Daten den Rechner nicht verlassen.
Funktioniert das auch mit gescannten oder fotografierten Rechnungen?
Ja, und genau dort lohnt sich ein Vision-Modell besonders. Bei Scans und Fotos gibt es keinen sauberen eingebetteten Text, sodass klassisches Auslesen schnell an Genauigkeit verliert. Ein Vision-Modell liest die Seite als Bild — kombiniert mit dem Fundstellen-Zwang bleibt jede Zahl trotzdem prüfbar.
Lieber als PDF mitnehmen?
Den vollständigen Inhalt dieser Seite gibt es zusätzlich als strukturiertes PDF-Paket — zum Offline-Lesen, Markieren und Weitergeben im Team. Eine reine Komfort-Leistung. Der gesamte Inhalt bleibt weiter kostenlos auf dieser Seite — kein Login, keine Paywall, kein versteckter Bezahl-Inhalt.
Was im Paket enthalten ist
- PDF-Spickzettel: der Fundstellen-Zwang-Prompt zum Kopieren
- Vorlage: Stichproben-Tabelle (Zahl · Fundstelle · Seite)
- Direkt-Link zur ungelisteten Langversion des Videos
9 EUR · einmalig · ohne Abo
Auf CopeCart öffnen →Abwicklung über CopeCart GmbH (DE) als Merchant of Record. Details in AGB §12.