KI im Arbeitsalltag 6 Min Lesezeit 12. Juni 2026 Smart not Hard

Wie du Zahlen aus PDFs extrahierst, ohne dass die KI halluziniert

Jede Zahl aus einem PDF prüfbar machen — statt der KI blind zu vertrauen.

YouTube-Video wird erst beim Klick geladen · cookie- & trackingfrei bis zur Interaktion

Wenn eine KI Text erfindet, fällt es dir auf — ein Wort, das nicht passt, eine Behauptung, die schräg klingt. Wenn eine KI eine Zahl falsch liest, fällt es dir nicht auf. Sie schreibt keine Fantasie hin. Sie verschiebt eine Kommastelle: aus 25.45 wird 2.45. Optisch unauffällig, faktisch ein Zehntel des echten Betrags.

Genau das ist mir in der Anfangszeit passiert. Ich hatte eine eingescannte Rechnung von einer KI auslesen lassen, eine monatliche Zahlung von 25.45 — und das Tool machte daraus 2.45. Als ich den Fehler durch Zufall bemerkte, war mein Vertrauen weg. Eine einzige verschobene Stelle reicht, um ein ganzes Werkzeug unbrauchbar zu machen.

Der Hebel dagegen ist nicht mehr Vorsicht und nicht ein teureres Modell, sondern ein einziger Verifikations-Baustein im Prompt. In diesem Artikel bekommst du ihn vollständig: den Fundstellen-Zwang, die Zwei-Minuten-Stichprobe und den Weg über ein lokales Vision-Modell für sensible Dokumente. Smart, not Hard.

Die Diagnose

Warum eine falsche Zahl gefährlicher ist als ein erfundener Satz

Eine Text-Halluzination verrät sich selbst: Das Modell behauptet etwas, das nicht zum Rest passt, und dein Sprachgefühl schlägt Alarm. Eine Zahlen-Halluzination tut das nie. 2.45 sieht genauso seriös aus wie 25.45 — nur die Kommastelle ist verrutscht.

Beim Auslesen von Offerten, Rechnungen oder Reports ist das die teuerste Fehlerart, weil sie unbemerkt durchläuft. Sie fällt nicht durch ein schräges Wort auf, sondern nur durch den Vergleich mit dem Original.

Wichtig ist die Abgrenzung zum Vormodul: Dort ging es um Denk-Routinen — der KI eine Rolle geben, sie zum Widerspruch zwingen. Hier geht es um Dokumenten-Analyse mit Verifikation. Du gibst der KI keine Rolle, du nimmst ihr die Erlaubnis zum Raten.

Das Herzstück

Der Fundstellen-Zwang — jede Zahl an ihre Quelle binden

Der ganze Trick steckt in einem Satz, den du an deine Extraktions-Aufgabe anhängst. Du zwingst die KI, jede Zahl zu belegen:

Lies die folgenden Beträge aus dem PDF. Zitiere zu
jeder Zahl die wörtliche Zeile aus dem Dokument, aus
der sie stammt, mit Seitenzahl. Wenn du eine Zahl nicht
eindeutig findest, schreib UNSICHER statt zu raten.

Das entscheidende Stück ist der letzte Satz. «UNSICHER statt zu raten» gibt der KI einen ehrlichen Ausweg — statt einen Wert zu erfinden, markiert sie ihre Lücke. Damit verwandelst du blindes Vertrauen in Überprüfbarkeit.

Die Kontrolle

Die Zwei-Minuten-Stichprobe

Du musst nicht jede Zahl nachrechnen — das wäre das Gegenteil von smart. Du prüfst die wichtigsten zwei bis drei: das Total, die grösste Summe, ein Datum.

Lass dir das Ergebnis als Tabelle ausgeben — Zahl, wörtliche Fundstelle, Seite — und schlage zwei davon im Original auf:

Tabelle mit drei Spalten anfordern: Zahl, Fundstelle, Seite.
Zwei wichtige Zeilen auswählen (Total und grösste Summe).
Im PDF auf die zitierte Seite springen und vergleichen.

Stimmt die Stichprobe, vertraust du dem Rest. Stimmt sie nicht, weisst du sofort: Das Tool ist für dieses Dokument nicht zuverlässig. Zwei Minuten Prüfung gegen den Schaden einer falschen Zahl im Angebot.

Der Aha-Moment

Warum die Tabelle die KI ehrlich macht

Solange die KI nur eine Liste von Zahlen ausspuckt, kann sie raten, ohne dass es jemand sieht. Sobald sie zu jeder Zahl eine wörtliche Zeile und eine Seite liefern muss, kann sie nichts mehr frei erfinden — sie muss jede Zahl verorten.

Frag nie «stimmt die Zahl?». Die KI bestätigt sich selbst. Verlang die Fundstelle und prüf selbst.

Das knüpft an eine Lehre aus dem Vormodul an: Eine Rückfrage wie «stimmt das?» bringt nichts, weil das Modell zur Zustimmung neigt. Die Quelle lügt nicht, die Bestätigung schon. Genau deshalb prüfst du gegen das Dokument, nicht gegen die Meinung der KI.

Der Datenschutz

Sensible Dokumente lokal statt in der Cloud

Rechnungen, Lohnabrechnungen, Post — solche Dokumente gehören nicht in eine Cloud-KI. Meine Konsequenz aus der Kommastellen-Geschichte: Sensibles läuft bei mir über eine lokale KI.

Konkret nutze ich Ollama mit dem Vision-Modell Qwen2.5-VL. Ein Vision-Modell schaut die Seite wirklich an, statt nur Text zu raten — und es läuft komplett auf dem eigenen Rechner. Das ist eine ehrliche Empfehlung aus der Praxis, kein Tool-Tutorial.

Merk dir das Prinzip: Der Fundstellen-Zwang bleibt derselbe, egal ob Cloud oder lokal. Bei sensiblen Daten kommt nur dazu, dass nichts deinen Rechner verlässt.

In 5 Schritten — direkt anwendbar

Dokument und wichtige Zahlen festlegen

Nimm ein echtes PDF und markiere für dich, welche Werte zählen: Total, grösste Summe, Schlüssel-Datum. Das sind die Zahlen, die du später stichprobenartig prüfst.

Den Fundstellen-Zwang in den Prompt schreiben

Hänge an deine Aufgabe: «Zitiere zu jeder Zahl die wörtliche Zeile mit Seitenzahl. Wenn unklar, schreib UNSICHER statt zu raten.» Lass das Ergebnis als Tabelle (Zahl, Fundstelle, Seite) ausgeben.

Stichprobe gegen das Original

Wähle zwei bis drei Zeilen aus der Tabelle, springe im PDF auf die zitierte Seite und vergleiche. Achte besonders auf verrutschte Kommastellen.

Bei UNSICHER nachfassen

Jede UNSICHER-Markierung prüfst du selbst im Dokument — nicht, indem du die KI fragst «stimmt das?», sondern indem du die Stelle aufschlägst.

Sensible Dokumente lokal verarbeiten

Für Rechnungen, Lohn und Post richte ein lokales Vision-Modell ein (z. B. Qwen2.5-VL via Ollama) und wende denselben Fundstellen-Zwang an. So bleiben die Daten auf deinem Rechner.

Typische Fehler — und wie du sie vermeidest

Die fünf Fallen, in die beim Zahlen-Auslesen fast jeder tappt:

Der KI blind vertrauen, weil das Ergebnis plausibel aussieht

Eine falsch gelesene Zahl sieht immer plausibel aus — das ist ja das Problem. Plausibilität ist kein Beweis. Erst die Fundstelle plus Stichprobe macht eine Zahl belastbar.

Nur «lies die Zahlen» schreiben, ohne die Quelle zu verlangen

Ohne Fundstellen-Zwang stellt die KI Zahlen frei in den Raum. Verlange zu jeder Zahl die wörtliche Zeile und die Seite — sonst kannst du nichts gezielt gegenprüfen.

Keine Stichprobe machen

Ohne Vergleich mit dem Original bleibt jede Extraktion eine Vermutung. Zwei bis drei geprüfte Zahlen reichen, um Vertrauen in den Rest zu rechtfertigen.

«Stimmt diese Zahl?» die KI fragen

Die KI neigt zur Selbstbestätigung und sagt dir, was du hören willst. Prüfe gegen die Quelle, nicht gegen die Meinung des Modells.

Sensible Dokumente in eine Cloud-KI laden

Rechnungen, Lohn und Post enthalten vertrauliche Daten. Für solche Dokumente gehört ein lokales Vision-Modell zum Einsatz, damit nichts deinen Rechner verlässt.

Fazit

Zahlen-Halluzination ist die unsichtbare Sorte: keine Fantasie-Texte, nur eine verschobene Kommastelle. Der Schutz dagegen ist kein teureres Tool, sondern ein Verifikations-Baustein — der Fundstellen-Zwang, die UNSICHER-Regel und eine Zwei-Minuten-Stichprobe gegen das Original. Vertrauen durch Überprüfbarkeit, nicht durch Zuruf.

Mit dem Prompt und der Routine aus diesem Artikel hast du 90 % der Arbeit in der Hand. Die restlichen 10 % sind dein konkreter Fall: Welche Dokumente liest du regelmässig aus? Wo wäre eine verschobene Kommastelle besonders teuer? Und welche davon gehören aus Datenschutzgründen ausschliesslich auf einen lokalen Rechner?

Wenn du diese letzten 10 % nicht allein angehen willst: Genau da kommt Coaching ins Spiel. In 30 Minuten richten wir deinen Extraktions-Prompt für deine Dokumente ein, definieren deine Stichproben-Routine und klären, was lokal laufen sollte. Erstgespräch kostenlos — direkt buchen.

30 Minuten. Deine Dokumente. Dein Extraktions-Prompt.

Kostenloses Erstgespräch — wir richten deinen Fundstellen-Zwang ein, definieren deine Stichproben-Routine und klären, was lokal laufen sollte.

Kostenloses Erstgespräch buchen

Häufige Fragen

Welche KI ist am besten geeignet, um Zahlen aus PDFs auszulesen?

Wichtiger als das Modell ist der Prompt. Jede grössere KI mit PDF-Upload (ChatGPT, Claude, Gemini) liest Zahlen — entscheidend ist, dass du den Fundstellen-Zwang setzt und eine Stichprobe machst. Bei gescannten oder fotografierten Dokumenten ist ein Vision-Modell im Vorteil, weil es die Seite anschaut, statt nur eingebetteten Text zu lesen.

Was ist ein Vision-Modell und wann brauche ich es?

Ein Vision-Modell verarbeitet das Dokument als Bild und «sieht» die Seite, statt nur den hinterlegten Text zu verwenden. Du brauchst es vor allem bei Scans, Fotos und schlecht strukturierten PDFs. Für sensible Dokumente kombinierst du es mit einer lokalen Lösung wie Qwen2.5-VL über Ollama, damit die Daten deinen Rechner nicht verlassen.

Reicht der Fundstellen-Zwang wirklich gegen Halluzination?

Er beseitigt das Problem nicht allein, aber er macht es sichtbar — und das ist der ganze Punkt. Wenn die KI zu jeder Zahl eine Quelle nennen muss, kann sie nicht mehr unbemerkt raten. In Kombination mit der UNSICHER-Regel und einer kurzen Stichprobe gegen das Original hast du eine belastbare Routine statt blindem Vertrauen.

Wie viele Zahlen soll ich stichprobenartig prüfen?

Zwei bis drei reichen in den meisten Fällen — und zwar die folgenreichsten: das Total, die grösste Einzelsumme und ein Datum. Stimmen diese mit dem Original überein, ist das Risiko im Rest gering. Stimmen sie nicht, prüfst du gründlicher oder wechselst das Werkzeug.

Was ist Qwen2.5-VL und wie aufwändig ist die lokale Einrichtung?

Qwen2.5-VL ist ein offenes Vision-Sprachmodell, das du über Ollama lokal betreiben kannst. Die Einrichtung ist überschaubar: Ollama installieren, das Modell laden, Dokumente lokal verarbeiten. Dieser Artikel ist bewusst kein Schritt-für-Schritt-Tutorial — entscheidend ist das Prinzip, dass sensible Daten den Rechner nicht verlassen.

Funktioniert das auch mit gescannten oder fotografierten Rechnungen?

Ja, und genau dort lohnt sich ein Vision-Modell besonders. Bei Scans und Fotos gibt es keinen sauberen eingebetteten Text, sodass klassisches Auslesen schnell an Genauigkeit verliert. Ein Vision-Modell liest die Seite als Bild — kombiniert mit dem Fundstellen-Zwang bleibt jede Zahl trotzdem prüfbar.

Komfort-Variante

Lieber als PDF mitnehmen?

Den vollständigen Inhalt dieser Seite gibt es zusätzlich als strukturiertes PDF-Paket — zum Offline-Lesen, Markieren und Weitergeben im Team. Eine reine Komfort-Leistung. Der gesamte Inhalt bleibt weiter kostenlos auf dieser Seite — kein Login, keine Paywall, kein versteckter Bezahl-Inhalt.

Was im Paket enthalten ist

PDF-Spickzettel: der Fundstellen-Zwang-Prompt zum Kopieren
Vorlage: Stichproben-Tabelle (Zahl · Fundstelle · Seite)
Direkt-Link zur ungelisteten Langversion des Videos

9 EUR · einmalig · ohne Abo

Auf CopeCart öffnen →

Abwicklung über CopeCart GmbH (DE) als Merchant of Record. Details in AGB §12.