OCR für ein eingescanntes PDF

Erkenne Text in einem eingescannten PDF mit OCR auf dem Gerät — kein Upload.

100 % privat — deine Dateien verlassen niemals dein Gerät

Ziehe deine Datei hierher

oder klicke zum Auswählen — deine Datei wird lokal verarbeitet und niemals hochgeladen

Kein-Upload-MonitorLIVE

Uploads deiner Datei

0

Von deinem Gerät gesendete Bytes

0 B

Verifiziert — deine Datei hat dieses Gerät nie verlassen.

Verarbeite eine Datei und beobachte, wie diese Werte bei null bleiben.

So führst du OCR auf einem PDF durch

  1. 1

    Öffne dein eingescanntes PDF

    Ziehe die Datei hinein. Ihre Seiten werden lokal gelesen und niemals hochgeladen.

  2. 2

    Erkennung ausführen

    Jede Seite wird gerendert und von der Tesseract-OCR-Engine in deinem Browser gelesen.

  3. 3

    Text kopieren oder herunterladen

    Erhalte den erkannten Text zum Kopieren oder lade ihn als .txt oder .docx herunter.

OCR auf dem Gerät für eingescannte Dokumente

Wenn ein PDF nur Bilder von Text ist — ein Scan, ein Foto, ein Fax — gibt es keine Textebene zum Kopieren. OCR (optische Zeichenerkennung) liest die Zeichen aus dem Bild. pdfnoupload führt Tesseract aus, eine angesehene Open-Source-OCR-Engine, vollständig in deinem Browser über WebAssembly. Deine eingescannten Verträge und Unterlagen werden lokal erkannt und niemals hochgeladen, was genau das ist, was du für sensible Dokumente willst.

Wisse, was dich erwartet

OCR funktioniert am besten bei sauberen, geraden Scans von gedrucktem Text in anständiger Auflösung. Handschrift, Scans von geringer Qualität oder verzerrte Scans, Tabellen und mehrspaltige Layouts können Fehler oder eine durcheinandergeratene Reihenfolge erzeugen — das gilt für jede OCR, nicht nur für unsere. Die Engine wird einmal heruntergeladen und funktioniert dann offline. Die Erkennung läuft in einem Web Worker mit Fortschrittsbalken, da OCR Zeit braucht, besonders bei großen Dokumenten.

Häufig gestellte Fragen

Wird mein Scan für OCR hochgeladen?+

Nein. OCR läuft in deinem Browser über WebAssembly. Überprüfe null Uploads in den DevTools → Netzwerk.

Warum ist OCR langsamer als andere Tools?+

Zeichen aus Bildern zu erkennen ist rechenintensiv. Es läuft in einem Worker, damit deine Seite reaktionsfähig bleibt, mit einem Fortschrittsbalken.

Wie genau ist es?+

Sehr gut bei sauberem gedrucktem Text; weniger zuverlässig bei Handschrift, schlechten Scans, Tabellen oder mehrspaltigen Seiten.