OCR für ein eingescanntes PDF
Erkenne Text in einem eingescannten PDF mit OCR auf dem Gerät — kein Upload.
Ziehe deine Datei hierher
oder klicke zum Auswählen — deine Datei wird lokal verarbeitet und niemals hochgeladen
Uploads deiner Datei
0
Von deinem Gerät gesendete Bytes
0 B
Verifiziert — deine Datei hat dieses Gerät nie verlassen.
Verarbeite eine Datei und beobachte, wie diese Werte bei null bleiben.
So führst du OCR auf einem PDF durch
- 1
Öffne dein eingescanntes PDF
Ziehe die Datei hinein. Ihre Seiten werden lokal gelesen und niemals hochgeladen.
- 2
Erkennung ausführen
Jede Seite wird gerendert und von der Tesseract-OCR-Engine in deinem Browser gelesen.
- 3
Text kopieren oder herunterladen
Erhalte den erkannten Text zum Kopieren oder lade ihn als .txt oder .docx herunter.
OCR auf dem Gerät für eingescannte Dokumente
Wenn ein PDF nur Bilder von Text ist — ein Scan, ein Foto, ein Fax — gibt es keine Textebene zum Kopieren. OCR (optische Zeichenerkennung) liest die Zeichen aus dem Bild. pdfnoupload führt Tesseract aus, eine angesehene Open-Source-OCR-Engine, vollständig in deinem Browser über WebAssembly. Deine eingescannten Verträge und Unterlagen werden lokal erkannt und niemals hochgeladen, was genau das ist, was du für sensible Dokumente willst.
Wisse, was dich erwartet
OCR funktioniert am besten bei sauberen, geraden Scans von gedrucktem Text in anständiger Auflösung. Handschrift, Scans von geringer Qualität oder verzerrte Scans, Tabellen und mehrspaltige Layouts können Fehler oder eine durcheinandergeratene Reihenfolge erzeugen — das gilt für jede OCR, nicht nur für unsere. Die Engine wird einmal heruntergeladen und funktioniert dann offline. Die Erkennung läuft in einem Web Worker mit Fortschrittsbalken, da OCR Zeit braucht, besonders bei großen Dokumenten.
Häufig gestellte Fragen
Wird mein Scan für OCR hochgeladen?+
Nein. OCR läuft in deinem Browser über WebAssembly. Überprüfe null Uploads in den DevTools → Netzwerk.
Warum ist OCR langsamer als andere Tools?+
Zeichen aus Bildern zu erkennen ist rechenintensiv. Es läuft in einem Worker, damit deine Seite reaktionsfähig bleibt, mit einem Fortschrittsbalken.
Wie genau ist es?+
Sehr gut bei sauberem gedrucktem Text; weniger zuverlässig bei Handschrift, schlechten Scans, Tabellen oder mehrspaltigen Seiten.