Appliquer l'OCR à un PDF numérisé
Reconnaissez le texte d'un PDF numérisé grâce à un OCR exécuté sur l'appareil — sans envoi.
Glissez-déposez votre fichier ici
ou cliquez pour en choisir un — votre fichier est traité localement et n'est jamais envoyé
Téléversements de votre fichier
0
Octets envoyés depuis votre appareil
0 B
Vérifié — votre fichier n'a jamais quitté cet appareil.
Traitez un fichier et regardez ces compteurs rester à zéro.
Comment appliquer l'OCR à un PDF
- 1
Ouvrez votre PDF numérisé
Déposez le fichier. Ses pages sont lues localement et ne sont jamais envoyées.
- 2
Lancez la reconnaissance
Chaque page est restituée et lue par le moteur OCR Tesseract dans votre navigateur.
- 3
Copiez ou téléchargez le texte
Obtenez le texte reconnu à copier, ou téléchargez-le en .txt ou .docx.
Un OCR sur l'appareil pour les documents numérisés
Lorsqu'un PDF n'est que des images de texte — un scan, une photo, un fax — il n'y a aucune couche de texte à copier. L'OCR (reconnaissance optique de caractères) lit les caractères à partir de l'image. pdfnoupload exécute Tesseract, un moteur OCR open source reconnu, entièrement dans votre navigateur via WebAssembly. Vos contrats et documents numérisés sont reconnus localement et ne sont jamais envoyés, ce qui est exactement ce que vous voulez pour des documents sensibles.
Sachez à quoi vous attendre
L'OCR fonctionne mieux sur des scans propres et droits de texte imprimé à une résolution correcte. L'écriture manuscrite, les scans de faible qualité ou de travers, les tableaux et les mises en page à plusieurs colonnes peuvent produire des erreurs ou un ordre désordonné — c'est vrai pour tout OCR, pas seulement le nôtre. Le moteur se télécharge une fois, puis fonctionne hors ligne. La reconnaissance s'exécute dans un Web Worker avec une barre de progression, car l'OCR prend du temps, surtout sur les documents volumineux.
Foire aux questions
Mon scan est-il envoyé pour l'OCR ?+
Non. L'OCR s'exécute dans votre navigateur via WebAssembly. Vérifiez l'absence d'envoi dans les DevTools → Réseau.
Pourquoi l'OCR est-il plus lent que les autres outils ?+
Reconnaître des caractères à partir d'images demande beaucoup de calcul. Cela s'exécute dans un worker pour que votre page reste réactive, avec une barre de progression.
Quelle est sa précision ?+
Très bonne sur du texte imprimé propre ; moins fiable sur l'écriture manuscrite, les scans de mauvaise qualité, les tableaux ou les pages à plusieurs colonnes.