Tous les articles

OCR d'un PDF : rendre un PDF numérisé consultable sans le téléverser

June 4, 2026 · 2 min de lecture

Un PDF numérisé n'est en réalité qu'une image d'une page. Vous voyez les mots, mais vous ne pouvez pas les sélectionner, les rechercher ni les copier — parce que, pour l'ordinateur, ce sont des pixels, pas du texte. L'OCR (reconnaissance optique de caractères) corrige cela en lisant l'image et en récupérant les véritables caractères. Ce guide explique comment fonctionne l'OCR et comment l'exécuter dans votre navigateur, pour qu'un document numérisé reste sur votre appareil.

Ce que fait l'OCR

L'OCR analyse l'image d'une page, reconnaît les formes des lettres et reconstruit le texte. Après l'OCR, vous pouvez :

  • Rechercher un mot ou un nombre dans le document.
  • Sélectionner et copier son texte.
  • L'utiliser pour une conversion PDF en Word ou PDF en texte qui contient réellement des mots.

C'est ce qui transforme une pile de scans en documents exploitables et consultables.

Pourquoi exécuter l'OCR localement plutôt que de téléverser

Les documents numérisés sont souvent les éléments les plus sensibles que les gens possèdent : contrats, pièces d'identité, déclarations fiscales, vieilles lettres, documents médicaux. Les services OCR dans le cloud exigent de téléverser tout cela. Exécuter l'OCR dans le navigateur garde le scan sur votre appareil — la reconnaissance se fait localement à l'aide d'une version WebAssembly du moteur open source Tesseract.

Pour le confirmer : ouvrez DevTools → Network et lancez l'OCR. Vous ne verrez pas le fichier être téléversé.

Comment faire l'OCR d'un PDF dans votre navigateur

  1. Ouvrez l'outil OCR PDF.
  2. Ajoutez votre PDF numérisé.
  3. Laissez-le traiter — la reconnaissance s'exécute sur votre appareil, donc la vitesse dépend de votre machine et du nombre de pages.
  4. Utilisez le texte reconnu, ou exportez-le.

Conseils pour les meilleurs résultats

  • Les scans de meilleure qualité l'emportent. Des pages à 300 DPI, droites (non inclinées) et à fort contraste donnent un OCR bien plus précis que des photos de téléphone à basse résolution.
  • Les originaux propres comptent. Les taches de café, l'écriture manuscrite par-dessus le texte imprimé et les photocopies pâles réduisent tous la précision.
  • Ayez des attentes réalistes. L'OCR est excellent mais pas parfait — relisez les nombres importants (dates, totaux, numéros) après la reconnaissance.
  • Tâche lourde, soyez patient. L'OCR demande beaucoup de calcul ; les gros documents prennent plus de temps parce que le travail se fait sur votre appareil plutôt que dans un centre de données.

Après l'OCR

Une fois votre scan consultable, vous voudrez peut-être le convertir en Word pour le modifier, extraire le texte brut, ou caviarder des détails sensibles maintenant qu'ils sont reconnaissables.

En résumé

L'OCR rend un PDF numérisé réellement utile — consultable, sélectionnable, convertible — et il n'y a aucune raison de téléverser des scans privés pour le faire. Lancez l'OCR sur votre PDF entièrement dans votre navigateur.