OCR su un PDF: rendi ricercabile un PDF scansionato senza caricarlo
June 4, 2026 · 2 min di lettura
Un PDF scansionato in realtà non è altro che l'immagine di una pagina. Puoi vedere le parole, ma non puoi selezionarle, cercarle o copiarle — perché per il computer sono pixel, non testo. L'OCR (riconoscimento ottico dei caratteri) risolve questo problema leggendo l'immagine e recuperando i caratteri effettivi. Questa guida spiega come funziona l'OCR e come eseguirlo nel tuo browser, così un documento scansionato resta sul tuo dispositivo.
Cosa fa l'OCR
L'OCR analizza l'immagine di una pagina, riconosce le forme delle lettere e ricostruisce il testo. Dopo l'OCR puoi:
- Cercare una parola o un numero nel documento.
- Selezionare e copiare il testo da esso.
- Inserirlo in una conversione PDF in Word o PDF in testo che contiene davvero le parole.
È ciò che trasforma una pila di scansioni in documenti utilizzabili e ricercabili.
Perché eseguire l'OCR in locale anziché caricare il file
I documenti scansionati sono spesso le cose più sensibili che le persone possiedono: contratti, documenti d'identità, dichiarazioni fiscali, vecchie lettere, documentazione medica. I servizi OCR in cloud richiedono di caricare tutto questo. Eseguire l'OCR nel browser mantiene la scansione sul tuo dispositivo — il riconoscimento avviene localmente usando una build WebAssembly del motore open-source Tesseract.
Per confermarlo: apri DevTools → Network ed esegui l'OCR. Non vedrai il file essere caricato.
Come eseguire l'OCR su un PDF nel tuo browser
- Apri lo strumento OCR PDF.
- Aggiungi il tuo PDF scansionato.
- Lascialo elaborare — il riconoscimento avviene sul tuo dispositivo, quindi la velocità dipende dalla tua macchina e dal numero di pagine.
- Usa il testo riconosciuto, o esportalo.
Consigli per i migliori risultati
- Le scansioni di qualità superiore vincono. Pagine a 300 DPI, dritte (non inclinate) e ad alto contrasto vengono riconosciute con l'OCR in modo molto più accurato rispetto a foto da telefono a bassa risoluzione.
- Gli originali puliti contano. Macchie di caffè, scrittura a mano sopra il testo stampato e fotocopie sbiadite riducono tutti l'accuratezza.
- Aspettative realistiche. L'OCR è eccellente ma non perfetto — rileggi i numeri importanti (date, totali, codici) dopo il riconoscimento.
- Lavoro pesante, sii paziente. L'OCR è computazionalmente intenso; i documenti grandi richiedono più tempo perché il lavoro avviene sul tuo dispositivo anziché in un data center.
Dopo l'OCR
Una volta che la tua scansione è ricercabile, potresti voler convertirla in Word per modificarla, estrarre il testo semplice, oppure redigere i dettagli sensibili ora che sono riconoscibili.
In conclusione
L'OCR rende un PDF scansionato davvero utile — ricercabile, selezionabile, convertibile — e non c'è alcun motivo per caricare scansioni private per farlo. Esegui l'OCR sul tuo PDF interamente nel tuo browser.