OCR PDF hasil pindaian

Kenali teks dalam PDF hasil pindaian menggunakan OCR di perangkat — tanpa unggahan.

100% privat — file Anda tidak pernah meninggalkan perangkat Anda

Seret & letakkan file Anda di sini

atau klik untuk memilih — file Anda diproses secara lokal dan tidak pernah diunggah

Pemantau tanpa-unggahLANGSUNG

Unggahan file Anda

0

Byte yang dikirim dari perangkat Anda

0 B

Terverifikasi — file Anda tidak pernah meninggalkan perangkat ini.

Proses sebuah file dan saksikan angka ini tetap nol.

Cara melakukan OCR pada PDF

  1. 1

    Buka PDF hasil pindaian Anda

    Letakkan file. Halamannya dibaca secara lokal dan tidak pernah diunggah.

  2. 2

    Jalankan pengenalan

    Setiap halaman dirender dan dibaca oleh mesin OCR Tesseract di browser Anda.

  3. 3

    Salin atau unduh teks

    Dapatkan teks yang dikenali untuk disalin, atau unduh sebagai .txt atau .docx.

OCR di perangkat untuk dokumen hasil pindaian

Ketika PDF hanya berupa gambar teks — pindaian, foto, faks — tidak ada lapisan teks untuk disalin. OCR (optical character recognition) membaca karakter dari gambar. pdfnoupload menjalankan Tesseract, mesin OCR sumber terbuka yang dihormati, sepenuhnya di browser Anda melalui WebAssembly. Kontrak dan catatan hasil pindaian Anda dikenali secara lokal dan tidak pernah diunggah, yang tepat seperti yang Anda inginkan untuk dokumen sensitif.

Ketahui apa yang diharapkan

OCR bekerja paling baik pada pindaian teks cetak yang bersih dan lurus pada resolusi yang layak. Tulisan tangan, pindaian berkualitas rendah atau miring, tabel, dan tata letak multi-kolom dapat menghasilkan kesalahan atau urutan yang berantakan — ini berlaku untuk semua OCR, bukan hanya milik kami. Mesin diunduh satu kali dan kemudian berfungsi offline. Pengenalan berjalan di Web Worker dengan bilah kemajuan, karena OCR membutuhkan waktu, terutama pada dokumen besar.

Pertanyaan yang sering diajukan

Apakah pindaian saya diunggah untuk OCR?+

Tidak. OCR berjalan di browser Anda melalui WebAssembly. Verifikasi nol unggahan di DevTools → Network.

Mengapa OCR lebih lambat daripada alat lain?+

Mengenali karakter dari gambar sangat berat secara komputasi. Ini berjalan di worker agar halaman Anda tetap responsif, dengan bilah kemajuan.

Seberapa akurat OCR ini?+

Sangat baik pada teks cetak yang bersih; kurang andal pada tulisan tangan, pindaian buruk, tabel, atau halaman multi-kolom.