OCR PDF hasil pindaian
Kenali teks dalam PDF hasil pindaian menggunakan OCR di perangkat — tanpa unggahan.
Seret & letakkan file Anda di sini
atau klik untuk memilih — file Anda diproses secara lokal dan tidak pernah diunggah
Unggahan file Anda
0
Byte yang dikirim dari perangkat Anda
0 B
Terverifikasi — file Anda tidak pernah meninggalkan perangkat ini.
Proses sebuah file dan saksikan angka ini tetap nol.
Cara melakukan OCR pada PDF
- 1
Buka PDF hasil pindaian Anda
Letakkan file. Halamannya dibaca secara lokal dan tidak pernah diunggah.
- 2
Jalankan pengenalan
Setiap halaman dirender dan dibaca oleh mesin OCR Tesseract di browser Anda.
- 3
Salin atau unduh teks
Dapatkan teks yang dikenali untuk disalin, atau unduh sebagai .txt atau .docx.
OCR di perangkat untuk dokumen hasil pindaian
Ketika PDF hanya berupa gambar teks — pindaian, foto, faks — tidak ada lapisan teks untuk disalin. OCR (optical character recognition) membaca karakter dari gambar. pdfnoupload menjalankan Tesseract, mesin OCR sumber terbuka yang dihormati, sepenuhnya di browser Anda melalui WebAssembly. Kontrak dan catatan hasil pindaian Anda dikenali secara lokal dan tidak pernah diunggah, yang tepat seperti yang Anda inginkan untuk dokumen sensitif.
Ketahui apa yang diharapkan
OCR bekerja paling baik pada pindaian teks cetak yang bersih dan lurus pada resolusi yang layak. Tulisan tangan, pindaian berkualitas rendah atau miring, tabel, dan tata letak multi-kolom dapat menghasilkan kesalahan atau urutan yang berantakan — ini berlaku untuk semua OCR, bukan hanya milik kami. Mesin diunduh satu kali dan kemudian berfungsi offline. Pengenalan berjalan di Web Worker dengan bilah kemajuan, karena OCR membutuhkan waktu, terutama pada dokumen besar.
Pertanyaan yang sering diajukan
Apakah pindaian saya diunggah untuk OCR?+
Tidak. OCR berjalan di browser Anda melalui WebAssembly. Verifikasi nol unggahan di DevTools → Network.
Mengapa OCR lebih lambat daripada alat lain?+
Mengenali karakter dari gambar sangat berat secara komputasi. Ini berjalan di worker agar halaman Anda tetap responsif, dengan bilah kemajuan.
Seberapa akurat OCR ini?+
Sangat baik pada teks cetak yang bersih; kurang andal pada tulisan tangan, pindaian buruk, tabel, atau halaman multi-kolom.