스캔된 PDF에 OCR 적용

기기 내 OCR을 사용해 스캔된 PDF의 텍스트를 인식하세요 — 업로드 없음.

100% 비공개 — 파일이 기기를 절대 벗어나지 않습니다

여기에 파일을 끌어다 놓으세요

또는 클릭하여 선택하세요 — 파일은 로컬에서 처리되며 절대 업로드되지 않습니다

업로드 없음 모니터실시간

파일 업로드 횟수

0

기기에서 전송된 바이트

0 B

확인됨 — 파일이 이 기기를 벗어나지 않았습니다.

파일을 처리하면서 이 값들이 0으로 유지되는지 확인하세요.

PDF에 OCR을 적용하는 방법

  1. 1

    스캔된 PDF 열기

    파일을 끌어다 놓으세요. 페이지는 로컬에서 읽히며 절대 업로드되지 않습니다.

  2. 2

    인식 실행

    각 페이지가 브라우저의 Tesseract OCR 엔진에 의해 렌더링되고 읽힙니다.

  3. 3

    텍스트 복사 또는 다운로드

    인식된 텍스트를 복사하거나, .txt 또는 .docx로 다운로드하세요.

스캔 문서를 위한 기기 내 OCR

PDF가 텍스트 이미지일 뿐일 때 — 스캔본, 사진, 팩스 — 복사할 텍스트 레이어가 없습니다. OCR(광학 문자 인식)은 이미지에서 문자를 읽어냅니다. pdfnoupload는 존경받는 오픈소스 OCR 엔진인 Tesseract를 WebAssembly를 통해 전적으로 브라우저에서 실행합니다. 스캔한 계약서와 기록이 로컬에서 인식되고 절대 업로드되지 않으므로, 민감한 서류에 정확히 원하는 방식입니다.

기대치를 알아두세요

OCR은 적당한 해상도로 깨끗하고 반듯하게 스캔된 인쇄 텍스트에서 가장 잘 작동합니다. 손글씨, 저화질 또는 기울어진 스캔, 표, 다단 레이아웃은 오류나 뒤섞인 순서를 만들 수 있습니다 — 이는 저희뿐 아니라 모든 OCR에 해당합니다. 엔진은 한 번 다운로드된 뒤 오프라인에서 작동합니다. OCR은 특히 큰 문서에서 시간이 걸리므로, 인식은 진행 표시줄과 함께 Web Worker에서 실행됩니다.

자주 묻는 질문

OCR을 위해 내 스캔본이 업로드되나요?+

아니요. OCR은 WebAssembly를 통해 브라우저에서 실행됩니다. DevTools → 네트워크에서 업로드가 없음을 검증하세요.

OCR이 다른 도구보다 느린 이유는 무엇인가요?+

이미지에서 문자를 인식하는 것은 계산량이 많습니다. 페이지가 계속 반응하도록 워커에서 실행되며 진행 표시줄이 있습니다.

정확도는 어느 정도인가요?+

깨끗한 인쇄 텍스트에서는 매우 좋습니다. 손글씨, 열악한 스캔, 표 또는 다단 페이지에서는 덜 신뢰할 수 있습니다.