PDF OCR: 업로드 없이 스캔한 PDF를 검색 가능하게 만들기
June 4, 2026 · 2분 분량
스캔한 PDF는 사실 페이지를 찍은 사진일 뿐입니다. 글자가 보이지만 선택, 검색, 복사를 할 수 없습니다 — 컴퓨터에게는 그것이 텍스트가 아니라 픽셀이기 때문입니다. OCR(광학 문자 인식)은 이미지를 읽어 실제 문자를 복원함으로써 이를 해결합니다. 이 가이드는 OCR이 어떻게 작동하는지, 그리고 스캔 문서가 당신의 기기에 머무르도록 브라우저에서 실행하는 방법을 설명합니다.
OCR이 하는 일
OCR은 페이지 이미지를 분석하여 글자 모양을 인식하고 텍스트를 재구성합니다. OCR 후에는 다음을 할 수 있습니다:
- 문서에서 단어나 숫자를 검색.
- 텍스트를 선택하고 복사.
- 실제로 단어가 담긴 PDF-Word 변환이나 PDF-텍스트 변환에 입력.
이것이 스캔 더미를 쓸모 있고 검색 가능한 문서로 바꿔 주는 것입니다.
업로드 대신 OCR을 로컬에서 실행하는 이유
스캔 문서는 사람들이 가진 것 중 가장 민감한 것인 경우가 많습니다: 계약서, 신분증, 세금 서식, 오래된 편지, 의료 서류. 클라우드 OCR 서비스는 이 모든 것을 업로드해야 합니다. 브라우저에서 OCR을 실행하면 스캔본이 당신의 기기에 머뭅니다 — 인식은 오픈소스 Tesseract 엔진의 WebAssembly 빌드를 사용해 로컬에서 이루어집니다.
확인하려면: DevTools → Network를 열고 OCR을 실행하세요. 파일이 업로드되는 것이 보이지 않을 것입니다.
브라우저에서 PDF OCR을 실행하는 방법
- OCR PDF 도구를 엽니다.
- 스캔한 PDF를 추가합니다.
- 처리되도록 둡니다 — 인식이 당신의 기기에서 실행되므로 속도는 기기 성능과 페이지 수에 따라 달라집니다.
- 인식된 텍스트를 사용하거나 내보냅니다.
최상의 결과를 위한 팁
- 고품질 스캔이 유리합니다. 300 DPI에 (기울지 않고) 똑바르며 대비가 높은 페이지가 저해상도 휴대폰 사진보다 훨씬 정확하게 OCR됩니다.
- 깨끗한 원본이 중요합니다. 커피 얼룩, 인쇄물 위 손글씨, 흐릿한 복사본은 모두 정확도를 떨어뜨립니다.
- 기대치를 정하세요. OCR은 훌륭하지만 완벽하지는 않습니다 — 인식 후 중요한 숫자(날짜, 합계, ID)는 교정하세요.
- 무거운 작업이니 인내심을 가지세요. OCR은 계산 부하가 큽니다; 큰 문서는 작업이 데이터센터가 아니라 당신의 기기에서 이루어지므로 더 오래 걸립니다.
OCR 이후
스캔본이 검색 가능해지면 편집을 위해 Word로 변환하거나, 일반 텍스트를 추출하거나, 이제 인식 가능해진 민감한 세부 정보를 편집(레닥션)하고 싶을 수 있습니다.
결론
OCR은 스캔한 PDF를 진정으로 유용하게 — 검색 가능, 선택 가능, 변환 가능하게 — 만들어 주며, 이를 위해 비공개 스캔본을 업로드할 이유가 없습니다. 브라우저에서 전부 PDF에 OCR을 실행하세요.