すべての記事

PDFをOCR:アップロードせずにスキャンPDFを検索可能にする

June 4, 2026 · 読了時間 1 分

スキャンしたPDFは、実のところページの「画像」にすぎません。文字は見えても、選択・検索・コピーはできません。コンピューターにとっては、それがテキストではなくピクセルだからです。OCR(光学文字認識)は、画像を読み取って実際の文字を復元することで、これを解決します。このガイドでは、OCRの仕組みと、スキャンした文書をデバイス上にとどめたままブラウザの中でOCRを実行する方法を説明します。

OCRが行うこと

OCRはページの画像を解析し、文字の形を認識して、テキストを再構築します。OCRの後は、次のことができます。

  • 文書内の単語や数字を検索する。
  • そこからテキストを選択してコピーする。
  • 実際に単語を含んだPDF→WordPDF→テキスト変換に渡す。

これが、山積みのスキャンを使える検索可能な文書に変えるものです。

アップロードせずにローカルでOCRを実行する理由

スキャンした文書は、人が持つ最も機密性の高いものであることが多いです。契約書、ID、税務書類、古い手紙、医療書類などです。クラウドのOCRサービスは、それらすべてのアップロードを要求します。ブラウザの中でOCRを実行すれば、スキャンはデバイス上にとどまります。認識はオープンソースのTesseractエンジンのWebAssemblyビルドを使ってローカルで行われます。

確認するには、DevTools → Networkを開いてOCRを実行してください。ファイルがアップロードされる様子は見られません。

ブラウザでPDFをOCRする方法

  1. PDF OCRツールを開きます。
  2. スキャンしたPDFを追加します。
  3. 処理させます。認識はデバイス上で行われるため、速度はマシンとページ数に依存します。
  4. 認識されたテキストを使うか、エクスポートします。

最良の結果を得るためのヒント

  • 高品質なスキャンが有利です。 300 DPI、傾いていない、コントラストの高いページは、低解像度のスマホ写真よりはるかに正確にOCRされます。
  • きれいなオリジナルが大切です。 コーヒーのシミ、印刷の上の手書き、薄れたコピーはすべて精度を下げます。
  • 期待値を設定しましょう。 OCRは優秀ですが完璧ではありません。認識後は重要な数字(日付、合計、ID)を校正してください。
  • 重い作業なので、辛抱強く。 OCRは計算負荷が高く、大きな文書ほど時間がかかります。データセンターではなくあなたのデバイス上で作業が行われるためです。

OCRの後に

スキャンが検索可能になったら、編集のためにWordに変換したり、プレーンテキストを抽出したり、認識できるようになった機密情報を黒塗りしたりするとよいでしょう。

まとめ

OCRはスキャンしたPDFを本当に役立つもの — 検索可能、選択可能、変換可能 — にします。そのためにプライベートなスキャンをアップロードする理由はありません。完全にブラウザの中でPDFのOCRを実行する