防備録として書き残します。
品質を大事にする人、なるべく手軽さを求める人など十人十色のレシピがあると思います。
なのであまり突っ込まないで下さい。
文章メインで見出しがカラー
見出し程度がカラーなので、グレースケールもしくは白黒でもいいのですが、雰囲気を残したい場合はやはりカラーにするしかありません。
ScanSnapの設定
画質は「スーパーファイン」ではなく「エクセレント」にしました。この理由は後述します。
カラーモードは「カラー」を選択。
読み取り面の選択は「両面読み取り」
原稿の向きの自動回転と白紙ページの自動削除はOFFにします。
継続読み取りは各自の原稿によって調整します。
ファイル形式はPDFではなくJPEGとします。
これは傾き補正や余白の削除などで、結局JPEGで扱うからです。
圧縮率は一番小さくしました。
圧縮率3と比べたわけではないので、自分で納得できる圧縮率でいいと思います。
ゴミ取り
取り込んだJPEGに目立つゴミがある場合、取ってしまいましょう。
Photoshopをお持ちの方はパッチツールやスタンプツールで簡単にゴミ取りができます。
Photoshop チュートリアル スタンプツールより簡単に消せる!パッチツールの使い方!
[フォトショップ]コピースタンプツールで不要物を消去する
傾き補正とクロップ
傾き補正はeTilTranというツールで行います。
eTilTranの作者のサイトはこちら→No.722
表示されたグリッドを見ながら、マウスホイールで傾きを調整できるので簡単です。
ついでにできるなら、iPadに最適化するため画像のサイズを4:3にクロップしておきます。
(このときのサイズは横が16の倍数、縦が8の倍数が最適です。私は4032:5376にクロップしてます。)
圧縮
このままではサイズがあまりにも大きいので品質90でJPEGを圧縮します。
ツールはバッチ処理ができれば何でも構わないです。
Ralpha Image Resizer
PDF化
iX500には付属ソフトとしてAdobe Acrobat X Standardが付いています。
このソフトを使ってJPEGをまとめてPDF化します。
「ファイルをPDFに結合」で複数のJPEGをまとめてPDF化できます。
ファイルサイズが大きくてもいい場合はこのPDFを保存して終了です。
さらにファイルサイズを減らしたい場合はClearScanでファイルサイズを減らします。
ClearScan
ClearScanは単ページの方が精度が良いという情報があったので、先ほどの複数ページのPDFを単ページ化します。
これで1ページだけのPDFが大量にできます。
この複数のPDFに対してOCRを実行します。
ツール→テキスト認識→複数のファイル内
分割したPDFファイルにOCRが実行され、文字もClearScanによりフォント化されます。
この複数のPDFを1つにまとめて保存すれば終了です。
これで完成です。
画像PDFとClearScanPDFのサイズ比較
画像PDF | 40.5MB |
ClearScanPDF | 3.5MB |
含まれる図の数などでも変動しますが、これぐらいサイズが変わります。
600dpiと300dpiのClearScan結果の違い
100%表示したPDFのスクリーンショットです。
300dpiだと少し潰れているように感じますね。
200%にするとこれだけ違います。
600dpiの方はClearScanで生成されたフォントというより、元々あるフォントと見間違うほど綺麗ですね。
サイズは2倍以上違いますので、どこまで許容できるか、各自の環境に合わせて考えればいいと思います。
300dpi | 1.59MB |
600dpi | 3.5MB |