OCRソフトで印刷文書をデータ化
2 文書を取り込む
3/6 次のページへ


2.1 文書の取り込み

文書をテキストデータにする作業は,文書の取り込み,取り込んだ画像の修正,画像を文字として認識させる,誤認識の修正,テキストデータの保存,という手順で進みます。この順番をおさえておきましょう。
ここでは,文書の取り込みについて説明します。まず,文書の取り込み範囲を設定し,次に取り込みを行います。手順を見てみましょう。


手順
  1. [画像のスキャン]ボタンをクリックして,[スキャナ取り込み]画面を表示します。
  2. スキャン条件を設定します。
  3. [スキャン範囲の自動設定]に印をつけます。
  4. [プレスキャン]ボタンをクリックして,プレビューを確認します。
  5. プレビュー画面で青い枠をドラッグして取り込み範囲を設定します。
  6. [スキャン]ボタンをクリックして,取り込みを開始します。

ポイント

ポイント 薄い原稿や濃い原稿の場合は,文書に合わせて濃度を選択します。
ポイント 取り込みが終了するまでは,原稿カバーを開けないようにしましょう。

濃度のプルダウン

補足 [DPI](解像度)を変えると?

一般に,解像度が高いほど文字の認識率も高くなります。しかし,文書の文字が明瞭な場合には,解像度を下げても文字の認識率はあまり落ちません。解像度を下げると,取り込みの処理が速くなります。


2.2 文字として認識させるために,きれいに修正する

ここでは,取り込んだ画像の修正について説明します。
取り込まれた画像には,文字として認識されにくい白抜き文字や汚れがあります。文字認識の精度を上げるために,きれいに修正します。修正の手順を見てみましょう。


手順
  1. [画像修正]を選択します。
  2. [縮尺設定]ボタンで,画像表示を大きくし,修正箇所を見やすくします。
  3. [範囲選択]ボタンをクリックして,修正する範囲を選択します。
  4. 不要な文字を取り除きます。
  5. 白抜き文字を反転して認識できるようにします。
  6. 汚れを取り除きます。

ポイント

ポイント ツールバーの[拡大・縮小]ボタンをクリックすると,マウスカーソルが虫眼鏡の形に変わります。画像上でクリックすると拡大されます。

[拡大・縮小]ボタン→虫眼鏡

ポイント [消しゴム]の大きさは調整できます。[線の太さ]ボタンをクリックして,太さを選択します。

[線の太さ]ボタン

ポイント 文字の下地を[消しゴム]で消すのはたいへんです。下地のある原稿は,スキャン条件の濃度を[ユーザ設定]にして取り込み直しましょう。プレビュー画面で,文字が見えて下地が見えなくなる程度に[濃度調整]を薄く設定してから,取り込みます。

原稿→ユーザ設定画面→取り込み画面

▲このページの先頭へ

 
前のページへ 3/6 次のページへ
閉じる
Copyright:2003-2009 Ministry of Education,Culture,Sports,Science and Technology