JP2019168747A

JP2019168747A - 文書読取装置及びプログラム

Info

Publication number: JP2019168747A
Application number: JP2018053866A
Authority: JP
Inventors: 茜阿部; Akane Abe; 和宏大谷; Kazuhiro Otani; 岡田　茂; Shigeru Okada; 茂岡田; 邦彦小林; Kunihiko Kobayashi; 清水　淳一; Junichi Shimizu; 淳一清水; 山口　聡之; Satoyuki Yamaguchi; 聡之山口; 真太郎安達; Shintaro Adachi; 慎也中村; Shinya Nakamura
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2018-03-22
Filing date: 2018-03-22
Publication date: 2019-10-03
Anticipated expiration: 2038-03-22
Also published as: JP7059734B2

Abstract

【課題】利用者が、読み取るべき２以上の同一または類似する形式の文書の全てに対して読取位置をマーキングする手間を省く。【解決手段】文書読取装置としての画像処理装置は、スキャナモジュール、制御部１２４及び記憶部１２３を備える。制御部１２４は、読取位置２１が設定されている第１文書２０を読み取り、読取位置情報として記憶装置１２３に記憶する。第１文書２０と同一または類似形式であって、読取位置２１が設定されていない第２文書２２を読み取る際の読取位置を、記憶装置１２３に記憶された読取位置情報を用いて特定する。【選択図】図２

Description

本発明は、文書読取装置及びプログラムに関する。

特許文献１には、文字認識を行う端末と中央制御装置間で通信を行う通信システムにおいて、処理効率を向上する通信システムが記載されている。移動端末は、スキャナで読み取られた原稿の種類を示す原稿ＩＤを含む画像データに対し、制御信号に基づいて文字認識部で文字認識を行い、原稿ＩＤを原稿ＩＤ認識部で認識する。中央制御装置へ文字認識結果及び原稿ＩＤ認識結果を文字認識結果・原稿ＩＤ送信部で送信し、中央制御装置より画像信号の制御信号を閾値・位置情報受信部で受信する。中央制御装置は、移動端末より文字認識結果及び原稿ＩＤ認識結果を文字認識結果・原稿ＩＤ受信部で受信し、画像信号の制御信号を移動端末へ閾値・位置情報送信部で送信する。原稿ＩＤ認識結果に基づいて、画像信号の制御信号を閾値制御部で制御する。

特許文献２には、登録シートから文書属性を判断できるようにし、ユーザの作業の負担を軽減する文書管理システムが記載されている。文書管理サーバに記録されている文書属性に応じた文書保存先情報を記載した登録シートを印刷し、その登録シートを含む紙書類をスキャンすることで電子化されたイメージ文書を作成する。次にこのイメージ文書から登録シートを抽出した上で、ＯＣＲ（Optical Character Recognition）処理を行い、この結果を用いて文書属性の判定処理をする。さらに、この文書属性に対応してイメージ文書をページ毎に体裁を整えるための整理処理、および、イメージ文書を分割し、文書管理サーバの所定の場所に記録する。

特開平１１−１８４９６６号公報特開２００８−１６５３８６号公報

文書に対してＯＣＲ処理を実行する際に、文書の特定領域だけにＯＣＲ処理を実行して文字情報を抽出する所謂ゾーンＯＣＲは、比較的大量の文書を処理する場合等に有効であるが、他方で、読み取るべき２以上の同一または類似形式の文書の全てに対して読取位置を設定するのは利用者にとって煩雑となる。

本発明は、かかる課題を解決することを目的とする。

請求項１に記載の発明は、文書読取部と、読取位置が設定されている第１文書に対して前記文書読取部で読み取り、読取位置情報として記憶する記憶部と、前記第１文書と同一または類似形式であって、前記読取位置が設定されていない第２文書に対して前記文書読取部で読み取る際の読取位置を、前記記憶部に記憶された前記読取位置情報を用いて特定する読取位置特定部とを備える文書読取装置である。

請求項２に記載の発明は、前記読取位置情報は、前記第１文書の中で一定数の文字が含まれる位置座標とその範囲の情報を含む請求項１に記載の文書読取装置である。

請求項３に記載の発明は、前記読取位置情報は、前記第１文書における特定位置に対する相対的位置の情報を含む請求項１に記載の文書読取装置である。

請求項４に記載の発明は、前記相対的位置の情報は、前記特定位置に対する位置座標とその範囲の情報を含む請求項３に記載の文書読取装置である。

請求項５に記載の発明は、前記特定位置は、特定属性の位置である請求項３に記載の文書読取装置である。

請求項６に記載の発明は、前記記憶部は、前記第２文書が複数枚からなる組を構成する場合に、前記第１文書に対して前記組に対応させて前記文書読取部で読み取り、読取位置情報として記憶する請求項１に記載の文書読取装置である。

請求項７に記載の発明は、前記複数枚は、表面と裏面である請求項６に記載の文書読取装置である。

請求項８に記載の発明は、前記複数枚は、１組の帳票を構成する請求項６に記載の文書読取装置である。

請求項９に記載の発明は、前記複数枚からなる組は、前記読取位置が互いに異なる請求項６に記載の文書読取装置である。

請求項１０に記載の発明は、前記第１文書における前記読取位置の設定は、マーキングによる請求項１に記載の文書読取装置である。

請求項１１に記載の発明は、前記マーキングは、特定色による囲み、特定色による塗りつぶし、チェックマークの追加、無色透明による囲み、無色透明による塗りつぶしの少なくともいずれかである請求項１０に記載の文書読取装置である。

請求項１２に記載の発明は、前記第１文書の画像を表示する表示部と、前記第１文書の画像に対してマーキングする操作部とをさらに備える請求項１０に記載の文書読取装置である。

請求項１３に記載の発明は、前記第１文書は、前記第２文書に対する１または複数のヘッダシートである請求項１に記載の文書読取装置である。

請求項１４に記載の発明は、前記ヘッダシートの枚数は、利用者により設定される請求項１３に記載の文書読取装置である。

請求項１５に記載の発明は、前記ヘッダシートの枚数は、前記文書読取部で判定される請求項１３に記載の文書読取装置である。

請求項１６に記載の発明は、コンピュータに、読取位置が設定されている第１文書を読み取るステップと、前記読取位置についての読取位置情報を生成するステップと、前記読取位置情報を記憶部に記憶するステップと、前記読取位置情報を記憶した後に、前記第１文書と同一または類似形式であって、前記読取位置が設定されていない第２文書を読み取る際の読取位置を、前記記憶部に記憶された前記読取位置情報を用いて特定するステップを実行させるプログラムである。

請求項１〜１６に記載の発明によれば、読み取るべき２以上の同一または類似する形式の文書の全てに対して読取位置を設定する手間が省かれる。

請求項２に記載の発明によれば、さらに、第１文書の中で一定数の文字が含まれる位置座標とその範囲の情報が利用され得る。

請求項３〜５に記載の発明によれば、さらに、第１文書における特定位置に対する相対的位置の情報が利用され得る。

請求項６〜９に記載の発明によれば、さらに、第２文書が複数枚からなる組を構成する場合に対応し得る。

請求項１０〜１２に記載の発明によれば、さらに、第１文書における読取位置がマーキングにより設定され得る。

請求項１３〜１５に記載の発明によれば、さらに、第１文書が１または複数のヘッダシートで構成され得る。

実施形態１のシステム構成図である。実施形態１の機能ブロック図である。ゾーンＯＣＲの説明図である。実施形態１の処理を示す説明図（その１）である。実施形態１の処理を示す説明図（その２）である。実施形態１の処理を示す説明図（その３）である。実施形態１の処理を示す説明図（その４）である。実施形態１の処理フローチャートである。実施形態１の他の処理フローチャートである。実施形態２の処理を示す説明図（その１）である。実施形態２の処理を示す説明図（その２）である。実施形態２の処理フローチャートである。実施形態３の処理を示す説明図（その１）である。実施形態３の処理を示す説明図（その２）である。変形例の読取位置説明図である。

以下、図面に基づき本発明の実施形態について、文書読取装置として画像処理装置を例にとり説明する。

＜実施形態１＞
図１は、本実施形態における画像処理装置を含むシステムの構成ブロック図である。システムは、端末装置１０及び画像処理装置１２を備える。端末装置１０と画像処理装置１２は、通信回線１４を介して接続され、通信回線１４は、例えばＬＡＮ（ローカルエリアネットワーク）等のデータ通信ネットワークである。通信回線１４は、有線、無線のいずれでもよい。

端末装置１０は、ＰＣやスマートフォン等であり、利用者の指示に従い、文書の印刷命令を含む印刷ジョブ等を送信する。

画像処理装置１２は、例えば複数の機能を実現する複合機であり、ＲＯＭ１２１、ＲＡＭ１２２、記憶装置１２３、１つ又は複数のプロセッサで構成される制御部１２４、入出力インターフェイス（Ｉ／Ｆ）１２５、操作部１２６、及び画像形成部１２７を備える。

１又は複数のプロセッサで構成される制御部１２４は、ＲＯＭ１２１や記憶装置１２３に記憶された処理プログラムに従い、端末装置１０から入出力Ｉ／Ｆ１２５を介して印刷ジョブ命令等を受け付け、ＰＤＬデータを解釈して中間データを生成し、生成した中間データからさらに描画データ（ラスターデータ）を生成する。また、制御部１２４は、操作部１２６から受け付けたコピー（Copy）、スキャン（Scan）、ファックス(Fax)、メール（mail）等の各種アプリケーションの命令を実行する。

画像形成部１２７は、文書読取部としてのスキャナモジュール１２８を備え、文書を読み取って電子データに変換する。また、画像形成部１２７は、スキャナモジュール１２８以外にもプリントモジュール、ファックスモジュール、メールモジュール、用紙給紙モジュール、原稿給紙モジュール、及び画像処理アクセラレータを備える。

プリントモジュールは、画像を用紙に出力する機能を有するモジュールである。例えば、公知のインクジェット方式の構成を備え、描画データを用紙に印刷する。ノズル等から液体あるいは溶融固体インクを吐出し、紙、フィルム等に記録を行う。インクを吐出する方法には、静電誘引力を利用してインクを吐出させるドロップオンデマンド方式（圧力パルス方式）、高熱により気泡を形成・成長させることで生じる圧力を利用してインクを吐出させる熱インクジェット方式等がある。記録ヘッドは、例えば、シアンインクを吐出するヘッド、マゼンタインクを吐出するヘッド、イエローインクを吐出するヘッド、ブラックインクを吐出するヘッドを備え、各ヘッドが用紙の幅と少なくとも同等の幅を有するラインヘッドが用いられる。記録ヘッドにより各色のインク滴を中間転写体に吐出して記録し、その後に用紙に転写して印刷する。

ファックスモジュールは、モデムやファックス用画像処理モジュールを備え、ファックス機能を実行するモジュールである。

メールモジュールは、電子メール機能を実行するモジュールである。

用紙給紙モジュールは、用紙トレイからプリントモジュールに用紙を搬送するモジュールである。

原稿給紙モジュールは、原稿トレイからファックスモジュールに用紙を搬送するモジュールである。

画像処理アクセラレータは、スキャナモジュール等と連動して圧縮／伸長処理を行うモジュールである。この画像処理アクセラレータは必須ではなく、付加的モジュールとしてもよい。

操作部１２６は、タッチパネルを含み、制御部１２４からの制御指令に応じて画像処理装置１２が備える各種機能（コピー、スキャン、ファックス、メール、ＯＣＲ等）に対応するアプリケーションアイコンを表示する。例えば、コピー機能に対応するコピーアイコン、ファックスに対応するファックスアイコン、文書をスキャンしてメール送信する機能に対応するスキャンｔｏメールアイコン等である。利用者は、操作部１２６をタッチ操作することで、アプリケーション毎に固有の設定情報を設定できる。

記憶装置１２３は、ＨＤＤ（Hard Disk Drive）やＳＳＤ（Solid State Drive）等で構成され、処理プログラムや文書データを記憶する。また、本実施形態では、特に、特定文書（第１文書）に含まれる読取位置情報を記憶する。

画像処理装置１２は、これら以外にも、用紙のパンチやソート等を行うフィニッシャ、ＵＳＢ、ＩＣカードリーダ等から構成され利用者の認証を行う認証部、課金部、人感センサや顔カメラ等を備えてもよい。また、画像処理装置１２は、通信回線１４を介してインターネット及び外部サーバ（ネットワークサーバ）に接続されてもよく、イーサネット（登録商標）やＷｉＦｉを備えてもよい。インターネットを介して外部サーバに接続する際には、認証プロセスが必要となるが、画像処理装置１２は当該認証プロセスを実行するためのアプリケーションを備えていてもよい。

次に、文書読取装置としての画像処理装置１２の文書読取機能（スキャン機能）について説明する。

図２は、制御部１２４の機能ブロック図を示す。制御部１２４は、スキャナモジュール１２８の動作を制御して、フィーダにセットされた１または複数の文書を取り込み、電子データに変換する。そして、利用者から操作部１２６を介してＯＣＲの実行が指示された場合に、当該電子データを対象としてＯＣＲを実行し、その結果を出力する。ＯＣＲ処理は公知の手法が用いられ得る。一般に、ＯＣＲ処理は、正規化処理、特徴抽出処理、マッチング処理、知識処理から構成される。正規化処理では、ＯＣＲ対象の１つの文字を一定の大きさに変換する。特徴抽出処理では、正規化された文字を上下、左右、斜め方向の4つの成分に分解し、４つの成分を例えば７×７画素程度まで圧縮したものを個々の文字の特徴として抽出する。マッチング処理では、抽出された特徴と予め記憶された標準パターンと比較して照合する。知識処理では、認識すべき言語、例えば日本語の単語情報や構文情報を使用し、マッチング処理で得られた候補文字に対して予め登録してある単語辞書と照合することで誤読部分を訂正する。

制御部１２４は、機能ブロックとして、読取位置検出部１２４ａと、読取位置特定部１２４ｂと、ＯＣＲ実行部１２４ｃを備える。

読取位置検出部１２４ａは、第１文書２０を読み取って得られた電子データから、第１文書２０に含まれる読取位置２１を検出することで、読取位置を検出する。読取位置２１は、予め第１文書２０に対するマーキングで設定されており、例えば特定色マーカによる塗りつぶしや囲み等で設定される。読取位置検出部１２４ａは、第１文書２０における読取位置２１の読取位置を検出すると、検出した読取位置の情報（読取位置情報）を記憶装置１２３に記憶する。

読取位置特定部１２４ｂは、第１文書２０と同一または類似形式の第２文書２２に対してＯＣＲを実行する場合の読取位置、すなわちＯＣＲ対象位置を特定する。具体的には、読取位置特定部１２４ｂは、記憶装置１２３に記憶された、第１文書２０から検出された読取位置情報を読み出し、第２文書２２に対する読取位置として特定し、ＯＣＲ実行部１２４ｃに出力する。

ＯＣＲ実行部１２４ｃは、第２文書２２に対してＯＣＲを実行する際に、読取位置特定部１２４ｂで特定された読取位置を対象としたＯＣＲ、すなわちゾーンＯＣＲを実行し、その結果を出力する。第２文書２２は、第１文書２０と同一または類似形式を有するが、「同一形式」とは、第１文書２０に含まれる項目と同一項目が同一位置に存在することを意味し、「類似形式」とは、第１文書２０に含まれる項目と同一項目があるもののその位置が異なることを意味する。

図３は、従来のゾーンＯＣＲ処理を模式的に示す。第２文書２２がゾーンＯＣＲ処理の対象とすると、利用者は、予め第２文書２２を構成する全てのページに対して読取位置２２をマーカ等で設定する。例えば、あるページの上部にある「Ｎｏ．１２３４」の領域をマーカで囲み、別のページの上部にある「ＮＯ．５６７８」の領域をマーカで囲み、さらに別のページの上部にある「ＮＯ．９９９０」の領域をマーカで囲む等である。そして、制御部１２４は、第２文書２２を読み取って読取位置２３を検出し、この読取位置２３においてＯＣＲを実行してその結果を「ＮＯ．１２３４」、「Ｎｏ．５６７８」、「Ｎｏ．９９９９」等と出力する。

このように、第２文書２２の全てのページに対して読取位置をマーカ等で設定するのは煩雑であり、特に第２文書２２が比較的大量のページから構成される場合にはその手間は膨大となり得る。また、文書の全てのページに対して読取位置をマーカ等で設定すると、文書自体がマーカで汚れてしまう。

これに対し、本実施形態では、第２文書２２と同一または類似する形式の第１文書２０に対して読取位置をマーカ等で設定しておけば、その読取位置は記憶装置１２３に記憶され、第２文書２２の読取位置として利用されるので、利用者は、第１文書２０に対してのみ読取位置を設定するだけでよく、第２文書２２に対して読取位置をマーカ等で設定する必要がない。また、マーカによる汚れも抑制され得る。

本実施形態の処理を具体的に説明する。

図４は、第１文書２０及び第２文書２２を具体的に示す。第１文書２０及び第２文書２２は、ともに同一形式の帳票（請求書）であり、「請求書」の見出しに加え、「会社名」、「金額」、「請求日」の各項目が記載されている。第１文書２０及び第２文書２２の各項目名、及びその位置は同一である。第１文書２０は、請求書の帳票の１ページ目に相当し、第２文書２２は、請求書の帳票の２ページ目以降（２ページ目からＭページ目まで）に相当する。画像処理装置１２のスキャナモジュール１２８は、１ページ目としての第１文書２０と、２ページ目以降の第２文書２２を読取対象とする。

１ページ目としての第１文書２０の「会社名」、「金額」、「請求日」の各項目の領域は、特定色のマーカにより囲まれ、あるいは塗りつぶされることで読取位置２１が設定される。２ページ目以降としての第２文書２２には、読取位置２１は設定されない。

図５は、１ページ目としての第１文書２０を読み取って電子データに変換し、電子データから読取位置２１を検出する様子を示す。読取位置２１は、特定色のマーカで設定されている場合には当該特定色を識別することで検出され得る。読取位置２１は、第１文書２０の中で一定数の文字が含まれる領域であり、第１文書２０の一定位置、例えば左上を原点（０，０）としたときの読取位置２１の基準位置（例えば左上）の二次元座標（Ｘ、Ｙ）と、領域の範囲（サイズ）を示す幅及び高さで規定され得る。第１文書２０に読取位置２１が３箇所設定されている場合には、箇所毎にその読取位置が検出され、読取位置情報が生成される。読取位置情報は、
（Ｘ、Ｙ、幅、高さ）
＝（１０，１５，１００，２０）
＝（１０，７０，１２０，１０）
＝（１５，１００，１２０，１０）
等である。検出された読取位置２１の読取位置情報は、第１文書２０に関連付けて記憶装置１２３に記憶される。

図６は、２ページ目以降としての第２文書２２を読み取って電子データに変換し、電子データを対象としてゾーンＯＣＲを実行する様子を示す。記憶装置１２３には、第１文書２０に関連付けて読取位置２１の読取位置情報が記憶されているので、制御部１２４は、これらの読取位置情報を記憶装置１２３から読み出し、当該読取位置情報で特定される読取位置においてゾーンＯＣＲを実行する。従って、２ページ目の請求書でも、１ページ目の請求書に設定された読取位置２１と同一位置でＯＣＲが実行され、具体的には、
（Ｘ、Ｙ、幅、高さ）
＝（１０，１５，１００，２０）
＝（１０，７０，１２０，１０）
＝（１５，１００，１２０，１０）
で特定される３箇所においてＯＣＲが実行される。この結果、２ページ目のＯＣＲ実行結果として、「会社名」の項目から「株式会社ＸＸ」が文字列として抽出され、「金額」の項目から「￥３２，４００」が文字列として抽出され、「請求日」の項目から「２０１７／△△／△」が文字列として抽出される。

同様に、３ページ目の請求書でも、１ページ目の請求書に設定された読取位置２１と同一位置でＯＣＲが実行され、具体的には、
（Ｘ、Ｙ、幅、高さ）
＝（１０，１５，１００，２０）
＝（１０，７０，１２０，１０）
＝（１５，１００，１２０，１０）
で特定される３箇所においてＯＣＲが実行される。この結果、３ページ目のＯＣＲ実行結果として、「会社名」の項目から「株式会社○○」が文字列として抽出され、「金額」の項目から「￥１０，８００」が文字列として抽出され、「請求日」の項目から「２０１７／××／×」が文字列として抽出される。

なお、１ページ目は第１文書２０として機能するものの、同時に請求書の帳票として第２文書２２としても機能する場合には、読取位置２１を検出して読取位置情報を記憶装置１２３に記憶するとともに、記憶した読取位置情報を用いて１ページ目についてもゾーンＯＣＲを実行してその結果を出力してもよい。

図４では、請求書の帳票の１ページ目を第１文書２０とし、２ページ目以降を第２文書２２としているが、帳票にヘッダシートを付加し、ヘッダシートを第１文書２０とし、１ページ目からＭページ目の帳票自体を第２文書２２としてもよい。

図７は、この場合の処理を模式的に示す。

ヘッダシートとしての第１文書２０を読み取って電子データに変換し、電子データから読取位置２１を検出する様子を示す。読取位置２１は、特定色のマーカで設定されている場合には当該特定色を識別することで検出され得る。第１文書２０に読取位置２１が３箇所設定されている場合には、箇所毎にその読取位置が検出され読取位置情報が生成される。
（Ｘ、Ｙ、幅、高さ）
＝（１０，１５，１００，２０）
＝（１０，７０，１２０，１０）
＝（１５，１００，１２０，１０）
等である。検出されたこれらの読取位置情報は、第１文書２０に関連付けて記憶装置１２３に記憶される。

その後、１ページ目以降としての第２文書２２を読み取って電子データに変換し、電子データを対象としてゾーンＯＣＲを実行する様子を示す。記憶装置１２３には、第１文書２０に関連付けて読取位置情報が記憶されているので、制御部１２４は、これらの読取位置情報を記憶装置１２３から読み出し、当該読取位置情報で特定される読取位置においてゾーンＯＣＲを実行する。従って、１ページ目の請求書でも、ヘッダシートに設定された読取位置２１と同一位置でＯＣＲが実行され、具体的には、
（Ｘ、Ｙ、幅、高さ）
＝（１０，１５，１００，２０）
＝（１０，７０，１２０，１０）
＝（１５，１００，１２０，１０）
で特定される３箇所においてＯＣＲが実行される。この結果、１ページ目のＯＣＲ実行結果として、「会社名」の項目から「株式会社ＸＸ」が文字列として抽出され、「金額」の項目から「￥３２，４００」が文字列として抽出され、「請求日」の項目から「２０１７／△△／△」が文字列として抽出される。２ページ目〜Ｍページ目についても同様である。

図８は、本実施形態の処理フローチャートを示す。第１文書２０としてヘッダシートを用いる場合の処理である。

まず、利用者は、操作部１２６を操作して、ヘッダシートの枚数を入力する（Ｓ１０１）。なお、デフォルト枚数を１とし、ヘッダシートの枚数が１枚の場合には入力を省略してもよい。

次に、制御部１２４は、ヘッダシートをスキャナモジュール１２８で読み取り、ＯＣＲ対象領域としての読取位置２１を検知する（Ｓ１０２）。読取位置２１が特定色のマーカで設定されている場合、当該特定色を検知する。ＯＣＲ対象領域の検知は、当該ヘッダシートについてＯＣＲ対象領域が検知されるまで繰り返し実行され（Ｓ１０３）、当該ヘッダシートにおける全てのＯＣＲ対象領域が読取位置２１として検知される。

全てのＯＣＲ対象領域が検知された後、検知されたＯＣＲ対象領域を読取位置情報として記憶装置１２３に記憶することでＯＣＲ対象領域リストを更新する（Ｓ１０４）。例えば、既述したように、読取位置２１として３箇所存在すれば、当該ヘッダシートに関連付けて、
（１０，１５，１００，２０）
（１０，７０，１２０，１０）
（１５，１００，１２０，１０）
のリストが作成されて記憶装置１２３に記憶される。

次に、当該ヘッダシートが、Ｓ１０１で入力された枚数の最終ヘッダシートであるか否かを判定する（Ｓ１０５）。最終ヘッダシートでなければ（Ｓ１０５でＮＯ）、次のヘッダシートに対してＳ１０２以降の処理が繰り返し実行され、ヘッダシートに関連付けてＯＣＲ対象領域リストが作成され記憶装置１２３に記憶される。

全てのヘッダシートに対してＯＣＲ対象領域リストが記憶装置１２３に記憶されると（Ｓ１０５でＹＥＳ）、最終ヘッダシートの次の頁をＯＣＲ対象ページに設定する（Ｓ１０６）。

次に、制御部１２４は、記憶装置１２３に記憶されているＯＣＲ対象領域リストから１ページ分のＯＣＲ対象領域群を読み出して取得し（Ｓ１０７）、このＯＣＲ対象領域群を用いてＯＣＲ対象ページに対してゾーンＯＣＲ処理を実行する（Ｓ１０８）。ゾーンＯＣＲ処理を実行して文字列を抽出すると、抽出した文字列を記憶装置１２３に記憶する（Ｓ１０９）。なお、記憶装置１２３に記憶するとともに表示装置に表示してもよく、あるいは通信回線１４を介して端末装置１０あるいは外部装置（外部サーバ）に出力してもよい。

次に、同一ページの最終領域か否かを判定し（Ｓ１１０）、最終領域でなければゾーンＯＣＲ処理を繰り返す。これにより、ＯＣＲ対象領域が３箇所あればこれら３箇所の全てにおいてゾーンＯＣＲ処理が実行され、その結果が記憶装置１２３に記憶される。以上の処理は、全てのページに対して繰り返し実行される（Ｓ１１１）。

図８の処理では、利用者が操作部１２６を操作してヘッダシートの枚数を入力しているが、制御部１２４がヘッダシートの枚数を検出してもよい。

図９は、この場合の処理フローチャートを示す。

まず、制御部１２４は、入力された文書に対してＯＣＲ対象領域を検知する（Ｓ２０１）。なお、図８に示すような、利用者が操作部１２６を操作してヘッダシートの枚数を入力する処理はない。

次に、ＯＣＲ対象領域が検知されたか否かを判定し（Ｓ２０２）、検知された場合には（Ｓ２０２でＹＥＳ）、検知されたＯＣＲ対象領域を記憶装置１２３に記憶することでＯＣＲ対象領域リストを更新する（Ｓ２０３）。例えば、既述したように、読取位置２１として３箇所存在すれば、当該ヘッダシートに関連付けて、
（１０，１５，１００，２０）
（１０，７０，１２０，１０）
（１５，１００，１２０，１０）
のリストが作成されて記憶装置１２３に記憶される。

次に、当該ページが最終ページであるか否かを判定する（Ｓ２０４）。最終ページでなければ（Ｓ２０４でＮＯ）、次のページに対してＳ２０１以降の処理が繰り返し実行され、ＯＣＲ対象領域、すなわち読取位置２１が設定された全てのページについてＯＣＲ対象領域リストが作成され記憶装置１２３に記憶される。

ＯＣＲ対象領域、すなわち読取位置２１が設定された全てのページについて処理が完了すると、もはやＯＣＲ対象領域が検知されなくなる（Ｓ２０２）。このページから第２文書２２が始まることになるので、制御部１２４は、記憶装置１２３に記憶されているＯＣＲ対象領域リストから１ページ分のＯＣＲ対象領域群を読み出して取得し（Ｓ２０５）、このＯＣＲ対象領域群を用いてＯＣＲ対象ページに対してゾーンＯＣＲ処理を実行する（Ｓ２０６）。ゾーンＯＣＲ処理を実行して文字列を抽出すると、抽出した文字列を記憶装置１２３に記憶する（Ｓ２０７）。記憶装置１２３に記憶するとともに表示装置に表示してもよく、あるいは通信回線１４を介して端末装置１０あるいは外部装置（外部サーバ）に出力してもよい。

次に、同一ページの最終領域か否かを判定し（Ｓ２０８）、最終領域でなければゾーンＯＣＲ処理を繰り返す。これにより、ＯＣＲ対象領域が３箇所あればこれら３箇所の全てにおいてゾーンＯＣＲ処理が実行され、その結果が記憶装置１２３に記憶される。以上の処理は、全てのページに対して繰り返し実行される（Ｓ２０９、Ｓ２１０）。

＜実施形態２＞
実施形態１では、第１文書２０と第２文書２２が同一形式の場合について説明したが、本実施形態では第１文書２０と第２文書２２が類似形式の場合、すなわち項目は共通するがその位置は異なる場合について説明する。

図１０は、本実施形態における第１文書２０及び第２文書２２を示す。第１文書２０と第２文書２２は、互いに異なる種類の帳票である。第１文書２０には、項目として「お客様番号」、「有効期限」が含まれる。第２文書２２にも、項目として「お客様番号」、「有効期限」が含まれるが、その位置は第１文書２０と異なる。第１文書２０の「お客様番号」及び「有効期限」はともに上部に位置しているが、第２文書２２の一つは「お客様番号」が上部に位置しているものの「有効期限」は下部に位置し、第２文書２２の他の一つは「お客様番号」が中央部に位置して「有効期限」は下部に位置している。

このように位置が異なる場合、項目の属性とその値に着目し、属性とその値を組として読取位置情報とする。例えば、第１文書２０において、
「お客様番号０１２３４」
との項目がある場合、属性は「お客様番号」でその値は「０１２３４」であり、値は属性の右側に位置している。そこで、属性とその値の相対的位置関係に着目し、
属性：「お客様番号」
値の属性との位置関係：右側
値の幅：１００
値の高さ：２０
等により読取位置情報を生成する。値の幅及び高さにより、値が記載されている領域のサイズが特定される。

ここで、値の属性との位置関係については、右側、左側、上側、下側、右下側等と規定され得るが、属性の基準位置からの相対的位置座標、例えば（１０，１０）等で規定してもよい。右側、下側等は、位置座標の一つの表現といえる。

図１１は、第１文書２０に設定された読取位置２１を具体的に示す。制御部１２４は、特定色のマーカ等で設定された読取位置２１を検出し、属性、その値の属性との位置関係、値の幅、値の高さを検出する。すなわち、「お客様番号０１２３４」の項目について設定された読取位置２１に関して、
属性：「お客様番号」
値の属性との位置関係：右側
値の幅：１００
値の高さ：２０
と検出する。また、「有効期限２０１８／３／１０」の項目について設定された読取位置２１に関して、有効期限の値が有効期限の下側に位置していることから
属性：「有効期限」
値の属性との位置関係：下側
値の幅：８０
値の高さ：３０
と検出する。制御部１２４は、検出した属性とその値の組データを、読取位置情報として記憶装置１２３に記憶する。

なお、実施形態１では、読取位置２１は第１文書２０内における２次元座標（Ｘ，Ｙ）及び領域サイズで規定されているが、実施形態２では，読取位置２１は第１文書２０内における属性とその値の相対的位置関係で規定されているので、第２文書２２において対応する属性を検出するために、まず第２文書２２のページ全体を対象としてＯＣＲを実行する。

図１２は、本実施形態の処理フローチャートを示す。

まず、利用者は、操作部１２６を操作して、ヘッダシートの枚数を入力する（Ｓ３０１）。なお、デフォルト枚数を１とし、ヘッダシートの枚数が１枚の場合には入力を省略してもよい。

次に、制御部１２４は、ヘッダシートをスキャナモジュール１２８で読み取り、ＯＣＲ対象領域としての読取位置２１を検知する（Ｓ３０２）。読取位置２１が特定色のマーカで設定されている場合、当該特定色を検知する。ＯＣＲ対象領域の検知は、当該ヘッダシートについてＯＣＲ対象領域が検知されるまで繰り返し実行され（Ｓ３０３）、当該ヘッダシートにおける全てのＯＣＲ対象領域が読取位置２１として検知される。

全てのＯＣＲ対象領域が検知された後、検知されたＯＣＲ対象領域を記憶装置１２３に記憶することでＯＣＲ対象領域リストを更新する（Ｓ３０４）。例えば、既述したように、読取位置２１として２箇所存在すれば、当該ヘッダシートに関連付けて、
属性：「お客様番号」
値の属性との位置関係：右側
値の幅：１００
値の高さ：２０
属性：「有効期限」
値の属性との位置関係：下側
値の幅：８０
値の高さ：３０
のリストが作成されて記憶装置１２３に記憶される。

次に、当該ヘッダシートが、Ｓ１０１で入力された枚数の最終ヘッダシートであるか否かを判定する（Ｓ３０５）。最終ヘッダシートでなければ（Ｓ３０５でＮＯ）、次のヘッダシートに対してＳ３０２以降の処理が繰り返し実行され、ヘッダシートに関連付けてＯＣＲ対象領域リストが作成され記憶装置１２３に記憶される。

全てのヘッダシートに対してＯＣＲ対象領域リストが記憶装置１２３に記憶されると（Ｓ３０５でＹＥＳ）、最終ヘッダシートの次の頁をＯＣＲ対象ページに設定する（Ｓ３０６）。

次に、制御部１２４は、記憶装置１２３に記憶されているＯＣＲ対象領域リストから１ページ分の属性と値の組を読み出して取得する（Ｓ３０７）。そして、ＯＣＲ対象ページ全体に対してＯＣＲを実行し、読み出した属性と一致する領域を検出し、さらに検出した属性の値の文字列を抽出する（Ｓ３０８）。例えば、読み出した属性と値が、
属性：「お客様番号」
値の属性との位置関係：右側
値の幅：１００
値の高さ：２０
であれば、制御部１２４は、ＯＣＲ対象ページの全体に対してＯＣＲを実行し、文字列「お客様番号」を抽出する。そして、抽出した「お客様番号」を基準として、その右側に位置する幅１００、高さ２０の領域のＯＣＲ処理結果から文字列を抽出することで属性の値、例えば「０１２３４」等を取得する。属性はページ全体のＯＣＲ処理結果から抽出されるが、当該属性の値は、属性との相対的位置関係から規定される特定領域に対するゾーンＯＣＲで取得される。ＯＣＲ処理を実行して属性とその値を抽出すると、抽出した属性とその値を記憶装置１２３に記憶する（Ｓ３０９）。なお、記憶装置１２３に記憶するとともに表示装置に表示してもよく、あるいは通信回線１４を介して端末装置１０あるいは外部装置（外部サーバ）に出力してもよい。

次に、同一ページの最終領域か否かを判定し（Ｓ３１０）、最終領域でなければ処理を繰り返す。これにより、ＯＣＲ対象領域が２箇所あればこれら２箇所の全てにおいてＯＣＲ処理が実行され、その結果が記憶装置１２３に記憶される。以上の処理は、全てのページに対して繰り返し実行される（Ｓ３１１）。

本実施形態では、属性とその値の相対的位置関係が同一であれば、たとえ属性自体の位置が文書毎に変化していても対応し得る。

なお、本実施形態において、読取位置２１のデータとして属性とその値の相対的位置関係に許容範囲を設定しておくことで、文書毎に属性自体の位置が変化するのみならず属性とその値の相対的位置関係が変化している場合にも対応し得る。例えば、読取位置情報として
属性：「お客様番号」
値の属性との位置関係：右側または下側
値の幅：１００
値の高さ：２０
とする等である。この場合、Ｓ３０８では、検出された属性の右側、及び下側のゾーンＯＣＲ処理を実行して値の文字列を抽出する。

＜実施形態３＞
実施形態１，２では、第２文書２２が１ページ単位の帳票の場合について説明したが、第２文書２２が複数ページで１組の帳票の場合もあり得る。あるいは、第２文書２２が表と裏の両面文書の場合もあり得る。

このような場合、第１文書２０についても第２文書２２のページ構成に対応させて複数ページを１組とする、あるいは表と裏の両面を１組とすればよい。

図１３は、本実施形態における第１文書２０及び第２文書２２を具体的に示す。第１文書２０及び第２文書２２は、ともに同一形式の帳票（契約書）であり、表面及び裏面を１組として構成される。表面には「契約書」の見出しに加え、「会社名」、「担当者」の各項目が記載され、裏面には「契約日」の項目が記載されている。第１文書２０及び第２文書２２の各項目名、及びその位置は同一である。第１文書２０は、契約書の帳票の１ページ目の表面２０ａ及び裏面２０ｂに相当し、第２文書２２は、契約書の帳票の２ページ目以降（２ページ目からＭページ目まで）の表面２２ａ及び裏面２２ｂに相当する。画像処理装置１２のスキャナモジュール１２８は、１ページ目としての第１文書２０の表面２０ａ及び裏面２０ｂと、２ページ目以降の第２文書２２の表面２２ａ及び裏面２２ｂを読取対象とする。

１ページ目としての第１文書２０の表面２０ａの「会社名」、「担当者」、及び裏面２０ｂの「契約日」の各項目の領域は、特定色のマーカにより囲まれ、あるいは塗りつぶされることで読取位置２１が設定される。２ページ目以降としての第２文書２２には、読取位置２１は設定されない。

図１４は、１ページ目としての第１文書２０を読み取って電子データに変換し、電子データから読取位置２１を検出する様子を示す。読取位置２１は、特定色のマーカで設定されている場合には当該特定色を識別することで検出され得る。読取位置情報は、第１文書２０の一定位置、例えば左上を原点（０，０）としたときの読取領域の左上の二次元座標（Ｘ、Ｙ）と、読取領域のサイズを示す幅及び高さで規定され得る。第１文書２０の表面２０ａに読取位置２１が３箇所設定され、裏面２０ｂに１箇所設定されている場合には、箇所毎にその読取位置情報が生成される。
表面２０ａ：
（Ｘ、Ｙ、幅、高さ）
＝（１０，１５，１００，２０）
＝（１０，７０，１２０，１０）
＝（１５，１００，１２０，１０）
裏面２０ｂ：
（Ｘ、Ｙ、幅、高さ）
＝（１５，１００，１４０，１０）
等である。検出されたこれらの読取位置情報は、第１文書２０に関連付けて記憶装置１２３に記憶される。

なお、本実施形態では、読取位置情報を実施形態１と同様に第１文書２０の一定位置を原点（０，０）としたときの読取領域の左上の二次元座標（Ｘ、Ｙ）と、読取領域のサイズを示す幅及び高さで規定しているが、実施形態２と同様に属性とその値の相対的位置関係と、値領域のサイズを示す幅及び高さで規定してもよい。例えば、
表面２０ａ：
属性：「お客様番号」
値の属性との位置関係：右側
値の幅：１００
値の高さ：２０
裏面２０ｂ：
属性：「有効期限」
値の属性との位置関係：下側
値の幅：８０
値の高さ：３０
等である。

以上、本発明の実施形態について説明したが、本発明はこれらの実施形態に限定されるものではなく、種々の変形が可能である。以下、変形例について説明する。

＜変形例１＞
実施形態では、第１文書２０の中の属性とその値の組に着目して読取位置情報を生成し記憶装置１２３に記憶しているが、属性としては「お客様番号」や「有効期限」等の特定文字列の他に、特定色や特定形状としてもよい。

＜変形例２＞
実施形態では、第１文書２０に対するマーキングとして、特定色のマーカによる囲みや塗りつぶし、チェックマークの追加等を例示したが、これ以外にも、無色透明による塗りつぶしや囲みによるマーキングでもよく、制御部１２４は、第１文書２０に対してブラックライトを照射することで第１文書２０の無色透明マーキングを検出して読取位置情報を生成してもよい。特定色のマーカによる囲みでは、表を構成する特定色の罫線と区別すべく、当該罫線色以外の色とするのが望ましい。

また、第１文書２０に対するマーキングとしては、１種類のみならず、複数種類が混在していてもよい。例えば、特定色のマーカによる囲みと塗りつぶしの組合せ、特定色マーカによる囲みとチェックマークの組合せ等である。

図１５は、複数種類が混在するマーキングの例を示す。第１文書２０の読取位置２１は、特定色（例えば黄色や赤）マーカによる囲み、塗りつぶし、及びチェックマークにより設定され得る。

さらに、第１文書２０に対するマーキングは、利用者が第１文書２０に対して直接行ってもよいが、第１文書２０をスキャナモジュール１２８で電子データに変換して得られた電子画像を操作部１２６に表示し、利用者が操作部１２６を操作することで行ってもよい。

＜変形例３＞
実施形態１では、図５に示すように読取位置情報として位置座標、幅、高さを規定し、実施形態２では、図１１に示すように読取位置情報として属性、属性との相対的位置関係、幅、高さを規定しているが、これらを組み合わせてもよい。すなわち、ある読取位置２１については図５に示す形式とし、別の読取位置２１については図１１に示す形式とする等である。

＜変形例４＞
実施形態では、第１文書２０の読取位置２１を検出して生成された読取位置情報を用いて、第２文書２２の読取位置を特定しているが、読取位置の特定には、厳密に一致する位置の他、許容範囲内にある最近位置も含まれ得る。従って、第２文書２２において読取位置情報で特定される位置に文字列が存在しない場合（例えばチェックマークの場合）には、読取位置情報で特定される位置に最も近い文字列をＯＣＲの対象とすればよい。

＜変形例５＞
実施形態１では、第２文書２２のページ毎にゾーンＯＣＲを実行してＯＣＲ結果を出力しているが、第２文書２２が同一形式の場合には、第２文書２２の全てのページについて読取位置情報で特定される読取位置を一括して読み取り、その後にページ毎にＯＣＲを実行してその結果を出力してもよい。

１０端末装置、１２画像処理装置、１４通信回線、２０第１文書、２２第２文書、１２３記憶装置、１２４制御部、１２８スキャナモジュール。

Claims

文書読取部と、
読取位置が設定されている第１文書に対して前記文書読取部で読み取り、読取位置情報として記憶する記憶部と、
前記第１文書と同一または類似形式であって、前記読取位置が設定されていない第２文書に対して前記文書読取部で読み取る際の読取位置を、前記記憶部に記憶された前記読取位置情報を用いて特定する読取位置特定部と、
を備える文書読取装置。
前記読取位置情報は、前記第１文書の中で一定数の文字が含まれる位置座標とその範囲の情報を含む
請求項１に記載の文書読取装置。
前記読取位置情報は、前記第１文書における特定位置に対する相対的位置の情報を含む
請求項１に記載の文書読取装置。
前記相対的位置の情報は、前記特定位置に対する位置座標とその範囲の情報を含む
請求項３に記載の文書読取装置。
前記特定位置は、特定属性の位置である
請求項３に記載の文書読取装置。
前記記憶部は、前記第２文書が複数枚からなる組を構成する場合に、前記第１文書に対して前記組に対応させて前記文書読取部で読み取り、読取位置情報として記憶する
請求項１に記載の文書読取装置。
前記複数枚は表面と裏面である
請求項６に記載の文書読取装置。
前記複数枚は、１組の帳票を構成する
請求項６に記載の文書読取装置。
前記複数枚からなる組は、前記読取位置が互いに異なる
請求項６に記載の文書読取装置。
前記第１文書における前記読取位置の設定は、マーキングによる
請求項１に記載の文書読取装置。
前記マーキングは、特定色による囲み、特定色による塗りつぶし、チェックマークの追加、無色透明による囲み、無色透明による塗りつぶしの少なくともいずれかである
請求項１０に記載の文書読取装置。
前記第１文書の画像を表示する表示部と、
前記第１文書の画像に対してマーキングする操作部と、
をさらに備える請求項１０に記載の文書読取装置。
前記第１文書は、前記第２文書に対する１または複数のヘッダシートである
請求項１に記載の文書読取装置。
前記ヘッダシートの枚数は、利用者により設定される
請求項１３に記載の文書読取装置。
前記ヘッダシートの枚数は、前記文書読取部で判定される
請求項１３に記載の文書読取装置。
コンピュータに、
読取位置が設定されている第１文書を読み取るステップと、
前記読取位置についての読取位置情報を生成するステップと、
前記読取位置情報を記憶部に記憶するステップと、
前記読取位置情報を記憶した後に、前記第１文書と同一または類似形式であって、前記読取位置が設定されていない第２文書を読み取る際の読取位置を、前記記憶部に記憶された前記読取位置情報を用いて特定するステップ
を実行させるプログラム。