JP2000278514A

JP2000278514A - 文書画像結合装置、文書画像結合方法及び文書画像結合プログラムを記録した記録媒体

Info

Publication number: JP2000278514A
Application number: JP11111708A
Authority: JP
Inventors: 裕幸 ▲高▼倉; Hiroyuki Takakura; Kenichiro Sakai; 憲一郎酒井; Hirotaka Chiba; 広隆千葉; Tsuguo Noda; 嗣男野田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1999-01-18
Filing date: 1999-04-20
Publication date: 2000-10-06
Anticipated expiration: 2019-04-20
Also published as: JP3821267B2; US7194144B1

Abstract

(57)【要約】【課題】分割して読み取った文書画像を自動的に結合す
ることである。【解決手段】文字領域検出部１４は、分割して読み取っ
た２つの文書画像の文字領域を検出する。文字認識部２
２は文字領域内の文字を認識して文字コードを取得す
る。重なり位置検出部２３は、２つの文書画像の文字領
域の位置及び大きさと文字コードを比較して、一致度が
高い行画像の位置を重なり位置として画像結合部に出力
する。画像結合部１６はその重なり位置で２つの文書画
像を結合する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、スキャナ等で読み
取った複数の文書画像を結合して１つの文書画像を再生
する文書画像結合装置、文書画像結合方法及び文書画像
を結合するプログラムを記録した記録媒体に関する。

【０００２】

【従来の技術】新聞、設計図面等のサイズの大きい画像
を読み取りたいという要望がある。そのよう場合、Ａ１
サイズ等の大きな画像を直接読み取れるスキャナーを有
する画像読取装置を用いることは可能であるが、大型の
画像読取装置は、装置のコストが高いばかりでなく、広
い設置場所が必要となるなどの問題点があった。

【０００３】そこで、例えばＡ４サイズのスキャナーを
用いてＡ４より大きなサイズの画像を分割して読み取
り、分割した画像をオペレータが画面上で見ながら手動
で結合する方法、あるいは原稿または原稿に被せる透明
シートに位置合わせのマークを付けておいて、分割して
読み取った複数の画像をそのマークを利用して結合する
方法が提案されている。

【０００４】例えば、特開平１−２２９５５９号公報に
は、１回の読み取り動作によって読み取り可能な最大有
効サイズより大きな原稿を、その最大有効サイズより小
さい領域に分割するための分割指示マークを予め原稿に
付けておき、その分割指示マークを含むように複数の領
域に分割して画像を読み取り、分割指示マークの位置情
報に基づいて分割した画像を１つの画像に結合する技術
について記載されている。

【０００５】図３４は、予めマークが付けられた画像を
分割して読み取り、読み取った画像をマークを元に結合
する従来の結合方法の説明図である。この例では、分割
した画像を結合するためのマークを入力対象画像に予め
付けておいて、第１スキャンでそのマークを含むように
入力対象画像の左側の第１画像を読み取り、同様に第２
スキャンでそのマークを含むように右側の第２画像を読
み取る。そして、第１及び第２画像のマークの位置を検
出し、マークの位置が一致するように２つの画像を結合
する。これにより元の入力対象画像を復元することがで
きる。

【０００６】最近、携帯可能なノート型のパーソナルコ
ンピュータが普及するにつれて、ノート型のパーソナル
コンピュータで使用できるような小型で持ち運びが容易
なハンドヘルドスキャナーが開発、製品化されている。
この種のハンドヘルドスキャナーは、本体を小型化する
ために小型の光電変換センサを使用しているので、一度
にスキャンできる幅が狭い。そのため、例えばＡ４サイ
ズの原稿でも複数回に分けてスキャンした後、読み取っ
た画像を結合する必要が生じる。

【０００７】

【発明が解決しようとする課題】しかしながら、スキャ
ナーで読み取った画像をオペレータが手動で結合する方
法は操作が煩雑であるという問題点がある。また、入力
対象画像にマークを付ける方法は、画像を読み取る度に
マークを付ける必要があり使い勝手が悪い。

【０００８】本発明の課題は、分割して読み取った文書
画像を自動的に結合できるようにすることである。

【０００９】

【課題を解決するための手段】請求項１記載の文書画像
結合装置は、分割して読み取られた複数の文書画像のそ
れぞれについて文字領域を抽出する文字領域抽出手段
と、文字領域抽出手段により抽出された文字領域内の文
字画像を文字認識する文字認識手段と、文字認識手段に
より得られるそれぞれの文書画像の文字認識結果に基づ
いて複数の文書画像の重なりを検出する重なり検出手段
と、重なり検出手段により検出された重なり位置で複数
の文書画像を結合する画像結合手段とを備える。

【００１０】この発明によれば、ユーザが分割して読み
取った複数の文書画像を結合するための操作を特別に行
わなくとも、あるいは文書画像に予め結合のためのマー
ク等を付けなくとも複数の文書を自動的に結合すること
ができる。

【００１１】請求項２記載の文書画像結合装置は、分割
して読み取られた複数の文書画像のそれぞれについて文
字領域を抽出する文字領域抽出手段と、文字領域抽出手
段により抽出された複数の文書画像の複数の文字領域の
位置と大きさとを比較して一致度の高い複数の文字領域
を検出し、検出した一致度の高い複数の文字領域に基づ
いて複数の文書画像の重なりを検出する重なり検出手段
と、重なり検出手段により検出された重なり位置で複数
の文書画像を結合する画像結合手段とを備える。

【００１２】この発明によれば、分割して読み取られた
複数の文書画像を結合するための操作を何も行わなくと
も分割した文書画像を結合して１つの文書画像を再生す
ることができる。

【００１３】例えば、文字認識手段が、抽出された文字
領域内の文字画像を文字認識して文字コードに変換し、
重なり検出手段がそれぞの文書画像の複数の文字コード
を比較して文書画像の重なり位置を検出する。

【００１４】また、文字領域抽出手段が、分割された文
書画像の行画像単位で文字領域を抽出し、重なり検出手
段がそれぞれの行画像の文字領域を比較して重なり位置
を検出するようにしても良い。

【００１５】さらに、文書画像を２つに分割して読み取
って、行画像単位で比較するときに、文書画像の縁から
中心に向かう方向に文字領域の比較を行って文書画像の
重なり位置を検出するようにしても良い。

【００１６】この場合、２つの文書画像で一致する可能
性が高い縁から順に行画像を比較することでより短時間
で重なり位置を検出することができる。また、重なり検
出手段は、文書画像の特定の領域内の文字領域を重なり
位置の検出対象としても良い。

【００１７】文書を重なり部分を含んで２分割して読み
取る場合、重なって読み取られる領域はある程度限定さ
れるので、特定の領域内の文字領域を比較することで、
重なり位置を効率的に検出することができる。

【００１８】また、重なり検出手段は、文書を下から中
心に向かう方向、上から中心に向かう方向、左から中心
に向かう方向、あるいは右から中心に向かう方向等の複
数の検出方向の中で予め優先順位の定められた方向から
順に重なり位置を検出するようにしても良い。

【００１９】例えば、横書きの文書を２つに分割して読
み取る場合には、最初に文書の上側を読み取り、次に下
側を読み取ることが多いと思われるので、最初に読み取
った文書画像の下側から中心に向かう方向、あるいは２
番目に読み取った文書画像の上側から中心に向かう方向
を優先順位の１番目として設定し、最初にその方向で２
つの文書画像の文字領域の位置、大きさ、あるいは文字
コードを比較することで効率的に重なり位置を検出する
ことができる。

【００２０】請求項１５記載の発明は、分割して読み取
られた複数の文書画像の内の任意数の文書画像またはそ
れぞれの文書画像を複数の領域に分割する領域分割手段
と、領域分割手段により分割された複数の領域のそれぞ
れについて行画像を抽出する行画像抽出手段と、行画像
抽出手段により抽出されたそれぞれの領域の行画像の文
字領域を比較して一致度の高い文字領域の位置に基づい
て複数の文書画像の重なり位置を検出する重なり検出手
段と、重なり検出手段により検出された重なり位置で複
数の文書画像を結合する画像結合手段とを備える。

【００２１】この発明によれば、文書画像に表、図形等
が含まれている場合でも、文書画像を複数の領域に分割
し、領域毎に行画像を抽出することで、図形等を含まな
い行画像を抽出することが可能となる。従って、それら
の行画像の文字領域を比較することで文書画像の重なり
位置を正確に検出することができる。

【００２２】請求項２９記載の発明は、分割して読み取
られた複数の文書画像の内の任意数の文書画像またはそ
れぞれの文書画像を複数の領域に分割する領域分割手段
と、領域分割手段により分割された複数の領域のそれぞ
れについて行画像を抽出する行画像抽出手段と、行画像
抽出手段により抽出されたそれぞれの領域の行画像の文
字領域を比較して一致度の高い文字領域の位置に基づい
て複数の文書画像の重なり位置を検出する重なり検出手
段と、重なり検出手段により検出された重なり位置で複
数の文書画像を結合する画像結合手段と、複数の文書画
像の自動結合を行うか否かを表示画面上で設定できる設
定手段とを備える。

【００２３】この発明によれば、ユーザは表示画面上に
表示される設定手段により文書画像の自動結合を行うか
否かを簡単に設定できる。例えば、表示画面上にボタン
を表示し、そのボタンにより自動結合の実行の有無を指
定できるようにすることで、画像を自動結合させるか否
かの操作が非常に簡単になる。

【００２４】また、使用するスキャナの解像度、文書画
像の結合枚数、読み取り対象の文書画像の用紙サイズ等
を画面上で設定できるので、文書画像を結合するための
条件の設定が簡単になる。

【００２５】

【発明の実施の形態】以下、本発明の実施の形態を図面
を参照しながら説明する。図１は、本発明の第１の実施
の形態の文書画像結合装置（例えば、パーソナルコンピ
ュータで構成される）１１のブロック図である。この第
１の実施の形態は、２つの文書画像の文字領域を抽出
し、それぞれの文字領域の大きさ、位置を比較して２つ
の文書の重なり位置を検出するものである。画像入力手
段は、例えばハンディスキャナ等からなる。文書画像結
合システムは、例えば、文書画像結合機能を有するパー
ソナルコンピュータとハンディスキャナとから構成され
る。

【００２６】ハンディスキャナ等により読み取られた文
書画像は、画像上のノイズ等を除去した後、必要に応じ
て傾き補正等の前処理を行って第１及び第２の画像格納
部１２，１３に格納される。ここで、最初に読み取られ
た文書画像は、第１の文書画像として第１の画像格納部
１２に格納され、２番目に読み取られた文書画像は第２
の文書画像として第２の画像格納部１３に格納される。

【００２７】文字領域検出部１４は、スキャナーで読み
取られた第１及び第２の文書画像の大きさ（横画素数、
縦画素数）を重なり位置検出部１５に通知する。そし
て、重なり位置検出部１５により指示された領域から１
行分の行画像を抽出し、行画像の各文字領域の座標、例
えば文書画像の左上角を原点とした直交座標における各
文字領域の左上角の座標及び大きさを求め、それらを重
なり位置検出部１５に通知する。なお、文字領域とは、
文字に外接する四角形で囲まれる領域を指す。

【００２８】重なり位置検出部１５は、第１及び第２の
文書画像の行画像の各文字領域の大きさと位置とを比較
し、大きさと位置の一致度の高い行画像の位置を文書画
像の重なり位置と判断し、例えば一致した行画像の先頭
の文字領域の座標と最後の文字領域の座標とを重なり位
置座標として画像結合部１６に出力する。

【００２９】画像結合部１６は、重なり位置検出部１５
から出力される重なり位置座標に基づいて２つの文書画
像を結合して１つの文書画像に再生する。この第１の実
施の形態によれば、２つの文書画像の行画像の文字領域
の位置と大きさを比較することにより２つの文書画像の
重なり位置を検出し、その重なり位置で文書を結合する
ことができる。従って、ユーザは文書画像を結合するた
めの操作を何も行わなくとも、分割して読み取った複数
の文書画像を結合させることができる。

【００３０】次に、図２は、本発明の第２の実施の形態
の文書画像結合装置２１のブロック図である。この第２
の実施の形態は、分割して読み取った２つの文書画像の
それぞれについて文字領域内の文字の認識を行って対応
する文字コードを得て、２つの文書画像の文字コードと
文字領域の位置及び大きさの２つを比較して重なり位置
を検出するものである。

【００３１】図２のブロックにおいて、第１の画像格納
部１２、第２の画像格納部１３及び文字領域検出部１４
の機能は図１と同一である。文字認識部２２は、文字領
域検出部１４で検出された文字領域の文字画像の文字認
識を行って対応する文字コードを得て、その文字コード
を重なり位置検出部２３に出力する。

【００３２】重なり位置検出部２３は、第１及び第２の
文書画像の行画像の文字領域の位置及び大きさと文字コ
ードを比較し、一致度の高い行画像の位置を重なり位置
と判断し、その行画像の位置座標を画像結合部１６に出
力する。画像結合部１６は、その位置座標に基づいて２
つの文書画像を結合する。

【００３３】図３（Ａ）〜（Ｃ）は、原理説明図であ
る。先ず、図３（Ａ）に示すように、１つの文書画像が
２つに分割されて読み取られる。図３（Ａ）の例では文
書画像の一部の文字が重なるようにスキャナーで読み取
られている。次に、文字領域検出部１４により、第１及
び第２の文書画像の文字領域が検出され、それぞれの文
字領域の座標、大きさが重なり位置検出部１５に出力さ
れる。あるいは、文字認識部２２が文字領域内の文字の
認識を行って対応する文字コードを重なり位置検出部２
３に出力する。

【００３４】重なり位置検出部１５（または２３）は、
図３（Ｂ）に示すように２つの文書画像の行画像単位で
文字領域の座標、大きさを比較し、一致度の高い行画像
を重なり位置と判断する。あるいは、２つの文書画像の
行画像の文字コードを比較し、一致度の高い行画像を重
なり位置と判断する。重なり位置が検出されたなら、文
書結合部１６は、２つの文書画像をその重なり位置で結
合して１つの文書画像を再生する。

【００３５】次に、文字領域の座標及び大きさと文字コ
ードの２つを比較して重なり位置を検出する本発明の第
２の実施の形態の処理内容を、図４，図６，図１０，図
１３のフローチャートを参照して説明する。

【００３６】図４は、文書画像を結合するための全体の
処理を示すフローチャートである。先ず、文書画像の行
の方向を識別する（図４，Ｓ４０１）。文書画像の行の
方向の識別は、例えばスキャナ入力した画像の１ライン
単位で水平方向及び垂直方向の黒画素数の累積値を求
め、その黒画素数の累積値の分布から識別する。識別方
法としては、黒画素の累積値（１ライン中に含まれる黒
画素の個数）の分散を走査方向とそれに垂直な方向につ
いて計算し、分散の大きい方を行の方向と判断してい
る。これは、行と平行に黒画素数を累積した場合には、
文字の存在しない行間の部分では黒画素の累積値が
「０」となり、文字の存在する行の部分では黒画素数が
多くなるので、行の部分と行間とでは黒画素の累積値の
分布が大きく変動するのに対して、行と直交する方向に
黒画素数を累積した場合には、各ラインの中に文字の存
在する部分と存在しない部分が混在するので、黒画素の
累積値の分布はあまり変動しないことから、走査方向に
対する行の方向を識別している。なお、走査方向に対す
る行の方向の識別方法は、上述した方法に限らず他の方
法でも良い。

【００３７】次に、第１の文書画像から行画像を抽出す
る（Ｓ４０１）。ここで、行画像とは、図５に示すよう
に文書画像の文書の１行を構成する複数の文字画像に外
接する領域内の画像を指す。

【００３８】次に、図４のステップＳ４０２及びＳ４０
４の行画像抽出処理の内容を図６のフローチャートを参
照して説明する。先ず、文書が縦書きか、横書きかによ
り行検出方向を決定する（図６，Ｓ６０１）。この処理
では、文書が横書きであれば、第１及び第２の画像格納
部１２，１３に格納されている文書画像を水平方向の１
ライン単位で上から下に順に読み出す方向を選択し、文
書が縦書きであれば、垂直方向の１ライン単位で右から
左に順に読み出す方向を選択する。

【００３９】次に、行画像５２の個数をカウントするカ
ウンタＬに初期値として「０」を設定し（Ｓ６０２）、
ライン番号を示すラインカウンタｋに「０」を設定して
最初のラインを選択する（Ｓ６０３）。そして、ライン
カウンタｋで指定される第ｋラインが黒画素を含むか否
かを判別す（Ｓ６０４）。

【００４０】第ｋラインに黒画素が含まれている場合に
は、文字を含む行と判断して、ラインカウンタｋの値を
行の開始ライン番号としてレジスタＬｓに格納する（Ｓ
６０５）。そして、ラインカウンタｋの値を「１」イン
クリメントして次のラインを選択する（Ｓ６０６）。そ
して、新たに指定された第ｋラインに黒画素が含まれる
か否かを判別する（Ｓ６０７）。

【００４１】第ｋラインに黒画素が含まれる場合には、
ステップＳ６０８に進みそのライが文書画像の最後のラ
インか否かを判別する。文書画像の最後のラインか否か
の判別は、スキャナで文書を読み取ったとき、文書の縦
方向と横方向の総ドット数が分かっているので、ライン
番号が縦方向または横方向の総ドット数より大きいか否
かにより判断する。

【００４２】文書画像の最後のラインでなければ（Ｓ６
０８，ＮＯ）、ステップＳ６０６に戻り、次のラインを
選択する。ステップＳ６０７で第ｋラインに黒画素が含
まれないと判別された場合には、それまでのラインに黒
画素が含まれていて、次のラインに黒画素が含まれてい
ないのであるから、行の終了と判断して、ステップＳ６
０９に進み”ｋ−１”、すなわち黒画素を含む１ライン
前のライン番号を行の終了ライン番号としてレジスタＬ
ｅに格納する。そして、行の開始ライン番号を示すレジ
スタＬｓから行の終了ライン番号を示すレジスタＬｅま
での各ラインの画像を行画像として抽出する（Ｓ６１
０）。

【００４３】さらに、抽出した行画像が有効な行画像か
否か、つまり重なり位置の検出に使用可能な行画像か否
かを判別する（Ｓ６１１）。ステップＳ６１１の処理で
は、例えば、行画像として検出した領域のライン数が予
め設定してある行画像のライン数を下回る場合、あるい
は行画像の領域内の総画素数に対する黒画素の割合が予
め設定した値より小さい場合には、文字でない画像上の
ノイズやゴミを読み取った可能性が高いので、その領域
は行画像として不適切と判断して、ステップＳ６１３に
進む。

【００４４】ステップＳ６１１で有効な行画像と判断さ
れた場合には、行画像の数をカウントするカウンタＬの
値を「１」インクリメントする（Ｓ６１２）。文書画像
の横方向と縦方向の画素数は予め決められているので、
ラインカウンタｋの値と文書画像の縦方向の画素数とを
比較し、ラインカウンタｋの値が縦方向の画素数に達し
たか否かにより、ラインカウンタｋで指定されるライン
が文書画像の最後のラインか否かを判別する（Ｓ６１
３）。文書画像の最後のラインでなければ、ラインカウ
ンタｋの値をインクリメントして次のラインを選択し
（Ｓ６１４）、ステップＳ６０４に戻り、上述した処理
を文書画像の最後のラインに達するまで繰り返しす。

【００４５】上述した行画像の抽出処理を２つの文書画
像に対して行い、それぞれの行画像の開始ライン番号、
終了ライン番号、行数を求める。図４に戻り、ステップ
Ｓ４０２で第１の文書画像の行画像を抽出したなら、次
のステップＳ４０３で、抽出した行画像の文字領域を検
出し、それぞれの文字を認識して対応する文字コードを
取得する。

【００４６】同様に、ステップＳ４０４で第２の文書画
像の行画像を抽出したなら、次のステップＳ４０５で、
抽出した行画像の文字領域を抽出し、それぞれの文字を
認識して対応する文字コードを取得する。

【００４７】文字領域とは、図７に示すように文書画像
の各文字に外接する領域を指している。行画像から文字
領域を検出しその文字領域内の文字の認識を行う。図４
に戻り、２つの文書画像の文字コードを取得したなら、
次に、比較方向と順序を決定する（Ｓ４０６）。

【００４８】行画像の比較の方向、順序は、例えば図８
に示すように横書きの文書を２分割してスキャンする場
合には、文書画像の上半分を最初にスキャンし、次に下
半分をキャンすることが１番多いと思われる。そこで、
図９（Ａ）に示すように、第２の文書画像の上側の水平
方向の１または複数の行画像と、第１の文書画像の水平
方向の行画像を下側の行画像から中心に向かって順に比
較する方向、あるいは第１の文書画像の下側の水平方向
の１または複数の行画像と、第２の文書画像の水平方向
の行画像を上側の行画像から中心に向かって順に比較す
る方向を、横書き文書の優先順位の１番目の比較方向と
して選択する。

【００４９】また、図８（Ｂ）に示すように縦書きの文
書画像を２分割してスキャンする場合には、文書画像の
右半分を最初にスキャンし、次に左半分をスキャンする
ことが１番多いと思われる。そこで、図９（Ｄ）に示す
ように、第２の文書画像の右側の垂直方向の１または複
数の行画像と、第１の文書画像の垂直方向の行画像の左
側の行画像から中心に向かう方向に順に比較する方向、
あるいは第１の文書画像の垂直方向の１または複数の行
画像と、第２の文書画像の垂直方向の行画像の右側の行
から中心に向かう方向に順に比較する方向を、縦書き文
書の優先順位の１番目の比較方向として選択する。

【００５０】さらに、横書きの文書で下半分を最初にス
キャンし、次に上半分をスキャンした場合を想定して、
図９（Ｂ）に示すように第２の文書画像の水平方向の行
画像を下側から中心に向かう方向に、あるいは第１の文
書画像の水平方向の行画像を上側から中心に向かう方向
に順に比較する方向を優先順位の２番目の比較方向とし
て選択する。

【００５１】同様に、縦書きの文書で左半分を最初にス
キャンし、次に右半分をスキャンした場合を想定して、
図９（Ｃ）に示すように、第１の文書画像の垂直方向の
行画像を右側から中心に向かう方向に、あるいは第２の
文書画像の垂直方向の行画像を左側から中心に向かう方
向に順に比較する方向を優先順位の２番目の比較方向と
して選択する。

【００５２】また、場合によっては、図１０（Ａ）に示
すように横書きの文書画像を縦方向に２分割してスキャ
ンすることも、あるいは図１０（Ｂ）に示すように縦書
きの文書を横方向に２分割してスキャンすることも考え
られる。

【００５３】文書画像の結合方向は文書のスキャン方向
及び順序により定まる。縦書き文書を左右に２分割して
スキャンした場合の文書画像の結合方向としては、図１
１に示すような４つの方向が考えられる。

【００５４】最初に縦書き文書画像の右半分をスキャ
ンし、次にその左半分をスキャンした場合には、図１１
（Ａ）に示すように最初に読み取られた第１の文書画像
の左端部と２番目に読み取られた第２の文書画像の右端
部を結合する必要がある。

【００５５】最初に文書画像の左半分をスキャンし、
次に右半分をスキャンした場合には、図１１（Ｂ）に示
すように最初に読み取られた第１の文書画像の右端部と
２番目に読み取られた第２の文書画像の左端部とを結合
する必要がある。

【００５６】縦書き文書を上下に２分割してスキャン
した場合で、最初に文書画像の上半分をスキャンし、次
に下半分をスキャンした場合には、図１１（Ｃ）に示す
ように最初に読み取られた第１の文書画像の下端部と２
番目に読み取られた第２の文書画像の上端部とを結合す
る必要がある。

【００５７】最初に文書画像の下半分をスキャンし、
次に上半分をスキャンした場合には、図１１（Ｄ）に示
すように最初に読み取られた第１の文書画像の上端部と
２番目に読み取られた第２の文書画像の下端部とを結合
する必要がある、また、横書き文書を２分割してスキャ
ンした場合の文書画像の結合方向としては、図１２に示
すような４つの方向が考えられる。

【００５８】最初に文書画像の上半分をスキャンし、
次に下半分をスキャンした場合には、最初に読み取られ
た第１の文書画像の下端部と２番目に読み取られた第２
の文書画像の上端部とを結合する必要がある。

【００５９】最初に横書き文書の下半分をスキャン
し、次にその上半分をスキャンした場合には、図１２
（Ｂ）に示すように最初に読み取られた第１の文書画像
の上端部と２番目に読み取られた第２の文書画像の下端
部とを結合する必要がある。

【００６０】横書き文書を左右に２分割してスキャン
した場合で、最初に文書画像の左半分をスキャンし、次
にその右半分をスキャンした場合には、図１２（Ｃ）に
示すように最初に読み取られた第１の文書画像の右端部
と２番目に読み取られた第２の文書画像の左端部を結合
する必要がある。

【００６１】横書き文書を左右に２分割してスキャン
した場合で、最初に文書画像の右半分をスキャンし、次
にその左半分をスキャンした場合には、図１２（Ｄ）に
示すように最初に読み取った第１の文書画像の左端部と
２番目に読み取った第２の文書画像の右端部とを結合す
る必要がある。

【００６２】以上のことを前提として比較方向とその順
序が決定したなら、図４のステップＳ４０７の重なり位
置検出処理を実行する。この重なり位置検出処理ににつ
いては後に詳しく説明する。

【００６３】次のステップＳ４０８で重なり位置が検出
されたか否かを判別し、重なり位置が検出されたなら、
その重なり位置で第１と第２の文書画像を結合する。こ
れにより、ユーザは分割して読み取った２つの文書画像
を結合するための操作を何も行わなくとも、２つの文書
画像を１つの文書画像に結合することができる。

【００６４】ここで、図４のステップＳ４０７の重なり
位置検出処理の処理内容を、図１３のフローチャートを
参照して説明する。先ず、横書きの文書の上半分を最初
にスキャンし、次に重なり部分を含むように下半分をス
キャンした場合（図９（Ａ））、あるいは縦書きの文書
の右半分を最初にスキャンし、次に重なり部分を含むよ
うに左半分をスキャンした場合（図９，（Ｄ））を想定
して行画像の比較を行う。

【００６５】最初に第２の文書画像の行画像を指定する
行カウンタｋ２に「１」を設定して、第２の文書画像の
１行目の行画像を指定する（図１３，Ｓ１００１）。そ
して、そのｋ２行の行画像の文字領域の座標、大きさと
文字コードを取得する（Ｓ１００２）。

【００６６】ここで、文書画像の行番号は、文書をスキ
ャンしたときのスキャン方向により自動的に決められて
おり、例えば図１４（Ａ）に示すように、横書き文書画
像を上から下にスキャンした場合には、上側の最初の行
画像の行番号が「１」となり、以下順に「２」、「３」
・・・と行番号が設定される。また、図１４（Ｂ）に示
すように縦書きの文書画像を右側から左側にスキャンし
た場合には、右側の最初の行画像の行番号が「１」とな
り、以下「２」、「３」・・・と行番号が設定される。

【００６７】次に、第１の文書画像の行画像を指定する
行カウンタｋ１に第１の文書画像の最終行の行番号Ｌ１
を設定する（図１３，Ｓ１００３）。上述した処理で第
２の文書画像の１行目の行番号を行カウンタｋ２に設定
し、第１の文書画像の最終行の行番号を行カウンタｋ１
に設定しているのは、横書き（または縦書き）の文書を
上下に２分割してスキャンする場合、最初に文書画像の
上側半分（または右半分）をスキャンし、次に下半分
（または左半分）をスキャンすることが多いと考えられ
るので、第１の文書画像の下側（または左側）の行画像
と、それに続く第２の文書画像の上側（または右側）の
行画像が一致する可能性が高いので、第２の文書画像の
１行目と第１の文書画像の最終行から中心に向かって順
に比較することで、少ない比較回数で重なり位置を検出
するためである。

【００６８】次に、行カウンタｋ１で指定される第１の
文書画像のｋ１行の行画像の文字領域と文字コードを取
得する（Ｓ１００４）。そして、第２の文書画像のｋ２
番目（例えば、１行目）の行画像の隣接する文字領域の
位置の差と第１の文書画像のｋ１番目（例えば、最終
行）の行画像の隣接する文字領域の位置の差のずれ、そ
れぞれの文字領域の大きさ及び第２の文書画像のｋ２番
目の行画像の文字コードと第１の文書画像のｋ１番目の
行画像の文字コードの一致度を計算する（Ｓ１００
５）。そして、２つの行画像の文字領域の相対位置と大
きさの一致度を表す評価式の値が予め定めた閾値以下か
否か、文字コードの一致度を示す値が所定値以下か否か
を判別する（Ｓ１００６）。

【００６９】２つの文書画像の行画像の文字領域の相対
位置及び大きさの一致度は、例えば、図１５に示すよう
に文書画像の左上角を原点としたときの第１の文書画像
の行画像のｉ番目の文字領域の左上角の座標を（Ｘai，
Ｙai）、文字領域の高さをＨａｉ幅をＷａｉ、ｉ＋１
番目の文字領域の座標を（Ｘai+1，Ｙai+1）、第２の文
書画像の行画像のｉ番目の文字領域の左上角の座標を
（Ｘbi，Ｙbi）、文字領域の高さをＨｂｉ、幅をＷｂ
ｉ, ｉ＋１番目の文字領域の座標を（Ｘbi+1，Ｙbi+1）
としたとき、以下の式で表せる。

【００７０】Ｐ＝Σ（（｜Ｘai+1−Ｘai｜−｜Ｘbi+1−Ｘbi｜）² ＋（｜Ｙai+1−Ｙai｜−｜Ｙbi+1−Ｙbi｜）²）・・・（１） S ＝Σ（（Ｗai+1−Ｗbi) ²＋（Ｈai+1−Ｈbi) ²）・・・（２）上記の（１）式の｜Ｘai+1−Ｘai｜、｜Ｙai+1−Ｙai｜
は、第１の文書画像のｉ＋１番目の文字領域とｉ番目の
文字領域の左上角の位置の水平方向及び垂直方向の差を
示している。同様に｜Ｘbi+1−Ｘbi｜、｜Ｙbi+1−Ｙbi
｜は、第２の文書画像のｉ＋１番目の文字領域とｉ番目
の文字領域の左上角の位置の水平方向及び垂直方向の差
を示している。従って、｜Ｘai+1−Ｘai｜−｜Ｘbi+1−
Ｘbi｜は２つの文書画像のｉ＋１番目とｉ番目の文字領
域の左上角の位置の水平方向の差のずれを表し、同様に
｜Ｙai+1−Ｙai｜−｜Ｙbi+1−Ｙbi｜は２つの文書画像
のｉ＋１番目とｉ番目の文字領域の垂直方向の差のずれ
を表している。そして、２つの文書画像の隣接する文字
領域の左上角の位置の差のずれを累積加算することによ
り、２つの文書画像の行画像内の文字領域の相対位置の
一致度を求めることができる。なお、ずれを２乗してい
るのは、累積加算する際に打ち消しあって相殺されない
ようにするためである。

【００７１】２つの文書画像の行画像が一致すれば、行
画像内の隣接する文字領域の位置の垂直方向及び水平方
向の差は同じになるのでずれが小さくなり、（１）式の
Ｐの値は”０”または”０”に近い値となる。また、行
画像が不一致であれば、行画像内の隣接する文字領域の
位置の垂直方向及び水平方向の差のずれが大きくなり、
Ｐの値も大きくなる。行画像が完全に一致すれば、Ｐの
値は”０”となるが、スキャン画像であるので多少のゆ
がみが生じることを考慮して、予め定めた閾値とＰとを
比較し、Ｐが閾値以下であれば行が重なりあるものと判
定するようにしている。（２）式のＳは文字領域の幅と
高さのの違いを表しており、それぞれの文字領域の大き
さが一致し、行画像の一致度が高いほど値が小さくな
る。

【００７２】また、文字コードの一致度を示す値Ｒ
は、”Ｒ＝Σ｜Ｍai＝＝Ｍbi？０：１｜／Ｎ” で表す
ことができる。Ｍai、Ｍbiは、第１及び第２の文書画像
のｉ番目の文字の文字コード、Ｎは１行の文字数を示し
ている。上記の式のΣ｜Ｍai＝＝Ｍbi？０：１｜／Ｎの
中の値は文字コードが一致したとき、”０”、不一致の
とき”１”となるので、一致度を示す左辺の値Ｒは、文
字コードの一致度が高い程小さな値となる。

【００７３】図１３に戻り、文字領域の位置及び大きさ
の一致度を示すＰ，Ｓの値と文字コードの一致度を示す
Ｒの値をそれぞれ所定のしきい値と比較し、Ｐ，Ｓの値
が所定の閾値より大きいか、または文字コードの一致度
を示す値Ｒが所定値より大きい場合には、２つの行画像
は不一致と判断し、第１の文書画像の行カウンタｋ１の
値から「１」を減算して次の行画像を指定する（Ｓ１０
０７）。そして、カウンタｋ１の値が「１」以上か否
か、つまり第１の文書画像の行画像の比較を最終行から
１行目まで終了したか否かを判別する（Ｓ１００８）。

【００７４】カウンタｋ１の値で「１」以上であれば、
すなわち第１の文書画像で比較を行っていない行画像が
残っている場合には、ステップＳ１００４に戻りｋ１行
目の行画像の文字領域と文字コードを取得し、上述した
処理を繰り返す。

【００７５】他方、上述した行画像の比較を行ってＰ，
Ｓの値が所定の閾値以下となり、かつ文字コードの一致
度を示す値Ｒが所定値以下となったなら（Ｓ１００６，
ＹＥＳ）、行画像が一致するものと判断し、ステップＳ
１００９に進み一致した行画像の座標を重なり位置とし
て格納する。

【００７６】他方、ステップＳ１００８で第１の文書画
像の行カウンタｋ１の値が「０」以下と判別されたと
き、すなわち第１の文書画像の全ての行画像と第２の文
書画像の１行目の行画像を比較した結果、一致する行画
像が存在しないときには、文書画像のスキャン方向が異
なるもの、つまり文書の上半分を最初にスキャンし、次
に下半分をスキャンしたのではないと判断し、優先順位
の２番目の比較方向で行画像の比較を行う。

【００７７】以下、この優先順位の２番目の比較方向で
の重なり位置検出処理を図１６のフローチャートを参照
して説明する。優先順位の２番目の比較方向は、文書画
像の下半分（または左半分）を最初にスキャンし、次に
文書の上半分（または右半分）をスキャンした場合を想
定しているので、第２の文書画像の最終行の行画像と第
１の文書画像の各行画像を比較するために第２の文書画
像の最終行の行番号Ｌ２を第２の文書画像の行画像を指
定する行カウンタｋ２に設定する（図１６，Ｓ１３０
１）。さらに、第２の文書画像のｋ２番目の行画像の文
字領域と文字コードを取得する（Ｓ１３０２）。

【００７８】次に、第１の文書画像の行画像を指定する
行カウンタｋ１に「１」を設定して、１行目の行画像を
指定する（Ｓ１３０３）。さらに、第１の文書画像のｋ
１番目の行画像と第２の文書画像のｋ２番目の行画像の
文字領域の座標、大きさの一致度を表す評価式の計算及
び文字コードの一致度を示す値Ｒを計算する（Ｓ１３０
４）。文字領域の座標及び大きさの一致度は、上述した
（１）、（２）式の評価式を用いて計算する。

【００７９】そして、評価式のＰ，Ｓの値が予め設定し
た閾値以下か否か、文字コードの一致度を示す値Ｒが所
定値以下か否かを判別する（Ｓ１３０６）。Ｐ，Ｓの値
が閾値より大きいとき、または文字コードの一致度を示
す値Ｒが所定値より大きいときには（Ｓ１３０６，Ｎ
Ｏ）、２つの行画像は不一致と判断し、ステップＳ１３
０７に進み行カウンタｋ１の値に「１」を加算して、次
の行を指定する。そして、行カウンタｋ１の値が第１の
文書画像の最終行の行番号Ｌ１以下か否かを判別する。

【００８０】行カウンタｋ１の値が最終行の号番号Ｌ１
以下のときには（Ｓ１３０８，ＮＯ）、ステップＳ１３
０４に戻り、行カウンタｋ１で指定される行画像の文字
領域、文字コードを取得し、それらの文字領域、文字コ
ードと第２の文書画像の最終行の文字領域、文字コード
とを比較する。

【００８１】他方、Ｐ，Ｓの値が閾値以下、かつ文字コ
ードの一致度を示す値Ｒが所定値以下と判別された場合
には（Ｓ１３０６，ＹＥＳ）、第１の文書画像と第２の
文書画像の行画像が一致したものと判断し、ステップＳ
１３０９に進み行画像の座標を重なり位置座標として格
納する。

【００８２】なお、行カウンタｋ１の値が最終行の行番
号を超えた場合は（Ｓ１３０８，ＮＯ）、優先順位の１
番目と２番目の２つの比較方向で２つの文書の行画像を
比較しても一致する行画像が存在しなかった場合である
ので、ステップＳ１３１０に進み重なり位置が検出でき
なかったことを通知する。

【００８３】この実施の形態によれば、文書を複数（２
以上）の文書画像に分割して読み取った場合に、読み取
った文書画像の行画像の文字領域の位置、大きさ及び文
字コードを比較して一致する行画像を検出することによ
り文書画像の重なり位置を検出することができる。これ
により、分割して読み取った文書画像を自動的に結合す
ることができる。

【００８４】上述した第２の実施の形態では、文書画像
の行画像の文字領域の位置及び大きさと文字コードの両
方を用いて行画像の比較を行っているが、ＯＣＲのため
の辞書データを格納する記憶容量が足りなかったり、Ｏ
ＣＲ処理に時間がかかってしまう低速なシステム等でＯ
ＣＲを搭載できないシステムでは、文字領域の位置と大
きさのみを比較するようにしても良い。また、複数の行
で文字が同じ順序で配置される可能性は少ないので、文
字の大きさ、位置関係を比較せず、文字コードのみを比
較するようにしても良い。

【００８５】次に、図１７は、文書画像の文字領域のパ
ターン、すなわち位置と大きさを比較して文書画像の重
なり位置を検出する本発明の第１の実施の形態の重なり
位置の検出方法の説明図である。

【００８６】この第１の実施の形態の重なり位置検出処
理も基本的には第２の実施の形態の重なり位置検出処理
と同様であり、１つ文書画像を上半分を最初にスキャン
し、次に下半分をスキャンした場合に対応する行画像の
比較方向を優先順の１番目のとし、文書画像の下半分を
最初にスキャンし、次に上半分をスキャンした場合に対
応する行画像の比較方向を優先順位の２番目に設定して
いる。

【００８７】図１３のステップＳ１００６の行画像の一
致度の判定で、１番目の優先順位の比較方向、すなわち
第２の文書画像の１行目の行画像の文字領域の位置と大
きさと、第１の文書画像の最終行の行画像の文字領域の
位置と大きさとを比較して行画像の一致度を判定する。
行画像が一致すると判定したなら、ステップＳ１００９
で、例えばその行画像の左端の文字領域の座標と右端の
文字領域の座標を重なり位置座標として保存する。そし
て、その重なり位置で２つの文書画像を結合する。

【００８８】この第１の実施の形態は、行画像の文字領
域の位置とその大きさのみから行画像の一致度を判定し
ているので、文字領域の位置及び大きさと、文字認識の
両方を行って一致度を判定する場合に比べて重なり位置
検出処理の処理プログラムが簡単になり処理時間も短く
なる。

【００８９】次に、分割して読み取った文書画像の行画
像の文字コードのみを比較して文書画像の重なり位置を
検出する本発明の第３の実施の形態の重なり位置検出方
法を図１８を参照して説明する。

【００９０】この第３の実施の形態の文書画像結合装置
の基本的構成は、図２に示す文書画像結合装置と同様で
ある。この第３の実施の形態では、図１３のフローチャ
ートにおいて、ステップＳ１００２，ステップＳ１００
４で第２の文書画像の１行目の行画像の文字コードと第
１の文書画像の最終行の行画像の文字コードを取得した
なら、ステップＳ１０００５で２つの文書画像の文字コ
ードの一致度を示す値Ｒを算出する。そして、一致度を
示す値が所定値以下であれば、ステップＳ１００９で行
画像が一致するものと判断し、その行画像の座標を重な
り位置座標として保存する。

【００９１】この第３の実施の形態は、文書画像の行画
像の文字の文字認識を行って文字コードを得て、分割し
て読み取った２つの文書画像を行単位で文字コードを比
較することで文書画像の重なり位置を検出することがで
きるので、文書毎に位置合わせのマーク等を付ける必要
がなく、簡単に文書を結合することができる。

【００９２】次に、読み取った文書画像を複数の領域に
分割し、分割した領域から行画像を抽出し、それぞれの
領域の行画像に含まれる文字を比較して複数の文書画像
の結合位置を検出するようにした本発明の第４の実施の
形態を説明する。

【００９３】この実施の形態の文書画像結合装置の基本
的構成は、図２の文書画像結合装置２１と同じであり、
図２の構成と異なる点は、文字領域検出部１４が、第１
及び第２の画像格納部１２，１３に格納されている第１
及び第２の文書画像をそれぞれ複数の領域に分割する機
能と、それぞれの領域から行画像を抽出する機能を有し
ている点である。

【００９４】図１９は、第４の実施の形態の処理の概略
を示すフローチャートである。先ず、スキャナにより分
割して読み取った文書画像を順に第１の文書格納部１２
と第２の文書格納部１３に格納する（図１９，Ｓ１９０
１）。次に、第１及び第２の文書画像をそれぞれ複数の
領域に分割し、それぞれの領域から行画像を抽出する
（Ｓ１９０２）。

【００９５】ここで、図１９のステップＳ１９０１の行
画像の抽出処理を、図２０のフローチャートを参照して
説明する。先ず、分割して読み取った第１及び第２の文
書画像を垂直方向及び水平方向にそれぞれ複数の領域に
分割する（図２０，Ｓ２００１）。次に、全ての領域の
行画像の抽出が終了したか否かを判別する（Ｓ２００
２）。

【００９６】全ての領域の抽出が終了していなければ
（Ｓ２００２，ＮＯ）、ステップＳ２００３に進み、第
１または第２の文書画像の複数の領域の中から、垂直方
向または水平方向に分割した領域の１つを抽出する。

【００９７】次に、領域の分割線と垂直な方向に白画素
ラインと黒画素ラインを検出し、画像の先頭ラインが黒
画素ラインか否かを判別する。黒画素ラインか白画素ラ
インの判別は、黒画素の数が所定値より多いラインを黒
画素ラインとし、黒画素の数が所定値未満のラインを白
画素ラインと判定している。

【００９８】図２１は白画素ラインと黒画素ラインの抽
出方法の説明図である。例えば、領域の分割線に対して
垂直な方向が図２１（Ａ）の縦方向であるとすると、図
２１（Ａ）の文字の左端のラインには黒画素が３個含ま
れる。仮に、この文字が縦書きの文書の文字であるとす
ると、当然同一ライン上には他の文字の黒画素が含まれ
ることになるので、ライン全体では多数の黒画素が検出
されて、このラインは黒画素ラインと判定される。

【００９９】他方、図２１（Ｂ）に示すような文字が存
在しないいライン、例えば図２１の左端のラインには黒
画素が含まれない。従って、ライン全体でも黒画素数が
所定値以下となるので、そのラインは白画素ラインと判
定される。また、罫線が存在する場合でも、罫線と直交
する方向にラインを選択した場合には、図１２（Ｂ）の
領域の右端のラインように罫線による黒画素が１個含ま
れることになるが、ライン全体では罫線以外に黒画素が
存在しなければ、そのラインは白画素ラインと判定され
る。

【０１００】図２０に戻り、画像の先頭ラインが黒画素
ラインの場合には（Ｓ２００４，ＹＥＳ）、黒画素領域
をスキップして白画素ラインの検出を行う（Ｓ２００
５）。これは、最初に検出された領域が黒画素領域であ
った場合、スキャン時に文字の全体が読み取られず、文
字の一部が読み取られている可能性があるので、その黒
画素領域を文書画像の結合位置の検出に使用しないよう
にするためである。

【０１０１】領域の先頭ラインが黒画素ラインで、その
黒画素領域をスキップして次の白画素ラインを検出した
場合、あるいはステップＳ２００４で領域の先頭ライン
が黒画素ラインではないと判別された場合には、ステッ
プＳ２００６においてフラグｆｌａｇに”ｗｈｉｔｅ”
を設定する。そして、その領域に画素の判別を行ってい
ないラインが存在するか否かを判別する（Ｓ２００
７）。画素の判別を行っていないラインが存在する場合
には（Ｓ２００７，ＹＥＳ）、フラグｆｌａｇが”ｂｌ
ａｃｋ”か否かを判別する（Ｓ２００８）。

【０１０２】フラグｆｌａｇが”ｂｌａｃｋ”でない場
合（Ｓ２００８，ＮＯ）、つまり先頭の黒画素領域の次
に白画素ラインが検出された場合、あるいは先頭ライン
が白画素ラインであった場合には、ステップＳ２００９
に進み次のラインが黒画素ラインか否かを判別する。

【０１０３】次のラインが黒画素ラインでなければ（Ｓ
２００９，ＮＯ）、ステップＳ２０１０に進み白画素ラ
インの数を計数するカウンタ”ｗｈｉｔｅ＿ｌｉｎｅ”
をインクリメントして次のラインを指定する。

【０１０４】ステップＳ２００７〜Ｓ２０１０の処理を
繰り返し白画素領域の次の黒画素ラインを検出すると、
ステップＳ２００９の判別がＹＥＳとなり、ステップＳ
２０１１に進みフラグｆｌａｇに”ｂｌａｃｋ”を設定
する。

【０１０５】フラグｆｌａｇが”ｂｌａｃｋ”となる
と、ステップＳ２００８の判別がＹＥＳとなり、ステッ
プＳ２０１２に進みラインが白画素ラインか否かを判別
する。ラインが白画素ラインでなければ（Ｓ２０１２，
ＮＯ）、ステップＳ２０１３に進み黒画素ラインの数を
カウントするカウンタ”ｂｌａｃｋ＿ｌｉｎｅ”をイン
クリメント（ｂｌａｃｋ＿ｌｉｎｅ＋＋) した後、ステ
ップＳ２００７に戻り、順次ラインを検出して黒画素ラ
インの数をカウントする。

【０１０６】そして、黒画素ラインが終了して次の白画
素ラインが検出されると（Ｓ２０１２，ＹＥＳ）、ステ
ップＳ２０１４に進みフラグｆｌａｇに”ｗｈｉｔｅ”
を設定する。

【０１０７】以上のようにして白画素ラインとそれに続
く黒画素ラインが検出されたなら、白画素ラインの数を
カウントするカウンタ”ｗｈｉｔｅ＿ｌｉｎｅ”の値が
所定値”ｗｈｉｔｅ＿ｔｈｒｅｓｈ１”より大きいか否
かを判別する。

【０１０８】なお、白画素ラインの数が所定値”ｗｈｉ
ｔｅ＿ｔｈｒｅｓｈ１”より大きいか否かを判別してい
るのは、行画像の方向に対して垂直方向に画素を検出す
るラインが設定された場合には、文字と文字の間の空白
部分が白画素領域として検出される。このときの白画素
領域の幅が所定値”ｗｈｉｔｅ＿ｔｈｒｅｓｈ１”以下
となるように”ｗｈｉｔｅ＿ｔｈｒｅｓｈ１”の値を設
定しておけば、文字間の空白と、行と行との間の空白行
を識別できるからである。

【０１０９】白画素ラインの数”ｗｈｉｔｅ＿ｌｉｎ
ｅ”が所定値”ｗｈｉｔｅ＿ｔｈｒｅｓｈ１”より大き
いときには、この白画素領域を行間と見なし次のステッ
プＳ２０１６に進む。ステップＳ２０１６では、黒画素
ラインの数”ｂｌａｃｋ＿ｌｉｎｅ”が黒画素ライン数
の下限値”ｂｌａｃｋ＿ｔｈｒｅｓｈ１”より大きく、
かつ上限値”ｂｌａｃｋ＿ｔｈｒｅｓｈ２”より小さい
か否かを判別する。

【０１１０】白画素ラインの数が所定値より大きく、か
つ黒画素ラインの数が所定範囲内にあるとき、つまり行
間に相当する所定幅以上の白画素領域が検出され、その
白画素領域に隣接する所定幅の黒画素領域が検出された
場合には（Ｓ２０１６，ＹＥＳ）、その黒画素領域を行
画像（行）として抽出する（Ｓ２０１７）。

【０１１１】ここで、黒画素ラインの数が”ｂｌａｃｋ
＿ｔｈｒｅｓｈ２”より小さいことを行画像の条件とし
て設定しているのは、文書画像に図形等が含まれている
場合、図形を含む複数のラインを黒画素ラインとして検
出した場合、一般に図形の幅は行画像の幅より広いの
で、その黒画素ラインの数は、行画像の黒画素ラインの
数より大きくなる。そこで、黒画素ラインの数の上限値
を設定することで、図形等を含む黒画素領域が行画像と
して抽出され、画像の結合位置を検出するための処理に
無駄が生じるのを防ぐためである。

【０１１２】以上の処理により１つの行画像が検出され
たので行数をカウントする行カウンタをインクリメント
し（Ｓ２０１８）、次の白画素ラインまたは黒画素ライ
ンを検出するためにラインカウンタ”ｗｈｉｔｅ＿ｌｉ
ｎｅ”及び”ｂｌａｃｋ＿ｌｉｎｅ”にそれぞれ「０」
を設定する（Ｓ２０１９）。その後、ステップＳ２００
７に戻り、上述した処理を繰り返し、次の白画素領域ま
たは黒画素領域の検出を行う。

【０１１３】なお、ステップＳ２０１５で白画素ライン
の数が所定値”ｗｈｉｔｅ＿ｔｈｒｅｓｈ１”以下と判
別された場合（Ｓ２０１５，ＮＯ）、つまり白画素領域
が行間ではない場合には、検出した黒画素領域は行画像
ではないので、ステップＳ２０１９に進みラインカウン
タ”ｗｈｉｔｅ＿ｌｉｎｅ”及び”ｂｌａｃｋ＿ｌｉｎ
ｅ”をクリアする。

【０１１４】同様に、ステップＳ２０１６で黒画素ライ
ンの数が所定範囲外と判別された場合には（Ｓ２０１
６，ＮＯ）、黒画素領域が行画像に該当しないと判断
し、ステップＳ２０１９に進みラインカウンタ”ｗｈｉ
ｔｅ＿ｌｉｎｅ”及び”ｂｌａｃｋ＿ｌｉｎｅ”をクリ
アする。

【０１１５】以上の処理を繰り返し、ステップＳ２００
７で画素を判別していないラインが存在しないと判別さ
れた場合（Ｓ２００７，ＮＯ）、つまり垂直（または水
平）方向に分割した１つの領域の全てのラインの検出が
終了した場合には、ステップＳ２００２に戻り、全ての
領域が終了したか否かを判別し、領域が存在する場合に
は、上述した処理を繰り返す。

【０１１６】なお、この第４の実施の形態では、分割し
て読み取った文書画像をそれぞれ垂直及び水平方向の領
域に分割し、垂直方向に分割した領域の行画像の数、水
平方向に分割した領域の行画像の数を求め、両者を比較
して、行画像の数の多い方の領域を結合位置の検出に用
いるようにしている。これは、行の方向に対して垂直方
向に領域を分割することにより、図形、表等を含まない
行画像を抽出できるからである。これにより、文書画像
が縦書き、横書きの何れでも、また図形、表等が文書画
像に含まれていても、文書画像から文字を含む行画像を
正確に切り出すことができる。

【０１１７】図２２は、行画像の抽出の説明図である。
図２２の右側に示す文書画像の領域から、垂直方向及び
水平方向に１ラインづつ黒画素ラインまたは白画素ライ
ンが検出され、連続する白画素ラインが白画素領域とし
て、連続する黒画遅ラインが黒画素領域として抽出され
る。さらに、黒画素ラインの数が上述した条件を満たす
とき、一定数の黒画素ラインからなる黒画素領域は行画
像として抽出される。この結果、図２２の左側に示すよ
うな行画像を抽出することができる。

【０１１８】次に図２３は、図形を含む文書の行画像の
抽出の説明図である。文書画像に図形が含まれている場
合でも、行画像に対して垂直方向に上下２つの領域に分
割し、領域単位で行画像の抽出を行うことで、上側の領
域１から図形が含まれない黒画素領域及び白画素領域を
抽出することができる。すなわち、図形を含む文書であ
っても、複数の領域に分割することにより、領域１から
行画像を切り出すことが可能となる。

【０１１９】例えば、複数の領域に分割せずに行画像の
抽出を行ったとすると、図２３の領域１の左から３行目
の「そこで、最低二学年で１つの」という文章が書かれ
た行の隣の空白行には下側の図形の黒画素が含まれてし
まうので、白画素領域ではなく黒画素領域として検出さ
れてしまう可能性があり、本来文字の存在しない空白行
と文字を含む行画像とを区別することが難しかった。

【０１２０】この第４の実施の形態では、分割して読み
取った文書画像を複数の領域に分割し、領域毎に行画像
を抽出することにより、文書画像に図形、表、罫線等が
含まれていても、それらを除いた文字のみが含まれる行
画像を抽出することができる。これにより、後述する文
書画像の結合位置の検出処理において、文書画像の結合
位置となり得る有効な行画像を用いて行画像の比較を行
うことができるので、結合位置を検出するための処理時
間を短縮し、より効率的に文書画像を結合することがで
きる。

【０１２１】次に、図１９のステップＳ１９０３の画像
の結合位置の検出処理の内容を図２４のフローチャート
を参照して説明する。上述した行画像の抽出処理により
行画像の数の多かった領域を第１及び第２の文書格納部
１２，１３からそれぞれ取り出す（図２４，Ｓ２４０
１）。このとき取り出す領域は、２つの文書画像の対応
する領域を第１の候補として取り出す。例えば、図２５
に示すように２つの文書画像が読み取られ、それぞれの
文書画像を上下２つの領域に分割した場合には、それぞ
れ対応する上側の領域１を取り出す。これは、文書画像
をハンディスキャナによりスキャンするとき、通常は同
じ方向にスキャンするので、第１及び第２の文書画像の
対応する位置の領域の行画像から順に比較するためであ
る。

【０１２２】次に、第１の文書画像の領域１の行画像を
取り出す（Ｓ２４０２）。なお、第１の文書画像の領域
１から行画像を取り出す際に、縁から中心に向かう方向
に順に行画像を取り出す。次に、取り出した行画像のそ
れぞれの文字を文字認識して対応する文字コードを検出
する（Ｓ２４０３）。

【０１２３】次に、第２の文書画像の領域１の行画像を
取り出す（Ｓ２４０４）。さらに、行画像のそれぞれの
文字を文字認識して対応する文字コードを検出する（Ｓ
２３０５）。２つの文書画像のそれぞれの領域の行画像
の文字コードを比較し、文字コードの一致度（画像の一
致度）が所定値”Ｔｈｒｅｓｈ”より大きいか否かを判
別する（Ｓ２４０６）。このとき、先頭の文字コードが
一致しない場合には、２つの領域の文字の配列がずれて
いることも考えられるので、一方の領域の先頭の文字コ
ードと他方の領域の文字コードを順に比較して文字コー
ドが一致するかどうかを判別する。

【０１２４】文字コードの一致度が所定値以下の場合
（Ｓ２４０６，ＮＯ）、つまり第１の文書画像の或る行
画像の文字列と第２の文書画像の或る行画像の文字列の
一致度が低い場合には、第２の文書画像の選択した領域
に文字コードを比較していない行画像が存在するか否か
を判別する（Ｓ２４０７）。文字コードを比較していな
い行画像が存在する場合には、ステップＳ２４０４に戻
り第２の文書画像の次の行画像を取り出し上述した処理
を繰り返す。

【０１２５】ステップＳ２４０７で、第２の文書画像の
選択した領域に文字コードの比較を行っていない行画像
が存在しない場合（Ｓ２４０７，ＮＯ）、つまり第１の
文書画像の選択した領域の特定の行画像（例えば、１番
目の行画像）と、第２の文書画像の選択した領域の全て
の行画像の文字コードの比較が終了して文字コード一致
度が所定値以下のときには、ステップＳ２４０１に戻り
第１及び第２の文書画像の次の領域を取り出し上述した
処理を繰り返す。

【０１２６】この結果、文字コードの一致度が所定値”
Ｔｈｒｅｓｈ”より大きい行画像が検出されたなら、ス
テップＳ２４０８に進み一致度の高い行画像の文字領域
を文書画像の結合位置（重なり位置）として検出する。

【０１２７】なお、文書を複数に分割してスキャンする
場合、個人によってスキャン順序、あるいはスキャン方
向に一定の傾向があると考えられるので、それぞれの行
画像に番号を付け、過去に結合位置として検出された行
画像の検出頻度を行画像の番号（識別情報）に対応させ
て記憶しておいて、検出頻度の高い行画像を優先して文
字コードの比較を行うようにしても良い。このように過
去に結合位置として検出された行画像の位置を優先して
比較の対象とすることにより結合位置を検出するための
処理時間を短縮することができる。

【０１２８】図２５は、２つの画像の結合面が行画像と
平行な場合、つまり文書画像を行と平行な方向にスキャ
ンして分割して読み取った場合の重なり位置の検出方法
の説明図である。

【０１２９】上述したように２つに分割した文書画像を
それぞれ２つの領域に分割し、領域の分割線と垂直な方
向に黒画素ライン、白画素ラインの検出を行って、黒画
素ラインの数が所定範囲内の黒画素領域を行画像として
抽出する。次に、第１の文書画像の抽出した行画像を予
め定められている方向から順に取り出す。例えば、縁か
ら中心に向かう方向に行画像を順に取り出す。同様に第
２の文書画像の抽出した行画像を予め定めてある方向か
ら順に取り出す。

【０１３０】そして、取り出した行画像のそれぞれの文
字を認識し、得られた文字コードを比較して文字コード
の一致度を判定する。文字コードの一致度が所定値以上
であれば、その文字領域を２つの文書画像の重なり位置
として決定する。

【０１３１】図２５においては、第１の文書画像の領域
１の左から１行目の５個の文字「あ、い、う、え、お」
の文字コードと、第２の文書画像の上側の領域１の右か
ら１行目の５個の文字の文字コードが全て一致するの
で、その位置が２つの文書画像の結合位置となる。

【０１３２】図２６は、２つの文書画像の結合面が行画
像（行）と垂直な場合、つまり文書画像を行と垂直な方
向にスキャンして分割して読み取った場合の重なり位置
の検出方法の説明図である。

【０１３３】この場合も領域の分割線と垂直な方向に行
画像を抽出し、行画像が抽出できたなら、それぞれの文
字を認識し、得られた文字コードを比較して文字コード
の一致度を判定する。

【０１３４】図２６において、例えば、第１の文書画像
の右側の領域１の上から３行目の文字コードと、第２の
文書画像の左側の領域１の上から３行目の文字コードを
比較する。この場合、横書きの文書を中央部で重なるよ
うに左右に２分割して読み取り、分割した２つの文書画
像をそれぞれ左右２つの領域に分割しているが、分割の
仕方によっては第１の文書画像の領域１の３行目の先頭
の文字と第２の文書画像の領域１の同一行の先頭の文字
は必ずしも一致しない。

【０１３５】例えば、図２６では、第１の文書画像の領
域１の３行目の文字列は「お、か、き、く、け、こ」の
順序で並んでいるのに対して、第２の文書画像の領域１
の文字列は「か、き、く、け、こ、さ」の順に並んでお
り、両者の文字列は完全には一致しないことになる。

【０１３６】そこで、本実施の形態では、一方の文書画
像の領域の文字の配列順序を基準にして、他方の文書画
像の領域の比較対象の文字を１づつ順に比較し、一致す
る文字が存在したなら、それ以降の対応する文字を順に
比較するようにしている。

【０１３７】図２６の例について言えば、第２の文書画
像の領域１の左から１番目の文字「か」の文字コード
と、第１の文書画像の領域１の左から１番目の文字の文
字コード、２番目の文字コード・・・と順に比較して、
第１の文書画像の領域１の左から２番目の文字の文字コ
ードと一致したなら、次に第２の文書画像の領域１の左
から２番目の文字「き」の文字コードと、第１の文書画
像の領域１の左から３番目の文字の文字コードを比較す
る。この場合、３番目以降の文字コードが全て一致する
ので、第１の文書画像の文字列「か、き、く、け、こ」
を含む行画像と、第２の文書画像の同一の文字列を含む
行画像の文字領域の位置が２つの文書画像の重なり位
置、すなわち結合位置であることが分かる。

【０１３８】以上のようにして文書画像の結合位置を検
出したなら、検出した結合位置で２つの文書画像を結合
する。図２７は、図１９のステップＳ１９０４の画像結
合処理のフローチャートである。

【０１３９】文書画像の結合位置が得られたなら、第１
及び第２の文書画像を結合のために不要な画像と残す必
要のある画像に分割する（図２７，Ｓ２７０１）。次
に、２つの文書画像がずれて読み取られている場合もあ
るので、２つの文書画像を含むような領域の縦幅と横幅
とを決定する（Ｓ２７０２）。そして、不要な部分を除
去して２つの文書画像を結合する。

【０１４０】図２８は、結合面が行と平行な場合、つま
り文書画像を行と平行な方向にスキャンした場合の文書
画像の結合方法の説明図である。第１の文書画像の文字
列「あ、い、う・・・」の行と、第２の文書画像の文字
列「あ、い、う・・・」の行とが結合位置として検出さ
れ、第１及び第２の文書画像の該当する行の左隅上の座
標が結合位置の座標として設定される。そして、第１及
び第２の文書画像が、結合位置の座標の左側と右側の領
域にそれぞれ分割され、第１の文書画像の分割位置（結
合位置）の左側の画像を除去した残りの画像Ａと、第２
の文書画像の結合位置の右側の画像を除去した残りの画
像Ｂとが結合されて元の文書画像が再生される。

【０１４１】図２９は、結合面が行と垂直な場合、つま
り文書画像を行と垂直な方向にスキャンした場合の画像
の結合方法の説明図である。この場合、第１の文書画像
の文字列「か、き、く、け、こ・・・」の行の文字
「か」の左隅上を通り行と直交する線と、第２の文書画
像の文字列「か、き、く、け、こ」を含む行の文字
「か」の左隅上を通り行と直交する線が、それぞれ分割
位置として得られる。そして、第１の文書画像の文字
「か」の左上隅を通る線の左側の画像を除去した残りの
画像Ａと、第２の文書画像の文字「か」の左上隅を通る
線の左側の画像を除去した残りの画像Ｂとが結合されて
元の文書画像が再生される。

【０１４２】上述した第４の実施の形態は、分割して読
み取った文書画像をそれぞれ複数の領域に分割し、分割
した領域から行画像を抽出し、その行画像の文字コード
を比較して一致度が高い行画像を、文書画像の結合位置
として検出するようにしたので、文書の中に図形、表、
罫線等が含まれている場合でも、それらを含まない黒画
素領域を行画像として抽出することができる。例えば、
所定幅の行画像を検出することで、図形、表等を含んだ
黒画素領域を行画像から除外することができるので、よ
り正確に行画像を抽出することができる。従って、文書
画像の結合位置を短い処理時間で正確に検出し、文書画
像を再生することができる。

【０１４３】なお、上述した第４の実施の形態では、抽
出した行画像のそれぞれの文字の文字コードを比較して
文書画像の結合位置を検出しているが、文字に外接する
文字領域の位置と大きさとを比較して結合位置を検出す
るようにしても良い。

【０１４４】次に、図３０は、１つの文書画像を３つ以
上に分割して読み取ったときに、各画像を順に結合する
結合方法の説明図である。図３０に示すように、最初に
読み取った画像１と２番目に読み取った画像２の結合位
置を上述した画像の結合位置の検出処理により求め、画
像１と画像２とを結合する。次に、１番目の画像１と２
番目の画像２とを結合して得られた結合画像１と３番目
に読み取った画像３とを結合し、結合画像３を得る。以
下、同様に結合により得られた画像と読み取った画像を
順に結合して最終的に全て元の画像を再生する。

【０１４５】以下、複数画像の結合処理を図３１のフロ
ーチャートと図３２のユーザインタフェースの説明図を
参照して説明する。第１の画像格納部１２に格納されて
いる画像１を取り込む（図３１，Ｓ３１０１）。次に、
画像の取り込み枚数をカウントするカウンタｉに初期値
として「１」を設定する（Ｓ３１０２）。

【０１４６】次に、自動結合のチェックボックスがオン
となっているか否かを判別する（Ｓ３１０３）。図３２
のの自動結合のチェックボックスをユーザがマウス等
によりクリックしてオンにすると、ステップＳ３１０３
の判別がＹＥＳとなり、ステップＳ３１０４以降の処理
が実行され、分割された文書画像の結合が行われる。な
お、ステップＳ３１０３において、自動結合のチェック
ボックスがオフと判別された場合には（ステップＳ３１
０３，ＮＯ）、ステップＳ３１１１に進み取り込んだ画
像をそのまま表示する。なお、初期設定では自動結合す
るように条件が設定されている。

【０１４７】次に、取り込んだ画像の枚数を計数するカ
ウンタｉの値がユーザにより設定さる結合枚数ｎより小
さいか否かを判別する（Ｓ３１０４）。結合枚数とは、
１つの文書画像を幾つに分割して読み取ったか示すもの
であり、ユーザが図３２のの数字を変更することによ
り結合枚数を設定するようになっている。

【０１４８】本実施の形態の文書画像結合装置の表示装
置には、図３２に示すような設定画面が表示され、ユー
ザは、その設定画面から文書画像の読み取り条件、結合
条件等を設定することができる。具体的には、スキャナ
の解像度、画像の読み取り単位、読み取り対象の用紙サ
イズ、画像タイプ等をプルダウンメニューから選択でき
るようになっており、読み取り方向、自動結合を行うか
否かはチェックボックスをマウス等でクリックすること
で変更することができる。これにより、文書画像を読み
取って、結合するまでの処理条件を簡易に設定でき、文
書画像を結合する際の操作を簡略化できる。

【０１４９】図３１に戻り、取り込んだ画像の枚数が指
定された結合枚数より小さい場合には（Ｓ３１０４，Ｙ
ＥＳ）、次に、結合終了ボタンが操作されたか否かを判
別する（Ｓ３１０５）。結合終了ボタンとは、図３２の
に示すボタンであり、自動結合の途中でこのボタンを
操作することにより、自動結合処理を終了させることが
できる。

【０１５０】次に、結合終了ボタンが操作されていなけ
れば（Ｓ３１０５，ＮＯ）、次のステップＳ３１０６に
進み、第２の画像格納部１３に格納されている画像２を
取り込む（Ｓ３１０６）。上述した画像の結合位置の検
出処理により得られた結合位置で２つの画像を結合する
（Ｓ３１０７）。そして、画像の結合が成功したか否か
を判別する（Ｓ３１０８）。

【０１５１】処理のスタート時には、画像１としては１
番目に読み取った画像が、画像２としては２番目に読み
取った画像が取り込まれるので両者を結合し、結合画像
を第１の画像格納部１２に格納する。

【０１５２】画像の結合が成功したなら（Ｓ３１０８，
ＹＥＳ）、処理のスタート時には、１番目と２番目の画
像の結合が終了したことになるので、カウンタｉの値を
インクリメントして「２」にして２枚分の画像の結合が
終了したことを記憶し、結合した画像を第１の画像格納
部１２に転送し（Ｓ３１０９）、ステップＳ３１０４に
戻る。以下、第２の画像格納部１３に３番目、４番目・
・・の画像を順に格納し、その画像２と第１の画像格納
部１２の２回目、３回目・・・の結合画像との結合を繰
り返すことにより、分割して読み取った文書画像を再生
する。

【０１５３】図３１のステップＳ３１０８で結合が失敗
したと判断された場合には（Ｓ３１０８，ＮＯ）、ステ
ップＳ３１１０に進み再度第２の画像格納部１３の画像
２を取り込むか否かを判別する。ユーザにより取り込み
が指示された場合には、ステップＳ３１０５に戻り上述
した画像の結合処理を繰り返す。

【０１５４】また、ステップＳ３１１１０で結合終了ボ
タンが操作されたと判別された場合には（Ｓ３１１０，
ＹＥＳ）、ステップＳ３１１１に進み第１の画像格納部
１２に格納されている結合画像を表示する。

【０１５５】さらに、ステップＳ３１０４でカウンタｉ
の値が指定枚数Ｎと等しいか、または大きいと判別され
た場合（Ｓ３１０４，ＮＯ）、つまり指定枚数分の画像
の結合処理が終了した場合には、ステップＳ３１１１に
進み第１の画像格納部１２に格納されている結合画像、
すなわち再生した元の文書画像を表示する。

【０１５６】これらの処理により、図３０に示すように
１つの文書画像をｎ個に分割して読み取る場合に、１番
目の画像１と２番目の画像２を結合して結合画像１を生
成し、次に３番目の画像３とその結合画像１とを結合し
て結合画像２を生成する。以下、同様に前回の結合処理
における結合画像Ｋ−１と次の画像Ｋとを結合して最終
的な結合画像ｎを生成する。

【０１５７】このように、１つの文書画像を複数の画像
に分割して読み取る場合に、分割された個々の画像をそ
れぞれ結合するのではなく、１番目と２番目の画像を結
合して得られる結合画像と次の３番目の画像を結合し、
その結合画像と４番目の画像を結合し、以下同様の結合
処理を繰り返すことにより、例えば、画像のスキャン順
序に一定の規則性がある場合には、無駄な画像の結合位
置の検出を行わずに、より短時間で結合位置を検出する
ことができる。

【０１５８】なお、文書画像を３以上の複数の画像に分
割する場合、文書画像をハンディスキャナ等でスキャン
する順序は一定の傾向がある場合が多いので、画像１，
画像２の結合方向が検出されたなら、その結合方向を優
先して次の画像３との結合位置を検出することでより短
時間で結合位置を検出することができる。また、画像の
結合処理の過程でそれ以前と結合方向が変化した場合に
は、新たに検出された結合方向で次の画像を結合するこ
とで、スキャン順序、方向の変化に応じて効率的に結合
位置の検出を行うことができる。

【０１５９】さらに、本発明の文書画像結合装置に格納
されるプログラムデータを、図３３に示すフロッピーデ
ィスク、ＣＤＲＯＭ等の記録媒体３３０１に格納してお
いて、その記録媒体３３０１を情報処理装置（パーソナ
ルコンピュータ等）３３０２の媒体駆動装置（フロッピ
ーディスクドライバー、ＣＤＲＯＭドライバー等）によ
り読み取り、読み取ったプログラムデータをハードディ
スク等の記憶装置３３０３に格納し、そのプログラム実
行するようにしてもよい。あるいはプログラムを情報提
供者のコンピュータのハードディスク等の記憶装置３３
０４に記憶しておいて、通信によりユーザの情報処理装
置３３０２に転送し、ユーザ側の記憶装置３３０３に記
憶してプログラムを実行するようにしてもよい。また、
記録媒体３３０１に記録するプログラムは、実施の形態
に述べたフローチャートの一部の機能を有するものであ
ってもよい。

【０１６０】

【発明の効果】本発明によれば、分割して読み取る文書
に結合のためのマーク等を付ける必要が無く、また分割
した文書画像の結合位置をオペレータが指定する必要が
無くなり、分割して読み取った複数の画像をユーザの手
を煩わすことなく結合することができる。また、分割し
て読み取った文書画像をそれぞれ複数の領域に分割して
行画像を抽出することで、文書画像に図形、表等が含ま
れる場合でも、行画像を抽出して複数の文書画像を正確
に結合することができる。

【図面の簡単な説明】

【図１】第１の実施の形態の文書画像結合装置のブロッ
ク図である。

【図２】第２の実施の形態の文書画像結合装置のブロッ
ク図である。

【図３】同図（Ａ）、（Ｂ）、（Ｃ）は、原理説明図で
ある。

【図４】全体の処理を示すフローチャートである。

【図５】行画像の説明図である。

【図６】行画像抽出処理のフローチャートである。

【図７】文字領域の説明図である。

【図８】同図（Ａ）、（Ｂ）は横書き文書と縦書き文書
のスキャン順序の説明図である。

【図９】同図（Ａ）〜（Ｄ）は、重なり位置の検出方向
の説明図である。

【図１０】同図（Ａ），（Ｂ）は、文書のスキャン順序
の説明図である。

【図１１】同図（Ａ）〜（Ｄ）は、縦書文書の結合方向
の説明図である。

【図１２】同図（Ａ）〜（Ｄ）は、横書文書の結合方向
の説明図である。

【図１３】重なり位置検出処理のフローチャート（その
１）である。

【図１４】同図（Ａ）、（Ｂ）は、横書き及び縦書き文
書画像の行画像番号の説明図である。

【図１５】文字領域パターンと文字コードを比較して重
なり位置を検出する場合の説明図である。

【図１６】重なり位置検出処理のフローチャート（その
２）である。

【図１７】文字領域のパターンを比較して重なり位置を
検出する場合の説明図である。

【図１８】文字コードを比較して重なり位置を検出する
場合の説明図である。

【図１９】第４の実施の形態の処理の概要を示すフロー
チャートである。

【図２０】行画像の抽出処理のフローチャートである。

【図２１】同図（Ａ）、（Ｂ）は、白画素ラインと黒画
素ラインの抽出方法の説明図である。

【図２２】行画像の抽出の説明図である。

【図２３】図形を含む文書の行画像の抽出の説明図であ
る。

【図２４】画像の結合位置の検出処理のフローチャート
である。

【図２５】結合面が行と平行な場合の重なり位置の検出
方法の説明図である。

【図２６】結合面が行と垂直な場合の重なり位置の検出
方法の説明図である。

【図２７】画像の結合処理のフローチャートである。

【図２８】結合面が行と平行な場合の画像の結合方法の
説明図である。

【図２９】結合面が行と垂直な場合の画像の結合方法の
説明図である。

【図３０】複数画像の結合方法の説明図である。

【図３１】複数画像の結合処理のフローチャートであ
る。

【図３２】ユーザインタフェースの説明図である。

【図３３】記録媒体の説明図である。

【図３４】従来の画像結合方法の説明図である。

【符号の説明】

１１，２１文書画像結合装置１２第１の画像格納部１３第２の画像格納部１４文字領域検出部１５，２３重なり位置検出部１６画像結合部２２文字認識部

───────────────────────────────────────────────────── フロントページの続き (72)発明者千葉広隆神奈川県川崎市中原区上小田中４丁目１番１号富士通株式会社内 (72)発明者野田嗣男神奈川県川崎市中原区上小田中４丁目１番１号富士通株式会社内Ｆターム(参考） 5B029 AA01 BB15 CC20 CC23 CC27 CC28 DD10 EE08 5B050 BA16 CA07 DA06 EA03 EA05 EA06 EA07 EA08 EA18 EA19 FA02 5B057 AA11 BA02 CA02 CA06 CA12 CA16 CB02 CB06 CB12 CB16 CB18 CC03 CE09 CE10 DA07 DA08 DB02 DB05 DB08 DC05 DC08 DC19 DC31 DC36 5C076 AA12 AA36 BA08 CA10

Claims

【特許請求の範囲】

【請求項１】分割して読み取られた複数の文書画像のそ
れぞれについて文字領域を抽出する文字領域抽出手段
と、前記文字領域抽出手段により抽出された文字領域内の文
字画像を文字認識する文字認識手段と、前記文字認識手段により得られるそれぞれの文書画像の
文字認識結果に基づいて前記複数の文書画像の重なりを
検出する重なり検出手段と、前記重なり検出手段により検出された重なり位置で前記
複数の文書画像を結合する画像結合手段とを備えること
を特徴とする文書画像結合装置。
【請求項２】分割して読み取られた複数の文書画像のそ
れぞれについて文字領域を抽出する文字領域抽出手段
と、前記文字領域抽出手段により抽出された前記複数の文書
画像の複数の文字領域の位置と大きさとを比較して一致
度の高い複数の文字領域を検出し、検出した一致度の高
い複数の文字領域の位置に基づいて前記複数の文書画像
の重なりを検出する重なり検出手段と、前記重なり検出手段により検出された重なり位置で前記
複数の文書画像を結合する画像結合手段とを備えること
を特徴とする文書画像結合装置。
【請求項３】分割して読み取られた複数の文書画像のそ
れぞれについて文字領域を抽出する文字領域抽出手段
と、前記文字領域抽出手段により抽出された文字領域内の文
字画像を文字認識する文字認識手段と、前記文字認識手段により得られるそれぞれの文書画像の
文字認識結果と、前記文字領域抽出手段により抽出され
た前記複数の文書画像の複数の文字領域の位置と大きさ
の比較結果に基づいて前記複数の文書画像の重なりを検
出する重なり検出手段と、前記重なり検出手段により検出された重なり位置で前記
複数の文書画像を結合する画像結合手段とを備えること
を特徴とする文書画像結合装置。
【請求項４】前記文字領域抽出手段は、前記複数の文書
画像の行画像の複数の文字領域を抽出することを特徴と
する請求項１，２または３記載の文書画像結合装置。
【請求項５】前記重なり検出手段は、前記複数の文書画
像の縁から中心に向かう方向に前記行画像の文字領域の
比較を行って一致度の高い行画像の位置を重なり位置と
して検出することを特徴とする請求項１，２または３記
載の文書結合装置。
【請求項６】前記分割されて読み取られた複数の文書画
像は２つの文書画像からなり、前記重なり検出手段は、前記２つの文書画像の行画像の
文字領域を比較して前記２つの文書画像の重なり位置を
検出することを特徴とする請求項１，２または３記載の
文書画像結合装置。
【請求項７】前記重なり検出手段は、前記複数の文書画
像の特定の領域内の文字領域を検出対象とすることを特
徴とする請求項１，２，３または４記載の文書画像結合
装置。
【請求項８】前記重なり検出手段は、複数の検出方向の
中で予め優先順位の定められた方向から順に重なり位置
を検出することを特徴とする請求項１，２，３または４
記載の文書画像結合装置。
【請求項９】前記重なり検出手段は、前記文書画像が縦
書きか、横書きかに応じて重なり位置を検出する方向を
決定することを特徴とする請求項８記載の文書画像結合
装置。
【請求項１０】前記重なり検出手段は、特定の方向にの
み重なり位置の検出を行うことを特徴とする請求項１，
２，３または４記載の文書画像結合装置。
【請求項１１】前記文字領域抽出手段は、文字画像に外
接する四角形で囲まれる領域を文字領域として抽出する
ことを特徴とする請求項１，２，３または４記載の文書
結合装置。
【請求項１２】分割して読み取られた複数の文書画像の
それぞれについて文字領域を抽出し、前記抽出した文字領域内の文字画像を文字認識し、前記分割して読み取られたそれぞれの文書画像の文字認
識結果に基づいて前記複数の文書画像の重なりを検出
し、検出された重なり位置で前記複数の文書画像を結合する
ことを特徴とする文書画像結合方法。
【請求項１３】分割して読み取られた複数の文書画像の
それぞれについて文字領域を抽出し、それぞれの文書画像の複数の文字領域の位置と大きさと
を比較して一致度の高い複数の文字領域を検出し、前記一致度の高い複数の文字領域の位置に基づいて前記
複数の文書画像の重なりを検出し、検出された重なり位置で前記複数の文書画像を結合する
ことを特徴とする文書画像結合方法。
【請求項１４】分割して読み取られた複数の文書画像の
それぞれについて文字領域を抽出し、抽出された文字領域内の文字画像を文字認識し、それぞれの文書画像の文字認識結果と、前記複数の文書
画像の複数の文字領域の位置と大きさの比較結果とに基
づいて前記複数の文書画像の重なりを検出し、検出された重なり位置で前記複数の文書画像を結合する
ことを特徴とする文書画像結合方法。
【請求項１５】分割して読み取られた複数の文書画像の
内の任意数の文書画像またはそれぞれの文書画像を複数
の領域に分割する領域分割手段と、前記領域分割手段により分割された複数の領域のそれぞ
れについて行画像を抽出する行画像抽出手段と、前記行画像抽出手段により抽出されたそれぞれの領域の
行画像の文字領域を比較して一致度の高い文字領域の位
置に基づいて前記複数の文書画像の重なり位置を検出す
る重なり検出手段と、前記重なり検出手段により検出された重なり位置で前記
複数の文書画像を結合する画像結合手段とを備えること
を特徴とする文書画像結合装置。
【請求項１６】分割して読み取られた複数の文書画像の
内の任意数の文書画像またはそれぞれの文書画像を複数
の領域に分割する領域分割手段と、前記領域分割手段により分割された複数の領域のそれぞ
れについて行画像を抽出する行画像抽出手段と、前記行画像抽出手段により抽出されたそれぞれの領域の
行画像の文字画像を文字認識する文字認識手段と、前記文字認識手段により得られるそれぞれの文書画像の
１または複数の領域の文字認識結果に基づいて前記複数
の文書画像の重なり位置を検出する重なり検出手段と、前記重なり検出手段により検出された重なり位置で前記
複数の文書画像を結合する画像結合手段とを備えること
を特徴とする文書画像結合装置。
【請求項１７】分割して読み取られた複数の文書画像の
内の任意数の文書画像またはそれぞれの文書画像を複数
の領域に分割する領域分割手段と、前記領域分割手段により分割された複数の領域のそれぞ
れについて行画像を抽出する行画像抽出手段と、前記行画像抽出手段により抽出された行画像の複数の文
字領域の位置と大きさを比較して一致度の高い複数の文
字領域を検出し、検出した複数の文字領域の位置に基づ
いて前記複数の画像の重なり位置を検出する重なり検出
手段と、前記重なり検出手段により検出された重なり位置で前記
複数の文書画像を結合する画像結合手段とを備えること
を特徴とする文書画像結合装置。
【請求項１８】前記領域分割手段は、前記複数の文書画
像をそれぞれ垂直及び水平方向に複数の領域に分割し、前記行画像抽出手段は、前記複数の文書画像の垂直方向
に分割された領域から抽出した行画像の数と、水平方向
に分割された領域から抽出した行画像の数とを比較し、
行画像の数の多い領域の行画像の方向を前記複数の文書
画像の行画像の方向として認識することを特徴とする請
求項１５，１６または１７記載の文書画像結合装置。
【請求項１９】前記行画像抽出手段は、分割された領域
の１ライン分の画素を検出し、１ラインに含まれる黒画
素数が一定値以上となるラインを黒画素ライン、それ以
外のラインを白画素ラインとして検出することを特徴と
する請求項１５，１６，１７または１８記載の文書画像
結合装置。
【請求項２０】前記行画像抽出手段は、前記領域分割手
段により分割された領域の分割線に対して垂直方向に１
ラインづつ前記領域の画素を検出することを特徴とする
請求項１９記載の文書画像結合装置。
【請求項２１】前記行画像抽出手段は、連続する黒画素
ラインの数が所定範囲内となる領域を黒画素領域として
抽出することを特徴とする請求項１９または２０記載の
文書画像結合装置。
【請求項２２】前記行画像抽出手段は、連続する白画素
ラインの数が所定値以上となる領域を白画素領域として
抽出することを特徴とする請求項２１記載の文書画像結
合装置。
【請求項２３】前記領域分割手段は、読み取った文書画
像の解像度に応じて分割する領域の大きさを変更するこ
とを特徴とする請求項１５，１６または１７記載の文書
画像結合装置。
【請求項２４】前記行画像抽出手段は、読み取った文書
画像の解像度に応じて黒画素領域とみなす黒画素ライン
の数を変更することを特徴とする請求項２１記載の文書
画像結合装置。
【請求項２５】前記行画像抽出手段は、所定の条件を満
たす白画素領域と隣接する黒画素領域を行画像として抽
出することを特徴とする請求項２１または２２記載の文
書画像結合装置。
【請求項２６】前記重なり検出手段は、前記行画像抽出
手段により抽出された行画像の数の多い方向に分割され
た複数の領域の行画像の文字領域を比較して一致度の高
い文字領域を重なり位置として検出することを特徴とす
る請求項１８記載の文書画像結合装置。
【請求項２７】前記重なり検出手段は、過去に文書画像
の重なり位置として検出された行画像の検出頻度を前記
行画像に割り当てられる識別情報と対応させて記憶し、
検出頻度の高い行画像から優先して重なり位置の検出を
行うことを特徴とする請求項１５，１６または１７記載
の文書画像結合装置。
【請求項２８】前記重なり検出手段は、それぞれの領域
の行画像を所定の順序で比較することを特徴とする請求
項１５，１６または１７記載の文書画像結合装置。
【請求項２９】分割して読み取られた複数の文書画像の
内の任意数の文書画像またはそれぞれの文書画像を複数
の領域に分割する領域分割手段と、前記領域分割手段により分割された複数の領域のそれぞ
れについて行画像を抽出する行画像抽出手段と、前記行画像抽出手段により抽出されたそれぞれの領域の
行画像の文字領域を比較して一致度の高い文字領域の位
置に基づいて前記複数の文書画像の重なり位置を検出す
る重なり検出手段と、前記重なり検出手段により検出された重なり位置で前記
複数の文書画像を結合する画像結合手段と、前記複数の文書画像の自動結合を行うか否かを表示画面
上で設定できる設定手段とを備えることを特徴とする文
書画像結合装置。
【請求項３０】前記設定手段は、表示画面上に表示され
る操作ボタンであることを特徴とする請求項２９記載の
文書画像結合装置。
【請求項３１】前記設定手段は、文書画像の結合枚数を
ユーザが設定できることを特徴とする請求項２９または
３０記載の文書画像結合装置。
【請求項３２】分割して読み取られた複数の文書画像の
内の任意数の文書画像またはそれぞれの文書画像を複数
の領域に分割し、分割された複数の領域のそれぞれについて行画像を抽出
し、それぞれの領域の行画像の文字領域を比較して一致度の
高い文字領域の位置に基づいて前記複数の文書画像の重
なり位置を検出し、検出された重なり位置で前記複数の文書画像を結合する
ことを特徴とする文書画像結合方法。
【請求項３３】分割して読み取られた複数の文書画像の
内の任意数の文書画像またはそれぞれの文書画像を複数
の領域に分割し、分割された複数の領域のそれぞれについて行画像を抽出
し、抽出された行画像の文字領域内の文字画像を文字認識
し、それぞれの領域の文字認識結果に基づいて前記複数の文
書画像の重なり位置を検出し、検出された重なり位置で前記複数の文書画像を結合する
ことを特徴とする文書画像結合方法。
【請求項３４】分割して読み取られた複数の文書画像の
内の任意数の文書画像またはそれぞれの文書画像を複数
の領域に分割し、分割された複数の領域のそれぞれについて行画像を抽出
し、それぞれの領域の行画像の複数の文字領域の位置と大き
さを比較して一致度の高い文字領域を抽出し、抽出された文字領域の位置に基づいて前記複数の画像の
重なり位置を検出し、検出された重なり位置で前記複数の文書画像を結合する
ことを特徴とする文書画像結合方法。
【請求項３５】分割して読み取られた複数の文書画像の
自動結合を行うか否かを表示画面上で設定できるように
表示し、前記複数の文書画像の内の任意数の文書画像またはそれ
ぞれの文書画像を複数の領域に分割し、分割された複数の領域のそれぞれについて行画像を抽出
し、それぞれの領域の行画像の文字領域を比較して一致度の
高い文字領域の位置に基づいて文書画像の重なり位置を
検出し、検出された重なり位置で前記複数の文書画像を結合する
ことを特徴とする文書画像結合方法。
【請求項３６】分割して読み取られた複数の文書画像の
それぞれについて文字領域を抽出させ、前記複数の文字領域の位置と大きさとに基づいて前記複
数の文書画像の複数の文字領域を比較させ一致度の高い
文字領域を検出させ、一致度の高い文字領域の位置に基
づいて前記複数の文書画像の重なり位置を検出させ、検出された重なり位置で前記複数の文書画像を結合させ
るプログラムを記録したコンピュータ読み取り可能な記
録媒体。
【請求項３７】分割して読み取られた複数の文書画像の
それぞれについて文字領域を抽出させ、抽出された文字領域内の文字画像を文字認識させ、それぞれの文書画像の文字認識結果と、前記複数の文書
画像の複数の文字領域の位置と大きさの比較結果とに基
づいて前記複数の文書画像の重なり位置を検出させ、検出された重なり位置で前記複数の文書画像を結合させ
るプログラムを記録したコンピュータ読み取り可能な記
録媒体。
【請求項３８】分割して読み取られた複数の文書画像の
内の任意数の文書画像またはそれぞれの文書画像を複数
の領域に分割させ、分割された複数の領域のそれぞれについて行画像を抽出
させ、それぞれの領域の行画像の文字領域を比較して一致度の
高い文字領域の位置に基づいて前記複数の文書画像の重
なり位置を検出させ、検出された重なり位置で前記複数の文書画像を結合させ
るプログラムを記録したコンピュータ読み取り可能な記
録媒体。
【請求項３９】分割して読み取られた複数の文書画像の
内の任意数の文書画像またはそれぞれの文書画像を複数
の領域に分割させ、分割された複数の領域のそれぞれについて行画像を抽出
させ、それぞれの領域の行画像の文字領域内の文字画像を文字
認識させ、それぞれの領域の文字認識結果に基づいて前記複数の文
書画像の重なり位置を検出させ、検出された重なり位置で前記複数の文書画像を結合させ
るプログラムを記録したコンピュータ読み取り可能な記
録媒体。
【請求項４０】分割して読み取られた複数の文書画像の
自動結合を行うか否かを表示画面上で設定できるように
表示させ、前記複数の文書画像の内の任意数の文書画像またはそれ
ぞれの文書画像を複数の領域に分割させ、分割された複数の領域のそれぞれについて行画像を抽出
させ、それぞれの領域の行画像の文字領域を比較して一致度の
高い文字領域の位置に基づいて前記複数の文書画像の重
なり位置を検出させ、検出された重なり位置で前記複数の文書画像を結合させ
るプログラムを記録したコンピュータ読み取り可能な記
録媒体。