JP7180408B2

JP7180408B2 - 画像処理装置および画像処理プログラム

Info

Publication number: JP7180408B2
Application number: JP2019011385A
Authority: JP
Inventors: 茂岡田; 周作久保; 公則吉塚
Original assignee: Fuji Xerox Co Ltd; Fujifilm Business Innovation Corp
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2019-01-25
Filing date: 2019-01-25
Publication date: 2022-11-30
Anticipated expiration: 2039-01-25
Also published as: US20200242773A1; JP2020120330A; US11328425B2

Description

本発明は、画像処理装置および画像処理プログラムに関する。

例えば本の見開きの画像などの２ページ分を１枚の画像としてスキャナで読み取り、その１枚の画像を１ページごとに２分割して２枚の画像をファイル出力したいという要求がある。この場合に、定型サイズの画像であってその画像の中央で２分割すれば済む場合だけでなく、不定型サイズの画像を分割する場合など、どの箇所で分割すればよいか装置にとっては必ずしも明らかではない。

ここで、特許文献１には、本の見開きの画像の、文字が存在しない境界付近の縁の形状や画素の白黒のヒストグラムに基づく文字無し領域の認識などにより、境界箇所を検出することが提案されている。

特開２００５－５１３８３号公報

しかし、画像全体の画素のヒストグラムに基づいて分割しようとすると、例えば文字数が少なく空白が多い画像などの場合、複数の文字なし領域が出現し、分割箇所を誤るおそれがある。

本発明は、画像全体の画素のヒストグラムに基づいて分割する場合と比べ、正確に、分割するべき境界箇所で分割することができる画像処理装置および画像処理プログラムを提供することを目的とする。

請求項１は、
第１の画像データにより表される、２ページ分からなる第１の画像の、該２ページに跨る一部領域である探索領域内から分割可能領域を探索する探索部と、
前記第１の画像を、前記探索部での探索により得られた分割可能領域内を通って、前記２ページを跨ぐ第１の向きに交わる第２の向きに延びる分割線で分割して各１ページ分の２枚の第２の画像を表す第２の画像データを生成する分割部とを備え、
前記探索部が、
前記探索領域内に存在する文字領域を認識する認識部と、
前記探索領域内の、前記第１の向きに並ぶ複数の画素の各々について、前記第２の向きに並ぶ前記文字領域の行数を計数する計数部とを備え、
前記計数部で計数された、前記複数の画素の計数値の分布に基づいて、前記分割可能領域を探索することを特徴とする画像処理装置である。

請求項２は、前記複数の画素が、前記第１の向きに断続的に並ぶ複数の画素であることを特徴とする請求項１に記載の画像処理装置である。

請求項３は、
前記探索部が、前記計数部で計数された計数値のうちの第１の計数閾値以下の計数値が対応づけられた画素が前記第１の向きについて第１の継続閾値以上にわたって継続する第１の分割可能領域を探索し、
前記分割部が、前記第１の画像を、前記第１の分割可能領域内を通る分割線で分割することを特徴とする請求項１または２に記載の画像処理装置である。

請求項４は、前記分割部は、前記第１の分割可能領域が存在しない場合に、前記第１の画像を、幾何学的に定められた、前記第１の向きについての中央位置で分割することを特徴とする請求項３に記載の画像処理装置である。

請求項５は、前記探索部は、前記計数部で計数された計数値のうちのゼロの計数値が対応づけられた画素が前記第１の向きについて第１の継続閾値以上継続する第１の分割可能領域を探索し、
前記分割部は、前記第１の分割可能領域が存在する場合に、前記第１の画像を該第１の分割可能領域内を通る分割線で分割することを特徴とする請求項１または２に記載の画像処理装置である。

請求項６は、
前記探索部は、前記第１の分割可能領域が存在しない場合に、文字領域の行数を計数した各画素の計数値を１ずつ減じる第１の減算部を備え、
前記分割部は、前記第１の減算部を第１の計数閾値を超える回数にわたって繰り返し作用させるよりも前に前記第１の分割可能領域が出現した場合に、前記第１の画像を該第１の分割可能領域内を通る分割線で分割することを特徴とする請求項５に記載の画像処理装置である。

請求項７は、
前記探索部は、前記第１の分割可能領域が存在しない場合に前記認識部で認識された前記文字領域を縮小して前記計数部を再度作用させる縮小部を備え、
前記分割部が、前記縮小部を第１の回数閾値を超える回数にわたって繰り返し作用させるよりも前に、第２の計数閾値以下である画素が前記第１の向きについて第２の継続閾値以上にわたって継続する第２の分割可能領域が出現した場合に、前記第１の画像を該第２の分割可能領域内を通る分割線で分割することを特徴とする請求項３または請求項６に記載の画像処理装置である。

請求項８は、前記分割部は、前記縮小部を前記第１の回数閾値と同数回にわたって繰り返し作用させても前記第２の分割可能領域が出現しない場合に、前記第１の画像を、幾何学的に定められた、前記第１の向きについての中央位置で分割することを特徴とする請求項７に記載の画像処理装置である。

請求項９は、
前記探索部は、前記縮小部を前記第１の回数閾値と同数回にわたって繰り返し作用させても前記第２の分割可能領域が出現しない場合に、前記縮小部を前記第１の回数閾値と同数回にわたって繰り返し作用させることにより前記計数部で得られた各画素の計数値を１ずつ減じる第２の減算部を備え、
前記分割部は、前記第２の減算部を前記第２の計数閾値を超えて繰り返し作用させるよりも前に前記第２の分割可能領域が出現した場合に、前記第１の画像を該第２の分割可能領域内を通る分割線で分割することを特徴とする請求項７に記載の画像処理装置である。

請求項１０は、前記分割部は、前記第２の減算部を前記第２の計数閾値と同数回にわたって繰り返し作用させても前記第２の分割可能領域が出現しない場合に、前記第１の画像を、幾何学的に定められた、前記第１の向きについての中央位置で分割することを特徴とする請求項９に記載の画像処理装置である。

請求項１１は、前記分割部による分割で生成された前記第２の画像データにより表される前記２枚の第２の画像の前記第１の向きの寸法が互いに異なっている場合に該２枚の画像の寸法を調整する調整部を備えたことを特徴とする請求項１から１０のうちのいずれか１項に記載の画像処理装置である。

請求項１２は、前記分割部による分割で生成された前記第２の画像データにより表される前記２枚の第２の画像の各々について文字領域の傾きを補正する補正部を備えたことを特徴とする請求項１から１１のうちのいずれか１項に記載の画像処理装置である。

請求項１３は、プログラムを実行する情報処理装置内で実行され、該情報処理装置を請求項１から１２のうちのいずれか１項に記載の画像処理装置として動作させることを特徴とする画像処理プログラムである。

請求項１および請求項３の画像処理装置、並びに、請求項１３の画像処理プログラムによれば、画像全体の画素のヒストグラムに基づいて分割する場合と比べ、正確に分割することができる。

請求項２の画像処理装置によれば、複数の画素が連続的に並ぶ複数の画素である場合と比べ、短時間で分割箇所探索の演算が終了する。

請求項４の画像処理装置によれば、第１の分割可能領域が存在しない場合において第１の分割可能領域を探索する演算以外の分割可能領域探索の演算を試みる場合と比べ、短時間で分割可能領域探索の演算が終了する。

請求項５の画像処理装置によれば、計数値がゼロ以外の第１の計数閾値以下の計数値を含んで第１の継続閾値以上継続する場合と比べ、高い信頼性をもって分割される。

請求項６の画像処理装置によれば、第１の減算部を備えない場合と比べ、分割可能領域が探索される可能性が高まる。

請求項７の画像処理装置によれば、縮小部を備えない場合と比べ、分割可能領域が探索される可能性が高まる。

請求項８の画像処理装置によれば、縮小部による文字領域の縮小による第２の分割可能領域を探索する演算に加えてさらに分割可能領域探索の演算を試みる場合と比べ、短時間で分割可能領域探索の演算が終了する。

請求項９の画像処理装置によれば、第２の減算部を備えない場合と比べ、分割可能領域が探索される可能性が高まる。

請求項１０の画像処理装置によれば、文字領域の認識による分割領域の探索に失敗しても２枚の第２の画像が得られる。

請求項１１の画像処理装置によれば、分割により得られた２枚の第２の画像の寸法が互いに異なっているときに、それらの第２の画像の寸法が調整される。

請求項１２の画像処理装置によれば、分割により得られた２枚の第２の画像の文字領域が傾いているときに、文字の向きが調整される。

本発明の一実施形態が組み込まれた複合機の外観図である。図１に外観を示した複合機の処理内容を示したブロック図である。図２に１つのブロックで示した画像処理装置の、ページ連写に関する処理を示した機能ブロック図である。図１に示した複合機にページ連写の処理を実行させる際の、タッチパネル上に表示されるＵＩ画面の推移を示した図である。スキャナでの読取りの開始を指示するＵＩ画面を示した図である。ページ連写処理の前半部分のフローチャートを示した図である。スキャナでの読取りにより得られた画像の一例を示した図である。図７に示した矩形の各文字領域の座標を示した図である。図６のステップＳ１５で用意される配列を示した図である。ページ連写処理の第１例の後半部分のフローチャートを示した図である。２分割の様子を示した図である。寸法調整の様子を示した図である。最終的に得られた２枚の第２の画像を示した図である。ページ連写処理の第２例の後半部分のフローチャートを示した図である。図７に示した第１の画像とは異なる第１の画像を示した図である。図１５に示した各文字領域の座標を示した図である。図６のステップＳ１５で用意される、図１５に示した第１の画像に関する配列と、その配列を使った演算方法を示した図である。図１５に示した第１の画像に関する２分割の様子を示した図である。図１５に示した第１の画像に関する寸法調整の様子を示した図である。図１５に示した第１の画像を２分割することにより最終的に得られた２枚の第２の画像を示した図である。図７に示した第１の画像および図１５に示した第１の画像のいずれとも異なる第１の画像を示した図である。図２１に示した各文字領域の座標を示した図である。図６のステップＳ１５で用意される、図２１に示した第１の画像に関する配列示した図である。図２１に示した第１の画像を２分割するときの分割線を示した図である。図２１に示した第１の画像を２分割することにより最終的に得られた２枚の第２の画像を示した図である。ページ連写処理の第３例の後半部分の中の一部のフローチャートを示した図である。これまでの第１の画像とはさらに異なる、もう１枚の第１の画像を示した図である。図２７に示した第１の画像の探索領域ＳＲの文字領域を示した図である。ページ連写処理の第３例の後半部分の中の、図２６に示した一部を除く残りのフローチャートを示した図である。縮小処理を示した図である。２分割された直後の２枚の画像を示した図である。図２７に示した第１の画像を２分割して得た、最終的な２枚の第２の画像を示した図である。図２７に近似したもう１つの第１の画像を示した図である。図３３に示した文字領域に縮小処理を施した後の文字領域を示した図である。ページ連写処理の第４例の後半部分の中の、図２６に示した一部を除く残りのフローチャートを示した図である。

以下、本発明の実施の形態について説明する。

図１は、本発明の一実施形態が組み込まれた複合機の外観図である。

この複合機１は、スキャナ１０とプリンタ２０を備えている。スキャナ１０では、原稿に記録されている画像が読み取られる。この読み取りに得られた画像は、不図示のパーソナルコンピュータ（以下、「ＰＣ」と略記する。）等に向けて送信される。

また、この複合機１には、プリント前の用紙を収容しておく用紙トレイ２１が備えられている。この複合機１には、不図示のＰＣ等から送信されてきた画像データが入力される。プリンタ２０では、用紙トレイ２１から取り出された用紙上に、入力された画像データに基づく画像がプリントされ、画像がプリントされた用紙が用紙台２２上に送り出される。

また、この複合機１は、コピー機能を備えている。コピーを行うときは、先ずは、用紙上の画像がスキャナ１０で読み取られる。そして、プリンタ２０により、その読み取りにより得られた画像データに基づく画像がプリント出力される。この複合機１にはさらに、ファクシミリ送受信機能などの他の機能も備えられている。ただし、本実施形態の説明には無関係なので、この複合機１の、このほかの機能についての説明は省略する。

この複合機１には、ユーザインタフェース（以下、「ＵＩ」と略記する。）を構成するタッチパネル３０が備えられている。このタッチパネル３０にはユーザ向けの各種の情報が表示され、また、このタッチパネル３０の操作により、ユーザによる各種の指示が入力される。

図２は、図１に外観を示した複合機の処理内容を示したブロック図である。ここには、本実施形態の特徴部分の説明に必要な処理ブロックのみが示されている。

この複合機１は、図１を参照して説明したスキャナ１０およびプリンタ２０に加え、さらに画像処理装置５０を備えている。スキャナ１０で得られた画像データは画像処理装置５０で画像処理されてからプリンタ２０に送り込まれ、プリンタ２０では、画像処理後の画像データに基づく画像が用紙上にプリント出力される。この画像処理装置５０には、プログラムを実行するコンピュータとしてのハードウェアとそのハードウェア上で実行されるソフトウェアとが含まれている。この画像処理装置５０は、本発明の画像処理装置の一実施形態に相当する。

本実施形態は、スキャナ１０で、２ページ分の原稿を１枚の画像として読み取り、画像処理装置５０で、その読み取りにより得られた画像データが表す画像を１ページごとの２枚の画像を表す画像データに変換する機能に特徴を有する。ここでは、この機能を「ページ連写」と称する。以下では、このページ連写に絞って説明を続ける。

なお、以下では、表現の煩雑さを避けるため、原稿上あるいは用紙上の画像と、原稿上の画像を読み取って得たデータ上の画像とを区別せずに、いずれも「画像」と表現することがある。また、ここでは、スキャナ１０で読み取られた２ページ分の画像を「第１の画像」あるいは「第１の画像データ」と称し、その第１の画像を２ページに分割した画像を「第２の画像」あるいは「第２の画像データ」と称する。

図３は、図２に１つのブロックで示した画像処理装置の、ページ連写に関する処理を示した機能ブロック図である。この画像処理装置の、ページ連写に関する機能も、プログラムを実行するコンピュータとしてのハードウェアとそのハードウェア上で実行されるソフトウェアとの複合により実現する機能である。本実施形態の具体例については後述することとし、ここでは、この図３を参照しながら、本実施形態について概括的に説明する。

この画像処理装置５０は、探索部５１と分割部５２を備えている。

探索部５１は、２ページ分からなる第１の画像の、その２ページに跨る一部領域である探索領域内から分割可能領域を探索する。本実施形態では、探索領域として、第１の画像の、第１の向きの全幅のうちの中央の２分の１の領域が探索領域として設定されている。探索部５１の内部構成についての説明は、他の機能ブロックの説明の後に回す。

分割部５２は、第１の画像を、探索部での探索により得られた分割可能領域内を通って、２ページを跨ぐ向き（以下では、２ページを跨ぐ向きを「第１の向き」と称する。）に交わる向き（以下では、第１の向きに交わる向きを「第２の向き」と称する。）に延びる分割線で分割して、各１ページ分の２枚の第２の画像を生成する。

また、この画像処理装置５０は、さらに調整部５３と補正部５４を備えている。

補正部５３および調整部５４では、分割部５２における２分割により生成された２枚の第２の画像の後処理が行われる。

厚い本の見開きの２ページをスキャナ１０で読み取って得た第１の画像などの場合、各々のページの文字が傾いていることがある。それら２ページ分の文字は互いに逆向きに傾いていることが多く、第１の画像上では文字の傾きを調整することは困難である。２ページに分割された第２の画像上では、その１枚ごとの第２の画像上の文字は同じ向きに傾いていることが多い。そこで、この画像処理装置５０には、補正部５３が備えられていて、分割部５２により生成された２枚の第２の画像の各々について文字領域の傾きが補正される。

また、分割部５２での２分割は、第１の画像の、第１の向き（２ページを跨ぐ向き）の寸法の中央で分割されるとは限らない。したがって、得られた２枚の第２の画像は、第１の向きの寸法が互いに異なっている可能性がある。そこで、調整部５４では、分割部５２により生成された２枚の第２の画像の第１の向きの寸法が互いに異なっている場合に、それら２枚の画像の寸法が互いに同一となるように調整する処理が行われる。

このようにして、分割部５２により２分割され、補正部５３により文字の傾き補正が行われ、さらに調整部５４により寸法調整が行なわれた２枚の第２の画像が生成される。

次に、探索部５１の構成について説明する。

探索部５１には、認識部５１１が備えられている。この認識部５１１では、光学的文字認識（ＯｐｔｉｃａｌＣｈａｒａｃｔｅｒＲｅｃｏｇｎｉｔｉｏｎ／Ｒｅａｄｅｒ、以下「ＯＣＲ」と略記する。）を実行するソフトウェアの動作により、スキャナ１０での読み込みにより得られた第１の画像上の文字領域が認識される。ただし、この認識部５１１は、第１の画像上の、２ページに跨る一部領域である探索領域内についてのみＯＣＲを実行させる。ＯＣＲでは、画像上の文字や、文字列の画像上の座標（文字領域）が認識されるが、分割部５２では、文字列の画像上の座標（文字領域）の情報が利用される。ＯＣＲソフトウェア自体は広く知られた技術であり、ここでの説明は省略する。

また、この探索部５１には、計数部５１２が備えられている。この計数部５１２では、探索領域内の、第１の向きに並ぶ複数の画素の各々について、第２の向きに並ぶ文字領域の行数が計数される。ここで、第１の向きに並ぶ複数の画素は必ずしも連続的に並ぶ複数の画素である必要はなく、断続的に並ぶ複数の画素であってもよい。例えば、１つの文字領域の第２の向きの寸法から１文字の大きさが推測されるため、この１文字の寸法の例えば１０分の１程度に飛び飛びに並ぶ複数の画素について計数を行ってもよい。そして、この探索部５１は、計数部５１１で計数された計数値の分布に基づいて、分割可能領域を探索する。

以下では、探索部５１における分割可能領域の探索方法について説明する。

本実施形態のうちの第１例の場合、探索部５１では、計数部５１２で計数された計数値のうちの第１の計数閾値Ｃ１以下の計数値が対応付けられた画素が第１の向きについて第１の継続閾値Ｋ１以上にわたって継続する第１の分割可能領域Ａ１を探索する。この第１の分割可能領域Ａ１が探索されたときは、分割部５２は、第１の画像Ｐ１を、その第１の分割可能領域Ａ１内を通る分割線ＤＬで分割する。

また、本実施形態のうちの第２例の場合、以下のようにして、この第１の分割可能領域Ａ１の探索が行われる。すなわち、この第２例の場合、探索部５１は、先ずは、計数部５１２で計数された計数値がゼロの画素が第１の向きについて上記の第１の継続閾値Ｋ１以上継続する第１の分割可能領域Ａ１を探索する。そして、分割部５２は、その第１の分割可能領域Ａ１が存在する場合には、第１の画像Ｐ１をその第１の分割可能領域Ａ１内を通る分割線ＤＬで分割する。

この第２例において、そのような計数値「ゼロ」が継続する第１の分割可能領域Ａ１が存在しなかった場合に備え、探索部５１には第１の減算部５１３が用意されている。この第１の減算部５１３は、計数値「ゼロ」が継続する第１の分割可能領域Ａ１が存在しなかった場合に、文字領域の行数を計数した各画素の計数値を１ずつ減じる。そして、探索部５１は、各画素の計数値を１ずつ減じることにより第１の分割可能領域Ａ１が現れないかどうかを監視する。ここで、計数値の下限は、ゼロに差し置かれる。そして、第１の減算部５１３を、上記の第１の計数閾値Ｃ１を超える回数にわたって繰り返し作用させるよりも前に、すなわち、各画素の計数値から第１の計数閾値Ｃ１を差し引くまでの間に、計数値「ゼロ」が第１の継続閾値Ｋ１以上に亘って並ぶ第１の分割可能領域Ａ１が出現した場合には、分割部５２は、第１の画像Ｐ１を、その出現した第１の分割可能領域Ａ１内を通る分割線ＤＬで分割する。

各画素の計数値から第１の計数閾値Ｃ１を差し引いてもなお、そのような第１の分割可能領域Ａ１が出現しなかったときは、上述の第１例および第２例の場合には、分割部７１は、それ以上の分割に適した箇所の検出は行わずに、第１の画像Ｐ１を、第１の向きについて幾何学的に定められた中央位置で分割する。ここでは、一例として、ＯＣＲを実行させた探索領域ＳＲの、第１の向きの中央を通る分割線ＤＬで第１の画像を分割する。

一方、以下に説明する第３例の場合、第１の分割可能領域Ａ１が出現しなかったときには、次のようにして分割可能領域の探索を続ける。この実施形態の探索部５１には、第１の分割可能領域Ａ１が出現しなかった場合に備え、縮小部５１４が用意されている。

この縮小部５１４は、認識部５１１で認識された文字領域を縮小して計数部５１２を再度作用させる。文字領域が縮小されると、隣接する２つの文字領域の間に文字領域ではないとみなされる領域が出現する。そこで、文字領域を縮小した状態で、計数部５１２を再度作用させる、すなわち、第２の向きに並ぶ文字領域の行数を計数すると、第２の向きに文字領域が存在しない、あるいは文字領域が少数しか存在しない箇所が出現する可能性がある。そこで、ここでは、縮小部５１４により文字領域を少しずつ縮小させる。探索部５１は、縮小部５１４による縮小により、第２の計数閾値Ｃ２以下である画素が第１の向きについて第２の継続閾値Ｋ２以上にわたって継続する第２の分割可能領域Ａ２が現れないかどうかを監視する。そして、縮小部５１４が第１の回数閾値Ｒ１を超える回数にわたって文字領域を繰り返し縮小する間に第２の分割可能領域Ａ２が出現した場合には、分割部５２は、第１の画像Ｐ１を、その第２の分割可能領域Ａ２内を通る分割線ＤＬで分割する。

ただし、この第３例の場合、そのような第２の分割可能領域Ａ２が見つからなかったときは、分割部５２は、この時点で、それ以上の分割に適した箇所の検出はあきらめて、第１の画像Ｐ１を、ＯＣＲを実行させた探索領域ＳＲの、第１の向きの中央を通る分割線ＤＬで分割する。

本実施形態には、さらに、第４例が用意されている。この第４例の場合、縮小部５１４による文字領域の縮小によって第２の分割可能領域Ａ２が見つからなかった場合、次のようにして、分割可能領域の探索を続ける。この実施形態の探索部５１には、上記の第３例では第２の分割可能領域Ａ２が見つからなかった場合に備え、第２の減算部５１５が用意されている。

この第２の減算部５１５は、文字領域の行数を計数した各画素の計数値を１ずつ減じる。ただし、この第２の減算部５１５は、縮小部５１４を上記の第１の回数閾値Ｒ１と同数回にわたって繰り返し作用させることによって得られた文字領域の行数を数えたときの各画素の計数値から１ずつ減じる。

そして、探索部５１は、この第２の減算部５１５が、各画素の計数値から１ずつ減じる処理を繰り返す間、第２の分割可能領域Ａ２が現れないかどうかを監視する。そして、第２の減算部５１５を第２の計数閾値Ｃ２を超えて繰り返し作用させるよりも前に第２の分割可能領域Ａ２が出現した場合には、分割部５２は、第１の画像Ｐ１を、その第２の分割可能領域Ａ２内を通る分割線ＤＬで分割する。

ただし、この第４例においても、そのような第２の分割可能領域Ａ２が見つけられなかったときは、分割部５２は、やむを得ず、第１の画像Ｐ１を、ＯＣＲを実行させた探索領域ＳＲの、第１の向きの中央中心を通る分割線ＤＬで第１の画像を分割する。

本実施形態には、上記の第１例から第４例の４種類の形態が存在する。以下では、これら４種類の形態の具体例について、順次に説明する。

図４は、図１に示した複合機にページ連写の処理を実行させる際の、タッチパネル上に表示されるＵＩ画面の推移を示した図である。

ここでは先ず、図４（Ａ）に示すメニュー画面３０Ａ上の「スキャン」ボタンをタッチする。すると、ＵＩ画面が、図４（Ｂ）に示す「読み取り方法」選択画面３０Ｂに変わる。ここでは、「ページ連写（非定型サイズ）」をタッチする。すると、ＵＩ画面が、図４（Ｃ）に示す「読み取りサイズ指定」画面３０Ｃに変わる。この画面３０Ｃ上では、例えばＡ３サイズが指定される。なお、原稿のサイズ等の自動検知によりサイズが分かる場合は、の図４（Ｃ）の「読み取りサイズ指定」画面３０Ｃは不要である。この画面３０Ｃ上で読み取りサイズが指定されると、ＵＩ画面が、図４（Ｄ）に示す「縦書き／横書き指定」画面３０Ｄに変わる。この画面３０Ｄ上では、原稿上の文字が縦書きか横書きかが指定される。縦書きの場合は右側が１ページ目であり、横書きの場合は左側が１ページ目であり、縦書きと横書きとでは、２分割したときの１ページ目と２ページ目が入れ替わるからである。

図５は、スキャナでの読取りの開始を指示するＵＩ画面を示した図である。

この図５のＵＩ画面３０Ｅには、原稿が左上にあわせてセットされることを示したイラストや、「スタート」、「次原稿あり」、「次原稿なし」、および「キャンセル」の各ボタンが表示されている。

２ページ分からなる原稿をスキャナ１０（図１参照）にセットして「スタート」ボタンを押すと、原稿の読取りから始まるページ連写処理が行われる。

図６は、ページ連写処理の前半部分のフローチャートを示した図である。

ここでは先ず、上記の手順を経て、原稿上の画像の読取が行われて（ステップＳ１１）、自動正立処理が行われる（ステップＳ１２）。自動正立処理とは、原稿が例えば上下逆向きにセットされて読み込まれたときに画像を回転させて正しい向きに整える処理をいう。この自動正立処理にあたっては、画像上の一部の文字について文字認識処理が行われ、その結果に基づいて文字の向きが認識され、その文字の向きが正しい向きとなるように画像が回転される。文字認識処理については、ステップＳ１３で説明する。

図７は、スキャナでの読取りにより得られた画像の一例を示した図である。この画像上の各「×」印は、各文字を表している。

ここでは、図４（Ｃ）の「読み取りサイズ指定」画面３０Ｃで「Ａ３」が指定され、これにより、Ａ３サイズの領域にわたって、３００ｄｐｉ（ＤｏｔｐｅｒＩｎｃｈ）の分解能で読取りが行われたものとする。この場合、画像の長手方向（横方向、Ｘ方向）の画素数が４９６１ピクセル、縦方向（Ｙ方向）の画素数が３５０８ピクセルの画像データが得られる。ただし、この図７に示す例では、画像の読取りのもとになった原稿はＡ３サイズよりも小サイズであって、画像の左側の縁と左隅の文字との間隔よりも、画像の右側の縁と右隅の文字との間隔の方が広くなっている。

ここでは、このようにして得られた画像データを「第１の画像データ」と称する。また、前述の通り、原稿上あるいは用紙上の画像とデータ上の画像を区別せずに単に「画像」と表現するときは、この第１の画像データは、「第１の画像」と表現される。ここでは、この図７に示す第１の画像を、この後の図に出現する別の第１の画像と区別するために、第１の画像Ｐ１＿１と称する。

原稿上の画像の読取り（ステップＳ１１）および自動正立処理（ステップＳ１２）が終了すると、次に文字認識処理（ HYPERLINK "https://en.wikipedia.org/wiki/Optical#character#recognition" ＼o "en:Optical character recognition" Ｏｐｔｉｃａｌｃｈａｒａｃｔｅｒｒｅｃｏｇｎｉｔｉｏｎ／ｒｅａｄｅｒ、以下、「ＯＣＲ」と略記する。）が実行される（ステップＳ１３）。ここでは、図７に点線で囲って示した、矢印Ｘで示す横方向中央の、第１の画像Ｐ１＿１の２分の１の探索領域ＳＲについて、ＯＣＲが実行される。この探索領域ＳＲは、２ページ分からなる第１の画像Ｐ１＿１の、その２ページに跨る領域であり、本発明にいう探索領域の一例に相当する。また、この第１の画像の、２ページを跨ぐＸ方向は、本発明にいう「第１の向き」の一例に相当する。また、その第１の向きに交わるＹ方向は、本発明にいう「第２の向き」の一例に相当する。

ＯＣＲを実行すると矩形の文字領域の座標が分かり、ここでは、その座標情報を取得する（ステップＳ１４）。図７に示す例では、「×」で示す文字列を囲う点線で示した各文字領域の座標情報が取得される。この図７には、ＯＣＲにより、左寄りの（１）～（６）の文字領域と、右寄りの（７）～（１１）の文字領域認識されたことが示されている。なお、ＯＣＲ自体は広く知られている技術であり、ここでのこれ以上の説明は省略する。

図８は、図７に示した矩形の各文字領域の座標を示した図である。この図８中、「Ｘ」、「Ｙ」は、文字領域の左上隅のＸ座標、Ｙ座標である。これらのＸ座標、Ｙ座標は、探索領域ＳＲの左上隅を原点としたときの画素数で表現されている。また、「Ｗ」、「Ｈ」は、文字領域のＸ方向の幅、Ｙ方向の高さを表している。これらも画素数で表現されている。

例えば、（１）の文字列のＸ座標は「０」であり、これは、この文字列が探索領域ＳＲの左隅から始まっていることを意味している。また、この文字列のＹ座標は「６００」であり、これは、この文字列が探索領域ＳＲの上縁、すなわち第１の画像Ｐ１＿１の上縁から６００ピクセル下がった位置にあることを意味している。また、この文字列の「Ｗ」は「８００」であり、これは、この文字列が横方向（Ｘ方向）に８００ピクセル続いていることを表している。さらに、この文字列の「Ｈ」は「２００」であり、これは、この文字列が縦方向（Ｙ方向）に２００ピクセルの高さを持っていることを表している。（２）～（１１）の文字列についても同様である。

図６のステップＳ１４において、図８に示すような、探索領域ＳＲ内の文字領域の座標情報を取得した後、探索領域ＳＲのＸ方向の画素数と同数の要素からなる配列を用意して各要素に割り当てる数値を「ゼロ」に初期化する（ステップＳ１６）。

図９は、図６のステップＳ１５で用意される配列を示した図である。

この配列は、探索領域ＳＲのＸ方向に並ぶ画素数である２４８０の要素を持っている。この図９に示した配列の要素には、すでに「ゼロ」以外の数値が対応づけられている要素もあるが、図６のステップＳ１５では、先ずは全ての要素が「ゼロ」に初期化される。

次に、各要素ごとに、縦方向（Ｙ方向）に並ぶ文字領域の行数が計数される（ステップＳ１６）。

図７に示す探索領域ＳＲ内の文字領域のうちの（１）～（６）の文字領域は、互いにＹ方向に並び、Ｘ方向について１ピクセル目から８００ピクセル連続している。したがって、図９に示す配列のうちの左端から８００ピクセル分の要素には、計数値「６」があてはめられる。また、図７に示す探索領域ＳＲ内の文字領域のうちの（１）～（６）の文字領域と（７）～（１１）の文字領域との間は、７００ピクセル間隔が空いていて、Ｙ方向に眺めたとき、この７００ピクセルの間には文字領域は存在しない。このため、図９に示す配列の、左端から８０１番目の要素から始まる７００要素の計数値は、「ゼロ」のままである。それよりも右側の要素は、Ｙ方向に見たときに（７）～（１１）の５つの文字領域が並んでいるため、各要素に計数値「５」があてはめられる。

図１０は、ページ連写処理の第１例の後半部分のフローチャートを示した図である。

図６のステップＳ１６における計数を行って配列（図９参照）の各要素に計数値をあてはめた後、図１０のステップＳ２１の判定が行われる。ここでは、第１の計数閾値Ｃ１以下の計数値の要素が第１の継続閾値Ｋ１以上にわたって継続する第１の分割可能領域Ａ１が存在するか否かが判定される。ここでは、一例として、第１の計数閾値Ｃ１＝３、第１の継続閾値Ｋ１＝５００とする。図９の配列を参照すると、計数値が第１の計数閾値Ｃ１＝３以下の要素が第１の継続閾値Ｋ１＝５００以上である「７００」にわたって継続する第１の分割可能領域Ａ１が存在する。この場合、ステップＳ２１では「Ｙｅｓ」と判定される。

そこで次に、第１の分割可能領域Ａ１の中央が、探索領域ＳＲの中央±α以内か否かが判定される（ステップＳ２２）。ここでは、一例として、α＝２００とする。図９を参照すると、第１の分割可能領域Ａ１の中央は配列の左端（すなわち探索領域ＳＲの左端）から数えて８００＋７００／２＝１１５０の位置にある。一方、図７に示すように、探索領域ＳＲの横幅は２４８０ピクセルであり、したがってその探索領域ＳＲの中央は、探索領域ＳＲの左端から数えて２４８０／２＝１２４０の位置にある。これらを比較すると、第１の分割可能領域Ａ１の中央である１１５０は、探索領域ＳＲの中央である１２４０よりも９０だけ少ない。すなわち、ここに示す例の場合、第１の分割可能領域Ａ１の中央は、探索領域ＳＲの中央±α以内の位置にある。したがって、この例の場合、図１０のステップＳ２２で「Ｙｅｓ」と判定され、ステップＳ２４に進む。なお、ステップＳ２１で「Ｎｏ」と判定される場合、あるいはステップＳ２２で「Ｎｏ」と判定される場合についての説明は、後に譲る。

ステップＳ２２で「Ｙｅｓ」と判定されてステップＳ２４に進むと、ここでは、第１の画像が第１の分割可能領域Ａ１の中央で分割されて２枚の第２の画像が生成される。すなわち、これを「画像データ」という言葉を使って正確に表現すると、第１の画像データで表される第１の画像を分割する演算が行われて２枚の第２の画像を表す第２の画像データが生成される、という表現となる。

図１１は、２分割の様子を示した図である。

第１の分割可能領域Ａ１の中央は探索領域ＳＲの左端から数えて１１５０ピクセルの位置にある。探索領域ＳＲの左端は、この図１１に示すように、第１の画像Ｐ１＿１は、探索領域ＳＲの左端よりもさらに左側に１２４０ピクセル広がっている。したがって、ここで説明している例の場合、第１の画像は、その第１の画像Ｐ１＿１の左端から２３９０ピクセルの位置で、縦方向（Ｙ方向）に延びる分割線ＤＬで分割される。

そして分割された２枚の画像についてスキュー補正が行われる（ステップＳ２６）。スキュー補正の説明は後に譲る。

次に、２分割された２枚の画像の寸法が互いに同一か否かが判定される（ステップＳ２７）。図１１を見ると、分割線ＤＬは第１の画像の中央よりも左に寄った位置にある。したがって、ステップＳ２６では、２枚の画像の寸法は同一ではないと判定される。この場合、ステップＳ２８に進んで、画像の寸法調整が行われる。

図１２は、寸法調整の様子を示した図である。

ここで説明している具体例の場合、分割線ＤＬは左寄りの位置にある。このことはすなわち、分割後の左側の画像のＸ方向の幅が短く、右側の画像のＸ方向の幅が長いことを意味している。そこで、ステップＳ２１では、左側の画像の左側に２４８０－２３９０＝９０ピクセルの幅の空白部を追加し、また右側の画像からは、２５７１－２４８０＝９１ピクセル幅だけ削除する。分割線ＤＬが左寄りだったということは、スキャナ１０（図１参照）で読み取った原稿のＸ方向の寸法が読み取りの寸法（図４（Ｃ）参照）よりも短かったことを意味している。すなわち、分割線ＤＬで分割した後の右側の画像の削除される領域は空白の領域ということになる。

図１０のステップＳ２１で、第１の計数閾値Ｃ１以下の計数値の要素が第１の継続閾値Ｋ１以上にわたって継続する第１の分割可能領域Ａ１が存在しないと判定されると、ここに示す第１例ではステップＳ２５に進み、探索領域ＳＲのＸ方向の中央を通ってＹ方向に延びる分割線ＤＬで２分割される。なお、ステップＳ２３の中央寄りで分割する処理についての説明は、さらに後に譲る。

図１３は、最終的に得られた２枚の第２の画像を示した図である。

これら２枚の第２の画像Ｐ２＿１は、互いに同一の寸法の画像となっている。

図１４は、ページ連写処理の第２例の後半部分のフローチャートを示した図である。この第２例における前半部分は前述の第１例の前半部分である図６と同一であり、改めての図の提示および説明は省略する。

図６のステップＳ１６における計数を行って配列（図９参照）の各要素に計数値をあてはめた後、図１４のステップＳ３１の判定が行われる。なお、この第２例のステップＳ３１～ステップＳ３４の処理は、図１０に示した第１例の後半部分のステップＳ２１の処理と比べほとんどの場合は同じ結果となる処理である。

ステップＳ３１では、計数値が「ゼロ」の要素が第１の継続閾値Ｋ１以上にわたって継続する第１の分割可能領域Ａ１が存在するか否かが判定される。図９に示したように、「ゼロ」の計数値が継続し「ゼロ」以外の第１の計数閾値Ｃ１が存在しない場合は、このステップＳ３１における第１の分割可能領域Ａ１は、第１例における第１の分割可能領域Ａ１と同じである。ただし、図９の配列の中の計数値「ゼロ」が続く領域の途中に、第１の計数閾値Ｃ１（たとえばＣ１＝３）以下の、例えば「２」の計数値の要素があると、第１例における第１の分割可能領域Ａ１と、この第２例における第１の分割可能領域Ａ１が同一の領域とはならない場合がある。第１例の場合は、第１の計数閾値Ｃ１以下であって、かつ「ゼロ」以外の計数値の要素があっても、その「ゼロ」以外であってＣ１以下の計数値の要素も含めて第１の継続閾値Ｋ１以上連続している領域が第１の分割可能領域Ａ１となる。これに対し、この第２例の場合は、計数値「ゼロ」が連続している要素のみが判定対象となり、計数値「ゼロ」の要素が第１の継続閾値Ｋ１以上継続している第１の分割可能領域Ａ１が存在するか否かが判定される。このため、図９に示した配列の中の、７００ピクセル並ぶ計数値「ゼロ」の要素のなかの一方の端寄り、例えば右側から１００ピクセル目の要素が計数値「２」だった場合は、この第２例における第１の分割可能領域Ａ１は、図９における、計数値「ゼロ」が割り当てられている７００ピクセルの領域のうちの右側の１００ピクセルを除く、左側６００ピクセルの領域となる。したがってこの場合、分割線ＤＬの位置が第１例の場合よりもさらに左寄りとなる。第１例と第２例とでは、このような細かな相違が理論上考えられるが、ほとんどのケースでは同一の結果となる。

ここでは、第１例の場合と同様に、第１の計数閾値Ｃ１＝３を採用する。第１の継続閾値Ｋ１についても、第１例の場合を踏襲して、Ｋ１＝５００とする。この場合、第１例で参照した具体例、即ち図７に示した第１の画像Ｐ１＿１の場合は、ステップＳ３１で「Ｙｅｓ」と判定されて、ステップＳ３５に進む。ステップＳ３５～ステップＳ４１の各処理は、第１例における図１０のステップＳ２２～ステップＳ２８の各処理とそれぞれ同一であり、重複説明は省略する。ただし、図１０のステップＳ２３およびステップＳ２６の処理については、まだ説明していない。図１０のステップＳ２３の処理については、この図１４のステップＳ３６の処理として後で説明する。図１０のステップＳ２６の処理、すなわち図１４のステップＳ３９の処理については、さらに後で説明する。

図１４のステップＳ３１において、計数値が「ゼロ」の要素が第１の継続閾値Ｋ１以上にわたって継続する第１の分割可能領域Ａ１が存在しないと判定されると、ステップＳ３２に進む。そこで、以下では、ステップＳ３２に進むことになる具体例を挙げて説明する。

図１５は、図７に示した第１の画像とは異なる第１の画像を示した図である。この図１５に示す第１の画像Ｐ１＿２の、図７に示した第１の画像Ｐ１＿１との違いは、２ページの中央と思われる箇所に、少し斜めに押された「会社」の文字の割り印の印影が存在することである。ここでは、図６のステップＳ１３におけるＯＣＲにおいて、（１）～（１１）の文字領域に加え、さらに「会」および「社」がそれぞれ別の文字領域として認識されている。ここでは「会」の文字領域を（１２）の文字領域、「社」の文字領域を（１３）の文字領域とする。

図１６は、図１５に示した各文字領域の座標を示した図である。この図１６中の「Ｘ」、「Ｙ」、「Ｗ」、「Ｈ」の意味は、図８の場合と同じである。

ここには、図８にも示した（１）～（１１）の文字領域の座標に、さらに、（１２）の「会」のひと文字からなる文字領域の座標と、（１３）の「社」のひと文字からなる文字領域の座標が追加されている。

図１７は、図６のステップＳ１５で用意される、図１５に示した第１の画像に関する配列と、その配列を使った演算方法を示した図である。

図１７（Ａ）は、図６のステップＳ１６で得られた、図１５に示した第１の画像Ｐ１＿２に関する配列である。図１５に示した第１の画像Ｐ１＿２に「会社」の文字からなる割り印の印影が存在していることの影響で、計数値「ゼロ」の領域が、領域Ａ１１と領域Ａ１２とに分かれている。これら２つの領域Ａ１１，Ａ１２は、いずれも、第１の継続閾値Ｋ１＝５００以上という条件を満たさず、したがって、これらの領域Ａ１１，Ａ１２のいずれも、第１の分割可能領域Ａ１ではない。この場合、図１４のステップＳ３１では「Ｎｏ」と判定されて、ステップＳ３２に移る。このステップＳ３２では、第１の計数閾値Ｃ１（初期値はＣ１＝３）を「１」だけ減算する。そして、その減算後の第１の計数閾値Ｃ１（ここではＣ１＝２）が「ゼロ」よりも大きいか否かが判定される（ステップＳ３３）。ここでは、第１の計数閾値Ｃ１＝２であるため、ステップＳ３４に進む。このステップＳ３４では、図１７（Ａ）に示す配列の全ての要素それそれについて、各要素の計数値を「１」だけ減算する。ただし、ここでは、計数値「ゼロ」を下限とする。この減算処理の後、ステップＳ３１に戻る。

図１７（Ａ）に示す配列の全ての要素それそれについて、各要素の計数値を「１」だけ減算すると、図１７（Ｂ）の配列となる。この図１７（Ｂ）の配列においても、計数値「ゼロ」の領域が、領域Ａ２１と領域Ａ２２とに分かれている。そして、これら２つの領域Ａ２１，Ａ２２のいずれも、第１の継続閾値Ｋ１＝５００以上という条件を満たさず、したがって、これらの領域Ａ２１，Ａ２２のいずれも、第１の分割可能領域Ａ１ではない。そこで、ステップＳ３１から再度ステップＳ３２に進み、第１の計数閾値Ｃ１がさらに「１」だけ減算されて、今度はＣ１＝１となる。そして、ステップＳ３３では、第１の計数閾値Ｃ１が「ゼロ」よりも大きいか否かが判定される。第１の計数閾値Ｃ１は、ここではＣ１＝１となっているものの、まだ「ゼロ」より大きい数値であるため、再度ステップＳ３４に進む。このステップＳ３４では、今度は、図１７（Ｂ）に示す配列の全ての要素それそれについて、各要素の計数値を「１」だけ減算し、図１７（Ｃ）の配列を生成する。そして、もう一度、ステップＳ３１に戻る。このステップＳ３１に戻ると、今度は、図１７（Ｃ）の配列が参照される。この図１７（Ｃ）の配列には、計数値「ゼロ」が、第１の継続閾値Ｋ１＝５００以上にわたって継続する第１の分割可能領域Ａ１が現れている。そこで、ステップＳ３１では「Ｙｅｓ」と判定されて、ステップＳ３５に進む。その後の処理は、ステップＳ３６およびステップＳ３９を除き、説明済みである。ステップＳ３１～ステップＳ３４のループをさらに繰り返して、ステップＳ３３において「Ｎｏ」と判定されると、ステップＳ３８に進み、探索領域ＳＲのＸ方向の中央を通ってＹ方向に延びる分割線ＤＬで２分割される。ステップＳ３３において「Ｎｏ」と判定される具体例については、後で説明する。

図１８は、図１５に示した第１の画像に関する２分割の様子を示した図である。

また、図１９は、図１５に示した第１の画像に関する寸法調整の様子を示した図である。

さらに、図２０は、図１５に示した第１の画像を２分割することにより最終的に得られた２枚の第２の画像を示した図である。

これらの図１８～図２０は、「会社」の印影が存在する点を除き、第１例の場合の、図１１～図１３のそれぞれ対応する図であり、説明は省略する。

図２１は、図７に示した第１の画像および図１５に示した第１の画像のいずれとも異なる第１の画像を示した図である。この図２１に示す第１の画像Ｐ１＿３の、図７に示した第１の画像Ｐ１＿１との違いは、図７に示した第１の画像Ｐ１＿１に存在していた（１）～（１１）の文字領域のうちの左側の（１）～（６）の文字領域が存在しておらず、右側の（７）～（１１）の文字領域のみ存在している点である。

図２２は、図２１に示した各文字領域の座標を示した図である。この図２１中の「Ｘ」、「Ｙ」、「Ｗ」、「Ｈ」の意味は、図８および図１６の場合と同じである。

図２３は、図６のステップＳ１５で用意される、図２１に示した第１の画像に関する配列を示した図である。

この配列の場合、左側の１５００ピクセルの要素の計数値が「ゼロ」となっている。このため、図１４のステップＳ２１では、この１５００ピクセルが第１の分割可能領域Ａ１であると判定される。そして次に、この第１の分割可能領域Ａ１の中央が探索領域ＳＲの中央±α以内か否かが判定される（ステップＳ３５）。ここでは、α＝２００である。図２３を参照すると、第１の分割可能領域Ａ１の中央は配列の左端（すなわち探索領域ＳＲの左端）から数えて７５０の位置にある。一方、図２１に示すように、探索領域ＳＲの横幅は２４８０ピクセルであり、したがってその探索領域ＳＲの中央は、探索領域ＳＲの左端から数えて２４８０／２＝１２４０の位置にある。これらを比較すると、第１の分割可能領域Ａ１の中央である７５０は、探索領域ＳＲの中央である１２４０よりも４９０も少ない。すなわち、ここに示す例の場合、第１の分割可能領域Ａ１の中央は、探索領域ＳＲの中央±α以内の位置から外れている。したがって、この例の場合、図１４のステップＳ３５で「Ｎｏ」と判定され、ステップＳ３６に進む。このステップＳ３６では、第１の分割可能領域Ａ１の中央ではなく、もっと探索領域ＳＲの中央寄りの位置で分割される。

図２４は、図２１に示した第１の画像を２分割するときの分割線を示した図である。

この例の場合、探索領域ＳＲの中央には文字領域は存在せず、したがって、この第１の画像Ｐ１＿３は、探索領域ＳＲの中央を通る分割線ＤＬで２分割される。文字領域が探索領域ＳＲの中央にまで及んでいるときは、分割線ＤＬは、その文字領域を避けることができるまで横にずれた位置に引かれる。図１４のステップＳ３６では、このような分割処理が行われる。図１０のステップＳ２３も同様である。

図２５は、図２１に示した第１の画像を２分割することにより最終的に得られた２枚の第２の画像を示した図である。

図２４に示したように、分割線ＤＬが探索領域ＳＲの中央を通っているため、分割後の２枚の第２の画像Ｐ２＿３は、分割した時点で互いに同一の寸法となっている。このため、図１４のステップＳ４１はスキップされる。

図２６は、ページ連写処理の第３例の後半部分の中の一部のフローチャートを示した図である。第３例の残りのフローチャートは、図２９に示されている。図２９については、図２６の説明の後で説明する。この第３例における前半部分は前述の第１例および第２例の前半部分である図６と同一であり、改めての図の提示および説明は省略する。

この図２６を、第２例のフローチャートである図１４と比較すると、第２例のフローチャートには、ステップＳ３８が存在する。そして、その第２例では、ステップＳ３３で「Ｎｏ」と判定されるとステップＳ３８に進む構成となっている。これに対し、この図２６の第３例の場合、ステップＳ３８が削除されていて、ステップＳ３３で「Ｎｏ」と判定されると、図２９に示す処理に移る構成となっている。すなわち、図１４に示す第２例の場合、ステップＳ３３で「Ｎｏ」と判定されると分割に適した位置についてのそれ以上の探索は諦めて第１の画像の中央で分割することとしている。これに対し、この第３例では、ステップＳ３３で「Ｎｏ」と判定されると、さらに、図２９に示す処理により、分割位置の次の探索が行なわれる。第２例と、第３例の図２６に示した部分との差異は以上の点だけであり、図２６についてのこれ以上の説明は省略する。

図２７は、これまでの第１の画像とはさらに異なる、もう１枚の第１の画像を示した図である。

この第１の画像Ｐ１＿４の場合、２ページ分の文字が互いにほとんど接した位置にある。また、これら２ページの文字は、互いに逆方向に少し斜めになっている。

ここでは、この図２７の第１の画像Ｐ１＿４について図６に示した前半の処理を実行する。

図２８は、図２７に示した第１の画像の探索領域ＳＲの文字領域を示した図である。

ここには、左側の（１）～（５）の文字領域と、右側の（６）～（１１）の文字領域が現れている。

図示や再度の説明は省略するが、これらの文字領域の行数の計数により生成された、例えば図１７（Ａ）に示すような配列に関して、図１４あるいは図２６のステップＳ３１～ステップＳ３４の処理を第１の計数閾値Ｃ１が「ゼロ」になるまで繰り返しても、第１の分割可能領域Ａ１は出現しない。このため、ステップＳ３３では「Ｎｏ」と判定される。図１４に示した第２例の場合は、ステップＳ３３で「Ｎｏ」と判定されるとステップＳ３８に進み、探索領域ＳＲの中央で２分割される。これに対し、第３例の場合は、図２９の処理に移る。

図２９は、ページ連写処理の第３例の後半部分の中の、図２６に示した部分を除く残りの部分のフローチャートを示した図である。

ここでは先ず、各文字領域について、１ステップ分の縮小処理が行われる。

図３０は、縮小処理を示した図である。

この図３０には、図２８に示す（１）～（１１）の各文字領域について縮小処理を何ステップか繰り返した後の各文字領域が示されている。図３０に破線で示されている（１）～（１１）の各文字領域は、図２８に示す、対応する各文字領域と比べ、それぞれ縮小されていて、各文字領域についてＸ方向の左端の始点が右端の終点側に近づき、これとともに、右端の終点が左端の始点側に近づいている。これにより、図３０には、Ｙ方向に文字領域が存在しない領域Ａ２が生まれている。

これを踏まえ、図２９に戻って説明を続ける。

図２９のステップＳ５１では、１ステップ分の縮小処理が行われる。これにより、各文字領域は少しだけ縮小される。ただし、この縮小処理は、座標上の文字領域が縮小されるのであって、文字そのものが縮小される訳ではない。この縮小処理の後、図６のステップＳ１５およびステップＳ１６と同様に、要素の配列を用意して初期化し（ステップＳ５２）、各要素ごとにＹ方向に並ぶ文字領域の行数を計数する（ステップＳ５３）。そして、その配列を参照して、第２の計数閾値Ｃ２以下の計数値が第２の継続閾値Ｋ２以上にわたって継続する第２の分割可能領域Ａ２が出現したか否かが判定される（ステップＳ５４）。ここでは、一例として、第２の計数閾値Ｃ２＝０、第２の継続閾値Ｋ２＝３０が採用されている。したがって、この場合、このステップＳ５４では、計数値「ゼロ」の要素が３０以上にわたって継続する第２の分割可能領域Ａ２が出現したか否かが判定される。図３０に示すように、第２の分割可能領域Ａ２が出現していた場合は、ステップＳ５７に進み、この第１の画像Ｐ１＿４が、第２の分割可能領域Ａ２の中央を通ってＹ方向に延びる分割線ＤＬで２分割される。

一方、ステップＳ５４において「Ｎｏ」と判定されると、第１の回数閾値Ｒ１が「１」だけ減算される（ステップＳ５５）。第１の回数閾値Ｒ１は縮小処理（ステップＳ５１）を何回繰り返すかを決定する係数であり、ここでは、初期値として、例えば、第１の回数閾値Ｒ１＝３が採用されている。この場合、このステップＳ５５を初回に通過したときは、Ｒ１＝２となる。そして、その減算後の第１の回数閾値Ｒ１がＲ１＞０か否かが判定され（ステップＳ５６）、Ｒ１＞０を満たすときは、ステップＳ５１に戻って再度縮小処理が行われる。

ステップＳ５６において「Ｎｏ」と判定されるとステップＳ５８に進む。このステップＳ５８では、第１の画像Ｐ１＿４が、探索領域ＳＲの中央を通ってＹ方向に延びる分割線ＤＬで２分割される。

図３１は、２分割された直後の２枚の画像を示した図である。

図２７に示した通り、分割前の第１の画像Ｐ１＿４上の２ページの文字は、互いに逆方向に少し斜めになっている。このため、図３１に示す、２分割された直後の２枚の画像においても、文字が少し斜めになっている。分割前の第１の画像Ｐ１＿４上では、２ページの文字は互いに逆向きに傾いているため、文字の傾きを直すことはできない。これに対し、２分割された後の画像の場合、各１枚の画像上の文字は、いずれも同じ向きに傾いている。したがって、各画像毎に回転処理して文字を正しい向きを向かせるスキュー補正を行なうことができる。ステップＳ５９では、このスキュー補正が行われる。図１０のステップＳ２６および図１４のステップＳ３９のスキュー補正も同様の処理である。そして、その後、２枚の画像の寸法が互いに異なっているときは（ステップＳ６０）、互いに同一寸法となるように、寸法調整が行われる（ステップＳ６１）。寸法調整については、図１２を参照して説明済みであり、重複説明は省略する。

図３２は、図２７に示した第１の画像を２分割して得た、最終的な２枚の第２の画像を示した図である。スキュー補正により文字の傾きが補正され、かつ同じ寸法の２枚の第２の画像Ｐ２＿４が得られている。

次に、第４例について説明する。

図２７に示した第１の画像の場合、２ページの文字が互いに近づいてはいるものの、図６のステップＳ１３におけるＯＣＲにおいて、（１）～（５）の左側の文字領域と（６）～（１１）の右側の文字領域が別々の文字領域しとして認識されている。

図３３は、図２７に近似したもう１つの第１の画像を示した図である。

この図３３に示した第１の画像Ｐ１＿５には、ＯＣＲで認識された文字領域が示されている。ただし、この図３３では、図２８と比べたとき、図２８における（２）の左側の文字領域と（７）の右側の文字領域が別々の文字領域とは認識されずに、左右がつながった、（２－７）の１つの文字領域として認識されている。

図３４は、図３３に示した文字領域に縮小処理を施した後の文字領域を示した図である。

この図３４に示すように、左右の文字領域が繋がっていると、縮小処理によっても文字領域が２ページに分離されない場合が生じる。

以上の図３３および図３４の説明を踏まえ、第４例の処理について説明する。

この第４例についても、前半部分についてはこれまでの第１例から第３例までと同様に、図６に示した処理が行われる。また、後半部分についても、上記の第３例と同じく、先ずは図２６の処理が行われる。

そして、この第４例では、図２６のステップＳ３３での「Ｎｏ」の判定を受けて、図３５の処理が開始される。

図３５は、ページ連写処理の第４例の後半部分の中の、図２６に示した一部を除く残りのフローチャートを示した図である。

この図３５のフローチャートを、第３例の処理のフローチャートである図２９のフローチャートと対比すると、図３５には、図２９と共通のステップＳ５１～ステップＳ５６と、図２９と共通のステップＳ５７～ステップＳ６１との間に、ステップＳ７１～ステップＳ７４が挿入されている。すなわち、図２９に示した第３例の場合、ステップＳ５６で「Ｎｏ」の判定を受けると、それ以上の分割位置の探索をあきらめて、探索領域ＳＲの中央で分割することとしている。これに対し、図３５に示した第４例の場合、ステップＳ５６で「Ｎｏ」の判定を受けると、さらに別の処理で分割に適した位置の探索が行われる。

ステップＳ７１～ステップＳ７４の処理は、図１４のステップＳ３１～ステップＳ３４の処理と同様である。ただし、ここでは、ステップＳ５１の縮小処理を第１の回数閾値Ｒ１と同じ回数繰り返した後のステップＳ５３で作成された配列をベースにしている。なお、ここでは、第４例の説明に用いた図３３，図３４との整合を取るために、Ｃ３＝０を初期値としている。そして、図３３，図３４に示した例の場合、左右が繋がっている文字領域は、（２－７）の文字領域１つのみである。したがってステップＳ７１において、配列の各要素の計数値を１ずつ減算すると図３０に示した第２の分割可能領域Ａ２が出現する。このため、ステップＳ７２において「Ｙｅｓ」と判定されてステップＳ５７に進むことになる。ただし、左右につながった文字領域が複数存在し、第２の計数閾値Ｃ２の初期値が例えばＣ２＝３だったときは、ステップＳ７１～ステップＳ７４の処理が、最大Ｃ２＝３回行われることになる。そして、その処理を繰り返している間に、ステップＳ７２で「Ｙｅｓ」の判定があるとステップＳ５７に進む。一方、ステップＳ７１～ステップＳ７４の処理をＣ２＝３回繰り返してもステップＳ７２での判定が「Ｎｏ」の判定であった場合には、ステップＳ５８に進んで、探索領域ＳＲの中央で２分割される。

なお、上記の実施形態では、第１の計数閾値Ｃ１あるいは第２の計数閾値Ｃ２として、Ｃ１＝３あるいはＣ２＝０という予め定められた固定値を用いているが、これらは固定値ではなく、画像毎に決めてもよい。第１の計数閾値Ｃ１あるいは第２の計数閾値Ｃ２は、例えば図９に示すような配列の要素の計数値の最大値あるいは平均値に基づいて、例えば最大値の５分の１、あるいは平均値の２分の１等の値に定めることができる。

また、第１の継続閾値Ｋ１あるいは第２の継続閾値Ｋ２についても、上記の実施形態では、Ｋ１＝５００あるいはＫ２＝３０という予め定められた固定値を用いているが、これらも固定値ではなく、画像毎に定めてもよい。例えば、図９に示すような配列の途中に、計数値「ゼロ」が継続する領域が複数個所に分かれて存在する場合には、細かな継続領域を避けるように、第１の継続閾値Ｋ１あるいは第２の継続閾値Ｋ２を調整してもよい。

さらに、第１の回数閾値Ｒ１についても、画像毎に調整してもよい。

また、ここでは特に説明することなく、二値画像を前提とした説明を行なったが、多値画像の場合は、二値化処理の後に、本実施形態が適用される。また、カラー画像の場合は、例えば輝度情報を抽出してその輝度情報を二値化すればよい。

１複合機
１０スキャナ
２０プリンタ
２１用紙トレイ
２２用紙台
３０タッチパネル
３０Ａメニュー画面
３０Ｂ「読み取り方法」選択画面
３０Ｃ「読み取りサイズ指定」画面
３０Ｄ「縦書き／横書き指定」画面
３０ＥＵＩ画面
５０画像処理装置
５１探索部
５２分割部
５３調整部
５４補正部
５１１認識部
５１２計数部
５１３第１の減算部
５１４縮小部
５１５第２の減算部

Claims

第１の画像データにより表される、２ページ分からなる第１の画像の、該２ページに跨る一部領域である探索領域内から分割可能領域を探索する探索部と、
前記第１の画像を、前記探索部での探索により得られた分割可能領域内を通って、前記２ページを跨ぐ第１の向きに交わる第２の向きに延びる分割線で分割して各１ページ分の２枚の第２の画像を表す第２の画像データを生成する分割部とを備え、
前記探索部が、
前記探索領域内に存在する文字領域を認識する認識部と、
前記探索領域内の、前記第１の向きに並ぶ複数の画素の各々について、前記第２の向きに並ぶ前記文字領域の行数を計数する計数部とを備え、
前記計数部で計数された、前記複数の画素の計数値の分布に基づいて、前記分割可能領域を探索することを特徴とする画像処理装置。
前記複数の画素が、前記第１の向きに断続的に並ぶ複数の画素であることを特徴とする請求項１に記載の画像処理装置。
前記探索部が、前記計数部で計数された計数値のうちの第１の計数閾値以下の計数値が対応づけられた画素が前記第１の向きについて第１の継続閾値以上にわたって継続する第１の分割可能領域を探索し、
前記分割部が、前記第１の画像を、前記第１の分割可能領域内を通る分割線で分割することを特徴とする請求項１または２に記載の画像処理装置。
前記分割部は、前記第１の分割可能領域が存在しない場合に、前記第１の画像を、幾何学的に定められた、前記第１の向きについての中央位置で分割することを特徴とする請求項３に記載の画像処理装置。
前記探索部は、前記計数部で計数された計数値のうちのゼロの計数値が対応づけられた画素が前記第１の向きについて第１の継続閾値以上継続する第１の分割可能領域を探索し、
前記分割部は、前記第１の分割可能領域が存在する場合に、前記第１の画像を該第１の分割可能領域内を通る分割線で分割することを特徴とする請求項１または２に記載の画像処理装置。
前記探索部は、前記第１の分割可能領域が存在しない場合に、文字領域の行数を計数した各画素の計数値を１ずつ減じる第１の減算部を備え、
前記分割部は、前記第１の減算部を第１の計数閾値を超える回数にわたって繰り返し作用させるよりも前に前記第１の分割可能領域が出現した場合に、前記第１の画像を該第１の分割可能領域内を通る分割線で分割することを特徴とする請求項５に記載の画像処理装置。
前記探索部は、前記第１の分割可能領域が存在しない場合に前記認識部で認識された前記文字領域を縮小して前記計数部を再度作用させる縮小部を備え、
前記分割部が、前記縮小部を第１の回数閾値を超える回数にわたって繰り返し作用させるよりも前に、第２の計数閾値以下である画素が前記第１の向きについて第２の継続閾値以上にわたって継続する第２の分割可能領域が出現した場合に、前記第１の画像を該第２の分割可能領域内を通る分割線で分割することを特徴とする請求項３または請求項６に記載の画像処理装置。
前記分割部は、前記縮小部を前記第１の回数閾値と同数回にわたって繰り返し作用させても前記第２の分割可能領域が出現しない場合に、前記第１の画像を、幾何学的に定められた、前記第１の向きについての中央位置で分割することを特徴とする請求項７に記載の画像処理装置。
前記探索部は、前記縮小部を前記第１の回数閾値と同数回にわたって繰り返し作用させても前記第２の分割可能領域が出現しない場合に、前記縮小部を前記第１の回数閾値と同数回にわたって繰り返し作用させることにより前記計数部で得られた各画素の計数値を１ずつ減じる第２の減算部を備え、
前記分割部は、前記第２の減算部を前記第２の計数閾値を超えて繰り返し作用させるよりも前に前記第２の分割可能領域が出現した場合に、前記第１の画像を該第２の分割可能領域内を通る分割線で分割することを特徴とする請求項７に記載の画像処理装置。
前記分割部は、前記第２の減算部を前記第２の計数閾値と同数回にわたって繰り返し作用させても前記第２の分割可能領域が出現しない場合に、前記第１の画像を、幾何学的に定められた、前記第１の向きについての中央位置で分割することを特徴とする請求項９に記載の画像処理装置。
前記分割部による分割で生成された前記第２の画像データにより表される前記２枚の第２の画像の前記第１の向きの寸法が互いに異なっている場合に該２枚の画像の寸法を調整する調整部を備えたことを特徴とする請求項１から１０のうちのいずれか１項に記載の画像処理装置。
前記分割部による分割で生成された前記第２の画像データにより表される前記２枚の第２の画像の各々について文字領域の傾きを補正する補正部を備えたことを特徴とする請求項１から１１のうちのいずれか１項に記載の画像処理装置。
プログラムを実行する情報処理装置内で実行され、該情報処理装置を請求項１から１２のうちのいずれか１項に記載の画像処理装置として動作させることを特徴とする画像処理プログラム。