以下、本発明をその実施の形態を示す図面に基づいて具体的に説明する。
(実施の形態1)
図1は実施の形態1に係る画像処理装置の機能的構成を説明するブロック図である。本実施の形態に係る画像処理装置は、信号変換部11、2値化処理部12、レイアウト解析部13、文字認識部14、ページ抜け判定部15を備え、例えば原稿給送装置(ADF:Auto Document Feeder)を搭載したスキャナ装置によりページ単位で連続的に読み取られた原稿画像の画像データを順次取得し、取得したページ単位の画像データを解析することにより、原稿読取時にページ抜けが発生したか否かを判定する。
信号変換部11には、原稿画像を読み取ることにより得られるページ単位の画像データが入力される。信号変換部11に入力される画像データは、例えばRGB(R:赤,G:緑,B:青)のカラー画像データであり、信号変換部11は、入力されたRGBのカラー画像データを輝度データに変換し、変換後の輝度データを後段の2値化処理部12へ送出する。信号変換部11は、例えば下記の式を用いて、カラー画像データを輝度データに変換することができる。
Yi=0.30Ri+0.59Gi+0.11Bi
Y:各画素の輝度値
R,G,B:各画素の各色線分の値
i:画素毎に付与された値(iは1以上の整数)
なお、輝度データへの変換手法は、上記の式を利用した変換手法に限定されるものではない。例えば、信号変換部11は、RGB信号をCIE1976L* a* b* 信号(CIE:Commission International de l'Eclairage、L* :明度、a* ,b* :色度)に変換してもよく、あるいは、G信号を用いても良い。
2値化処理部12は、信号変換部11から入力された輝度データについて、各画素の輝度値と設定した閾値との間の大小関係を判定することにより、輝度データの2値化処理を行う。輝度データが8ビットのデータである場合、例えば閾値を128に設定することができる。また、複数の画素よりなるブロック(例えば5×5のブロック)の輝度値の平均値を閾値として設定してもよい。
レイアウト解析部13は、2値化処理部12から出力される2値データについてレイアウト解析を行って文字列を抽出し、抽出した文字列を1文字単位の文字に区別する。
文字認識部14は、1文字単位に区別された文字に対して文字認識を行い、原稿の上端領域又は下端領域に存在するページ番号(数字)を認識する。
ページ抜け判定部15は、画像データの数より算出される原稿枚数(以下Naとする)と、文字認識により認識したページ番号から算出される原稿枚数(以下Nbとする)とを比較し、ページ抜けが発生しているか否かの判定を行う。
以下、レイアウト解析部13、文字認識部14、ページ抜け判定部15が実行する処理内容の詳細について説明する。
図2はレイアウト解析部13が実行する処理内容を説明する模式図である。レイアウト解析部13は、2値化処理部12から入力された2値データに基づき、各文字領域に外接する外接矩形を求め、文字列の1文字単位の区別を行う。
レイアウト解析部13は、例えば、以下のような処理を実行することにより、文字領域に外接する外接矩形を求める。まず、レイアウト解析部13は、注目ライン上の黒画素に対してラベリングを行うと共に、注目ラインを1ライン分だけ下にずらしたライン上の黒画素に対して異なるラベルをセットする。レイアウト解析部13は、両ラインの黒画素の連結状態を判定し、連結していると判定した場合、同じラベル(上のラインのラベル)に置き換える処理を行う。レイアウト解析部13は、このような処理を注目ラインを1ラインずつずらしながら繰り返し実行することにより、文字列に含まれる各文字領域の抽出を行い、抽出した文字領域の上端、下端、左端及び右端の画素の位置を基に外接矩形を求める。
次いで、レイアウト解析部13は、各文字領域の外接矩形を統合するか否かの判定を行う。例えば、レイアウト解析部13は、注目する外接矩形の高さと、隣接する外接矩形までの距離(水平距離及び垂直距離)とを算出し、注目する外接矩形の高さが隣接する外接矩形までの水平距離及び垂直距離の1/3未満であれば、注目する外接矩形内の文字領域は個別の文字として認識されるべきであるため、外接矩形を統合しないと判定する。一方、注目する外接矩形の高さが隣接する外接矩形までの水平距離及び垂直距離の1/3以上であれば、隣接する外接矩形内の文字領域は1つの文字として認識されるべきであるため、レイアウト解析部13は、これらの外接矩形を統合すると判定し、外接矩形の統合を行う。
以上の処理により、レイアウト解析部13では、個別の文字として認識されるべき文字領域について外接矩形を求めることができ、後段の文字認識部14で文字認識を行った場合、例えば、「1」という文字と、「11」という文字とを区別することが可能となる。
文字認識部14は、レイアウト解析部13により抽出された外接矩形内の文字を認識する。例えば、文字認識部14は、外接矩形内の文字を予め定められたサイズ(例えば10ポイント)の大きさに正規化し、正規化した文字を辞書データ(不図示)に登録されている文字のパターンと比較することにより、文字認識を行う。なお、本願では、原稿に付されているページ番号のみを認識できれば良いため、アラビア数字、ローマ数字、漢数字等の数字に限定して文字認識を行ってもよい。
また、本願では、原稿全体について文字認識を行う必要はなく、ページ番号が記載されていると想定される原稿の上端領域及び下端領域について認識を行えばよい。図3は文字認識の対象となる原稿の領域を示す模式図である。図3に示すように、文字認識部14は、原稿の縦方向の長さに対して約1/15程度の領域を対象領域として文字認識を行えば、原稿に付されているページ番号を認識することができる。
図4はページ抜け判定部15の構成を示すブロック図である。ページ抜け判定部15は、ページ番号判定部151、計数部152、及び比較処理部153を備え、画像データの数により算出される原稿枚数Naと、文字認識により認識したページ番号から算出される原稿枚数Nbとを比較し、ページ抜けが発生しているか否かの判定を行う。
ページ番号判定部151は、文字認識部14による文字認識結果に基づき、各原稿に対するページ番号の有無を判定する。すなわち、ページ番号判定部151は、文字認識部14から原稿の上端領域又は下端領域に数字を認識した旨の文字認識結果が得られた場合、原稿にページ番号が存在すると判定し、数字を認識しない旨の文字認識結果が得られた場合、原稿にはページ番号が存在しないと判定する。
また、ページ番号判定部151は、ページ番号が存在する画像データと認識したページ番号との対応付けを行い、連続する2つの画像データのページ番号の差が1であれば、ページ番号が連続していると判定する。ページ番号が連続していないと判定した場合、ページ番号判定部151は、判定した2つの画像データの双方に第1の識別符号を付与する。更に、ページ番号判定部151は、ページ番号が存在しない画像データに対し、第2の識別符号を付与する。
計数部152は、ページ番号判定部151による判定結果に基づいて、原稿枚数をカウントする。例えば、計数部152は、第1の識別符号が付与された範囲に存在する画像データの数より、上述の原稿枚数Naをカウントすることができる。また、計数部152は、第1の識別符号が付与された2つの画像データのページ番号に基づき、上述の原稿枚数Nbをカウントすることができる。更に、計数部152は、第2の識別符号が付与された画像データの数をカウントすることにより、ページ番号が付されていない原稿の枚数をカウントすることができる。
比較処理部153は、計数部152による計数結果に基づいて、原稿読取時のページ抜けの有無を判定する。具体的な処理内容については後述することとするが、ページ番号判定部151にてページ番号が存在しない画像データを検出した場合、又はページ番号が連続しない2つの画像データを検出した場合、比較処理部153は、計数部152による計数結果を参照し、画像データの数より算出される原稿枚数Naと、ページ番号から算出される原稿枚数Nbとを比較することにより、ページ抜けの有無を判定する。
以下、ページ抜け判定部15が実行する処理内容を具体例を用いて説明する。
図5は原稿の各ページにページ番号が存在し、ページ抜けが発生したケースを説明する説明図である。図5に示した例は、ページ番号1から順にページ番号が付された原稿をADFにより搬送し、各原稿の画像をスキャナ装置にて読み取った結果、ページ番号3及びページ番号4の原稿の画像を読み取ることができなかったケースを示している。
ページ抜け判定部15のページ番号判定部151は、スキャナ装置から得られる一連の画像データについてページ番号を判定する。その結果、ページ番号1、ページ番号2、ページ番号5、ページ番号6、…の順であったとした場合、ページ番号2の画像データと、ページ番号5の画像データとの間でページ番号が連続しないので、ページ番号判定部151は、両者(ページ番号2及び5の画像データ)に第1の識別符号を付与する。
比較処理部153は、ページ番号判定部151にて第1の識別符号が付与された2つ画像データの範囲でページ抜けの有無を判定する。
図5に示す例において、第1の識別符号が付与された範囲に存在する画像データは、ページ番号2及びページ番号5の画像データの2つであるから、計数部152が画像データの数よりカウントする原稿枚数Naは2枚となる。
一方、ページ番号2からページ番号5までの間に本来存在するべき画像データの数は、4つ(=5−2+1)であるから、計数部152がページ番号に基づきカウントする原稿枚数Nbは4枚となる。
比較処理部153は、計数部152による計数結果を参照し、画像データの数から算出される原稿枚数Na(=2枚)と、ページ番号から算出される原稿枚数Nb(=4枚)とを比較した結果、スキャナ装置にて読み取られた原稿枚数は、本来存在すべき枚数から2枚足りないと判定できるため、図5の例では、ページ番号2とページ番号5との間でページ抜けが発生していると判定する。
図6はページ番号を有していない原稿が挿入されており、ページ抜けが発生していないケースを説明する説明図である。図5では各原稿にページ番号が付されているケースについて説明したが、例えば、オフィス文書におけるグラフなどの資料ページ、小説の章の区切りの白紙ページ、雑誌の広告ページ等の原稿には、ページ番号が付されない場合がある。図6は、ページ番号3の原稿とページ番号4の原稿との間に、ページ番号を有していない原稿が挿入されたケースを示している。なお、図6に示す例は、各原稿をADFにより順次搬送し、各原稿の画像をスキャナ装置にて読み取った結果、全ての原稿の画像を読み取ることができた例を示している。
ページ番号判定部151は、スキャナ装置から得られる一連の画像データについてページ番号を判定する。その結果、ページ番号1、ページ番号2、ページ番号3、ページ番号なし、ページ番号4、…の順であったとした場合、ページ番号判定部151は、ページ番号が連続しないページ番号3の画像データ及びページ番号4の画像データに第1の識別符号を付与し、ページ番号が存在しない画像データに第2の識別符号を付与する。
比較処理部153は、ページ番号判定部151にて第1の識別符号が付与された2つ画像データの範囲でページ抜けの有無を判定する。
図6に示す例において、第1の識別符号が付与された範囲に存在する画像データは、ページ番号3の画像データ、ページ番号が存在しない画像データ、及びページ番号4の画像データの3つであるから、計数部152が画像データの数よりカウントする原稿枚数Naは3枚となる。
一方、ページ番号3からページ番号4までの間に本来存在するべき画像データの数は、2つ(=4−3+1)であるから、計数部152がページ番号に基づきカウントする原稿枚数Nbは2枚となる。
比較処理部153は、計数部152による計数結果を参照し、画像データの数から算出される原稿枚数Na(=3枚)と、ページ番号から算出される原稿枚数Nb(=2枚)とを比較した結果、スキャナ装置にて読み取られた原稿枚数は、本来存在すべき画像データより多いと判定できるため、図6の例では、ページ番号3とページ番号4との間でページ抜けが発生していないと判定する。
図7はページ番号を有していない原稿が挿入されており、ページ抜けが発生したケースを説明する説明図である。図7に示した例は、図6と同様に、ページ番号3の原稿とページ番号4の原稿との間に、ページ番号を有していない原稿が挿入されたケースを示している。なお、図7に示す例は、各原稿をADFにより順次搬送し、各原稿の画像をスキャナ装置にて読み取った結果、ページ番号4〜ページ番号7の原稿の画像を読み取ることができなかった例を示している。
ページ番号判定部151は、スキャナ装置から得られる一連の画像データについてページ番号を判定する。その結果、ページ番号1、ページ番号2、ページ番号3、ページ番号なし、ページ番号8、…の順であったとした場合、ページ番号判定部151は、ページ番号が連続しないページ番号3の画像データ及びページ番号8の画像データに第1の識別符号を付与し、ページ番号が存在しない画像データに第2の識別符号を付与する。
比較処理部153は、ページ番号判定部151にて第1の識別符号が付与された2つ画像データの範囲でページ抜けの有無を判定する。
図7に示す例において、第1の識別符号が付与された範囲に存在する画像データは、ページ番号3の画像データ、ページ番号が存在しない画像データ、及びページ番号8の画像データの3つであるから、計数部152が画像データの数よりカウントする原稿枚数Naは3枚となる。
一方、ページ番号3からページ番号8までの間に本来存在するべき画像データの数は、6つ(=8−3+1)であるから、計数部152がページ番号に基づきカウントする原稿枚数Nbは6枚となる。
比較処理部153は、計数部152による計数結果を参照し、画像データの数から算出される原稿枚数Na(=3枚)と、ページ番号から算出される原稿枚数Nb(=6枚)とを比較した結果、スキャナ装置にて読み取られた原稿枚数は、本来存在すべき枚数から3枚足りないと判定できるため、図7の例では、ページ番号3とページ番号8との間でページ抜けが発生していると判定する。
図8はページ番号が存在しない原稿を含み、ページ抜けが発生していないケースを説明する説明図である。前述したように、オフィス文書におけるグラフなどの資料ページ、小説の章の区切りの白紙ページ、雑誌の広告ページ等の原稿には、ページ番号が付されない場合がある。図8では、本来的にはページ番号が付されるべき原稿であるが、資料ページ、区切りの白紙ページ、広告ページ等であるため、ページ番号が付されなかった原稿が含まれるケースについて説明する。なお、図8の例は、4ページ目の原稿がグラフなどの資料ページであったため、当該原稿にページ番号が付されなかった例を示している。
ページ番号判定部151は、スキャナ装置から得られる一連の画像データについてページ番号を判定する。その結果、ページ番号1、ページ番号2、ページ番号3、ページ番号なし、ページ番号5、…の順であったとした場合、ページ番号判定部151は、ページ番号が連続しないページ番号3の画像データ及びページ番号5の画像データに第1の識別符号を付与し、ページ番号が存在しない画像データに第2の識別符号を付与する。
比較処理部153は、ページ番号判定部151にて第1の識別符号が付与された2つ画像データの範囲でページ抜けの有無を判定する。
図8に示す例において、第1の識別符号が付与された範囲に存在する画像データは、ページ番号3の画像データ、ページ番号が存在しない画像データ、及びページ番号5の画像データの3つであるから、計数部152が画像データの数よりカウントする原稿枚数Naは3枚となる。
一方、ページ番号3からページ番号5までの間に本来存在するべき画像データの数は、3つ(=5−3+1)であるから、計数部152がページ番号に基づきカウントする原稿枚数Nbは3枚となる。
比較処理部153は、計数部152による計数結果を参照し、画像データの数から算出される原稿枚数Na(=3枚)と、ページ番号から算出される原稿枚数Nb(=3枚)とを比較した結果、スキャナ装置にて読み取られた原稿枚数は、本来存在すべき枚数に一致すると判定できるため、図8の例では、ページ番号3とページ番号5との間でページ抜けが発生していないと判定する。
次に、ページ抜け判定処理の処理手順について説明する。
図9及び図10は実施の形態1に係る画像処理装置が実行する処理の手順を説明するフローチャートである。画像処理装置は、図に示していないカウンタNpの値を0にセットし(ステップS101)、スキャナ装置で読み取られた1ページ分の画像データを取得する(ステップS102)。
次いで、画像処理装置は、カウンタNpの値を1だけインクリメントし(ステップS103)、ステップS102で取得した画像データに第1の識別符号を付与する(ステップS104)。
画像処理装置は、第1の識別符号を付与した画像データを、信号変換部11、2値化処理部12、レイアウト解析部13、及び文字認識部14にて順次処理することにより、画像の上端領域及び下端領域内で文字認識処理を実行する(ステップS105)。
次いで、ページ抜け判定部15のページ番号判定部151は、文字認識部14による文字認識結果を参照し、Np枚目の画像データにページ番号が存在するか否かを判定する(ステップS106)。
ページ番号が存在しないと判定した場合(S106:NO)、ページ番号判定部151は、Np枚目の画像データに対して第2の識別符号を付与した上で(ステップS107)、処理をステップS102へ戻す。
ページ番号が存在すると判定した場合(S106:YES)、ページ番号判定部151は、認識したページ番号が1であるか否かを判断する(ステップS108)。ページ番号が1であると判断した場合(S108:YES)、ページ番号判定部151は、処理をステップS102へ戻す。
ページ番号が1でないと判断した場合(S108:NO)、ページ番号判定部151は、Np−1枚目の画像データのページ番号とNp枚目の画像データのページ番号とが連続しているか否かを判断する(ステップS109)。
ページ番号が連続していると判断した場合(S109:YES)、ページ番号判定部151は、Np−1枚目の画像データに付与されている第1の識別符号を削除する(ステップS110)。
ページ番号が連続していないと判断した場合(S109:NO)、または、Np−1枚目の画像データに付与されている第1の識別符号を削除した場合(S110)、ページ番号判定部151は、第1の識別符号を2つ検出したか否かを判断する(ステップS111)。
第1の識別符号を2つ検出していない場合(S111:NO)、ページ番号判定部151は、判定対象の全画像データが終了したか否かを判断する(ステップS112)。全画像データが終了したと判断した場合(S112:YES)、ページ抜け判定部15は、ページ抜け無しとの判定を出力する(ステップS113)。一方、全画像データが終了していないと判断した場合(S112:NO)、ページ抜け判定部151は、処理をステップS102へ戻す。
第1の識別符号を2つ検出した場合(S111:YES)、ページ抜け判定部15の計数部152は、第1の識別符号が付与された一方の画像データから他方の画像データまでの範囲に存在する画像データの数より原稿枚数Naをカウントすると共に、第1の識別符号が付与された2つの画像データのページ番号に基づき原稿枚数Nbをカウントする(ステップS114)。
ページ抜け判定部15の比較処理部153は、計数部152による計数結果を参照して、第1の識別符号が付与された一方の画像データから他方の画像データまでの範囲に存在する画像データの数から算出される原稿枚数Naと、ページ番号から算出される原稿枚数Nbとを比較し(ステップS115)、Na−Nbが0以上であるか否かを判断する(ステップS116)。
Na−Nbが0以上であると判断した場合(S116:YES)、比較処理部153は、ページ抜け無しと判定する(ステップS117)。一方、Na−Nbが0未満であると判断した場合(S116:NO)、比較処理部153は、ページ抜けが発生していると判定する(ステップS118)。ページ抜けが発生していると比較処理部153にて判定された場合、画像処理装置は、図に示していない表示部に警告を表示させる(ステップS119)。
次いで、画像処理装置は、全ての画像データに対する判定が終了したか否かを判断する(ステップS120)。全ての画像データに対する判定が終了していない場合(S120:NO)、画像処理装置は、処理をステップS102へ戻す。全ての画像データに対する判定が終了した場合(S120:YES)、画像処理装置は、本フローチャートによる処理を終了する。
以上のように、実施の形態1では、ページ番号の連続性だけでページ抜けの判定を行うのではなく、原稿を読み取ることにより得られる画像データの数と、ページ番号から算出される原稿枚数とを比較して、ページ抜けの判定を行う構成としているので、読み取り対象の原稿の中にページ番号が記載されていないページが含まれていたとしても、ページ抜けが発生しているか否かを正しく検知することが可能となる。
なお、本実施の形態では、取得した画像データに対して、ページ番号の存在、ページ番号の連続性の判定を行う構成としたが、全ての原稿画像を読み取ってメモリ(不図示)に格納しておき、メモリに格納されている画像データを読み出して処理するようにしてもよい。
また、本実施の形態では、スキャナ装置で読み取られた原稿枚数Naを画像データの数としてカウントする構成としたが、スキャナ装置から原稿枚数Naの情報を取得する構成としてもよい。
スキャナ装置にて読み取られた原稿の枚数は、以下のようにしてカウントすることができる。スキャナ装置が備える原稿給送装置にセットされた原稿は原稿検知センサにより検知され、給送補助ローラにより原稿給送装置の内部へ引き込まれる。原稿給送装置の内部へ引き込まれた原稿は、給送タイミングセンサによる検知結果に基づき、給送ローラ及び整合ローラの対により1枚ずつ読取部(例えばCCD)へ給送され、読取部にて原稿画像が読み取られる。スキャナ装置は、給送タイミングセンサからの出力信号に基づき、読取部にて原稿画像を読み取った原稿の枚数をカウントすることができる。
また、スキャナ装置にて読み取られた原稿に集約原稿が含まれる場合、集約原稿についての情報(1枚の原稿に配置されているページ数等の情報)を受付け、受付けた情報に基づいて、集約原稿の原稿画像を分割し、分割した原稿画像のそれぞれに対してページ抜け判定処理を行うようにしてもよい。
また、集約原稿と1ページ単位の原稿とが混在している場合、ページ毎に集約原稿であるか否かの判定を行い、集約原稿と判定された原稿については、上記の手法により、ページ抜け判定処理を行う。なお、集約原稿であるか否かの判定手法には、例えば、特開2008−305099号公報に開示されている手法を用いることができる。この手法では、画像データを輝度データに変換した後に低解像度化し、低解像度化された輝度データに対して、主走査方向及び副走査方向のライン毎の特徴量(反転回数、エッジの数、画素の平均値、あるいは、画素値の分布)を算出し、主走査方向及び副走査方向の特徴量の分布が所定の条件を満たすか否かにより、集約原稿であるか否かの判定を行う。
(実施の形態2)
実施の形態2では、コピア機能、プリンタ機能、ファクシミリ送信機能、イメージ送信機能等を備えたデジタル複合機への適用例について説明する。
図11は実施の形態2に係るデジタル複合機の構成を説明するブロック図である。実施の形態2に係るデジタル複合機は、原稿読取部1、画像処理部2、画像出力部3、制御部5、記憶部6、操作部7、表示部8を備える。
原稿読取部1は、例えば、CCD(Charge Coupled Device)ラインセンサを備え、原
稿から反射される光をCCDラインセンサにて、R,G,B(R:赤,G:緑,B:青)に色分解された電気信号(アナログ信号)に変換する。
画像処理部2は、AD変換部21、シェーディング補正部22、入力処理部23、色補正部24、領域分離部25、黒生成下色除去部26、空間フィルタ部27、出力階調補正部28、中間調生成部29を備える。また、画像処理部2は、実施の形態1で説明した信号変換部11、2値化処理部12、レイアウト解析部13、文字認識部14、ページ抜け判定部15を備える。
原稿読取部1から入力されるカラー画像信号(アナログ信号)は、AD変換部21にてデジタル信号に変換され、シェーディング補正部22にて原稿読取部1における照明系、結像系、撮像系で生じる各種の歪みが取り除かれる。その後、入力処理部23においてRGBデジタル信号のそれぞれに対してガンマ(入力階調)を補正する処理などが施され、後段の信号変換部11、色補正部24、領域分離部25に引き渡される。
色補正部24では、RGB信号の補色であるCMY(C:シアン,M:マゼンタ,Y:イエロー)信号が生成されると共に色再現性を高める処理が施され、黒生成下色除去部26にてCMYK(K:黒)4色信号に変換される。空間フィルタ部27ではCMYK信号に対して強調処理や平滑化処理が施され、出力階調補正部28では、用紙等に出力するための出力ガンマ補正処理が行われる。中間調生成部29では画像を出力するための階調再現処理が行われる。
一方、領域分離部25では、入力画像データの各画素が黒文字、色文字、網点、印画紙写真(連続階調領域)等のどのような領域に属する画素であるのか判定される。領域分離部25より出力された領域分離データは、例えば、黒生成下色除去部26、空間フィルタ部27、中間調生成部29のそれぞれに引き渡され、各種領域に応じた適切な処理の切替えが行われる。中間調生成部29から出力されるCMYK信号は、画像出力部3に引き渡される。
画像出力部3は、中間調生成部29から入力されるCMYK信号に基づき、電子写真方式、インクジェット方式等の方式で用紙等のシート上に画像を形成する。
制御部5は、CPU、ROM、RAM等(不図示)を備える。制御部5が備えるROMには、デジタル複合機が備えるハードウェア各部の動作を制御するためのコンピュータプログラムが予め格納されている。制御部5は、ROMに格納されているコンピュータプログラムをCPUにて実行することにより、ハードウェア各部の動作を制御し、装置全体として本発明に係る画像形成装置として機能させるように構成されている。
記憶部6は、メモリ、ハードディスクなどの不揮発性の記憶媒体を備えており、画像処理部2が処理した画像データ、操作部7を通じてユーザにより設定された各種設定情報等を記憶する。
例えば、入力処理部23から出力されるカラー画像データを記憶部6に引き渡し、記憶部6にてファイリングデータとして管理するようにしても良い。この場合、画像データは、例えば、JPEG圧縮アルゴリズムに基づいてJPEGコードに圧縮されて格納される。デジタル複合機においてコピー出力動作又はプリント出力動作が指示された場合は、記憶部6からJPEGコードが引き出され、不図示のJPEG伸張部に引き渡され、復号化処理がなされRGBデータに変換される。一方、イメージ送信動作が指示された場合、記憶部6からJPEGコードが引き出され、ネットワーク網や通信回線を介して外部装置(不図示)へデータが伝送される。なお、ファイリングデータの管理やデータの引渡しの動作制御については制御部5が行うものとする。
操作部7は、各種キー及びタッチパネルを備えており、ユーザによる操作を受付ける。また、表示部8は、液晶ディスプレイ、有機ELディスプレイ等を含み、ユーザに対して報知すべき情報、画像等を表示する。
実施の形態2に係るデジタル複合機は、画像処理部2内に信号変換部11、2値化処理部12、レイアウト解析部13、文字認識部14、ページ抜け判定部15を備えるので、入力処理部23を通じて入力される画像データに基づき、原稿読取部1にて一連の原稿画像を読み取った際にページ抜けが発生したか否かを判定することができる。なお、実施の形態2に係るデジタル複合機が実行するページ抜け判定処理は、実施の形態1で説明したものと同様である。
ページ抜け判定部15は、判定結果を制御部5に通知する。制御部5は、ページ抜けが発生している旨の判定結果をページ抜け判定部15から受信した場合、その旨の情報を表示部8に表示させる。このとき、制御部5は、原稿読取部1による原稿読取動作、及び画像出力部3による画像出力動作を一旦停止させ、原稿読取動作及び画像出力動作の継続の要否を操作部7を通じて受付けるようにしてもよい。
以上のように、実施の形態2に係るデジタル複合機は、原稿読取部1にて読み取った一連の原稿画像に係る画像データに基づき、ページ抜けが発生しているか否かを正しく検知することができる。
(実施の形態3)
実施の形態3では、ページ抜け判定処理の実行の要否(ページ抜け判定モードのON/OFF)を受付け、ページ抜け判定モードがONの場合、若しくは、ページ抜け判定モードがOFFであり、かつ原稿読取部1で読み取られた原稿のページ番号が1以外から始まる場合、ページ抜け判定処理を動作させる構成について説明する。
なお、実施の形態3に係るデジタル複合機の構成は実施の形態2と同様であるため、その説明を省略することとする。
図12は実施の形態3に係るデジタル複合機が実行する処理の手順を説明するフローチャートである。実施の形態3に係るデジタル複合機は、操作部7を通じてページ抜け判定モードのON/OFFを受付け、ページ抜け判定モードのON/OFFに係る設定情報を記憶部6に記憶させる。
制御部5は、記憶部6内の設定情報を参照することにより、ページ抜け判定モードがONに設定されているか否かを判断する(ステップS301)。ページ抜け判定モードがONに設定されている場合(S301:YES)、制御部5は、実施の形態1で説明したページ抜け判定処理を実行するために、図9及び図10に示すフローチャートのステップS101へ処理を移行させる。
ページ抜け判定モードがOFFに設定されている場合(S301:NO)、画像処理装置は、原稿読取部1で読み取られた1ページ分の画像データを取得し(ステップS302)、信号変換部11、2値化処理部12、レイアウト解析部13、及び文字認識部14にて順次処理することにより、画像の上端領域及び下端領域内で文字認識処理を実行する(ステップS303)。
次いで、ページ抜け判定部15のページ番号判定部151は、文字認識部14による文字認識結果を参照し、画像データにページ番号が存在するか否かを判定する(ステップS304)。
ページ番号が存在しないと判定した場合(S304:NO)、ページ抜け判定部15は、当該画像データに対して第2の識別符号を付与し(ステップS305)、処理をステップS302へ戻す。ページ番号が存在しない画像データに対して第2の識別符号を付与することにより、ページ抜け判定部15の計数部152は、付与した第2の識別符号の数をカウントすることにより、ページ番号が存在しない画像データの数をカウントすることができる。
ページ番号が存在すると判定した場合(S304:YES)、ページ抜け判定部15は、認識したページ番号が2以上であるか否かを判断する(ステップS306)。認識したページ番号が2以上でない場合には(S306:NO)、ページ抜け判定部15は、本フローチャートによる処理を終了する。
認識したページ番号が2以上であると判断した場合(S306:YES)、ページ抜け判定部15の計数部152は、画像データの数より原稿枚数Naをカウントし、ページ番号に基づき原稿枚数Nbをカウントする(ステップS307)。ここで、計数部152は、画像データの数から算出される原稿枚数Naは、実施の形態1と同様の手法にてカウントすることができる。また、ページ番号から算出される原稿枚数Nbについては、ページ番号判定部151にて認識したページ番号がN(Nは2以上の整数)の場合、計数部152は、原稿読取部1で読み取った原稿はページ番号1から始まる原稿であると仮定して、原稿枚数Nbを(N−1)+1=N枚とカウントすることができる。
次いで、ページ抜け判定部15の比較処理部153は、計数部152による計数結果を参照して、画像データの数より算出される原稿枚数Naと、ページ番号に基づいて算出される原稿枚数Nbとを比較し(S308)、Na−Nbが0以上であるか否かを判断する(ステップS309)。Na−Nbが0以上であると判断した場合(S309:YES)、比較処理部153は、ページ抜け無しと判定する(ステップS310)。一方、Na−Nbが0未満であると判断した場合(S309:NO)、比較処理部153は、ページ抜けが発生していると判定し(ステップS311)、その旨を制御部5に通知する。
制御部5は、ページ抜け判定部15の比較処理部153から、ページ抜けが発生している旨の通知を受信した場合、表示部8に警告を表示させる(ステップS312)。
以上のように、実施の形態3では、ページ抜け判定モードがOFFに設定されている場合であっても、読み取った原稿のページ番号が2以上から始まるときには、ページ抜けが発生している可能性があるため、ページ抜け判定処理を実施することができる。
(実施の形態4)
実施の形態4では、ページ番号が付されていない画像データを広告ページと判断し、当該ページの画像データを削除する広告スキップモードを搭載したデジタル複合機の構成について説明を行う。
図13は実施の形態4に係るデジタル複合機の構成を説明するブロック図である。実施の形態4に係るデジタル複合機は、中間調生成部29の後段にデータ削除部30を備える。また、実施の形態4に係るデジタル複合機は、操作部7を通じて広告スキップモードのON/OFFの設定を受付ける。なお、広告スキップモードのON/OFFに係る設定情報は記憶部6に記憶される。
デジタル複合機は、記憶部6に記憶されている設定情報を参照し、広告スキップモードがONに設定されているか否かを判断する。広告スキップモードがONに設定されており、かつ、ページ抜け判定部15のページ番号判定部151にてページ番号が存在しない画像データを検知した場合、ページ抜け判定部15は、当該ページの画像データの削除をデータ削除部30に指示する。
データ削除部30は、ページ抜け判定部15から画像データの削除指示を受付けた場合、中間調生成部29から出力される該当ページの画像データを削除する処理を行う。
なお、広告スキップモードがONに設定されていない場合、若しくは、広告スキップモードがONに設定されている場合であっても、ページ番号判定部151がページ番号の存在を検知した場合、データ削除部30は画像データを削除せずに、中間調生成部29から出力される画像データを画像出力部3へ送出する。
以上のように、実施の形態4では、広告スキップモードがONに設定されている場合であって、ページ番号が存在しない画像データをページ番号判定部151が検知したとき、当該ページを広告ページと判断し、データ削除部30において広告ページを削除することができる。
(実施の形態5)
実施の形態5では、原稿読取部1にて読み取られた原稿画像に係る画像データを外部装置へ送信するイメージ送信モードを搭載したデジタル複合機の構成について説明を行う。
図14は実施の形態5に係るデジタル複合機の構成を説明するブロック図である。実施の形態5に係るデジタル複合機は、データ削除部30の後段にフォーマット化処理部31を備える。また、実施の形態5に係るデジタル複合機は、ネットワーク網や通信回線を介して、外部装置(不図示)と通信するための送受信部4を備える。
本実施の形態では、イメージ送信モードのON/OFFを操作部7を通じて受付ける。イメージ送信モードがONに設定されている場合、原稿読取部1、AD変換部21、シェーディング補正部22、入力処理部23の処理内容は、画像出力部3を通じて画像を出力(印刷)するときと同様である。
信号変換部11は、RGBの画像データを輝度データに変換し、後段の2値化処理部12へ変換後の輝度データを送出する。2値化処理部12は、変換された輝度データを2値化する。
レイアウト解析部13は、2値化された輝度データを基に、黒画素に対してラベリング処理を行うことで1文字の外接矩形を求め、画像データに存在する文字列を1文字単位で区別できるようにする。
文字認識部14は、レイアウト解析部13で1文字単位で区別した文字に対して、パターンマッチング処理を行い、ページ番号(数字)の認識を行う。
ページ抜け判定部15では、ページ番号が存在するか否か、ページ番号が連続するか否かの判定を行う。ページ番号が存在しないページが見つかった場合、もしくは、ページ番号が連続しないページが見つかった場合、ページ抜け判定部15は、読み込まれた原稿枚数(画像データから算出される原稿枚数Na)とページ番号から算出した本来存在するべき原稿枚数Nbの比較を行い、ページ抜けが発生しているかの判定を行う。ページ抜けが発生していると判定した場合は、ページ抜け判定部15は、制御部5を通じて、ページ抜けが発生している旨の警告を表示部8に表示させる。
色補正部24は、入力処理部23から入力されるRGBの画像データを、一般に普及している表示装置の表示特性に適合したR’G’B’の画像データ(例えば、sRGBデータ)に変換する。領域分離部25は、空間フィルタ部27及び出力階調補正部28に対して領域分離データを出力する。
黒生成下色除去部26は、入力される画像データに対して処理を行わずに、後段の空間フィルタ部27へ画像データを送出する。空間フィルタ部27は、領域分離データに基づき、デジタルフィルタを用いて強調処理、平滑化処理等の空間フィルタ処理を行う。
出力階調補正部28は、例えば、文字領域、文字以外の領域のそれぞれに適したガンマ補正を行う。図15は出力階調補正部28が用いるガンマ補正曲線の一例を示すグラフである。横軸は補正前の画素値(入力信号)、縦軸は補正後の画素値(出力信号)を表している。実線で示す曲線g1は、文字領域に適用するガンマ補正曲線の一例を表し、破線で示す曲線g2は、文字以外の領域に適用するガンマ補正曲線の一例を表している。出力階調補正部28は、文字領域の画素に対して、曲線g1に従うガンマ補正を施すことにより、文字をはっきりさせることができ、文字以外の領域の画素に対して、曲線g2に従うガンマ補正を施すことにより、表示装置の表示特性に適した補正を行うことができる。
中間調生成部29は、入力される画像データに対して処理を行わずに、後段のデータ削除部30へ画像データを送出する。データ削除部30では、操作部7を通じて、広告スキップモードがONに設定されている場合であって、ページ抜け判定部15においてページ番号が存在しない画像データを検知した場合、当該ページを広告ページと判断し、画像データの削除処理を行う。
フォーマット化処理部31は、データ削除部30を通じて入力される画像データ(すなわち、広告ページ以外の画像データ)に基づき、PDFファイル等の画像ファイルを生成する。フォーマット化処理部31で生成された画像ファイルは、送受信部4を通じて外部装置へ送信される。なお、画像ファイルを外部装置へ送信する際、図に示していないメール処理部にて送信対象の画像ファイルを電子メールに添付し、当該電子メールを送受信部4を通じて相手先の通信装置へ送信する構成としてもよい。
なお、本実施の形態では、レイアウト解析部13による解析結果に基づき文字認識部14で文字認識を行う構成としたが、領域分離データにより作成されるテキストマップ(文字エッジと判定された画素よりなる画像領域)を参照して、文字領域に対して文字認識を行うようにしてもよい。あるいは、文字認識部14の前段に原稿種別判別部を設け、文字原稿、文字印刷写真原稿、文字印画紙写真原稿と判別された場合、文字認識を行うようにしてもよい。
また、本実施の形態では、データ削除部30を備える構成としたが、広告スキップモードを搭載しない場合には、データ削除部30が存在しなくてもよい。この場合、フォーマット化処理部31では、出力階調補正部28から出力される画像データに基づき、画像ファイルが生成される。
また、本実施の形態では、文字認識部14において、画像全体の文字認識を行い、フォーマット化処理部31でPDFファイル等の画像ファイルを生成する際、認識した文字を透明テキストとして埋め込む構成としてもよい。
以上のように、実施の形態5では、送受信部4を通じて送信する画像ファイルを生成する過程で、ページ抜けが発生しているか否かを検知することができる。
(実施の形態6)
実施の形態6では、イメージ送信機能等を備えたスキャナ装置への適用例について説明する。
図16は実施の形態6に係るスキャナ装置の構成を説明するブロック図である。実施の形態6に係るスキャナ装置は、実施の形態2〜5で説明したデジタル複合機と同様に、原稿読取部1、画像処理部2、送受信部4、制御部5、記憶部6、操作部7、表示部8を備える。
画像処理部2は、AD変換部21、シェーディング補正部22、入力処理部23、色補正部24、データ削除部30、フォーマット化処理部31を備える。
また、画像処理部2は、ページ抜け判定処理を実現するための構成として、信号変換部11、2値化処理部12、レイアウト解析部13、文字認識部14、ページ抜け判定部15を備える。
画像処理部2が備える各部の動作は、例えば、実施の形態5で説明したものと同様であり、原稿読取部1から入力された画像データに基づいて、ページ抜けが発生しているか否かをページ抜け判定部15にて判定する。ページ抜けを検出した場合には、制御部5を通じて、ページ抜けが発生している旨の警告を表示部8に表示させる。また、画像処理部2は、入力された画像データに基づいて画像ファイルを生成し、生成した画像ファイルを送受信部4を通じて外部装置へ送信する。
なお、本実施の形態では、データ削除部30を備える構成としたが、広告スキップモードを搭載しない場合には、データ削除部30が存在しなくてもよい。この場合、フォーマット化処理部31では、色補正部24から出力される画像データに基づき、画像ファイルが生成される。
また、本実施の形態では、ページ抜け判定モードのON/OFF、広告スキップモードのON/OFF等の設定を、スキャナ装置と通信可能に接続された外部端末(例えばPC)から実行できる構成であってもよい。
以上のように、実施の形態6では、送受信部4を通じて送信する画像ファイルを生成する過程で、ページ抜けが発生しているか否かを検知することができる。
(実施の形態7)
実施の形態7では、情報処理装置(コンピュータ)によりページ抜け判定処理を実行する構成について説明を行う。
図17は実施の形態7に係る情報処理装置の構成を説明するブロック図である。実施の形態7に係る情報処理装置は、例えば、パーソナルコンピュータ、サーバ装置、タブレット端末などの画像データを処理することができる装置であり、制御部101、記憶部102、画像処理部103、操作部104、表示部105、通信部106等を備える。
制御部101は、CPU、ROM、RAMなどを備え(不図示)、ROMに予め記憶された制御プログラムをCPUにて実行することにより、上述したハードウェア各部の動作を制御する。
記憶部102は、ハードディスク、メモリ等の記憶装置であり、上述したようなページ抜け判定処理を実現させるためのコンピュータプログラム、通信部106を通じて取得した画像データ等を記憶する記憶領域を有する。
画像処理部103は、処理対象の画像データを一時的に記憶する画像メモリ、画像メモリに記憶した画像データを処理するための画像処理回路等を備え、情報処理装置が取得した画像データに対する処理を行う。
操作部104は、キーボード、マウス、タッチパネルなどの入力インタフェースを備え、情報処理装置のユーザによる操作を受付ける。表示部105は、液晶ディスプレイ装置などを備え、情報処理装置のユーザに対して報知すべき情報を表示する。
通信部106は、LANなどの通信ネットワークに接続されており、通信ネットワークに接続された外部装置から送信されるデータを受信すると共に、外部装置へ通知すべきデータを送信する。本実施の形態では、通信部106には、イメージ送信機能を備えたデジタル複合機、スキャナ装置等が接続され、これらの装置にて読み取られた一連の原稿画像に係る画像データを通信ネットワーク経由で取得する。
実施の形態7では、記憶部102に記憶された上記コンピュータプログラムを制御部101が実行することにより、通信部106を通じて取得した一連の原稿画像に係る画像データに基づいて、ページ抜けの有無を判定するページ抜け判定処理を実現する。なお、制御部101が実行する処理の具体的な内容は、実施の形態1〜実施の形態6で説明した画像処理装置、デジタル複合機、スキャナ装置が実行する処理と同様である。
実施の形態7では、ページ抜け判定処理を実現させるためのコンピュータプログラムが記憶部102に予め記憶されている構成について説明したが、上記処理を行うプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)を記録した記録媒体として、持ち運び自在に提供する構成としてもよい。例えば、プログラム読取装置が外部記憶装置として情報処理装置に接続され、プログラム読取装置に記録媒体が挿入されることで、読み取られるプログラムメディアであってもよい。
なお、上記プログラムメディアは、本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープ等のテープ系、フレキシブルディスクやハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD等の光ディスクのディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM、EPROM(Erasable Programmable Read Only Memory)、EEPROM(Electrically Erasable Programmable Read Only Memory)、フラッシュROM等による半導体メモリを含めた固定的にプログラムコードを担持する媒体であっても良い。
また、実施の形態7では、インターネットを含む通信ネットワークに接続可能であるため、通信ネットワークからプログラムコードをダウンロードするように流動的にプログラムコードを担持する媒体であっても良い。なお、このように通信ネットワークからプログラムをダウンロードする場合には、そのダウンロード用のプログラムは予め本体装置に格納しておくか、あるいは別な記録媒体からインストールされるものであっても良い。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
今回開示された実施の形態は、全ての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上述した意味ではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内での全ての変更が含まれることが意図される。
以上の実施の形態に関し、更に以下の付記を開示する。
本願の画像処理装置は、複数の原稿を読み取ることにより得られるページ単位の画像データを処理する画像処理装置において、読み取られた原稿の枚数を計数する計数部(152)、前記原稿から得られる画像データからページ番号を検出する検出部(151)、及び前記計数部(152)が計数した原稿の枚数と、前記検出部(151)が検出したページ番号より算出される原稿の枚数とを比較することにより、ページ抜けが発生しているか否かを判定する判定部(153)を備えることを特徴とする。
本願では、ページ番号の連続性だけでページ抜けの判定を行うのではなく、原稿を読み取ることにより得られる画像データの数と、ページ番号から算出される原稿枚数とを比較して、ページ抜けの有無が判定される。このため、読み取り対象の原稿の中にページ番号が記載されていないページが含まれていたとしても、ページ抜けが発生しているか否かを正しく検知することが可能となる。
本願の画像処理装置は、前記検出部(151)にて検出したページ番号が連続しない場合、又は、前記検出部(151)にてページ番号が検出されない原稿を含む場合、前記判定部(153)は、前記計数部(152)が計数した原稿の枚数と、前記検出部(151)が検出したページ番号より算出される原稿の枚数との比較処理を行うようにしてあることを特徴とする。
本願では、検出したページ番号が連続しない場合、又はページ番号が検出されない原稿を含む場合、ページ抜けが発生している可能性があるため、計数した原稿の枚数と、ページ番号から算出される原稿の枚数との比較処理を作動させる。
本願の画像処理装置は、前記検出部(151)にて検出した最初のページ番号が2以上の場合、前記判定部(153)によるページ抜けの判定処理を行うようにしてあることを特徴とする。
本願では、複数枚の原稿を読み取った際に検出したページ番号が1以外の数字(すなわち、2以上)から始まる場合、既にページ抜けが発生している可能性があるため、ページ抜け判定処理を自動的に作動させる。
本願の画像処理装置は、前記検出部(153)にてページ番号が検出されない原稿の画像データを削除するデータ削除部(30)を更に備えることを特徴とする。
本願では、雑誌の広告ページ等を含む原稿を読み取った場合、ページ番号の記載がないページの画像データを広告ページとみなして削除することができる。
本願の画像形成装置は、原稿の画像を読み取り、ページ単位の画像データを出力する原稿読取部(1)、該原稿読取部(1)が出力するページ単位の画像データに基づき、ページ抜けが発生しているか否かを判定する上記何れか1つに記載の画像処理装置(2)、及び前記画像データに基づきシート上に画像形成を行う画像形成部(3)を備えることを特徴とする。
本願では、ページ番号の連続性だけでページ抜けの判定を行うのではなく、原稿を読み取ることにより得られる画像データの数と、ページ番号から算出される原稿枚数とを比較して、ページ抜けの有無が判定される。このため、読み取り対象の原稿の中にページ番号が記載されていないページが含まれていたとしても、ページ抜けが発生しているか否かを正しく検知することが可能となる。
本願のコンピュータプログラムは、原稿読取装置により読み取られたページ単位の画像データを処理するコンピュータに、読み取られた原稿の枚数を計数し(S114)、前記原稿から得られる画像データからページ番号を検出し(S106)、計数した原稿の枚数と、検出したページ番号より算出される原稿の枚数とを比較することにより、ページ抜けが発生しているか否かを判定する(S115)処理を実行させるためのコンピュータプログラムである。
本願では、原稿読取装置にて読み取られたページ単位の画像データに基づき、ページ抜けが発生しているか否かの判断をソフトウェアの処理により実現できる。
本願の記録媒体は、原稿読取装置により読み取られたページ単位の画像データを処理するコンピュータに、読み取られた原稿の枚数を計数し(S114)、前記原稿から得られる画像データからページ番号を検出し(S106)、計数した原稿の枚数と、検出したページ番号より算出される原稿の枚数とを比較することにより、ページ抜けが発生しているか否かを判定する(S115)処理を実行させるためのコンピュータプログラムを記録している。
本願では、原稿読取装置にて読み取られたページ単位の画像データに基づき、ページ抜けが発生しているか否かの判断を記録媒体から読み出されたソフトウェアを実行することにより実現できる。