JPH11213171A - 文書画像入力装置 - Google Patents
文書画像入力装置Info
- Publication number
- JPH11213171A JPH11213171A JP10017341A JP1734198A JPH11213171A JP H11213171 A JPH11213171 A JP H11213171A JP 10017341 A JP10017341 A JP 10017341A JP 1734198 A JP1734198 A JP 1734198A JP H11213171 A JPH11213171 A JP H11213171A
- Authority
- JP
- Japan
- Prior art keywords
- document
- character recognition
- unit
- character
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
- Processing Or Creating Images (AREA)
Abstract
(57)【要約】
【課題】 文書画像入力装置において、文書の境界を示
すセパレータシートを不要とする。 【解決手段】 画像入力部2により読み取られた帳票画
像データ、又はそれを画像回転変換部8が回転させた回
転帳票画像データに対し、文字認識部4は文字認識確度
を求める。方向判別部6は、良好な文字認識確度が得ら
れる帳票画像データの回転角を見つけ、それに基づいて
各帳票の向きを判定する。そして帳票の向きが、直前の
帳票の向きと異なった場合、そのことにより文書の境界
を認識する。画像ファイル出力部16には、その文書単
位で帳票画像データがファイルされる。
すセパレータシートを不要とする。 【解決手段】 画像入力部2により読み取られた帳票画
像データ、又はそれを画像回転変換部8が回転させた回
転帳票画像データに対し、文字認識部4は文字認識確度
を求める。方向判別部6は、良好な文字認識確度が得ら
れる帳票画像データの回転角を見つけ、それに基づいて
各帳票の向きを判定する。そして帳票の向きが、直前の
帳票の向きと異なった場合、そのことにより文書の境界
を認識する。画像ファイル出力部16には、その文書単
位で帳票画像データがファイルされる。
Description
【0001】
【発明の属する技術分野】本発明は、文書画像入力装置
に関し、特に複数の文書を読み取る際における単位文書
の判別に関する。
に関し、特に複数の文書を読み取る際における単位文書
の判別に関する。
【0002】
【従来の技術】従来より、多数の帳票を順次、読み込ん
で画像データを得、文書ごとの電子的な画像ファイルを
作成する電子ファイリング装置があった。そのような従
来の文書画像入力装置では、帳票はスタックとして積み
重ねられて装置にセットされ、装置はそのスタックから
一枚ずつ順に帳票を取り出し読み取る。
で画像データを得、文書ごとの電子的な画像ファイルを
作成する電子ファイリング装置があった。そのような従
来の文書画像入力装置では、帳票はスタックとして積み
重ねられて装置にセットされ、装置はそのスタックから
一枚ずつ順に帳票を取り出し読み取る。
【0003】そのような文書画像入力装置には、それぞ
れ一又は複数の帳票からなる複数の単位文書をまとめて
スタックにセットすると、自動的にそれら単位文書ごと
に電子ファイルを分けて作成するものもあった。
れ一又は複数の帳票からなる複数の単位文書をまとめて
スタックにセットすると、自動的にそれら単位文書ごと
に電子ファイルを分けて作成するものもあった。
【0004】従来の装置において行われていた単位文書
の判別の方法は、特開平3−292568号公報「画像
入力方式」に示されるように、スタック上で隣り合う2
つの文書間に所定のセパレータシートを挿入するという
方法である。この方法では、装置がそのセパレータシー
トを検知することにより、文書の境界を認識し、それに
応じてファイルを分けて作成するといった処理を行う。
セパレータシートとしては、一般の帳票と異なる形状の
シートや、一般の文書には希にしか現れない記号等が印
刷されたシートが用いられていた。
の判別の方法は、特開平3−292568号公報「画像
入力方式」に示されるように、スタック上で隣り合う2
つの文書間に所定のセパレータシートを挿入するという
方法である。この方法では、装置がそのセパレータシー
トを検知することにより、文書の境界を認識し、それに
応じてファイルを分けて作成するといった処理を行う。
セパレータシートとしては、一般の帳票と異なる形状の
シートや、一般の文書には希にしか現れない記号等が印
刷されたシートが用いられていた。
【0005】なお、セパレータシートに文書の登録条件
を記入し、装置はその文字認識結果に応じてファイルを
自動的に登録するということも行われていた(特開平6
−266823号情報)。
を記入し、装置はその文字認識結果に応じてファイルを
自動的に登録するということも行われていた(特開平6
−266823号情報)。
【0006】
【発明が解決しようとする課題】しかし、上記従来技術
は、文書区切りのためセパレータシートを入力文書数だ
け作成しなければならず、ユーザの作業負担が大きいと
いう問題があった。また、特定形状の紙片をセパレータ
シートとして用いる方法は、そのシート形状を認識する
ための装置を要するので、一般の画像入力装置において
簡単に実施することができないといった問題や、装置の
構成が複雑となったり製造コストが高くなるといった問
題があった。
は、文書区切りのためセパレータシートを入力文書数だ
け作成しなければならず、ユーザの作業負担が大きいと
いう問題があった。また、特定形状の紙片をセパレータ
シートとして用いる方法は、そのシート形状を認識する
ための装置を要するので、一般の画像入力装置において
簡単に実施することができないといった問題や、装置の
構成が複雑となったり製造コストが高くなるといった問
題があった。
【0007】本発明は上記問題点を解消するためになさ
れたもので、入力文書が複数ある場合において、読み込
まれる単位文書ごとにファイルを作成する作業の省力化
を実現する文書画像入力装置を提供することを目的とす
る。
れたもので、入力文書が複数ある場合において、読み込
まれる単位文書ごとにファイルを作成する作業の省力化
を実現する文書画像入力装置を提供することを目的とす
る。
【0008】
【課題を解決するための手段】第一の本発明に係る文書
画像入力装置は、各帳票画像データに対して文字認識処
理を行い文字ごとに文字認識確度を定める文字認識部
と、前記文字認識確度に基づいて帳票の方向を判別する
方向判別部と、連続して読み取られる2つの前記帳票間
での前記方向の変化を検知し、当該方向の変化に基づい
て連続して読み取られる2つの前記文書の境界を判別す
る文書単位判別部とを有するものである。
画像入力装置は、各帳票画像データに対して文字認識処
理を行い文字ごとに文字認識確度を定める文字認識部
と、前記文字認識確度に基づいて帳票の方向を判別する
方向判別部と、連続して読み取られる2つの前記帳票間
での前記方向の変化を検知し、当該方向の変化に基づい
て連続して読み取られる2つの前記文書の境界を判別す
る文書単位判別部とを有するものである。
【0009】文字認識部は、帳票から読み取った各文字
に対して、その読み取りの確からしさの指標として文字
認識確度を付与する。本発明によれば、方向判別部はこ
の文字認識確度を利用して、帳票が例えば画像入力部を
基準にして縦置きか横置きかといった帳票の方向を判別
する。帳票を順次、読み込む流れにおいて、文書単位判
別部は、連続する2つの帳票の方向が異なることを検知
し、それら帳票が互いに異なる文書に属するものであ
る、すなわち方向変化前の帳票がある単位文書の最後の
ページであり、方向変化後の帳票が次の単位文書の先頭
のページであると判断する。この判断に基づいて帳票画
像データが文書単位にまとめられ、文書の画像ファイル
が作成される。
に対して、その読み取りの確からしさの指標として文字
認識確度を付与する。本発明によれば、方向判別部はこ
の文字認識確度を利用して、帳票が例えば画像入力部を
基準にして縦置きか横置きかといった帳票の方向を判別
する。帳票を順次、読み込む流れにおいて、文書単位判
別部は、連続する2つの帳票の方向が異なることを検知
し、それら帳票が互いに異なる文書に属するものであ
る、すなわち方向変化前の帳票がある単位文書の最後の
ページであり、方向変化後の帳票が次の単位文書の先頭
のページであると判断する。この判断に基づいて帳票画
像データが文書単位にまとめられ、文書の画像ファイル
が作成される。
【0010】第二の本発明に係る文書画像入力装置は、
帳票イメージを回転させたイメージに対応した回転帳票
画像データを生成する画像回転変換部を有し、前記方向
判別部は前記文字認識確度に基づいて前記帳票に対する
文字認識処理結果の信頼性を評価し、その評価結果が所
定の適格条件を満たすか否かに基づいて前記帳票の方向
を判別し、前記画像回転変換部は前記適格条件が満たさ
れない場合、前記回転帳票画像データを前記文字認識部
へ出力するものである。
帳票イメージを回転させたイメージに対応した回転帳票
画像データを生成する画像回転変換部を有し、前記方向
判別部は前記文字認識確度に基づいて前記帳票に対する
文字認識処理結果の信頼性を評価し、その評価結果が所
定の適格条件を満たすか否かに基づいて前記帳票の方向
を判別し、前記画像回転変換部は前記適格条件が満たさ
れない場合、前記回転帳票画像データを前記文字認識部
へ出力するものである。
【0011】文字認識においてある文字とその文字パタ
ーンとをマッチングさせる場合、一般に、文字がパター
ンに対して傾いていると認識率が低下する。本発明はこ
のことを利用したものであり、方向判別部が、文字認識
確度に基づく評価が所定の適格条件を満たさないと判定
した場合には、画像回転変換部が帳票イメージを回転
し、文字認識部がそのイメージに対して再度、文字認識
を行い文字認識確度を出力する。例えば、異なる方向に
対応した帳票画像データに対する文字認識確度を比較し
て、より高い確度が得られる方向を帳票の方向と判断し
たり、方向判別部による評価結果が適格となるまで、画
像の回転角度の調整を繰り返すといった処理が行われ
る。
ーンとをマッチングさせる場合、一般に、文字がパター
ンに対して傾いていると認識率が低下する。本発明はこ
のことを利用したものであり、方向判別部が、文字認識
確度に基づく評価が所定の適格条件を満たさないと判定
した場合には、画像回転変換部が帳票イメージを回転
し、文字認識部がそのイメージに対して再度、文字認識
を行い文字認識確度を出力する。例えば、異なる方向に
対応した帳票画像データに対する文字認識確度を比較し
て、より高い確度が得られる方向を帳票の方向と判断し
たり、方向判別部による評価結果が適格となるまで、画
像の回転角度の調整を繰り返すといった処理が行われ
る。
【0012】本発明の好適な態様は、前記方向判別部
が、帳票の全領域又は所定部分領域に含まれる各文字の
前記文字認識確度を平均した文字認識確度平均値を求
め、当該文字認識確度平均値と所定基準値との比較に基
づいて前記評価結果の適格不適格を判定するものであ
る。
が、帳票の全領域又は所定部分領域に含まれる各文字の
前記文字認識確度を平均した文字認識確度平均値を求
め、当該文字認識確度平均値と所定基準値との比較に基
づいて前記評価結果の適格不適格を判定するものであ
る。
【0013】また本発明の他の好適な態様は、前記方向
判別部が、帳票の全領域又は所定部分領域に含まれる文
字のうち、所定範囲の前記文字認識確度を有するものの
割合を求め、当該割合と所定基準値との比較に基づいて
前記評価結果の適格不適格を判定するものである。
判別部が、帳票の全領域又は所定部分領域に含まれる文
字のうち、所定範囲の前記文字認識確度を有するものの
割合を求め、当該割合と所定基準値との比較に基づいて
前記評価結果の適格不適格を判定するものである。
【0014】第三の本発明に係る文書読み込み装置は、
前記帳票上の所定領域を属性情報領域として指定する領
域指定手段と、前記単位文書内の所定ページの前記帳票
の前記属性情報領域から読み取られる文字情報により当
該単位文書の属性情報を取得する属性情報取得部とを有
するものである。
前記帳票上の所定領域を属性情報領域として指定する領
域指定手段と、前記単位文書内の所定ページの前記帳票
の前記属性情報領域から読み取られる文字情報により当
該単位文書の属性情報を取得する属性情報取得部とを有
するものである。
【0015】本発明によれば、領域指定手段は、所定の
条件又はユーザが指定した条件に基づいて属性情報領域
を指定する。例えば、属性情報領域は文書の先頭や最後
といった特定のページの特定位置に設定される。例え
ば、属性情報領域は、文書のタイトルが記載される位置
を含むように指定される。属性情報取得部がこの属性情
報領域から取得する属性情報は、例えば対応する文書の
画像ファイルを識別するために用いることができる。
条件又はユーザが指定した条件に基づいて属性情報領域
を指定する。例えば、属性情報領域は文書の先頭や最後
といった特定のページの特定位置に設定される。例え
ば、属性情報領域は、文書のタイトルが記載される位置
を含むように指定される。属性情報取得部がこの属性情
報領域から取得する属性情報は、例えば対応する文書の
画像ファイルを識別するために用いることができる。
【0016】
【発明の実施の形態】次に、本発明の実施形態について
図面を参照して説明する。
図面を参照して説明する。
【0017】図1は、本発明の実施形態である文書画像
入力装置の概略のブロック構成図である。本装置は、画
像入力部2、文字認識部4、方向判別部6、画像回転変
換部8、画像入力制御部10、領域指定部12、属性情
報取得部14、画像ファイル出力部16を含んで構成さ
れ、文書20を読み取り、文書画像ファイルを生成す
る。
入力装置の概略のブロック構成図である。本装置は、画
像入力部2、文字認識部4、方向判別部6、画像回転変
換部8、画像入力制御部10、領域指定部12、属性情
報取得部14、画像ファイル出力部16を含んで構成さ
れ、文書20を読み取り、文書画像ファイルを生成す
る。
【0018】文書20は、帳票が積み重ねられたスタッ
クである。画像入力部2は、自動給紙機構によってスタ
ックから1枚ずつ帳票をセットされ、そのイメージを読
み取って帳票画像データを生成する。画像入力部2とし
ては、例えば光学的スキャナが用いられる。
クである。画像入力部2は、自動給紙機構によってスタ
ックから1枚ずつ帳票をセットされ、そのイメージを読
み取って帳票画像データを生成する。画像入力部2とし
ては、例えば光学的スキャナが用いられる。
【0019】文字認識部4は、画像入力部2で生成され
た帳票画像データに含まれる文字のイメージを認識し
て、それを対応する文字コードに変換することにより、
文書テキストデータを生成する。
た帳票画像データに含まれる文字のイメージを認識し
て、それを対応する文字コードに変換することにより、
文書テキストデータを生成する。
【0020】図2は、文字認識部4が行う文字認識処理
の一例を示す模式図である。この例の文字認識部4では
各文字イメージについて複数の文字候補が得られ、各文
字候補はそれぞれ認識の確からしさを示す指標として文
字認識確度を付与される。文字認識確度は、その文字候
補が文書に記載されていた文字である蓋然性を表すもの
であり、当該確度が大きい文字候補が、小さいものより
必ず正しい文字であるということを意味しない。複数の
文字候補が得られた場合には、それらには優先順位が付
けられる。この優先順位は、単純には文字認識確度の大
小に従って定めることができる。
の一例を示す模式図である。この例の文字認識部4では
各文字イメージについて複数の文字候補が得られ、各文
字候補はそれぞれ認識の確からしさを示す指標として文
字認識確度を付与される。文字認識確度は、その文字候
補が文書に記載されていた文字である蓋然性を表すもの
であり、当該確度が大きい文字候補が、小さいものより
必ず正しい文字であるということを意味しない。複数の
文字候補が得られた場合には、それらには優先順位が付
けられる。この優先順位は、単純には文字認識確度の大
小に従って定めることができる。
【0021】図に示す例では、画像30は、画像入力部
2により生成されたものを示している。画像30は、例
えば、実際の文書20上において「ベクトル」である文
字列のイメージが、例えば文書上のゴミ等により文字列
の第二文字「ク」にノイズを含んで取り込まれた例を示
している。この文書画像データが文字認識部4に入力さ
れると、文字認識部4は文字認識処理によって、画像デ
ータを認識結果40として示されるように認識する。認
識結果40は、例えば、文字列の第一文字に対して、第
一から第五の文字候補として、それぞれ「ベ」(カタカ
ナ)、「べ」(ひらがな)、「ペ」(カタカナ)、
「ぺ」(ひらがな)、「ヨ」という認識結果を得、第一
候補の文字認識確度として“0.788184”という値を得た
ことを示している。また認識結果40は、文字列の第二
文字に対しては、第一から第五の文字候補として、それ
ぞれ「タ」(カタカナ)、「ク」(カタカナ)、「グ」
(カタカナ)、「夕」(漢字)、「ダ」(カタカナ)と
いう認識結果を得、第二候補の文字認識確度として“0.
698382”という値を得たことを示している。すなわち第
二文字は、ノイズのため、正しい文字「ク」ではなく誤
った文字「タ」として認識されている。ノイズを含んで
生成される文字イメージ(上記例では「ク」にノイズが
付加されたイメージ)は本来の正しい文字の完全な形を
有さないし、一般に、誤って認識された文字(上記例で
は「タ」)の完全な形をもなさない。そのため、一般に
誤って第一候補として認識された文字の認識確度は低く
なる。
2により生成されたものを示している。画像30は、例
えば、実際の文書20上において「ベクトル」である文
字列のイメージが、例えば文書上のゴミ等により文字列
の第二文字「ク」にノイズを含んで取り込まれた例を示
している。この文書画像データが文字認識部4に入力さ
れると、文字認識部4は文字認識処理によって、画像デ
ータを認識結果40として示されるように認識する。認
識結果40は、例えば、文字列の第一文字に対して、第
一から第五の文字候補として、それぞれ「ベ」(カタカ
ナ)、「べ」(ひらがな)、「ペ」(カタカナ)、
「ぺ」(ひらがな)、「ヨ」という認識結果を得、第一
候補の文字認識確度として“0.788184”という値を得た
ことを示している。また認識結果40は、文字列の第二
文字に対しては、第一から第五の文字候補として、それ
ぞれ「タ」(カタカナ)、「ク」(カタカナ)、「グ」
(カタカナ)、「夕」(漢字)、「ダ」(カタカナ)と
いう認識結果を得、第二候補の文字認識確度として“0.
698382”という値を得たことを示している。すなわち第
二文字は、ノイズのため、正しい文字「ク」ではなく誤
った文字「タ」として認識されている。ノイズを含んで
生成される文字イメージ(上記例では「ク」にノイズが
付加されたイメージ)は本来の正しい文字の完全な形を
有さないし、一般に、誤って認識された文字(上記例で
は「タ」)の完全な形をもなさない。そのため、一般に
誤って第一候補として認識された文字の認識確度は低く
なる。
【0022】方向判別部6は、このような性質を有する
文字認識確度を含んだ認識結果を文字認識部4から入力
される。方向判別部6は、文字認識部4から得られた文
字認識確度に基づいて、文字認識部4に入力された帳票
画像データに対する認識結果の信頼性(確からしさ)を
評価する。
文字認識確度を含んだ認識結果を文字認識部4から入力
される。方向判別部6は、文字認識部4から得られた文
字認識確度に基づいて、文字認識部4に入力された帳票
画像データに対する認識結果の信頼性(確からしさ)を
評価する。
【0023】信頼性が十分なものであることを判断する
基準となる条件(適格条件)は、予め方向判別部6に設
定されたものを用いてもよいし、図示しない設定手段に
よりユーザが適宜設定可能なように装置を構成してもよ
い。
基準となる条件(適格条件)は、予め方向判別部6に設
定されたものを用いてもよいし、図示しない設定手段に
よりユーザが適宜設定可能なように装置を構成してもよ
い。
【0024】方向判別部6は、適格条件を満たす評価結
果が得られた場合には、画像入力部2で生成された帳票
画像データを画像ファイル出力部16へ出力する。一
方、所望の適格条件を満たす評価結果が得られなかった
場合には、方向判別部6は、画像回転変換部8への通知
を行う。
果が得られた場合には、画像入力部2で生成された帳票
画像データを画像ファイル出力部16へ出力する。一
方、所望の適格条件を満たす評価結果が得られなかった
場合には、方向判別部6は、画像回転変換部8への通知
を行う。
【0025】画像回転変換部8は、文字認識部4が文字
認識処理を施した帳票画像データに対し、その表す画像
を例えば所定方向に所定角度だけ回転させる変換を施し
て、文字認識部4へ出力する。
認識処理を施した帳票画像データに対し、その表す画像
を例えば所定方向に所定角度だけ回転させる変換を施し
て、文字認識部4へ出力する。
【0026】画像入力制御部10は、適格条件が満たさ
れたときに方向判別部6から通知を受けて、画像入力部
2を制御し、次の帳票をスキャンさせる。
れたときに方向判別部6から通知を受けて、画像入力部
2を制御し、次の帳票をスキャンさせる。
【0027】領域指定部12は、一つには文字認識部4
に対し、帳票画像データのうち文字認識を施す領域を指
定する機能を有する。また、もう一つには、属性情報取
得部14に対し、読み取られる文書の属性情報を含んだ
領域を指定する機能を有する。領域指定部12は、これ
らの領域指定を予め自身内に記憶された条件により行う
ことも、ユーザからの設定を受けて文字認識部4や属性
情報取得部14に対し行うことも可能である。
に対し、帳票画像データのうち文字認識を施す領域を指
定する機能を有する。また、もう一つには、属性情報取
得部14に対し、読み取られる文書の属性情報を含んだ
領域を指定する機能を有する。領域指定部12は、これ
らの領域指定を予め自身内に記憶された条件により行う
ことも、ユーザからの設定を受けて文字認識部4や属性
情報取得部14に対し行うことも可能である。
【0028】属性情報取得部14は、文書中の所定ペー
ジにおける領域指定部12により指定された領域から文
字情報を取得する。本装置では、属性情報取得部14は
文書の先頭ページの帳票から文字情報を取り出し、この
取り出された文字情報に表された当該文書の属性情報を
取り出し、当該文書の画像ファイルの管理に用いる。
ジにおける領域指定部12により指定された領域から文
字情報を取得する。本装置では、属性情報取得部14は
文書の先頭ページの帳票から文字情報を取り出し、この
取り出された文字情報に表された当該文書の属性情報を
取り出し、当該文書の画像ファイルの管理に用いる。
【0029】画像ファイル出力部16は、例えばハード
ディスクといった記憶装置であり、基本的に適格条件を
満たした帳票画像データを記録する。同一の文書に関わ
る帳票画像データは、基本的には同一のファイルに格納
される。画像ファイル出力部16は、認識結果を表示し
たり、記録したりする働きを有する。
ディスクといった記憶装置であり、基本的に適格条件を
満たした帳票画像データを記録する。同一の文書に関わ
る帳票画像データは、基本的には同一のファイルに格納
される。画像ファイル出力部16は、認識結果を表示し
たり、記録したりする働きを有する。
【0030】文字認識部4、方向判別部6、画像回転変
換部8、画像入力制御部10及び領域指定部12及び、
属性情報取得部14は、例えば、中央処理装置(CP
U:Central Processing Unit)上で実行されるソフト
ウェアにより実現されうる。すなわち、本装置の一例
は、パーソナルコンピュータ等の汎用コンピュータにス
キャナ装置を接続することにより構成することができ
る。
換部8、画像入力制御部10及び領域指定部12及び、
属性情報取得部14は、例えば、中央処理装置(CP
U:Central Processing Unit)上で実行されるソフト
ウェアにより実現されうる。すなわち、本装置の一例
は、パーソナルコンピュータ等の汎用コンピュータにス
キャナ装置を接続することにより構成することができ
る。
【0031】図3は、本装置における処理を説明する処
理フロー図である。ユーザは、自動給紙機構に新たに文
書を載置する際に、現在のスタックの最後尾の文書と逆
向きとなるように、当該文書を載置する。例えば、スタ
ックの最後の文書が、スキャナにより帳票の上部から下
部へ走査されるような向きに載置されている場合には、
次の文書はそれに対し180°回転した向き、すなわち
スキャナにより帳票の上部から下部へ走査されるような
向きに載置される。このように、自動給紙機構には、ユ
ーザにより複数の文書が向きを交互に変えて積み重ねら
れたスタックが形成される(S50)。
理フロー図である。ユーザは、自動給紙機構に新たに文
書を載置する際に、現在のスタックの最後尾の文書と逆
向きとなるように、当該文書を載置する。例えば、スタ
ックの最後の文書が、スキャナにより帳票の上部から下
部へ走査されるような向きに載置されている場合には、
次の文書はそれに対し180°回転した向き、すなわち
スキャナにより帳票の上部から下部へ走査されるような
向きに載置される。このように、自動給紙機構には、ユ
ーザにより複数の文書が向きを交互に変えて積み重ねら
れたスタックが形成される(S50)。
【0032】装置が起動されると、画像入力制御部10
は自動給紙機構を制御して、帳票をまずスタックの先頭
の1枚の帳票を画像入力部2にセットする。
は自動給紙機構を制御して、帳票をまずスタックの先頭
の1枚の帳票を画像入力部2にセットする。
【0033】画像入力部2はこのスタック先頭の帳票の
イメージを光学的に読み取り(S55)、帳票画像デー
タを出力する。この1枚目の帳票画像データは、図1に
は示さない画像表示部、例えばCRTディスプレイ等に
表示される(S60)。ユーザは、必要に応じ、この段
階で、画像表示部に表示された帳票イメージの所望の領
域を文書名が記載される領域として指定することができ
る。この指定は、例えば、マウス等によるカーソル操作
により、画像表示部に表示された帳票イメージ上で直接
行うことができる。ユーザがここで指定を行ったときに
はその領域が、また指定を行わなかったときには予め領
域指定部12に記憶されている領域が、属性情報取得部
14に属性情報である文書名が記載された領域であると
して設定される(S65)。
イメージを光学的に読み取り(S55)、帳票画像デー
タを出力する。この1枚目の帳票画像データは、図1に
は示さない画像表示部、例えばCRTディスプレイ等に
表示される(S60)。ユーザは、必要に応じ、この段
階で、画像表示部に表示された帳票イメージの所望の領
域を文書名が記載される領域として指定することができ
る。この指定は、例えば、マウス等によるカーソル操作
により、画像表示部に表示された帳票イメージ上で直接
行うことができる。ユーザがここで指定を行ったときに
はその領域が、また指定を行わなかったときには予め領
域指定部12に記憶されている領域が、属性情報取得部
14に属性情報である文書名が記載された領域であると
して設定される(S65)。
【0034】以降説明する処理は、スタックの1枚目の
帳票についても、それ以降の帳票についても共通であ
る。
帳票についても、それ以降の帳票についても共通であ
る。
【0035】画像入力部2が生成した帳票画像データは
文字認識部4に渡され、文字認識部4は、入力された帳
票画像データに対して文字認識処理を行う(S70)。
この文字認識処理は、帳票画像データの全領域または領
域指定部12から設定された所定の部分領域に対して行
われる。文字認識部4は、この設定された領域内の帳票
画像データに含まれる文字画像を表すデータ部分を検出
し、各文字画像に対して文字認識を行う。その結果、1
つの文字画像に対して、複数の文字候補を検出した場合
は、文字認識部4はそれら候補間での優先順位を定め、
少なくとも第一候補の文字認識確度を求める。ちなみ
に、文字認識対象領域を狭く設定することにより、その
処理時間を短縮することができる。
文字認識部4に渡され、文字認識部4は、入力された帳
票画像データに対して文字認識処理を行う(S70)。
この文字認識処理は、帳票画像データの全領域または領
域指定部12から設定された所定の部分領域に対して行
われる。文字認識部4は、この設定された領域内の帳票
画像データに含まれる文字画像を表すデータ部分を検出
し、各文字画像に対して文字認識を行う。その結果、1
つの文字画像に対して、複数の文字候補を検出した場合
は、文字認識部4はそれら候補間での優先順位を定め、
少なくとも第一候補の文字認識確度を求める。ちなみ
に、文字認識対象領域を狭く設定することにより、その
処理時間を短縮することができる。
【0036】文字認識部4による各文字画像についての
認識結果は、方向判別部6に入力される。方向判別部6
は、まず認識結果の評価を行う。この評価は、例えば、
設定された領域内での文字認識確度の平均値を求めると
いうものである。その評価結果が適格である、つまり文
字認識が確からしいことは、当該平均値が予め方向判別
部6に設定された閾値、例えば“0.7”を超えるとい
う適格条件を満たすか否かに基づいて判断される(S7
5)。一般に、適格条件が満たされる場合には、文字認
識が施された帳票画像データの向きとマッチングされた
文字パターンとの向きとはよい精度で一致していたこと
を示し、一方、満たされない場合には、それらの向きは
十分には一致していなかったことを示す。
認識結果は、方向判別部6に入力される。方向判別部6
は、まず認識結果の評価を行う。この評価は、例えば、
設定された領域内での文字認識確度の平均値を求めると
いうものである。その評価結果が適格である、つまり文
字認識が確からしいことは、当該平均値が予め方向判別
部6に設定された閾値、例えば“0.7”を超えるとい
う適格条件を満たすか否かに基づいて判断される(S7
5)。一般に、適格条件が満たされる場合には、文字認
識が施された帳票画像データの向きとマッチングされた
文字パターンとの向きとはよい精度で一致していたこと
を示し、一方、満たされない場合には、それらの向きは
十分には一致していなかったことを示す。
【0037】まず、適格条件が満たされなかった場合に
は、画像回転変換部8へ通知される。画像回転変換部8
は、文字認識部4が文字認識処理を施した帳票画像デー
タに対し、その表す画像を180°だけ回転させる変換
を施して(S80)、文字認識部4へ戻す(S70)。
は、画像回転変換部8へ通知される。画像回転変換部8
は、文字認識部4が文字認識処理を施した帳票画像デー
タに対し、その表す画像を180°だけ回転させる変換
を施して(S80)、文字認識部4へ戻す(S70)。
【0038】帳票画像データの回転状態は2つの回転回
数レジスタ値R1、R2により管理される。R1は、現
在処理されている帳票のイメージに対して画像回転変換
部8が行った回転変換処理の回数であり、各帳票に対す
る処理が開始される時点では、初期値=0に設定されて
いる。R2は、一枚前の帳票のイメージに対して画像回
転変換部8が行った回転変換処理の回数であり、各帳票
でのイメージ読み込み処理の終了段階において、それま
で処理を行っていた帳票に対する回転回数レジスタR1
の値で更新される。
数レジスタ値R1、R2により管理される。R1は、現
在処理されている帳票のイメージに対して画像回転変換
部8が行った回転変換処理の回数であり、各帳票に対す
る処理が開始される時点では、初期値=0に設定されて
いる。R2は、一枚前の帳票のイメージに対して画像回
転変換部8が行った回転変換処理の回数であり、各帳票
でのイメージ読み込み処理の終了段階において、それま
で処理を行っていた帳票に対する回転回数レジスタR1
の値で更新される。
【0039】上記、帳票画像データに回転変換を施して
文字認識部4へ戻すというループ処理により、基本的に
は、適格条件が満たされるまで、同一の帳票に対して順
次、回転変換が行われる。しかし、帳票画像の回転合計
角度が360°となった場合、つまりR1=2となった
場合には(S85)、それ以上、回転を繰り返しても無
意味である。このような場合は、帳票上の文字認識処理
対象領域に、例えば図形といった文字認識できない画像
が記載されている場合に起こりうる。よって、この場合
には適格条件が満たされていなくても、画像データの画
像ファイル出力部16への格納が行われ(S95)次の
帳票処理に移行する。なお、この場合には、帳票の向き
は前帳票と同じであるとみなされ、上記R2の更新は行
われず、R1の初期化のみが行われる。このように、R
1=2となった場合に必ずループを抜け出すことによ
り、無限ループが回避される。なお、回転合計角R1≠
2つまりR1=1である場合には(S85)、画像回転
変換部8は上述のように、変換により得られた回転帳票
画像データを文字認識部4へ戻す。
文字認識部4へ戻すというループ処理により、基本的に
は、適格条件が満たされるまで、同一の帳票に対して順
次、回転変換が行われる。しかし、帳票画像の回転合計
角度が360°となった場合、つまりR1=2となった
場合には(S85)、それ以上、回転を繰り返しても無
意味である。このような場合は、帳票上の文字認識処理
対象領域に、例えば図形といった文字認識できない画像
が記載されている場合に起こりうる。よって、この場合
には適格条件が満たされていなくても、画像データの画
像ファイル出力部16への格納が行われ(S95)次の
帳票処理に移行する。なお、この場合には、帳票の向き
は前帳票と同じであるとみなされ、上記R2の更新は行
われず、R1の初期化のみが行われる。このように、R
1=2となった場合に必ずループを抜け出すことによ
り、無限ループが回避される。なお、回転合計角R1≠
2つまりR1=1である場合には(S85)、画像回転
変換部8は上述のように、変換により得られた回転帳票
画像データを文字認識部4へ戻す。
【0040】適格条件が満たされることにより、上記ル
ープを抜け出した場合には、当該帳票が文書の先頭の帳
票であるかどうかが判定される。この判定は、スタック
の先頭の帳票であるかどうかの判定(S100)と、当
該帳票に関する回転回数が直前の帳票に関する回転回数
と同じであるかどうかの判定(S105)により行われ
る。帳票がスタックの先頭である場合には、それは明ら
かに文書の先頭ページである(S100)。また、本装
置では文書は交互に向きを変えてスタックされるので、
回転回数レジスタ値R1がR2と異なる場合には、その
ことによって、当該帳票とその直前の帳票とが異なる文
書に属していたことが把握される(105)。よって、
セパレータシートを用いることなく、本装置では各文書
の終了ページ、先頭ページを認識することができるわけ
である。
ープを抜け出した場合には、当該帳票が文書の先頭の帳
票であるかどうかが判定される。この判定は、スタック
の先頭の帳票であるかどうかの判定(S100)と、当
該帳票に関する回転回数が直前の帳票に関する回転回数
と同じであるかどうかの判定(S105)により行われ
る。帳票がスタックの先頭である場合には、それは明ら
かに文書の先頭ページである(S100)。また、本装
置では文書は交互に向きを変えてスタックされるので、
回転回数レジスタ値R1がR2と異なる場合には、その
ことによって、当該帳票とその直前の帳票とが異なる文
書に属していたことが把握される(105)。よって、
セパレータシートを用いることなく、本装置では各文書
の終了ページ、先頭ページを認識することができるわけ
である。
【0041】当該帳票が文書の先頭ページであると認識
されると、処理S65にて設定された属性情報領域にお
いて文字認識され、得られたテキスト情報に基づいて文
書名が取得される。この文書名は、例えば、画像ファイ
ル出力部16の記憶される文書画像データファイルの識
別名として用いられる。
されると、処理S65にて設定された属性情報領域にお
いて文字認識され、得られたテキスト情報に基づいて文
書名が取得される。この文書名は、例えば、画像ファイ
ル出力部16の記憶される文書画像データファイルの識
別名として用いられる。
【0042】このようにして、本装置では単位文書が認
識され、各帳票画像データを画像ファイル出力部16に
格納する処理が行われる(S90)。現在認識された帳
票が文書の先頭でない場合には、前帳票と同一のファイ
ルにデータが追加される。一方、現在認識された帳票が
文書の先頭である場合には、前帳票までを格納してきた
ファイルが閉じられ、新たなファイルに現在認識された
帳票の画像データが格納される。これにより、文書ごと
に画像データのファイルが区分して生成される。
識され、各帳票画像データを画像ファイル出力部16に
格納する処理が行われる(S90)。現在認識された帳
票が文書の先頭でない場合には、前帳票と同一のファイ
ルにデータが追加される。一方、現在認識された帳票が
文書の先頭である場合には、前帳票までを格納してきた
ファイルが閉じられ、新たなファイルに現在認識された
帳票の画像データが格納される。これにより、文書ごと
に画像データのファイルが区分して生成される。
【0043】なお、次の帳票の処理へ移行する前の適当
な段階(図示する例では、画像データを画像ファイル出
力部16へ格納する前)において、上述した回転回数レ
ジスタ値R1の初期化(S95)、及びR2の更新(S
110)が行われる。
な段階(図示する例では、画像データを画像ファイル出
力部16へ格納する前)において、上述した回転回数レ
ジスタ値R1の初期化(S95)、及びR2の更新(S
110)が行われる。
【0044】これによりある帳票の処理が終了する。し
かる後、スタックの次の帳票に対して同様の処理が行わ
れる。つまり、画像入力制御部10は、自動給紙機構に
次の帳票のセットを指示し、次の帳票がセットされた場
合には(S115)、その帳票に対し画像入力部2によ
るスキャンが行われ(S120)、それにより得られた
帳票画像データに対して、上述の処理S70〜S110
が行われる。一方、スタックのすべての帳票が処理さ
れ、給紙が行われなかった場合には(S115)、全処
理を終了する。
かる後、スタックの次の帳票に対して同様の処理が行わ
れる。つまり、画像入力制御部10は、自動給紙機構に
次の帳票のセットを指示し、次の帳票がセットされた場
合には(S115)、その帳票に対し画像入力部2によ
るスキャンが行われ(S120)、それにより得られた
帳票画像データに対して、上述の処理S70〜S110
が行われる。一方、スタックのすべての帳票が処理さ
れ、給紙が行われなかった場合には(S115)、全処
理を終了する。
【0045】さて、上述した装置の説明で用いた文字認
識処理結果の評価及び適格条件に代えて、以下の評価、
条件を用いることもできる。つまり、文字認識対象領域
にて認識された文字のうち、その文字認識確度が所定範
囲にあるものの割合を求め、当該割合と所定の基準割合
との比較に基づいて適格不適格を判定する。例えば、文
字認識確度の所定範囲は、0.9以上と定めることがで
き、所定基準割合は、例えば70%と定めることができ
る。このような文字認識の確からしさの判断は、文字認
識対象領域の一部の領域の認識率が低い場合にも対応で
きるというメリットがある。
識処理結果の評価及び適格条件に代えて、以下の評価、
条件を用いることもできる。つまり、文字認識対象領域
にて認識された文字のうち、その文字認識確度が所定範
囲にあるものの割合を求め、当該割合と所定の基準割合
との比較に基づいて適格不適格を判定する。例えば、文
字認識確度の所定範囲は、0.9以上と定めることがで
き、所定基準割合は、例えば70%と定めることができ
る。このような文字認識の確からしさの判断は、文字認
識対象領域の一部の領域の認識率が低い場合にも対応で
きるというメリットがある。
【0046】また、領域指定部12によって、文書名領
域だけでなく、キーワード領域も指定できるようにする
こともできる。この場合、当該キーワード領域から得ら
れた文字情報を、画像ファイル出力部16に格納された
ファイルに対する検索機能が提供されている場合のその
検索キーワードとして用いたり、ファイルの分類に用い
たりすることができる。
域だけでなく、キーワード領域も指定できるようにする
こともできる。この場合、当該キーワード領域から得ら
れた文字情報を、画像ファイル出力部16に格納された
ファイルに対する検索機能が提供されている場合のその
検索キーワードとして用いたり、ファイルの分類に用い
たりすることができる。
【0047】また、上述の装置では、1回当たりの回転
角度は180°としたが、これ以外の角度でもよく、例
えば、1回当たりの回転角度を90°とすることができ
る。この場合、処理S85の判定条件は「R1が4であ
るか否か」になる。また、回転変換1回の回転角を90
°とする場合において、文書の先頭ページ、又は直前ペ
ージの帳票と回転変換回数が1回のみ異なる帳票は、同
一の文書に属するものと取り扱う形態も可能である。
角度は180°としたが、これ以外の角度でもよく、例
えば、1回当たりの回転角度を90°とすることができ
る。この場合、処理S85の判定条件は「R1が4であ
るか否か」になる。また、回転変換1回の回転角を90
°とする場合において、文書の先頭ページ、又は直前ペ
ージの帳票と回転変換回数が1回のみ異なる帳票は、同
一の文書に属するものと取り扱う形態も可能である。
【0048】
【発明の効果】本発明の文書画像入力装置によれば、向
きを変えて積み重ねられた複数文書の境界を、各帳票の
向きを文字認識確度に基づいて検知し、その向きの変化
に基づいて認識することができる。これにより、文書単
位での画像データの読み込み、ファイル作成を、読み込
まれる帳票間にセパレータシートを挟むことなく行うこ
とができる。これにより、入力文書が複数ある場合にお
いて、セパレータシートの作成、セットといった作業が
不要となり、省力化が実現されるという効果が得られ
る。また、その発明の構成は、文字認識を利用しソフト
ウェア的に実現されるため、何らハードウェア的な追加
を要せず、よって、装置の製造コストの増大を生じるこ
ともない。
きを変えて積み重ねられた複数文書の境界を、各帳票の
向きを文字認識確度に基づいて検知し、その向きの変化
に基づいて認識することができる。これにより、文書単
位での画像データの読み込み、ファイル作成を、読み込
まれる帳票間にセパレータシートを挟むことなく行うこ
とができる。これにより、入力文書が複数ある場合にお
いて、セパレータシートの作成、セットといった作業が
不要となり、省力化が実現されるという効果が得られ
る。また、その発明の構成は、文字認識を利用しソフト
ウェア的に実現されるため、何らハードウェア的な追加
を要せず、よって、装置の製造コストの増大を生じるこ
ともない。
【図1】 本発明の実施形態である文書画像入力装置の
概略のブロック構成図である。
概略のブロック構成図である。
【図2】 文字認識部が行う文字認識処理の一例を示す
模式図である。
模式図である。
【図3】 本装置における処理を説明する処理フロー図
である。
である。
2 画像入力部、4 文字認識部、6 方向判別部、8
画像回転変換部、10 画像入力制御部、12 領域
指定部、14 属性情報取得部、16 画像ファイル出
力部、20 文書。
画像回転変換部、10 画像入力制御部、12 領域
指定部、14 属性情報取得部、16 画像ファイル出
力部、20 文書。
Claims (5)
- 【請求項1】 文書を構成する複数帳票の帳票イメージ
を順次読み取り、帳票画像データを生成する画像入力部
を備え、前記文書単位の画像ファイルを生成する文書画
像入力装置において、 前記各帳票画像データに対して文字認識処理を行い、文
字ごとに文字認識確度を定める文字認識部と、 前記文字認識確度に基づいて、前記帳票の方向を判別す
る方向判別部と、 連続して読み取られる2つの前記帳票間での前記方向の
変化を検知し、当該方向の変化に基づいて連続して読み
取られる2つの前記文書の境界を判別する文書単位判別
部と、 を有することを特徴とする文書画像入力装置。 - 【請求項2】 前記帳票イメージを回転させたイメージ
に対応した回転帳票画像データを生成する画像回転変換
部を有し、 前記方向判別部は、前記文字認識確度に基づいて前記帳
票に対する文字認識処理結果の信頼性を評価し、その評
価結果が所定の適格条件を満たすか否かに基づいて前記
帳票の方向を判別し、 前記画像回転変換部は、前記適格条件が満たされない場
合、前記回転帳票画像データを前記文字認識部へ出力す
ること、 を特徴とする請求項1記載の文書画像入力装置。 - 【請求項3】 前記方向判別部は、前記帳票の全領域又
は所定部分領域に含まれる各文字の前記文字認識確度を
平均した文字認識確度平均値を求め、当該文字認識確度
平均値と所定基準値との比較に基づいて前記評価結果の
適格不適格を判定すること、を特徴とする請求項2記載
の文書画像入力装置。 - 【請求項4】 前記方向判別部は、前記帳票の全領域又
は所定部分領域に含まれる文字のうち、所定範囲の前記
文字認識確度を有するものの割合を求め、当該割合と所
定基準値との比較に基づいて前記評価結果の適格不適格
を判定すること、を特徴とする請求項2記載の文書画像
入力装置。 - 【請求項5】 前記帳票上の所定領域を属性情報領域と
して指定する領域指定手段と、 前記文書内の所定ページの前記帳票の前記属性情報領域
から読み取られる文字情報により当該文書の属性情報を
取得する属性情報取得部と、 を有することを特徴とする請求項1記載の文書画像入力
装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10017341A JPH11213171A (ja) | 1998-01-29 | 1998-01-29 | 文書画像入力装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10017341A JPH11213171A (ja) | 1998-01-29 | 1998-01-29 | 文書画像入力装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH11213171A true JPH11213171A (ja) | 1999-08-06 |
Family
ID=11941365
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10017341A Pending JPH11213171A (ja) | 1998-01-29 | 1998-01-29 | 文書画像入力装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH11213171A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017046278A (ja) * | 2015-08-28 | 2017-03-02 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
-
1998
- 1998-01-29 JP JP10017341A patent/JPH11213171A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017046278A (ja) * | 2015-08-28 | 2017-03-02 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6137905A (en) | System for discriminating document orientation | |
US8331672B2 (en) | Method and apparatus for recognizing character in character recognizing apparatus | |
US7305619B2 (en) | Image processing method, device and storage medium therefor | |
JPH11316800A (ja) | 文字認識方法及び装置 | |
US5265171A (en) | Optical character reading apparatus for performing spelling check | |
JPH1139428A (ja) | 文書映像の方向修正方法 | |
US20010043742A1 (en) | Communication document detector | |
JP3285686B2 (ja) | 領域分割方法 | |
JP3573945B2 (ja) | フォーマット認識装置及び文字読み取り装置 | |
JPH11213171A (ja) | 文書画像入力装置 | |
JP3467437B2 (ja) | 文字認識装置及びその方法とプログラム記録媒体 | |
JP3319203B2 (ja) | 文書ファイリング方法及び装置 | |
JP3787377B2 (ja) | 文書方向判定方法及び装置及び文字認識方法及び装置 | |
JPH11203411A (ja) | 文書読み取り装置 | |
JPH06103411A (ja) | 文書読取装置 | |
JPH11338973A (ja) | 文書画像補正装置および文書画像補正方法 | |
JP3159087B2 (ja) | 文書照合装置および方法 | |
JPH0696288A (ja) | 文字認識装置及び機械翻訳装置 | |
JPH11184976A (ja) | 辞書学習方式および文字認識装置 | |
JP2006277149A (ja) | 文字画像切出装置、文字画像切出方法およびプログラム | |
JP3186712B2 (ja) | 文書読取装置 | |
JP2963474B2 (ja) | 類似文字識別方法 | |
JP2931485B2 (ja) | 文字切出し装置及び方法 | |
JP3310063B2 (ja) | 文書処理装置 | |
JP2976990B2 (ja) | 文字認識装置 |