JP3671682B2 - Image recognition device - Google Patents
Image recognition device Download PDFInfo
- Publication number
- JP3671682B2 JP3671682B2 JP20491298A JP20491298A JP3671682B2 JP 3671682 B2 JP3671682 B2 JP 3671682B2 JP 20491298 A JP20491298 A JP 20491298A JP 20491298 A JP20491298 A JP 20491298A JP 3671682 B2 JP3671682 B2 JP 3671682B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- image data
- image
- reliability
- inclination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Editing Of Facsimile Originals (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Analysis (AREA)
- Facsimile Scanning Arrangements (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、デジタル複写機、ファクシミリなどにおいて画像入力装置から読み取られた原稿画像を認識する画像認識装置に関する。
【0002】
【従来の技術】
従来、例えば、自動原稿搬送装置(Auto Document Feeder、以下、「ADF」という。)を備えたデジタル複写機において、複数枚の原稿を連続して読み取ってコピーする場合、読み取られた原稿の向きに応じてコピーが排出されるので、原稿をADFにセットする際に、各原稿が一律に同じ方向を向いているか否かを確認する必要があった。しかし、このような確認作業は結構手間がかかるものであり、原稿枚数が多ければ、それだけ反対方向の原稿を見落とすおそれも大きくなる。
【0003】
このような不都合を避けるため、原稿を読み取り、生成した画像データからまず原稿の方向を判別し(このような原稿の方向の判別を、以下、「天地認識」という。)、その画像出力が紙面に対して適切な方向になるように画像データを回転処理して出力する方法が考えられている。天地認識の方法は種々考案されており、例えば、特開平9−9040号公報には、原稿の中で文書画像と認識される部分に関し、主走査方向及び副走査方向についてのヒストグラムを取得することにより、天地認識を行う技術が開示されている。
【0004】
図10は、上記従来の天地認識の方法について説明するための図である。同図に示されるように、画像入力装置に入力された文書画像データから、主走査方法及び副走査方向に関して取得されたヒストグラムを用いて、文字行の向きや、行の先頭の文字位置を認識することにより、天地認識を行うことができる。
【0005】
より具体的には、取得されたヒストグラムの立ち上がりエッジの数と立ち下がりエッジの数、両者の和及び差を、主走査方向のヒストグラム及び副走査方向のヒストグラムについてそれぞれ算出する。図10に示したような横書きの文書画像であれば、主走査方向のヒストグラム(a)の立ち上がりエッジの数と立ち下がりエッジの数がほぼ等しくなる他、両者の和は、副走査方向のヒストグラム(b)と比較して多くなる。主走査方向のヒストグラム(a)には、行を表すピークと、行間に相当するピークのない部分が交互に検出されるからである。
【0006】
また、図10の例における副走査方向のヒストグラム(b)からは、行の先頭の文字位置を認識することができる。即ち、行の先頭の文字位置は比較的一定しているため、ヒストグラムの立ち上がりエッジが数箇所に集中するのに対し、行の最後の文字位置は、文章によってまちまちであり、従って行の最後の文字位置によるヒストグラムの立ち下がりエッジは、比較的分散して発生するので、その立ち上がりエッジの数と立ち下がりエッジの数との差が大きければ当該原稿の上下を認識できる。
【0007】
以上のような認識により、文字行の向きと、行の先頭の文字位置を検出することができ、かかる検出結果に基づいて天地認識を行うことができる。これらの認識は、縦書きの原稿についても適用することが可能である。
【0008】
【発明が解決しようとする課題】
しかしながら、上記従来の技術は、例えば原稿がADFを介してセットされる際に傾いてしまったような場合に、正確な天地認識ができない場合があるという問題を有していた。
【0009】
即ち、原稿が傾いていしまったような場合には、図11に示すように行間や、先頭の文字位置を正確に認識することが可能なヒストグラムを取得することができず、取得されたヒストグラムを用いて天地認識を行っても正確な認識を行うことができないからである。このような問題は、原稿に記載された文字行自体が傾いているような場合にも起こりうる。
【0010】
本発明は、上記の問題点に鑑み、原稿が傾いている場合においても、天地認識を行うことができる画像認識装置を提供することを目的とする。
【0011】
本発明の第2の目的は、原稿に記載された文字行自体が傾いているような場合においても、より正確な天地認識を行うことができる画像認識装置を提供することである。
【0012】
【課題を解決するための手段】
上記課題を解決するために、本発明の第1の画像認識装置は、原稿を読み取り第1の画像データを生成する画像読み取り手段と、前記原稿の傾きを検出する原稿傾き検出手段と、前記原稿傾き検出手段により検出された原稿の傾きに基づいて、前記画像読み取り手段により生成された第1の画像データの傾きを補正して、第2の画像データを生成する傾き補正手段と、前記画像読み取り手段により生成された第1の画像データ、及び、前記傾き補正手段により生成された第2の画像データのうち、何れの画像データに基づいて原稿の方向を認識するかを判断する判断手段と、前記判断手段により判断された第1の画像データ、及び第2の画像データのうちの何れかの画像データに基づいて、原稿の方向を認識する原稿方向認識手段とを備えることを特徴とする。
【0013】
また、本発明の第2の画像認識装置は、原稿を読み取り画像データを生成する画像読み取り手段と、前記原稿の傾きを検出する原稿傾き検出手段と、前記原稿傾き検出手段により検出された原稿の傾きに基づいて、前記画像読み取り手段により生成された第1の画像データの傾きを補正して、第2の画像データを生成する傾き補正手段と、前記画像読み取り手段により生成された第1の画像データ、及び前記傾き補正手段により生成された第2の画像データのそれぞれに基づいて、原稿の方向の認識を行う場合の、認識の信頼度に関する情報を取得する信頼度取得手段と、前記信頼度取得手段により第1の画像データに基づいて取得された信頼度に関する情報と、前記信頼度取得手段により第2の画像データに基づいて取得された信頼度に関する情報とを比較する比較手段と、前記比較手段による比較の結果、信頼度が高い方の画像データに基づいて、原稿の方向を認識する原稿方向認識手段とを備えることを特徴とする。
【0014】
【発明の実施の形態】
本発明に係る画像認識装置の一適用例であるデジタル複写機(以下、単に「複写機」という。)について、以下に添付の図面を参照しながら説明する。
【0015】
(1)複写機全体の構成
まず、本発明に係る画像認識装置が適用される複写機の全体の構成を図1により説明する。
同図に示すように、この複写機は、ADF10と、画像読取部30と、プリンタ部50と、給紙部70とからなる。
【0016】
ADF10は、原稿を自動的に画像読取部30に搬送する装置であって、原稿給紙トレイ11に載置された原稿は、給紙ローラ12、捌きローラ13により1枚ずつ分離されて下方に送られ、搬送ベルト14によって、プラテンガラス31上の原稿読取位置まで搬送される。
原稿読取位置に搬送された原稿は、画像読取部30のスキャナ32によりスキャンされた後、再び、搬送ベルト14により図の右方向に送られ、排紙ローラ15を経て原稿排紙トレイ16上に排出される。
【0017】
画像読取部30は、上記プラテンガラス31の原稿読取位置に搬送された原稿の画像を光学的に読み取るものであって、スキャナ32、CCDカラーイメージセンサ(以下、単に「CCDセンサ」という。)38などから構成される。
【0018】
スキャナ32には、露光ランプ33と、この露光ランプ33の照射による原稿からの反射光をプラテンガラス31に平行な方向に光路変更するミラー34が設置され、図の矢印方向に移動することによりプラテンガラス31上の原稿をスキャンする。原稿からの反射光はミラー34に反射された後、さらにミラー35、36および集光レンズ37を介してCCDセンサ38まで導かれ、ここで電気信号に変換されて画像データが生成される。
【0019】
当該画像データは、制御部100内の画像信号処理部110(図2参照)においてA/D変換されてデジタル信号となり、シェーディング補正や濃度変換処理を加えられ、さらに公知の誤差拡散処理等を加えられた後、高解像度画像メモリ120(同図2)に格納される。高解像度画像メモリ120に格納された画像データは、後述するようにCPU190でなされた天地認識の結果に応じて回転処理され、プリンタ部50のレーザダイオード(以下、「LD」とも表記する。)51の駆動信号となる。
【0020】
プリンタ部50は、公知の電子写真方式により記録シート上に画像を形成するものであって、上記駆動信号を受信するとレーザダイオード51を駆動してレーザ光を出射させる。レーザ光は、所定の角速度で回転するポリゴンミラー52側面のミラー面で反射され、fθレンズ53、ミラー54、55を介して、感光体ドラム56の表面を露光走査する。
【0021】
この感光体ドラム56は、上記露光を受ける前にクリーニング部57で感光体表面の残留トナーを除去され、さらにイレーサランプ(図示せず)の照射を受けて除電された後、帯電チャージャ58により一様に帯電されており、このように一様に帯電した状態で上記露光を受けると、感光体ドラム56表面に静電潜像が形成される。
【0022】
現像器59は、感光体ドラム56表面に形成された上記静電潜像を可視化する。
【0023】
一方、給紙部70には、2つの用紙カセット71、72が設けられており、上述の感光体ドラム56の露光および現像の動作と同期して、必要なサイズの記録シートが、用紙カセット71、72のいずれかから、給紙ローラ711もしくは721の駆動により給紙される。給紙された記録シートは、感光体ドラム56の下方で当該感光体ドラム56の表面に接触し、転写チャージャ60の静電力により、感光体ドラム56表面に形成されていたトナー像が当該記録シート表面に転写される。
【0024】
その後、記録シートは、分離チャージャ61の静電力によって感光体ドラム56の表面から引き剥され、搬送ベルト62により定着部63に搬送される。
記録シートに転写されたトナー像は、定着部63において内部にヒータを備えた定着ローラ64で加熱されながら押圧されることにより定着される。定着後の記録シートは、排出ローラ65により排紙トレイ66上に排出される。
【0025】
また、画像読取部30の前面の操作しやすい位置には、操作パネル90が設けられており、コピー枚数を入力するテンキーやコピー開始を指示するスタートキー、各種のコピーモードを設定するための設定キー、上記設定キーなどにより設定されたモードをメッセージで表示する表示部などが設けられている。
【0026】
(2)制御部100の構成
次に、本実施の形態において、上記複写機の内部に設置される制御部100の構成を、図2のブロック図を参照しながらより詳細に説明する。
同図に示すように制御部100は、画像信号処理部110と、高解像度画像メモリ120と、傾き検出部125と、回転処理部130と、LD駆動部140と、解像度変換部150と、第1低解像度認識用メモリ160と、傾き補正部170と、第2低解像度認識用メモリ180と、CPU190等からなる。
【0027】
画像信号処理部110は、A/Dコンバータ、シェーディング補正部、MTF補正部や、変倍部、γ補正部などを備えており、CCDセンサ38より入力された原稿の画像データは、A/Dコンバータでデジタルの多値信号に変換され、シェーディング補正部で露光ランプ33の照度ムラやCCDセンサ38の感度ムラが補正された後、MTF補正部でエッジ強調などの画質改善のための処理を受け、さらに変倍部やγ補正部でそれぞれ変倍処理、γ補正処理を加えられた後に、高解像度画像メモリ120および解像度変換部150に送られる。
【0028】
なお、本実施の形態のCCDセンサ38からは、反射率濃度変換された濃度データが出力されているものとする。
【0029】
傾き検出部125は、読み取られた原稿の傾き検出処理を行う。傾き検出処理の詳細については後述する。
回転処理部130は、高解像度画像メモリ120から目的のページの画像データを読み出して、CPU190からの回転角情報に基づき、必要に応じて画像データを回転処理してから、LD駆動部140に転送する。なお、この回転処理は、画像データのメモリアドレスを変更する公知の技術(例えば、特開昭60ー126769号公報参照)によってなされる。
【0030】
LD駆動部140は、高解像度画像メモリ120から出力された画像データについて、内部のROMに格納された制御プログラムに基づいてLD51へ送り、記録シートへの画像形成を実行する。
【0031】
解像度変換処理部150は、画像信号処理部110を経由した高解像度画像データを低解像度の画像データに変換する。解像度変換された画像データは、まず第1低解像度認識用メモリ160に書き込まれる。本実施の形態では、CCDセンサ38で読み取られた400DPIまたは600DPIの画像データを、25DPIまたは40DPIの低解像度に変換する。解像度変換は、具体的には、例えば縦4画素×横4画素の16画素を取り出し、取り出された16画素の濃度の最大値を取得して、それを1画素の濃度とする処理を、所定の解像度となるまで繰り返し実行することにより行うことができる。
【0032】
傾き補正部170は、傾き検出部125において検出された原稿の傾きに基づいて、第1低解像度認識用メモリ160に格納された画像データの補正を行う。ここで、補正とは、具体的には、検出された原稿の傾き分だけ、画像データを回転させることをいう。なお、本実施の形態の説明では、回転処理部130において行われる天地認識に基づく回転処理と区別するため、傾き補正のための回転処理を「傾き補正処理」という。
【0033】
傾き補正部170において傾き補正処理された低解像度画像データは、第2低解像度認識用メモリ180に格納される。
本実施の形態の画像認識装置では、第2低解像度認識用メモリ180に格納される傾き補正処理された低解像度画像データに基づいて天地認識を行うこともできるし、後述の如く、第1低解像度認識用メモリ160に格納された画像データ、及び第2低解像度認識用メモリ180に格納された画像データについて、それぞれの画像データを天地認識に用いた場合の認識信頼度を求め、より信頼度が高いと判定された方の画像データを用いて天地認識を行うようにすることもできる。
【0034】
即ち、本実施の形態の画像認識装置では、前述の特開平9−9040号公報に開示されている方法を用いて天地認識を行うこととしているが、当該天地認識に用いるヒストグラムの取得にあたっては、原稿の傾き分を補正すれば、正確な天地認識を行うことが可能なヒストグラムを取得することができる場合が多いと考えられる。原稿中の文字行は、原稿と平行に記載されているのが通常であるからである。
【0035】
しかしながら、例えば原稿に記載されている文字行自体が、原稿に対して傾いているような場合には、原稿の傾き分を補正しても、却って正確な天地認識が妨げられる場合も有り得る。従って、本実施の形態の画像認識装置では、傾き補正前の画像データと、傾き補正後の画像データとについて、それぞれを天地認識に用いた場合の認識信頼度を求め、信頼度の高い方の画像データを用いて天地認識を行うようにすることもできるようにしている。信頼度の算出の方法については後述する。
【0036】
(3)制御部100の処理
本実施の形態の制御部100は、CCDセンサ38より読み取られた画像データについて、原稿の傾きの検出処理(以下、「傾き検出処理」という。)、傾きの補正処理(以下、「傾き補正処理」という。)、傾き補正処理が行われていない画像データ、及び傾き補正処理を行った画像データからのヒストグラム取得処理(ヒストグラム取得処理は、傾き補正処理を行った画像データのみについて実行するようにしてもよい。)、取得されたヒストグラムから、原稿方向の認識に用いる場合の認識の信頼度を取得する信頼度取得処理、取得された信頼度を比較する信頼度比較処理、比較の結果、より信頼度の高いヒストグラムに基づいて原稿の方向を認識する天地認識処理を行う。この天地認識処理自体は、上記従来技術と同様にヒストグラムのエッジカウントにより行う。
【0037】
傾き検出処理、傾き補正処理、ヒストグラム取得処理、信頼度取得処理、信頼度比較処理、天地認識処理は、第1低解像度認識用メモリ160、及び第2低解像度認識用メモリ180に格納された解像度変換処理後の画像データに基づいてCPU190で実行される。
【0038】
以下、CPU190の処理内容について詳細に説明するが、これらの処理を指示するプログラムはROM192に格納されており、また必要に応じてRAM191が作業用のメモリ領域として利用される。
【0039】
なお、ヒストグラム取得処理を、傾き補正後の画像データのみについて実行した場合には、信頼度取得処理、信頼度比較処理は不要となり、天地認識処理を、ヒストグラム取得処理にて得られた、傾き補正後の画像データについてのヒストグラムに基づいて行えばよい。以下、本実施の形態の制御部100の処理内容について説明する。
【0040】
図3は、信頼度取得処理等を行う場合の本実施の形態における制御部100の処理内容を示すフローチャートである。以下、同図に基づいて、制御部100の処理内容について詳細に説明する。
【0041】
(3−1)原稿の傾き検出処理
制御部100は、まずCCDセンサ38による原稿読み取り結果に基づいて原稿の傾き検出処理を行う(S301)。
ここで、原稿ガラスで読み取られる原稿が傾いている場合の傾き検出処理について詳細に説明する。この処理は、傾き検出部125によって行われる。図4に示すように、原稿400は、右上端を基準とする原稿ガラス31の上に原稿400の複写面を下向きに置かれている。原稿ガラス31の長手方向がスキャン読み取りの副走査方向であり、それに垂直な方向が主走査方向である。同図に示した例では、原稿400は、画像基準から離れて置かれ、その位置は副走査方向と平行ではない。この例では、原稿400は読み取り領域からはみ出ていない。
【0042】
また、本実施の形態の複写機では、原稿押さえ(ADFの搬送ベルト14)を橙色に着色してあり、露光ランプの光の原稿押さえによる反射光が、CCDセンサ38にとって、分光感度が小さい色となるようにしている。即ち、原稿押さえの橙色は、CCDセンサ38にとって黒色であるのと同じに考えることができる一方、原稿の地肌は、通常白色であるため、原稿と原稿押さえとを区別することが可能である。このことを利用して、原稿のエッジを検出し、原稿の傾き角度を検出することができる。
【0043】
図5と図6は、原稿400(破線で示す)が読み取り領域(実線で示す長方形)からはみ出ていない場合の読み取った画像のイメージを示す。
画像信号処理部110では、少なくとも原稿の範囲を含む長方形領域の画像データを処理して、原稿が存在する原稿領域の検出を行い、原稿の周囲(すなわちエッジ部)のすべての座標から、図に示すように長方形の原稿の四隅の座標を検出する。ここで、主走査方向がX軸であり、副走査方向がY軸であるとする。XmaxとXminとは、最大と最小のX座標であり、YmaxとYminとは、最大と最小のY座標である。
【0044】
残りの2つのX座標については、Y座標がYminである頂点のX座標をX1とし、Y座標がYmaxである頂点のX座標をX2とする。また、残りの2つのY座標のうちX座標がXminである頂点のY座標をY1とし、X座標がXmaxである頂点のY座標をY2とする。
従って、図5の例では、原稿の四隅のX座標とY座標は、(X1,Ymin)、(Xmax,Y2)、(Xmin,Y1)、(X2,Ymax)となる。原稿400の4辺の長さを、a、b、c、dとすると、各辺の長さは原稿の四隅の座標から下記の(数1)を用いて計算できる。
【0045】
【数1】
【0046】
また、図6の例では、原稿の傾きの方向は図5の場合と異なるが、原稿の四隅の座標は、(Xmin,Y1)、(X1,Ymin)、(X2,Ymax)、(Xmax,Y2)となる。従って、この場合にも、四辺の長さa、b、c、dは上記(数1)に示した式で計算できる。
【0047】
ここで、原稿が傾いていた場合の画像データを補正するための編集処理パラメータは、次のようになる。まず、X1−Xmin<Y1−Yminの場合(図5)、
回転座標: (X1,Ymin)
回転角θ: tan-1{(X1−Xmin)/(Y1−Ymin)}
【0048】
また、X1−Xmin>Y1−Yminの場合(図6)、
回転座標: (Xmin,Y1)
回転角θ: tan-1{(Y1−Ymin)/(X1−Xmin)}
【0049】
ここで、回転座標とは、図の左上端に近い隅の座標である。また、回転角θは、上記回転座標の位置を基準として画像データを回転し、読み取り領域に対して平行にするための回転角度である。ここで、検出された編集処理パラメータが傾き補正処理に用いられる。
【0050】
以上に説明した内容に基づいた、傾き検出処理における制御部100の処理内容について以下に説明する。
【0051】
図7は、傾き検出処理の詳細な処理内容を示すフローチャートである。同図に示されるように、傾き検出処理では、まず原稿領域においてエッジ部の座標を抽出し、抽出した複数の座標からなる線分を原稿領域の各辺とみなす(S701)。次に、Xmin点とXmax点の座標及びYmin点とYmax点の座標を抽出する(S702、S703)。
【0052】
X1−Xmin<Y1−Yminであれば(S704:Yes)、−tan-1((X1−Xmin)/(Y1−Ymin))を傾き角θ’とする(S705)。
傾き角θ’は、上記編集処理パラメータとして求められた回転角θに加えて回転方向を考慮するようにしたものである。
【0053】
また、X1−Xmin>Y1−Yminであれば(S706:Yes)、tan-1((Y1−Ymin)/(X1−Xmin))を傾き角θ’とする(S707)。
また、X1−Xmin=Y1−Ymin=0であれば(S708:Yes)、主走査方向及び副走査方向のいずれについても原稿が傾いていないと考えられる場合であるから、傾き角θ’を0とする(S709)。
【0054】
以上のいずれにも該当しない場合、即ち、X1−Xmin=Y1−Yminであって、両者の値が0でない場合には、傾き角θ’を45°と設定する(S710)。
【0055】
(3−2)任意角回転による傾き補正処理
傾き検出処理を終了すると、図3のフローチャートに戻って、制御部100は、検出された傾きに基づく傾き補正処理を行う。即ち、傾き角θ’が0°でない場合(S302:Yes)について、傾き補正処理を行う(S303)。
【0056】
前述の如く、傾き補正とは、原稿の傾きが検出された場合に、画像データを傾斜角だけ回転処理して、傾いていない画像を得ることをいう。従って、読み取られた原稿が傾いていたときでも、原稿が傾いていない場合と同様の画像データを得ることができる。
【0057】
傾き補正処理は、傾き検出部125において取得された編集パラメータに基づいて、傾き補正部170において行われるが、この傾き補正処理は、第1低解像度認識用メモリ160に格納されている低解像度画像データに対する、傾き角θ’分の任意角回転処理であり、その処理方法は、既に公知の技術である。従って、ここでの詳細な説明は省略するが、極めて簡略に説明すると、下記の(数2)に示す式を用いることにより、座標(X,Y)が角度θだけ回転されて座標(U,V)となることを利用する。
【0058】
【数2】
【0059】
(3−3)認識信頼度に関する制御部100の処理
制御部100は、CCDセンサ38により読み取られた原稿の画像データに基づいて、上述のごとく原稿の傾きを検出し、傾き補正処理を行った場合、及び傾き補正処理を行わない場合について、それぞれ信頼度を取得する(図3、S304)。ここで、傾き補正を行った画像データのみを天地認識に利用する場合は信頼度に関する処理が不要となることは前述の通りであるが、信頼度を取得した場合には、より信頼度の高い方の画像データを用いて、以後の天地認識処理を行うようにする(図3、S305以下)。
【0060】
天地認識処理の結果として、適切な方向で文書画像データが出力されるように、回転処理部130に対して回転角情報が出力される。
【0061】
ここで、信頼度取得処理について、二つの方法を挙げて説明する。まず、第1の方法として、ヒストグラムから算出されるMTF値を用いる信頼度の取得方法について説明する。
ここで、「MTF値」とは、ヒストグラムを取得した場合に、そのヒストグラムの数ライン毎の高さの最大値(以下、「max値」という。)、及び最小値(以下、「min値」という。)を取得した場合に、以下の式(数3)により算出される値をいう(以下、MTF値を取得するために分割された数ラインにより形成される領域を「ライン領域」と称する)。
【0062】
【数3】
【0063】
図8は、MTF値の算出について説明するための図である。同図(a)は、原稿400に記載された文字行が原稿の向きに平行である場合の例を示す。同図において、410は取得された主走査方向のヒストグラムを表し、Rはライン領域を示す。
【0064】
同図(a)に示されるように、文字行が原稿の向きに平行である場合には、主走査方向のヒストグラムに、行を表すピークが検出される。一方、文字が存在しない部分では、ヒストグラムのピークは検出されないため、ライン領域毎に見ると、いずれのライン領域でも、min値は0となる。即ち、上記(数3)より、いずれのライン領域でもMTF値は1となる。上記(数3)からわかるように、1はMTF値の最大値である。従って、ライン領域毎のMTF値の、原稿内の平均値を取ると、文字行に傾きがない場合、即ち、天地認識を行うのに適当なヒストグラムが得られる状態においては、MTF値の平均値は高くなるといえる。
【0065】
一方、図8(b)に示されるように、文字行が傾いている場合には、主走査方向のヒストグラムのピークの幅が広がる場合があるため、ライン領域におけるmax値とmin値の差が小さい場合、即ち、MTF値が小さい場合が発生する。従って、原稿内のMTF値の平均値を取得すると、文字行が傾いている場合、即ち、天地認識を行うのに適当なヒストグラムが得られない状態においては、MTF値の平均値が低くなる場合が多いと考えられる。以上の内容から、原稿内のMTF値の平均値の高い方が、認識信頼度は高いと判断できる。
【0066】
次に、第2の方法として、ヒストグラムのエッジカウントを利用した認識信頼度の取得方法について説明する。
ヒストグラムのエッジカウントを使用した方法とは、ヒストグラムを取得した場合に、そのヒストグラム値が増える方向の変化点(以下、「立ち上がりエッジ」という。)と、減る方向の変化点(以下、「立ち下がりエッジ」という。)の数をそれぞれカウントすると、通常の原稿では立ち下がりエッジの数の方が多くなることを利用したものである。これは、従来技術として説明した、特開平9−9040号公報に記載された天地認識でも用いている方法である。
【0067】
図9は、エッジカウントを利用した認識信頼度の取得方法について説明するための図である。同図の例において、400は原稿、420は取得された副走査方向のヒストグラムを表す。また、同図(a)は、文字行に傾きがない場合の例、同図(b)は、文字行が原稿方向と平行であるが、センタリングされている場合の例、同図(c)は、文字行が傾いている場合の例を示すものである。
【0068】
同図(a)のように、文字行が傾いていない場合、即ち、天地認識を行うために適切なヒストグラムを取得することができる場合においては、立ち上がりエッジの数と、立ち下がりエッジの数との差が大きくなる。文章の先頭位置がある程度一定しているため、立ち上がりエッジが2となるのに対し、文章の終わりの位置は分散していることから、立ち下がりエッジが4となるからである。
【0069】
しかし、同図(b)に示されるように文字行がセンタリングされている場合や、同図(c)に示されるように文字行が傾きを持った場合には、立ち上がりエッジの数と、立ち下がりエッジの数との差があまり顕著に現れない。
エッジカウントを利用した信頼度認識とは、以上に説明したような内容に基づき、立ち上がりエッジの数と立ち下がりエッジの数との差が大きいほど、認識信頼度が高いと判定するものである。
【0070】
以上に説明したような方法のいずれか、または両方を用いて認識信頼度を取得すると、取得された信頼度を比較し(S305)、信頼度が大きいと判定された方の低解像度画像データを用いて、以下の天地認識処理を行う。即ち、補正後の画像データの信頼度の方が大きい場合には(S305:Yes)、補正後の情報を用いて天地認識処理を行い(S306)、それ以外の場合には(S305:No)、補正前の情報を用いて天地認識処理を行う(S307)。なお、ステップS302において、傾き角θ’が0であった場合には、傾き補正や、信頼度に関する処理を行う必要がないため、そのままの情報を用いて、天地認識処理を行う(S308)。
【0071】
以上のような処理を行うことにより、原稿ガラス上にセットされた原稿が傾いている場合や、原稿に記載された文字行自体が傾いているような場合においても、より正確な天地認識を行うことができる。
【0072】
なお、本実施の形態では、主として認識信頼度の取得を行う場合の例について、詳細に説明を行ったが、上述の如く、認識信頼度を考慮せず、原稿の傾き補正処理を行った画像データを用いて天地認識処理を行っても、原稿ガラス上にセットされた原稿が傾いている場合に、より正確な天地認識を行うことが可能となる。その場合には、具体的には、図3のフローチャートにおいて、ステップS303からステップS306に進むようにすればよい。
【0073】
また、本実施の形態では、モノクロ複写機に適用される画像認識装置の場合について説明したが、フルカラー複写機にも適用することは可能である。ただし、この場合には、原稿から生成した画像データから、有彩色のカラーデータを予めキャンセルする回路を組み込んでおき、モノクロのみの画像データのみから天地認識を行う方が望ましい。文字部分のほとんどはモノクロだからである。
【0074】
さらに、上記認識信頼度の取得に際して、第1の方法及び第2の方法を併用する場合であれば、それぞれの方法により取得された認識信頼度を同等に取り扱うだけでなく、一定の重み付けをして最終的な認識信頼度を算出するようにすることもできる。
【0075】
また、本実施の形態では、認識信頼度に関して、横書きの原稿を用いた場合について説明したが、認識信頼度の取得に関する第1の方法及び第2の方法のいずれを用いる場合でも、主走査方向及び副走査方向の両方のヒストグラムを取得することにより、原稿が横書きである場合でも、縦書きである場合でも適用することが可能である。具体的には、例えば、主走査方向及び副走査方向のヒストグラムから、認識信頼度を表す値をそれぞれ取得し、信頼度の大きい方を採用するようにすればよい。
【0076】
また、本実施の形態では、原稿方向の判別に際して、画像データのヒストグラムのエッジカウントを求める方法を用いたが、ヒストグラムを利用する他の方法を用いることも可能である。例えば、ヒストグラムを利用して画像データから文字を切り出し、パターンマッチングする方法により、原稿方向の判別を行うようにしてもよい。
【0077】
【発明の効果】
以上に説明したように、本発明の第1の画像認識装置によれば、原稿傾き検出手段により検出された原稿の傾きに基づいて、画像データを補正する傾き補正手段と、画像読み取り手段により生成された傾き補正前の画像データ、及び前記傾き補正手段により補正された画像データのうち、何れの画像データに基づいて原稿の方向を認識するかを判断する判断手段と、前記判断手段により判断された画像データに基づいて、原稿の方向を認識する原稿方向認識手段とを備えることにより、原稿ガラス上にセットされた原稿が傾いている場合や、原稿に記載された文字行自体が傾いているような場合においても、的確に天地認識を行うことができるという効果がある。
【0078】
また、本発明の第2の画像認識装置によれば、原稿傾き検出手段により検出された原稿の傾きに基づいて、画像データを補正する傾き補正手段と、画像読み取り手段により生成された傾き補正前の画像データ、及び傾き補正手段により補正された画像データのそれぞれに基づいて、原稿の方向の認識を行う場合の、認識の信頼度に関する情報を取得する信頼度取得手段と、傾き補正前の画像データに基づいて取得された信頼度に関する情報と、傾きが補正された画像データに基づいて取得された信頼度に関する情報とを比較する比較手段と、前記比較手段による比較の結果、信頼度が高い方の画像データに基づいて、原稿の方向を認識する原稿方向認識手段とを備えることにより、原稿に記載された文字行自体が傾いているような場合でも、より正確な天地認識を行うことができるという効果を奏する。
【図面の簡単な説明】
【図1】本発明に係る画像認識装置が適用される複写機の全体の構成を示す図である。
【図2】本発明に係る画像認識装置が適用される複写機の制御部の構成を示すブロック図である。
【図3】本実施の形態の画像認識装置における制御部の処理内容を示すフローチャートである。
【図4】本発明に係る画像認識装置における原稿の傾き検出の方法について説明するための図である。
【図5】本発明に係る画像認識装置における原稿の傾き検出の方法について説明するための図である。
【図6】本発明に係る画像認識装置における原稿の傾き検出の方法について説明するための図である。
【図7】傾き検出処理の詳細な内容を示すフローチャートである。
【図8】MTF値の算出について説明するための図である。
【図9】ヒストグラムのエッジカウントを利用した認識信頼度の取得方法について説明するための図である。
【図10】従来の天地認識処理について説明するための図である。
【図11】従来の天地認識処理の問題点について説明するための図である。
【符号の説明】
38 CCDセンサ
100 制御部
110 画像信号処理部
120 高解像度画像メモリ
125 傾き検出部
130 回転処理部
140 LD駆動部
150 解像度変換部
160 第1低解像度認識用メモリ
170 傾き補正部
180 第2低解像度用認識メモリ
190 CPU
191 RAM
192 ROM[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an image recognition apparatus that recognizes a document image read from an image input apparatus in a digital copying machine, a facsimile, or the like.
[0002]
[Prior art]
2. Description of the Related Art Conventionally, for example, in a digital copying machine equipped with an automatic document feeder (hereinafter referred to as “ADF”), when a plurality of originals are continuously read and copied, the direction of the read original is set. Since the copy is discharged accordingly, it is necessary to check whether or not each document is uniformly oriented in the same direction when the document is set on the ADF. However, such a confirmation operation is quite time-consuming, and the larger the number of documents, the greater the possibility of overlooking the document in the opposite direction.
[0003]
In order to avoid such inconvenience, the original is read, and the direction of the original is first determined from the generated image data (the determination of the direction of the original is hereinafter referred to as “top / bottom recognition”). For example, a method of rotating and outputting image data so as to be in an appropriate direction is considered. Various methods for recognizing the top and bottom have been devised. For example, Japanese Patent Application Laid-Open No. 9-9040 obtains histograms in the main scanning direction and the sub-scanning direction for a portion of a manuscript recognized as a document image. Thus, a technique for performing top-and-bottom recognition is disclosed.
[0004]
FIG. 10 is a diagram for explaining the conventional method of upside down recognition. As shown in the figure, using the histogram acquired for the main scanning method and sub-scanning direction from the document image data input to the image input device, the direction of the character line and the character position at the beginning of the line are recognized. By doing so, the top and bottom can be recognized.
[0005]
More specifically, the number of rising edges and the number of falling edges of the acquired histogram, the sum and difference thereof are calculated for the histogram in the main scanning direction and the histogram in the sub scanning direction, respectively. In the case of a horizontally written document image as shown in FIG. 10, the number of rising edges and the number of falling edges in the histogram (a) in the main scanning direction are substantially equal, and the sum of the two is the histogram in the sub-scanning direction. More than (b). This is because, in the histogram (a) in the main scanning direction, peaks representing rows and portions having no peaks corresponding to the rows are detected alternately.
[0006]
Further, from the histogram (b) in the sub-scanning direction in the example of FIG. 10, the character position at the beginning of the line can be recognized. That is, since the character position at the beginning of the line is relatively constant, the rising edge of the histogram is concentrated in several places, whereas the character position at the end of the line varies depending on the sentence, and thus the end of the line Since the falling edges of the histogram depending on the character positions are relatively dispersed, the upper and lower sides of the document can be recognized if the difference between the number of rising edges and the number of falling edges is large.
[0007]
Through the recognition as described above, the direction of the character line and the character position at the beginning of the line can be detected, and the top-and-bottom recognition can be performed based on the detection result. These recognitions can also be applied to a vertically written document.
[0008]
[Problems to be solved by the invention]
However, the above conventional technique has a problem that, for example, when the document is tilted when being set via the ADF, accurate top-and-bottom recognition may not be performed.
[0009]
That is, when the document is tilted, it is not possible to acquire a histogram that can accurately recognize the line spacing or the leading character position as shown in FIG. This is because accurate recognition cannot be performed even if the top-and-bottom recognition is performed. Such a problem may also occur when the character line itself described in the document is tilted.
[0010]
In view of the above problems, an object of the present invention is to provide an image recognition apparatus capable of performing top-and-bottom recognition even when a document is inclined.
[0011]
A second object of the present invention is to provide an image recognition apparatus capable of performing more accurate top-and-bottom recognition even when the character line itself described in the document is tilted.
[0012]
[Means for Solving the Problems]
In order to solve the above problems, the first image recognition apparatus of the present invention reads a document. First Image reading means for generating image data; ,Previous Based on the document inclination detection means for detecting the inclination of the document, and the document inclination detected by the document inclination detection means, The inclination of the first image data generated by the image reading means is corrected, and the second Image data Generation Tilt correction means for First image data generated by the image reading means; and By the inclination correction means Generation Was Second image data Of which image data is used to determine the direction of the document to be recognized, and any one of the first image data and the second image data determined by the determination unit. data And a document direction recognition means for recognizing the direction of the document.
[0013]
The second image recognition apparatus of the present invention includes an image reading unit that reads an original and generates image data. ,Previous Based on the document inclination detection means for detecting the inclination of the document, and the document inclination detected by the document inclination detection means, The inclination of the first image data generated by the image reading means is corrected, and the second Image data Generation An inclination correction unit, first image data generated by the image reading unit, and the inclination correction unit. Generation Second image data obtained Each of A reliability acquisition means for acquiring information related to the reliability of recognition when the orientation of the document is recognized based on By the reliability acquisition means First image data On the basis of the Information about the obtained confidence, By the reliability acquisition means Second image data On the basis of the Comparing means for comparing information about the obtained reliability, and document direction recognizing means for recognizing the direction of the document based on image data with higher reliability as a result of comparison by the comparing means. Features.
[0014]
DETAILED DESCRIPTION OF THE INVENTION
A digital copying machine (hereinafter simply referred to as “copying machine”) as an application example of an image recognition apparatus according to the present invention will be described below with reference to the accompanying drawings.
[0015]
(1) Configuration of the entire copying machine
First, an overall configuration of a copying machine to which an image recognition apparatus according to the present invention is applied will be described with reference to FIG.
As shown in the figure, the copier includes an
[0016]
The
The document transported to the document reading position is scanned by the
[0017]
The
[0018]
The
[0019]
The image data is A / D converted into a digital signal by an image signal processing unit 110 (see FIG. 2) in the
[0020]
The
[0021]
The
[0022]
The developing
[0023]
On the other hand, the
[0024]
Thereafter, the recording sheet is peeled off from the surface of the
The toner image transferred to the recording sheet is fixed by being pressed by the fixing
[0025]
An operation panel 90 is provided at an easy-to-operate position on the front side of the
[0026]
(2) Configuration of
Next, in the present embodiment, the configuration of the
As shown in the figure, the
[0027]
The image
[0028]
It is assumed that density data that has undergone reflectance density conversion is output from the
[0029]
The
The
[0030]
The
[0031]
The resolution
[0032]
The
[0033]
The low resolution image data that has been subjected to the tilt correction processing in the
In the image recognition apparatus of the present embodiment, the top-and-bottom recognition can be performed based on the low-resolution image data subjected to the tilt correction process stored in the second low-
[0034]
That is, in the image recognition apparatus of the present embodiment, the top and bottom recognition is performed using the method disclosed in the above-mentioned Japanese Patent Application Laid-Open No. 9-9040, but in acquiring the histogram used for the top and bottom recognition, It is considered that it is often possible to obtain a histogram capable of performing accurate top-and-bottom recognition by correcting the inclination of the document. This is because character lines in a document are usually written in parallel with the document.
[0035]
However, for example, when the character line itself described in the original is inclined with respect to the original, even if the inclination of the original is corrected, accurate vertical recognition may be hindered. Therefore, in the image recognition apparatus according to the present embodiment, for each of the image data before tilt correction and the image data after tilt correction, the recognition reliability is obtained when each is used for top-and-bottom recognition. It is also possible to perform top-and-bottom recognition using image data. A method of calculating the reliability will be described later.
[0036]
(3) Processing of
The
[0037]
Inclination detection processing, inclination correction processing, histogram acquisition processing, reliability acquisition processing, reliability comparison processing, and top / bottom recognition processing are resolutions stored in the first low
[0038]
Hereinafter, the processing contents of the
[0039]
When the histogram acquisition process is executed only for the image data after the inclination correction, the reliability acquisition process and the reliability comparison process are not required, and the top and bottom recognition process is the inclination correction obtained by the histogram acquisition process. What is necessary is just to perform based on the histogram about later image data. Hereinafter, the processing content of the
[0040]
FIG. 3 is a flowchart showing the processing contents of the
[0041]
(3-1) Document skew detection processing
The
Here, the tilt detection process when the document read by the document glass is tilted will be described in detail. This process is performed by the
[0042]
In the copying machine of the present embodiment, the document presser (ADF transport belt 14) is colored orange, and the reflected light of the exposure lamp light from the document presser has a color with low spectral sensitivity for the
[0043]
5 and 6 show images of the read image when the document 400 (shown by a broken line) does not protrude from the reading area (a rectangle shown by a solid line).
The image
[0044]
For the remaining two X coordinates, the X coordinate of the vertex whose Y coordinate is Ymin is X1, and the X coordinate of the vertex whose Y coordinate is Ymax is X2. Of the remaining two Y coordinates, the Y coordinate of the vertex whose X coordinate is Xmin is Y1, and the Y coordinate of the vertex whose X coordinate is Xmax is Y2.
Therefore, in the example of FIG. 5, the X and Y coordinates of the four corners of the document are (X1, Ymin), (Xmax, Y2), (Xmin, Y1), (X2, Ymax). If the lengths of the four sides of the
[0045]
[Expression 1]
[0046]
In the example of FIG. 6, the direction of the inclination of the document is different from that in FIG. 5, but the coordinates of the four corners of the document are (Xmin, Y1), (X1, Ymin), (X2, Ymax), (Xmax, Y2). Accordingly, also in this case, the lengths a, b, c, and d of the four sides can be calculated by the equation shown in the above (Equation 1).
[0047]
Here, the editing process parameters for correcting the image data when the document is tilted are as follows. First, when X1−Xmin <Y1−Ymin (FIG. 5),
Rotation coordinates: (X1, Ymin)
Rotation angle θ: tan -1 {(X1-Xmin) / (Y1-Ymin)}
[0048]
Further, when X1-Xmin> Y1-Ymin (FIG. 6),
Rotation coordinates: (Xmin, Y1)
Rotation angle θ: tan -1 {(Y1-Ymin) / (X1-Xmin)}
[0049]
Here, the rotation coordinates are the coordinates of the corner close to the upper left corner of the figure. The rotation angle θ is a rotation angle for rotating the image data on the basis of the position of the rotation coordinate and making it parallel to the reading area. Here, the detected editing process parameter is used for the inclination correction process.
[0050]
The processing content of the
[0051]
FIG. 7 is a flowchart showing the detailed processing contents of the tilt detection processing. As shown in the figure, in the tilt detection process, first, the coordinates of the edge portion are extracted from the document area, and the line segment composed of the extracted plurality of coordinates is regarded as each side of the document area (S701). Next, the coordinates of the Xmin point and the Xmax point and the coordinates of the Ymin point and the Ymax point are extracted (S702, S703).
[0052]
If X1-Xmin <Y1-Ymin (S704: Yes), -tan -1 ((X1−Xmin) / (Y1−Ymin)) is set as an inclination angle θ ′ (S705).
The inclination angle θ ′ is obtained by considering the rotation direction in addition to the rotation angle θ obtained as the editing processing parameter.
[0053]
If X1-Xmin> Y1-Ymin (S706: Yes), tan -1 Let ((Y1-Ymin) / (X1-Xmin)) be the inclination angle θ '(S707).
If X1-Xmin = Y1-Ymin = 0 (S708: Yes), it is considered that the document is not inclined in both the main scanning direction and the sub-scanning direction. (S709).
[0054]
If none of the above applies, that is, if X1−Xmin = Y1−Ymin and both values are not 0, the inclination angle θ ′ is set to 45 ° (S710).
[0055]
(3-2) Inclination correction processing by arbitrary angle rotation
When the tilt detection process ends, the
[0056]
As described above, the tilt correction refers to obtaining an image that is not tilted by rotating the image data by the tilt angle when the tilt of the document is detected. Therefore, even when the read document is tilted, the same image data as when the document is not tilted can be obtained.
[0057]
The tilt correction process is performed in the
[0058]
[Expression 2]
[0059]
(3-3) Processing of
The
[0060]
As a result of the top / bottom recognition processing, rotation angle information is output to the
[0061]
Here, the reliability acquisition process will be described with two methods. First, as a first method, a reliability acquisition method using an MTF value calculated from a histogram will be described.
Here, the “MTF value” refers to the maximum value (hereinafter referred to as “max value”) and the minimum value (hereinafter referred to as “min value”) of several lines of the histogram when the histogram is acquired. (Referred to below as an area formed by several lines divided to acquire the MTF value). ).
[0062]
[Equation 3]
[0063]
FIG. 8 is a diagram for explaining the calculation of the MTF value. FIG. 4A shows an example in which the character line written on the original 400 is parallel to the direction of the original. In the figure, 410 represents the acquired histogram in the main scanning direction, and R represents a line area.
[0064]
As shown in FIG. 5A, when the character line is parallel to the document direction, a peak representing the line is detected in the histogram in the main scanning direction. On the other hand, since the peak of the histogram is not detected in a portion where no character exists, the min value is 0 in any line region when viewed for each line region. That is, from the above (Equation 3), the MTF value is 1 in any line region. As can be seen from the above (Equation 3), 1 is the maximum value of the MTF value. Accordingly, when the average value of the MTF values for each line area in the original is taken, the average value of the MTF values is obtained when there is no inclination in the character line, that is, in a state where a histogram suitable for the top / bottom recognition is obtained. Can be said to be expensive.
[0065]
On the other hand, as shown in FIG. 8B, when the character line is inclined, the peak width of the histogram in the main scanning direction may be widened, so that the difference between the max value and the min value in the line region is A small case occurs, that is, a case where the MTF value is small. Therefore, when the average value of the MTF values in the document is acquired, the average value of the MTF values is low when the character line is tilted, that is, when a suitable histogram for performing top-and-bottom recognition cannot be obtained. It is thought that there are many. From the above contents, it can be determined that the higher the average value of the MTF values in the document, the higher the recognition reliability.
[0066]
Next, as a second method, a method for acquiring the recognition reliability using the edge count of the histogram will be described.
When the histogram is acquired, the method using the histogram edge count is a change point in the direction in which the histogram value increases (hereinafter referred to as “rising edge”) and a change point in the direction in which the histogram value decreases (hereinafter referred to as “falling edge”). When the number of “edges” is counted, the fact that the number of falling edges is larger in a normal document is used. This is a method used in the top-and-bottom recognition described in Japanese Patent Application Laid-Open No. 9-9040 described as the prior art.
[0067]
FIG. 9 is a diagram for explaining a recognition reliability acquisition method using an edge count. In the example of FIG. 4,
[0068]
As shown in FIG. 6A, when the character line is not tilted, that is, when an appropriate histogram can be obtained for the top-and-bottom recognition, the number of rising edges, the number of falling edges, The difference becomes larger. This is because the leading edge of the sentence is fixed to some extent, so that the rising edge is 2, whereas the end position of the sentence is dispersed, so the falling edge is 4.
[0069]
However, when the character line is centered as shown in FIG. 7B or when the character line has a slope as shown in FIG. The difference from the number of falling edges does not appear so noticeably.
The reliability recognition using the edge count is based on the contents as described above and determines that the recognition reliability is higher as the difference between the number of rising edges and the number of falling edges is larger.
[0070]
When the recognition reliability is acquired using one or both of the methods described above, the acquired reliability is compared (S305), and the low-resolution image data that has been determined to have a high reliability is obtained. The following top-and-bottom recognition processing is performed. That is, when the reliability of the corrected image data is higher (S305: Yes), the top / bottom recognition process is performed using the corrected information (S306), and otherwise (S305: No). Then, the top and bottom recognition processing is performed using the information before correction (S307). In step S302, if the tilt angle θ ′ is 0, it is not necessary to perform tilt correction or reliability-related processing, so the top and bottom recognition processing is performed using the information as it is (S308).
[0071]
By performing the processing as described above, even when the document set on the document glass is tilted or when the character line itself described in the document is tilted, more accurate top-and-bottom recognition is performed. be able to.
[0072]
In the present embodiment, an example in which recognition reliability is mainly acquired has been described in detail. However, as described above, an image obtained by performing document skew correction processing without considering recognition reliability. Even if the top / bottom recognition processing is performed using the data, it is possible to perform the top / bottom recognition more accurately when the document set on the document glass is tilted. In that case, specifically, in the flowchart of FIG. 3, the process may proceed from step S303 to step S306.
[0073]
In this embodiment, the case of an image recognition apparatus applied to a monochrome copying machine has been described. However, the present invention can also be applied to a full-color copying machine. However, in this case, it is desirable to incorporate a circuit for canceling chromatic color data in advance from image data generated from a document, and to perform top-and-bottom recognition only from monochrome image data. This is because most of the text is monochrome.
[0074]
Further, when the first method and the second method are used together in acquiring the recognition reliability, not only the recognition reliability acquired by each method is handled equally, but also a constant weight is applied. It is also possible to calculate the final recognition reliability.
[0075]
In this embodiment, the case where a horizontally written document is used for the recognition reliability has been described. However, in the case of using either the first method or the second method related to acquisition of the recognition reliability, the main scanning direction is used. By acquiring both histograms in the sub-scanning direction and the original, it is possible to apply the document regardless of whether the document is written horizontally or vertically. Specifically, for example, values representing the recognition reliability may be acquired from the histograms in the main scanning direction and the sub-scanning direction, and the higher reliability may be adopted.
[0076]
In the present embodiment, the method of obtaining the edge count of the histogram of the image data is used for determining the document direction, but other methods using the histogram can be used. For example, the document orientation may be determined by a method of cutting out characters from image data using a histogram and performing pattern matching.
[0077]
【The invention's effect】
As described above, according to the first image recognition apparatus of the present invention, the inclination correction unit that corrects the image data based on the inclination of the document detected by the document inclination detection unit, Image data before tilt correction generated by the image reading means, and Image data corrected by the inclination correcting means Determination means for determining which image data to recognize the direction of the document, and image data determined by the determination means Based on the document direction recognition means for recognizing the direction of the document, Placed on the original glass When the document is tilted Or the text line in the manuscript is tilted Also, there is an effect that the top and bottom can be accurately recognized.
[0078]
Further, according to the second image recognition apparatus of the present invention, the inclination correction means for correcting the image data based on the inclination of the original detected by the original inclination detection means, and the inclination correction generated by the image reading means. Image data and image data corrected by the inclination correction means Each of , A reliability acquisition means for acquiring information related to the reliability of recognition when the orientation of the document is recognized, and image data before tilt correction On the basis of the Information about the obtained reliability and image data with corrected tilt On the basis of the Comparing means for comparing the acquired information relating to reliability, and original direction recognition means for recognizing the direction of the original based on image data with higher reliability as a result of comparison by the comparing means Even when the character line itself described in the manuscript is tilted, there is an effect that more accurate vertical recognition can be performed.
[Brief description of the drawings]
FIG. 1 is a diagram showing an overall configuration of a copying machine to which an image recognition apparatus according to the present invention is applied.
FIG. 2 is a block diagram illustrating a configuration of a control unit of a copier to which an image recognition apparatus according to the present invention is applied.
FIG. 3 is a flowchart showing processing contents of a control unit in the image recognition apparatus of the present embodiment.
FIG. 4 is a diagram for explaining a method of detecting the inclination of an original in the image recognition apparatus according to the present invention.
FIG. 5 is a diagram for explaining a method of detecting an inclination of an original in the image recognition apparatus according to the present invention.
FIG. 6 is a diagram for explaining a method of detecting the inclination of a document in the image recognition apparatus according to the present invention.
FIG. 7 is a flowchart showing detailed contents of tilt detection processing;
FIG. 8 is a diagram for explaining calculation of an MTF value.
FIG. 9 is a diagram for explaining a recognition reliability acquisition method using an edge count of a histogram.
FIG. 10 is a diagram for explaining conventional top-and-bottom recognition processing.
FIG. 11 is a diagram for explaining a problem of conventional upside-down recognition processing.
[Explanation of symbols]
38 CCD sensor
100 Control unit
110 Image signal processor
120 high resolution image memory
125 Tilt detector
130 Rotation processing part
140 LD driver
150 Resolution converter
160 First low-resolution recognition memory
170 Tilt correction unit
180 Second Low Resolution Recognition Memory
190 CPU
191 RAM
192 ROM
Claims (5)
前記原稿の傾きを検出する原稿傾き検出手段と、
前記原稿傾き検出手段により検出された原稿の傾きに基づいて、前記画像読み取り手段により生成された第1の画像データの傾きを補正して、第2の画像データを生成する傾き補正手段と、
前記画像読み取り手段により生成された第1の画像データ、及び、前記傾き補正手段により生成された第2の画像データのうち、何れの画像データに基づいて原稿の方向を認識するかを判断する判断手段と、
前記判断手段により判断された第1の画像データ、及び第2の画像データのうちの何れかの画像データに基づいて、原稿の方向を認識する原稿方向認識手段と
を備えることを特徴とする画像認識装置。Image reading means for reading a document and generating first image data;
And the document skew detection means for detecting the inclination of the previous Symbol manuscript,
An inclination correcting means for correcting the inclination of the first image data generated by the image reading means based on the inclination of the original detected by the original inclination detecting means and generating second image data;
Judgment for determining which of the first image data generated by the image reading unit and the second image data generated by the tilt correction unit is to recognize the direction of the document. Means,
And an original direction recognizing means for recognizing the direction of the original based on any one of the first image data and the second image data determined by the determining means. Recognition device.
前記画像読み取り手段により生成された第1の画像データ、及び前記傾き補正手段により生成された第2の画像データのそれぞれに基づいて、原稿の方向の認識を行う場合の、認識の信頼度に関する情報を取得する信頼度取得手段と、
前記信頼度取得手段により第1の画像データに基づいて取得された信頼度に関する情報と、前記信頼度取得手段により第2の画像データに基づいて取得された信頼度に関する情報とを比較する比較手段とを含み、
前記原稿方向認識手段は、
前記比較手段による比較の結果、信頼度が高い方の画像データに基づいて、原稿の方向を認識すること
を特徴とする請求項1に記載の画像認識装置。 The determination means includes
Information on the reliability of recognition when the orientation of the document is recognized based on each of the first image data generated by the image reading unit and the second image data generated by the inclination correction unit. A reliability acquisition means for acquiring
Comparing means for comparing the information about the reliability that is obtained based on the first image data by the reliability obtaining means, and information about the confidence level obtained based on the second image data by the reliability obtaining means Including
The document direction recognition means includes:
The comparison result of the comparison by means, on the basis of image data having a higher reliability, the image recognition apparatus according to claim 1, wherein the recognizing the direction of the document.
画像データについてのヒストグラムから算出されるMTF値に基づいて信頼度に関する情報を取得すること
を特徴とする請求項2に記載の画像認識装置。The reliability acquisition means includes
The image recognition apparatus according to claim 2 , wherein information on reliability is acquired based on an MTF value calculated from a histogram of image data.
画像データについてのヒストグラムの立ち上がりエッジ数と立ち下がりエッジ数とに基づいて、信頼度に関する情報を取得すること
を特徴とする請求項2に記載の画像認識装置。The reliability acquisition means includes
The image recognition apparatus according to claim 2 , wherein information on reliability is acquired based on the number of rising edges and the number of falling edges of a histogram for image data.
原稿傾き検出手段により検出された原稿の傾きがなかった場合には、処理を行わず、
前記原稿方向認識手段は、
原稿傾き検出手段により検出された原稿の傾きがなかった場合には、前記画像読み取り手段により生成された第1の画像データに基づいて、原稿の方向を認識すること
を特徴とする請求項1から4までの何れか1項に記載の画像認識装置。 The inclination correction means and the determination means are:
If there is no document inclination detected by the document inclination detection means, no processing is performed.
The document direction recognition means includes:
If there is no tilt of the detected document by document skew detection means, on the basis of the first image data generated by the image reading means, from claim 1, characterized in that to recognize the direction of the document 5. The image recognition device according to any one of 4 to 4 .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP20491298A JP3671682B2 (en) | 1998-07-21 | 1998-07-21 | Image recognition device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP20491298A JP3671682B2 (en) | 1998-07-21 | 1998-07-21 | Image recognition device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000036908A JP2000036908A (en) | 2000-02-02 |
JP3671682B2 true JP3671682B2 (en) | 2005-07-13 |
Family
ID=16498447
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP20491298A Expired - Fee Related JP3671682B2 (en) | 1998-07-21 | 1998-07-21 | Image recognition device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3671682B2 (en) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7119926B2 (en) | 2000-12-12 | 2006-10-10 | Canon Kabushiki Kaisha | Dust and dirt detection in image reading apparatus having original flow scanning function |
JP2005311766A (en) | 2004-04-22 | 2005-11-04 | Fuji Xerox Co Ltd | Image reading apparatus |
JP4847378B2 (en) * | 2007-03-19 | 2011-12-28 | 株式会社リコー | Image processing apparatus, image processing method, program, and computer-readable recording medium |
JP4502001B2 (en) | 2007-12-20 | 2010-07-14 | コニカミノルタビジネステクノロジーズ株式会社 | Image processing apparatus and image processing method |
JP2009181594A (en) * | 2009-05-18 | 2009-08-13 | Fuji Xerox Co Ltd | Image reader |
JP6450604B2 (en) * | 2015-01-28 | 2019-01-09 | オリンパス株式会社 | Image acquisition apparatus and image acquisition method |
CN107925709B (en) * | 2015-09-29 | 2019-12-20 | 京瓷办公信息系统株式会社 | Image reading apparatus and image forming apparatus |
JP5950317B1 (en) * | 2016-02-25 | 2016-07-13 | 有限会社Ics Sakabe | Code recognition system, code recognition method, code recognition program, and package sorting system |
-
1998
- 1998-07-21 JP JP20491298A patent/JP3671682B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000036908A (en) | 2000-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8009931B2 (en) | Real-time processing of grayscale image data | |
JP7131415B2 (en) | TILT DETECTION DEVICE, READING DEVICE, IMAGE PROCESSING DEVICE, AND TILT DETECTION METHOD | |
JP4570670B2 (en) | Image processing apparatus, image reading apparatus, image forming apparatus, image processing method, image processing program, and recording medium | |
JP7211238B2 (en) | Edge detection device, tilt correction device, reading device, image processing device, and edge detection method | |
JP5114114B2 (en) | Image forming apparatus | |
US10194051B2 (en) | Device for detecting amount of skew in document and image processing apparatus | |
JP3695163B2 (en) | Image forming apparatus | |
US20070133069A1 (en) | Device for measuring sheet length and image forming apparatus | |
JP5645689B2 (en) | Image processing apparatus and image forming apparatus having the same | |
JP3671682B2 (en) | Image recognition device | |
US7555172B2 (en) | Dynamic range detection and adjustment | |
JPH06103410A (en) | Picture processor | |
JP3396006B2 (en) | Digital copier | |
JP3629962B2 (en) | Image recognition device | |
JP2018133693A (en) | Document feeder and image forming apparatus | |
JP3629969B2 (en) | Image recognition device | |
JP2010011359A (en) | Image processing apparatus, image forming apparatus, method of controlling the image processing apparatus, control program, and recording medium | |
JP3629959B2 (en) | Image recognition device | |
JP3081083B2 (en) | Image processing device | |
JP2021100220A (en) | Image processing device and image processing method | |
US11496633B2 (en) | Image processing apparatus and server apparatus with interactive refinement of streak detection, control method therefor, and storage medium | |
JP3675181B2 (en) | Image recognition device | |
JP3078421B2 (en) | Digital image forming apparatus and laser scanning light correction method for digital image forming apparatus | |
CN115379060A (en) | Image reading apparatus and image processing method | |
JP2021129168A (en) | Image forming apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041207 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20050128 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050203 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20050203 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050329 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050411 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090428 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090428 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100428 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110428 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120428 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130428 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140428 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |