JP3629962B2 - 画像認識装置 - Google Patents

画像認識装置 Download PDF

Info

Publication number
JP3629962B2
JP3629962B2 JP19599598A JP19599598A JP3629962B2 JP 3629962 B2 JP3629962 B2 JP 3629962B2 JP 19599598 A JP19599598 A JP 19599598A JP 19599598 A JP19599598 A JP 19599598A JP 3629962 B2 JP3629962 B2 JP 3629962B2
Authority
JP
Japan
Prior art keywords
recognition
reliability
image data
document
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP19599598A
Other languages
English (en)
Other versions
JP2000032247A (ja
Inventor
博 杉浦
祥二 今泉
和弘 上田
Original Assignee
ミノルタ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ミノルタ株式会社 filed Critical ミノルタ株式会社
Priority to JP19599598A priority Critical patent/JP3629962B2/ja
Priority to US09/350,128 priority patent/US6798905B1/en
Publication of JP2000032247A publication Critical patent/JP2000032247A/ja
Application granted granted Critical
Publication of JP3629962B2 publication Critical patent/JP3629962B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Facsimile Scanning Arrangements (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

【0001】
【発明が属する技術分野】
本発明は、複写機などの画像形成装置において読み取った原稿の向きを認識する画像認識装置に関する。以下、原稿の向きを認識することを「天地の認識」とする。
【0002】
【従来の技術】
複写機、特にデジタル複写機では、多数の原稿を連続して複写する場合、原稿の向きにかかわらず同じ方向を向いて複写できるようする技術の開発研究が進められている(特開平6−103410)。原稿の向きが一定でなければ複写結果の向きも一定しないというのでは、複写前あるいは複写後に、利用者が原稿または複写結果の並べ替えをしなければならないという不都合が生じるからである。
【0003】
そして、このように複写結果の向きをそろえるためには、原稿の天地認識および画像回転の処理を行うことが必要となる。天地認識処理方法では、原稿の画像データから切り出した文字の方向を判定して、文字の方向を原稿の方向とするものが多い。画像回転処理は、天地認識処理で求めた原稿の方向が所定の方向と一致していない場合に、画像データを必要な角度だけ回転処理して、所定方向に一致させるものである。回転処理後の画像データから複写画像を形成すれば、複写結果の方向は一定になる。
【0004】
この天地認識処理については、処理の効率化や判定結果の信頼度向上のために様々な方法が考案されている。その中に信頼度向上のための方法として、特開平9−69136公報記載のものがある。
ここに公開されている方法は、天地認識処理の基本的な前提「文字の方向=原稿の方向」の例外となる文字の存在を考慮して、こうした例外的な文字をもとに天地認識が行われることで発生する誤認識を減らそうとするものである。
【0005】
図8は、原稿と向きが一致しない文字の例を示している。
同図(a)の文字列801は、グラフ、図表などで説明のために付加されるキャプション文字である。上向きの原稿810において、左向きとなっている。
同図(b)の文字列802は、表中文字である。表821が横向き(左向き)に掲載されているため、原稿820が上向きなのに、文字列802は左向きになっている。
【0006】
これらキャプション文字や表中文字をもとに天地認識が行われれば、結果として原稿の向きが誤認識されることは容易に理解できる。そこで、特開平9−69136公報記載の方法では、下記の手順で、キャプション文字や表中文字による天地認識をなるべく行わないようにしている。
先ず、原稿の文字部分を複数の領域に分割する。次いで各領域の属性を判定する。属性は、本文に当たる「テキスト属性」、表題を示す「タイトル属性」、表中の記載であることを示す「表中文字属性」、図やグラフに付随する説明文字であることを示す「キャプション属性」などがある。さらに、属性をもとに領域ごとの優先順位を設定する。優先順位は「テキスト」や「タイトル」が高く、「表中文字」、「キャプション」は低いのが普通である。そして、優先順位の高い領域から複数の文字を切り出して、各文字に天地認識を行う。そして、これら複数文字の天地認識結果が一致すれば、その結果を採用し、不一致の場合は次に優先順位の高い領域から文字を切り出して天地認識処理を行う。
【0007】
【発明が解決しようとする課題】
しかしながら、上記従来技術では、領域ごとに属性の判定を行い、属性の優先順位を考慮しながら優先順位に従って領域ごとに天地認識処理処理を行うので負荷を大きい。もちろん、こうした処理は天地認識結果の精度を向上させるためのものであり、無用なものではないが、実際のところ優先順位は固定的で、属性が「タイトル」あるいは「テキスト」である部分をもとに天地認識が行われることがほとんどである。「表中文字」あるいは「キャプション」で天地認識を行うのは、原稿にこれらの文字しか存在しない場合であり、こうした原稿はどのような天地認識方法を採っても天地認識結果の信頼性は低い。「テキスト」と「キャプション」が混在する原稿で、あえて「キャプション」の優先順位を上げて天地認識を行う場合は考えにくく、あったとしても極めて特殊な場合であろう。よって、属性ごとに分割した領域に優先順位まで設定して行う天地認識処理は、効果に対して負荷が過大となる場合が多い。
本発明は上記課題に鑑み、より小さな負荷でしかも結果の信頼性を落とすことなく原稿の天地認識を実行できる画像認識装置を提供することを目的とする。
【0008】
【課題を解決するための手段】
上記の課題を解決するために、本発明の画像認識装置は、原稿を読み取って画像データを生成する画像読取手段と、画像データを複数の領域に分割する分割手段と、前記複数の領域のそれぞれについて、原稿の天地認識処理に用いる場合の信頼度を算出する信頼度算出手段と、信頼度が最も高い領域の画像データから読み取り対象となった原稿の天地を判定する天地認識手段とを備えることを特徴とし、この構成によって天地認識結果の確度を落とすことなく天地認識処理速度を向上させることを可能としている。
【0009】
そして、信頼度については、前記信頼度算出手段が、前記分割領域ごとに画像データのヒストグラムを作成し、走査方向における度数の最大値と最小値との差に基づいて当該領域の信頼度を算出する。
信頼度については更に、前記信頼度算出手段が、前記分割領域ごとに画像データのヒストグラムを作成し、度数が走査方向において増加する変加点の数と減少する変加点の数とを求め、これら2つの値から当該領域の信頼度を求めるということもできる。
【0010】
そして、前記複数の分割領域において最も高い信頼度を有する領域が複数あった場合でも、前記天地認識手段は、これら複数の領域の天地認識結果に加えて信頼度が次に高い領域の天地認識結果を参照して原稿の天地を判定するので、認識結果の確度は高い。
【0011】
【発明の実施の形態】
以下、本発明の実施の形態を、デジタル複写機を例にとって、図面を参照しながら説明する。
(1)デジタル複写機全体の構成
まず、本実施の形態におけるデジタル複写機1(以下、単に「複写機1」という。)の全体の構成を図1により説明する。
同図に示すように、この複写機1は、原稿自動搬送装置10と、画像読取部30と、プリンタ部50と、給紙部70とからなる。
【0012】
原稿自動搬送装置10は、原稿を自動的に画像読取部30に搬送する装置であって、原稿給紙トレイ11に載置された原稿は、給紙ローラ12、捌きローラ13により1枚ずつ分離されて下方に送られ、搬送ベルト14によって、プラテンガラス31上の原稿読取位置まで搬送される。
原稿読取位置に搬送された原稿は、画像読取部30のスキャナ32によりスキャンされた後、再び、搬送ベルト14により図の右方向に送られ、排紙ローラ15を経て原稿排紙トレイ16上に排出される。
【0013】
画像読取部30は、上記プラテンガラス31の原稿読取位置に搬送された原稿の画像を光学的に読み取るものであって、スキャナ32、CCDイメージセンサ(以下、「CCDセンサ」という)38などから構成される。
スキャナ32には、露光ランプ33とこの露光ランプ33の照射による原稿からの反射光をプラテンガラス31に平行な方向に光路変更するミラー34が設置され、図の矢印方向に移動することによりプラテンガラス31上の原稿をスキャンする。原稿からの反射光はミラー34に反射された後、さらにミラー35、36および集光レンズ37を介してCCDイメージセンサ38まで導かれ、ここで電気信号に変換されて画像データが生成される。
【0014】
当該画像データは、制御部100においてA/D変換されてデジタル信号となり、さらにシェーディング補正や濃度変換処理等を加えられた後、公知の誤差拡散処理を加えられた後、いったんメモリに格納される。そして、天地認識の結果に応じて回転処理され、プリンタ部50のレーザダイオード51の駆動信号となる。
【0015】
プリンタ部50は、公知の電子写真方式により記録シート上に画像を形成するものであって、上記駆動信号を受信するとレーザダイオード51を駆動してレーザ光を出射させる。レーザ光は、所定の角速度で回転するポリゴンミラー52側面のミラー面で反射され、fθレンズ53、ミラー54、55を介して、感光体ドラム56の表面を露光走査する。
この感光体ドラム56は、上記露光を受ける前にクリーニング部57で感光体表面の残留トナーを除去され、さらにイレーサランプ(図示せず)の照射を受けて除電された後、帯電チャージャ58により一様に帯電されており、このように一様に帯電した状態で上記露光を受けると、感光体ドラム56表面に静電潜像が形成される。
現像器59は、感光体ドラム56表面に形成された上記静電潜像を現像する。
【0016】
一方、給紙部70には、2つの用紙カセット71、72が設けられており、上述の感光体ドラム56における露光および現像の動作と同期して、必要なサイズの記録シートが、用紙カセット71、72のいずれかから、給紙ローラ711もしくは721の駆動により給紙される。給紙された記録シートは、感光体ドラム56の下方で当該感光体ドラム56の表面に接触し、この時、転写チャージャ60の静電力により、感光体ドラム56表面に形成されていたトナー像が当該記録シート表面に転写される。
【0017】
その後、記録シートは、分離チャージャ61の静電力によって感光体ドラム56の表面から分離され、搬送ベルト62により定着部63に搬送される。
記録シートに転写されたトナー像は、定着部63において内部にヒータを備えた定着ローラ64で加熱されながら押圧されることにより定着される。定着後の記録シートは、排出ローラ65により排紙トレイ66上に排出される。
【0018】
画像読取部30の前面の操作しやすい位置には、操作パネル90が設けられており、コピー枚数を入力するテンキーやコピー開始を指示するスタートキー、各種のコピーモードを設定するための設定キー、上記設定キーなどにより設定されたモードをメッセージで表示する表示部などが設けられている。
【0019】
(2)制御部100の構成
次に、複写機1の内部に設置されている制御部100の構成を図面に従って説明する。
図2は、制御部100の構成を示すブロック図である。
制御部100は、画像読取制御部110、画像信号処理部120、メモリ制御部130、プリンタ制御部140、メイン制御部150、原稿認識部200などから成る。上記各構成部は、それぞれCPUを中心として構成されており、コマンドライン(図中、点線で表示)を介して情報やコマンドを、画像データバス(図中、実線で表示)を介して画像データを、相互にやり取りする。
【0020】
画像読取制御部110は、原稿自動搬送装置10および画像読取部30の動作を制御するものである。すなわち、メイン制御部150からの実行指示を受けて起動し、先ず原稿自動搬送装置10に対し原稿の順次搬送を行わせる。そして、搬送された原稿の読取りを画像読取部30に指示して、読み取った画像データを画像信号処理部120に出力させる。
【0021】
画像信号処理部120は、CCDセンサ38から出力されてくる画像データについて、A/Dコンバータでデジタルの多値信号に変換し、シェーディング補正部で露光ランプ33の照度ムラやCCDセンサ38の感度ムラを補正する。その後、MTF補正部でエッジ強調などの画質改善を施すなどの処理をした上で、原稿認識部200およびメモリ制御部130に出力する。
【0022】
原稿認識部200は、上記画像データに基づいて原稿の天地認識を行い、天地認識の結果、原稿の向きの調整が必要となった場合には、メモリ制御部130に指示して、画像データの回転処理を行わせる。原稿認識部200については、構成や処理内容の詳細を後述する。
【0023】
メモリ制御部130は、画像信号処理部120から出力されてくる画像データを2値化、さらに必要な場合は圧縮した上で画像メモリ131にいったん格納する。そして、メイン制御部150から指示を受けると、画像メモリ131から画像データを読み出し、多値化、さらに圧縮されている場合は伸長を行って画像メモリ131格納前の画像データに戻す。さらに、上記原稿認識部200から画像回転処理の指示を受けていた場合は、指示に応じた角度だけ画像データを回転させ、作像処理のためにプリント制御部140に出力する。なお、画像の回転処理については公知の技術(例えば、特開昭60−126769など)を用いて実行する。
【0024】
プリンタ制御部140は、上記メモリ制御部130から出力されてきた画像データを各再現色ごとに、レーザーダイオード駆動信号に変換して、それぞれをレーザーダイオード51に出力して、露光走査を行わせる。
メイン制御部150は、利用者の指定(複写枚数、片面/両面指定、複写開始指示など)を図外の操作パネルから受け付けると、指定内容を制御部100の構成各部に通知する。また、構成各部の処理タイミングを統一的に制御して、円滑な複写動作を実現する。
【0025】
(3)原稿認識部200の構成
次に、制御部100のうち、天地認識処理を実行する原稿認識部200について、構成と処理内容とを説明する。
図3は、原稿認識部200の構成を示すブロック図である。
原稿認識部200は、認識制御部210、2値化部220、領域分割部230、信頼度判定部240、天地認識部250、作業用メモリ260などで構成される。
【0026】
2値化部220は、画像信号処理部120から出力されてくる多階調画像データを所定階調レベルのスレッシュレベルと比較して、2値データに変換する。そして、2値化した画像データを作業用メモリ260に格納し、処理終了を認識制御部210に通知する。
【0027】
領域分割部230は、認識制御部210からの指示を受け、作業用メモリ260内の2値化画像データを複数の領域に分割する。
図4は、領域分割の一例を示す模式図である。ここでは、原稿を主走査方向と副走査方向とでそれぞれ2等分し、A,B,C,Dの4つの領域に分割している。
領域分割部230は、分割した領域の画像データについて識別情報(作業用メモリ260におけるアドレス)を、信頼性判定部240に通知する。そして、認識制御部210に処理終了を通知する。
【0028】
信頼性判定部240は、領域分割部230から通知されたアドレスをもとに作業用メモリ260内の各領域について、ヒストグラムを作成し、ヒストグラムから画像データ中の文字列の向き(行方向)が主走査方向と副走査方向のいずれかを判定する。そして、行方向のヒストグラムをもとに、各領域の画像データを天地認識に使用した場合の信頼度を判定する。ここで言う信頼度とは、具体的には画像データのヒストグラムから算出されるMTF値である。MTF値は、行方向のヒストグラムにおいてヒストグラム値の最大値(max)、最小値(min)を取り、以下の(式1)にあてはめることで求められる。
MTF値=(max−min)/(max+min) …(式1)
信頼度算出部240は、当該領域の行方向のヒストグラムをいくつかの区分に分けてMTF値を求め、各区分のMTF値の平均値を当該領域の信頼度とする。
【0029】
図5は、信頼度(MTF値)が高くなる画像データの例を示す。ヒストグラム510は、6つの区分511〜516に分けられており、各区分において、ヒストグラム値の最大値は様々だが、最小値は0となっている。結果として、全区分でMTF値は、
max−0/max+0
=max/max
=1
となる。“1”はMTF値の最大値である。このようにMTFが最大値となるのは、ヒストグラム510に谷(度数=0の部分)があるためであり、これはつまり、ヒストグラム510の元となる画像データ520には、一列に並んだ文字データが間隔を置いて複数配置されていることを意味している。
【0030】
MTF値は、原稿に傾きがある場合のほかに、表の罫線や図形など文字以外の情報が含まれていて谷ができない画像データの場合に低くなる。キャプション文字や表中文字など、天地認識に用いるのに不適当な文字データは、グラフや表罫線など文字以外の情報を伴なうことが多いので、MTF値が低い領域(文字以外の情報を含む領域)に含まれる文字については、天地認識に用いるのは不適当であると考えることができる。逆にMTF値の大きい領域には、上述の通り文字データが傾きなしに一列に並んでいると考えることができ、天地認識における信頼性が高い。以上のことが、MTF値を天地認識結果の信頼度とする根拠である。
【0031】
信頼度判定部240は、このように、2値画像データからヒストグラムを作成し、作成したヒストグラムのMTF値の平均を信頼度として求める。そして、信頼度の算出を終えると、当該領域の2値画像データのアドレス、これに対応するヒストグラムのアドレス、そして信頼度の数値を対にして認識制御部210に出力する。図4の例では、4つの領域のうち、領域C,Dはグラフを含むため、信頼度が低くなる。また、領域Bはグラフなどの図形は含まないものの、空白部分が多い。信頼度が最も高いのは、データすべてが文字列である領域Aとなる。
【0032】
天地認識部250は、認識制御部210からアドレスが出力されてくる領域(信頼度判定部240が最も信頼度が高いと判定した領域)について公知の方法で天地認識を行う。天地認識の方法については様々なものが公開されている(特開平4−229763、特開平7−65120など)ので詳細な説明は省くが、基本的な手順は以下の通りである。先ず、処理対象領域の画像データからヒストグラムに応じて1文字分のデータを切り出し、この切り出しデータに対応する文字データ(比較用文字)を図外のメモリ内のパターン辞書から見つけ出す。それから、比較用文字を90度ずつ回転させては、切り出しデータと比較する。そして、一致した時点での角度(0,90,180または270度)を切り出し文字の向きを示す情報として認識制御部210に出力する。
【0033】
次いで、認識制御部210について説明するが、認識制御部210は原稿認識部200全体の処理の制御も行うので、原稿認識部200の動作説明を兼ねることにする。
図6は、原稿認識部200による原稿の天地判断処理の流れを示すフローチャート図である。
原稿認識部200による処理は、画像信号処理部120から補正済み画像データが出力されてきたタイミングで開始される。
【0034】
先ず認識制御部210は、2値化部220に指示して画像データを2値化させてから作業用一時記憶に格納し(S601)、領域分割部230に画像データ分割を指示する。領域分割部230は、この2値化された画像データを分割する(S602)。
【0035】
認識制御部210は、領域分割部230から分割領域の数と各領域のアドレスとを受け取ると、これら情報を信頼度判定部240に出力し、各領域の信頼度を求めさせる。信頼度判定部240は、領域ごとに画素ヒストグラムを生成し(S604)、MTF値を算出して認識制御部210に通知する(S605)処理を、未処理領域がなくなるまで繰り返す(S603)。
【0036】
認識制御部210は、信頼度判定部240から出力されてくる領域ごとの信頼度情報を保持し、全ての領域についての信頼度情報がそろった時点で、信頼度の値をもとに天地認識に用いる領域を選択する。認識制御部210は、信頼度の値が最大となる領域を選択する(S606)。それから、認識制御部210は、この信頼度の値を所定の閾値と比較する。そして、信頼度の最大値が閾値を下回る場合(S607:No)、天地認識部250への処理実行指示は出さず、メモリ制御部130に対しては、画像データの回転補正は不要とする情報(回転角度=0度)を出力する(S615、S618)。これは、最大値があくまで相対的なものであり、例えば20%程度の信頼度の領域でも、他の領域の信頼度が10%などと低い値であれば最大値となってしまうからである。信頼度の最大値が低い場合は、どの領域を用いて天地認識を行っても信頼できる結果は得られないと考えられるので、天地認識処理は行わず、操作者が原稿を置いた向きのままにして複写するのである。
【0037】
一方、信頼度の最大値が所定の閾値以上であった場合(S607:Yes)、認識制御部210は、当該領域の2値画像データとヒストグラムとのアドレスを天地認識部250に出力し、これらを用いて天地認識を行うよう指示する(S608)。そして、この指示に対して天地認識部250から当該領域の天地認識結果が出力されてくると、この結果をもとに、この原稿のコピーを所定の向きに向けさせるのに必要な回転角度を算出し、これをメモリ制御部130に出力する(S617)。
【0038】
なお、信頼度の値が最も高い領域が複数あった場合(S609:Yes)、認識制御部210は、それら全ての領域に対して上記の天地認識処理を行わせ(S608)、結果が複数の領域で一致すれば(S610:Yes)、その結果を採用する。領域間で結果が不一致となれば(S610:No)、2番目に高い信頼度を有する別領域に対して、更に天地認識処理を行わせる(S611)。この際、認識制御部210は、この2番目に高い信頼度についても閾値との比較を行い、閾値以上である場合に限って(S612:Yes)天地認識を行わせる(S613)。閾値を下回っていれば(S612:No)、天地認識不能として、メモリ制御部130に対して画像データの回転補正は不要とする情報(回転角度=0度)を出力して処理を終える(S615、S618)。
【0039】
2番目に信頼度の高い領域に天地認識処理を行った場合、認識制御部210は、この結果を先に行った2種類の結果と比較し、いずれかと一致すれば(S614:Yes)、一致した結果をもとに必要な回転角度を算出し、これをメモリ制御部130に出力する(S616、S618)。先の天地認識結果のいずれもが後から行った天地認識結果と一致しなかった場合(S614:No)、認識制御部210は天地認識不能と判定して、メモリ制御部130に対して画像データの回転補正は不要とする情報(回転角度=0度)を出力する(S615、S618)。
【0040】
以上のように、本実施の形態ににおいて、原稿認識部200は画像データを領域に分割して、最も信頼度の高い領域から切り出すデータで原稿の天地認識を行うが、その際、領域分割は単純な規則に従って行い、領域ごとの属性(テキスト、キャプション、表中文字など)を判定することもしない。また、信頼度の判定は画像データのヒストグラムのMTF値によって定めるので、天地認識処理の負荷は従来技術に比べ大きく低減される。しかも、MTF値を信頼度の基準とすることで、キャプション文字や表中文字など誤認識の原因となるデータは排除できるので、認識結果の信頼度が従来技術に比べて低下することもない。
【0041】
なお、本実施の形態においては、MTF値によって天地認識に使用する場合の信頼度が高い領域(一列に文字データが並んでいる領域)を判断しているが、ヒストグラムにおけるエッジ数を用いて、信頼度が高い領域を判断することもできる。
【0042】
図7にエッジ数と画像データの関係を示す。
同図(a)は、横書きの左詰めで傾きのないテキストの画像データと、この画像データについて、走査方向のうち行方向に一致しない方向のヒストグラム710を示す。ヒストグラム710には、ヒストグラム値が増加する方向の変化点(増加エッジ:同図中では白丸で示す)の数はヒストグラム値が減少する方向の変化点(減少エッジ:同図中では黒丸で示す)の数より少なくなる。(図7では、増加エッジは2個、減少エッジは4個。)文字列の開始位置は改行部分を除いて左側で一致するのに対し、文字列の終端は不特定だがらである。傾きのある文字列や図表を含む画像データでは、エッジの数は多くなり、増加エッジと減少エッジの数に差は出にくい。よって、増加エッジ数と減少エッジ数、また両者の差に着目すれば、文字列を多く含んだ画像データを見つけ出すことができる。増加エッジ数と減少エッジ数との和は少ない方が、両者の差は大きい方が、画像データ720のような文字列の画像データである可能性が高いと判断できる。
【0043】
また、上記実施の形態においては、本発明に係る画像認識装置をモノクロの複写機に適用した例を説明したが、その他の原稿認識が必要な装置、例えばカラー複写機やファクシミリ装置における画像認識装置としても適用される。ただし、その場合、画像データ中の有彩色データを予めキャンセルする回路を組み込んでいることが必要である。有彩色データキャンセル回路については公知の技術なので、詳細な説明は省略する。
【0044】
【発明の効果】
以上の説明から明らかなように、本発明の画像認識装置によれば、原稿を読み取って画像データを生成する画像読取手段と、画像データを複数の領域に分割する分割手段と、前記複数の領域のそれぞれについて、原稿の天地認識処理に用いる場合の信頼度を算出する信頼度算出手段と、信頼度が最も高い領域の画像データから読み取り対象となった原稿の天地を判定する天地認識手段とによって天地認識処理を行うので、従来のように領域の属性を判定する必要もなく、天地認識処理を迅速に実行することができる。また、信頼度は画像データのヒストグラムに表れる値を基に算出され、一列に並んだ文字データを多く含む領域ほど高くなるので、信頼度を基準に選んだ領域を用いて行った認識結果の確度も高い。
【図面の簡単な説明】
【図1】本発明に係る画像認識装置が適用される複写機の全体の構成を示す断面図である。
【図2】上記複写機における制御部の構成を示すブロック図である。
【図3】上記制御部における原稿認識部の構成を示すブロック図である。
【図4】上記原稿認識部による画像データの領域分割の一例を示す図である。
【図5】信頼度の具体的な目安であるMTF値が高くなる種類の画像データとそのヒストグラムとの一例を示す図である。
【図6】上記原稿認識部による天地認識処理の流れを示すフローチャート図である。
【図7】信頼度の別の目安であるエッジカウントを説明するための図である。
【図8】従来の天地認識処理において誤認識の原因となる文字データの例を示す図である。
【符号の説明】
1 複写機
100 制御部
120 画像信号処理部
130 メモリ制御部
131 画像メモリ
150 メイン制御部
200 原稿認識部
210 認識制御部
230 領域分割部
240 信頼度判定部
250 天地認識部

Claims (4)

  1. 原稿を読み取って画像データを生成する画像読取手段と、
    画像データを複数の領域に分割する分割手段と、
    前記複数の領域のそれぞれについて、原稿の方向認識処理に用いる場合の信頼度を算出する信頼度算出手段と、
    信頼度が最も高い領域の画像データに基づいて読み取り対象の原稿の向きを判定する天地認識手段とを備えることを特徴とする画像認識装置。
  2. 前記信頼度算出手段は、前記複数の領域ごとに画像データのヒストグラムを作成し、読み取り走査方向における度数の最大値と最小値との差に基づいて当該領域の信頼度を算出することを特徴とする、請求項1記載の画像認識装置。
  3. 前記信頼度算出手段は、前記複数の領域ごとに画像データのヒストグラムを作成し、読み取り走査方向において度数が増加する変加点の数と減少する変加点の数とを求め、これら2つの値から当該領域の信頼度を求めることを特徴とする、請求項1記載の画像認識装置。
  4. 前記複数の領域において最も高い信頼度を有する領域が複数あってしかもこれら領域の天地認識の結果が一致しない場合、前記天地認識手段は、これら領域の天地認識結果に加えて信頼度が次に高い領域の天地認識結果を参照して原稿の方向を判定することを特徴とする、請求項1乃至3のいずれかに記載の画像認識装置。
JP19599598A 1998-07-10 1998-07-10 画像認識装置 Expired - Fee Related JP3629962B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP19599598A JP3629962B2 (ja) 1998-07-10 1998-07-10 画像認識装置
US09/350,128 US6798905B1 (en) 1998-07-10 1999-07-09 Document orientation recognizing device which recognizes orientation of document image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19599598A JP3629962B2 (ja) 1998-07-10 1998-07-10 画像認識装置

Publications (2)

Publication Number Publication Date
JP2000032247A JP2000032247A (ja) 2000-01-28
JP3629962B2 true JP3629962B2 (ja) 2005-03-16

Family

ID=16350481

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19599598A Expired - Fee Related JP3629962B2 (ja) 1998-07-10 1998-07-10 画像認識装置

Country Status (1)

Country Link
JP (1) JP3629962B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4927122B2 (ja) 2009-06-15 2012-05-09 シャープ株式会社 画像処理方法、画像処理装置、画像形成装置、プログラムおよび記録媒体
JP6177758B2 (ja) * 2014-12-15 2017-08-09 京セラドキュメントソリューションズ株式会社 画像読取装置及び画像形成装置
US11853844B2 (en) 2020-04-28 2023-12-26 Pfu Limited Information processing apparatus, image orientation determination method, and medium

Also Published As

Publication number Publication date
JP2000032247A (ja) 2000-01-28

Similar Documents

Publication Publication Date Title
US5452105A (en) Joint-portion processing device for image data for use in an image processing apparatus
EP0591974A2 (en) Image processing apparatus
US6798905B1 (en) Document orientation recognizing device which recognizes orientation of document image
JP3695163B2 (ja) 画像形成装置
JP3671682B2 (ja) 画像認識装置
JP3629962B2 (ja) 画像認識装置
JPH06103410A (ja) 画像処理装置
JP3083671B2 (ja) 画像処理装置
JP3629969B2 (ja) 画像認識装置
JP3629959B2 (ja) 画像認識装置
JP3081083B2 (ja) 画像処理装置
JPH11213089A (ja) 画像処理装置及びその方法
JPH1169096A (ja) 画像形成装置
JPH11213152A (ja) 画像処理装置
JPH08139916A (ja) 画像処理装置および画像処理方法
JP3675181B2 (ja) 画像認識装置
JP3078421B2 (ja) デジタル画像形成装置及びデジタル画像形成装置のレーザ走査光補正方法
JP4132473B2 (ja) 画像処理装置及び画像形成装置
JP2000022898A (ja) 傾き量検出装置
JPH11220557A (ja) 画像処理装置及び方法
JPH11341252A (ja) 画像形成装置、画像形成方法、記憶媒体
JP2003141444A (ja) 画像処理装置および画像処理装置の制御方法およびプログラムおよび記憶媒体
JP2000022897A (ja) 画像認識装置
JP2003316207A (ja) 画像形成装置
JPH0554188A (ja) 画像処理装置

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041207

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071224

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081224

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081224

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091224

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101224

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101224

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111224

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111224

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121224

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131224

Year of fee payment: 9

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees