JP3629969B2 - 画像認識装置 - Google Patents
画像認識装置 Download PDFInfo
- Publication number
- JP3629969B2 JP3629969B2 JP25012498A JP25012498A JP3629969B2 JP 3629969 B2 JP3629969 B2 JP 3629969B2 JP 25012498 A JP25012498 A JP 25012498A JP 25012498 A JP25012498 A JP 25012498A JP 3629969 B2 JP3629969 B2 JP 3629969B2
- Authority
- JP
- Japan
- Prior art keywords
- page
- document
- image
- recognition
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Facsimile Scanning Arrangements (AREA)
- Editing Of Facsimile Originals (AREA)
Description
【発明の属する技術分野】
本発明は、画像入力装置で読み取られた書籍原稿の原稿方向を認識する画像認識装置に関する。
【0002】
【従来の技術】
従来から本のように片側が綴じられた原稿(書籍原稿)を操作者がページめくりしながらコピーする際に、書籍の見開きページを片ページにずつ連続的に読み取ってコピーする、いわゆるページ連写可能なモード(以下、「ブック分割モード」という。)を備えた複写機がある。このようなモードで書籍原稿をコピーする場合、縦書きが横書きかでページ順が異なるだけでなく、誤って本の天地を逆にして複写機の原稿読取ガラス板(プラテンガラス)に載置した場合には、その載置された方向にしたがって記録シート上に画像形成されて排出されるので、排出されたコピー束についてそのページ順や天地方向が揃うように改めて並び替える必要があり、大変手間であった。
【0003】
そこで、特開平9−83691号公報には、書籍原稿をブック分割モードで複写する場合に、ページ毎に行方向と天地方向を判別してその認識結果に基づいて、ページ連写の順番を変更すると共に必要に応じて画像データを回転させ、原稿のページ順に原稿の方向が揃った状態でコピーを出力する技術が開示されている。
【0004】
【発明が解決しようとする課題】
ところが、上記公報における技術は、ページ毎の画像データに基づきその原稿方向を判別(以下、このように原稿方向を判別する処理を「天地認識」という。)するようになっているが、これは見開きページ双方の天地認識が可能であることを前提としており、片方のページの天地認識が不可能であった場合には対処できなかった。
【0005】
本発明は、上記の問題点に鑑み、書籍原稿についてページ毎に的確に天地認識を行うことができる画像認識装置を提供することを目的とする。
【0006】
【課題を解決するための手段】
上記目的を達成するため、本発明は、書籍原稿を読み取って得られた画像データに基づいてその原稿方向を認識する画像認識装置であって、見開き2ページのそれぞれの画像データに基づきページ毎に原稿方向を判別する判別手段と、前記判別手段により、見開き2ページのそれぞれのページの原稿方向が判別された場合は、その判別結果をそのまま当該ページの原稿方向として認識すると共に、見開き2ページのどちらか一方の原稿方向が判別不能であると判断された場合には、他方のページの判別結果を当該判別不能なページの原稿方向として認識する認識手段とを備えることを特徴とする。
【0007】
また、本発明は、前記判別手段が、各ページの原稿方向の判別に際しその信頼度を求め、当該信頼度が所定値以下の場合に、原稿方向が判別不能と判断することを特徴とする。
【0008】
【発明の実施の形態】
本発明に係る画像認識装置の一適用例であるデジタル複写機(以下、単に「複写機」という。)について、以下に添付の図面を参照しながら説明する。
(1)複写機全体の構成
まず、本発明に係る画像認識装置が適用される複写機の全体の構成を図1により説明する。
【0009】
同図に示すように、この複写機は、自動原稿搬送装置(Auto Document Feeder、以下、単に「ADF」という。)10と、画像読取部30と、プリンタ部50と、給紙部70とからなる。
ADF10は、原稿を自動的に画像読取部30に搬送する装置であって、原稿給紙トレイ11に載置された原稿は、給紙ローラ12、捌きローラ13により1枚ずつ分離されて下方に送られ、搬送ベルト14によって、プラテンガラス31上の原稿読取位置まで搬送される。
【0010】
原稿読取位置に搬送された原稿は、画像読取部30のスキャナ32によりスキャンされた後、再び、搬送ベルト14により図の右方向に送られ、排紙ローラ15を経て原稿排紙トレイ16上に排出される。
画像読取部30は、上記プラテンガラス31の原稿読取位置に搬送された原稿の画像を光学的に読み取るものであって、スキャナ32、CCDイメージセンサ(以下、単に「CCD」という。)38などから構成される。
【0011】
スキャナ32には、露光ランプ33と、この露光ランプ33の照射による原稿からの反射光をプラテンガラス31に平行な方向に光路変更するミラー34が設置され、図の矢印方向に移動することによりプラテンガラス31上の原稿をスキャンする。原稿からの反射光はミラー34に反射された後、さらにミラー35、36および集光レンズ37を介してCCD38まで導かれ、ここで電気信号に変換されて画像データが生成される。
【0012】
当該画像データは、制御部100内の画像信号処理部110(図3参照)においてA/D変換されてデジタル信号とされた後、種々の補正を加えられ、高解像度画像メモリ120(同図2)に格納される。高解像度画像メモリ120に格納された画像データは、後述するようにCPU170でなされた天地認識の結果に応じて回転処理され、プリンタ部50のレーザダイオード(以下、「LD」とも表記する。)51の駆動信号となる。
【0013】
プリンタ部50は、公知の電子写真方式により記録シート上に画像を形成するものであって、上記駆動信号を受信するとレーザダイオード51を駆動してレーザ光を出射させる。レーザ光は、所定の角速度で回転するポリゴンミラー52側面のミラー面で反射され、fθレンズ53、ミラー54、55を介して、感光体ドラム56の表面を露光走査する。
【0014】
この感光体ドラム56は、上記露光を受ける前にクリーニング部57で感光体表面の残留トナーを除去され、さらにイレーサランプ(図示せず)の照射を受けて除電された後、帯電チャージャ58により一様に帯電されており、このように一様に帯電した状態で上記露光を受けると、感光体ドラム56表面に静電潜像が形成される。
【0015】
現像器59は、感光体ドラム56表面に形成された上記静電潜像を可視化する。
一方、給紙部70には、2つの用紙カセット71、72が設けられており、上述の感光体ドラム56の露光および現像の動作と同期して、必要なサイズの記録シートが、用紙カセット71、72のいずれかから、給紙ローラ711もしくは721の駆動により給紙される。給紙された記録シートは、感光体ドラム56の下方で当該感光体ドラム56の表面に接触し、転写チャージャ60の静電力により、感光体ドラム56表面に形成されていたトナー像が当該記録シート表面に転写される。
【0016】
その後、記録シートは、分離チャージャ61の静電力によって感光体ドラム56の表面から引き剥され、搬送ベルト62により定着部63に搬送される。
記録シートに転写されたトナー像は、定着部63において内部にヒータを備えた定着ローラ64で加熱されながら押圧されることにより定着される。定着後の記録シートは、排出ローラ65により排紙トレイ66上に排出される。
【0017】
また、画像読取部30の前面の操作しやすい位置には、操作パネル90が設けられている。
図2は、当該操作パネル90の構成を示す図であり、メッセージや操作ボタンなどを液晶で表示する液晶表示部91と、コピースタートキー95を備える。
液晶表示部91は、メッセージ表示部92と第1選択ボタン表示部93と第2選択ボタン表示部94を備える。第1、第2選択ボタン表示部93、94の表面には透明なタッチパネルが積層されており、当該ボタンの画面にタッチすることにより目的の入力が可能となっている。
【0018】
第1選択ボタン表示部93の各ボタンを押下するとそれに応じた選択ボタンが第2選択ボタン表示部94に表示され、さらに詳細な入力が可能となる。図では、第1選択ボタン表示部93の「コピー」のボタンが押下されたときの第2選択ボタン表示部94の例が表示されており、特に「ブック分割」のボタンを押下することにより、書籍原稿に対してページ連写を実行するブック分割モードが設定される。
(2)制御部100の構成
次に、上記複写機の内部に設置される制御部100の構成を、図3のブロック図を参照しながらより詳細に説明する。
【0019】
同図に示すように制御部100は、画像信号処理部110と、高解像度画像メモリ120と、回転処理部130と、LD駆動部140と、解像度変換部150と、低解像度認識用メモリ160とCPU170等からなる。
操作パネル90からブック分割モードが設定され、コピースタートキー95が押下されると、CPU170は、画像読取部30に指示して、両開き状態の書籍原稿をそのページ毎に読み取らせる。当該画像情報はCCD38で電気信号に変換されて反射率データとして画像信号処理部110に送られる。
【0020】
画像信号処理部110は、濃度変換部やA/Dコンバータ、シェーディング補正部、MTF補正部、変倍部、およびγ補正部などを備える。CCD38より入力された反射率データは、濃度変換部で濃度データに変換された後、A/Dコンバータでデジタルの多値信号に変換され、シェーディング補正部で露光ランプ33の照度ムラやCCD38の感度ムラが補正される。その後、MTF補正部でエッジ強調などの画質改善のための処理を受け、さらに変倍部やγ補正部でそれぞれ変倍処理、γ補正処理など加えられた後に高解像度画像メモリ120および解像度変換部150に送出される。
【0021】
回転処理部130は、CPU170からの指示により、高解像度画像メモリ120から目的のページの画像データを読み出し、必要に応じて画像データを回転処理してから、LD駆動部140に転送する。回転処理部130における回転処理は、画像データのメモリアドレスを変更する公知の技術(例えば、特開昭60ー126769号公報参照)によってなされる。
【0022】
なお、画像データの回転処理の有無やどちらのページから先に画像形成を実行するかについては、CPU170で実行される天地認識の結果による。詳しくは後述する。
LD駆動部140は、高解像度画像メモリ120から出力された画像データに基づいて駆動信号を生成してレーザダイオード51に送り、CPU170は、ROM172に格納されたプログラムに基づきプリンタ部50、給紙部70を制御し、これらにより記録シート上への画像形成が実行される。
【0023】
一方、解像度変換部150は、画像信号処理部110を経由した高解像度画像データを低解像度の画像データに変換する。解像度変換された画像データは、低解像度認識用メモリ160に書き込まれる。本実施の形態では、CCD38で読み取られた400DPIまたは600DPIの画像データを、25DPIまたは40DPIの低解像度に変換する。解像度変換は、具体的には、例えば縦4画素×横4画素の16画素を取り出し、取り出された16画素の濃度の最大値を取得して、それを1画素の濃度とする処理を、所定の解像度となるまで繰り返し実行することにより行うことができる。このように低解像度に変換するのは、データ量を少なくして天地認識を円滑に実行させるためである。
【0024】
低解像度変換された見開き2ページの画像データは、それぞれ低解像度認識用メモリ160にページ毎に格納され、CPU170は、それぞれの画像データに基づいて天地認識を行う。
この天地認識の手法は種々あるが、本実施の形態では、たとえば特開平9−9040号公報に開示されているように、原稿画像の主走査方向および副走査方向についてのヒストグラムを取得することにより天地認識を行う。
【0025】
図4は、上記天地認識の方法について説明するための図であり、1枚の原稿をその長手方向が主走査方向に平行になるようにプラテンガラス31上に載置し、スキャナ32で読み取って得られた画像データについてヒストグラムを取得して天地認識を行う例を示している。
より具体的には、当該原稿の画像データについて得られた副走査方向のヒストグラム(a)および主走査方向のヒストグラム(b)について、ヒストグラム値が増える方向の変化点(以下、「立ち上がりエッジ」という。)と、減る方向の変化点(以下、「立ち下がりエッジ」という。)の数をそれぞれカウントし、当該立ち上がりエッジの数と立ち下がりエッジの数および両カウント数の和および差を算出する。
【0026】
図4のような横書きの原稿400であれば、副走査方向のヒストグラム(a)の立ち上がりエッジの数と立ち下がりエッジの数がほぼ等しくなると共に両者の和は、主走査方向のヒストグラム(b)と比較して多くなる。副走査方向のヒストグラム(a)には、行を表すピークと、行間に相当するピークのない部分が交互に検出されるからである。これにより文字行の方向を判定することができる。
【0027】
次に、当該文字行と直交する方向(主走査方向)のヒストグラム(b)から行の先頭の文字位置を認識する。すなわち、行の先頭の文字位置は比較的一定しているため、同図に示すように原稿の天地方向が正しい場合には、ヒストグラムの立ち上がりエッジが特定の箇所に集中するのに対し、行の最後の文字位置は、文章によってまちまちであり、行の最後の文字位置によるヒストグラムの立ち下がりエッジは、比較的分散して発生することになる。したがって、一般的に立ち上がりエッジの数と立ち下がりエッジの数との差が大きければ、当該エッジカウント数の少ない側が行頭であると判断でき、その原稿方向が判別できる。
【0028】
もっとも、原稿画像に図形を含むような場合には、立ち上がりエッジと立ち下がりエッジの数に上述のような規則性がなくなり、天地の認識は不可能となる。そこで、まず、当該画像データについて天地認識する際の信頼度を求め、信頼度が所定以上の場合について天地認識を行い、所定値未満のものについては天地認識不可能とする判断を行う。このような信頼度の求め方の詳細については後述する。
【0029】
CPU170は、見開き2ページの各画像データに基づき天地認識を行って、それぞれの結果をそのまま当該ページの原稿方向として認識すると共に、もし、片方のページのみが認識不可能な場合には他方のページの認識結果を当該ページの原稿方向と認定する。これは書籍原稿においては見開き両ページは、ほとんど同じ原稿方向であると断定できるからである。
【0030】
通常、書籍のコピーにあっては、その背表紙(綴り部分)の向きが、複写機に向かって操作している使用者の向きと同方向(装置上での主走査方向)になるようにプラテンガラス31上に載置されるので、上述の処理により文字行の向きが例えば横向きであると判定された場合(すなわち、図4に示すような場合)には、横書きの文章であると断定してよい。この場合には書籍は左開きとなるので、その天地方向が正しければ、読み取った左側のページから画像形成し、天地が逆さまであれば、読み取った右側のページの画像データを180°回転した上で、こちらのページから画像形成するように制御される。
【0031】
学問書などにおいては、文章参照の便宜上、一方のページが横書きで、他方のページが縦書きであるという場合もありうるが、この場合には、以前の見開きページの共通の判別結果を参照にして決定するか、もしくは、操作パネル90のメッセージ表示部92に操作者の判断を請うメッセージを表示させ、当該操作者の操作パネル90操作に基づき決定するようにすればよい。
【0032】
なお、見開きの双方のページとも天地認識が不可能な場合には、操作パネル90のメッセージ表示部92に、当該見開きページは両ページとも天地認識不能である旨表示させる。
以上のようにしてCPU170は、原稿が縦書きか横書きかの判断結果と、ページごとの原稿方向の判別結果に基づき、上記見開き2ページの画像データの回転の要否とその回転角およびどちらのページの画像データを先にプリントアウトするかを判断し、それぞれ回転角情報およびページ読み出し情報として回転処理部130に送り、当該回転処理後の画像データに基づきプリンタ部50で画像形成を実行させる。
【0033】
これにより、正しい方向に画像形成された記録シートが書籍原稿のページ順に排紙トレイ66から排出されることになる。
以上の処理を指示するプログラムは、ROM172に格納されており、必要に応じてRAM171が作業用のメモリ領域として利用される。
(3)制御部100の処理
以下、CPU170における天地認識の処理内容について図5のフローチャートに基づきより詳しく説明する。
【0034】
上述したように、ブック分割モードでは、書籍原稿のページ毎に、例えば左ページA、右ページBの順に読み取られ、それぞれ解像度変換部150により低解像度に変換され後、低解像度認識用メモリ160に格納される。
制御部100は、書籍の見開き2ページのうち、まず先に読み取ったページAの原稿について天地認識を行う(ステップS1)。
【0035】
図6は、このステップS1で実行されるページ毎の天地認識処理の内容を示すフローチャートである。
CPU170は、低解像度認識用メモリ160から、ページAの画像データを読み出して、その濃度値を主走査方向と副走査方向に積算して図4の(a)(b)に示したようなヒストグラムを作成する(ステップS100)。そして得られたヒストグラムに基づき、まず当該原稿の文字行の方向を判別する(ステップS110)。このような文字行の方向は、上述したようにヒストグラムの立ち上がりエッジ数と立ち下がりエッジ数が等しいこと並びに当該エッジ数が他の方向のエッジ数に比較して多いことにより判別される。
【0036】
次に、天地認識のための画像データの信頼度を求める(ステップS120)。
ここで、信頼度の計算方法について、二つの例を挙げて説明する。まず、第1に、ヒストグラムから算出されるMTF値を用いる方法について説明する。
「MTF値」とは、ヒストグラムを取得した場合に、そのヒストグラムの数ライン毎の高さの最大値(以下、「max値」という。)、および最小値(以下、「min値」という。)を取得した場合に、次式1により算出される値をいう(以下、MTF値を取得するために分割された数ラインにより形成される領域を「ライン領域」と称する)。
(MTF値)=(max値−min値)/(max値+min値) (式1)
図7は、上記MTF値の算出について説明するための図である。同図(a)は、原稿400に記載された文字行が原稿の向きに平行である場合の例を示す。同図において、410は取得された主走査方向のヒストグラムを表し、Rはライン領域を示す。
【0037】
同図(a)に示されるように、文字行が原稿の向きに対して直交する場合には、主走査方向のヒストグラムに行を表すピークが検出される。一方、文字が存在しない部分(行間)では、ヒストグラムのピークは検出されないため、ライン領域毎に見ると、いずれのライン領域でも、min値は0となる。すなわち、上記(式1)より、いずれのライン領域でもMTF値は1となる。上記(式1)からもわかるように、1はMTF値の最大値である。したがって、ライン領域毎のMTF値の、原稿内の平均値を取ると、文字行に傾きがない場合のヒストグラムについては、すなわち、天地認識を行うのに適当なヒストグラムが得られる状態においては、MTF値の平均値は高くなるといえる。
【0038】
一方、例えば、図7(b)に示されるように、文字行が傾いている場合には、主走査方向のヒストグラムのピークの幅が広がる場合があるため、ライン領域におけるmax値とmin値の差が小さい場合、すなわち、MTF値が小さい場合が発生する。したがって、原稿内のMTF値の平均値を取得すると、文字行が傾いている場合、すなわち、天地認識を行うのに適当なヒストグラムが得られない状態においては、MTF値の平均値が低くなる場合が多いと考えられる。文字行が傾いていると副走査方向のヒストグラムのエッジに規則性がなくなって天地認識が困難となる(図8(c)参照)。また、書籍原稿中に図形を含むような場合にもMTF値が低くなることは容易に推定できる。
【0039】
以上の内容から、原稿内のMTF値の平均値が低ければ、認識信頼度は低く正確な天地認識が不可能であると言える。
次に、第2の方法として、ヒストグラムのエッジカウントを利用した認識信頼度の計算方法について説明する。
この方法は、行方向と異なる方向に求めた場合において、ヒストグラムの立ち上がりエッジと、立ち下がりエッジの数をそれぞれカウントすると、通常の原稿では立ち下がりエッジの数の方が多くなることを利用したものである。
【0040】
図8は、このエッジカウントを利用した認識信頼度の取得方法について説明するための図である。同図の例において、420は原稿400により取得された主走査方向のヒストグラムを表す。また、同図(a)は、文字行に傾きがない場合の例、同図(b)は、文字行が原稿方向と平行であるが、センタリングされている場合の例、同図(c)は、文字行が傾いている場合の例を示すものである。
【0041】
同図(a)のように、文字行が傾いていない場合、すなわち、天地認識を行うために適切なヒストグラムを取得することができる場合においては、立ち上がりエッジの数と、立ち下がりエッジの数との差が大きくなる。文章の先頭位置がある程度一定しているため、立ち上がりエッジが2となるのに対し、文章の終わりの位置は分散していることから、立ち下がりエッジが4となるからである。
【0042】
しかし、同図(b)に示されるように文字行がセンタリングされている場合や、同図(c)に示されるように文字行が傾きを持った場合には、立ち上がりエッジの数と、立ち下がりエッジの数との差があまり顕著に現れない。
エッジカウントを利用した信頼度認識とは、以上に説明したような内容に基づき、立ち上がりエッジの数と立ち下がりエッジの数との差が大きいほど認識信頼度が高いと判定するものである。具体的には、原稿の行数にもよるが、平均的には両エッジの差が2以上の場合に、その天地認識が可能であると判断できる。
【0043】
なお、エッジカウントによる天地認識に不適な例として上記のように文字行が原稿に対して傾いている場合のほか、図9の書籍原稿の右ページのように図形(円グラフ)を含む場合にも天地認識が難しいといえる。その他、表や挿し絵などを含む原稿についても同じことが言える。
以上に説明したような方法のいずれか、または両方を用いて得られた認識信頼度が所定値以上(エッジカウント方式では立ち上がりエッジと立ち下がりエッジの差が2以上)であるか否かを判定し、これにより天地認識が可能か否かを判断する(ステップS130)。
【0044】
天地認識が可能であれば、上述した行方向と異なる方向のヒストグラムのエッジカウントにより原稿画像の天地認識を行う(ステップS140)。すなわち、上記ステップS110において行方向が判別されているので、さらに当該行方向と直交する方向のヒストグラムのエッジをカウントして立ち上がりエッジと立ち下がりエッジのどちらが多いかを判別することにより、それぞれの行頭の方向が分かるので最終的に原稿の上下を判別することができる。
【0045】
したがって、この天地認識処理において判別される内容は、原稿の上・下方向および判別不能の3種類になる。通常の書籍原稿においては、文字行が横方向(背表紙に対して直交する方向)であれば、横書きの文章であると認定できるし、文字行が縦方向(背表紙と平行な方向)であれば、縦書きの文章であると特定できるので、本実施の形態では上記のように上下の判別および判別不能のみを行うようにしている。
【0046】
なお、特殊な学問書などにおいては、まれに、文字行が縦方向であっても横書きである場合(図10の書籍原稿の右ページ参照)や、反対に文字行が横方向であっても縦書きの場合があるので、これらの場合には、原稿方向を上下のほかに左右の場合についても判別する方が望ましい。そのためには、天地認識の方法として、例えば、公知の文字認識の手法を採用すればよい。すなわち、原稿画像データから文字画像を切り出し、この画像に対し、内部のメモリに辞書として格納された文字のパターンを90°ずつ回転させながらマッチングさせていく方法を採用することにより、原稿の上下のほか左右の方向についても判別可能となる。
【0047】
図5に戻り、上記判定結果は、RAM171内に格納される(ステップS2)。次に、上記と同様にしてページBについて天地認識処理を実行し(ステップS3)、その結果を同じくRAM171に格納する(ステップS4)。
上記格納された両ページの認識結果から、まず、双方のページについて天地認識できたか否かを判断し、双方とも天地認識ができておれば、それぞれの認識結果をそのまま採用する(ステップS6)。
【0048】
ステップS5において、双方の天地認識ができてない場合は、ステップS7に移り、ページAの天地認識ができているか否かを判断し、ページAについて天地認識ができておれば、ページBの天地認識が不可能であったことになるので、ページAの認識結果をページBの認識結果として採用する。上述したように書籍原稿においては見開き両ページは、ほとんど同じ原稿方向であると断定してよいからである。
【0049】
ステップS7においてページAの天地の認識が不能の場合には、ステップS9に移って、今度はページBの天地認識ができているか否かを判断し、当該ページの天地認識ができておれば、ページAの天地認識が不能であったことになるので、上記と同じ理由によりページBの天地認識の結果をページAの天地認識として採用する。
【0050】
ステップS9において、ページAの天地認識も不可能であった場合には、もはや、ページA、B共に天地認識不可能と判断される(ステップS11)。
CPU170は、上記天地認識の結果にしたがって回転角情報を生成して回転処理部130に送出するが、ページA・Bともに天地認識不能の場合には、例えば、操作パネル90の液晶表示部91に天地認識不能である旨を表示させる。そして、操作者がそのメッセージにしたがって、書籍の天地を確認してプラテンガラス31上に載置し再度コピースタートキー95を押下すると今度は天地認識をせずにそのままの画像によりコピーを行うようにすればよい。但し、見開きのどちらのページを先にコピーするかは、それまでのページの認識結果に基づき、正方向に書籍が載置された場合を想定して決定すればよい。
【0051】
なお、本実施の形態では、モノクロ複写機に適用される画像認識装置の場合について説明したが、フルカラー複写機にも適用することは可能である。ただし、この場合には、原稿から生成した画像データから、有彩色のカラーデータを予めキャンセルする回路を組み込んでおき、モノクロの画像データのみから天地認識を行う方が望ましい。文字部分のほとんどはモノクロだからである。
【0052】
また、上記実施の形態においては、複写機に画像認識装置を組み込んだ例について説明したが、イメージリーダやプリンタなどの信号処理部に組み込むようにしてもよいし、さらには装置単体として構成し、適当なインターフェースを介して上記イメージリーダやプリンタなどに接続可能なようにしてもよい。
【0053】
【発明の効果】
以上に説明したように、本発明に係る画像認識装置にあっては、書籍原稿における見開きの各ページの画像データに基づきそのページ毎に原稿方向を判別し、見開き2ページのどちらか一方の原稿方向が判別不能であると判断された場合には、他方のページの判別結果を当該判別不能なページの原稿方向として採用するようにしているので、ページ毎に的確に原稿方向を認識することができる。
【図面の簡単な説明】
【図1】本発明に係る画像認識装置が適用される複写機の全体の構成を示す図である。
【図2】上記複写機の操作パネルの構成を示す図である。
【図3】上記複写機内部の制御部の構成を示すブロック図である。
【図4】本発明に係る画像認識装置における天地認識処理について説明するための図である。
【図5】上記制御部における天地認識処理の内容を示すフローチャートである。
【図6】図6のフローチャートにおけるページ毎の天地認識の内容を示すフローチャートである。
【図7】MTF値の算出について説明するための図である。
【図8】ヒストグラムのエッジカウントを利用した天地認識の信頼度の取得方法について説明するための図である。
【図9】天地認識が不可能なページを含む書籍原稿の例を示す図である。
【図10】文字行が背表紙と平行でありながら文字が横書きであるページを含む書籍原稿の例を示す図である。
【符号の説明】
38 CCDイメージセンサ
100 制御部
110 画像信号処理部
120 高解像度画像メモリ
130 回転処理部
140 LD駆動部
150 解像度変換部
160 低解像度認識用メモリ
170 CPU
171 RAM
172 ROM
Claims (2)
- 書籍原稿を読み取って得られた画像データに基づいてその原稿方向を認識する画像認識装置であって、
見開き2ページのそれぞれの画像データに基づきページ毎に原稿方向を判別する判別手段と、
前記判別手段により、見開き2ページのそれぞれのページの原稿方向が判別された場合は、その判別結果をそのまま当該ページの原稿方向として認識すると共に、見開き2ページのどちらか一方の原稿方向が判別不能であると判断された場合には、他方のページの判別結果を当該判別不能なページの原稿方向として認識する認識手段と、
を備えることを特徴とする画像認識装置。 - 前記判別手段は、各ページの原稿方向の判別に際しその信頼度を求め、当該信頼度が所定値以下の場合に、原稿方向が判別不能であると判断することを特徴とする請求項1記載の画像認識装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP25012498A JP3629969B2 (ja) | 1998-09-03 | 1998-09-03 | 画像認識装置 |
US09/350,128 US6798905B1 (en) | 1998-07-10 | 1999-07-09 | Document orientation recognizing device which recognizes orientation of document image |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP25012498A JP3629969B2 (ja) | 1998-09-03 | 1998-09-03 | 画像認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000083141A JP2000083141A (ja) | 2000-03-21 |
JP3629969B2 true JP3629969B2 (ja) | 2005-03-16 |
Family
ID=17203188
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP25012498A Expired - Fee Related JP3629969B2 (ja) | 1998-07-10 | 1998-09-03 | 画像認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3629969B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5896266B2 (ja) * | 2011-06-23 | 2016-03-30 | 富士ゼロックス株式会社 | 画像処理装置およびプログラム |
US9076058B2 (en) * | 2013-01-29 | 2015-07-07 | Sharp Laboratories Of America, Inc. | Methods, systems and apparatus for determining orientation in a document image |
JP6327162B2 (ja) * | 2015-01-27 | 2018-05-23 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
JP2017151493A (ja) | 2016-02-22 | 2017-08-31 | 富士ゼロックス株式会社 | 画像処理装置、画像読み取り装置及びプログラム |
-
1998
- 1998-09-03 JP JP25012498A patent/JP3629969B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000083141A (ja) | 2000-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7282687B2 (en) | Image forming apparatus having a processing deciding section and image formation controlling method | |
JP5114114B2 (ja) | 画像形成装置 | |
US6798905B1 (en) | Document orientation recognizing device which recognizes orientation of document image | |
JP3695163B2 (ja) | 画像形成装置 | |
US20090125841A1 (en) | Operation panel and electric device including the same | |
US9898237B1 (en) | System and method of printing using mixed paper sizes | |
US11736641B2 (en) | Apparatus and method for creating images from documents | |
US20200028985A1 (en) | Image forming apparatus | |
JPH09205544A (ja) | 読取り画像の修正方法及び画像読取り装置 | |
JP2010098680A (ja) | 画像形成装置 | |
JPWO2019008919A1 (ja) | 原稿読取装置 | |
JP3629969B2 (ja) | 画像認識装置 | |
JP3671682B2 (ja) | 画像認識装置 | |
JPH07245682A (ja) | 画像読取装置及びそれを組み込んだ複写機 | |
JP4050371B2 (ja) | 画像処理装置 | |
JP2007096662A (ja) | 画像読取装置及び画像処理装置 | |
JP3629959B2 (ja) | 画像認識装置 | |
JPH1169096A (ja) | 画像形成装置 | |
JPH08227192A (ja) | 紙づまりからの復旧を改良した複写装置および複写方法 | |
JP3629962B2 (ja) | 画像認識装置 | |
JP6354705B2 (ja) | 画像処理装置 | |
JP3675181B2 (ja) | 画像認識装置 | |
JP5746602B2 (ja) | 画像処理装置及び画像処理方法 | |
JP3987850B2 (ja) | 画像処理装置及び画像形成装置 | |
JP6844522B2 (ja) | 画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20041124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20041207 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071224 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081224 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081224 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091224 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101224 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101224 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111224 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111224 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121224 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131224 Year of fee payment: 9 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |