JP3684036B2 - 画像処理装置及び画像処理方法 - Google Patents

画像処理装置及び画像処理方法 Download PDF

Info

Publication number
JP3684036B2
JP3684036B2 JP17862997A JP17862997A JP3684036B2 JP 3684036 B2 JP3684036 B2 JP 3684036B2 JP 17862997 A JP17862997 A JP 17862997A JP 17862997 A JP17862997 A JP 17862997A JP 3684036 B2 JP3684036 B2 JP 3684036B2
Authority
JP
Japan
Prior art keywords
document
color
image
color component
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP17862997A
Other languages
English (en)
Other versions
JPH1127545A (ja
Inventor
真琴 高岡
彰信 西方
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP17862997A priority Critical patent/JP3684036B2/ja
Priority to US09/110,022 priority patent/US6295385B1/en
Publication of JPH1127545A publication Critical patent/JPH1127545A/ja
Application granted granted Critical
Publication of JP3684036B2 publication Critical patent/JP3684036B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/242Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees

Description

【0001】
【発明の属する技術分野】
本発明は、例えばファクシミリ(FAX)機能、ファイリング機能等を有するデジタル複合複写機やスキャナ機器等の画像処理装置及び画像処理方法に関するものである。
【0002】
【従来の技術】
近年、複写機もデジタル化が進み、かなりの複写機がコピー機能に限らず複合動作が可能となってきた。特に、コピー、プリンタ、FAX、更にファイリング、といった複合動作を行なうようになってきており、例えばファイリングされたデータを読み出してプリントしたり、FAXで送られてきた画像をファイリングしたりする複合動作が可能である。
【0003】
このように高度化してきたデジタル複写機は、利用者が気軽にコピー感覚で、オートフィーダに原稿を載せてFAXしたり、ファイリングしたりできるため、よく使用されるようになってきた。
【0004】
また、デジタル複写機の動作速度も年々向上し、1分間に20枚〜80枚位の入出力速度を出せるようになってきている。そのため、利用者は、沢山の原稿をコピー、ファイリング、或いはFAXを行ないたい場合、動作速度の遅い従来の専用機を使わず、この種のディジタル複写機を使用することが多くなってきた。つまり、利用者は、大量の原稿を処理するため、機械の前に張り着いて、原稿がすべて読み込まれるまで待っていたり、時間を開けて再び原稿を取りに行くのがとても煩わしく感じられ、高速のデジタル複写機を使用するのである。
【0005】
しかしながら、従来このように大量の原稿を処理するため、複写機のところに持っていく際に、原稿の向きが揃っていない場合、前もって原稿の向きを揃えるように人間が整理してから、動作に望んでいた。
【0006】
上述のデジタル複写機で複数枚の原稿をコピーしたり、FAXしたりする際に、原稿の向きを整理する作業は煩わしい作業である。特に、A4サイズの原稿の場合、縦方向の原稿の場合は簡単だが、横向き(A4R)の原稿が混在している場合、左右どちらに向かせるか悩むところである。通常、複写機は、フィーダに載せるのにA4原稿の場合、縦方向に載せるが、場合によってはA4Rの方向に紙を載せたりする場合もある。また、A4R(横向き)の原稿の場合、正方向の原稿の向きをフィーダの口に合わせたり、逆方向の向きを合わせたりする場合がある。さらに原稿の片側にバインダのための穴が開けてあると、オートフィーダに原稿を乗せる際に、ひっくり返して乗せる場合がある。
【0007】
図1は、A4サイズの通常の文書原稿をオートフィーダー101にセットする際の方向102〜109を示す図である。図示するように、実に多種類のセット方法がある。
【0008】
このように原稿のセットの仕方もまちまちであるため、利用者によって原稿の向きの整理の仕方もまちまちであった。
【0009】
このため、原稿が整理されていなければ、そのままあっちこっち向いたコピー用紙が排出されていた。このような場合、コピー枚数が少なければ良いが、大量で、しかもオートステイプル機器を用いると、そのまま固定されてしまう。また、最近よく利用されるようになってきた縮小レイアウト機能も原稿を載せたままの状態で複数枚の原稿が1枚にレイアウトされてコピーされてしまう。
【0010】
そこで、利用者が原稿の向きを整理することなく、さらには、人による原稿の向きセットの相違による違いを解決するために、原稿向き判別技術が開発されてきた。この原稿向き検知技術をデジタル複写機に搭載することにより、利用者は原稿を整理するといった煩わしさから解放されることになる。
【0011】
代表的な方向判別技術は、文字認識の技術を利用する方法、レイアウト認識の技術を利用する方法等がある。これらの技術は、原稿中に書かれた内容の一部を瞬時に判断し、その結果を出力する高速処理を行なっている。例えば、文字認識技術の応用で方向を判別する方法は、原稿中の文字領域を抽出し、その文字領域の文字を認識して正しい方向を判別する方法である。
【0012】
【発明が解決しようとする課題】
しかしながら、原稿向き判別技術は文書原稿中の、文書の特徴を認識し、その原稿の向きを認識する技術であるが、その性能は完璧ではない。時には、判断を誤ることもある。特に、近年はカラー文書が多く作成されるような時代となり、原稿向き判別もカラー原稿に対しても正しく判別しなければならなくなった。
【0013】
従来は、白黒原稿を対象としていたため、画像を入力する時は白黒2値画像を用いて方向判別を行なってきた。
【0014】
これに対し、デジタル複合複写機の場合、スキャナとしての機能も重要なため、例え白黒コピー機であったとしても、カラーCCDを搭載し、入力はカラーで行なうことが可能なものも多い。
【0015】
しかしながら、方向判別機能は、白黒原稿処理のため、せっかく色情報があるのに、その情報を捨ててしまっていた訳である。このため、以下のような原稿に対して、方向判別処理がうまく作動しないという課題があった。
【0016】
(1)最近よく用いられる2色刷り、3色刷りの原稿を画像入力すると、色により、肝心の文字部が掠れたりして、正しく方向判別ができなかった。
【0017】
(2)最も重要な方向性を表す色文字部が、方向判別処理の対象部からはずれる場合があった。
【0018】
(3)背景がある色で塗りつぶされ、その中に、他の色を用いた文字部があるような原稿で、うまく方向判別処理が作動しなかった。
【0019】
本発明は、上記課題を解決するためになされたもので、カラー画像に対して、精度の高い方向判別処理を行なう画像処理装置及び画像処理方法を提供することを目的とする。
【0020】
【課題を解決するための手段】
上記目的を達成するために、本発明の画像処理装置は、文書原稿をカラー画像データとして読み取って入力する画像入力手段と、前記入力されたカラー画像データを構成する各色成分の出現頻度を解析する色成分解析手段と、前記色成分解析手段による解析結果に基づいて前記入力されたカラー画像データを構成する各色成分毎に文字認識を行ない、当該文字認識の結果に基づいて前記文書原稿の方向を判別する方向判別手段と、前記方向判別手段での判別結果に応じて前記カラー画像データに応じたデータに対して所定の編集を行なう画像編集手段と、前記画像編集手段編集された画像データを出力する出力手段とを有することを特徴とする。
【0021】
また、上記目的を達成するために、本発明の画像処理方法は、文書原稿をカラー画像データとして読み取って入力する画像入力工程と、前記入力されたカラー画像データを構成する各色成分の出現頻度を解析する色成分解析工程と、前記色成分解析工程での解析結果に基づいて前記入力されたカラー画像データを構成する各色成分毎に文字認識を行ない、当該文字認識の結果に基づいて前記文書原稿の方向を判別する方向判別工程と、前記方向判別工程での判別結果に応じて前記カラー画像データに応じたデータに対して所定の編集を行なう画像編集工程と、前記画像編集工程で編集された画像データを出力する出力工程とを有することを特徴とする。
【0022】
【発明の実施の形態】
以下、図面を参照しながら本発明に係る実施の形態を詳細に説明する。
【0023】
尚、本実施形態では、本発明の適用例としてデジタル複合複写機を例に説明するが、これに限るものではなく、他の種々の装置に適用できることは言うまでもない。
【0024】
図2は、本実施形態におけるデジタル複合複写機の外観を示す図である。同図において、201はイメージスキャナ部であり、原稿を読み取り、デジタル信号処理を行なうところである。尚、このスキャナ部201には、オートフィーダーと呼ばれる自動紙送り装置も含まれている。また、スキャナ部201のセンサとして色情報を読み込むことが可能なカラーセンサが装備されている。
【0025】
一方、202はプリンタ部であり、イメージスキャナ部201で読み取られた原稿画像に対応した画像を用紙にプリントする部分である。また、203は電話線であり、外部装置とのファクシミリ送受信等に用いられる。
【0026】
図3は、本実施形態における画像処理系の構成を示すブロック図である。同図において、301はシェーディング補正部であり、不図示のRGBカラーCCDで読み取られた電気信号における画素間のばらつきを補正する。302はカラー白黒変換部であり、RGB色画像データを白黒グレースケール画像へ変換する。この変換方法として、厳密にはRGB輝度データより明度データへ変換する方法があるが、G(グリーン)データを用いてもさほど問題はない。303はエッジ強調回路であり、文字や表等のエッジを強調する処理を行なう。例えば、5×5のウインドウで2次微分を行ない、画像のエッジを強調する。
【0027】
304は変倍回路であり、縮小コピー時はデータの間引き処理を行ない、拡大コピー時はデータの補間を行なう。また、両面や縮小レイアウトをする時は後述するページメモリに蓄えられ、操作パネルからの指示に従ったコピーになるようにメモリから読み出すアドレスを切り替えながら、画像データが読み出される。305はγ変換回路であり、輝度データである画像データをプリンタに出力するための濃度データに変換する。尚、このデータ変換は、テーブルサーチ等により行なわれる。306はPWM回路であり、濃度データに変換された画像データをレーザの発光強度の信号に変換し、画像データの濃度に従ったパルス幅を不図示のレーザユニットに対して出力する。
【0028】
312はCPU部であり、本処理系をコントロールする心臓部である。また、CPU部312には本装置のプログラムや制御データを格納するROM、CPUが処理を実行時に使用するワークエリアや各種テーブル等が定義されたRAM、及び周辺回路等が含まれる。311は利用者の指示を受け付けるオペレーションパネル部であり、あらゆる指示がここで行なわれる。ここで受け取った指示又は命令はCPU部312に送られる。307は本実施形態における色成分解析部であり、RGBカラーデータの各画素成分がどの程度存在するか解析する。
【0029】
308は方向判別処理部であり、色成分解析部307から入力された解析結果313を考慮し、シェーディング補正部301でシェーディング補正された画像データを解析し、その文書の方向を判別する。具体的には、色成分解析部307で解析された結果313を用いて、その色を優先的に用いるか背景色を検知してその色成分の情報は用いないなどの判断を行なう。
【0030】
309はページメモリであり、入力された画像データをページ毎に蓄積する。尚、本処理系では、画像データがリアルタイムで入力されており、方向判別処理部308では文書画像1ページ分の画像データを入力しながら、即座に方向判別結果をCPU部312に通知し、その結果によりCPU部312がページメモリ309の読み出し順序を制御する。また、コピー動作時は、画像データがページメモリ309より読み出され、γ変換回路305へ送られる。310はスキャナユニットであり、スキャナ動作時に読み取った画像データを外部へ送出する。
【0031】
以上の構成において、オペレーションパネル部311から方向判別処理と縮小レイアウト送信が選択されると、CPU部312は方向判別処理部308に判別処理実行をセットする。ここで、画像データの流れは、RGBのCCDより電気信号を受け、シェーディング補正部301で補正される。そして、RGBカラーデータは、出力先が白黒プリンタの場合、カラー白黒変換部302で白黒データに変換される。これは、白黒プリンタでプリントする場合、カラーデータを必要としないためである。ちなみに、カラースキャナ入力が指示されていた場合は、この系は素通りする。そして、エッジ強調部303で、エッジ強調(選択指示された場合のみ)され、変倍処理部304に受け渡される。
【0032】
また、上述の処理と同時に、シェーディング処理された画像データは色成分解析部307にも送られ、色成分解析部307が画像データを入力しながら色成分解析を行なう。この色成分解析部307は、RGB多値画像データをある特定のスライスレベルで2値化し、その2値データを各色毎に加算していく。つまり、R,G,B,C,M,Y別々に加算していき、全画像領域についてカウントすると、その結果を方向判別処理部308に送る。この色成分解析部307の詳細は更に後述する。
【0033】
次に、方向判別処理部308は、逐次画像データを入力し、文字領域の抽出を行ないながら文字領域画像データを蓄積していく。その後、文字領域抽出が終了すると、色成分解析部307の解析結果313に基づいて優先順位の高い色画像の文字領域から方向判別処理を行なう。そして、その判別結果をCPU部312に送出する。
【0034】
一方、変倍回路304で間引かれた画像データは、ページメモリ309に一時格納される。尚、ページメモリ309の容量によるが、画像データは多数枚ここに一時的に格納される。次に、方向判別処理結果に基づいて、正規な方向でない画像を回転処理(読み出し方を工夫することで対処できる)し、1ページ分蓄積する。そして、画像データは、複写機動作では、γ変換回路305でプリンタの特性に変換され、PWM部306を介してレーザプリントが行なわれる。
【0035】
図4は、本実施形態におけるオペレーションパネル部311の構成を示す外観図である。同図において、401は拡張機能キーであり、コピーを行なう際に、縮小レイアウトを行なうかどうか、自動原稿方向検知のオン/オフ、カラー原稿の選択等のモード選択機能を有する。そして、利用者は、コピーを行なう際に、拡張機能キー401により縮小レイアウトを行なうかどうかを選択する。
【0036】
ここで、コピー時の縮小レイアウトについて説明する。図5は、複数枚の原稿を縮小レイアウトした状態を示す図である。図5に示す(a),(c),(e),(g)は片面縮小レイアウトを、また(b),(d),(f),(h)は両面縮小レイアウトを示すものである。この両面機能は、紙が節約になり、配布資料などはかさばらなくて済むため、よく用いられるようになった機能である。
【0037】
しかしながら、このような縮小レイアウトは文書の中身がどんなものであれ、機械的に縮小レイアウトされてしまう。図6は、4in1の両面縮小レイアウトの例を示す図である。図示するように、文書には、日本語の場合縦書き、横書きがあり、紙面は縦置き、横置きの配置がある。つまり、上向き横書き文書601〜604の場合は605,606のように、上向き縦書き文書607〜610の場合は611,612のように、左向き縦書き文書613〜616の場合は617,618のように、そして、左向き横書き文書619〜622の場合は623,624のようにそれぞれ縮小レイアウトされる。
【0038】
図6からも明らかなように、実際縮小レイアウトされたコピーは利用者が見て最適なレイアウトと言えるものではなっかた。
【0039】
図7は、本実施形態における縮小レイアウトの結果を示す図である。図示するように、原稿の向きによってその配置が最適にレイアウトされている。つまり、上向き横書き文書701〜704の場合は705,706のように、上向き縦書き文書707〜710の場合は711,712のように、左向き縦書き文書713〜716の場合は717,718のように、そして、左向き横書き文書719〜722の場合は723,724のようにそれぞれ縮小レイアウトされる。
【0040】
このような縮小レイアウトの最適原稿配置を実現するために、原稿方向検知を行ない、その原稿の向きから最適な縮小レイアウトが可能となる。
【0041】
次に、上述の縮小レイアウトを行なう動作について説明する。図8は、本実施形態における縮小レイアウト処理を示すフローチャートである。
【0042】
まず、ステップS801において、図4に外観を示すオペレーションパネル部311の動作モード(コピー/ファクス/ファイル)選択キー402からコピー動作が選択され、ステップS802で拡張機能キー401により縮小レイアウトが選択される。具体的には、拡張機能キー401が押下されると、表示モードが図5に示したそれぞれの縮小レイアウト画面表示に変更され、その表示画面から所望のレイアウト方法が選択される。
【0043】
次に、ステップS803において、初期設定機能により方向判別機能の設定を行なう。その際、色成分解析を行なうかどうかも選択される。そして、ステップS804で方向判別機能を選択するキーが選択される。尚、この“原稿方向検知ON&色成分解析ON&コピー”にて色成分解析方向判別モードが選択される。その後、ステップS805において、コピースタートキーが押され、ステップS805でコピー動作をスタートする。次に、ステップS806において、原稿を給紙し、原稿台の上に原稿が配置される。そして、複写機の読み取り機構が移動して画像読み取りを開始する。
【0044】
次に、ステップS809において、読み取られた画像データは上述の画像処理が施され、ページメモリ309に一時保存される一方、ステップS807では、色成分解析部307によって画像のカラー画素解析が行なわれる。また同時に、ステップS808では、色別の文字領域抽出が行なわれる。そして、ステップS810において、1ページ分の解析結果が方向判別処理部308に送られ、方向判別処理が行なわれる。
【0045】
そして、ステップS811において、方向判別処理結果をページ毎に一時記憶し、続くステップS812で縮小レイアウトを指示された枚数、例えば4in1は4枚のように給紙したかどうか確認する。ここで、画像データが揃ったならばステップS813に進み、正方向縮小レイアウト順に画像を読み出し、プリントを行なう。そして、ステップS814で排紙し、ステップS815では全て終了かどうか判断し、終了するまで上述の動作を繰り返す。
【0046】
このように、本実施形態では、デジタル複写機やスキャナ機器で方向判別手段のために画像を入力する際に、従来、画像データとして白黒画像を入力していたものを、RGB各色成分画像で入力し、RGB別に入力された画像データより、以下の処理を行なう。
(1)あるしきい値で各色別に2値化する。各色毎に画素データを加算する。
【0047】
例えば、RED,BLUE,GREEN,CYAN,MAGENTA,YELLOWの色別に色画素数を求める。その画素数、色数の多い順、色ごとの頻度数を方向判別処理部へ渡す。
(2)方向判別処理の前処理である文字領域抽出手段は、各色画像別に文字領域抽出を行なう。
(3)方向判別処理部は、前記色成分解析結果、色別の文字領域情報に基づいて方向判別処理を行なう。その際、色成分解析結果は、サンプリングする文字領域の優先順位を決定する情報になる。色成分情報は、最も多く使われている色画像を優先順位を上げたり、逆に下地で用いられている色画像は、とびぬけて画素数が多いため、その色は省いたりする判断が可能である。
【0048】
従って、本実施形態によれば、色情報を用いて原稿方向判別を行なうことで、カラー原稿に対する精度の高い方向判別処理を実現するようになる。
【0049】
次に、上述の各処理部について詳細に説明する。従来、文書の方向判別の手法にはいくつかの手法があるが、本実施形態では文書の方向を決定する大きな要素として文字の方向が最も重要であろうと考え、文字の方向を判別し、文書の方向を判別する方法について説明する。
【0050】
通常、活字文書は、ワープロ作成文書の他に、図、表、絵などが混在している場合が多い。その場合、文字部のみを領域判別し、文字認識手法の一部を用いて方向を判別する。
【0051】
[色成分解析処理]
図9は、色成分解析部307の処理を説明するための図である。色成分解析部307では、RGBカラーセンサより入力された多値画像データを所定のしきい値で2値化する。例えば、REDセンサの画像データの値が「130」であれば、しきい値50で2値化すると、“1”となる。そして、REDセンサで“1”となった画像の値をライン毎とページ全体で加算する。つまり、よりREDの色が多く出現するとより加算結果が多くなる。この処理をGREEN,BLUEのセンサでも行なう。
【0052】
図9に示す(B)は、各色毎のヒストグラムの例を示す図である。図中に示す記号「▲」はしきい値である。図から分かるように、しきい値より大きな画素値が多いと色成分が大きいと判断する。また、CYANの色成分を抽出する方法として、GREENセンサの画像データとBLUEセンサの画像データとの平均をとり、CYANの画像データとする。同様に、MAGENTA,YELLOWの画像データも作成する。図9に示す(C)はRBGからCMYを求める式を示す図である。
【0053】
この処理により、RED,GREEN,BLUE,CYAN,MAGENTA,YELLOWの各色成分のライン毎とページ全体の加算結果が得られる。図9に示す(D)は、各色毎の画素数の一例を示す図である。この例では、1ページの中で、GREENが一番多く、続いてYELLOWとなる。この数値が重要な判断材料となる。つまり、以下のような判断が可能である。
【0054】
(1)最も多い文字部を利用して文書の方向を判別する。この場合、色の多い順に優先順位をつける。
【0055】
(2)背景色は抜かす。この場合、極端に色画素数が多く、2番目以降と差が激しいものを背景色と見なす。
【0056】
そして、この処理結果が次の続く方向判別処理部308で、色成分解析結果として用いられる。
【0057】
尚、色成分処理部307は、各色毎に並行して処理を行なうことで、画像処理系のパイプライン処理には追随できる。また、所定のしきい値は、各色毎に設定可能である。このパラメータを可変することにより、2値化のしきい値が変更できる。これにより、センサのばらつきの補正や意識的にある色成分を強調させた結果も得ることが可能である。
【0058】
[文字方向判別前処理]
以下は、色別に同時に行なう処理である。
<2値化処理>
本処理系は、次に続く方向判別の前処理である。ここでは、画像データは多値データを用いる。この2値化処理は、画像から文字部を抽出する目的で行なう。そのため、単純2値化の方法で良い。簡単な方法は、中間の値である“128”をスライスレベルとする方法である。
【0059】
しかしながら、原稿に下地があったり、比較的薄い濃度の原稿の場合、2値化後の画像がその後の処理に適さない場合がある。このような場合、ダイナミックスライスレベルを用いた2値化処理方法がある。
【0060】
この処理は、注目画素の前の列の輝度、或いは濃度データの平均と注目画素の輝度、或いは濃度の値よりスライスレベルを決定し、単純2値化する。
【0061】
また、多値画像データを受け取るのではなく、2値化データを受け取る方法もあるが、後に続く本処理に都合の良いデータが得られればよい。
<文字領域抽出処理>
方向判別処理は、画像データより、文字領域の検出を行なう。これは、本実施形態のアルゴリズムでは、文字を方向判別の手段に用いるためである。
【0062】
まず、画像データより黒画素を検出して行き、ある一定の条件を満たす領域を検出すると、その部分は文字領域と判別し、その領域情報を保存する。
【0063】
ある一定の条件とは、以下の条件である。
【0064】
(1)黒画素の連続したエッジがある。
【0065】
(2)ある一定の黒画素幅である。
【0066】
(3)近辺に同様な黒画素ブロックが存在する。
【0067】
以上の条件を満たした領域を文字領域と判断する。もちろん、これだけの条件では正確な判別ができないが、詳細はここでは割愛する。
【0068】
図10は、原画像と文字領域判別結果を示す図である。図10に示す(a)は原画像であり、画像中には文字の部分、絵の部分、グラフの部分などが書かれている。図10に示す(b)は、原画像の中から抽出した文字領域を示している。つまり、図中の1001〜1005が原画像から判別された文字領域である。
【0069】
文字領域の中で、1002は比較的大きな文字のブロックであり、1003は文字数の多い一番広い領域に渡る文字領域である。そして、1005は縦書きの文字領域である。
<文字認識処理>
次に、抽出された文字領域に対して文字認識処理を行なう。この文字認識処理の方法としては、特徴ペクトル抽出、比較方式等がある。例えば、図11に示す(a)のように、「売」という文字を含む文字領域が判別された場合、第一段階として、この文字領域について文字切り出し処理を行なう。これは、一つの文字の矩形を切り出す処理で、連続する黒画素の状態を検出することで求められる。次に、第二段階として、図11に示す(b)のように、一文字をm×n(例えば64×64)の画素ブロックに切り出す。そして、図11に示す(c)のように、その中から2×2画素のウィンドウを用いて黒画素の分布方向(方向ベクトル情報)を抽出する。
【0070】
尚、図11に示す(c)は、方向ベクトル情報の一部を例示したものであり、上述の2×2画素のウィンドウをずらしてゆき、方向ベクトル情報を数十個得ることで文字の特徴とする。この特徴ベクトルと予め記憶されている文字認識辞書の内容とを比較して、特徴ベクトルが一番近い文字から順番に文字を抽出する。この場合、特徴ベクトルが特徴に近い順番に第1候補、第2候補、第3候補、…となる。この特徴ベクトルに対する特徴の近さが、専門用語では、その文字に対する距離の近さ、即ち文字認識の類似度(マッチ度)という数値となる。
【0071】
[方向判別処理]
このようにして文字認識の類似度が求められるが、その類似度に基づいた文字方向判別処理について説明する。図12は、文字方向判別処理を説明するための図であり、この例では「ビールの売り上げ」という文例を用いている。
【0072】
図12に示す(a)は正方向の文字列であり、図12に示す(b)は270°回転した文字列である。ここで、文字「売」に注目すると、文字方向を判別する場合、図12に示す(c)のように、1つの文字「売」について0°,90°,180°,270°の4方向から文字認識を行なってみる。ここで、各回転角度は各文字の特徴ベクトルの読み出し方を変更すればよく、特に原稿を回転させる必要はない。
【0073】
各回転角度における文字認識結果は、図12に示す(c)のように、互いに異なっている。尚、図12に示す(c)には、説明用の仮の文字認識結果と類似度が示されているが、現実にこの通りになるとは限らない。
【0074】
図12に示す(c)において、正方向(0°)から文字認識を行った場合は、「売」と正しく認識され、類似度も0.90と高い値となる。また、90°回転した方向から文字認識を行った場合は、「版」と誤認識され、類似度も0.40と低下する。このように誤認識が発生し、類似度も低下するのは、回転した方向から見た場合の特徴ベクトルに基づいて文字認識を行ったからである。同様に、180°,270°回転した方向から文字認識を行った場合も、誤認識が発生し、類似度も低下する。このように、文字認識の方向別の類似度は、複雑な文字であればある程、その差が顕著に現れてくる。
【0075】
図12に示す(c)の結果は、正方向の場合に類似度が1番高いため、文書は正方向に向いている可能性が高いと判断される。しかし、文字方向判別の精度を向上させるため、同一ブロック内の複数の文字について、同様に4方向から文字認識を行なってみる。また、1つのブロックだけで文字方向を判別した場合、特殊な文字列について文字方向を誤って判別する恐れがあるので、複数のブロックについて同様の文字認識を行なってみる。
【0076】
そして、各ブロックについて、当該ブロック内の各認識対象文字の4方向別の類似度の平均値を求め、更に各ブロックでの4方向別の類似度の平均値に対する平均値を求め、これらの平均値が最も高い方向を文字(文書)の方向として判定する。
【0077】
このように、1文字だけの類似度で文字方向を判定するのではなく、同一ブロック内の複数文字、更には他のブロック内の複数文字の類似度で文字方向を判定することにより、文字(文書)方向を高精度に判別することが可能となる。但し、1文字だけの自身度で文字方向の判別を行なったり、或いは同一ブロック内の複数文字の類似度で文字方向を判別しても、方向判別は行なうことができる。
【0078】
このような方法で、原稿方向判別を行なうが、文書中の文字はどのような状態になっているかまちまちである。例えば、ある文字は飾り文字であったり、ある文字は誤って図形を文字と判別していたりすることがある。このため、より多くの領域で方向判別処理を行なった方がより精度の高い結果が得られることは言うまでもない。
【0079】
以上原稿方向認識の一例を説明してきたが、認識方法は他の方式があることは言うまでもない。ここでは方向認識部としてそれらすべてを網羅する。
【0080】
尚、方向判別処理部は、一部専用ハードを搭載したCPUで構成されている。このため、指示により処理系を変更することは容易である。
【0081】
また、図9の説明にて、1ページ分の色成分解析を行なうように説明したが、原稿中のある特定のブロックだけで、例えば数ライン分の色成分解析結果を出力して、その数ライン毎に優先順位を変化させる方法をとることもできる。
【0082】
尚、本発明は複数の機器(例えば、ホストコンピュータ,インタフェイス機器,リーダ,プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機,ファクシミリ装置など)に適用してもよい。
【0083】
また、本発明の目的は前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(CPU若しくはMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
【0084】
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0085】
プログラムコードを供給するための記憶媒体としては、例えばフロッピーディスク,ハードディスク,光ディスク,光磁気ディスク,CD−ROM,CD−R,磁気テープ,不揮発性のメモリカード,ROMなどを用いることができる。
【0086】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0087】
更に、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0088】
【発明の効果】
以上説明したように、本発明によれば、例えば、出現頻度の最も高い色成分について、文字認識の結果を優先させて文書画像の方向を判別すること、或いは文書画像の背景色を方向判別の対象から除くことにより、カラー画像に対して精度の高い方向判別を行なうことができる
【0092】
【図面の簡単な説明】
【図1】A4サイズの通常の文書原稿をオートフィーダー101にセットする際の方向102〜109を示す図である。
【図2】本実施形態におけるデジタル複合複写機の外観を示す図である。
【図3】本実施形態における画像処理系の構成を示すブロック図である。
【図4】本実施形態におけるオペレーションパネル部311の構成を示す外観図である。
【図5】複数枚の原稿を縮小レイアウトした状態を示す図である。
【図6】4in1の両面縮小レイアウトの例を示す図である。
【図7】本実施形態における縮小レイアウトの結果を示す図である。
【図8】本実施形態における縮小レイアウト処理を示すフローチャートである。
【図9】色成分解析部307の処理を説明するための図である。
【図10】原画像と文字領域判別結果を示す図である。
【図11】文字認識処理を説明するための図である。
【図12】文字方向判別処理を説明するための図である。

Claims (9)

  1. 文書原稿をカラー画像データとして読み取って入力する画像入力手段と、
    前記入力されたカラー画像データを構成する各色成分の出現頻度を解析する色成分解析手段と、
    前記色成分解析手段による解析結果に基づいて前記入力されたカラー画像データを構成する各色成分毎に文字認識を行ない、当該文字認識の結果に基づいて前記文書原稿の方向を判別する方向判別手段と、
    前記方向判別手段での判別結果に応じて前記カラー画像データに応じたデータに対して所定の編集を行なう画像編集手段と、
    前記画像編集手段編集された画像データを出力する出力手段とを有することを特徴とする画像処理装置。
  2. 前記方向判別手段は、前記出現頻度が高いと解析された色成分の文字認識結果に基づいて前記文書原稿の方向を判別することを特徴とする請求項1記載の画像処理装置。
  3. 前記方向判別手段は、前記出現頻度に基づいて前記文書原稿の背景色と解析された色成分を前記判別の対象から除くことを特徴とする請求項1記載の画像処理装置。
  4. 前記画像編集手段は、複数の文書原稿の縮小レイアウト処理であることを特徴とする請求項1記載の画像処理装置。
  5. 文書原稿をカラー画像データとして読み取って入力する画像入力工程と、
    前記入力されたカラー画像データを構成する各色成分の出現頻度を解析する色成分解析工程と、
    前記色成分解析工程での解析結果に基づいて前記入力されたカラー画像データを構成する各色成分毎に文字認識を行ない、当該文字認識の結果に基づいて前記文書原稿の方向を判別する方向判別工程と、
    前記方向判別工程での判別結果に応じて前記カラー画像データに応じたデータに対して所定の編集を行なう画像編集工程と、
    前記画像編集工程で編集された画像データを出力する出力工程とを有することを特徴とする画像処理方法。
  6. 前記方向判別工程は、前記出現頻度が高いと解析された色成分の文字認識結果に基づいて前記文書原稿の方向を判別することを特徴とする請求項5記載の画像処理方法
  7. 前記方向判別工程は、前記出現頻度に基づいて前記文書原稿の背景色と解析された色成分を前記判別の対象から除くことを特徴とする請求項5記載の画像処理方法。
  8. 前記画像編集工程は、複数の文書原稿縮小レイアウト処理されることを特徴とする請求項記載の画像処理方法。
  9. コンピュータを請求項1記載の画像処理装置の各手段として機能させるためのプログラム記録たコンピュータ読み取り可能な記録媒体。
JP17862997A 1997-07-03 1997-07-03 画像処理装置及び画像処理方法 Expired - Fee Related JP3684036B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP17862997A JP3684036B2 (ja) 1997-07-03 1997-07-03 画像処理装置及び画像処理方法
US09/110,022 US6295385B1 (en) 1997-07-03 1998-07-02 Image processing apparatus and image processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17862997A JP3684036B2 (ja) 1997-07-03 1997-07-03 画像処理装置及び画像処理方法

Publications (2)

Publication Number Publication Date
JPH1127545A JPH1127545A (ja) 1999-01-29
JP3684036B2 true JP3684036B2 (ja) 2005-08-17

Family

ID=16051809

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17862997A Expired - Fee Related JP3684036B2 (ja) 1997-07-03 1997-07-03 画像処理装置及び画像処理方法

Country Status (2)

Country Link
US (1) US6295385B1 (ja)
JP (1) JP3684036B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3695163B2 (ja) * 1998-07-31 2005-09-14 コニカミノルタビジネステクノロジーズ株式会社 画像形成装置
EP0989738A1 (en) * 1998-09-22 2000-03-29 Hewlett-Packard Company Document analysis method to detect BW/color areas and corresponding scanning device
JP2001043310A (ja) * 1999-07-30 2001-02-16 Fujitsu Ltd 文書画像補正装置および補正方法
US6985642B2 (en) * 2002-01-31 2006-01-10 International Business Machines Corporation Image size reduction method and system
JP4047090B2 (ja) 2002-07-31 2008-02-13 キヤノン株式会社 画像処理方法及び画像処理装置
JP3962649B2 (ja) * 2002-07-31 2007-08-22 キヤノン株式会社 フォントダウンロード装置および方法
JP2004165863A (ja) * 2002-11-12 2004-06-10 Murata Mach Ltd カラー画像送信装置
US7349120B2 (en) * 2003-05-16 2008-03-25 Primax Electronics Ltd. Method for multiple-page scaling and composing printing
KR101198769B1 (ko) * 2007-07-13 2012-11-12 삼성전자주식회사 화상형성장치 및 그 제어방법
JP4968937B2 (ja) * 2007-10-12 2012-07-04 キヤノン株式会社 画像形成装置
JP4341716B2 (ja) * 2007-11-16 2009-10-07 コニカミノルタビジネステクノロジーズ株式会社 画像形成装置
JP2010211439A (ja) * 2009-03-10 2010-09-24 Fuji Xerox Co Ltd 文字出力装置およびプログラム
CN107203767B (zh) * 2017-05-24 2020-01-14 深圳市神视检验有限公司 一种辅助实现自动化无损检测的方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5276742A (en) * 1991-11-19 1994-01-04 Xerox Corporation Rapid detection of page orientation
JPH0723151A (ja) * 1993-07-05 1995-01-24 Ricoh Co Ltd 画像形成装置
JP3050007B2 (ja) * 1993-08-26 2000-06-05 ミノルタ株式会社 画像読取装置およびこれを備えた画像形成装置
US5761070A (en) * 1995-11-02 1998-06-02 Virginia Tech Intellectual Properties, Inc. Automatic color and grain sorting of materials
JP3562174B2 (ja) * 1995-11-13 2004-09-08 ミノルタ株式会社 画像処理装置

Also Published As

Publication number Publication date
JPH1127545A (ja) 1999-01-29
US6295385B1 (en) 2001-09-25

Similar Documents

Publication Publication Date Title
US8125679B2 (en) Image processing method and image processing apparatus
US7684620B2 (en) Image processing apparatus and method for dividing an image into component images
JP4586241B2 (ja) 画像処理装置
JP4135752B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
US7742197B2 (en) Image processing apparatus that extracts character strings from a image that has had a light color removed, and control method thereof
JP4732315B2 (ja) 画像処理装置及び方法
JP3684036B2 (ja) 画像処理装置及び画像処理方法
JP2002312777A (ja) 画像処理装置及びその方法
US8184344B2 (en) Image processing apparatus and image processing method, computer program and storage medium
JP2000175031A (ja) 画像処理装置、画像処理方法および画像入力装置
US8040571B2 (en) Image processing for extracting unique information from region of paper determined to be suitable
US8345980B2 (en) Image processing apparatus, image processing method, and computer-readable storage medium to determine whether a manuscript is an original by using paper fingerprint information
JP4709090B2 (ja) 画像処理装置及び画像処理装置の制御方法及びプログラム
JP3899872B2 (ja) 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
US8059296B2 (en) Image forming apparatus that synthesizes fiber information extracted from pages of a paper medium having a plurality of pages, and an image forming apparatus control method, a program, and a storage medium relating thereto
JP4396710B2 (ja) 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム
JP5020777B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP4498371B2 (ja) 画像処理装置および画像処理装置の制御方法
JP3899800B2 (ja) 画像処理装置、画像処理方法および画像処理プログラムを記録したコンピュータ読取可能な記録媒体
JP2002109542A (ja) 画像処理システム並びにデータ処理装置及び方法
JP2006109482A (ja) 画像処理方法、画像処理装置及び画像処理プログラム
JP2002027228A (ja) 画像処理のための装置、方法及び記録媒体
JP5284431B2 (ja) 二次元コードを復号化する装置、二次元コードを復号化する装置の制御方法、およびプログラム
JP4101188B2 (ja) 画像処理装置及び画像処理方法及びコンピュータプログラム
JPH10228530A (ja) 画像処理装置及び画像処理方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040826

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041029

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050510

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050527

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090603

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees