JPH1127545A - 画像処理装置及び画像処理方法 - Google Patents

画像処理装置及び画像処理方法

Info

Publication number
JPH1127545A
JPH1127545A JP9178629A JP17862997A JPH1127545A JP H1127545 A JPH1127545 A JP H1127545A JP 9178629 A JP9178629 A JP 9178629A JP 17862997 A JP17862997 A JP 17862997A JP H1127545 A JPH1127545 A JP H1127545A
Authority
JP
Japan
Prior art keywords
image data
color
document
image
color component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9178629A
Other languages
English (en)
Other versions
JP3684036B2 (ja
Inventor
Makoto Takaoka
真琴 高岡
Akinobu Nishikata
彰信 西方
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP17862997A priority Critical patent/JP3684036B2/ja
Priority to US09/110,022 priority patent/US6295385B1/en
Publication of JPH1127545A publication Critical patent/JPH1127545A/ja
Application granted granted Critical
Publication of JP3684036B2 publication Critical patent/JP3684036B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/242Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees

Landscapes

  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

(57)【要約】 【課題】 カラー画像に対して、精度の高い方向判別処
理を行なう画像処理装置及び画像処理方法を提供する。 【解決手段】 入力された文書原稿のカラー画像データ
から色成分解析部307で各色成分の出現頻度を求め、
方向判別処理部308で各色成分の出現頻度から文字認
識処理により文書原稿の方向を判別し、その判別結果に
応じて画像データに所定の編集を行ない、編集された画
像データを出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えばファクシミ
リ(FAX)機能、ファイリング機能等を有するデジタ
ル複合複写機やスキャナ機器等の画像処理装置及び画像
処理方法に関するものである。
【0002】
【従来の技術】近年、複写機もデジタル化が進み、かな
りの複写機がコピー機能に限らず複合動作が可能となっ
てきた。特に、コピー、プリンタ、FAX、更にファイ
リング、といった複合動作を行なうようになってきてお
り、例えばファイリングされたデータを読み出してプリ
ントしたり、FAXで送られてきた画像をファイリング
したりする複合動作が可能である。
【0003】このように高度化してきたデジタル複写機
は、利用者が気軽にコピー感覚で、オートフィーダに原
稿を載せてFAXしたり、ファイリングしたりできるた
め、よく使用されるようになってきた。
【0004】また、デジタル複写機の動作速度も年々向
上し、1分間に20枚〜80枚位の入出力速度を出せる
ようになってきている。そのため、利用者は、沢山の原
稿をコピー、ファイリング、或いはFAXを行ないたい
場合、動作速度の遅い従来の専用機を使わず、この種の
ディジタル複写機を使用することが多くなってきた。つ
まり、利用者は、大量の原稿を処理するため、機械の前
に張り着いて、原稿がすべて読み込まれるまで待ってい
たり、時間を開けて再び原稿を取りに行くのがとても煩
わしく感じられ、高速のデジタル複写機を使用するので
ある。
【0005】しかしながら、従来このように大量の原稿
を処理するため、複写機のところに持っていく際に、原
稿の向きが揃っていない場合、前もって原稿の向きを揃
えるように人間が整理してから、動作に望んでいた。
【0006】上述のデジタル複写機で複数枚の原稿をコ
ピーしたり、FAXしたりする際に、原稿の向きを整理
する作業は煩わしい作業である。特に、A4サイズの原
稿の場合、縦方向の原稿の場合は簡単だが、横向き(A
4R)の原稿が混在している場合、左右どちらに向かせ
るか悩むところである。通常、複写機は、フィーダに載
せるのにA4原稿の場合、縦方向に載せるが、場合によ
ってはA4Rの方向に紙を載せたりする場合もある。ま
た、A4R(横向き)の原稿の場合、正方向の原稿の向
きをフィーダの口に合わせたり、逆方向の向きを合わせ
たりする場合がある。さらに原稿の片側にバインダのた
めの穴が開けてあると、オートフィーダに原稿を乗せる
際に、ひっくり返して乗せる場合がある。
【0007】図1は、A4サイズの通常の文書原稿をオ
ートフィーダー101にセットする際の方向102〜1
09を示す図である。図示するように、実に多種類のセ
ット方法がある。
【0008】このように原稿のセットの仕方もまちまち
であるため、利用者によって原稿の向きの整理の仕方も
まちまちであった。
【0009】このため、原稿が整理されていなければ、
そのままあっちこっち向いたコピー用紙が排出されてい
た。このような場合、コピー枚数が少なければ良いが、
大量で、しかもオートステイプル機器を用いると、その
まま固定されてしまう。また、最近よく利用されるよう
になってきた縮小レイアウト機能も原稿を載せたままの
状態で複数枚の原稿が1枚にレイアウトされてコピーさ
れてしまう。
【0010】そこで、利用者が原稿の向きを整理するこ
となく、さらには、人による原稿の向きセットの相違に
よる違いを解決するために、原稿向き判別技術が開発さ
れてきた。この原稿向き検知技術をデジタル複写機に搭
載することにより、利用者は原稿を整理するといった煩
わしさから解放されることになる。
【0011】代表的な方向判別技術は、文字認識の技術
を利用する方法、レイアウト認識の技術を利用する方法
等がある。これらの技術は、原稿中に書かれた内容の一
部を瞬時に判断し、その結果を出力する高速処理を行な
っている。例えば、文字認識技術の応用で方向を判別す
る方法は、原稿中の文字領域を抽出し、その文字領域の
文字を認識して正しい方向を判別する方法である。
【0012】
【発明が解決しようとする課題】しかしながら、原稿向
き判別技術は文書原稿中の、文書の特徴を認識し、その
原稿の向きを認識する技術であるが、その性能は完璧で
はない。時には、判断を誤ることもある。特に、近年は
カラー文書が多く作成されるような時代となり、原稿向
き判別もカラー原稿に対しても正しく判別しなければな
らなくなった。
【0013】従来は、白黒原稿を対象としていたため、
画像を入力する時は白黒2値画像を用いて方向判別を行
なってきた。
【0014】これに対し、デジタル複合複写機の場合、
スキャナとしての機能も重要なため、例え白黒コピー機
であったとしても、カラーCCDを搭載し、入力はカラ
ーで行なうことが可能なものも多い。
【0015】しかしながら、方向判別機能は、白黒原稿
処理のため、せっかく色情報があるのに、その情報を捨
ててしまっていた訳である。このため、以下のような原
稿に対して、方向判別処理がうまく作動しないという課
題があった。
【0016】(1)最近よく用いられる2色刷り、3色
刷りの原稿を画像入力すると、色により、肝心の文字部
が掠れたりして、正しく方向判別ができなかった。
【0017】(2)最も重要な方向性を表す色文字部
が、方向判別処理の対象部からはずれる場合があった。
【0018】(3)背景がある色で塗りつぶされ、その
中に、他の色を用いた文字部があるような原稿で、うま
く方向判別処理が作動しなかった。
【0019】本発明は、上記課題を解決するためになさ
れたもので、カラー画像に対して、精度の高い方向判別
処理を行なう画像処理装置及び画像処理方法を提供する
ことを目的とする。
【0020】
【課題を解決するための手段】上記目的を達成するため
に、本発明の画像処理装置は、文書原稿をカラー画像デ
ータとして読み取って入力する画像入力手段と、前記画
像入力手段より入力されたカラー画像データに基づいて
前記文書原稿の方向を判別する方向判別手段と、前記方
向判別手段での判別結果に応じて前記カラー画像データ
に応じたデータに対して所定の編集を行なう画像編集手
段と、前記画像編集手段により編集された画像データを
出力する出力手段とを有することを特徴とする。
【0021】また、上記目的を達成するために、本発明
の画像処理方法は、文書原稿をカラー画像データとして
読み取って入力する画像入力工程と、前記画像入力工程
より入力されたカラー画像データに基づいて前記文書原
稿の方向を判別する方向判別工程と、前記方向判別工程
での判別結果に応じて前記カラー画像データに応じたデ
ータに対して所定の編集を行なう画像編集工程と、前記
画像編集工程で編集された画像データを出力する出力工
程とを有することを特徴とする。
【0022】
【発明の実施の形態】以下、図面を参照しながら本発明
に係る実施の形態を詳細に説明する。
【0023】尚、本実施形態では、本発明の適用例とし
てデジタル複合複写機を例に説明するが、これに限るも
のではなく、他の種々の装置に適用できることは言うま
でもない。
【0024】図2は、本実施形態におけるデジタル複合
複写機の外観を示す図である。同図において、201は
イメージスキャナ部であり、原稿を読み取り、デジタル
信号処理を行なうところである。尚、このスキャナ部2
01には、オートフィーダーと呼ばれる自動紙送り装置
も含まれている。また、スキャナ部201のセンサとし
て色情報を読み込むことが可能なカラーセンサが装備さ
れている。
【0025】一方、202はプリンタ部であり、イメー
ジスキャナ部201で読み取られた原稿画像に対応した
画像を用紙にプリントする部分である。また、203は
電話線であり、外部装置とのファクシミリ送受信等に用
いられる。
【0026】図3は、本実施形態における画像処理系の
構成を示すブロック図である。同図において、301は
シェーディング補正部であり、不図示のRGBカラーC
CDで読み取られた電気信号における画素間のばらつき
を補正する。302はカラー白黒変換部であり、RGB
色画像データを白黒グレースケール画像へ変換する。こ
の変換方法として、厳密にはRGB輝度データより明度
データへ変換する方法があるが、G(グリーン)データ
を用いてもさほど問題はない。303はエッジ強調回路
であり、文字や表等のエッジを強調する処理を行なう。
例えば、5×5のウインドウで2次微分を行ない、画像
のエッジを強調する。
【0027】304は変倍回路であり、縮小コピー時は
データの間引き処理を行ない、拡大コピー時はデータの
補間を行なう。また、両面や縮小レイアウトをする時は
後述するページメモリに蓄えられ、操作パネルからの指
示に従ったコピーになるようにメモリから読み出すアド
レスを切り替えながら、画像データが読み出される。3
05はγ変換回路であり、輝度データである画像データ
をプリンタに出力するための濃度データに変換する。
尚、このデータ変換は、テーブルサーチ等により行なわ
れる。306はPWM回路であり、濃度データに変換さ
れた画像データをレーザの発光強度の信号に変換し、画
像データの濃度に従ったパルス幅を不図示のレーザユニ
ットに対して出力する。
【0028】312はCPU部であり、本処理系をコン
トロールする心臓部である。また、CPU部312には
本装置のプログラムや制御データを格納するROM、C
PUが処理を実行時に使用するワークエリアや各種テー
ブル等が定義されたRAM、及び周辺回路等が含まれ
る。311は利用者の指示を受け付けるオペレーション
パネル部であり、あらゆる指示がここで行なわれる。こ
こで受け取った指示又は命令はCPU部312に送られ
る。307は本実施形態における色成分解析部であり、
RGBカラーデータの各画素成分がどの程度存在するか
解析する。
【0029】308は方向判別処理部であり、色成分解
析部307から入力された解析結果313を考慮し、シ
ェーディング補正部301でシェーディング補正された
画像データを解析し、その文書の方向を判別する。具体
的には、色成分解析部307で解析された結果313を
用いて、その色を優先的に用いるか背景色を検知してそ
の色成分の情報は用いないなどの判断を行なう。
【0030】309はページメモリであり、入力された
画像データをページ毎に蓄積する。尚、本処理系では、
画像データがリアルタイムで入力されており、方向判別
処理部308では文書画像1ページ分の画像データを入
力しながら、即座に方向判別結果をCPU部312に通
知し、その結果によりCPU部312がページメモリ3
09の読み出し順序を制御する。また、コピー動作時
は、画像データがページメモリ309より読み出され、
γ変換回路305へ送られる。310はスキャナユニッ
トであり、スキャナ動作時に読み取った画像データを外
部へ送出する。
【0031】以上の構成において、オペレーションパネ
ル部311から方向判別処理と縮小レイアウト送信が選
択されると、CPU部312は方向判別処理部308に
判別処理実行をセットする。ここで、画像データの流れ
は、RGBのCCDより電気信号を受け、シェーディン
グ補正部301で補正される。そして、RGBカラーデ
ータは、出力先が白黒プリンタの場合、カラー白黒変換
部302で白黒データに変換される。これは、白黒プリ
ンタでプリントする場合、カラーデータを必要としない
ためである。ちなみに、カラースキャナ入力が指示され
ていた場合は、この系は素通りする。そして、エッジ強
調部303で、エッジ強調(選択指示された場合のみ)
され、変倍処理部304に受け渡される。
【0032】また、上述の処理と同時に、シェーディン
グ処理された画像データは色成分解析部307にも送ら
れ、色成分解析部307が画像データを入力しながら色
成分解析を行なう。この色成分解析部307は、RGB
多値画像データをある特定のスライスレベルで2値化
し、その2値データを各色毎に加算していく。つまり、
R,G,B,C,M,Y別々に加算していき、全画像領
域についてカウントすると、その結果を方向判別処理部
308に送る。この色成分解析部307の詳細は更に後
述する。
【0033】次に、方向判別処理部308は、逐次画像
データを入力し、文字領域の抽出を行ないながら文字領
域画像データを蓄積していく。その後、文字領域抽出が
終了すると、色成分解析部307の解析結果313に基
づいて優先順位の高い色画像の文字領域から方向判別処
理を行なう。そして、その判別結果をCPU部312に
送出する。
【0034】一方、変倍回路304で間引かれた画像デ
ータは、ページメモリ309に一時格納される。尚、ペ
ージメモリ309の容量によるが、画像データは多数枚
ここに一時的に格納される。次に、方向判別処理結果に
基づいて、正規な方向でない画像を回転処理(読み出し
方を工夫することで対処できる)し、1ページ分蓄積す
る。そして、画像データは、複写機動作では、γ変換回
路305でプリンタの特性に変換され、PWM部306
を介してレーザプリントが行なわれる。
【0035】図4は、本実施形態におけるオペレーショ
ンパネル部311の構成を示す外観図である。同図にお
いて、401は拡張機能キーであり、コピーを行なう際
に、縮小レイアウトを行なうかどうか、自動原稿方向検
知のオン/オフ、カラー原稿の選択等のモード選択機能
を有する。そして、利用者は、コピーを行なう際に、拡
張機能キー401により縮小レイアウトを行なうかどう
かを選択する。
【0036】ここで、コピー時の縮小レイアウトについ
て説明する。図5は、複数枚の原稿を縮小レイアウトし
た状態を示す図である。図5に示す(a),(c),
(e),(g)は片面縮小レイアウトを、また(b),
(d),(f),(h)は両面縮小レイアウトを示すも
のである。この両面機能は、紙が節約になり、配布資料
などはかさばらなくて済むため、よく用いられるように
なった機能である。
【0037】しかしながら、このような縮小レイアウト
は文書の中身がどんなものであれ、機械的に縮小レイア
ウトされてしまう。図6は、4in1の両面縮小レイア
ウトの例を示す図である。図示するように、文書には、
日本語の場合縦書き、横書きがあり、紙面は縦置き、横
置きの配置がある。つまり、上向き横書き文書601〜
604の場合は605,606のように、上向き縦書き
文書607〜610の場合は611,612のように、
左向き縦書き文書613〜616の場合は617,61
8のように、そして、左向き横書き文書619〜622
の場合は623,624のようにそれぞれ縮小レイアウ
トされる。
【0038】図6からも明らかなように、実際縮小レイ
アウトされたコピーは利用者が見て最適なレイアウトと
言えるものではなっかた。
【0039】図7は、本実施形態における縮小レイアウ
トの結果を示す図である。図示するように、原稿の向き
によってその配置が最適にレイアウトされている。つま
り、上向き横書き文書701〜704の場合は705,
706のように、上向き縦書き文書707〜710の場
合は711,712のように、左向き縦書き文書713
〜716の場合は717,718のように、そして、左
向き横書き文書719〜722の場合は723,724
のようにそれぞれ縮小レイアウトされる。
【0040】このような縮小レイアウトの最適原稿配置
を実現するために、原稿方向検知を行ない、その原稿の
向きから最適な縮小レイアウトが可能となる。
【0041】次に、上述の縮小レイアウトを行なう動作
について説明する。図8は、本実施形態における縮小レ
イアウト処理を示すフローチャートである。
【0042】まず、ステップS801において、図4に
外観を示すオペレーションパネル部311の動作モード
(コピー/ファクス/ファイル)選択キー402からコ
ピー動作が選択され、ステップS802で拡張機能キー
401により縮小レイアウトが選択される。具体的に
は、拡張機能キー401が押下されると、表示モードが
図5に示したそれぞれの縮小レイアウト画面表示に変更
され、その表示画面から所望のレイアウト方法が選択さ
れる。
【0043】次に、ステップS803において、初期設
定機能により方向判別機能の設定を行なう。その際、色
成分解析を行なうかどうかも選択される。そして、ステ
ップS804で方向判別機能を選択するキーが選択され
る。尚、この“原稿方向検知ON&色成分解析ON&コ
ピー”にて色成分解析方向判別モードが選択される。そ
の後、ステップS805において、コピースタートキー
が押され、ステップS805でコピー動作をスタートす
る。次に、ステップS806において、原稿を給紙し、
原稿台の上に原稿が配置される。そして、複写機の読み
取り機構が移動して画像読み取りを開始する。
【0044】次に、ステップS809において、読み取
られた画像データは上述の画像処理が施され、ページメ
モリ309に一時保存される一方、ステップS807で
は、色成分解析部307によって画像のカラー画素解析
が行なわれる。また同時に、ステップS808では、色
別の文字領域抽出が行なわれる。そして、ステップS8
10において、1ページ分の解析結果が方向判別処理部
308に送られ、方向判別処理が行なわれる。
【0045】そして、ステップS811において、方向
判別処理結果をページ毎に一時記憶し、続くステップS
812で縮小レイアウトを指示された枚数、例えば4i
n1は4枚のように給紙したかどうか確認する。ここ
で、画像データが揃ったならばステップS813に進
み、正方向縮小レイアウト順に画像を読み出し、プリン
トを行なう。そして、ステップS814で排紙し、ステ
ップS815では全て終了かどうか判断し、終了するま
で上述の動作を繰り返す。
【0046】このように、本実施形態では、デジタル複
写機やスキャナ機器で方向判別手段のために画像を入力
する際に、従来、画像データとして白黒画像を入力して
いたものを、RGB各色成分画像で入力し、RGB別に
入力された画像データより、以下の処理を行なう。 (1)あるしきい値で各色別に2値化する。各色毎に画
素データを加算する。
【0047】例えば、RED,BLUE,GREEN,
CYAN,MAGENTA,YELLOWの色別に色画
素数を求める。その画素数、色数の多い順、色ごとの頻
度数を方向判別処理部へ渡す。 (2)方向判別処理の前処理である文字領域抽出手段
は、各色画像別に文字領域抽出を行なう。 (3)方向判別処理部は、前記色成分解析結果、色別の
文字領域情報に基づいて方向判別処理を行なう。その
際、色成分解析結果は、サンプリングする文字領域の優
先順位を決定する情報になる。色成分情報は、最も多く
使われている色画像を優先順位を上げたり、逆に下地で
用いられている色画像は、とびぬけて画素数が多いた
め、その色は省いたりする判断が可能である。
【0048】従って、本実施形態によれば、色情報を用
いて原稿方向判別を行なうことで、カラー原稿に対する
精度の高い方向判別処理を実現するようになる。
【0049】次に、上述の各処理部について詳細に説明
する。従来、文書の方向判別の手法にはいくつかの手法
があるが、本実施形態では文書の方向を決定する大きな
要素として文字の方向が最も重要であろうと考え、文字
の方向を判別し、文書の方向を判別する方法について説
明する。
【0050】通常、活字文書は、ワープロ作成文書の他
に、図、表、絵などが混在している場合が多い。その場
合、文字部のみを領域判別し、文字認識手法の一部を用
いて方向を判別する。
【0051】[色成分解析処理]図9は、色成分解析部
307の処理を説明するための図である。色成分解析部
307では、RGBカラーセンサより入力された多値画
像データを所定のしきい値で2値化する。例えば、RE
Dセンサの画像データの値が「130」であれば、しき
い値50で2値化すると、“1”となる。そして、RE
Dセンサで“1”となった画像の値をライン毎とページ
全体で加算する。つまり、よりREDの色が多く出現す
るとより加算結果が多くなる。この処理をGREEN,
BLUEのセンサでも行なう。
【0052】図9に示す(B)は、各色毎のヒストグラ
ムの例を示す図である。図中に示す記号「▲」はしきい
値である。図から分かるように、しきい値より大きな画
素値が多いと色成分が大きいと判断する。また、CYA
Nの色成分を抽出する方法として、GREENセンサの
画像データとBLUEセンサの画像データとの平均をと
り、CYANの画像データとする。同様に、MAGEN
TA,YELLOWの画像データも作成する。図9に示
す(C)はRBGからCMYを求める式を示す図であ
る。
【0053】この処理により、RED,GREEN,B
LUE,CYAN,MAGENTA,YELLOWの各
色成分のライン毎とページ全体の加算結果が得られる。
図9に示す(D)は、各色毎の画素数の一例を示す図で
ある。この例では、1ページの中で、GREENが一番
多く、続いてYELLOWとなる。この数値が重要な判
断材料となる。つまり、以下のような判断が可能であ
る。
【0054】(1)最も多い文字部を利用して文書の方
向を判別する。この場合、色の多い順に優先順位をつけ
る。
【0055】(2)背景色は抜かす。この場合、極端に
色画素数が多く、2番目以降と差が激しいものを背景色
と見なす。
【0056】そして、この処理結果が次の続く方向判別
処理部308で、色成分解析結果として用いられる。
【0057】尚、色成分処理部307は、各色毎に並行
して処理を行なうことで、画像処理系のパイプライン処
理には追随できる。また、所定のしきい値は、各色毎に
設定可能である。このパラメータを可変することによ
り、2値化のしきい値が変更できる。これにより、セン
サのばらつきの補正や意識的にある色成分を強調させた
結果も得ることが可能である。
【0058】[文字方向判別前処理]以下は、色別に同
時に行なう処理である。 <2値化処理>本処理系は、次に続く方向判別の前処理
である。ここでは、画像データは多値データを用いる。
この2値化処理は、画像から文字部を抽出する目的で行
なう。そのため、単純2値化の方法で良い。簡単な方法
は、中間の値である“128”をスライスレベルとする
方法である。
【0059】しかしながら、原稿に下地があったり、比
較的薄い濃度の原稿の場合、2値化後の画像がその後の
処理に適さない場合がある。このような場合、ダイナミ
ックスライスレベルを用いた2値化処理方法がある。
【0060】この処理は、注目画素の前の列の輝度、或
いは濃度データの平均と注目画素の輝度、或いは濃度の
値よりスライスレベルを決定し、単純2値化する。
【0061】また、多値画像データを受け取るのではな
く、2値化データを受け取る方法もあるが、後に続く本
処理に都合の良いデータが得られればよい。 <文字領域抽出処理>方向判別処理は、画像データよ
り、文字領域の検出を行なう。これは、本実施形態のア
ルゴリズムでは、文字を方向判別の手段に用いるためで
ある。
【0062】まず、画像データより黒画素を検出して行
き、ある一定の条件を満たす領域を検出すると、その部
分は文字領域と判別し、その領域情報を保存する。
【0063】ある一定の条件とは、以下の条件である。
【0064】(1)黒画素の連続したエッジがある。
【0065】(2)ある一定の黒画素幅である。
【0066】(3)近辺に同様な黒画素ブロックが存在
する。
【0067】以上の条件を満たした領域を文字領域と判
断する。もちろん、これだけの条件では正確な判別がで
きないが、詳細はここでは割愛する。
【0068】図10は、原画像と文字領域判別結果を示
す図である。図10に示す(a)は原画像であり、画像
中には文字の部分、絵の部分、グラフの部分などが書か
れている。図10に示す(b)は、原画像の中から抽出
した文字領域を示している。つまり、図中の1001〜
1005が原画像から判別された文字領域である。
【0069】文字領域の中で、1002は比較的大きな
文字のブロックであり、1003は文字数の多い一番広
い領域に渡る文字領域である。そして、1005は縦書
きの文字領域である。 <文字認識処理>次に、抽出された文字領域に対して文
字認識処理を行なう。この文字認識処理の方法として
は、特徴ペクトル抽出、比較方式等がある。例えば、図
11に示す(a)のように、「売」という文字を含む文
字領域が判別された場合、第一段階として、この文字領
域について文字切り出し処理を行なう。これは、一つの
文字の矩形を切り出す処理で、連続する黒画素の状態を
検出することで求められる。次に、第二段階として、図
11に示す(b)のように、一文字をm×n(例えば6
4×64)の画素ブロックに切り出す。そして、図11
に示す(c)のように、その中から2×2画素のウィン
ドウを用いて黒画素の分布方向(方向ベクトル情報)を
抽出する。
【0070】尚、図11に示す(c)は、方向ベクトル
情報の一部を例示したものであり、上述の2×2画素の
ウィンドウをずらしてゆき、方向ベクトル情報を数十個
得ることで文字の特徴とする。この特徴ベクトルと予め
記憶されている文字認識辞書の内容とを比較して、特徴
ベクトルが一番近い文字から順番に文字を抽出する。こ
の場合、特徴ベクトルが特徴に近い順番に第1候補、第
2候補、第3候補、…となる。この特徴ベクトルに対す
る特徴の近さが、専門用語では、その文字に対する距離
の近さ、即ち文字認識の類似度(マッチ度)という数値
となる。
【0071】[方向判別処理]このようにして文字認識
の類似度が求められるが、その類似度に基づいた文字方
向判別処理について説明する。図12は、文字方向判別
処理を説明するための図であり、この例では「ビールの
売り上げ」という文例を用いている。
【0072】図12に示す(a)は正方向の文字列であ
り、図12に示す(b)は270°回転した文字列であ
る。ここで、文字「売」に注目すると、文字方向を判別
する場合、図12に示す(c)のように、1つの文字
「売」について0°,90°,180°,270°の4
方向から文字認識を行なってみる。ここで、各回転角度
は各文字の特徴ベクトルの読み出し方を変更すればよ
く、特に原稿を回転させる必要はない。
【0073】各回転角度における文字認識結果は、図1
2に示す(c)のように、互いに異なっている。尚、図
12に示す(c)には、説明用の仮の文字認識結果と類
似度が示されているが、現実にこの通りになるとは限ら
ない。
【0074】図12に示す(c)において、正方向(0
°)から文字認識を行った場合は、「売」と正しく認識
され、類似度も0.90と高い値となる。また、90°
回転した方向から文字認識を行った場合は、「版」と誤
認識され、類似度も0.40と低下する。このように誤
認識が発生し、類似度も低下するのは、回転した方向か
ら見た場合の特徴ベクトルに基づいて文字認識を行った
からである。同様に、180°,270°回転した方向
から文字認識を行った場合も、誤認識が発生し、類似度
も低下する。このように、文字認識の方向別の類似度
は、複雑な文字であればある程、その差が顕著に現れて
くる。
【0075】図12に示す(c)の結果は、正方向の場
合に類似度が1番高いため、文書は正方向に向いている
可能性が高いと判断される。しかし、文字方向判別の精
度を向上させるため、同一ブロック内の複数の文字につ
いて、同様に4方向から文字認識を行なってみる。ま
た、1つのブロックだけで文字方向を判別した場合、特
殊な文字列について文字方向を誤って判別する恐れがあ
るので、複数のブロックについて同様の文字認識を行な
ってみる。
【0076】そして、各ブロックについて、当該ブロッ
ク内の各認識対象文字の4方向別の類似度の平均値を求
め、更に各ブロックでの4方向別の類似度の平均値に対
する平均値を求め、これらの平均値が最も高い方向を文
字(文書)の方向として判定する。
【0077】このように、1文字だけの類似度で文字方
向を判定するのではなく、同一ブロック内の複数文字、
更には他のブロック内の複数文字の類似度で文字方向を
判定することにより、文字(文書)方向を高精度に判別
することが可能となる。但し、1文字だけの自身度で文
字方向の判別を行なったり、或いは同一ブロック内の複
数文字の類似度で文字方向を判別しても、方向判別は行
なうことができる。
【0078】このような方法で、原稿方向判別を行なう
が、文書中の文字はどのような状態になっているかまち
まちである。例えば、ある文字は飾り文字であったり、
ある文字は誤って図形を文字と判別していたりすること
がある。このため、より多くの領域で方向判別処理を行
なった方がより精度の高い結果が得られることは言うま
でもない。
【0079】以上原稿方向認識の一例を説明してきた
が、認識方法は他の方式があることは言うまでもない。
ここでは方向認識部としてそれらすべてを網羅する。
【0080】尚、方向判別処理部は、一部専用ハードを
搭載したCPUで構成されている。このため、指示によ
り処理系を変更することは容易である。
【0081】また、図9の説明にて、1ページ分の色成
分解析を行なうように説明したが、原稿中のある特定の
ブロックだけで、例えば数ライン分の色成分解析結果を
出力して、その数ライン毎に優先順位を変化させる方法
をとることもできる。
【0082】尚、本発明は複数の機器(例えば、ホスト
コンピュータ,インタフェイス機器,リーダ,プリンタ
など)から構成されるシステムに適用しても、一つの機
器からなる装置(例えば、複写機,ファクシミリ装置な
ど)に適用してもよい。
【0083】また、本発明の目的は前述した実施形態の
機能を実現するソフトウェアのプログラムコードを記録
した記憶媒体を、システム或いは装置に供給し、そのシ
ステム或いは装置のコンピュータ(CPU若しくはMP
U)が記憶媒体に格納されたプログラムコードを読出し
実行することによっても、達成されることは言うまでも
ない。
【0084】この場合、記憶媒体から読出されたプログ
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。
【0085】プログラムコードを供給するための記憶媒
体としては、例えばフロッピーディスク,ハードディス
ク,光ディスク,光磁気ディスク,CD−ROM,CD
−R,磁気テープ,不揮発性のメモリカード,ROMな
どを用いることができる。
【0086】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部又は全部
を行い、その処理によって前述した実施形態の機能が実
現される場合も含まれることは言うまでもない。
【0087】更に、記憶媒体から読出されたプログラム
コードが、コンピュータに挿入された機能拡張ボードや
コンピュータに接続された機能拡張ユニットに備わるメ
モリに書込まれた後、そのプログラムコードの指示に基
づき、その機能拡張ボードや機能拡張ユニットに備わる
CPUなどが実際の処理の一部又は全部を行い、その処
理によって前述した実施形態の機能が実現される場合も
含まれることは言うまでもない。
【0088】
【発明の効果】以上説明したように、本発明によれば、
カラー画像の方向を判別し、その判別結果に応じてカラ
ー画像データに応じたデータに対して編集を行うので、
例えばNin1の編集において、N枚の画像をレイアウト
する際に、操作者は原稿の向きを考慮して配置する必要
がなく、見易いNin1画像を形成できる。
【0089】また、方向の判別を、色成分解析、文字認
識の結果により行うので、文字を含むドキュメントの編
集処理において、良好な方向判別が可能となる。
【0090】更に、各色成分毎に出現頻度の高い順に文
字認識を行うので、一番多い色文字を優先した、方向判
別が可能となる。
【0091】また更には、下地成分の影響を受けること
なく、文字認識、方向判別が可能となる。
【0092】
【図面の簡単な説明】
【図1】A4サイズの通常の文書原稿をオートフィーダ
ー101にセットする際の方向102〜109を示す図
である。
【図2】本実施形態におけるデジタル複合複写機の外観
を示す図である。
【図3】本実施形態における画像処理系の構成を示すブ
ロック図である。
【図4】本実施形態におけるオペレーションパネル部3
11の構成を示す外観図である。
【図5】複数枚の原稿を縮小レイアウトした状態を示す
図である。
【図6】4in1の両面縮小レイアウトの例を示す図で
ある。
【図7】本実施形態における縮小レイアウトの結果を示
す図である。
【図8】本実施形態における縮小レイアウト処理を示す
フローチャートである。
【図9】色成分解析部307の処理を説明するための図
である。
【図10】原画像と文字領域判別結果を示す図である。
【図11】文字認識処理を説明するための図である。
【図12】文字方向判別処理を説明するための図であ
る。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI H04N 1/387 G06F 15/70 370 1/46 H04N 1/46 Z

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 文書原稿をカラー画像データとして読み
    取って入力する画像入力手段と、 前記画像入力手段より入力されたカラー画像データに基
    づいて前記文書原稿の方向を判別する方向判別手段と、 前記方向判別手段での判別結果に応じて前記カラー画像
    データに応じたデータに対して所定の編集を行なう画像
    編集手段と、 前記画像編集手段により編集された画像データを出力す
    る出力手段とを有することを特徴とする画像処理装置。
  2. 【請求項2】 前記方向判別手段は、前記カラー画像デ
    ータに基づいて各色成分の出現頻度を解析する色成分解
    析手段と、前記色成分解析手段での解析結果に従って前
    記カラー画像データの文字認識を行なう文字認識手段と
    を含むことを特徴とする請求項1記載の画像処理装置。
  3. 【請求項3】 前記方向判別手段は、前記カラー画像デ
    ータの各色成分毎に出現頻度の高い順に文字認識を行な
    い、それぞれの認識結果から前記文書原稿の方向を判別
    することを特徴とする請求項2記載の画像処理装置。
  4. 【請求項4】 前記方向判別手段は、前記カラー画像デ
    ータの色成分数が少ない場合、最多出現頻度の色成分の
    画像データに対して文字認識を行ない、前記文書原稿の
    方向を判別することを特徴とする請求項2記載の画像処
    理装置。
  5. 【請求項5】 前記方向判別手段は、文書原稿の下地色
    成分を除いたカラー画像データに対して文字認識を行な
    い、前記文書原稿の方向を判別することを特徴とする請
    求項2記載の画像処理装置。
  6. 【請求項6】 前記画像編集手段は、複数の文書原稿の
    縮小レイアウト処理であることを特徴とする請求項1記
    載の画像処理装置。
  7. 【請求項7】 文書原稿をカラー画像データとして読み
    取って入力する画像入力工程と、 前記画像入力工程より入力されたカラー画像データに基
    づいて前記文書原稿の方向を判別する方向判別工程と、 前記方向判別工程での判別結果に応じて前記カラー画像
    データに応じたデータに対して所定の編集を行なう画像
    編集工程と、 前記画像編集工程で編集された画像データを出力する出
    力工程とを有することを特徴とする画像処理方法。
  8. 【請求項8】 前記方向判別工程は、前記カラー画像デ
    ータに基づいて各色成分の出現頻度を解析する色成分解
    析工程と、前記色成分解析工程での解析結果に従って前
    記カラー画像データの文字認識を行なう文字認識工程と
    を含むことを特徴とする請求項7記載の画像処理方法。
  9. 【請求項9】 前記方向判別工程は、前記カラー画像デ
    ータの各色成分毎に出現頻度の高い順に文字認識を行な
    い、それぞれの認識結果から前記文書原稿の方向を判別
    することを特徴とする請求項2記載の画像処理方法。
  10. 【請求項10】 前記方向判別工程は、前記カラー画像
    データの色成分数が少ない場合、最多出現頻度の色成分
    の画像データに対して文字認識を行ない、前記文書原稿
    の方向を判別することを特徴とする請求項8記載の画像
    処理方法。
  11. 【請求項11】 前記方向判別工程は、文書原稿の下地
    色成分を除いたカラー画像データに対して文字認識を行
    ない、前記文書原稿の方向を判別することを特徴とする
    請求項8記載の画像処理方法。
  12. 【請求項12】 前記画像編集工程は、複数の文書原稿
    の縮小レイアウト処理であることを特徴とする請求項7
    記載の画像処理方法。
  13. 【請求項13】 画像処理のプログラムコードが格納さ
    れたコンピュータ可読媒体であって、 文書原稿をカラー画像データとして読み取って入力する
    画像入力工程のコードと、 入力されたカラー画像データに基づいて前記文書原稿の
    方向を判別する方向判別工程のコードと、 判別結果に応じて前記カラー画像データに応じたデータ
    に対して所定の編集を行なう画像編集工程のコードと、 編集された画像データを出力する出力工程のコードとを
    有することを特徴とするコンピュータ可読媒体。
JP17862997A 1997-07-03 1997-07-03 画像処理装置及び画像処理方法 Expired - Fee Related JP3684036B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP17862997A JP3684036B2 (ja) 1997-07-03 1997-07-03 画像処理装置及び画像処理方法
US09/110,022 US6295385B1 (en) 1997-07-03 1998-07-02 Image processing apparatus and image processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17862997A JP3684036B2 (ja) 1997-07-03 1997-07-03 画像処理装置及び画像処理方法

Publications (2)

Publication Number Publication Date
JPH1127545A true JPH1127545A (ja) 1999-01-29
JP3684036B2 JP3684036B2 (ja) 2005-08-17

Family

ID=16051809

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17862997A Expired - Fee Related JP3684036B2 (ja) 1997-07-03 1997-07-03 画像処理装置及び画像処理方法

Country Status (2)

Country Link
US (1) US6295385B1 (ja)
JP (1) JP3684036B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7317835B2 (en) 2002-07-31 2008-01-08 Canon Kabushiki Kaisha Image processing method and apparatus
JP2009100018A (ja) * 2007-10-12 2009-05-07 Canon Inc 画像形成装置及び端末装置

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3695163B2 (ja) * 1998-07-31 2005-09-14 コニカミノルタビジネステクノロジーズ株式会社 画像形成装置
EP0989738A1 (en) * 1998-09-22 2000-03-29 Hewlett-Packard Company Document analysis method to detect BW/color areas and corresponding scanning device
JP2001043310A (ja) * 1999-07-30 2001-02-16 Fujitsu Ltd 文書画像補正装置および補正方法
US6985642B2 (en) * 2002-01-31 2006-01-10 International Business Machines Corporation Image size reduction method and system
JP3962649B2 (ja) * 2002-07-31 2007-08-22 キヤノン株式会社 フォントダウンロード装置および方法
JP2004165863A (ja) * 2002-11-12 2004-06-10 Murata Mach Ltd カラー画像送信装置
US7349120B2 (en) * 2003-05-16 2008-03-25 Primax Electronics Ltd. Method for multiple-page scaling and composing printing
KR101198769B1 (ko) * 2007-07-13 2012-11-12 삼성전자주식회사 화상형성장치 및 그 제어방법
JP4341716B2 (ja) * 2007-11-16 2009-10-07 コニカミノルタビジネステクノロジーズ株式会社 画像形成装置
JP2010211439A (ja) * 2009-03-10 2010-09-24 Fuji Xerox Co Ltd 文字出力装置およびプログラム
CN107203767B (zh) * 2017-05-24 2020-01-14 深圳市神视检验有限公司 一种辅助实现自动化无损检测的方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5276742A (en) * 1991-11-19 1994-01-04 Xerox Corporation Rapid detection of page orientation
JPH0723151A (ja) * 1993-07-05 1995-01-24 Ricoh Co Ltd 画像形成装置
JP3050007B2 (ja) * 1993-08-26 2000-06-05 ミノルタ株式会社 画像読取装置およびこれを備えた画像形成装置
US5761070A (en) * 1995-11-02 1998-06-02 Virginia Tech Intellectual Properties, Inc. Automatic color and grain sorting of materials
JP3562174B2 (ja) * 1995-11-13 2004-09-08 ミノルタ株式会社 画像処理装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7317835B2 (en) 2002-07-31 2008-01-08 Canon Kabushiki Kaisha Image processing method and apparatus
JP2009100018A (ja) * 2007-10-12 2009-05-07 Canon Inc 画像形成装置及び端末装置

Also Published As

Publication number Publication date
US6295385B1 (en) 2001-09-25
JP3684036B2 (ja) 2005-08-17

Similar Documents

Publication Publication Date Title
US7684620B2 (en) Image processing apparatus and method for dividing an image into component images
US7742197B2 (en) Image processing apparatus that extracts character strings from a image that has had a light color removed, and control method thereof
US7599081B2 (en) Detecting and protecting a copy guarded document
JP4586241B2 (ja) 画像処理装置
JP2002312777A (ja) 画像処理装置及びその方法
JPH08289094A (ja) 文書イメージスキャン方法及びその装置
US20090158915A1 (en) Sheet music creation method and image processing system
US8184344B2 (en) Image processing apparatus and image processing method, computer program and storage medium
JP3684036B2 (ja) 画像処理装置及び画像処理方法
US20200202155A1 (en) Method for image processing, and image-processing system
US6807301B1 (en) Image production controlling device, image producing device, image production controlling method, and a storage medium
JP2005348103A (ja) 画像補正装置、画像読取装置、プログラム及び記憶媒体
US20050254859A1 (en) Scanning apparatus and method having editing function, and multi functional peripheral using the scanning method
JP2008227910A (ja) 画像形成装置、画像形成方法、画像形成プログラム、および画像形成プログラムを格納した記憶媒体
JP5020777B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JPH10126631A (ja) 原稿種判定方法、カラー画像処理装置および記録媒体
JP4710672B2 (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム
JPH10191018A (ja) 画像処理方法及び装置
JP2006109482A (ja) 画像処理方法、画像処理装置及び画像処理プログラム
JP5284431B2 (ja) 二次元コードを復号化する装置、二次元コードを復号化する装置の制御方法、およびプログラム
JP2002109542A (ja) 画像処理システム並びにデータ処理装置及び方法
JP3899800B2 (ja) 画像処理装置、画像処理方法および画像処理プログラムを記録したコンピュータ読取可能な記録媒体
JP2008193234A (ja) 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム
JP2002027228A (ja) 画像処理のための装置、方法及び記録媒体
JP2005115768A (ja) 画像処理方法、画像処理装置、画像形成装置及び画像処理システム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040826

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041029

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050510

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050527

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090603

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees