JPH08272987A - 画像処理方法及びその装置 - Google Patents

画像処理方法及びその装置

Info

Publication number
JPH08272987A
JPH08272987A JP7077611A JP7761195A JPH08272987A JP H08272987 A JPH08272987 A JP H08272987A JP 7077611 A JP7077611 A JP 7077611A JP 7761195 A JP7761195 A JP 7761195A JP H08272987 A JPH08272987 A JP H08272987A
Authority
JP
Japan
Prior art keywords
text
image
attribute
image information
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7077611A
Other languages
English (en)
Inventor
Michiko Hirayu
三知子 平湯
Kazuyoshi Suzuki
一可 鈴木
Akihiko Sakai
明彦 酒井
Eiji Ohara
栄治 大原
Yuka Nagai
由佳 長井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP7077611A priority Critical patent/JPH08272987A/ja
Publication of JPH08272987A publication Critical patent/JPH08272987A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Processing Or Creating Images (AREA)

Abstract

(57)【要約】 【目的】 画像情報に含まれる画像の属性を判別し、そ
の判別した属性に応じて各画像の領域を求め、予め設定
されている領域情報に応じて画像を変倍して所定のフォ
ーマットの画像を作成する画像処理方法及びその装置を
提供することを目的とする。 【構成】 スキャナ回路1より原稿画像情報を入力し、
属性分離回路4により、その入力された画像情報の属性
を判別し、その属性に応じて前記画像情報を分離する。
この属性分離回路4は、更にそれら分離された画像情報
の領域情報を求めて画像変倍計算回路6に出力する。画
像変倍計算回路5は、その領域情報と領域情報記憶部1
0に予め記憶されている領域情報とに応じて、その分離
された画像情報を変倍する。こうして変倍された画像情
報は、定形フォーマット記憶部11に記憶されている所
定のフォーマットに従って定形のフォーマットに合成さ
れて出力される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力した画像情報の属
性分離を行って画像を変倍する画像処理方法及びその装
置に関するものである。
【0002】
【従来の技術】従来、多数の原稿サイズの書類を読取
り、それらの画像をまとめて1ページの画像に編集する
際は、例えば、ユーザーがマニュアルにより、各画像を
切り張りし、それをコピーするという操作を繰り返しな
がら、所望の1ページ分の画像を作成するのが一般的で
あった。
【0003】
【発明が解決しようとする課題】しかしながら上記従来
例では、多数の原稿サイズの書類が大量にある際に、い
ちいちマニュアルにより切り張りやコピー等を行うと、
大量の切り張り、コピー作業が必要となる。このため、
煩わしい作業を繰り返さなければならず、作業効率が悪
いなどの欠点を有していた。
【0004】本発明は上記従来例に鑑みてなされたもの
で、画像情報に含まれる画像の属性を判別し、その判別
した属性に応じて各画像の領域を求め、予め設定されて
いる領域情報に応じて画像を変倍して所定のフォーマッ
トの画像を作成する画像処理方法及びその装置を提供す
ることを目的とする。
【0005】本発明の他の目的は、面倒な画像の切り貼
りやコピー等の操作を不要にして、所望の切り貼り画像
を作成できる画像処理方法及びその装置を提供すること
にある。
【0006】
【課題を解決するための手段】上記目的を達成するため
に本発明の画像処理装置は以下のような構成を備える。
即ち、画像情報を入力する入力手段と、前記入力手段に
より入力された画像情報の属性を判別し、当該属性に応
じて前記画像情報を分離する分離手段と、前記分離手段
により分離された画像情報の領域情報を求め、前記領域
情報と予め記憶されている所定の領域情報とに応じて前
記分離された画像情報を変倍する変倍手段と、前記変倍
手段により変倍された画像情報を所定のフォーマットに
従って合成する合成手段とを有する。
【0007】上記目的を達成するために本発明の画像処
理方法は以下のような工程を備える。即ち、画像情報を
入力する工程と、入力された画像情報の属性を判別し、
当該属性に応じて前記画像情報を分離する分離工程と、
分離された画像情報の領域情報を求める工程と、前記領
域情報と予め記憶されている所定の領域情報とに応じて
前記分離された画像情報を変倍する工程と、変倍された
画像情報を所定のフォーマットに従って合成する工程と
を有する。
【0008】
【作用】以上の構成において、画像情報を入力し、その
入力された画像情報の属性を判別し、当該属性に応じて
前記画像情報を分離する。こうして分離された画像情報
の領域情報を求め、その求めた領域情報と予め記憶され
ている所定の領域情報とに応じて、分離された画像情報
を変倍し、その変倍された画像情報を所定のフォーマッ
トに従って合成するように動作する。
【0009】
【実施例】以下、添付図面を参照して本発明の好適な実
施例を詳細に説明する。
【0010】図1は、本発明の一実施例の画像処理装置
の構成を示すブロック図である。
【0011】図において、1は原稿画像を読取って入力
するスキャナ回路、2はメモリコントロール回路で、メ
モリ回路3へのデータの書込み及びメモリ回路3よりの
データの読み出しを制御している。4は属性分離回路
(ブロックセレクション回路)で、メモリコントロール
回路2を通して読み出された画像データの属性分離を行
い、その分離結果である領域情報を作成する。5は画像
変倍計算回路で、読み込まれた画像データの変倍率を計
算する。6は、画像変倍計算回路5で計算された変倍率
で画像の変倍を行う画像変倍回路である。7は作成回路
で、画像変倍回路6で変倍された画像をカバーレターな
どに作成する。8は出力回路で、作成回路7で作成され
た書類を出力する。9はシステム制御回路で、本実施例
の画像処理装置全体を制御している。10は予め用意さ
れている領域情報を記憶している領域情報記憶部であ
る。11は定形フォーマット情報を記憶している定形フ
ォーマット記憶部である。
【0012】次に、上述の各回路の詳細を説明する。
【0013】まず、属性分離回路(ブロックセレクショ
ン回路)4は、画像データの属性分離を行って領域情報
を作成する回路であり、この回路4の動作原理を図4か
ら図27を参照して説明する。
【0014】図4は、この属性分離回路4におけるおお
まかな処理を示すフローチャートである。
【0015】この属性分離回路4における属性分離処理
速度を速くしたい場合には、ステップS1で、画像デー
タの間引きが行なわれる。この画像データの間引きが行
なわれた場合、属性分離回路4の処理は、その間引かれ
たイメージに対して行なわれる。この画像データの間引
きは、m×m画素ブロックにおける黒画素の連結性を調
べることにより行なわれる。例えば、3×3の画素ブロ
ックにおいて、連結した黒画素が2つ存在する場合、そ
の3×3の画素ブロックは1つの黒画素に間引かれる。
逆に、その画素ブロックにおいて、連結した白画素が2
つ存在する場合は、その画素ブロックは1つの白画素に
間引かれる。
【0016】次にステップS2において、画素のイメー
ジが解析され、画素同士の連結性が探索されるととも
に、その大きさや他の連結成分に対する相対的な位置に
応じて分類される。1つの連結成分というのは、白画素
によって完全に囲まれた黒画素の集合である。従って、
1つの黒画素連結成分は、他の黒画素連結成分から少な
くとも1つの白画素により完全に分離される。
【0017】このステップS2の処理は、図5〜図7の
フローチャートを参照して後述するが、概略を説明する
と、連結成分の探索と、その大きさの情報と連結成分同
士から得られるいくつかの統計的な情報に基づいて行な
われる連結成分のクラス分けを行う。このクラス分けで
は、まず夫々の連結成分が、テキストユニットか、非テ
キストユニットかに分類される。そして、非テキストユ
ニットは、さらに詳細に解析され、それがフレーム構造
をもつデータか、ハーフトーンイメージか、線画か、表
か、又はその他の表形式のテキストデータかに判別され
る。そして、そのデータ構造が未知のものであれば、未
知のものとして、分類が行なわれない。そして、連結成
分の構成データを与え、そのデータの再構築を容易にす
るように、階層的な木(ツリー)構造が、それぞれの連
結成分に対して作成される。
【0018】次にステップS3において、近接した連結
成分は、ギャップラインを挟まない限りグループ化され
る。ここでのグループ化は、垂直方向に行う場合と水平
方向に行う場合とがある。これはグループ化しようとす
るテキストユニットが縦書きであるか、横書きであるか
ということに対応しており、両方向に近接した連結成分
間の距離を予め水平及び垂直のそれぞれの方向について
調べ、水平方向の距離が小さい場合には水平方向に、垂
直方向の距離が小さい場合には垂直方向にグループ化を
行うこととする。
【0019】尚、ステップS2で生成されたツリー構造
は、テキストと非テキストが不適当に混ざらないように
するために用いられる。更にステップS3では、行間で
垂直もしくは水平方向に延長したギャップと、非テキス
トユニットの垂直方向に延長した境界とを検出すること
により、テキストユニットが行にグループ化されるかど
うかを決定する。この行構造は、適当に階層ツリー構造
を更新して行くことにより、そのツリー構造の中に保持
される。
【0020】次にステップS4において、ステップS3
でグループ化された行が、先にグループ化された方向と
は逆方向についてスペースが狭ければ、その方向に再度
グループ化されたブロックとなる。一方、非テキストユ
ニットは、そのイメージページに対する境界として用い
られる。2つの非テキストユニットの間にあるテキスト
ユニットは、他のテキストラインユニットとは分けられ
て処理される。
【0021】さらに、ステップS4において、ステップ
S2で分類できなかった非テキストユニットが、大きい
フォントサイズのタイトルであるかどうかを決定するた
めに解析される。もしそれらがタイトルと決定されたな
らば、それらのユニットは、適当な属性が付けられ、そ
して、ツリー構造が更新される。画像データに含まれる
タイトルは、そのページを再構成する手助けとなる。
【0022】図5〜図7は、図4のステップS2におい
て、どのように画素イメージデータの連結画素を検出
し、それらの連結画素を分類するかを示す処理フローチ
ャートである。
【0023】まずステップS11において、画像データ
に含まれる画素データが輪郭線追跡により探索される。
この輪郭線追跡は、図8に示されるように、画像をスキ
ャンすることにより行なわれる。この画像のスキャン
は、矢印Aで示す画像の右下部から始まり、図形の右端
に出合うまで上方に行なわれて行く。このスキャンは、
他の方向、例えば左上から右下に向けて順次スキャンさ
れてもよい。黒画素にぶつかると、隣接した画素が黒画
素かどうかが、図8の31で示す矢印方向の順に調べら
れる。この黒画素の探索は、中心から見て8方向のベク
トルで表されるので8方向探索と呼ばれる。そして、隣
接した黒画素が存在すると、このプロセスにより図形の
外部輪郭が得られる。こうして、図9に示すように、矢
印A方向のスキャンが文字“Q”32の端に対応するポ
イントにぶつかる。隣接画素の調査が31で示された方
向の順に行なわれ、文字“Q”32の外輪郭が追跡され
る。なお、ここでは閉じた輪郭の内側の部分(文字Qの
内側)は追跡されない。
【0024】こうして8方向探索により得られた輪郭
線、即ち、1つの連結成分が取り出されると、次の黒画
素に出合うまでスキャンが進行する。こうして、例え
ば、完全な黒領域を表していると思われるオブジェクト
34が8方向探索される。同様に、手書き文字“non
text”である、非テキストのオブジェクト35が追
跡され、そして、単語“text”を形成する個々の文
字の集合オブジェクト36a〜36dが追跡される。こ
の図8で示されるスキャンは、全ての連結成分が検出さ
れるまで続けられる。
【0025】次にステップS12に進み、全ての連結成
分を矩形で切り出す。この場合、個々の連結成分を覆う
可能な限り最小の矩形が描かれることになる。こうし
て、図9におけるオブジェクト32の周りに矩形37
が、オブジェクトの34の周りに矩形39が、オブジェ
クト35の周りに矩形40がそれぞれ描かれる。また、
テキストオブジェクト36a,36b,36c,36d
に対する矩形41a〜41dも同様である。
【0026】ステップS13では、ステップS12で得
られた全ての矩形に対して木構造における位置付けが成
される。ほとんどの場合、ステップS13で得られた木
構造は、各オブジェクトに対してルートから直接生じ
る。これは、連結成分の外部輪郭だけが追跡され、閉領
域の内部は追跡されないからである。こうして、図10
に示すように、連結成分32に対応する矩形37はペー
ジのルートから直接生じる。しかし、非テキストオブジ
ェクト35を囲む矩形40や、テキストオブジェクト3
6a,36bを囲む矩形41a,41bのように、その
矩形が他の矩形(ここでは矩形39)に完全に含まれて
しまう場合は、これらの連結成分は包含される連結成分
(この場合、成分34)の子となる。さらに、成分34
のように、少なくとも1つの子をもつそれぞれの連結成
分は、成分それ自身を“主要な子”とする。図9の例で
は、成分34は他の子成分40,41a,41bととも
に、自分自身の矩形39を主要な子として含んでいる
(図10参照)。
【0027】次にステップS14に進み、木における第
1レベルのそれぞれの連結成分は、テキストユニットか
非テキストユニットかに分類される。この分類過程は2
つのステップを含む。最初のステップでは、連結成分を
囲む矩形が予め定められたサイズと比較される。この連
結成分を囲む矩形の高さがフォントサイズの最大値に対
応する予め定められた値を越える場合、あるいは矩形の
幅がページ幅を経験的に決められた一定の値(“5”の
場合に満足のいく結果が得られている)で割った値より
大きい場合は、その連結成分は非テキスト・ユニットと
分類され、そのユニットに“非テキスト”の属性が与え
られる。
【0028】次に第2のステップでは、属性が与えられ
なかった残りの全てのユニット、即ち、非テキストとし
て分類されなかったユニットが、残りの全ての連結成分
から得られる統計的なサイズに基づいて決められた値と
比較される。特に、非テキストとみなされなかった全て
の矩形の平均高が計算される。この平均高に、ある一定
値(一般には“2”)を掛けることによって適応的な閾
値が得られる。この閾値より大きい全てのユニットは非
テキストに分類される。一方、その閾値より小さいユニ
ットはテキストとみなす。こうして各ユニットは分類さ
れて適切な属性が与えられる。以上2つのステップによ
る分類は、図5〜図7で示される更にいくつかの処理を
受ける。これについては以下で詳しく述べる。
【0029】ツリー構造の第1レベルの全てのユニット
がテキストか非テキストかに分類された後、テキストユ
ニットの子は、主要な子(即ち、自分自身)を含めてテ
キストとして分類される。一方、非テキストの主要な子
は非テキストとして残されるが、それ以外の子はテキス
トとして分類される。
【0030】次にステップS15に進み、最初のユニッ
トを選択する。次にステップS16に進み、もしそのユ
ニットがテキストであればステップS17へ進み、次の
ユニットが選択される。そしてステップS16で非テキ
ストユニットが選択されるまでステップS16〜ステッ
プS17の処理を行い、ステップS16で非テキストユ
ニットが選択されるとステップS18へ進む。
【0031】ステップS18で、非テキストユニットが
子を持っているかどうかを調べる。例えば、図10の例
では、非テキストユニット(矩形)34は非テキストで
ある主要な子(矩形)39と、テキストである矩形4
0,41a,41bという子をもつ。
【0032】このステップS18において、そのユニッ
トに子が存在する場合はステップS19に進み、ここで
各ユニットは、ハーフトーン(または、グレースケー
ル)かどうかのフィルタリングを受ける。ハーフトーン
・フィルタリングにおいては、その子が調べられ“ノイ
ズ”サイズより小さいものの数が数えられる。この“ノ
イズサイズ”のユニットは、その高さが入力イメージデ
ータにおける最小のフォントサイズより小さいものであ
る。そしてステップS20において、ノイズサイズより
小さいユニットの数が総数の半分より大きい場合、その
ユニットはハーフトーンイメージであると判定する。そ
の結果、ステップS20からステップS24に進み、そ
のユニットに“ハーフトーン(HALFTONE)”という属性が
与えられる。そしてステップS25に進み、ハーフトー
ンイメージの中のテキストが調べられる。即ち、ハーフ
トーンイメージの子の中ではなく、ハーフトーンイメー
ジと同レベルになるように、木構造を修正する。ここで
子の処置が適切であれば、ハーフトーンイメージ中の文
字認識も可能になる。そしてステップS17に戻って次
のユニットが選択され、前述と同様の処理を実行する。
【0033】一方、ステップS19のハーフトーンフィ
ルタリングの結果、そのユニットがハーフトーンでない
ことが分かったらステップS20からステップS21に
進み、そこでそのユニットの主要な子を、後の処理のた
めに選択する。そしてステップS22に進む。
【0034】またステップS18で、非テキストユニッ
トであって、子を持たないと判定された場合、或はステ
ップS21で主要な子が後の処理のために選択された場
合はステップS22に進み、そのユニットがフレーム・
フィルタリングを受ける。このフレームフィルタリング
とは、そのユニットがフレーム(枠)であるかどうかを
判定することである。この「フレームである」とは、そ
のユニットを囲むような矩形を構成するほとんど同じ長
さの幅や高さを持った平行な直線が複数存在することを
意味している。ここでは特に、注目ユニットにおいて画
素単位で見た時の各行での連結成分の線幅を調べる。
【0035】図11において、非テキストユニット42
は、44で示す様な輪郭成分をもつ連結成分43を含ん
でいる。この例において、行(ROW)iにおける子の連結
成分の線幅はXi、即ち、輪郭線44の左端45aから
右端45bまでの距離になる。一方、行jでは連結成分
43の内部に2つの線幅が存在する。即ち、46a〜4
6b間と、47a〜47b間である。そして、最も長い
線幅である46a〜46b間が、距離Xjとして定義さ
れる。
【0036】このようにして、非テキストユニット42
における全ての行nにおいて距離Xが計算され、その非
テキストユニットがフレームであるかどうかが、次の不
等式によって調べられる。 ここで、Xkは上で述べたように、連結成分中の第k行
における最も長い線幅を示し、Wは矩形42の横幅、N
は行の数であり、閾値は枠が多少傾いていても枠として
検知できるように予め計算された値である。ここで1°
の傾きを許すためには、{sin(1°)×L+(一定
値)}の閾値でよい。この一定値というのは、ステップ
S14で計算された文字の平均高である。そして、上記
の不等式が満たされないと、そのユニットはフレームデ
ータと判定され、ステップS23からステップS26に
進み、“フレーム(FRAME)”という属性が付加される。
こうして、例えば、“フレームであり表”あるいは“フ
レームでありハーフトーン”の様な判定が、フレームに
対して可能になる。
【0037】このステップS26からステップS42に
進み、そのフレームデータが表あるいは表形式のものを
含んでいる可能性が調べられ、連結成分内の白輪郭を得
るための検査が行なわれる。この白輪郭は、ステップS
11で得られた(黒)輪郭と基本的には同じだが、ただ
黒画素の代わりに白画素を調べて得られるものである点
が異なる。
【0038】図14のように、非テキストユニットの内
部が右下から左上に向かって矢印Bの方向に探索され
る。初めて白画素に出会うと、その点から近接の白画素
に対して51で示す様な外向きの方向に探索を行う。こ
こでは、1から4で示される方向しか必要でないことに
注意すべきである。その結果、ここでの処理における白
輪郭追跡は4方向の探索ということになる。全ての白輪
郭が取り出されるまで、この処理は続けられる。例え
ば、白輪郭追跡は、黒線分52,53,54,55で囲
まれる輪郭部を取り出すことであり、同様の処理は56
で示す様な黒画素の内部に対しても行なわれる。このよ
うにして非テキストオブジェクト中の全ての閉じた白輪
郭が追跡されるまで、上述した矢印B方向へのスキャン
が続けられる。
【0039】そしてステップS43において、非テキス
トユニットの密度が計算される。この密度は、連結成分
内の黒画素の数をカウントし、矩形で囲まれた画素の総
数により、その矩形の黒画素の数を割ることにより求め
られる。
【0040】次にステップS44に進み、発見された非
テキストユニット内の白輪郭の数が計算される。そし
て、もしその数が“4”以上であれば、その非テキスト
イメージはテーブルか、テキストブロックがテーブル状
に並んだものである可能性があるためステップS47に
進み、白輪郭の充填率が計算される。この白輪郭の充填
率というのは、非テキストイメージ中の白輪郭で囲まれ
る面積の割合を示すものである。
【0041】即ち、図14の例では、57,59で示す
ように、完全に白画素だけで構成される白輪郭もあれ
ば、60,61のように内部に黒画素領域を含む白輪郭
も存在する。もし、白輪郭の充填率が高ければ、おそら
く、その非テキストイメージはテーブルか、テキストブ
ロックがテーブル状に並んだものである。この推定をよ
り確実にするために、注目白輪郭に対して水平及び垂直
方向に格子状の内部構造を持っているかどうかが調べら
れる。特にステップS49では、水平または垂直方向に
少なくとも2つの輪郭線を横断していないような境界線
をもつ白輪郭は、格子上になっていないとみなして再結
合する。例えば、図14の例では白輪郭59の左境界6
2と右境界63は、別の白画素60の左境界64と右境
界65と一致するように垂直方向に伸びている。そのた
め、これらの白輪郭は格子状に並んでいると判断され、
再結合されることはない。同様に、白輪郭59の上境界
66と下境界67は、別の黒画素70の上境界68と下
境界69と一致するように水平方向に伸びている。その
結果、これらの白輪郭も格子状に並んでいると判定さ
れ、再結合されない。
【0042】図15〜図17は、白輪郭が結合される場
合を説明する図である。
【0043】図15において、例えば非テキストユニッ
ト71は、ハーフトーンイメージからバイナリイメージ
までのユニットを含む非テキストユニットの例を表して
いる。非テキストイメージ71は、黒画素領域72と白
画素領域74,75,76,77,78,79を含んで
いる。おそらくこの白画素領域の充填率は充分高いの
で、ステップS48よりステップS49に進み、再結合
される。まず、図15及び図16で示すように、まず白
輪郭75の上端と下端が白輪郭77の上端と下端と比較
される。これらの上端及び下端は一致しないので、白輪
郭75と76とが結合され、新たな白輪郭76’が作り
出される。尚、この白画素の充填率が低い時はステップ
S48よりステップS55に進む。
【0044】次に図16と図17において、白輪郭77
の左右の境界が白輪郭78の左右の境界と比較される。
これらの境界は一致しないので、白輪郭77と79とは
再結合され、新たな白輪郭77’となる。このプロセス
は、再結合が起らなくなるまで水平および垂直方向に繰
り返される。
【0045】以上説明したようにテーブルの白輪郭は結
合されにくく、テーブル以外、例えばハーフトーンイメ
ージや線図形のようなテーブル以外のものは結合され易
い。そしてステップS50で再結合率が計算される。も
し再結合率が高いか、再結合処理の後に残った白輪郭の
数が“4”未満であればステップS55に進み、その非
テキストユニットは、以下で詳述するように、ハーフト
ーンイメージか、線図形であると判定される。
【0046】ステップS50で、再結合率が高くない
か、または少なくとも4個以上の白輪郭が残った場合は
ステップS51に進み、テーブルと判定されて属性(TAB
LE)が付与される。次にステップS52に進み、新たに
テーブルと判定された図形の内部が調べられ、含まれる
連結成分の探索や分類が行なわれる。新しい内部連結成
分に従って、ステップS53で木構造が更新される。次
にステップS54に進み、内部連結成分はテキストか非
テキストが再び分類され、その分類結果に従って適切な
属性が付加される。この処理は、既に説明したステップ
S12からステップS14の処理と同じである。そして
ステップS54からステップS17に戻り、次のテキス
トユニットが選択される。
【0047】ステップS48で白輪郭の充填率が高くな
いか、或はステップS50で再結合率が高くない場合、
その非テキスト枠図形はハーフトーンイメージか、線図
形の可能性が高い。そして、そのユニットがハーフトー
ンイメージか線図形かは、そのユニット中の黒画素の水
平方向のランレングスの平均、白画素と黒画素の割合及
び密度によって決定される。一般的に、非常に暗いイメ
ージはハーフトーンイメージと判定され、白く明るいイ
メージは線図形と判定される。
【0048】特に、白画素の平均ランレングスがほとん
ど“0”の場合(ほとんど真黒か、まだら模様のイメー
ジ)で、さらにステップS43で計算された密度が白よ
り黒の方が大きい場合(即ち、密度が閾値約0.5(こ
れを1番目の閾値とする)より大きい時)は、そのフレ
ームユニットはハーフトーンであると判定される。も
し、密度が1番目の閾値よりも大きくない場合には、そ
のユニットは、線図形と決められる。また、もし白画素
の平均ランレングスがほとんど“0”と言えず、かつ白
画素の平均ランレングスが黒画素の平均ランレングスよ
りも大きい場合は、そのフレームユニットは線図形と判
定される。しかし、白画素の平均ランレングスが黒画素
の平均ランレングスより大きくない場合(即ち、これも
黒が支配的なイメージである)、さらに詳細なテストが
必要である。特に、黒画素の数が白画素の数よりはるか
に少ない時(即ち、黒画素の数が白画素の2倍(これを
2番目の閾値とする)より小さいとき)、このフレーム
ユニットはハーフトーンと判定される。一方、黒画素の
数を白画素の数で割った値が2番目の閾値より大きくな
いが、ステップS43で計算した密度が1番目の閾値よ
り大きい場合は、そのフレームユニットはハーフトーン
イメージであると判定する。そうでなければ、線図形と
判定される。
【0049】そしてステップS55において、フレーム
ユニットが線図形と判定されるとステップS58に進
み、ここで“線図形”という属性(LINE-DRAWING)が付加
され、更にステップS59で、全ての子が除去される。
特に、あるユニットが一度線図形と判定されると、もう
そのユニットに対しては文字認識処理が行なわれない。
その後、ステップS17に戻り、次のテキストユニット
が選択される。
【0050】一方、ステップS55で、そのフレームユ
ニットが線図形でないと判定されるとステップS56に
進み、“ハーフトーン”という属性(HALFTONE)が付加さ
れ、次にステップS57で、そのユニットの子の内、テ
キストサイズの子が除去される。そして、テキストサイ
ズより大きい全ての子は、フレームハーフトーンイメー
ジの子として残ることが許される。そしてステップS1
7に戻り、次のテキストユニットが選択される。
【0051】次に再び図6のステップS44に戻り、白
輪郭の数が“4”より大きくない場合は、そのフレーム
ユニットはテーブルでないと判断されてステップS45
に進み、ステップS43で計算された密度が、ある閾値
(約0.5)と比較される。この閾値はフレーム内のテ
キストユニットや線図形が全画素の半分より小さいはず
だということで選ばれている。もしこの密度が、この閾
値より小さければステップS46に進み、フレームユニ
ットの内部構造が調べられる。この処理は、すでに述べ
た、フレームユニットの内部構造に対するステップS1
1の処理と同じである。
【0052】一方、ステップS45で、その密度が予め
定めた閾値より大きい場合はステップS35に進み、そ
のフレームユニットが線図形かハーフトーンイメージの
どちらかに分類されるか、或はそのフレームが、分類不
可能(即ち、そのフレームは“未知”)であるかが判定
される。
【0053】図5のステップS23に戻り、ステップS
22のフレームフィルタリングによって非テキストユニ
ット内にフレームが検知されなかった場合はステップS
27に進み、その非テキストユニットが“線”を含んで
いるかどうかを判定する。“線”はテキストの境界を表
わすのに有用な非テキストユニットといえる。しかし、
そのような線によって区切られる(囲まれる)テキスト
は、その線に非常に近い場合が多く、接触が起きている
可能性がある。その結果、線探索というのはテキストが
線に接触している場合と、接触していない場合の両方を
考慮する必要がある。
【0054】接触が起きていない場合の線探索のために
は、非テキストユニットの縦方向のヒストグラムが計算
される。図12の例では、線のヒストグラム48は、そ
の高さがほぼ線幅に等しい均一の値になるはずである。
線幅というのは近似的にテキストユニットの幅
(“W”)に等しいが、もし違いが生じるとすれば、そ
れは傾きθsのせいである。この傾きは原稿画像が入力
された時点で起きている。そして、非テキストユニット
が線を含んでいるかどうかを判定するためには、ヒスト
グラム中の各セル(cell)kの高さ49を幅Wと比較す
る。次式のように、これらの値の差の2乗平均が閾値と
比較される。 この閾値は、非テキスト内の線のねじれ、または、傾き
θsを許容するように計算される。1°のねじれや傾き
に対しては、 という閾値が満足な結果を生じることがわかっている。
【0055】上述の不等式によって非接触の線が発見さ
れなかった場合は、接触が起きている線が含まれていな
いかどうかの探索が行なわれる。注目している非テキス
トユニット中に、接触している線が含まれているかどう
かを調べるためには、線状のものがユニットの境界線近
くに存在するかどうかを調べればよい。例えば、図12
の例のように、ユニットを囲む矩形の境界線近くに線が
存在すると、境界線からの距離の2乗和を計算すること
によって調べることができる。即ち、このケースでは、
次式の不等式が計算される。 もし、上式の左辺が予め定められた閾値より小さけれ
ば、接触している線が存在していることがわかる。この
閾値というのは接触を起していない線の場合と同じとを
使えばよい。
【0056】こうしてステップS28で線が検出されれ
ばステップS29に進み、“線”という属性(LINE)が、
その非テキストユニットに付加される。そしてステップ
S17に進み、次のユニットが選択される。
【0057】一方、もしステップS28で、線が検出さ
れなかった場合はステップS30に進み、その非テキス
トユニットのサイズが調べられる。このサイズがある閾
値より小さければステップS31に進み、その非テキス
トユニットの分類を決定することができず、その閾値は
最大のフォントサイズから決定される。具体的には、最
大フォントサイズの半分の値にするとよい結果が得られ
る。そして“未知”の属性(UNKNOWN)が付加される。そ
の後ステップS17に進み、次のユニットが選択され
る。
【0058】ステップS30において、もしサイズが予
め決められた閾値より大きければステップS32に進
み、そこで非テキストユニットの内部領域で白輪郭の探
索が行なわれ、ステップS42〜ステップS44で説明
した処理と同様の処理がステップS32〜ステップS3
4で実行され、白輪郭の数が計算される。
【0059】そしてステップS34において、白輪郭の
数が“4”以上でなければステップS35に進み、線図
形あるいはハーフトーンイメージとして十分な大きさを
持っているかどうかを確かめるために、サイズが計算さ
れる。このサイズの決定は、そのテキストのユニットの
高さと幅、及び黒画素のランレングスの最大長に基づい
て行なわれる。特に、その非テキストユニットの高さと
幅が最大フォントサイズより小さい場合は、そのユニッ
トは線図形やハーフトーンイメージを構成するに十分な
大きさを持ってないとみなされてステップS38に進
み、“未知”の属性(UNKNOWN)が付加される。
【0060】同様に、ユニットの幅は最大フォントサイ
ズより大きいが、黒画素のランレングスの最大長が最大
フォントサイズより大きくないときもステップS38に
進み“未知”の属性が付加される。そしてステップS1
7に戻り、新しいユニットが選択される。
【0061】ステップS35において、その非テキスト
ユニットが線図形或はハーフトーンイメージを構成する
のに十分な大きさを持っている場合はステップS36に
進み、線図形かどうかが判定され、線図形又はハーフト
ーンイメージという属性が付加される。これらステップ
S36〜S41の処理は、前述のステップS55〜S5
9と同様の処理であるため、それらの説明を省略する。
【0062】図5〜図7(図4のステップS2に相当)
で説明した流れに従って、入力画像中の全ての連携成分
が調べられ、分類されると図20で示されるようなツリ
ー構造が得られる。
【0063】図20に示すように、ルート(ROOT)は入力
画像のページにあたる。ルートの子はテキストブロック
(TEXT)、又は、未知(NON-TEXT UNKNOWN)・フレーム(FRA
ME)・写真(図)(PICTURE)・線(LINE)からなる非テキス
トブロックである。フレーム(FRAME)の子はテキストブ
ロック(TEXT)、“未知”の非テキストデータ(UNKNOW
N)、テキストブロックを含む表(TABLE)、写真(図)(PI
CTURE)、線(LINE)である。
【0064】図23は、ピクセルイメージデータのペー
ジ90を表わす図で、この中には、大きなフォントサイ
ズのテキスト91、例えば93の様なテキストデータを
含む表92、テキストデータ94、水平線95、別のタ
イトル96、2つの段落からなるテキストデータ97、
キャプション99を備え枠で囲まれた線図形98、タイ
トル100で始まりテキストデータ101へ続く2番目
の段組、キャプション103を備え枠で囲まれたハーフ
トーンイメージ102、テキストデータ104、水平線
105、最終段落106が含まれる。
【0065】図24は、同じイメージに対してステップ
S2(図4)の処理を施したものである。
【0066】図24から理解できるように、ページ90
中の連結成分は矩形で切り出され、その内部は図5のス
テップS23からステップS42〜ステップS54で示
される処理によって属性が調べられる。ステップS11
で得られた全てのテキストユニットは、ツリーのどの位
置にあっても、ステップS12で垂直方向或は水平方向
にグループ化される。このグループ化の操作は、各テキ
ストユニット及びその周辺のユニットの纏まり具合に基
づいている。また段組を表していると思われるギャップ
(空間スペース)が垂直及び水平両方向について検出さ
れ、保持される。なお、図4のステップS3の詳細な説
明は、図18のフローチャートを参照して以下に説明す
る。
【0067】まずステップS61では、非テキストユニ
ットの境界線が垂直及び水平方向に伸ばされ、ギャップ
ラインマーカとされる。
【0068】これは図24に示されるように、垂直方向
のギャップラインマーカ109a,109bが、テキス
トあるいは非テキストユニットと交差するまで(この例
では図23のユニット95)垂直方向に伸ばされる。同
様に、ギャップラインマーカ109c,109dも、ユ
ニット95と交差するまで伸ばされる。また、水平方向
のギャップラインマーカについても同様の処理を行う。
ギャップラインマーカは、ギャップ(空間スペース)を
検知するのに有効で、これによって段組を得ることがで
きる。
【0069】次にステップS62に進み、図24の10
7で示すようなテキストユニットの行結合が行なわれ
る。ここでの行結合は、両方向に近接した連結成分間の
距離を予め水平及び垂直それぞれの方向について調べ
て、水平方向の距離が短い場合には水平方向に、垂直方
向の距離が短い場合には垂直方向について行なわれる。
この結合方向は、結合しようとするテキストユニットの
組方向が縦であるか横であるかに対応しているものであ
る。
【0070】そして、これらのテキストユニットは、次
の条件が満たされると1つのテキスト行として結合され
る。 (1)その結合によってギャップラインマーカを越えな
い。 (2)そのテキストユニットは他のテキストユニットと
接触しているか、一定の閾値以下の距離にある。この閾
値としては図5のステップS14で求めたテキストの平
均長に、実験的に求めたスケールファクタ(本実施例で
は“1.2”で満足いく結果が得られている)をかけた
ものでよい。
【0071】しかし、結合の前にテキストユニット間の
ギャップをテキストユニットが横組である場合には水
平、縦組である場合には垂直の方向に伸ばすことによっ
て、段組構造を表わす方向に、伸びたギャップが存在す
るかどうか決定することができる。例えば、図24の例
では、ギャップ108が2つのテキストの間に存在して
いる。ギャップは数行に亙って垂直方向に伸びているた
め、ステップS62では、テキストユニット間の距離が
閾値以下であってもギャップとして残される。
【0072】次にステップS63に進み、ステップS6
2で結合されなかったテキストユニットの組みに対し
て、それらのユニットが共に近接する他のテキストユニ
ットによってオーバラップされ、かつ、その結合がギャ
ップラインマーカを横切らないとき結合が行なわれる。
このステップは、段落の構造からくるものではなく、単
にテキスト行におけるスペースの関係から発生したもの
を消去するのに効果的である。図24の例では、ステッ
プS62で残されたギャップ108は、ステップS63
で消去される。なぜなら、すぐ下の文字にオーバラップ
され、かつ、ギャップラインマーカを横切ることもない
からである。そしてステップS64に進み、ツリー構造
を更新する。
【0073】図19は、図4のステップS3で説明した
グループ化の処理の結果を表わす模式図で、図21は、
このステップS3の処理によってツリー構造がどのよう
に変更されたかを表わす図である。
【0074】図25に示されるように、結合されたテキ
ストユニットはグループ化されて、110で示すような
テキスト行にされる。特に、ツリー構造のどこにあって
も、テキストユニットは必ず結合されてテキスト行にな
る。例えば、111はツリー構造状のフレームテーブル
の下にあるが、やはり結合されている。しかし、図6の
ステップS27からS39、及びステップS42からス
テップS59で求めた白輪郭を越えた再グループ化は行
なわれないことに注意されたい。これは、テーブル中の
項目を1つの行にしてしまわないためである。尚、左右
の段組の間のギャップは保持される。また、非テキスト
ユニットは再グループ化されない。そのため、112や
113で示すように、これらユニットは閾値以下の距離
にあってもグループ化されていない。
【0075】図21では、この新たなグループ化が反映
されたツリー構造になっている。
【0076】図18(図4のステップS3)で述べた過
程でテキストユニットが結合されてテキスト行になった
後、ステップS4で示されるように、テキスト行はテキ
スト行形成時の結合方向とは逆の方向に結合されてテキ
ストブロックとなる。この過程を図19を用いて、より
詳細に説明する。
【0077】グループ化の過程は、テキスト行ユニット
のまとまり具合と非テキストユニットの位置による。例
えば、間に存在する非テキスト行は境界線として作用
し、反対側にあるテキスト行同士がグループ化されて1
つのテキストブロックとなるのを防ぐ。2つの連続する
非テキスト行ユニットの間にある全てのテキスト行は同
時に処理を受ける。加えて、ステップS4では、いくつ
かのテキストユニットは非テキストユニットと結合され
るべきか(例えば非テキストイメージとともに構成され
るテキストキャプション)、または、ある非テキストユ
ニットを他の非テキストユニットと結合すべきか(例え
ば、ハーフトーンイメージと関係している線図形)が、
調べられる。
【0078】図19は、テキスト行をグループ化してテ
キストブロックとする様子を表わすフローチャートであ
る。
【0079】まずステップS71で、タイトルブロック
が、ステップS14で非テキストユニットと分類された
ものの中から形成される。その判断基準は、最大フォン
トサイズより小さいが、平均テキストサイズより大きい
ということである。そのような、同じ様な大きさで近接
している非テキストユニットが全てグループ化されるこ
とによってタイトルブロックが形成される。そして、そ
のブロックには“タイトル”という属性(TITLE)が付加
される。そして、グループ化できなかった残りの全ての
非テキストブロックは、ピクチャーテキストという属性
が付加される。そして、ツリー構造がこれに応じて適当
に更新される。なお、タイトルはページの再構成に役立
つ。
【0080】次にステップS72に進み、テキスト行の
間にある非テキストユニットが検出される。これらの非
テキストユニットは、テキストブロック間の境界線とし
て作用し、テキスト行が1つのテキストブロックになる
のを防いでいる。そしてステップS73に進み、2つの
ステップからなる処理によって、テキスト行がテキスト
行形成時の結合方向とは逆の方向(以下、これを「ブロ
ック結合方向」と呼ぶ)にグループ化されてテキストブ
ロックとなる。最初のステップでは、段組の間のギャッ
プが探索される。そのためには、例えば画素のブロック
結合方向のヒストグラムが計算される。2番目のステッ
プでは、ブロック結合方向に連続するテキスト行同士の
距離が、図5のステップS14で計算したテキストの高
さより小さければ、これらのテキスト行は、各段組内に
おいてグループ化される。このステップS73の処理
は、図25のテキスト行114のように、同じ段落に属
するテキスト行を結合するのに有効である。
【0081】次にステップS74に進み、垂直方向又は
水平方向に近接したテキストブロックが、非テキストユ
ニットによって分離されておらず、かつステップS73
で得られたヒストグラムから発見されたどんなギャップ
をも破壊しない場合にグループ化される。これらテキス
トブロックのグループ化は、ステップS14で計算した
垂直方向の高さに応じて計算される一定の閾値より小さ
いブロック間の分離状態に基づいて行なわれる。
【0082】図25の例で、段落115のテキスト行や
段落116のテキスト行から作られるテキストブロック
をグループ化するのに、このステップS74の処理が有
効である。しかし、段落117と118とを結合するの
には有効でない。これら、これらのテキストブロック1
17,118が非テキストブロック119(線)によっ
て分離されているからである。
【0083】次にステップS75に進み、あるテキスト
ブロックが非テキストブロックと結合すべきか、或はあ
る非テキストブロックが他の非テキストブロックと結合
すべきかを決定する。ここで、テキストブロックは、非
テキストタイトルブロック、非テキストハーフトーンブ
ロック、及び付属物をもつ非テキストラインと結合する
ことができる。これらの結合は次の判断に従って行なわ
れる。
【0084】(1-a)もし、あるテキストブロックが非
テキストのタイトルブロックと水平方向に近く、かつ垂
直方向にオーバラップしている場合、そのテキストブロ
ックは非テキストタイトルブロックに結合される(但
し、テキストブロックおよびタイトルブロックは共に横
組であるとする)。
【0085】(1-b)もし、あるテキストブロックが非
テキストのタイトルブロックと垂直方向に近く、かつ水
平方向にオーバラップしている場合、そのテキストブロ
ックは非テキストタイトルブロックに結合される(但
し、テキストブロックおよびタイトルブロックは共に縦
組であるとする)。
【0086】(2)あるテキストブロックが(水平方向
にも垂直方向にも)ワードサイズのブロックより小さ
く、かつそのテキストブロックが、近接するワードサイ
ズのテキストブロックを持たない場合、このテキストブ
ロックは非テキストハーフトーンイメージブロックの内
部に置かれる。
【0087】(3)付属物を持つ非テキストラインをオ
ーバラップする、あるテキストブロックに対して、その
付属物を持つラインは、おそらくアンダーライン付のテ
キストなので単にテキストとする。
【0088】また、いくつかの非テキストブロックは、
図27に従って他の非テキストブロックと結合される。
尚、この図27で、“Test”となっているのは、それぞ
れ次の内容である。 Test#1:1つのブロックが完全に他のブロックに
含まれるならば結合する。 Test#2:ピクチャーテキストの幅がワードサイズ
ブロックの幅より小さいならば結合する。 Test#3:ブロック同士が近接しているならば結合
する。
【0089】次にステップS76では属性が修正され、
これまでに述べた処理によってツリー構造が更新され
る。
【0090】図26は、図19の処理で得られるブロッ
ク構造を表しており、図22はツリー構造の一例を示す
図である。
【0091】図26中のブロックとしては、タイトルブ
ロック120、テキストブロック121、写真(線画)
122がある。また、フレームデータとしては、表形式
になっているブロック123、テキストユニット125
を内部に有し表構造になっているブロック124があ
る。尚、非テキストイメージ127は、図26中の様々
なユニットのセパレータとなっている。
【0092】次に、図1の画像変倍計算回路5について
説明する。
【0093】画像変倍計算回路5は、属性分離回路4の
分離結果の領域情報より、読み込まれた画像が予め用意
された領域情報における各画像要素領域サイズの何倍に
なるか倍率を計算する回路である。画像変倍回路6は、
画像変倍計算回路5により求めた倍率に基づいて各画像
要素を変倍する回路である。作成回路7は、画像変倍回
路6で求めた変倍結果に基づき、予め用意してあった定
形フォーマットに従い、カバーレター等を作成する回路
である。尚、これら各回路の動作原理は、全体の動作原
理の中で詳しく説明する。
【0094】次に全体の動作原理を図1に基づいて説明
する。
【0095】スキャナ回路1により原稿をスキャンして
画像が読み込まれ、この画像データは、システム制御回
路10により制御されたメモリコントロール回路2を介
してメモリ回路3に記憶される。また、メモリコントロ
ール回路2の制御の下にメモリ回路3より読み出された
画像データは、属性分離回路4に供給される。この属性
分離回路4は、読み込まれた画像データを各画像要素
(文字部、タイトル部、写真部等)に分離する属性分離
を行う。更に、これら分離された各画像要素に対して、
各画像要素の領域を示す領域情報と、全画像データにお
ける各画像要素の位置座標を示す位置情報とを同時に作
成する。これらの領域情報と位置情報は、画像変倍計算
回路5に送られる。
【0096】画像変倍計算回路5は、属性分離回路4か
ら送られてきた領域情報と位置情報とを、予め領域情報
記憶部10に記憶されている領域情報値とを比較し、そ
の比較結果に応じて変倍率を計算する。この時、各画像
要素の位置情報も比較し、それら位置情報のズレも同時
に計算する。
【0097】次に、この画像変倍計算回路5の動作原理
を図2を参照して説明する。
【0098】例えば、読み込まれた画像情報の画像要素
の1つが201で示すような情報で属性分離回路4から
送られてきたとする。202は、領域情報記憶部10に
記憶されている予め用意された領域情報値とする。まず
読み込まれた画像要素201の位置203の位置情報
と、領域情報値202の位置204の位置情報とを重ね
合わせ、画像要素201の位置情報のズレを無くす。こ
の位置情報のずれがなくなったところで、読み込まれた
画像要素201の縦、横の変倍率を計算する。この時、
変倍率は縦、横の自由変倍は行なわず、また定形フォー
マットにはめ込むことが条件であるため、変倍率の計算
には、縦、横でどちらか小さい方を選択する。
【0099】図2において、読み込まれた画像要素20
1の領域情報が縦“4”、横“10”の場合、領域情報
値202が縦“10”、横“15”の場合を考える。こ
の場合の倍率は、縦が“2.5倍”、横が“1.5倍”
となり、条件により小さい方の倍率を選択するため、画
像要素201の変倍率は“1.5”となる。画像変倍計
算回路5は、この変倍率を変倍率情報として画像変倍回
路6に送る。
【0100】画像変倍回路6は、画像変倍計算回路5か
ら送られてきた変倍率情報に合わせて画像要素を変倍
し、その変倍した画像要素を変倍画像として作成回路7
に送る。作成回路7は、画像変倍回路6から送られてき
た変倍画像を、予め定形フォーマット記憶部11に記憶
されているフォーマットの各画像要素の部分に、この変
倍画像をはめ込んでカバーレター等を作成する。この動
作例を図3に示す。またこの作成した情報は、作成情報
として出力回路8に送られ、この出力回路8は作成回路
7から送られてきた作成情報のプリント出力を行う。
【0101】図3において、写真部、グラフ部、文字
部、タイトル部及び表部で示される画像要素が存在し、
それが定形フォーマット記憶部11に記憶されている定
形フォーマットに従って配置され、1ページの画像が形
成されている。
【0102】
【その他の実施例】他の実施例として、定形フォーマッ
ト記憶部11に記憶されている各画像要素の領域に縦、
横ぴったりに納めるために、各画像要素の縦、横の自由
変倍を可能にしてもよい。また他の実施例として、変倍
率を計算する画像要素がタイトル部・文字部の場合は、
タイトル部・文字部中の個々の切り出し文字画像の文字
サイズと10の領域情報値に予め用意してある文字サイ
ズを比較し、その変倍率を計算する。
【0103】その計算結果に合わせて、個々の文字画像
を変倍して、変倍した文字画像を定形フォーマットのタ
イトル部および文字部中にはめ込むことにより、文字サ
イズを統一したカバーレター等を作成することが可能で
ある。
【0104】尚、本発明は、複数の機器から構成される
システムに適用しても、1つの機器から成る装置に適用
しても良い。また、本発明はシステム或は装置に本発明
を実施するプログラムを供給することによって達成され
る場合にも適用できる。
【0105】以上説明したように本実施例によれば、読
み込まれた画像情報を属性に応じた分離結果である領域
情報と、所定の領域情報に応じて画像の変倍を行うだけ
で、多数の原稿サイズの書類を適切に同一サイズの書類
に変換できる効果がある。
【0106】また、比較的簡単な構成で複数の画像の切
り貼りを行うことができ、かつ優れた操作環境を有する
画像処理方法及びその装置を提供できる。
【0107】
【発明の効果】以上説明したように本発明によれば、画
像情報に含まれる画像の属性を判別し、その判別した属
性に応じて各画像の領域を求め、予め設定されている領
域情報に応じて画像を変倍して所定のフォーマットの画
像を作成できる効果がある。
【0108】また本発明によれば、、面倒な画像の切り
貼りやコピー等の操作を不要にして、所望の切り貼り画
像を作成できる効果がある。
【0109】
【図面の簡単な説明】
【図1】本発明の一実施例の画像処理装置の構成を示す
ブロック図である。
【図2】本実施例の画像変倍回路の動作例を説明する模
式図である。
【図3】本実施例の作成回路における処理を説明するた
めの模式図である。
【図4】本実施例の属性分離回路における処理の概要を
示すフローチャートである。
【図5】図4のステップS2の処理を示すフローチャー
トである。
【図6】図4のステップS2の処理を示すフローチャー
トである。
【図7】図4のステップS2の処理を示すフローチャー
トである。
【図8】原稿画像に含まれる画像の属性分離を説明する
図である。
【図9】原稿画像に含まれる画像の属性分離を説明する
図である。
【図10】実施例における矩形領域の階層構造を示す図
である。
【図11】非テキスト領域の分離を説明する図である。
【図12】非テキスト領域の分離を説明する図である。
【図13】非テキスト領域の分離を説明する図である。
【図14】非テキストユニットの内部の探索方向を示す
図である。
【図15】本実施例において、白輪郭が結合される場合
を説明する図である。
【図16】本実施例において、白輪郭が結合される場合
を説明する図である。
【図17】本実施例において、白輪郭が結合される場合
を説明する図である。
【図18】図4のステップS3の詳細な処理を示すフロ
ーチャートである。
【図19】本実施例において、テキスト行をグループ化
してテキストブロックとする様子を表わすフローチャー
トである。
【図20】本実施例により得られるツリー構造を説明す
る図である。
【図21】本実施例により得られるツリー構造を説明す
る図である。
【図22】本実施例により得られるツリー構造を説明す
る図である。
【図23】本実施例で処理される原稿画像の具体例を示
す図である。
【図24】図23の画像をユニットに分割した例を示す
図である。
【図25】同じイメージに対してステップS2(図4)
の処理を施した例を示す図である。
【図26】図19の処理で得られるブロック構造を表わ
す図である。
【図27】非テキストブロック同士を結合する論理を示
す図である。
【符号の説明】
1 スキャナ回路 2 メモリコントロール回路 3 メモリ回路 4 属性分離回路 5 画像変倍計算回路 6 画像変倍回路 7 作成回路 8 出力回路 9 システム制御回路 10 領域情報記憶部 11 定形フォーマット記憶部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 大原 栄治 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 長井 由佳 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 画像情報を入力する入力手段と、 前記入力手段により入力された画像情報の属性を判別
    し、当該属性に応じて前記画像情報を分離する分離手段
    と、 前記分離手段により分離された画像情報の領域情報を求
    め、前記領域情報と予め記憶されている所定の領域情報
    とに応じて前記分離された画像情報を変倍する変倍手段
    と、 前記変倍手段により変倍された画像情報を所定のフォー
    マットに従って合成する合成手段と、を有することを特
    徴とする画像処理装置。
  2. 【請求項2】 前記分離手段は、連結する白画素或は黒
    画素数に応じて前記属性がテキストか非テキストかを判
    別することを特徴とする請求項1に記載の画像処理装
    置。
  3. 【請求項3】 前記所定のフォーマットは、前記属性に
    対応する画像情報の配列情報を含むことを特徴とする請
    求項1に記載の画像処理装置。
  4. 【請求項4】 画像情報を入力する工程と、 入力された画像情報の属性を判別し、当該属性に応じて
    前記画像情報を分離する分離工程と、 分離された画像情報の領域情報を求める工程と、 前記領域情報と予め記憶されている所定の領域情報とに
    応じて前記分離された画像情報を変倍する工程と、 変倍された画像情報を所定のフォーマットに従って合成
    する工程と、を有することを特徴とする画像処理方法。
  5. 【請求項5】 前記分離工程では、前記画像情報におけ
    る連結する白画素或は黒画素数に応じて前記属性がテキ
    ストか非テキストかを判別することを特徴とする請求項
    4に記載の画像処理方法。
  6. 【請求項6】 前記所定のフォーマットは、前記属性に
    対応する画像情報の配列情報を含むことを特徴とする請
    求項4に記載の画像処理方法。
JP7077611A 1995-04-03 1995-04-03 画像処理方法及びその装置 Withdrawn JPH08272987A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7077611A JPH08272987A (ja) 1995-04-03 1995-04-03 画像処理方法及びその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7077611A JPH08272987A (ja) 1995-04-03 1995-04-03 画像処理方法及びその装置

Publications (1)

Publication Number Publication Date
JPH08272987A true JPH08272987A (ja) 1996-10-18

Family

ID=13638719

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7077611A Withdrawn JPH08272987A (ja) 1995-04-03 1995-04-03 画像処理方法及びその装置

Country Status (1)

Country Link
JP (1) JPH08272987A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009077145A (ja) * 2007-09-20 2009-04-09 Canon Inc 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009077145A (ja) * 2007-09-20 2009-04-09 Canon Inc 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体

Similar Documents

Publication Publication Date Title
US8155445B2 (en) Image processing apparatus, method, and processing program for image inversion with tree structure
EP0660256B1 (en) Method and apparatus for selecting text and/or non-text blocks in a stored document
JP2536966B2 (ja) テキスト編集システム
US6574375B1 (en) Method for detecting inverted text images on a digital scanning device
US6738154B1 (en) Locating the position and orientation of multiple objects with a smart platen
US5987171A (en) Page analysis system
JP3308032B2 (ja) スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置
JP3302147B2 (ja) 文書画像処理方法
EP0843275A2 (en) Pattern extraction apparatus and method for extracting patterns
JPH07131641A (ja) 画像処理装置
JPH0668301A (ja) 文字認識方法及び装置
EP1017011A2 (en) Block selection of table features
US8094973B2 (en) Content aware image resizing for text and contone images
JPH1031716A (ja) 文字行抽出方法および装置
US6356657B1 (en) Image processing method and apparatus for discriminating an input image area or an attribute of image information in the discriminated area
JP3852218B2 (ja) 画像処理方法および画像処理装置
JPH08272987A (ja) 画像処理方法及びその装置
JPH09120443A (ja) 画像処理方法とその装置
JP2786355B2 (ja) 文章画像の属性判別方法
EP0975146A1 (en) Locating the position and orientation of multiple objects with a smart platen
JP3187895B2 (ja) 文字領域抽出方法
JP2881066B2 (ja) 文章画像の属性判別方法
JPH0728934A (ja) 文書画像処理装置
JP3024234B2 (ja) 文書画像の罫線抽出装置
JP2800205B2 (ja) 画像処理装置

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20020604