JPH08272987A

JPH08272987A - 画像処理方法及びその装置

Info

Publication number: JPH08272987A
Application number: JP7077611A
Authority: JP
Inventors: Michiko Hirayu; 三知子平湯; Kazuyoshi Suzuki; 一可鈴木; Akihiko Sakai; 明彦酒井; Eiji Ohara; 栄治大原; Yuka Nagai; 由佳長井
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1995-04-03
Filing date: 1995-04-03
Publication date: 1996-10-18

Abstract

(57)【要約】【目的】画像情報に含まれる画像の属性を判別し、そ
の判別した属性に応じて各画像の領域を求め、予め設定
されている領域情報に応じて画像を変倍して所定のフォ
ーマットの画像を作成する画像処理方法及びその装置を
提供することを目的とする。【構成】スキャナ回路１より原稿画像情報を入力し、
属性分離回路４により、その入力された画像情報の属性
を判別し、その属性に応じて前記画像情報を分離する。
この属性分離回路４は、更にそれら分離された画像情報
の領域情報を求めて画像変倍計算回路６に出力する。画
像変倍計算回路５は、その領域情報と領域情報記憶部１
０に予め記憶されている領域情報とに応じて、その分離
された画像情報を変倍する。こうして変倍された画像情
報は、定形フォーマット記憶部１１に記憶されている所
定のフォーマットに従って定形のフォーマットに合成さ
れて出力される。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、入力した画像情報の属
性分離を行って画像を変倍する画像処理方法及びその装
置に関するものである。

【０００２】

【従来の技術】従来、多数の原稿サイズの書類を読取
り、それらの画像をまとめて１ページの画像に編集する
際は、例えば、ユーザーがマニュアルにより、各画像を
切り張りし、それをコピーするという操作を繰り返しな
がら、所望の１ページ分の画像を作成するのが一般的で
あった。

【０００３】

【発明が解決しようとする課題】しかしながら上記従来
例では、多数の原稿サイズの書類が大量にある際に、い
ちいちマニュアルにより切り張りやコピー等を行うと、
大量の切り張り、コピー作業が必要となる。このため、
煩わしい作業を繰り返さなければならず、作業効率が悪
いなどの欠点を有していた。

【０００４】本発明は上記従来例に鑑みてなされたもの
で、画像情報に含まれる画像の属性を判別し、その判別
した属性に応じて各画像の領域を求め、予め設定されて
いる領域情報に応じて画像を変倍して所定のフォーマッ
トの画像を作成する画像処理方法及びその装置を提供す
ることを目的とする。

【０００５】本発明の他の目的は、面倒な画像の切り貼
りやコピー等の操作を不要にして、所望の切り貼り画像
を作成できる画像処理方法及びその装置を提供すること
にある。

【０００６】

【課題を解決するための手段】上記目的を達成するため
に本発明の画像処理装置は以下のような構成を備える。
即ち、画像情報を入力する入力手段と、前記入力手段に
より入力された画像情報の属性を判別し、当該属性に応
じて前記画像情報を分離する分離手段と、前記分離手段
により分離された画像情報の領域情報を求め、前記領域
情報と予め記憶されている所定の領域情報とに応じて前
記分離された画像情報を変倍する変倍手段と、前記変倍
手段により変倍された画像情報を所定のフォーマットに
従って合成する合成手段とを有する。

【０００７】上記目的を達成するために本発明の画像処
理方法は以下のような工程を備える。即ち、画像情報を
入力する工程と、入力された画像情報の属性を判別し、
当該属性に応じて前記画像情報を分離する分離工程と、
分離された画像情報の領域情報を求める工程と、前記領
域情報と予め記憶されている所定の領域情報とに応じて
前記分離された画像情報を変倍する工程と、変倍された
画像情報を所定のフォーマットに従って合成する工程と
を有する。

【０００８】

【作用】以上の構成において、画像情報を入力し、その
入力された画像情報の属性を判別し、当該属性に応じて
前記画像情報を分離する。こうして分離された画像情報
の領域情報を求め、その求めた領域情報と予め記憶され
ている所定の領域情報とに応じて、分離された画像情報
を変倍し、その変倍された画像情報を所定のフォーマッ
トに従って合成するように動作する。

【０００９】

【実施例】以下、添付図面を参照して本発明の好適な実
施例を詳細に説明する。

【００１０】図１は、本発明の一実施例の画像処理装置
の構成を示すブロック図である。

【００１１】図において、１は原稿画像を読取って入力
するスキャナ回路、２はメモリコントロール回路で、メ
モリ回路３へのデータの書込み及びメモリ回路３よりの
データの読み出しを制御している。４は属性分離回路
（ブロックセレクション回路）で、メモリコントロール
回路２を通して読み出された画像データの属性分離を行
い、その分離結果である領域情報を作成する。５は画像
変倍計算回路で、読み込まれた画像データの変倍率を計
算する。６は、画像変倍計算回路５で計算された変倍率
で画像の変倍を行う画像変倍回路である。７は作成回路
で、画像変倍回路６で変倍された画像をカバーレターな
どに作成する。８は出力回路で、作成回路７で作成され
た書類を出力する。９はシステム制御回路で、本実施例
の画像処理装置全体を制御している。１０は予め用意さ
れている領域情報を記憶している領域情報記憶部であ
る。１１は定形フォーマット情報を記憶している定形フ
ォーマット記憶部である。

【００１２】次に、上述の各回路の詳細を説明する。

【００１３】まず、属性分離回路（ブロックセレクショ
ン回路）４は、画像データの属性分離を行って領域情報
を作成する回路であり、この回路４の動作原理を図４か
ら図２７を参照して説明する。

【００１４】図４は、この属性分離回路４におけるおお
まかな処理を示すフローチャートである。

【００１５】この属性分離回路４における属性分離処理
速度を速くしたい場合には、ステップＳ１で、画像デー
タの間引きが行なわれる。この画像データの間引きが行
なわれた場合、属性分離回路４の処理は、その間引かれ
たイメージに対して行なわれる。この画像データの間引
きは、ｍ×ｍ画素ブロックにおける黒画素の連結性を調
べることにより行なわれる。例えば、３×３の画素ブロ
ックにおいて、連結した黒画素が２つ存在する場合、そ
の３×３の画素ブロックは１つの黒画素に間引かれる。
逆に、その画素ブロックにおいて、連結した白画素が２
つ存在する場合は、その画素ブロックは１つの白画素に
間引かれる。

【００１６】次にステップＳ２において、画素のイメー
ジが解析され、画素同士の連結性が探索されるととも
に、その大きさや他の連結成分に対する相対的な位置に
応じて分類される。１つの連結成分というのは、白画素
によって完全に囲まれた黒画素の集合である。従って、
１つの黒画素連結成分は、他の黒画素連結成分から少な
くとも１つの白画素により完全に分離される。

【００１７】このステップＳ２の処理は、図５〜図７の
フローチャートを参照して後述するが、概略を説明する
と、連結成分の探索と、その大きさの情報と連結成分同
士から得られるいくつかの統計的な情報に基づいて行な
われる連結成分のクラス分けを行う。このクラス分けで
は、まず夫々の連結成分が、テキストユニットか、非テ
キストユニットかに分類される。そして、非テキストユ
ニットは、さらに詳細に解析され、それがフレーム構造
をもつデータか、ハーフトーンイメージか、線画か、表
か、又はその他の表形式のテキストデータかに判別され
る。そして、そのデータ構造が未知のものであれば、未
知のものとして、分類が行なわれない。そして、連結成
分の構成データを与え、そのデータの再構築を容易にす
るように、階層的な木（ツリー）構造が、それぞれの連
結成分に対して作成される。

【００１８】次にステップＳ３において、近接した連結
成分は、ギャップラインを挟まない限りグループ化され
る。ここでのグループ化は、垂直方向に行う場合と水平
方向に行う場合とがある。これはグループ化しようとす
るテキストユニットが縦書きであるか、横書きであるか
ということに対応しており、両方向に近接した連結成分
間の距離を予め水平及び垂直のそれぞれの方向について
調べ、水平方向の距離が小さい場合には水平方向に、垂
直方向の距離が小さい場合には垂直方向にグループ化を
行うこととする。

【００１９】尚、ステップＳ２で生成されたツリー構造
は、テキストと非テキストが不適当に混ざらないように
するために用いられる。更にステップＳ３では、行間で
垂直もしくは水平方向に延長したギャップと、非テキス
トユニットの垂直方向に延長した境界とを検出すること
により、テキストユニットが行にグループ化されるかど
うかを決定する。この行構造は、適当に階層ツリー構造
を更新して行くことにより、そのツリー構造の中に保持
される。

【００２０】次にステップＳ４において、ステップＳ３
でグループ化された行が、先にグループ化された方向と
は逆方向についてスペースが狭ければ、その方向に再度
グループ化されたブロックとなる。一方、非テキストユ
ニットは、そのイメージページに対する境界として用い
られる。２つの非テキストユニットの間にあるテキスト
ユニットは、他のテキストラインユニットとは分けられ
て処理される。

【００２１】さらに、ステップＳ４において、ステップ
Ｓ２で分類できなかった非テキストユニットが、大きい
フォントサイズのタイトルであるかどうかを決定するた
めに解析される。もしそれらがタイトルと決定されたな
らば、それらのユニットは、適当な属性が付けられ、そ
して、ツリー構造が更新される。画像データに含まれる
タイトルは、そのページを再構成する手助けとなる。

【００２２】図５〜図７は、図４のステップＳ２におい
て、どのように画素イメージデータの連結画素を検出
し、それらの連結画素を分類するかを示す処理フローチ
ャートである。

【００２３】まずステップＳ１１において、画像データ
に含まれる画素データが輪郭線追跡により探索される。
この輪郭線追跡は、図８に示されるように、画像をスキ
ャンすることにより行なわれる。この画像のスキャン
は、矢印Ａで示す画像の右下部から始まり、図形の右端
に出合うまで上方に行なわれて行く。このスキャンは、
他の方向、例えば左上から右下に向けて順次スキャンさ
れてもよい。黒画素にぶつかると、隣接した画素が黒画
素かどうかが、図８の３１で示す矢印方向の順に調べら
れる。この黒画素の探索は、中心から見て８方向のベク
トルで表されるので８方向探索と呼ばれる。そして、隣
接した黒画素が存在すると、このプロセスにより図形の
外部輪郭が得られる。こうして、図９に示すように、矢
印Ａ方向のスキャンが文字“Ｑ”３２の端に対応するポ
イントにぶつかる。隣接画素の調査が３１で示された方
向の順に行なわれ、文字“Ｑ”３２の外輪郭が追跡され
る。なお、ここでは閉じた輪郭の内側の部分（文字Ｑの
内側）は追跡されない。

【００２４】こうして８方向探索により得られた輪郭
線、即ち、１つの連結成分が取り出されると、次の黒画
素に出合うまでスキャンが進行する。こうして、例え
ば、完全な黒領域を表していると思われるオブジェクト
３４が８方向探索される。同様に、手書き文字“ｎｏｎ
ｔｅｘｔ”である、非テキストのオブジェクト３５が追
跡され、そして、単語“ｔｅｘｔ”を形成する個々の文
字の集合オブジェクト３６ａ〜３６ｄが追跡される。こ
の図８で示されるスキャンは、全ての連結成分が検出さ
れるまで続けられる。

【００２５】次にステップＳ１２に進み、全ての連結成
分を矩形で切り出す。この場合、個々の連結成分を覆う
可能な限り最小の矩形が描かれることになる。こうし
て、図９におけるオブジェクト３２の周りに矩形３７
が、オブジェクトの３４の周りに矩形３９が、オブジェ
クト３５の周りに矩形４０がそれぞれ描かれる。また、
テキストオブジェクト３６ａ，３６ｂ，３６ｃ，３６ｄ
に対する矩形４１ａ〜４１ｄも同様である。

【００２６】ステップＳ１３では、ステップＳ１２で得
られた全ての矩形に対して木構造における位置付けが成
される。ほとんどの場合、ステップＳ１３で得られた木
構造は、各オブジェクトに対してルートから直接生じ
る。これは、連結成分の外部輪郭だけが追跡され、閉領
域の内部は追跡されないからである。こうして、図１０
に示すように、連結成分３２に対応する矩形３７はペー
ジのルートから直接生じる。しかし、非テキストオブジ
ェクト３５を囲む矩形４０や、テキストオブジェクト３
６ａ，３６ｂを囲む矩形４１ａ，４１ｂのように、その
矩形が他の矩形（ここでは矩形３９）に完全に含まれて
しまう場合は、これらの連結成分は包含される連結成分
（この場合、成分３４）の子となる。さらに、成分３４
のように、少なくとも１つの子をもつそれぞれの連結成
分は、成分それ自身を“主要な子”とする。図９の例で
は、成分３４は他の子成分４０，４１ａ，４１ｂととも
に、自分自身の矩形３９を主要な子として含んでいる
（図１０参照）。

【００２７】次にステップＳ１４に進み、木における第
１レベルのそれぞれの連結成分は、テキストユニットか
非テキストユニットかに分類される。この分類過程は２
つのステップを含む。最初のステップでは、連結成分を
囲む矩形が予め定められたサイズと比較される。この連
結成分を囲む矩形の高さがフォントサイズの最大値に対
応する予め定められた値を越える場合、あるいは矩形の
幅がページ幅を経験的に決められた一定の値（“５”の
場合に満足のいく結果が得られている）で割った値より
大きい場合は、その連結成分は非テキスト・ユニットと
分類され、そのユニットに“非テキスト”の属性が与え
られる。

【００２８】次に第２のステップでは、属性が与えられ
なかった残りの全てのユニット、即ち、非テキストとし
て分類されなかったユニットが、残りの全ての連結成分
から得られる統計的なサイズに基づいて決められた値と
比較される。特に、非テキストとみなされなかった全て
の矩形の平均高が計算される。この平均高に、ある一定
値（一般には“２”）を掛けることによって適応的な閾
値が得られる。この閾値より大きい全てのユニットは非
テキストに分類される。一方、その閾値より小さいユニ
ットはテキストとみなす。こうして各ユニットは分類さ
れて適切な属性が与えられる。以上２つのステップによ
る分類は、図５〜図７で示される更にいくつかの処理を
受ける。これについては以下で詳しく述べる。

【００２９】ツリー構造の第１レベルの全てのユニット
がテキストか非テキストかに分類された後、テキストユ
ニットの子は、主要な子（即ち、自分自身）を含めてテ
キストとして分類される。一方、非テキストの主要な子
は非テキストとして残されるが、それ以外の子はテキス
トとして分類される。

【００３０】次にステップＳ１５に進み、最初のユニッ
トを選択する。次にステップＳ１６に進み、もしそのユ
ニットがテキストであればステップＳ１７へ進み、次の
ユニットが選択される。そしてステップＳ１６で非テキ
ストユニットが選択されるまでステップＳ１６〜ステッ
プＳ１７の処理を行い、ステップＳ１６で非テキストユ
ニットが選択されるとステップＳ１８へ進む。

【００３１】ステップＳ１８で、非テキストユニットが
子を持っているかどうかを調べる。例えば、図１０の例
では、非テキストユニット（矩形）３４は非テキストで
ある主要な子（矩形）３９と、テキストである矩形４
０，４１ａ，４１ｂという子をもつ。

【００３２】このステップＳ１８において、そのユニッ
トに子が存在する場合はステップＳ１９に進み、ここで
各ユニットは、ハーフトーン（または、グレースケー
ル）かどうかのフィルタリングを受ける。ハーフトーン
・フィルタリングにおいては、その子が調べられ“ノイ
ズ”サイズより小さいものの数が数えられる。この“ノ
イズサイズ”のユニットは、その高さが入力イメージデ
ータにおける最小のフォントサイズより小さいものであ
る。そしてステップＳ２０において、ノイズサイズより
小さいユニットの数が総数の半分より大きい場合、その
ユニットはハーフトーンイメージであると判定する。そ
の結果、ステップＳ２０からステップＳ２４に進み、そ
のユニットに“ハーフトーン(HALFTONE)”という属性が
与えられる。そしてステップＳ２５に進み、ハーフトー
ンイメージの中のテキストが調べられる。即ち、ハーフ
トーンイメージの子の中ではなく、ハーフトーンイメー
ジと同レベルになるように、木構造を修正する。ここで
子の処置が適切であれば、ハーフトーンイメージ中の文
字認識も可能になる。そしてステップＳ１７に戻って次
のユニットが選択され、前述と同様の処理を実行する。

【００３３】一方、ステップＳ１９のハーフトーンフィ
ルタリングの結果、そのユニットがハーフトーンでない
ことが分かったらステップＳ２０からステップＳ２１に
進み、そこでそのユニットの主要な子を、後の処理のた
めに選択する。そしてステップＳ２２に進む。

【００３４】またステップＳ１８で、非テキストユニッ
トであって、子を持たないと判定された場合、或はステ
ップＳ２１で主要な子が後の処理のために選択された場
合はステップＳ２２に進み、そのユニットがフレーム・
フィルタリングを受ける。このフレームフィルタリング
とは、そのユニットがフレーム（枠）であるかどうかを
判定することである。この「フレームである」とは、そ
のユニットを囲むような矩形を構成するほとんど同じ長
さの幅や高さを持った平行な直線が複数存在することを
意味している。ここでは特に、注目ユニットにおいて画
素単位で見た時の各行での連結成分の線幅を調べる。

【００３５】図１１において、非テキストユニット４２
は、４４で示す様な輪郭成分をもつ連結成分４３を含ん
でいる。この例において、行(ROW)ｉにおける子の連結
成分の線幅はＸi、即ち、輪郭線４４の左端４５ａから
右端４５ｂまでの距離になる。一方、行ｊでは連結成分
４３の内部に２つの線幅が存在する。即ち、４６ａ〜４
６ｂ間と、４７ａ〜４７ｂ間である。そして、最も長い
線幅である４６ａ〜４６ｂ間が、距離Ｘjとして定義さ
れる。

【００３６】このようにして、非テキストユニット４２
における全ての行ｎにおいて距離Ｘが計算され、その非
テキストユニットがフレームであるかどうかが、次の不
等式によって調べられる。ここで、Ｘkは上で述べたように、連結成分中の第ｋ行
における最も長い線幅を示し、Ｗは矩形４２の横幅、Ｎ
は行の数であり、閾値は枠が多少傾いていても枠として
検知できるように予め計算された値である。ここで１°
の傾きを許すためには、｛ｓｉｎ（１°）×Ｌ＋（一定
値）｝の閾値でよい。この一定値というのは、ステップ
Ｓ１４で計算された文字の平均高である。そして、上記
の不等式が満たされないと、そのユニットはフレームデ
ータと判定され、ステップＳ２３からステップＳ２６に
進み、“フレーム(FRAME)”という属性が付加される。
こうして、例えば、“フレームであり表”あるいは“フ
レームでありハーフトーン”の様な判定が、フレームに
対して可能になる。

【００３７】このステップＳ２６からステップＳ４２に
進み、そのフレームデータが表あるいは表形式のものを
含んでいる可能性が調べられ、連結成分内の白輪郭を得
るための検査が行なわれる。この白輪郭は、ステップＳ
１１で得られた（黒）輪郭と基本的には同じだが、ただ
黒画素の代わりに白画素を調べて得られるものである点
が異なる。

【００３８】図１４のように、非テキストユニットの内
部が右下から左上に向かって矢印Ｂの方向に探索され
る。初めて白画素に出会うと、その点から近接の白画素
に対して５１で示す様な外向きの方向に探索を行う。こ
こでは、１から４で示される方向しか必要でないことに
注意すべきである。その結果、ここでの処理における白
輪郭追跡は４方向の探索ということになる。全ての白輪
郭が取り出されるまで、この処理は続けられる。例え
ば、白輪郭追跡は、黒線分５２，５３，５４，５５で囲
まれる輪郭部を取り出すことであり、同様の処理は５６
で示す様な黒画素の内部に対しても行なわれる。このよ
うにして非テキストオブジェクト中の全ての閉じた白輪
郭が追跡されるまで、上述した矢印Ｂ方向へのスキャン
が続けられる。

【００３９】そしてステップＳ４３において、非テキス
トユニットの密度が計算される。この密度は、連結成分
内の黒画素の数をカウントし、矩形で囲まれた画素の総
数により、その矩形の黒画素の数を割ることにより求め
られる。

【００４０】次にステップＳ４４に進み、発見された非
テキストユニット内の白輪郭の数が計算される。そし
て、もしその数が“４”以上であれば、その非テキスト
イメージはテーブルか、テキストブロックがテーブル状
に並んだものである可能性があるためステップＳ４７に
進み、白輪郭の充填率が計算される。この白輪郭の充填
率というのは、非テキストイメージ中の白輪郭で囲まれ
る面積の割合を示すものである。

【００４１】即ち、図１４の例では、５７，５９で示す
ように、完全に白画素だけで構成される白輪郭もあれ
ば、６０，６１のように内部に黒画素領域を含む白輪郭
も存在する。もし、白輪郭の充填率が高ければ、おそら
く、その非テキストイメージはテーブルか、テキストブ
ロックがテーブル状に並んだものである。この推定をよ
り確実にするために、注目白輪郭に対して水平及び垂直
方向に格子状の内部構造を持っているかどうかが調べら
れる。特にステップＳ４９では、水平または垂直方向に
少なくとも２つの輪郭線を横断していないような境界線
をもつ白輪郭は、格子上になっていないとみなして再結
合する。例えば、図１４の例では白輪郭５９の左境界６
２と右境界６３は、別の白画素６０の左境界６４と右境
界６５と一致するように垂直方向に伸びている。そのた
め、これらの白輪郭は格子状に並んでいると判断され、
再結合されることはない。同様に、白輪郭５９の上境界
６６と下境界６７は、別の黒画素７０の上境界６８と下
境界６９と一致するように水平方向に伸びている。その
結果、これらの白輪郭も格子状に並んでいると判定さ
れ、再結合されない。

【００４２】図１５〜図１７は、白輪郭が結合される場
合を説明する図である。

【００４３】図１５において、例えば非テキストユニッ
ト７１は、ハーフトーンイメージからバイナリイメージ
までのユニットを含む非テキストユニットの例を表して
いる。非テキストイメージ７１は、黒画素領域７２と白
画素領域７４，７５，７６，７７，７８，７９を含んで
いる。おそらくこの白画素領域の充填率は充分高いの
で、ステップＳ４８よりステップＳ４９に進み、再結合
される。まず、図１５及び図１６で示すように、まず白
輪郭７５の上端と下端が白輪郭７７の上端と下端と比較
される。これらの上端及び下端は一致しないので、白輪
郭７５と７６とが結合され、新たな白輪郭７６’が作り
出される。尚、この白画素の充填率が低い時はステップ
Ｓ４８よりステップＳ５５に進む。

【００４４】次に図１６と図１７において、白輪郭７７
の左右の境界が白輪郭７８の左右の境界と比較される。
これらの境界は一致しないので、白輪郭７７と７９とは
再結合され、新たな白輪郭７７’となる。このプロセス
は、再結合が起らなくなるまで水平および垂直方向に繰
り返される。

【００４５】以上説明したようにテーブルの白輪郭は結
合されにくく、テーブル以外、例えばハーフトーンイメ
ージや線図形のようなテーブル以外のものは結合され易
い。そしてステップＳ５０で再結合率が計算される。も
し再結合率が高いか、再結合処理の後に残った白輪郭の
数が“４”未満であればステップＳ５５に進み、その非
テキストユニットは、以下で詳述するように、ハーフト
ーンイメージか、線図形であると判定される。

【００４６】ステップＳ５０で、再結合率が高くない
か、または少なくとも４個以上の白輪郭が残った場合は
ステップＳ５１に進み、テーブルと判定されて属性(TAB
LE)が付与される。次にステップＳ５２に進み、新たに
テーブルと判定された図形の内部が調べられ、含まれる
連結成分の探索や分類が行なわれる。新しい内部連結成
分に従って、ステップＳ５３で木構造が更新される。次
にステップＳ５４に進み、内部連結成分はテキストか非
テキストが再び分類され、その分類結果に従って適切な
属性が付加される。この処理は、既に説明したステップ
Ｓ１２からステップＳ１４の処理と同じである。そして
ステップＳ５４からステップＳ１７に戻り、次のテキス
トユニットが選択される。

【００４７】ステップＳ４８で白輪郭の充填率が高くな
いか、或はステップＳ５０で再結合率が高くない場合、
その非テキスト枠図形はハーフトーンイメージか、線図
形の可能性が高い。そして、そのユニットがハーフトー
ンイメージか線図形かは、そのユニット中の黒画素の水
平方向のランレングスの平均、白画素と黒画素の割合及
び密度によって決定される。一般的に、非常に暗いイメ
ージはハーフトーンイメージと判定され、白く明るいイ
メージは線図形と判定される。

【００４８】特に、白画素の平均ランレングスがほとん
ど“０”の場合（ほとんど真黒か、まだら模様のイメー
ジ）で、さらにステップＳ４３で計算された密度が白よ
り黒の方が大きい場合（即ち、密度が閾値約０．５（こ
れを１番目の閾値とする）より大きい時）は、そのフレ
ームユニットはハーフトーンであると判定される。も
し、密度が１番目の閾値よりも大きくない場合には、そ
のユニットは、線図形と決められる。また、もし白画素
の平均ランレングスがほとんど“０”と言えず、かつ白
画素の平均ランレングスが黒画素の平均ランレングスよ
りも大きい場合は、そのフレームユニットは線図形と判
定される。しかし、白画素の平均ランレングスが黒画素
の平均ランレングスより大きくない場合（即ち、これも
黒が支配的なイメージである）、さらに詳細なテストが
必要である。特に、黒画素の数が白画素の数よりはるか
に少ない時（即ち、黒画素の数が白画素の２倍（これを
２番目の閾値とする）より小さいとき）、このフレーム
ユニットはハーフトーンと判定される。一方、黒画素の
数を白画素の数で割った値が２番目の閾値より大きくな
いが、ステップＳ４３で計算した密度が１番目の閾値よ
り大きい場合は、そのフレームユニットはハーフトーン
イメージであると判定する。そうでなければ、線図形と
判定される。

【００４９】そしてステップＳ５５において、フレーム
ユニットが線図形と判定されるとステップＳ５８に進
み、ここで“線図形”という属性(LINE-DRAWING)が付加
され、更にステップＳ５９で、全ての子が除去される。
特に、あるユニットが一度線図形と判定されると、もう
そのユニットに対しては文字認識処理が行なわれない。
その後、ステップＳ１７に戻り、次のテキストユニット
が選択される。

【００５０】一方、ステップＳ５５で、そのフレームユ
ニットが線図形でないと判定されるとステップＳ５６に
進み、“ハーフトーン”という属性(HALFTONE)が付加さ
れ、次にステップＳ５７で、そのユニットの子の内、テ
キストサイズの子が除去される。そして、テキストサイ
ズより大きい全ての子は、フレームハーフトーンイメー
ジの子として残ることが許される。そしてステップＳ１
７に戻り、次のテキストユニットが選択される。

【００５１】次に再び図６のステップＳ４４に戻り、白
輪郭の数が“４”より大きくない場合は、そのフレーム
ユニットはテーブルでないと判断されてステップＳ４５
に進み、ステップＳ４３で計算された密度が、ある閾値
（約０．５）と比較される。この閾値はフレーム内のテ
キストユニットや線図形が全画素の半分より小さいはず
だということで選ばれている。もしこの密度が、この閾
値より小さければステップＳ４６に進み、フレームユニ
ットの内部構造が調べられる。この処理は、すでに述べ
た、フレームユニットの内部構造に対するステップＳ１
１の処理と同じである。

【００５２】一方、ステップＳ４５で、その密度が予め
定めた閾値より大きい場合はステップＳ３５に進み、そ
のフレームユニットが線図形かハーフトーンイメージの
どちらかに分類されるか、或はそのフレームが、分類不
可能（即ち、そのフレームは“未知”）であるかが判定
される。

【００５３】図５のステップＳ２３に戻り、ステップＳ
２２のフレームフィルタリングによって非テキストユニ
ット内にフレームが検知されなかった場合はステップＳ
２７に進み、その非テキストユニットが“線”を含んで
いるかどうかを判定する。“線”はテキストの境界を表
わすのに有用な非テキストユニットといえる。しかし、
そのような線によって区切られる（囲まれる）テキスト
は、その線に非常に近い場合が多く、接触が起きている
可能性がある。その結果、線探索というのはテキストが
線に接触している場合と、接触していない場合の両方を
考慮する必要がある。

【００５４】接触が起きていない場合の線探索のために
は、非テキストユニットの縦方向のヒストグラムが計算
される。図１２の例では、線のヒストグラム４８は、そ
の高さがほぼ線幅に等しい均一の値になるはずである。
線幅というのは近似的にテキストユニットの幅
（“Ｗ”）に等しいが、もし違いが生じるとすれば、そ
れは傾きθｓのせいである。この傾きは原稿画像が入力
された時点で起きている。そして、非テキストユニット
が線を含んでいるかどうかを判定するためには、ヒスト
グラム中の各セル(cell)ｋの高さ４９を幅Ｗと比較す
る。次式のように、これらの値の差の２乗平均が閾値と
比較される。この閾値は、非テキスト内の線のねじれ、または、傾き
θｓを許容するように計算される。１°のねじれや傾き
に対しては、という閾値が満足な結果を生じることがわかっている。

【００５５】上述の不等式によって非接触の線が発見さ
れなかった場合は、接触が起きている線が含まれていな
いかどうかの探索が行なわれる。注目している非テキス
トユニット中に、接触している線が含まれているかどう
かを調べるためには、線状のものがユニットの境界線近
くに存在するかどうかを調べればよい。例えば、図１２
の例のように、ユニットを囲む矩形の境界線近くに線が
存在すると、境界線からの距離の２乗和を計算すること
によって調べることができる。即ち、このケースでは、
次式の不等式が計算される。もし、上式の左辺が予め定められた閾値より小さけれ
ば、接触している線が存在していることがわかる。この
閾値というのは接触を起していない線の場合と同じとを
使えばよい。

【００５６】こうしてステップＳ２８で線が検出されれ
ばステップＳ２９に進み、“線”という属性(LINE)が、
その非テキストユニットに付加される。そしてステップ
Ｓ１７に進み、次のユニットが選択される。

【００５７】一方、もしステップＳ２８で、線が検出さ
れなかった場合はステップＳ３０に進み、その非テキス
トユニットのサイズが調べられる。このサイズがある閾
値より小さければステップＳ３１に進み、その非テキス
トユニットの分類を決定することができず、その閾値は
最大のフォントサイズから決定される。具体的には、最
大フォントサイズの半分の値にするとよい結果が得られ
る。そして“未知”の属性(UNKNOWN)が付加される。そ
の後ステップＳ１７に進み、次のユニットが選択され
る。

【００５８】ステップＳ３０において、もしサイズが予
め決められた閾値より大きければステップＳ３２に進
み、そこで非テキストユニットの内部領域で白輪郭の探
索が行なわれ、ステップＳ４２〜ステップＳ４４で説明
した処理と同様の処理がステップＳ３２〜ステップＳ３
４で実行され、白輪郭の数が計算される。

【００５９】そしてステップＳ３４において、白輪郭の
数が“４”以上でなければステップＳ３５に進み、線図
形あるいはハーフトーンイメージとして十分な大きさを
持っているかどうかを確かめるために、サイズが計算さ
れる。このサイズの決定は、そのテキストのユニットの
高さと幅、及び黒画素のランレングスの最大長に基づい
て行なわれる。特に、その非テキストユニットの高さと
幅が最大フォントサイズより小さい場合は、そのユニッ
トは線図形やハーフトーンイメージを構成するに十分な
大きさを持ってないとみなされてステップＳ３８に進
み、“未知”の属性(UNKNOWN)が付加される。

【００６０】同様に、ユニットの幅は最大フォントサイ
ズより大きいが、黒画素のランレングスの最大長が最大
フォントサイズより大きくないときもステップＳ３８に
進み“未知”の属性が付加される。そしてステップＳ１
７に戻り、新しいユニットが選択される。

【００６１】ステップＳ３５において、その非テキスト
ユニットが線図形或はハーフトーンイメージを構成する
のに十分な大きさを持っている場合はステップＳ３６に
進み、線図形かどうかが判定され、線図形又はハーフト
ーンイメージという属性が付加される。これらステップ
Ｓ３６〜Ｓ４１の処理は、前述のステップＳ５５〜Ｓ５
９と同様の処理であるため、それらの説明を省略する。

【００６２】図５〜図７（図４のステップＳ２に相当）
で説明した流れに従って、入力画像中の全ての連携成分
が調べられ、分類されると図２０で示されるようなツリ
ー構造が得られる。

【００６３】図２０に示すように、ルート(ROOT)は入力
画像のページにあたる。ルートの子はテキストブロック
(TEXT)、又は、未知(NON-TEXT UNKNOWN)・フレーム(FRA
ME)・写真（図）(PICTURE)・線(LINE)からなる非テキス
トブロックである。フレーム(FRAME)の子はテキストブ
ロック(TEXT)、“未知”の非テキストデータ(UNKNOW
N)、テキストブロックを含む表(TABLE)、写真（図）(PI
CTURE)、線(LINE)である。

【００６４】図２３は、ピクセルイメージデータのペー
ジ９０を表わす図で、この中には、大きなフォントサイ
ズのテキスト９１、例えば９３の様なテキストデータを
含む表９２、テキストデータ９４、水平線９５、別のタ
イトル９６、２つの段落からなるテキストデータ９７、
キャプション９９を備え枠で囲まれた線図形９８、タイ
トル１００で始まりテキストデータ１０１へ続く２番目
の段組、キャプション１０３を備え枠で囲まれたハーフ
トーンイメージ１０２、テキストデータ１０４、水平線
１０５、最終段落１０６が含まれる。

【００６５】図２４は、同じイメージに対してステップ
Ｓ２（図４）の処理を施したものである。

【００６６】図２４から理解できるように、ページ９０
中の連結成分は矩形で切り出され、その内部は図５のス
テップＳ２３からステップＳ４２〜ステップＳ５４で示
される処理によって属性が調べられる。ステップＳ１１
で得られた全てのテキストユニットは、ツリーのどの位
置にあっても、ステップＳ１２で垂直方向或は水平方向
にグループ化される。このグループ化の操作は、各テキ
ストユニット及びその周辺のユニットの纏まり具合に基
づいている。また段組を表していると思われるギャップ
（空間スペース）が垂直及び水平両方向について検出さ
れ、保持される。なお、図４のステップＳ３の詳細な説
明は、図１８のフローチャートを参照して以下に説明す
る。

【００６７】まずステップＳ６１では、非テキストユニ
ットの境界線が垂直及び水平方向に伸ばされ、ギャップ
ラインマーカとされる。

【００６８】これは図２４に示されるように、垂直方向
のギャップラインマーカ１０９ａ，１０９ｂが、テキス
トあるいは非テキストユニットと交差するまで（この例
では図２３のユニット９５）垂直方向に伸ばされる。同
様に、ギャップラインマーカ１０９ｃ，１０９ｄも、ユ
ニット９５と交差するまで伸ばされる。また、水平方向
のギャップラインマーカについても同様の処理を行う。
ギャップラインマーカは、ギャップ（空間スペース）を
検知するのに有効で、これによって段組を得ることがで
きる。

【００６９】次にステップＳ６２に進み、図２４の１０
７で示すようなテキストユニットの行結合が行なわれ
る。ここでの行結合は、両方向に近接した連結成分間の
距離を予め水平及び垂直それぞれの方向について調べ
て、水平方向の距離が短い場合には水平方向に、垂直方
向の距離が短い場合には垂直方向について行なわれる。
この結合方向は、結合しようとするテキストユニットの
組方向が縦であるか横であるかに対応しているものであ
る。

【００７０】そして、これらのテキストユニットは、次
の条件が満たされると１つのテキスト行として結合され
る。（１）その結合によってギャップラインマーカを越えな
い。（２）そのテキストユニットは他のテキストユニットと
接触しているか、一定の閾値以下の距離にある。この閾
値としては図５のステップＳ１４で求めたテキストの平
均長に、実験的に求めたスケールファクタ（本実施例で
は“１．２”で満足いく結果が得られている）をかけた
ものでよい。

【００７１】しかし、結合の前にテキストユニット間の
ギャップをテキストユニットが横組である場合には水
平、縦組である場合には垂直の方向に伸ばすことによっ
て、段組構造を表わす方向に、伸びたギャップが存在す
るかどうか決定することができる。例えば、図２４の例
では、ギャップ１０８が２つのテキストの間に存在して
いる。ギャップは数行に亙って垂直方向に伸びているた
め、ステップＳ６２では、テキストユニット間の距離が
閾値以下であってもギャップとして残される。

【００７２】次にステップＳ６３に進み、ステップＳ６
２で結合されなかったテキストユニットの組みに対し
て、それらのユニットが共に近接する他のテキストユニ
ットによってオーバラップされ、かつ、その結合がギャ
ップラインマーカを横切らないとき結合が行なわれる。
このステップは、段落の構造からくるものではなく、単
にテキスト行におけるスペースの関係から発生したもの
を消去するのに効果的である。図２４の例では、ステッ
プＳ６２で残されたギャップ１０８は、ステップＳ６３
で消去される。なぜなら、すぐ下の文字にオーバラップ
され、かつ、ギャップラインマーカを横切ることもない
からである。そしてステップＳ６４に進み、ツリー構造
を更新する。

【００７３】図１９は、図４のステップＳ３で説明した
グループ化の処理の結果を表わす模式図で、図２１は、
このステップＳ３の処理によってツリー構造がどのよう
に変更されたかを表わす図である。

【００７４】図２５に示されるように、結合されたテキ
ストユニットはグループ化されて、１１０で示すような
テキスト行にされる。特に、ツリー構造のどこにあって
も、テキストユニットは必ず結合されてテキスト行にな
る。例えば、１１１はツリー構造状のフレームテーブル
の下にあるが、やはり結合されている。しかし、図６の
ステップＳ２７からＳ３９、及びステップＳ４２からス
テップＳ５９で求めた白輪郭を越えた再グループ化は行
なわれないことに注意されたい。これは、テーブル中の
項目を１つの行にしてしまわないためである。尚、左右
の段組の間のギャップは保持される。また、非テキスト
ユニットは再グループ化されない。そのため、１１２や
１１３で示すように、これらユニットは閾値以下の距離
にあってもグループ化されていない。

【００７５】図２１では、この新たなグループ化が反映
されたツリー構造になっている。

【００７６】図１８（図４のステップＳ３）で述べた過
程でテキストユニットが結合されてテキスト行になった
後、ステップＳ４で示されるように、テキスト行はテキ
スト行形成時の結合方向とは逆の方向に結合されてテキ
ストブロックとなる。この過程を図１９を用いて、より
詳細に説明する。

【００７７】グループ化の過程は、テキスト行ユニット
のまとまり具合と非テキストユニットの位置による。例
えば、間に存在する非テキスト行は境界線として作用
し、反対側にあるテキスト行同士がグループ化されて１
つのテキストブロックとなるのを防ぐ。２つの連続する
非テキスト行ユニットの間にある全てのテキスト行は同
時に処理を受ける。加えて、ステップＳ４では、いくつ
かのテキストユニットは非テキストユニットと結合され
るべきか（例えば非テキストイメージとともに構成され
るテキストキャプション）、または、ある非テキストユ
ニットを他の非テキストユニットと結合すべきか（例え
ば、ハーフトーンイメージと関係している線図形）が、
調べられる。

【００７８】図１９は、テキスト行をグループ化してテ
キストブロックとする様子を表わすフローチャートであ
る。

【００７９】まずステップＳ７１で、タイトルブロック
が、ステップＳ１４で非テキストユニットと分類された
ものの中から形成される。その判断基準は、最大フォン
トサイズより小さいが、平均テキストサイズより大きい
ということである。そのような、同じ様な大きさで近接
している非テキストユニットが全てグループ化されるこ
とによってタイトルブロックが形成される。そして、そ
のブロックには“タイトル”という属性(TITLE)が付加
される。そして、グループ化できなかった残りの全ての
非テキストブロックは、ピクチャーテキストという属性
が付加される。そして、ツリー構造がこれに応じて適当
に更新される。なお、タイトルはページの再構成に役立
つ。

【００８０】次にステップＳ７２に進み、テキスト行の
間にある非テキストユニットが検出される。これらの非
テキストユニットは、テキストブロック間の境界線とし
て作用し、テキスト行が１つのテキストブロックになる
のを防いでいる。そしてステップＳ７３に進み、２つの
ステップからなる処理によって、テキスト行がテキスト
行形成時の結合方向とは逆の方向（以下、これを「ブロ
ック結合方向」と呼ぶ）にグループ化されてテキストブ
ロックとなる。最初のステップでは、段組の間のギャッ
プが探索される。そのためには、例えば画素のブロック
結合方向のヒストグラムが計算される。２番目のステッ
プでは、ブロック結合方向に連続するテキスト行同士の
距離が、図５のステップＳ１４で計算したテキストの高
さより小さければ、これらのテキスト行は、各段組内に
おいてグループ化される。このステップＳ７３の処理
は、図２５のテキスト行１１４のように、同じ段落に属
するテキスト行を結合するのに有効である。

【００８１】次にステップＳ７４に進み、垂直方向又は
水平方向に近接したテキストブロックが、非テキストユ
ニットによって分離されておらず、かつステップＳ７３
で得られたヒストグラムから発見されたどんなギャップ
をも破壊しない場合にグループ化される。これらテキス
トブロックのグループ化は、ステップＳ１４で計算した
垂直方向の高さに応じて計算される一定の閾値より小さ
いブロック間の分離状態に基づいて行なわれる。

【００８２】図２５の例で、段落１１５のテキスト行や
段落１１６のテキスト行から作られるテキストブロック
をグループ化するのに、このステップＳ７４の処理が有
効である。しかし、段落１１７と１１８とを結合するの
には有効でない。これら、これらのテキストブロック１
１７，１１８が非テキストブロック１１９（線）によっ
て分離されているからである。

【００８３】次にステップＳ７５に進み、あるテキスト
ブロックが非テキストブロックと結合すべきか、或はあ
る非テキストブロックが他の非テキストブロックと結合
すべきかを決定する。ここで、テキストブロックは、非
テキストタイトルブロック、非テキストハーフトーンブ
ロック、及び付属物をもつ非テキストラインと結合する
ことができる。これらの結合は次の判断に従って行なわ
れる。

【００８４】（1-a）もし、あるテキストブロックが非
テキストのタイトルブロックと水平方向に近く、かつ垂
直方向にオーバラップしている場合、そのテキストブロ
ックは非テキストタイトルブロックに結合される（但
し、テキストブロックおよびタイトルブロックは共に横
組であるとする）。

【００８５】（1-b）もし、あるテキストブロックが非
テキストのタイトルブロックと垂直方向に近く、かつ水
平方向にオーバラップしている場合、そのテキストブロ
ックは非テキストタイトルブロックに結合される（但
し、テキストブロックおよびタイトルブロックは共に縦
組であるとする）。

【００８６】（2）あるテキストブロックが（水平方向
にも垂直方向にも）ワードサイズのブロックより小さ
く、かつそのテキストブロックが、近接するワードサイ
ズのテキストブロックを持たない場合、このテキストブ
ロックは非テキストハーフトーンイメージブロックの内
部に置かれる。

【００８７】（3）付属物を持つ非テキストラインをオ
ーバラップする、あるテキストブロックに対して、その
付属物を持つラインは、おそらくアンダーライン付のテ
キストなので単にテキストとする。

【００８８】また、いくつかの非テキストブロックは、
図２７に従って他の非テキストブロックと結合される。
尚、この図２７で、“Test”となっているのは、それぞ
れ次の内容である。Ｔｅｓｔ＃１：１つのブロックが完全に他のブロックに
含まれるならば結合する。Ｔｅｓｔ＃２：ピクチャーテキストの幅がワードサイズ
ブロックの幅より小さいならば結合する。Ｔｅｓｔ＃３：ブロック同士が近接しているならば結合
する。

【００８９】次にステップＳ７６では属性が修正され、
これまでに述べた処理によってツリー構造が更新され
る。

【００９０】図２６は、図１９の処理で得られるブロッ
ク構造を表しており、図２２はツリー構造の一例を示す
図である。

【００９１】図２６中のブロックとしては、タイトルブ
ロック１２０、テキストブロック１２１、写真（線画）
１２２がある。また、フレームデータとしては、表形式
になっているブロック１２３、テキストユニット１２５
を内部に有し表構造になっているブロック１２４があ
る。尚、非テキストイメージ１２７は、図２６中の様々
なユニットのセパレータとなっている。

【００９２】次に、図１の画像変倍計算回路５について
説明する。

【００９３】画像変倍計算回路５は、属性分離回路４の
分離結果の領域情報より、読み込まれた画像が予め用意
された領域情報における各画像要素領域サイズの何倍に
なるか倍率を計算する回路である。画像変倍回路６は、
画像変倍計算回路５により求めた倍率に基づいて各画像
要素を変倍する回路である。作成回路７は、画像変倍回
路６で求めた変倍結果に基づき、予め用意してあった定
形フォーマットに従い、カバーレター等を作成する回路
である。尚、これら各回路の動作原理は、全体の動作原
理の中で詳しく説明する。

【００９４】次に全体の動作原理を図１に基づいて説明
する。

【００９５】スキャナ回路１により原稿をスキャンして
画像が読み込まれ、この画像データは、システム制御回
路１０により制御されたメモリコントロール回路２を介
してメモリ回路３に記憶される。また、メモリコントロ
ール回路２の制御の下にメモリ回路３より読み出された
画像データは、属性分離回路４に供給される。この属性
分離回路４は、読み込まれた画像データを各画像要素
（文字部、タイトル部、写真部等）に分離する属性分離
を行う。更に、これら分離された各画像要素に対して、
各画像要素の領域を示す領域情報と、全画像データにお
ける各画像要素の位置座標を示す位置情報とを同時に作
成する。これらの領域情報と位置情報は、画像変倍計算
回路５に送られる。

【００９６】画像変倍計算回路５は、属性分離回路４か
ら送られてきた領域情報と位置情報とを、予め領域情報
記憶部１０に記憶されている領域情報値とを比較し、そ
の比較結果に応じて変倍率を計算する。この時、各画像
要素の位置情報も比較し、それら位置情報のズレも同時
に計算する。

【００９７】次に、この画像変倍計算回路５の動作原理
を図２を参照して説明する。

【００９８】例えば、読み込まれた画像情報の画像要素
の１つが２０１で示すような情報で属性分離回路４から
送られてきたとする。２０２は、領域情報記憶部１０に
記憶されている予め用意された領域情報値とする。まず
読み込まれた画像要素２０１の位置２０３の位置情報
と、領域情報値２０２の位置２０４の位置情報とを重ね
合わせ、画像要素２０１の位置情報のズレを無くす。こ
の位置情報のずれがなくなったところで、読み込まれた
画像要素２０１の縦、横の変倍率を計算する。この時、
変倍率は縦、横の自由変倍は行なわず、また定形フォー
マットにはめ込むことが条件であるため、変倍率の計算
には、縦、横でどちらか小さい方を選択する。

【００９９】図２において、読み込まれた画像要素２０
１の領域情報が縦“４”、横“１０”の場合、領域情報
値２０２が縦“１０”、横“１５”の場合を考える。こ
の場合の倍率は、縦が“２．５倍”、横が“１．５倍”
となり、条件により小さい方の倍率を選択するため、画
像要素２０１の変倍率は“１．５”となる。画像変倍計
算回路５は、この変倍率を変倍率情報として画像変倍回
路６に送る。

【０１００】画像変倍回路６は、画像変倍計算回路５か
ら送られてきた変倍率情報に合わせて画像要素を変倍
し、その変倍した画像要素を変倍画像として作成回路７
に送る。作成回路７は、画像変倍回路６から送られてき
た変倍画像を、予め定形フォーマット記憶部１１に記憶
されているフォーマットの各画像要素の部分に、この変
倍画像をはめ込んでカバーレター等を作成する。この動
作例を図３に示す。またこの作成した情報は、作成情報
として出力回路８に送られ、この出力回路８は作成回路
７から送られてきた作成情報のプリント出力を行う。

【０１０１】図３において、写真部、グラフ部、文字
部、タイトル部及び表部で示される画像要素が存在し、
それが定形フォーマット記憶部１１に記憶されている定
形フォーマットに従って配置され、１ページの画像が形
成されている。

【０１０２】

【その他の実施例】他の実施例として、定形フォーマッ
ト記憶部１１に記憶されている各画像要素の領域に縦、
横ぴったりに納めるために、各画像要素の縦、横の自由
変倍を可能にしてもよい。また他の実施例として、変倍
率を計算する画像要素がタイトル部・文字部の場合は、
タイトル部・文字部中の個々の切り出し文字画像の文字
サイズと１０の領域情報値に予め用意してある文字サイ
ズを比較し、その変倍率を計算する。

【０１０３】その計算結果に合わせて、個々の文字画像
を変倍して、変倍した文字画像を定形フォーマットのタ
イトル部および文字部中にはめ込むことにより、文字サ
イズを統一したカバーレター等を作成することが可能で
ある。

【０１０４】尚、本発明は、複数の機器から構成される
システムに適用しても、１つの機器から成る装置に適用
しても良い。また、本発明はシステム或は装置に本発明
を実施するプログラムを供給することによって達成され
る場合にも適用できる。

【０１０５】以上説明したように本実施例によれば、読
み込まれた画像情報を属性に応じた分離結果である領域
情報と、所定の領域情報に応じて画像の変倍を行うだけ
で、多数の原稿サイズの書類を適切に同一サイズの書類
に変換できる効果がある。

【０１０６】また、比較的簡単な構成で複数の画像の切
り貼りを行うことができ、かつ優れた操作環境を有する
画像処理方法及びその装置を提供できる。

【０１０７】

【発明の効果】以上説明したように本発明によれば、画
像情報に含まれる画像の属性を判別し、その判別した属
性に応じて各画像の領域を求め、予め設定されている領
域情報に応じて画像を変倍して所定のフォーマットの画
像を作成できる効果がある。

【０１０８】また本発明によれば、、面倒な画像の切り
貼りやコピー等の操作を不要にして、所望の切り貼り画
像を作成できる効果がある。

【０１０９】

【図面の簡単な説明】

【図１】本発明の一実施例の画像処理装置の構成を示す
ブロック図である。

【図２】本実施例の画像変倍回路の動作例を説明する模
式図である。

【図３】本実施例の作成回路における処理を説明するた
めの模式図である。

【図４】本実施例の属性分離回路における処理の概要を
示すフローチャートである。

【図５】図４のステップＳ２の処理を示すフローチャー
トである。

【図６】図４のステップＳ２の処理を示すフローチャー
トである。

【図７】図４のステップＳ２の処理を示すフローチャー
トである。

【図８】原稿画像に含まれる画像の属性分離を説明する
図である。

【図９】原稿画像に含まれる画像の属性分離を説明する
図である。

【図１０】実施例における矩形領域の階層構造を示す図
である。

【図１１】非テキスト領域の分離を説明する図である。

【図１２】非テキスト領域の分離を説明する図である。

【図１３】非テキスト領域の分離を説明する図である。

【図１４】非テキストユニットの内部の探索方向を示す
図である。

【図１５】本実施例において、白輪郭が結合される場合
を説明する図である。

【図１６】本実施例において、白輪郭が結合される場合
を説明する図である。

【図１７】本実施例において、白輪郭が結合される場合
を説明する図である。

【図１８】図４のステップＳ３の詳細な処理を示すフロ
ーチャートである。

【図１９】本実施例において、テキスト行をグループ化
してテキストブロックとする様子を表わすフローチャー
トである。

【図２０】本実施例により得られるツリー構造を説明す
る図である。

【図２１】本実施例により得られるツリー構造を説明す
る図である。

【図２２】本実施例により得られるツリー構造を説明す
る図である。

【図２３】本実施例で処理される原稿画像の具体例を示
す図である。

【図２４】図２３の画像をユニットに分割した例を示す
図である。

【図２５】同じイメージに対してステップＳ２（図４）
の処理を施した例を示す図である。

【図２６】図１９の処理で得られるブロック構造を表わ
す図である。

【図２７】非テキストブロック同士を結合する論理を示
す図である。

【符号の説明】

１スキャナ回路２メモリコントロール回路３メモリ回路４属性分離回路５画像変倍計算回路６画像変倍回路７作成回路８出力回路９システム制御回路１０領域情報記憶部１１定形フォーマット記憶部

───────────────────────────────────────────────────── フロントページの続き (72)発明者大原栄治東京都大田区下丸子３丁目30番２号キヤノン株式会社内 (72)発明者長井由佳東京都大田区下丸子３丁目30番２号キヤノン株式会社内

Claims

【特許請求の範囲】

【請求項１】画像情報を入力する入力手段と、前記入力手段により入力された画像情報の属性を判別
し、当該属性に応じて前記画像情報を分離する分離手段
と、前記分離手段により分離された画像情報の領域情報を求
め、前記領域情報と予め記憶されている所定の領域情報
とに応じて前記分離された画像情報を変倍する変倍手段
と、前記変倍手段により変倍された画像情報を所定のフォー
マットに従って合成する合成手段と、を有することを特
徴とする画像処理装置。
【請求項２】前記分離手段は、連結する白画素或は黒
画素数に応じて前記属性がテキストか非テキストかを判
別することを特徴とする請求項１に記載の画像処理装
置。
【請求項３】前記所定のフォーマットは、前記属性に
対応する画像情報の配列情報を含むことを特徴とする請
求項１に記載の画像処理装置。
【請求項４】画像情報を入力する工程と、入力された画像情報の属性を判別し、当該属性に応じて
前記画像情報を分離する分離工程と、分離された画像情報の領域情報を求める工程と、前記領域情報と予め記憶されている所定の領域情報とに
応じて前記分離された画像情報を変倍する工程と、変倍された画像情報を所定のフォーマットに従って合成
する工程と、を有することを特徴とする画像処理方法。
【請求項５】前記分離工程では、前記画像情報におけ
る連結する白画素或は黒画素数に応じて前記属性がテキ
ストか非テキストかを判別することを特徴とする請求項
４に記載の画像処理方法。
【請求項６】前記所定のフォーマットは、前記属性に
対応する画像情報の配列情報を含むことを特徴とする請
求項４に記載の画像処理方法。