JP2789622B2 - 文字/図形領域判定装置 - Google Patents

文字/図形領域判定装置

Info

Publication number
JP2789622B2
JP2789622B2 JP63313938A JP31393888A JP2789622B2 JP 2789622 B2 JP2789622 B2 JP 2789622B2 JP 63313938 A JP63313938 A JP 63313938A JP 31393888 A JP31393888 A JP 31393888A JP 2789622 B2 JP2789622 B2 JP 2789622B2
Authority
JP
Japan
Prior art keywords
image
chain
pixel
black
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63313938A
Other languages
English (en)
Other versions
JPH02159690A (ja
Inventor
昇 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP63313938A priority Critical patent/JP2789622B2/ja
Publication of JPH02159690A publication Critical patent/JPH02159690A/ja
Application granted granted Critical
Publication of JP2789622B2 publication Critical patent/JP2789622B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は人間による認識のためのマーク付け等が行わ
れていない一般の文書を認識するための文書画像認識に
おいて、文字と図形が混在する文書における文字領域と
図形領域を識別判定する装置に関するものである。
(従来の技術) 一般に行われている文字/図形領域判定処理は(1)
黒画素群の大きさ,(2)近隣の線の密度,(3)周辺
分布特徴などを利用している。
(発明が解決しようとする課題) しかし、上記の黒画素群の大きさにより分離処理をす
る方法(1)においては、黒画素群の大きさだけからで
は、見出しなどの大きな文字、小さな図形などは誤った
分離をしてしまうという問題点がある。
上記の近隣の線の密度により分離処理をする方法
(2)においては、近隣の線の密度を調べるためには、
線のストロークを抽出し、その分布を調べる必要がある
ので、そのための処理が煩雑で一般に処理時間がかかっ
てしまうという問題点がある。
上記の周辺分布特徴を利用する方法(3)において
は、周辺分布では、黒画素を投影加算するために、文字
と図形が縦・横方向から見た際に分離してないと、分離
を行いにくいという問題点がある。
本発明は、このような従来技術の問題点を解決するこ
とを目的とするものである。つまり、大きな文字も文字
として、小さな図形も図形として分離でき、比較的簡単
な処理により、高速化でき、文字と図形が複雑に混在し
ていても文字/図形分離が行えるようにすることを目的
とするものである。
(課題を解決するための手段) 上記目的を達成するための本発明の構成は、第1図の
実施例に示すように、画像をデジタル化して入力する画
像入力部1と、画像を記憶しておくイメージメモリ2
と、画像における輪郭を抽出する輪郭抽出部3と、その
輪郭抽出部3により抽出した輪郭を追跡し、これをチェ
ーン符号化するチェーン符号化部4と、そのチェーン符
号の方向の変化回数を計数する方向変化計数部5と、そ
の一連のチェーン符号に連結する黒画素を計数する黒連
結計数部6と、方向変化計数部5により計数した方向変
化回数と黒連結計数部6により計数した黒画素数とに基
づいて文字領域と図形領域とを判定する領域判定部7と
を備えたことを特徴とする。
(作用) 本発明は、画像入力部1から一般文書(人間による処
理のためのマーク付け等が行われていない文書)をデジ
タル入力し、その原画像をイメージメモリ2に格納して
おき、その原画像に対して、輪郭抽出部3により画像の
輪郭を抽出し、その輪郭線をたどりながら、チェーン符
号化部4によって、チェーン符号化を行い、方向変化計
数部5によってチェーン符号の方向の変化を計数し、黒
連結計数部6によって、一連のチェーン符号に連結する
原画像の黒画素(つまり、その一連のチェーン符号によ
って囲まれた黒画素の面積)を計数し、領域判定部7に
よって、チェーン符号の変化回数とその一連のチェーン
符号の変化回数とその一連のチェーン符号によって囲ま
れた黒画素の面積を利用して、文字の領域と図形の領域
を判定する。
(実施例) 第1図は本発明の一実施例を示すもので、画像入力部
1,イメージメモリ2,輪郭抽出部3,チェーン符号化部4,方
向変化計数部5,黒連結計数部6,領域判定部7,文字処理部
8,図形処理部9からなっている。
画像入力部1は、文字や図形が混在する文書画像をデ
ジタル化して入力する。
イメージメモリ2は、前記デジタルデータを記憶して
おく。
輪郭抽出部3は、第2図に示すように原画像と、その
原画像を1画素分、右にシフトした画像との論理積をと
り、その処理結果の画像と原画像を1画素分、左にシフ
トした画像との論理積をとり、同じように上,下に1画
素分シフトした画像との論理積をとると、4方向に1画
素分収縮した画像ができあがり、この画像と原画像との
排他的論理和をとることによって、輪郭抽出をする。第
3図に原画像と、収縮画像と、輪郭抽出画像を示す。
チェーン符号化部4は、輪郭抽出部3によって輪郭抽
出された画像に対して、ラスター走査を行い、黒画素を
見つけ、その黒画素を白画素に置き換え、その画素の8
近傍を走査し、黒画素があったならば、第4図に従い、
チェーン符号化を行い、その画素を白画素に置き換え、
次々とこの処理を8近傍に黒画素がなくなるまで、くり
返す。また、8近傍に複数の黒画素が存在した場合は、
注目した画素以外の黒画素の位置情報をスタックする。
メインの黒画素追跡が終了した時点でスタックされた画
素の位置情報を取り出し、同様にチェーン符号化をくり
返す。このスタックされていた画素情報から追跡して抽
出したチェーン符号はメインのチェーン符号とつながっ
ているので、子チェーン符号とする。スタックにある画
素情報を全て取り出した時点で、最初に行っていたラス
ター走査を続ける。これによって、画像全てのチェーン
符号化が行われる。第5図はチェーン符号化の手順をよ
り詳細に示すフローチャートである。
まず、走査の始点として着目画素を画像の左上とする
(ステップ11)。その着目画素が黒画素であるか否かを
調べ(ステップ12)、黒画素でないときは着目画素をラ
スター走査順に従って変更する(ステップ13)。着目し
た画素が最終画素(例えば画像の右下の画素)であるか
否かを判定し(ステップ14)、最終画素でなければステ
ップ12へ戻り、着目画素が黒画素であるかどうかを判定
し、黒画素でなければ着目画素を変更するという動作を
繰り返して着目画素が黒画素に遭遇するまでラスター走
査順に従って走査して行く。
着目画素が黒画素であったときは、着目画素を白画素
に変更する(ステップ15)。そして、着目画素の周りの
8近傍に黒画素があるかどうかを調べる(ステップ1
6)。黒画素が8近傍に2個以上あるときはスタックに
2個目以上の座標を入れる(ステップ18)。1個目の黒
画素に対しては、次のステップ(19)の処理を行う。着
目画素の近傍に黒画素が1個あるときは、それをチェー
ン符号化する(ステップ19)。即ち、第4図における中
心の画素からみた近傍の8画素の方向のうち該当する方
向の数値(0,1,2,3,4,5,6,7)で符号化する。そして上
記近傍の黒画素を次の着目画素とし、ステップ15に戻
り、同様のチェーン符号化処理を続行する。
着目画素の8近傍に黒画素がなかったときは、スタッ
クを調べる(ステップ20)。スタックに黒画素座標があ
るときにはその座標を取り出し(ステップ21)、これを
着目画素とし、ステップ15に戻り、同様のチェーン符号
化処理を続行する。スタックに黒画素座標がないときに
は次の黒画素を走査するために、ステップ12に戻る。こ
のとき着目画素の位置は、チェーン符号化のための追跡
処理を行う前の座標である。
走査の最終画素に達したら(ステップ14)、チェーン
符号化処理を終了する。
方向変化計数部5は、チェーン符号化された各々の黒
画素連(1本のメインのチェーン符号とそれにつながっ
ている子チェーン符号の組)の方向の変化を計数する。
黒連結計数部6では、チェーン符号化部4によって生
成された一連のチェーン符号(メインのチェーン符号と
その子チェーン符号の組)に連結している原画像の黒画
素を計数する。たとえば、第3図(c)の輪郭抽出画像
は一連のチェーン符号になっており(“を”の穴、つま
り第3図(c)の10、は外側の輪郭と接しており、一連
のチェーン符号を形成している)、このチェーン符号に
連結している原画像の黒画素とは、第3図(b)の収縮
画像になる。つまり、一連のチェーン符号に連結する黒
画素を計数することは、孤立画像の面積を計数している
ことになる。また、第6図のように複数の輪郭を持つ、
つまり、一連のチェーン符号が複数組で一つの孤立画像
を形成している場合は、その複数組のチェーン符号を新
たに一連のチェーン符号として、方向変化計数部5で処
理している一連のチェーン符号と対応がとれるようにす
る。具体的には、そのようなチェーン符号番号を文字/
図形の領域判定部7へ知らせるようにする。
領域判定部7では、“文字は比較的小さく、複雑で輪
郭の方向変化が煩雑であり、図形は比較的大きく、簡単
で輪郭の方向変化が少ない”ことを利用して、各々のチ
ェーン符号の方向の変化回数とその黒連結画像の画素数
(面積)の関係、たとえば式(1)のような比をとり、
あるしきい値で、文字と図形を分離する。
(チェーン符号の方向の変化回数)/(面積)…(1) 文字と判定した領域は文字処理部8へ、図形と判定し
た領域は図形処理部9へ渡す。
文字処理部8や図形処理部9では、文書画像認識のた
めの文字認識や、図形のベクトル化などそれぞれの画像
の特性に適した処理を行う。
なお、上記の実施例においては、輪郭抽出部3で上,
下,左,右の4方向で収縮したが、これを右上,右下,
左上,左下も含めた8方向で収縮を行うようにすること
もできる。
また、輪郭抽出部としては、上記実施例では輪郭を抽
出するのに収縮画像を用いたが、その他の輪郭抽出手
段、例えば、画像に微分処理を施して輪郭を得るような
手段を用いてもよい。
また、上記実施例では輪郭抽出してからチェーン符号
化を行っているが、これを輪郭抽出を行わずに、黒画素
と白画素の境界をたどることによって、チェーン符号化
を行うようにすることもできる。
(発明の効果) 本発明は、輪郭線をチェーン符号化し、そのチェーン
符号より方向の変化回数を計数すると共に、そのチェー
ン符号に連結している黒画素数(面積)を計数すること
によって、文字領域の図形領域を分離するように構成し
たので、大きな文字も文字として、小さな図形を図形と
して分離でき、しかも従来技術に比べ比較的簡単な処理
であるので、処理を高速化することでき、文字と図形が
複雑に混在していても文字領域と図形領域の判定を確実
に行うことができる。
【図面の簡単な説明】
第1図は、本発明の一実施例の構成を示すブロック図で
ある。 第2図は、収縮画像を作成する方法の説明図である。 第3図(a)は原画像、同図(b)は第2図の方法によ
って得られた収縮画像、同図(c)は輪郭抽出された画
像の例を示す図である。 第4図は、チェーン符号化する際のチェーン符号の方向
とそれを表す数を示す図である。 第5図は、本実施例におけるチェーン符号化の手順を示
すフローチャートである。 第6図は、1つの黒連結画像に対して、複数のチェーン
符号が存在する例を示す図である。 1……画像入力部、2……イメージメモリ、3……輪郭
抽出部、4……チェーン符号化部、5……方向変化計数
部、6……黒連結計数部、7……領域判定部、8……文
字処理部、9……図形処理部。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】画像をデジタル化して入力する画像入力部
    と、 画像を記憶しておくイメージメモリと、 画像における輪郭を抽出する輪郭抽出部と、 輪郭抽出部により抽出した輪郭を追跡し、これをチェー
    ン符号化するチェーン符号化部と、 そのチェーン符号の方向の変化回数を計数する方向変化
    計数部と、 その一連のチェーン符号に連結する黒画素を計数する黒
    連結計数部と、 方向変化計数部により計数した方向変化回数と黒連結計
    数部により計数した黒画素数より文字領域と図形領域と
    を判定する領域判定部と を備えたことを特徴とする文字/図形領域判定装置。
JP63313938A 1988-12-14 1988-12-14 文字/図形領域判定装置 Expired - Lifetime JP2789622B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63313938A JP2789622B2 (ja) 1988-12-14 1988-12-14 文字/図形領域判定装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63313938A JP2789622B2 (ja) 1988-12-14 1988-12-14 文字/図形領域判定装置

Publications (2)

Publication Number Publication Date
JPH02159690A JPH02159690A (ja) 1990-06-19
JP2789622B2 true JP2789622B2 (ja) 1998-08-20

Family

ID=18047322

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63313938A Expired - Lifetime JP2789622B2 (ja) 1988-12-14 1988-12-14 文字/図形領域判定装置

Country Status (1)

Country Link
JP (1) JP2789622B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05342408A (ja) * 1991-04-04 1993-12-24 Fuji Xerox Co Ltd 文書画像ファイリング装置
JPH05346970A (ja) * 1991-04-04 1993-12-27 Fuji Xerox Co Ltd 文書認識装置

Also Published As

Publication number Publication date
JPH02159690A (ja) 1990-06-19

Similar Documents

Publication Publication Date Title
JP3950777B2 (ja) 画像処理方法、画像処理装置および画像処理プログラム
JP2940936B2 (ja) 表領域識別方法
JPH04104324A (ja) プログラム作成装置
JP4077094B2 (ja) カラー文書画像認識装置
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
JPH05342408A (ja) 文書画像ファイリング装置
JP2789622B2 (ja) 文字/図形領域判定装置
JP2507949B2 (ja) 文字/図形領域判定装置
JPH0656618B2 (ja) 画像情報の文字・図形分離方法
Ye et al. Document image matching and annotation lifting
JPH03126181A (ja) 文書画像の領域分割方法
JPS63304387A (ja) 文書読取装置
JP2796561B2 (ja) 表形式文書認識方式
JPS62121589A (ja) 文字切出し方法
JP3586911B2 (ja) 枠線認識装置
JPH022189B2 (ja)
JP2001043312A (ja) 文書画像処理装置
JPH03268181A (ja) 文書読み取り装置
JPH0658689B2 (ja) 線図形分離装置
JPH0660220A (ja) 文書画像の領域抽出方法
JP3104355B2 (ja) 特徴抽出装置
JPH02166583A (ja) 文字認識装置
JPH11120291A (ja) パタン認識システム
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JPH0656625B2 (ja) 特徴抽出方式