JPH04309191A - 領域属性識別装置 - Google Patents

領域属性識別装置

Info

Publication number
JPH04309191A
JPH04309191A JP3073397A JP7339791A JPH04309191A JP H04309191 A JPH04309191 A JP H04309191A JP 3073397 A JP3073397 A JP 3073397A JP 7339791 A JP7339791 A JP 7339791A JP H04309191 A JPH04309191 A JP H04309191A
Authority
JP
Japan
Prior art keywords
black
area
attribute
circumscribed rectangle
scan line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3073397A
Other languages
English (en)
Inventor
Yumiko Ikemure
池牟禮 由美子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP3073397A priority Critical patent/JPH04309191A/ja
Publication of JPH04309191A publication Critical patent/JPH04309191A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ワードプロセッサ、デ
スクトップパブリッシングなどの文書編集装置の入力部
となる文字認識装置の前処理に関するものである。
【0002】
【従来の技術】近年、文字・図形などが混在する文書を
スキャナなどの画像読み取り装置でビットマップデータ
として取り込み、ビットマップデータから自動的に文字
・図形領域を分割、認識する文字認識装置が利用される
ようになってきており、そのために、分割された領域の
属性を識別する領域属性識別方式が提案されている。
【0003】以下、従来の領域属性識別装置について説
明する。図9において、21文書画像全体の濃淡情報を
空間的2次元フーリエ変換するフーリエ変換処理部であ
る。22はフーリエ変換のピーク値の絶対値の変化を検
出する特徴抽出部である。23は特徴抽出部22で抽出
された特徴より、領域の属性を判定する属性判定部であ
る。
【0004】
【発明が解決しようとする課題】従来の領域属性識別装
置は、画像データ取り込みの際の多値データに対して、
画像(写真)領域と文字領域の判別を行っていた。
【0005】また、図形と文字の識別については、2次
元フーリエ変換を用いているために処理時間がかかると
いう欠点があった。本発明は上記問題を解決するもので
、取り込んだ2値画像データから画像領域と文字領域と
の識別を高速で行うことができる領域属性識別装置を提
供することを目的とするものである。
【0006】
【課題を解決するための手段】上記課題を解決するため
に本発明の領域属性識別装置は、2値化された認識対象
文書の領域分割を行い、分割された領域が文字・図形あ
るいは画像(写真)であるかを識別し、認識を行う文字
認識装置において、走査ライン上の黒画素を抽出する手
段と、抽出された黒画素と前走査ラインの黒画素との連
結状態を検査し、前走査ラインで連結が終了していれば
黒画素群の外接矩形を検出する手段と、連結終了してい
る外接矩形の幅と高さの情報より領域の属性を判定する
手段を備えたものである。
【0007】
【作用】上記構成により、走査ライン上の黒画素の位置
を検出し、ある走査ライン上のある黒画素と次の走査ラ
イン上のある黒画素とが接している箇所を求め、前走査
ラインで連結が終了していると、その黒画素群の外接矩
形を検出し、連結終了している外接矩形の幅と高さの情
報から領域の属性判定をする。このことにより、垂直方
向の走査が1ライン終了する毎に属性を判定でき、従来
の方式に比べて高速に属性識別をすることが可能となる
【0008】
【実施例】以下本発明の一実施例を図面に基づいて説明
する。図1は本発明の一実施例の領域属性識別装置のブ
ロック図である。図1において、1は走査ライン上の黒
画素の位置を検出する黒画素検出部である。2は検出さ
れた黒画素と前走査ラインの黒画素との連結状態を調べ
る連結検出部であり、前走査ラインで黒画素の連結が終
っている場合は、その外接矩形の座標を格納する。3は
抽出された外接矩形の高さあるいは幅の度数をとるヒス
トグラム作成部である。4は画像判定部であり、微小矩
形の出現頻度が閾値以上であれば、その領域は画像(写
真)領域であるとみなして処理を終了し、閾値未満であ
れば、走査終了まで黒画素検出部1〜画像判定部4の動
作を繰り返す。5は属性判定部であり、外接矩形の高さ
のばらつきに対応する標準偏差を計算し、領域の属性を
判定する。6はCPUであり、上記1〜5の各部を内蔵
している。
【0009】7はRAMであり、前走査ラインの黒ラン
(1ライン単位に黒画素が連続している長さを以下黒ラ
ンといい、白画素が連続している長さを以下白ランとい
う)の個数(preCount)、前走査ラインの対象
黒ラン番号(preNum)、走査ラインの黒ラン個数
(exeCount)、走査ラインの黒ランの開始座標
と終了座標(coodinate )などの情報を格納
し、連結終了した外接矩形の値を登録する外接矩形格納
エリア(rect)を有している。8はスキャナ、9は
CRT、10はプリンタ、11はハードディスクである
【0010】図8は文書例の一例を示し、たとえば写真
領域(1) 〜(2) 文字領域(1) 〜(11)を
有している。次に上記構成による動作を図8の文書例、
図2〜図4のフローチャートを参照しながら説明する。
【0011】図8のような構成からなる文書をビットマ
ップデータとして、図1のスキャナ8から取り込み(S
1)、文書の領域分割を行う。図8の文書例では、ビッ
トマップデータサイズは縦1100×横848 となる
【0012】スキャナ8より取り込まれたビットマップ
データから水平方向に対して、1ライン単位に白画素が
連続している長さの白ランと黒画素が連続している長さ
の黒ランを検出して、出現順に格納する。たとえば図5
のビットマップデータの1ライン目は [白2、黒4、白3、黒2、…] のようにRAM7に格納される。この検出された水平方
向のラン情報より水平領域区切りを検出する(S2)。 同様にして、垂直方向のラン情報より垂直領域区切りを
検出する(S3)。そして、水平領域区切りと垂直領域
区切りから、文書を構成する文字領域・図形領域などの
各領域に分割され(S4)、領域情報として領域開始座
標・終了座標がRAM7に格納される。
【0013】次に、分割された領域に対して属性の識別
処理を行う。領域属性の識別を行うために領域内の黒画
素の外接矩形情報を用いる。領域内の黒画素の外接矩形
を求めるには、対象ラインの黒ランと前ラインの黒ラン
とが接しているか否かを領域の高さ分だけ調べることで
実現される。
【0014】属性識別には以下に示す外接矩形特徴を用
いる。[写真領域は微小矩形が多数存在する]という特
徴から、領域内においてあらかじめ定められた閾値th
1以下の大きさを持つ外接矩形数があらかじめ定められ
た閾値th2以上あれば、その領域は写真領域と判定さ
れる。
【0015】写真領域とならなかった領域が文字領域と
図形領域になる。[文字領域はほぼ同じ位の大きさの外
接矩形が多数存在するため、矩形の大きさのバラツキは
小さい]という特徴がある。一方、[図形領域は外接矩
形の大きさにかなりのバラツキがある]という特徴があ
る。したがって、文字領域と図形領域の判定を行うため
には、外接矩形の高さのばらつきに対応する標準偏差を
求め、標準偏差の値とあらかじめ定められた閾値th3
との比較を行えば良い。閾値th3以上であれば図形領
域と判定され、th3未満であれば文字領域と判定され
る。以上の結果を図1のCRT9、あるいはプリンタ1
0に出力する(S5〜6)。
【0016】次に、領域属性の識別処理について図3、
図4を用いてさらに詳細に説明する。本実施例では1ラ
イン毎に外接矩形を検出すると同時に写真領域の判定を
行う。1ライン目の外接矩形検出では、前ラインは存在
しないので前ラインの黒ラン個数(preCount)
、前ラインの対象黒ラン番号(preNum)を0とす
る(S5−1、5−3)。また、1ライン中の複数個の
黒ランを管理するため、走査ラインの黒ラン個数(ex
eCount)を0とする(S5−2)。
【0017】領域分割部で検出された水平ラン情報から
、走査ラインの黒ランの開始座標と終了座標を取得して
coodinate に格納し(S5−4)、走査ライ
ンの黒ラン個数exeCountをカウントアップする
(S5−5)。図5の黒ラン座標は、水平ラン情報[白
2、黒4、…]より開始座標は2(白2)、終了座標は
5(白2+黒4−1)となる。
【0018】S5−4で得た黒ランの開始座標および終
了座標と前ラインの黒ラン番号preNum値に対応し
た黒ランの開始座標および終了座標より、黒ランが接し
ているか否かチェックを行う(S5−6)。たとえば、
図6において走査ラインを2ライン目、前ラインを1ラ
イン目、preNumを1、対象ランを2番目とした場
合に、黒ランの開始座標=7、終了座標=7、前ライン
の開始座標=2、終了座標=5となる。
【0019】S5−6のチェックの結果、前ラインの黒
ランとの連結が終了したと判定された場合は、走査ライ
ン黒ランと前ライン対象黒ランの位置関係を調べる(S
5−7)。たとえば図7において、前ラインの黒ラン(
preNum=1)が走査ラインの対象黒ランより前に
位置し、かつ、前ラインの黒ランが、すでに黒ラン連結
検出の終了している走査ラインの対象黒ランと接してい
ない場合は、連結終了したとして外接矩形の値(x1,
x2,y1,y2)を外接矩形格納エリアrectに登
録し、外接矩形の幅/高さに対するヒストグラムをとる
(S5−9,5−10)。ここで、x1,x2は外接矩
形の水平方向の領域開始座標および終了座標、Y1,Y
2は垂直方向の領域開始座標および終了座標を示してい
る。したがって、図7では、連結を終了した黒ランの外
接矩形として外接矩形値(x1=1,x2=5,y1=
0,y2=1)が得られる。さらに、次の前ラインの黒
ランが接触しているか否か調べるため、前ラインの黒ラ
ン番号preNumをカウントアップし(S5−11)
、S5−6に戻る。
【0020】S5−7で、走査ラインの対象黒ランが前
ラインの黒ランよりも前に位置している場合、あるいは
前ラインの黒ランが無い場合(preNum≧preC
ount)は、黒ラン連結の開始点として新規に外接矩
形座標リストを作成する(S5−8)。
【0021】S5−6のチェックの結果、前ラインの黒
ランと走査ラインの対象黒ランが連結していると判定さ
れた場合は、外接矩形座標リストの座標を変更する(S
5−12)。
【0022】この処理を走査ラインの黒ランの個数分繰
り返し(S5−13)、繰り返し終了した水平(副)走
査方向の走査終了時点で前ラインの黒ランが残っていれ
ば、残りを連結終了矩形として外接矩形格納エリアre
ctに登録し(S5−14)、幅/高さのヒストグラム
をとる(S5−15)。
【0023】以上のようにして、1ライン毎に抽出した
外接矩形の高さがth1以下の矩形数がth2以上ある
かチェックする(5−16)。th2以上あればその領
域は画像(写真)領域であると判断し、領域に画像属性
をセットして処理を終る(S5−23)。th2未満で
あれば垂直(主)走査方向の走査が終了するまで処理を
続ける。このとき、走査ラインの黒ラン個数exeCo
untの値を前ラインの黒ラン個数preCountに
セットし(S5,24)、S5−2に戻る。
【0024】走査が終了している場合は抽出した外接矩
形の高さのばらつきに対応する標準偏差を計算し、領域
の属性判定をする(S5−18)。標準偏差の値が閾値
th3以上であればその領域は図形領域であると判定さ
れ、図形属性が与えられる。閾値th3未満であれば文
字属性が与えられ、縦書き/横書きを検出して処理を終
了する(S5−19〜5−22)。
【0025】なお、本実施例では閾値th1、th2、
th3の値は以下とした。 th1=3 th2=100 th3=25 本実施例の属性識別結果を表1に示す。ここで、文字領
域(5) が画像と判定されているのは、背景のある文
字領域であるためである。
【0026】
【表1】
【0027】
【発明の効果】以上のように本発明によれば、垂直方向
の走査が1ライン終了する毎に属性判定し、属性が確定
すれば処理を終了することにより、従来の方式と比べて
少ないメモリで、かつ高速に属性識別をすることが可能
となった。
【図面の簡単な説明】
【図1】本発明の一実施例の領域属性識別装置のブロッ
ク図である。
【図2】図1の領域属性識別装置のフローチャートであ
る。
【図3】図1の領域属性識別装置の属性判定部のフロー
チャートである。
【図4】図3のフローチャートに続くフローチャートで
ある。
【図5】黒ラン座標の説明図である。
【図6】読み取りパターン側における第0ラインと第1
ラインでの黒ランおよび白ランの一例を示す図である。
【図7】読み取りパターン側における第1ラインと第2
ラインの黒ランおよび白ランの一例を示す図である。
【図8】文書例の一例を示す図である。
【図9】従来の領域属性識別装置のブロック図である。
【符号の説明】
1    黒画素検出部 2    連結検出部 3    ヒストグラム作成部 4    画像判定部 5    属性判定部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】  2値化された認識対象文書の領域分割
    を行い、分割された領域が文字・図形あるいは画像(写
    真)であるかを識別し、認識を行う文字認識装置におけ
    る領域属性識別装置であって、走査ライン上の黒画素を
    抽出する手段と、抽出された黒画素と前走査ラインの黒
    画素との連結状態を検査し、前走査ラインで連結が終了
    していれば黒画素群の外接矩形を検出する手段と、連結
    終了している外接矩形の幅と高さの情報より領域の属性
    を判定する手段とを備えた領域属性識別装置。
JP3073397A 1991-04-08 1991-04-08 領域属性識別装置 Pending JPH04309191A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3073397A JPH04309191A (ja) 1991-04-08 1991-04-08 領域属性識別装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3073397A JPH04309191A (ja) 1991-04-08 1991-04-08 領域属性識別装置

Publications (1)

Publication Number Publication Date
JPH04309191A true JPH04309191A (ja) 1992-10-30

Family

ID=13517027

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3073397A Pending JPH04309191A (ja) 1991-04-08 1991-04-08 領域属性識別装置

Country Status (1)

Country Link
JP (1) JPH04309191A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009246930A (ja) * 2008-03-31 2009-10-22 Sharp Corp 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体
CN104469071A (zh) * 2013-09-19 2015-03-25 株式会社Pfu 图像处理装置及图像处理方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009246930A (ja) * 2008-03-31 2009-10-22 Sharp Corp 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体
US8385643B2 (en) 2008-03-31 2013-02-26 Sharp Kabushiki Kaisha Determination of inputted image to be document or non-document
CN104469071A (zh) * 2013-09-19 2015-03-25 株式会社Pfu 图像处理装置及图像处理方法
CN104469071B (zh) * 2013-09-19 2017-12-15 株式会社Pfu 图像处理装置及图像处理方法

Similar Documents

Publication Publication Date Title
US5452374A (en) Skew detection and correction of a document image representation
JP3338537B2 (ja) 画像傾き検出装置
US5465304A (en) Segmentation of text, picture and lines of a document image
Antonacopoulos Page segmentation using the description of the background
JP3809404B2 (ja) 画像処理方法、装置およびシステム
US8000529B2 (en) System and method for creating an editable template from a document image
US5889886A (en) Method and apparatus for detecting running text in an image
JP2940936B2 (ja) 表領域識別方法
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
JPH03290774A (ja) 文書画像の文章領域抽出装置
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
JP3728224B2 (ja) 文書処理装置及び方法
JPH04309191A (ja) 領域属性識別装置
JP2868134B2 (ja) 画像処理方法及び装置
Mitchell et al. Document page segmentation based on pattern spread analysis
JP3165589B2 (ja) 画像分類装置
JP3095470B2 (ja) 文字認識装置
JPH06187489A (ja) 文字認識装置
JP4738645B2 (ja) 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体
JP3406942B2 (ja) 画像処理装置及び方法
JPH07111738B2 (ja) 文書中の領域境界抽出方式
JP3000480B2 (ja) 文字領域区切り検出方法
JP2982221B2 (ja) 文字読み取り装置
JP2715930B2 (ja) 線分検出方法
JPH0822507A (ja) 文書認識装置