JPH0363882A - 画像処理装置 - Google Patents

画像処理装置

Info

Publication number
JPH0363882A
JPH0363882A JP1200892A JP20089289A JPH0363882A JP H0363882 A JPH0363882 A JP H0363882A JP 1200892 A JP1200892 A JP 1200892A JP 20089289 A JP20089289 A JP 20089289A JP H0363882 A JPH0363882 A JP H0363882A
Authority
JP
Japan
Prior art keywords
image
area
character
graphic
separation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1200892A
Other languages
English (en)
Other versions
JP2906465B2 (ja
Inventor
Noboru Shimizu
昇 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP1200892A priority Critical patent/JP2906465B2/ja
Publication of JPH0363882A publication Critical patent/JPH0363882A/ja
Application granted granted Critical
Publication of JP2906465B2 publication Critical patent/JP2906465B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は人間による認識のためのマーク付は等が行われ
ていない一般文書を認識するための文書画像認識におい
て、文字と図形が混在する文書から文字領域と図形領域
とを分離すると共にそれぞれの領域を表示する表示手段
を備えた画像処理装置に関するものである。
(従来の技術) 人間による認識のためのマーク付は等が行われていない
一般文書を圧縮して記憶装置内に格納する場合、あるい
は上記文書内の文字あるいは図形を認識する場合、文字
と図形とを混在した形で処理を行うことは困難である。
そこで、文字と図形とを混在した文書から文字と図形と
を分離する処理を行った後に、上記の圧縮あるいは認識
等の処理を行っていた。
(発明が解決しようとする課題) しかし、文字と図形との分離において、形状の似ている
もの、たとえば、文字の“−(いち)と図形の“  (
点線)とを正確に判断して分離することは困難であった
。したがって、圧縮あるいは認識等の処理が終わってか
ら、表示手段に表示された文字あるいは図形を目視しな
がら一つ−つ修正しなければならないので、この修正は
大変手間がかかる。また、上記修正の範囲を矩形等のあ
る程度大きな領域で修正できたとしても、離れている点
線等を2つ一緒に修正したり、その間にある図形までも
一緒に修正してしまうという問題があった。
本発明は、入力画像から文字領域と図形領域とを分離し
た後、これらを圧縮あるいは認識等の処理を行う前に、
分離した結果を直ちに表示できる表示手段を備えた画像
処理装置を提供することを目的とする。
(課題を解決するための手段) 第1図は本発明の画像処理装置における原理ブロック構
成図で、画像入力手段l、イメージメモリ2、特徴抽出
手段3、文字/図形分離手段4、表示手段5から構成さ
れる。
画像入力手段1は、文字や図形を含む文書画像を2値デ
ジタルデータとして入力する。イメージメモリ2は、入
力した2値デジタルデータを記憶しておく。特徴抽出手
段3は、イメージメモリ2に記憶された画像における黒
画素塊の面積、複雑さ、偏平率等を特徴量として抽出す
る。文字/図形分離手段4は、前記特徴抽出手段3で得
られた特徴量から文字領域と図形領域とを分離する。分
離された文字領域と図形領域とは、それぞれ表示手段5
に表示される。
(作  用) 本発明は、画像入力手段1から文字や図形を含む一般文
書すなわち、人間による処理のためのマーク付は等が行
われていない文書をデジタルデータとして入力し、その
画像をイメージメモリ2に格納する。イメージメモリ2
に格納されている画像の黒画素塊についてラスタースキ
ャンし、特徴抽出手段3において、その特徴量を抽出す
る。
特徴量としては黒画素塊の面積、複雑さ、偏平率等を計
算する。そして、文字/図形分離手段4において、上記
計算によって得られた黒画素塊の面積、複雑さ、偏平率
等を用いて文字/図形分離アルゴリズムにより文字領域
と図形領域とに分離される。分離された文字領域または
図形領域は、分離処理の結果をチエツクするためにCR
T等の表示手段5に表示される。
(実 施 例) 第2図は本発明の一実施例を示すもので、第2図におけ
る符号工ないし5は第1図図示のものと対応しているの
で、詳細な説明は省略する。
3iおよび32は特徴抽出手段3におけるラベル付は部
および特徴抽出部、61および62は記憶手段6におけ
る文字記憶部および図形記憶部、7は確認修正手段、8
は修正指示入力手段である。
ラベル付は部31は、イメージメモリ2に格納されてい
る画像に対して、孤立している黒画素塊のそれぞれを識
別できるような番号に置き換える。
たとえば、第3図図示のごとく、黒画素を全て“1″に
置き換える。次に、第4図図示のごとく、5番目に見つ
けた黒画素塊の1”を全て′5”に置き換える。同じく
、6番目に見つけた黒画素塊の“l”を全て“6”に置
き換える。このラベル付けの方法は公知の方法(たとえ
ば、「ディジタル画像処理jp360〜365  Ro
senfeld&Kak著参照)を用いることができる
ラベル付は部31でラベル付けが終わった後、特徴抽出
部32では、それぞれのラベル付けされた黒画素塊の特
徴量を抽出する。この特徴量としては、黒画素塊の「面
積」、輪郭のチェーン符号の方向の変化回数の割合によ
って決まる「複雑さ」、および各々のラベルが付けられ
ている黒画素塊を囲む最小の矩形すなわち、外接矩形の
高さと幅とにより求まる「偏平率」がある。
先ず、「面積」の測定方法は、ラベル付けされた黒画素
塊をラスタースキャンし、黒画素塊に同一数字の付され
たラベル番号の数を計数する。たとえば、第4図図示の
ごとく、ラベル番号“5″の面積は19であり、ラベル
番号“6″の面積は11である。
次に、「複雑さ」を求めるための輪郭のチェーン符号化
法を第6図フローチャートを参照しつつ説明する。
先ずラスタースキャンを開始する(ステップ■)。
ラスタースキャンを続け、最終の画素であればラスター
スキャンは終了する(ステップ■)。
ラスタースキャンされた画素にラベルが付けられている
か否かを調べ、ラベルが付いている黒画素であれば次の
ステップへ進む。黒画素でなければラスタースキャンを
続ける(ステップ■)。
当該黒画素が今までに輪郭を抽出したラベルか否かを調
べ、初めてのものであれば次のステップへ進み、今まで
に輪郭を抽出したラベルであればラスタースキャンを続
ける(ステップ■)。
第4図図示のごとく、ラベル付けされた画素を見つけた
らその輪郭に沿って右手にラベル付けされた画素、左手
に白画素がくる方向(つまり、時計回りの方向〉に、ラ
ベル付けされた画素を追跡する。そして、方向によるチ
ェーン符号の割当は、第5図図示のごとく決められてい
る。すなわち、第4図図示ラベル番号“5”の黒画素塊
は、左上端の黒画素から出発し、右に11進み、その後
左に11進み、下に7降り、その抜上1こ7上がって一
周する。この時のチェーン符号は、”o o o 。
0000000222222222223333333
1111111”となる(ステップ■)。
黒画素塊の一周に全てチェーン符号が付くまで続けられ
る(ステップ■〉。
以上のようにして求められたチェーン符号から前記ラベ
ル番号“5”の黒画素塊の「複雑さ」が求まる。
7 次に、「偏平率」を求めるために黒画素塊の外接矩形を
求める。黒画素塊の外接矩形は、チェーン符号をたどり
ながら、それぞれの方向を数え上げ、反対の方向は1減
するようにし、それぞれの方向のピーク値を求めること
によって、外接矩形の高さと横幅を求めることができる
そして、「偏平率」は次の式で求まる。
max  (width、height )width
  :  外接矩形の横幅 height :  外接矩形の高さ max (a、b)  :  a、bの大きい方を取り
出すmin (a、b)  :  a、bの小さい方を
取り出す第4図図示のラベル番号“5”の黒画素塊の場
合、 以上のような各処理により、黒画素塊“5′の特徴であ
る「面積」、「複雑さ」、「偏平率」を抽出することが
できる。
この抽出した特徴に基づいて、文字/図形分離手段4に
おいて、3次元特徴空間での多次元クラスタリングを行
い、ラベル番号“5”の黒画素塊を文字または図形の何
れかに識別する。この際に用いるクラスタリング手法は
、たとえば、「ノくターン認識と図形処理」長足 真 
著p27〜28に記載されているクラスタリングアルゴ
リズムにしたがう。
前記文字/図形分離手段4で分離された文字画像と、特
徴抽出手段3で抽出された文字に該当する黒画素塊の特
徴群とを文字記憶861に送出して記憶する。同様に、
図形画像と特徴抽出手段3で抽出された図形に該当する
黒画素塊の特徴群とを図形記憶部62に送出して記憶す
る。
文字記憶部61および図形記憶162の記憶内容は、確
認修正手段7を通してたとえば、CRT等の表示手段5
に出力される。
表示手段5における表示方法は、文字領域を赤で表示し
、図形領域を青で表示して見やすくすることができる。
操作者は表示手段5に表示された文字領域または図形領
域を見ながら修正指示入力手段8でマウス等のポインテ
ィングデバイスまたはキーボード等を用いて、誤識別し
た画素塊を指示して修正コマンドを入力する。
また、確認修正手段7では、操作者が修正指示入力手段
8から指示したものと、直接修正指示はされていないが
特徴空間内で近いものを、自動的に修正することもでき
る。すなわち、確認修正手段7では、文字/図形記憶部
62に記憶されている黒画素塊の特徴より、修正指示さ
れた画素塊と特徴空間内で距離の近いものを探し出し、
文字と図形との認定の誤りを修正する。
距離の近いものを探し出す際の距離計算は、たとえば、
ユークリッド距離を用い、その計算式は次の通りである
11X+  XJIB XI :修正指示された対象面素塊の特徴空間内での座
標(ベクトル) X、:対象面素塊と同じカテゴリに含まれており、対象
外の画素塊の特徴空間内座標(i≠j)この計算をX、
と同じカテゴリ (文字または図形)内の全ての画素塊
について計算し、ある闇値より小さいものを距離が近い
ものと判断し、修正操作の時に同様な処理を施す。
以上の実施例において、特徴として「面積」、「複雑さ
」、「偏平率」を用い、輪郭のチェーン符号として4連
結を、また、文字/図形分離アルゴリズムとして多次元
クラスタリング法をそれぞれ用いたが、これらに限定す
るものではない。特徴およびアルゴリズムを他の手法と
し、輪郭のチェーン符号を8連結とすることもできる。
本発明の実施例によれば、文字領域および図形領域を表
示する表示手段と修正指示入力手段からの指示で確認修
正できる確認修正手段とを備えているので、表示手段に
表示された文字領域および図形領域を目視しながら、修
正指示入力手段から的確な指示を行い、誤識別したもの
を直ちに修正できる。
また、表示手段に表示された文字領域および図形領域を
目視して修正できるので、必要でない部分まで誤って修
正してしまうことがない。
さらに、確認修正手段において特徴空間内の距離の近い
ものを一緒に自動修正できるようにすることもでき、操
作者の誤識別の手間がかからない。
(発明の効果) 本発明によれば、文字領域と図形領域とを分離した後の
処理を行う前に、表示手段に表示することができるので
、分離処理における誤りを簡単にチエツク修正できる。
【図面の簡単な説明】
第1図は本発明の原理ブロック構成図、第2図は本発明
の詳細な説明図、第3図および第4図は黒画素塊のラベ
ル付は説明図、第5図はチェーン符号割当説明図、第6
図はチェーン符号化を行うフローチャートである。 1・・・画像入力手段 2・・・イメージメモリ 3・・・特徴抽出手段 4・・・文字/図形分離手段 5・・・表示手段 6・・・記憶手段 7・・・確認修正手段 8・・・修正指示入力手段 第1図 第2図

Claims (1)

  1. 【特許請求の範囲】 文字と図形とが混在する画像をデジタルデータとして入
    力する画像入力手段と、 この画像入力手段により入力された入力画像を記憶する
    イメージメモリと、 前記イメージメモリに記憶されている画像データの特徴
    を抽出する特徴抽出手段と、 この特徴抽出手段に基づいて入力画像を文字領域と図形
    領域とに分離する文字/図形分離手段と、文字/図形分
    離手段で分離された画像の文字領域と図形領域とを表示
    する表示手段と、 を備えたことを特徴とする画像処理装置。
JP1200892A 1989-08-02 1989-08-02 画像処理装置 Expired - Fee Related JP2906465B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1200892A JP2906465B2 (ja) 1989-08-02 1989-08-02 画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1200892A JP2906465B2 (ja) 1989-08-02 1989-08-02 画像処理装置

Publications (2)

Publication Number Publication Date
JPH0363882A true JPH0363882A (ja) 1991-03-19
JP2906465B2 JP2906465B2 (ja) 1999-06-21

Family

ID=16431989

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1200892A Expired - Fee Related JP2906465B2 (ja) 1989-08-02 1989-08-02 画像処理装置

Country Status (1)

Country Link
JP (1) JP2906465B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05342408A (ja) * 1991-04-04 1993-12-24 Fuji Xerox Co Ltd 文書画像ファイリング装置
JP2009070242A (ja) * 2007-09-14 2009-04-02 Ricoh Co Ltd 領域分割方法及び装置、並びにプログラム
JP2010108135A (ja) * 2008-10-29 2010-05-13 Toshiba Corp 画像処理装置、画像処理プログラムおよび画像処理方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05342408A (ja) * 1991-04-04 1993-12-24 Fuji Xerox Co Ltd 文書画像ファイリング装置
JP2009070242A (ja) * 2007-09-14 2009-04-02 Ricoh Co Ltd 領域分割方法及び装置、並びにプログラム
JP2010108135A (ja) * 2008-10-29 2010-05-13 Toshiba Corp 画像処理装置、画像処理プログラムおよび画像処理方法

Also Published As

Publication number Publication date
JP2906465B2 (ja) 1999-06-21

Similar Documents

Publication Publication Date Title
US11605219B2 (en) Image-processing device, image-processing method, and storage medium on which program is stored
JPH0363882A (ja) 画像処理装置
JPS6337487A (ja) 文字認識装置
JPS61272882A (ja) 情報認識装置
JP3014123U (ja) 文字認識装置
JP2675303B2 (ja) 文字認識方法
JPH07182459A (ja) 表構造抽出装置
JPH04199483A (ja) 文書認識修正装置
JPH07160811A (ja) 文字認識装置
JPH0495173A (ja) 特徴識別装置
JP2003208566A (ja) 文字抽出方法、文字抽出装置およびプログラム
JPH0696272A (ja) 帳票フォーマット定義体作成装置
JPS63239569A (ja) 文字認識装置
JPH0434655A (ja) 図面読取装置
JPS63229586A (ja) 文字認識装置
JPS58125183A (ja) 光学文字読取装置における認識不能文字表示方法
JPS63221495A (ja) 文字認識装置
JPS63271588A (ja) 文字認識装置
JP2977244B2 (ja) 文字認識方法及び文字認識装置
JPH06162106A (ja) 電子ファイリングシステム
JPH04156694A (ja) 文字認識方式
JPH0282379A (ja) 文字認識装置
JPS63229587A (ja) 文字認識装置
JPS62174887A (ja) なぞり書き入力方式
JPH09204491A (ja) 光学的文字読取装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080402

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090402

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees