JPH05324908A - 圧縮イメージ認識処理方式 - Google Patents

圧縮イメージ認識処理方式

Info

Publication number
JPH05324908A
JPH05324908A JP3024370A JP2437091A JPH05324908A JP H05324908 A JPH05324908 A JP H05324908A JP 3024370 A JP3024370 A JP 3024370A JP 2437091 A JP2437091 A JP 2437091A JP H05324908 A JPH05324908 A JP H05324908A
Authority
JP
Japan
Prior art keywords
character
image
compressed image
data
contour
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3024370A
Other languages
English (en)
Inventor
Hitoshi Yoshio
仁司 吉尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PFU Ltd
Original Assignee
PFU Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PFU Ltd filed Critical PFU Ltd
Priority to JP3024370A priority Critical patent/JPH05324908A/ja
Publication of JPH05324908A publication Critical patent/JPH05324908A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【目的】本発明は,圧縮イメージ認識処理方式に関し,
少ない容量のメモリを用い,高速処理を可能とすること
を目的とする。 【構成】圧縮イメージ中の黒画素を抽出しその輪郭を走
査することにより1文字に相当する閉領域を抽出する輪
郭走査部1を設けるように構成し,この閉領域について
伸張部2がビットマップメモリ上に伸張して1文字分の
イメージを得,このイメージから特徴抽出部3が特徴デ
ータを抽出し,この特徴データと辞書5とを照合部4が
照合して1文字分の文字データを得るように構成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は,圧縮イメージ認識処理
方式に関し,特に,イメージデータの伸張を切出した文
字についてのみ行なう圧縮イメージ認識処理方式に関す
る。
【0002】文字認識装置においては,装置外部から送
られてきた圧縮されたイメージデータの認識が行なわれ
る。この認識のために,圧縮されたイメージデータ以
下,圧縮イメージをビットマップメモリ上に一度伸張
(展開)する必要がある。
【0003】
【従来の技術】図4及び図5は,従来の圧縮イメージの
認識処理について示す。図5に示す如き圧縮イメージに
ついて,図4(A)に示す全イメージ伸張部6が,全圧
縮イメージをビットマップメモリ上に伸張(展開)す
る。これにより,図5の中央に示す如きビットマップが
得られる。このビットマップから,切り出し部7が,1
文字分のビットマップ(イメージデータ)を切り出す。
これは,図5の右端に示すイメージに相当する。この切
り出したイメージについて,特徴抽出部3が,その特徴
データを抽出する。次に,照合部4が,特徴データと辞
書5との照合を行ない,特徴データに適合する文字デー
タを抽出する。例えば,図5のイメージから,文字デー
タ「A」が抽出される。
【0004】
【発明が解決しようとする課題】前述の従来技術によれ
ば,圧縮イメージから文字データを認識するためには,
全圧縮イメージをビットマップ上に展開する必要があ
る。このため,以下の問題があった。即ち,展開(伸
張)のための処理は,文字の部分(図5に示す1文字分
の集合)以外の白画素についても,文字の部分と同様に
行う必要がある。従って,ビットマップ上への展開に多
大の時間を要し,高速処理の障害となっていた。また,
全圧縮イメージを一度にビットマップ上に展開するた
め,必要なビットマップの容量が極めて大きくなってし
まっていた。
【0005】本発明は,少ない容量のメモリを用い,高
速処理を可能とした圧縮イメージ認識処理方式を提供す
ることを目的とする。
【0006】
【課題を解決するための手段】図1は本発明の原理構成
図であり,本発明によるデータ処理装置又は文字認識装
置を示している。この文字認識装置は,当該装置の外部
から送られてきた圧縮イメージから1文字に相当する閉
領域の分を抽出する輪郭走査部1と,圧縮イメージを伸
張してイメージを得る伸張部(1文字イメージ伸張部)
2と,圧縮イメージを伸張して得たイメージからその特
徴データを抽出する特徴抽出部3と,この特徴データを
用いて辞書5を参照して文字データを得る照合部4とを
備える。
【0007】輪郭走査部1は,圧縮イメージ中から黒画
素を検出し,その輪郭を走査することにより,1文字に
相当する閉領域を抽出する。この閉領域について,伸張
部2が,ビットマップメモリ上に伸張(展開)すること
により,1文字のイメージを得る。この1文字のイメー
ジについて,特徴抽出部3が,その特徴データを抽出す
る。そして,この特徴データと辞書5との照合を照合部
4が行ない,この1文字についての文字データを得る。
【0008】以上によれば,圧縮イメージからの文字デ
ータの認識は,1文字毎に行なわれる。従って,イメー
ジを展開するためのビットマップメモリの容量は,1文
字分,即ち,1文字に相当する閉領域を格納できる分だ
けあればよく,この領域をくり返し用いればよい。この
結果,ビットマップメモリの容量を,従来と比較して,
十分に小さくできる。一方,このイメージの伸張に先立
って,1文字に相当する閉領域の分の圧縮イメージが抽
出される。この抽出は,黒画素の輪郭を走査することに
よっている。従って,文字の部分以外の白画素について
ビットマップメモリ上に展開する必要がなく,この分展
開のための処理を不要にできる。この結果,伸張のため
の時間を短縮でき,処理を高速化できる。
【0009】
【実施例】図1において,文字認識装置は,cpu(中
央処理装置)とメモリとからなる。メモリは,プログラ
ム格納用,データ格納用及びイメージ伸張のためのビッ
トマップメモリとからなる。輪郭走査部1乃至照合部4
は,プログラム格納用のメモリに格納された各種のプロ
グラムとcpuとからなる。
【0010】輪郭走査部1は,圧縮イメージから黒画素
を抽出する。圧縮イメージは,データ格納用メモリに格
納される。圧縮イメージは,図2に示す如きものであ
る。圧縮イメージの各行は,これをビットマップメモリ
上に展開した時の各行に対応する。各行において記述さ
れた数字は,その行における白画素及び黒画素の連続の
範囲を示す。例えば,図2の最上行「0113250
8」は,各2文字に区切られ,この行の先頭から順に,
白画素が「01個(桁)」,黒画素が「13個」,白画
素が「25個」,黒画素が「08個」,並んでいること
を示す。各ラスタの先頭が何画素目かは,別に示され
る。この順にビットマップメモリ上に各画素を展開する
ことにより,イメージが得られる。
【0011】輪郭走査部1は,実際のイメージを展開す
ることなく,この圧縮イメージにおける各画素の配列の
規則性を利用して,黒画素を抽出する。即ち,圧縮イメ
ージは,白画素と黒画素とを交互に,2桁の数字で表し
ている。そこで,まず,圧縮イメージの先頭行から黒画
素の有無を調べ,無ければ,次行以下順にくり返し調べ
る。そして,黒画素を抽出すると,その黒画素の領域を
起点として,これに連なる黒画素を抽出してゆく。
【0012】この抽出は,実際のイメージを展開した場
合に反時計回りとして表される方向に行なわれる。これ
は,この方向に文字(黒画素)の輪郭を走査することに
等しい。このために,当該黒画素領域を基に,行数及び
/又は桁数を変化させて,連続する黒画素の領域を走査
してゆく。この走査により,ある閉領域が抽出される。
即ち,最初に抽出された黒画素に戻ることで処理を終了
する。この閉領域が,1文字分の黒画素の固まりであ
る。この時点では,図2に示す如く,圧縮イメージのま
まである。この圧縮イメージは,データ格納用メモリに
格納される。
【0013】伸張部2は,この1文字分の圧縮イメージ
をビットマップメモリ上に伸張(展開)して,1文字分
のイメージを得る。このイメージは,図2に示す如く,
黒画素により文字(「A」)を表したものである。な
お,実際は,ビットマップメモリ上に黒画素を「1」,
白画素を「0」としたデータを各ドットに対応するビッ
トに書込んだものであることはいうまでもない。
【0014】ここで必要とされるビットマップメモリの
サイズ(容量)は,1文字分の圧縮イメージを展開でき
るような縦方向及び横方向のサイズ(外接するサイズ)
とされる。即ち,図2の如く,長方形(又は正方形)と
なる。1文字分の閉領域が長方形等でない場合には,ビ
ットマップメモリのサイズとの間で差が生じるが,この
部分は白画素とされる。
【0015】特徴抽出部3は,このビットマップメモリ
上の1文字のイメージからその特徴データを抽出する。
この特徴データは,データ格納用メモリに格納される。
照合部4は,この特徴データと辞書5の内容とを照合し
て,文字データを得る。この文字データは,例えばコー
ドの形でデータ格納用メモリに格納される。
【0016】図3は,圧縮イメージ認識処理フローを示
す。ステップ1において,文字認識装置の外部から圧縮
イメージが入力される。ステップ2において,輪郭走査
部1が,この圧縮イメージから黒画素の抽出を行ない,
ステップ3において,黒画素抽出の有無を調べ,無い場
合にはステップ2をくり返す。黒画素が有る場合,輪郭
走査部1は,ステップ4において,圧縮データの中の黒
画素を反時計回りにその輪郭につき走査し,ステップ5
において,閉領域の抽出が終了したか否かを調べ,未終
了の場合にはステップ4をくり返す。
【0017】終了の場合,ステップ6において,伸張部
2が,抽出された閉領域,即ち,1文字分の圧縮イメー
ジをビットマップメモリ上にイメージとして伸張する。
ステップ7において,特徴抽出部3が,伸張されたイメ
ージから特徴データを抽出する。ステップ8において,
照合部4が,特徴データを辞書5と照合して,ステップ
9において,文字データを得る。
【0018】この文字データは,圧縮イメージ中の1文
字分の領域から抽出したものであり,圧縮イメージに他
の文字が含まれている可能性がある。そこで,再びステ
ップ2以下をくり返す。これに先立って,先に抽出した
閉領域は,全て,白画素に置換される。そして,この後
に最初に抽出された黒画素について同様の処理がくり返
される。この過程で用いられるビットマップメモリは,
先に閉領域を展開するのに用いたものを用いる。従っ
て,その容量は極めて少なくてすみ,図5との比較から
判るように,従来1文字を切り出すために用いていた分
と同等でよい。また,伸張すべきデータ(ドット数又は
ビット数)の総和も少なくなり,その分処理が高速化さ
れる。更に,従来の1文字分のデータの切り出しは,ビ
ットマップメモリ間で各ビット毎のデータ転送によって
いたが,本実施例では,1文字分のデータの抽出を圧縮
イメージで抽出しているので,この点からも処理が高速
化できる。
【0019】
【発明の効果】以上説明したように,本発明によれば,
圧縮イメージ認識処理において,圧縮イメージ中の黒画
素の輪郭を走査して1文字に相当する閉領域を抽出する
ことにより,1文字分のイメージを得て特徴を抽出して
文字データを得ることができるので,イメージの伸張の
ためのビットマップメモリの容量を極めて小さくでき,
イメージの伸張処理量を少なくして高速化を図ることが
できる。
【図面の簡単な説明】
【図1】本発明の原理構成図である。
【図2】圧縮イメージの伸張説明図である。
【図3】圧縮イメージ認識処理フローである。
【図4】従来技術説明図である。
【図5】従来技術説明図である。
【符号の説明】
1 輪郭走査部 2 1文字イメージ伸張部 3 特徴抽出部 4 照合部 5 辞書 6 全イメージ伸張部 7 切り出し部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 圧縮イメージを伸張して得たイメージか
    らその特徴データを抽出する特徴抽出部(3) と,前記特
    徴データを用いて辞書(5) を参照して文字データを得る
    照合部(4) とを備えた文字認識装置において,前記圧縮
    イメージから1文字に相当する閉領域の分を抽出する輪
    郭走査部(1)と,前記圧縮イメージを伸張してイメージ
    を得る伸張部(2) とを設け,前記輪郭走査部(1) が,前
    記圧縮イメージに存在する黒画素の輪郭を走査すること
    により前記1文字に相当する閉領域を抽出し,前記伸張
    部(2) が,前記1文字に相当する閉領域を伸張すること
    により前記1文字のイメージを得て,前記特徴抽出部
    (3) が,前記1文字のイメージからその特徴データを抽
    出することを特徴とする圧縮イメージ認識処理方式。
JP3024370A 1991-02-19 1991-02-19 圧縮イメージ認識処理方式 Pending JPH05324908A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3024370A JPH05324908A (ja) 1991-02-19 1991-02-19 圧縮イメージ認識処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3024370A JPH05324908A (ja) 1991-02-19 1991-02-19 圧縮イメージ認識処理方式

Publications (1)

Publication Number Publication Date
JPH05324908A true JPH05324908A (ja) 1993-12-10

Family

ID=12136308

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3024370A Pending JPH05324908A (ja) 1991-02-19 1991-02-19 圧縮イメージ認識処理方式

Country Status (1)

Country Link
JP (1) JPH05324908A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5773477A (en) * 1980-10-21 1982-05-08 Ibm Character recognition device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5773477A (en) * 1980-10-21 1982-05-08 Ibm Character recognition device

Similar Documents

Publication Publication Date Title
JP2940936B2 (ja) 表領域識別方法
JP2667435B2 (ja) 領域抽出方法
JP3086702B2 (ja) テキスト又は線図形を識別する方法及びデジタル処理システム
US5129014A (en) Image registration
JPH03122773A (ja) 画像形成装置
JPH01277981A (ja) 文字認識装置
US5144682A (en) Method and an apparatus for isolating an area corresponding to a character or word
JP3062382B2 (ja) 画像処理装置及び方法
JPH0424781A (ja) 文書処理装置
JPH05324908A (ja) 圧縮イメージ認識処理方式
JP2000076378A (ja) 文字認識方法
JP2612383B2 (ja) 文字認識処理方式
JP3402755B2 (ja) 領域分割方法
JPH04255080A (ja) 画像入力装置
JPS615383A (ja) 文字パタ−ン分離装置
JPH06176142A (ja) 図面自動入力装置の輪郭ベクトル化方法
JPH05159062A (ja) 文書認識装置
JP2895122B2 (ja) 行切出し方法
JPH03142691A (ja) 表形式文書認識方式
JP2002032713A (ja) 文字認識処理方法
JP2000082113A (ja) 文字認識装置および辞書作成方法および記録媒体
JPH0795336B2 (ja) 文字認識方式
JPH07104940B2 (ja) 図形認識装置
JP2917396B2 (ja) 文字認識方式
JPH0447459A (ja) 図面認識処理方式