JPH0215388A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0215388A
JPH0215388A JP63167586A JP16758688A JPH0215388A JP H0215388 A JPH0215388 A JP H0215388A JP 63167586 A JP63167586 A JP 63167586A JP 16758688 A JP16758688 A JP 16758688A JP H0215388 A JPH0215388 A JP H0215388A
Authority
JP
Japan
Prior art keywords
character
recognized
direction code
horizontal
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63167586A
Other languages
English (en)
Inventor
Tamotsu Maeda
保 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP63167586A priority Critical patent/JPH0215388A/ja
Publication of JPH0215388A publication Critical patent/JPH0215388A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は新聞、雑誌などの活字、ドツト文字および手書
き文字を読み取り、たとえばJISコードの情報量に変
換する文字認識装置に関するものである。
従来の技術 近年、文字認識装置の改良が著しく、その結果、文字認
識装置を安価に実現できるようになり、文字認識装置が
ワードプロセッサやコンピュータの入力装置として身近
に利用されるようになってきた。特開昭61−1256
88号などには以下に述べるように微少な違いしか存在
しない文字パターンについても識別可能な文字認識装置
が提案されている。
第3図は従来の文字認識装置を示す。認識対象文字を含
む画像は画像入力部1で入力され、文字部り出し部2で
は画像入力部lで入力された画像から認識対象文字パタ
ーンを矩形で切り出す。さらに、4方向コ一ド付与部3
では、文字部り出し部2で切り出した認識対象文字パタ
ーン中の画素点の極性が当該画素点に隣接する画素点の
うち少なくとも1つの画素点の極性と異なる境界点の時
に境界点に隣接する8画素点との関係により当該画素点
の方向成分を水平、垂直、対角、逆対角の4方向コード
a、b、c、dに量子化する〔第4図(1)参照〕。第
4図(■)において「0」・印は黒画素、「Δ」印は白
画素、「*」印は着目する黒画素、「+」印は黒画素ま
たは白画素を表わしている。
領域別方向コード密度計算部4では、4方向コ一ド付与
部3で得られた境界点の方向コードを用いて、文字部り
出し部2で切り出した矩形を水平方向にM1垂直方向に
N分割したMxN個の各サブ領域毎の各方向コードに対
応した境界点のヒストグラムを求める。認識部5では、
領域別方向コード密度計算部4で求めたヒストグラムを
認識対象文字の特徴量として、辞書6と比較して認識候
補文字を決定し、これを表示部7に認識結果とじて表示
する。
ここでは認識例題文字 字、を例に、上記の動作を具体
的に説明する。
まず、画像入力部1で2値化された認識例題文字1字、
は、文字部り出し部2で第5図に示すような認識対象文
字パターンとして矩形に切り出される。次に4方向コ一
ド付与部3で認識対象文字パターンの全ての境界点の方
向コードを第4図の条件に従って付与する。認識対象文
字パターンを水平方向に4分割(M=4 ) 、垂直方
向に4分割(N=4)した場合、領域別方向コード密度
計算部4では各16領域について境界点の方向コードを
計数し、下記第1表に示すような各方向コードに対応し
た境界点のヒストグラムを得て、これを認識「 例題文字 字、の特徴量とする。認識部5では認「 識例題文字 字、と同様の方法で抽出した各文字の特徴
量を蓄えている辞書6と照合し、認識候補文字を決定し
、最後に表示部7に結果を表示する。
以  下  余  白 く 第 表 〉 発明が解決しようとする1M題 このような従来の構成は、各サブ領域における輪郭特徴
を表現可能だが、1文字あたりの特徴量が上記の側でも
64バイト/字と大きいために、照合に要する時間が長
(かかる、辞書の容量が太き(なり不経済であるなどの
問題がある。
本発明は処理速度が早く、しかも辞書の容量が小さくて
済む文字認識装置を提供することを目的とする。
課題を解決するための手段 本発明の文字認識装置は、認識対象文字を含む文書を2
値化入力する画像入力部と、入力された画像から認識対
象文字パターンを矩形に切り出す文字部り出し部と、認
識対象文字パターン円・の文字部の画素を黒画素、文字
以外の背景部の面木を白画素とするとき、認識対象文字
パターンの黒画素点に隣接する水平、垂直の4画素のう
ち少なくとも1画素が白画素であるとき、この黒画素と
この黒画素に隣接する6画素の関係から当該黒画素点の
水平、垂直の2方向コードを決定する2方向コード付与
部と、上記2方向コード付与部で与えられた方向コード
の数を用いて、上記文字部り出し部で切り出された文字
パターンを水平方向にP分割、垂直方向にQ分割したp
XQ個のサブ領域内の方向コード密度を計算する領域別
方向コード密度計算部と、計算された認識対象文字の領
域毎の方向コード密度から認識候補文字を決定する文字
認識部とを設けたことを特徴とする。
作用 この構成によると、2方向コード付与部が、認識対象文
字パターンの黒画素点に隣接する水平、垂直の4画素の
うち少なくとも1つが白画素の場合、この黒画素と当該
黒画素に隣接する6画素点との関係により、水平、垂直
の2方向について、方向コードを抽出する。
第1表の例によると、対角、逆対角成分の方向コードの
数は、水平、垂直成分の方向コードの数が最大で”7″
という大きな値をとるのに比べ、0”または1°という
小さな値をとる。このことから認識対象文字パターンと
辞書内に蓄えられた文字パターンの特徴量を照合する場
合、特徴量の小さな対角、逆対角方向の方向コードが照
合結果に与える影響は小さいために、近似的に水平、垂
直成分の2個の方向コードだけを特徴量としても大きな
影響は見られない。漢字の持つこの様な性質を利用して
、多(の漢字パターンについても同様に水平、垂直方向
の2個の方向コードを使って量子化することにより良好
な結果を得ることができる。
実施例 以下、本発明の一実施例を第1図と第2図に基づいて説
明する。
第1図は本発明の文字認識装置を示す。詔、1対象文字
を含む画像は画像入力部8を介して2値画像で入力され
、文字部り出し部9では入力された2値画像から認識対
象文字パターンを矩形に切り出す。2方向コード付与部
lOでは、切り出された文字パターン内の黒画素点に隣
接する水平、垂直方向の4画素のうち少なくとも1画素
が白画素のときにこの黒画素とこの黒画素に隣接する4
画素点との位置関係により方向コードを抽出し、これを
特徴量とする。領域別方向コード密度計算部11では、
認識対象文字パターンを水平方向にP分割、垂直方向に
Q分割したときのP×Q個のサブ領域について2方向コ
°−ド付与部10で与えられた方向コードの数を計数す
る。文字認識部12では、領域別方向コード密度計算部
11で求めた特徴量と辞書]3が持つ特徴量を照合して
認識候補文字を決定し、これを表示部14に認識結果と
して表示する。
以上のように構成された本実施例の文字認識装置につい
て、特徴抽出例題文字 字、を例に、以下チの動作を説
明する。まず、特徴抽出例題文字1字、が、画像入力部
lで2値化された場合の文字パターン例を第5図に示す
。第2図(1)は方向コード説明図であり、水平方向を
コードa、垂直方向をコードbとする。上記文字パター
ンから上記方向コードを抽出するために、着目する黒画
素点に隣接する水平、垂直方向の4画素のうち少なくと
も1つが白画素のときに、着目する黒画素とその周囲の
画素が第2図句)に示すパターンを構成する場合に水平
または垂直の方向コードを決定する。
ここでrOJ印は黒画素、「△」印は白画素、「*」印
は着目する黒画素を表わしている。下記第2表に示す値
は、第3図に示す認識対象文字パターンを水平、垂直に
各々4分割した場合について(P=Q=4)  、各領
域における方向コード数を示したものであり、この値を
特徴量として用いることができる。
以  下  余  白 〈 第 表 〉 辞書13は、認識の対象とするすべての文字について、
上記方向コードの数を表す特徴量を蓄えている。文字認
識部12では、認識例題文字r字」と辞書14内の文字
の上記特徴量を比較し、特徴量の差が最も小さい文字を
認識候補文字に決定する。
表示部14では、決定された認識候補文字を認識結果と
して表示する。
このようtζ、認識対象文字パターンの黒画素点に隣接
する水平、垂直の4画素のうち少な(とも1つが白画素
の場合、この黒画素と当該黒画素に隣接する6画素点と
の関係から水平、垂直の2方装置を実現することができ
る。
発明の効果 以上のように本発明によると、2方向コード付与部と領
域別方向コード密度計算部および文字認識部を設け、認
識対象文字パターンの黒画素点に隣接する水平、垂直の
4画素のうち少なくとも1つが白画素の場合、この黒画
素と当該黒画素に隣接する6画素点との関係から水平、
垂直の2方[1′について方向コードを抽出するため、
処理速度l従来例の2倍に高速化でき、かつ辞書容量を
従来例の2分の1に小型化でき、高い認識率を持つ優れ
た文字認識装置を実現することができるもの1ある。
【図面の簡単な説明】
第1図は本発明の文字認識装置の構成図、第一図は本発
明における方向コード説明図と方向コドの決定方法の説
明図、第3図は文字認識装!itG構成図、第4図は従
来例の方向コード説明図とン向コードの決定方法の説明
図、第5図は特徴抽1例題文字r字」が入力された場合
の文字バター図である。

Claims (1)

    【特許請求の範囲】
  1. 1、認識対象文字を含む文書を2値化入力する画像入力
    部と、入力された画像から認識対象文字パターンを矩形
    に切り出す文字部り出し部と、認識対象文字パターン内
    の文字部の画素を黒画素、文字以外の背景部の画素を白
    画素とするとき、認識対象文字パターンの黒画素点に隣
    接する水平、垂直の4画素のうち少なくとも1画素が白
    画素であるとき、この黒画素とこの黒画素に隣接する6
    画素の関係から当該黒画素点の水平、垂直の2方向コー
    ドを決定する2方向コード付与部と、上記2方向コード
    付与部で与えられた方向コードの数を用いて、上記文字
    部り出し部で切り出された文字パターンを水平方向にP
    分割、垂直方向にQ分割したP×Q個のサブ領域内の方
    向コード密度を計算する領域別方向コード密度計算部と
    、計算された認識対象文字の領域毎の方向コード密度か
    ら認識候補文字を決定する文字認識部とを設けた文字認
    識装置。
JP63167586A 1988-07-04 1988-07-04 文字認識装置 Pending JPH0215388A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63167586A JPH0215388A (ja) 1988-07-04 1988-07-04 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63167586A JPH0215388A (ja) 1988-07-04 1988-07-04 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0215388A true JPH0215388A (ja) 1990-01-19

Family

ID=15852503

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63167586A Pending JPH0215388A (ja) 1988-07-04 1988-07-04 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0215388A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5707856A (en) * 1991-12-24 1998-01-13 Higa; Teruo Microbiological method for disposing of organic waste materials
US6670739B2 (en) 2001-03-02 2003-12-30 Murata Manufacturing Co., Ltd. Surface acoustic wave apparatus

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5707856A (en) * 1991-12-24 1998-01-13 Higa; Teruo Microbiological method for disposing of organic waste materials
US6670739B2 (en) 2001-03-02 2003-12-30 Murata Manufacturing Co., Ltd. Surface acoustic wave apparatus

Similar Documents

Publication Publication Date Title
JPH0582628B2 (ja)
JPH0215388A (ja) 文字認識装置
JPH02116987A (ja) 文字認識装置
JP2917427B2 (ja) 図面読取装置
JP2789622B2 (ja) 文字/図形領域判定装置
JP2930996B2 (ja) 画像認識方法および画像認識装置
JPH0449148B2 (ja)
JP2918363B2 (ja) 文字分類方法及び文字認識装置
KR910005385B1 (ko) 스트로크 근사 직선 추출에 의한 문자인식방법
JPS6334682A (ja) 文字認識装置
JPH11306282A (ja) 文字列領域抽出方法及び装置
JPH0632079B2 (ja) 文字認識装置
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
JPS60147891A (ja) 文字認識装置
JPH05108882A (ja) 文字認識装置
JPS6378287A (ja) 文字認識装置
JPH0350689A (ja) 文字認識装置
JPH02187884A (ja) 文字認識装置
JPS6210784A (ja) 文字認識装置
Reddy et al. An edge-based text region extraction from document images using connected component analysis
JPS61262984A (ja) 文字認識装置
JPH026113B2 (ja)
JPS63221495A (ja) 文字認識装置
JPS63271588A (ja) 文字認識装置
JPH04280393A (ja) 文字図形認識装置