JPH0381889A - 文字認識方式 - Google Patents

文字認識方式

Info

Publication number
JPH0381889A
JPH0381889A JP1219020A JP21902089A JPH0381889A JP H0381889 A JPH0381889 A JP H0381889A JP 1219020 A JP1219020 A JP 1219020A JP 21902089 A JP21902089 A JP 21902089A JP H0381889 A JPH0381889 A JP H0381889A
Authority
JP
Japan
Prior art keywords
dissimilarity
character
pattern
candidate character
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1219020A
Other languages
English (en)
Inventor
Atsushi Tsukumo
津雲 淳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1219020A priority Critical patent/JPH0381889A/ja
Publication of JPH0381889A publication Critical patent/JPH0381889A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は文字認識に関する。
(従来の技術) 情報処理システムの多様化に伴ない、様々なデータ入力
方法が要求されており、文字認識技術も有力なデータ入
力方法として実用化が進められている。しかし現在の文
字認識技術は、文字の読取り精度の点で人間に比べては
るかに劣っており、種々の改良が試みられている。
文字認識方式には種々のものがあるが、本願と同一出願
人により、昭和63年9月20日に出願された特願昭6
3−237065号「文字認識方式」または特願昭63
−237066号「文字認識方式」等で示される方式も
有力なものの一つである。この文字認識方式では第3図
(a)に示したように文字パターンを複数の部分領域に
分割する。そして第3図(b)に示したように各部分領
域の特徴を複数の方向に対してスカラーまたはベクトル
の系列として記述することによって特徴パタンを作成す
る。そして特徴の記述形式が同一の参照パタンとの間で
対応する系列間の非線形マツチングを行なって、入力文
字パタンと参照パタンとの相違度を求めている。尚、第
3図(b)は部分領域の特徴記述の例を4方向に対する
2次元ベクトルの系列を例として示している。
(発明が解決しようとする課題〉 前項で説明した文字認識方式では文字パタン全体から求
めた相違度を使って文字認識を行なっている。しかし第
4図(a)と(b)に示すような類似文字の識別を行な
う場合には部分的な違いに着目した相違度が必要となる
。たとえば、第4図(a)、 (b)の例では「口」と
1日」との相違度に重点をおいた評価も必要であろう。
しかし類似文字間の差異のある場所を自動的に抽出する
ことは極めて困難である。第4図の例では門がまえの中
の「口」と1日」とがそれぞれ門がまえと分離できれば
問題がないが、様々な変形や線の接触が生じるために、
安定な分離処理を行なえないのが現状である。
本発明は、類似文字の識別を精度良く実行できる文字認
識方式を提供することを目的とする。
(課題を解決するための手段) 第1の本発明は、二次元格子状の配列として与えられる
文字パタンを格納する文字パタン記憶部と、前記文字パ
タン記憶部から文字パタン信号を読込み、文字パタン上
の複数の部分領域においてスカラーまたはベクトルの系
列として各部分領域の特徴を記述することによって特徴
パタンを作成する特徴抽出部と、前記特徴抽出部で求め
られた特徴パタンを格納する特徴パタン記憶部と、前記
特徴パタン記憶部に格納されている特徴パタンと同一の
形式で記述されている各読取り字種ごとの参照パタンを
格納している参照パタン記憶部と、前記特徴パタン記憶
部から特徴パタン信号を読込み、前記参照パタン記憶部
から各読取り対象字種ごとの参照パタンを順次読込み、
特徴パタンの各部分領域と参照パタン上の対応する部分
領域との間の相違度を求める相違度計算部と、前記相違
度計算部から各読取り字種に対する相違度信号を読込み
、相違度の順序付けを行ない、候補字種を選び出す候補
字種選択部と、前記候補字種選択部から候補字種信号を
読取り、前記特徴パタン記憶部から特徴パタン信号を読
込み、前記参照パタン記憶部からは候補字種の参照パタ
ンを順次読込み、文字パタンの内部に対応する部分領域
の特徴を用いて相違度計算を行なうことによって内部相
違度を求める内部相違度計算部と、前記内部相違度計算
部から各候補字種の内部相違度信号を読込み、内部相違
度の順序付けを行ない、認識結果を示す信号を出力する
判定部を具備することを特徴とする。
第2の本発明は、第1の本発明における判定部を、前記
内部相違度計算部から各候補字種の内部相違度信号を読
込み、前記候補字種選択部から候補字種信号を読取り、
かつ前記参照パタン記憶部から候補字種の参照パタンを
順次読込み、候補字種と1つ上位の順の候補字種との間
で、参照パタン同士の相違度計算゛を行ない類似文字と
判定した場合には内部相違度を用いて新たに2つの候補
字種の順序付けを行ない、類似文字ではないと判定した
場合には2つの候補字種の順序を保存する対判定処理を
候補字種の最下位から順に最上位まで行なうことによっ
て認識結果を決定する判定部に置きかえたことを特徴と
する。
(作用) 以下、本発明の原理について図を用いて説明する。
第5図は文字パタンの部分領域のうち文字パタンの内部
の部分領域に注目している例を示す・図である。
第5図に示された内部領域の中の矢印は特徴系列の方向
・を示している。類似文字同志の差異“を示す領域は類
似文字の組合せによって異なるが、すべての組合せに対
して注目する領域を定めることは現状では困難である。
文字パタンの外部の領域が大分類に安定して有効なこと
は漢字認識の分野では広く知られている。しかし類似文
字間の差異は文字パタンの内部領域に生じる場合が多い
。従って分類処理が行なわれた後の候補字種の識別のた
めには第5図を例とするような内部領域に注目した方が
文字パタンの形状の差を強調した相違度が求められる。
適用される特徴は特殊なものに限る必要はなく第6図(
a)、 (b)、 (c)、 (d)に示すように、各
部分領域内の矢印の方向に対して垂直な方向に画素値を
累積した部分投影等の文字認識の一般的な特徴を用いて
もよい。
以上が第1の本発明の原理である。この第1の本発明に
より、第4図(a)、 (b)に例示したような類似文
字の識別を精度良く行なうことができる。
しかしこの第1の本発明でも若干の問題が生じる場合も
ある。第1の本発明では、候補字種は、入力された文字
パタンに全体としては類似しているという規準により選
択されているので、候補字種同志がすべて互いに類似文
字ではないという可能性が、わずかながらある。この場
合には、内部相違度を用いて候補をさらにしぼって行こ
うとすると誤認識が発生することもありうる。
第2の本発明は、この問題をも解決し、類似文字の識別
をさらに良好に行なえる文字認識方式を提供する。次に
、第6図を参照して第2の本発明の原理につき、説明す
る。
第7図は最終的な判定論理の実行順序を示す図であり、
候補字種が5個の場合を例としている。まず第5位と第
4位との間で以下のような判定を行なう。第5位の候補
字種と第4位の候補字種の参照パタン間の相違度計算を
行ない、相違度の値によって類似文字ではないと判定さ
れた場合には内部相違度を適用して順位付けを変更する
のは危険であるので、両者の順位を保存し、一方、相違
度の値によって類似文字であると判定された場合には、
内部相違度を適用して新たに順位付けを行なう。
次に第4位と第3位の候補字種の間で同様の対判定処理
をくり返し、最後は第2位と第1位の候補字種の間で同
様の対判定処理が行なわれる。この処理によって候補字
種の段階で第5位の字種が最終的に第1位になることも
起こり得る。類似文字であるがどうかの判定を導入する
ことによって内部相違度の適用効果がより安定する効果
が得られる。
(実施例) 第1図は第1の本発明の一実施例を示すブロック図であ
る。
文字パタン記憶部1は入力文字パタンを格納するもので
、通常の記憶手段でよい。特徴抽出部2は前記文字パタ
ン記憶部1がら文字パタン信号1oを読込み、例えば第
8図(a)、 (b)、 (c5. (d)に示すよう
な複数の部分領域内で、第6図に示すような部分投影抽
出などによってスカラーまたはベクトルの系列で表わさ
れる特徴を抽出し、各部分領域内で抽出された特徴系列
全体を特徴パタン信号2oとして出力するもので、従来
技術で実現できる。特徴パタン記憶部3は、前記特徴抽
出部2がら出力された特徴パタン信号20を格納するも
ので通常の記憶手段でよい。参照パタン記憶部4は前記
特徴パタン記憶部3に格納されている特徴パタンと同一
形式で記述された各読取り対象字種ごとの特徴パタンを
参照パタンとして格納するもので通常の記憶手段でよい
。相違度計算部5は前記特徴パタン記憶部3から信号3
0として入力文字パタンの特徴パタンを読込み、前記参
照パタン記憶部4から信号40として各読取り対象字種
の参照パタンを順次読込み、対応する特徴系列間でそれ
ぞれ文字認識処理で一般に用いられる距離計算を行なっ
て入力文字パタンの特徴パタンと各参照パタンとの相違
度を求め、相違度信号50として出力するもので、従来
技術で実現できる。候補字種選択部6は前記相違度計算
部5から相違度信号50を読込み、相違度の順序づけを
行なって順位または相違度の値に基づいて読取り対象字
種の中から候補字種を絞り、候補字種信号60を出力す
るもので、漢字認識装置等で必ず用いられる従来技術で
実現できる。゛内部相違度計算部7は前記特徴パタン記
憶部3から特徴パタン信号30を読込み、前記候補字種
選択部6から候補字種信号60を読込み、前記参照パタ
ン記憶部4から候補字種の参照パタンを信号41として
読込み、例えば第5図(a)。
(b)、 (c)、 (d)に示すような文字パタンの
内部を示す部分領域の特徴系列に関してのみ距離計算を
行なって文字パタンの内部の部分パタンの相違度を求め
、各候補字種の内部相違度を信号70として出力するも
ので文字認識の従来技術を流用することで実現できる。
判定部8は前記内部相違度計算部7から出力された内部
相違度信号70を読込み、内部相違度の値に基づいて順
序づけを行ない、認識結果を信号80として出力するも
ので、文字認識では常に用いられる従来技術を流用する
ことで容易に実現でき゛る。
第2図は、第2の本発明の一実施例を示すブロック図で
ある。第1の本発明と第2の本発明との差異は判定部8
の動作のみであり、他の構成要素の動作は同一であるの
で、以下では第2の本発明の判定部8についてのみ説明
する。第2図において、判定部8は、前記内部相違度計
算部7から各候補字種の内部相違度信号70を読込み、
前記候補字種選択部6から候補字種信号60を読込み、
かつ前記参照パタン記憶部4から候補字種の参照パタン
を信号4工として読込み、作用の項で説明したように候
補字種と一つ上位の順の候補字種との間で参照パタン同
士の相違度計算を行ない、相違度の値によって類似文字
と判定した場合には内部相違度を用いて新たに2つの候
補字種の順序付けを行ない、類似文字ではないと判定し
た場合には2つの候補字種の順序を保存する対判定処理
を候補字種の最下位から順に最上位まで行ない、認識結
果を信号80として出力する。この第2の発明の判定部
も文字認識における従来技術を流用することにより容易
に実現できる。
以上のように、本発明によれば、類似文字同士に候補が
絞られた後に内部パタンだけを用いた内部相違度を求め
ることによって類似文字の識別能力が高い文字認識処理
を実現でき、文字認識装置の性能向上に大きく役立つ。
また第2の本発明によれば、内部パタンだけを用いた対
判定をくり返すことにより類似文字の識別能力をさらに
高めることができる。
【図面の簡単な説明】
第1図、第2図は本発明の構成の一実施例を示すブロッ
ク図である。図中、1は文字パタン記憶部、2は特徴抽
出部、3は特徴パタン記憶部、4は参照パタン記憶部、
5は相違度計算部、6は候補字種選択部、7は内部相違
度計算部、8は判定部である。第3図は従来の文字認識
方式の例を示す図、第4図は類似文字の例を示す図、第
5図は文字パタンの内部の部分領域の例を示す図、第6
図は部分領域における特徴系列の例を示す図、第7図は
第2の発明における対判定処理の順序を示す図、第8図
は文字パタンを部分領域に分割する例を示す図である。

Claims (1)

  1. 【特許請求の範囲】 1、二次元格子状の配列として与えられる文字パタンを
    格納する文字パタン記憶部と、前記文字パタン記憶部か
    ら文字パタン信号を読込み、文字パタン上の複数の部分
    領域においてスカラーまたはベクトルの系列として各部
    分領域の特徴を記述することによって特徴パタンを作成
    する特徴抽出部と、前記特徴抽出部で求められた特徴パ
    タンを格納する特徴パタン記憶部と、前記特徴パタン記
    憶部に格納されている特徴パタンと同一の形式で記述さ
    れている各読取り字種ごとの参照パタンを格納している
    参照パタン記憶部と、前記特徴パタン記憶部から特徴パ
    タン信号を読込み、前記参照パタン記憶部から各読取り
    対象字種ごとの参照パタンを順次読込み、特徴パタンの
    各部分領域と参照パタン上の対応する部分領域との間の
    相違度を求める相違度計算部と、前記相違度計算部から
    各読取り字種に対する相違度信号を読込み、相違度の順
    序付けを行ない、候補字種を選び出す候補字種選択部と
    、前記候補字種選択部から候補字種信号を読取り、前記
    特徴パタン記憶部から特徴パタン信号を読込み、前記参
    照パタン記憶部からは候補字種の参照パタンを順次読込
    み、文字パタンの内部に対応する部分領域の特徴を用い
    て相違度計算を行なうことによって内部相違度を求める
    内部相違度計算部と、前記内部相違度計算部から各候補
    字種の内部相違度信号を読込み、内部相違度の順序付け
    を行ない、認識結果を示す信号を出力する判定部を具備
    する文字認識方式。 2、請求項1記載の文字認識装置において、前記判定部
    を、前記内部相違度計算部から各候補字種の内部相違度
    信号を読込み、前記候補字種選択部から候補字種信号を
    読取り、かつ前記参照パタン記憶部から候補字種の参照
    パタンを順次読込み、候補字種と1つ上位の順の候補字
    種との間で、参照パタン同士の相違度計算を行ない、類
    似文字と判定した場合には内部相違度を用いて新たに2
    つの候補字種の順序付けを行ない、類似文字ではないと
    判定した場合には2つの候補字種の順序を保存する対判
    定処理を候補字種の最下位から順に最上位まで行なうこ
    とによって認識結果を決定する判定部に置きかえたこと
    を特徴とする文字認識方式。
JP1219020A 1989-08-25 1989-08-25 文字認識方式 Pending JPH0381889A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1219020A JPH0381889A (ja) 1989-08-25 1989-08-25 文字認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1219020A JPH0381889A (ja) 1989-08-25 1989-08-25 文字認識方式

Publications (1)

Publication Number Publication Date
JPH0381889A true JPH0381889A (ja) 1991-04-08

Family

ID=16728994

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1219020A Pending JPH0381889A (ja) 1989-08-25 1989-08-25 文字認識方式

Country Status (1)

Country Link
JP (1) JPH0381889A (ja)

Similar Documents

Publication Publication Date Title
EP0355748B1 (en) A pattern recognition apparatus and method for doing the same
US6128410A (en) Pattern matching apparatus and method that considers distance and direction
JPH0381889A (ja) 文字認識方式
JP3798179B2 (ja) パターン抽出装置及び文字切り出し装置
JP2995650B2 (ja) 罫線除去方式
JPH01271883A (ja) 指紋中心検出方式
JPH0520794B2 (ja)
JPS5951033B2 (ja) 図形基本要素抽出装置
JPS6228888A (ja) 対象物識別方法
JPH07160824A (ja) 文字認識装置
JPH02293990A (ja) 文字認識装置
JP4231375B2 (ja) パターン認識装置、パターン認識方法、パターン認識プログラムおよびパターン認識プログラムを記録した記録媒体。
JPH04216172A (ja) 図面自動入力装置のノイズベクトル検出・除去方法
JPH04260980A (ja) 図形認識装置
JP3763966B2 (ja) 画像認識方法、装置および記録媒体
JPH0664534B2 (ja) 単一化候補項の選択装置
JPH09319825A (ja) 文字認識装置
JP3944798B2 (ja) 画像データ処理装置
JPS61182183A (ja) パタ−ン認識処理方式
JPS596420B2 (ja) オンライン文字特徴抽出方法
JPH02193281A (ja) 文字認識装置
JPS62127989A (ja) 図形パタ−ン対応位置検出方式
JPH0792833B2 (ja) 線図形入力方法および装置
JPS5816503B2 (ja) 文字識別処理方式
JP2000020643A (ja) パターン認識装置及び方法