JPS61198385A - 文字認識方式 - Google Patents

文字認識方式

Info

Publication number
JPS61198385A
JPS61198385A JP60038309A JP3830985A JPS61198385A JP S61198385 A JPS61198385 A JP S61198385A JP 60038309 A JP60038309 A JP 60038309A JP 3830985 A JP3830985 A JP 3830985A JP S61198385 A JPS61198385 A JP S61198385A
Authority
JP
Japan
Prior art keywords
character
name
names
candidate word
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60038309A
Other languages
English (en)
Other versions
JPH0580711B2 (ja
Inventor
Hirohisa Goto
後藤 裕久
Koichi Higuchi
浩一 樋口
Yoshiyuki Yamashita
山下 義征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP60038309A priority Critical patent/JPS61198385A/ja
Publication of JPS61198385A publication Critical patent/JPS61198385A/ja
Publication of JPH0580711B2 publication Critical patent/JPH0580711B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、文字認識方式に関する。
(従来の技術) 文字認識、特に漢字認識においては、認識対象に字形の
酷似した類似文字が多く含まれている。
たとえば「大」、「犬」、「太」のように点の有無や、
位置の異なる文字、「未」、「末」や「人」、「入」の
ように文字線の長さが異なる文字などである。ところで
、手書文字では筆者の違いによる局所的な文字線の位置
移動や傾き、また、印刷文字では活字の傾き等により、
入力文字の字形が変形すると、抽出される特徴が不安定
となり、その認識が難しくなるが、前記類似文字間では
その影響が顕著でありわずかな変形でも誤認識する。
前記問題点を解決する方法として、連続した入力文字を
単語として扱い、各入力文字の候補文字名から得られる
文字名列があらかじめ用意した単語辞書に存在するか調
べることにより、誤認識を防止する方法が考案されてい
る(例えば、昭和57年度電子通信学会全国大会、P5
−32El 、1341、「手書漢字認識における単語
情報の利用」)。
例えば、住所を認識対象とする認識装置において、第2
図(a)に示すように手書文字「東」。
「京」、「都」が入力され、それぞれの文字の第1位候
補が「束」、「京」、「都」であった場合について説明
する。あらかじめ、第2図(b)に示すように住所単語
が格納された単語辞書を用意しておき、入力文字に対し
て得られた候補文字名を組合せた文字列「東京都」、「
東京群」、「東京部」、「東京都」などが前記単語辞書
内に存在するか検索する。この場合、存在する文字列は
「東京都」だけであり、第2図(C)に示すように認識
結果「東京都」が得られる。このように、入力文字の第
1位候補は「束」、「京」、「都」であり、第1文字目
が誤認識しているが、単語辞書を利用することにより正
しい認識結果が得られる。
(発明が解決しようとする問題点) しかしながら、上記従来の方式にあっては、互いに異な
る文字が類似文字である複数の単語(類似単語と呼ぶ)
が存在する場合、先に述べたように類似文字間では僅か
な変形でも誤認識が起こるため単語として扱う場合でも
類似した単語に誤認識するという問題があった。その対
策として文字単位の認識辞書文字マスクを多数用意しな
ければならず、辞書が増大し、ひいては、処理速度も低
下するという問題点があった。
本発明は、以上述べた類似単語間の誤認識という問題点
と、認識・辞書文字マスクの増大および処理速度の低下
という問題点を除去し、認識精度が良く処理速度の速い
優れた文字認識方式を提供することを目的とする。
(問題点を解決するための手段) 本発明は、文字図形パターンの特定方向のストロークを
あらわすサブパターンにおける任意の分割単位領域の黒
ビット数を、文字線幅とストローク方向に対応した文字
枠の大きさとで正規化して得られる量を特徴要素として
、ストローク方向の異なる複数の各サブパターン毎に且
つ文字枠内を分割することによって得られる前記各分割
単位領域毎に当該文字図形パターンから前記特徴要素を
抽出してサブパターン特徴マトリクスを作成し、標準文
字マスクが当該サブパターン特徴マトリクスと同形式で
記述されているマトリクス辞書を参照して当該文字図形
パターンの認識を行う文字認識方式を対象とする。
本発明によれば、この文字認識方式において。
以下に述べる第1ないし第3の識別工程が設けられる。
第1の識別工程は、前記文字図形パターンのサブパター
ン特徴マトリクスと前記標準文字マスクとの照合を行な
い、両者の距離の小さなものから標準文字マスクの文字
名を所定個取出し、これを文字図形パターンの候補文字
名グループとして保存する。
第2の識別工程は、連続する文字図形パターンにそれぞ
れ対応する候補文字名グループから1文字ずつ取出して
組合せた文字数に個の文字名列が予め用意した単語辞書
内に存在するかどうかを調べ、存在していれば前記文字
名列を候補単語名として出力する。
第3の識別工程は、前記候補単語名がN0個(Noは2
以上の整数)ある場合にN、個の前記候補単語名から2
@取出し、この2個の候補単語名を比較しi文字目(l
≦i≦K、iは整数)の文字名が異なるとき、それぞれ
のi文字目の文字名のマトリクス辞書の各要素の差の絶
対値を要素とする差分辞書マトリクスを作成し、該差分
辞書マトリクスでサブパターン特徴マトリクスと前記i
文字目の文字名の標準文字マスクとの距離に重み付けを
行ない、その重み付距離の小さい方の文字名を含む候補
単語名に対して所定の得点を与え、K文字目まで比較が
終った後の得点の和が大きい方の候補単語名に対して改
めて所定の得点を与えることを、No個の候補単語名か
ら2個取出して得られる全ての組合せに対して行ない、
最も得点の高い候補単語名を識別結果として出力する。
(作 用) 第1の識別工程は入力された文字図形パターンに対し、
複数の候補文字を提供する作用を呈する。第2の識別工
程はこれらの候補文字の組合せの文字名列のうち、所定
の単語に該当するもののみを候補単語名として選択する
作用を呈する。
第3の識別工程は候補単語名が所定数No個ある場合、
これらのうち最も適切なものを1つ決定する作用を呈す
る。この場合、差分辞書マトリクスはサブパターン特徴
マトリクスと標準文字マスクとの距離を重み付けする作
用をもつ、すなわち、両者の差違部分を強調する作用を
もつ、従って、認識精度を向上させ、処理速度を速くす
ることができる。
(実施例) 以下、本発明を実施例に基づき図面を参照して詳細に説
明する。
まず、文字図形パターン(以下、入カバターンとする)
と各サブパターンの例を第3図に示す。
同図(a)は入カバターン、(b)は垂直サブパターン
(V S P) 、 (C)は水平サブパターン(H3
P)、(d)は右斜めサブパターン(H5P)、(e)
は左斜めサブパターン(LSP)である。
S1図は1本発明の一実施例を示すブロック図である。
同図において、文字の光信号は、光信号人力1より光電
変換部2において2値の量子化されたディジタル電気信
号に変換され、パターンレジスタ3に格納される。それ
と同時に線幅計算部4において入カバターンの線幅(W
)が計算される。サブパターン抽出部5はパターンレジ
スタ3について垂直スキャンを全面に行なって黒点(文
字線部を黒点とする)の連続の長さと線幅計算部4にお
いて計算された線幅との関係より垂直サブパターン(V
SP)を抽出し垂直サブパターンレジスタに格納する。
同様に水平スキャンにより水平サブパターン(H3P)
を、右斜め45°スキヤンにより右斜めサブパターン(
H3P)を左斜め45°スキヤンにより左斜めサブパタ
ーン(LSr)、を抽出し、各サブパターンレジスタに
格納する。
文字枠検出部6はパターンレジスタ3内の入カバターン
に外接する方形枠を検出し、その結果を文字枠分割決定
部7へ送る。この方形枠を文字枠と呼ぶ。
文字枠分割決定部7は文字枠検出部6で検出された文字
枠内をMXN個の領域(M、Nは整数、本実施例ではM
=N=5)に分割するためのX軸。
Y軸上の分割座標を決定する。ここでX軸、Y軸はそれ
ぞれ水平方向及び垂直方向の座標軸を示す。
特徴マトリクス抽出部8は文字枠分割決定部により決定
された分割点座標をうけてvsp。
H5P、RSP、LSPの各サブパターンレジスタ上の
文字枠内領域をMXN個の部分領域に分割し、各領域内
の特徴量を計算して、MXNX4次元の特徴マトリクス
を抽出する。以下、特徴量の計算方法を説明する。
まず、それぞれのサブパターンについて各部分領域内の
黒点数Bijを計数し、線幅計算部4で計算した線幅W
を用いて式(1)により文字線長をあらわす特徴量を計
算し、MXN次元のマトリクスをそれぞれのサブパター
ンごとに作成する。
さらに■SP特徴マトリクスは文字枠のY軸方向の長さ
ΔYで、H3P特徴マトリクスは文字枠のX軸方向の長
さΔXで、H3P及びLSP特徴マトリクスは(ΔX+
ΔY)/2でそれぞれ正規化を行ない最終的にMXNX
4次元の特徴マトリクスを作成する。
マトリクス識別部9は、特徴マトリクス抽出部8で抽出
した特徴マトリクス(Fm)とあらかじめマトリクス辞
書10に用意されている辞書マトリクス(F d)との
間に式(2)で定義される距M (D)を適用し、Dの
値が小さなものから順に対応する辞書マトリクスの文字
名をN^個取出す−9このN^個の文字名を入力文字の
候補文字名グループと呼び、候補文字名バッファ11に
出力する(本実施例ではN^=10)。
D=  l (Fm& −Fd+ ) 2−・(2)こ
こで、Fm 、 F d4は特徴マトリクス及び辞書マ
トリクスの各要素を表わしl≦に≦(MXNX4)であ
る。
候補文字名バッファ11は前記マトリクス識別部9から
出力された候補文字名グループを貯えていく。また、候
補文字名として空白を得た場合は、貯えている候補文字
名グループを後処理部12へ出力し、バッファ内を初期
化する。すなわち、本実施例では空白を区切りとして単
語の取出しを行なう(以下、これら候補文字名グループ
に対応する入力文字の集合を入力単語と呼ぶ)。但し、
貯えている候補文字名グループがあらかじめ規定した数
値N、、(N、:単語最大文字数と空白以外の文字の最
大連続数、本実施例では10)に達した場合にも、貯え
でいる候補文字名グループを出力し、バッファ内をクリ
アする。
特徴マトリクスバッファ12は、特徴ブトリクス抽出部
8p抽出した特徴マトリクスを貯える。そして、貯えた
特徴マトリクスを差分識別部1Bの要求により、出力し
、出力した後はバッファ内をクリアする。
後処理部13はまず、前記候補文字名バッファ11から
出力された候補文字名グループ(入力文字数に文字、各
文字について候補文字名NA個)より入力文字1文字に
ついて1個の候補文字名を取り出し、長さKの文字名列
を作る1次に、後処理部13はこの文字名列と同一の単
語が単語辞書14内に存在するか検索し、存在する場合
は当該単語を候補単語として差分識別部1B及び差分辞
書作成部15に出力する。この処理を候補文字名グルー
プ内の全ての候補文字名を組合せた文字名列について行
なって得られた候補単語を全て出力する0以上の処理に
ついて、第4図を例に説明する。同図(a)は入力文字
r大」、「田」、「市」とそれぞれの入力文字に対する
候補文字名である。この例では説明を簡単にするためN
^=3.に=3とする。
入力文字「太」に対しては候補文字名グループ(大、大
、犬)が得られており、同様に入力文字「田」に対して
は(田、由1国)、入力文字[市Jにしては(市、布、
中)が候補文字名グループとして得られている。次に、
前記3つの候補文字名グループからそれぞれ1個づつの
候補文字名を取出す。例えば「大田布」という文字名列
を取出して、この文字名列と同一の単語が単語辞書14
内に存在するか検索する。この例の場合は住所を認識対
象としているので、単語辞書14にはあらかじめ住所単
語を格納しておく、前記の文字名列「大田布」は住所単
語として存在するので、後処理部13は文字名列「大田
布」を候補単語として差分識別部16及び差分辞書作成
部】5に出力する。
さらに、前記3つの候補文字名グループからそれぞれ1
個づつ候補文字名を取出して作ることのできる全ての文
字名列について、前記の単語辞書との照合を行う。この
例では「大田布」の他に「太11市」、「大田布」、「
大田布」など27個(=N^×に個)の文字名列につい
て、単語辞書14との照合を行うにれらの文字名列のう
ち「大田布」及び「太田市」が単語辞書14内叫存在す
るので、この2単語名を候補単語名として出力する(第
4図(b))。第5図は前記文字名列と単語辞書との照
合の方法を図示したものであり、候補文字名を組み合わ
せて作られる文字名列から取り出した「太田市」と単語
辞書14内の単語「太田市」が一致して候補単語名とし
て出力される。
単語辞書14には、認識対象とする単語名が格納されて
いる。本実施例では住所を認識対象としているので、単
語辞書14には都道府県名、市町村名などをあらかじめ
格納しておく。
差分辞書作成部15は後処理部13から出力されたNI
)個の候補単語名を受けて、N、≧2の場合に限りこれ
らの候補単語名の中から2個づつの組合せを作り、全て
の2個の候補単語名(文字数に個)について以下の処理
を行なう。
まず、2個の候補単語名を比較し、i文字目(l≦i≦
K)の文字名が異なるとき、それぞれの文字名に対応す
る辞書マトリクス(Fd^及びFd、)をマトリクス辞
書10から取出す、さらに、(3)式により辞書マトリ
クス1oの各要素の差の絶対値を要素とする差分辞書マ
トリクス(WAβ)を作成する。
W非IFd硫−F 4/J・・・・・・・・・(3)但
し、WA鵠+ F dA屹、Fde&はマトリクスWA
、 。
Fd^、FdlIの要素を表わす。また、k=1゜2、
・・・、MXNX4である。差分辞書マトリクスは2個
の候補文字名を比較したとき、同じ文字位置で文字名が
異なるものがあれば全てについて作成される。
差分辞書作成部15は、以上のように作成した差分辞書
マトリクスを差分識別部1Gへ出力する。以下、第6図
を用いて差分辞書マトリクスの例を説明する。まず、後
処理部13から「太田市」、「太田市」の2個の候補単
語名が得られたとする。この2個の単語名を比較すると
「大」と「太」が異なるので、この2つの文字名に対応
する辞書マトリクスを取出し、差分辞書マトリクスを作
成する。第6図(a)及び(C)はそれぞれ「大」及び
「太」の文字パターン例、同図(b)、(d)はそれぞ
れ「大」及び「太」に対応する辞書マトリクス例であり
、同図(e)は差分辞書マトリクスの例である。また1
図中のH,V、L、RはそれぞれHSP特徴マトリクス
、VSP特徴マトリクス。
LSP特徴マトリクス、R3P特徴マトリクスであるこ
とを示している。第6図から、差分マトリクスのR5P
特徴マトリクスをみると、「大」とr太」の相異部分「
、」に大きな要素値が現れていることがわかる。
差分識別部16は、後処理部13から出力された候補単
語名(単語数280個)と羨分辞書作成部15で作成し
た差分辞書マトリクスをうけて前記候補単語名の順序付
を行ない、最も上位の候補単語名を出力する。以下、順
序付の方法を説明する。後処理部】34から得たN、個
の候補単語名について2個づつの組合せを作り、それら
全ての組合せについて次の処理を行う。2個の候補単語
名(C^。
C,とする文字数に個)を比較し、i文字目(l≦i≦
K)の文字名が異なるとき、それぞれの文字名(文字名
をA、Bとする)に対応する辞書マトリクス(Fd^及
びFd、)をマトリクス辞書10から取出し、差分辞書
作成部15から文字名A。
Bに対応する差分辞書マトリクスWAうを取出す。
さらに、認識しようとしている入力文字パターンの特徴
マトリクスをFmとしたとき、式(4)、(5)を適用
して文字名A及びBに対する重み打圧#A^、D、を計
算する。
D@=  IWsBt(Ftak−F4を戸−(5)さ
らにD^、D、を比較し式(6)を適用して、2個の単
語名C^、C,に対する得点、PAε、Pれを与える。
また、i文字目以外にも異なる文字名があれば同様に重
み打圧離を計算し、得点を求める。さらに得点を累積し
て、累積得点P^、P、を求める。P^、P8を式(7
)に示す。
FA=迄 1^コ・1・=六、P−コ°゛°(υ但し、
j文字目の文字名が2個の単語名について同一であれば PA3= 0 、 P 、J= 0とする。
ざらにP^、P、を比較し、改めて候補単語名C^、C
,に対する得点Q AB −Q BAを式(8)により
与える。
以上のように2個の候補単語名C^、C1lの得点Q 
A8+ Q BAを求める。この処理を80個の候補単
語名から取出して作ることのできる全ての2個の組合せ
について行ない、単語名ごとに得点を累積して最も高得
点の単語名の文字名列を文字名山力17に出力する0式
(3)に、単語名Ckの累積得点Rkの計算式を示す、
但し、Qkjは単語名CkのCjに対する得点である。
Rk =、Σ Qkj  ・・・・・・・・・・・・・
・・・・・・・・ (9)(但しQkk=0とする) この累積得点Rkの最も大きい単語名の文字名列を、最
終的な認識結果として文字名出力17に出力する。また
、後処理部12から出力された候補単語名が1個(すな
わちNo=1)の場合は、差分識別は行なわずに候補単
語名の文字名列を文字名出力17に出力する。候補単語
名が0個の場合は、読取不能コードを出力する。
以上説明した差分識別部1Bの動作をフローチャートで
示せば、第7図(a)及び(b)のとおりである。第7
図(a)において、後処理部13で得られた候補単語名
(文字数K)の測置を80個とする。
差分識別部1Bのフローは5701で始まり、処理は5
702へ移る。もし候補単語名が0個の場合(8口くl
の場合)は、5702から5703へ処理が移り、識別
不能を表わすコードを出力して5710へ移り終了する
。また、候補単語名が1(ilの場合(N、=1の場合
)は、5702から5704−5処理が移り、後処理部
から出力された候補単語名を結果として出力して571
0へ移り終了する。
候補単語名が複数個の場合(No>1の場合)は。
5702からS 705へ処理が移り、3705では、
5707で候補単語名に与えられる得点Rの初期値を全
てOにする。
そして、5706ではN、個の候補単語名から2個の候
補単語名A、Bを取り出す、その取り出された候補単語
名A、Bに対し5707でそれぞれ得点Q AB 、Q
 BAを計算する。得点の計算は後述する。8708で
は、Nl)個の候補単語名から2個の候補単語名を取り
出す組合せが全て行なわれたかどうかを判断し、全て行
なわれた場合には、S 709へ処理が移り、そうでな
い場合には、再び、5706と5707の処理を行なう
。5708では、5707で計算された得点Qの合計を
求め得点Rとし、最も得点Hの高い候補単語名を識別結
果として出力し5710へ移りフローが終了する。
ここで、5707の2個の候補単語名に得点Qを与える
処理について、第7図(b)を用いて詳細に説明する。
第7図(a)の3708で2個の候補単語名が得られ、
処理が8707に移った時第7図(b)の3711から
フローが開始する。 5712の工は候補単語名の何文
字目かを示す変数で、2個の候補単語名の文字名の一致
のチェックを1文字目から行なうように工に1を代入す
る。第7図(b)のフローでは、得点はPとQの2種類
を使う、得点Pは2個の候補単語名間で互いに異なる文
字名がある時に候補単語名に与えられる得点で、得点Q
は2個の候補単語名の文字名の比較を全ての文字名に対
して行なった後に得点Pを比較して得点Pの大きな候補
単語名の方に改めて与える得点である。5713では候
補単語名Aの得点P^と候補単語名Bの得点P、に初期
値としてOを与える。
候補単語名A、Bの文字数をTeとし、候補単語名Aの
各文字名をTA (I)、(I=l 、Te)表わし、
同様に候補単語名Bの各文字名をT(I)(I=1.、
Te)と表わす、 5714−cは、候補単語名Aと候
補単語名Bの工文字目の文字名が一致しているかどうか
調べる。つまりTA (r)とTl1(I)が一致して
いるかどうかを調べ、TA (I)とTl1(I)が一
致していれば、5721に処理が移る。また、TA(I
)とTll (Dが一致していなければ、5715に処
理が移り、予めT^ (I)と”rll(I)の差分辞
書マトリクスを差分辞書作成部15で作成し、入カバタ
ーンのサブパターン特徴マトリクスと文字名T^ (I
)の標準文字マスクの辞書との前記差分辞書マトリクス
で重み付けされた距離D^を5715で、入カバターン
のサブパターン特徴マトリクスと文字名Tl1(I)の
標準文字マスクの辞書との前記差分辞書マトリクスで重
み付けされた距離り、をS 71Bで計算する。571
7では、前記のD^とり、の大小比較を行ない、D^が
り、よりも大きい時は、5720で候補文字名Bの得点
P、に2点を加え、D^がり、よりも小さい時は、57
18で候補文字名Aの得点P^に2点加え、D^とDl
が等しい時には5718でP^とP、に共に1点を加え
る。得点Pに点数を与えた後、5721へ処理が移る。
5721では、候補単語名の次の文字名の比較を行なう
ため、■を1増し5722に処理が移る。5722では
、■の値が候補単語名の文字数Kを超えた場合は、57
23へ移り、超えない場合は5714の処理を行なう。
5723では、候補単語名A、Bの1文字目の文字名か
らに文字目の文字名までの比較が終了した後の得点P^
と得点P、の比較を行なう。P^がPfIより大きい場
合は、8726で候補単語名Aの得点QA8に2点を与
え、P^がP、より小さい場合は、5725で候補単語
名Bの得点Q、に2点を与え、P^とP8が等しい場合
は5724でQAllとQ 114に共に1点を与え、
5727に処理が移り終了する。
(発明の効果) 以上詳細に説明したように、本発明によれば、N^個の
候補文字名から2個取り出し、各文字名の標準文字マト
リクスの各要素の差の絶対値を要素とする差分辞書マト
リクスを入力文字特徴マトリクスと標準文字マトリクス
との距離の重み付けとして距離の小さい候補文字名に得
点を与えることを、全ての組合せに対して行ない順序付
を行なうこととしたため、特徴マトリクス識別の識別結
果で字形の酷似した類似文字が候補として選択された場
合でも差分識別は字形の相異部分に着目して相異部分に
対応するマトリクス要素値を強調した識別を行なってい
るので、正確な文字認識を行なうことができる。また、
辞書マトリクスから計算した差分マトリクスを重みマス
クとしているので、予め字形の酷似した類似文字ごとに
対応した重みマスクを用意する必要がなくなり、辞書を
増大させることなく文字認識装置に利用した場合に、装
置の構造が簡単になるという効果がある。
また、本発明は単語辞書による後処理を行なった後に得
られる候補単語名に入力文字の類似文字が含まれている
場合、もともと類似文字間では誤認識する確率が高いた
めに、誤まった候補単語名が1位の候補として出力され
る可能性があるが、本発明によれば、単語辞書を用いた
後処理で得られた候補単語名について差分識別を行なう
ことで、類似文字に誤認識することを防げ、認識精度の
向上がはかれる。さらに、差分識別を行なう候補数がN
個であるとすると、差分識別をする際にN02回のマツ
チングが行なわれる。しかし、単語辞書による後処理を
行なった後に、差分識別を行なう場合は差分識別を行な
う候補単語名の装置が少なくなるので、マツチングの回
数は大幅に少なくなる。このため差分識別の高速化がは
かれる0以上より、処理速度および認識精度が大幅に向
上する。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
従来の単語辞書を用いた後処理の例を示すブロック図、
第3図はサブパターンの抽出例を示す図、第4図及び第
5図は第1図に示す後処理部13の動作を説明するため
の図、第6図(a)及び(C)は文字パターン例を示す
図、第6図(b)及び(d)は辞書マトリクス例を示す
図、第6図(e)は差分辞書マトリクス例を示す図、第
7図は第1図に示す差分識別部16の動作フローチャー
トである。 1−m−光信号入力、 2−m−光電変換部、 3−m−パターンレジスタ、 4−一一線幅計算部、 5−m−サブパターン抽出部、 6−−−文字枠検出部、 7−−−文字枠分割決定部、 8−−一特徴マトリクス抽出部、 9−一一マトリクス識別部、 lO−m−マトリクス辞書、 11−m−候補文字名バッファ、 12−−− 特徴マトリクスバッファ、13−m−後処
理部、 14−m−単語辞書、 15−一一差分辞書作成部、 16一−−差分識別部、 17−−−文字名出力。 特  許  出  願  人 沖電気工業株式会社 特許出願代理人

Claims (1)

    【特許請求の範囲】
  1. 文字図形パターンの特定方向のストロークをあらわすサ
    ブパターンにおける任意の分割単位領域の黒ビット数を
    文字線幅とストローク方向に対応した文字枠の大きさと
    で正規化して得られる量を特徴要素として、ストローク
    方向の異なる複数の各サブパターン毎に且つ文字枠内を
    分割することによって得られる前記各分割単位領域毎に
    当該文字図形パターンから前記特徴要素を抽出してサブ
    パターン特徴マトリクスを作成し、標準文字マスクが当
    該サブパターン特徴マトリクスと同形式で記述されてい
    るマトリクス辞書を参照して当該文字図形パターンの認
    識を行う文字認識方式において、前記文字図形パターン
    のサブパターン特徴マトリクスと前記標準文字マスクと
    の照合を行ない、両者の距離の小さなものから標準文字
    マスクの文字名を所定個取出し、これを文字図形パター
    ンの候補文字名グループとして保存する第1の識別工程
    と、連続する文字図形パターンにそれぞれ対応する候補
    文字名グループから1文字ずつ取出して組合せた文字数
    K個の文字名列が予め用意した単語辞書内に存在するか
    どうかを調べ、存在していれば前記文字名列を候補単語
    名として出力する第2の識別工程と、前記候補単語名が
    N_0個(N_0は2以上の整数)ある場合にN_0個
    の前記候補単語名から2個取出し、この2個の候補単語
    名を比較しi文字目(1≦i≦K、iは整数)の文字名
    が異なるとき、それぞれのi文字目の文字名のマトリク
    ス辞書の各要素の差の絶対値を要素とする差分辞書マト
    リクスを作成し、該差分辞書マトリクスでサブパターン
    特徴マトリクスと前記i文字目の文字名の標準文字マス
    クとの距離に重み付けを行ない、その重み付距離の小さ
    い方の文字名を含む候補単語名に対して所定の得点を与
    え、K文字目まで比較が終った後の得点の和が大きい方
    の候補単語名に対して改めて所定の得点を与えることを
    、N_0個の候補単語名から2個取出して得られる全て
    の組合せに対して行ない、最も得点の高い候補単語名を
    識別結果として出力する第3の識別工程とを有すること
    を特徴とする文字認識方式。
JP60038309A 1985-02-27 1985-02-27 文字認識方式 Granted JPS61198385A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60038309A JPS61198385A (ja) 1985-02-27 1985-02-27 文字認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60038309A JPS61198385A (ja) 1985-02-27 1985-02-27 文字認識方式

Publications (2)

Publication Number Publication Date
JPS61198385A true JPS61198385A (ja) 1986-09-02
JPH0580711B2 JPH0580711B2 (ja) 1993-11-10

Family

ID=12521694

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60038309A Granted JPS61198385A (ja) 1985-02-27 1985-02-27 文字認識方式

Country Status (1)

Country Link
JP (1) JPS61198385A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6436387A (en) * 1987-07-31 1989-02-07 Toyota Central Res & Dev Character recognition device
KR100236247B1 (ko) * 1996-01-16 1999-12-15 다니구찌 이찌로오, 기타오카 다카시 온라인 문자 인식 방법 및 온라인 문자 인식 장치

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6436387A (en) * 1987-07-31 1989-02-07 Toyota Central Res & Dev Character recognition device
KR100236247B1 (ko) * 1996-01-16 1999-12-15 다니구찌 이찌로오, 기타오카 다카시 온라인 문자 인식 방법 및 온라인 문자 인식 장치

Also Published As

Publication number Publication date
JPH0580711B2 (ja) 1993-11-10

Similar Documents

Publication Publication Date Title
Cheung et al. An Arabic optical character recognition system using recognition-based segmentation
US7437001B2 (en) Method and device for recognition of a handwritten pattern
Okamoto et al. Performance evaluation of a robust method for mathematical expression recognition
JPS61198385A (ja) 文字認識方式
Li et al. Character recognition under severe perspective distortion
US20020126903A1 (en) Word recognizing apparatus for dynamically generating feature amount of word and method thereof
Hu et al. Construction of partitioning paths for touching handwritten characters
Airphaiboon et al. Recognition of handprinted Thai characters using loop structures
CN114943241B (zh) 用于修复条码码图的方法、电子设备、存储介质
JP2930996B2 (ja) 画像認識方法および画像認識装置
Gatos et al. A segmentation-free recognition technique to assist old Greek handwritten manuscript OCR
JPH09147105A (ja) 図面閉領域の抽出方法
JP2671984B2 (ja) 情報認識装置
JP3352467B2 (ja) オンライン文字認識装置
Hu et al. Structural boundary feature extraction for printed character recognition
JP2004005761A (ja) キーワード抽出・検索装置
JPS62125485A (ja) 文字認識方式
JPS6330991A (ja) 文字認識装置
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JPH06131503A (ja) 文字認識処理装置
JP2962984B2 (ja) 文字認識装置
JP2984315B2 (ja) 認識装置
JPH0256683A (ja) 図面認識方式
JP2004030695A (ja) キーワード抽出・検索装置
JPH04280393A (ja) 文字図形認識装置