JP2762472B2 - 文字認識方法および文字認識装置 - Google Patents

文字認識方法および文字認識装置

Info

Publication number
JP2762472B2
JP2762472B2 JP63204144A JP20414488A JP2762472B2 JP 2762472 B2 JP2762472 B2 JP 2762472B2 JP 63204144 A JP63204144 A JP 63204144A JP 20414488 A JP20414488 A JP 20414488A JP 2762472 B2 JP2762472 B2 JP 2762472B2
Authority
JP
Japan
Prior art keywords
character
stroke
template
degree
approximation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63204144A
Other languages
English (en)
Other versions
JPH0253193A (ja
Inventor
公義 吉田
寛文 田守
秋夫 坂野
公之 茶谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP63204144A priority Critical patent/JP2762472B2/ja
Priority to KR1019890011629A priority patent/KR0128733B1/ko
Priority to CN89106539A priority patent/CN1020213C/zh
Publication of JPH0253193A publication Critical patent/JPH0253193A/ja
Application granted granted Critical
Publication of JP2762472B2 publication Critical patent/JP2762472B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明はオンライン手書き文字の認識装置に関す
る。
〔発明の概要〕
この発明は、オンライン手書き文字の認識装置におい
て、入力されたストロークと、あらかじめ定義しておい
た文字の基本的構成要素との近似度を求め、この近似度
を成分とする特徴ベクタから入力された文字をファジー
性をもって評価することにより、その諸特性を向上させ
たものである。
〔従来の技術〕
オンラインで手書き文字を認識する方法として、第6
図に示すように、 i.1ストロークの入力筆跡(同図A)を、その筆跡上の
サンプル点P0,P1,…,Pnと、その時系列情報とによって
折れ線(同図B)で近似する。
ii.あらかじめ定義しておいたストロークの基本的形
状、すなわち、「基本ストロークタイプ」と、i項の折
れ線と比較する「ストローク認識」を行う。
iii.ii項の結果に基づいて、入力されたストロークを、
最も近い基本ストロークタイプのコード番号に変換す
る。
IV.1文字分のすべてのストロークについて、i〜iii項
を繰り返す。
V.辞書を参照し、iii項のコード番号をそのストローク
順(筆順)に持つ文字を、入力された文字と判断する。
という方法が、多く用いられている。
この方法によれば、入力されたストロークを一度基本
ストロークタイプに置き換えているので、入力筆跡のサ
ンプル点P0〜Pnに基づく情報のうち、以後の認識過程で
必要なデータを除いてほとんどを捨てることができ、し
たがって、記憶容量の小さな装置でも文字認識ができ
る。また、辞書の基本ストロークタイプのコード番号
を、各文字ごとにストローク順に並べておくことによ
り、これと、入力された文字の基本ストロークタイプの
コード番号の順序とを比較することで入力された文字の
認識ができるので、辞書を小型化できるとともに、比較
に要する時間を短縮できる。
文献:「日経エレクトロニクス」1983年12月5日号 〔発明が解決しようとする課題〕 しかし、この方法による場合には、入力ノイズ、筆記
者の書きぐせなどにより入力筆跡が変化ないし変形して
いるときには、ii項のストローク認識にエラーを生じ、
この結果、認識精度が大幅に低下してしまう。例えば
「一」あるいは横棒を書くとき、第7図Aの○印内に示
すように、「筆押さえ」があると、その基本ストローク
タイプは同図Bのように認識されてしまう。
このため、従来においては、辞書に「誤認識しやすい
ストロークタイプ」コードを「ストロークSがコード番
号C1,C2,…,またはCn」のように並列に記述することで
対処している。
しかし、このようにすると、辞書のサイズが大きくな
るとともに、検索時間が長くなってしまう。さらに、ユ
ーザーが未登録の文字を辞書に追加登録できるようにし
ようとした場合、入力されたストロークから登録の必要
なストロークタイプコードを一意に決定することができ
ないので、そのような追加登録の実用が非常に困難であ
る。
この発明は、以上のような問題点を解決しようとする
ものである。
〔課題を解決するための手段〕
上記の課題を解決するために、本発明は、下記の手段
を備えた文字認識方法及び装置を提供する。
文字毎に、該文字を構成する基本構成要素である各テ
ンプレートに対して予め各々設定された一致とすべき程
度を示す修飾語を記憶する特徴辞書を用いた文字認識方
法であって、文字の基本的構成要素として予め記憶され
た複数のテンプレートと、入力された手書き入力の各ス
トロークとの近似度を各々算出する近似度演算処理ステ
ップと、前記近似度演算部で算出された各ストロークに
対する各テンプレートの近似度を、前記特徴辞書に記憶
された各テンプレートに対する修飾語を用いて修飾して
各ストローク毎に合格度を求め、該合格度に基いて、該
当する候補文字を特定する検定処理ステップとを具備す
ることを特徴とする文字認識方法。
文字の基本的構成用として予め記憶された複数のテン
プレートと、入力された手書き入力の各ストロークとの
近似度を各々算出する近似度演算部と、文字毎に、該文
字を構成する基本構成要素である各テンプレートに対し
て予め各々設定された一致すべき程度を示す修飾語を記
憶する特徴辞書と、前記近似度演算部で算出された各ス
トロークに対する各テンプレートの近似度を、前記特徴
辞書に記憶された各テンプレートに対する修飾語を用い
て修飾して各ストローク毎に合格度を求め、該合格度に
基いて、該当する候補文字を特定する検定手段とを具備
することを特徴とする文字認識装置。
〔作用〕
ファジー性をもって文字認識が行われ、認識率を低下
させることなく、辞書サイズの小型化、検索の高速化な
どが実現される。
〔実施例〕
まず、この発明及び実施例のアウトラインについて説
明しよう。
すなわち、この発明においては、 I.例えば、第2図に示すようなテンプレート(基本スト
ロークタイプ)T126を用意する。
II.入力された文字ごとに、その第i番目のストロークS
iと、テンプレートT1〜T26とを順次比較して各テンプレ
ートTj(j=1〜26)との近似度Eijを演算する。
例えば、入力された文字がカタカナの「メ」とすれ
ば、その第1ストロークS1は、テンプレートT1,T2,T3
どと近似度が高く、テンプレートT7などと近似度が低い
ので、 E10 1=90%,E10 2=80%,E10 3=95%,‥‥,E10 7
=0%,‥‥‥,E12 6=0% となる。同様に、第2ストロークS2については、 E20 1=5%,E20 2=0%,E20 3=0%,‥‥,E20 7
=95%,‥‥‥,E22=0% となる(数値は、説明用の仮りの大きさ)。
III.各文字に対して、II項の結果を各ストロークSiごと
に特徴ベクタVi Vi=(Ei01,Ei02,…,Ei26) として保持する。
上例の場合であれば、 V1=(90,80,95,…,0,…,0) V2=(5,0,0,…,95,…,0) である。
IV.カタカナの「メ」の字が正しく書かれた場合、その
第1ストロークS1はテンプレートT3に「大体」一致し、
第2ストロークS2はテンプレートT7に「確実に」一致す
る。
そこで、辞書には、「メ」の字であれば、「メ」のJI
Sコード、T3=大体、T7=確実に のように文字データを記述しておく。
すなわち、各文字ごとに、その文字のコード番号と、
その文字の第i番目のストロークSiに最も近いテンプレ
ートの番号Tj及びその近さ(一致)の程度を示す修飾語
とを記述しておく。また、このテンプレート番号Tj及び
修飾語は、ストローク順にそのストローク数だけ記述し
ておく。
さらに、この文字データは、文字の総ストローク数ご
とに項分けしておく。
V.例えば、第3図に示すようなファジー性をもった関数
のテーブルを用意しておく。
VI.IV項による文字のデータのうち、入力された文字の
総ストローク数の項から第1番目の文字についての文字
データを取り出す。
上例の場合、「メ」の字の総ストローク数は2画なの
で、2画の項から第1番目の文字データを取り出す。
VII.VI項で取り出した文字データが、簡単のため、
「メ」の字についての文字データであるとすると、第1
ストロークS1については、T3=「大体」なので、第3図
の「大体」の関数曲線を選択するとともに、III項で求
めた特徴ベクタV1の近似度のうち、テンプレートT3に対
する近似度95%(=E10 3)を取り出す。
そして、この近似度95%を、第3図の「大体」の関数
曲線により合格率G1、例えばG1=96%に変換する。
同様に、第2ストロークS2については、T7=「確実
に」なので、第3図の「確実に」の関数曲線を選択する
とともに、特徴ベクタV2の近似度のうち、テンプレート
T7に対する近似度95%(=E20 7)を取り出して合格度G
2、例えば、G2=98%に変換する。
すなわち、VI項で取り出された文字データにしたがっ
て、各ストロークSiごとに、第4図の関数曲線を選択す
るとともに、特徴ベクタViの対応する近似値Ejiを、そ
の選択した関数曲線により修飾して合格度Giに変換す
る。
VIII.VII項で求めた合格度Giのうち、最小の合格率を、
その文字データの示すコード番号の文字の合格度Gmとす
る。
上例の場合には、G1=96%,G2=98%なので、入力さ
れた文字の、「メ」の字に対する合格度Gmは、96%(=
G1)となる。
IX.以後、該当する総ストローク数の文字データについ
て、VII,VIII項を実行する。
X.IX項が終了したら、得られた合格度Gm(これは、文字
データの数だけ得られる)のうち、最高の合格度Gを与
えている文字を、入力された文字に対する第1候補とし
てそのコード番号を出力する。
次に、テンプレートT1〜T26であるが、これは次のよ
うな点を考慮して決定されている。すなわち、 i.漢字の構成要素は、「横ストローク」、「縦ストロー
ク」、「はらい」、「曲げ」などがあるが、種類は限定
されている。
ii.同じように見えるストロークでも、運筆の違いから
「はね」、「曲がり」などの変形のしかたに違いを生じ
る。また、「はね」などには、もともと長さや角度の規
定がないので、異なる変形を生じる可能性のストローク
には、例えばテンプレートT1〜T3のように、変形の種類
分だけ別個にテンプレートを用意する。
iii.特に複雑な基本形状は、漢字のすべてについての出
現頻度が極めて低いので、テンプレートを定義しない
で、他の認識方法で処理する。
なお、テンプレートT1〜T26において、破線で示すス
トローク部分は、近似度Eijを求めるとき、評価を小さ
くないし無視することを示す。
次に、この発明の一例について説明しよう。
第1図において、(1)はタブレットなどの座標入力
手段を示し、この入力手段(1)により1ストローク分
の座標列P0〜Pnが入力され、この座標列P0〜Pnが折れ線
圧縮回路(2)に供給されて折れ線情報及びその端点情
報の列に圧縮変換される。すなわち、例えば、入力され
たストローク(座標列)が前処理されて第4図Bに示す
ような折れ線#1〜#4で構成されているとすれば、こ
のストロークは、その折れ線#1〜#4ごとに、例えば
同図Aに示すような角範囲(方向)をもって8方向に量
子化されるとともに、その折れ線#1〜#4の長さと、
各始点及び終点の座標値とに変換され、同図Cに示すよ
うなデータとされる。
そして、このデータの1ストローク分が、一時用のバ
ッファメモリ(3)を通じて近似度演算回路(401)〜
(426)に供給されてテンプレートT1〜T26との近似度Ei
jが算出される(上記II項)。なお、この近似度Eijの算
出は、ルール記憶回路(501)〜(526)に記述されてい
る演算アルゴリズムにしたがって各テンプレートTjごと
に独立に、かつ、並列に実行される。
そして、算出された近似度Eijが、特徴ベクタ記憶バ
ッファ(6)に供給される。図は、このバッファ(6)
の構造を模型的に示しているもので、テンプレートT1
26に対応して行方向に26個のメモリエリアを有するとと
もに、認識する文字の最大のストローク数kに対応して
列方向にk個のメモリエリアを有する。したがって、こ
のバッファ(6)には、1つの文字について、その各ス
トロークSiの特徴ベクタViが、そのストロークSiごとに
ストアされる(上記III項)。
そして、この1文字分の特徴ベクタViと、特徴辞書
(7)からの文字コード(上記IV項)とが、検定回路
(8)において上記VI〜X項のように処理されて入力さ
れた文字のコード番号が出力される。
第5図は、近似度演算回路(410)において、入力ス
トロークSiのテンプレートT1に対する近似度Ei01を算出
するルールの例を示す。
すなわち、同図Aは、「右」,「五」などに含まれる
「ノ」を誇張して示したものであるが、このストローク
「ノ」に対して、テンプレートT1のときには、同図Bに
示すように、長さL1〜L4,Lh,Lwが計測されて Ei01=(aLh−bLw−cL1+dL4+eL3)/L2 ただし、 Ei01>1のときには、Ei01=1 Ei01<0のときには、Ei01=0 a〜eは定数が算出される(ここでは、近似
値Ei01を小数で表示)。
が計算される。
そして、このとき、テンプレートT1では、破線のスト
ローク部分の重みを0ないし小さくしているので、値
L3,L4に対する定数e,dは、他の定数a〜cに比べて小さ
くされる。
また、演算回路(402)〜(426)においても、そのテ
ンプレートT2〜T26に対応して近似度Ei02〜Ei26の演算
式がそれぞれ定義されてその近似度が算出される。
〔発明の効果〕
以上のようにして、この発明によれば、オンライン手
書き文字の認識が行われるが、この場合、特にこの発明
によれば、入力されたストロークSiとあらかじめ定義し
ておいたテンプレートT1〜T26との近似度Eijを求め、こ
の近似度Eij及び修飾語に基づいて文字認識を行ってい
るので、筆跡の自然な変化ないし変形に対する認識率の
低下がない。むしろ、テンプレートTjは、テンプレート
T1〜T3のように部分的な変形にも対処しているので、認
識率は向上し、筆跡の変化ないし変形に対して強くなれ
る。
また、辞書(7)は、ストロークSiに対応する代表的
なテンプレートTj及びその修飾語を、基本的には1個だ
け持っていればよいので、辞書(7)を小型化できると
ともに、辞書(7)の検索を高速化できる。
さらに、未定義文字の登録も、ユーザーが1ストロー
ク入力するごとに、最も近似度の高いテンプレートの形
状を画面表示し、そのテンプレートが正しい形状である
かどうかを会話形式で確認していくという方法で実現す
ることができる。
【図面の簡単な説明】
第1図はこの発明の一例の系統図、第2図〜第7図はそ
の説明のための図である。 (1)は座標入力手段、(401)〜(426)は近似度演算
回路、(7)は特徴辞書、(8)は検定回路である。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 茶谷 公之 東京都品川区北品川6丁目7番35号 ソ ニー株式会社内 (56)参考文献 特開 平1−312684(JP,A) 特開 平2−33688(JP,A) 「ファジー推論による実時間手書き漢 字認識」,電子情報通信学会論文誌 D −▲II▼,VolJ72,No.3,p p.369−379,1989年3月 「オンライン手書文字認識における、 サブパターン導入による略字、くずし 字、筆順誤りへの対応」.電子情報通信 学会論文誌 D,Vol.J70−D,N o.4,pp.777−784,1987年4月 「ファジー推論エキスパートシステム の現状と動向」,情報処理,Vol. 28,No.8,pp.1065−1074,1987 年8月 (58)調査した分野(Int.Cl.6,DB名) G06K 9/62 JICSTファイル(JOIS)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】文字毎に、該文字を構成する基本構成要素
    である各テンプレートに対して予め各々設定された一致
    すべき程度を示す修飾語を記憶する特徴辞書を用いた文
    字認識方法であって、文字の基本的構成要素として予め
    記憶された複数のテンプレートと、入力された手書き入
    力の各ストロークとの近似度を各々算出する近似度演算
    処理ステップと、前記近似度演算部で算出された各スト
    ロークに対する各テンプレートの近似度を、前記特徴辞
    書に記憶された各テンプレートに対する修飾語を用いて
    修飾して各ストローク毎に合格度を求め、該合格度に基
    いて、該当する候補文字を特定する検定処理ステップと
    を具備することを特徴とする文字認識方法。
  2. 【請求項2】文字の基本的構成要素として予め記憶され
    た複数のテンプレートと、入力された手書き入力の各ス
    トロークとの近似度を各々算出する近似度演算部と、文
    字毎に、該文字を構成する基本構成要素である各テンプ
    レートに対して予め各々設定された一致すべき程度を示
    す修飾語を記憶する特徴辞書と、前記近似度演算部で算
    出された各ストロークに対する各テンプレートの近似度
    を、前記特徴辞書に記憶された各テンプレートに対する
    修飾語を用いて修飾して各ストローク毎に合格度を求
    め、該合格度に基いて、該当する候補文字を特定する検
    定手段とを具備することを特徴とする文字認識装置。
JP63204144A 1988-08-17 1988-08-17 文字認識方法および文字認識装置 Expired - Fee Related JP2762472B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP63204144A JP2762472B2 (ja) 1988-08-17 1988-08-17 文字認識方法および文字認識装置
KR1019890011629A KR0128733B1 (ko) 1988-08-17 1989-08-16 온라인 수서 문자 인식 장치
CN89106539A CN1020213C (zh) 1988-08-17 1989-08-17 联机手写字符识别装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63204144A JP2762472B2 (ja) 1988-08-17 1988-08-17 文字認識方法および文字認識装置

Publications (2)

Publication Number Publication Date
JPH0253193A JPH0253193A (ja) 1990-02-22
JP2762472B2 true JP2762472B2 (ja) 1998-06-04

Family

ID=16485566

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63204144A Expired - Fee Related JP2762472B2 (ja) 1988-08-17 1988-08-17 文字認識方法および文字認識装置

Country Status (3)

Country Link
JP (1) JP2762472B2 (ja)
KR (1) KR0128733B1 (ja)
CN (1) CN1020213C (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69227174T2 (de) * 1991-12-19 1999-04-29 Texas Instruments Inc Zeichenerkennung
TW274135B (ja) * 1994-09-14 1996-04-11 Hitachi Seisakusyo Kk
JPH10124505A (ja) * 1996-10-25 1998-05-15 Hitachi Ltd 文字入力装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0632083B2 (ja) * 1988-06-10 1994-04-27 サン電子株式会社 ファジー推論による手書き文字認識装置
JPH0632084B2 (ja) * 1988-07-25 1994-04-27 サン電子株式会社 ファジー推論による手書き文字認識方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
「オンライン手書文字認識における、サブパターン導入による略字、くずし字、筆順誤りへの対応」.電子情報通信学会論文誌 D,Vol.J70−D,No.4,pp.777−784,1987年4月
「ファジー推論エキスパートシステムの現状と動向」,情報処理,Vol.28,No.8,pp.1065−1074,1987年8月
「ファジー推論による実時間手書き漢字認識」,電子情報通信学会論文誌 D−▲II▼,VolJ72,No.3,pp.369−379,1989年3月

Also Published As

Publication number Publication date
CN1020213C (zh) 1993-03-31
KR900003771A (ko) 1990-03-27
CN1040447A (zh) 1990-03-14
JPH0253193A (ja) 1990-02-22
KR0128733B1 (ko) 1998-04-15

Similar Documents

Publication Publication Date Title
US5742705A (en) Method and apparatus for character recognition of handwritten input
US6275611B1 (en) Handwriting recognition device, method and alphabet, with strokes grouped into stroke sub-structures
US6539113B1 (en) Radical definition and dictionary creation for a handwriting recognition system
US7174043B2 (en) On-line handwriting recognizer
US6118890A (en) System and method for broad classification of biometric patterns
US5923778A (en) Hierarchical representation of reference database for an on-line Chinese character recognition system
WO1997044758A9 (en) Methods and apparatuses for handwriting recognition
JPH05108883A (ja) 文字認識方法及び装置
WO1997044758A1 (en) Methods and apparatuses for handwriting recognition
JP2881866B2 (ja) 手書き文字の認識方法及び装置
JPH11203415A (ja) 類似パターンカテゴリ識別辞書作成装置および方法
JP2762472B2 (ja) 文字認識方法および文字認識装置
JP2556477B2 (ja) パタン照合装置
JPH0757092A (ja) 指紋照合装置
JP3977473B2 (ja) 手書き文字認識方法及び手書き文字認識装置
JP3221488B2 (ja) 検証機能付きオンライン文字認識装置
JP3125432B2 (ja) 手書き文字認識装置
JP2924040B2 (ja) 手書き文字の認識装置
JP2665488B2 (ja) 個人辞書登録方式
JP3760040B2 (ja) 文字認識方法、文字認識装置及び情報記録媒体
JPH10247221A (ja) オンライン文字認識装置
JPS58186882A (ja) 手書き文字入力装置
JP2001060250A (ja) 文字認識方法および装置
JP2851865B2 (ja) 文字認識装置
JP3763151B2 (ja) 手書き文字認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees