JPH012187A - オンライン連続文字認識装置 - Google Patents

オンライン連続文字認識装置

Info

Publication number
JPH012187A
JPH012187A JP62-158107A JP15810787A JPH012187A JP H012187 A JPH012187 A JP H012187A JP 15810787 A JP15810787 A JP 15810787A JP H012187 A JPH012187 A JP H012187A
Authority
JP
Japan
Prior art keywords
character
pattern
segmentation
standard
candidates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62-158107A
Other languages
English (en)
Other versions
JPS642187A (en
Inventor
藤井 浩美
Original Assignee
日本電気株式会社
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to JP62-158107A priority Critical patent/JPH012187A/ja
Publication of JPS642187A publication Critical patent/JPS642187A/ja
Publication of JPH012187A publication Critical patent/JPH012187A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、オンラインで入力された文字の筆跡より、I
II!it以上連続して書かれた文字を認識するオンラ
イン連続文字認識装置に関するものである。
(従来の技術) オンライン文字認識は、タブレット等からオンラインで
入力された筆跡データより文字を認識するものであり、
すでにさまざまな製品が発売されている。それらの製品
の多くは、パターンマツチング法による認識処理を行っ
ている。パターンマツチング法とは、あらかじめ筆記さ
れた文字データを標準パターンとして保持しておき、入
力された文字パターンとのマツチングを行い、最も類似
した標準パターンのカテゴリを認識結果とする方法であ
る。
この原理に基づくオンライン文字認識において、連続し
て書かれた文字列を認識する方法としては、各文字の開
始時刻と終了時刻(以下、始端、終端ということにする
)を求めるセグメンテーションを行った後に1文字単位
パターンを切り出し認識処理を行う方法があった(以下
、従来技術aと呼ぶ〉。以下、連続して書かれた数字列
を例に取り、この方法の概略を説明する。
この方法では、まず、タブレットなどから入力された特
徴値の時系列データに対し、あらかじめ定められたセグ
メンテーションルールに従って各文字の始端と終端を定
める。特徴値としては、位置座標、方向角、ペンのアッ
プダウン情報などが用いられる。ルールとしては、例え
ば、昭和62年2月17日に本願と同一出願人により出
願された「オンライン連続文字認識装置」に記載されて
いる方法を用いることができる。この文献におけるセグ
メンテーションは、まず、ペンがアップし、かつ、次の
時刻点がX軸方向へ増加している場合に、その点を文字
の終端候補としてその次の点を次の文字の始端候補とす
る。次に、このようにして求められた各文字に対し、そ
の文字のX軸座標の最大値よりも次の文字の最小値の方
が小さい場合には、−文字が分離されていると解釈し、
その文字の終端候補は終端でないとして終端候補から外
す、というものである。
セグメンテーションによって、文字列中の各文字の始端
、終端が求められると、各文字の始端より終端までのセ
グメントを1文字パターンとして入力パターンよりそれ
ぞれ切り出す。第3図はその様子を示している。入力パ
ターンにおける白丸はセグメンテーションによって求め
られた始端、黒丸は終端を示している。パターン切り出
し後、各パターンに対して、そのパターンとあらかじめ
保持されている標準パターンとの間でパターンマツチン
グを行い最大類似度の得られた標準パターンのカテゴリ
名を認識結果として出力する。類似度を求める方法とし
ては、特願昭56−199098号明細書、特願昭56
−20871号明細書に記載されているDPマツチング
法がよく知られている。この方法は、動的計画法を用い
てパターンの時間軸を最適に伸縮させてマツチングを行
い類似度を得る方法である。また、DPマツチング以外
にも、パターンの時間軸を1対1で対応させる線形マツ
チングを用いることもできる。
しかし、これらの方法では、文字境界で各文字を切り出
し、1文字単位で認識処理を行うため、第4図に示すよ
うにセグメンテーション誤りが起きると正しく認識する
ことは不可能である。
これに対し、別のアプローチとしてセグメンテーション
を行わないことにより、上述の従来技術aの問題を回避
する方法が特願昭60−110743号明細書に記載さ
れている(以下、従来技術すと呼ぶ)。以下に、この方
法の概略を述べる。
まず、連続して書かれた1つの文字の書き始めの点から
次の文字の書き始めまでのパターンである連続文字パタ
ーンと、孤立して書かれた文字パターンである孤立パタ
ーンを標準パターンとする。そして、第5図に示すよう
に、入力パターンと、標準パターンを連結させた連結標
準パターンとの間でパターンマツチングを行い最大類似
度が得られる標準パターン系列を求め、そのカテゴリ系
列を認識結果とする。文字列を対象として、最大類似度
が得られる標準パターン系列を求める方法は、前記文献
のDPマツチングを応用した2段DPマツチングやクロ
ック同期伝播型DPマッチングを用いることができる。
2段DPマツチングについては、「連続発声した単語音
声を効率的に認識する2段DPマツチング」、日経エレ
クトロニクス、1983年11月 7日号、No、32
9の 171頁より208頁に、クロック同期伝播型D
Pマツチングについては、特開昭58−98796にそ
れぞれ詳しく述べられているので、ここでは省略する。
(発明が解決しようとする問題点) 従来技術aでは、文字境界で各文字を切り出し、1文字
単位で認識処理を行うため、セグメンテーション誤りが
生じると誤認識になるという問題点があった。
それに対し従来技術すでは、セグメンテーション誤りに
よる誤認識を回避できる反面、文字列を1筆書きされた
データとして扱うため、ストロークの途中が文字境界と
なる認識誤りが起きるという問題があった。また、入力
パターンの時刻点の全ての組合せを文字区間と想定して
計算を行うため、計算量が膨大になるという欠点があっ
た。
本発明の目的は、従来技術a、bにおけるこのような欠
点を除去し、セグメンテーション誤りが起きても正しく
認識することが可能である高性能なオンライン連続文字
認識装置を堤供することにある。
(問題を解決するための手段) 本発明における第1の発明によるオンライン連続文字認
識装置は、次の各部をに必要とする。すなわち、認識対
象文字の標準パターンを保持する標準パターン格納部と
、入力された文字列のデータに対し、あらかじめ定めら
れたルールにしたがって文字列中の各文字の始端と終端
の候補を求めるセグメンテーション部と、前記セグメン
テーション部にて得られた各文字の始端と終端の候補よ
り複数の文字区間を求め、求められた各文字区間のデー
タを1文字パターンとして切り出す文字切り出し部と、
前記文字切り出し部にて得られた各文字パターンと前記
標準パターン格納部における標準パターンとの間で類似
度を求め、最大の類似度を与える標準パターンの系列を
出力する認識部の又部である。
本発明における第2の発明によるオンライン連続文字認
識装置は、次の各部を必要とする。すなわち、認識対象
文字の標準パターンを保持する標準パターン格納部と、
入力された文字列のデータに対し、あらかじめ定められ
たルールにしたがって文字列中の各文字の始端と終端の
候補を求めるセグメンテーション部と、前記セグメンテ
ーション部にて得られた各文字の始端と終端の候補より
複数の文字区間を求め、求められた各文字区間のデータ
を1文字パターンとして切り出す文字切り出し部と、前
記文字切り出し部にて得られた各文字パターンの情報に
基づき認識対象文字の中からそのパターンに体する候補
文字を選択する候補文字選択部と、前記文字切り出し部
にて得られた入力パターンの各文字パターンと前記候補
文字選択部で得られた各文字パターンに対する候補文字
の標準パターンとの間の類似度を求め、最大の類似度を
与える標準パターンの系列を出力する認識部の各部であ
る。
(作用) 本発明における第1の発明によるオンライン連続文字認
識装置では、文字切り出し部にて文字列における各文字
区間の候補を求め、それに従って文字を切り出す。この
とき、セグメンテーションで得られた始端と終端に誤り
がある可能性を考慮して、ある始端から始まる文字の終
端を複数個選び、その始端から始まる複数個の文字区間
をそれぞれ文字区間候補としてパターンを切り出す。以
」二の原理により、セグメンテーション誤りがおきても
、正しい文字区間を候補として得ることができる。また
、セグメンテーションルールに基づくセグメンテーショ
ン結果を利用しているため、従来技術すにおけるストロ
ークの途中が終端となる誤認識をなくすことができる。
さらに、文字区間が限定されるため、従来技術すより大
幅に計算量を減らすことができる。
本発明における第2の発明によるオンライン連続文字認
識装置では、第1の発明の文字切り出し部において切り
出された各文字パターンに対し、候補文字選択部におい
て候補文字を選択する。候補文字の選択は、切り出され
たパターンの画数、ストローク長などの情報を用いて行
う。これにより、各文字区間において候補文字の個数が
少なくなり、計算量をさらに減らすことができる。
(実施例) 以下に、本発明の実施例について図面を参照しながら詳
細に説明する。第1図は、本発明における第1の発明に
よるオンライン連続文字認識装置の一実施例を示すブロ
ック図である。ここでは、前記の従来技術の説明と同様
に、連続して書かれた数字を例にとり説明する。
入力バッファ1は書かれた数字列の特徴パラメータを時
系列パターンとして一時保持する。特徴パラメータとし
ては、従来技術a、bと同様に位置座標や方向角などが
用いられる。一方、標準パターン格納部4には、認識対
象となる文字パターンが特徴パラメータの時系列パター
ンとしてあらかじめ保持されている。保持されているパ
ターンは、認識対象の字種の文字パターンである。この
実施例では、数字を認識対象としているので、” O’
“〜” 9 ”の文字パターンが保持されている。
セグメンテーション部2では、従来技術aで述べたよう
な特徴パラメータに対するあらかじめ定められたルール
に従って、入力された文字列パターン内の各文字の始端
と終端の候補を求める。
文字切り出し部3では、セグメンテーション部2にて求
められた始端、終端の集合により、各文字区間の候補を
求め、パターンを切り出す。ここでは、第4図に示した
セグメンテーション結果の例を用いて文字区間候補を求
める方法を説明する。文字区間候補は、第6図に示すよ
うに、例えば、あるセグメント1個を1文字区間とする
場合と、あるセグメントと次のセグメントの2個のセグ
メントを1文字区間とする方法を用いる。第6図の例で
は、2個のセグメントまでを1文字区間としたが、2g
までとは限らず、1個以上の汗怠個のセグメントをあわ
せて1文字とすることができる。また、認識対象文字の
画数の上限が分がっている場合には、セグメント内の画
数の累積値がその上限を越えない範囲で1文字区間とす
る、などのルールによって文字区間候補を求めることも
できる。文字区間が定められると、入力バッファ1内の
入力パターンから、各文字区間候補に1〜に9のパター
ンが切り出される。
認識部5では、切り出されたパターンに対して認識処理
を行う。すなわち、各文字パターンに対して標準パター
ン格納部4の標準パターン“0”〜“9″とのマツチン
グを行い、もっとも類似度の大きい標準パターンを求め
、入力パターン全体として、最大類似度を与える標準パ
ターンの系列を求める。最大類似度を与える標準パター
ン系列は、従来方式すの2段DPマツチングやクロック
同期伝播型DPマツチングを用いて求める。
次に、本発明における第2の発明について図面を用いて
説明する。第2図は、その第2の発明の一実施例を示す
ブロック図である。入力バッファ1は入力された文字の
時系列パターンを入力パターンとして一時保持する。一
方、標準パターン格納部4には、認識対象となる文字パ
ターンが特徴パラメータの時系列パターンとしてあらか
じめ保持されている。第1の発明の場合と同様に゛′0
パ〜” 9 ”の文字パターンが保持されている。
セグメンテーション部2では、従来技術aで述べたよう
な特徴パラメータに対するルールがあらかじめ定められ
ており、そのルールに従って入力された文字列パターン
内の各文字の始端と終端の候補を求める。
文字切り出し部3では、第1の発明で述べたようにして
、セグメンテーション部3にて求められた始端、終端の
集合より、各文字区間の候補を求め、パターンを切り出
す。
次に、候補文字選択部6では、切り出された各文字パタ
ーンに対して、候補となる文字を認識対象文字の中から
選択する。ここでは、例えば、各文字パターンの画数を
求め、その画数を持つ標準パターンをそのパターンに対
する候補文字とする方法を用いる。第6図における区間
に1のパターンは、画数が1面であるため、1画の標準
パターン′″0″、” 1 ”、” 2 ”、パ3”、
”6パ、“8パ、“9″を候補とする。同様に、区間に
2のパターンでは、2画の標準パターン°′4”、″5
”、”7’“を候補とする。このようにして全ての文字
パターンに1〜に9に対して候補文字を絞る。この例で
は、同一の画数として候補を求めたが、同一画数である
必要はなく、画数に幅を持たせて候補文字の個数を絞る
こともできる。また、画数の他に、パターン内のストロ
ーク長、パターンの大きさ等の情報を用いることができ
る。
最後に、認識部5において、切り出された各文字パター
ンに対して、選ばれた候補文字の標準パターンに対して
のみマツチングを行い、第1の発明と同様の方法で結果
を得る。
(発明の効果) 以上説明した本発明の第1の発明によるオンライン連続
文字認識装置は、複数の可能性で文字区間候補を求める
ため、セグメンテーション誤りが生じてもそれらを救う
ことができ、認識率が向上する。また、セグメンテーシ
ョンによって文字の終端候補が有効に絞られているため
、無理なマツチングによりストローク長途中が終端にな
る誤認識は回避される。
さらに、本発明の第2の発明によるオンライン連続文字
認識装置は、文字区間ごとに候補文字を絞ることができ
るため、計算量が減少し、処理速度が向上するという利
点が生じる。
【図面の簡単な説明】
第1図は、本発明の第1の発明の一実施例を示すブロッ
ク図。第2図は、本発明の第2の発明の一実施例を示す
ブロック図。第3図、第4図は、セグメンテーション結
果を示す図。第5図は、従来技術を説明するための図、
第6図は、第1図の文字切り出し部3における動作を説
明するための図である。 図において、

Claims (2)

    【特許請求の範囲】
  1. (1)認識対象文字の標準パターンを保持する標準パタ
    ーン格納部と、入力された文字列のデータに対し、あら
    かじめ定められたルールにしたがって文字列中の各文字
    の始端と終端の候補を求めるセグメンテーション部と、
    前記セグメンテーション部にて得られた各文字の始端と
    終端の候補より複数の文字区間を求め、求められた各文
    字区間のデータを1文字パターンとして切り出す文字切
    り出し部と、前記文字切り出し部にて得られた各文字パ
    ターンと前記標準パターン格納部における標準パターン
    との間で類似度を求め、最大の類似度を与える標準パタ
    ーンの系列を出力する認識部とを持つことを特徴とする
    オンライン連続文字認識装置。
  2. (2)認識対象文字の標準パターンを保持する標準パタ
    ーン格納部と、入力された文字列のデータに対し、あら
    かじめ定められたルールにしたがって文字列中の各文字
    の始端と終端の候補を求めるセグメンテーション部と、
    前記セグメンテーション部にて得られた各文字の始端と
    終端の候補より複数の文字区間を求め、求められた各文
    字区間のデータを1文字パターンとして切り出す文字切
    り出し部と、前記文字切り出し部にて得られた各文字パ
    ターンの情報に基づき認識対象文字の中からそのパター
    ンに対する候補文字を選択する候補文字選択部と、前記
    文字切り出し部にて得られた入力パターンの各文字パタ
    ーンと前記候補文字選択部で得られた各文字パターンに
    対する候補文字の標準パターンとの間の類似度を求め、
    最大の類似度を与える標準パターンの系列を出力する認
    識部とを持つことを特徴とするオンライン連続文字認識
    装置。
JP62-158107A 1987-06-24 オンライン連続文字認識装置 Pending JPH012187A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62-158107A JPH012187A (ja) 1987-06-24 オンライン連続文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62-158107A JPH012187A (ja) 1987-06-24 オンライン連続文字認識装置

Publications (2)

Publication Number Publication Date
JPS642187A JPS642187A (en) 1989-01-06
JPH012187A true JPH012187A (ja) 1989-01-06

Family

ID=

Similar Documents

Publication Publication Date Title
KR900008555B1 (ko) 수서도형의 온라인 인식방법 및 장치
KR940022320A (ko) 영어문자인식 방법 및 시스템
JP3761937B2 (ja) パターン認識方法及び装置及びコンピュータ制御装置
JPH012187A (ja) オンライン連続文字認識装置
JPH0520794B2 (ja)
JPH09319828A (ja) オンライン文字認識装置
JP2671985B2 (ja) 情報認識方法
JP3198218B2 (ja) オンライン手書き文字認識方法
JP2671984B2 (ja) 情報認識装置
JPS62160597A (ja) オンライン連続文字認識装置
KR960013818B1 (ko) 다중획인식을 이용한 한글조합인식장치
JPH04115383A (ja) オンライン手書き文字認識装置の文字認識方式
JPH0210473B2 (ja)
JPS63200289A (ja) オンライン連続文字認識装置
KR900005141B1 (ko) 문자인식장치
JPS63118993A (ja) 文字認識方法
JPH01316890A (ja) オンライン手書文字認識方式
JPS6215681A (ja) オンライン手書き文字認識方式
JPH0944599A (ja) 情報処理装置及び方法
JPS6022793B2 (ja) 文字識別装置
JPH0355681A (ja) 手書き文字認識装置
JPS62128384A (ja) 手書き文字認識方式
JPS61267883A (ja) オンライン連続文字認識装置
JPS63155389A (ja) オンライン文字認識装置
JPH01169588A (ja) オンライン文字認識装置