JPH012187A

JPH012187A - オンライン連続文字認識装置

Info

Publication number: JPH012187A
Application number: JP62-158107A
Authority: JP
Inventors: 藤井　浩美
Original assignee: 日本電気株式会社
Filing date: 1987-06-24
Publication date: 1989-01-06

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（産業上の利用分野）本発明は、オンラインで入力された文字の筆跡より、Ｉ
ＩＩ！ｉｔ以上連続して書かれた文字を認識するオンラ
イン連続文字認識装置に関するものである。

（従来の技術）オンライン文字認識は、タブレット等からオンラインで
入力された筆跡データより文字を認識するものであり、
すでにさまざまな製品が発売されている。それらの製品
の多くは、パターンマツチング法による認識処理を行っ
ている。パターンマツチング法とは、あらかじめ筆記さ
れた文字データを標準パターンとして保持しておき、入
力された文字パターンとのマツチングを行い、最も類似
した標準パターンのカテゴリを認識結果とする方法であ
る。

この原理に基づくオンライン文字認識において、連続し
て書かれた文字列を認識する方法としては、各文字の開
始時刻と終了時刻（以下、始端、終端ということにする
）を求めるセグメンテーションを行った後に１文字単位
パターンを切り出し認識処理を行う方法があった（以下
、従来技術ａと呼ぶ〉。以下、連続して書かれた数字列
を例に取り、この方法の概略を説明する。

この方法では、まず、タブレットなどから入力された特
徴値の時系列データに対し、あらかじめ定められたセグ
メンテーションルールに従って各文字の始端と終端を定
める。特徴値としては、位置座標、方向角、ペンのアッ
プダウン情報などが用いられる。ルールとしては、例え
ば、昭和６２年２月１７日に本願と同一出願人により出
願された「オンライン連続文字認識装置」に記載されて
いる方法を用いることができる。この文献におけるセグ
メンテーションは、まず、ペンがアップし、かつ、次の
時刻点がＸ軸方向へ増加している場合に、その点を文字
の終端候補としてその次の点を次の文字の始端候補とす
る。次に、このようにして求められた各文字に対し、そ
の文字のＸ軸座標の最大値よりも次の文字の最小値の方
が小さい場合には、−文字が分離されていると解釈し、
その文字の終端候補は終端でないとして終端候補から外
す、というものである。

セグメンテーションによって、文字列中の各文字の始端
、終端が求められると、各文字の始端より終端までのセ
グメントを１文字パターンとして入力パターンよりそれ
ぞれ切り出す。第３図はその様子を示している。入力パ
ターンにおける白丸はセグメンテーションによって求め
られた始端、黒丸は終端を示している。パターン切り出
し後、各パターンに対して、そのパターンとあらかじめ
保持されている標準パターンとの間でパターンマツチン
グを行い最大類似度の得られた標準パターンのカテゴリ
名を認識結果として出力する。類似度を求める方法とし
ては、特願昭５６−１９９０９８号明細書、特願昭５６
−２０８７１号明細書に記載されているＤＰマツチング
法がよく知られている。この方法は、動的計画法を用い
てパターンの時間軸を最適に伸縮させてマツチングを行
い類似度を得る方法である。また、ＤＰマツチング以外
にも、パターンの時間軸を１対１で対応させる線形マツ
チングを用いることもできる。

しかし、これらの方法では、文字境界で各文字を切り出
し、１文字単位で認識処理を行うため、第４図に示すよ
うにセグメンテーション誤りが起きると正しく認識する
ことは不可能である。

これに対し、別のアプローチとしてセグメンテーション
を行わないことにより、上述の従来技術ａの問題を回避
する方法が特願昭６０−１１０７４３号明細書に記載さ
れている（以下、従来技術すと呼ぶ）。以下に、この方
法の概略を述べる。

まず、連続して書かれた１つの文字の書き始めの点から
次の文字の書き始めまでのパターンである連続文字パタ
ーンと、孤立して書かれた文字パターンである孤立パタ
ーンを標準パターンとする。そして、第５図に示すよう
に、入力パターンと、標準パターンを連結させた連結標
準パターンとの間でパターンマツチングを行い最大類似
度が得られる標準パターン系列を求め、そのカテゴリ系
列を認識結果とする。文字列を対象として、最大類似度
が得られる標準パターン系列を求める方法は、前記文献
のＤＰマツチングを応用した２段ＤＰマツチングやクロ
ック同期伝播型ＤＰマッチングを用いることができる。

２段ＤＰマツチングについては、「連続発声した単語音
声を効率的に認識する２段ＤＰマツチング」、日経エレ
クトロニクス、１９８３年１１月　７日号、Ｎｏ、３２
９の　１７１頁より２０８頁に、クロック同期伝播型Ｄ
Ｐマツチングについては、特開昭５８−９８７９６にそ
れぞれ詳しく述べられているので、ここでは省略する。

（発明が解決しようとする問題点）従来技術ａでは、文字境界で各文字を切り出し、１文字
単位で認識処理を行うため、セグメンテーション誤りが
生じると誤認識になるという問題点があった。

それに対し従来技術すでは、セグメンテーション誤りに
よる誤認識を回避できる反面、文字列を１筆書きされた
データとして扱うため、ストロークの途中が文字境界と
なる認識誤りが起きるという問題があった。また、入力
パターンの時刻点の全ての組合せを文字区間と想定して
計算を行うため、計算量が膨大になるという欠点があっ
た。

本発明の目的は、従来技術ａ、ｂにおけるこのような欠
点を除去し、セグメンテーション誤りが起きても正しく
認識することが可能である高性能なオンライン連続文字
認識装置を堤供することにある。

（問題を解決するための手段）本発明における第１の発明によるオンライン連続文字認
識装置は、次の各部をに必要とする。すなわち、認識対
象文字の標準パターンを保持する標準パターン格納部と
、入力された文字列のデータに対し、あらかじめ定めら
れたルールにしたがって文字列中の各文字の始端と終端
の候補を求めるセグメンテーション部と、前記セグメン
テーション部にて得られた各文字の始端と終端の候補よ
り複数の文字区間を求め、求められた各文字区間のデー
タを１文字パターンとして切り出す文字切り出し部と、
前記文字切り出し部にて得られた各文字パターンと前記
標準パターン格納部における標準パターンとの間で類似
度を求め、最大の類似度を与える標準パターンの系列を
出力する認識部の又部である。

本発明における第２の発明によるオンライン連続文字認
識装置は、次の各部を必要とする。すなわち、認識対象
文字の標準パターンを保持する標準パターン格納部と、
入力された文字列のデータに対し、あらかじめ定められ
たルールにしたがって文字列中の各文字の始端と終端の
候補を求めるセグメンテーション部と、前記セグメンテ
ーション部にて得られた各文字の始端と終端の候補より
複数の文字区間を求め、求められた各文字区間のデータ
を１文字パターンとして切り出す文字切り出し部と、前
記文字切り出し部にて得られた各文字パターンの情報に
基づき認識対象文字の中からそのパターンに体する候補
文字を選択する候補文字選択部と、前記文字切り出し部
にて得られた入力パターンの各文字パターンと前記候補
文字選択部で得られた各文字パターンに対する候補文字
の標準パターンとの間の類似度を求め、最大の類似度を
与える標準パターンの系列を出力する認識部の各部であ
る。

（作用）本発明における第１の発明によるオンライン連続文字認
識装置では、文字切り出し部にて文字列における各文字
区間の候補を求め、それに従って文字を切り出す。この
とき、セグメンテーションで得られた始端と終端に誤り
がある可能性を考慮して、ある始端から始まる文字の終
端を複数個選び、その始端から始まる複数個の文字区間
をそれぞれ文字区間候補としてパターンを切り出す。以
」二の原理により、セグメンテーション誤りがおきても
、正しい文字区間を候補として得ることができる。また
、セグメンテーションルールに基づくセグメンテーショ
ン結果を利用しているため、従来技術すにおけるストロ
ークの途中が終端となる誤認識をなくすことができる。

さらに、文字区間が限定されるため、従来技術すより大
幅に計算量を減らすことができる。

本発明における第２の発明によるオンライン連続文字認
識装置では、第１の発明の文字切り出し部において切り
出された各文字パターンに対し、候補文字選択部におい
て候補文字を選択する。候補文字の選択は、切り出され
たパターンの画数、ストローク長などの情報を用いて行
う。これにより、各文字区間において候補文字の個数が
少なくなり、計算量をさらに減らすことができる。

（実施例）以下に、本発明の実施例について図面を参照しながら詳
細に説明する。第１図は、本発明における第１の発明に
よるオンライン連続文字認識装置の一実施例を示すブロ
ック図である。ここでは、前記の従来技術の説明と同様
に、連続して書かれた数字を例にとり説明する。

入力バッファ１は書かれた数字列の特徴パラメータを時
系列パターンとして一時保持する。特徴パラメータとし
ては、従来技術ａ、ｂと同様に位置座標や方向角などが
用いられる。一方、標準パターン格納部４には、認識対
象となる文字パターンが特徴パラメータの時系列パター
ンとしてあらかじめ保持されている。保持されているパ
ターンは、認識対象の字種の文字パターンである。この
実施例では、数字を認識対象としているので、”　Ｏ’
“〜”　９　”の文字パターンが保持されている。

セグメンテーション部２では、従来技術ａで述べたよう
な特徴パラメータに対するあらかじめ定められたルール
に従って、入力された文字列パターン内の各文字の始端
と終端の候補を求める。

文字切り出し部３では、セグメンテーション部２にて求
められた始端、終端の集合により、各文字区間の候補を
求め、パターンを切り出す。ここでは、第４図に示した
セグメンテーション結果の例を用いて文字区間候補を求
める方法を説明する。文字区間候補は、第６図に示すよ
うに、例えば、あるセグメント１個を１文字区間とする
場合と、あるセグメントと次のセグメントの２個のセグ
メントを１文字区間とする方法を用いる。第６図の例で
は、２個のセグメントまでを１文字区間としたが、２ｇ
までとは限らず、１個以上の汗怠個のセグメントをあわ
せて１文字とすることができる。また、認識対象文字の
画数の上限が分がっている場合には、セグメント内の画
数の累積値がその上限を越えない範囲で１文字区間とす
る、などのルールによって文字区間候補を求めることも
できる。文字区間が定められると、入力バッファ１内の
入力パターンから、各文字区間候補に１〜に９のパター
ンが切り出される。

認識部５では、切り出されたパターンに対して認識処理
を行う。すなわち、各文字パターンに対して標準パター
ン格納部４の標準パターン“０”〜“９″とのマツチン
グを行い、もっとも類似度の大きい標準パターンを求め
、入力パターン全体として、最大類似度を与える標準パ
ターンの系列を求める。最大類似度を与える標準パター
ン系列は、従来方式すの２段ＤＰマツチングやクロック
同期伝播型ＤＰマツチングを用いて求める。

次に、本発明における第２の発明について図面を用いて
説明する。第２図は、その第２の発明の一実施例を示す
ブロック図である。入力バッファ１は入力された文字の
時系列パターンを入力パターンとして一時保持する。一
方、標準パターン格納部４には、認識対象となる文字パ
ターンが特徴パラメータの時系列パターンとしてあらか
じめ保持されている。第１の発明の場合と同様に゛′０
パ〜”　９　”の文字パターンが保持されている。

セグメンテーション部２では、従来技術ａで述べたよう
な特徴パラメータに対するルールがあらかじめ定められ
ており、そのルールに従って入力された文字列パターン
内の各文字の始端と終端の候補を求める。

文字切り出し部３では、第１の発明で述べたようにして
、セグメンテーション部３にて求められた始端、終端の
集合より、各文字区間の候補を求め、パターンを切り出
す。

次に、候補文字選択部６では、切り出された各文字パタ
ーンに対して、候補となる文字を認識対象文字の中から
選択する。ここでは、例えば、各文字パターンの画数を
求め、その画数を持つ標準パターンをそのパターンに対
する候補文字とする方法を用いる。第６図における区間
に１のパターンは、画数が１面であるため、１画の標準
パターン′″０″、”　１　”、”　２　”、パ３”、
”６パ、“８パ、“９″を候補とする。同様に、区間に
２のパターンでは、２画の標準パターン°′４”、″５
”、”７’“を候補とする。このようにして全ての文字
パターンに１〜に９に対して候補文字を絞る。この例で
は、同一の画数として候補を求めたが、同一画数である
必要はなく、画数に幅を持たせて候補文字の個数を絞る
こともできる。また、画数の他に、パターン内のストロ
ーク長、パターンの大きさ等の情報を用いることができ
る。

最後に、認識部５において、切り出された各文字パター
ンに対して、選ばれた候補文字の標準パターンに対して
のみマツチングを行い、第１の発明と同様の方法で結果
を得る。

（発明の効果）以上説明した本発明の第１の発明によるオンライン連続
文字認識装置は、複数の可能性で文字区間候補を求める
ため、セグメンテーション誤りが生じてもそれらを救う
ことができ、認識率が向上する。また、セグメンテーシ
ョンによって文字の終端候補が有効に絞られているため
、無理なマツチングによりストローク長途中が終端にな
る誤認識は回避される。

さらに、本発明の第２の発明によるオンライン連続文字
認識装置は、文字区間ごとに候補文字を絞ることができ
るため、計算量が減少し、処理速度が向上するという利
点が生じる。

【図面の簡単な説明】

第１図は、本発明の第１の発明の一実施例を示すブロッ
ク図。第２図は、本発明の第２の発明の一実施例を示す
ブロック図。第３図、第４図は、セグメンテーション結
果を示す図。第５図は、従来技術を説明するための図、
第６図は、第１図の文字切り出し部３における動作を説
明するための図である。図において、

Claims

【特許請求の範囲】

（１）認識対象文字の標準パターンを保持する標準パタ
ーン格納部と、入力された文字列のデータに対し、あら
かじめ定められたルールにしたがって文字列中の各文字
の始端と終端の候補を求めるセグメンテーション部と、
前記セグメンテーション部にて得られた各文字の始端と
終端の候補より複数の文字区間を求め、求められた各文
字区間のデータを１文字パターンとして切り出す文字切
り出し部と、前記文字切り出し部にて得られた各文字パ
ターンと前記標準パターン格納部における標準パターン
との間で類似度を求め、最大の類似度を与える標準パタ
ーンの系列を出力する認識部とを持つことを特徴とする
オンライン連続文字認識装置。
（２）認識対象文字の標準パターンを保持する標準パタ
ーン格納部と、入力された文字列のデータに対し、あら
かじめ定められたルールにしたがって文字列中の各文字
の始端と終端の候補を求めるセグメンテーション部と、
前記セグメンテーション部にて得られた各文字の始端と
終端の候補より複数の文字区間を求め、求められた各文
字区間のデータを１文字パターンとして切り出す文字切
り出し部と、前記文字切り出し部にて得られた各文字パ
ターンの情報に基づき認識対象文字の中からそのパター
ンに対する候補文字を選択する候補文字選択部と、前記
文字切り出し部にて得られた入力パターンの各文字パタ
ーンと前記候補文字選択部で得られた各文字パターンに
対する候補文字の標準パターンとの間の類似度を求め、
最大の類似度を与える標準パターンの系列を出力する認
識部とを持つことを特徴とするオンライン連続文字認識
装置。