JPH10247221A - オンライン文字認識装置 - Google Patents
オンライン文字認識装置Info
- Publication number
- JPH10247221A JPH10247221A JP9048648A JP4864897A JPH10247221A JP H10247221 A JPH10247221 A JP H10247221A JP 9048648 A JP9048648 A JP 9048648A JP 4864897 A JP4864897 A JP 4864897A JP H10247221 A JPH10247221 A JP H10247221A
- Authority
- JP
- Japan
- Prior art keywords
- feature
- segment
- character
- stroke
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/03—Arrangements for converting the position or the displacement of a member into a coded form
- G06F3/033—Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor
- G06F3/0354—Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor with detection of 2D relative movements between the device, or an operating part thereof, and a plane or surface, e.g. 2D mice, trackballs, pens or pucks
- G06F3/03545—Pens or stylus
Landscapes
- Character Discrimination (AREA)
Abstract
る認識率の低下を防止し、また、続け字等に対する認識
率の向上を図るオンライン文字認識装置を提供する。 【解決手段】 入力部1からの入力文字パターン上の座
標点を折れ線近似することで得た各セグメントに関する
方向及び長さ及び特徴点とを抽出する特徴抽出部2と、
辞書内文字のセグメントと入力文字パターンから得たセ
グメントとの対応付けを行いセグメント対応付けの距離
を算出する特徴点対応付け部3と、辞書内文字の特徴点
組に対応した入力文字パターン上の特徴点組によって決
定される区間の特徴情報を対応ストローク特徴として抽
出する指定区間特徴抽出部4と、算出した対応ストロー
ク特徴の距離とセグメント対応付けの距離とを併用して
候補文字を算出する特徴照合部5とを有する。
Description
等で文字を手書きして入力するオンライン文字認識装
置、特に続け字等に対する文字認識率の向上を図るオン
ライン文字認識装置に関する。
コンピュータに文字コードを入力するための要素技術で
あるオンライン文字認識において、楷書で筆記された文
字は、公知である基本ストローク方式(予め数種類のス
トロークの形状を基本ストロークとして定義し、文字を
基本ストロークの組み合わせで表現する)やその他種々
の認識方式により高精度な認識が可能である。しかし、
続け字に対する認識性能は楷書に比べ十分でないのが現
状である。このため、従来から続け字に対応したオンラ
イン文字認識方式の研究が行われてきた。例えば、電子
通信学会論文誌J66−D No.5、第593〜60
0頁に記載された「選択的ストローク結合による画数・
筆順に依存しないオンライン文字認識」がある。以下、
これを従来例1とする。従来例1によると、入力パター
ンと辞書においてストローク(ペンダウンからペンアッ
プまでの座標列の単位)数の少ない方のストロークをス
トローク数の多い方に1対1に対応付け、ストロークの
多い方で対応付いていないストロークは、既に対応付い
ているストロークに選択的に結合し、結合後の辞書と入
力パターンの座標点間の距離をDP(Dynamic Programi
ng)マッチングを用いて算出し、候補文字を出力するこ
とにより続け字認識を可能にしている。DPマッチング
については、例えば「パターン認識」(船久保 登著:
共立出版)の第62頁より記述があるのでここでは詳し
く言及しない。従来例1では座標点をDPマッチングの
特徴に用いているが、この他には図18に示す運筆に沿
って等分割した座標点間の方向成分(方向コード)を用
いる方法もある。
に沿ってストロークをあたかも一筆書きしているように
全て繋げた状態にし、ストロークを適当な幅で等分割近
似している。図18のそれぞれの分割点間(a1,a
2,a3,a4,・・・,a21)の方向成分を、例え
ば図19に示す8方向コードに近似し、この方向成分を
DPマッチングの特徴に用いて続け字認識を行うことも
可能である。
続け字に対応した辞書を作成して認識する方法、あるい
はストロークの分離情報を辞書に持ち、入力パターンと
辞書のストローク数が同一になるようにストロークを分
解する方法がある。
して、特公平2−10473号がある。以下、これを従
来例2とする。ここで、この従来例2について構成及び
動作の説明をする。
装置の基本構成を示したブロック構成図である。図20
には、座標入力装置21と、座標入力装置21の出力を
入力する基本線分識別回路22と、基本線分識別回路2
2の出力を入力して順次出力する線分コード送出回路2
3と、線分コードバッファ24と、判定回路29が再認
識とした場合、ストロークの線分を順次分解する線分分
解回路25と、制御回路26と、線分コード送出回路2
3の出力と辞書記憶部28の出力を比較する比較回路2
7と、比較回路27の出力を入力して文字の同定を行う
判定回路29と、記憶している辞書データを比較回路2
7に順次送出する辞書記憶部28とが示されている。
時系列情報を供給された基本線分識別回路22では、ス
トロークを折れ線近似し、それぞれの折れ線(セグメン
ト)の方向成分を図19に示す8方向コードで表す。次
に、図21に示す方向コード列と基本ストロークの対応
表を用いて入力ストロークがどの基本ストロークに属す
るか決定する。
の動作を説明する。図22では線101,102,10
3,104,105の順にストロークを記入している。
各ストロークを折れ線近似し、8方向コードで筆順に沿
って表すと{(1),(6),(7),(1,7),
(1)}となる。これを図21に示す基本ストローク表
を用いて基本ストローク列{(1),(3),(4),
(7),(1)}を得る。
いるので、比較回路27で5画辞書と照合処理を行い、
判定回路29で候補文字判定を行う。その結果、辞書内
の文字「石」と一致し、文字コードを出力する。
明する。図23では線106,107,108,109
の順に記入している。図23の続け字パターンに対して
は、同様に基本線分識別回路22で基本ストローク列
{(1),(3),(4),(21)}を得る。画数が
4であるので、比較回路27は、4画辞書と比較する。
この場合、判定回路29は、辞書記憶部28内に「石」
の4画辞書が存在しないと文字を出力することができな
い。そこで、制御回路26に戻り、線分分解回路25を
用いてストロークを順次分解する。分解ストロークと分
解ルールは、予め辞書記憶部28に登録してあり、ここ
では、図24に示すルールを用いて基本ストローク(2
1)を(7),(1)に分割し、更に画数を5とする。
この結果、入力パターンの基本ストローク列は
{(1),(3),(4),(7),(1)}と修正さ
れ、比較回路27は、辞書記憶部28内の5画辞書と照
合作業を行う。その結果、辞書内の文字「石」と一致
し、判定回路29は、結果を出力する。
1によると、続け字の認識が可能であるが、例えば、図
25に示したような辞書パターン(a)と入力パターン
(b)を照合する場合、図25(c)に示したように、
位置ずれあるいは変形によって対応する座標点間の距離
が大きくなり、その結果、辞書との距離が大きくなって
誤読しやすいという問題点があった。
に用いる特徴に方向コードを用いると、続け字認識が可
能なほか図25に示したような位置ずれに対しては強く
なるが、運筆方向が似ている文字同士、例えば、「伎」
と「仮」、「却」と「劫」、あるいは「村」と「杖」等
の文字を誤認識しやすい問題点があった。
方向差が大きい文字を認識する場合、入力パターンと辞
書とのDPマッチングで得られるコスト値が字形の整っ
たパターンに比べ大きくなり、その結果、他の文字に誤
読しやすいという問題点があった。
ね」「おさえ」の成分を持つ文字(a)と「はね」「お
さえ」の成分を持たない(つまり、対応する成分を持た
ない)辞書(b)との整合の距離が大きくなり、誤読し
やすいという問題点があった。これに対して、例えばス
トロークの始点、終点付近の折り返し成分(例えば連続
する直線部の角度差が90度以下である始点または終点
の線分)の方向コードを無視する、あるいは重み付けを
する等の方法が考えられるが、始点、終点付近の折り返
し成分がノイズであるか、文字に必要な特徴であるかは
文字を意識しないと判定できない。このため、ストロー
クの始点、終点付近の成分を単純に無視することができ
ないといった問題点があった。
を用いて認識する方法は、辞書と入力パターンの画数を
一致させないと距離を計算できない問題点があり、続け
字に対応するためには、予め続け字のパターンを辞書に
登録するか、辞書の文字パターンで続けやすい部分を文
字毎に記述する必要があった。すなわち、従来例2で
は、入力パターンの続けられたストロークの分解ルール
が分解辞書に存在しないとストロークを分解できず、誤
認識となる問題があった。これに対して全ての文字の様
々な続け字ストロークに対処するには、莫大な辞書容量
を必要とする問題点があった。
の方向コードを持つストロークに対し方向コード毎に分
解する方法を用いて解決しようとしても、続け書きした
ストローク部分には、本来ストロークとして表出する実
ストローク以外に楷書では表出しない仮想ストロークを
含む場合がある。図27にこの例を示す。図27の入力
パターン(a)は、辞書(b)に比べ、正しい画数では
仮想ストロークとなる成分30および31を余計に持
つ。このため、単に直線成分で分解した直線コード列
は、実ストロークのみの特徴を持つ辞書とは必ずしも一
致しないために、誤認識する場合があり、方向コードで
単純に分割できないという問題点があった。
になされたものであり、その目的は、入力文字パターン
中の予期せぬ成分に起因する認識率の低下を防止し、ま
た、続け字等に対する認識率の向上を図るオンライン文
字認識装置を提供することにある。
するために、第1の発明に係るオンライン文字認識装置
は、文字パターンの座標点列データを入力として、その
入力文字パターンに該当した文字コードを出力するオン
ライン文字認識装置において、前記入力文字パターンを
記述する際のストローク上の座標点列データを入力する
入力手段と、前記入力手段に入力された座標点列データ
に含まれる時系列順に並んだ座標点を折れ線近似するこ
とで得た各直線部分をセグメントとし、その各セグメン
トに関する特徴情報と各セグメントの端点である特徴点
とを抽出する特徴抽出手段と、文字を構成するセグメン
トに関する特徴情報及び特徴点を文字毎に格納した辞書
を予め記憶する辞書記憶手段と、前記辞書に記述された
各文字の特徴情報と前記特徴抽出手段から抽出された特
徴情報とに基づいて前記辞書内の各文字を構成するセグ
メントと前記入力文字パターンから得たセグメントとの
対応付けを行い、セグメント対応付けの距離を算出する
特徴点対応付け手段と、前記辞書が指定するストローク
上の特徴点組に対応した前記入力文字パターンのストロ
ーク上の特徴点組によって決定される区間の特徴情報を
対応ストローク特徴として抽出する指定区間特徴抽出手
段と、前記指定区間特徴抽出手段によって抽出された対
応ストローク特徴を前記辞書内の特徴情報と照合し、対
応ストローク特徴の距離を算出する特徴照合手段と、前
記特徴照合手段で得られた候補文字コードを出力する出
力手段とを有し、前記特徴照合手段は、算出した対応ス
トローク特徴の距離及び前記特徴点対応付け手段によっ
て算出されたセグメント対応付けの距離に基づいて前記
辞書内の前記入力文字パターンに対応した文字を特定す
るものである。
は、第1の発明において、前記特徴抽出手段は、隣接し
たセグメントの向きが近似しているとき単一のセグメン
トとして結合するものである。
は、第1の発明において、前記特徴点対応付け手段は、
前記辞書内の文字の各ストロークの始点と終点に対し前
記入力文字パターンの座標点をそれぞれ1つ対応付け、
前記指定区間特徴抽出手段は、前記始点に対応する前記
入力文字パターンの特徴点と前記終点に対応する前記入
力文字パターンの特徴点とを特徴点組とするものであ
る。
は、第1の発明において、前記特徴照合手段は、前記辞
書内の文字を特定する際、前記対応ストローク特徴の距
離及び前記セグメント対応付けの距離に重み付けを行う
ものである。
は、第1の発明において、前記各セグメントに関する情
報には、各セグメントの方向及び長さが含まれており、
前記特徴点対応付け手段は、前記特徴抽出手段が算出し
た各セグメントの方向及び長さに基づいて、対応付けし
た各セグメントのコストを算出し、そのコストに基づき
セグメント対応付けの距離を算出するものである。
は、第5の発明において、前記特徴点対応付け手段は、
前記辞書中の文字を構成する部分として表出されるスト
ロークに対応したセグメントと前記入力文字パターンを
構成するストロークのうち表出しない部分に対応したセ
グメントとを対応付けないようにするものである。
は、第5の発明において、前記辞書記憶手段は、所定の
セグメントに関する特徴情報に方向非依存情報を付加し
た辞書を記憶し、前記特徴点対応付け手段は、方向非依
存情報が付加されたセグメントに基づき算出されるコス
トを一定値とするものである。
は、第7の発明において、前記辞書内の文字を構成する
セグメントのうち入力される文字パターンによって方向
がばらつくものと考えられるセグメントに関する特徴情
報に方向非依存情報を付加するものである。
は、第7の発明において、前記特徴点対応付け手段は、
方向非依存情報が付加されたセグメントに基づき算出さ
れるコストを0とするものである。
置は、第7の発明において、前記特徴点対応付け手段
は、方向非依存情報が付加されたセグメントに対応付け
する前記入力文字パターンから得たセグメントの数の上
限を設けるものである。
好適な実施の形態について説明する。
ライン文字認識装置の実施の形態1を示したブロック構
成図である。本実施の形態におけるオンライン文字認識
装置は、入力部1、特徴抽出部2、特徴点対応付け部
3、指定区間特徴抽出部4、特徴照合部5、辞書記憶部
6及び出力部7で構成される。入力部1は、入力手段と
して設けられ、ユーザがタブレット等にペンで入力した
文字データ(入力文字パターン)を記述する際のストロ
ーク上の座標点列データを入力する。特徴抽出部2は、
特徴抽出手段として設けられ、入力部1に入力された座
標点列データに含まれる時系列順に並んだ座標点を折れ
線近似することで得た各直線部分をセグメントとし、そ
の各セグメントに関する特徴情報と各セグメントの端点
である特徴点とを抽出する。特徴点対応付け部3は、特
徴点対応付け手段として設けられ、辞書に記述された各
文字の特徴情報と特徴抽出部2から抽出された特徴情報
とに基づいて辞書内の各文字を構成するセグメントと入
力文字パターンから得たセグメントとの対応付けを行
い、セグメント対応付けの距離を算出する。指定区間特
徴抽出部4は、指定区間特徴抽出手段として設けられ、
辞書が指定するストローク上の特徴点組に対応した入力
文字パターンのストローク上の特徴点組によって決定さ
れる区間の特徴情報を対応ストローク特徴として抽出す
る。特徴照合部5は、特徴照合手段として設けられ、指
定区間特徴抽出部4によって抽出された対応ストローク
特徴を辞書内の特徴情報と照合し、対応ストローク特徴
の距離を算出する。辞書記憶部6は、辞書記憶手段とし
て設けられ、前述した辞書を予め記憶する。本実施の形
態における辞書には、文字を構成するセグメントに関す
る特徴情報及び特徴点が文字毎に格納されている。出力
部7は、出力手段として設けられ、特徴照合部5で得ら
れた候補文字コードを出力する。
を表形式で示した図であり、図3は、辞書中の文字
「琢」に関する情報を表形式で示した図である。辞書記
憶部6が記憶する辞書に含まれる内容及び特徴は、文字
コード、セグメントの特徴情報として方向コード及びセ
グメント長、ストロークの外接矩形幅、ストロークの外
接矩形高さである。セグメントの方向コードとセグメン
ト長は、ストローク以外に仮想ストロークに対しても保
持する。なお、ストロークとは、ペンダウンからペンア
ップまでの座標列の単位をいうが、ここでは、このスト
ロークを実ストローク、あるストロークの終点(ペンア
ップ位置)から次のストロークの始点(ペンダウン位
置)を結ぶストロークを仮想ストロークということにす
る。実ストロークは、1ストロークにつき複数のセグメ
ントを保持可能であるが、仮想ストロークは、1ストロ
ークにつき1セグメントとする。複数のセグメントを持
つストロークの始点から終点の方向を図2、図3でかっ
こ内に表示する。また、図2、図3には図示しないが、
それぞれのセグメントが実ストロークであるか、仮想ス
トロークであるかを識別するストローク識別コードを保
持する。
理のフローチャートであり、図5は、特徴抽出部2の処
理を示したフローチャートである。図6(a)は、16
方向コードの例であり、図6(b)は、DPマッチング
に用いる値を設定したテーブルを示した図である。な
お、本実施の形態においては、辞書内の各文字を構成す
るセグメントと力文字パターンから得たセグメントとの
対応付けをDPマッチングによって行うことにする。
れを図4のフローチャートに基づいて説明する。
ペンで記入した手書き文字データの時系列順に並んだ座
標列を得る(ステップ100)。次に、特徴抽出部2
は、前処理、特徴抽出を行うが(ステップ101)、こ
の処理の詳細について図5に示したフローチャートを用
いて説明する。
る座標点間の距離を基準幅と比較し、距離が基準幅を超
えない点の間引き処理を行う(ステップ201)。本実
施の形態では、この間引き後の座標点から次の座標点す
なわち時系列順に並んだ座標点を折れ線近似することで
得た各直線部分をセグメントと呼ぶことにする。次に、
セグメントの方向コードを抽出する(ステップ20
2)。セグメント方向コードは、実ストローク以外に仮
想ストロークに対しても抽出する。ここでは、図6
(a)に示す16方向コードを用いて方向コード列を抽
出する。そして、セグメントの結合処理を行う(ステッ
プ203)。ここでは、隣接したセグメントの向きが近
似している場合、具体的には隣り合うセグメント間の方
向差が±1の場合、そのセグメント同士を結合し、結合
したセグメント方向コードを再計算する。例えば、方向
コード8のセグメントに続いて方向コード9のセグメン
トが現れた場合、これらのセグメントを結合して方向コ
ード8の単一のセグメントとする。但し、仮想ストロー
クに対しては結合処理を実行しない。そして、結合後の
セグメント長を算出する(ステップ204)。セグメン
ト長は、間引き処理に用いた基準幅の何倍であるかで表
記する。本実施の形態では、特徴情報としてセグメント
の方向を表す方向コードと長さとを抽出する。以上の特
徴抽出処理後の入力パターンを図7に示す。また、抽出
した特徴を表形式で示したものを図8に示す。
は、辞書から文字データを1つ取り出す(ステップ10
2)。この例では、図2に示した「家」の辞書を取り出
す。次に、特徴点対応付け部3は、入力パターンと辞書
内の文字「家」間においてDPマッチングによるセグメ
ントの対応付けを行う(ステップ103)。DPマッチ
ングは以下のように行う。
si(2),..si(i),..si(I)}、辞書のセグメントをSd = {sd
(1),sd(2),..sd(j),..sd(J)}とすると、
minは、最小値を求めるための関数である。ここで、 D[si(i+1)][sd(j+1)] = a[si(i+1),sd(j+1)] * (|si(i+
1)| + |sd(j+1)|) を用いる。以下、この式を数式2とする。数式1でd[i+
1][j+1]は、始点からsi(i+1),sd(j+1)までの対応付けコ
ストの累積を示す。数式2でD[si(i+1)][sd(j+1)]は、
セグメントsi(i+1)とセグメントsd(j+1)の対応付けのコ
ストを表す。a[si(i+1),sd(j+1)]は、セグメントsi(i+
1)とセグメントsd(j+1)の方向差によって決まる値であ
り、ここでは図6(b)に示す表の値を用いる。|si(i+
1)|及び|sd(j+1)|は、セグメントsi(i+1),sd(j+1)のセ
グメント長である。また、ここでは図示しないが、最小
値を与える対応付けの経路表も保持する。
を辞書とのDPマッチングのコスト(セグメント対応付
けの距離)とする。数式3内のdistは、DPマッチング
のコストを求めるための関数(distance)を意味する。な
お、このDPマッチングは、上述した「パターン認識」
(船久保 登著:共立出版)に記載されている方法を用
いている。
場合に比べ画数が減少しているので、正しい画数の文字
辞書と続け字入力パターンのストロークおよびセグメン
ト対応付けにおいて、入力パターンに対し辞書の成分が
複数対応する場合がある。しかし、通常、辞書の実スト
ロークまたは実セグメントが入力パターンの仮想ストロ
ークとなることはない。従って、辞書中の文字を構成す
る部分として表出されるストロークに対応したセグメン
トと入力文字パターンを構成するストロークのうち表出
しない部分に対応したセグメントとを対応付けないよう
にする必要がある。そこで、セグメントのDPマッチン
グの際に入力パターンの仮想ストロークと辞書の実スト
ローク成分の計算時にはこれらセグメントが対応付かな
いようにD[si(i)][sd(j)]の値に大きなペナルティ距離
を与え、これによって実際にはあり得ない対応付けを阻
止する。これにより、続け字であっても文字の誤認をよ
り確実に防止することができる。もちろん、他の方法を
用いて上記セグメントが対応付かないようにしてもよ
い。
す入力パターンの特徴の対応付けを数式1〜3及び図6
を用いて計算すると、dist dp =682を得る。
は、ステップ103で得た図示しないパスの表を用いて
辞書ストロークの始点、終点に対応する入力パターンの
座標点を得る(ステップ104)。図9に辞書内の文字
「家」のストロークの始点、終点に対応する入力パター
ンの座標点を示す。続いて、指定区間特徴抽出部4は、
入力パターンの対応点間の特徴抽出を行う(ステップ1
05)。ここでは、図9に示す「家」の各ストロークの
始点、終点に対応する点の組を特徴点組とし、この特徴
点組を構成する始点に対応する入力文字パターンの特徴
点(始点)と当該終点に対応する入力文字パターンの特
徴点(終点)とを入力文字パターンにおける特徴点組と
する。そして、この入力文字パターンにおける特徴点組
に挟まれる座標点列から、文字入力パターンの始点、終
点間の外接矩形幅、外接矩形高さ、始点から終点への方
向を求め、また、各特徴点組間の仮想ストローク(終点
に対応する点から次のストロークの始点に対応する点へ
のベクトル)の方向および距離を求める。以降、これら
の特徴を対応ストローク特徴と呼ぶことにする。その結
果を図10に示す。
特徴と入力パターンの対応ストローク特徴の照合を行う
(ステップ106)。対応ストローク特徴の照合は、例
えば、(外接矩形幅の差)+(外接矩形高さの差)+
(始点から終点への方向の差)+(仮想ストロークの方
向差)+(仮想ストロークの長さ差)を用いて計算す
る。辞書に対応する仮想ストロークが入力パターンに存
在しない場合は、その部分の計算は行わない。図2と図
10の特徴間で上記計算を行い、辞書「家」との対応ス
トローク特徴の距離dist st=93を得る。
在するかを判断する(ステップ107)。辞書内の他の
文字が存在する場合は、ステップ102に戻り、次の文
字との照合を行う。この場合は他の文字が存在し、図3
の辞書「琢」と照合する。特徴点対応付け部3は、ステ
ップ102およびステップ103を上記と同様の処理を
行い、「琢」のDPマッチングのコストdist dp =674を
得る。同様にして特徴点対応付け部3は、ステップ10
4を実行し、入力パターンが文字「琢」のストロークの
始点、終点に対応する座標点を求める。この結果を図1
1に示す。
105を実行し、辞書「家」と同様に対応ストローク特
徴を抽出する。その結果を図12に示す。そして、特徴
照合部5は、図12に示すストローク特徴と図3の辞書
を参照して計算し、ストローク特徴の距離dist st=223
を得る。
なるまで続け、文字がなくなったら出力部7は、認識結
果のソーティング作業を行う(ステップ108)。結果
のソーティングは、 dist all =α×dist dp + β×dist st (α、βは
重みの定数) をそれぞれの辞書に対し求める。以下、この式を数式4
とする。いま、α=1、β=1とすると、 dist all「家」 = 682 +93 = 775 dist all「琢」 = 674 + 223 = 897 となる。dist allを昇順にソーティングすることによっ
て「家」を第1候補文字に、「琢」を第2候補文字とす
る。最後に、出力部7は、候補文字「家」および「琢」
を出力して終了する(ステップ109)。
認識結果となる。DPマッチングのみの結果では「琢」
が候補1位であるが、対応ストローク特徴を併用して候
補文字を算出することによって正解を得ることができ
る。
Pマッチングと対応ストローク特徴を併用して認識処理
を行うことにより、字形の崩れた続け字パターンに対
し、続け字に対応した辞書データを保持しなくとも認識
することができる。
ンを全ての辞書中の文字とマッチングを行っているが、
少数の特徴を用いて大分類を行い、大分類結果に対して
DPマッチングの計算を行い、対応ストローク特徴を計
算することも可能である。また、上記例ではα=1,β
=1としてDPマッチングと対応ストローク特徴の重み
付けを等しくしたが、この値はこれに限ったものではな
い。また、最終的に距離を計算する式(数式4)は、D
Pマッチングの結果と対応ストローク特徴の結果に重み
付けをした値の和としたが、例えば対応ストローク特徴
を用いてソーティングし、第1位候補文字の距離がある
値より大きな場合、DPマッチングの結果のみを用いて
ソーティングし直し、第1位を候補文字とするなど単な
る係数としてでなく他の計算方法や条件を付加するなど
して重み付けをして正解を得るようにすることも可能で
ある。
チングを用いていたが、DPマッチングに限らず、弛緩
法、その他の方法でもかまわない。また、対応ストロー
ク特徴は、対応部分の幅、高さ、始点から終点への方
向、仮想ストロークの幅、方向を用いて説明したが、こ
の代わりに他の特徴、例えば基本ストロークを抽出して
もよい。
マッチングにおいて、文字パターンの変動によるコスト
の上昇を抑制する方法を実施の形態1で用いた図6と、
図13、図14、図15及び図16を用いて説明する。
図13は、変動の大きな部分を含む文字の例、図14
は、文字「木」のセグメント辞書の内容例、図15は、
図13(d)のセグメント特徴、そして、図16は、方
向非依存コードを用いた文字「木」のセグメント辞書を
それぞれ示した図である。
コード及びセグメント長を用いてDPマッチングを行う
場合、個人によっては入力文字のあるストロークに「は
ね」をつける場合、あるいは文字パターンのあるストロ
ークの終点と次のストロークの始点との距離が近い場合
などに、セグメントまたは仮想ストロークの方向コード
がかなり変動する場合がある。図13(a)〜(c)に
示すような文字では、図中○内の部分の仮想ストローク
の方向差は、16方向コードを用いるとパターン間で8
となり、DPマッチングのコストを増加させる原因にな
る。また、図13(d)に示すように「はね」のあるパ
ターンに対し、辞書に「はね」がない場合、DPマッチ
ングではコストが大きくなり、このようなストロークが
同一文字中に多数存在すると結果として他の文字に誤読
する場合がある。
ために、予め方向の差が個人あるいは文字パターンによ
って大きく異なる部分は方向差を計算せず、ストローク
の長さ情報だけを用いて計算するセグメントを設けるこ
とにより、この問題点を回避するようにしたことを特徴
としている。
ントの方向コード列とセグメント長を図15のように抽
出し、「木」の辞書のセグメントの方向コード列とセグ
メント長を図14のように示す。セグメント特徴のDP
マッチングの際、入力パターンの仮想ストロークと辞書
の実ストロークが対応することを禁止すると、図14、
図15では、共に画数が4画と等しいのでそれぞれ筆順
に従ってストロークを1対1に対応付けることとなる。
つまり、図15の入力ストロークの2画目の方向コード
{9,13}は、辞書の2画目の方向コード{9}と対
応付けることとなり、入力パターンの2画目の「はね」
の部分のセグメントと辞書との対応付けコストは、数式
2および図6(b)を用いて計算すると、コスト=方向
差4*セグメント長さの和=20×(7+1)=160
となる。
本実施の形態における特徴的な辞書の例を図16に示
す。本実施の形態においては、所定のセグメント、すな
わち前述したように入力される文字パターンによっては
個人差が出やすく「はね」等の方向がばらつくものと考
えられ方向コードがかなり変動する場合のあるセグメン
トに関する特徴情報に方向非依存情報を付加するように
した。本実施の形態では、方向非依存情報として方向非
依存コード番号を用いている。図6(a)の16方向コ
ードにおいて方向非依存方向コード番号を17と仮想的
に設け、図16の2画目に保持する。方向コードが17
であるセグメントのセグメント計算は、方向差を0とし
てDPマッチングを行うように定義し、図16の2画目
のストロークと図15の2画目のストロークのコスト計
算を図14の場合と同様にDPマッチングを計算し、数
式5を用いて計算する。図14の場合と同様に2画目の
対応付けの結果、辞書{9,17}と入力パターン
{9,13}に対し、{9}と{9}、{17}と{1
3}が対応付き、数式5での{17}と{13}のコス
ト計算は、方向差0×(1+1)=0となり、{9}と
{9}のコスト計算0×(7+7)=0を加えるとスト
ローク単位でのコストは、必ず一定した値0となる。こ
のように方向非依存コードを用いることにより、図14
の辞書とのコスト160に比べDPマッチングにおける
コストが小さくなり、結果として辞書との距離が小さく
なり、誤認識を防ぐことができる。
ングを行う場合、対応付けが期待通りに行われない場合
が存在する。これを図17を用いて説明する。いま、図
17(a)の折れ線と図17(b)の辞書とのDPマッ
チングを行うものとする。図17(a)は、5つのセグ
メント11〜15を有し、図17(b)は、2つのセグ
メント16,17を有するものとする。図6(a)を用
いると、それぞれのセグメントの方向コードは、セグメ
ント11が9,セグメント12が5,セグメント13が
9,セグメント14が5,セグメント15が9であり、ま
た、セグメント16は9、セグメント17は、方向非依
存コード17とする。なお、セグメント長さは全て1と
する。ここで、図17(a)及び(b)を数式1及び数
式2を用いて対応付けを行う。はじめにセグメント11
とセグメント16とを対応付け、そのコストは、方向差
0×(1+1)=0である。次に、数式1でセグメント
12とセグメント16は、方向差が4であるのでコスト
は図6(b)と数式2から20×(1+1)=40、セ
グメント11とセグメント17は、方向非依存コードと
の対応付けであるのでコスト0、セグメント12とセグ
メント17も方向非依存コードとの対応付けであるので
コスト0となり、最もコストの小さいセグメント11と
セグメント17あるいはセグメント12とセグメント1
7が対応付く。同様に計算し、残りのセグメント13,
14,15は、全てセグメント17と対応付き、コスト
もそれぞれ0となる。その結果、図17(a)及び
(b)とのセグメント対応付けのコストは、数式3を用
いて、0/(5+2)=0となる。
一であることを意味し、間違った対応付けとなる。この
ような対応付けを許してしまうと、方向非依存コードを
含むが全く形状の似ていない文字と認識されることがあ
る。これを防止するために、本実施の形態においては、
方向非依存コードが付加されたセグメントに対応付けす
る入力文字パターンから得たセグメントの数の上限を設
けるようにした。
限数を1とすると、図17(a)及び(b)とのコスト
は、セグメント11〜15とセグメント16が対応付
き、セグメント15とセグメント17が対応付く。その
コストは、(セグメント11とセグメント16のコスト
=)0+(セグメント12とセグメント16のコスト=)
40+(セグメント13とセグメント16のコスト=)
0+(セグメント14とセグメント16のコスト=)4
0+(セグメント15とセグメント16のコスト=)0
+(セグメント15とセグメント17のコスト=)0=
80となって、先程のコスト0に比べて期待通りのコス
トを得る。
17であるセグメントに基づき算出されるコストを0と
なるようにその方向差を0として「はね」等のセグメン
トを無視するようにしたが、コストを0以外の一定値と
したり、0とならないように方向差を設定するなど応用
することも可能である。
点の計算式を数式1〜3を用いたが、これに限らず他の
式を用いてもよい。
や、運筆方向が似ている文字同士に対して、セグメント
対応付けと対応ストローク特徴とを併用して文字認識処
理を行うことにより、より詳細な文字検定が可能とな
り、その結果、精度良く文字認識を行うことができる。
また、同一の筆順では、文字のどの部分を続けても、1
種類の辞書で認識可能であり、異なる続け字にそれぞれ
対応する辞書を設ける必要がない。従って、例えば、字
形の崩れた続け字パターンに対し、続け字に対応した辞
書データを保持しなくとも認識することができるように
なり、辞書作成の労力及び辞書容量の削減等付随した種
々の効果をも奏することができる。
際にセグメント対応付けと対応ストローク特徴の重み付
けを設定できるようにしたので、より正確な文字認識処
理を提供することができる。
表出されるストロークに対応したセグメントと入力文字
パターンを構成するストロークのうち表出しない部分に
対応したセグメントとを対応付けないようにしたので、
続け字であっても文字の誤認をより確実に防止すること
ができる。
けるようにしたので、セグメント対応付けの距離を算出
する際、その計算結果が「はね」「おさえ」等の文字の
部分的変動によって大きく変動しないようにすることが
できるため、結果としてより高精度な文字認識を行うこ
とができる。
ントに対応付けられる入力文字パターンから得たセグメ
ントの数の上限を設けるようにしたので、更に高精度な
文字認識を行うことができる。
の形態1を示したブロック構成図である。
れた文字「家」に関する情報の内容例を示した図であ
る。
れた文字「琢」に関する情報の内容例を示した図であ
る。
フローチャートである。
徴抽出部が行う処理を示したフローチャートである。
方向コードの例を示した図であり、(b)は、DPマッ
チングに用いる値を設定したテーブルを示した図であ
る。
特徴抽出処理を行った後のパターンを示した図である。
特徴抽出処理を行ったことにより抽出された特徴を表形
式で示した図である。
入力パターンの座標点を示した図である。
の対応ストローク特徴を示した図である。
る入力パターンの座標点を示した図である。
の対応ストローク特徴を示した図である。
例を示した図である。
容例を示した図である。
ント特徴を示した図である。
グメント辞書を示した図である。
の対応付け数の制限を説明するために用いる図である。
方式の特徴を示した図である。
構成を示したブロック構成図である。
表を示した図である。
字「石」の入力パターンを示した図である。
字「石」の入力パターンを示した図である。
である。
よる影響を示した図である。
「はね」「おさえ」を含まない辞書の例を示した図であ
る。
場合の例を示した図である。
4 指定区間特徴抽出部、5 特徴照合部、6 辞書記
憶部、7 出力部。
Claims (10)
- 【請求項1】 文字パターンの座標点列データを入力と
して、その入力文字パターンに該当した文字コードを出
力するオンライン文字認識装置において、 前記入力文字パターンを記述する際のストローク上の座
標点列データを入力する入力手段と、 前記入力手段に入力された座標点列データに含まれる時
系列順に並んだ座標点を折れ線近似することで得た各直
線部分をセグメントとし、その各セグメントに関する特
徴情報と各セグメントの端点である特徴点とを抽出する
特徴抽出手段と、 文字を構成するセグメントに関する特徴情報及び特徴点
を文字毎に格納した辞書を予め記憶する辞書記憶手段
と、 前記辞書に記述された各文字の特徴情報と前記特徴抽出
手段から抽出された特徴情報とに基づいて前記辞書内の
各文字を構成するセグメントと前記入力文字パターンか
ら得たセグメントとの対応付けを行い、セグメント対応
付けの距離を算出する特徴点対応付け手段と、 前記辞書が指定するストローク上の特徴点組に対応した
前記入力文字パターンのストローク上の特徴点組によっ
て決定される区間の特徴情報を対応ストローク特徴とし
て抽出する指定区間特徴抽出手段と、 前記指定区間特徴抽出手段によって抽出された対応スト
ローク特徴を前記辞書内の特徴情報と照合し、対応スト
ローク特徴の距離を算出する特徴照合手段と、 前記特徴照合手段で得られた候補文字コードを出力する
出力手段と、 を有し、 前記特徴照合手段は、算出した対応ストローク特徴の距
離及び前記特徴点対応付け手段によって算出されたセグ
メント対応付けの距離に基づいて前記辞書内の前記入力
文字パターンに対応した文字を特定することを特徴とす
るオンライン文字認識装置。 - 【請求項2】 前記特徴抽出手段は、隣接したセグメン
トの向きが近似しているとき単一のセグメントとして結
合することを特徴とする請求項1記載のオンライン文字
認識装置。 - 【請求項3】 前記特徴点対応付け手段は、前記辞書内
の文字の各ストロークの始点と終点に対し前記入力文字
パターンの座標点をそれぞれ1つ対応付け、 前記指定区間特徴抽出手段は、前記始点に対応する前記
入力文字パターンの特徴点と前記終点に対応する前記入
力文字パターンの特徴点とを特徴点組とすることを特徴
とする請求項1記載のオンライン文字認識装置。 - 【請求項4】 前記特徴照合手段は、前記辞書内の文字
を特定する際、前記対応ストローク特徴の距離及び前記
セグメント対応付けの距離に重み付けを行うことを特徴
とする請求項1記載のオンライン文字認識装置。 - 【請求項5】 前記各セグメントに関する情報には、各
セグメントの方向及び長さが含まれており、 前記特徴点対応付け手段は、前記特徴抽出手段が算出し
た各セグメントの方向及び長さに基づいて、対応付けし
た各セグメントのコストを算出し、そのコストに基づき
セグメント対応付けの距離を算出することを特徴とする
請求項1記載のオンライン文字認識装置。 - 【請求項6】 前記特徴点対応付け手段は、前記辞書中
の文字を構成する部分として表出されるストロークに対
応したセグメントと前記入力文字パターンを構成するス
トロークのうち表出しない部分に対応したセグメントと
を対応付けないようにすることを特徴とする請求項5記
載のオンライン文字認識装置。 - 【請求項7】 前記辞書記憶手段は、所定のセグメント
に関する特徴情報に方向非依存情報を付加した辞書を記
憶し、 前記特徴点対応付け手段は、方向非依存情報が付加され
たセグメントに基づき算出されるコストを一定値とする
ことを特徴とする請求項5記載のオンライン文字認識装
置。 - 【請求項8】 前記辞書内の文字を構成するセグメント
のうち入力される文字パターンによって方向がばらつく
ものと考えられるセグメントに関する特徴情報に方向非
依存情報を付加することを特徴とする請求項7記載のオ
ンライン文字認識装置。 - 【請求項9】 前記特徴点対応付け手段は、方向非依存
情報が付加されたセグメントに基づき算出されるコスト
を0とすることを特徴とする請求項7記載のオンライン
文字認識装置。 - 【請求項10】 前記特徴点対応付け手段は、方向非依
存情報が付加されたセグメントに対応付けする前記入力
文字パターンから得たセグメントの数の上限を設けるこ
とを特徴とする請求項7記載のオンライン文字認識装
置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP04864897A JP3657077B2 (ja) | 1997-03-04 | 1997-03-04 | オンライン文字認識装置 |
TW087100891A TW399187B (en) | 1997-03-04 | 1998-01-22 | On-line character recognizing device |
KR1019980005891A KR100301216B1 (ko) | 1997-03-04 | 1998-02-25 | 온라인문자인식장치 |
CN98105119A CN1096043C (zh) | 1997-03-04 | 1998-03-02 | 在线文字识别装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP04864897A JP3657077B2 (ja) | 1997-03-04 | 1997-03-04 | オンライン文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10247221A true JPH10247221A (ja) | 1998-09-14 |
JP3657077B2 JP3657077B2 (ja) | 2005-06-08 |
Family
ID=12809190
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP04864897A Expired - Fee Related JP3657077B2 (ja) | 1997-03-04 | 1997-03-04 | オンライン文字認識装置 |
Country Status (4)
Country | Link |
---|---|
JP (1) | JP3657077B2 (ja) |
KR (1) | KR100301216B1 (ja) |
CN (1) | CN1096043C (ja) |
TW (1) | TW399187B (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007213433A (ja) * | 2006-02-10 | 2007-08-23 | Fujitsu Ltd | 文字検索装置 |
WO2008025019A1 (en) * | 2006-08-25 | 2008-02-28 | Dynamic Representation Systems, Llc., Part I | Methods and systems for generating a symbol identification challenge for an automated agent |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109101973B (zh) * | 2018-08-06 | 2019-12-10 | 掌阅科技股份有限公司 | 文字识别方法、电子设备、存储介质 |
-
1997
- 1997-03-04 JP JP04864897A patent/JP3657077B2/ja not_active Expired - Fee Related
-
1998
- 1998-01-22 TW TW087100891A patent/TW399187B/zh not_active IP Right Cessation
- 1998-02-25 KR KR1019980005891A patent/KR100301216B1/ko not_active IP Right Cessation
- 1998-03-02 CN CN98105119A patent/CN1096043C/zh not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007213433A (ja) * | 2006-02-10 | 2007-08-23 | Fujitsu Ltd | 文字検索装置 |
WO2008025019A1 (en) * | 2006-08-25 | 2008-02-28 | Dynamic Representation Systems, Llc., Part I | Methods and systems for generating a symbol identification challenge for an automated agent |
Also Published As
Publication number | Publication date |
---|---|
KR100301216B1 (ko) | 2001-11-30 |
JP3657077B2 (ja) | 2005-06-08 |
CN1096043C (zh) | 2002-12-11 |
TW399187B (en) | 2000-07-21 |
KR19980079762A (ko) | 1998-11-25 |
CN1201207A (zh) | 1998-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0459746B1 (en) | Pattern recognition method, and apparatus therefor | |
JPH0684006A (ja) | オンライン手書き文字認識方法 | |
US5659633A (en) | Character recognition method utilizing compass directions and torsion points as features | |
JPH1166238A (ja) | 手書き文字認識方法 | |
JPH10247221A (ja) | オンライン文字認識装置 | |
JP2002063548A (ja) | 手書き文字認識方法 | |
JP3977473B2 (ja) | 手書き文字認識方法及び手書き文字認識装置 | |
JP3470028B2 (ja) | 手書き文字認識装置およびプログラム記憶媒体 | |
JP3815934B2 (ja) | 手書き文字認識装置および方法 | |
JPH09114926A (ja) | オンライン文字認識における入力文字大分類方法および装置 | |
JP2903779B2 (ja) | 文字列認識方法及びその装置 | |
JP2761679B2 (ja) | オンライン手書き文字認識装置 | |
JP3221488B2 (ja) | 検証機能付きオンライン文字認識装置 | |
JPH081660B2 (ja) | オンライン手書き図形認識装置 | |
JP3198218B2 (ja) | オンライン手書き文字認識方法 | |
JP3139701B2 (ja) | ファジィベクトルによるオンライン手書き入力文字認識方法及び装置並びにその方法を実行するための記録媒体 | |
JP3359229B2 (ja) | オンライン手書き文字認識方法 | |
JP3015137B2 (ja) | 手書文字認識装置 | |
JPH076211A (ja) | オンライン文字認識装置 | |
JP2824704B2 (ja) | 文字認識装置 | |
JP2851865B2 (ja) | 文字認識装置 | |
JP2972443B2 (ja) | 文字認識装置 | |
KR940001739B1 (ko) | 스트로크인식을 통한 온라인 필기체 문자인식방법 | |
JPH1049631A (ja) | オンライン手書き文字認識方法および装置 | |
JPH07282200A (ja) | オンライン文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040622 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040907 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041029 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20041029 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050308 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050308 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080318 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090318 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |