JP3657077B2 - オンライン文字認識装置 - Google Patents
オンライン文字認識装置 Download PDFInfo
- Publication number
- JP3657077B2 JP3657077B2 JP04864897A JP4864897A JP3657077B2 JP 3657077 B2 JP3657077 B2 JP 3657077B2 JP 04864897 A JP04864897 A JP 04864897A JP 4864897 A JP4864897 A JP 4864897A JP 3657077 B2 JP3657077 B2 JP 3657077B2
- Authority
- JP
- Japan
- Prior art keywords
- segment
- feature
- stroke
- character
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/03—Arrangements for converting the position or the displacement of a member into a coded form
- G06F3/033—Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor
- G06F3/0354—Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor with detection of 2D relative movements between the device, or an operating part thereof, and a plane or surface, e.g. 2D mice, trackballs, pens or pucks
- G06F3/03545—Pens or stylus
Landscapes
- Character Discrimination (AREA)
Description
【発明の属する技術分野】
本発明は、ペンコンピュータ等で文字を手書きして入力するオンライン文字認識装置、特に続け字等に対する文字認識率の向上を図るオンライン文字認識装置に関する。
【0002】
【従来の技術】
ペンとタブレットを入力手段とするペンコンピュータに文字コードを入力するための要素技術であるオンライン文字認識において、楷書で筆記された文字は、公知である基本ストローク方式(予め数種類のストロークの形状を基本ストロークとして定義し、文字を基本ストロークの組み合わせで表現する)やその他種々の認識方式により高精度な認識が可能である。しかし、続け字に対する認識性能は楷書に比べ十分でないのが現状である。このため、従来から続け字に対応したオンライン文字認識方式の研究が行われてきた。例えば、電子通信学会論文誌J66−D No.5、第593〜600頁に記載された「選択的ストローク結合による画数・筆順に依存しないオンライン文字認識」がある。以下、これを従来例1とする。従来例1によると、入力パターンと辞書においてストローク(ペンダウンからペンアップまでの座標列の単位)数の少ない方のストロークをストローク数の多い方に1対1に対応付け、ストロークの多い方で対応付いていないストロークは、既に対応付いているストロークに選択的に結合し、結合後の辞書と入力パターンの座標点間の距離をDP(Dynamic Programing)マッチングを用いて算出し、候補文字を出力することにより続け字認識を可能にしている。DPマッチングについては、例えば「パターン認識」(船久保 登著:共立出版)の第62頁より記述があるのでここでは詳しく言及しない。従来例1では座標点をDPマッチングの特徴に用いているが、この他には図18に示す運筆に沿って等分割した座標点間の方向成分(方向コード)を用いる方法もある。
【0003】
図18では、入力パターンに対し運筆方向に沿ってストロークをあたかも一筆書きしているように全て繋げた状態にし、ストロークを適当な幅で等分割近似している。図18のそれぞれの分割点間(a1,a2,a3,a4,・・・,a21)の方向成分を、例えば図19に示す8方向コードに近似し、この方向成分をDPマッチングの特徴に用いて続け字認識を行うことも可能である。
【0004】
また、基本ストロークを用いた方法では、続け字に対応した辞書を作成して認識する方法、あるいはストロークの分離情報を辞書に持ち、入力パターンと辞書のストローク数が同一になるようにストロークを分解する方法がある。
【0005】
例えば、基本ストロークを用いた従来例として、特公平2−10473号がある。以下、これを従来例2とする。ここで、この従来例2について構成及び動作の説明をする。
【0006】
図20は、従来例2のオンライン文字認識装置の基本構成を示したブロック構成図である。図20には、座標入力装置21と、座標入力装置21の出力を入力する基本線分識別回路22と、基本線分識別回路22の出力を入力して順次出力する線分コード送出回路23と、線分コードバッファ24と、判定回路29が再認識とした場合、ストロークの線分を順次分解する線分分解回路25と、制御回路26と、線分コード送出回路23の出力と辞書記憶部28の出力を比較する比較回路27と、比較回路27の出力を入力して文字の同定を行う判定回路29と、記憶している辞書データを比較回路27に順次送出する辞書記憶部28とが示されている。
【0007】
座標入力装置21から出力される座標点の時系列情報を供給された基本線分識別回路22では、ストロークを折れ線近似し、それぞれの折れ線(セグメント)の方向成分を図19に示す8方向コードで表す。次に、図21に示す方向コード列と基本ストロークの対応表を用いて入力ストロークがどの基本ストロークに属するか決定する。
【0008】
次に、図22のパターンを用いて従来例2の動作を説明する。図22では線101,102,103,104,105の順にストロークを記入している。各ストロークを折れ線近似し、8方向コードで筆順に沿って表すと{(1),(6),(7),(1,7),(1)}となる。これを図21に示す基本ストローク表を用いて基本ストローク列{(1),(3),(4),(7),(1)}を得る。
【0009】
図22の文字パターンは、5画で記入しているので、比較回路27で5画辞書と照合処理を行い、判定回路29で候補文字判定を行う。その結果、辞書内の文字「石」と一致し、文字コードを出力する。
【0010】
次に、図23の続け字パターンで動作を説明する。図23では線106,107,108,109の順に記入している。図23の続け字パターンに対しては、同様に基本線分識別回路22で基本ストローク列{(1),(3),(4),(21)}を得る。画数が4であるので、比較回路27は、4画辞書と比較する。この場合、判定回路29は、辞書記憶部28内に「石」の4画辞書が存在しないと文字を出力することができない。そこで、制御回路26に戻り、線分分解回路25を用いてストロークを順次分解する。分解ストロークと分解ルールは、予め辞書記憶部28に登録してあり、ここでは、図24に示すルールを用いて基本ストローク(21)を(7),(1)に分割し、更に画数を5とする。この結果、入力パターンの基本ストローク列は{(1),(3),(4),(7),(1)}と修正され、比較回路27は、辞書記憶部28内の5画辞書と照合作業を行う。その結果、辞書内の文字「石」と一致し、判定回路29は、結果を出力する。
【0011】
【発明が解決しようとする課題】
しかしながら、従来例1によると、続け字の認識が可能であるが、例えば、図25に示したような辞書パターン(a)と入力パターン(b)を照合する場合、図25(c)に示したように、位置ずれあるいは変形によって対応する座標点間の距離が大きくなり、その結果、辞書との距離が大きくなって誤読しやすいという問題点があった。
【0012】
また、図18に示すようにDPマッチングに用いる特徴に方向コードを用いると、続け字認識が可能なほか図25に示したような位置ずれに対しては強くなるが、運筆方向が似ている文字同士、例えば、「伎」と「仮」、「却」と「劫」、あるいは「村」と「杖」等の文字を誤認識しやすい問題点があった。
【0013】
また、字形がくずれて辞書との対応部分の方向差が大きい文字を認識する場合、入力パターンと辞書とのDPマッチングで得られるコスト値が字形の整ったパターンに比べ大きくなり、その結果、他の文字に誤読しやすいという問題点があった。
【0014】
更に、例えば、図26に示すような「はね」「おさえ」の成分を持つ文字(a)と「はね」「おさえ」の成分を持たない(つまり、対応する成分を持たない)辞書(b)との整合の距離が大きくなり、誤読しやすいという問題点があった。これに対して、例えばストロークの始点、終点付近の折り返し成分(例えば連続する直線部の角度差が90度以下である始点または終点の線分)の方向コードを無視する、あるいは重み付けをする等の方法が考えられるが、始点、終点付近の折り返し成分がノイズであるか、文字に必要な特徴であるかは文字を意識しないと判定できない。このため、ストロークの始点、終点付近の成分を単純に無視することができないといった問題点があった。
【0015】
一方、基本ストローク等のストローク特徴を用いて認識する方法は、辞書と入力パターンの画数を一致させないと距離を計算できない問題点があり、続け字に対応するためには、予め続け字のパターンを辞書に登録するか、辞書の文字パターンで続けやすい部分を文字毎に記述する必要があった。すなわち、従来例2では、入力パターンの続けられたストロークの分解ルールが分解辞書に存在しないとストロークを分解できず、誤認識となる問題があった。これに対して全ての文字の様々な続け字ストロークに対処するには、莫大な辞書容量を必要とする問題点があった。
【0016】
更に、例えば、分解辞書を使用せずに複数の方向コードを持つストロークに対し方向コード毎に分解する方法を用いて解決しようとしても、続け書きしたストローク部分には、本来ストロークとして表出する実ストローク以外に楷書では表出しない仮想ストロークを含む場合がある。図27にこの例を示す。図27の入力パターン(a)は、辞書(b)に比べ、正しい画数では仮想ストロークとなる成分30および31を余計に持つ。このため、単に直線成分で分解した直線コード列は、実ストロークのみの特徴を持つ辞書とは必ずしも一致しないために、誤認識する場合があり、方向コードで単純に分割できないという問題点があった。
【0017】
本発明は以上のような問題を解決するためになされたものであり、その目的は、入力文字パターン中の予期せぬ成分に起因する認識率の低下を防止し、また、続け字等に対する認識率の向上を図るオンライン文字認識装置を提供することにある。
【0018】
【課題を解決するための手段】
以上のような目的を達成するために、第1の発明に係るオンライン文字認識装置は、文字パターンの座標点列データを入力として、その入力文字パターンに該当した文字コードを出力するオンライン文字認識装置において、前記入力文字パターンを記述する際の各ストローク上の座標点列データを入力する入力手段と、前記入力手段に入力された1ストローク上の座標点列データに含まれる時系列順に並んだ座標点を折れ線近似することで得た各直線部分をセグメントとし、その各セグメントの方向及び長さから得られる当該セグメントに関する特徴情報と各セグメントの端点である特徴点とを抽出する特徴抽出手段と、文字を構成するセグメントに関する特徴情報及び特徴点を文字毎に格納した辞書を予め記憶する辞書記憶手段と、前記辞書に記述された各文字の特徴情報と前記特徴抽出手段から抽出された特徴情報とに基づいて前記辞書内の各文字を構成するセグメントと前記入力文字パターンから得たセグメントとの対応付けを行い、セグメント対応付けの距離を算出する特徴点対応付け手段と、前記辞書が指定する文字のストロークの始点と終点との組で構成される特徴点組に対応した前記入力文字パターンのストローク上の特徴点組によって決定される区間に含まれるストロークの形状及び方向から得られる当該ストロークに関する特徴情報を対応ストローク特徴として抽出する指定区間特徴抽出手段と、前記指定区間特徴抽出手段によって抽出された対応ストローク特徴を前記辞書内の特徴情報と照合し、対応ストローク特徴の距離を算出する特徴照合手段と、前記特徴照合手段で得られた候補文字コードを出力する出力手段とを有し、前記特徴照合手段は、算出した対応ストローク特徴の距離及び前記特徴点対応付け手段によって算出されたセグメント対応付けの距離に基づいて前記辞書内の前記入力文字パターンに対応した文字を特定するものである。
【0019】
第2の発明に係るオンライン文字認識装置は、第1の発明において、前記特徴抽出手段は、隣接したセグメントの向きが近似しているとき単一のセグメントとして結合するものである。
【0020】
第3の発明に係るオンライン文字認識装置は、第1の発明において、前記特徴点対応付け手段は、前記辞書内の文字の各ストロークの始点と終点に対し前記入力文字パターンの座標点をそれぞれ1つ対応付け、前記指定区間特徴抽出手段は、前記始点に対応する前記入力文字パターンの特徴点と前記終点に対応する前記入力文字パターンの特徴点とを特徴点組とするものである。
【0021】
第4の発明に係るオンライン文字認識装置は、第1の発明において、前記特徴照合手段は、前記辞書内の文字を特定する際、前記対応ストローク特徴の距離及び前記セグメント対応付けの距離に重み付けを行うものである。
【0022】
第5の発明に係るオンライン文字認識装置は、第1の発明において、前記各セグメントに関する情報には、各セグメントの方向及び長さが含まれており、前記特徴点対応付け手段は、前記特徴抽出手段が算出した各セグメントの方向及び長さに基づいて、対応付けした各セグメントのコストを算出し、そのコストに基づきセグメント対応付けの距離を算出するものである。
【0023】
第6の発明に係るオンライン文字認識装置は、第5の発明において、前記特徴点対応付け手段は、前記辞書中の文字を構成する部分として表出されるストロークに対応したセグメントと前記入力文字パターンを構成するストロークのうち表出しない部分に対応したセグメントとを対応付けないようにするものである。
【0024】
第7の発明に係るオンライン文字認識装置は、第5の発明において、前記辞書記憶手段は、所定のセグメントに関する特徴情報に方向非依存情報を付加した辞書を記憶し、前記特徴点対応付け手段は、方向非依存情報が付加されたセグメントに基づき算出されるコストを一定値とするものである。
【0025】
第8の発明に係るオンライン文字認識装置は、第7の発明において、前記辞書内の文字を構成するセグメントのうち入力される文字パターンによって方向がばらつくものと考えられるセグメントに関する特徴情報に方向非依存情報を付加するものである。
【0026】
第9の発明に係るオンライン文字認識装置は、第7の発明において、前記特徴点対応付け手段は、方向非依存情報が付加されたセグメントに基づき算出されるコストを0とするものである。
【0027】
第10の発明に係るオンライン文字認識装置は、第7の発明において、前記特徴点対応付け手段は、方向非依存情報が付加されたセグメントに対応付けする前記入力文字パターンから得たセグメントの数の上限を設けるものである。
【0028】
【発明の実施の形態】
以下、図面に基づいて、本発明の好適な実施の形態について説明する。
【0029】
実施の形態1.
図1は、本発明に係るオンライン文字認識装置の実施の形態1を示したブロック構成図である。本実施の形態におけるオンライン文字認識装置は、入力部1、特徴抽出部2、特徴点対応付け部3、指定区間特徴抽出部4、特徴照合部5、辞書記憶部6及び出力部7で構成される。入力部1は、入力手段として設けられ、ユーザがタブレット等にペンで入力した文字データ(入力文字パターン)を記述する際のストローク上の座標点列データを入力する。特徴抽出部2は、特徴抽出手段として設けられ、入力部1に入力された座標点列データに含まれる時系列順に並んだ座標点を折れ線近似することで得た各直線部分をセグメントとし、その各セグメントに関する特徴情報と各セグメントの端点である特徴点とを抽出する。特徴点対応付け部3は、特徴点対応付け手段として設けられ、辞書に記述された各文字の特徴情報と特徴抽出部2から抽出された特徴情報とに基づいて辞書内の各文字を構成するセグメントと入力文字パターンから得たセグメントとの対応付けを行い、セグメント対応付けの距離を算出する。指定区間特徴抽出部4は、指定区間特徴抽出手段として設けられ、辞書が指定するストローク上の特徴点組に対応した入力文字パターンのストローク上の特徴点組によって決定される区間の特徴情報を対応ストローク特徴として抽出する。特徴照合部5は、特徴照合手段として設けられ、指定区間特徴抽出部4によって抽出された対応ストローク特徴を辞書内の特徴情報と照合し、対応ストローク特徴の距離を算出する。辞書記憶部6は、辞書記憶手段として設けられ、前述した辞書を予め記憶する。本実施の形態における辞書には、文字を構成するセグメントに関する特徴情報及び特徴点が文字毎に格納されている。出力部7は、出力手段として設けられ、特徴照合部5で得られた候補文字コードを出力する。
【0030】
図2は、辞書中の文字「家」に関する情報を表形式で示した図であり、図3は、辞書中の文字「琢」に関する情報を表形式で示した図である。辞書記憶部6が記憶する辞書に含まれる内容及び特徴は、文字コード、セグメントの特徴情報として方向コード及びセグメント長、ストロークの外接矩形幅、ストロークの外接矩形高さである。セグメントの方向コードとセグメント長は、ストローク以外に仮想ストロークに対しても保持する。なお、ストロークとは、ペンダウンからペンアップまでの座標列の単位をいうが、ここでは、このストロークを実ストローク、あるストロークの終点(ペンアップ位置)から次のストロークの始点(ペンダウン位置)を結ぶストロークを仮想ストロークということにする。実ストロークは、1ストロークにつき複数のセグメントを保持可能であるが、仮想ストロークは、1ストロークにつき1セグメントとする。複数のセグメントを持つストロークの始点から終点の方向を図2、図3でかっこ内に表示する。また、図2、図3には図示しないが、それぞれのセグメントが実ストロークであるか、仮想ストロークであるかを識別するストローク識別コードを保持する。
【0031】
図4は、本実施の形態における文字認識処理のフローチャートであり、図5は、特徴抽出部2の処理を示したフローチャートである。図6(a)は、16方向コードの例であり、図6(b)は、DPマッチングに用いる値を設定したテーブルを示した図である。なお、本実施の形態においては、辞書内の各文字を構成するセグメントと力文字パターンから得たセグメントとの対応付けをDPマッチングによって行うことにする。
【0032】
次に、本実施の形態における認識処理の流れを図4のフローチャートに基づいて説明する。
【0033】
まず、入力部1は、ユーザがタブレットにペンで記入した手書き文字データの時系列順に並んだ座標列を得る(ステップ100)。次に、特徴抽出部2は、前処理、特徴抽出を行うが(ステップ101)、この処理の詳細について図5に示したフローチャートを用いて説明する。
【0034】
特徴抽出部2は、入力座標列に対し連続する座標点間の距離を基準幅と比較し、距離が基準幅を超えない点の間引き処理を行う(ステップ201)。本実施の形態では、この間引き後の座標点から次の座標点すなわち時系列順に並んだ座標点を折れ線近似することで得た各直線部分をセグメントと呼ぶことにする。次に、セグメントの方向コードを抽出する(ステップ202)。セグメント方向コードは、実ストローク以外に仮想ストロークに対しても抽出する。ここでは、図6(a)に示す16方向コードを用いて方向コード列を抽出する。そして、セグメントの結合処理を行う(ステップ203)。ここでは、隣接したセグメントの向きが近似している場合、具体的には隣り合うセグメント間の方向差が±1の場合、そのセグメント同士を結合し、結合したセグメント方向コードを再計算する。例えば、方向コード8のセグメントに続いて方向コード9のセグメントが現れた場合、これらのセグメントを結合して方向コード8の単一のセグメントとする。但し、仮想ストロークに対しては結合処理を実行しない。そして、結合後のセグメント長を算出する(ステップ204)。セグメント長は、間引き処理に用いた基準幅の何倍であるかで表記する。本実施の形態では、特徴情報としてセグメントの方向を表す方向コードと長さとを抽出する。以上の特徴抽出処理後の入力パターンを図7に示す。また、抽出した特徴を表形式で示したものを図8に示す。
【0035】
次に、図4に戻り、特徴点対応付け部3は、辞書から文字データを1つ取り出す(ステップ102)。この例では、図2に示した「家」の辞書を取り出す。次に、特徴点対応付け部3は、入力パターンと辞書内の文字「家」間においてDPマッチングによるセグメントの対応付けを行う(ステップ103)。DPマッチングは以下のように行う。
【0036】
入力パターンのセグメントをSi = {si(1),si(2),..si(i),..si(I)}、辞書のセグメントをSd = {sd(1),sd(2),..sd(j),..sd(J)}とすると、
【数1】
を実行する。以下、この式を数式1とする。なお、関数minは、最小値を求めるための関数である。ここで、
D[si(i+1)][sd(j+1)] = a[si(i+1),sd(j+1)] * (|si(i+1)| + |sd(j+1)|)
を用いる。以下、この式を数式2とする。数式1でd[i+1][j+1]は、始点からsi(i+1),sd(j+1)までの対応付けコストの累積を示す。数式2でD[si(i+1)][sd(j+1)]は、セグメントsi(i+1)とセグメントsd(j+1)の対応付けのコストを表す。a[si(i+1),sd(j+1)]は、セグメントsi(i+1)とセグメントsd(j+1)の方向差によって決まる値であり、ここでは図6(b)に示す表の値を用いる。|si(i+1)|及び|sd(j+1)|は、セグメントsi(i+1),sd(j+1)のセグメント長である。また、ここでは図示しないが、最小値を与える対応付けの経路表も保持する。
【0037】
数式1を漸化的に計算し、最終的に
dist dp= d[I][J] / (I+J)
を計算する。以下、この式を数式3とする。この数式3を辞書とのDPマッチングのコスト(セグメント対応付けの距離)とする。数式3内のdistは、DPマッチングのコストを求めるための関数(distance)を意味する。なお、このDPマッチングは、上述した「パターン認識」(船久保 登著:共立出版)に記載されている方法を用いている。
【0038】
ここで、続け字は、正しい画数で書かれた場合に比べ画数が減少しているので、正しい画数の文字辞書と続け字入力パターンのストロークおよびセグメント対応付けにおいて、入力パターンに対し辞書の成分が複数対応する場合がある。しかし、通常、辞書の実ストロークまたは実セグメントが入力パターンの仮想ストロークとなることはない。従って、辞書中の文字を構成する部分として表出されるストロークに対応したセグメントと入力文字パターンを構成するストロークのうち表出しない部分に対応したセグメントとを対応付けないようにする必要がある。そこで、セグメントのDPマッチングの際に入力パターンの仮想ストロークと辞書の実ストローク成分の計算時にはこれらセグメントが対応付かないようにD[si(i)][sd(j)]の値に大きなペナルティ距離を与え、これによって実際にはあり得ない対応付けを阻止する。これにより、続け字であっても文字の誤認をより確実に防止することができる。もちろん、他の方法を用いて上記セグメントが対応付かないようにしてもよい。
【0039】
図2で示す「家」の辞書の特徴と図8に示す入力パターンの特徴の対応付けを数式1〜3及び図6を用いて計算すると、dist dp =682を得る。
【0040】
次に、図4において、特徴点対応付け部3は、ステップ103で得た図示しないパスの表を用いて辞書ストロークの始点、終点に対応する入力パターンの座標点を得る(ステップ104)。図9に辞書内の文字「家」のストロークの始点、終点に対応する入力パターンの座標点を示す。続いて、指定区間特徴抽出部4は、入力パターンの対応点間の特徴抽出を行う(ステップ105)。ここでは、図9に示す「家」の各ストロークの始点、終点に対応する点の組を特徴点組とし、この特徴点組を構成する始点に対応する入力文字パターンの特徴点(始点)と当該終点に対応する入力文字パターンの特徴点(終点)とを入力文字パターンにおける特徴点組とする。そして、この入力文字パターンにおける特徴点組に挟まれる座標点列から、文字入力パターンの始点、終点間の外接矩形幅、外接矩形高さ、始点から終点への方向を求め、また、各特徴点組間の仮想ストローク(終点に対応する点から次のストロークの始点に対応する点へのベクトル)の方向および距離を求める。以降、これらの特徴を対応ストローク特徴と呼ぶことにする。その結果を図10に示す。
【0041】
次に、特徴照合部5は、辞書のストローク特徴と入力パターンの対応ストローク特徴の照合を行う(ステップ106)。対応ストローク特徴の照合は、例えば、(外接矩形幅の差)+(外接矩形高さの差)+(始点から終点への方向の差)+(仮想ストロークの方向差)+(仮想ストロークの長さ差)を用いて計算する。辞書に対応する仮想ストロークが入力パターンに存在しない場合は、その部分の計算は行わない。図2と図10の特徴間で上記計算を行い、辞書「家」との対応ストローク特徴の距離dist st=93を得る。
【0042】
次に、特徴照合部5は、照合する辞書が存在するかを判断する(ステップ107)。辞書内の他の文字が存在する場合は、ステップ102に戻り、次の文字との照合を行う。この場合は他の文字が存在し、図3の辞書「琢」と照合する。特徴点対応付け部3は、ステップ102およびステップ103を上記と同様の処理を行い、「琢」のDPマッチングのコストdist dp =674を得る。同様にして特徴点対応付け部3は、ステップ104を実行し、入力パターンが文字「琢」のストロークの始点、終点に対応する座標点を求める。この結果を図11に示す。
【0043】
次に、指定区間特徴抽出部4は、ステップ105を実行し、辞書「家」と同様に対応ストローク特徴を抽出する。その結果を図12に示す。そして、特徴照合部5は、図12に示すストローク特徴と図3の辞書を参照して計算し、ストローク特徴の距離dist st=223を得る。
【0044】
以上の流れを参照する文字が辞書中になくなるまで続け、文字がなくなったら出力部7は、認識結果のソーティング作業を行う(ステップ108)。結果のソーティングは、
dist all =α×dist dp + β×dist st (α、βは重みの定数)
をそれぞれの辞書に対し求める。以下、この式を数式4とする。いま、α=1、β=1とすると、
dist all「家」 = 682 +93 = 775
dist all「琢」 = 674 + 223 = 897
となる。dist allを昇順にソーティングすることによって「家」を第1候補文字に、「琢」を第2候補文字とする。最後に、出力部7は、候補文字「家」および「琢」を出力して終了する(ステップ109)。
【0045】
上記処理を行った結果、「家」が最終的に認識結果となる。DPマッチングのみの結果では「琢」が候補1位であるが、対応ストローク特徴を併用して候補文字を算出することによって正解を得ることができる。
【0046】
以上のように、本実施の形態によれば、DPマッチングと対応ストローク特徴を併用して認識処理を行うことにより、字形の崩れた続け字パターンに対し、続け字に対応した辞書データを保持しなくとも認識することができる。
【0047】
なお、実施の形態1では、入力文字パターンを全ての辞書中の文字とマッチングを行っているが、少数の特徴を用いて大分類を行い、大分類結果に対してDPマッチングの計算を行い、対応ストローク特徴を計算することも可能である。また、上記例ではα=1,β=1としてDPマッチングと対応ストローク特徴の重み付けを等しくしたが、この値はこれに限ったものではない。また、最終的に距離を計算する式(数式4)は、DPマッチングの結果と対応ストローク特徴の結果に重み付けをした値の和としたが、例えば対応ストローク特徴を用いてソーティングし、第1位候補文字の距離がある値より大きな場合、DPマッチングの結果のみを用いてソーティングし直し、第1位を候補文字とするなど単なる係数としてでなく他の計算方法や条件を付加するなどして重み付けをして正解を得るようにすることも可能である。
【0048】
更に、セグメントの対応付けは、DPマッチングを用いていたが、DPマッチングに限らず、弛緩法、その他の方法でもかまわない。また、対応ストローク特徴は、対応部分の幅、高さ、始点から終点への方向、仮想ストロークの幅、方向を用いて説明したが、この代わりに他の特徴、例えば基本ストロークを抽出してもよい。
【0049】
実施の形態2.
次に、実施の形態1のDPマッチングにおいて、文字パターンの変動によるコストの上昇を抑制する方法を実施の形態1で用いた図6と、図13、図14、図15及び図16を用いて説明する。図13は、変動の大きな部分を含む文字の例、図14は、文字「木」のセグメント辞書の内容例、図15は、図13(d)のセグメント特徴、そして、図16は、方向非依存コードを用いた文字「木」のセグメント辞書をそれぞれ示した図である。
【0050】
実施の形態1のように、セグメントの方向コード及びセグメント長を用いてDPマッチングを行う場合、個人によっては入力文字のあるストロークに「はね」をつける場合、あるいは文字パターンのあるストロークの終点と次のストロークの始点との距離が近い場合などに、セグメントまたは仮想ストロークの方向コードがかなり変動する場合がある。図13(a)〜(c)に示すような文字では、図中○内の部分の仮想ストロークの方向差は、16方向コードを用いるとパターン間で8となり、DPマッチングのコストを増加させる原因になる。また、図13(d)に示すように「はね」のあるパターンに対し、辞書に「はね」がない場合、DPマッチングではコストが大きくなり、このようなストロークが同一文字中に多数存在すると結果として他の文字に誤読する場合がある。
【0051】
本実施の形態においては、これを防止するために、予め方向の差が個人あるいは文字パターンによって大きく異なる部分は方向差を計算せず、ストロークの長さ情報だけを用いて計算するセグメントを設けることにより、この問題点を回避するようにしたことを特徴としている。
【0052】
例えば、図13(d)のパターンのセグメントの方向コード列とセグメント長を図15のように抽出し、「木」の辞書のセグメントの方向コード列とセグメント長を図14のように示す。セグメント特徴のDPマッチングの際、入力パターンの仮想ストロークと辞書の実ストロークが対応することを禁止すると、図14、図15では、共に画数が4画と等しいのでそれぞれ筆順に従ってストロークを1対1に対応付けることとなる。つまり、図15の入力ストロークの2画目の方向コード{9,13}は、辞書の2画目の方向コード{9}と対応付けることとなり、入力パターンの2画目の「はね」の部分のセグメントと辞書との対応付けコストは、数式2および図6(b)を用いて計算すると、コスト=方向差4*セグメント長さの和=20×(7+1)=160となる。
【0053】
これに対し、方向コードの変動に対処した本実施の形態における特徴的な辞書の例を図16に示す。本実施の形態においては、所定のセグメント、すなわち前述したように入力される文字パターンによっては個人差が出やすく「はね」等の方向がばらつくものと考えられ方向コードがかなり変動する場合のあるセグメントに関する特徴情報に方向非依存情報を付加するようにした。本実施の形態では、方向非依存情報として方向非依存コード番号を用いている。図6(a)の16方向コードにおいて方向非依存方向コード番号を17と仮想的に設け、図16の2画目に保持する。方向コードが17であるセグメントのセグメント計算は、方向差を0としてDPマッチングを行うように定義し、図16の2画目のストロークと図15の2画目のストロークのコスト計算を図14の場合と同様にDPマッチングを計算し、数式5を用いて計算する。図14の場合と同様に2画目の対応付けの結果、辞書{9,17}と入力パターン{9,13}に対し、{9}と{9}、{17}と{13}が対応付き、数式5での{17}と{13}のコスト計算は、方向差0×(1+1)=0となり、{9}と{9}のコスト計算0×(7+7)=0を加えるとストローク単位でのコストは、必ず一定した値0となる。このように方向非依存コードを用いることにより、図14の辞書とのコスト160に比べDPマッチングにおけるコストが小さくなり、結果として辞書との距離が小さくなり、誤認識を防ぐことができる。
【0054】
しかし、方向非依存コードとのDPマッチングを行う場合、対応付けが期待通りに行われない場合が存在する。これを図17を用いて説明する。いま、図17(a)の折れ線と図17(b)の辞書とのDPマッチングを行うものとする。図17(a)は、5つのセグメント11〜15を有し、図17(b)は、2つのセグメント16,17を有するものとする。図6(a)を用いると、それぞれのセグメントの方向コードは、セグメント11が9,セグメント12が5,セグメント13が9,セグメント14が5,セグメント15が9であり、また、セグメント16は9、セグメント17は、方向非依存コード17とする。なお、セグメント長さは全て1とする。ここで、図17(a)及び(b)を数式1及び数式2を用いて対応付けを行う。はじめにセグメント11とセグメント16とを対応付け、そのコストは、方向差0×(1+1)=0である。次に、数式1でセグメント12とセグメント16は、方向差が4であるのでコストは図6(b)と数式2から20×(1+1)=40、セグメント11とセグメント17は、方向非依存コードとの対応付けであるのでコスト0、セグメント12とセグメント17も方向非依存コードとの対応付けであるのでコスト0となり、最もコストの小さいセグメント11とセグメント17あるいはセグメント12とセグメント17が対応付く。同様に計算し、残りのセグメント13,14,15は、全てセグメント17と対応付き、コストもそれぞれ0となる。その結果、図17(a)及び(b)とのセグメント対応付けのコストは、数式3を用いて、0/(5+2)=0となる。
【0055】
この結果は、図17(a)及び(b)が同一であることを意味し、間違った対応付けとなる。このような対応付けを許してしまうと、方向非依存コードを含むが全く形状の似ていない文字と認識されることがある。これを防止するために、本実施の形態においては、方向非依存コードが付加されたセグメントに対応付けする入力文字パターンから得たセグメントの数の上限を設けるようにした。
【0056】
例えば、方向非依存コードとの対応付け上限数を1とすると、図17(a)及び(b)とのコストは、セグメント11〜15とセグメント16が対応付き、セグメント15とセグメント17が対応付く。そのコストは、(セグメント11とセグメント16のコスト=)0+(セグメント12とセグメント16のコスト=)40+(セグメント13とセグメント16のコスト=)0+(セグメント14とセグメント16のコスト=)40+(セグメント15とセグメント16のコスト=)0+(セグメント15とセグメント17のコスト=)0=80となって、先程のコスト0に比べて期待通りのコストを得る。
【0057】
なお、上記実施の形態では、方向コードが17であるセグメントに基づき算出されるコストを0となるようにその方向差を0として「はね」等のセグメントを無視するようにしたが、コストを0以外の一定値としたり、0とならないように方向差を設定するなど応用することも可能である。
【0058】
なお、上記例では、DPマッチングの対応点の計算式を数式1〜3を用いたが、これに限らず他の式を用いてもよい。
【0059】
【発明の効果】
本発明によれば、誤認識しやすい続け字や、運筆方向が似ている文字同士に対して、セグメント対応付けと対応ストローク特徴とを併用して文字認識処理を行うことにより、より詳細な文字検定が可能となり、その結果、精度良く文字認識を行うことができる。また、同一の筆順では、文字のどの部分を続けても、1種類の辞書で認識可能であり、異なる続け字にそれぞれ対応する辞書を設ける必要がない。従って、例えば、字形の崩れた続け字パターンに対し、続け字に対応した辞書データを保持しなくとも認識することができるようになり、辞書作成の労力及び辞書容量の削減等付随した種々の効果をも奏することができる。
【0060】
また、計算により最終的な文字認識をする際にセグメント対応付けと対応ストローク特徴の重み付けを設定できるようにしたので、より正確な文字認識処理を提供することができる。
【0061】
また、辞書中の文字を構成する部分として表出されるストロークに対応したセグメントと入力文字パターンを構成するストロークのうち表出しない部分に対応したセグメントとを対応付けないようにしたので、続け字であっても文字の誤認をより確実に防止することができる。
【0062】
また、方向非依存情報を付加した辞書を設けるようにしたので、セグメント対応付けの距離を算出する際、その計算結果が「はね」「おさえ」等の文字の部分的変動によって大きく変動しないようにすることができるため、結果としてより高精度な文字認識を行うことができる。
【0063】
また、方向非依存情報が付加されたセグメントに対応付けられる入力文字パターンから得たセグメントの数の上限を設けるようにしたので、更に高精度な文字認識を行うことができる。
【図面の簡単な説明】
【図1】 本発明に係るオンライン文字認識装置の実施の形態1を示したブロック構成図である。
【図2】 実施の形態1において使用する辞書に格納された文字「家」に関する情報の内容例を示した図である。
【図3】 実施の形態1において使用する辞書に格納された文字「琢」に関する情報の内容例を示した図である。
【図4】 実施の形態1における文字認識処理を示したフローチャートである。
【図5】 実施の形態1における文字認識処理のうち特徴抽出部が行う処理を示したフローチャートである。
【図6】 (a)は実施の形態1において使用する16方向コードの例を示した図であり、(b)は、DPマッチングに用いる値を設定したテーブルを示した図である。
【図7】 実施の形態1において入力パターンに対して特徴抽出処理を行った後のパターンを示した図である。
【図8】 実施の形態1において入力パターンに対して特徴抽出処理を行ったことにより抽出された特徴を表形式で示した図である。
【図9】 辞書内の文字「家」の始点、終点に対応する入力パターンの座標点を示した図である。
【図10】 辞書内の文字「家」に対する入力パターンの対応ストローク特徴を示した図である。
【図11】 辞書内の文字「琢」の始点、終点に対応する入力パターンの座標点を示した図である。
【図12】 辞書内の文字「琢」に対する入力パターンの対応ストローク特徴を示した図である。
【図13】 文字パターンによって変動が大きい部分の例を示した図である。
【図14】 辞書内の文字「木」のセグメント辞書の内容例を示した図である。
【図15】 図13(d)に示した文字「木」のセグメント特徴を示した図である。
【図16】 方向非依存コードを用いた文字「木」のセグメント辞書を示した図である。
【図17】 実施の形態2において方向非依存コードとの対応付け数の制限を説明するために用いる図である。
【図18】 従来例1において方向コードを用いた認識方式の特徴を示した図である。
【図19】 8方向コードの例を示した図である。
【図20】 従来例2のオンライン文字認識装置の基本構成を示したブロック構成図である。
【図21】 方向コード列とストロークコードとの対応表を示した図である。
【図22】 従来例2の動作を説明するために用いる文字「石」の入力パターンを示した図である。
【図23】 従来例2の動作を説明するために用いる文字「石」の入力パターンを示した図である。
【図24】 続け字ストロークの分解ルールを示した図である。
【図25】 従来例1における距離計算時の位置ずれによる影響を示した図である。
【図26】 「はね」「おさえ」を含む入力パターンと「はね」「おさえ」を含まない辞書の例を示した図である。
【図27】 続け字によって仮想ストロークが表出する場合の例を示した図である。
【符号の説明】
1 入力部、2 特徴抽出部、3 特徴点対応付け部、4 指定区間特徴抽出部、5 特徴照合部、6 辞書記憶部、7 出力部。
Claims (10)
- 文字パターンの座標点列データを入力として、その入力文字パターンに該当した文字コードを出力するオンライン文字認識装置において、
前記入力文字パターンを記述する際の各ストローク上の座標点列データを入力する入力手段と、
前記入力手段に入力された1ストローク上の座標点列データに含まれる時系列順に並んだ座標点を折れ線近似することで得た各直線部分をセグメントとし、その各セグメントの方向及び長さから得られる当該セグメントに関する特徴情報と各セグメントの端点である特徴点とを抽出する特徴抽出手段と、
文字を構成するセグメントに関する特徴情報及び特徴点を文字毎に格納した辞書を予め記憶する辞書記憶手段と、
前記辞書に記述された各文字の特徴情報と前記特徴抽出手段から抽出された特徴情報とに基づいて前記辞書内の各文字を構成するセグメントと前記入力文字パターンから得たセグメントとの対応付けを行い、セグメント対応付けの距離を算出する特徴点対応付け手段と、
前記辞書が指定する文字のストロークの始点と終点との組で構成される特徴点組に対応した前記入力文字パターンのストローク上の特徴点組によって決定される区間に含まれるストロークの形状及び方向から得られる当該ストロークに関する特徴情報を対応ストローク特徴として抽出する指定区間特徴抽出手段と、
前記指定区間特徴抽出手段によって抽出された対応ストローク特徴を前記辞書内の特徴情報と照合し、対応ストローク特徴の距離を算出する特徴照合手段と、
前記特徴照合手段で得られた候補文字コードを出力する出力手段と、
を有し、
前記特徴照合手段は、算出した対応ストローク特徴の距離及び前記特徴点対応付け手段によって算出されたセグメント対応付けの距離に基づいて前記辞書内の前記入力文字パターンに対応した文字を特定することを特徴とするオンライン文字認識装置。 - 前記特徴抽出手段は、隣接したセグメントの向きが近似しているとき単一のセグメントとして結合することを特徴とする請求項1記載のオンライン文字認識装置。
- 前記特徴点対応付け手段は、前記辞書内の文字の各ストロークの始点と終点に対し前記入力文字パターンの座標点をそれぞれ1つ対応付け、
前記指定区間特徴抽出手段は、前記始点に対応する前記入力文字パターンの特徴点と前記終点に対応する前記入力文字パターンの特徴点とを特徴点組とすることを特徴とする請求項1記載のオンライン文字認識装置。 - 前記特徴照合手段は、前記辞書内の文字を特定する際、前記対応ストローク特徴の距離及び前記セグメント対応付けの距離に重み付けを行うことを特徴とする請求項1記載のオンライン文字認識装置。
- 前記各セグメントに関する情報には、各セグメントの方向及び長さが含まれており、
前記特徴点対応付け手段は、前記特徴抽出手段が算出した各セグメントの方向及び長さに基づいて、対応付けした各セグメントのコストを算出し、そのコストに基づきセグメント対応付けの距離を算出することを特徴とする請求項1記載のオンライン文字認識装置。 - 前記特徴点対応付け手段は、前記辞書中の文字を構成する部分として表出されるストロークに対応したセグメントと前記入力文字パターンを構成するストロークのうち表出しない部分に対応したセグメントとを対応付けないようにすることを特徴とする請求項5記載のオンライン文字認識装置。
- 前記辞書記憶手段は、所定のセグメントに関する特徴情報に方向非依存情報を付加した辞書を記憶し、
前記特徴点対応付け手段は、方向非依存情報が付加されたセグメントに基づき算出されるコストを一定値とすることを特徴とする請求項5記載のオンライン文字認識装置。 - 前記辞書内の文字を構成するセグメントのうち入力される文字パターンによって方向がばらつくものと考えられるセグメントに関する特徴情報に方向非依存情報を付加することを特徴とする請求項7記載のオンライン文字認識装置。
- 前記特徴点対応付け手段は、方向非依存情報が付加されたセグメントに基づき算出されるコストを0とすることを特徴とする請求項7記載のオンライン文字認識装置。
- 前記特徴点対応付け手段は、方向非依存情報が付加されたセグメントに対応付けする前記入力文字パターンから得たセグメントの数の上限を設けることを特徴とする請求項7記載のオンライン文字認識装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP04864897A JP3657077B2 (ja) | 1997-03-04 | 1997-03-04 | オンライン文字認識装置 |
TW087100891A TW399187B (en) | 1997-03-04 | 1998-01-22 | On-line character recognizing device |
KR1019980005891A KR100301216B1 (ko) | 1997-03-04 | 1998-02-25 | 온라인문자인식장치 |
CN98105119A CN1096043C (zh) | 1997-03-04 | 1998-03-02 | 在线文字识别装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP04864897A JP3657077B2 (ja) | 1997-03-04 | 1997-03-04 | オンライン文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10247221A JPH10247221A (ja) | 1998-09-14 |
JP3657077B2 true JP3657077B2 (ja) | 2005-06-08 |
Family
ID=12809190
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP04864897A Expired - Fee Related JP3657077B2 (ja) | 1997-03-04 | 1997-03-04 | オンライン文字認識装置 |
Country Status (4)
Country | Link |
---|---|
JP (1) | JP3657077B2 (ja) |
KR (1) | KR100301216B1 (ja) |
CN (1) | CN1096043C (ja) |
TW (1) | TW399187B (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4817297B2 (ja) * | 2006-02-10 | 2011-11-16 | 富士通株式会社 | 文字検索装置 |
US20080049969A1 (en) * | 2006-08-25 | 2008-02-28 | Jason David Koziol | Methods And Systems For Generating A Symbol Identification Challenge For An Automated Agent |
CN109101973B (zh) * | 2018-08-06 | 2019-12-10 | 掌阅科技股份有限公司 | 文字识别方法、电子设备、存储介质 |
-
1997
- 1997-03-04 JP JP04864897A patent/JP3657077B2/ja not_active Expired - Fee Related
-
1998
- 1998-01-22 TW TW087100891A patent/TW399187B/zh not_active IP Right Cessation
- 1998-02-25 KR KR1019980005891A patent/KR100301216B1/ko not_active IP Right Cessation
- 1998-03-02 CN CN98105119A patent/CN1096043C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH10247221A (ja) | 1998-09-14 |
KR100301216B1 (ko) | 2001-11-30 |
CN1096043C (zh) | 2002-12-11 |
TW399187B (en) | 2000-07-21 |
KR19980079762A (ko) | 1998-11-25 |
CN1201207A (zh) | 1998-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7369702B2 (en) | Template-based cursive handwriting recognition | |
US5285505A (en) | Method and apparatus for improving prototypes of similar characters in on-line handwriting recognition | |
US20090238461A1 (en) | System For Line Extraction In Digital Ink | |
US5732154A (en) | Handwriting and character recognition system | |
JP4817297B2 (ja) | 文字検索装置 | |
JP3657077B2 (ja) | オンライン文字認識装置 | |
JP2820221B2 (ja) | オンライン手書き文字認識方法 | |
JPH09319828A (ja) | オンライン文字認識装置 | |
JP3470028B2 (ja) | 手書き文字認識装置およびプログラム記憶媒体 | |
JP3359229B2 (ja) | オンライン手書き文字認識方法 | |
JP3198218B2 (ja) | オンライン手書き文字認識方法 | |
JPH0357509B2 (ja) | ||
JP3817281B2 (ja) | 情報処理装置及び方法 | |
JP3015137B2 (ja) | 手書文字認識装置 | |
JPH076211A (ja) | オンライン文字認識装置 | |
JPH0776980B2 (ja) | 文字認識方法 | |
KR940001739B1 (ko) | 스트로크인식을 통한 온라인 필기체 문자인식방법 | |
JP3290110B2 (ja) | 手書き文字認識装置 | |
JPH081660B2 (ja) | オンライン手書き図形認識装置 | |
JPH07107698B2 (ja) | 文字認識方法 | |
JPH07282200A (ja) | オンライン文字認識装置 | |
AU2004214901B2 (en) | Line extraction in digital ink | |
JPH0443316B2 (ja) | ||
JP2905334B2 (ja) | オンライン手書き文字認識用辞書作成方法およびオンライン手書き文字認識用辞書作成装置 | |
JPH02217981A (ja) | オンライン手書文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040622 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040907 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041029 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20041029 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050308 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050308 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080318 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090318 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |