JP4092847B2 - 文字認識装置および文字認識方法 - Google Patents
文字認識装置および文字認識方法 Download PDFInfo
- Publication number
- JP4092847B2 JP4092847B2 JP2000091009A JP2000091009A JP4092847B2 JP 4092847 B2 JP4092847 B2 JP 4092847B2 JP 2000091009 A JP2000091009 A JP 2000091009A JP 2000091009 A JP2000091009 A JP 2000091009A JP 4092847 B2 JP4092847 B2 JP 4092847B2
- Authority
- JP
- Japan
- Prior art keywords
- point
- semi
- turbid
- muddy
- stroke
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Discrimination (AREA)
Description
【発明の属する技術分野】
本発明は手書きの濁点・半濁点付き文字を精度良く認識する文字認識装置および文字認識方法に関するものである。
【0002】
【従来の技術】
濁点・半濁点付き手書き文字の認識率を高める方法として例えば特開平10−171919(従来の技術1)がある。また、濁点・半濁点ストロークを判定する方法として例えば特開平7―129717(従来の技術2)がある。
【0003】
従来の技術1について図10を用いて説明する。図10において、100は文字イメージ入力領域、101は記号優先認識イメージ入力領域、102は小文字(仮名文字)優先認識イメージ入力領域である。従来の技術1では、濁点・半濁点付き文字の認識率を高めるために、基本文字、濁点・半濁点、句読点のそれぞれを入力するための入力枠(図10の100、101、102)を設る。筆記者は例えば濁点付き文字である“び”を入力する際には図11に示すように濁点ストロークを入力枠101内に筆記し、濁点ストローク以外の基本文字“ひ”を入力枠100内に筆記する。これにより、濁点ストロークを確実に分離し、濁点文字を認識するものである。
【0004】
次に従来の技術2について図12を用いて説明する。図12は“び”の入力パターン例を示したものである。図12の110は1行の高さ(Line_height)、111は濁点ストロークの高さ(Height)、112は濁点ストロークの縦幅(Yh)、113は濁点ストロークの横幅(Xh)を示す。従来の技術2では、α、βを1以下の定数とし,
(1)Xh < α × Line_height
(2)Yh < α × Line_height
(3)Height > β × Lineheight
の全ての条件を満たした場合にそのストロークを濁点と判定するものである。
【0005】
【発明が解決しようとする課題】
以上のように従来の技術1では、濁点・半濁点を精度良く入力するためには、濁点・半濁点用に用意された小さな記入枠内に濁点・半濁点を入力する必要があり、筆記者が文字入力する際の負担となる。また、従来例2では、濁点・半濁点の判定条件を1つでも満たさない場合には濁点・半濁点が正しく抽出できず、濁点・半濁点文字に対する認識性能が低下する課題があった。
【0006】
【発明の目的】
本発明は、上記のような問題点を解決するためになされたものであり、筆記者が普段通りに手書き入力した濁点・半濁点文字において、筆記の際の位置、形の変動が大きい濁点・半濁点の判定結果に応じて適切に辞書照合を行うことにより、濁点・半濁点文字に対する認識性能を向上させる文字認識装置を提供する。
【0007】
【課題を解決するための手段】
本発明の文字認識装置は、内部右上隅に予め設定された濁点・半濁点判定領域を有する文字枠内に記載された手書き文字の座標点情報を入力文字パターンから取得する入力手段と、前記入力手段から得られる入力座標点情報と、前記濁点・半濁点判定領域を用いて入力パターンの濁点・半濁点情報を検出し、前記入力パターンが濁点・半濁点ストロークを含む可能性の高さを判定した濁点・半濁点判定結果を出力する濁点・半濁点種別判定手段と、前記入力パターンから文字認識に必要な特徴を抽出する特徴抽出手段と、予め認識対象文字の特徴値を、濁点・半濁点ストロークを含まない文字部、含む文字部に分類して格納した特徴辞書と、前記濁点・半濁点種別判定手段の濁点・半濁点判定結果を用いて前記特徴辞書の分類部を選択し、当該選択した分類部の特徴値と前記特徴抽出手段で得られた前記入力パターンの特徴値との照合を行う辞書照合手段と、前記辞書照合手段で得られた照合結果を基に認識結果を求める認識結果生成手段と、認識結果を表示する表示手段とを備え、前記濁点・半濁点種別判定手段は、前記入力パターンが濁点・半濁点ストロークを含む可能性の高さを、「前記入力パターンが濁点・半濁点ストロークを含まない」、「前記入力パターンが濁点・半濁点ストロークを含むまたは含まない両方の可能性がある」又は「前記入力パターンが濁点・半濁点ストロークを含む」のいずれかに判定した濁点・半濁点判定結果を出力し、前記特徴抽出手段は、前記濁点・半濁点種別判定手段の濁点・半濁点判定結果が「前記入力パターンが濁点・半濁点ストロークを含む」場合は、前記入力パターンの濁点・半濁点を除いた部分のみの特徴を抽出し、前記特徴辞書は、さらに濁点・半濁点ストロークを含む文字のうち、濁点・半濁点ストロークを除いた部分の文字の特徴値分類部を有し、前記辞書照合手段は、前記濁点・半濁点種別判定手段の濁点・半濁点判定結果が「前記入力パターンが濁点・半濁点ストロークを含まない」場合は、濁点・半濁点ストロークを含まない文字部を選択し、「前記入力パターンが濁点・半濁点ストロークを含むまたは含まない両方の可能性がある」場合は、濁点・半濁点ストロークを含まない文字部と含む文字部の両方を選択し、「前記入力パターンが濁点・半濁点ストロークを含む」場合は、濁点・半濁点ストロークを含む文字のうち、濁点・半濁点ストロークを除いた部分の文字の特徴値分類部を選択して、前記特徴抽出手段で得られた前記入力パターンの特徴値との照合を行うものであって、前記文字枠は右上隅に広さの異なる複数の濁点・半濁点判定領域を有し、前記濁点・半濁点種別判定手段は、前記入力パターンの座標点情報と前記複数の濁点・半濁点判定領域から、前記入力パターンのストロークの始終点が前記複数の濁点・半濁点判定領域のいずれの領域に存在するかに基づいて、前記入力パターンが濁点・半濁点ストロークを含む可能性の高さを判定した濁点・半濁点判定結果を出力するものである。
【0011】
本発明の文字認識方法は、内部右上隅に予め設定された濁点・半濁点判定領域を有する文字枠内に記載された手書き文字の座標点情報を入力文字パターンから取得する座標点情報入力工程と、前記座標点情報入力工程から得られる入力座標点情報と、前記濁点・半濁点判定領域を用いて入力パターンの濁点・半濁点情報を検出し、前記入力パターンが濁点・半濁点ストロークを含む可能性の高さを判定した濁点・半濁点判定結果を出力する濁点・半濁点種別判定工程と、前記入力パターンから文字認識に必要な特徴を抽出する特徴抽出工程と、前記濁点・半濁点種別判定工程の濁点・半濁点判定結果を用いて、予め認識対象文字の特徴値を、濁点・半濁点ストロークを含まない文字、含む文字に分類して格納した特徴辞書の分類を選択し、当該選択した分類部の特徴値と前記特徴抽出工程で得られた前記入力パターンの特徴値との照合を行う辞書照合工程と、前記辞書照合工程で得られた照合結果を基に認識結果を求める認識結果生成工程と、前記認識結果生成工程の認識結果を表示する表示工程とを備え、前記濁点・半濁点種別判定工程では、前記入力パターンが濁点・半濁点ストロークを含む可能性の高さを、「前記入力パターンが濁点・半濁点ストロークを含まない」、「前記入力パターンが濁点・半濁点ストロークを含むまたは含まない両方の可能性がある」又は「前記入力パターンが濁点・半濁点ストロークを含む」のいずれかに判定した濁点・半濁点判定結果を出力し、前記特徴抽出工程は、前記濁点・半濁点種別判定工程の濁点・半濁点判定結果が「前記入力パターンが濁点・半濁点ストロークを含む」場合は、前記入力パターンの濁点・半濁点を除いた部分のみの特徴を抽出し、前記辞書照合工程では、さらに濁点・半濁点ストロークを含む文字のうち、濁点・半濁点ストロークを除いた部分の文字の特徴値分類部を有した前記特徴辞書から、前記濁点・半濁点種別判定工程の濁点・半濁点判定結果が「前記入力パターンが濁点・半濁点ストロークを含まない」場合は、濁点・半濁点ストロークを含まない文字部を選択し、「前記入力パターンが濁点・半濁点ストロークを含むまたは含まない両方の可能性がある」場合は、濁点・半濁点ストロークを含まない文字部と含む文字部の両方を選択し、「前記入力パターンが濁点・半濁点ストロークを含む」場合は、濁点・半濁点ストロークを含む文字のうち、濁点・半濁点ストロークを除いた部分の文字の特徴値分類部を選択して、前記特徴抽出工程で得られた前記入力パターンの特徴値との照合を行うものであって、前記文字枠は右上隅に広さの異なる複数の濁点・半濁点判定領域を有し、前記濁点・半濁点種別判定工程は、前記入力パターンの座標点情報と前記複数の濁点・半濁点判定領域から、前記入力パターンのストロークの始終点が前記複数の濁点・半濁点判定領域のいずれの領域に存在するかに基づいて、前記入力パターンが濁点・半濁点ストロークを含む可能性の高さを判定した濁点・半濁点判定結果を出力するものである。
【0014】
【発明の実施の形態】
実施の形態1.
以下、本発明の実施の形態1について図を用いて説明する。
図1は本発明に係わる文字認識装置の概略構成図である。図1において、1は筆記者がタブレット等の装置上にペンで筆記した文字列から筆順に従って座標点データ(入力パターン)を取得する入力手段、2は入力パターンの濁点・半濁点ストロークの種別を判定する濁点・半濁点種別判定手段、3は入力パターンから文字認識に必要な特徴を抽出する特徴抽出手段、4は特徴抽出手段3で抽出した入力パターンの特徴値と予め用意した辞書特徴との照合を行う辞書照合手段、5は辞書照合結果を表示するディスプレイなどの表示手段、6は濁点・半濁点種別判定手段2の結果のデータ等を格納する格納手段、7は辞書照合の結果から認識結果を生成する認識結果生成手段、8は予め用意した特徴辞書、9は濁点・半濁点付き文字の情報を格納した濁点・半濁点テーブル、10はメモリーを備え、全体を制御する制御手段である。
【0015】
図2は本実施例の全体の処理フローである。図3は濁点・半濁点種別判定のための領域を示した図である。図4は濁点・半濁点種別判定処理の処理フローである。図5は濁点・半濁点種別判定の説明のための入力パターン例である。図6は濁点または半濁点を判定するための判定条件を説明する図である。図7は特徴辞書の一例である。図8は濁点・半濁点テーブルの例である。
【0016】
次に、図2の処理フローを用いて動作の全体概要を説明する。
まず、ユーザがタブレット等の装置に文字を手書きすると、入力手段1は筆記文字の座標点データを取得し、これを入力パターンとして制御手段10に受け渡す(図2のステップS1)。次に制御手段10は、入力パターンを濁点・半濁点種別判定手段2に送り、濁点・半濁点種別判定手段2は濁点・半濁点種別の判定を行う(図2のステップS2)。
【0017】
ここで濁点・半濁点種別判定手段2の動作を図3から図5を用いて説明する。図3の14は文字枠の右上隅に予め設定した濁点・半濁点判定用の領域である。この領域に始点、終点が存在するストロークは確実に濁点・半濁点であるものとして判定される。以降この14を領域2と呼ぶ。また、図3の13は領域2の外側に予め設定したL字型で囲まれたの領域で、この領域に存在するストローク(但し始終点がこの領域または領域2に存在するもの)は濁点・半濁点である可能性が高いと判定される。以降この13を領域1と呼ぶ。また、図3の12は文字枠内の領域1、領域2を除いた領域を示しており、ストロークの始点、または終点がこの領域に存在するものは濁点・半濁点ではないと判定される。以降この領域を領域0と呼ぶ。図5はそれぞれ“ホ”、“ガ”、“バ”の入力パターン例を示している。図5の15、16、及び17、18はそれぞれ“ガ”、“バ”の濁点ストロークを示す。
【0018】
ここで、図5の“ホ”が入力パターンである場合の処理フローを説明する。図4のステップS21で、濁点・半濁点種別判定手段2は入力パターンの各ストロークのうち、始点、終点の両方の座標が領域1、または領域2に含まれるストロークを検出する。図5の“ホ”の入力パターンは、始終点の両方が領域1、または領域2に存在するストロークがないため、ステップS21でNとなりステップS22へ進む。ステップS22で濁点・半濁点種別判定手段2は図5の“ホ”の入力パターン中には濁点・半濁点ストロークは無いと判定する。
【0019】
次に図5の“ガ”が入力パターンである場合の処理フローを説明する。図4のステップS21で濁点・半濁点種別判定手段2は図5の“ガ”の入力パターン中のストローク15,16を、始終点が領域1、または領域2に存在するストロークとして検出する。するとステップS21でYとなりステップS23に進む。ステップS23で濁点・半濁点種別判定手段2はステップS21で検出したストロークのうち、領域1にかかるストロークが存在するか否かを判定する。図5の“ガ”の場合、ストローク15の終点付近が領域1にかかっているのでステップS23でYとなる。
【0020】
次に、ステップS24で濁点・半濁点種別判定手段2は始終点が領域1、または領域2に存在するストロークを第1種濁点・半濁点ストロークと判定する。すなわち、図5の“ガ”のストローク15,16を第1種濁点・半濁点ストロークであると判定する。次にステップS26で、ステップS24で判定した第1種濁点・半濁点ストロークが、濁点であるか半濁点であるかを判定する。
【0021】
ここで、濁点か半濁点かの判定は例えば次のようにして行うことができる。図6は図5の“ガ”の濁点・半濁点ストロークを示した例とする。ここで、濁点・半濁点ストロークを囲む外接矩形の(幅+高さ)に対して、濁点ストロークの始点から終点への距離(図6の符号18)が一定割合以上であれば濁点、そうでなければ半濁点と判定する。
【0022】
具体的には、直前の処理で濁点・半濁点ストロークと判定されたストローク群のうち先頭ストロークの始点Sの座標を(Sx、Sy)、最終ストロークの終点の座標Eを(Ex,Ey)とし、濁点・半濁点ストロークの外接矩形の幅をW,高さをHとすると(図6)、(|Sx-Ex| + |Sy-Ey|)/(W+H) が1/2以上であれば濁点、そうでなければ半濁点である半濁点等として判定する。なお、|・|は絶対値を表す。この例では図6の濁点ストロークの始点から終点への距離値18が外接矩形の幅(W)と高さ(H)の和(W+H)の1/2より大きいため濁点であると判定される。
【0023】
以上の処理により、図5の“ガ”の入力パターンは、ストローク15,16が第1種濁点・半濁点ストローク(濁点)と判定される。
【0024】
次に図5の“バ”が入力パターンである場合の処理フローを説明する。図4のステップS21で濁点・半濁点種別判定手段2は図5の“バ”の入力パターン中のストローク17,18を、始終点が領域1、または領域2に存在するストロークとして検出してステップS21でYとなり、次にステップS23に進む。ステップS23で濁点・半濁点種別判定手段2はステップS21で検出したストロークの内、領域1にかかるストロークが存在するか否かを判定する。図5の“バ”の場合、ストローク17,18は領域1にかからないので図4のステップS23でNとなり、ステップS25へ進む。
【0025】
ステップS25で濁点・半濁点種別判定手段2は始終点が領域2に存在するストロークを第2種濁点・半濁点ストロークと判定する。すなわち、図5の“バ”の例では、領域2に始終点が存在するストローク17,18を第2種濁点・半濁点ストロークと判定する。
【0026】
次に、ステップS26で濁点・半濁点種別判定手段2は図5の“ガ”の時と同様に図5の“バ”のストローク17,18が濁点であるか半濁点であるかを判定する。この例ではストローク17の始点からストローク18の終点までの距離がストローク17,18を囲む外接矩形の縦横の和の1/2以上であるため濁点であると判定される。以上の処理により、濁点・半濁点種別判定手段2は図5“バ”のストローク17、18を、第2種濁点・半濁点ストローク(濁点)であると判定する。
【0027】
以上述べたように、図2のステップS2の濁点・半濁点種別判定処理では、入力パターンが、(1)濁点・半濁点なしの入力パターン、(2)濁点・半濁点の可能性が高いストローク(第1種濁点・半濁点ストローク)を含む入力パターン(3)確実な濁点・半濁点ストローク(第2種濁点・半濁点ストローク)を含む入力パターンのいずれであるかを判定する。なお、濁点・半濁点種別判定手段2は、この濁点・半濁点種別判定の結果を格納手段6に格納する。
【0028】
図2の処理フローに戻り、ステップS3で特徴抽出手段3は、入力パターンから文字認識に必要な特徴を抽出する。特徴抽出は例えば電子通信情報学会論文誌、Vol.J67−A No.3、pp166−pp173、1987 「開曲線にも適用できる新しいフーリエ記述子」に記載の方法により実現する。すなわち、入力パターンを一筆書きに変換してこれを全曲率関数で表現し、P型フーリエ変換を行った結果得られたP型フーリエ係数値を特徴値として抽出する。この特徴値と予め用意した特徴辞書8の特徴値とを照合することで文字認識を行うことができる。
【0029】
なお、ステップS2で第2種濁点・半濁点ストロークと判定されたパターンの場合には、特徴抽出手段3は、該当する濁点・半濁点ストローク部分を除いた入力パターンに対して特徴抽出を行う。すなわち、図5の“バ”の入力パターンの例では、第2種濁点・半濁点ストロークと判定されたストローク17,18を除く入力パターン(“ハ”のパターン)に対して一筆書きパターンからP型フーリエ係数を求め、これを特徴値とする。ここで、特徴抽出手段3は抽出した特徴値データを格納手段6に格納する。
【0030】
これにより、確実に濁点・半濁点と判定できる文字に対しては、濁点・半濁点ストロークを除いた文字パターンに対して特徴値を抽出することができ、筆記の際のゆれ(筆記位置や筆記形状の多様性)が大きい濁点・半濁点ストロークの影響をなくして安定した特徴値を抽出することができる。
【0031】
図4のフローに戻り、入力パターンに濁点・半濁点が無い場合、すなわちステップS2の濁点・半濁点種別判定手段2で濁点・半濁点ストローク無しと判定された場合は、ステップS4でNとなりステップS5に進む。
【0032】
ステップS5で辞書照合手段4は、ステップS3で特徴抽出手段3が抽出した特徴値(格納手段6に格納されている)と、予め用意した特徴辞書8の特徴値のうち通常文字辞書の特徴値とのみ辞書照合を行う。以下辞書照合について説明する。
【0033】
図7に本実施の形態1における特徴辞書8の一例を示す。図7において、20は正解文字コード、21は濁点・半濁点種別に対応した識別番号、22は文字の特徴値を示す。
【0034】
濁点・半濁点無しの文字に対しては22にその文字を一筆書きしたパターンから求めた特徴値を格納し、21の識別番号として0を格納する。一方、濁点・半濁点付きの文字に対しては、濁点・半濁点まで含めた文字パターンを一筆書きにして求めた特徴値と、濁点・半濁点を除いた文字パターン部分を一筆書きして求めた特徴値との両方を特徴辞書として持つ。
【0035】
すなわち、文字“バ”を例にとると、濁点・半濁点まで含めた“バ”のパターンを一筆書きにして求めた特徴値を22に格納し、21の識別番号には1を格納するとともに、濁点・半濁点を除いた“ハ”パターンを一筆書きにして求めた特徴値を22に格納し、21の識別番号には2を格納しておく。なお、濁点・半濁点を除いたパターンが同一になる文字の場合には、図7の25“バ、パ”の例に示すように、正解文字20に両方の文字コードを格納しておく。
【0036】
図7の23は識別番号21が0となる文字の特徴辞書、すなわち濁点・半濁点ストロークを含まない文字の特徴辞書の集まりを示しており、これを通常文字辞書(濁点・半濁点ストロークを含まない文字部)と呼ぶ。また、24は同様に識別番号21が1となる文字の特徴辞書、すなわち濁点・半濁点ストロークを含む文字の特徴辞書の集まりを示しており、これを濁点・半濁点文字辞書(濁点・半濁点ストロークを含む文字部)と呼ぶ。さらに、25は同様に識別番号21が2となる文字の特徴辞書、すなわち、濁点・半濁点ストロークを含む文字のうち、濁点・半濁点ストロークを除いた部分の文字の特徴辞書の集まりを示しており、これを濁点・半濁点分離文字辞書(濁点・半濁点ストロークを含む文字のうち、濁点・半濁点ストロークを除いた部分の文字の特徴値分類部)と呼ぶ。
【0037】
なお、図7の22には説明のために一筆書きのパターンを記載しているが、実際は文字認識に使用するP型フーリエ係数が特徴値として格納される。また、この特徴値は予め大量の文字パターンデータベースを用いて求めたものである。
【0038】
図2のステップS5にもどり、入力パターンが濁点・半濁点無しのパターンの場合、図7の通常文字辞書(図7の23)とのみ特徴値の照合を行う。すなわち、入力パターンから抽出した特徴値と特徴辞書8に格納された特徴値22のうち、識別番号が0の通常文字辞書との特徴値とを照合し、各特徴値の差を加算したものを辞書照合の距離値とする。
【0039】
最後に図2のステップS10で制御手段10は、辞書照合の結果最も照合距離値が小さいものを認識結果として表示手段5に表示する。
【0040】
一方、入力パターンが濁点・半濁点ストロークを含む文字の場合、図2のステップS4でYとなりステップS6に進む。ここで、入力パターンが図5の“ガ”の例のように第2種濁点・半濁点ストロークを含まない場合(すなわち第1種濁点・半濁点ストロークの場合)、ステップS6でNとなりステップS9に進む。
【0041】
ステップS9では辞書照合手段4は入力パターンの特徴値と、特徴辞書8中の通常文字辞書、及び濁点・半濁点文字辞書の特徴値とを照合する。すなわち図7の23,24の特徴値と照合を行う。これは濁点・半濁点種別判定手段2の処理において第1種濁点・半濁点ストロークと判定された場合には、濁点・半濁点付きの文字の可能性があるとともに、入力パターンが通常の文字(濁点・半濁点ストローク無しの文字)である可能性もあることから、通常文字辞書と濁点・半濁点文字辞書の両者との照合を行うものである。最後にステップS10にて制御手段10が照合距離が最も小さいものを認識結果として表示手段5に表示する。
【0042】
また入力パターンが第2種濁点・半濁点ストロークを含む文字の場合、ステップS6でYになり、ステップS7に進む。ステップS7では、辞書照合手段4は入力パターンの特徴値と特徴辞書8中の濁点・半濁点分離文字辞書25とのみ辞書照合を行う。これは、入力パターンが第2種濁点・半濁点ストロークを含む場合、濁点・半濁点ストロークであると判定されたストロークを除いた文字パターン同士の特徴値を照合することで、筆記の際の揺らぎの大きい濁点・半濁点ストロークの影響を無くして精度良く辞書照合できるようにするものである。
【0043】
次にステップS8で、認識結果生成手段7は、濁点・半濁点分離文字辞書25との照合結果から最終的な認識結果を求める。具体的には図5の“バ”が入力パターンである場合には、第2種濁点・半濁点ストローク(濁点)を含む入力パターンのため、辞書照合の結果、図7の“バ、パ”の正解文字が得られる。
【0044】
ここで、図7の“バ、パ”のように正解文字が複数ある場合には、認識結果生成手段7は、濁点・半濁点テーブル9を参照し、最終的な認識結果を求める。図8は濁点・半濁点テーブル9の例を示したものである。このように濁点・半濁点テーブル9は、文字コードと、その文字が濁点を含む文字であるか、半濁点を含む文字であるかの情報を保持したものである。
【0045】
図5の“バ”の第2種濁点・半濁点ストロークが濁点であるから、図8の濁点・半濁点テーブルの“バ”、“パ”のうち濁点を含む文字であるとの情報がある“バ”が選ばれる。そして、ステップS10において制御手段10がこの結果を表示手段5に表示する。
【0046】
以上、実施の形態1について説明した。なお、本実施の形態1では、図3に示すように濁点・半濁点を判定する領域は四角形の領域としているが、これは、濁点・半濁点ストロークが正しく判定できるよう、図9に示すように三角領域、または円弧領域等と設定しても良い。
【0047】
また、本実施の形態1では、図7の特徴辞書8において、通常文字辞書と濁点・半濁点分離文字辞書の特徴値を別々に持っているが、濁点・半濁点文字から濁点・半濁点ストローク部分を分離したパターンは通常文字辞書と同様な特徴値になるため、これらを共通化するようにしてもよい。この場合、特徴辞書8のメモリサイズを縮小することができる。
【0048】
本実施の形態1では以上の工程を経ることから、確実に濁点・半濁点付き文字の場合は濁点・半濁点を除いた文字パターンを使って辞書照合できるので筆記の際の揺らぎが大きい濁点・半濁点の影響を受けず安定した認識率が得られる。
【0049】
また、濁点・半濁点付きの文字、または通常文字の両方の可能性がある場合には通常文字辞書、及び濁点・半濁点文字辞書の両方と辞書照合するので、濁点・半濁点の判定誤りがあっても正しく文字認識できる。また、確実に濁点・半濁点無し、あるいは濁点・半濁点有りの判定がされた入力パターンに対しては、それぞれ通常文字辞書とのみ、濁点・半濁点分離文字辞書とのみ辞書照合すればよいので辞書照合にかかる時間を大幅に短縮することが可能である。
【0050】
【発明の効果】
以上のように本発明では
予め認識対象文字の特徴値を格納した特徴辞書は、濁点・半濁点ストロークを含まない文字と含む文字とに夫々分類して格納し、
一方、予め設定された濁点・半濁点判定領域と入力座標点情報とで濁点・半濁点情報を検出し、この検出した濁点・半濁点情報で特徴辞書の分類を選択して辞書照合するので、濁点・半濁点付き文字に対する認識性能を向上させることができる。
濁点・半濁点情報により、確実に濁点・半濁点付き文字の場合は濁点・半濁点を除いた文字パターンを使って辞書照合できるので筆記の際の揺らぎが大きい濁点・半濁点ストロークの影響を無くして精度良く辞書照合でき、安定した認識率が得られる。
【図面の簡単な説明】
【図1】 本発明に係わる実施の形態1の概略構成図である。
【図2】 本実施の形態1の全体の処理フロー図である
【図3】 本実施の形態1の濁点・半濁点種別判定領域を示した図である。
【図4】 本実施の形態1の濁点・半濁点種別判定処理の処理フロー図である。
【図5】 本実施の形態1の濁点・半濁点種別判定の説明のための入力パターン例の説明図である。
【図6】 本実施の形態1の濁点または半濁点を判定するための判定条件を説明する図である。
【図7】 本実施の形態1の特徴辞書の説明図である。
【図8】 本実施の形態1の濁点・半濁点テーブルの説明図である。
【図9】 本発明の濁点・半濁点種別の他の判定領域を示した図である。
【図10】 従来の技術1の文字枠の説明図である。
【図11】 従来の技術1の文字枠文字を記入した説明図である。
【図12】 従来の技術2の説明図である。
【符号の説明】
1:入力手段、2:濁点・半濁点種別判定手段、3:特徴抽出手段、4:辞書照合手段、5:表示手段、6:格納手段、7:認識結果生成手段、8:特徴辞書、9:濁点・半濁点テーブル、10:制御手段。
Claims (4)
- 内部右上隅に予め設定された濁点・半濁点判定領域を有する文字枠内に記載された手書き文字の座標点情報を入力文字パターンから取得する入力手段と、
前記入力手段から得られる入力座標点情報と、前記濁点・半濁点判定領域を用いて入力パターンの濁点・半濁点情報を検出し、前記入力パターンが濁点・半濁点ストロークを含む可能性の高さを判定した濁点・半濁点判定結果を出力する濁点・半濁点種別判定手段と、
前記入力パターンから文字認識に必要な特徴を抽出する特徴抽出手段と、
予め認識対象文字の特徴値を、濁点・半濁点ストロークを含まない文字部、含む文字部に分類して格納した特徴辞書と、
前記濁点・半濁点種別判定手段の濁点・半濁点判定結果を用いて前記特徴辞書の分類部を選択し、当該選択した分類部の特徴値と前記特徴抽出手段で得られた前記入力パターンの特徴値との照合を行う辞書照合手段と、
前記辞書照合手段で得られた照合結果を基に認識結果を求める認識結果生成手段と、
認識結果を表示する表示手段とを備え、
前記濁点・半濁点種別判定手段は、前記入力パターンが濁点・半濁点ストロークを含む可能性の高さを、「前記入力パターンが濁点・半濁点ストロークを含まない」、「前記入力パターンが濁点・半濁点ストロークを含むまたは含まない両方の可能性がある」又は「前記入力パターンが濁点・半濁点ストロークを含む」のいずれかに判定した濁点・半濁点判定結果を出力し、
前記特徴抽出手段は、前記濁点・半濁点種別判定手段の濁点・半濁点判定結果が「前記入力パターンが濁点・半濁点ストロークを含む」場合は、前記入力パターンの濁点・半濁点を除いた部分のみの特徴を抽出し、
前記特徴辞書は、さらに濁点・半濁点ストロークを含む文字のうち、濁点・半濁点ストロークを除いた部分の文字の特徴値分類部を有し、
前記辞書照合手段は、前記濁点・半濁点種別判定手段の濁点・半濁点判定結果が「前記入力パターンが濁点・半濁点ストロークを含まない」場合は、濁点・半濁点ストロークを含まない文字部を選択し、「前記入力パターンが濁点・半濁点ストロークを含むまたは含まない両方の可能性がある」場合は、濁点・半濁点ストロークを含まない文字部と含む文字部の両方を選択し、「前記入力パターンが濁点・半濁点ストロークを含む」場合は、濁点・半濁点ストロークを含む文字のうち、濁点・半濁点ストロークを除いた部分の文字の特徴値分類部を選択して、前記特徴抽出手段で得られた前記入力パターンの特徴値との照合を行うものであって、
前記文字枠は右上隅に広さの異なる複数の濁点・半濁点判定領域を有し、
前記濁点・半濁点種別判定手段は、前記入力パターンの座標点情報と前記複数の濁点・半濁点判定領域から、前記入力パターンのストロークの始終点が前記複数の濁点・半濁点判定領域のいずれの領域に存在するかに基づいて、前記入力パターンが濁点・半濁点ストロークを含む可能性の高さを判定した濁点・半濁点判定結果を出力することを特徴とする文字認識装置。 - 前記濁点・半濁点種別判定手段は濁点・半濁点ストロークを囲む外接矩形の幅と高さの和に対して、濁点・半濁点ストロークの始点から終点への距離が所定割合以上であれば濁点、未満であれば半濁点と判定する構成にされたことを特徴とする請求項1に記載の文字認識装置。
- 内部右上隅に予め設定された濁点・半濁点判定領域を有する文字枠内に記載された手書き文字の座標点情報を入力文字パターンから取得する座標点情報入力工程と、
前記座標点情報入力工程から得られる入力座標点情報と、前記濁点・半濁点判定領域を用いて入力パターンの濁点・半濁点情報を検出し、前記入力パターンが濁点・半濁点ストロークを含む可能性の高さを判定した濁点・半濁点判定結果を出力する濁点・半濁点種別判定工程と、
前記入力パターンから文字認識に必要な特徴を抽出する特徴抽出工程と、
前記濁点・半濁点種別判定工程の濁点・半濁点判定結果を用いて、予め認識対象文字の特徴値を、濁点・半濁点ストロークを含まない文字、含む文字に分類して格納した特徴辞書の分類を選択し、当該選択した分類部の特徴値と前記特徴抽出工程で得られた前記入力パターンの特徴値との照合を行う辞書照合工程と、
前記辞書照合工程で得られた照合結果を基に認識結果を求める認識結果生成工程と、
前記認識結果生成工程の認識結果を表示する表示工程とを備え、
前記濁点・半濁点種別判定工程では、前記入力パターンが濁点・半濁点ストロークを含む可能性の高さを、「前記入力パターンが濁点・半濁点ストロークを含まない」、「前記入力パターンが濁点・半濁点ストロークを含むまたは含まない両方の可能性がある」又は「前記入力パターンが濁点・半濁点ストロークを含む」のいずれかに判定した濁点・半濁点判定結果を出力し、
前記特徴抽出工程は、前記濁点・半濁点種別判定工程の濁点・半濁点判定結果が「前記入力パターンが濁点・半濁点ストロークを含む」場合は、前記入力パターンの濁点・半濁点を除いた部分のみの特徴を抽出し、
前記辞書照合工程では、さらに濁点・半濁点ストロークを含む文字のうち、濁点・半濁点ストロークを除いた部分の文字の特徴値分類部を有した前記特徴辞書から、前記濁点・半濁点種別判定工程の濁点・半濁点判定結果が「前記入力パターンが濁点・半濁点ストロークを含まない」場合は、濁点・半濁点ストロークを含まない文字部を選択し、「前記入力パターンが濁点・半濁点ストロークを含むまたは含まない両方の可能性がある」場合は、濁点・半濁点ストロークを含まない文字部と含む文字部の両方を選択し、「前記入力パターンが濁点・半濁点ストロークを含む」場合は、濁点・半濁点ストロークを含む文字のうち、濁点・半濁点ストロークを除いた部分の文字の特徴値分類部を選択して、前記特徴抽出工程で得られた前記入力パターンの特徴値との照合を行う方法であって、
前記文字枠は右上隅に広さの異なる複数の濁点・半濁点判定領域を有し、
前記濁点・半濁点種別判定工程は、前記入力パターンの座標点情報と前記複数の濁点・半濁点判定領域から、前記入力パターンのストロークの始終点が前記複数の濁点・半濁点判定領域のいずれの領域に存在するかに基づいて、前記入力パターンが濁点・半濁点ストロークを含む可能性の高さを判定した濁点・半濁点判定結果を出力することを特徴とする文字認識方法。 - 前記濁点・半濁点種別判定工程は濁点・半濁点ストロークを囲む外接矩形の幅と高さの和に対して、濁点・半濁点ストロークの始点から終点への距離が所定割合以上であれば濁点、未満であれば半濁点と判定することを特徴とする請求項3に記載の文字認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000091009A JP4092847B2 (ja) | 2000-03-29 | 2000-03-29 | 文字認識装置および文字認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000091009A JP4092847B2 (ja) | 2000-03-29 | 2000-03-29 | 文字認識装置および文字認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001283155A JP2001283155A (ja) | 2001-10-12 |
JP4092847B2 true JP4092847B2 (ja) | 2008-05-28 |
Family
ID=18606528
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000091009A Expired - Fee Related JP4092847B2 (ja) | 2000-03-29 | 2000-03-29 | 文字認識装置および文字認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4092847B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2725054C1 (ru) * | 2019-08-30 | 2020-06-29 | Федеральное государственное бюджетное образовательное учреждение высшего образования "Тверской государственный технический университет" (ТвГТУ) | Способ приготовления фибробетонной смеси |
-
2000
- 2000-03-29 JP JP2000091009A patent/JP4092847B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2725054C1 (ru) * | 2019-08-30 | 2020-06-29 | Федеральное государственное бюджетное образовательное учреждение высшего образования "Тверской государственный технический университет" (ТвГТУ) | Способ приготовления фибробетонной смеси |
Also Published As
Publication number | Publication date |
---|---|
JP2001283155A (ja) | 2001-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7437001B2 (en) | Method and device for recognition of a handwritten pattern | |
EP1564675B1 (en) | Apparatus and method for searching for digital ink query | |
KR100412317B1 (ko) | 문자인식/수정방법및장치 | |
Palacios et al. | A system for processing handwritten bank checks automatically | |
JP2004139484A (ja) | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム | |
JP4280355B2 (ja) | 文字認識装置 | |
CN115311666A (zh) | 图文识别方法、装置、计算机设备及存储介质 | |
Verma et al. | A novel approach for structural feature extraction: contour vs. direction | |
JP3099797B2 (ja) | 文字認識装置 | |
JP4092847B2 (ja) | 文字認識装置および文字認識方法 | |
US7133556B1 (en) | Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition | |
Naz et al. | Challenges in baseline detection of cursive script languages | |
US11361529B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
US20180211127A1 (en) | Character recognition device, character recognition method, and character recognition program | |
JP2009259190A (ja) | 文字認識プログラムおよび文字認識装置 | |
JPH11328315A (ja) | 文字認識装置 | |
JP3457094B2 (ja) | 文字認識装置及び文字認識方法 | |
JP2803892B2 (ja) | 文字認識装置 | |
JPS6142083A (ja) | 文字認識装置 | |
JP2962911B2 (ja) | 文字認識装置 | |
JP2963474B2 (ja) | 類似文字識別方法 | |
JPH0436885A (ja) | 光学式文字読取装置 | |
WO2010150383A1 (ja) | 認識装置 | |
JPH1011542A (ja) | 文字認識装置 | |
JPS61243579A (ja) | 文字認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20040629 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041029 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070628 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070703 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070829 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071023 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080225 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110314 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110314 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110314 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120314 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130314 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130314 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140314 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |