JP3595900B2 - 手書き文字認識装置及び記録媒体 - Google Patents
手書き文字認識装置及び記録媒体 Download PDFInfo
- Publication number
- JP3595900B2 JP3595900B2 JP27398698A JP27398698A JP3595900B2 JP 3595900 B2 JP3595900 B2 JP 3595900B2 JP 27398698 A JP27398698 A JP 27398698A JP 27398698 A JP27398698 A JP 27398698A JP 3595900 B2 JP3595900 B2 JP 3595900B2
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- score
- candidates
- character
- scores
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Discrimination (AREA)
Description
【発明の属する技術分野】
本発明は、ペン入力コンピュータ、ペン操作型携帯情報端末装置(PDA:Personal Digital Asistant )等において、電子ペン(以下、ペンという)のような筆記具で筆記された手書き文字を認識して文字コードに変換する手書き文字認識装置、及び手書き文字認識のコンピュータプログラムが記録されている記録媒体に関する。
【0002】
【従来の技術】
手書き文字認識は、タブレット型の座標入力装置から所定時間毎に入力される、ペンによる手書き文字の各筆点(座標点)の時系列ベクトル情報(ストローク情報ともいう)に基づいて認識するオンライン手書き文字認識(以下、オンライン認識という)と、筆記された文字を光学的に読み取り、二次元のイメージ情報として認識するOCR(Optical Character Recognition )とに大別される。なお、OCRはオンライン認識との比較のため、オフライン手書き文字認識(以下、オフライン認識という)と呼ばれる。
【0003】
オンライン認識では、ストローク情報を認識対象とするので筆順及び画数の情報が簡単に得られ、これらをもとにした比較的簡単なパターン・マッチングで高精度の認識結果を得ることができるという特長がある。しかし、筆順の誤り、くずし書き、重ね書き、塗りつぶし等によって筆順、画数が変動した場合、変動の情報が認識辞書に登録されていない限り、手書き文字を認識できない、また変動を吸収するようなアルゴリズムは計算量が膨大になるので、実時間で手書き文字を認識できない等の欠点がある。
【0004】
一方、オフライン認識では、二次元イメージ情報を認識対象とし、筆順及び画数に依存しないため、筆順、画数に変動のある手書き文字の全体の形から文字を認識することができるという特長がある。しかし、画数が少ない文字、非漢字等ではわずかの変形が全体の形の変形につながる率が高いため、筆順及び画数の情報から容易に認識できるにもかかわらず、認識辞書に膨大な数のテンプレートが登録されていない限り、実用的な認識性能を得ることが難しいという欠点がある。
【0005】
以上のように、ストローク情報と二次元イメージ情報といった異なる特徴量に基づいて手書き文字を認識するオンライン認識とオフライン認識とでは、認識特性に相補性があるので、両者を併用して認識性能を高めようとする多くの提案が従来からなされている(特開昭55−140970号公報、特開平9−288717号公報、特開平9−179938号公報等)。
【0006】
特開昭55−140970号公報、及び特開平9−288717号公報に代表される手書き文字認識は、オフライン認識により獲得した認識候補とオンライン認識により獲得した認識候補とを統合する並列型ハイブリッド認識と呼ばれる手書き文字認識である。
【0007】
特開昭55−140970号公報に開示された並列型ハイブリッド認識では、総合判定手段がオンライン認識とオフライン認識とから出力される認識候補を統合する。その方法は、オンライン認識が出力する識別クラス(A−i)と、オフライン認識が出力する識別クラス(B−j)とを行及び列とする二次元の表に文字コードCijが記載されている場合、即ちオンライン認識及びオフライン認識のいずれでも認識候補として獲得された場合、文字コードCijを認識結果として出力する。
【0008】
また、図1は特開平9−288717号公報に開示された並列型ハイブリッド認識の手順を示すフローチャートである。
手書き文字のストローク情報を用いてオンライン認識を行う一方、ストローク情報から生成したイメージ情報の特徴データを用いてオフライン認識を行う。次にオンライン認識で獲得した認識候補とオフライン認識で獲得した認識候補との認識スコアを加算して両方の認識候補を統合し、統合結果に基づいて認識結果を出力する。
【0009】
一方、特開平9−179938号公報に代表される手書き文字認識は、直列型ハイブリッド認識と呼ばれ、図2に示すように、ストローク情報から生成したイメージ情報の特徴データを用いてオフライン認識を行い、認識候補を絞り(大分類)、これらの認識候補に対して、手書き文字のストローク情報を用いてオンライン認識を行ってオフライン認識で獲得した認識候補をさらに絞り込み(細分類)、最終的な認識結果を出力する。
【0010】
従って、オンライン認識はオフライン認識に比べて認識に長時間を要するが、直列型ハイブリッド認識では、辞書の全ての文字コードに対してオンライン認識を行う前述の並列型ハイブリッドに比べて、オンライン認識に要する時間が短縮され、これにより全体の認識時間が短縮される。
【0011】
【発明が解決しようとする課題】
前述のように、特開昭55−140970号公報に開示された並列型ハイブリッド認識では、オフライン認識とオンライン認識との両方で認識候補として獲得された文字コードだけが認識結果として出力されるので、相補正を有するオフライン認識とオンライン認識との特性が活かされない。
【0012】
また、特開平9−288717号公報に開示された並列型ハイブリッド認識のように、オンライン認識の認識候補の認識スコアとオフライン認識の認識候補の認識スコアとを加算するという単純な演算では高い認識性能を期待することはできない。例えば認識不能な筆順で筆記された場合、オフライン認識において獲得された正解の文字に対して、オンライン認識が極端に悪いスコアを返すことがある。このような場合にオフライン認識の認識スコアとオンライン認識の認識スコアとを加算すると、正解の文字の順位が大幅に下がり、認識スコアの得点が高い順に選択したいくつかの認識候補の中に正解の文字が含まれていないという虞がある。
【0013】
また、特開平9−179938号公報に代表される直列型ハイブリッド認識では、オフライン認識により絞った認識候補に対してオンライン認識を行って認識候補をさらに絞り込むので、オフライン認識により獲得した認識候補の中の得点が高い上位の認識候補が脱落する可能性があり、認識に要する時間は上述の並列型ハイブリッド認識より短縮されるが、相補正を有するオフライン認識とオンライン認識との特性が活かされない。例えば、塗りつぶし文字のように、オフライン認識は得意とするがオンライン認識が不得手とするような文字はオフライン認識で正解の文字コードが認識候補として獲得されていてもオンライン認識で脱落してしまう。
【0014】
本発明はこのような問題点を解決するためになされたものであって、オフライン認識で認識候補を絞り込むとともに、それぞれが高い認識性能を有し、また認識の得手、不得手、認識速度等といった認識特性に相補正を有するオンライン認識とオフライン認識との両方の認識特性を活かして最終的な認識結果を出力することにより、高速で高精度に手書き文字を認識する手書き文字認識装置、及び手書き文字認識のコンピュータプログラムが記録されている記録媒体の提供を目的とする。
【0015】
【課題を解決するための手段】
図3は本発明の原理図である。
ペン入力手段1は、ペンによりタブレットに手書きされていく文字の筆点の座標データを所定時間毎に入力する座標入力手段である。イメージ情報生成手段2は、ペン入力手段1により入力された筆点の時系列ベクトル情報を二次元のイメージ情報に変換する。
【0016】
オフライン認識手段3は、各文字の、文字コード及び二次元イメージの特徴情報が格納されているオフライン認識辞書31を参照し、二次元のイメージ情報をもとに認識処理を行い、文字コードと認識スコアとの対からなる複数個の認識候補を獲得する。
照合テーブル4はオフライン認識手段3が獲得した認識候補のうち、認識スコアの得点が高いN個の文字コードを格納する。
【0017】
オンライン認識手段5は、各文字の、文字コード及び時系列ベクトル情報が格納されているオンライン認識辞書51を参照し、手書き文字の筆点の時系列ベクトル情報を、照合テーブル4に格納された文字コードに対応するオンライン認識辞書51の文字コードの時系列ベクトル情報と照合して認識処理を行い、文字コードと認識スコアとの対からなる認識候補を獲得する。
【0018】
統合手段6の認識スコア正規化手段61は、オフライン認識手段3が獲得した認識候補のうち、認識スコアの得点が高い上位M個の認識候補の認識スコアと、オンライン認識手段5が獲得した認識候補の中の、認識スコアの得点が高い上位L個の認識候補の認識スコアとを正規化し、各認識候補の新しい認識スコアを決定する。
【0019】
統合手段6の候補統合手段62は、正規化後の認識スコアに基づいて、オフライン認識手段3の認識候補及びオンライン認識手段5の認識候補を統合し、認識スコアの得点が高い上位K個の認識候補を認識結果として出力する。
【0020】
第1発明の手書き文字認識装置は、手書きで入力される文字から手書き文字を認識する装置において、手書きされた文字の二次元イメージ情報をもとに、文字コード及び認識スコアを対とする複数個の認識候補を獲得する第1の認識手段と、前記第1の認識手段が獲得した複数個の認識候補の中の上位複数個の認識候補に対して、手書き文字の時系列ベクトル情報をもとに認識スコアを算出し、認識スコア及び文字コードを対とする認識候補を獲得する第2の認識手段と、第1の認識手段が獲得した複数個の認識候補の中の認識スコアの得点が高い上位複数個の認識候補の認識スコア、及び第2の認識手段が獲得した認識候補の中の認識スコアの得点が高い上位複数個の認識候補の認識スコアを正規化する認識スコア正規化手段と、正規化後の認識スコアに基づいて、複数個の認識候補を認識結果として出力する候補統合手段とを備えたことを特徴とする。
【0021】
第1発明では、手書き入力された文字の二次元のイメージ情報をもとに、第1の認識手段が認識処理を行って複数個の認識候補を獲得し、第2の認識手段は、手書き文字の筆点の時系列ベクトル情報をもとに、第1の認識手段が獲得した複数個の認識候補の中の、例えば認識スコアの得点が高い上位複数個の認識候補に対して認識処理を行って複数個の認識候補を獲得し、認識スコア正規化手段が、第1の認識手段が獲得した複数個の認識候補の中の認識スコアの得点が高い上位複数個の認識候補の認識スコアと、第2の認識手段が獲得した複数個の認識候補の中の認識スコアの得点が高い上位複数個の認識候補の認識スコアとを正規化し、候補統合手段が、正規化後の認識スコアに基づいて、複数個の認識候補を認識結果として出力する。
従って、オンライン認識及びオフライン認識の両方の認識特性の長所が活かされ、認識性能が向上するとともに、実用的に十分高速に認識結果が得られる。
【0022】
第2発明の手書き文字認識装置は、手書きで入力される文字の筆点における時系列ベクトル情報から手書き文字を認識する装置において、時系列ベクトル情報を二次元イメージ情報に変換するイメージ情報生成手段と、各文字の、文字コード及び二次元イメージの特徴情報が格納されているオフライン認識辞書と、イメージ情報生成手段により生成された二次元イメージ情報から得られる特徴情報をオフライン認識辞書の特徴情報と照合して文字コード及び認識スコアを対とする複数個の認識候補を獲得するオフライン認識手段と、オフライン認識手段が獲得した複数個の認識候補の中の認識スコアの得点が高い上位N個の認識候補の文字コードを格納する照合テーブルと、各文字の、文字コード及び時系列ベクトル情報が格納されているオンライン認識辞書と、手書き文字の時系列ベクトル情報を、照合テーブルに格納されているN個の文字コードに対応するオンライン認識辞書の時系列ベクトル情報と照合して、文字コード及び認識スコアを対とする複数個の認識候補を獲得するオンライン認識手段と、オフライン認識手段が獲得した複数個の認識候補の中の認識スコアの得点が高い上位M個(ただし、M≦N)の認識候補の認識スコア、及びオンライン認識手段が獲得した複数個の認識候補の中の認識スコアの得点が高い上位L個(ただし、L≦N)の認識候補の認識スコアを正規化する認識スコア正規化手段と、認識スコア正規化手段による正規化後の認識スコアに基づいて、オフライン認識手段が獲得したM個の認識候補、及びオンライン認識手段が獲得したL個の認識候補を統合し、認識スコアの得点が高い上位K個(ただし、K≦M+L)の認識候補を認識結果として出力する候補統合手段とを備えたことを特徴とする。
【0023】
第2発明では、イメージ情報生成手段が、筆点の時系列ベクトル情報から生成した二次元のイメージ情報をもとに、オフライン認識手段が認識処理を行って複数個の認識候補を獲得し、これらの中の認識スコアの得点が高い上位N個の認識候補を照合テーブルに格納する一方、オンライン認識手段は、手書き文字の筆点の時系列ベクトル情報をもとに、照合テーブルに格納された認識候補に対して認識処理を行って複数個の認識候補を獲得し、認識スコア正規化手段が、オフライン認識手段が獲得した認識候補の中の認識スコアの得点が高い上位M個の認識候補の認識スコアと、オンライン認識手段が獲得した認識候補の中の認識スコアの得点が高い上位L個の認識候補の認識スコアとを正規化し、候補統合手段が、認識スコアが正規化されたオフライン認識手段の認識候補及びオンライン認識手段の認識候補から認識スコアの得点が高い上位K個の認識候補を選択し、認識結果として出力する。
従って、オンライン認識及びオフライン認識の両方の認識特性の長所が活かされ、認識性能が向上するとともに、実用的に十分高速に認識結果が得られる。
【0024】
第3発明の手書き文字認識装置は、第1又は第2発明において、前記候補統合手段は、オフライン認識手段及びオンライン認識手段が同一の文字コードを有する認識候補を獲得した場合は、該認識候補の認識スコアを正規化後の得点が高い方の認識スコアと決定し、またいずれか一方が獲得した認識候補の認識スコアを正規化後の認識スコアと決定する手段を備えることを特徴とする。
【0025】
第3発明では、オフライン認識手段及びオンライン認識手段がそれぞれ獲得したM個及びL個の認識候補に同一の認識候補が含まれる場合のこの認識候補の認識スコアを、正規化後の得点が高い方の認識スコアと決定し、またいずれか一方が獲得した認識候補の認識スコアを、正規化後の認識スコアと決定する。
従って、例えば塗りつぶし文字のように、オフライン認識が得意とし、オフライン認識において認識スコアの得点が高かった認識候補が、このような文字を不得手とするオンライン認識において脱落せず、認識性能が向上する。
【0026】
第4発明の手書き文字認識装置は、第2又は第3発明において、前記オンライン認識手段は、オンライン認識辞書にオフライン認識辞書と異なる文字セットが格納されており、前記照合テーブルに格納された文字コードがオンライン認識辞書に存在しない場合、前記照合テーブルに格納された文字コードのオンライン認識による認識スコアを所定の固定値とした認識候補として獲得する手段であることを特徴とする。
【0027】
第4発明では、オンライン認識辞書にオフライン認識辞書と異なる文字セットが格納されており、例えばほとんど書く機会がないようなJIS第2水準の複雑な文字がオフライン認識の結果として照合テーブルに格納されたが、オンライン認識辞書にこの文字が認識対象として含まれていない場合、照合テーブルに格納された文字コードのオンライン認識の認識スコアを、例えば最悪の0といった固定値とする。
【0028】
従って、オンライン認識とオフライン認識との認識対象の文字セットが同一でなく、オンライン認識の認識対象の数の方が少ない場合でも、手書き文字がオフライン認識の認識対象に含まれていれば認識結果が得られる。この場合、オフライン認識のスコアが十分高ければ、オンライン認識の認識対象に含まれていなくても認識することができる。通常、オフライン認識辞書は手書き文字のパターンを収集さえすれば辞書を自動的に合成することができるのに対し、オンライン認識辞書は文字のストローク情報を人手で記述するため、例えばほとんど書く機会がないようなJIS第2水準の複雑な文字の認識辞書を作成することは非常に困難であるが、オフライン認識辞書に含まれていれば、オンライン認識辞書に含まれていなくても認識結果を得ることができて、認識対象の拡張が容易である。
【0029】
第5発明の手書き文字認識装置は、第1乃至第4発明のいずれかにおいて、前記認識スコア正規化手段は、オフライン認識手段が獲得した複数個の認識候補の中の認識スコアの得点が高い上位複数個の認識候補の認識スコアと、オフライン認識手段が獲得した複数個の認識候補の中の認識スコアの得点が高い上位m個の認識候補の認識スコアの平均値との差に所定の係数を乗じ、オンライン認識手段の認識候補が正解である場合の認識スコアの平均値に応じた所定値を加算して前記上位複数個の認識スコアを正規化する手段であることを特徴とする。
【0030】
従って、オフライン認識手段が獲得した認識候補の認識スコア及びオンライン認識手段が獲得した認識候補の認識スコアとが同レベルで比較できるように補正される。
【0031】
第6発明の記録媒体は、手書きで入力される文字の筆点における時系列ベクトル情報からコンピュータに手書き文字を認識させる装置で使用するコンピュータプログラムを記録しており、コンピュータでの読み取りが可能な記録媒体において、前記コンピュータに、時系列ベクトル情報を二次元イメージ情報に変換させるプログラムコード手段と、各文字の、文字コード及び二次元イメージの特徴情報が格納されているオフライン認識辞書と、前記コンピュータに、生成された二次元イメージ情報から得られる特徴情報をオフライン認識辞書の特徴情報と照合するオフライン認識を実行させて文字コード及び認識スコアを対とする複数個の認識候補を獲得させるプログラムコード手段と、前記コンピュータに、オフライン認識により獲得した複数個の認識候補の中の認識スコアの得点が高い上位N個の認識候補の文字コードを照合テーブルに格納させるプログラムコード手段と、各文字の、文字コード及び時系列ベクトル情報が格納されているオンライン認識辞書と、前記コンピュータに、手書き文字の時系列ベクトル情報を、照合テーブルに格納されているN個の文字コードに対応するオンライン認識辞書の時系列ベクトル情報と照合するオンライン認識を実行させて、文字コード及び認識スコアを対とする複数個の認識候補を獲得させるプログラムコード手段と、前記コンピュータに、オフライン認識により獲得した複数個の認識候補の中の認識スコアの得点が高い上位M個(ただし、M≦N)の認識候補の認識スコア、及びオンライン認識により獲得した複数個の認識候補の中の認識スコアの得点が高い上位L個(ただし、L≦N)の認識候補の認識スコアを正規化させるプログラムコード手段と、前記コンピュータに、正規化後の認識スコアに基づいて、オフライン認識により獲得したM個の認識候補、及びオンライン認識により獲得したL個の認識候補を統合させ、認識スコアの得点が高い上位K個(ただし、K≦M+L)の認識候補を認識結果として出力させるプログラムコード手段とを含むことを特徴とする。
【0032】
第6発明では、コンピュータが記録媒体のコンピュータプログラムを読み取り、筆点の時系列ベクトル情報から生成した二次元のイメージ情報をもとに、オフライン認識処理を行って複数個の認識候補を獲得し、これらのうちのN個の認識候補を照合テーブルに格納する一方、手書き文字の筆点の時系列ベクトル情報をもとに、照合テーブルに格納された認識候補に対してオンライン認識処理を行って複数個の認識候補を獲得し、オフライン認識で獲得した認識候補の中のM個の認識候補の認識スコアと、オンライン認識で獲得した認識候補の中のL個の認識候補の認識スコアとを正規化し、認識スコアが正規化されたオフライン認識の認識候補及びオンライン認識の認識候補からK個の認識候補を選択し、認識結果として出力する。
従って、手書き文字認識のコンピュータプログラムを、CD−ROM、MO等の可搬型記録媒体、又は回線経由で提供することができる。
【0033】
【発明の実施の形態】
次に、本発明の手書き文字認識装置の具体的な実施形態について、以下に説明する。なお、装置の構成は図3の原理図と同様である。
手書きで筆記された一文字分のストローク情報が座標入力装置であるペン入力手段1により入力されると、イメージ情報生成手段2は、ストローク情報をビットマップ情報に展開し、手書き文字イメージ情報を生成する。
図4はイメージ情報生成の概念図である。
【0034】
オフライン認識手段3は、イメージ情報生成手段2が生成したイメージ情報からイメージ特徴を抽出し、オフライン認識辞書31と照合して得た認識スコア及び文字コードの対からなる複数個の認識候補を獲得する。これらの認識候補のうち、認識スコアの得点が高い上位N個が選択され、これらの文字コードが照合テーブル4に格納される。
【0035】
次に、オンライン認識手段5は、一文字分のストローク情報を、照合テーブル4に格納された文字コードに対応するオンライン認識辞書51のストローク情報と照合して得た認識スコア及び文字コードの対からなる複数個の認識候補を獲得する。
統合手段6は、オフライン認識手段3が獲得した複数個の認識候補のうち、認識スコアの得点が高い上位M個の認識候補を選択し、またオンライン認識手段5が獲得した複数個の認識候補のうち、認識スコアの得点が高い上位L個の認識候補を選択する。
【0036】
なお、オンライン認識手段5は、オフライン認識辞書31とオンライン認識辞書51とに異なる文字セットが格納されており、例えばほとんど書く機会がないようなJIS第2水準の複雑な文字がオフライン認識の結果として照合テーブル4に格納されたが、オンライン認識辞書51にこの文字が認識対象として含まれていない場合、照合テーブル4に格納された文字コードの認識スコアを、例えば最悪の0といった固定値としてオンライン認識の認識候補として出力する。
【0037】
統合手段6の認識スコア正規化手段61は、M個のオフライン認識の認識候補と、L個のオンライン認識の認識候補とのいずれか一方の認識スコア、又は両方の認識スコアに対して所定のアルゴリズムで演算を行って認識スコアを正規化し、オフライン認識手段3及びオンライン認識手段5の認識スコアとを同レベルで比較できるように補正する。
【0038】
統合手段6の候補統合手段62は、正規化された認識スコアをもとに、オフライン認識及びオンライン認識の認識候補を統合し、認識スコアの得点が高い上位K個の認識候補を最終的な認識結果として出力する。
このとき、候補統合手段62は、オフライン認識手段3とオンライン認識手段5との両方から同一の文字コードの認識候補の出力がある場合は、正規化後の得点が高い方の認識スコアを採用する。
なお、以上のようにして得られた認識結果の認識精度を高めるために、文脈処理を行って補正してもよい。
【0039】
【実施例】
以下に、本発明の手書き文字認識装置を使用した手書き文字認識の具体例について説明する。
オフライン認識としては株式会社富士通研究所で開発された288次元特徴ベクトルによる認識方式(鎌田、他:「圧縮特徴と原特徴を併用した高速かつ高精度な文字認識方式」:信学技報、PRU96−205(1997−03 ))を用いる。このオフライン認識は、領域を12×6分割し、縦横斜め等の4方向からスキャンして得られる288次元の特徴ベクトルを基に認識処理を行うもので、コンパクトな辞書で高速に認識処理を行うことができる。なお、イメージ情報生成では、文字サイズの正規化後、各ストロークの幅を1とした2値化処理を行っている。
【0040】
一方、オンライン認識としては、東京農工大で開発された続け字認識アルゴリズム「線型時間伸縮マッチング法」(秋山、中川:「ストロークのつながりに寛容なオンライン手書き文字認識」:画像の認識・理解シンポジウム(MIRU’94 )I、145−152 (1994.07 ))を用いる。このオンライン認識では、画数が変動した続け文字であっても、筆順が辞書に登録されている範囲であれば高精度に認識処理を行うことができる。認識辞書は部首毎に構造化・共有されているため非常にコンパクトであるが、計算時間がかかるため、通常、なんらかの大分類機構で100〜数百程度に絞り込んだ後で使用すると効果的である。
【0041】
本実施例では、オフライン認識の結果、上位100位までの認識候補の文字コードを照合テーブルに格納する。オンライン認識では、照合テーブルに格納された文字コードの辞書パターンを順次読み出し、前述の「線型時間伸縮マッチング法」を実施する。なお、照合テーブルに格納された文字コードが辞書にない場合は照合処理を行わず、認識スコアを固定値(例えば最悪値0)とする。
【0042】
本実施例では、以上のような照合処理で得られた認識候補のうち、上位10位をオンライン認識の認識候補として出力する。
同様に、オフライン認識の結果として得られた上位10位を認識候補として出力する。
認識スコア正規化は、以下のようなアルゴリズムで認識スコアを正規化する。
【0043】
(1) オンライン認識の認識スコアはそのままの値を正規化後の認識スコアとして使用する。
(2) オフライン認識の認識候補を認識スコアの得点が高い順にソートし、第i番目の認識候補の認識スコアをdi とする。以下の式で示すように、上位5位の認識候補の認識スコアの平均mを算出し、正規化後の認識スコアDi を決定する。
【0044】
【数1】
【0045】
ここで、パラメータα、βは、認識実験等により最適の値が決定される数値であって、本実施例ではα=0.7 、β=680 とする。βの値は、オンライン認識が正解であった場合の平均的な認識スコアよりやや小さい値である。
候補統合では、認識スコアを上述のアルゴリズムによって正規化した後、両認識により同一の文字コードが認識候補として獲得されている場合は、得点が高い方の認識スコアを選択し、認識候補が一方の認識でしか得られていない場合は、それぞれの認識スコアを最終的な認識スコアとして決定する。以上の結果、認識スコアの得点が高い上位10個を認識結果として出力する。
【0046】
表1は、公開されている認識評価データに対して本実施例の手書き文字認識を実行した時の認識実験結果を示している。なお、認識評価データとしては、東京農工大の中川研究室が中心になって収集したオンライン手書きDB(TUAT Nakagawa Lab.HANDS−kuchibue−97−01 )より、mdb0051 、mdb0055 、mdb0066 の中の非漢字を除いたJIS第一水準の漢字( 16929字)を用いた。
【0047】
【表1】
【0048】
表1から明らかなように、本実施例では、一位認識(正解の文字が一位に存在する場合だけ正解とする)、累積認識(正解の文字が一位か二位、一位から三位までのいずれか、一位から五位までのいずれか、又は一位から十位までのいずれかに存在すれば正解とする)のいずれにおいても認識性能が大幅に向上している。
【0049】
なお、照合テーブルに格納する文字コードの数を100としたが、文字コードの数はこれより多くてもよい。文字コードの数を多くすれば計算量は増加するが、一般的に認識性能は向上する。文字コード数を100とした時の認識速度は、JIS第一水準+非漢字の合計3345字の認識対象に対し、Pentium Pro 266 MHz のCPUで、平均33ms/文字であった。
【0050】
本発明の手書き文字認識装置は、上述したような手書き文字認識のコンピュータプログラムを、磁気ディスク,CD−ROM等の可搬型記録媒体、コンピュータと無線又は有線にてプログラムの通信が可能な、例えばセンタに備えられた回線先メモリ、あるいは、コンピュータに備えつけられたRAM、ハードディスク等の処理装置側メモリ等の記録媒体からロードする。
【0051】
【発明の効果】
以上のように、本発明の手書き文字認識装置及び記録媒体は、オフライン認識で認識候補を絞り込むとともに、それぞれが高い認識性能を有し、また認識の得手不得手、認識速度等といった認識特性に相補正を有するオンライン認識とオフライン認識との両方の認識特性を活かして最終的な認識結果を出力するので、高速で高精度に手書き文字を認識するという優れた効果を奏する。
【図面の簡単な説明】
【図1】並列型ハイブリッド認識手順のフローチャートである。
【図2】直列型ハイブリッド認識手順のフローチャートである。
【図3】本発明の原理図である。
【図4】イメージ情報生成の概念図である。
【符号の説明】
1 ペン入力手段
2 イメージ情報生成手段
3 オフライン認識手段
31 オフライン認識辞書
4 照合テーブル
5 オンライン認識手段
51 オンライン認識辞書
6 統合手段
61 認識スコア正規化手段
62 候補統合手段
Claims (6)
- 手書きで入力される文字から手書き文字を認識する装置において、
手書きされた文字の二次元イメージ情報をもとに、文字コード及び認識スコアを対とする複数個の認識候補を獲得する第1の認識手段と、
前記第1の認識手段が獲得した複数個の認識候補の中の上位複数個の認識候補に対して、手書き文字の時系列ベクトル情報をもとに認識スコアを算出し、認識スコア及び文字コードを対とする認識候補を獲得する第2の認識手段と、
第1の認識手段が獲得した複数個の認識候補の中の認識スコアの得点が高い上位複数個の認識候補の認識スコア、及び第2の認識手段が獲得した認識候補の中の認識スコアの得点が高い上位複数個の認識候補の認識スコアを正規化する認識スコア正規化手段と、
正規化後の認識スコアに基づいて、複数個の認識候補を認識結果として出力する候補統合手段と
を備えたことを特徴とする手書き文字認識装置。 - 手書きで入力される文字の筆点における時系列ベクトル情報から手書き文字を認識する装置において、
時系列ベクトル情報を二次元イメージ情報に変換するイメージ情報生成手段と、
各文字の、文字コード及び二次元イメージの特徴情報が格納されているオフライン認識辞書と、
イメージ情報生成手段により生成された二次元イメージ情報から得られる特徴情報をオフライン認識辞書の特徴情報と照合して文字コード及び認識スコアを対とする複数個の認識候補を獲得するオフライン認識手段と、
オフライン認識手段が獲得した複数個の認識候補の中の認識スコアの得点が高い上位N個の認識候補の文字コードを格納する照合テーブルと、
各文字の、文字コード及び時系列ベクトル情報が格納されているオンライン認識辞書と、
手書き文字の時系列ベクトル情報を、照合テーブルに格納されているN個の文字コードに対応するオンライン認識辞書の時系列ベクトル情報と照合して、文字コード及び認識スコアを対とする複数個の認識候補を獲得するオンライン認識手段と、
オフライン認識手段が獲得した複数個の認識候補の中の認識スコアの得点が高い上位M個(ただし、M≦N)の認識候補の認識スコア、及びオンライン認識手段が獲得した複数個の認識候補の中の認識スコアの得点が高い上位L個(ただし、L≦N)の認識候補の認識スコアを正規化する認識スコア正規化手段と、
認識スコア正規化手段による正規化後の認識スコアに基づいて、オフライン認識手段が獲得したM個の認識候補、及びオンライン認識手段が獲得したL個の認識候補を統合し、認識スコアの得点が高い上位K個(ただし、K≦M+L)の認識候補を認識結果として出力する候補統合手段と
を備えたことを特徴とする手書き文字認識装置。 - 前記候補統合手段は、オフライン認識手段及びオンライン認識手段が同一の文字コードを有する認識候補を獲得した場合は、該認識候補の認識スコアを正規化後の得点が高い方の認識スコアと決定し、またいずれか一方が獲得した認識候補の認識スコアを正規化後の認識スコアと決定する手段を備える請求項1又は2記載の手書き文字認識装置。
- 前記オンライン認識手段は、オンライン認識辞書にオフライン認識辞書と異なる文字セットが格納されており、前記照合テーブルに格納された文字コードがオンライン認識辞書に存在しない場合、前記照合テーブルに格納された文字コードのオンライン認識による認識スコアを所定の固定値とした認識候補として獲得する手段である請求項2又は3記載の手書き文字認識装置。
- 前記認識スコア正規化手段は、オフライン認識手段が獲得した複数個の認識候補の中の認識スコアの得点が高い上位複数個の認識候補の認識スコアと、オフライン認識手段が獲得した複数個の認識候補の中の認識スコアの得点が高い上位m個の認識候補の認識スコアの平均値との差に所定の係数を乗じ、オンライン認識手段の認識候補が正解である場合の認識スコアの平均値に応じた所定値を加算して前記上位複数個の認識スコアを正規化する手段である請求項1乃至4のいずれかに記載の手書き文字認識装置。
- 手書きで入力される文字の筆点における時系列ベクトル情報からコンピュータに手書き文字を認識させる装置で使用するコンピュータプログラムを記録しており、コンピュータでの読み取りが可能な記録媒体において、
前記コンピュータに、時系列ベクトル情報を二次元イメージ情報に変換させるプログラムコード手段と、
各文字の、文字コード及び二次元イメージの特徴情報が格納されているオフライン認識辞書と、
前記コンピュータに、生成された二次元イメージ情報から得られる特徴情報をオフライン認識辞書の特徴情報と照合するオフライン認識を実行させて文字コード及び認識スコアを対とする複数個の認識候補を獲得させるプログラムコード手段と、
前記コンピュータに、オフライン認識により獲得した複数個の認識候補の中の認識スコアの得点が高い上位N個の認識候補の文字コードを照合テーブルに格納させるプログラムコード手段と、
各文字の、文字コード及び時系列ベクトル情報が格納されているオンライン認識辞書と、
前記コンピュータに、手書き文字の時系列ベクトル情報を、照合テーブルに格納されているN個の文字コードに対応するオンライン認識辞書の時系列ベクトル情報と照合するオンライン認識を実行させて、文字コード及び認識スコアを対とする複数個の認識候補を獲得させるプログラムコード手段と、
前記コンピュータに、オフライン認識により獲得した複数個の認識候補の中の認識スコアの得点が高い上位M個(ただし、M≦N)の認識候補の認識スコア、及びオンライン認識により獲得した複数個の認識候補の中の認識スコアの得点が高い上位L個(ただし、L≦N)の認識候補の認識スコアを正規化させるプログラムコード手段と、
前記コンピュータに、正規化後の認識スコアに基づいて、オフライン認識により獲得したM個の認識候補、及びオンライン認識により獲得したL個の認識候補を統合させ、認識スコアの得点が高い上位K個(ただし、K≦M+L)の認識候補を認識結果として出力させるプログラムコード手段と
を含むことを特徴とする記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27398698A JP3595900B2 (ja) | 1998-09-28 | 1998-09-28 | 手書き文字認識装置及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27398698A JP3595900B2 (ja) | 1998-09-28 | 1998-09-28 | 手書き文字認識装置及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000105798A JP2000105798A (ja) | 2000-04-11 |
JP3595900B2 true JP3595900B2 (ja) | 2004-12-02 |
Family
ID=17535354
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP27398698A Expired - Fee Related JP3595900B2 (ja) | 1998-09-28 | 1998-09-28 | 手書き文字認識装置及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3595900B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012150761A (ja) | 2011-01-21 | 2012-08-09 | Fujitsu Ltd | 情報処理装置および情報処理プログラム |
JP6003047B2 (ja) * | 2011-11-24 | 2016-10-05 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
JP6003492B2 (ja) | 2012-10-01 | 2016-10-05 | 富士ゼロックス株式会社 | 文字認識装置及びプログラム |
CN104008363B (zh) * | 2013-02-26 | 2017-08-01 | 佳能株式会社 | 手写轨迹的检测、规范化和在线识别以及异常字根的收集 |
JP6451316B2 (ja) | 2014-12-26 | 2019-01-16 | 富士通株式会社 | 文字認識プログラム、文字認識方法及び文字認識装置 |
JP6055065B1 (ja) * | 2015-11-04 | 2016-12-27 | アイサンテクノロジー株式会社 | 文字認識プログラム、文字認識装置 |
JP7162278B2 (ja) * | 2021-02-15 | 2022-10-28 | アイタックソリューションズ株式会社 | 認識処理装置、認識処理プログラム、認識処理方法、及び認識処理システム |
-
1998
- 1998-09-28 JP JP27398698A patent/JP3595900B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000105798A (ja) | 2000-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3176023B2 (ja) | 手書き入力照合方法および装置 | |
Burrow | Arabic handwriting recognition | |
US7369702B2 (en) | Template-based cursive handwriting recognition | |
Kale et al. | Zernike moment feature extraction for handwritten Devanagari compound character recognition | |
US20080008387A1 (en) | Method and apparatus for recognition of handwritten symbols | |
CN107657241B (zh) | 一种面向签字笔的签名真伪性鉴别系统 | |
EP2943911A1 (en) | Process of handwriting recognition and related apparatus | |
JPH0652539B2 (ja) | パターン同定方法及び装置 | |
Guo et al. | Forgery detection by local correspondence | |
Hamida et al. | A novel feature extraction system for cursive word vocabulary recognition using local features descriptors and gabor filter | |
Abandah et al. | Feature selection for recognizing handwritten Arabic letters | |
Yadav et al. | Handwriting recognition system-a review | |
JP3595900B2 (ja) | 手書き文字認識装置及び記録媒体 | |
Basha et al. | A novel approach for optical character recognition (OCR) of handwritten Telugu alphabets using convolutional neural networks | |
CN107103289B (zh) | 利用笔迹轮廓特征来进行笔迹鉴别的方法及系统 | |
Tang et al. | Text-independent writer identification using improved structural features | |
Safdar et al. | A novel similar character discrimination method for online handwritten Urdu character recognition in half forms | |
Bania et al. | Handwritten assamese character recognition using texture and diagonal orientation features with artificial neural network | |
Erlandson et al. | Word-level recognition of multifont Arabic text using a feature vector matching approach | |
Dhaka et al. | Character Recognition of Offline Handwritten English Scripts: A Review | |
Singh et al. | Survey on offline signature recognition and verification schemes | |
Amrouch et al. | A novel feature set for recognition of printed amazigh text using maximum deviation and hmm | |
Bhowmik et al. | Handwritten Devanagari numerals recognition using grid based Hausdroff distance | |
Kumar | Offline handwritten Gurmukhi script recognition | |
Simayi et al. | Survey on the features for recognition of on-line handwritten Uyghur characters |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040525 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040824 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040824 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080917 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080917 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090917 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090917 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100917 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100917 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110917 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120917 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120917 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130917 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |