JP2013171441A

JP2013171441A - 文字認識用識別器学習装置、方法、文字認識装置、方法、及びプログラム

Info

Publication number: JP2013171441A
Application number: JP2012035047A
Authority: JP
Inventors: Minoru Mori; 稔森; Ei Sakano; 鋭坂野; Seiichi Uchida; 誠一内田
Original assignee: Kyushu University NUC; Nippon Telegraph and Telephone Corp
Current assignee: Kyushu University NUC; Nippon Telegraph and Telephone Corp
Priority date: 2012-02-21
Filing date: 2012-02-21
Publication date: 2013-09-02

Abstract

【課題】筆点座標値や局所方向が変化した場合でも、精度良く文字を認識する。
【解決手段】学習時には、特徴値抽出部２２で、学習用オンライン文字データから、座標系列順において隣接しない２つの座標点間の相対ベクトルを含む任意の２点間の相対ベクトルを特徴値（大局的特徴）として抽出し、ブースティング処理部２４で、ＡｄａＢｏｏｓｔ法により抽出した特徴値を学習して識別器３０を構築する。認識時には、特徴抽出部４２で、認識対象オンライン文字データから大局的特徴を抽出し、学習部２０で構築された識別器３０に抽出した大局的特徴を入力して、認識対象オンライン文字データが表す文字を認識する。
【選択図】図１

Description

本発明は、文字認識用識別器学習装置、方法、文字認識装置、方法、及びプログラムに関する。

オンライン手書き文字認識における代表的な手法として、標準パターン及び入力パターン共に全てのストロークを筆順どおりに結合して１画で表現した一筆書きパターンを生成し、これらの筆点座標系列間でＤＰマッチング（Dynamic Programming（動的計画法）によるマッチング）を行うことにより認識する手法が提案されている（例えば、非特許文献１参照）。また、マッチングに用いる特徴として、筆点座標だけではなく、隣接筆点間の差分としての相対座標値として定義される局所方向を用いる手法もある。

また、標準パターンと入力パターンとの間でストロークの対応付けを行い、対応付けられた各ストローク間の距離の総和を基にして、パターン間の距離を求めることにより認識する方法が提案されている（例えば、非特許文献２参照）。

また、非特許文献２に記載の手法を拡張し、ストロークの順番を入れ替えることで、筆順の変動への耐性を向上させた手法も提案されている（例えば、非特許文献３参照）。

佐藤幸男、足立秀綱、「走り書き文字のオンライン認識」電子情報通信学会論文誌（Ｄ），Ｖｏｌ．Ｊ６８−（Ｄ），Ｎｏｌ．１２，ｐｐ．２１１６−２１２２小高和己、荒川弘き、増田功、「ストロークの点近似による手書き文字のオンライン認識」、電子情報通信学会論文誌（Ｄ），Ｖｏｌ．Ｊ６３−Ｄ，Ｎｏ．２，ｐｐ．１５３−１６０若原徹、小高和己、梅田三千雄、「選択的ストローク結合による画数・筆順に依存しないオンライン文字認識」、電子情報通信学会論文誌（Ｄ），Ｖｏｌ．Ｊ６６−Ｄ，Ｎｏ．５，ｐｐ．５９３−６００

しかしながら、非特許文献１に記載の筆点座標を用いたＤＰマッチング法では、ＤＰマッチングにより部分的な座標のずれを吸収できるが、座標に大きな変動が生じた際には、そのずれを吸収できず、他の文字種に誤認識される場合がある、という問題がある。

また、局所方向を用いたＤＰマッチング法では、座標値のずれに対して耐性が向上するが、逆に筆点座標を用いないことにより、異なる座標に存在する類似した形状を持つ別の文字種に誤認識される場合がある、という問題がある。

また、非特許文献２及び３に記載のストローク間の対応付けに基づく手法では、ストローク間の距離値を用いるため、筆点座標が変動した場合には距離の総和が大きくなり、他の文字種に誤認識される場合がある、という問題がある。

本発明は上記問題点に鑑みてなされたものであり、筆点座標値や局所方向が変化した場合でも、精度良く文字を認識することができる文字認識用識別器学習装置、方法、文字認識装置、方法、及びプログラムを提供することを目的とする。

上記目的を達成するために、本発明の文字認識用識別器学習装置は、筆跡が座標系列で表現された複数の学習用文字データ各々から、前記座標系列順において隣接しない２つの座標点間の相対ベクトルを含む２つの座標点間の相対ベクトルを学習用特徴値として複数抽出する学習用抽出手段と、前記学習用抽出手段により抽出された学習用特徴値と前記学習用文字データが表す文字とを対応付けて学習することにより、認識対象文字データが表す文字を認識するための識別器を構築する構築手段と、を含んで構成されている。

本発明の文字認識用識別器学習装置では、学習用文字データとして、筆跡が座標系列で表現された複数の学習用文字データを用いる。「筆跡が座標系列で表現された」文字データとは、文字データの各ストローク上の座標が、座標値と共にその座標が何番目の座標であるかを示す情報を有する文字データである。例えば、文字データがオンライン文字データの場合には、筆順（入力の時系列順）に従って何番目の座標であるかを示す情報を定めることができる。文字データがオフライン文字データの場合には筆順が不明であるので、各ストロークの一端から他端へ向けて各座標に連番を付すなどして、何番目の座標であるかを示す情報を定めることができる。

学習用抽出手段は、上記の学習用文字データ各々から、座標系列順において隣接しない２つの座標点間の相対ベクトルを含む２つの座標点間の相対ベクトルを学習用特徴値として複数抽出する。２つの座標点間が隣接している場合には、相対ベクトルは局所的な特徴を示すものとなるが、２つの座標点間が隣接していない場合には、相対ベクトルは大局的な特徴を示すものとなる。

そして、構築手段が、学習用抽出手段により抽出された学習用特徴値と学習用文字データが表す文字とを対応付けて学習することにより、認識対象文字データが表す文字を認識するための識別器を構築する。

このように、大局的な特徴を示す座標系列順において隣接しない２つの座標点間の相対ベクトルを学習用特徴値として用いて、文字認識のための識別器を構築するため、筆点座標を特徴値とした場合のように座標のずれに依存せず、かつ局所方向では表現できない文字の大局的な構造情報を使用することができ、筆点座標値や局所方向が変化した場合でも、精度良く文字を認識するための識別器を構築することができる。

また、前記構築手段は、前記学習用抽出手段により抽出された複数の学習用特徴値から、ＡｄａＢｏｏｓｔ法により選択された複数の学習用特徴値に対応する複数の弱識別器を生成し、該複数の弱識別器を統合して前記識別器を構築することができる。これにより、認識に適した特徴が効率的に選択及び統合され、識別率を向上させることができる。

また、本発明の文字認識装置は、筆跡が座標系列で表現された認識対象文字データから、前記座標系列順において隣接しない２つの座標点間の相対ベクトルを含む２つの座標点間の相対ベクトルを認識用特徴値として複数抽出する認識用抽出手段と、上記の文字認識用識別器学習装置により構築された前記識別器、及び前記認識用抽出手段により抽出された複数の認識用特徴値を用いて、前記認識対象文字データが表す文字を認識する認識手段と、を含んで構成されている。

本発明の文字認識装置によれば、認識用抽出手段が、筆跡が座標系列で表現された認識対象文字データから、座標系列順において隣接しない２つの座標点間の相対ベクトルを含む２つの座標点間の相対ベクトルを認識用特徴値として複数抽出し、認識手段が、上記の文字認識用識別器学習装置により構築された識別器、及び認識用抽出手段により抽出された複数の認識用特徴値を用いて、認識対象文字データが表す文字を認識する。これにより、筆点座標値や局所方向が変化した場合でも、精度良く文字を認識することができる。

また、本発明の文字認識用識別器学習方法は、学習用抽出手段と、構築手段とを含む文字認識用識別器学習装置における文字認識用識別器学習方法であって、前記学習抽出手段は、筆跡が座標系列で表現された複数の学習用文字データ各々から、前記座標系列順において隣接しない２つの座標点間の相対ベクトルを含む２つの座標点間の相対ベクトルを学習用特徴値として複数抽出し、前記構築手段は、前記学習用抽出手段により抽出された学習用特徴値と前記学習用文字データが表す文字とを対応付けて学習することにより、認識対象文字データが表す文字を認識するための識別器を構築する方法である。

また、本発明の文字認識方法は、認識用抽出手段と、認識手段とを含む文字認識装置における文字認識方法であって、前記認識用抽出手段は、筆跡が座標系列で表現された認識対象文字データから、前記座標系列順において隣接しない２つの座標点間の相対ベクトルを含む２つの座標点間の相対ベクトルを認識用特徴値として複数抽出し、前記認識手段は、上記の文字認識用識別器学習方法により構築された前記識別器、及び前記認識用抽出手段により抽出された複数の認識用特徴値を用いて、前記認識対象文字データが表す文字を認識する方法である。

また、本発明の文字認識プログラムは、コンピュータを、上記の文字認識装置を構成する各手段として機能させるためのプログラムである。

以上説明したように、本発明の文字認識用識別器学習装置、方法、文字認識装置、方法、及びプログラムによれば、大局的な特徴を示す座標系列順において隣接しない２つの座標点間の相対ベクトルを特徴値として用いて、文字認識のための識別器を構築、及び文字認識を行うため、筆点座標を特徴値とした場合のように座標のずれに依存せず、かつ局所方向では表現できない文字の大局的な構造情報を使用することができ、筆点座標値や局所方向が変化した場合でも、精度良く文字を認識することができる、という効果が得られる。

本実施の形態の文字認識装置の構成を示すブロック図である。大局的特徴の一例を示す概略図である。大局的特徴の有効性を説明するための概略図である。本実施の形態の文字認識装置における学習処理ルーチンの内容を示すフローチャートである。本実施の形態の文字認識装置における認識処理ルーチンの内容を示すフローチャートである。（ａ）特徴値として座標値のみを用いた場合、（ｂ）大局的特徴を用いた場合の学習曲線を示すグラフである。座標値、大局的特徴、座標値と大局的特徴を特徴値とした場合の使用した特徴数に対する認識率を示すグラフである。

以下、図面を参照して本発明の実施の形態を詳細に説明する。本実施の形態では、オンライン文字を認識する文字認識装置に本発明を適用した例について説明する。なお、オンライン文字とは、文字の筆跡をストローク毎の筆点座標系列で表現し、筆点座標の時系列の情報を有する文字である。

本実施の形態に係る文字認識装置１０は、ＣＰＵ（Central Processing Unit）と、ＲＡＭ（Random Access Memory）と、後述する学習処理及び認識処理を含む文字認識処理ルーチンを実行するためのプログラムを記憶したＲＯＭ（Read Only Memory）とを備えたコンピュータで構成されている。このコンピュータは、機能的には、図１に示すように、学習部２０と認識部４０とを含んだ構成で表すことができる。

まず、学習部２０について説明する。学習部２０は、さらに、特徴値抽出部２２とブースティング処理部２４とを含んだ構成で表すことができる。

特徴値抽出部２２は、学習用のオンライン文字データを受け付け、学習用オンライン文字データから、ストローク上の任意の２点間を結ぶ相対ベクトルを特徴値として抽出する。具体的には、オンライン文字データの文字パターンの大きさを正規化し、Ｎ点の特徴点からなる時系列データにリサンプリングする。ここで、リサンプリングとは、１つの文字に設定する特徴点の数を決めて、特徴点をサンプリングすることをいう。リアルタイムで書かれている文字の特徴点をサンプリングする際に、一定時間毎の特徴点をとると、人によって文字を書くスピードが異なるため、１文字当たりの特徴点数にばらつきがでるためである。例えば、１つの文字に設定する特徴点の数をＮとし、各特徴点の間隔が一定の距離になるようにリサンプリングする。なお、Ｎの数としては、字形を十分に表現可能な点数とする必要がある。

次に、各特徴点間で定義されるＮ×（Ｎ―１）／２の組み合わせにおいて、相対ベクトルｆ（ｆ_ｘ，ｆ_ｙ）を特徴値として抽出する。以下、この相対ベクトル、すなわち隣接する２点間の相対ベクトル及び隣接しない２点間の相対ベクトルを含むストローク上の任意の２点間の相対ベクトルで表される特徴値を「大局的特徴」ともいう。図２に、特徴点Ｐ_ｎにおける大局的特徴の一例を示す。ここで、Ｐ_ｎはリサンプリングして得られたＮ個の特徴点中のｎ番目の特徴点であることを表す。例えば、特徴点Ｐ_ｎの座標値を（ｘ_ｎ，ｙ_ｎ）、特徴点Ｐ_Ｎの座標値を（ｘ_Ｎ，ｙ_Ｎ）とすると、この２点間の相対ベクトル（Ｐ_ｎ→Ｐ_Ｎ）で表される大局的特徴ｆは、特徴点Ｐ_ｎに対する特徴点Ｐ_Ｎのｘ軸方向の相対位置ｆ_ｘ＝ｘ_ｎ−ｘ_Ｎ、ｙ軸方向の相対位置ｆ_ｙ＝ｙ_ｎ−ｙ_Ｎで表される。

ここで、図３を参照して、特徴値として大局的特徴を用いることの有効性について説明する。図３（ａ）及び（ｂ）は、クラス“２”及び“３”における、特徴点Ｐ_ｎでの大局的特徴の定義例を表す。特徴値として局所方向（隣接する２点間の相対ベクトル）のみを用いる場合に、例えば、特徴点Ｐ_ｎ及びＰ_ｎ−１間のベクトルで表される特徴点Ｐ_ｎにおける局所方向を特徴値として抽出したとする。この場合、クラス“２”と“３”とでは、ほぼ類似の特徴値が抽出されるため、両クラス間の識別は困難であると想定される。

しかし、特徴値として大局的特徴を用いる場合には、ストローク上の任意の２点間の相対ベクトルを特徴値として抽出するため、例えば、特徴点Ｐ_ｎとＰ_Ｎとの間で定義された大局的特徴のように、クラス“２”と“３”とで明らかに異なる特徴値を抽出可能である。このような特徴値を用いることは、両クラス間の識別に非常に効果的であることが想定される。

また、図３（ｃ）は、大局的特徴によりストロークの離れた位置同士の関係を直接定義可能な例として、クラス“０”の開始点と終点との関係を記述する例である。このように、大局的特徴によれば、クラス“０”の始点と終点とが近接である等のオンライン文字データの特徴的な構造を表現することができる。

ブースティング処理部２４は、特徴値抽出部２２で抽出された特徴値を学習することにより、文字認識を行うための識別器３０を構築する。

オンライン文字データの特徴的な構造（例えば、上述のクラス“０”の始点と終点とが近接である等）は、他の構造よりも認識の際により重要となる。よって、このように認識に適した構造を表現する特徴値を適切に選択する識別器を学習することが望ましい。また、複数の構造の情報を統合して用いれば、単独の構造のみに注目するよりも正確な認識を行うことができる。

そこで、本実施の形態では、ブースティング処理によって、抽出した特徴値の選択及び統合を行う。このブースティング処理は、例えば、非特許文献４（Y. Freund and R. Schapire, “A decision-theoretic generalization of on-line learning and an application to boosting” Journal of Computer and System Sciences, 1997.）により公知のＡｄａＢｏｏｓｔ（Adaptive Boosting、アダブースト）法を用いることができる。ＡｄａＢｏｏｓｔ法では、既に選ばれた弱識別器の弱点をうまく補完するような識別器が逐次に新たに選ばれていくため、効率的に複数の特徴値を統合することができる。

具体的には、ブースティング処理部２４は、学習用オンライン文字データのセット{Ｉ_ｉ，Ｌ_ｉ}（ｉ＝１〜Ｎ）を取得する。ここで、Ｉ_ｉはｉ番目のオンライン文字データ、Ｌ_ｉはｉ番目のオンライン文字データのクラス（数字の場合、０〜９）が着目クラス（Ｌ_ｉ＝１）か、着目クラス外（Ｌ_ｉ＝０）かを示す変数である。例えば、クラス“０”に着目した場合、Ｉ_ｉが“０”であればＬ_ｉ＝１、Ｉ_ｉが“１”であればＬ_ｉ＝０となる。また、Ｎは学習用オンラインデータの総数（総サンプル数）である。

次に、以下に示す重みの獲得処理を行う。重みの獲得は、各クラスを着目クラスｃとして、着目クラスｃ毎に実行する。

まず、オンライン文字データの重みｗ_t,iを、下記（１）式により初期化する。ｔは何回目の重み獲得処理かを示す変数であり、ｔ＝１〜Ｔである。

ここで、ｐは着目クラス外のサンプル数、ｑは着目クラスｃのサンプル数である。次に、以下に示す＜１＞重みの正規化、＜２＞大局的特徴の学習、＜３＞特徴選択、及び＜４＞重みの更新を、Ｔ回繰り返す（for ｔ＝１，・・・，Ｔ）。

＜１＞重みの正規化
下記（２）式により重みｗ_t,iを正規化する。

＜２＞大局的特徴の学習
ｉ番目のサンプルのｊ番目の大局的特徴をｆ_i,j＝（ｆ_i,j,x，ｆ_i,j,y）とする。また、着目クラスの各サンプルのｊ番目の大局的特徴の重み付平均（ｍ_j,x，ｍ_j,y）を下記（３）式により、着目クラス外の各サンプルのｊ番目の大局的特徴の重み付平均（ｍ'_j,x，ｍ'_j,y）を下記（４）式により求める。

次に、ｆ_i,jが誤認識となった場合に、ε^ｊ←ε^ｊ+ｗ_t,iとして重み付誤差ε^ｊを求める。ｆ_i,jが誤認識となるか否かの判定は、例えば、ｉ番目のサンプルが着目クラスのサンプルの場合には、下記（５）式を満たす場合に、ｉ番目のサンプルが着目クラス外のサンプルの場合には、下記（６）式を満たす場合に誤認識であると判定することができる。なお、（５）式及び（６）式は、シティブロック距離を用いた一例であるが、ユークリッド距離等の他の距離を用いてもよい。

＜３＞特徴選択
各大局的特徴について算出された重み付誤差ε^ｊが最小となるｊ番目の大局的特徴をｔ番目の弱識別器ｈ_c,tとして採用する。

＜４＞重みの更新
下記（７）式により信頼度α_c,tを計算し、下記（８）式により重みｗ_t,iを更新する。

ここで、ε_c,tは、弱識別器ｈ_c,tに採用されたｊ番目の大局的特徴に対する重み付誤差、すなわち上記における最小の重み付誤差ε^ｊである。また、Ｌｉ×ｈ_c,t（Ｉ_ｉ）は、正しく認識できたサンプルは「１」、誤認識したサンプルは「−１」となる。

上記の＜１＞〜＜４＞の処理をｔ＝１，・・・，Ｔまで繰り返し、クラスｃについてＴ個の弱識別器ｈ_c,tを得る。これらＴ個の弱識別器を用いて、下記（９）式により、クラスｃについての最終的な識別関数Ｈ_ｃ（Ｉ）を構築する。

ブースティング処理は２クラスを判別する識別器であるため、２クラス以上の認識が対象となる課題には、使用上の工夫が必要である。本実施の形態では、例えば数字の１０クラスを認識対象とする場合、クラス“０”とその他クラス、クラス“１”とその他クラスという分け方を、０〜９の１０通り実施することで、各クラスの数字に対応した１０個の識別器（Ｈ_０（Ｉ），・・・，Ｈ_９（Ｉ））が構築される。構築された識別器３０は、所定の記憶領域に格納する。

次に、認識部４０について説明する。認識部４０は、さらに、特徴値抽出部４２と文字認識処理部４４とを含んだ構成で表すことができる。

特徴値抽出部４２は、認識対象のオンライン文字データを受け付け、学習部２０の特徴値抽出部２２と同様の処理により、認識対象オンライン文字データから特徴値を抽出する。

文字認識処理部４４は、学習部２０で生成された識別器３０に、特徴値抽出部４２で抽出された特徴値を入力して得られる識別結果に基づいて、認識対象オンライン文字データを認識する。具体的には、特徴値抽出部４２で抽出された大局的特徴の値を、クラス毎の識別器３０（クラス毎の識別関数、（９）式）に代入して、クラス毎のスコアを算出する。１０個の識別器の内、最大のスコアを出力する識別器を持つクラスを、認識対象オンライン文字の認識結果とする。

次に、本実施の形態の文字認識装置１０の作用について説明する。まず、学習部２０において図４に示す学習処理ルーチンが実行されて、識別器３０が生成される。次に、認識部４０において、生成された識別器３０を用いて、図５に示す認識処理ルーチンが実行される。以下、各処理について詳細に説明する。

まず、学習処理ルーチンでは、ステップ１００で、学習用オンライン文字データを受け付ける。次に、ステップ１０２で、上記ステップ１００で受け付けた学習用オンライン文字データの文字パターンの大きさを正規化し、Ｎ点の特徴点からなる時系列データにリサンプリングする。そして、各特徴点間で定義されるＮ×（Ｎ―１）／２の組み合わせにおいて、相対ベクトルｆ（ｆ_ｘ，ｆ_ｙ）を特徴値（大局的特徴）として抽出する。

次に、ステップ１０４で、上記ステップ１０２で抽出した大局的特徴をブースティング処理により学習して、クラス毎の識別器を構築して、学習処理を終了する。

次に、認識処理ルーチンでは、ステップ１１０で、認識対象オンライン文字データを受け付ける。次に、ステップ１１２で、学習処理のステップ１０２と同様に、上記ステップ１１０で受け付けた認識対象オンライン文字データから大局的特徴を抽出する。次に、ステップ１１４で、上記ステップ１１２で抽出された大局的特徴の値を、学習処理のステップ１０４で構築されたクラス毎の識別器３０に代入して、クラス毎のスコアを算出し、最大のスコアを出力する識別器を持つクラスを、認識対象オンライン文字の認識結果として出力し、認識処理を終了する。

以上説明したように、本実施の形態の文字認識装置によれば、オンライン文字データのストローク上の任意の２点間の相対ベクトルで表される大局的特徴を用いて識別器の学習及び認識対象文字の認識を行うため、筆点座標を特徴値とした場合のように座標のずれに依存せず、かつ局所方向では表現できない文字の大局的な構造情報を使用することができ、筆点座標値や局所方向が変化した場合でも、精度良くオンライン文字を認識することができる。

また、上記のような大局的特徴をブースティング処理により統合した識別器を構築するため、文字認識に適した大局的特徴が効率的に選択及び統合され、識別率を向上させることができる。また、ブースティング処理により識別器を構築することにより、全ての特徴値を用いる場合に比べて、高速に文字を認識することができる。

なお、上記実施の形態では、認識対象の文字をオンライン文字とする場合について説明したが、本発明は、オフライン文字認識にも適用可能である。オフライン文字認識では、文字データの座標値が時系列データではないため、ストロークから特徴点をリサンプリングする際には、ストローク上で等間隔に予め定めた個数の特徴点を抽出すると共に、各特徴点にストロークの一端から他端に向けて順次番号を付与するようにするとよい。

また、上記実施の形態では、学習部と認識部とを同一のコンピュータで構成する場合について説明したが、別々のコンピュータで構成するようにしてもよい。

また、上記実施の形態では、文字認識に用いる特徴値として大局的特徴のみを用いる場合について説明した。相対ベクトルで表される大局的特徴を用いた場合には、座標ずれを吸収することができるが、座標位置が大きく異なる場合でも相対ベクトルが類似している場合に誤認識を生じる場合がある。そこで、特徴値として大局的特徴と共に座標値も用いるようにしてもよい。座標値を特徴値とする場合も、ｉ番目のサンプルのｊ番目の座標値をＰ_i,j＝（Ｐ_i,j,x，Ｐ_i,j,ｙ）として、上記実施の形態の大局的特徴と同様に扱うことができる。この場合も、上記実施の形態と同様にＡｄａＢｏｏｓｔ法を用いることで、座標値自体が文字の重要な構造を表す場合には、その座標値を示す特徴値が弱識別器として採用される。

ここで、文字認識の特徴値として大局的特徴を用いることの有効性について、実験結果を参照しながら説明する。オンライン文字データとして、数字データ“０”から“９”までの数字１０クラスが３１,３８６サンプル格納されているデータを用い、全サンプルの内、９０％（２８,２４８サンプル）を学習用データとして用い、残りの１０％（３,１３８サンプル）を評価（認識対象）データとして用いた。

前処理として、各数字データのパターンを元のアスペクト比は保存したまま、１２８×１２８ピクセルの大きさに正規化した。特徴点のリサンプリングは、Ｎ＝４０点で行った。従って、各サンプルから４０個のｘｙ座標値からなる特徴値と７８０個の大局的特徴とが得られる。なお、本実験においても、上記実施の形態のと同様に、「大局的特徴」は、隣接する２点間の相対ベクトル及び隣接しない２点間の相対ベクトルを含むストローク上の任意の２点間の相対ベクトルで表される特徴値である。

図６は、特徴値として座標値のみを用いた場合（ａ）、及び大局的特徴を用いた場合（ｂ）において、ＡｄａＢｏｏｓｔで学習した際の学習曲線を示す。図６に示す通り、ほぼ全てのクラスにおいて、大局的特徴を用いた場合の方が、より高い学習効率を示している。また、図７及び表１は、ＡｄａＢｏｏｓｔで選択し、認識の際に使用した特徴数に対し、座標値を特徴値としたもの（座標値、ｌｏｃａｌ）、大局的特徴を使用したもの（大局、ｇｌｏｂａｌ）、座標値と大局的特徴との両方使用したもの（座標値＋大局、ｌｏｃａｌ＋ｇｌｏｂａｌ）、各々の認識率を比較した結果である。

図７及び表１が示すように、大局的特徴を用いた手法では、使用する特徴の数如何にかかわらず、従来の座標値のみを使用する場合よりも、高い認識率を達成可能である。また、両手法を併用した際にさらに高い認識率を達成していることにより、ブースティング処理を用いることにより、同じ特徴の使用数でも、より効率的に有効な特徴を選択し、同じ認識処理量でさらに高い認識率を達成することが可能であることがわかる。

また、本発明は、上記実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。

また、本願明細書中において、プログラムが予めインストールされている実施の形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。

１０文字認識装置
２０学習部
２２学習部の特徴値抽出部
２４ブースティング処理部
３０識別器
４０認識部
４２認識部の特徴値抽出部
４４文字認識処理部

Claims

筆跡が座標系列で表現された複数の学習用文字データ各々から、前記座標系列順において隣接しない２つの座標点間の相対ベクトルを含む２つの座標点間の相対ベクトルを学習用特徴値として複数抽出する学習用抽出手段と、
前記学習用抽出手段により抽出された学習用特徴値と前記学習用文字データが表す文字とを対応付けて学習することにより、認識対象文字データが表す文字を認識するための識別器を構築する構築手段と、
を含む文字認識用識別器学習装置。
前記構築手段は、前記学習用抽出手段により抽出された複数の学習用特徴値から、ＡｄａＢｏｏｓｔ法により選択された複数の学習用特徴値に対応する複数の弱識別器を生成し、該複数の弱識別器を統合して前記識別器を構築する請求項１記載の文字認識用識別器学習装置。
筆跡が座標系列で表現された認識対象文字データから、前記座標系列順において隣接しない２つの座標点間の相対ベクトルを含む２つの座標点間の相対ベクトルを認識用特徴値として複数抽出する認識用抽出手段と、
請求項１または請求項２記載の文字認識用識別器学習装置により構築された前記識別器、及び前記認識用抽出手段により抽出された複数の認識用特徴値を用いて、前記認識対象文字データが表す文字を認識する認識手段と、
を含む文字認識装置。
学習用抽出手段と、構築手段とを含む文字認識用識別器学習装置における文字認識用識別器学習方法であって、
前記学習抽出手段は、筆跡が座標系列で表現された複数の学習用文字データ各々から、前記座標系列順において隣接しない２つの座標点間の相対ベクトルを含む２つの座標点間の相対ベクトルを学習用特徴値として複数抽出し、
前記構築手段は、前記学習用抽出手段により抽出された学習用特徴値と前記学習用文字データが表す文字とを対応付けて学習することにより、認識対象文字データが表す文字を認識するための識別器を構築する
文字認識用識別器学習方法。
認識用抽出手段と、認識手段とを含む文字認識装置における文字認識方法であって、
前記認識用抽出手段は、筆跡が座標系列で表現された認識対象文字データから、前記座標系列順において隣接しない２つの座標点間の相対ベクトルを含む２つの座標点間の相対ベクトルを認識用特徴値として複数抽出し、
前記認識手段は、請求項４記載の文字認識用識別器学習方法により構築された前記識別器、及び前記認識用抽出手段により抽出された複数の認識用特徴値を用いて、前記認識対象文字データが表す文字を認識する
文字認識方法。
コンピュータを、請求項３記載の文字認識装置を構成する各手段として機能させるための文字認識プログラム。