JP2013171441A - 文字認識用識別器学習装置、方法、文字認識装置、方法、及びプログラム - Google Patents

文字認識用識別器学習装置、方法、文字認識装置、方法、及びプログラム Download PDF

Info

Publication number
JP2013171441A
JP2013171441A JP2012035047A JP2012035047A JP2013171441A JP 2013171441 A JP2013171441 A JP 2013171441A JP 2012035047 A JP2012035047 A JP 2012035047A JP 2012035047 A JP2012035047 A JP 2012035047A JP 2013171441 A JP2013171441 A JP 2013171441A
Authority
JP
Japan
Prior art keywords
learning
recognition
character
feature
coordinate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012035047A
Other languages
English (en)
Inventor
Minoru Mori
稔 森
Ei Sakano
鋭 坂野
Seiichi Uchida
誠一 内田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyushu University NUC
Nippon Telegraph and Telephone Corp
Original Assignee
Kyushu University NUC
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyushu University NUC, Nippon Telegraph and Telephone Corp filed Critical Kyushu University NUC
Priority to JP2012035047A priority Critical patent/JP2013171441A/ja
Publication of JP2013171441A publication Critical patent/JP2013171441A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

【課題】筆点座標値や局所方向が変化した場合でも、精度良く文字を認識する。
【解決手段】学習時には、特徴値抽出部22で、学習用オンライン文字データから、座標系列順において隣接しない2つの座標点間の相対ベクトルを含む任意の2点間の相対ベクトルを特徴値(大局的特徴)として抽出し、ブースティング処理部24で、AdaBoost法により抽出した特徴値を学習して識別器30を構築する。認識時には、特徴抽出部42で、認識対象オンライン文字データから大局的特徴を抽出し、学習部20で構築された識別器30に抽出した大局的特徴を入力して、認識対象オンライン文字データが表す文字を認識する。
【選択図】図1

Description

本発明は、文字認識用識別器学習装置、方法、文字認識装置、方法、及びプログラムに関する。
オンライン手書き文字認識における代表的な手法として、標準パターン及び入力パターン共に全てのストロークを筆順どおりに結合して1画で表現した一筆書きパターンを生成し、これらの筆点座標系列間でDPマッチング(Dynamic Programming(動的計画法)によるマッチング)を行うことにより認識する手法が提案されている(例えば、非特許文献1参照)。また、マッチングに用いる特徴として、筆点座標だけではなく、隣接筆点間の差分としての相対座標値として定義される局所方向を用いる手法もある。
また、標準パターンと入力パターンとの間でストロークの対応付けを行い、対応付けられた各ストローク間の距離の総和を基にして、パターン間の距離を求めることにより認識する方法が提案されている(例えば、非特許文献2参照)。
また、非特許文献2に記載の手法を拡張し、ストロークの順番を入れ替えることで、筆順の変動への耐性を向上させた手法も提案されている(例えば、非特許文献3参照)。
佐藤幸男、足立秀綱、「走り書き文字のオンライン認識」電子情報通信学会論文誌(D),Vol.J68−(D),Nol.12,pp.2116−2122 小高和己、荒川弘き、増田功、「ストロークの点近似による手書き文字のオンライン認識」、電子情報通信学会論文誌(D),Vol.J63−D,No.2,pp.153−160 若原徹、小高和己、梅田三千雄、「選択的ストローク結合による画数・筆順に依存しないオンライン文字認識」、電子情報通信学会論文誌(D),Vol.J66−D,No.5,pp.593−600
しかしながら、非特許文献1に記載の筆点座標を用いたDPマッチング法では、DPマッチングにより部分的な座標のずれを吸収できるが、座標に大きな変動が生じた際には、そのずれを吸収できず、他の文字種に誤認識される場合がある、という問題がある。
また、局所方向を用いたDPマッチング法では、座標値のずれに対して耐性が向上するが、逆に筆点座標を用いないことにより、異なる座標に存在する類似した形状を持つ別の文字種に誤認識される場合がある、という問題がある。
また、非特許文献2及び3に記載のストローク間の対応付けに基づく手法では、ストローク間の距離値を用いるため、筆点座標が変動した場合には距離の総和が大きくなり、他の文字種に誤認識される場合がある、という問題がある。
本発明は上記問題点に鑑みてなされたものであり、筆点座標値や局所方向が変化した場合でも、精度良く文字を認識することができる文字認識用識別器学習装置、方法、文字認識装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明の文字認識用識別器学習装置は、筆跡が座標系列で表現された複数の学習用文字データ各々から、前記座標系列順において隣接しない2つの座標点間の相対ベクトルを含む2つの座標点間の相対ベクトルを学習用特徴値として複数抽出する学習用抽出手段と、前記学習用抽出手段により抽出された学習用特徴値と前記学習用文字データが表す文字とを対応付けて学習することにより、認識対象文字データが表す文字を認識するための識別器を構築する構築手段と、を含んで構成されている。
本発明の文字認識用識別器学習装置では、学習用文字データとして、筆跡が座標系列で表現された複数の学習用文字データを用いる。「筆跡が座標系列で表現された」文字データとは、文字データの各ストローク上の座標が、座標値と共にその座標が何番目の座標であるかを示す情報を有する文字データである。例えば、文字データがオンライン文字データの場合には、筆順(入力の時系列順)に従って何番目の座標であるかを示す情報を定めることができる。文字データがオフライン文字データの場合には筆順が不明であるので、各ストロークの一端から他端へ向けて各座標に連番を付すなどして、何番目の座標であるかを示す情報を定めることができる。
学習用抽出手段は、上記の学習用文字データ各々から、座標系列順において隣接しない2つの座標点間の相対ベクトルを含む2つの座標点間の相対ベクトルを学習用特徴値として複数抽出する。2つの座標点間が隣接している場合には、相対ベクトルは局所的な特徴を示すものとなるが、2つの座標点間が隣接していない場合には、相対ベクトルは大局的な特徴を示すものとなる。
そして、構築手段が、学習用抽出手段により抽出された学習用特徴値と学習用文字データが表す文字とを対応付けて学習することにより、認識対象文字データが表す文字を認識するための識別器を構築する。
このように、大局的な特徴を示す座標系列順において隣接しない2つの座標点間の相対ベクトルを学習用特徴値として用いて、文字認識のための識別器を構築するため、筆点座標を特徴値とした場合のように座標のずれに依存せず、かつ局所方向では表現できない文字の大局的な構造情報を使用することができ、筆点座標値や局所方向が変化した場合でも、精度良く文字を認識するための識別器を構築することができる。
また、前記構築手段は、前記学習用抽出手段により抽出された複数の学習用特徴値から、AdaBoost法により選択された複数の学習用特徴値に対応する複数の弱識別器を生成し、該複数の弱識別器を統合して前記識別器を構築することができる。これにより、認識に適した特徴が効率的に選択及び統合され、識別率を向上させることができる。
また、本発明の文字認識装置は、筆跡が座標系列で表現された認識対象文字データから、前記座標系列順において隣接しない2つの座標点間の相対ベクトルを含む2つの座標点間の相対ベクトルを認識用特徴値として複数抽出する認識用抽出手段と、上記の文字認識用識別器学習装置により構築された前記識別器、及び前記認識用抽出手段により抽出された複数の認識用特徴値を用いて、前記認識対象文字データが表す文字を認識する認識手段と、を含んで構成されている。
本発明の文字認識装置によれば、認識用抽出手段が、筆跡が座標系列で表現された認識対象文字データから、座標系列順において隣接しない2つの座標点間の相対ベクトルを含む2つの座標点間の相対ベクトルを認識用特徴値として複数抽出し、認識手段が、上記の文字認識用識別器学習装置により構築された識別器、及び認識用抽出手段により抽出された複数の認識用特徴値を用いて、認識対象文字データが表す文字を認識する。これにより、筆点座標値や局所方向が変化した場合でも、精度良く文字を認識することができる。
また、本発明の文字認識用識別器学習方法は、学習用抽出手段と、構築手段とを含む文字認識用識別器学習装置における文字認識用識別器学習方法であって、前記学習抽出手段は、筆跡が座標系列で表現された複数の学習用文字データ各々から、前記座標系列順において隣接しない2つの座標点間の相対ベクトルを含む2つの座標点間の相対ベクトルを学習用特徴値として複数抽出し、前記構築手段は、前記学習用抽出手段により抽出された学習用特徴値と前記学習用文字データが表す文字とを対応付けて学習することにより、認識対象文字データが表す文字を認識するための識別器を構築する方法である。
また、本発明の文字認識方法は、認識用抽出手段と、認識手段とを含む文字認識装置における文字認識方法であって、前記認識用抽出手段は、筆跡が座標系列で表現された認識対象文字データから、前記座標系列順において隣接しない2つの座標点間の相対ベクトルを含む2つの座標点間の相対ベクトルを認識用特徴値として複数抽出し、前記認識手段は、上記の文字認識用識別器学習方法により構築された前記識別器、及び前記認識用抽出手段により抽出された複数の認識用特徴値を用いて、前記認識対象文字データが表す文字を認識する方法である。
また、本発明の文字認識プログラムは、コンピュータを、上記の文字認識装置を構成する各手段として機能させるためのプログラムである。
以上説明したように、本発明の文字認識用識別器学習装置、方法、文字認識装置、方法、及びプログラムによれば、大局的な特徴を示す座標系列順において隣接しない2つの座標点間の相対ベクトルを特徴値として用いて、文字認識のための識別器を構築、及び文字認識を行うため、筆点座標を特徴値とした場合のように座標のずれに依存せず、かつ局所方向では表現できない文字の大局的な構造情報を使用することができ、筆点座標値や局所方向が変化した場合でも、精度良く文字を認識することができる、という効果が得られる。
本実施の形態の文字認識装置の構成を示すブロック図である。 大局的特徴の一例を示す概略図である。 大局的特徴の有効性を説明するための概略図である。 本実施の形態の文字認識装置における学習処理ルーチンの内容を示すフローチャートである。 本実施の形態の文字認識装置における認識処理ルーチンの内容を示すフローチャートである。 (a)特徴値として座標値のみを用いた場合、(b)大局的特徴を用いた場合の学習曲線を示すグラフである。 座標値、大局的特徴、座標値と大局的特徴を特徴値とした場合の使用した特徴数に対する認識率を示すグラフである。
以下、図面を参照して本発明の実施の形態を詳細に説明する。本実施の形態では、オンライン文字を認識する文字認識装置に本発明を適用した例について説明する。なお、オンライン文字とは、文字の筆跡をストローク毎の筆点座標系列で表現し、筆点座標の時系列の情報を有する文字である。
本実施の形態に係る文字認識装置10は、CPU(Central Processing Unit)と、RAM(Random Access Memory)と、後述する学習処理及び認識処理を含む文字認識処理ルーチンを実行するためのプログラムを記憶したROM(Read Only Memory)とを備えたコンピュータで構成されている。このコンピュータは、機能的には、図1に示すように、学習部20と認識部40とを含んだ構成で表すことができる。
まず、学習部20について説明する。学習部20は、さらに、特徴値抽出部22とブースティング処理部24とを含んだ構成で表すことができる。
特徴値抽出部22は、学習用のオンライン文字データを受け付け、学習用オンライン文字データから、ストローク上の任意の2点間を結ぶ相対ベクトルを特徴値として抽出する。具体的には、オンライン文字データの文字パターンの大きさを正規化し、N点の特徴点からなる時系列データにリサンプリングする。ここで、リサンプリングとは、1つの文字に設定する特徴点の数を決めて、特徴点をサンプリングすることをいう。リアルタイムで書かれている文字の特徴点をサンプリングする際に、一定時間毎の特徴点をとると、人によって文字を書くスピードが異なるため、1文字当たりの特徴点数にばらつきがでるためである。例えば、1つの文字に設定する特徴点の数をNとし、各特徴点の間隔が一定の距離になるようにリサンプリングする。なお、Nの数としては、字形を十分に表現可能な点数とする必要がある。
次に、各特徴点間で定義されるN×(N―1)/2の組み合わせにおいて、相対ベクトルf(f,f)を特徴値として抽出する。以下、この相対ベクトル、すなわち隣接する2点間の相対ベクトル及び隣接しない2点間の相対ベクトルを含むストローク上の任意の2点間の相対ベクトルで表される特徴値を「大局的特徴」ともいう。図2に、特徴点Pにおける大局的特徴の一例を示す。ここで、Pはリサンプリングして得られたN個の特徴点中のn番目の特徴点であることを表す。例えば、特徴点Pの座標値を(x,y)、特徴点Pの座標値を(x,y)とすると、この2点間の相対ベクトル(P→P)で表される大局的特徴fは、特徴点Pに対する特徴点Pのx軸方向の相対位置f=x−x、y軸方向の相対位置f=y−yで表される。
ここで、図3を参照して、特徴値として大局的特徴を用いることの有効性について説明する。図3(a)及び(b)は、クラス“2”及び“3”における、特徴点Pでの大局的特徴の定義例を表す。特徴値として局所方向(隣接する2点間の相対ベクトル)のみを用いる場合に、例えば、特徴点P及びPn−1間のベクトルで表される特徴点Pにおける局所方向を特徴値として抽出したとする。この場合、クラス“2”と“3”とでは、ほぼ類似の特徴値が抽出されるため、両クラス間の識別は困難であると想定される。
しかし、特徴値として大局的特徴を用いる場合には、ストローク上の任意の2点間の相対ベクトルを特徴値として抽出するため、例えば、特徴点PとPとの間で定義された大局的特徴のように、クラス“2”と“3”とで明らかに異なる特徴値を抽出可能である。このような特徴値を用いることは、両クラス間の識別に非常に効果的であることが想定される。
また、図3(c)は、大局的特徴によりストロークの離れた位置同士の関係を直接定義可能な例として、クラス“0”の開始点と終点との関係を記述する例である。このように、大局的特徴によれば、クラス“0”の始点と終点とが近接である等のオンライン文字データの特徴的な構造を表現することができる。
ブースティング処理部24は、特徴値抽出部22で抽出された特徴値を学習することにより、文字認識を行うための識別器30を構築する。
オンライン文字データの特徴的な構造(例えば、上述のクラス“0”の始点と終点とが近接である等)は、他の構造よりも認識の際により重要となる。よって、このように認識に適した構造を表現する特徴値を適切に選択する識別器を学習することが望ましい。また、複数の構造の情報を統合して用いれば、単独の構造のみに注目するよりも正確な認識を行うことができる。
そこで、本実施の形態では、ブースティング処理によって、抽出した特徴値の選択及び統合を行う。このブースティング処理は、例えば、非特許文献4(Y. Freund and R. Schapire, “A decision-theoretic generalization of on-line learning and an application to boosting” Journal of Computer and System Sciences, 1997.)により公知のAdaBoost(Adaptive Boosting、アダブースト)法を用いることができる。AdaBoost法では、既に選ばれた弱識別器の弱点をうまく補完するような識別器が逐次に新たに選ばれていくため、効率的に複数の特徴値を統合することができる。
具体的には、ブースティング処理部24は、学習用オンライン文字データのセット{I,L}(i=1〜N)を取得する。ここで、Iはi番目のオンライン文字データ、Lはi番目のオンライン文字データのクラス(数字の場合、0〜9)が着目クラス(L=1)か、着目クラス外(L=0)かを示す変数である。例えば、クラス“0”に着目した場合、Iが“0”であればL=1、Iが“1”であればL=0となる。また、Nは学習用オンラインデータの総数(総サンプル数)である。
次に、以下に示す重みの獲得処理を行う。重みの獲得は、各クラスを着目クラスcとして、着目クラスc毎に実行する。
まず、オンライン文字データの重みwt,iを、下記(1)式により初期化する。tは何回目の重み獲得処理かを示す変数であり、t=1〜Tである。
ここで、pは着目クラス外のサンプル数、qは着目クラスcのサンプル数である。次に、以下に示す<1>重みの正規化、<2>大局的特徴の学習、<3>特徴選択、及び<4>重みの更新を、T回繰り返す(for t=1,・・・,T)。
<1>重みの正規化
下記(2)式により重みwt,iを正規化する。
<2>大局的特徴の学習
i番目のサンプルのj番目の大局的特徴をfi,j=(fi,j,x,fi,j,y)とする。また、着目クラスの各サンプルのj番目の大局的特徴の重み付平均(mj,x,mj,y)を下記(3)式により、着目クラス外の各サンプルのj番目の大局的特徴の重み付平均(m'j,x,m'j,y)を下記(4)式により求める。
次に、fi,jが誤認識となった場合に、ε←ε+wt,iとして重み付誤差εを求める。fi,jが誤認識となるか否かの判定は、例えば、i番目のサンプルが着目クラスのサンプルの場合には、下記(5)式を満たす場合に、i番目のサンプルが着目クラス外のサンプルの場合には、下記(6)式を満たす場合に誤認識であると判定することができる。なお、(5)式及び(6)式は、シティブロック距離を用いた一例であるが、ユークリッド距離等の他の距離を用いてもよい。
<3>特徴選択
各大局的特徴について算出された重み付誤差εが最小となるj番目の大局的特徴をt番目の弱識別器hc,tとして採用する。
<4>重みの更新
下記(7)式により信頼度αc,tを計算し、下記(8)式により重みwt,iを更新する。
ここで、εc,tは、弱識別器hc,tに採用されたj番目の大局的特徴に対する重み付誤差、すなわち上記における最小の重み付誤差εである。また、Li×hc,t(I)は、正しく認識できたサンプルは「1」、誤認識したサンプルは「−1」となる。
上記の<1>〜<4>の処理をt=1,・・・,Tまで繰り返し、クラスcについてT個の弱識別器hc,tを得る。これらT個の弱識別器を用いて、下記(9)式により、クラスcについての最終的な識別関数H(I)を構築する。
ブースティング処理は2クラスを判別する識別器であるため、2クラス以上の認識が対象となる課題には、使用上の工夫が必要である。本実施の形態では、例えば数字の10クラスを認識対象とする場合、クラス“0”とその他クラス、クラス“1”とその他クラスという分け方を、0〜9の10通り実施することで、各クラスの数字に対応した10個の識別器(H(I),・・・,H(I))が構築される。構築された識別器30は、所定の記憶領域に格納する。
次に、認識部40について説明する。認識部40は、さらに、特徴値抽出部42と文字認識処理部44とを含んだ構成で表すことができる。
特徴値抽出部42は、認識対象のオンライン文字データを受け付け、学習部20の特徴値抽出部22と同様の処理により、認識対象オンライン文字データから特徴値を抽出する。
文字認識処理部44は、学習部20で生成された識別器30に、特徴値抽出部42で抽出された特徴値を入力して得られる識別結果に基づいて、認識対象オンライン文字データを認識する。具体的には、特徴値抽出部42で抽出された大局的特徴の値を、クラス毎の識別器30(クラス毎の識別関数、(9)式)に代入して、クラス毎のスコアを算出する。10個の識別器の内、最大のスコアを出力する識別器を持つクラスを、認識対象オンライン文字の認識結果とする。
次に、本実施の形態の文字認識装置10の作用について説明する。まず、学習部20において図4に示す学習処理ルーチンが実行されて、識別器30が生成される。次に、認識部40において、生成された識別器30を用いて、図5に示す認識処理ルーチンが実行される。以下、各処理について詳細に説明する。
まず、学習処理ルーチンでは、ステップ100で、学習用オンライン文字データを受け付ける。次に、ステップ102で、上記ステップ100で受け付けた学習用オンライン文字データの文字パターンの大きさを正規化し、N点の特徴点からなる時系列データにリサンプリングする。そして、各特徴点間で定義されるN×(N―1)/2の組み合わせにおいて、相対ベクトルf(f,f)を特徴値(大局的特徴)として抽出する。
次に、ステップ104で、上記ステップ102で抽出した大局的特徴をブースティング処理により学習して、クラス毎の識別器を構築して、学習処理を終了する。
次に、認識処理ルーチンでは、ステップ110で、認識対象オンライン文字データを受け付ける。次に、ステップ112で、学習処理のステップ102と同様に、上記ステップ110で受け付けた認識対象オンライン文字データから大局的特徴を抽出する。次に、ステップ114で、上記ステップ112で抽出された大局的特徴の値を、学習処理のステップ104で構築されたクラス毎の識別器30に代入して、クラス毎のスコアを算出し、最大のスコアを出力する識別器を持つクラスを、認識対象オンライン文字の認識結果として出力し、認識処理を終了する。
以上説明したように、本実施の形態の文字認識装置によれば、オンライン文字データのストローク上の任意の2点間の相対ベクトルで表される大局的特徴を用いて識別器の学習及び認識対象文字の認識を行うため、筆点座標を特徴値とした場合のように座標のずれに依存せず、かつ局所方向では表現できない文字の大局的な構造情報を使用することができ、筆点座標値や局所方向が変化した場合でも、精度良くオンライン文字を認識することができる。
また、上記のような大局的特徴をブースティング処理により統合した識別器を構築するため、文字認識に適した大局的特徴が効率的に選択及び統合され、識別率を向上させることができる。また、ブースティング処理により識別器を構築することにより、全ての特徴値を用いる場合に比べて、高速に文字を認識することができる。
なお、上記実施の形態では、認識対象の文字をオンライン文字とする場合について説明したが、本発明は、オフライン文字認識にも適用可能である。オフライン文字認識では、文字データの座標値が時系列データではないため、ストロークから特徴点をリサンプリングする際には、ストローク上で等間隔に予め定めた個数の特徴点を抽出すると共に、各特徴点にストロークの一端から他端に向けて順次番号を付与するようにするとよい。
また、上記実施の形態では、学習部と認識部とを同一のコンピュータで構成する場合について説明したが、別々のコンピュータで構成するようにしてもよい。
また、上記実施の形態では、文字認識に用いる特徴値として大局的特徴のみを用いる場合について説明した。相対ベクトルで表される大局的特徴を用いた場合には、座標ずれを吸収することができるが、座標位置が大きく異なる場合でも相対ベクトルが類似している場合に誤認識を生じる場合がある。そこで、特徴値として大局的特徴と共に座標値も用いるようにしてもよい。座標値を特徴値とする場合も、i番目のサンプルのj番目の座標値をPi,j=(Pi,j,x,Pi,j,y)として、上記実施の形態の大局的特徴と同様に扱うことができる。この場合も、上記実施の形態と同様にAdaBoost法を用いることで、座標値自体が文字の重要な構造を表す場合には、その座標値を示す特徴値が弱識別器として採用される。
ここで、文字認識の特徴値として大局的特徴を用いることの有効性について、実験結果を参照しながら説明する。オンライン文字データとして、数字データ“0”から“9”までの数字10クラスが31,386サンプル格納されているデータを用い、全サンプルの内、90%(28,248サンプル)を学習用データとして用い、残りの10%(3,138サンプル)を評価(認識対象)データとして用いた。
前処理として、各数字データのパターンを元のアスペクト比は保存したまま、128×128ピクセルの大きさに正規化した。特徴点のリサンプリングは、N=40点で行った。従って、各サンプルから40個のxy座標値からなる特徴値と780個の大局的特徴とが得られる。なお、本実験においても、上記実施の形態のと同様に、「大局的特徴」は、隣接する2点間の相対ベクトル及び隣接しない2点間の相対ベクトルを含むストローク上の任意の2点間の相対ベクトルで表される特徴値である。
図6は、特徴値として座標値のみを用いた場合(a)、及び大局的特徴を用いた場合(b)において、AdaBoostで学習した際の学習曲線を示す。図6に示す通り、ほぼ全てのクラスにおいて、大局的特徴を用いた場合の方が、より高い学習効率を示している。また、図7及び表1は、AdaBoostで選択し、認識の際に使用した特徴数に対し、座標値を特徴値としたもの(座標値、local)、大局的特徴を使用したもの(大局、global)、座標値と大局的特徴との両方使用したもの(座標値+大局、local+global)、各々の認識率を比較した結果である。
図7及び表1が示すように、大局的特徴を用いた手法では、使用する特徴の数如何にかかわらず、従来の座標値のみを使用する場合よりも、高い認識率を達成可能である。また、両手法を併用した際にさらに高い認識率を達成していることにより、ブースティング処理を用いることにより、同じ特徴の使用数でも、より効率的に有効な特徴を選択し、同じ認識処理量でさらに高い認識率を達成することが可能であることがわかる。
また、本発明は、上記実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
また、本願明細書中において、プログラムが予めインストールされている実施の形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。
10 文字認識装置
20 学習部
22 学習部の特徴値抽出部
24 ブースティング処理部
30 識別器
40 認識部
42 認識部の特徴値抽出部
44 文字認識処理部

Claims (6)

  1. 筆跡が座標系列で表現された複数の学習用文字データ各々から、前記座標系列順において隣接しない2つの座標点間の相対ベクトルを含む2つの座標点間の相対ベクトルを学習用特徴値として複数抽出する学習用抽出手段と、
    前記学習用抽出手段により抽出された学習用特徴値と前記学習用文字データが表す文字とを対応付けて学習することにより、認識対象文字データが表す文字を認識するための識別器を構築する構築手段と、
    を含む文字認識用識別器学習装置。
  2. 前記構築手段は、前記学習用抽出手段により抽出された複数の学習用特徴値から、AdaBoost法により選択された複数の学習用特徴値に対応する複数の弱識別器を生成し、該複数の弱識別器を統合して前記識別器を構築する請求項1記載の文字認識用識別器学習装置。
  3. 筆跡が座標系列で表現された認識対象文字データから、前記座標系列順において隣接しない2つの座標点間の相対ベクトルを含む2つの座標点間の相対ベクトルを認識用特徴値として複数抽出する認識用抽出手段と、
    請求項1または請求項2記載の文字認識用識別器学習装置により構築された前記識別器、及び前記認識用抽出手段により抽出された複数の認識用特徴値を用いて、前記認識対象文字データが表す文字を認識する認識手段と、
    を含む文字認識装置。
  4. 学習用抽出手段と、構築手段とを含む文字認識用識別器学習装置における文字認識用識別器学習方法であって、
    前記学習抽出手段は、筆跡が座標系列で表現された複数の学習用文字データ各々から、前記座標系列順において隣接しない2つの座標点間の相対ベクトルを含む2つの座標点間の相対ベクトルを学習用特徴値として複数抽出し、
    前記構築手段は、前記学習用抽出手段により抽出された学習用特徴値と前記学習用文字データが表す文字とを対応付けて学習することにより、認識対象文字データが表す文字を認識するための識別器を構築する
    文字認識用識別器学習方法。
  5. 認識用抽出手段と、認識手段とを含む文字認識装置における文字認識方法であって、
    前記認識用抽出手段は、筆跡が座標系列で表現された認識対象文字データから、前記座標系列順において隣接しない2つの座標点間の相対ベクトルを含む2つの座標点間の相対ベクトルを認識用特徴値として複数抽出し、
    前記認識手段は、請求項4記載の文字認識用識別器学習方法により構築された前記識別器、及び前記認識用抽出手段により抽出された複数の認識用特徴値を用いて、前記認識対象文字データが表す文字を認識する
    文字認識方法。
  6. コンピュータを、請求項3記載の文字認識装置を構成する各手段として機能させるための文字認識プログラム。
JP2012035047A 2012-02-21 2012-02-21 文字認識用識別器学習装置、方法、文字認識装置、方法、及びプログラム Pending JP2013171441A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012035047A JP2013171441A (ja) 2012-02-21 2012-02-21 文字認識用識別器学習装置、方法、文字認識装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012035047A JP2013171441A (ja) 2012-02-21 2012-02-21 文字認識用識別器学習装置、方法、文字認識装置、方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2013171441A true JP2013171441A (ja) 2013-09-02

Family

ID=49265325

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012035047A Pending JP2013171441A (ja) 2012-02-21 2012-02-21 文字認識用識別器学習装置、方法、文字認識装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP2013171441A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103809694A (zh) * 2014-02-21 2014-05-21 上海分维智能科技有限公司 一种基于智能终端的手写识别儿童智能学习系统
KR101991461B1 (ko) * 2017-12-13 2019-06-20 단국대학교 산학협력단 특징점의 벡터화를 이용한 문자인식 시스템 및 방법
WO2022180725A1 (ja) * 2021-02-25 2022-09-01 株式会社ワコム 文字認識装置、プログラム及び方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103809694A (zh) * 2014-02-21 2014-05-21 上海分维智能科技有限公司 一种基于智能终端的手写识别儿童智能学习系统
KR101991461B1 (ko) * 2017-12-13 2019-06-20 단국대학교 산학협력단 특징점의 벡터화를 이용한 문자인식 시스템 및 방법
WO2022180725A1 (ja) * 2021-02-25 2022-09-01 株式会社ワコム 文字認識装置、プログラム及び方法

Similar Documents

Publication Publication Date Title
JP4787275B2 (ja) セグメント化ベースの認識
Parui et al. Online handwritten Bangla character recognition using HMM
TWI321294B (en) Method and device for determining at least one recognition candidate for a handwritten pattern
Awal et al. First experiments on a new online handwritten flowchart database
Arandjelović et al. Sketch recognition by fusion of temporal and image-based features
Stern et al. Most discriminating segment–Longest common subsequence (MDSLCS) algorithm for dynamic hand gesture classification
Mori et al. Global feature for online character recognition
Kim et al. Improving discrimination ability of convolutional neural networks by hybrid learning
Zarro et al. Recognition-based online Kurdish character recognition using hidden Markov model and harmony search
Al-Helali et al. A statistical framework for online Arabic character recognition
US7580573B2 (en) Segmentation-based recognition
JP2013171441A (ja) 文字認識用識別器学習装置、方法、文字認識装置、方法、及びプログラム
Bresler et al. Detection of arrows in on-line sketched diagrams using relative stroke positioning
Chen et al. Simple, fast and accurate hyper-parameter tuning in Gaussian-kernel SVM
Tang et al. Online chemical symbol recognition for handwritten chemical expression recognition
JP2015052994A (ja) 特徴選択装置、学習装置、方法、及びプログラム
Mori et al. How important is global structure for characters?
Bouchaffra Embedding HMMs-based models in a Euclidean space: the topological hidden Markov models
US9042641B2 (en) Character recognition apparatus, character recognition method, and computer-readable medium
Wang et al. On-line signature verification using segment-to-segment graph matching
JP2020177318A (ja) 照合装置、学習装置、方法、及びプログラム
Aksela et al. Adaptive combination of adaptive classifiers for handwritten character recognition
Tang et al. Connected bond recognition for handwritten chemical skeletal structural formulas
Nahar Bangla Handwritten Character Recognition Method
Bhokse et al. Devnagari handwriting recognition system using dynamic time warping algorithm