JPH09282415A

JPH09282415A - 情報処理方法

Info

Publication number: JPH09282415A
Application number: JP8091091A
Authority: JP
Inventors: Hiroto Yoshii; 裕人吉井
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1996-04-12
Filing date: 1996-04-12
Publication date: 1997-10-31

Abstract

(57)【要約】【課題】ストロークの大局的構造特性をうまく反映
し、かつ、カテゴリー間の競合関係をうまく反映したベ
クトルの分類木を生成すること。【解決手段】上位から下位へとピラミッド型に階層化
されたベクトル系列（２−２−２）において、上位から
順に下位へと分類効率の最大となるベクトルについて選
択的にベクトルの組を生成して（Ｓ１００７）分類木を
作成する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、情報処理方法に関
し、特に、ペン等の軌跡入力手段により入力されたスト
ロークを認識する為の情報処理方法に関するものであ
る。

【０００２】

【従来の技術】従来、手書き文字認識を行う方法とし
て、分類木を用いて段階的にパターンをカテゴリーに選
別していく方法がある。例えば、特公平６−５２５３７
に記載されているパターン認識方法は、特徴軸に順番を
付けて、その順番に従ってカテゴリー分けを行ってい
る。

【０００３】

【発明が解決しようとする課題】しかしながら、従来の
分類木を用いた認識方法では、ノードを作っていく際
に、個々の特徴量のみに注目しているので、パターンの
大局的な様子を判断できない。

【０００４】特に、特公平６−５２５３７に従って分類
木を作成し、この分類木を用いて手書き文字認識を行う
と、高い認識率を達成することができなかった。

【０００５】かといって、特徴量の多いパターンを認識
するための分類木を作るためには、計算機での計算時間
の問題から、特公平６−５２５３７のように、各々のノ
ードで特徴軸を選ぶ方法を用いなければならないという
ジレンマがあった。

【０００６】本発明は、上記従来例に鑑みてなされたも
ので、特徴量の多いパターンの大局的構造特性をうまく
反映し、かつ、カテゴリー間の競合関係をうまく反映し
たストロークベクトルの分類木を生成する方法と、生成
された分類木を用いて、高速で高認識率の文字認識を行
う方法を提供することを目的とする。

【０００７】

【課題を解決する為の手段】上記課題を解決する為に、
本発明は、ベクトル列と、該ベクトル列における近傍ベ
クトルを合成して生成されるより上位のベクトル列とが
対応している階層化ベクトル系列を記憶し、前記階層化
ベクトル系列の上位のベクトル列から所定のエントロピ
ーが最大となるベクトルを選択し、前記選択されたベク
トルについて下位のベクトル列の組に展開して分類木を
作成する情報処理方法あるいはコンピュータ可読メモリ
を提供する。

【０００８】上記課題を解決する為に、本発明は、好ま
しくは前記ベクトル列は、一ストロークデータを分割
し、各分割ストロークをベクトル量子化して得たものと
する。

【０００９】上記課題を解決する為に、本発明は、好ま
しくは前記ベクトルの選択は、分類効率が最大となるベ
クトルを選択する。

【００１０】上記課題を解決する為に、本発明は、好ま
しくはストロークを入力し、前記入力したストロークを
分割して各区間のストロークをベクトル量子化してベク
トル列を生成し、前記ベクトル列における近傍ベクトル
を合成してより上位のベクトル列を生成し、前記生成さ
れる下位から上位のベクトル列により構成される階層化
ベクトル系列を記憶し、前記記憶した階層化ベクトル系
列のより上位のベクトル列から下位に向かって順に、前
記分類木をたどって認識する。

【００１１】上記課題を解決する為に、本発明は、好ま
しくはデジタイザを利用し、該デジタイザにより前記ス
トロークの入力を行う。

【００１２】上記課題を解決する為に、本発明は、好ま
しくは前記認識結果を表示する。

【００１３】

【発明の実施の形態】はじめに、本実施の形態の文字認
識方法とその装置のポイントを説明した後、その詳細な
説明に入るものとする。

【００１４】本実施の形態の文字認識方法は、学習用ス
トロークを分割し、この分割されたストローク切片をベ
クトル量子化し、その結果得られたベクトル系列を階層
的に処理し、階層化されたベクトル系列に基づいて、分
類木を作成する。

【００１５】また、ベクトル系列を階層的に処理する工
程では、学習用ストロークを構成するベクトル系列情報
を段階的に縮退する。

【００１６】また、分類木を作成する場合、上の階層で
カテゴリーの競合が最も激しく、かつ、すぐ下の階層で
カテゴリーがよく分離されるベクトルを、後述するエン
トロピー基準に基づいて選び、その結果に基づき縮退さ
れたベクトルを下の階層に向かって展開する。

【００１７】また、オンライン手書き文字認識用辞書
は、上述の分類木を内容として保持する。

【００１８】さらに、上述の分類木に基づいて、ユーザ
ーが筆記したストロークのカテゴリーを判別する。

【００１９】以下、図面に基づいて、本発明に係る一実
施の形態の文字認識方法とその装置を説明する。

【００２０】尚、以下、本発明に係る第１、第２の実施
の形態の主題はそれぞれ、分類木の構造とその作成方
法、生成された分類木を用いた文字認識方法である。

【００２１】＜実施の形態１＞図１は、本実施の形態の
オンライン手書き文字認識方法が適用される情報処理装
置のハード構成の一例を示す図である。

【００２２】本実施の形態のオンライン手書き文字認識
装置は、ストローク入力装置４０１、表示装置４０２、
中央処理装置（ＣＰＵ）４０３、メモリ４０４から、主
に構成される。

【００２３】ストローク入力装置４０１は、例えば、デ
ジタイザとペンを有し、デジタイザの上にペンによって
入力された文字や図形の座標データをＣＰＵ４０３に渡
す。

【００２４】表示装置４０２は、ストローク入力装置４
０１に入力されたストロークデータやＣＰＵ４０３が認
識した結果を表示する。

【００２５】ＣＰＵ４０３は、入力されたストロークデ
ータで構成される文字や図形の認識を行ったり、装置全
体の制御を行ったりする。

【００２６】メモリ４０４は、ＣＰＵ４０３が使用する
認識プログラムや辞書を記憶したり、入力されたストロ
ークデータ、認識プログラムの使用する変数等を一時的
に記憶する。

【００２７】図２は、本実施の形態のオンライン手書き
文字認識方法が適用される情報処理装置における主にメ
モリ内の構造を示すものである。１は図１にも４０３と
して示したＣＰＵであり、後述するメモリ２に格納され
ている制御プログラムに従って、本実施の形態において
説明する各処理を実行するものである。後述するフロー
チャートの処理も、実行の為の制御プログラムがメモリ
２に格納され、ＣＰＵ１により実行されるのは同様であ
る。

【００２８】メモリ２は、ＣＰＵ１が各処理を実行する
為の制御プログラムを格納するプログラム部２−１と、
各種パラメータやデータを格納するデータ部２−２とを
有する。プログラム部は、例えば図１０のフローチャー
トの個々の部品がサブルーチンプログラム２−１−１〜
２−１−３として格納される。このサブルーチンプログ
ラムは注目ノードの状態を判別するＳ１００１の処理プ
ログラムであり、ノードを削除するＳ１００２の処理プ
ログラムであり、リーフノードとしてのＳ１００５の処
理プログラムであり、適切なベクトルを選択するＳ１０
０６の処理プログラムであり、ベクトルの組みの枝を生
成するＳ１００７の処理プログラムであり、作成された
分類木を利用して入力パターンを認識するプログラムで
ありと、各処理についてのサブルーチンがプログラム部
２−１に格納される。後述する各処理の実行時には、必
要に応じてメモリ２の制御プログラムを読み出し、ＣＰ
Ｕ１が実行する。データ部２−２には、個々の学習パタ
ーンを暫定的に保持する学習パターンバッファ２−２−
１と、各学習パターンから得たベクトルデータのピラミ
ッド展開したパターンを保持するエリア２−２−２と、
作成途中の分類木を保持する分類木バッファ２−２−３
を有する。

【００２９】ＨＤＤ（ハードディスクドライブ）３は、
全学習パターンを保持し、本実施の形態で説明する方法
により作成された分類木のデータを保持する。

【００３０】ここで、メモリ２は、装置内蔵のＲＯＭ，
ＲＡＭ，ＨＤ等とし、予めプログラム及びデータを格納
しておいても良いし、或は装置本体に着脱可能なＦＤや
ＣＤ−ＲＯＭ等の記憶媒体から処理に先立ってプログラ
ムやデータを読み込むようにしても良い。また、公衆回
線やＬＡＮ等の通信手段を介して他の装置からプログラ
ムやデータを読み込むようにしても良い。

【００３１】図３は、本発明に係る一実施の形態のオン
ライン手書き文字認識用の辞書作成方法を最もよく表わ
す処理フロー図である。

【００３２】図３において、Ｓ１０１は「学習用ストロ
ークの入力ステップ」、Ｓ１０２は入力した「学習用ス
トローク」を分割する「ストローク分割ステップ」であ
る。

【００３３】また、Ｓ１０３は、「ストローク分割ステ
ップ」において分割されたストローク切片をベクトル量
子化する「ベクトル化ステップ」である。

【００３４】Ｓ１０４は、「ベクトル化ステップ」の処
理の結果得られたベクトル系列を階層的に処理する「階
層化前処理ステップ」である。

【００３５】１０５は、「階層化前処理ステップ」で生
成された「階層化されたベクトル系列」である。

【００３６】Ｓ１０６は、「階層化されたベクトル系
列」に基づいて、分類木を作成する「分類木作成ステッ
プ」である。

【００３７】Ｓ１０７は、「分類木作成ステップ」が分
類木を作成する過程で使用する「展開ベクトル判別ステ
ップ」である。

【００３８】１０８は最終的に生成された「分類木」で
ある。

【００３９】本実施の形態におけるインプットは、１０
１の「学習用ストローク」で、アウトプットは１０８の
「分類木」となり、このデータはＨＤＤ３に記憶され
る。

【００４０】以下、図４から図８に基づいて、本発明に
係る一実施の形態の文字認識処理における分類木作成処
理の方法を以下に説明する。

【００４１】ここで、理解を容易にするために、認識対
象のカテゴリーとして、１画で書かれた「く」「し」
「つ」の３種類の文字を想定して説明する。

【００４２】そして、辞書作成用の学習パターンは
「く」「し」「つ」それぞれに対し１００個存在すると
仮定する。ここで、これらを、ＴＰｉ，ｊ（ＴｒａｉｎｉｎｇＰａｔｔｅｒｎ
ｉ，ｊ）ここで、ｉはカテゴリー「つ」，「く」，「し」を表わ
すサフィックスで、０＜＝ｉ＜＝２の範囲の値をとる。また、ｊは学習パターンナンバーを
示すサフィックスで、ここでは各カテゴリーについて１
００個の学習パターンを入力するので、１＜＝ｊ＜＝１００の範囲の値をとるものとする。

【００４３】本実施の形態のオンライン手書き文字認識
用辞書作成方法は、図４のフローチャートに示すよう
に、ベクトル生成フェーズ、階層化前処理フェーズ、分
類木作成フェーズの３段階のステップをへて実行され
る。以下、各フェーズの説明を行う。

【００４４】（１）ベクトル生成フェーズ図５に基づいて、ベクトル生成フェーズの様子を詳しく
述べる。

【００４５】まず、学習用ストロークはｎ分割（図５の
例ではｎ＝８となっている）される。図５では、このｎ
分割は、ストローク距離に関するｎ等分となっている
が、本発明ではこれに制限されるものではない。

【００４６】例えば、始点終点付近のストロークの状態
が不安定なストローク入力装置であれば、始点終点付近
のストロークをいくら詳しくベクトル化してもあまり意
味がない。この様な場合は、ｎ分割における最初と最後
の分割は、その他の分割に比べて長くとっても構わな
い。

【００４７】次に、ｎ分割されたそれぞれの切片がベク
トル量子化される。

【００４８】図５においては、番号０から番号１１まで
の１２方向の基本ベクトルに量子化している。この基本
ベクトルの方向は、３６０度の中で等間隔に並んでいる
が、本発明は、これに制限されるものではない。

【００４９】例えば、図５の１２方向の基本ベクトルの
中で、実際左上方向の（例えば番号１０や番号１１）基
本ベクトルは、筆記ストロークの中にはあまり出てこな
い。よって、これらの部分はもっと角度の間隔の開いた
基本ベクトルのセットを用いてもよい。

【００５０】以上ベクトル生成フェーズにおいて、図２
のストローク分割ステップとベクトル化ステップが学習
用ストロークすべてに施される。

【００５１】図５の例でいうと、入力例のストロークが
基本ベクトル系列「１２４５５４２１」に変換される。

【００５２】（２）階層化前処理フェーズ次に、ベクトル化された学習用ストロークは、ピラミッ
ド上に階層化前処理が施される。

【００５３】図６にその１例を示す。

【００５４】図６に於いては、ベクトル化ステップの結
果得られたベクトル系列の隣り合う２個のベクトルの平
均ベクトルを上の階層に格納することによって、ベクト
ル情報が順次半分になっている（言い換えれば、縮退し
ている）。

【００５５】結局、図５において、８個の基本ベクトル
系列で表されたストロークを、順次４個、２個、１個の
ベクトルに変換することになる。

【００５６】この隣り合う２個のベクトルを平均する１
方法を、図７に基づいて詳しく述べる。

【００５７】尚、図６においては、基本ベクトルを１２
方向としたが、説明の便宜上、図７では８方向とする。
この様に、基本ベクトルの総数や個々の基本ベクトルの
方向が変わっても、本発明の本質は変らない。

【００５８】以下、基本ベクトルは８方向であるという
前提で、以下の説明を行う。また、隣り合う２個のベク
トルの最初の番号を、ｐｅｒ、後の番号をｐｏｓｔで示
すことにする。

【００５９】この時、２個のベクトルの平均は単純に
は、（ｐｒｅ＋ｐｏｓｔ）／２となるが、これが基本ベクトルにならない場合が存在す
る。

【００６０】一般的に、８方向の等分割ベクトルと８方
向の等分割ベクトルの平均ベクトルは１６方向存在する
ので、これを８方向にしなくてはいけない。

【００６１】図７はこの方法を示している。

【００６２】図７の「→」（８００）は、上の階層で右
向き（番号２）のベクトルが存在することを意味し、そ
の下に書かれた８組のベクトルは、下の階層で存在しう
るベクトルの組を意味する。

【００６３】つまり、上の階層で番号２のベクトルにな
る（ｐｒｅ，ｐｏｓｔ）の組は、（２，２）、（１，３）（３，１）、（０，４）（２，３）、（３，２）（１，４）、（４，１）の８組存在する。これは、ｐｒｅとｐｏｓｔの値の平均
（ｐｒｅ＋ｐｏｓｔ）／２が１．５より大、かつ２．５
以下という条件の元で成立する組である。

【００６４】上の階層のベクトルの番号が番号２以外の
場合は、番号２と同様の考えに基づき、図７のベクトル
組み合わせを全て４５度ずつ回転して得られるベクトル
組み合わせを用いる。

【００６５】尚、この上の階層のベクトルと下の階層の
２個のベクトルの組み合わせは図７に限ったものではな
く、上の階層のベクトルが下の階層の２個の平均ベクト
ルと見なせうる組み合わせであれば、何でもよい。

【００６６】（３）分類木作成フェーズ階層化前処理フェーズ（２）を経て、学習用ストローク
（ＴＰｉ，ｊ）の全てが、図６に示すようなベクトルの
ピラミッド形式に下から上へ展開される。ここでの例で
は、「く」「し」「つ」の各カテゴリーについて各々１
００個の学習用ストロークが用いられているので、合計
３００個の学習用ストロークについてピラミッド展開が
行われ、メモリ２に格納される。分類木の作成は、この
ベクトルのピラミッド化とは逆に、上から下へ行われ
る。

【００６７】なお、以下の説明においては、基本ベクト
ルは図７にある番号０から番号７までの８方向（個）で
あると仮定する。この場合、ベクトルのピラミッド上に
あるベクトルも全てこの基本ベクトルのどれかである。

【００６８】最上位の層のベクトルの状態は８個存在す
るので、ルートノードから８本の枝が伸びることになる
（図８）。

【００６９】このとき、枝に存在する学習用ストローク
（ＴＰｉ，ｊ）の数を数える。この結果によって、以後
の処理が３つにわかれる。

【００７０】１学習用ストローク（ＴＰｉ，ｊ）が１
つも存在しない場合：この場合は、その枝を削除する。

【００７１】２学習用ストローク（ＴＰｉ，ｊ）の中
で、あるカテゴリー（例えば「つ」）のストロークのみ
存在する場合：この場合は、この枝を葉とし、カテゴリ
ーの番号（例えば「つ」）を割り振る。

【００７２】３上記１、２以外の場合、即ち、複数カ
テゴリーのストロークが混在して存在する場合：この場
合、この枝をノードとして、更に分類木作成を続ける。

【００７３】図８に、この処理の結果を示す。図８は、
枝の状態を、図６の最上位の層（以下、第１層と呼ぶ）
のベクトルを図示することによって示している。

【００７４】存在するカテゴリーの種類の欄が「×」と
なっている枝は、学習用ストローク（ＴＰｉ，ｊ）が１
つも存在しない場合に相当し、削除される。

【００７５】左から３番目の枝は、「つ」のカテゴリー
の学習用ストロークしか存在しない。これは、学習用ス
トローク（ＴＰｉ，ｊ）の中で、あるカテゴリー（例え
ば「つ」）のストロークのみが存在する場合に相当し、
葉となる。

【００７６】例えば、左から４番目と５番目の枝には
「く」「し」「つ」のカテゴリーの学習用ストロークが
存在し、上記１、２以外の場合、即ち、複数カテゴリー
のストロークが混合して存在する場合に相当し、ノード
となる。

【００７７】次に、このノードから枝を作成する方法に
ついて述べる。

【００７８】このノードから枝を作成する際に、最も効
率の良い枝の作成を行ないたい。最も効率が良いとは、
結局、枝を展開した時に、最も多くカテゴリーに関する
情報が得られるということである。

【００７９】以下、展開した時に最も効率の良くなるベ
クトルを選ぶ方法を説明する。

【００８０】あるノードに存在する学習用ストローク
（ＴＰｉ，ｊ）の中で、カテゴリー番号ｉが同一の学習
用ストロークの数をＮｉで表わす。また、このノードに
存在する学習用ストロークの総数をＮとすると、このノ
ードにおけるそれぞれのカテゴリーの存在確率ｐｉは、ｐｉ＝Ｎｉ／Ｎで表される。また、あるノードのカテゴリーの種類の数
を、例えば、２とすれば、

【００８１】

【外１】よって、このノードの情報が得られた時のエントロピー
は、以下の式で表される。

【００８２】

【外２】（１）

【００８３】次に、このノードにおいて、そのノードで
の一つの学習用ストロークを構成するベクトルからある
ベクトルを選択して、そこから枝を展開した時のエント
ロピーの減少量を計算する。

【００８４】上述のとおり、１つのベクトルを下の層に
むかって展開した時の枝の数は８本である。この８本の
枝に学習用ストローク（ＴＰｉ，ｊ）がどの様に分布す
るかを、展開したときの枝に存在する各カテゴリーごと
の学習用ストローク（ＴＰｉ，ｊ）の数、即ち、Ｎｉ，ｂで表す。Ｎｉ，ｂのｉはカテゴリー番号を示し、ｂは枝
（ｂｒａｎｃｈ）の番号を示す。よって、ｂの値は１≦
ｂ≦８の範囲を取る。

【００８５】このとき、それぞれの枝の情報が得られた
ときのエントロピーは、上の議論と同じく、

【００８６】

【外３】（２）この式で、

【００８７】

【外４】はｂ番目の枝に存在する学習用ストローク（ＴＰｉ，
ｊ）の全てのカテゴリーについて総合した総数を表す。

【００８８】それぞれの枝にいく確率は、Ｎｂ／Ｎここで、Ｎは（１）式のＮと同じである。そのため、枝
を展開したときの平均エントロピーは、

【００８９】

【外５】（３）となる。

【００９０】結局、エントロピーの平均減少値は、

【００９１】

【外６】（４）となる。

【００９２】そして、Ｋの値を枝の数の対数で割った値

【００９３】

【外７】（５）が、枝を展開したときの分類効率を表す。

【００９４】この値が最高となるベクトルを選び、枝を
展開していく。

【００９５】なお、１つのベクトルのみを展開するので
はなく、複数のベクトルのグループに関して枝を展開し
てもよい。この場合、（５）式のＢｒａｎｃｈＮｕｍｂ
ｅｒは、（選択されたベクトルの数）×８となる。

【００９６】尚、本実施の形態においては、（５）式で
表される値を枝を展開したときの分類効率を表わす値と
して採用したが、例えば、文献「Ｃｌａｓｓｆｉｃａｔ
ｉｏｎａｎｄＲｅｇｒｅｓｓｉｏｎＴｒｅｅｓ」
に記載されている”Ｇｉｎｉｃｒｉｔｅｒｉｏｎ”等の
枝の展開効率を表す関数ならば（５）式に限らず何でも
よいことは言うまでもない。

【００９７】以上、展開するベクトル、またはベクトル
の組が決定されれば、それに従って、枝を展開し、葉及
びノードを作成していく。そして、最後、全部、葉にな
ったところで、分類木作成を完了する。

【００９８】以上説明した処理をフローチャートとして
表現した図が図１０である。以下、図９に示したような
分類木の生成手順を説明する。

【００９９】まず、ステップＳ１０００では、注目ノー
ドをルートノード（図９２００）とする。

【０１００】ステップＳ１００１では、設定された注目
ノードに関して、以下の３条件、即ち、１．学習用ストロークが存在する。２．単一カテゴリー学習パターンのみが存在する。３．複数のカテゴリーの学習パターンが存在する。のどれに当てはまるかチェックして、１．の条件を満た
せば、ステップＳ１００２へ進む。また、２．の条件を
満たせば、ステップＳ１００５へ進む。また、３．の条
件を満たせば、ステップＳ１００６へ進む。

【０１０１】ステップＳ１００２では、分類木からその
ノードを削除する。

【０１０２】ステップＳ１００３では、他の全ノード
は、全てリーフノードになったかどうかチェックして、
イエスであれば、処理を終了する。また、ノーであれ
ば、ステップＳ１００４に進み、注目ノードとして次の
ノードを選ぶ。そして、ステップＳ１００１に戻り、同
様の処理を繰り返す。

【０１０３】ステップＳ１００５では、そのノードをリ
ーフノードとして、そのカテゴリー番号をアサインす
る。そして、ステップＳ１００３に進む。

【０１０４】ステップＳ１００６では、そのノードに含
まれるベクトル列の中から、上述のエントロピー基準に
基づいて、そのベクトル列中の１つのベクトルを選択す
る。

【０１０５】ステップＳ１００７では、選択されたベク
トルの下位階層のベクトルの組の枝を生成する。

【０１０６】図１１は、このステップでの処理を説明す
るための図であり、下位階層のベクトルの組の例を示
す。

【０１０７】図１１を参照して、５０００が、ステップ
Ｓ１００６で選択された方向”２”を有するベクトルで
あるとする。このベクトルに対応する下位層でのベクト
ルの組は、８通りの組み合わせベクトル、即ち、５００
１、５００２、５００３、５００４、５００５、５００
６、５００７、５００８が存在する。そして、これらの
組み合わせベクトルの各々を新しいノードとする各枝を
生成する。

【０１０８】以上、ステップＳ１００７での処理の具体
例を示した。

【０１０９】次に、ステップＳ１００８へ進み、生成さ
れた枝のノードの１つを次の注目ノードとする。そし
て、ステップＳ１００１へ戻り、同様の処理を繰り返
す。

【０１１０】以上説明した手順によって、図８に示すよ
うな分類木を生成することにより、特徴量の多いストロ
ークパターンの大局的分類を維持しながら、類似のカテ
ゴリー間の細かい特徴の違いを反映した分類木を生成で
き、この分類木を探索することで、高速かつ高認識率の
文字認識が可能になる。

【０１１１】尚、本実施の形態では、学習ストロークが
１本という前提で、本発明に係わるオンライン手書き文
字認識用の辞書作成方法を述べてきたが、実際には何本
のストロークが入力文字として切り出されるシステムで
あっても、それぞれのストロークを本実施の形態と同様
に処理することによって対応できることも言うまでもな
い。

【０１１２】次に、図９の分類木の生成について、更
に、具体的に説明する。

【０１１３】図９は、図８を更に下の階層まで表示した
図で、削除した枝は省いてある。図９の四角（□）で囲
ってある枝は葉であることを示す。

【０１１４】葉以外の全ての枝はノードとなるので、更
に、深く枝の展開が行われるわけであるが、図９におい
ては、左から２番目のノード（２０１）に関する更なる
枝の展開結果を図示した。

【０１１５】左から２番目のノード（２０１）は、
「く」「し」「つ」の３種類のカテゴリーが共存してお
り、枝の展開が必要となっている。

【０１１６】このノードの状態を表現するベクトルは１
つしか存在しない（○の中に表示されているベクトル）
ので、展開するべきベクトルは一意的に決定する。この
時の展開するベクトルの組み合わせは、図７に記載され
ているベクトルの組みに準ずる。つまり、上の階層のベ
クトルが右下の方向（番号３）のベクトルでありうる下
の階層の２個のベクトルの８つの組合わせに相当する枝
の展開が行われる。この状況は図６において、ベクトル
の展開が第２層まで進んだことを意味する。

【０１１７】更に、展開した左から２番目の枝のノード
（２０２）には「し」「く」の２つのカテゴリーが存在
する。よって、更なる枝の展開が必要になる。ここで、
ノードを表現する２個のベクトルのうち、どのベクトル
を展開すべきかについて、「展開ベクトル判別ステッ
プ」（Ｓ１０７）での処理で、最初のベクトルという答
えを出したとする。すると、最初のベクトルの状態に関
して、上の階層と同様に８本の枝が展開され、ある枝は
削除され、ある枝は葉となり、ある枝はノードとなる。
ノードとなった枝は、更に展開しなければならなく、最
終的に全ての枝の末端は葉となる。

【０１１８】＜実施の形態２＞第２の実施の形態では、
上述実施の形態で示した処理手順により生成された分類
木を探索して、オンライン手書き文字の認識を行う認識
方法を説明する。

【０１１９】図１２は、本実施の形態のオンライン手書
き文字認識方法が適用される情報処理装置における主に
メモリ内の構造を示すものである。１２０１は図１にも
４０３として示したＣＰＵであり、後述するメモリ１２
０２に格納されている制御プログラムに従って、本実施
の形態において説明する各処理を実行するものである。
後述するフローチャートの処理も、実行の為の制御プロ
グラムがメモリ２に格納され、ＣＰＵ１２０１により実
行されるのは同様である。

【０１２０】メモリ１２０２は、ＣＰＵ１２０１が各処
理を実行する為の制御プログラムを格納するプログラム
部１２０２−１と、各種パラメータやデータを格納する
データ部１２０２−２とを有する。プログラム部は、例
えば図１３のフローチャートの個々の部品がサブルーチ
ンプログラムとして格納される。このサブルーチンプロ
グラムはストロークを分割するＳ３０２の処理プログラ
ムであり、ベクトル化するＳ３０３の処理プログラムで
あり、階層化前処理のＳ３０４の処理プログラムであ
り、カテゴリー判別のＳ３０７の処理プログラムであ
り、と、各処理についてのサブルーチンがプログラム部
１２０２−１に格納される。後述する各処理の実行時に
は、必要に応じてメモリ１２０２の制御プログラムを読
み出し、ＣＰＵ１２０１が実行する。データ部１２０２
−２には入力装置１２０４から入力した、ユーザ記入の
入力パターンを保持するバッファと、その入力パターン
から得たベクトルデータのピラミッド展開したパターン
を保持するエリアと、入力パターンの認識候補を保持す
るバッファを有する。

【０１２１】ＨＤＤ（ハードディスクドライブ）１２０
３は、先の実施の形態で説明した方法により作成された
分類木のデータを保持する。

【０１２２】ここでメモリ１２０２は、装置内蔵のＲＯ
Ｍ、ＲＡＭ、ＨＤ等とし、予めプログラム及びデータを
格納しておいても良いし、或は装置本体に着脱可能なＦ
ＤやＣＤ−ＲＯＭ等の記憶媒体から処理に先立ってプロ
グラムやデータを読み込むようにしても良い。また、公
衆回線やＬＡＮ等の通信手段を介して他の装置からプロ
グラムやデータを読み込むようにしても良い。

【０１２３】図１３は、この処理手順を最もよく表わす
フローチャートである。

【０１２４】図１３を参照して、３０１は、ユーザーが
入力した「筆記ストローク」のデータを示す。この筆記
ストロークは、第１の実施の形態で示した「学習用スト
ローク」（１０１）と同様のものである。

【０１２５】ステップＳ３０２は、「筆記ストローク」
を分割する「ストローク分割ステップ」である。

【０１２６】ステップＳ３０３は、前記「ストローク分
割ステップ」において分割されたストローク切片をベク
トル量子化する「ベクトル化ステップ」、ステップＳ３
０４は、前記「ベクトル化ステップ」の結果得られたベ
クトル系列を階層的に処理する「階層化前処理ステッ
プ」である。

【０１２７】そして、３０５は、「階層化前処理ステッ
プ」で処理された後の「階層化されたベクトル系列」で
ある。

【０１２８】ステップＳ３０７は、「階層化されたベク
トル系列」（３０５）を元に「分類木」（３０６）の分
類内容に従って、「筆記ストローク」（３０１）のカテ
ゴリーを決定する「カテゴリー判別ステップ」である。

【０１２９】ここで、「分類木」（３０６）は、カテゴ
リー分類に必要な情報をまとめた分類木であり、その内
容は、第１の実施の形態ですでに説明した方法で作成し
うる分類木であることが望ましい。

【０１３０】尚、上述の「ストローク分割ステップ」
（Ｓ３０２）、「ベクトル化ステップ」（Ｓ３０３）、
「階層化前処理ステップ」（Ｓ３０４）の３つのステッ
プでの処理はそれぞれ、第１の実施の形態の「ストロー
ク分割ステップ」（Ｓ１０２）、「ベクトル化ステッ
プ」（Ｓ１０３）、「階層化前処理ステップ」（Ｓ１０
４）の各処理３つのステップでの処理と同様である。

【０１３１】また、「階層化されたベクトル系列」（３
０５）については、第１の実施の形態での場合は、学習
パターンの数だけ存在したが、本実施の形態において
は、筆記されたストロークから導き出された１つのみで
ある。

【０１３２】また、「カテゴリー判別ステップ」（Ｓ３
０７）では、図９の分類木に基づき、「階層化されたベ
クトル系列」（３０５）をたぐって葉に到達した時点
で、その葉に存在するカテゴリーを認識結果として出力
する。

【０１３３】尚、本発明は、複数の機器から構成される
システムに適用しても、１つの機器からなる装置に適用
しても良い。また、本発明はシステム或は装置にプログ
ラムを供給することによって実施される場合にも適用で
きることは言うまでもない。この場合、本発明に係るプ
ログラムを格納した記憶媒体が本発明を構成することに
なる。そして、該記憶媒体からそのプログラムをシステ
ム或は装置に読み出すことによって、そのシステム或は
装置が、予め定められた仕方で動作する。

【０１３４】以上説明したように、本実施の形態によれ
ば、第１の実施の形態の分類木生成方法によって生成さ
れた、カテゴリー間の競合関係をうまく反映したストロ
ークベクトルの分類木を用いることで、極めて高速で認
識率の高いオンライン手書き文字認識を実現できる。

【０１３５】

【発明の効果】以上説明したように本発明によれば、特
徴量の多いパターンの大局的構造特性をうまく反映し、
かつ、カテゴリー間の競合関係をうまく反映したストロ
ークベクトルの分類木を生成でき、生成された分類木を
用いて、高速で高認識率の文字認識が可能となる。

【図面の簡単な説明】

【図１】本発明の一実施の形態の情報処理方法が適用さ
れる情報処理装置の構成を示すブロック図である。

【図２】本発明の一実施の形態の情報処理装置の構成図
である。

【図３】本発明の一実施の形態のオンライン手書き文字
認識辞書の生成方法を表わす図である。

【図４】本発明の一実施の形態のオンライン手書き文字
認識辞書の生成方法の処理の流れを示すフローチャート
である。

【図５】ストローク生成フェーズの処理を説明するため
の図である。

【図６】階層化されたベクトル系列を示す図である。

【図７】ベクトル平均化処理を説明するための図であ
る。

【図８】分類木の様子を示す図である。

【図９】オンライン手書き文字認識辞書の分類木のデー
タ構成を表わす図である。

【図１０】第１の実施の形態の分類木生成処理の詳細な
フローチャートである。

【図１１】図１０のステップＳ１００７の枝生成の一例
を示した図である。

【図１２】第２の実施の形態の情報処理装置の構成図で
ある。

【図１３】第２の実施の形態のオンライン手書き文字認
識処理を示す図である。

Claims

【特許請求の範囲】

【請求項１】ベクトル列と、該ベクトル列における近
傍ベクトルを合成して生成されるより上位のベクトル列
とが対応している階層化ベクトル系列を記憶し、前記階層化ベクトル系列の上位のベクトル列から所定の
エントロピーが最大となるベクトルを選択し、前記選択されたベクトルについて下位のベクトル列の組
に展開して分類木を作成することを特徴とする情報処理
方法。
【請求項２】前記ベクトル列は、一ストロークデータ
を分割し、各分割ストロークをベクトル量子化して得た
ものとすることを特徴とする請求項１に記載の情報処理
方法。
【請求項３】前記ベクトルの選択は、分類効率が最大
となるベクトルを選択することを特徴とする請求項１に
記載の情報処理方法。
【請求項４】ストロークを入力し、前記入力したストロークを分割して各区間のストローク
をベクトル量子化してベクトル列を生成し、前記ベクトル列における近傍ベクトルを合成してより上
位のベクトル列を生成し、前記生成される下位から上位のベクトル列により構成さ
れる階層化ベクトル系列を記憶し、前記記憶した階層化ベクトル系列のより上位のベクトル
列から下位に向かって順に、前記分類木をたどって認識
することを特徴とする請求項１に記載の情報処理方法。
【請求項５】デジタイザを利用し、該デジタイザによ
り前記ストロークの入力を行うことを特徴とする請求項
に記載４の情報処理方法。
【請求項６】前記認識結果を表示することを特徴とす
る請求項４に記載の情報処理方法。
【請求項７】ベクトル列と、該ベクトル列における近
傍ベクトルを合成して生成されるより上位のベクトル列
とが対応している階層化ベクトル系列を利用し、前記階層化ベクトル系列の上位のベクトル列から所定の
エントロピーが最大となるベクトルを選択し、前記選択されたベクトルについて下位のベクトル列の組
に展開して分類木を作成することを特徴とするコンピュ
ータ可読メモリ。
【請求項８】前記ベクトル列は、一ストロークデータ
を分割し、各分割ストロークをベクトル量子化して得た
ものとすることを特徴とする請求項７に記載のコンピュ
ータ可読メモリ。
【請求項９】前記ベクトルの選択は、分類効率が最大
となるベクトルを選択することを特徴とする請求項７に
記載のコンピュータ可読メモリ。
【請求項１０】学習用ストロークを入力し、前記入力したストロークを分割して各区間のストローク
をベクトル量子化してベクトル列を生成し、前記ベクトル列における近傍ベクトルを合成してより上
位のベクトル列を生成して前記階層化ベクトル系列を、
生成することを特徴とする請求項７に記載のコンピュー
タ可読メモリ。
【請求項１１】前記学習用ストロークを記憶した記憶
媒体から学習用ストロークを読取ることを特徴とする請
求項７に記載のコンピュータ可読メモリ。
【請求項１２】ストロークを入力し、前記入力したストロークを分割して各区間のストローク
をベクトル量子化してベクトル列を生成し、前記ベクトル列における近傍ベクトルを合成してより上
位のベクトル列を生成し、前記生成される下位から上位のベクトル列により構成さ
れる階層化ベクトル系列を記憶し、前記記憶した階層化ベクトル系列のより上位のベクトル
列から下位に向かって順に、前記分類木をたどって認識
することを特徴とする請求項７に記載のコンピュータ可
読メモリ。
【請求項１３】デジタイザを利用し、該デジタイザに
より前記ストロークの入力を行うことを特徴とする請求
項１２に記載のコンピュータ可読メモリ。
【請求項１４】前記認識結果を表示することを特徴と
する請求項１２に記載のコンピュータ可読メモリ。