JPH08235320A - 辞書大分類方法及びこの方法を用いた文字認識装置 - Google Patents

辞書大分類方法及びこの方法を用いた文字認識装置

Info

Publication number
JPH08235320A
JPH08235320A JP7038376A JP3837695A JPH08235320A JP H08235320 A JPH08235320 A JP H08235320A JP 7038376 A JP7038376 A JP 7038376A JP 3837695 A JP3837695 A JP 3837695A JP H08235320 A JPH08235320 A JP H08235320A
Authority
JP
Japan
Prior art keywords
character
constituent elements
dictionary
recognition
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7038376A
Other languages
English (en)
Inventor
Tsutomu Kobayashi
努 小林
Kenji Suzuki
謙二 鈴木
Yoshio Furuichi
佳男 古市
Junichi Tanaka
淳一 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP7038376A priority Critical patent/JPH08235320A/ja
Publication of JPH08235320A publication Critical patent/JPH08235320A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】文字の構成要素に従って認識辞書を高速かつ効
果的に大分類することができ、また、同一の構成要素を
複数有する文字についても対応可能とする。 【構成】認識辞書11から各構成要素からなる文字を高
速に検索するため、各文字毎にその文字の有する構成要
素をビット毎に割り当てたビットフィールド13を設け
る。このビットフィールド13を参照して、座標検出部
1から入力された座標データの中から次に構成要素とし
て抽出され得る構成要素を判断し、それらの構成要素の
みの抽出を試みる。また、同一の構成要素を複数有する
文字が存在するため、ビットフィールド13にその旨を
示す拡張ビットを設けることで対応する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、オンライン手書き文字
認識装置に係り、特に文字の構成要素に従って認識辞書
を大分類するための辞書大分類方法と、この辞書大分類
方法を用いて文字認識処理を行う文字認識装置に関す
る。
【0002】
【従来の技術】従来、オンライン手書き文字認識装置で
は、手書き文字認識用の辞書を備えており、その認識辞
書に登録されている標準パターンと入力パターンとをマ
ッチング処理することで、入力座標から文字として認識
する方式を取っている。この場合、認識辞書内の全ての
標準パターンを用いてマッチング処理を行っていたので
は、処理に多大な時間を要してしまう。
【0003】したがって、一般には、文字の画数情報や
ストロークパターンによる階層的な辞書構造により、入
力パターンとのマッチングを行なう辞書パターンを絞り
込み、その処理速度の向上を図っている。
【0004】また、このような階層的な辞書構造を用い
た方式とは別に、漢字における部首を含めた文字の構成
要素に従って認識辞書を大分類し、最終的に絞り込まれ
た認識辞書の範囲内でマッチングを行なう方式がある。
本発明は、この後者の方式を用いるものとする。
【0005】
【発明が解決しようとする課題】文字の構成要素に従っ
て認識辞書を大分類する方式では、入力された座標デー
タから文字の構成要素が抽出される度に、その構成要素
を用いた辞書パターンを検索する必要があるため、処理
時間が膨大になる問題があった。
【0006】また、漢字には、1つの文字の中に同じ構
成要素を複数持つものがある。例えば、「木」(へんと
は限らない)を1つの構成要素とすると、漢字の「林」
や「淋」は構成要素「木」を複数有することになる。こ
のため、文字がどの様な構成で成り立っているのかを示
すデータを用い、そのデータから同一の構成要素を複数
有することを判断する手段が必要となる。
【0007】本発明は上記のような事情に鑑みなされた
もので、文字の構成要素に従って認識辞書を高速かつ効
果的に大分類することができ、また、同一の構成要素を
複数有する文字についても対応可能な認識辞書大分類方
法及びその方法を用いた文字認識装置を提供することを
目的とする。
【0008】
【課題を解決するための手段】
(1)本発明は、認識辞書から各構成要素からなる文字
を高速に検索するため、各文字毎にその文字の有する構
成要素をビット毎に割り当てたビットフィールドを用い
て、入力された座標データの中から次に構成要素として
抽出され得る構成要素を判断し、それらの構成要素のみ
の抽出を試みるようにしたものである。
【0009】また、同一の構成要素を複数有する文字が
存在するため、ビットフィールドにその旨を示す拡張ビ
ットを設けることで対応する。 (2)本発明は、認識辞書中の各文字毎の構成要素を記
憶したビットフィールドに同一の構成要素を複数有する
文字であることを示す拡張ビットを付加しておき、入力
座標データから可能な限り構成要素を抽出した後に、同
一の構成要素が複数存在する場合と存在しない場合とで
ビットフィールドの内容を参照しながら認識辞書を大分
類するようにしたものである。
【0010】
【作用】上記(1)の構成によれば、文字の構成要素に
従って認識辞書を大分類し、最終的に絞り込まれた認識
辞書の範囲内でマッチングを行なう場合において、各文
字毎にその文字の有する構成要素をビット毎に割り当て
たビットフィールドを用いることにより、既に抽出され
た構成要素を有する文字群から次に抽出を試みる構成要
素を判断することができる。
【0011】上記(2)の構成によれば、入力座標デー
タから可能な限り構成要素を抽出したとき、その構成要
素群の中に同一の構成要素が複数存在する場合には、ビ
ットフィールドを参照してその構成要素を複数用いる文
字に認識辞書が大分類される。また、同一の構成要素が
複数存在しない場合には、ビットフィールドを参照して
その構成要素を用いる文字に認識辞書が大分類される。
【0012】
【実施例】以下、図面を参照して本発明の一実施例を説
明する。図1は本発明の一実施例に係るオンライン手書
き文字認識装置の概略構成を示すブロック図である。本
装置は、座標検出部1、表示部2、制御部3、入力座標
バッファ4、文字認識部5および認識辞書11を有す
る。
【0013】座標検出部1は、例えばタブレット1aと
スタイラスペン1bからなり、ユーザが入力した筆跡か
ら座標データを得る。表示部2は、例えばLCD (Liqu
id Crystal Display) 装置からなり、各種情報の表示を
行なう。
【0014】制御部3は、装置全体の制御を行なうもの
であり、ここでは文字認識部5を通じて手書き文字の認
識処理を実行する。入力座標バッファ4は、座標検出部
1から出力された座標データを蓄積するためのバッファ
である。
【0015】文字認識部5は、認識辞書11を参照して
パターンマッチング方式により文字認識を行うものであ
り、ここでは、認識制御部6、構成要素抽出部7、抽出
対象指示部8、認識辞書大分類部9、パターンマッチン
グ部10から構成される。
【0016】認識制御部6は、認識処理における各種制
御を行う。構成要素抽出部7は、入力座標バッファ4に
格納された入力座標データから文字を構成する構成要素
を抽出する。抽出対象指示部8は、構成要素抽出部7に
対して次に抽出を試みる構成要素を指示する。認識辞書
大分類部9は、構成要素抽出部7による構成要素の抽出
結果に基づいて認識辞書11を大分類する。パターンマ
ッチング部10は、最終的に大分類された認識辞書11
の標準パターンと入力座標バッファ4の入力座標データ
からなる文字パターンとをマッチングする。
【0017】認識辞書11は、手書き文字の認識に必要
な各種情報を記憶しており、ここでは、構成要素データ
部12、ビットフィールド部13、標準パターンデータ
部14を有して構成される。
【0018】構成要素データ部12は、文字を構成する
構成要素の特徴データを記憶している。ビットフィール
ド部13は、各文字毎にその文字が有する構成要素を各
ビットに対応させて記憶しており、同一の構成要素を複
数有する文字には、その旨を示す拡張ビットを付加して
いる。標準パターンデータ部14は、各文字の標準パタ
ーンとして筆跡等の特徴データを記憶している。
【0019】また、図中15は入力座標バッファ4の入
力座標データから抽出された文字の構成要素を順次格納
するための抽出済み構成要素バッファ、16は大分類中
の辞書範囲を記憶するための辞書範囲バッファ、17は
構成要素抽出部7が抽出を試みる構成要素の種類を記憶
するための抽出対象バッファである。
【0020】なお、入力座標バッファ4、認識辞書1
1、抽出済み構成要素バッファ15、辞書範囲バッファ
16、抽出対象バッファ17は、それぞれ本装置の内部
もしくは外部に設けられたメモリやディスクなどの記憶
装置の中に構成される。
【0021】図2は同実施例におけるビットフィールド
部13の構成を示す図である。ビットフィールド部13
には、認識辞書11内に登録された各文字毎にその文字
が有する構成要素を各ビットに対応させて記憶してい
る。また、同一の構成要素を複数有する文字には、その
旨を示す拡張ビットを付加している。例えば「淋」とい
う文字は構成要素「木」を2つ有しており、このような
文字には拡張ビット「1」が付加される。
【0022】図3は同実施例における認識辞書構造を示
す図である。認識辞書11は、文字を構成する種々の構
成要素を各ビットに対応させたビットフィールド部13
を有して構成されている。このビットフィールド部13
に、各文字毎にその文字が有する構成要素を記憶すると
共に、同一の構成要素を複数有する文字にその旨を示す
拡張情報を付加している。
【0023】図4は他の実施例としての認識辞書構造を
示す図である。認識辞書構造の他の例として、文字を構
成する種々の構成要素を番号付けし、各文字毎にその文
字が有する構成要素をその番号で記憶すると共に、同一
の構成要素を複数有する文字にその旨を示す拡張情報を
付加するようにしても良い。
【0024】次に、同実施例の動作を説明する。図5は
同実施例における認識辞書大分類の処理動作を示すフロ
ーチャートである。なお、太線で示す部分が本発明にお
ける新規部分となるステップである。
【0025】座標検出部1から出力された座標点列のデ
ータが制御部3によって入力座標バッファ4に蓄積され
た後に、文字認識部5へと処理が渡され、次のような認
識辞書大分類処理が開始される。
【0026】まず、入力座標バッファ4の入力座標デー
タから抽出を試みる構成要素の対象範囲を全ての構成要
素とするため、抽出対象バッファ17を初期設定する
(ステップA11)。また、入力座標バッファ4の入力
座標データにおける全ストロークから構成要素の抽出を
試みるように入力座標バッファ4を初期設定する(ステ
ップA12)。
【0027】この状態で、文字認識部5は入力座標バッ
ファ4の入力座標データから当該文字の構成要素を抽出
する(ステップA13)。このとき、文字認識部5は続
いて新たな構成要素を抽出できたか否かを判断し、新た
な構成要素が抽出された場合には(ステップA14のY
es)、その結果を抽出済み構成要素バッファ15に登
録する(ステップA15)。
【0028】抽出済み構成要素バッファ15に抽出済み
構成要素が登録されると、文字認識部5はビットフィー
ルド部13の情報を参照しながら、これまでに抽出され
た構成要素を有する文字に認識辞書11を大分類し、そ
の分類された範囲を辞書範囲バッファ16に記憶する
(ステップA16)。そして、入力座標バッファ4から
構成要素が抽出されたストロークを次の抽出範囲から除
外するように、入力座標バッファ4を再設定する(ステ
ップA17)。
【0029】ここで、文字認識部5は次に抽出される可
能性のある構成要素をビットフィールド部13から検索
する(ステップA18)。この検索範囲中に拡張ビット
が立っている文字が存在するか否かを判断し、存在する
場合には(ステップA19のYes)、このとき新たに
抽出した構成要素も次回の抽出対象範囲とするべく、抽
出対象バッファ17に先ほど抽出した構成要素を登録す
る(ステップA20)。
【0030】しかして、ステップA18での検索結果と
ステップA19で参照した拡張ビットの情報から、次に
入力座標バッファ4から抽出し得る構成要素が有るかど
うかが判断される。抽出し得る構成要素が存在する場合
には(ステップA21のYes)、文字認識部5はそれ
らの構成要素を次に構成要素抽出部7が抽出する抽出対
象として抽出対象バッファ17に登録した後(ステップ
A22)、ステップA13にループする。
【0031】また、上記ステップA14で入力座標バッ
ファ4から構成要素の抽出ができなかったと判断された
場合、または、上記ステップA21で入力座標バッファ
4からこれ以上の構成要素を抽出し得ないと判断された
場合には、ここでの認識辞書大分類おける処理は終了す
る。そして、大分類された認識辞書11の範囲内で標準
パターンデータ部14の標準パターンと入力座標バッフ
ァ4の入力データパターンとのマッチング処理が行なわ
れる。
【0032】次に、本発明の他の実施例としての動作を
説明する。図6は他の実施例としての認識辞書大分類の
処理動作を示すフローチャートである。なお、太線で示
す部分が本発明における新規部分となるステップであ
る。
【0033】まず、入力座標バッファ4の入力座標デー
タにおける全ストロークから構成要素の抽出を試みるよ
うに入力座標バッファ4を初期設定する(ステップB1
1)。
【0034】この状態で、文字認識部5は入力座標バッ
ファ4の入力座標データから当該文字の構成要素を抽出
する(ステップB12)。このとき、文字認識部5は実
際に抽出されたか否かを判断し、抽出されなかった場合
には(ステップB13のNo)、以下のステップB16
での処理をスキップする。
【0035】構成要素が抽出されると、文字認識部5は
その結果を抽出済み構成要素バッファ15に登録する
(ステップB14)。そして、入力座標バッファ4から
構成要素が抽出されたストロークを次の抽出範囲から除
外するように、入力座標バッファ4を再設定する(ステ
ップB15)。
【0036】文字認識部5は、入力座標バッファ4の中
にまだ構成要素を抽出していないストロークがあるか否
かを判断し、その結果、抽出していないストロークがあ
れば(ステップB16のNo)、ステップB12にルー
プする。
【0037】しかして、全てのストロークに対する構成
要件の抽出が可能な限り行われると(ステップB16の
Yes)、文字認識部5は抽出済み構成要素バッファ1
5の内容から構成要素を1つ抜き出し(ステップB1
7)、その構成要素が複数抽出されたか否かを抽出済み
構成要素バッファ15の内容から判断する。
【0038】この結果、当該構成要素が複数抽出されて
いない場合、つまり、当該構成要素が1つである場合に
は(ステップB18のNo)、文字認識部5はビットフ
ィールド部13を参照して、その構成要素を用いる文字
に認識辞書11を大分類する(ステップB19)。
【0039】一方、当該構成要素が複数抽出された場
合、つまり、当該構成要素と同じ要素が複数ある場合に
は(ステップB18のYes)、文字認識部5はビット
フィールド部13を参照して、その構成要素を複数用い
る文字に認識辞書11を大分類する(ステップB1
9)。
【0040】このようにして、認識辞書11が大分類さ
れると、その辞書範囲が辞書範囲バッファ16に記憶さ
れる(ステップB21)。抽出済み構成要素バッファ1
5に登録されている構成要素がまだ残っている場合(ス
テップB22のNo)、文字認識部5はステップB17
にループする。また、同ステップB22において、抽出
済み構成要素バッファ15に登録されている構成要素全
てについて認識辞書11の大分類が終了したと判断され
ると、ここでの認識辞書大分類おける処理は終了する。
そして、大分類された認識辞書11の範囲内で標準パタ
ーンデータ部14の標準パターンと入力座標バッファ4
の入力データパターンとのマッチング処理が行なわれ
る。
【0041】なお、ここで挙げた例では、構成要素の組
み合わせデータとしてビットフィールドを用いている
が、本発明はこれに限るものではなく、それ以外のデー
タ形式でも同様にして実現が可能である。
【0042】
【発明の効果】以上のように本発明によれば、文字の構
成要素に従って認識辞書を大分類し、最終的に絞り込ま
れた認識辞書の範囲内でマッチングを行なう場合におい
て、各文字毎にその文字の有する構成要素をビット毎に
割り当てたビットフィールドを用いることにより、既に
抽出された構成要素を有する文字群から次に抽出を試み
る構成要素を判断することができる。これにより、認識
辞書の大分類を高速かつ効果的に行なうことができる。
また、ビットフィールドに同一構成要素の存在を示す拡
張ビットを付加しておくことで、同一構成要素を複数有
する文字についても対応することができる。
【図面の簡単な説明】
【図1】本発明の一実施例に係る文字認識装置の構成を
示すブロック図。
【図2】同実施例におけるビットフィールドの構成を示
す図。
【図3】同実施例における認識辞書構造を示す図。
【図4】他の実施例としての認識辞書構造を示す図。
【図5】同実施例における認識辞書大分類の処理動作を
示すフローチャート。
【図6】他の実施例としての認識辞書大分類の処理動作
を示すフローチャート。
【符号の説明】
1…座標検出部、1a…タブレット、1b…スタイラス
ペン1b、2…表示部、3…制御部、4…入力座標バッ
ファ、5…文字認識部、6…認識制御部、7…構成要素
抽出部、8…抽出対象指示部、9…認識辞書大分類部、
10…パターンマッチング部、11…認識辞書、12…
構成要素データ部、13…ビットフィールド部、14…
標準パターンデータ部、15…抽出済み構成要素バッフ
ァ、16…辞書範囲バッファ、17…抽出対象バッフ
ァ。
フロントページの続き (72)発明者 田中 淳一 東京都青梅市末広町2丁目9番地 株式会 社東芝青梅工場内

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 文字の構成要素に従って認識辞書を大分
    類し、最終的に絞り込まれた認識辞書の範囲内でマッチ
    ングを行なう文字認識装置の辞書大分類方法において、 予め各文字毎にその文字が有する構成要素を記憶した記
    憶部を用いて、 入力座標データから当該文字の構成要素を抽出する際
    に、 上記記憶部の内容を参照して、既に抽出された構成要素
    を有する文字群から次に抽出を試みる構成要素を判断す
    るようにしたことを特徴とする辞書大分類方法。
  2. 【請求項2】 同一の構成要素を複数有する文字にその
    旨を示す拡張情報を付加しておくことで、その拡張情報
    が付加された文字について既に抽出された構成要素も抽
    出対象として加えるようにしたことを特徴とする請求項
    1記載の辞書大分類方法。
  3. 【請求項3】 文字の構成要素に従って認識辞書を大分
    類し、最終的に絞り込まれた認識辞書の範囲内でマッチ
    ングを行なう文字認識装置の辞書大分類方法において、 予め各文字毎にその文字が有する構成要素を記憶すると
    共に、同一の構成要素を複数有するか否かの拡張情報を
    記憶した記憶部を用いて、 入力された座標データから当該文字の構成要素を可能な
    限り抽出した後、 同一の構成要素が複数存在するか否かを判断し、 同一の構成要素が複数存在する場合と存在しない場合と
    で上記記憶部の内容を参照しながら上記認識辞書を大分
    類するようにしたことを特徴とする辞書大分類方法。
  4. 【請求項4】 文字の構成要素に従って認識辞書を大分
    類し、最終的に絞り込まれた認識辞書の範囲内でマッチ
    ングを行なう文字認識装置において、 座標データを入力するための入力手段と、 この入力手段により入力された座標データから当該文字
    の構成要素を抽出する構成要素抽出手段と、 予め各文字毎にその文字が有する構成要素を記憶した記
    憶手段と、 この記憶手段の内容を参照し、既に抽出された構成要素
    を有する文字群から次に抽出を試みる構成要素を判断
    し、上記構成要素抽出手段に対して指示を行う抽出対象
    指示手段と、 上記構成要素抽出手段によって抽出された構成要素に従
    って認識辞書を大分類する認識辞書大分類手段とを具備
    したことを特徴とする文字認識装置。
  5. 【請求項5】 同一の構成要素を複数有する文字に拡張
    情報を付加しておき、 上記抽出対象指示手段は、その拡張情報が付加された文
    字について既に抽出された構成要素も抽出対象として加
    えるように指示することを特徴とする請求項4記載の文
    字認識装置。
  6. 【請求項6】 文字の構成要素に従って認識辞書を大分
    類し、最終的に絞り込まれた認識辞書の範囲内でマッチ
    ングを行なう文字認識装置において、 座標データを入力するための入力手段と、 この入力手段により入力された座標データから当該文字
    の構成要素を可能な限り抽出する構成要素抽出手段と、 予め各文字毎にその文字が有する構成要素を記憶すると
    共に、同一の構成要素を複数有するか否かの拡張情報を
    記憶した記憶手段と、 上記構成要素抽出手段によって抽出された構成要素群の
    中に同一の構成要素が複数存在するか否かを判断し、同
    一の構成要素が複数存在する場合と存在しない場合とで
    上記記憶手段の内容を参照しながら上記認識辞書を大分
    類する認識辞書大分類手段とを具備したことを特徴とす
    る文字認識装置。
JP7038376A 1995-02-27 1995-02-27 辞書大分類方法及びこの方法を用いた文字認識装置 Pending JPH08235320A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7038376A JPH08235320A (ja) 1995-02-27 1995-02-27 辞書大分類方法及びこの方法を用いた文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7038376A JPH08235320A (ja) 1995-02-27 1995-02-27 辞書大分類方法及びこの方法を用いた文字認識装置

Publications (1)

Publication Number Publication Date
JPH08235320A true JPH08235320A (ja) 1996-09-13

Family

ID=12523571

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7038376A Pending JPH08235320A (ja) 1995-02-27 1995-02-27 辞書大分類方法及びこの方法を用いた文字認識装置

Country Status (1)

Country Link
JP (1) JPH08235320A (ja)

Similar Documents

Publication Publication Date Title
JP4308785B2 (ja) デジタルインク質疑検索装置及びその方法
EP0542566B1 (en) Character recognition method and apparatus thereof
JP2726568B2 (ja) 文字認識方法及び装置
JP2993673B2 (ja) 電子ファイル装置
US6373473B1 (en) Data storage apparatus and data retrieval method in said apparatus
JPH06332610A (ja) 手書き情報入力処理方式
US6421461B1 (en) Pattern recognition apparatus which compares input pattern feature and size data to registered feature and size pattern data, an apparatus for registering feature and size data, and corresponding methods and memory media therefor
JPH04281559A (ja) 文書検索装置
JPH08235320A (ja) 辞書大分類方法及びこの方法を用いた文字認識装置
CN113869352A (zh) 模型训练方法、服装检索方法及相关装置
JP3376808B2 (ja) 単語入力装置並びに単語入力方法
KR940007345B1 (ko) 온라인 한글 필기체 문자의 인식방법
JPH0567988B2 (ja)
JP3085508B2 (ja) 電子帳票検索システム
JPH0475552B2 (ja)
JP2562498B2 (ja) 指定図形の座標検出方式
JPS6059487A (ja) 手書文字認識装置
JPH09179935A (ja) 文字認識装置およびその制御方法
JPH053631B2 (ja)
JP2851865B2 (ja) 文字認識装置
JP2001216296A (ja) 文字検索装置及び文字検索方法並びに記録媒体
JPH05189606A (ja) 文字列領域検出方法
JPH0728835A (ja) 文書検索装置及びその方法
JPH0676115A (ja) 文字認識方法及び装置
JPH08263591A (ja) 文字認識装置及び方法