JPH06290272A - 高速マッチング方式 - Google Patents

高速マッチング方式

Info

Publication number
JPH06290272A
JPH06290272A JP5100338A JP10033893A JPH06290272A JP H06290272 A JPH06290272 A JP H06290272A JP 5100338 A JP5100338 A JP 5100338A JP 10033893 A JP10033893 A JP 10033893A JP H06290272 A JPH06290272 A JP H06290272A
Authority
JP
Japan
Prior art keywords
category
dictionary
flag table
flag
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5100338A
Other languages
English (en)
Other versions
JP3361564B2 (ja
Inventor
Hideaki Tanaka
秀明 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP10033893A priority Critical patent/JP3361564B2/ja
Publication of JPH06290272A publication Critical patent/JPH06290272A/ja
Application granted granted Critical
Publication of JP3361564B2 publication Critical patent/JP3361564B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】 認識辞書の各カテゴリベクトル間の距離関係
を保存したフラグテーブルを用いて可能性のあるカテゴ
リのみマッチング計算し、高速化を図る。 【構成】 入力データに対して、各辞書カテゴリベクト
ルとの距離計算を行った後、ソーティングにより認識候
補を作成する(step1〜4)。ソーティング結果をもと
に、認識候補として選ばれた候補番号に対応するビット
を1、認識候補外を0として、認識結果フラグを作成す
る(step5,6)。順次辞書カテゴリを注目カテゴリと
し、結果バッファに格納された距離をもとに1カテゴリ
当たり複数のフラグテーブルの中から範囲に該当するフ
ラグテーブルを決定し、それを注目フラグテーブルとす
る(step7,8)。該注目フラグテーブルと認識結果フ
ラグとの論理和を求め、注目フラグテーブルの値として
格納する(step9,10)。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、高速マッチング方式に
関し、より詳細には、文字や音声の認識装置などのよう
に、辞書ベクトルと入力ベクトルとのマッチング計算を
行なうようにした高速マッチング方式に関する。
【0002】
【従来の技術】図16は、従来の認識装置におけるマッ
チング部のフローチャートを示す図である。一般的に、
入力特徴ベクトルが与えられた場合、大分類処理(step
1)、小分類処理(step2)、詳細分類処理(step3)
を経て認識結果(候補)が求められる。各分類処理には
別々のマッチング辞書と特徴ベクトルが用いられ、入力
ベクトルとのマッチング計算(採用されている認識手法
に依存する)を行ない、計算結果をソーティングして認
識候補を作成する。このように処理を分割している理由
は高速化のためである。一般的に、詳細識別用の認識辞
書は、高認識率の実現のため、より多次元のベクトルを
採用している。そのため、全認識対象カテゴリに対し
て、この詳細分類辞書のみでマッチング計算を行なった
場合、その計算量が莫大となり、速度の低下を生じる。
これを解決するため、従来手法では、より少ない次元数
の特徴ベクトルによる認識辞書(ただし、その認識性能
は低下する)を用いた分類処理により、認識性能が保証
できるまで候補数を減少させ、次の(より多次元辞書を
用いた)分類処理へ送るといった多段階処理により高速
性を実現していた。
【0003】図16の従来方式の例では、大分類から詳
細分類へ行くに従い、用いるベクトル次元数は増加す
る。この従来手法の例として、各処理で用いる辞書の1
カテゴリ当たりのベクトル次元数と、入力候補数、出力
候補数、計算量を以下の表1に示す。
【0004】
【表1】
【0005】この例は、対象カテゴリ数が5000の認
識装置(日本語OCRなど)についてのものであり、詳
細分類辞書のみで計算した場合の計算量1280000
(=256×5000)を396800に減少させてい
る(約1/3)。また従来法では、これと演算方法の簡
略化を組み合わせる方法も行なわれている。例えば、詳
細分類などではマッチング処理にユークリッド距離や類
似度など乗算を必要とする演算を用い、大分類などでは
絶対差などの演算を用いる方法である。一般的には乗算
よりも減算のほうが高速に実行できるため、大分類で高
価な演算を用いるよりも高速化が実現できる。
【0006】
【発明が解決しようとする課題】前述のように、従来の
マッチング方式では、各分類部において必ず入力候補数
分のマッチング計算を行なう必要があり、劇的な高速化
とはならないという問題点が生じる。例えば、前記表1
の例で、仮に大分類処理で5000カテゴリ全てに対し
ての計算は行なわず、ある手法により1000カテゴリ
に対してのみ行なったとすれば、トータルの計算量は1
40800となり、約1桁の高速化となる。
【0007】本発明は、このような実情に鑑みてなされ
たもので、辞書の各カテゴリベクトル間の距離関係が既
知であることを利用し、その距離関係を保存したフラグ
テーブルを各カテゴリ毎に予め求めておき、注目カテゴ
リとのマッチング計算で得られた距離(または類似度)
をもとに、フラグテーブルとの論理演算により、以降の
カテゴリに対して候補となる可能性があるものを決定
し、可能性があると判断されたカテゴリを次の注目カテ
ゴリとし、以降同様の処理を操り返すことにより、可能
性の高いカテゴリのみをマッチング計算することによ
り、高速化を図るようにした高速マッチング方式を提供
することを目的としている。
【0008】
【課題を解決するための手段】本発明は、上記目的を達
成するために、(1)入力データに対して、各辞書カテ
ゴリベクトルとの距離計算を行う計算手段と、該計算手
段による距離計算ののちにソーティングによって認識候
補を作成する認識候補作成手段と、前記ソーティング結
果をもとに認識候補として選ばれた候補番号に対応する
ビットを決定して認識結果フラグを作成するフラグ作成
手段と、辞書カテゴリを注目カテゴリとし、フラグテー
ブルを決定する注目フラグテーブル決定手段と、該注目
フラグテーブルと前記認識結果フラグとの論理和を求め
る演算手段とから成り、高速マッチング処理のための辞
書の各カテゴリベクトルの距離関係を保存したフラグテ
ーブルを作成すること、(2)1つのフラグテーブルと
同様の構成を有する可能性フラグテーブルのビットを判
定する判定手段と、該判定手段によりビットが1の場合
にマッチング処理すべき注目カテゴリを決定する注目カ
テゴリ決定手段を、入力ベクトルの前記注目カテゴリに
対してマッチング計算を行なう計算手段と、該計算手段
の結果に基づいて、注目カテゴリの注目フラグテーブル
を決定する注目フラグテーブル決定手段と、該注目フラ
グテーブル決定手段により決定された注目フラグテーブ
ルと前記可能性フラグテーブルに対して、論理演算を用
いて可能性フラグテーブルの更新を行う更新手段とから
成り、辞書の各カテゴリベクトルの距離関係を保存した
フラグテーブルを用いて高速マッチング処理することを
特徴としたものである。
【0009】
【作用】本発明は、文字や音声の認識装置において、入
力されたパターン(文字や音声)と、予め備えてある認
識辞書とのマッチング処理を高速に行なうもので、高速
マッチング処理を実現するため、各辞書ベクトル間の距
離関係が既知であることを利用し、その距離関係を保存
したフラグテーブルを各辞書ベクトル毎に予め設定して
おき、入力ベクトルと注目カテゴリベクトルとのマッチ
ング結果(距離や類似度など)をもとにフラグテーブル
を用いた論理演算により、以降のカテゴリに対して、認
識候補としての可能性があるカテゴリ(可能性カテゴ
リ)のみを決定し、次の可能性カテゴリを注目カテゴリ
として、逐次、同様のマッチング処理およびフラグによ
る決定処理を操り返して高速に処理する。
【0010】
【実施例】実施例について、図面を参照して以下に説明
する。なお、以下の説明においては、簡単なため、マッ
チング計算には通常のユークリッド距離を用いた場合に
ついて説明する。まず、図12〜図15に基づいて、視
覚的な方式について説明する。図12は、辞書ベクトル
と入力ベクトルとの位置関係、図13は従来方式の計算
例、図14は本発明方式の第1カテゴリとの計算結果と
可能性カテゴリ、図15は本発明方式の第2カテゴリと
の計算結果と可能性カテゴリを各々示している。以下、
順次説明する。
【0011】図12は、辞書の各カテゴリベクトルと入
力ベクトルとの位置関係を2次元平面上にプロットした
ものである(カテゴリベクトルは〇で、入力ベクトルは
◎で表示)。従来手法では、図13のように、入力ベク
トルと全ての各カテゴリベクトルとの距離計算を行な
い、それらをソーティング(距離の小さいものから並べ
換えて)して認識候補を求める。なぜ全てのカテゴリベ
クトルに対して距離計算するかというと、それは入力ベ
クトルが未知であるため、各辞書ベクトルとの距離関係
が不明であるためである。しかし、入力ベクトルは未知
であっても、各カテゴリベクトル間の位置関係は既知で
ある。本発明の方式ではこのことを利用し、まず、図1
4に示すように、辞書の第1カテゴリとの距離計算結果
をもとに、可能性のあるカテゴリ(入力ベクトルが第1
カテゴリに近ければ近いカテゴリ、遠ければ遠いカテゴ
リ)を選び、それらのうち1つを第2カテゴリとする。
次に、図15に示すように、この第2カテゴリとの距離
計算結果をもとに、まだマッチング計算を行なっていな
く、かつ第1カテゴリでの計算結果から可能性があると
判定されたものの中から、再び可能性のあるカテゴリを
決定する。以降、この処理を操り返すことにより、可能
性のあるカテゴリのみをマッチング処理し、高速にマッ
チング処理を行なう。図14及び図15は、本発明の方
式での第1カテゴリにより処理結果と、第2カテゴリに
よる処理結果である。可能性のあるカテゴリは図の斜線
カテゴリとなる。
【0012】次に、本発明の高速マッチング方式に用い
るフラグテーブルの構成と作成方法について説明する。
フラグテーブルは辞書のカテゴリ番号に対応したバイナ
リーテーブルである。各ビットが辞書の各カテゴリに対
応し、ビット値が1ならば可能性があり、0ならば可能
性なしとして作成したテーブルである。
【0013】
【表2】
【0014】表2は、日本語OCRのフラグテーブルの
例である。このフラグテーブルからは、国、田、困、
口、団などのカテゴリが可能性のあるカテゴリとして選
択される。1つのフラグテーブルは認識対象カテゴリ−
ビット分の容量が必要となる。従って、そのメモリ容量
(バイト数)はカテゴリ数÷8で概算できる。例えば、
5000カテゴリのものであれば、1つのフラグテーブ
ルは625バイトとなる。本発明ではまず、マッチング
計算により求められる距離を均等の範囲ごとにm個に分
割し、辞書の1カテゴリ当たり、その個数分(m個)フ
ラグテーブルを用意する。最大距離を1000、分割数
mを10とした場合の、1カテゴリ当たりのフラグテー
ブル構成例を以下の表3に示す。
【0015】
【表3】
【0016】この最大距離は用いる特徴ベクトルの次元
数や正規化手法などにより異なってくる。また、分割数
mはより大きくとれば、各カテゴリ間の距離関係の最良
近似となるが、メモリ容量も増加するので、システムに
より随意に決定されるものである。あるシステムでは、
特徴ベクトルに対してある種の正規化処理を施こしてな
いものがある(かもしれない)。この場合論理的には、
最大距離の設定ができないが、実験により(頻度情報な
どをもとに)最大距離を設定し、それをm個に分割し、
m+1個の範囲として「最大距離以上」を設定すること
により、本発明の方式を適用することができる。
【0017】次に、辞書カテゴリの並び換えについて説
明する。フラグテーブルを作成する前に、辞書カテゴリ
の並び換えを行なう。この理由は、本発明ではある注目
カテゴリと入力ベクトルとの距離により、以降の可能性
カテゴリの決定を行なうため、辞書カテゴリの並びで、
カテゴリ間の距離が近いベクトル(例えば0とoなどの
類似文字)が連続している場合、可能性カテゴリ判定が
効果的に機能しないためである。これを解決するため、
本発明では、以前のカテゴリに対して最も遠いカテゴリ
ベクトルを順に並べていく方法で、辞書の各カテゴリベ
クトルを並び換える。
【0018】図1は、本発明の高速マッチング方式の辞
書並び換えのブロック図で、図中、1は辞書並び換え処
理部、2は平均ベクトル作成部、3は最近傍カテゴリ決
定部、4はカテゴリベクトルコピー部、5はコピーフラ
グ制御部、6は辞書並び換え制御部、7は平均ベクトル
バッファ、8は入力辞書バッファ、9は結果辞書バッフ
ァ、10は結果辞書カウンタ、11は選択番号バッフ
ァ、12は入力辞書カウンタ、13は最大累積距離バッ
ファ、14は累積距離バッファ、15はカウンタ、16
は距離バッファ、17はカテゴリ選択制御部、18はカ
テゴリ選択処理部である。
【0019】図2(a),(b)は、入力辞書及び結果辞
書の各々の構成図である。図3は辞書並び換えのフロー
チャートである。以下、各ステップに従って順に説明す
る。なおフローチャート中の記号の意味は、以下の表4
のとおりである。
【0020】
【表4】
【0021】step1:まず、入力辞書の全カテゴリック
ベクトルのコピーフラグ(既に結果辞書バッファへコピ
ーしたかを示すフラグ)を0クリアする。step2 :入力辞書の全カテゴリベクトルで平均ベクトル
を求める。step3,4 :平均ベクトルに最も近い入力辞書のカテゴ
リベクトルを求め(最近傍カテゴリ)、それを第1カテ
ゴリとして、結果バッファの第1番目にコピーする。こ
の時、第1カテゴリに選択された入力辞書カテゴリのコ
ピーフラグを1にする。step5 :結果辞書カウンタを1に初期化する。step6 :結果辞書カウンタの値が認識対象カテゴリ数で
あるかチェックする。もし、認識対象カテゴリ数であれ
ば辞書並び換え処理を終了する。
【0022】step7:全てのコピーフラグが0(まだ、
結果辞書にコピーされていない)カテゴリの中で、既に
コピー済の結果辞書の各カテゴリに対して、最も遠いカ
テゴリを次カテゴリとして選択する(選択フローヘ)。step8 :次カテゴリを結果辞書にコピーし、対応する入
力辞書のコピーフラグを1にする。step9 :結果辞書カウンタをインクリメントする。 以降、同様の処理を全ての入力辞書カテゴリが、結果辞
書にコピーされるまで(結果辞書カウンタが認識対象カ
テゴリとなるまで)操り返す。
【0023】図4は、カテゴリ選択のフローチャートで
ある。以下、各ステップに従って順に説明する。なお、
フローチャート中の記号の意味は、以下の表5のとおり
である。
【0024】
【表5】
【0025】step1,2:制御に必要な入力辞書カウン
タと最大累積距離バッファを0クリアする。step3,4 :入力辞書カテゴリの中で、コピーフラグが
0のものを探す。step5〜10 :評価に用いる累積距離バッファを0クリ
アし、この入力カテゴリベクトルと、(既にコピー済み
の)結果辞書の各カテゴリ間で距離を計算し、求められ
た距離を累積距離バッファに加算していく。step11〜14 :最大累積距離バッファとこの累積距離
バッファの内容を比較し、累積距離バッファの方が小さ
ければ、次の入力辞書カテゴリの走査へ移る。もし、累
積距離バッファの方が大きければ、その内容を最大累積
距離バッファへコピーし、選択番号バッファに現在の入
力辞書カテゴリ番号(入力辞書カウンタの内容)をコピ
ーする。 以降、同様の処理を全ての入力辞書カテゴリに対して行
ない、最終的に選択番号バッファに格納されている番号
が、次の結果辞書へコピーされるカテゴリ番号となる。
【0026】次に、フラグテーブルの作成方法について
説明する。フラグテーブルは実験的に作成し、作成に用
いられる入力データは、辞書作成に用いられる大量で多
類の特徴ベクトルである。図5は、フラグテーブル作成
部のブロック図で、図中、21はフラグテーブル作成処
理部、22は距離計算部、23はソーティング部、24
は認識結果フラグ設定部、25は注目フラグ決定部、2
6は注目フラグ更新部、27はフラグテーブル作成制御
部、28は入力特徴データバッファ部、29は距離バッ
ファ、30は認識結果(修補)バッファ、31は認識結
果フラグバッファ、32は認識結果バッファ、33はカ
テゴリカウンタである。
【0027】図6(a)〜(c)は、認識結果フラグ、
認識辞書、フラグテーブル部の各々の構成図である。図
7は、フラグテーブル作成のフローチャートである。以
下、各ステップに従って順に説明する。なお、フロチャ
ート中の記号の意味は、以下の表6のとおりである。
【0028】
【表6】
【0029】step1:まず、辞書の全てのフラグテーブ
ルを0クリアする。step2〜4 :入力データに対して、各辞書カテゴリベク
トルとの距離計算(この演算には採用される認識手法を
用いる)を行なった後、ソーティングにより認識候補を
作成する。この処理は通常のマッチング処理をそのまま
用いる。従って、ソーティングにより選ばれる候補数も
従来から採用している(あるいはその辞書により認識性
能が保証される)数を用いる。この時、各辞書べクトル
との距離は距離バッファに格納される。step5,6 :ソーティング結果をもとに、認識候補とし
て選ばれた候補番号に対応するビットを1、認識候補外
を0として、認識結果フラグを作成する。この認識結果
フラグは、表2のフラグテーブルと同様の構成でカテゴ
リ数分のバイナリーデータである。
【0030】step7,8:これらのデータ設定終了後、
各辞書カテゴリ毎にフラグテーブルの作成を行なう。ま
ず、順次辞書カテゴリを注目カテゴリとし、結果バッフ
ァに格納された距離をもとに1カテゴリ当たりの複数の
フラグテーブル(表3)の中から範囲に該当するフラグ
テーブルを決定し、それを注目フラグテーブルとする。 step9,10 :このフラグテーブルと認識結果フラグと
の論理和(OR)を求め、論理和結果をこの注目フラグ
テーブルの値として格納する(フラグテーブルの更新処
理:表7)。 以降、同様の処理を入力ベクトルがなくなるまで操り返
す。
【0031】
【表7】
【0032】この処理の結果、求められたフラグテーブ
ルは、あるカテゴリベクトルに対して、入力ベクトルと
の距離が求められた場合、最終的に候補として採用され
るべきカテゴリ位置のビットが1となったバイナリーデ
ータで、距離が小さい範囲のフラグテーブルは、そのカ
テゴリベクトルに近いカテゴリが1でその他は0とな
り、ある程度距離が大きい範囲のフラグテーブルは、そ
の距離に対応したカテゴリの位置が1となり、非常に近
いカテゴリや遠いカテゴリに対しては0となっている。
この情報は既知の辞書の各カテゴリベクトル間の距離関
係を保存したものであり、本発明の重要な要素は、この
情報に保存しつつ、学習ベクトル(フラグテーブル作成
に用いた特徴ベクトル)に対しては、認識性能の低下が
論理的に発生しないことである。従って、距離関係の保
存の他、学習ベクトルに対する認識性能も完全に保存さ
れている。
【0033】次に、高速マッチング方法について説明す
る。図8は、高速マッチング処理のブロック図で、図
中、41は距離計算部、42はフラグテーブル判定部、
43は高速マッチング制御部、44は距離バッファ、4
5は可能性フラグテーブル、46はカテゴリカウンタ、
47は入力特徴ベクトル、48は認識辞書、49は注目
フラグテーブル番号バッファ、50は先頭アドレスレジ
スタ、51は終了アドレスレジスタ、52はカウンタ、
53は論理演算部、54は更新制御部である。
【0034】図9(a)〜(c)は、可能性フラグテー
ブル、認識辞書、フラグテーブル部の各々の構成図であ
る。図10は、高速マッチング処理のフローチャートで
ある。以下、各ステップに従って順に説明する。なおフ
ローチャート中の記号の意味は、次の表8のとおりであ
る。
【0035】
【表8】
【0036】step1,2:最初に可能性フラグテーブル
の全ビットを1にセットする。この司能性フラグテーブ
ルは、表2のフラグテーブルと同様の構成であり、各ビ
ット位置が辞書の各カテゴリ番号に対応している。カテ
ゴリカウンタを0に初期化する。step3,4 :カテゴリカウンタで示される可能性フラグ
テーブルのビットが1か(そのカテゴリをマッチング計
算してよいか)どうかを判定する。もし0ならば、マッ
チング処理を行なわず、カデゴリカウンタのインクメン
トを行ない、次の辞書のカテゴリへ処理を進める。step5 :可能性フラグテーブルのビットが1の場合、そ
の辞書カテゴリベクトルと入力ベクトルとの距離計算を
行なう。step6 :求められた距離をもとに、その辞書カテゴリの
注目のフラグテーブルを決定する。
【0037】step7:この注目フラグテーブルと可能性
フラグテーブルとの論理積(AND)を求め、その結果
を可能性フラグテーブルへコピーする(可能性フラグテ
ーブル更新処理:後述)。step8 :カテゴリカウンタをインクリメントし、次の辞
書カテゴリへ処理を進める。 以降、同様の処理をカテゴリカウンタが認識対象カテゴ
リ数となるまで操り返す。以上の処理により、注目のカ
テゴリにより計算された距離をもとに、以降の可能性の
あるカテゴリの決定を遂次行ない、無駄なカテゴリとの
マッチング計算をパスすることにより、高速マッチング
処理を実現できる。
【0038】最後に、可能性フラグの更新処理を説明す
る。可能性フラグは、注目フラグとの論理積(AND)
により遂時更新される。前述した、高速マッチング処理
動作においては、この論理積範囲はフラグの全て(認識
対象カテゴリビット数分)であってもかまわない。しか
し、更新された可能性フラグの必要範囲は、現カテゴリ
番号以降の範囲である。従って、更新処理の論理積(A
ND)処理もその範囲のみで行なえばよいことになる。
この範囲を限定した更新処理の説明を行なう。フラグテ
ーブルは、バイナリーデータであるので、通常はカテゴ
リ数÷8で概算できるバイト数のデータである。論理演
算はバイト単位で行なえるので、更新処理の論理積(A
ND)もバイト単位で行なう。このバイト単位の処理は
メモリアクセス長の問題であるので、システムにより1
6ビットまたは32ビットなどのアクセスが可能の場
合、本発明と同様に処理できる。またアクセス幅が大き
くなるほど処理は高速となる。
【0039】図11は、可能性フラグテーブル更新のフ
ローチャートである。以下、各ステップに従って順に説
明する。なお、フローチャート中の記号の意味は、以下
の表9のとおりである。
【0040】
【表9】
【0041】step1:まず、現カテゴリ番号により、フ
ラグの先頭バイトアドレスを計算し(これはカテゴリ番
号÷8で求められる)、アドレスカウンタに代入する。step2〜5 :アドレスカウンタで示される可能性フラグ
のバイトデータと注目フラグのバイトデータの論理積
(AND)演算を行ない、結果を可能性フラグに代入す
る。同様にアドレスカウンタが終了となるまで操り返
す。 この処理により、高速マッチング処理に必要な範囲のみ
の可能性フラグの更新が行なえる。
【0042】次に、距離尺度以外のマッチング手法の適
用について説明する。本発明は、通常の絶対差距離やユ
ーリッド距離など、全ての距離尺度を用いたマッチング
手法を採用しているものに対して有効である。この他、
認識装置には類似度なる尺度も多く採用されている。類
似度(S)は以下の通りの数1の計算式で求められる。
【0043】
【数1】
【0044】これは単に2つのベクトルの内積値をそれ
ぞれのべクトルのノルムで正規化していることで、各ベ
クトルのノルムを1に正規化した次の数2の(2)式と
等価になる。
【0045】
【数2】
【0046】このベクトルを用いたユークリッド距離
(D)を考えると、以下の数3の(3)式となる。
【0047】
【数3】
【0048】結局、類似度とユークリッド距離とは等価
(裏表)な関係にある。従って、類似度法に対しても本
発明の適用は可能となる。
【0049】このように、本発明は、高速マッチング処
理に使用するための、辞書の各カテゴリベクトルの距離
関係を保存したフラグテーブルの構成とその作成方法で
あり、以下の点を特徴としている。 (1)1つのフラグテーブルは辞書の各カテゴリ番号に
対応したバイナリーデータであり、フラグテーブルのビ
ット値が1の場合は、対応するカテゴリが候補となる可
能性あり(マッチング処理する必要あり)、ビット値が
0の場合は、対応するカテゴリ候補となる可能性なし
(マッチング処理の必要なし)と意味付けられたもので
ある。 (2)1カテゴリ当たりのフラグテーブルの構成は、認
識手法に用いられる尺度(距離など)の最大値をある分
割数で分割し、分割された各距離範囲に対応した意味付
けのフラグテーブルを、分割した個数個備えたもので構
成されており、入力ベクトルと注目カテゴリとのマッチ
ング計算結果(距離など)により、注目カテゴリの注目
フラグテーブルが1つ決定できる構成である。
【0050】(3)本発明を効果的に動作させるため、
フラグテーブル作成前に、以前に決定された辞書の各カ
テゴリベクトルに対して、最も遠い関係にあるものから
順番に、辞書のカテゴリベクトルを並び換える操作を行
なう。 (4)辞書作成に用いた多種大量の特徴ベクトルを入力
データとし、採用されているマッチング手法と候補数を
もとに、それぞれマッチング処理とソーティング処理の
結果得られた認識結果候補と、辞書の各カテゴリベクト
ルとのマッチング結果(距離など)をもとに、各カテゴ
リの対応する注目フラグテーブルの更新処理を、入力特
徴ベクトルがなくなるまで操り返すことにより、各カテ
ゴリベクトルの距離関係を保存したフラグテーブルを作
成する方法である。
【0051】また、辞書の各カテゴリベクトルの距離関
係を保存したフラグテーブルを用いて、高速にマッチン
グ処理する方法であり、以下の点を特徴としている。 (1)1つのフラグテーブルと同様の構成をした可能性
フラクテーブルを備え、マッチング処理前にそれの全ビ
ット値を1に初期化する。 (2)カテゴリカウンタで示されるカテゴリに対応した
可能性フラグビット値が1つであるか判定することによ
り、マッチング処理すべき注目カテゴリを決定する。 (3)入力ベクトルとその注目カテゴリに対して、採用
されているマッチング計算を行ない、計算結果(距離な
ど)をもとに、注目カテゴリ注目フラグテーブルを決定
する。
【0052】(4)その注目フラグテーブルと可能性フ
ラグテーブルに対して、現カテゴリカウンタ以降のビッ
トデータに対してのみ、論理演算を用いて可能性フラグ
テーブルの更新を行なう。 (5)以降、カテゴリカウンタが認識対象カテゴリ数と
なるまで、同様の処理を操り返すことにより、可能性の
あるカテゴリベクトルとのみマッチング計算を行なうこ
とで、高速にマッチング処理を行なう。
【0053】
【発明の効果】以上の説明から明らかなように、本発明
によると、以下のような効果である。すなわち、本発明
は文字や音声の認識装置において、入力されたパターン
(文字や音声)と、予め備えてある認識辞書とのマッチ
ング処理を高速に行なう方法である。本発明では高速マ
ッチング処理を実現するため、各辞書ベクトル間の距離
関係が既知であることを利用し、その距離関係を保存し
たフラグテーブルを各辞書ベクトル毎に予め設定してお
き、入力ベクトルと注目カテゴリベクトルとのマッチン
グ結果(距離や類似度など)をもとにフラグテーブルを
用いた論理演算により、以降カテゴリに対して、認識候
補としての可能性があるカテゴリ(可能性カテゴリ)の
みを決定し、次の可能性カテゴリを注目カテゴリとし
て、遂次、同様のマッチング処理およびフラグによる決
定処理を操り返し高速に処理することができる。
【図面の簡単な説明】
【図1】本発明による高速マッチング方式の辞書並び換
え処理部の一実施例を説明するための構成図である。
【図2】図1における入力辞書及び結果辞書の構成図で
ある。
【図3】本発明による高速マッチング方式の辞書並び換
え処理のフローチャートである。
【図4】本発明による高速マッチング方式のカテゴリ選
択処理のフローチャートである。
【図5】本発明による高速マッチング方式のフラグテー
ブル作成部の構成図である。
【図6】図5における認識結果フラグ,認識辞書,フラ
グテーブル部の構成図である。
【図7】本発明による高速マッチング方式のフラグテー
ブル作成処理のフローチャートである。
【図8】本発明による高速マッチング方式の高速マッチ
ング処理部の構成図である。
【図9】図8における可能性フラグテーブル,認識辞
書,フラグテーブル部の構成図である。
【図10】本発明による高速マッチング方式の高速マッ
チング処理部のフローチャートである。
【図11】本発明による高速マッチング方式の可能性フ
ラグテーブル更新処理のフローチャートである。
【図12】本発明の辞書ベクトルと入力ベクトルとの位
置関係を示す図である。
【図13】本発明を説明するための従来方式の計算例を
示す図である。
【図14】本発明の第1カテゴリとの計算結果と可能性
カテゴリを示す図である。
【図15】本発明の第2カテゴリとの計算結果と可能性
カテゴリを示す図である。
【図16】従来のマッチング処理のフローチャートであ
る。
【符号の説明】
1…辞書並び換え処理部、2…平均ベクトル作成部、3
…最近傍カテゴリ決定部、4…カテゴリベクトルコピー
部、5…コピーフラグ制御部、6…辞書並び換え制御
部、7…平均ベクトルバッファ、8…入力辞書バッフ
ァ、9…結果辞書バッファ、10…結果辞書カウンタ、
11…選択番号バッファ、12…入力辞書カウンタ、1
3…最大累積距離バッファ、14…累積距離バッファ、
15…カウンタ、16…距離バッファ、17…カテゴリ
選択制御部、18…カテゴリ選択処理部。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 入力データに対して、各辞書カテゴリベ
    クトルとの距離計算を行う計算手段と、該計算手段によ
    る距離計算ののちにソーティングによって認識候補を作
    成する認識候補作成手段と、前記ソーティング結果をも
    とに認識候補として選ばれた候補番号に対応するビット
    を決定して認識結果フラグを作成するフラグ作成手段
    と、辞書カテゴリを注目カテゴリとし、フラグテーブル
    を決定する注目フラグテーブル決定手段と、該注目フラ
    グテーブルと前記認識結果フラグとの論理和を求める演
    算手段とから成り、高速マッチング処理のための辞書の
    各カテゴリベクトルの距離関係を保存したフラグテーブ
    ルを作成することを特徴とした高速マッチング方式。
  2. 【請求項2】 1つのフラグテーブルと同様の構成を有
    する可能性フラグテーブルのビットを判定する判定手段
    と、該判定手段によりビットが1の場合にマッチング処
    理すべき注目カテゴリを決定する注目カテゴリ決定手段
    を、入力ベクトルの前記注目カテゴリに対してマッチン
    グ計算を行なう計算手段と、該計算手段の結果に基づい
    て、注目カテゴリの注目フラグテーブルを決定する注目
    フラグテーブル決定手段と、該注目フラグテーブル決定
    手段により決定された注目フラグテーブルと前記可能性
    フラグテーブルに対して、論理演算を用いて可能性フラ
    グテーブルの更新を行う更新手段とから成り、辞書の各
    カテゴリベクトルの距離関係を保存したフラグテーブル
    を用いて高速マッチング処理することを特徴とする高速
    マッチング方式。
JP10033893A 1993-04-02 1993-04-02 高速マッチング方法及び装置 Expired - Fee Related JP3361564B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10033893A JP3361564B2 (ja) 1993-04-02 1993-04-02 高速マッチング方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10033893A JP3361564B2 (ja) 1993-04-02 1993-04-02 高速マッチング方法及び装置

Publications (2)

Publication Number Publication Date
JPH06290272A true JPH06290272A (ja) 1994-10-18
JP3361564B2 JP3361564B2 (ja) 2003-01-07

Family

ID=14271349

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10033893A Expired - Fee Related JP3361564B2 (ja) 1993-04-02 1993-04-02 高速マッチング方法及び装置

Country Status (1)

Country Link
JP (1) JP3361564B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08146988A (ja) * 1994-11-21 1996-06-07 N T T Data Tsushin Kk 音声認識方法及び音声認識装置
JP2004259114A (ja) * 2003-02-27 2004-09-16 Seiko Epson Corp 物体識別方法および物体識別装置、並びに物体識別プログラム
CN111611990A (zh) * 2020-05-22 2020-09-01 北京百度网讯科技有限公司 用于识别图像中表格的方法和装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08146988A (ja) * 1994-11-21 1996-06-07 N T T Data Tsushin Kk 音声認識方法及び音声認識装置
JP2004259114A (ja) * 2003-02-27 2004-09-16 Seiko Epson Corp 物体識別方法および物体識別装置、並びに物体識別プログラム
CN111611990A (zh) * 2020-05-22 2020-09-01 北京百度网讯科技有限公司 用于识别图像中表格的方法和装置
CN111611990B (zh) * 2020-05-22 2023-10-31 北京百度网讯科技有限公司 用于识别图像中表格的方法和装置

Also Published As

Publication number Publication date
JP3361564B2 (ja) 2003-01-07

Similar Documents

Publication Publication Date Title
Bonneel et al. Spot: sliced partial optimal transport
CN112368697B (zh) 经由对偶分解评估损失函数或损失函数的梯度的系统和方法
US11232141B2 (en) Method and device for processing an electronic document
JP2710062B2 (ja) 出力候補数決定方式
Chen et al. Efficient partial shape matching using smith-waterman algorithm
US5572604A (en) Method for pattern recognition using prototype transformations and hierarchical filtering
CN110046249A (zh) 胶囊网络的训练方法、分类方法、系统、设备及存储介质
CN111401099B (zh) 文本识别方法、装置以及存储介质
CN109800215B (zh) 一种对标处理的方法、装置、计算机存储介质及终端
JP3361564B2 (ja) 高速マッチング方法及び装置
EP0495182A2 (en) Constellation matching system and method
Pavlidis The use of a syntactic shape analyzer for contour matching
US20030212652A1 (en) Max, min determination of a two-dimensional sliding window of digital data
CN113554145A (zh) 确定神经网络的输出的方法、电子设备和计算机程序产品
CN116051519B (zh) 双时相影像建筑物变化检测方法、装置、设备及存储介质
CN116029492B (zh) 派单方法和装置
JP2882327B2 (ja) 線図形整合装置
JPH0737037A (ja) 最近傍分類を認識する比較関数に基づくocr方法
Verma et al. Improving LSH via Tensorized Random Projection
Wilkinson et al. Visualizing document image collections using image-based word clouds
JP3164962B2 (ja) 文字認識辞書作成方法および装置
CN114281862A (zh) 一种基于向量的数据比对方法、终端设备及存储介质
CN111597375A (zh) 基于相似图片组代表特征向量的图片检索方法及相关设备
JP2002318818A (ja) データ処理装置及びその方法、及びそのプログラム
CN118035442A (zh) 一种基于度量学习的不平衡文本分类方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071018

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081018

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081018

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091018

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091018

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101018

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111018

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees