JPH05314319A - パターン認識後処理方式 - Google Patents

パターン認識後処理方式

Info

Publication number
JPH05314319A
JPH05314319A JP4114501A JP11450192A JPH05314319A JP H05314319 A JPH05314319 A JP H05314319A JP 4114501 A JP4114501 A JP 4114501A JP 11450192 A JP11450192 A JP 11450192A JP H05314319 A JPH05314319 A JP H05314319A
Authority
JP
Japan
Prior art keywords
category
candidate
candidate category
occurrence probability
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4114501A
Other languages
English (en)
Other versions
JP3099845B2 (ja
Inventor
Akira Suzuki
章 鈴木
Sueji Miyahara
末治 宮原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP04114501A priority Critical patent/JP3099845B2/ja
Publication of JPH05314319A publication Critical patent/JPH05314319A/ja
Application granted granted Critical
Publication of JP3099845B2 publication Critical patent/JP3099845B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】 認識精度を向上したパターン認識後処理方式
を提供する。 【構成】 パターン認識結果から単語辞書との照合等で
候補カテゴリ列の集合から最尤候補カテゴリ列を選択す
る評価尺度として、式(1)で計算される評価値を使用
し、最も正解確率の高いカテゴリ列を選択することがで
きる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、認識精度を向上し得る
パターン認識後処理方式に関する。
【0002】
【従来の技術】認識対象とする全カテゴリの偏数をmと
し、各カテゴリをC1 〜Cm とする。入力カテゴリ列の
長さをL、入力される可能性のある全てのカテゴリ列の
集合をω,ωの要素数をkとする。
【0003】ここで、ある入力カテゴリ列の特徴ベクト
ルX1 〜XL に対して、最も正解の確率の高いカテゴリ
列を選択することを考える。この方法は、各カテゴリ列
について次式(1)で表される評価値を計算し、その値
が最大となる候補単語を求めることであることが、統計
的決定論から導出されている。
【0004】
【数1】 上式において、Wはωの中の任意のカテゴリ列、P
(W)はWの出現確率、CwiはWのi番目のカテゴリ、
P(Xi |Cwi)はカテゴリCwiからi番目のパターン
の特徴ベクトルXi が発生する確率である。この場合、
カテゴリ列の生起確率P(W)は比較的容易に求められ
る。
【0005】
【発明が解決しようとする課題】しかし、従来は特徴ベ
クトルXi としてパターン認識処理の特徴抽出過程にお
いて抽出される特徴ベクトルを当てはめており、この場
合はCi のカテゴリから特徴ベクトルXi が生起するP
(Xi |Cwi)を求めるのは非常に難しい。一般のパタ
ーン認識において出力される候補カテゴリの信頼性とし
ては、距離や類似度などの、確率P(Xi |Ci )に直
接変換することが難しい量である。したがって、前述の
評価値を計算するのは従来のパターン認識技術では難し
かった。
【0006】本発明は、上記に鑑みてなされたもので、
その目的とするところは、最も正解確率の高いカテゴリ
列を選択し、認識精度を向上したパターン認識後処理方
式を提供することにある。
【0007】
【課題を解決するための手段】上記目的を達成するた
め、本発明のパターン認識後処理方式は、音声や文字等
の入力パターンを認識し、認識結果として複数の候補カ
テゴリおよび該候補カテゴリの距離を生成するパターン
認識方式において、候補カテゴリ列の集合を作成する候
補カテゴリ列集合作成手段と、候補カテゴリ列集合作成
手段から出力された候補カテゴリ列集合の各候補カテゴ
リ列に対し、一定の規則で該カテゴリ列の生起確率を付
与するカテゴリ列生起確率計算手段と、該カテゴリ列生
起確率計算手段で生起確率計算手段を付与された候補カ
テゴリ列集合からすべての2つの候補カテゴリ列から構
成される候補カテゴリ列対の集合を作成する候補カテゴ
リ列対集合作成手段と、該候補カテゴリ列対集合作成手
段で作成された候補カテゴリ列対集合の中のすべての候
補カテゴリ列対について候補カテゴリ列対判定手段を用
いて評価値の計算を行い、自分以外の候補カテゴリ列対
よりも評価値が高い候補カテゴリ列を調べて最尤候補カ
テゴリ列として出力する最尤候補カテゴリ列選択部と、
任意の候補カテゴリ列対から、互いに対応するカテゴリ
および該カテゴリの距離からなる部分認識結果の集合を
作成し、該部分認識結果集合の生起確率を生起確率計算
手段を用いて計算し、該生起確率および候補カテゴリ列
の生起確率から評価値を計算する候補カテゴリ列対判定
手段と、任意の部分認識結果に対し、該部分認識結果に
含まれる2個の候補カテゴリについて各カテゴリから該
部分認識結果が生成される生起確率を求めて出力する生
起確率計算手段とを有することを要旨とする。
【0008】
【作用】本発明のパターン認識後処理方式では、認識対
象とする全カテゴリの個数をmとし、各カテゴリをC1
〜Cm とする。入力カテゴリ列の長さをL、入力される
可能性のある全てのカテゴリ列の集合をω,ωの要素数
をkとする。ここで、ある入力カテゴリ列の特徴ベクト
ルX1 〜XL に対して、最も正解の確率の高いカテゴリ
列を選択する機能において、ωに含まれる各カテゴリ列
について式(1)で表される評価値を計算し、その値が
最大となる候補カテゴリ列を求める方法を実現する。
【0009】あるカテゴリCから任意の特徴ベクトルX
が生起される確率P(X|C)を計算するのは、従来の
ように特徴ベクトルXとしてパターン認識処理の特徴抽
出過程において抽出される特徴ベクトルを当てはめるの
は難しい。そこで、特徴ベクトルXとして、入力パター
ンを認識した結果である全カテゴリに対する距離から構
成されるベクトルを採用し、これを距離ベクトルと呼
ぶ。ここで、認識対象の全カテゴリを順番に並べた時の
各カテゴリの通し番号(1〜m)をカテゴリ番号と呼ぶ
ことにし、カテゴリ番号がjであるカテゴリをCj で表
す。そして、入力パターンのカテゴリ番号jに対する距
離をrj で表すと、距離ベクトルは(r1,r2 ,…,
m )で表され、P(X|C)は次式で表される。
【0010】 P(X|C)=P((r1 ,r2 ,…,rm )|C) (2) ここで、何らかの方法により、正解の可能性のあるカテ
ゴリが2個に限定された場合を考える。このカテゴリを
u とCv とすると、距離ベクトルの中で両者の識別に
最も有効な要素を2個選ぶとすればru とrv であるの
で、この2個の要素から新しい特徴ベクトル(ru ,r
v )を作成し、式(2)の距離ベクトルの代わりにこれ
を使用する。このベクトルを部分距離ベクトルと呼ぶ。
この場合、式(2)は、次のようになる。
【0011】 P(X|Cu )=P((ru ,rv )|Cu ) P(X|Cv )=P((ru ,rv )|Cv ) この場合、任意の2カテゴリ間についての部分距離ベク
トルの生起確率(上の説明におけるP((ru ,rv
|Cu )とP((ru ,rv )|Cv ))を求める手段
が必要になるが、これはパターン認識で用いている識別
関数から理論的に導出するか、もしくは大量の認識結果
を収集し、全ての2カテゴリ間についての部分距離ベク
トルの分布を統計的に求めることにより実現できる。
【0012】
【実施例】以下、図面を用いて本発明の実施例を説明す
る。
【0013】図1は、本発明の一実施例に係わるパター
ン認識後処理方式の構成を示すブロック図である。図1
において、1は候補カテゴリ列集合作成手段、2はカテ
ゴリ列生起確率計算手段、3は候補カテゴリ列対集合作
成手段、4は最尤候補カテゴリ列選択部、5は候補カテ
ゴリ列対判定手段、6は生起確率計算手段である。
【0014】説明のために、カテゴリとしてA〜Gの英
字、パターンとして文字を用いる。また各カテゴリを順
番に並べた時の通し番号をカテゴリ番号と呼び、図2に
示す。
【0015】まず、パターン認識結果が候補カテゴリ列
集合作成手段1に入力される。正解が「FC」である認
識結果の例を図3に示す。
【0016】候補カテゴリ列集合作成手段1は、候補カ
テゴリ列集合を作成する。この方法は、生起可能な候補
カテゴリ列をあらかじめすべて用意した辞書を用いる方
法や、パターン認識結果の候補カテゴリを組み合わせて
作成する方法などが考えられるが、説明のために、ここ
では生起可能な候補カテゴリ列をあらかじめすべて用意
したカテゴリ列辞書を用いる方法を使用する。カテゴリ
列辞書の例を図4に示す。またその場合の候補カテゴリ
列集合作成手段1の処理結果は、{FG,FC,AD}
である。
【0017】次に、カテゴリ列生起確率計算手段2によ
って、候補カテゴリ列集合に含まれる各カテゴリ列の生
起確率が計算され、付与される。この方法として、説明
のために既に図4に示したカテゴリ列辞書の各カテゴリ
列にあらかじめ生起確率を記録しておき、このカテゴリ
列辞書と照合する方法を用いる。この場合の処理結果は
{(FG,0.3),(FC,0.2),(AD,0.
5)}である(()内はカテゴリ列および生起確率)。
【0018】次に、カテゴリ列生起確率計算手段2の処
理結果を受けて、候補カテゴリ列対集合作成手段3にお
いて候補カテゴリ列対集合が作成される。この場合の処
理結果を図5に示す。
【0019】次に、最尤候補カテゴリ列選択部4が候補
カテゴリ列対集合の要素を1個づつ取りだし、候補カテ
ゴリ列対判定手段5に送って各候補カテゴリ列対に含ま
れる候補カテゴリ列の評価値を計算し、その結果の中か
ら自分以外の全候補カテゴリ列よりも評価値の高い候補
カテゴリ列を最尤候補カテゴリ列とする。例の場合で
は、図5の候補カテゴリ列対集合に含まれる3つの候補
カテゴリ列対を候補カテゴリ列対判定手段5に送った結
果を図6(a),(b),(c)に示す。この結果か
ら、候補カテゴリ列「FC」が他の全ての候補カテゴリ
列よりも評価値が高いことから最尤候補カテゴリ列と判
断される(図6(a),(b),(c)では高い方の評
価値を「◎」で示している)。
【0020】次に、候補カテゴリ列対判定手段5の動作
を説明する。
【0021】例として、図5の候補カテゴリ列対集合の
候補カテゴリ列対NO.1が送られた時の動作を説明す
る。まず、候補カテゴリ列対から、対応する文字位置の
カテゴリと距離からなる部分距離ベクトルを全文字位置
について作成し、それを1個づつ生起確率計算手段6に
送って、部分距離ベクトルに含まれる2つのカテゴリか
らその部分距離ベクトルが生起する確率を計算する。こ
の場合は部分距離ベクトルとして(18(E),25
(F))と(32(G),16(C))が送られる。
【0022】生起確率計算手段6は、受け取った部分距
離ベクトルに含まれる2つのカテゴリそれぞれについ
て、その部分距離ベクトルが発生する確率を計算する。
【0023】図6(a)の例では、部分距離ベクトル
(18(E),25(F))に対して、カテゴリEから
この部分ベクトルが生起する確率は0.2、カテゴリF
からこの部分ベクトルが生起する確率は0.1と計算さ
れている。
【0024】
【発明の効果】以上説明したように、本発明によれば、
パターン認識結果から単語辞書との照合等で候補カテゴ
リ列の集合から最尤候補カテゴリ列を選択する評価尺度
として、式(1)で計算される評価値を使用することが
できるので、最も正解確率の高いカテゴリ列を選択する
ことができ、認識精度を向上させることができる。
【図面の簡単な説明】
【図1】本発明の一実施例に係わるパターン認識後処理
方式の構成を示すブロック図である。
【図2】図1のパターン認識後処理方式の動作を説明す
るために使用されるカテゴリのカテゴリ番号を示す図で
ある。
【図3】図1のパターン認識後処理方式の動作を説明す
るために使用される認識結果の列を示す図である。
【図4】図1のパターン認識後処理方式に使用される候
補カテゴリ列集合作成手段およびカテゴリ列生起確率計
算手段の動作を示すために使用されるカテゴリ列辞書を
示す図である。
【図5】図1のパターン認識後処理方式に使用される候
補カテゴリ列対集合作成手段の処理結果例を示す図であ
る。
【図6】図1の最尤候補カテゴリ列選択手段の処理過程
を示す説明図である。
【符号の説明】
1 候補カテゴリ列集合作成手段 2 カテゴリ列生起確率計算手段 3 候補カテゴリ列対集合作成手段 4 最尤候補カテゴリ列選択手段 5 候補カテゴリ列対判定手段 6 生起カテゴリ計算手段

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 音声や文字等の入力パターンを認識し、
    認識結果として複数の候補カテゴリおよび該候補カテゴ
    リの距離を生成するパターン認識方式において、候補カ
    テゴリ列の集合を作成する候補カテゴリ列集合作成手段
    と、候補カテゴリ列集合作成手段から出力された候補カ
    テゴリ列集合の各候補カテゴリ列に対し、一定の規則で
    該カテゴリ列の生起確率を付与するカテゴリ列生起確率
    計算手段と、該カテゴリ列生起確率計算手段で生起確率
    計算手段を付与された候補カテゴリ列集合からすべての
    2つの候補カテゴリ列から構成される候補カテゴリ列対
    の集合を作成する候補カテゴリ列対集合作成手段と、該
    候補カテゴリ列対集合作成手段で作成された候補カテゴ
    リ列対集合の中のすべての候補カテゴリ列対について候
    補カテゴリ列対判定手段を用いて評価値の計算を行い、
    自分以外の候補カテゴリ列対よりも評価値が高い候補カ
    テゴリ列を調べて最尤候補カテゴリ列として出力する最
    尤候補カテゴリ列選択部と、任意の候補カテゴリ列対か
    ら、互いに対応するカテゴリおよび該カテゴリの距離か
    らなる部分認識結果の集合を作成し、該部分認識結果集
    合の生起確率を生起確率計算手段を用いて計算し、該生
    起確率および候補カテゴリ列の生起確率から評価値を計
    算する候補カテゴリ列対判定手段と、任意の部分認識結
    果に対し、該部分認識結果に含まれる2個の候補カテゴ
    リについて各カテゴリから該部分認識結果が生成される
    生起確率を求めて出力する生起確率計算手段とを有する
    ことを特徴とするパターン認識後処理方式。
JP04114501A 1992-05-07 1992-05-07 パターン認識後処理方式 Expired - Fee Related JP3099845B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04114501A JP3099845B2 (ja) 1992-05-07 1992-05-07 パターン認識後処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04114501A JP3099845B2 (ja) 1992-05-07 1992-05-07 パターン認識後処理方式

Publications (2)

Publication Number Publication Date
JPH05314319A true JPH05314319A (ja) 1993-11-26
JP3099845B2 JP3099845B2 (ja) 2000-10-16

Family

ID=14639335

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04114501A Expired - Fee Related JP3099845B2 (ja) 1992-05-07 1992-05-07 パターン認識後処理方式

Country Status (1)

Country Link
JP (1) JP3099845B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3520022B2 (ja) 2000-01-14 2004-04-19 株式会社国際電気通信基礎技術研究所 外国語学習装置、外国語学習方法および媒体

Also Published As

Publication number Publication date
JP3099845B2 (ja) 2000-10-16

Similar Documents

Publication Publication Date Title
US5982929A (en) Pattern recognition method and system
KR20010041440A (ko) 자동 음성인식 시스템에서 엔-베스트 리스트에 적용된지식 베이스 전략
JPH0634185B2 (ja) 入力語認識装置
JPH05314319A (ja) パターン認識後処理方式
JP3708747B2 (ja) 音声認識方法
JP2966002B2 (ja) 音声認識装置
JPH0566597B2 (ja)
JP3110478B2 (ja) パターン認識方法および装置
JP3126081B2 (ja) ベクトル量子化方法及びベクトル量子化装置
JPH0922443A (ja) オンライン手書き文字認識方法
JPH0654503B2 (ja) パタ−ン認識装置
JPH0464077B2 (ja)
JP3245415B2 (ja) 文字認識方法
JPH06187500A (ja) オンライン文字認識装置
JP3352467B2 (ja) オンライン文字認識装置
JP2000122693A (ja) 話者認識方法および話者認識装置
JP2895486B2 (ja) 文字認識方法及び装置
JPH02148277A (ja) パターン認識装置
JPH01169588A (ja) オンライン文字認識装置
WO1991016687A1 (en) Pattern recognition
JPS62173498A (ja) 音声認識装置
JPS59160275A (ja) 単語認識装置
Lee Incremental network generation in template-based word recognition
JP2000181483A (ja) 単語音声認識方法
JPH06308994A (ja) 日本語音声認識方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070818

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080818

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080818

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090818

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees