JPS63278099A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS63278099A
JPS63278099A JP62012257A JP1225787A JPS63278099A JP S63278099 A JPS63278099 A JP S63278099A JP 62012257 A JP62012257 A JP 62012257A JP 1225787 A JP1225787 A JP 1225787A JP S63278099 A JPS63278099 A JP S63278099A
Authority
JP
Japan
Prior art keywords
judgment
similarity
detailed identification
category
detailed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62012257A
Other languages
English (en)
Inventor
高橋 圭子
陽一 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP62012257A priority Critical patent/JPS63278099A/ja
Publication of JPS63278099A publication Critical patent/JPS63278099A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は音声認識性能に優れた音声認識装置に関する
ものである。
(従来の技術) 音声認識に比較的多用される手法の一つにパタンマツチ
ング技術がある。これは、認識対象カテゴリ毎にその代
表的な特徴時系列パタン(標準パタンと称す)を用意し
ておき、入力された未知の音声の特徴時系列パタン(入
力パタンと称す)と各標準パタンとを重ね合せてその重
なり具合(類似度と称す)を算出して、最も重なりあう
、すなわち最大の類似度を与える標準パタンと同じカテ
ゴリに入力パタンが属すると判定する技術である。
類似度はパタン中で一定時間間隔毎に入力パタンと標準
パタンとの重なり具合を評価した量の総和である。この
ため1重なり具合が最適な所が多いほど類似度は大きく
なる。入力パタンと入力パタンが属するカテゴリの標準
パタンとの重なり具合の最適な所が他カテゴリのものに
比べて多いため、結果的に入力パタンが属するカテゴリ
の類似度が最大になるであろうと予想される。
このように従来用いられているパタンマツチング技術は
、入力パタンの特徴を全体的にとらえ、入力パタンの属
するカテゴリの標準パタンに対して最適な重なりを示し
て最大の類似度となるようにし、安定した音声認識性能
を得るようにしたものである。
(発明が解決しようとする問題点) パタンマツチング技術で用いられる標準パタンは、標準
パタンか属するカテゴリの平均的な特徴の現れかたを示
したパタンである。そのため、入力パタンに特徴の現れ
かたのばらつきが大きい部分があると、その部分に対し
て入力パタンと同じカテゴリに属する標準パタンとのず
れが大きくなり、結果的に入力パタンの属するカテゴリ
の類似度は小さくなる可能性がある。
特徴の現れかたのばらつきが大きい部分がある入力パタ
ンで、当該入力パタンの属するカテゴリに類似するカテ
ゴリが存在する場合、この類似カテゴリの標準パタンは
入力パタンの属するカテゴリの標準パタンと類似してい
る。これがため、類似カテゴリの類似度は入力パタンの
属するカテゴリの類似度と近い値を持ち、従って入力パ
タンの属するカテゴリの類似度が最大でなくなる可能性
があり、誤認識につながる。
例えば、「シチ」を入力パタンの例にとると、音声パワ
ーの低下する「シ」や「チ」のパタンの 終りの部分で
、「シチ」の標準パタンとのずれが大きくなり「シチ」
の類似度は小さくなる。そして「シチ」に対しては「イ
チ」という類似カテゴリが存在するため、結果的に「シ
チ」の類似度が最大となり得ないことも予想される。こ
のようにパタンマツチング技術は、入力パタンに特徴の
現れ方にばらつきの大きい部分があると、入力パタンの
属するカテゴリの類似度が小さくなる可能性があり、こ
れがため、類似カテゴリの識別が困難となるという問題
点があった。
この問題の解決を図るため、種々の検討を行ったところ
、類似カテゴリの識別に対しては、特徴が安定して抽出
されるばらつきの小さい部分で類似カテゴリ間で差を表
わす特徴の抽出量を調べれば識別は可能である。また、
既に説明した通り、パタンマツチング技術は、特徴の現
れ方のばらつきが大きい部分の影響で入力パタンの属す
るカテゴリの類似度が小さくなる可能性があり、類似カ
テゴリの識別が困難であるが、入力パタンの属するカテ
ゴリの類似度が最大でないにしても上位の値をとるので
、認識対象カテゴリを絞ることは可能である。
この発明は1以上の点を考慮して成されたもので、従っ
て、この発明の目的は、パタンマツチング技術で得られ
る認識結果に対して類似カテゴリの識別(詳細識別)を
行うか否かの判定を行い、詳細識別を行うと判定された
場合に詳細識別を行う構成と成して認識性能の向上を図
った音声認識装置を提供することにある。
(問題点を解決するための手段) この目的の達成を図るため、この発明の音声認識装置に
よれば、 入力音声を音声分析部で処理して得た音声分析出力を特
徴時系列パタン作成部に供給し、これよりパタンマツチ
ング手段に特徴時系列パタンを出力し、このパタンマツ
チング手段において特徴時系列パタンと予め用意された
標準パタンとのマツチング類似度を認識対象カテゴリ毎
に算出し、得られたマツチング類似度に基づいて判定部
により特徴時系列パタンか標準パタンと同じカテゴリに
属するかを判定して認識結果を出力する音声認識装置に
おいて。
マツチング類似度を第一次類似度としこの第一次類似度
から詳細識別の必要の有無の判定を行う詳細識別判定手
段と、 音声分析部からの音声分析出力から類似カテゴリの識別
に有効な詳細識別特徴量を抽出する詳細識別特徴量抽出
手段と。
詳細識別の必要有りとの判定の場合には詳細識別特徴量
及び詳細特徴辞書を用いて又は詳細識別の必要無しとの
判定の場合には第一次類似度及び詳細識別特徴量を用い
ずにそれぞれに対応する詳細識別類似度を算出して出力
する詳細識別類似度出力手段と を設け、 そして1判定部を、第一次類似度と詳細識別類似度とを
総合した最終類似度が最大値を与えるカテゴリを認識結
果として出力する構成とすることを特徴とする。
この発明の実施に当り、詳細識別が必要な場合には、上
位の複数の第一次類似度の認識対象カテゴリに対する詳
細識別類似度を算出しその他の認識対象カテゴリに対す
る詳細識別類似度をrQJとし、及び詳細識別が必要無
い場合には、認識対象カテゴリ毎の詳細識別類似度をr
QJとするのが好適である。
さらに、この発明の好適実施例によれば、詳細識別判定
手段に判定辞書と詳細識別判定部とを備え。
この判定辞書には、詳細識別判定の比較基準となる判定
条件要素と、複数のこれら判定条件要素で構成され詳細
識別のため一条件の成立可否を判定するための判定条件
内容と、該一条件が成立した時に判定が実行される使用
詳細識別特徴を指示する特徴番号と、前記判定条件内容
及び特徴番号の集合で構成される判定基準と、これら判
定基準の集合で構成され詳細識別を行うための判定尺度
とを予め読出し自在に格納しておき、 詳細識別判定部は、最大値から順次の上位の複数の第一
次類似度及びこれら複数の第一次類似度が与えるカテゴ
リを候補カテゴリ情報として選択し、これら候補カテゴ
リ情報から判定条件要素と比較される被判定条件要素を
求め、一つの判定尺度の一つの判定基準における各判定
条件内容毎に行われる判定条件要素と被判定条件要素と
の比較処理を全ての判定基準及び全ての判定尺度につい
て行い、これら比較処理により少なくとも一つ以上の判
定条件内容における判定条件要素の全てと被判定条件要
素とが一致した時は、詳細識別の必要有りとして当該判
定条件内容が属する判定基準の使用詳細識別特徴の特徴
番号を出力する構成とすることが出来る。
さらに、この発明の好適実施例においては1判定尺度は
類似カテゴリの組み合せとし1判定基準の一つを上位の
複数の第一次類似度が与えるカテゴリと類似する類似カ
テゴリが存在するという基準とし、判定条件の一つを誤
認識を起し易い類似カテゴリの組み合せとすることが出
来る。
さらに、この発明の好適実施例においては。
判定尺度は第一次類似度の差とし、判定基準を上位の複
数の第一次類似度のうちの任意の二つの第一次類似度の
差が所定の閾値以下であるという基準とし、判定内容を
所定の閾値とすることが出来る。
(作用) この発明の音声認識装置によれば、 ■入力音声を一定の時間間隔(フレームと称す)で分析
して入力音声の特徴時系列パタンを作成し、パタンプッ
チング手段において予め用意された標準パタンとのマツ
チング類似度を第一次類似度として認識対象カテゴリ毎
に算出する。
■次に、詳細識別判定手段において、第一次類似度の最
大値を第1位とし、大きい順に任意に定めた個数の第一
次類似度、及びその第一次類似度が与えるカテゴリを候
補カテゴリ情報とし、候補カテゴリ情報と詳細識別を行
うための条件が設定されている判定辞書とを用いて詳細
識別を行うか否かを判定する。
0次に、詳細識別類似度出力手段においては、詳細識別
を行う判定がなされた場合は、第一次類似度が上位の認
識対象カテゴリに対する詳細識別類似度を該認識カテゴ
リを識別するために必要な詳細識別特徴量と詳細特徴辞
書とを用いて算出し、それ以外の認識対象カテゴリに対
する詳細識別類似度を例えば「O」とし、詳細識別を行
わない判定がなされた場合は、全ての認識対象カテゴリ
の詳細識別類似度を例えば「0」とする。
■次に判定部において、第一次類似度と詳細識別類似度
を総合して認識対象カテゴリ毎に最終類似度を求め、最
大の最終類似度を与える標準パタンか属するカテゴリを
認識結果として出力する。
以上0〜0項の手順に従って音声認識を行う。
(実施例) 以下、図面を参照してこの発明の音声認識装置の実施例
につき説明する。
第1図はこの発明の音声認識装置の実施例を示すブロッ
ク図である。
縫!盈」 以下第1図に従ってこの装置の構成及び動作の概要を併
せて説明する。
入力された音声波形のAD変換した値である人、力音声
信号aは音声分析部10へ入力される。音声分析部10
は、入力音声信号aの音声分析(例えば周波数分析)を
行い、所定の時°間間隔で入力音声の始端から終端(音
声区間と称す)までの音声分析出力すを特徴時系列パタ
ン作成部12及び詳細識別特徴抽出手段14へ出力する
。特徴時系列パタン作成部12はマツチング演算に必要
な特徴を抽出して特徴時系列パタンを作成し、特徴時系
列パタンCをパタンマツチング手段16のパタンマツチ
ング類似度演算部18へ出力する。詳細識別特徴抽出手
段14は後述する詳細識別に用いられる複数の特徴量(
詳細識別特徴量)dを抽出し、抽出順に詳細識別特徴量
dを詳細識別類似度出力手段28の詳細識別類似度演算
部30へと出力する。パタンマツチング類似度演算部1
8は特徴時系列パタンCと標準パタン記憶部20に予め
用意されている標準パタンとの第一次類似度を求める演
算を行い、認識対象カテゴリ毎の第一次類似度eを一方
においては詳細識別判定手段22の詳細識別類似度判定
部24及び他方においては詳細識別類似度出力手段28
の詳細識別類似度演算部30へ出力する。詳細識別判定
部24は第一次類似度eの最大値から大きい順に任意の
数N個の第一次類似度(この場合にもeとして示す、)
を選び、選んだ第一次類似度eとその第一次類似度eが
与えるカテゴリの情報と判定辞書26とを参照し、後述
する方法に従って、詳細識別を行うか否かの判定を行い
、詳細識別を行うと判定された場合には実際に行うべき
詳細識別の実行番号及び詳細識別を行わないと判定され
た場合には例えばrQJとする詳細識別実行番号fを詳
細識別類似度演算部30へ出力する。詳細識別類似度演
算部30は詳細識別を行うと判定された場合には詳細識
別特徴量d、詳細識別実行番号f及び詳細特徴辞書32
とを参照する後述の方法に従って詳細識別類似度を算出
し、それを第一次類似度と総合した認識対象カテゴリ毎
の最終類似度gを判定部34に出力する。また、詳細識
別を行わないと判定された場合は第一次類似度eを最終
類似度gとして認識対象カテゴリ毎に判定部34へ出力
する。
判定部34は認識対象カテゴリ毎の最終類似度の最大値
が与えるカテゴリを認識結果りとして出方する。
1  1 ・   び雷   1 次に、これら手段での詳細識別の動作について説明する
この発明では詳細識別判定手段22及び詳細識別類似度
出力手段28を設けて詳細識別を行って、パタンマツチ
ング技術では識別困難な類似カテゴリを識別し認識性能
を向上させるために行うものである。従って、類似カテ
ゴリが存在し誤認識を生じやすい結果が出力された場合
にのみ詳細識別を行うよう詳細識別の実行を判定するこ
とが必要である。
一つの詳細識別を行うために必要な情報を表わす判定尺
度は、第一次類似度の上位2位が与えるカテゴリ及び1
位と2位の第一次類似度の差といったように複数存在す
る。一つの判定尺度だけでは詳細識別を行うか否かの判
定は完全ではないので、この発明は複数の判定尺度を用
いることとする。
第1図の詳細識別判定部24及び詳細識別類似度演算部
30に相当する詳細識別の処理手順を第2図を用いて説
明する。
第2図は詳細識別の処理手順を示す図である。
尚1図中、処理ステップをSで示す。
■=詳細識別判定部での処理ステップ く候補カテゴリ情報選択>(Sl) 詳細識別判定の対象となる認識対象カテゴリに関する情
報をパタンマツチングによる第一次類似度を用いて選択
する。任意に定めて選択される第一次類似度の候補数を
5ELNOとすると、この処理ステップではパタンマツ
チングによって得られる第一次類似度を大きい順に定め
られた5ELNOの数だけ選ぶ処理が行われる。この選
択された第一次類似度及びその第一次類似度が与えるカ
テゴリが候補カテゴリ情報となる。
く詳細識別類似度初期設定>(32) 次に、詳細識別類似度の初期設定を行う、詳細識別類似
度をR2(n)とすると、詳細識別類似度R2(n)は
後述するように判定基準内容毎に算出されているため、
全ての認識対象カテゴリに対する詳細識別類似度R2(
n)を R2(n)=O(1≦n≦N) n:認識対象カテゴリ番号 N:認識対象カテゴリ数 と設定する処理を行う。
く判定尺度番号初期設定>(53) 次に、判定尺度番号の初期設定を行う0判定尺度番号i
は複数存在する判定尺度の各々に与えられた番号であり
、判定尺度数をLNOとすると判定尺度番号iは1−L
NOの値をとる。この処理ステップ(SS)では判定尺
度番号Iに1を設定する。
く判定基準番号初期設定>(S4) 次に、判定基準番号の初期設定を行う0判定基準は、詳
細識別を行うための一条件と、その条件が成立したとき
実行される詳細識別に関する情報とを表わしていて判定
尺度毎に定められる。
例えば、一つの判定尺度を誤認識しやすい類似カテゴリ
の組合せとしたとき判定基準は「イチ。
シチ」、「イチ、ハチ」なとの類似カテゴリが存在する
ときとなる。尚1判定基準の数は判定尺度毎に定まる0
判定基準に与えられた番号を判定基準番号jとし、一つ
の判定尺度における判定基準の数をFNOとすると、判
定基準番号jは1−FNOの値をとる。この初期設定の
処理ステップ(S4)ではjに1を設定する。
く詳細識別実行判定〉(SS) 次に、詳細識別を行うか否かを判定する。処理ステップ
(s i)で選択される5ELNO数の候補カテゴリ情
報に基づいて定まりかつ詳細識別判定の対象となるカテ
ゴリのデータ情報である被判定条件と、詳細識別を行う
ための一条件が成立するか否かを判定する情報を表わす
判定条件内容とを比較し、 条件(a):被判定条件が判定条件内容を満たす場合は
詳細識別を実行するものとし、 条件(b):被判定条件が判定条件内容を満たさない場
合は詳細識別は行わないものとする。
尚、条件(a)が成立するとき1判定基準に設定されて
いる使用詳細識別特徴を示す特徴番号に基づいて詳細識
別が行われる。この処理ステップ(SS)では候補カテ
ゴリ情報より求める被判定条件と判定基準に設定される
判定条件内容とを比較し、条件(a)であるならば処理
ステップ(S6)へ続き1条件(b)であるならば処理
ステップ(SS)に処理を移す。
II:詳細識別類似度演算部での処理 く判定基準別類似度算出>(SS) 次に、処理ステップ(SS)において詳細識別を行うこ
とが判定された認識対象カテゴリに対し判定基準別類似
度を算出する0判定基準別類似度は、詳細識別特徴量に
対してそれぞれ算出されたカテゴリ類似度を、詳細識別
の対象とされた認識対象カテゴリ毎に、その総和をとっ
て得られる。尚、ここで詳細識別特徴量は、詳細識別特
徴量抽出手段14において、判定基準毎に定まる類似カ
テゴリ間での差を表わす特徴を抽出して得たものである
今、判定基準毎に定められて詳細識別が実行される使用
詳細識別特徴数(詳細識別特徴の実行数である)をMN
O,詳細識別の必要有りと判定された認識対象カテゴリ
及び詳細識別特徴毎に示されるカテゴリ類似度を P (n、CATNO(m)) とし、その判定基準番号・細識別類似度をR2’(n) とすると、 n :認識対象カテゴリ番号 CATNO(m):判定基準に設定される使用詳細識別
の特徴番号 で与えられる。
この処理ステップ(S6)では判定条件内容を満たす被
判定条件より定まる認識対象カテゴリに対しては(1)
式で定義される詳細識別類似度R2’(n)を算出し、
上記以外の認識対象カテゴリに対しては R2’ (n) =0 とする処理を行う。
く詳細識別類似度算出>(S7) 次に、得られた判定基準別の類似度を用いて詳細識別類
似度を算出する。詳細識別類似度は例えば認識対象カテ
ゴリ毎に判定尺度及び判定基準別の類似度の逐次加算を
とって得られるものとし、R2(n)=R2(n)+R
2’ (n) ・・・(2)で与えられる。どの処理ス
テップ(S7)では認識対象カテゴリに対しく2)式の
演算処理が行われる。
く判定基準番号加算>(S8) 処理ステップ(S5)〜(S 7)において一つの判定
基準に対する詳細識別判定が行われた。
これらの一連の処理ステップを定められた個数の全ての
判定基準対して行うため1判定基準番号jに1を加算す
る処理を行う。
く最終判定基準番号比較>(39) 判定基準に対して行う詳細識別判定を、設定された判定
基準数分を終了したか確認する。すなわち、判定基準番
号jと最終判定基準番号FNOを比較し、j≦FNOな
らば、処理ステップ(S5)〜(S8)を繰り返し行い
、j>FNOならば次の処理ステップ(510)へ続く
く判定尺度番号加算>(310) 以上説明した一連の処理ステップにおいて、一つの判定
尺度に対しての詳細識別判定が行われる。これを設定さ
れた個数の全ての判定尺度について順次行うため、判定
尺度番号iに1を加算する処理を行う。
く最終判定尺度番号比較>(Sll) 設定された判定尺度全てに対して詳細識別を行うか否か
の判定が行われたか確認する。すなわち、判定尺度番号
iと最終判定尺度番号LNOとを比較し、i≦LNOな
らば、処理ステップ(S4)〜(S 10)を繰り返し
行い、i > L N Oならば、詳細識別に関する処
理を終了する。
■:詳細識別判定の具体的説明 次に詳細識別判定の動作について説明する。
第2図の処理ステップ(S5)における詳細識別実行判
定は、判定辞書を用いて行われる。この実施例では1判
定辞書は判定尺度毎の判定尺度ディレクトリと、これら
判定尺度ディレクトリに対応する複数の判定基準とで構
成され、これらは所定の領域に予め格納されている。
第3図に示す判定尺度ディレクトリ1〜LNOには、各
判定尺度に与えられる判定基準数(FNO(i))(例
えば4.l、・・φ、2)と判定基準の格納先の先頭ア
ドレスに関する情報(例えば、判定基準数FNOが4の
場合にはそれぞれ16進法で表示される4個の先頭アド
レス(0000)、(0010)、(0020)。
(0030))が書かれている。
また、この実施例では、一つの判定基準は、例えば、第
4図(A)に示すような判定基準の内容を示す領域と、
第4図CB)に示すような実行される詳細識別特徴を示
す領域から構成される。
■各格納された判定基準の内容を示す領域では、第4図
(A)に示すように、それぞれの判定基準毎に適当に与
えられた判定条件内容の数(PAIRNO)(例えば、
1NPAIRNO番目の判定条件内容)と、各判定条件
内容に関する情報が書かれており、これら判定条件内容
として。
例えば、詳細識別の判定で比較基準となる判定条件要素
0BJECT(K)(但しに=1−KOHO)と、判定
条件要素数(KO)10)との情報が書かれている。
■実行される詳細識別特徴を示す領域では、第4図(B
)に示すように、使用詳細識別特徴数MNOと、使用詳
細識別特徴に与えられた特徴番号CATNO(K)(但
し1、K=l〜MNO)との情報が書かれている。
判定尺度は判定尺度毎に第4図(A)に示す一つの基準
判定が第3図の判定基準数に表わされる数だけ設定され
ている。詳細識別判定は、候補カテゴリ情報より求めら
れる判定条件要素と比較する被判定条件要素と判定条件
要素0BJECT(K)を用いて行われる。すなわち、
−判定基準において判定条件内容毎に被判定条件要素と
判定条件要素0BJECT(K)とを比較し、少なくと
も一つ以上の判定条件内容において判定条件要素0BJ
ECT(K)の全てと被判定条件要素が一致するとき詳
細識別を行うこととする。そして、前述の判定を判定辞
書に設定される各判定尺度の判定基準毎について行うも
のである。
今、以下のような課程に基づいて詳細識別を行う場合に
つき説明する0例えば1判定尺度N01lが、第一次類
似度の最大値から上位2位までの二つの第一類似度がそ
れぞれ与えるカテゴリが誤認識しやすい類似カテゴリの
組合せであるとき、詳細識別を行うものとし、判定尺度
N011の第一番目の判定基準(判定基準番号l)の判
定条件内容数がPAIRNOが3であるとする。すなわ
ち PAIRNO=3 この場合、判定条件要素数KOHOが2であるので、判
定条件要素0BJECTの組み合せは■KOHO= 2 0BJECT (1)=シチ 0BJECT (2)=イチ ■KOHO=  2 0BJECT (1)=シ 0BJECT (2)=二 ■KOHO=  2 0BJECT (1)=ハチ 0BJECT (2)=イチ であり、また、使用詳細識別特徴数MNO及びその特徴
番号CATNOはそれぞれ MNO=4 CATNO(1)=1.CATNO(2)=2CATN
O(3)=4.CATNO(4)=8であるとする。
この仮定の下で、ある入力パタンに対するパタンマツチ
ングによる第一次類似度が「イチ」、「シチ」、「レイ
」、「二」、―・・の順に得られたとして、詳細識別判
定について説明する。
この場合の被判定条件要素は「イチ」、「シチ」であり
、「イチ」、「シチ」と判定基準番号lの0BJECT
(K)を比較して判定する。すなわち、判定基準番号1
に示される■〜■の各OBJ ECT (K) とrイ
+J 、rシ5−Jを比較すると、■の0BJECT 
(K)で一致がみられるので、詳細識別が実行される。
実行される詳細識別特徴は、判定基準番号1に設定され
ている特徴番号1.2.4.6が与えるものである。実
行される詳細識別特徴が判定辞書に設定されているのは
、認識対象カテゴリに対して必要な詳細識別特徴(類似
カテゴリとの識別に有効なもの)を抽出しているのでカ
テゴリによって必要な詳細識別特徴が違うためによる。
以上説明したような詳細識別判定が、実際は各判定尺度
の判定基準毎に行われる。
■二判定基準類似度算出の具体的説明 各判定尺度及び判定基準毎に行われる詳細識別判定で、
詳細識別を行う判定がなされた。すなわち、判定条件内
容の判定条件要素0BJECT(K)と一致のとれた被
判定条件要素より定まるカテゴリに対して判定基準別類
似度が算出される0例えば、前出の例に対しては、「イ
チ」と「シチ」に対する判定基準別類似度が次に説明す
る方法で算出される。
判定基準別類似度は(1)式(詳細識別処理ステップ(
S6)に記述)に定義されるように1判定基準毎に定ま
る詳細識別特徴量に対するカテゴリ類似度の総和である
カテゴリ類似度の算出は第1図の詳細特徴辞書32を用
いて行われるが、この詳細特徴辞書は本出願人に係る特
願昭61−043813号において提案された一例があ
る。
第5図は詳細識別特徴毎及び認識対象カテゴリ毎に設定
される詳細特徴辞書の一例を示す説明図であり、第6図
は判定基準別類似度算出処理の流れ図である。
第5図及び第6図を参照してカテゴリ類似度算出方法を
詳細に説明する。
第5図に示す詳細特徴辞書は、例えば、特徴量分布状態
を表わす値DISと、分布範囲より設定される閾値とし
ての例えば特徴量下限値LIMS及び特徴量上限値LI
MLとをそれぞれ格納していると共に、さらに分布の安
定性を考慮してそれぞれ定められた、カテゴリ類似度算
出のための加算基準値ADD、減算基準値SUB、加算
値増加量MULA及び減算値増加量MULSをそれぞれ
格納している。これら各値は各認識対象カテゴリの各詳
細識別特徴毎に経験的にかつ個別的に予め定められてい
て、従って少なくとも(特徴数)×(認識対象カテゴリ
数)の個数だけ詳。1特徴辞書に設定されている。
次に、処理手順を以下に説明する。
DISは既に説明したように特徴の分布状態を示すもの
であり、この実施例において分布状態の判定は次の3種
類を例とする(520)。
DIS=0:特徴値は上限値と下限値の間に分布する。
DIS=1:特徴値は下限値以上の範囲に分布する。
DIS=2:特徴値は上限値以下の範囲に分布する。
ここで、DIS=O11及び2における上限値及び下限
値はそれぞれ分布状態に応じて経験的に個別に定められ
た値であって、一般には互いに異なる値となっているか
、同一となっている場合もある。
[1]DIS=0である場合 上限値をLIML、下限値をLIMS及び抽出した詳細
識別特徴量をFDVとする時。
LIMS≦FDV≦LIML を満たすか否かの判定を行う(321)。
この条件を満たす場合には加算基準値ADDをカテゴリ
類似度とする(S22)。
満たさない場合には ■FDV<LIMSである時は、下限値からのずれの大
きさくLIMS−FDV)に減算値増加量MULSを乗
じ、得られた値に減算基準値SUBを加え、この和の値
に−1を乗じた値、すなわち −(SOB +MULS−(LIMS −FDV))を
カテゴリ類似度とする(S23)。
■次に、FDV>LIMLである時は、上限値からのず
れの大きさくFDV−LIML)に減算値増加量MUL
Sを乗じ、得られた値に減算基準値SUBを加え、この
和の僅に−lを乗じた値、すなわち −(SOB +NULS−(FDV−LIML)  )
をカテゴリ類似度とする(S22)。
[21さらに、DIS=1である時 下限値をLIMS及び抽出した詳細識別特徴量をFDV
とする時、FDV≧LIMSを満たすか否かの判定を行
い(S24)、この条件を満たす場合には下限値からの
ずれの大きさくFDV−L I MS)に加算値増加量
MULAを乗じ、得られた値に加算基準値ADDを加え
た値、すなわち ADD  + (FDV−LIMS)  −MULAを
カテゴリ類似度としく525)、満たさない場合には、
下限値からのずれの大きさくL I MS −FDV)
に減算値増加量MULSを乗じ、得られた値に減算基準
値SUBを加え、この加算した値に−1を乗じた値、す
なわち −(SUB +(LIMS −FDV) −MULS 
)をカテゴリ類似度とする(52B)。
[3]DIS=2である場合 上限値をLIML及び抽出した詳細識別特徴量をFDv
とする時FnV&LIMLを満たすか否かの判定を行い
(S27)、この条件を満たす場合には上限からのずれ
の大きさくL I ML−FDV)に加算値増加量MU
LAを乗じ、得られた値に加算基準値ADDを加えた値
、すなわちADD +(LIML −FDV) −MU
LAをカテゴリ類似度としく32B) 、 N4たさな
い場合には上限からのずれの大きさに減算値増加量MU
LSを乗じ、得られた値に減算基準値SUBを加え、こ
の加算した値に−1を乗じた値、すなわち −(SOB  +(FDV−LIML)   −Mtl
LS  )をカテゴリ類似度とする(S29)。
以上の如く各条件に対応した処理をステップ(S 22
)〜(S 32)に従って行った後、カテゴリ類似度と
して出力する(S30)。
尚、ADD、SUB、MULA、MULSの各個につい
ては特徴値の分布が安定(例えば1分散が小)であれば
相対的に大きい値、特徴値の分布が不安定(例えば、分
散が大)であれば相対的に小さい値に設定するのが有効
である。
この発明について説明した実施例は単なる一好適例であ
って、この発明はこの実施例にのみ限定されるものでは
ない、また、第1図に示した全部又は一部の機能ブロッ
クで示した構成成分の各機能はいわゆる中央処理装置(
CPU)、マイクロコンピュータ、適当なメモリ等の適
当な信号処理装置を用いて適当に電子的に処理されるも
のである。
(発明の効果) 上述した説明から明らかなようにこの発明では、パタン
マツチング技術で類似カテゴリが存在し、誤認識の可能
性があるカテゴリが認識候補とされた場合に詳細識別を
行うことにより、従来より正確で安定な認識が可能とな
り、認識性能の優れた音声認識装置の提供が期待出来る
【図面の簡単な説明】
第1図はこの発明の音声認識装置の実施例を示すブロッ
ク図。 第2図は詳細識別の処理手順の流れ図、第3図は判定辞
書に格納されている判定尺度ディレクトリの説明図、 策4図(A)は判定辞書に格納されている判定基準の内
容を示す領域説明図、 第4図(B)は判定辞書に格納されている実行される詳
細識別特徴を示す領域説明図、第5図は特徴辞書の一例
の説明図、 第6図はカテゴリ類似度算出手順を示す流れ図である。 lO・・・音声分析部 12・・・特徴時系列パタン作成部 14・・・詳細識別特徴抽出手段 1G・・・パタンマツチング手段 18・・・パタンマツチング類似度演算部20・・・標
準パタン記憶部、22・・・詳細識別判定手段24・・
・詳細識別判定部、  2B・・・判定辞書28・・・
詳細識別類似度出力手段 30・・・詳細識別類似度演算部 32・・・詳細特徴辞書 34・・・判定部。 特許出願人    沖電気工業株式会社判足纂準の内雇
11−1窮i吹   0BJECT−21足全件早亀曳
柚されル鱒細鍜別特考覧P・44織 第4図 り工S  勃イ攻量ANP収飴 LIMS  :特イ咲量下Fl値 LIML   倚1よ限値 A[)D   、71El]ll(、tsuB :;A
Ij基準値 ML/L八 ’IIIIXQ:噌如量 ML/L、S  :;l;、″4値、槽如量特雀文舎手
害の一イlすの51y月ffl第5図 ナテブリ享14べ1しl田+I傾Eホγ浅水J刀第6図

Claims (5)

    【特許請求の範囲】
  1. (1)入力音声を音声分析部で処理して得た音声分析出
    力を特徴時系列パタン作成部に供給し、これよりパタン
    マッチング手段に特徴時系列パタンを出力し、該パタン
    マッチング手段において特徴時系列パタンと予め用意さ
    れた標準パタンとのマッチング類似度を認識対象カテゴ
    リ毎に算出し、該マッチング類似度に基づいて判定部に
    より前記特徴時系列パタンが前記標準パタンと同じカテ
    ゴリに属するかを判定して認識結果を出力する音声認識
    装置において、 前記マッチング類似度を第一次類似度とし該第一次類似
    度から詳細識別の必要の有無の判定を行う詳細識別判定
    手段と、 前記音声分析部からの音声分析出力から類似カテゴリの
    識別に有効な詳細識別特徴量を抽出する詳細識別特徴量
    抽出手段と、 詳細識別の必要有りとの判定の場合には前記詳細識別特
    徴量及び詳細特徴辞書を用いて又は詳細識別の必要無し
    との判定の場合には前記第一次類似度及び詳細識別特徴
    量を用いずにそれぞれに対応する詳細識別類似度を算出
    して出力する詳細識別類似度出力手段と を具え、 前記判定部を、前記第一次類似度と詳細識別類似度とを
    総合した最終類似度が最大値を与えるカテゴリを認識結
    果として出力する構成として成ることを特徴とする音声
    認識装置。
  2. (2)詳細識別が必要な場合には、上位の複数の第一次
    類似度の認識対象カテゴリに対する詳細識別類似度を算
    出しその他の認識対象カテゴリに対する詳細識別類似度
    を「0」とし、及び詳細識別が必要無い場合には、認識
    対象カテゴリ毎の詳細識別類似度を「0」とすることを
    特徴とする特許請求の範囲第1項に記載の音声認識装置
  3. (3)前記詳細識別判定手段は判定辞書と詳細識別判定
    部とを備え、 該判定辞書には、詳細識別判定の比較基準となる判定条
    件要素と、複数のこれら判定条件要素で構成され詳細識
    別のため一条件の成立可否を判定するための判定条件内
    容と、該一条件が成立した時に判定が実行される使用詳
    細識別特徴を指示する特徴番号と、前記判定条件内容及
    び特徴番号の集合で構成される判定基準と、これら判定
    基準の集合で構成され詳細識別を行うための判定尺度と
    を予め格納してあり、 前記詳細識別判定部においては、最大値から順次の上位
    の複数の第一次類似度及びこれら複数の第一次類似度が
    与えるカテゴリを候補カテゴリ情報として選択し、これ
    ら候補カテゴリ情報から判定条件要素と比較される被判
    定条件要素を求め、一つの判定尺度の一つの判定基準に
    おける各判定条件内容毎に行われる判定条件要素と被判
    定条件要素との比較処理を全ての判定基準及び全ての判
    定尺度について行い、これら比較処理により少なくとも
    一つ以上の判定条件内容における判定条件要素の全てと
    被判定条件要素とが一致した時は、詳細識別の必要有り
    として当該判定条件内容が属する判定基準の使用詳細識
    別特徴の特徴番号を出力する ことを特徴とする特許請求の範囲第1項又は第2項に記
    載の音声認識装置。
  4. (4)前記判定尺度は類似カテゴリの組み合せとし、前
    記判定基準の一つを上位の複数の第一次類似度が与える
    カテゴリと類似する類似カテゴリが存在するという基準
    とし、前記判定条件の一つを誤認識を起し易い類似カテ
    ゴリの組み合せとすることを特徴とする特許請求の範囲
    第3項に記載の音声認識装置。
  5. (5)前記判定尺度は第一次類似度の差とし、前記判定
    基準を上位の複数の第一次類似度のうちの任意の二つの
    第一次類似度の差が所定の閾値以下であるという基準と
    し、前記判定内容を所定の閾値とする ことを特徴とする特許請求の範囲第3項に記載の音声認
    識装置。
JP62012257A 1987-01-23 1987-01-23 音声認識装置 Pending JPS63278099A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62012257A JPS63278099A (ja) 1987-01-23 1987-01-23 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62012257A JPS63278099A (ja) 1987-01-23 1987-01-23 音声認識装置

Publications (1)

Publication Number Publication Date
JPS63278099A true JPS63278099A (ja) 1988-11-15

Family

ID=11800314

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62012257A Pending JPS63278099A (ja) 1987-01-23 1987-01-23 音声認識装置

Country Status (1)

Country Link
JP (1) JPS63278099A (ja)

Similar Documents

Publication Publication Date Title
US9077949B2 (en) Content search device and program that computes correlations among different features
EP1615204A1 (en) Method for classifying music
US5917941A (en) Character segmentation technique with integrated word search for handwriting recognition
US20080263021A1 (en) Methods of object search and recognition
JPH0634185B2 (ja) 入力語認識装置
US8718803B2 (en) Method for calculating measures of similarity between time signals
CN110851590A (zh) 一种通过敏感词检测与非法内容识别进行文本分类的方法
MX2012011923A (es) Asignacion de atributis aplicables para datos que describen la identidad personal.
CN112289326B (zh) 一种利用具有噪音去除的鸟类识别综合管理系统的噪音去除方法
CN112750442B (zh) 一种具有小波变换的朱鹮种群生态体系监测系统及其方法
WO2008062822A1 (fr) Dispositif d'exploration de texte, procédé d'exploration de texte et programme d'exploration de texte
KR102560276B1 (ko) 이미지 검색 기반 감성 색채 배색 추천 장치 및 방법
CN110727762B (zh) 确定相似文本的方法、装置、存储介质及电子设备
Hockman et al. Computational strategies for breakbeat classification and resequencing in hardcore, jungle and drum and bass
JPS63278099A (ja) 音声認識装置
JP2002024251A (ja) 時系列データの分類方法及び装置並びに時系列データの分類プログラムを記録した記録媒体
CN110069601A (zh) 情绪检测分析方法及相关装置
JP2002251590A (ja) 文書分析装置
JP3174187B2 (ja) ガス識別装置
CN109034554A (zh) 相关性计算方法及系统
JPS6252912B2 (ja)
JPH09179874A (ja) カテゴリ値間距離定義方法
JPH06162000A (ja) 単語認識処理装置
JP2001243425A (ja) オンライン文字認識装置およびオンライン文字認識方法
JPH08212300A (ja) 文字認識方法及び文字認識装置