JPH1049189A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH1049189A
JPH1049189A JP8200031A JP20003196A JPH1049189A JP H1049189 A JPH1049189 A JP H1049189A JP 8200031 A JP8200031 A JP 8200031A JP 20003196 A JP20003196 A JP 20003196A JP H1049189 A JPH1049189 A JP H1049189A
Authority
JP
Japan
Prior art keywords
input
pattern
recognition
unit
standard pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP8200031A
Other languages
English (en)
Inventor
Junichi Nakabashi
順一 中橋
Kenji Sakiyama
健次 崎山
Toru Inada
徹 稲田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP8200031A priority Critical patent/JPH1049189A/ja
Publication of JPH1049189A publication Critical patent/JPH1049189A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 音声認識装置において、判定可能な認識カテ
ゴリに属さない認識対象外の音声信号の入力を高い確率
で却下可能にする。 【解決手段】 入力された音声信号の特徴ベクトルか
ら、ファジィベクトル量子化部13によって入力パタン
が作成される。マッチング部16は入力パタンと標準パ
タン記憶部15に記憶されている各標準パタンとのマッ
チングを行い、パタン間類似度を求める。また、前記特
徴ベクトルから標準パタン作成部14によって、標準パ
タンの作成と同一の手法によって入力標準パタンが作成
される。しきい値算出部18は入力パタンと入力標準パ
タンとのマッチングを行い、しきい値を算出する。認識
結果判定部19は、マッチング部16によって求められ
たパタン間類似度が最大となる標準パタンに対応する認
識カテゴリを認識結果として出力するが、パタン間類似
度の最大値がしきい値算出部18によって算出されたし
きい値を越える場合は入力された音声信号は認識対象外
と判定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号を代表と
する時系列信号パターンの認識技術に関するものであ
る。
【0002】
【従来の技術】音声認識装置とは、入力された未知の音
声信号がどの認識カテゴリ(単語,音素等)に属するか
を認識する装置である。音声認識では、他のパターン認
識と同様に、ベクトル量子化やマッチング等の技術が利
用される。
【0003】図5はベクトル量子化を用いた一般的な音
声認識装置の構成を示すブロック図である。
【0004】分析部51は、入力された音声信号を例え
ば10ms毎にサンプリングし、サンプリングしたた音声
信号をフィルタバンク、LPC分析又はケプストラム分
析等の周知の手法によりn次元の特徴ベクトルyに変換
する。
【0005】ベクトル量子化部52は、分析部51によ
って得られた特徴ベクトルyをコードブック53を参照
してベクトル量子化してマッチング部54に出力する。
【0006】ここで、ベクトル量子化は次のように行わ
れる。音声認識装置が認識の対象とするベクトル空間を
M個の部分空間(クラスタ)に分割し、各クラスタを代
表するベクトルであるコードベクトルを予め決定してお
く。そして、分割した各クラスタにラベル(番号)を付
し、クラスタCm (m=1〜M)を代表するコードベク
トルμm をラベルmによって検索可能な形でコードブッ
ク53に記憶させておく。
【0007】部分空間(クラスタ)は、認識カテゴリが
属するベクトル空間を満たすよう予め収集された特徴ベ
クトルの集合を、LBGアルゴリズムやc−means
クラスタリング等の周知の手法によりクラスタリングす
ることによって決定される。この場合、コードベクトル
μm はクラスタCm の重心ベクトル又は平均ベクトルで
ある。
【0008】特徴ベクトルyとコードベクトルμm との
距離をd(y,μm )とするとき、ベクトル量子化部5
2は式(1)に従って特徴ベクトルyをラベルoに変換
する。すなわち、特徴ベクトルyは、最も類似するコー
ドベクトルμo のラベルoに変換される。ベクトル量子
化部52は、特徴ベクトルyの時系列をラベル系列に変
換して出力する。
【0009】マッチング部54は、認識時のみに動作す
るものであり、標準パタン記憶部55に記憶された標準
パタンとベクトル量子化部52から出力されたラベル系
列(入力パタン)とのマッチングを行い、そのパタン間
距離Dw を距離マトリックス56を参照して算出する。
【0010】ここで、マッチングについて説明する。
【0011】音声認識では、未知の音声信号を分析して
得られた入力パタン{a1 ,a2 ,…,aT }と、予め
記憶されている認識カテゴリw(w=1〜W)の標準パ
タン(参照パタン)Rw ={rw 1 ,bw 2 ,…,bw
Jw}とのパタン間距離Dw 又はパタン間類似度Sw を算
出する。パタン間の距離又は類似度を計算することをマ
ッチングという。
【0012】マッチング手法として、一般的にはDP
(dynamic programming )マッチング法がよく用いられ
る。DPマッチング法では、入力パタンのフレームtと
認識カテゴリwの標準パタンのフレームjとのフレーム
間距離dw (t,j)又はフレーム間類似度sw (t,
j)に基づいて、式(2)又は(3)に示す漸化式で求
められる累積距離又は累積類似度g(t、j)を計算
し、これによりパタン間距離Dw 又はパタン間類似度S
w を計算する。
【数1】
【0013】図6はDPマッチングに用いられる代表的
な経路パスを示す図であり、(数2)に示す漸化式を図
的に示したものである。同図中、(a)は対称形パス、
(b)は非対称形パス(入力パタン側依存パス)、
(c)は非対称形パス(標準パタン側依存パス)であ
り、それぞれ特性が異なる。以下の説明には、最も一般
的な図6(a)のパスを用いる。
【0014】図7はDPマッチングの漸化的なマッチン
グの様子を示す格子グラフであり、入力パタンを横軸
に、標準パタンを縦軸に、それぞれ時間に沿って表現し
ている。すなわち、図6(a)に示す経路パスに限定し
たとき、図7に示すように、格子点(t-1,j-1) の累積距
離(又は累積類似度)には格子点(t-2,j-1) ,(t-2,j-
2) ,(t-1,j-2) の累積距離(又は累積類似度)が反映
され、また、格子点(t,j)の累積距離(又は累積類似
度)には格子点(t-1,j) ,(t-1,j-1) ,(t,j-1) の累積
距離(又は累積類似度)が反映される。このように、漸
化的に格子点をたどりながら累積類似度の計算が進めら
れ、標準パタン及び入力パタンの最終フレームにおける
累積距離(又は累積類似度)が標準パタンと入力パタン
とのパタン間距離(又はパタン間類似度)となる。
【0015】標準パタン記憶部55は、認識カテゴリw
(w=1〜W)毎に予め作成された標準パタンRw をラ
ベル系列{rw 1 ,bw 2 ,…,bw Jw}の形で記憶し
ている。これは、標準パタンの学習時にベクトル量子化
部32から出力されたラベル系列である。マッチング部
54は、標準パタン記憶部55に記憶された各標準パタ
ンRw とベクトル量子化部52から出力された入力パタ
ンとしてのラベル系列{o1 ,o2 ,…,oT }とのパ
タン間距離Dw を式(2)に示す漸化式に従って算出す
る。ただし、フレーム間距離を算出するために、距離マ
トリックス56を参照する。
【0016】距離マトリックス56は、マッチング部5
4がパタン間距離Dw を算出するのに必要となるコード
ベクトル相互間の距離z(m,n)(m=1〜M,n=
1〜M)を記憶している。ここで、z(m,n)はラベ
ルmのコードベクトルμm とラベルnのコードベクトル
μn との距離を表し、距離マトリックス56はラベルm
とnとで検索可能なようにマトリックスの形で記憶して
いる。フレーム間距離dw (t,j)は、式(4)に示
すように、入力パタンのフレームtにおけるラベルot
と標準パタンwのフレームjのラベルrw j とで検索さ
れた距離マトリックス56の値になる。 dw (t,j)=z(ot ,rw j ) …(4)
【0017】認識結果判定部57は、パタン間距離Dw
が最小になる標準パタンに対応する認識カテゴリws
認識結果として出力する。このとき、認識結果となる認
識カテゴリws は式(5)のように表される。ただし、
パタン間距離Dw の最小値が予め定めておいたしきい値
以上であるときは、入力された音声信号は認識対象外と
判定する。
【0018】なお、マッチング部54がパタン間類似度
w を算出するときは、認識結果判定部57はパタン間
類似度Sw が最大になる標準パタンに対応する認識カテ
ゴリws を認識結果として出力する。このとき、認識結
果となる認識カテゴリws は式(6)のように表され
る。ただし、この場合は、パタン間類似度Sw の最大値
が予め定めておいたしきい値以下であるときは、入力さ
れた音声信号は認識対象外と判定する。
【0019】
【発明が解決しようとする課題】ところが、従来の音声
認識装置には以下のような問題があった。
【0020】従来の音声認識装置では、認識結果判定部
において認識対象外の音声信号の入力を却下するために
用いられるしきい値は、認識の対象となる認識カテゴリ
に基づいて予め設定されていた。すなわち、しきい値は
入力される音声信号に関わらず一定であった。このた
め、入力される音声信号に対してしきい値が常に適切で
あるとは限らず、したがって、認識対象外の音声信号の
入力を却下できる確率が低いという問題があった。
【0021】また、認識の対象となる認識カテゴリが変
化したときに適宜対応することが困難であった。例え
ば、認識対象の単語を更新するような場合、認識対象の
単語以外の音声信号の入力を的確に却下するためには、
更新の度にしきい値を適切な値に設定し直す必要があっ
た。
【0022】前記の問題に鑑み、本発明は、音声認識装
置において、認識対象外の音声信号の入力を高い確率で
却下可能にし、しかも認識の対象となる認識カテゴリが
変化しても適宜対応可能にすることを課題とする。
【0023】
【課題を解決するための手段】前記の課題を解決するた
め、請求項1の発明が具体的に講じた手段は、入力され
た音声信号に対し、この音声信号が属する認識カテゴリ
を判定する音声認識装置として、各認識カテゴリに対応
する音声信号の特徴ベクトルから第1の手法によって作
成された,各認識カテゴリに対応する標準パタンを記憶
する標準パタン記憶部と、入力された認識対象の音声信
号の特徴ベクトルから前記第1の手法と異なる第2の手
法によって入力パタンを作成する入力パタン作成部と、
前記認識対象の音声信号の特徴ベクトルから前記第1の
手法によって入力標準パタンを作成する標準パタン作成
部と、前記入力パタン作成部によって作成された入力パ
タンと前記標準パタン記憶部に記憶されている各標準パ
タンとのマッチングを行い、前記入力パタンと前記各標
準パタンとの距離を求めるマッチング部と、前記入力パ
タン作成部によって作成された入力パタンと前記標準パ
タン作成部によって作成された入力標準パタンとのマッ
チングを行い、前記入力パタンと前記入力標準パタンと
の距離を求め、この距離を基にして当該音声認識装置が
判定可能な認識カテゴリに属さない音声信号の入力を却
下するためのしきい値を算出するしきい値算出部と、前
記マッチング部によって求められた前記入力パタンと前
記各標準パタンとの距離及び前記しきい値算出部によっ
て算出されたしきい値を基にして、前記認識対象の音声
信号が属する認識カテゴリを判定する認識結果判定部と
を備えているものとする。
【0024】請求項1の発明によると、入力パタン作成
部において、入力された認識対象の音声信号の特徴ベク
トルから、各認識カテゴリに対応する音声信号の特徴ベ
クトルから標準パタンを作成した第1の手法と異なる第
2の手法によって、入力パタンが作成される。そして、
マッチング部によって、前記入力パタン作成部において
作成された入力パタンと標準パタン記憶部に記憶されて
いる各標準パタンとのマッチングが行われ、前記入力パ
タンと前記各標準パタンとの距離が求められる。また、
標準パタン作成部において、前記認識対象の音声信号の
特徴ベクトルから前記第1の手法によって入力標準パタ
ンが作成される。そして、しきい値算出部によって、前
記入力パタン作成部において作成された入力パタンと前
記標準パタン作成部において作成された入力標準パタン
とのマッチングが行われ、前記入力パタンと前記入力標
準パタンとの距離が求められ、この距離を基にしてしき
い値が算出される。このしきい値は当該音声認識装置が
判定可能な認識カテゴリに属さない音声信号の入力を却
下するためのものであり、認識結果判定部によって、前
記マッチング部により求められた前記入力パタンと前記
各標準パタンとの距離及び前記しきい値を基にして、前
記認識対象の音声信号が属する認識カテゴリが判定され
る。このため、当該音声認識装置が判定可能な認識カテ
ゴリに属さない音声信号の入力を却下するためのしきい
値が、入力された認識対象の音声信号に対してその都度
設定され、しかもそのしきい値は、認識対象の音声信号
から作成された入力パタンと前記認識対象の音声信号か
ら標準パタンの作成と同一の手法によって作成された入
力標準パタンとに対してマッチングを行うことによって
算出されるので、入力された認識対象の音声信号に対し
て常に適切な値となる。したがって、認識対象外の音声
信号の入力を高い確率で却下可能になり、しかも認識の
対象となる認識カテゴリが変化してもしきい値を更新す
る必要がないので、認識カテゴリの変化に柔軟に対応可
能である。
【0025】そして、請求項2の発明では、前記請求項
1の音声認識装置における認識結果判定部は、前記マッ
チング部によって求められた前記入力パタンと前記各標
準パタンとの距離の最小値を求め、この最小値が前記し
きい値算出部によって算出されたしきい値よりも大きい
ときは、前記認識対象の音声信号は当該音声認識装置が
判定可能な認識カテゴリのいずれにも属さないと判定す
る一方、前記最小値が前記しきい値以下のときは、前記
認識対象の音声信号は前記入力パタンとの距離が最小で
ある標準パタンに対応する認識カテゴリに属すると判定
するものとする。
【0026】また、請求項3の発明では、前記請求項1
の音声認識装置において、前記マッチング部は、前記入
力パタンと前記各標準パタンとの距離の代わりに前記入
力パタンと前記各標準パタンとの類似度を求めるもので
あり、前記しきい値算出部は、前記入力パタンと前記入
力標準パタンとの距離の代わりに前記入力パタンと前記
入力標準パタンとの類似度を求め、この類似度を基にし
て前記しきい値を算出するものである。
【0027】そして、請求項4の発明では、前記請求項
3の音声認識装置における認識結果判定部は、前記マッ
チング部によって求められた前記入力パタンと前記各標
準パタンとの類似度の最大値を求め、この最大値が前記
しきい値算出部によって算出されたしきい値よりも小さ
いときは、前記認識対象の音声信号は当該音声認識装置
が判定可能な認識カテゴリのいずれにも属さないと判定
する一方、前記最大値が前記しきい値以上のときは、前
記認識対象の音声信号は前記入力パタンとの距離が最大
である標準パタンに対応する認識カテゴリに属すると判
定するものとする。
【0028】また、請求項5の発明が講じた解決手段
は、入力された音声信号に対し、この音声信号が属する
認識カテゴリを判定する音声認識装置として、各認識カ
テゴリが属する特徴ベクトル空間における各クラスタを
代表するコードベクトルを、各コードベクトルを示すラ
ベルによって検索可能な形で記憶しているコードブック
と、入力された認識対象の音声信号の特徴ベクトルを、
前記コードブックを参照して、前記特徴ベクトルと前記
各コードベクトルとの依存度合を要素とする入力帰属度
ベクトルに変換するファジィベクトル量子化部と、音声
認識装置の学習時に、各認識カテゴリに対応する音声信
号の特徴ベクトルから標準パタンを作成する一方、音声
認識装置の認識時に、認識対象の音声信号の特徴ベクト
ルから入力標準パタンを作成する標準パタン作成部と、
音声認識装置の学習時に前記標準パタン作成部によって
作成された,各認識カテゴリに対応する標準パタンを記
憶する標準パタン記憶部と、前記コードベクトル同士の
依存度合であるコードベクトル間帰属度を、各コードベ
クトルを示す2つのラベルによって検索可能な形で記憶
しているコードベクトル間帰属度テーブルと、前記ファ
ジィベクトル量子化部によって変換された入力帰属度ベ
クトルと前記標準パタン記憶部に記憶されている各標準
パタンとのマッチングを前記コードベクトル間帰属度テ
ーブルを参照して行い、前記入力帰属度ベクトルと前記
各標準パタンとの類似度を求めるマッチング部と、前記
ファジィベクトル量子化部によって変換された入力帰属
度ベクトルと前記標準パタン作成部によって作成された
標準入力パタンとのマッチングを前記コードベクトル間
帰属度テーブルを参照して行い、前記入力帰属度ベクト
ルと前記入力標準パタンとの類似度を求め、この類似度
を基にして当該音声認識装置が判定可能な認識カテゴリ
に属さない音声信号の入力を却下するためのしきい値を
算出するしきい値算出部と、前記マッチング部によって
求められた前記入力帰属度ベクトルと前記各標準パタン
との類似度及び前記しきい値算出部によって算出された
しきい値を基にして、前記認識対象の音声信号が属する
認識カテゴリを判定する認識結果判定部とを備えている
ものとする。
【0029】請求項5の発明によると、当該音声認識装
置が判定可能な認識カテゴリに属さない音声信号の入力
を却下するためのしきい値が、入力された認識対象の音
声信号に対してその都度設定され、しかもそのしきい値
は、認識対象の音声信号からファジィベクトル量子化部
によって作成された入力帰属度ベクトルと前記認識対象
の音声信号から標準パタンの作成と同一の手法によって
作成された入力標準パタンとに対してマッチングを行う
ことによって算出されるので、入力された認識対象の音
声信号に対して常に適切な値となる。したがって、認識
対象外の音声信号の入力を高い確率で却下可能になり、
しかも認識の対象となる認識カテゴリが変化してもしき
い値を更新する必要がないので、認識カテゴリの変化に
柔軟に対応可能である。
【0030】
【発明の実施の形態】以下、本発明の実施形態について
図面を参照して説明する。
【0031】(第1の実施形態)図1は本発明の第1の
実施形態に係る音声認識装置の構成を示すブロック図で
ある。図1において、11は入力された音声信号の特徴
を抽出して特徴ベクトルを生成する分析部、12は特徴
ベクトル空間におけるコードベクトルを記憶するコード
ブック、13は認識時に特徴ベクトルから入力パタンを
作成する入力パタン作成部としてのファジィベクトル量
子化部、14は学習時に単語や音素等の各認識カテゴリ
に対応する標準パタンを作成する一方,認識時に特徴ベ
クトルから入力標準パタンを作成する標準パタン作成
部、15は標準パタンを記憶する標準パタン記憶部、1
6は入力パタンと標準パタンとをマッチングするマッチ
ング部、17は認識対象外の音声信号の入力を却下する
ためのしきい値を算出するしきい値算出部、18はコー
ドベクトル間帰属度テーブル、19は認識対象の音声信
号が属する認識カテゴリを判定する認識結果判定部であ
る。
【0032】分析部11は、入力された音声信号を例え
ば10ms等の一定周期(以下「フレーム」という)でサ
ンプリングし、サンプリングした音声信号をフィルタバ
ンクを用いたりLPC分析又はケプストラム分析等の周
知の手法によってn次元の特徴ベクトルに変換する。標
準パタンの学習時には、各認識カテゴリに対して予め発
声された音声信号をそれぞれ特徴ベクトルに変換して、
標準パタン作成部14に出力する。音声信号の認識時に
は、認識対象の音声信号を特徴ベクトルに変換してファ
ジィベクトル量子化部13に出力する。このときの特徴
ベクトルは、標準パタン作成部14にも出力される。
【0033】コードブック12は、特徴ベクトル空間に
おける各コードベクトルをそれぞれに対応したラベルに
よって検索可能な形で記憶している。各コードベクトル
は、予め特徴ベクトル空間を満たすように収集された特
徴ベクトルの集合からクラスタリングによって作成され
る。ここでは、特徴ベクトル空間はM個のクラスタCm
(m=1〜M)に分割されており、各クラスタCm を代
表するコードベクトルμm (m=1〜M)がコードブッ
ク12に記憶されているものとする。
【0034】ファジィベクトル量子化部13は、音声信
号の認識時に、コードブック12に記憶されたコードベ
クトルμm を用いて、分析部11によって生成された特
徴ベクトルyt の各クラスタCm に対する入力帰属度を
表す入力帰属度ベクトルutm(m=1〜M,ut1+ut2
+…+utM=1)を算出する。入力帰属度ベクトルutm
は、式(7)に示すように、ファジィ理論のメンバーシ
ップ関数等を用いて算出する場合が多い。
【数2】 ここで、Fはファジネスと呼ばれる曖昧度をコントロー
ルするパラメータである。
【0035】さらに、入力帰属度ベクトルutmの各要素
とクラスタCm との対応関係をラベルで表現した入力ラ
ベルベクトルotm(m=1〜M)を算出する。ファジィ
ベクトル量子化部13は、認識対象の音声信号から生成
された特徴ベクトルの時系列に対し、入力帰属度ベクト
ル系列U={u1 ,u2 ,…,ut ,…,uT }(ut
はutm(m=1〜M)を表す)及び入力ラベルベクトル
系列O={o1 ,o2,…,ot ,…,oT }(ot
tm(m=1〜M)を表す)を算出し、入力パタンとし
て出力する。
【0036】標準パタン作成部14は、標準パタンの学
習時に、単語や音素等の各認識カテゴリに属する音声信
号から各認識カテゴリに対応する標準パタンを作成す
る。ここでは、各認識カテゴリに属する音声信号から生
成された特徴ベクトルyt を当該特徴ベクトルの複数フ
レーム毎の平均値である平均特徴ベクトルave _yj
変換し、さらに、コードブック12を参照してこの平均
特徴ベクトルave _yjに最も類似するコードベクトル
のラベルoj に変換する。また、音声信号の認識時に
は、認識対象の音声信号から生成された特徴ベクトルを
標準パタンの作成と同一の手法によって変換し、入力標
準パタンとしてしきい値算出部に出力する。
【0037】標準パタン記憶部15は、標準パタン作成
部14によって変換されたラベルの時系列を各認識カテ
ゴリに対応する標準パタンとして記憶する。例えば、認
識カテゴリが単語であるとすると、第w番目の単語の標
準パタンは、その単語の音声信号に対して標準パタン作
成部42によって変換されたラベルの系列Rw として登
録される。この結果、標準パタン記憶部15には、認識
カテゴリw(w=1〜W)に対して次のような標準パタ
ンRw (w=1〜W)が記憶される。 R1 ={r1 1 ,r1 2 ,…,r1 j1} R2 ={r2 1 ,r2 2 ,…,r2 j2} … Rw ={rw 1 ,rw 2 ,…,rw jw} ここで、単語wの標準パタンにおける第jフレームのラ
ベルをrw j で表している。
【0038】マッチング部16は、音声信号の認識時
に、ファジィベクトル量子化部13によって算出された
入力パタンと標準パタン記憶部15に記憶された各認識
カテゴリの標準パタンとのパタン間類似度を、DPマッ
チングを用いてコードベクトル間帰属度テーブル17を
参照して算出する。
【0039】ここでは、認識カテゴリwの標準パタンR
w ={rw 1 ,rw 2 ,…,rw j,…,rw Jw}と入
力パタンである入力帰属度ベクトル系列U={u1 ,u
2 ,…,ut ,…,uT }及び入力ラベルベクトル系列
O={o1 ,o2 ,…,ot,…,oT }とのパタン間
類似度を算出するものとする。このとき、入力パタンの
フレームtと標準パタンRw のフレームjとのフレーム
間類似度sw (t,j)として、次の式(8a)〜(8d)
の4種類の定義が可能である。
【数3】
【0040】ここで、s1 w (t,j)、s2 w (t,j)はそ
れぞれ加算形式、乗算形式による定義である。
【0041】マッチング部16は、式(8a)〜(8
d)のうちのいずれかの定義によるフレーム間類似度s
w (t,j)に基づいて、式(3)に示す漸化式に従って累
積類似度g(t,j)を計算し、パタン間類似度Sw を計算
する。
【0042】コードベクトル間帰属度テーブル17は、
マッチング部16がフレーム間類似度を計算する際に必
要となる,コードブック12に記憶されているコードベ
クトルμm 相互間の帰属度を、マトリックスの形で記憶
している。
【0043】すなわち、コードブック12が記憶してい
るコードベクトルμm の,各クラスタCn (n=1〜
M,n≠m)に対する帰属度bmn(n=1〜M,bm1
…+bmM=1,n≠m)を、ファジィベクトル量子化部
13によって入力帰属度ベクトルを算出したのと同一の
手法を用いて事前に作成し、コードベクトル間帰属度テ
ーブル17に2つのラベルmとnとで検索可能な形で格
納しておく。ただし、n=mのときの帰属度を定数Xと
して与えてもよい。この場合、他の帰属度と比較して相
対的に帰属度を大きくしたいときはXを1程度の値に
し、そうでなければ他の帰属度と同等の値とし、その
後、n=mのときの帰属度Xも含めたすべての帰属度b
mn(n=1〜M)の総和が1となるように正規化する。
【0044】また、マッチング部16のフレーム間類似
度の計算方法によっては、コードベクトル間帰属度bmn
の対数値log(bmn)をコードベクトル間帰属度テーブル
17に格納する。
【0045】しきい値算出部18は、音声信号の認識時
に、入力された認識対象の音声信号からファジィベクト
ル量子化部13によって作成された入力パタンと、前記
認識対象の音声信号から標準パタン作成部14によって
標準パタンの作成と同一の手法によって作成された入力
標準パタンとから、対象となる認識カテゴリ以外の音声
信号の入力を却下するためのしきい値を算出する。
【0046】認識結果判定部19は、マッチング部16
によって算出された,入力パタンと各認識カテゴリwの
標準パタンとのパタン間類似度を入力し、このパタン間
類似度が最大となる認識カテゴリwを認識結果として出
力する。ただし、パタン間類似度の最大値がしきい値算
出部18によって算出されたしきい値以下である場合に
は、本装置の対象となる認識カテゴリ以外の音声信号と
判定し、これを認識結果とする。
【0047】図1に示す本実施形態に係る音声認識装置
の動作について、学習時と認識時とに分けて説明する。
【0048】まず、学習時の動作について説明する。学
習時には、音声認識装置は、対象とする認識カテゴリ
(単語,音素等)の標準パタンを作成して記憶する。
【0049】まず、対象とする認識カテゴリに対して予
め発生された音声信号を入力とし、入力された音声信号
を分析部11によって特徴ベクトルに変換する。そし
て、標準パタン作成部14はコードブック12を参照し
て特徴ベクトルから標準パタンを作成し、標準パタン記
憶部15は標準パタン作成部によって作成された標準パ
タンを記憶する。
【0050】次に、認識時の動作について説明する。認
識時には、音声認識装置は、与えられた音声信号がどの
認識カテゴリに属するかを判定する。
【0051】まず、認識対象の音声信号を入力とし、こ
の認識対象の音声信号を分析部11によって特徴ベクト
ルに変換する。そして、ファジィベクトル量子化部13
はコードブック12を参照して特徴ベクトルから入力パ
タンを作成し、マッチング部16及びしきい値算出部1
8に出力する。また、標準パタン作成部14はコードブ
ック12を参照して、標準パタンの作成と同一の手法に
よって特徴ベクトルから入力標準パタンを作成し、しき
い値算出部18に出力する。
【0052】マッチング部16は、ファジィベクトル量
子化部13によって作成された入力パタンと標準パタン
記憶部15に記憶されている各標準パタンとのマッチン
グを行い、コードベクトル間帰属度テーブル17を参照
してパタン間類似度を算出する。
【0053】図2はマッチング部16の動作を示すフロ
ーチャートである。図2に従ってマッチング部16の動
作を順を追って説明する。
【0054】まず、ファジィベクトル量子化部13によ
って算出された入力パタンが、マッチング部16に入力
される。
【0055】ステップS11において、認識カテゴリ数
のカウンタwを初期化する。そして、ステップS12に
おいて、認識カテゴリのカウンタwを1ずつ増加させ、
次の認識カテゴリに進む。ステップS13において、カ
ウンタwの値が本装置が認識の対象とする認識カテゴリ
の数Wよりも大きいか否かを判断し、大きいときは動作
を終了し、小さいときはステップS14に進む。すなわ
ち、準備されている全ての標準パタンに対してマッチン
グが行われると、動作を終了する。
【0056】ステップS14において、入力パタン長の
カウンタtを初期化する。そして、ステップS15にお
いて、入力パタン長のカウンタtを1ずつ増加させ、入
力パタンの次のフレームに進む。ステップS16におい
て、カウンタtの値が与えられた入力パタンのフレーム
数Tよりも大きいか否かを判断し、大きいときはステッ
プS22に進み、小さいときはステップS17に進む。
【0057】ステップS17において、認識カテゴリw
の標準パタン長のカウンタjを初期化する。そして、ス
テップS18において、認識カテゴリwの標準パタン長
のカウンタjを1ずつ増加させ、認識カテゴリwの標準
パタンの次のフレームに進む。ステップS19におい
て、カウンタjの値が認識カテゴリwの標準パタンのフ
レーム数JW よりも大きいか否かを判断し、大きいとき
はステップS15に進み、小さいときはステップS20
に進む。
【0058】ステップS20において、入力パタンのフ
レームtと認識カテゴリwの標準パタンのフレームjと
のフレーム間類似度sw (t,j)を、式(8a)〜
(8d)のいずれかに従って、標準パタン記憶部15及
びコードベクトル間帰属度テーブル17を参照して算出
する。なお、図2に示すフローチャートでは、ステップ
S20に式(8a)の加算形式を記述しているが、他の
式(8b)〜(8d)の定義を用いても、全体としては
全く同じ動作である。
【0059】次に、ステップS21において、ステップ
S20で得られたフレーム間類似度Sw (t、j)に基
づき、式(3)に示す漸化式を算出する。漸化式を算出
したら、ステップS18に戻る。ステップS18におい
て、認識カテゴリwの標準パタン長のカウンタjを1ず
つ増加させ、認識カテゴリwの標準パタンの次のフレー
ムに進む。ステップS19において、カウンタjの値が
認識カテゴリwの標準パタンのフレーム数JW よりも大
きいか否かを判断し、大きいときはステップS15に進
み、小さいときはステップS20に進む。このように、
カウンタjの値が認識カテゴリwの標準パタンのフレー
ム数JW よりも大きくなるまで、ステップS18〜S2
1を繰り返す。
【0060】カウンタjの値が認識カテゴリwの標準パ
タンのフレーム数JW よりも大きくなると、ステップS
15に戻る。ステップS15において、入力パタン長の
カウンタtを1ずつ増加させ、入力パタンの次のフレー
ムに進む。ステップS16において、カウンタtの値が
与えられた入力パタンのフレーム数Tよりも大きいか否
かを判断し、大きいときはステップS22に進み、小さ
いときはステップS17に進む。このように、カウンタ
tの値が与えられた入力パタンのフレーム数Tよりも大
きくなるまで、ステップS15〜S21を繰り返す。
【0061】カウンタtの値が入力パタンのフレーム数
Tよりも大きくなると、ステップS22に進む。このと
き、入力パタンと認識カテゴリwの標準パタンとのパタ
ンマッチングは終了しているので、累積類似度g(T,
w )をパタン間類似度Swに代入し、ステップS12
に戻る。
【0062】ステップS12において、認識カテゴリの
カウンタwを1ずつ増加させ、次の認識カテゴリに進
む。ステップS13において、カウンタwの値が認識の
対象とする認識カテゴリの数Wよりも大きいか否かを判
断し、大きいときは動作を終了し、小さいときはステッ
プS14に進む。すなわち、与えられた入力パタンに対
して全ての認識カテゴリwの標準パタンとのマッチング
を実行したとき、マッチング部16は動作を終了する。
【0063】動作を終了すると、マッチング部16は、
終了信号及び算出したパタン間類似度を認識結果判定部
19に出力する。
【0064】一方、しきい値算出部18は、標準パタン
作成部14によって標準パタンと同一の手法によって作
成された入力標準パタン及びファジィベクトル量子化部
13によって算出された入力パタンから、認識対象外の
音声信号の入力を却下するためのしきい値を算出する。
【0065】図3はしきい値算出部18の動作を示すフ
ローチャートである。図3に従ってしきい値算出部18
の動作を順を追って説明する。
【0066】まず、ファジィベクトル量子化部13によ
って作成された入力パタン及び標準パタン作成部14に
よって作成された入力標準パタンが、しきい値算出部1
8に入力される。
【0067】ステップS31において、入力パタン長の
カウンタtを初期化する。そして、ステップS32にお
いて、カウンタtを1ずつ増加させ、入力パタンの次の
フレームに進む。ステップS33において、カウンタt
が入力パタンのフレーム数Tよりも大きいか否かを判断
し、大きいときはステップS39に進み、大きくないと
きはステップS34に進む。すなわち、入力パタンと入
力標準パタンとのパタンマッチングが終了したとき、ス
テップS39に進む。
【0068】ステップS34において、入力標準パタン
長のカウンタjを初期化する。そして、ステップS35
において、カウンタjを1ずつ増加させ、入力標準パタ
ンの次のフレームに進む。ステップS36において、カ
ウンタjが入力標準パタンのフレーム数JP よりも大き
いか否かを判断し、大きいときはステップS32に戻
り、大きくないときはステップS37に進む。すなわ
ち、入力パタンのフレームtまでの入力標準パタンに対
する累積類似度g(t,j)の算出が終了したとき、ス
テップS32に戻る。
【0069】ステップS37において、入力パタンのフ
レームtと入力標準パタンのフレームjとのフレーム間
類似度sP (t,j)を、式(9a)〜(9d)のいず
れかの定義に従って、コードベクトル間帰属度テーブル
17を参照して算出する。
【数4】
【0070】図3に示すフローチャートのステップS3
7では、図2に示すフローチャートのステップS20に
示す式(8a)の加算形式に対応して式(9a)の加算
形式を記載しているが、他の式(8b)〜(8d)に対
応して式(9b)〜(9d)のフレーム間類似度の定義
を用いても、全体としては全く同じ動作である。
【0071】次に、ステップS38において、ステップ
S37で得られたフレーム間類似度SP (t,j)に基
づき、式(3)に示す漸化式に従って累積類似度g
(t,j)を算出する。算出した後、ステップS35に
戻る。
【0072】ステップS39において、ステップS32
〜S38を繰り返すことによって得られた累積類似度g
(T,JP )と相対しきい値幅R_thとから、次式に従
ってしきい値R_val を算出する。 R_val =g(T,JP )−R_th …(10)
【0073】ここで、相対しきい値幅R_thは、算出さ
れた累積類似度g(T,JP )に対して、入力パタンが
対象となる認識カテゴリに属するかを判断するための類
似度の幅を示す値である。
【0074】しきい値算出部18は、ステップS39に
おいて計算したしきい値R_val を認識結果判定部19
に出力し、その動作を終了する。
【0075】最後に、認識結果判定部19は、マッチン
グ部16から出力されたパタン類似度の最大値を求め、
この最大値がしきい値算出部18によって求められたし
きい値を上回るときは、パタン類似度が最大となる標準
パタンの認識カテゴリwを認識結果として出力する。パ
タン類似度の最大値がしきい値以下であるときは、入力
された音声信号は認識対象外のものであると判定し、こ
れを認識結果として出力する。
【0076】以上説明したように、本実施形態に係る音
声認識装置によると、入力された音声信号から認識カテ
ゴリの標準パタンの形式にあったしきい値が算出される
ので、入力された音声信号に対して適切なしきい値が常
に設定可能になり、認識対象外の音声信号の入力を高い
確率で却下することができる。
【0077】なお、本実施形態では、ファジィベクトル
量子化部13はコードブック12に記憶された全てのコ
ードベクトルを用いて入力パタンを作成するものとして
説明したが、類似度の高いコードベクトルのみを用いて
もよい。この場合、フレーム間類似度の計算量を削減す
ることができ、類似しないコードベクトルの影響をなく
して認識性能を向上させることができる。
【0078】(第2の実施形態)図4はベクトル量子化
を用いた一般的な音声認識装置に本発明の思想を用いた
場合の構成を示すブロック図である。図4において、2
1は分析部、23はコードブック、28は距離マトリッ
クスであり、図5に示す従来の音声認識装置における分
析部51,コードブック53及び距離マトリックス56
と同様の動作をする。
【0079】標準パタン作成部24は、学習時に認識カ
テゴリの標準パタンを作成するものであり、例えば、分
析部21で得られた特徴ベクトルyから複数フレームの
平均値からなる平均特徴ベクトルを求め、特徴ベクトル
yを、コードブック23を参照してこの平均特徴ベクト
ルに最も類似するコードベクトルμo のラベルoに変換
し、標準パタンとして標準パタン記憶部25に出力す
る。また、音声信号の認識時には、分析部21で得られ
た特徴ベクトルyから求めたラベルを入力標準パタンと
してしきい値算出部27に出力する。
【0080】標準パタン記憶部25は、学習時に標準パ
タン作成部24から出力された標準パタンを記憶するも
のであり、認識カテゴリw(w=1〜W)毎に作成され
た標準パタンRw をラベル系列の形で記憶している、。
【0081】入力パタン作成部22は、音声信号の認識
時において、分析部21で得られた特徴ベクトルyに対
し、標準パタン作成部24とは異なる手法によってラベ
ル系列(入力パタン)を作成する。例えば、標準パタン
作成部24のように特徴ベクトルの複数フレームの平均
化を行わずに、分析部21から出力された特徴ベクトル
の値そのものをコードブック23を参照してこの特徴ベ
クトルに最も類似するコードベクトルμo のラベルoに
変換する。
【0082】マッチング部26は、認識時のみに動作
し、標準パタン記憶部25に記憶された標準パタンと入
力パタン作成部22から出力された入力パタンとの間の
パタン間距離Dw を式(2)に示す漸化式に従って算出
する。ただし、フレーム間距離は距離マトリックス28
を参照しながら算出される。すなわち、フレーム間距離
w (t,j)は式(4)に示すように、入力パタンの
フレームtのラベルotと標準パタンwのフレームjの
ラベルrw j で検索された距離マトリックス28の値で
ある。
【0083】しきい値算出部27は、標準パタン作成部
24から出力された入力標準パタンと入力パタン作成部
22から出力された入力パタンとに対して、マッチング
部26と同一の手法によってマッチングを行い、マッチ
ングの結果得られた距離からしきい値を算出する。
【0084】認識結果判定部29は、マッチング部26
によって算出されたパタン間距離Dw (w=1〜W)が
最小である認識カテゴリwを求め、これを認識結果とし
て出力する。ただし、パタン間距離Dw の最小値が、し
きい値算出部27によって算出されたしきい値以上であ
るときは、入力された音声信号は認識対象外と判定す
る。
【0085】図4に示す音声認識装置においても、第1
の実施形態に係る音声認識装置と同様に入力された音声
信号から標準パタンの形式にあったしきい値が算出され
るので、入力された音声信号に対して適切なしきい値が
常に設定可能になり、認識対象外の音声信号の入力を高
い確率で却下することができる。
【0086】なお、第1及び第2の実施形態ではマッチ
ングの手法としてDPマッチング法を用いる場合を例に
とって説明したが、時間軸を線形に伸縮してマッチング
を行う線形マッチングを用いてももちろん本発明は実現
可能であり、同様の効果が得られる。
【0087】
【発明の効果】以上のように、本発明に係る音声認識装
置によると、判定可能な認識カテゴリに属さない音声信
号の入力を却下するためのしきい値が音声信号が入力さ
れる度にその都度設定され、しかも入力された音声信号
に対して常に適切な値となる。したがって、認識対象外
の音声信号の入力を高い確率で却下可能になり、しかも
認識カテゴリの変化に柔軟に対応可能である。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係る音声認識装置の
構成を示すブロック図である。
【図2】図1に示す音声認識装置におけるマッチング部
の動作を示すフローチャートである。
【図3】図1に示す音声認識装置におけるしきい値算出
部の動作を示すフローチャートである。
【図4】本発明の第2の実施形態に係る音声認識装置の
構成を示すブロック図であり、ベクトル量子化を用いた
音声認識装置に本発明を適用した場合の構成を示すもの
である。
【図5】ベクトル量子化を用いた音声認識装置の一般的
な構成を示すブロック図である。
【図6】DPマッチングに用いられる代表的な経路パス
を示す図であり、(a)は対称形パス、(b)は非対称
形パス(入力パタン側依存パス)、(c)は非対称形パ
ス(標準パタン側依存パス)である。
【図7】DPマッチング法を説明する格子グラフ図であ
る。
【符号の説明】
11 分析部 12 コードブック 13 ファジィベクトル量子化部(入力パタン作成部) 14 標準パタン作成部 15 標準パタン記憶部 16 マッチング部 17 コードベクトル間帰属度テーブル 18 しきい値算出部 19 認識結果判定部 21 分析部 22 入力パタン作成部 23 コードブック 24 標準パタン作成部 25 標準パタン記憶部 26 マッチング部 27 しきい値算出部 28 距離マトリックス 29 認識結果判定部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 入力された音声信号に対し、この音声信
    号が属する認識カテゴリを判定する音声認識装置であっ
    て、 各認識カテゴリに対応する音声信号の特徴ベクトルから
    第1の手法によって作成された,各認識カテゴリに対応
    する標準パタンを記憶する標準パタン記憶部と、 入力された認識対象の音声信号の特徴ベクトルから、前
    記第1の手法と異なる第2の手法によって入力パタンを
    作成する入力パタン作成部と、 前記認識対象の音声信号の特徴ベクトルから、前記第1
    の手法によって入力標準パタンを作成する標準パタン作
    成部と、 前記入力パタン作成部によって作成された入力パタンと
    前記標準パタン記憶部に記憶されている各標準パタンと
    のマッチングを行い、前記入力パタンと前記各標準パタ
    ンとの距離を求めるマッチング部と、 前記入力パタン作成部によって作成された入力パタンと
    前記標準パタン作成部によって作成された入力標準パタ
    ンとのマッチングを行い、前記入力パタンと前記入力標
    準パタンとの距離を求め、この距離を基にして当該音声
    認識装置が判定可能な認識カテゴリに属さない音声信号
    の入力を却下するためのしきい値を算出するしきい値算
    出部と、 前記マッチング部によって求められた前記入力パタンと
    前記各標準パタンとの距離及び前記しきい値算出部によ
    って算出されたしきい値を基にして、前記認識対象の音
    声信号が属する認識カテゴリを判定する認識結果判定部
    とを備えていることを特徴とする音声認識装置。
  2. 【請求項2】 請求項1に記載の音声認識装置におい
    て、 前記認識結果判定部は、 前記マッチング部によって求められた前記入力パタンと
    前記各標準パタンとの距離の最小値を求め、この最小値
    が前記しきい値算出部によって算出されたしきい値より
    も大きいときは、前記認識対象の音声信号は当該音声認
    識装置が判定可能な認識カテゴリのいずれにも属さない
    と判定する一方、前記最小値が前記しきい値以下のとき
    は、前記認識対象の音声信号は前記入力パタンとの距離
    が最小である標準パタンに対応する認識カテゴリに属す
    ると判定することを特徴とする音声認識装置。
  3. 【請求項3】 請求項1に記載の音声認識装置におい
    て、 前記マッチング部は、前記入力パタンと前記各標準パタ
    ンとの距離の代わりに前記入力パタンと前記各標準パタ
    ンとの類似度を求めるものであり、 前記しきい値算出部は、前記入力パタンと前記入力標準
    パタンとの距離の代わりに前記入力パタンと前記入力標
    準パタンとの類似度を求め、この類似度を基にして前記
    しきい値を算出するものであることを特徴とする音声認
    識装置。
  4. 【請求項4】 請求項3に記載の音声認識装置におい
    て、 前記認識結果判定部は、 前記マッチング部によって求められた前記入力パタンと
    前記各標準パタンとの類似度の最大値を求め、この最大
    値が前記しきい値算出部によって算出されたしきい値よ
    りも小さいときは、前記認識対象の音声信号は当該音声
    認識装置が判定可能な認識カテゴリのいずれにも属さな
    いと判定する一方、前記最大値が前記しきい値以上のと
    きは、前記認識対象の音声信号は前記入力パタンとの距
    離が最大である標準パタンに対応する認識カテゴリに属
    すると判定することを特徴とする音声認識装置。
  5. 【請求項5】 入力された音声信号に対し、この音声信
    号が属する認識カテゴリを判定する音声認識装置であっ
    て、 各認識カテゴリが属する特徴ベクトル空間における各ク
    ラスタを代表するコードベクトルを、各コードベクトル
    を示すラベルによって検索可能な形で記憶しているコー
    ドブックと、 入力された認識対象の音声信号の特徴ベクトルを、前記
    コードブックを参照して、前記特徴ベクトルと前記各コ
    ードベクトルとの依存度合を要素とする入力帰属度ベク
    トルに変換するファジィベクトル量子化部と、 音声認識装置の学習時に、各認識カテゴリに対応する音
    声信号の特徴ベクトルから標準パタンを作成する一方、
    音声認識装置の認識時に、認識対象の音声信号の特徴ベ
    クトルから入力標準パタンを作成する標準パタン作成部
    と、 音声認識装置の学習時に前記標準パタン作成部によって
    作成された,各認識カテゴリに対応する標準パタンを記
    憶する標準パタン記憶部と、 前記コードベクトル同士の依存度合であるコードベクト
    ル間帰属度を、各コードベクトルを示す2つのラベルに
    よって検索可能な形で記憶しているコードベクトル間帰
    属度テーブルと、 前記ファジィベクトル量子化部によって変換された入力
    帰属度ベクトルと前記標準パタン記憶部に記憶されてい
    る各標準パタンとのマッチングを前記コードベクトル間
    帰属度テーブルを参照して行い、前記入力帰属度ベクト
    ルと前記各標準パタンとの類似度を求めるマッチング部
    と、 前記ファジィベクトル量子化部によって変換された入力
    帰属度ベクトルと前記標準パタン作成部によって作成さ
    れた標準入力パタンとのマッチングを前記コードベクト
    ル間帰属度テーブルを参照して行い、前記入力帰属度ベ
    クトルと前記入力標準パタンとの類似度を求め、この類
    似度を基にして当該音声認識装置が判定可能な認識カテ
    ゴリに属さない音声信号の入力を却下するためのしきい
    値を算出するしきい値算出部と、 前記マッチング部によって求められた前記入力帰属度ベ
    クトルと前記各標準パタンとの類似度及び前記しきい値
    算出部によって算出されたしきい値を基にして、前記認
    識対象の音声信号が属する認識カテゴリを判定する認識
    結果判定部とを備えていることを特徴とする音声認識装
    置。
JP8200031A 1996-07-30 1996-07-30 音声認識装置 Withdrawn JPH1049189A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8200031A JPH1049189A (ja) 1996-07-30 1996-07-30 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8200031A JPH1049189A (ja) 1996-07-30 1996-07-30 音声認識装置

Publications (1)

Publication Number Publication Date
JPH1049189A true JPH1049189A (ja) 1998-02-20

Family

ID=16417677

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8200031A Withdrawn JPH1049189A (ja) 1996-07-30 1996-07-30 音声認識装置

Country Status (1)

Country Link
JP (1) JPH1049189A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6185527B1 (en) 1999-01-19 2001-02-06 International Business Machines Corporation System and method for automatic audio content analysis for word spotting, indexing, classification and retrieval
KR100440973B1 (ko) * 2002-08-01 2004-07-21 삼성전자주식회사 신호간 상관계수 결정 장치 및 방법과 이를 이용한 신호피치 결정 장치 및 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6185527B1 (en) 1999-01-19 2001-02-06 International Business Machines Corporation System and method for automatic audio content analysis for word spotting, indexing, classification and retrieval
KR100440973B1 (ko) * 2002-08-01 2004-07-21 삼성전자주식회사 신호간 상관계수 결정 장치 및 방법과 이를 이용한 신호피치 결정 장치 및 방법

Similar Documents

Publication Publication Date Title
US5315689A (en) Speech recognition system having word-based and phoneme-based recognition means
US5684925A (en) Speech representation by feature-based word prototypes comprising phoneme targets having reliable high similarity
KR100925479B1 (ko) 음성 인식 방법 및 장치
EP0755046B1 (en) Speech recogniser using a hierarchically structured dictionary
US6490555B1 (en) Discriminatively trained mixture models in continuous speech recognition
EP0504485A2 (en) A speaker-independent label coding apparatus
JP2005062866A (ja) コンパクトな音響モデルを作成するためのバブル分割方法
JPH09127972A (ja) 連結数字の認識のための発声識別立証
US5794190A (en) Speech pattern recognition using pattern recognizers and classifiers
US5924066A (en) System and method for classifying a speech signal
US5825977A (en) Word hypothesizer based on reliably detected phoneme similarity regions
US6230129B1 (en) Segment-based similarity method for low complexity speech recognizer
EP0344017B1 (en) Speech recognition system
US4918731A (en) Speech recognition method and apparatus
Kumar et al. Comparative analysis of different feature extraction and classifier techniques for speaker identification systems: A review
Sukkar Rejection for connected digit recognition based on GPD segmental discrimination
Tabibian et al. An evolutionary based discriminative system for keyword spotting
JPH1049189A (ja) 音声認識装置
JP3403838B2 (ja) 句境界確率計算装置および句境界確率利用連続音声認識装置
JPH064097A (ja) 話者認識方法
CN114898776A (zh) 一种多尺度特征联合多任务cnn决策树的语音情感识别方法
EP0435336B1 (en) Reference pattern learning system
JP2000075886A (ja) 統計的言語モデル生成装置及び音声認識装置
KR100435440B1 (ko) 화자간 변별력 향상을 위한 가변 길이 코드북 생성 장치및 그 방법, 그를 이용한 코드북 조합 방식의 화자 인식장치 및 그 방법
JP2853418B2 (ja) 音声認識方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20031007