JP3450972B2 - パターン認識装置 - Google Patents

パターン認識装置

Info

Publication number
JP3450972B2
JP3450972B2 JP29638996A JP29638996A JP3450972B2 JP 3450972 B2 JP3450972 B2 JP 3450972B2 JP 29638996 A JP29638996 A JP 29638996A JP 29638996 A JP29638996 A JP 29638996A JP 3450972 B2 JP3450972 B2 JP 3450972B2
Authority
JP
Japan
Prior art keywords
similarity
pattern
noise
given
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP29638996A
Other languages
English (en)
Other versions
JPH10143188A (ja
Inventor
千晴 河合
浩 片山
潔 宇都木
理香 西池
泰 山崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP29638996A priority Critical patent/JP3450972B2/ja
Publication of JPH10143188A publication Critical patent/JPH10143188A/ja
Application granted granted Critical
Publication of JP3450972B2 publication Critical patent/JP3450972B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、雑音が重畳された
観測パターンまたは特徴パターンと予め設定された標準
パターンとの類似度を求め、パターンマッチング法に基
づいて両者の間における同一性や類似性を識別するパタ
ーン認識装置に関する。
【0002】
【従来の技術】近年、ディジタル信号処理技術の著しい
進歩と、DSPのような高速かつ安価な信号処理装置の
実現とに応じて自動販売機その他の多くの電子機器にパ
ターン認識技術が適用されつつある。
【0003】特に、音声のパターン認識(以下、単に
「音声認識」という。)については、その対象となる情
報の情報量が画像の情報量に比べて著しく少ないため
に、先行して多くの分野に適用されつつある。図11
は、従来の音声認識装置の構成例を示す図である。図に
おいて、マイク71の出力はA/D変換器72を介して
DSP73の入力に接続され、そのDSP73の出力に
は認識結果が得られる。DSP73の外部メモリ端子に
は、メモリ74が接続される。
【0004】このような構成の音声認識装置では、マイ
ク71は人またはこれに代わる装置が音響的に発した音
声を音響−電気変換することにより観測信号を生成し、
A/D変換器72はその観測信号をディジタル信号に変
換する。メモリ74には、上述した音声として与えられ
る情報の内、認識すべきものの特徴の集合からなるパタ
ーン(ここでは、簡単のため単一であると仮定する。)
を示す標準パターンが予め格納される。
【0005】DSP73は、上述したディジタル信号に
所望の特徴抽出処理を施すことにより、そのディジタル
信号から特徴パターン(ここでは、簡単のため個々のフ
レーム単位に求められた複数の周波数スロットの「レベ
ル」のみであると仮定する。)を抽出し、その特徴パタ
ーンとメモリ74に格納された標準パターンとの相関を
以下の3つの方式の何れかに基づいてとることにより音
声認識を行う。
【0006】(1) メモリ74には種々の環境下における
環境雑音に個別に対応した標準パターン(図12(a)〜
(c)) が登録され、かつDSP73はこれらの標準パタ
ーンの内、ディジタル信号として与えられる環境雑音と
の相関が最大であるものを選択してDPマッチングをと
る(以下、「第一の方式」という。)。 (2) メモリ74には環境雑音が何ら重畳されていない音
声の標準パターン(図13(a))が登録され、かつDSP
73はディジタル信号として与えられる環境雑音(図1
3(b))とその標準パターンとの和を周波数スロット毎に
とると共に、これらの和に対して個別にDPマッチング
をとる(以下、「第二の方式」という。)。
【0007】(3) メモリ74には環境雑音が何ら重畳さ
れていない音声の標準パターン(図14(a))が登録さ
れ、かつDSP73はその標準パターンの内、予め設定
された閾値を下回るフレーム毎の区間(以下、「非音声
区間」という。)における標準パターンを環境雑音(図
14(b))で置換した後にDPマッチングをとる(以下、
「第三の方式」という。)。
【0008】これらの方式の下では、標準パターンに含
まれあるいは付加されたり置換された環境雑音について
も類似度が求められるために、上記(1)〜(3)の何れの演
算も施されない場合に比べて環境雑音に起因する認識率
の低下が抑えられる。なお、上述したDPマッチングの
尺度については、そのDPマッチングの演算対象の間に
ついて単なる周波数スロット毎の差分やその差分の逆数
の二乗値で定義される類似度に限定されず、例えば、最
尤スペクトラム距離、対数尤度比距離、予測誤差、cosh
尺度、LPCケプストラム距離の逆数で定義される類似
度のように、両者が類似するほど大きな値をとる尺度で
あれば、如何なるものであってもよい。
【0009】また、DPマッチングの演算については、
公知技術であるから、ここではその説明を省略する。
【0010】
【発明が解決しようとする課題】しかし、上述した従来
例の内、第一の方式が適用された従来例では、実際に運
用される環境における環境雑音が多様であるほどメモリ
74に予め登録されるべき標準パターンの情報量が増加
するために、実際に適用できない場合が多かった。
【0011】また、第二の方式が適用された従来例で
は、環境雑音と標準パターンとの和をとる処理が周波数
スロット毎に行われるのでその処理の処理量が大きく、
さらに両者の比率を適正に設定する演算の手順が複雑で
あるために、応答性が低下したり実時間性が損なわれる
可能性があった。
【0012】さらに、第三の方式が適用された従来例で
は、本来の標準パターンより環境雑音のレベルが大きい
非音声区間についてその環境雑音に適応した標準パター
ンが得られるために、認識率が向上するが、このような
環境雑音のレベルは必ずしも一定ではない。したがっ
て、閾値を動的に適正な値に設定することが技術的には
可能であっても、図15に示すように、その閾値THが
最適な値LEVより高く設定された区間(フレーム)に
ついては音声認識の対象となるディジタル信号が環境雑
音によってマスキングされるために、認識率が著しく低
下する可能性が高かった。
【0013】本発明は、処理量が大幅に増加することな
く確実に認識率を高く維持できるパターン認識装置を提
供することを目的とする。
【0014】
【課題を解決するための手段】図1は、請求項1〜3、
7〜9に記載の発明の原理ブロック図である。
【0015】請求項1に記載の発明は、雑音に重畳され
て間欠的に与えられる観測パターンを取り込み、その観
測パターンが与えられる有効区間と反対に与えられない
休止区間とを判別する判別手段11と、特徴空間におい
て観測パターンの特徴ベクトルを示す標準パターンが予
め登録された記憶手段12と、判別手段11によって判
別された有効区間について、与えられる観測パターン
と、先行する休止区間に観測パターンに重畳された雑音
の内、特徴が定常と見なし得る雑音との類似度を第一の
類似度として算出する第一の類似度算出手段13と、判
別手段11によって判別された有効区間について、与え
られる観測パターンと記憶手段12に登録された標準パ
ターンとの類似度を第二の類似度として算出する第二の
類似度算出手段14と、第一の類似度算出手段13によ
って算出された第一の類似度と第二の類似度算出手段1
4によって算出された第二の類似度との内、値が大きい
単一の類似度を時系列の順に対応付けて選択する選択手
段15と、選択手段15によって選択された単一の類似
度の列の認識をパターンマッチング法に基づいて行う認
識手段16とを備えたことを特徴とする。
【0016】請求項2に記載の発明は、雑音に重畳され
て間欠的に与えられる観測パターンを取り込み、その観
測パターンが与えられる有効区間と反対に与えられない
休止区間とを判別する判別手段11と、特徴空間におい
て観測パターンの特徴ベクトルを示す標準パターンが予
め登録された記憶手段12と、判別手段11によって判
別された有効区間について、与えられる観測パターン
と、先行する休止区間に観測パターンに重畳された雑音
の内、特徴が定常と見なし得る複数の雑音との類似度を
個別に算出し、複数の第一の類似度を得る第一の類似度
算出手段21と、判別手段11によって判別された有効
区間について、与えられる観測パターンと記憶手段12
に登録された標準パターンとの類似度を第二の類似度と
して算出する第二の類似度算出手段14と、第一の類似
度算出手段21によって得られた複数の第一の類似度と
第二の類似度算出手段14によって算出された第二の類
似度との内、値が最大である単一の類似度を時系列の順
に対応付けて選択する選択手段22と、選択手段22に
よって選択された単一の類似度の列の認識をパターンマ
ッチング法に基づいて行う認識手段23とを備えたこと
を特徴とする。
【0017】請求項3に記載の発明は、特徴が異なる複
数の雑音の何れかに重畳されて間欠的に与えられる観測
パターンを取り込み、その観測パターンが与えられる有
効区間と反対に与えられない休止区間とを判別する判別
手段11と、特徴空間において観測パターンの特徴ベク
トルを示す標準パターンが予め登録された記憶手段12
と、特徴空間において複数の雑音の特徴ベクトルを示す
雑音標準パターンが予め登録された雑音標準記憶手段3
1と、判別手段11によって判別された有効区間につい
て、与えられる観測パターンと雑音標準記憶手段31に
登録された複数の雑音の雑音標準パターンとの類似度を
個別に算出し、複数の第一の類似度を得る第一の類似度
算出手段32と、判別手段11によって判別された有効
区間について、与えられる観測パターンと記憶手段12
に登録された標準パターンとの類似度を第二の類似度と
して算出する第二の類似度算出手段14と、第一の類似
度算出手段32によって得られた複数の第一の類似度と
第二の類似度算出手段14によって算出された第二の類
似度との内、値が最大である単一の類似度を時系列の順
に対応付けて選択する選択手段33と、選択手段33に
よって選択された単一の類似度の列の認識をパターンマ
ッチング法に基づいて行う認識手段34とを備えたこと
を特徴とする。
【0018】図2は、請求項4〜9に記載の発明の原理
ブロック図である。請求項4に記載の発明は、雑音に重
畳されて間欠的に与えられる観測パターンを取り込み、
その観測パターンが与えられる有効区間と反対に与えら
れない休止区間とを判別する判別手段11と、特徴空間
において観測パターンとその観測パターンに重畳された
雑音との和の特徴ベクトルを示す標準パターンが予め登
録された記憶手段41と、判別手段11によって判別さ
れた有効区間について、先行する休止区間に与えられた
雑音の内、特徴が定常と見なし得る雑音と記憶手段41
に登録された標準パターンとの類似度を第一の類似度と
して算出する第一の類似度算出手段42と、判別手段1
1によって判別された有効区間について、与えられる観
測パターンと記憶手段41に登録された標準パターンと
の類似度を第二の類似度として算出する第二の類似度算
出手段43と、第一の類似度算出手段42によって算出
された第一の類似度と第二の類似度算出手段43によっ
て算出された第二の類似度との内、値が大きい単一の類
似度を時系列の順に対応付けて選択する選択手段44
と、選択手段44によって選択された単一の類似度の列
の認識をパターンマッチング法に基づいて行う認識手段
45とを備えたことを特徴とする。
【0019】請求項5に記載の発明は、雑音に重畳され
て間欠的に与えられる観測パターンを取り込み、その観
測パターンが与えられる有効区間と反対に与えられない
休止区間とを判別する判別手段11と、特徴空間におい
て観測パターンとその観測パターンに重畳された雑音と
の和の特徴ベクトルを示す標準パターンが予め登録され
た記憶手段41と、判別手段11によって判別された有
効区間について、先行する休止区間に与えられた雑音の
内、特徴が定常と見なし得る複数の雑音と記憶手段41
に登録された標準パターンとの類似度を個別に算出し、
複数の第一の類似度を得る第一の類似度算出手段51
と、判別手段11によって判別された有効区間につい
て、与えられる観測パターンと記憶手段41に登録され
た標準パターンとの類似度を第二の類似度として算出す
る第二の類似度算出手段43と、第一の類似度算出手段
51によって得られた複数の第一の類似度と第二の類似
度算出手段43によって算出された第二の類似度との
内、値が最大である単一の類似度を時系列の順に対応付
けて選択する選択手段52と、選択手段52によって選
択された単一の類似度の列の認識をパターンマッチング
法に基づいて行う認識手段53とを備えたことを特徴と
する。
【0020】請求項6に記載の発明は、特徴が異なる複
数の雑音の何れかに重畳されて間欠的に与えられる観測
パターンを取り込み、その観測パターンが与えられる有
効区間と反対に与えられない休止区間とを判別する判別
手段11と、特徴空間において観測パターンとその観測
パターンに重畳された雑音との和の特徴ベクトルを示す
標準パターンが予め登録された記憶手段41と、特徴空
間において複数の雑音の特徴ベクトルを示す雑音標準パ
ターンが予め登録された雑音標準記憶手段31と、判別
手段11によって判別された有効区間について、雑音標
準記憶手段31に登録された複数の雑音の雑音標準パタ
ーンと、記憶手段41に登録された標準パターンとの類
似度を個別に算出し、複数の第一の類似度を得る第一の
類似度算出手段61と、判別手段11によって判別され
た有効区間について、与えられる観測パターンと記憶手
段41に登録された標準パターンとの類似度を第二の類
似度として算出する第二の類似度算出手段43と、第一
の類似度算出手段61によって得られた複数の第一の類
似度と第二の類似度算出手段43によって算出された第
二の類似度との内、値が最大である単一の類似度を時系
列の順に対応付けて選択する選択手段62と、選択手段
62によって選択された単一の類似度の列の認識をパタ
ーンマッチング法に基づいて行う認識手段63とを備え
たことを特徴とする。
【0021】請求項7に記載の発明は、請求項1、2、
4、5の何れか1項に記載のパターン認識装置におい
て、第一の類似度算出手段は、特徴が定常と見なし得る
雑音の特徴を時系列の順に与えられる特徴の平滑化をは
かることにより求め、第一の類似度の算出に供すること
を特徴とする。請求項8に記載の発明は、請求項3また
は請求項6に記載のパターン認識装置において、雑音標
準記憶手段には、観測パターンに重畳され得る雑音の種
類に対応付けられて複数の雑音の特徴ベクトルを示す雑
音標準パターンが予め登録され、第一の類似度算出手段
は、判別手段によって判別された休止区間における雑音
の特徴に基づいてその雑音の種別を求め、雑音標準記憶
手段にその種別に対応付けられて登録された複数の雑音
標準パターンを複数の第一の類似度の算出に供すること
を特徴とする。
【0022】請求項9に記載の発明は、請求項1ないし
請求項8の何れか1項に記載のパターン認識装置におい
て、選択手段は、判別手段によって判別された休止区間
に限って単一または複数の第一の類似度と第二の類似度
との内、値が最大であるものを選択し、かつその判別手
段によって判別された有効区間についてはその第二の類
似度のみを選択することを特徴とする。
【0023】請求項1に記載の発明にかかわるパターン
認識装置では、判別手段11は雑音に重畳されて間欠的
に与えられる観測パターンの有効区間と休止区間とを判
別し、第一の類似度算出手段13はその有効区間につい
て、与えられる観測パターンと、先行する休止区間に与
えられた雑音の内、特徴が定常と見なし得る雑音との類
似度を第一の類似度として算出する。第二の類似度算出
手段14は同様の有効区間について、与えられる観測パ
ターンと記憶手段12に予め登録された標準パターンと
の類似度を第二の類似度として算出し、選択手段15は
上述した第一の類似度とその第二の類似度との内、値が
大きい単一の類似度を時系列の順に対応付けて選択す
る。
【0024】すなわち、観測パターンに雑音が重畳され
た状態であっても、複雑な演算を行うことなく類似度が
高く維持されるので、認識手段16はこのような類似度
の列の認識を確度高く行うことができる。
【0025】請求項2に記載の発明にかかわるパターン
認識装置では、判別手段11は雑音に重畳されて間欠的
に与えられる観測パターンの有効区間と休止区間とを判
別し、第一の類似度算出手段21はその有効区間につい
て、与えられる観測パターンと、先行する休止区間に与
えられた雑音の内、特徴が定常と見なし得る複数の雑音
との類似度を個別に算出することにより複数の第一の類
似度を得る。第二の類似度算出手段14は同様の有効区
間について、与えられる観測パターンと記憶手段12に
予め登録された標準パターンとの類似度を第二の類似度
として算出し、選択手段22はその第二の類似度と上述
した複数の第一の類似度との内、値が最大である単一の
類似度を時系列の順に対応付けて選択する。
【0026】すなわち、観測パターンに雑音が重畳さ
れ、かつその雑音の特徴が変化し得る場合であっても、
複雑な演算を行うことなく類似度が高く維持されるの
で、認識手段23はこのような類似度の列の認識をさら
に確度高く行うことができる。請求項3に記載の発明に
かかわるパターン認識装置では、判別手段11は雑音に
重畳されて間欠的に与えられる観測パターンの有効区間
と休止区間とを判別し、第一の類似度算出手段32はそ
の有効区間について、与えられる観測パターンと、雑音
標準記憶手段31に予め登録された複数の雑音の雑音標
準パターンとの類似度を個別に算出することにより、複
数の第一の類似度を得る。第二の類似度算出手段14は
同様の有効区間について、与えられる観測パターンと記
憶手段12に予め登録された標準パターンとの類似度を
第二の類似度として算出し、選択手段33はその第二の
類似度と上述した複数の第一の類似度との内、値が最大
である単一の類似度を時系列の順に対応付けて選択す
る。
【0027】すなわち、観測パターンに雑音が重畳さ
れ、かつその雑音の特徴が変化し得る場合であっても、
複雑な演算を行ったり第一の類似度の算出に要する複数
の雑音を度々収集することなく類似度が高く維持される
ので、観測パターン認識手段23はこのような類似度の
列の認識をさらに高い確度で効率的に行うことができ
る。
【0028】請求項4に記載の発明にかかわるパターン
認識装置では、請求項1に記載のパターン認識装置との
相違点は、特徴空間において観測パターンとその観測パ
ターンに重畳された雑音との和の特徴ベクトルを示す標
準パターンが予め記憶手段41に登録され、かつ第一の
類似度算出手段42が判別手段11によって判別された
有効区間について、先行する休止区間に与えられた雑音
の内、特徴が定常と見なし得る雑音と記憶手段41に予
め登録された標準パターンとの類似度を第一の類似度と
して算出する点にある。
【0029】しかし、第二の類似度算出手段43は同様
の有効区間について観測パターンと記憶手段41に登録
された標準パターンとの類似度を第二の類似度として算
出するので、請求項1に記載のパターン認識装置と同様
にして選択手段44によって選択される類似度は高い値
に維持され、かつ観測パターンに雑音が重畳された状態
であっても、複雑な演算を行うことなくこれらの類似度
の列の認識が確度高く行われる。
【0030】請求項5に記載の発明にかかわるパターン
認識装置では、請求項2に記載のパターン認識装置との
相違点は、特徴空間において観測パターンとその観測パ
ターンに重畳された雑音との和の特徴ベクトルを示す標
準パターンが予め記憶手段41に登録され、かつ第一の
類似度算出手段51が判別手段11によって判別された
有効区間について、先行する休止区間に与えられた雑音
の内、特徴が定常と見なし得る複数の雑音と、記憶手段
41に予め登録された標準パターンとの類似度を個別に
算出することにより複数の第一の類似度を得る点にあ
る。
【0031】しかし、第二の類似度算出手段43は同様
の有効区間について観測パターンと記憶手段41に登録
された標準パターンとの類似度を第二の類似度として算
出するので、請求項2に記載のパターン認識装置と同様
にして選択手段52によって選択される類似度は高い値
に維持され、かつ観測パターンに雑音が重畳されてその
雑音の特徴が変化し得る場合であっても、複雑な演算を
行うことなくこれらの類似度の列の認識が確度高く行わ
れる。
【0032】請求項6に記載の発明にかかわるパターン
認識装置では、請求項3に記載のパターン認識装置との
相違点は、特徴空間において観測パターンとその観測パ
ターンに重畳された雑音との和の特徴ベクトルを示す標
準パターンが予め記憶手段41に登録され、かつ第一の
類似度算出手段61が判別手段11によって判別された
有効区間について、雑音標準記憶手段31に予め登録さ
れた複数の雑音の雑音標準パターンと、記憶手段41に
予め登録された標準パターンとの類似度を個別に算出す
ることにより複数の第一の類似度を得る点にある。
【0033】しかし、第二の類似度算出手段43は、同
様の有効区間について観測パターンと記憶手段41に登
録された標準パターンとの類似度を第二の類似度として
算出する。したがって、請求項3に記載のパターン認識
装置と同様にして、観測パターンに雑音が重畳され、か
つその雑音の特徴が変化し得る場合であっても、複雑な
演算を行ったり第一の類似度の算出に要する複数の雑音
を度々収集することなく選択手段62によって選択され
る類似度は高い値に維持され、これらの類似度の列の認
識が確度高く行われる。
【0034】請求項7に記載の発明にかかわるパターン
認識装置では、請求項1、2、4、5に記載のパターン
認識装置において、第一の類似度算出手段は、定常と見
なし得る雑音について、特徴を時系列の順に平滑化する
ことにより求め、その求められた特徴を第一の類似度の
算出に供する。すなわち、このようにして求められた特
徴については、時系列の順に変動する成分が抑圧される
ので、請求項1、2、4、5に記載のパターン認識装置
に比べて認識率が向上する。
【0035】請求項8に記載の発明にかかわるパターン
認識装置では、請求項3、6に記載のパターン認識装置
において、雑音標準記憶手段には、観測パターンに重畳
され得る雑音の種類に対応付けられて複数の雑音の特徴
ベクトルを示す雑音標準パターンが予め登録される。ま
た、第一の類似度算出手段は、判別手段によって判別さ
れた休止区間における雑音の特徴に基づいてその雑音の
種別を求め、かつ雑音標準記憶手段にその種別に対応付
けられて登録された複数の雑音標準パターンを複数の第
一の類似度の算出に供する。
【0036】すなわち、これらの第一の類似度は、休止
区間に与えられた雑音の特徴を最も精度よく示す雑音標
準パターンに基づいて算出されるので、請求項3、6に
記載のパターン認識装置に比べて認識率が向上する。請
求項9に記載の発明にかかわるパターン認識装置では、
請求項1〜8に記載のパターン認識装置において、選択
手段は、判別手段によって判別された休止区間に限って
単一または複数の第一の類似度と第二の類似度との内、
値が最大であるものを選択し、かつ同様にして判別され
た有効区間についてはその第二の類似度のみを選択す
る。
【0037】すなわち、有効区間については第一の類似
度を算出する処理の省略が可能であり、かつ上述した選
択を行う処理は休止区間のみに行われるので、平均的な
処理量の低減がはかられ、かつこれらの有効区間と休止
区間とを識別する基準である閾値に誤差がある場合であ
っても高い認識率が確保される。
【0038】
【発明の実施の形態】以下、図面に基づいて本発明の実
施形態について詳細に説明する。
【0039】請求項1〜3、7〜9に記載の発明に対応
した実施形態と図11に示す従来例との構成の相違点
は、DSP73が行う処理の手順にあり、ハードウエア
の構成についてはその従来例と同様であるから、ここで
はその説明を省略する。請求項1〜3、7〜9に記載の
発明に対応した実施形態と図1に示すブロック図との対
応関係については、DSP73は判別手段11、第一の
類似度算出手段13、21、32、第二の類似度算出手
段14、選択手段15、22、33および認識手段1
6、23、34に対応し、メモリ74は記憶手段12お
よび雑音標準記憶手段31に対応する。
【0040】図3は、請求項1に記載の発明に対応した
実施形態の動作フローチャートである。図4は、請求項
1に記載の発明に対応した実施形態の動作を説明する図
である。以下、図3、図4および図11を参照して請求
項1に記載の発明に対応した実施形態の動作を説明す
る。
【0041】メモリ74には、従来例と同様の標準パタ
ーン(環境雑音は含まれない。)が予め登録される(図
4(1))。一方、DSP73は、A/D変換器72を介し
て与えられるディジタル信号について非音声区間の識別
に供されるべき閾値(ここでは、簡単のためレベルのみ
について設定されると仮定する。)が予め与えられ、そ
の閾値に基づいて従来例と同様にして非音声区間に属す
ると識別されたフレーム(以下、「非音声フレーム」と
いう。)については、その非音声フレームに後続してレ
ベルが閾値を上回るフレーム(以下、「音声フレーム」
という。)との間における類似度(以下、「第一の類似
度」という。)を算出する(図3(1)、図4(2))。
【0042】したがって、第一の類似度については、こ
のような算出の対象となった音声フレームにおいて音声
に重畳されている環境雑音の特徴が定常である限りにお
いて、これらの音声フレームに含まれる音声と環境雑音
との間における類似度を近似するものと見なされ得る。
また、DSP73は、音声フレームについては、メモリ
74に予め登録された標準パターン(ここでは、簡単の
ため、単一であると仮定する。)との間における類似度
(以下、「第二の類似度」という。)を算出する(図3
(2)、図4(3))。
【0043】さらに,DSP73は、このようにして算
出された第一の類似度と第二の類似度との内、値が大き
い一方を選択して(図4(4))DPマッチングの対象と
し、かつ後続する個々の音声フレームについても同様の
処理を反復する。
【0044】このように本実施形態によれば、標準パタ
ーンと実際の環境雑音との内、音声フレームに対して高
い類似度を与えるものが確実にDPマッチングの対象と
なるので、従来例に比べてハードウエアの規模の増大や
演算手順の複雑化を来すことなく、認識率が高く維持さ
れる。以下、請求項2、7に記載の発明に対応した実施
形態について説明する。
【0045】本実施形態と請求項1に記載の発明に対応
した実施形態との相違点は、DSP73が行う処理の手
順とメモリ74に予め登録された標準パターンの内容と
にある。図5は、請求項2、7に記載の発明に対応した
実施形態の動作フローチャートである。
【0046】図6は、請求項2、7に記載の発明に対応
した実施形態の動作を説明する図である。以下、図5、
図6および図11を参照して本実施形態の動作を説明す
る。メモリ74には、請求項1に記載の発明に対応した
実施形態と同様にして標準パターン(環境雑音は含まれ
ない。)が予め登録される。
【0047】一方、DSP73は、請求項1に記載の発
明に対応した実施形態と同様にして、A/D変換器72
を介して与えられるディジタル信号について非音声区間
の識別に供されるべき閾値が予め与えられ、その閾値に
基づいて検出された非音声フレームの内、最新のN個を
図示されないメモリに逐次蓄積する(図5(1))。さら
に、DSP73は、レベルがその閾値より高い音声フレ
ームを検出すると、その音声フレームについて、上述し
たように蓄積されたN個の非音声フレームとの類似度
(以下、これらのを一括して「第一の類似度」とい
う。)を個別に算出し(図5(2))、かつメモリ74に予
め登録された標準パターン(ここでは、簡単のため、単
一であると仮定する。)との間における類似度(以下、
「第二の類似度」という。)を算出する(図5(3))。
【0048】また、DSP73は、図6に示すように、
このようにして求められたN個の第一の類似度と第二の
類似度との内、値が最大であるものを選択して(図5
(4))DPマッチングの対象とし、以下、後続する個々の
音声フレームについても、同様の処理を反復する。この
ように本実施形態によれば、個々の音声フレームについ
て、その音声フレームに先行するN個の非音声フレーム
と標準パターンとの内、高い類似度を与えるものが確実
にDPマッチングの対象として与えられるので、環境雑
音が定常であると見なされ得ない場合においても、請求
項1に記載の発明に対応した実施形態と同様にして従来
例よりハードウエアの規模の増大や演算手順の複雑化を
来すことなく、認識率が高く維持される。
【0049】以下、請求項3、8に記載の発明に対応し
た実施形態について説明する。本実施形態と上述した請
求項2、7に記載の発明に対応した実施形態との相違点
は、DSP73が行う処理の手順と後述するようにメモ
リ74に登録される情報の形式とにある。図7は、請求
項3、8に記載の発明に対応した実施形態の動作フロー
チャートである。
【0050】以下、図7および図11を参照して本実施
形態の動作を説明する。メモリ74には、環境雑音が重
畳されない標準パターンに併せて、実際に非音声フレー
ムとして与えられ得るN個の雑音フレームが予め登録さ
れる。一方、DSP73は、A/D変換器72を介して
与えられるディジタル信号について非音声区間の識別に
供されるべき閾値が予め与えられ、その閾値に基づいて
請求項1、2に記載の実施形態と同様にして音声フレー
ムが検出されると、その音声フレームについて、上述し
たようにメモリ74に登録されたN個の雑音フレームと
の類似度(以下、これらのを一括して「第一の類似度」
という。)を個別に算出し(図7(1))、かつメモリ74
に予め登録された標準パターン(ここでは、簡単のた
め、単一であると仮定する。)との間における類似度
(以下、「第二の類似度」という。)を算出する(図7
(2))。
【0051】また、DSP73は、このようにして求め
られたN個の第一の類似度と第二の類似度との内、値が
最大であるものを選択して(図7(3))適用することによ
りDPマッチングを行い、以下、後続する個々の音声フ
レームについても、同様の処理を反復する。このように
本実施形態によれば、個々の音声フレームについて、そ
の音声フレームに先行する非音声フレームについて適宜
演算を施すことなく、請求項1、2に記載の発明に対応
した実施形態と同様にして大きな値の類似度が得られる
ので、環境雑音の特徴が既知であるならば、ハードウエ
アの規模の増大や演算手順の複雑化を来すことなく認識
率が高く維持される。
【0052】以下、請求項4〜8に記載の発明に対応し
た実施形態について説明する。本実施形態と請求項1〜
3に記載の発明に対応した実施形態との相違点は、図8
に点線枠で示すように環境雑音が予め収録されて音声の
標準パターンと共にメモリ74に登録され、かつDSP
73が後述する手順に基づいて演算を行う点にある。
【0053】なお、請求項4〜9に記載の発明に対応し
た実施形態と図2に示すブロック図との対応関係につい
ては、DSP73は判別手段11、第一の類似度算出手
段42、51、61、第二の類似度算出手段43、選択
手段44、52、62および認識手段45、53、63
に対応し、メモリ74は雑音標準記憶手段31および記
憶手段41に対応する。
【0054】以下、図8および図11を参照して本実施
形態の動作を説明する。DSP73は、図4に点線の矢
印で示すように、上述したようにメモリ74に登録され
た標準パターンと、その標準パターンと共に登録された
環境雑音との間の類似度を第一の類似度として求める
(図8(1))点を除いて、請求項1、2に記載の発明に対
応した実施形態と同様の手順に基づく処理を行う(図4
(3)、(4)、図8(2)、(3))。
【0055】このように本実施形態によれば、メモリ7
4に標準パターンが登録される際に音声に併せて環境雑
音についても収録、解析、その他の処理が一括して予め
行われ、かつDSP73は、音声認識の対象として与え
られる音声とその音声に重畳された環境雑音とをフレー
ム単位に峻別する処理を行うことなく、請求項1、2に
記載の発明に対応した実施形態と同様にして音声認識を
行うことができる。
【0056】また、本実施形態では、標準パターンに含
まれるべき環境雑音の成分については、音声認識の対象
となる音声と共に施されるべき濾波処理が上述したその
他の処理として予め施すことが可能であるから、このよ
うな成分が標準パターンに含まれない構成に比べて、多
様な環境雑音と濾波処理の形態とに柔軟に適応すること
が可能である。
【0057】なお、請求項1〜6に記載の発明に対応し
た実施形態では、音声認識に際してDSP73が適宜第
一の類似度を算出しているが、本発明はこのような演算
の手順に限定されず、例えば、環境雑音の特徴が定常的
であることが保証され、かつ算出された第一の類似度が
メモリ74に確実に保持されるならば、個々の音声フレ
ームについて第二の類似度のみを適宜求めることにより
音声認識を行うことも可能である。
【0058】また、請求項1、2、4、5に記載の発明
に対応した実施形態では、N個の非音声フレームが音声
フレームに直近の先行する非音声フレームから選択され
ているが、本発明はこのような構成に限定されず、例え
ば、図9に示すように、これらの非音声フレームは移動
平均法や指数平滑法その他の積分処理に基づいて求めら
れてもよい。
【0059】さらに、請求項3、6に記載の発明に対応
した実施形態では、メモリ74に予め登録された雑音フ
レームの数Nが何ら示されていないが、例えば、その数
Nが大きいために上述した第一の類似度の演算に所要す
る時間が過大となる場合には、単一または複数の非音声
フレームの集合に対して与えられるレベル、周波数スペ
クトラムその他の特徴に予め個別に対応付けられた複数
の雑音フレームがメモリ74に登録され、これらの雑音
フレームの内、実際に与えられた非音声フレームの特徴
に対応したものを選択して第一の類似度の算出に供する
ことにより、演算所要時間の短縮をはかることも可能で
ある。
【0060】以下、請求項9に記載の発明に対応した実
施形態について説明する。本実施形態と請求項1、2に
記載の発明に対応した実施形態との相違点は、DSP7
3が行う処理の手順にある。図10は、請求項9に記載
の発明に対応した実施形態の動作を説明する図である。
【0061】以下、図4、図10および図11を参照し
て本実施形態の動作を説明する。メモリ74には、環境
雑音について標準パターンが予め登録される。一方、D
SP73は、A/D変換器72を介して与えられるディ
ジタル信号について非音声区間の識別に供されるべき閾
値(ここでは、簡単のためレベルのみについて設定され
ると仮定する。)が予め与えられ、その閾値に基づいて
従来例と同様にして音声区間に属すると識別されたフレ
ームについては、そのフレームと上述した標準パターン
との類似度を音声区間類似度(図10(a))として算出す
る。
【0062】また、DSP73は、レベルが同様の閾値
を下回る期間(フレームの数)を逐次監視し、その長さ
が予め設定された上限値を下回る期間については既述の
非音声区間として識別するが、反対に超える期間につい
ては無効期間(長期間に亘って音声が与えられない。)
として識別する。DSP73は、このような非音声区間
に属すると識別されたフレームについては、そのフレー
ムに先行する無効期間のフレームとの間における類似度
を第一の類似度として算出する。
【0063】さらに、DSP73は、上述した非音声フ
レームについては、メモリ74に予め登録された標準パ
ターン(ここでは、簡単のため、単一であると仮定す
る。)との間における類似度を第二の類似度として算出
し、その第二の類似度と先行して求められた第一の類似
度とを比較して両者の内、値が大きい一方を非音声区間
類似度(図10(b))として求めると共に、後続する個々
のフレームについても順次同様の処理を反復する。
【0064】また、DSP73は、このようにして求め
られた音声区間類似度と非音声区間類似度との列(図1
0(c))にDPマッチングの処理を施すことにより、音声
認識を行う。このように本実施形態によれば、音声区間
の音声認識に既述の音声区間類似度が適用されるので、
上述した第一の類似度を算出する処理が非音声区間のみ
に限定されて処理量が低減される。
【0065】また、非音声区間の音声認識については第
一の類似度と第二の類似度との内、値が大きい非音声区
間類似度が適用されるので、上述した閾値に誤差が含ま
れる場合であっても認識率が高く維持される。なお、本
実施形態では、請求項1に記載の発明に対応した実施形
態に本発明が適用されているが、本発明は、請求項2〜
8に記載の発明に対応した実施形態についても同様に適
用可能である。
【0066】また、本実施形態では、第一の類似度を算
出するために環境雑音を示すフレームが請求項1に記載
の発明に対応した実施形態と同様にして求められている
が、本発明はこのような構成に限定されず、その環境雑
音の特徴が定常であると見なされ得る場合には、例え
ば、予め収録されて標準パターンと共にメモリ74に登
録された環境雑音を適用することにより同様にして第一
の類似度を算出することも可能である。
【0067】さらに、本実施形態では、閾値の算出方法
が何ら示されていないが、このような算出方法について
は、例えば、環境雑音が有する特定の特徴の平均をその
環境雑音が定常であると見なされ得る程度に長い期間に
亘って求め、その結果に所望のマージンを加算すること
により求めることができるが、認識率の低下が許容可能
な範囲に抑えられる限り如何なる方法に基づいて算出さ
れてもよい。
【0068】また、本実施形態では、音声のレベルが閾
値を下回る期間の長さに基づいて非音声区間と無効期間
との峻別がはかられているが、このような峻別の基準に
ついては、例えば、予め両者に対応して設定された閾値
であってもよい。なお、上述した各実施形態では、第一
の類似度と第二の類似度とを算出する演算がDPマッチ
ングにかかわる処理の過程で並行して行われているが、
本発明はこのような演算手順に限定されず、例えば、こ
れらの類似度が一括して算出された後にDPマッチング
が行われてもよい。
【0069】また、上述した各実施形態では、第一の類
似度および第二の類似度がこれらの大小関係の判別の対
象として並行して与えられたり、DPマッチングの演算
対象となる類似度の列が与えられるために搭載されるべ
きメモリについては何ら記述されていないが、このよう
なメモリについては、演算の手順や演算対象の情報量の
最大値に適応したものであればよい。
【0070】さらに、上述した各実施形態では、フレー
ム単位に分割された音声信号についてパワーが特徴量と
して求められ、特徴空間におけるその特徴量のパターン
認識が行われているが、本発明はこのような特徴量に限
定されず、例えば、フィルタバンクやフーリエ変換に基
づいて求められた周波数スペクトラム、ケプストラム、
自己相関関数、線形予測分析に基づくスペクトラム包絡
その他の如何なる特徴量が適用されてもよい。
【0071】また、上述した各実施形態では、フレーム
の長さが何ら示されていないが、確実に特徴量が得ら
れ、かつこれらの特徴量に基づいてパターン認識が行わ
れるならば、その長さは如何なるものであってもよい。
【0072】さらに、上述した各実施形態形態では、請
求項1〜9に記載の発明が何れも音声認識に適用されて
いるが、これらの発明は、このような音声認識に限定さ
れず、特徴量が確実に与えられるならば、例えば、文
字、図形、画像(3次元画像を含む。)、動画、波形そ
の他にも同様にして適用可能である。また、請求項1、
2、4、5、7〜9に記載の発明に対応した実施形態で
は、環境雑音の定常性を利用して音声フレームに直近の
先行する非音声フレームがその環境雑音に代えて適用さ
れているが、本発明はこのような構成に限定されず、例
えば、音響的に環境雑音と音声とが分離されて与えられ
るならば、その環境雑音の内、個々の音声フレームと並
行して与えられるものが同様の非音声フレームとして抽
出されてもよい。
【0073】
【発明の効果】上述したように請求項1、4に記載の発
明では、観測パターンに雑音が重畳された状態であって
も、複雑な演算を行うことなくパターン認識が確度高く
行われる。請求項2、5に記載の発明では、観測パター
ンに雑音が重畳され、かつその雑音の特徴が変化し得る
場合であっても、複雑な演算を行うことなく認識率が向
上する。
【0074】請求項3、6に記載の発明では、観測パタ
ーンに雑音が重畳され、かつその雑音の特徴が変化し得
る場合であっても、複雑な演算を行ったり第一の類似度
の算出に要する複数の雑音を度々収集することなく認識
率と認識の効率とが高められる。請求項7に記載の発明
では、雑音の特徴が変動する場合であっても、請求項
1、2、4、5に記載のパターン認識装置に比べて認識
率が向上する。
【0075】請求項8に記載の発明では、請求項3、6
に記載のパターン認識装置に比べて認識率が向上する。
請求項9に記載の発明では、平均的な処理量の低減がは
かられ、かつ有効区間と休止区間との識別に供される閾
値に誤差がある場合であっても高い認識率が確保され
る。
【0076】したがって、これらの発明が適用されたパ
ターン認識装置では、ハードウエアの規模やコストが大
幅に増加することなく観測パターンに雑音が重畳される
環境の下で応答性および信頼度が高められ、パターン認
識の適用分野の拡大が可能となる。
【図面の簡単な説明】
【図1】請求項1〜3、7〜9に記載の発明の原理ブロ
ック図である。
【図2】請求項4〜9に記載の発明の原理ブロック図で
ある。
【図3】請求項1に記載の発明に対応した実施形態の動
作フローチャートである。
【図4】請求項1に記載の発明に対応した実施形態の動
作を説明する図である。
【図5】請求項2、7に記載の発明に対応した実施形態
の動作フローチャートである。
【図6】請求項2、7に記載の発明に対応した実施形態
の動作を説明する図である。
【図7】請求項3、8に記載の発明に対応した実施形態
の動作フローチャートである。
【図8】請求項4〜6に記載の発明に対応した実施形態
の動作を説明する図である。
【図9】環境雑音の変換処理を説明する図である。
【図10】請求項9に記載の発明に対応した実施形態の
動作を説明する図である。
【図11】従来の音声認識装置の構成例を示す図であ
る。
【図12】第一の方式に基づく処理の過程を示す図であ
る。
【図13】第二の方式に基づく処理の過程を示す図であ
る。
【図14】第三の方式に基づく処理の過程を示す図であ
る。
【図15】第三の方式が適用された従来例の課題を説明
する図である。
【符号の説明】
11 判別手段 12,41 記憶手段 13,21,32,42,51,61 第一の類似度算
出手段 14,43 第二の類似度算出手段 15,22,33,44,52,62 選択手段 16,23,34,45,53,63 認識手段 31 雑音標準記憶手段 71 マイク 72 A/D変換器 73 DSP 74 メモリ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 西池 理香 神奈川県川崎市中原区上小田中4丁目1 番1号 富士通株式会社内 (72)発明者 山崎 泰 神奈川県川崎市中原区上小田中4丁目1 番1号 富士通株式会社内 (56)参考文献 特開 平6−110491(JP,A) 特開 昭59−224900(JP,A) 特開 平6−289891(JP,A) 特開 平6−242795(JP,A) 特開 平5−73088(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 15/04 G10L 11/02

Claims (9)

    (57)【特許請求の範囲】
  1. 【請求項1】 雑音に重畳されて間欠的に与えられる観
    測パターンを取り込み、その観測パターンが与えられる
    有効区間と反対に与えられない休止区間とを判別する判
    別手段と、 特徴空間において前記観測パターンの特徴ベクトルを示
    す標準パターンが予め登録された記憶手段と、 前記判別手段によって判別された有効区間について、与
    えられる観測パターンと、先行する休止区間に前記観測
    パターンに重畳された雑音の内、特徴が定常と見なし得
    る雑音との類似度を第一の類似度として算出する第一の
    類似度算出手段と、 前記判別手段によって判別された有効区間について、与
    えられる観測パターンと前記記憶手段に登録された標準
    パターンとの類似度を第二の類似度として算出する第二
    の類似度算出手段と、 前記第一の類似度算出手段によって算出された第一の類
    似度と前記第二の類似度算出手段によって算出された第
    二の類似度との内、値が大きい単一の類似度を時系列の
    順に対応付けて選択する選択手段と、 前記選択手段によって選択された単一の類似度の列の認
    識をパターンマッチング法に基づいて行う認識手段とを
    備えたことを特徴とするパターン認識装置。
  2. 【請求項2】 雑音に重畳されて間欠的に与えられる観
    測パターンを取り込み、その観測パターンが与えられる
    有効区間と反対に与えられない休止区間とを判別する判
    別手段と、 特徴空間において前記観測パターンの特徴ベクトルを示
    す標準パターンが予め登録された記憶手段と、 前記判別手段によって判別された有効区間について、与
    えられる観測パターンと、先行する休止区間に前記観測
    パターンに重畳された雑音の内、特徴が定常と見なし得
    る複数の雑音との類似度を個別に算出し、複数の第一の
    類似度を得る第一の類似度算出手段と、 前記判別手段によって判別された有効区間について、与
    えられる観測パターンと前記記憶手段に登録された標準
    パターンとの類似度を第二の類似度として算出する第二
    の類似度算出手段と、 前記第一の類似度算出手段によって得られた複数の第一
    の類似度と前記第二の類似度算出手段によって算出され
    た第二の類似度との内、値が最大である単一の類似度を
    時系列の順に対応付けて選択する選択手段と、 前記選択手段によって選択された単一の類似度の列の認
    識をパターンマッチング法に基づいて行う認識手段とを
    備えたことを特徴とするパターン認識装置。
  3. 【請求項3】 特徴が異なる複数の雑音の何れかに重畳
    されて間欠的に与えられる観測パターンを取り込み、そ
    の観測パターンが与えられる有効区間と反対に与えられ
    ない休止区間とを判別する判別手段と、 特徴空間において前記観測パターンの特徴ベクトルを示
    す標準パターンが予め登録された記憶手段と、 特徴空間において前記複数の雑音の特徴ベクトルを示す
    雑音標準パターンが予め登録された雑音標準記憶手段
    と、 前記判別手段によって判別された有効区間について、与
    えられる観測パターンと前記雑音標準記憶手段に登録さ
    れた複数の雑音の雑音標準パターンとの類似度を個別に
    算出し、複数の第一の類似度を得る第一の類似度算出手
    段と、 前記判別手段によって判別された有効区間について、与
    えられる観測パターンと前記記憶手段に登録された標準
    パターンとの類似度を第二の類似度として算出する第二
    の類似度算出手段と、 前記第一の類似度算出手段によって得られた複数の第一
    の類似度と前記第二の類似度算出手段によって算出され
    た第二の類似度との内、値が最大である単一の類似度を
    時系列の順に対応付けて選択する選択手段と、 前記選択手段によって選択された単一の類似度の列の認
    識をパターンマッチング法に基づいて行う認識手段とを
    備えたことを特徴とするパターン認識装置。
  4. 【請求項4】 雑音に重畳されて間欠的に与えられる観
    測パターンを取り込み、その観測パターンが与えられる
    有効区間と反対に与えられない休止区間とを判別する判
    別手段と、 特徴空間において前記観測パターンとその観測パターン
    に重畳された雑音との和の特徴ベクトルを示す標準パタ
    ーンが予め登録された記憶手段と、 前記判別手段によって判別された有効区間について、先
    行する休止区間に与えられた雑音の内、特徴が定常と見
    なし得る雑音と前記記憶手段に登録された標準パターン
    との類似度を第一の類似度として算出する第一の類似度
    算出手段と、 前記判別手段によって判別された有効区間について、与
    えられる観測パターンと前記記憶手段に登録された標準
    パターンとの類似度を第二の類似度として算出する第二
    の類似度算出手段と、 前記第一の類似度算出手段によって算出された第一の類
    似度と前記第二の類似度算出手段によって算出された第
    二の類似度との内、値が大きい単一の類似度を時系列の
    順に対応付けて選択する選択手段と、 前記選択手段によって選択された単一の類似度の列の認
    識をパターンマッチング法に基づいて行う認識手段とを
    備えたことを特徴とするパターン認識装置。
  5. 【請求項5】 雑音に重畳されて間欠的に与えられる観
    測パターンを取り込み、その観測パターンが与えられる
    有効区間と反対に与えられない休止区間とを判別する判
    別手段と、 特徴空間において前記観測パターンとその観測パターン
    に重畳された雑音との和の特徴ベクトルを示す標準パタ
    ーンが予め登録された記憶手段と、 前記判別手段によって判別された有効区間について、先
    行する休止区間に与えられた雑音の内、特徴が定常と見
    なし得る複数の雑音と前記記憶手段に登録された標準パ
    ターンとの類似度を個別に算出し、複数の第一の類似度
    を得る第一の類似度算出手段と、 前記判別手段によって判別された有効区間について、与
    えられる観測パターンと前記記憶手段に登録された標準
    パターンとの類似度を第二の類似度として算出する第二
    の類似度算出手段と、 前記第一の類似度算出手段によって得られた複数の第一
    の類似度と前記第二の類似度算出手段によって算出され
    た第二の類似度との内、値が最大である単一の類似度を
    時系列の順に対応付けて選択する選択手段と、 前記選択手段によって選択された単一の類似度の列の認
    識をパターンマッチング法に基づいて行う認識手段とを
    備えたことを特徴とするパターン認識装置。
  6. 【請求項6】 特徴が異なる複数の雑音の何れかに重畳
    されて間欠的に与えられる観測パターンを取り込み、そ
    の観測パターンが与えられる有効区間と反対に与えられ
    ない休止区間とを判別する判別手段と、 特徴空間において前記観測パターンとその観測パターン
    に重畳された雑音との和の特徴ベクトルを示す標準パタ
    ーンが予め登録された記憶手段と、 特徴空間において前記複数の雑音の特徴ベクトルを示す
    雑音標準パターンが予め登録された雑音標準記憶手段
    と、 前記判別手段によって判別された有効区間について、前
    記雑音標準記憶手段に登録された複数の雑音の雑音標準
    パターンと、前記記憶手段に登録された標準パターンと
    の類似度を個別に算出し、複数の第一の類似度を得る第
    一の類似度算出手段と、 前記判別手段によって判別された有効区間について、与
    えられる観測パターンと前記記憶手段に登録された標準
    パターンとの類似度を第二の類似度として算出する第二
    の類似度算出手段と、 前記第一の類似度算出手段によって得られた複数の第一
    の類似度と前記第二の類似度算出手段によって算出され
    た第二の類似度との内、値が最大である単一の類似度を
    時系列の順に対応付けて選択する選択手段と、 前記選択手段によって選択された単一の類似度の列の認
    識をパターンマッチング法に基づいて行う認識手段とを
    備えたことを特徴とするパターン認識装置。
  7. 【請求項7】 請求項1、2、4、5の何れか1項に記
    載のパターン認識装置において、 第一の類似度算出手段は、 特徴が定常と見なし得る雑音の特徴を時系列の順に与え
    られる特徴の平滑化をはかることにより求め、第一の類
    似度の算出に供することを特徴とするパターン認識装
    置。
  8. 【請求項8】 請求項3または請求項6に記載のパター
    ン認識装置において、 雑音標準記憶手段には、 観測パターンに重畳され得る雑音の種類に対応付けられ
    て複数の雑音の特徴ベクトルを示す雑音標準パターンが
    予め登録され、 第一の類似度算出手段は、 判別手段によって判別された休止区間における雑音の特
    徴に基づいてその雑音の種別を求め、前記雑音標準記憶
    手段にその種別に対応付けられて登録された複数の雑音
    標準パターンを複数の第一の類似度の算出に供すること
    を特徴とするパターン認識装置。
  9. 【請求項9】 請求項1ないし請求項8の何れか1項に
    記載のパターン認識装置において、 選択手段は、 判別手段によって判別された休止区間に限って単一また
    は複数の第一の類似度と第二の類似度との内、値が最大
    であるものを選択し、かつその判別手段によって判別さ
    れた有効区間についてはその第二の類似度のみを選択す
    ることを特徴とするパターン認識装置。
JP29638996A 1996-11-08 1996-11-08 パターン認識装置 Expired - Fee Related JP3450972B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP29638996A JP3450972B2 (ja) 1996-11-08 1996-11-08 パターン認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP29638996A JP3450972B2 (ja) 1996-11-08 1996-11-08 パターン認識装置

Publications (2)

Publication Number Publication Date
JPH10143188A JPH10143188A (ja) 1998-05-29
JP3450972B2 true JP3450972B2 (ja) 2003-09-29

Family

ID=17832918

Family Applications (1)

Application Number Title Priority Date Filing Date
JP29638996A Expired - Fee Related JP3450972B2 (ja) 1996-11-08 1996-11-08 パターン認識装置

Country Status (1)

Country Link
JP (1) JP3450972B2 (ja)

Also Published As

Publication number Publication date
JPH10143188A (ja) 1998-05-29

Similar Documents

Publication Publication Date Title
US5583961A (en) Speaker recognition using spectral coefficients normalized with respect to unequal frequency bands
JP4177755B2 (ja) 発話特徴抽出システム
EP1159737B9 (en) Speaker recognition
KR101616112B1 (ko) 음성 특징 벡터를 이용한 화자 분리 시스템 및 방법
US11611581B2 (en) Methods and devices for detecting a spoofing attack
US6865529B2 (en) Method of estimating the pitch of a speech signal using an average distance between peaks, use of the method, and a device adapted therefor
JP2000330587A (ja) 音声認識方法および装置
Quast et al. Robust pitch tracking in the car environment
JP2002366192A (ja) 音声認識方法及び音声認識装置
JP2000310993A (ja) 音声検出装置
JP3450972B2 (ja) パターン認識装置
JPH05119792A (ja) 音声認識装置
JP2992324B2 (ja) 音声区間検出方法
JP3091537B2 (ja) 音声パターン作成方法
US20010029447A1 (en) Method of estimating the pitch of a speech signal using previous estimates, use of the method, and a device adapted therefor
JP2502880B2 (ja) 音声認識方法
JPH0556520B2 (ja)
JP3484559B2 (ja) 音声認識装置および音声認識方法
CN116229988A (zh) 一种电力调度系统人员声纹识别鉴权方法、系统及装置
WO1997037345A1 (en) Speech processing
JP2021162685A (ja) 発話区間検知装置、音声認識装置、発話区間検知システム、発話区間検知方法及び発話区間検知プログラム
KR950002704B1 (ko) 음성인식 시스템의 유사음성 구분장치 및 구분방법
JP3008404B2 (ja) 音声認識装置
JPH0424717B2 (ja)
JPH0311479B2 (ja)

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030701

LAPS Cancellation because of no payment of annual fees