JPH03206499A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH03206499A
JPH03206499A JP2212831A JP21283190A JPH03206499A JP H03206499 A JPH03206499 A JP H03206499A JP 2212831 A JP2212831 A JP 2212831A JP 21283190 A JP21283190 A JP 21283190A JP H03206499 A JPH03206499 A JP H03206499A
Authority
JP
Japan
Prior art keywords
section
parameter
recognition
speech
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2212831A
Other languages
English (en)
Other versions
JP2969862B2 (ja
Inventor
Yumi Takizawa
滝沢 由実
Masahiro Hamada
正宏 浜田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to EP19900118858 priority Critical patent/EP0421341B1/en
Priority to DE1990633000 priority patent/DE69033000T2/de
Publication of JPH03206499A publication Critical patent/JPH03206499A/ja
Priority to US07/983,246 priority patent/US5361324A/en
Application granted granted Critical
Publication of JP2969862B2 publication Critical patent/JP2969862B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明&友 音声認識装置に関するものであも従来の技
術 近紙 音声認識技術の発達と共に 音声認識装置が様々
の分野で実用化されようとしており、実用化するために
Cヨ  認識装置を実用する上での様々の問題点を解決
する必要があも 実用下でGEL  装置の使用状況が様々に変化しこの
変化によって発声が変動する(例えば 周囲騒音が大き
くなると大声で発声するために発声が変動ずん 長時間
装置を使用していると発声者が疲労してくるために発声
が変動すん 発声者が代わると発声が変動ずん など)
。そのために 装置が標準音声を学習した時と使用する
時との状況が異なると、標準音声が上記変動を吸収でき
哄誤認識してしまうという点が大きな問題点の1つであ
も 上記問題点を解決するために あらかじめ予測できる全
ての変動パターンを装置に学習させておく方法がとられ
ている爪 全ての発声変動を学習させるために(よ 学
習時阻 装置の容監 使用者の手間が膨大となり実用的
ではな(ち そこで、発声変動を使用する度に計算し 音声の特徴パ
ラメータを分析する際に 変動に対応して分析条件を変
化させる方法が近年提案されていも この方法により、
学習時限 装置の容量 使用者の手間が少なく、しかも
発声の変動を吸収することができるようになん 以不 図面を参照しなが転 上述したような従来の音声
認識装置について説明を行う。ここでζ戴標準音声を登
録することで上記学習を行う登録型音声認識装置におい
て、発声が標準音声登録時と認識時で変化する1つの例
として、環境騒音の変化により発声状態が変動する場合
を説明すも第5図は 従来の単語音声認識装置のブロッ
ク図であも 1は信号入力端+, 20はパワー測定a
 21は分析(2)敵 22は母音判定臥 23は分析
(3)K  8は照合敵 9は認識結果出力端子、 1
0は標準音声保管用バッファ、 24、25、 26は
スイッチであも 以上のように構威された音声認識装置
について以下その動作について説明すも まず標準音声登録時にC上  音声入力直前の環境騒音
が信号入力端子lより人力され 入力パワー測定部20
で環境騒音のパワーが算出され パワーが一定閾値P1
以上の場合(上 周囲状況が登録時にふさわしくないと
みなし 登録を中断ずん環境騒音のパワーが一定閾値P
1以下の場合には 信号声入力端子lより入力された標
準音声用信号は分析(2)部2lに入力され 特徴パラ
メータが算出されも この際に分析(2)部で(よまず
入力信号を Fl(z)=1−0.9375xZ−1  ・・・式(
2)で表されるフィルタF1に通し 周波数の高域戒分
を強調した後分析を行う。分析方法としてたとえばLP
Cケプストラム法を用いれば所定の個数のLPCケプス
トラム係数が特徴パラメータとして算出されも そして
パワーが所定の音声区間検出閾値以上の場色 相当する
特徴パラメータを標準音声とみなしバッファlOに保管
すも標準音声用信号が入力されてからの上記の処理を認
識すべき全単語について行い、 登緑を終了する。
次に認識時にC上  まず登録時と同様に環境騒音のパ
ワーが測定された眞 信号入力端子lより音声信号が入
力されも 環境騒音パワーが一定閾値Pl以下の場合にj!登録時
と同様に分析(2)部21で特徴パラメータが算出され
 パラメータは照合部8に入力されも 照合部8で標準
音声と入力音声との照合を行八 最短距離を示す単語を
認識結果として認識結果出力端子9より出力すも 環境騒音パワーが一定閾値P1以上の場合に(上バヮー
測定部2でフレームごとの信号のパワーが算出され 騒
音パワーと信号パワーは母音判定部22に入力されも 
母音判定部22で(上 次の2つの条件で母音判定を行
う。
[11信号レベルは雑音レベルに一定値Cを加えたレベ
ル以上であも [2]上記条件[11を満たすフレームが5フレーム以
上継続していも 上記[11  [2]の条件を満足するフレームを母音
部と判断し 母音部の場合は入力信号を分析(3)部2
3に 母音部以外の場合には分析(2)部2lに入力す
も 母音部以外のフレームに対して{よ 登録時と同棟 上
記〔l〕式で表されるフィルタで高域強調を行い特徴パ
ラメータを算出すも 母音部と判定されたフレームに対
して(友 分析(3)部23″′QS下記式(3〉で表
されるフィルタを用いて高域強調を行う。
F2(z)=1−0.  6375xZ−1  −・・
式(3)上記フィルタF2はフィルタFlに比べて高域
強調の度合が少なく、傾きの緩やかなものであも環境騒
音が大きくなると話者の発声状態が変化し音声の高域周
波数或分が強くなも そのため上記高域強調フィルタの
傾き(よ 雑音の小さい場合に比べて緩やかにする必要
があも フィルタ通過後、登録時同様特徴パラメータを
算出すも 上記特徴パラメータは照合部8に入力され 環境騒音パ
ワーが一定閾値pt以上の場合と同様に認識結果が出力
端子9より出力されも なおスイッチ24(上 環境騒音パワーが一定閾値P1
以上の場合には母音判定部22!.,  一定閾値P1
以下の場合には分析(2)部2lに信号を入力するよう
に動作し 音声入力時以外の時は切断されていも スイ
ッチ26は母音の場合には分析(3)部23に 母音以
外の場合には分析(2)部2lに信号を入力するように
動作すも またスイッチ25は登録時には標準音声保管
バッファlOに 認識時には照合部8にパラメータを入
力するように動作すム 発明が解決しようとする課題 しかしなか板 上記のような構戒では まず発声変動に
よるスペクトルの傾きの変動を補正した後に 認識に使
用されるパラメータを分析しているために 分析処理を
行うことで補正内容がパラメータに忠実に反映され哄 
補正効率が悪くなり、場合によっては上記補正が認識率
に全く寄与しないことがあるという課題を有していナも
また 上記のような構或で1上 スペクトルの傾きの変
動は吸収できる八 発声変動による音韻特有の共振周波
数(以後ホルマント周波数と呼ぶ)の変動の補正はでき
哄 認識率の改善率が悪いという課題を有していtら 本発明!よ 雑音下で発声した場合の発声変動を認識パ
ラメータ上で補正することにより、補正効率を高くし 
補正結果が忠実に認識率の向上につながる音声認識装置
を提供することを目的とすもまた 従来補正されていな
かった発声変動によるホルマント周波数の変動を、直接
認識パラメータ上で効率よく補正し 従来にない認識率
向上を得ることを目的とすム 課題を解決するための手段 第1の発明【よ 入力信号の単位時間毎の特徴パラメー
タを分析する分析部と、特徴パラメータを補正するパラ
メータ補正部と、標準信号と人力信号とを照合し認識結
果を出力する照合部を具備し前記分析部で特徴パラメー
タを分析し その分析されたスペクトルを直交展開した
ものを認識パラメータとして算出し 前記パラメータ補
正部で装置使用時の環境騒音レベルの違いによる発声変
動に対応して前記認識パラメータを補正し 前記照合部
で前記補正されたパラメータを認識パラメータとして標
準音声と人力音声との照合を行うよう音声認識装置を構
戒するものであム 第2の発明は 人力信号の単位時間毎の特徴パラメータ
を分析する分析部と、共振周波数(以後ホルマント周波
数と呼ぶ)を検出するホルマント周波数検出部と、パラ
メータ補正値を検出する補正値算出部と、前記特徴パラ
メータを補正するパラメータ補正部と、標準信号と入力
信号とを照合し認識結果を出力する照合部を具iIiL
A  前記分析部でスペクトル分析を行い、 その分析
されたスペクトルを直交展開したものを認識パラメータ
として算出し 前記ホルマント周波数検出部で入力信号
のホルマント周波数を検出し 前記補正値算出部で前記
ホルマント周波数を利用してパラメータ補正値を算出し
 前記パラメータ補正部で入力音声の変動に対応して前
記パラメータ補正値にてパラメータを補正し その補正
されたパラメータを認識パラメータとして前記照合部で
標準音声と入力音声との照合を行うよう音声認識装置を
構或するものであも 作用 上記の構或によれ(戴 補正内容が認識パラメータに忠
実に反映され 補正効率が向上すもまた発声変動による
ホルマント周波数の変動の補正が可能となり、認識率を
向上させることができも 実施例 以下 本発明の実施例について図を参照しながら説明す
も 第1図(友 請求項1〜7に記載の発明の実施例を含む
単語音声認識装置のブロック図であムlは信号入力端予
 2はパワー測定臥 3は分析(1)fflL  4は
母音判定餓 5はホルマント周波数検出臥 6は補正値
算出a 7はパラメータ補正a 8は照合畝 9は認識
結果出力端子、 10は標準音声保管バッファ、 IL
12、 13、l4はスイッチであり、前記従来例と同
じものは同一の番号を付与していも 以上のように構戒された音声認識装置について以下その
動作について説明すも まず標準音声登録時にC友  音声入力直前の環境騒音
が信号入力端子1より入力され パワー測定部2で環境
騒音のパワーが算出され パワーが一定閾値P1以上の
場合Cヨ  周囲状況が登録時にふさわしくないとみな
し 登録を中断ずん環境騒音のパワーが一定閾値PI以
下の場合に(上 信号声入力端子lより入力された標準
音声用信号はパワー測定部2に入力されフレーム毎の信
号のパワーが算出され&  −X  入力音声は分析(
1)部3にも入力され 特徴パラメータが算出されも 
分析方法は従来例と同様であり、認識パラメータとして
所定の次数のLPCケブストラム係数が算出されも そ
してパワーが所定の音声区間検出閾値以上のフレームに
おける特徴パラメータが標準音声保管バッファIOに保
管されも標準音声用信号が入力されてからの上記の処理
を認識すべき全単語について行L\ 登緑を終了すも 次に認識時に4i  まず登録時と同様に環境騒音のパ
ワーが測定された微 信号入力端子lより認識されるべ
き信号が入力され 登録時同檄 分析(1)部3にてL
PCケプストラム係数が算出されも 環境騒音パワーが一定閾値P1以下の場合にはパラメー
タは照合部8に入力されも 照合部8で照合を行い、 
最短距離を示す単語を認識結果として認識結果出力端子
9より出力すム 環境騒音パワーが一定閾値PI以上の場合にはパワー測
定部2でフレームごとの信号のパワーが算出され 雑音
パワーと信号パワーは母音判定部4に入力されも 母音
判定部4で4L  次の2つの条件で母音判定を行う。
[1]信号レベルは雑音レベルに一定値Cを加えたレベ
ル以上であも [2]上記条件[1]を満たすフレームが5フレーム以
上継続していも 上記[1]  [2]の条件を満足するフレームを母音
部と判断し 母音部の場合は入力信号をホルマント周波
数検出部5に 母音部以外の場合には照合部8に人力す
も 母音部の場合にζ友 パラメータを補正するために ま
ずホルマント周波数検出部5で信号のホルマント周波数
を検出すム ホルマント周波数は次のように求めも 本
実施例の認識パラメータであるLPCケブストラムを算
出する過程玄 LPGパラメータa(i)が求められて
おり、このパラメー夕を用いて音声のスペクトルは N S = 1 /A(z)= 1 / ( 1+Σa (
i)X Z −’)IIl1 但し S: 音声のスペクトル N: 分析次数 で表されも このA (z)の複素根の実数部R e 
(z)と虚数部Im(z)か板 ホルマント周波数はf
= (fs/2π)tan−’ [Im(z)/Re(
z)]但し f : ホルマント周波数 fS:サンプリング周波数 となり、 LPGパラメータか転 ホルマント周波数を
求めることができも 次に 補正値算出部6玄 上記ホルマント周波数とLP
Cケプストラムをホルマント周波数で微分した値との積
値を用いてLPCケブストラムの補正値を算出すも 算
出式は特許請求の範囲第6項の式(1)の通りであも 
たとえば 式(1)において △f+ (第iホルマント周波数の変動量)= 120
Hz b+  (第iホルマントの八0ント1幅)  =  
150Hzfs  (サン7゜リンク2周波数)  =
  10KHzとし 発声変動により変動が大きかった
周波数範囲(300Hz〜1500Hz )に含まれる
ホルマントに対してのみ補正を行うと式(1)は式(4
)となんH (f+,n)= − 20. 15x e
xp(−0.047n)X1 (− sin ( 2yr fan/ 10000) 
)・・・式(4) 但 し  (   300Hz   <   f+  
 <   1500Hz   )式(4)にて算出され
た補正値はパラメータ補正部7に入力され 下記式(5
)のようにLPCケブストラムCn  が補正されも 
補正されたパラメータは照合部8で環境騒音パワーが一
定閾値P1以下の場合と同様に照合され 認識結果出力
端子9より認識結果が出力されも Cn =Cn+H(f+,n)      ・・・式(
5)以上のように 本実施例によれ&戴 分析部で認識
パラメータとしてケプストラム係数を算出しホルマント
周波数検出部で入力信号のホルマント周波数を検出し 
補正値算出部で式(1)に従って補正値を算出し パラ
メータ補正部で入方音声のホルマント周波数変動に対応
して、上記補正値を認識パラメータに加算してパラメー
タを補正すること玄 補正内容が認識パラメータに忠実
に反映され 補正効率が向上すも また発声変動にょる
ホルマント周波数の変動の補正が可能となり、認識率を
向上させることができも な抵 スイッチ11は音声入力直前の環境騒音パワーを
測定する場合にはパワー測定部2に おんせいを入力す
る場合には分析(1)部3に信号を入力するように動作
すも スイッチ12は登録時には標準音声保管バッファ
1oに 認識時には照合部8もしくは母音判定部4に認
識パラメータを入力するように動作すも また スイッ
チl3は入力音声のパワーが閾値P1以下の場合には照
合部8に 閾値P1以上の場合は母音判定部4にパラメ
ータを入力するように動作すも スイッチ14は母音の
場合にはホルマント周波数検出部5に 母音以外の場合
には照合部8に信号を入力するように動作すも なお本実施例で1上 騒音環境にて発声した場合の発声
変動について説明したパ それ以外の発声変動において
k ホルマント周波数が変動するような発声変動の補正
にζ上 本方法は有効であも但し 式(1)を用いた補
正は 限られたホルマント周波数のみがある規則をもっ
て変動する場合に最も補正効果が大きい力丈 騒音環境
にて発声した場合ζよ 約300Hz〜約1500Hz
にあるホルマント周波数のみ上昇する事実があり、上記
の補正効果が最も大きい条件に当てはまも そのたへ 
本補正は特に騒音環境においての発声変動に有効であも
な耘 請求項3に記載の発明のように 分析(1〉部3
で認識パラメータとしてケプスドラム係数を算出し パ
ラメータ補正部で入力音声の変動に対応してパラメータ
補正値にてケプストラム係数を補正し その補正された
ケブストラム係数にて照合部で標準音声と入力音声との
照合を行うことにより、特に高い補正効果を得ることが
できもまた 請求項4に記載の発明のように ホルマン
ト周波数の変動を、ホルマント周波数の変動量と認識パ
ラメータの変換核もしくは変換核と同周期かつ同位相に
て同符号の周期関数とを用いて補正すること玄 従来補
正できなかったホルマント周波数の変動を補正L  認
識率を向上させることができも 更に請求項5に記載の発明のように ホルマント周波数
変動を、ホルマント周波数の変動量と認識パラメータの
ホルマント周波数に対する傾きとを用いて補正すること
玄 従来補正されなかったホルマント周波数の変動を補
正し 認識率を向上させることができも 更に請求項6に記載の発明のように ホルマント周波数
変動を、ホルマント周波数の変動量と認識パラメータを
ホルマント周波数で微分した値とを用いて補正すること
玄 従来補正されなかったホルマント周波数の変動を補
正し 認識率を向上させるこ・とができも 更に請求項7に記載の発明のように ホルマント周波数
変動を、ホルマント周波数の変動量と認識パラメータで
あるケプスドラム係数をホルマント周波数で微分した値
との積を補正量とし 左記補正量をケプストラム係数に
加算または減算することで、従来補正されなかったホル
マント周波数の変動を補正し認識率を向上させることが
でき瓜な耘 本実施例では騒音環境にて発声した場合の
発声変動について説明した力t それ以外の発声変動に
おいても有効であも 次に 本発明の他の実施例について図を参照しながら説
明すも 第2図は請求項8に記載の発明の一実施例における単語
音声認識装置のブロック図であ,41は信号入力端+,
 15はパワー測定K  16は変動量推定%3は分析
(1)敵 4は母音判定敵5はホルマント周波数検出餓
 17は補正値算出敵 7はパラメータ補正餓 8は照
合敵 9は認識結果出力端子、 10は標準音声保管バ
ッファ、11,12、 13、 14はスイッチであり
、前記従来例と同じものは 同一の番号を付与していも
以上のように構威された音声認識装置について以下その
動作について説明すも まず標準音声登録時にζよ 音声入力直前の環境騒音が
信号人力端子1より入力され パワー測定部15で環境
騒音のパワーが算出され パワーが一定閾値Pi以上の
場合(よ 周囲状況が登録時にふさわしくないとみなし
 登録を中断ずん環境騒音のパワーが一定MiP 1以
下の場合に11  信号声入力端子1より入力された標
準音声用音声信号は分析(1)部3に入力され 特徴パ
ラメータが算出されも 分析方法は従来例と同様であり
、認識パラメータとして所定の次数のLPCケプストラ
ム係数が算出されも そしてパワーが所定の音声区間検
出閾値以上のフレームにおける特徴パラメータが標準音
声保管バッファ10に保管されも 標準音声用信号が入力されてからの上記の処理を認識す
べき全単語について行い、 登録を終了すん 次に認識時には まず登録時と同様に環境騒音のパワー
がパワー測定部2にて測定された後、信号入力端子lよ
り認識されるべき信号が入力され分析(1)部3で登録
時と同様に認識パラメータが算出されも 環境騒音パワーが一定閾値P1以下の場合にζ′!,認
識パラメータは照合部8に入力され 照合を行った眞 
最短距離を示す単語を認識結果として認識結果出力端子
9より出力すも 環境騒音パワーが一定閾値P1以上の場合にCL騒音パ
ワー値は変動量推定部l6に入力される。
変動量推定部l6でζよ 環境騒音のパワー値Pnより
次式を用いて騒音下での発声変形によるホルマント変動
量△fを推定すも この場合、パワーPT′L.P1の
単位はd& △fの単位はHzであムΔf= IOX 
(P n− P L)   ・・・  式(6)式(6
) g1  環境騒音が小さい場合Cヨ  発声変動が
少ないためホルマント周波数の変動量が小さく、環境騒
音が大きい場合ζよ 発声変動が大きいためホルマント
周波数の変動量も大きいという事実を反映しているもの
であも 次に 音声が入力され上記の環境騒音パワーと
分析(1)部でバラメー夕と共に算出された音声信号パ
ワーとは母音判定部4に入力されも 母音判定部4でC
ヨ  次の2つの条件で母音判定を行う。
[1]信号レベルは雑音レベルに一定値Cを加えたレベ
ル以上であも [2]上記条件[1コを満たすフレームが5フレーム以
上継続していも 上記[1]  [2]の条件を満足するフレームを母音
部と判断し 母音部の場合は入力信号をホルマント周波
数検出部5に 母音部以外の場合には照合部8に入力す
も 母音部の場合に(表 パラメータを補正するために ま
ずホルマント周波数検出部5で音声信号のホルマント周
波数を投出すも ホルマント周波数は次のように求めも
 本実施例の認識パラメータであるLPCケプストラム
を算出する過程で、LPCパラメータa (i)が求め
られており、このパラメータを用いて音声のスペクトル
は N 但し S: 音声のスペクトル N: 分析次数 で表されも このA (z)の複素根の実数部R e 
(z)ト虚数部I m(z)か転 ホルマント周波数は
f = (fs/2 π)  t a n−’ [Im
(z)/R e(z)]但し f : ホルマント周波
数 f8:サンプリング周波数 となり、LPGパラメータかペ ホルマント周波数を求
めることができも 次に 補正値算出部6で、上記ホルマント周波数とLP
Cケブストラムをホルマント周波数で微分した値との積
値を用いてLPCケブストラムの補正値を算出すム 算
出式は特許請求の範囲第6項の式(1)の通りである。
この際に 式ク1)のホルマント周波数の変動量は上記
式(6)で求めた値を用いも 他の変数は式(1〉にお
いてb+  (第iホルマントの八17ド幅)  = 
 150Hzfs  (サン7゜リンクゝ周波数)  
=  10KHzとし 発声変動により変動が大きかっ
た周波数範囲(300Hz−1500Hz )に含まれ
るホルマントに対してのみ補正を行うと式(1)は式(
4)となんH(f+,n)=−Σ1.26X 10−”
 x△f x exp( −0. 047n) xi (−sin  (2yrf+n/10000)  ) 
 −  式(4)但 し  (   300Hz   
<   fi   <   1500HZ   )式(
4)にて算出された補正値はパラメータ補正部7に入力
され 下記式(5)のようにLPCケプストラムCnが
補正されも 補正されたパラメータは照合部8で環境騒
音パワーが一定閾値P1以下の場合と同様に照合され 
認識結果出力端子9より認識結果が出力されも Cn =Cn+H(f+,n)    −・・式(5)
以上のように 本実施例によれば パワー測定部で環境
騒音パワーを測定し 変動量推定部で発声変動によるホ
ルマント周波数の変動量を環境騒音パワーを用いて式(
6)のように推定し 分析部で認識パラメータとしてケ
プストラム係数を算出し ホルマント周波数検出部で入
力信号のホルマント周波数を検出レ 補正値算出部で上
記で推定されたホルマント周波数の変動量を用いて式(
4)にて補正値を算出し パラメータ補正部で入力音声
の変動に対応して上記補正値を認識パラメータに加算し
てパラメータを補正すること玄 騒音下で発声したこと
によるホルマント周波数の変動の補正が可能となり、認
識率を向上させることができも まt−認識パラメータ
自身を補正することで、補正内容が認識パラメータに忠
実に反映され補正効率が向上すも また ホルマント周
波数の変動量を騒音パワーより推定し 環境騒音の大き
さに適した補正値を用いること玄 より補正効果を向上
させることができも な抵 スイッチl1は音声入力直前の環境騒音パワーを
測定する場合はパワー測定部2に 音声入力の際には分
析(1)部に信号を入力するように動作する。またスイ
ッチl2EL  登録時には標準音声保管バッファ10
に 認識時には照合部8または母音判定部4にパラメー
タを入力するように動作すも スイッチ13は環境騒音
パワーが一定閾値P1以上の場合には母音判定部4に 
一定閾値PI以下の場合には照合部8にパラメータを入
力するように動作すら スイッチ14は母音の場合には
ホルマント周波数検出部5に 母音以外の場合には照合
部8に信号を入力するように動作すも 次をへ 請求項9に記載の発明の実施例について図を参
照しながら説明すも 第3図は同実施例における単語音声認識装置のブロック
図であも lは信号入力端る 2はパワー測定敵 18はLPF部
,3は分析(1)餓 4は母音判定敵5はホルマント周
波数検出臥 6は補正値算出a7はパラメータ補正訊 
8は照合敵 9は認識結果出力端子、 lOは標準音声
保管バッファ、 19、l2、 13、 14はスイッ
チであり、前記従来例と同じもの{上 同一の番号を付
与していも以上のように構或された音声認識装置につい
て以下その動作について説明すも まず標準音声登録時に!友 音声人力遣前の環境騒音が
信号入力端子1より入力され 入力信号レベル測定部2
で環境騒音のパワーが算出され バワーが一定閾値P1
以上の場合ζよ 周囲状況が登録時にふさわしくないと
みなし 登録を中断ずん環境騒音のパワーが一定閾値P
1以下の場合に(上 信号声入力端子1より入力された
標準音声用音声信号はLPF部18に入力され カット
オフ周波数が2.5KHzL P Fを通過した後分析
(1)部3に入力され 分析(1)部3にて認識パラメ
ータとして所定の個数のLPCケブストラム係数が算出
されも 分析方法は上記実施例と同様であaそしてパワ
ーが所定の音声区間検出閾値以上の特徴パラメータが標
準音声保管バッファ10に保管されも 標準音声用信号が入力されてからの上記の処理を認識す
べき全単語について行(\ 登録を終了すん 次に認識時に番ヨ  まず音声入力直前に登録時と同様
に環境騒音のパワーがパワー測定部2で測定された後、
信号入力端子1より認識されるべき信号が入力されも 
入力信号は登録時と同様にLPF部l8を通過した後、
分析部3に入力され 分析部にてLPCケプストラム係
数がパラメータとして算出されも 環境騒音パワーが一定閾値P1以下の場合にC友上記パ
ラメータは照合部8に入力され 照合部8で照合を行(
\ 最短距離を示す単語を認識結果として認識結果出力
端子9より出力すも 環境騒音パワーが一定閾値P1以上の場合にζよ騒音パ
ワーと分析の際にパラメータと共に算出された音声信号
パワーは母音判定部4に入力されも母音判定部4で(よ
 次の2つの条件で母音判定を行う。
[1コ信号レベルは雑音レベルに一定値Cを加えたレベ
ル以上である。
[2]上記条件[1]を満たすフレームが5フレーム以
上継続していも 上記[l] [2コの条件を満足するフレームを母音部
と判断し 母音部の場合は入力信号のパラメータをホル
マント周波数検出部5に 母音部以外の場合には照合部
8に入力すも 母音部の場合には パラメータを補正するために まず
ホルマント周波数検出部5で信号のホルマント周波数を
検出すも ホルマント周波数は次のように求めも 本実
施例の認識パラメータであるLPCケプストラムを算出
する過程で、LPGパラメータa(i)が求められてお
り、このパラメータを用いて音声のスペクトルは 但し S: 音声のスペクトル M: 分析次数 で表されも このA (z)の複素根の実数部R e 
(z)と虚数部Im(z)か板 ホルマント周波数はF
= (N/ 2 yr)  t a n−’ [I m
(z)/R e(z)]但し F: ホルマント周波数 N: サンプリング周波数 となり、LPGパラメータか板 ホルマント周波数を求
めることができも 次に 補正値算出部6で、上記ホルマント周波数とLP
Cケプストラムをホルマント周波数で微分した値との積
値を用いてLPCケブストラムの補正値を算出すも 算
出式は特許請求の範囲の式(1)の通りであも 他の変
数は式(1)において△f+  (第iホルマントのホ
ルマント周波数の変動量)=  120Hz b1 (第iホルマントの八ゝ冫ド幅)  =  15
0Hzfs  (サン7゜リンクゝ周波数)  =  
10KHzとし 発声変動により変動が大きかった周波
数範囲(300Hz−1500Hz )に含まれるホル
マントに対してのみ補正を行うと式(1)は式(4)と
なんH(fI,n)=一Σ0. 15x exp(−0
.047n)xi (−sin (2yr fan/ 10000) )・
・・式(4) 但 し  (   300Hz   <   f+  
 <   1500Hz   )式(4)にて算出され
た補正値はパラメータ補正部7に入力され 下記式(5
)のようにLPCケプストラムCnが補正されも 補正
されたパラメータは照合部8で環境騒音パワーが一定閾
値Pi以下の場合と同様に照合され 認識結果出カ端子
9より認識結果が出力されも Cn =Cn+H(f+,n)       ・・・ 
式(5)以上のようほ 本実施例によれば 発声変形に
よってスペクトル変形が著しくしかもホルマントパワー
が上昇している高域スペクトルをLPF部で除去し 分
析部で線形予測係数及びケプストラム係数を算出し ホ
ルマント周波数検出部で低次ホルマント周波数を検出し
 補正値算出部で式(l)にて補正値を算出し パラメ
ータ補正部で入力信号のパターン変動に対応して上記補
正値にてパラメータを補正し 照合部で補正されたパラ
メータを認識パラメータして照合を行うことにより、低
次ホルマント周波数を確実に検出し 検出されたホルマ
ント周波数を用いて、発声変形の大きな要因であるホル
マント周波数の変動を入力音声毎に確実に補正すること
が可能となん また上記LPFの使用により、発声変形の著しい高域ス
ペクトルを除去するたム 発声の違いによる認識パラメ
ータのずれをも吸収できも すなわ板 上記発声変動が
環境騒音によるものである場合、発声変動が高域周波数
のスペクトルに太きく影響を及ぼす事実があり、高域周
波数のノくワーを減衰させることζ戴 上記の高域スペ
クトルの変形をも除去することとなも 従って、騒音環
境における認識率を向上させることができもな耘 スイ
ッチ19は音声入力直前の環境騒音測定時にはパワー測
定部2に音声入力の際にはLPF部18に信号を入力す
るように動作すも スイッチ12は登録時には標準音声
保管ノくツファ10に 認識時には照合部8または母音
判定部4にパラメータを入力するように動作すも スイ
・ソチ13は環境騒音パワーが一定閾値Pi以上の場合
には母音判定部4に 一定閾値P1以下の場合には照合
部8にパラメータを入力するように動作すも スイッチ
13i1  スイッチ14は母音の場合にはホルマント
周波数検出部5!,− 母音以外の場合には照合部8に
信号を入力するように動作すも次に 請求項10に記載
の発明の一実施例について図を参照しながら説明すも 第4図は同実施例における単語音声認識装置のブロック
図であも 1は信号入力端子 20はノ{ワー測定敵 
21は分析(2)ffli  22は母音判定fflL
  23は分析<3)K5はホルマント周波数検出鰍 
6は補正値算出敵 7はパラメータ補正1!L 8は照
合臥 9は認識結果出力端子、 10は標準音声保管バ
ッファ、 24、 25、26はスイッチであり、前記
従来例と同じものは 同一の番号を付与していも 以上のように構或された音声認識装置について以下その
動作について説明すも まず標準音声登録時に(友 音声入力直前の環境騒音が
信号入力端子1より入力され パワー測定部2で環境騒
音のパワーが算出され パワーが一定閾値PI以上の場
合は 周囲状況が登録時にふさわしくないとみなし 登
録を中断ずん環境騒音のパワーが一定閾値P1以下の場
合には 信号声入力端子lより入力された標準音声用信
号は分析(2)部2lに入力され 認識パラメータとし
てLPCケプストラム係数が算出されもこの際に分析(
2)部でCヨ  通露 まず入力信号を下記式(2)で
示されるフィルタに通し 高域スベクトルを強調した後
分析を行う。これは従来例に示したフィルタF1と同様
のフィルタであもFl  (z)=1−0.  937
5xZ−1・・・式(2〉 そしてパワーが所定の音声区間検出閾値以上の場合、相
当する特徴パラメータを標準音声とみなしバッファlO
に保管すa 標準音声用信号が入力されてからの上記の処理を認識す
べき全単語について行い、 登録を終了すん 次に認識時に{よ まず登録時と同様にパワー測定部2
で環境騒音のパワーが測定された抵 信号入力端子lよ
り認識されるべき信号が入力されも環境騒音パワーが一
定閾値P1以下の場合に&よ登録時と同様に式(2)の
F1で表されるフィルタを通過徽 分析(2〉部21で
特徴パラメータが算出され パラメータは照合部8に入
力されも照合部8で標準音声と入力音声との照合を行(
\最短距離を示す単語を認識結果として認識結果出力端
子9より出力すも 環境騒音パワーが一定閾値Pi以上の場合にζよパワー
測定部20で音声信号のパワーがフレームごとに算出さ
れ 先に測定された騒音パワーと音声信号パワーは母音
判定部2lに入力されも 母音判定部22では 次の2
つの条件で母音判定を行う。
[1]信号レベルは雑音レベルに一定値Cを加えたレベ
ル以上であも [2]上記条件[1]を満たすフレームが5フレーム以
上継続していも 上記[1]  [2]の条件を満足するフレームを母音
部と判断し 母音部の場合は入力信号を分析(3)部2
3!,− 母音部以外の場合には分析(2)部21に入
力すa 母音部以外のフレームに対して(;L 標準音声入力時
と同檄 上記式(2)で表されるフィルタで高域強調を
行い特徴パラメータを算出すも母音部と判定されたフレ
ームに対して(上 分析(3)部23で、下記式(3)
で示されるフィルタF2を用いて高域強調を行う。この
フィルタは従来例のフィルタF2と同様のものであもF
2  (z)=1−0.  6375xZ−1・・・式
(3) 上記式(3)のフィルタは式(2)のフィルタに比べて
、高域強調の度合が少なく、傾きの緩やかなものであも
 環境騒音が大きくなると話者の発声状態が変化し 音
声の高域スペクトル戒分が強くなもそのため上記高域強
調フィルタの傾き【上 雑音の小さい場合に比べて緩や
かにする必要があも フィルタ通過後、登録時同様特徴
パラメータを算出すも 次に ホルマント周波数検出部5で信号のホルマント周
波数を検出すも ホルマント周波数は次のように求めも
 本実施例の認識パラメータであるLPCケプストラム
を算出する過程玄 LPCパラメータa(i)が求めら
れており、このパラメータを用いて音声のスペクトルは 但し S: 音声のスペクトル M: 分析次数 で表されも このA (z)の複素根の実数部R e 
(z)と虚数部Im(z)か板 ホルマント周波数はF
= (N/ 2 π)  t a n−’ [I m(
z)/R e(z)]但し F: ホルマント周波数 N: サンプリング周波数 となり、LPGパラメータか板 ホルマント周波数を求
めることができも 次に 補正値算出部6で、上記ホルマント周波数とLP
Cケプストラムをホルマント周波数で微分した値との積
値を用いてLPCケプストラムの補正値を算出すも 算
出式は式(1)の通りであも他の変数は式(1)におい
て △f+  (第iホルマントの本ルマント周波数の変動
量〉=  120Hz b+  (第iホルマントの八17ド幅)  =  1
50Hzfs  (サン7゜り冫クゝ周波数)  = 
 10KHzとし 発声変動により変動が大きかった周
波数範囲(300Hz−1500Hz )に含まれるホ
ルマントに対してのみ補正を行うと式(1)は式(4)
となんH (f+.n)=−Σ0, 15 x exp
(−0.047n) Xl (−sin (2yr fan/10000))・・・
式(4) 但 し  (   300Hz   <   f+  
 <   1500Hz   )式(4)にて算出され
た補正値はパラメータ補正部7に入力され 下記式(5
)のようにLPCケプストラムCnが補正されも 補正
されたパラメータは照合部8で環境騒音パワーが一定閾
値PI以下の場合と同様に照合され 認識結果出力端子
9より認識結果が出力されも Cn =Cn+H(f+,n)       −  式
(5)以上のように 本実施例によれ(;CS/Hの低
い騒音下で発声された発声変動の大きい音声に対しての
ム 分析(3)部23で高域強調フィルタのl次係数を
変化させ高域強調度合を小さくした後、線形予測係数及
びケプストラムパラメータを算出し ホルマント周波数
検出部で低次ホルマント周波数を検出し 補正値算出部
で各パラメータのホルマント周波数と変換核とを用いて
補正値を算出し パラメータ補正部で入力信号のホルマ
ント変動に対応して上記補値にてパラメータを補正し 
照合部で補正されたパラメータを認識パラメータして照
合を行うことにより、高次ホルマントビークレベルが抑
えられ 結果として低次ホルマント周波数を確実に検出
でき、検出されたホルマント周波数を用いて、発声変形
の大きな要因であるホルマント周波数の変動を入力音声
毎に確実に補正することが可能となる。また高域強調度
合を小さくすることで、発声変形により上昇した高域ス
ペクトルパワーを抑えるたム 発声の違いによる認識パ
ラメータのずれを吸収できる。以上の理由により騒音環
境における認識率を向上させることができる。
な耘 スイッチ24は環境騒音パワーが一定閾値P1以
上の場合には母音判定部4ζへ 一定閾値Pi以下の場
合には分析(2)部21に信号を入力するように動作す
も スイッチ2 5 4;L  登録時には標準音声保
管バッファlOに 認識時には照合部8にパラメータを
入力するように動作する。
スイッチ26は母音の場合には分析(3)部23に 母
音以外の場合には分析(2)部21に信号を入力するよ
うに動作すも 発明の効果 本発明によれば 補正内容が認識パラメータに忠実に反
映され 補正効率が向上すム また 従来補正できなかった音声の変動によるホルマン
ト周波数の変動の補正が認識パラメータ上で可能となり
、補正内容が認識パラメータに忠実に反映され 補正効
率を向上させることができも
【図面の簡単な説明】
第1図〜第4図ζよ 本発明の実施例における音声認識
装置のブロック@ 第5図は従来例における音声認識装
置のブロック図である。 1・・・音声入力端子、2・・・パワー測定fflk3
・・・分析(1)K  4・・・母音判定敵 5・・・
ホルマント周波数算出臥 6・・・補正値算出臥 7・
・・パラメータ補正畝 8・・・照合@9・・・認識結
果出力端子、 10・・・標準音声保管バッファ、 1
1、 12、 l3、■ 4・・・スイッチ。

Claims (10)

    【特許請求の範囲】
  1. (1)入力信号の単位時間毎の特徴パラメータを分析す
    る分析部と、特徴パラメータを補正するパラメータ補正
    部と、標準信号と入力信号とを照合し認識結果を出力す
    る照合部を具備し、前記分析部で特徴パラメータを分析
    し、その分析されたスペクトルを直交展開したものを認
    識パラメータとして算出し、前記パラメータ補正部で装
    置使用時の環境騒音レベルの違いによる発声変動に対応
    して前記認識パラメータを補正し、前記照合部で前記補
    正されたパラメータを認識パラメータとして標準音声と
    入力音声との照合を行うことを特徴とする音声認識装置
  2. (2)入力信号の単位時間毎の特徴パラメータを分析す
    る分析部と、共振周波数(以後ホルマント周波数と呼ぶ
    )を検出するホルマント周波数検出部と、パラメータ補
    正値を検出する補正値算出部と、前記特徴パラメータを
    補正するパラメータ補正部と、標準信号と入力信号とを
    照合し認識結果を出力する照合部を具備し、前記分析部
    でスペクトル分析を行い、その分析されたスペクトルを
    直交展開したものを認識パラメータとして算出し、前記
    ホルマント周波数検出部で入力信号のホルマント周波数
    を検出し、前記補正値算出部で前記ホルマント周波数を
    利用してパラメータ補正値を算出し、前記パラメータ補
    正部で入力音声の変動に対応して前記パラメータ補正値
    にてパラメータを補正し、その補正されたパラメータを
    認識パラメータとして前記照合部で標準音声と入力音声
    との照合を行うことを特徴とする音声認識装置。
  3. (3)分析部で認識パラメータとしてケプストラム係数
    を算出し、パラメータ補正部で入力音声の変動に対応し
    てパラメータ補正値にてケプストラム係数を補正し、そ
    の補正されたケプストラム係数により照合部で標準音声
    と入力音声との照合を行うことを特徴とする請求項2に
    記載の音声認識装置。
  4. (4)補正値算出部で音声の変動によるホルマント周波
    数の変動量と認識パラメータの変換核もしくは変換核と
    同周期かつ同位相にて同符号の周期関数を用いて補正値
    を算出することを特徴とする請求項2に記載の音声認識
    装置。
  5. (5)補正値算出部で音声の変動によるホルマント周波
    数の変動量と認識パラメータのホルマント周波数に対す
    る傾きとを用いて補正値を算出することを特徴とする請
    求項2に記載の音声認識装置。
  6. (6)補正値算出部で音声の変動によるホルマント周波
    数の変動量と認識パラメータをホルマント周波数で微分
    した値とを用いて補正値を算出することを特徴とする請
    求項2に記載の音声認識装置。
  7. (7)補正値算出部で下記式(1)に従って補正値を算
    出することを特徴とする請求項2に記載の音声認識装置
    。 ▲数式、化学式、表等があります▼・・・(1) H(f_i、n):ホルマント周波数がf_iHzの時
    の第n次ケプストラム係数の補正量 Δf_i:発声変形の有無によるホルマント周波数の差 ▲数式、化学式、表等があります▼ ∂Cn/∂fi=(−4π/fs)exp(−nπb_
    i/fs)×sin(2πf_in/fs) Cn:第n次ケプストラム係数 b_i:第iホルマントのバンド幅 f_i:第iホルマント周波数 fs:サンプリング周波数 M/2:ホルマントの個数
  8. (8)環境騒音のパワーを測定するパワー測定部と、パ
    ワーの大きさからホルマント周波数の変動量を推定する
    変動量推定部と、入力信号の単位時間毎の特徴パラメー
    タを分析する分析部と、ホルマント周波数を検出するホ
    ルマント周波数検出部と、パラメータ補正値を検出する
    補正値算出部と、特徴パラメータを補正するパラメータ
    補正部と 標準信号と入力信号とを照合し認識結果を出
    力する照合部を具備し、前記パワー測定部で環境騒音パ
    ワーを測定し、前記変動量推定部で上記で測定された騒
    音パワーを用いて発声変形によるホルマント周波数変動
    量を推定し、前記分析部でスペクトル分析を行い、その
    分析されたスペクトルを直交展開したものを認識パラメ
    ータとして算出し、前記ホルマント周波数検出部で入力
    信号のホルマント周波数を検出し、前記補正値算出部で
    前記変動量推定部にて推定されたホルマント周波数の変
    動量と上記認識パラメータの変換核もしくは変換核と同
    周期かつ同位相にて同符号の周期関数とを用いて補正値
    を算出し、前記パラメータ補正部で騒音下で発声した場
    合の入力音声の発声変動に対応して上記補正値にてパラ
    メータを補正し、その補正されたパラメータを認識パラ
    メータして前記照合部で標準音声と入力音声との照合を
    行うことを特徴とする音声認識装置。
  9. (9)高域周波数のパワーを減衰させる特定帯域パワー
    減衰部を具備し、その特定帯域パワー減衰部で音声の高
    域周波数パワーを減衰させた後、分析部でスペクトル分
    析を行うことを特徴とする請求項2に記載の音声認識装
    置。
  10. (10)スペクトルの概形を補正する概形補正部を具備
    し、その概形補正部で標準音声と入力音声とのスペクト
    ルの概形が等しくなるようにスペクトル概形を補正し、
    分析部でスペクトル分析を行うことを特徴とする請求項
    2に記載の音声認識装置。
JP2212831A 1989-10-04 1990-08-10 音声認識装置 Expired - Fee Related JP2969862B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
EP19900118858 EP0421341B1 (en) 1989-10-04 1990-10-02 Speech recognizer
DE1990633000 DE69033000T2 (de) 1989-10-04 1990-10-02 Einrichtung zur Spracherkennung
US07/983,246 US5361324A (en) 1989-10-04 1992-11-30 Lombard effect compensation using a frequency shift

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP1-259034 1989-10-04
JP25903489 1989-10-04

Publications (2)

Publication Number Publication Date
JPH03206499A true JPH03206499A (ja) 1991-09-09
JP2969862B2 JP2969862B2 (ja) 1999-11-02

Family

ID=17328415

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2212831A Expired - Fee Related JP2969862B2 (ja) 1989-10-04 1990-08-10 音声認識装置

Country Status (2)

Country Link
US (1) US5361324A (ja)
JP (1) JP2969862B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002528753A (ja) * 1998-10-16 2002-09-03 ドラゴン システムズ ユーケー リサーチ アンド デヴェロプメント リミテッド スピーチプロセシング
JP2016075740A (ja) * 2014-10-03 2016-05-12 日本電気株式会社 音声処理装置、音声処理方法、およびプログラム

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2969862B2 (ja) 1989-10-04 1999-11-02 松下電器産業株式会社 音声認識装置
DE4322372A1 (de) * 1993-07-06 1995-01-12 Sel Alcatel Ag Verfahren und Vorrichtung zur Spracherkennung
US5864809A (en) * 1994-10-28 1999-01-26 Mitsubishi Denki Kabushiki Kaisha Modification of sub-phoneme speech spectral models for lombard speech recognition
US5742928A (en) * 1994-10-28 1998-04-21 Mitsubishi Denki Kabushiki Kaisha Apparatus and method for speech recognition in the presence of unnatural speech effects
JPH1074098A (ja) * 1996-09-02 1998-03-17 Yamaha Corp 音声変換装置
US6003000A (en) * 1997-04-29 1999-12-14 Meta-C Corporation Method and system for speech processing with greatly reduced harmonic and intermodulation distortion
WO2001030049A1 (fr) * 1999-10-19 2001-04-26 Fujitsu Limited Unite de traitement et de reproduction de son vocaux reçus
JP4880136B2 (ja) * 2000-07-10 2012-02-22 パナソニック株式会社 音声認識装置および音声認識方法
US20050114134A1 (en) * 2003-11-26 2005-05-26 Microsoft Corporation Method and apparatus for continuous valued vocal tract resonance tracking using piecewise linear approximations
US20070168187A1 (en) * 2006-01-13 2007-07-19 Samuel Fletcher Real time voice analysis and method for providing speech therapy
CN106558318B (zh) * 2015-09-24 2020-04-28 阿里巴巴集团控股有限公司 音频识别方法和系统
US9729957B1 (en) 2016-01-25 2017-08-08 Cirrus Logic, Inc. Dynamic frequency-dependent sidetone generation
GB201801657D0 (en) * 2017-11-21 2018-03-21 Cirrus Logic Int Semiconductor Ltd Speaker enrolment

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5862700A (ja) * 1981-10-12 1983-04-14 株式会社デンソー 音声認識装置
JPS6482000A (en) * 1987-09-24 1989-03-28 Nec Corp Pattern feature normalization system

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0054365B1 (en) * 1980-12-09 1984-09-12 Secretary of State for Industry in Her Britannic Majesty's Gov. of the United Kingdom of Great Britain and Northern Ireland Speech recognition systems
US4956865A (en) * 1985-01-30 1990-09-11 Northern Telecom Limited Speech recognition
US4922539A (en) * 1985-06-10 1990-05-01 Texas Instruments Incorporated Method of encoding speech signals involving the extraction of speech formant candidates in real time
US4852181A (en) * 1985-09-26 1989-07-25 Oki Electric Industry Co., Ltd. Speech recognition for recognizing the catagory of an input speech pattern
NL8603163A (nl) * 1986-12-12 1988-07-01 Philips Nv Werkwijze en inrichting voor het afleiden van formantfrekwenties uit een gedeelte van een spraaksignaal.
US5001761A (en) * 1988-02-09 1991-03-19 Nec Corporation Device for normalizing a speech spectrum
US4933973A (en) * 1988-02-29 1990-06-12 Itt Corporation Apparatus and methods for the selective addition of noise to templates employed in automatic speech recognition systems
GB8911153D0 (en) * 1989-05-16 1989-09-20 Smiths Industries Plc Speech recognition apparatus and methods
JP2969862B2 (ja) 1989-10-04 1999-11-02 松下電器産業株式会社 音声認識装置
US5040217A (en) * 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5862700A (ja) * 1981-10-12 1983-04-14 株式会社デンソー 音声認識装置
JPS6482000A (en) * 1987-09-24 1989-03-28 Nec Corp Pattern feature normalization system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002528753A (ja) * 1998-10-16 2002-09-03 ドラゴン システムズ ユーケー リサーチ アンド デヴェロプメント リミテッド スピーチプロセシング
JP4778613B2 (ja) * 1998-10-16 2011-09-21 ドラゴン システムズ ユーケー リサーチ アンド デヴェロプメント リミテッド スピーチプロセシング
JP2016075740A (ja) * 2014-10-03 2016-05-12 日本電気株式会社 音声処理装置、音声処理方法、およびプログラム
US10490194B2 (en) 2014-10-03 2019-11-26 Nec Corporation Speech processing apparatus, speech processing method and computer-readable medium

Also Published As

Publication number Publication date
US5361324A (en) 1994-11-01
JP2969862B2 (ja) 1999-11-02

Similar Documents

Publication Publication Date Title
US20200321008A1 (en) Voiceprint recognition method and device based on memory bottleneck feature
US8140330B2 (en) System and method for detecting repeated patterns in dialog systems
US7133826B2 (en) Method and apparatus using spectral addition for speaker recognition
Prasanna et al. Extraction of speaker-specific excitation information from linear prediction residual of speech
JPH03206499A (ja) 音声認識装置
US20150039313A1 (en) Speech-Based Speaker Recognition Systems and Methods
JPS62231997A (ja) 音声認識システム及びその方法
US20230015189A1 (en) Voice modification detection using physical models of speech production
KR20010040669A (ko) 잡음 보상되는 음성 인식 시스템 및 방법
Wang et al. Model-based speech enhancement in the modulation domain
CN107039035A (zh) 一种语音起始点和终止点的检测方法
US7072750B2 (en) Method and apparatus for rejection of speech recognition results in accordance with confidence level
Kinnunen Joint acoustic-modulation frequency for speaker recognition
JP2817429B2 (ja) 音声認識装置
Bhukya et al. End point detection using speech-specific knowledge for text-dependent speaker verification
JPH07121197A (ja) 学習式音声認識方法
US5425127A (en) Speech recognition method
JPS60114900A (ja) 有音・無音判定法
JP3026855B2 (ja) 音声認識装置
Sivakumaran et al. Sub-band based speaker verification using dynamic recombination weights.
Sarangi et al. Gaussian Filter Based Data-Driven Cepstral Features for Robust Speaker Verification System
Gour et al. Framework based supervised voice activity detection using linear and non-linear features
JPH10124084A (ja) 音声処理装置
JP3107905B2 (ja) 音声認識装置
JPH02275499A (ja) 発音評価法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees