JP3034279B2 - 有音検出装置および有音検出方法 - Google Patents

有音検出装置および有音検出方法

Info

Publication number
JP3034279B2
JP3034279B2 JP2172028A JP17202890A JP3034279B2 JP 3034279 B2 JP3034279 B2 JP 3034279B2 JP 2172028 A JP2172028 A JP 2172028A JP 17202890 A JP17202890 A JP 17202890A JP 3034279 B2 JP3034279 B2 JP 3034279B2
Authority
JP
Japan
Prior art keywords
feature vector
noise
standard pattern
frame
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2172028A
Other languages
English (en)
Other versions
JPH0458297A (ja
Inventor
仁樹 佐藤
恒雄 新田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2172028A priority Critical patent/JP3034279B2/ja
Priority to CA002040025A priority patent/CA2040025A1/en
Priority to EP91105621A priority patent/EP0451796B1/en
Priority to DE69126730T priority patent/DE69126730T2/de
Priority to US07/682,079 priority patent/US5293588A/en
Publication of JPH0458297A publication Critical patent/JPH0458297A/ja
Application granted granted Critical
Publication of JP3034279B2 publication Critical patent/JP3034279B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Time-Division Multiplex Systems (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、ATM(Asyncronus Transfer Mode)通信、D
SI(Digital Speech Interplation)、パケット通信や
音声認識の分野等において、音声信号中の有音区間を検
出するために用いられる有音検出装置に関する。
(従来の技術) 有音検出装置は、通信や音声認識の分野において、通
信効率や認識率の向上を図る等の重要な役割を果してい
る。
第9図は従来の有音検出装置の構成を示す図であり、
まず入力信号の電力、零点差数、自己相関関数やスペク
トル等の特徴ベクトルを特徴ベクトル計算装置23により
計算する。その後、マッチング装置24によりこの特徴ベ
クトルと音声標準パターン及び雑音標準パターンとの距
離を測定する。そして、例えば特徴ベクトルと音声標準
パターンとの距離の方が短ければ音声と判定し、逆に特
徴ベクトルと雑音標準パターンとの距離の方が短ければ
雑音と判定している。
また、第10図は従来の有音検出装置のもう一つの例を
示す図であり、電力計算装置25が入力フレームの平均電
力P(n)を計算する。また、しきい値更新装置26は、
判定のためのしきい値T(n)を、例えば もしP(n)<T(n)−P(n)×(α−1)なら
ば、T(n+1)=P(n+1)×α もし(n)≧T(n)−P(n)×(α−1)なら
ば、T(n+1)=P(n+1)×γ と更新する。
ここで、α、γは定数である。
そして、しきい値比較装置27が、入力フレームを もしP(n)≧T(n)ならば音声 もしP(n)<T(n)ならば雑音 と識別している。
尚、上記しきい値更新装置26によるしきい値の更新
は、 もしP(n)<T(n)−αならば、 T(n+1)=T(n+1)+α もしP(n)≧T(n)−αならば、 T(n+1)=P(n+1)+γ とするものであってもよい。
ところで、一般的に母音の大半はその電力が背景雑音
電力を上回るが、子音の電力は背景雑音電力を下回るこ
とが多い。そのため、背景雑音の大きな環境において
は、子音区間でも特徴ベクトルに雑音の特徴が大きく出
てしまう。
ところが、上述した従来の有音検出装置においては、
背景雑音の影響を受けた特徴ベクトルをそのまま判定に
用いているため、背景雑音が大きい場合には、子音の検
出誤りが発生するという問題かある。また、音声の特徴
ベクトルとして電力のみを用いた従来の有音検出装置に
おいては、入力レベルが低いときには、音声を雑音と誤
判定することが多いという問題がある。しかして、かか
る事態は通信の分野においては音質の劣化を招き、また
音声認識の分野においては認識率の低下の原因となって
いた。
(発明が解決しようとする課題) このように従来の有音検出装置においては、背景雑音
の影響を受けた特徴ベクトルをそのまま判定に用いてい
るため、背景雑音が大きい場合には、子音の検出誤りが
発生するという問題かある。また、音声の特徴ベクトル
として電力のみを用いた従来の有音検出装置において
は、入力レベルが低いときには、音声を雑音と誤判定す
ることが多いという問題がある。
本発明は、このような事情に基づき成されたもので、
背景雑音の大きな環境でもまた入力レベルに左右される
ことなく良好な検出率を得ることができる有音検出装置
を提供することを目的としている。
[発明の構成] (課題を解決するための手段) 本発明は、上述した課題を解決するために、入力信号
をフレーム単位に分けこの単位毎の入力信号の特徴ベク
トルを計算する特徴ベクトル計算手段と、この特徴ベク
トル計算手段により算出された特徴ベクトルに基づきこ
の特徴ベクトルの有音区間を推定する有音区間推定手段
と、この有音区間推定手段により有音区間でないと推定
されたフレームの特徴ベクトルに基づき雑音標準パター
ンを作成する雑音標準パターン作成手段と、この雑音標
準パターン作成手段により作成された雑音標準パターン
と予め作成しておいた音声標準パターンとを用いて前記
特徴ベクトル計算手段により算出された特徴ベクトルか
ら前記フレーム単位毎の入力信号が音声か雑音のどちら
であるかを判定する判定手段とを具備するものである。
また、第2の発明は、入力信号からフレーム単位でこ
の入力信号の特徴ベクトルを計算する特徴ベクトル計算
手段と、この特徴ベクトル計算手段により算出された特
徴ベクトルを前記入力信号の変動が除去された変換ベク
トルに変換する特徴ベクトル変換手段と、前記特徴ベク
トルに基づき各フレーム単位で有音区間を推定する有音
区間推定手段と、この有音区間推定手段により有音区間
でないと推定された変換ベクトルに基づき雑音標準パタ
ーンを作成する雑音標準パターン作成手段と、 この雑音標準パターン作成手段により作成された雑音
標準パターンと予め作成されている音声標準パターンと
を用いて前記各フレーム毎の入力信号が音声か雑音のど
ちらであるかを判定する判定手段とを具備するものであ
る。
(作 用) 本発明では、雑音と推定された特徴/変換ベクトルを
用いて雑音標準パターンを作成し、この雑音標準パター
ンと予め作成しておいた音声標準パターンとを用いてフ
レーム単位毎の入力信号が音声か雑音のどちらであるか
を判定しているので、背景雑音の大きな環境でもまた入
力レベルに左右されることなく良好な検出率を得ること
ができる。
(実施例) 以下、本発明の実施例の詳細を図面に基づき説明す
る。
第1図は本発明の一実施例に係る有音検出装置の概略
的構成を示すブロック図である。
以下では、入力信号をフレーム単位に分析し音声・雑
音の判定を行っていく。例えば入力信号を8K Hzでサン
プリングし、160サンプルづつまとめて1フレームとす
る。ただし、フレーム長や分析周期は、常に一定長であ
る必要はない。
特徴ベクトル計算装置1は、フレーム単位にDurbin法
等を用いて、線形予測係数を計算する。ここで、線形予
測係数変換して、PARCOR係数、LPCケプストラム、メル
ケプストラム等を計算し、特徴ベクトルとしてもよい。
また、電力、自己相関関数、零交差数等を計算してもよ
い。
現在音声か雑音かを判定しようとしているフレームを
以下では入力フレームと呼ぶ。また、特徴ベクトル計算
装置で得られた入力フレームの特徴ベクトルを とする。nは、フレームのシーケンシャルな番号であ
る。特徴ベクトルは、p次元のベクトルで、 と書き表すことができる。
雑音区間推定装置2は、例えば第2図に示すように、
電力計算装置3、しきい値更新装置4及びしきい値比較
装置5から構成される。
ここで、電力計算装置3は、入力フレームの平均電力
P(n)を計算する。また、しきい値更新装置4は、し
きい値T(n)を次式を用いて更新する。
もしP(n)<T(n)−P(n)×(α−1)なら
ば、T(n+1)=P(n+1)×α もしP(n)≧T(n)−P(n)×(α−1)なら
ば、T(n+1)=P(n+1)×γ ここで、α、γは定数である。
しきい値比較装置5は、入力フレームを もしP(n)≧T(n)ならば音声 もしP(n)<T(n)ならば雑音 と識別する 出力スイッチ6は、雑音区間推定装置2により雑音と
推定された特徴ベクトル を雑音標準パターン作成装置7に転送する。
雑音標準パターン作成装置7は、雑音標準パターンを
作成するもので、例えば第3図に示すように、バッファ
8及び平均・共分散行列計算装置9から構成される。バ
ッファ8は、雑音区間推定装置2により雑音と推定され
た特徴ベクトル を蓄積する。そして、平均・共分散行列計算装置9がバ
ッファ8内に蓄積された特徴ベクトルに基づき雑音標準
パターンを作成する。
判定装置10は、特徴ベクトル計算装置1から出力され
る特徴ベクトル をもとに、有音区間を判定するもので、例えば第4図に
示すように、マッチング装置11、音声標準パターン蓄積
装置12及び上記雑音標準パターン作成装置7により作成
された雑音標準パターンを蓄積する雑音標準パターン蓄
積装置13から構成される。
マッチング装置11は、音声標準パターン及び雑音標準
パターンと特徴ベクトル計算装置1から出力される特徴
ベクトル との距離を測定し、音声標準パターンにマッチングされ
た場合には音声と判定し、雑音標準パターンにマッチン
グされた場合には雑音と判定する。
具体的には、まず次式により各標準パターン(Σi,μ
i)(i=1,2…M+1)との距離を測定する。
なるwiに が属しているとする。もしwiが音声に属していれば、そ
のフレームは音声と判定し、wiが雑音に属していれば、
そのフレームは雑音であると判定する。
ここで、音声標準パターン蓄積装置12に蓄積されてい
る音声標準パターンは、以下のように定義できる。
標準パターンは、マッチング装置11の構成から分るよ
うに、クラスwに属する特徴ベクトルの平均値ベクトル
μ及び共分散行列Σとなる クラスwに属するL個のr次元特徴ベクトルを とする。
また、μiとΣiの要素をm(i)k、σ(i)klとすると、
後述する第5図に示す平均・共分散行列計算装置14によ
り次式を用いて計算される。
標準パターン1〜Mの作成法を第5図に示す。
同図に示すように、標準パターンを作成するために
は、各標準パターンのクラス毎に、音声データベース15
を作成する。
その作成方法は、具体的には、まず複数の被験者に各
クラスに属する音韻を発音してもらい、それを録音す
る。
このようにして得られた音声信号に対し、フレーム単
位に、子音と雑音との区別を付けるためにラベルを付け
ていく。このラベル付けは、音声信号の波形やスペクト
ルを例えばCRTに表示して、それを見ながらフレーム単
位にラベルを付けていく。この音声データベース15に対
応したラベルをラベルデータベース16とする。
そして、音声データベース15から特徴ベクトルを計算
する。その後、ラベルデータベース16を参照して、標準
パターンを作成しようとしているクラスに属するフレー
ムの特徴ベクトルならば、それを用いて平均・共分散行
列計算装置14により平均・共分散を計算する。
しかして、本実施例装置は、雑音と推定された特徴ベ
クトルを用いて雑音標準パターンを作成し、この雑音標
準パターンと音声標準パターンとに基づき音声/雑音の
判定を行っているので、背景雑音の大きな環境でもまた
入力レベルに左右されることなく良好な検出率を得るこ
とができる。
次に、本発明の他の実施例を説明する。
第6図はこの実施例に係る有音検出装置の構成を示す
図である。
同図に示す特徴ベクトル計算装置1は、第1図に示し
たものと同一の構成である。
特徴ベクトル変換装置17は、第7図に示すように構成
されている。
同図に示すバッファ18は、特徴ベクトル がバッファに蓄積される時間の順序関係を保存するため
に、特徴ベクトルがバッファに入力された順番で、当該
特徴ベクトルをバッファのヘッドからテイルに向かって
蓄積する。すなわち、時間的に一番新しい特徴ベクトル
をバッファのヘッドに、一番過去の特徴ベクトルをテイ
ルに蓄積する。このバッファ18の構成を第8図に示す。
同図に示すように、このバッファ18には、しきい値比較
装置19(第7図に示す。)により雑音と推定されたフレ
ームの特徴ベクトルが蓄積される。従って、バッファ18
内の特徴ベクトルは、必ずしも時間的に連続していると
は限らない。
ここで、バッファ18のヘッドのSフレーム目からテイ
ルに向かってNフレーム分の特徴ベクトルの集合をΩ
(n)とし、以下のように表す。
また、 のi番目の要素の集合Ωi(n)は次式により表され
る。
Ωi(n)={xLni(S),xLni(S+1),…xLni(S+N−1} しきい値比較装置19では特徴ベクトル のうちの電力をしきい値T(n)と比較し音声、雑音の
推定を行う。
のうち電力の成分をx1(n)とすると、 もしx1(n)≧T(n)ならば音声 もしx1(n)<T(n)ならば雑音 とする。
しきい値発生装置20では、バッファ18に蓄積された特
徴ベクトルのうち入力フレームのSフレームより過去
(バッファのヘッドからSフレーム目)からバッファの
テイルに向かってNフレーム分の特徴ベクトルの要素 の集合Ωi(n)を取り出し、Ωi(n)の平均値と標
準偏差を計算する。
まず、バッファ18で、ヘッドのSフレーム目からテイ
ルに向かってNフレーム分の特徴ベクトルの要素 を取り出し、これを Ω1(n)={xLn1(S),xLn1(S+1),…xLn1(S+N−1)} とする。
次に、次式を用いて特徴ベクトルの各要素ごとに、平
均値m1と標準偏差σ1を計算する。
また、平均値m1(n)と標準偏差σ1(n)は以下の
ようにも書き表すことができる。
jは次の条件を満たすもので、Σの範囲はjの大きい
方から以下の条件を満足するNフレームを取る。
(x1(j)∈Ω(n)′)&(i<n−S) ここで、Ω(n)′はしきい値比較装置19で雑音と判
断された特徴ベクトルの集合とする。
しきい値T(n)は、しきい値発生装置20で例えば以
下のように計算される。
T(n)=α×m1+β×σ1 ここで、α、βは、任意の数である。
ただし、バッファ18の中にN+Sフレーム分の特徴ベ
クトルが蓄積されるまでは、T(n)は予め与えられた
しきい値T0を取るものとする。
変換装置21は、Ω(n)を用いて特徴ベクトル から背景雑音や入力信号のレベル変動の影響を除去し、 とする。変換ベクトルはr(≦p)次元のベクトルであ
る。
を計算するために、まず、Ω(n)の各要素の平均値と
分散を次式により計算する。
ここで、 を定義する。
各要素は、次式で定義される。
yi(n)=(xi(n)−mi(n))/σi(n) また、次式でもよい。
yi(n)=xi(n)−mi(n) 変換ベクトル の計算例を以下に示す。
例1 は、Ω(n)の平均ベクトル の差をΩ(n)の分散で正規化したものである。ここ
で、i=1,2,……,rであり、r≦pである。
例2 変換ベクトルを のノルムと定義してもよい。
ここで、 はベクトルのノルムを表す。
例3 各要素の組ごとにノルムをとってもよい。例えば、 として、各ベクトルのノルムを用いて、次式で定義す
る。
出力スイッチ22は、しきい値比較装置19により雑音と
推定された変換ベクトル を雑音標準パターン作成装置7に転送する。
雑音標準パターン作成装置7は、雑音標準パターンを
作成するもので、第1図に示したものと同様に構成され
る。ただし、ここでは、バッファ8(第3図参照)は、
変換ベクトル を蓄積する。
判定装置10も、第1図及び第4図に示したものと同様
に構成される。ただし、ここでは、特徴ベクトル変換装
置17から出力される変換ベクトル をもとに、有音区間を判定する。すなわち、マッチング
装置11は、音声標準パターン及び雑音標準パターンと特
徴ベクトル変換装置17から出力される変換ベクトル との距離を測定し、音声標準パターンにマッチングされ
た場合には音声と判定し、雑音標準パターンにマッチン
グされた場合には雑音と判定する。
具体的には、まず次式により各標準パターン(μi,Σ
i)(i=1,2…M+1)との距離を測定する。
なるクラスwiにXが属しているとする。もしwiが音声に
属していれば、そのフレームは音声と判定し、wiが雑音
に属していれば、そのフレームは雑音であると判定す
る。
ここで、音声標準パターン蓄積装置12に蓄積されてい
る音声標準パターンは、以下のように定義できる。
標準パターンは、マッチング装置11の構成から分るよ
うに、クラスwに属する変換ベクトルの平均値ベクトル
μ及び共分散行列Σとなる。
クラスwに属するL個のr次元変換ベクトルを とする。
また、μiとΣiの各要素をm(i)k、σ(i)klとする
と、平均・共分散行列計算装置14により次式を用いて計
算される。
しかして、本実施例装置によれば、特徴ベクトル変換
装置17によって音声の特徴ベクトルから雑音の影響を取
り除き、雑音の標準パターンを適応的に作成しているた
め、S/N比が20dBから14dB程の背景雑音の大きな環境で
も検出率が良好結果が得られた。また、入力レベルに左
右されない検出率が得られた。
[発明の効果] 以上説明したように本発明によれば、雑音と推定され
た特徴/変換ベクトルのみを用いて雑音標準パターンを
作成し、この雑音標準パターンに基づき音声/雑音の判
定を行っているので、背景雑音の大きな環境でもまた入
力レベルに左右されることなく良好な検出率を得ること
ができる。
【図面の簡単な説明】 第1図は本発明の一実施例に係る有音検出装置の構成を
示す図、第2図は第1図に示す雑音区間推定装置の構成
を示す図、第3図は第1図に示す雑音標準パターン作成
装置の構成を示す図、第4図は第1図に示す判定装置の
構成を示す図、第5図は音声標準パターンの作成方法を
説明するための図、第6図は本発明の他の実施例に係る
有音検出装置の構成を示す図、第7図は第6図に示す特
徴ベクトル変換装置の構成を示す図、第8図は第7図に
示すバッファの構成を示す図、第9図及び第10図は従来
の有音検出装置の構成を示す図である。 1……特徴ベクトル計算装置、2……雑音区間推定装
置、7……雑音標準パターン作成装置、10……判定装
置。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭61−48898(JP,A) 特開 平2−282798(JP,A) 特開 平2−26640(JP,A) 特開 平3−48900(JP,A) 特公 平5−56512(JP,B2) 1990年電子情報通信学会春季全国大会 第1分冊 「A−228 背景雑音への 適応変換に基づく有音検出方式」p.1 −228 1989年電子情報通信学会春季全国大会 第3分冊 「B−372 ATM通信の ための音声セル化方式」p.3−78 電子情報通信学会技術研究報告[通信 ],Vol.89,No.132,CS89− 33「音声パケット通信のための有音検出 方式」p.61−66(1989年7月19日発 表) (58)調査した分野(Int.Cl.7,DB名) G10L 11/02 G10L 15/04 JICSTファイル(JOIS)

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】ある長さごとに区切ったフレームを単位と
    して入力された入力音声信号の特徴ベクトルを求める特
    徴ベクトル計算手段と、 前記特徴ベクトル計算手段により算出された特徴ベクト
    ルに基づき前記入力音声信号が雑音であるか否かをフレ
    ームごとに仮に判定する有音区間推定手段と、 この有音区間推定手段により雑音であると仮に判定され
    たフレームの前記特徴ベクトル計算手段により求められ
    た特徴ベクトルに基づき雑音標準パターンを作成する雑
    音標準パターン作成手段と、 この雑音標準パターン作成手段により作成された雑音標
    準パターンと予め作成しておいた音声標準パターンとを
    用いて、前記特徴ベクトル計算手段により算出された特
    徴ベクトルから前記入力音声信号のフレームが音声に属
    するか雑音に属するかを判定する判定手段とを具備する
    ことを特徴とする有音検出装置。
  2. 【請求項2】ある長さごとに区切ったフレームを単位と
    して入力された人力音声信号の特徴ベクトルを求める特
    徴ベクトル計算手段と、 前記入力音声信号のフレームの特徴ベクトルを前記入力
    音声信号の変動が除去された変換ベクトルに変換する特
    徴ベクトル変換手段と、 前記特徴ベクトル計算手段により算出された特徴ベクト
    ルに基づき前記入力音声信号が雑音であるか否かをフレ
    ームごとに仮に判定する有音区間推定手段と、 この有音区間推定手段により雑音であると仮に判定され
    たフレームの前記特徴ベクトル変換手段により求められ
    た変換ベクトルに基づき雑音標準パターンを作成する雑
    音標準パターン作成手段と、 この雑音標準パターン作成手段により作成された雑音標
    準パターンと予め作成しておいた音声標準パターンとを
    用いて、前記特徴ベクトル変換手段により算出された変
    換ベクトルから前記入力音声信号のフレームが音声に属
    するか雑音に属するかを判定する判定手段とを具備する
    ことを特徴とする有音検出装置。
  3. 【請求項3】前記特徴ベクトル変換手段は、前記有音区
    聞推定手段により雑音であると仮に判定されたフレーム
    の前記特徴ベクトル計算手段により求められた特徴ベク
    トルを複数フレーム分蓄積する蓄積手段と、この蓄積手
    段に蓄積された前記複数フレーム分の特徴ベクトルを用
    いて、前記入力音声信号のフレームの特徴ベクトルを変
    換ベクトルに変換する変換手段とからなることを特徴と
    する請求項2記載の有音検出装置。
  4. 【請求項4】前記変換手段は、前記入力音声信号のフレ
    ームの特徴ベクトルと前記蓄積手段に蓄積された前記複
    数フレーム分の特徴ベクトルとの距離ベクトルを求める
    ことによって、前記入力音声信号のフレームの特徴ベク
    トルを前記変換ベクトルに変換することを特徴とする請
    求項3記載の有音検出装置。
  5. 【請求項5】ある長さごとに区切ったフレームを単位と
    して入力された入力音声信号の特徴ベクトルを求める特
    徴ベクトル生成ステップと、 前記特徴ベクトル生成ステップにより算出された特徴ベ
    クトルに基づき、前記入力音声信号が雑音であるか否か
    をフレームごとに仮に判定する雑音判定ステップと、 前記雑音判定ステップにより雑音であると仮に判定され
    たフレームの前記特徴ベクトル生成ステップにより求め
    られた特徴ベクトルに基づき、雑音標準パターンを作成
    する雑音標準パターン作成ステップと、 前記雑音標準パターン作成ステップにより作成された雑
    音標準パターンと予め作成しておいた音声標準パターン
    とを用いて、前記特徴ベクトル生成ステップにより算出
    された特徴ベクトルから前記入力音声信号のフレームが
    音声に属するか雑音に属するかを判定する有音判定ステ
    ップとを有することを特徴とする有音検出方法。
  6. 【請求項6】ある長さごとに区切ったフレームを単位と
    して入力された入力音声信号の特徴ベクトルを求める特
    徴ベクトル生成ステップと、 前記特徴ベクトル生成ステップにより算出された特徴ベ
    クトルに基づき、前記入力音声信号が雑音であるか否か
    をフレームごとに仮に判定する雑音判定ステップと、 前記入力音声信号のフレームの特徴ベクトルを前記入力
    音声信号の変動が除去された変換ベクトルに変換する特
    徴ベクトル変換ステップと、 前記雑音判定ステップにより雑音であると仮に判定され
    たフレームの前記特徴ベクトル変換ステップにより求め
    られた変換ベクトルに基づき、雑音標準パターンを作成
    する雑音標準パターン作成ステップと、 前記雑音標準パターン作成ステップにより作成された雑
    音標準パターンと予め作成しておいた音声標準パターン
    とを用いて、前記特徴ベクトル変換ステップにより算出
    された変換ベクトルから前記入力音声信号のフレームが
    音声に属するか雑音に属するかを判定する有音判定ステ
    ップとを有することを特徴とする有音検出方法。
JP2172028A 1990-04-09 1990-06-27 有音検出装置および有音検出方法 Expired - Fee Related JP3034279B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2172028A JP3034279B2 (ja) 1990-06-27 1990-06-27 有音検出装置および有音検出方法
CA002040025A CA2040025A1 (en) 1990-04-09 1991-04-08 Speech detection apparatus with influence of input level and noise reduced
EP91105621A EP0451796B1 (en) 1990-04-09 1991-04-09 Speech detection apparatus with influence of input level and noise reduced
DE69126730T DE69126730T2 (de) 1990-04-09 1991-04-09 Sprachdetektor mit vermindertem Einfluss von Engangssignalpegel und Rauschen
US07/682,079 US5293588A (en) 1990-04-09 1991-04-09 Speech detection apparatus not affected by input energy or background noise levels

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2172028A JP3034279B2 (ja) 1990-06-27 1990-06-27 有音検出装置および有音検出方法

Publications (2)

Publication Number Publication Date
JPH0458297A JPH0458297A (ja) 1992-02-25
JP3034279B2 true JP3034279B2 (ja) 2000-04-17

Family

ID=15934189

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2172028A Expired - Fee Related JP3034279B2 (ja) 1990-04-09 1990-06-27 有音検出装置および有音検出方法

Country Status (1)

Country Link
JP (1) JP3034279B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3157788B2 (ja) 1998-11-12 2001-04-16 埼玉日本電気株式会社 携帯型情報端末
JP4497911B2 (ja) * 2003-12-16 2010-07-07 キヤノン株式会社 信号検出装置および方法、ならびにプログラム
JP2007114413A (ja) * 2005-10-19 2007-05-10 Toshiba Corp 音声非音声判別装置、音声区間検出装置、音声非音声判別方法、音声区間検出方法、音声非音声判別プログラムおよび音声区間検出プログラム
JP4282704B2 (ja) 2006-09-27 2009-06-24 株式会社東芝 音声区間検出装置およびプログラム
JP4950930B2 (ja) 2008-04-03 2012-06-13 株式会社東芝 音声/非音声を判定する装置、方法およびプログラム

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
1989年電子情報通信学会春季全国大会 第3分冊 「B−372 ATM通信のための音声セル化方式」p.3−78
1990年電子情報通信学会春季全国大会 第1分冊 「A−228 背景雑音への適応変換に基づく有音検出方式」p.1−228
電子情報通信学会技術研究報告[通信],Vol.89,No.132,CS89−33「音声パケット通信のための有音検出方式」p.61−66(1989年7月19日発表)

Also Published As

Publication number Publication date
JPH0458297A (ja) 1992-02-25

Similar Documents

Publication Publication Date Title
US5749068A (en) Speech recognition apparatus and method in noisy circumstances
EP2431972B1 (en) Method and apparatus for multi-sensory speech enhancement
JP2692581B2 (ja) 音響カテゴリ平均値計算装置及び適応化装置
US6721699B2 (en) Method and system of Chinese speech pitch extraction
US5459815A (en) Speech recognition method using time-frequency masking mechanism
EP1355296B1 (en) Keyword detection in a speech signal
JPH05216490A (ja) 音声コード化装置及び方法並びに音声認識装置及び方法
NZ316124A (en) Pattern recognition for speech recognising noise signals signatures
JP3298858B2 (ja) 低複雑性スピーチ認識器の区分ベースの類似性方法
EP1693826A1 (en) Vocal tract resonance tracking using a nonlinear predictor and a target-guided temporal constraint
JP3533696B2 (ja) 音声認識の境界推定方法及び音声認識装置
JPH10105187A (ja) クラスタ構成をベースとする信号セグメント化方法
JP3034279B2 (ja) 有音検出装置および有音検出方法
JP2898568B2 (ja) 声質変換音声合成装置
JP4673828B2 (ja) 音声信号区間推定装置、その方法、そのプログラム及び記録媒体
JP2002366192A (ja) 音声認識方法及び音声認識装置
JP3039623B2 (ja) 音声認識装置
JP4666129B2 (ja) 発声速度正規化分析を用いた音声認識装置
JP4755555B2 (ja) 音声信号区間推定方法、及びその装置とそのプログラムとその記憶媒体
JP2000075889A (ja) 音声認識システム及び音声認識方法
JP4691079B2 (ja) 音声信号区間推定装置、方法、プログラムおよびこれを記録した記録媒体
JPH11212588A (ja) 音声処理装置、音声処理方法、及び音声処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001083978A (ja) 音声認識装置
JP2000075888A (ja) ヒドン・マルコフ・モデルの学習方法及び音声認識システム
JP3032215B2 (ja) 有音検出装置及びその方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees