JPH01502858A - 音声フレーム中の基本周波数の存在を検出する装置および方法 - Google Patents

音声フレーム中の基本周波数の存在を検出する装置および方法

Info

Publication number
JPH01502858A
JPH01502858A JP63503536A JP50353688A JPH01502858A JP H01502858 A JPH01502858 A JP H01502858A JP 63503536 A JP63503536 A JP 63503536A JP 50353688 A JP50353688 A JP 50353688A JP H01502858 A JPH01502858 A JP H01502858A
Authority
JP
Japan
Prior art keywords
frame
response
calculating
value
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63503536A
Other languages
English (en)
Other versions
JPH0795239B2 (ja
Inventor
トムソン,デビッド リン
Original Assignee
アメリカン テレフォン アンド テレグラフ カムパニー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アメリカン テレフォン アンド テレグラフ カムパニー filed Critical アメリカン テレフォン アンド テレグラフ カムパニー
Publication of JPH01502858A publication Critical patent/JPH01502858A/ja
Publication of JPH0795239B2 publication Critical patent/JPH0795239B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Oscillators With Electromechanical Resonators (AREA)
  • Interface Circuits In Exchanges (AREA)
  • Radio Relay Systems (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Telephonic Communication Services (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】 適応しきい値有声音検出器 [技術分野] 本発明は通常有声音/無声音判別と呼ばれるところの音声が基本周波数を含むか 否かの判定に関する。さらにとくには、無声音/有声音判別は2段有声音検出器 により行われ、統計的手法を用いて最終しきい値が音声環境に適応的に計算され る。
[背景技術及び問題点コ 低ビット速度音声コーダにおいてはしばしば、不正確な音声判別のために音声品 質の低下が生ずる。これらの音声判別を正確に行う際の困難な点は、単一の音声 パラメータすなわち類別子(classifier)では有声音音声と無声音音 声との識別に信頼性がないという事実にある。音声判定を行うために、多重音声 類別子を重みつき和の形に組合わせることは当業者に周知である。この方法は通 常識別分析と呼ばれる。この方法は、デー・ピー・ブレザス(D、P、Prez as)他による「パターン認識および適応時間−領域分析を用いた迅速かつ正確 なピッチ検出」、I EEE音響・音声および信号処理国際会議資料、第1巻、 109−112ページ、1986年4月 (“Fast and Accura te Pitch Detection Using Pattern Rec ognition and Adaptive Time−Domain An alysis ” 、Proc、1EEEInt、Conf、Acoust、、 5peech and Signal Proc、、Vol、1.pp109− 112.April 1986)に記載されている。この論文の説明のように、 音声類別子の重みつき和がもしある特定のしきい値より大であれば音声フレーム は有声音と宣言され、もしそうでなければ無声音と宣言される。重み及びしきい 値は音声の学習(Training) セット上の性能を最大化するように選択 されるが、ここで各フレームの音声化(voteing)は既知である。
固定重みつき和による方法に付帯する問題点は、音声環境が変化する場合にそれ が良好に実行しないことである。その原因は、しきい値が、非線形ひずみ、及び ろ波による影響を受けて音声とは異なる学習セットからの決定されることである 。
しきい値を変化する音声環境に適応させるための一方法が、エイチ・ハサナイン (H,Hassanein)他の論文「改良形音声検出器を用いたリアルタイム 環境におけるGold−Rabinerピッチ検出器の使用」、I EEE音響 ・音成および信号処理学会トランザクション、1988年、東京、第ASSP− 33巻、第1号、319−320ページ(”Implementation o f the Gold−Rabiner Pitch Detector in  aReal Time Environment Using an Imp roved Voicing Detector ”、IEEE Transa ctions on Acoustic、5peech and Signal  Processing、198B、Tokyo、Vol、ASSP−33,N o、1.pp319−320)に開示されている。
この論文は、3つの異なるパラメータをこれらのパラメータに付属の独立しきい 値と比較し、各比較に基づいて適応しきい値を1つずつ増加または減少する試行 的方法を開示している。使用される3つのパラメータは、信号のエネルギー、第 1の反射係数、およびゼロクロスカウント数である。例えば、もし音声信号エネ ルギーがあらかじめ定義されたエネルギーレベルより小さければ、適応しきい値 が1つ増加される。一方もし音声信号エネルギーが他のあらかじめ定義されたエ ネルギーレベルより大きければ、適応しきい値が1つだけ減少される。適応しき い値が計算された後に、それが基本ピッチ検出器の出力から差引かれる。もし差 引かれた結果が正の数を与えれば、音声フレームは有声音と宣言され、そうでな ければ音声フレームは無声音と宣される。開示の方法に伴う問題点は、パラメー タ自身が基本ピッチ検出器において使用されないことである。従って、適応しき い値の調節は特別のものであり、それが計算される元の物理現象とは直接連結さ れていない。さらに、しきい値は変化する音声環境には迅速に適応可能ではない 。
[解決法] 上記の問題点は、適応統計的装置を使用することにより変化する環境に適応して 音声判別を行う音声判別装置により解決されかつ技術的進歩が達成される。統計 的値は有声音検出器の出力に基づいて統計的手法を使用することにより変化する 環境に適応される。フレームの音声属性に応答して音声フレーム内における基本 周波数の存在を指示する一般値を発生する有声音検出器により統計的パラメータ が計算される。第2番目に、発生された値に応答して音声フレームの無声音のも のおよび有声音のものに対する平均が計算される。2つの平均は次に判別領域を 決定するのに使用され、判別領域および現在の音声フレームとに応答して基本周 波数の存在の判定が行われる。
現在および過去の音声フレームの音声属性に応答して、現在の音声フレームが無 声音である確率を計算すること、あるフレームが無声音であろうという総合確率 を計算すること、および現在の音声フレームが有声音である確率を計算すること 、により無声音フレームに対する平均が計算されることが好ましい。次に現在の 音声フレームが無声音である確率および総合確率とに応答して無声音音声フレー ムの平均が計算される。さらに、現在の音声フレームが有声音である確率および 総合確率に応答して有声音音声フレームの平均が計算される。確率の計算は最尤 (ゆう)(ωaxfum 1ikelihood)統計的手法を用いることによ り実行されるのが好ましい。
一般値の発生は識別分析手法を用いて実行され、音声属性は音声類別子であるこ とが好ましい。
判定領域は、現在及び過去のフレームの一般値および有声音および無声音のフレ ームに応答して、無声音および有声音の音声フレームの平均、重み、および発生 されたしきい値により定義される。
音声フレーム内における基本周波数の存在を検出するための方法は、現在の音声 のフレームの音声フレームを定義する1組の類別子に応答して一般値を発生して 基本周波数の存在を指示するステップ、一般値に応答して1組の統計的パラメー タを計算するステップ、および一般値と計算された統計的パラメータとに応答し て基本周波数の存在を判定するステップ、を含む。一般値を発生するステップは 識別分析手法を用いて実行される。さらに基本周波数を判定するステップは、1 組のパラメータに応答して重み値およびしきい値を計算するステップを含む。
[図面の簡単な説明] 第1図は本発明をブロック図の形で表わした図;第2図および第3図は第1図の 有声音検出装置により実行されるある種の機能をさらに詳細に表わした図である 。
[詳細な説明] 第1図は識別変数または一般変数を発生するために音声類別子を処理するための 識別有声音検出器をまず利用することにより無声音/有声音判別動作を実行する ための装置を示す。後者の変数は有声音判別を行うために統計的分析される。統 計的分析は、種々の音声環境において信頼できる性能を与えるように無声音/有 声音判別を行うときに利用されるしきい値に適応する。
二こで、第1図に示す装置の全体的動作を考えてみる。類別子発生器100は各 音声フレームに応答して、音声エネルギーの対数(log)、LPG (線形予 測分析)ゲインの対数、第1反射係数の対数面積比、および1ピッチ周期だけオ フセットされている1フレーム長の2つの音声セグメントの二乗相関係数あるこ とが好ましい類別子(classifier)を発生する。これらの類別子の計 算は、アナログ音声をディジタルにサンプリングすること、ディジタルサンプル のフレームを形成すること、およびこれらのフレームを処理すること、を含み、 これは当業者には周知である。発生器100は通路106を介して類別子を沈黙 検出器101および識別有声音検出器102に伝送する。識別有声音検出器10 2は通路10Bを介して受けとられた類別子に応答して識別値Xを計算する。検 出器102は式x−c’ y+clを実行することによりこの計算を実行する。
“C′は重みを含むベクトル、“y2は類別子を含むベクトル、および“d”は しきい値を表わすスカラーであることが好ましい。
ベクトルCの成分は、音声エネルギーの対数に対応する成分は0゜391860 6に、LPGゲインの対数に対応する成分は−0,0520902に、第1反射 係数の対数面積化に対応する成分は0.5637082に、および二乗相関係数 に対応する成分は1.381249に等しく初期化し、またdは最初−8,38 454に等しく初期化することが好ましい。識別変数Xを計算した後に検出器1 02は通路111を介してこの値を統計的計算器103および減算器107に伝 送する。
沈黙検出器101は通路106を介して伝送された類別子に応答して、通路10 9上で類別子発生器100によって受取られたデータ上に音声が存在するか否か を判定する。音声の存在の指示は沈黙検出器101により通路110を介して統 計的計算器103に伝送される。
各音声フレームに対して検出器102は識別値Xを発生しそれを通路111を介 して伝送する。統計的計算器103は、現在の沈黙でないフレームに対する識別 値内でそれ以前の沈黙でないフレームと平均をとることにより、通路111を介 して受取られる識別値の平均を維持する。統計的計算器103は通路110を介 して受取られた信号に応答して、あるフレームが無声音である総合確率およびあ るフレームが有声音である確率とを計算する。さらに統計的計算器103は、そ のフレームが無声音であった場合に現フレームに対する識別値が有するであろう と統計値およびそのフレームが有声音であった場合に現フレームに対する識別値 が有するであろうと統計値とを計算する。この統計値は平均値であることが好ま しい。計算器103により行われる計算は、現フレームに基づくのみでなくそれ 以前のフレームにも基づいている。統計的計算器103は、これらの計算を、通 路10Bを介して受取られる現フレームに対する識別値および類別子の平均に基 づくのみでなく、重みおよびフレームが無声音であるかまたは有声音であるかを 判別するところの、通路113を介して、しきい値計算器104から受取られた しきい値に基づいて行う。
計算器104は、計算器103により発生された通路112を介して受取られた 現フレームに対する類別子の確率及び統計値に応答して、重み値aととして使用 される値および現フレームに対するしきい値b1とを再計算する。次にこれらの 新しいaおよびbの値は通路113を介して統計的計算器103に逆伝送される 。
計算器104は、重み、しきい値及び統計値、とを通路114を介してU/V判 別器105に伝送する。後者の判別器は通路114および115を介して伝送さ れた情報に応答してこのフレームが無声音であるかまたは有声音であるかを判別 し、この判別を通路11Bを介して伝送する。
二こで、第1図に示すブロックの103.104.105および107の動作を さらに詳細に説明する。統計的計算器103は、エヌ・イー・ディ (N、E、 Day)著の「混合正規分布の成分の推定」 (“Estimating th e Components of a ++l1xture of Norma l Distribution ”、ビオメトリカ[BioIIetrika] 誌、第56巻、第3号、463−474ページ、1969年)という題名の文献 に記載されたものに類似の改良E Mアルゴリズムを実行する。くずし平均(d ecaying average)の概念を用いて、計算器103は次式1.2 および3を計算することにより、現フレームおよびそれ以前のフレームに対する 識別値の平均を計算する。
n = n+1 if n < 2000 (1)Xnは現フレームのための識 別値であって通路illを介して検出器102から受取られ、2000までの処 理フレーム数である。2はくずし平均係数を示し、X は現フレームおよび過去 のフレームに対する識別子の平均を示す。統計的計算器10gは2、X および X、値の受領に応答して、次のようにまずxnの二次モーメントQnを計算する ことにより共分散値Tを計算する。
へ=(1−z)も−H+ 7XA 、 (4)Q が計算されると、次のように Tが計算される。
T=偽−Xヱ、(5) 現フレームの識別値から次のように平均値が差引かれる。
Xn= X!I−Xn (6) 次に計算器103は以下に示す式(7)を解くことにより、現在値X により表 わされるフレームが無声音である確率を決定する。
(7)式を解いた後に計算器103は次式を解くことにより、識別値が有声音フ レームを表わす確率を決定する。
P(v lx、) = 1−P(u lXl1) −(8)次に計算器103は p をめる式(9)を解くことにより、あるフレームが無声音であろうという総 合確率を決定する。
PR” (1−z) Pn−1+ Z PCu Ixn) −(9)フレームが 無声音であろうという確率を決定した後に、計算器103は無声音型および有声 音型の両方のフレームに対する識別値の平均値を与える2つの値UおよびVを決 定する。統計的平均無声音値である値Uは、もしフレームが無声音であるならば 平均識別値を含み;また統計的平均有声音値である値Vは、もしフレームが音声 音であるならば平均識別値を与える。以下に示すように、現フレームに対する値 Uは式(10)を計算することにより解かれ、現フレームに対する値Vは式(1 1)を計算することにより決定される。
un = (1−Z) u、1+ Z Xn P(ulx?l、/p、 −zx 、 (10)Vn= (1−z) ’n−1+ z X、 P(vlx、l)/ (1−p、、) −Dtrs (11)ここで計算器103は、通路112を介 してUおよびv1値T1および確率P をしきい値計算器104に伝送する。
計算器104はこの情報に応答してaおよびbに対する新しい値を計算する。次 にこれらの新しい値は通路113を介して統計的計算器103に逆伝送される。
これにより変化する環境に迅速に適応可能である。nが好ましくは99以上にな ると、値aおよびbは次式のように計算される。値aは次式を解くことにより決 定される。
値すは次式を解くことにより決定される。
b = −> a(un+v!l) + log[(1−Pn)/Pr+ 1  、 (13)式(12)および(13)を計算した後に、計算器104は通路1 14を介して値a、U、およびVをブロック105に伝送する。
判別器105はこの伝送された情報に応答して現フレームが有声音であるかまた は無声音であるかを判別する。もし値が正であれば、このときは、もし次式が真 であるならばフレームは有声音であると宣言される。
偽−a(u++”V、)/2 ) O; (14)またはもし値が負であれば、 このときは、もし次式が真であるならばフレームは有声音であると宣言される。
ax、 −a(u、+vn)/2 < O、(15)式(14)はまた次式のよ うに表わされる。
ax +b−1og [(1−p )/p コ 〉On n 0 式(15)はまた次式のようにも表わされる。
axn+b−1og [(1−pn)/pn) <0もし前記の条件が満たされ ないならば、判別器105はフレームが無声音であると宣言する。
第2図および第3図は第1図の装置により実施される操作を流れ図の形式でさら に詳細に示す。ブロック200は第1図のブロック101を実行する。ブロック 202ないし218は統計的計算器103を実行する。ブロック222はしきい 値計算器104を実行し、ブロック226ないし238は第1図のブロック10 5を実行する。減算器107はブロック208およびブロック224により実行 される。ブロック202は現フレームとそれ以前の全てのフレームとに対する識 別値の平均を表わす値を計算する。ブロック200は現フレーム内には音声が存 在するか否かを判別し、そしてもし現フレーム内に音声が存在しなければ、制御 が判別ブロック226に引渡される前にブロック224により現識別値から識別 値に対する平均が差引かれる。
しかしながら、現フレーム内に音声が存在すれば、このときはブロック202な いし222により統計的計算および重み計算が実行される。まず、第1番目にブ ロック202において平均値がめられる。第2番目にブロック206において2 次モーメントが計算される。次にブロック206においてもまた、現フレームお よび過去のフレームに対する平均値Xと共に後者の値が使用されてTを計算する 。次にブロック208において識別値X から平均Xが差引かれる。
ブロック210は、現在の重み値a1現在のしきい値b1および現フレームに対 する識別値X とを利用することにより、現フレームが無声音である確率を計算 する。現フレームが無声音であるという確率を計算した後に、ブロック212に より現フレームが有声音であるという確率が計算される。次にブロック214よ りあるフレームが無声音であろうという総合確率p が計算される。
ブロック216および218は2つの値UおよびVを計算する。値Uは、もしそ のフレームが無声音であったならば識別値がもつであろう統計的平均値を表わす 。値Vは、もしそのフレームが有声音であったならば識別値がもつであろう統計 的平均値を表わす。
現フレームおよびそれ以前のフレームに対する実際の識別値は値Uまたは値Vの 周りにクラスタ(集団化)される。もしこれらのフレームが無声音であることが 判ると、それ以前のフレームおよび現フレームに対する識別値は値Uのまわりに クラスタされ二そうでなければそれ以前の値は値Vのまわりにクラスタされる。
ブFIG、2 国際調査報告 FIG、3

Claims (14)

    【特許請求の範囲】
  1. (1)1つの音声フレームの音声属性を定義する1組の類別子に応答して基本周 波数の存在を指示する一般値を発生するための手段; 前記一般値に応答して、1組の統計的パラメータを計算するための手段;および 前記一般値および計算された1組の統計的パラメータに応答して前記基本周波数 の前記存在を判定するための手段;を含む音声フレーム内における基本周波数の 存在を検出するための装置。
  2. (2)前記発生手段が前記一般値を発生するために識別分析を実行するための手 段を含むことを特徴とする請求項1に記載の装置。
  3. (3)前記判定手段が: 前記1組の前記パラメータに応答してしきい値を計算するための手段; 前記1組の前記パラメータに応答して重み値を計算するための手段;および 前記重み値およびしきい値を、前記音声フレームの他の1つに対する他の組のパ ラメータを計算するのに使用される前記1組のパラメータを計算するための前記 手段に連絡するための手段;を含むことを特徴とする請求項1に記載の装置。
  4. (4)前記1組のパラメータを計算するための前記手段が、連絡された1組の重 み値およびしきい値および前記フレームの前記他の1つの他の一般値にさらに応 答して他の1組の統計的パラメータを計算することを特徴とする請求項3に記載 の装置。
  5. (5)前記1組のパラメータを計算するための前記手段が:前記音声フレームの 現在および以前のものへの前記一般値の平均を計算するための手段;および 前記音声フレームの現在および以前のものに対する前記一般値の前記平均、前記 連絡された重みおよびしきい値、および前記他の一般値、に応答して前記他の組 の統計的パラメータを決定するための手段; をさらに含むことを特徴とする請求項4に記載の装置。
  6. (6)1つの音声フレームの音声属性を定義する1組の類別子に応答して基本周 波数の存在を指示する一般値を発生するための手段; 前記一般値に応答して前記フレームの無声音のものに対する平均を推定するため の手段; 前記一般値に応答して前記フレームの有声音のものに対する平均を推定するため の手段; 前記フレームの無声音のものに対する前記平均と前記フレームの有声音のものに 対する前記平均とに応答して判別領域を決定するための手段;および 前記判別領域および前記フレームの現在のものとに応答して前記基本周波数の前 記存在を判定するための手段;を含む音声フレーム内に於ける基本周波数の存在 を検出するための装置。
  7. (7)前記判定のための手段が: 前記音声フレームの前記現在および以前のものへの前記一般値の分散を計算する ための手段; 前記フレームの無声音のものに対する前記平均、前記フレームの有声音のものの 前記平均、および前記分散、に応答して前記判別領域を発生するための手段; 前記フレームの前記現在および過去のものに応答して前記フレームの現在のもの が無声音である確率を計算するための手段を含む前記無声音フレームの前記平均 を推定するための前記手段;前記フレームの前記現在および過去のものと、前記 フレームの前記現在のものが無声音である確率とに応答してあるフレームが無声 音であろうという総合確率を計算するための手段;前記フレームの現在のものが 有声音である確率を計算するための手段をさらに含む前記有声音フレームの前記 平均を推定するための前記手段; 前記フレームの前記現在のものが無声音である前記確率、前記総合確率、および 前記分散、に応答して前記フレームの前記無声音のものの前記平均を計算するた めの手段;および前記フレームの前記現在のものが有声音である前記確率、前記 総合確率、および前記分散、に応答して前記フレームの前記有声音のものの前記 平均を計算するための手段;を含むことを特徴とする請求項6に記載の装置。
  8. (8)前記フレームの前記現在のものが無声音である前記確率を計算するための 前記手段が最大統計的動作を実行することを特徴とする請求項7に記載の装置。
  9. (9)前記フレームの前記現在のものが無声音である前記確率を計算するための 前記手段がさらに重み値およびしきい値に応答して最大統計的動作を実行するこ とを特徴とする請求項8に記載の装置。
  10. (10)1つの音声フレームの音声属性を定義する1組の類別子に応答して基本 周波数の存在を指示する一般値を発生するステップ; 前記一般値に応答して、1組のパラメータを計算するステップ;および 前記一般値および計算された前記1組の統計的パラメータとに応答して前記基本 周波数の前記存在を判定するステップ;を含む音声フレーム内における周波数の 存在を検出するための方法。
  11. (11)前記発生するステップが前記一般値を発生するために識別分析を実行す るステップを含むことを特徴とする請求項10に記載の方法。
  12. (12)前記判定するステップが: 前記1組の前記パラメータに応答してしきい値を計算するステップ; 前記1組の前記パラメータに応答して重み値を計算するステップ;および 前記重み値およびしきい値を、前記音声フレームの他の1つに対する他の組のパ ラメータを計算するのに使用される前記1組のパラメータを計算するための前記 手段に連絡するステップ;を含むことを特徴とする請求項11に記載の方法。
  13. (13)前記1組のパラメータを計算する前記ステップが、連絡された1組の重 み値およびしきい値および前記フレームの前記他の1つの他の一般値にさらに応 答して他の1組の統計的パラメータを計算することを特徴とする請求項12に記 載の方法。
  14. (14)前記1組のパラメータを計算する前記ステップが、前記音声フレームの 現在および以前のものへの前記一般値の平均を計算するステップ;および 前記音声フレームの現在および以前のものに対する前記一般値の前記の平均、前 記連絡された重みおよびしきい値、および前記他の一般値、に応答して前記他の 組の統計的パラメータを決定するステップ; をさらに含むことを特徴とする請求項13に記載の方法。
JP63503536A 1987-04-03 1988-01-12 音声フレーム中の基本周波数の存在を検出する装置および方法 Expired - Fee Related JPH0795239B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US3429887A 1987-04-03 1987-04-03
US34298 1987-04-03
PCT/US1988/000031 WO1988007739A1 (en) 1987-04-03 1988-01-12 An adaptive threshold voiced detector

Publications (2)

Publication Number Publication Date
JPH01502858A true JPH01502858A (ja) 1989-09-28
JPH0795239B2 JPH0795239B2 (ja) 1995-10-11

Family

ID=21875533

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63503536A Expired - Fee Related JPH0795239B2 (ja) 1987-04-03 1988-01-12 音声フレーム中の基本周波数の存在を検出する装置および方法

Country Status (9)

Country Link
EP (1) EP0309561B1 (ja)
JP (1) JPH0795239B2 (ja)
AT (1) ATE83329T1 (ja)
AU (1) AU598933B2 (ja)
CA (1) CA1336208C (ja)
DE (1) DE3876569T2 (ja)
HK (1) HK21794A (ja)
SG (1) SG60993G (ja)
WO (1) WO1988007739A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3875894T2 (de) * 1987-04-03 1993-05-19 American Telephone & Telegraph Adaptive multivariable analyseeinrichtung.
US5195138A (en) * 1990-01-18 1993-03-16 Matsushita Electric Industrial Co., Ltd. Voice signal processing device
US5204906A (en) * 1990-02-13 1993-04-20 Matsushita Electric Industrial Co., Ltd. Voice signal processing device
DE69130687T2 (de) * 1990-05-28 1999-09-09 Matsushita Electric Ind Co Ltd Sprachsignalverarbeitungsvorrichtung zum Herausschneiden von einem Sprachsignal aus einem verrauschten Sprachsignal

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60114900A (ja) * 1983-11-25 1985-06-21 松下電器産業株式会社 有音・無音判定法
JPS60200300A (ja) * 1984-03-23 1985-10-09 松下電器産業株式会社 音声の始端・終端検出装置
JPS6148898A (ja) * 1984-08-16 1986-03-10 松下電器産業株式会社 音声の有声無声判定装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3875894T2 (de) * 1987-04-03 1993-05-19 American Telephone & Telegraph Adaptive multivariable analyseeinrichtung.

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60114900A (ja) * 1983-11-25 1985-06-21 松下電器産業株式会社 有音・無音判定法
JPS60200300A (ja) * 1984-03-23 1985-10-09 松下電器産業株式会社 音声の始端・終端検出装置
JPS6148898A (ja) * 1984-08-16 1986-03-10 松下電器産業株式会社 音声の有声無声判定装置

Also Published As

Publication number Publication date
WO1988007739A1 (en) 1988-10-06
HK21794A (en) 1994-03-18
SG60993G (en) 1993-07-09
AU1700788A (en) 1988-11-02
CA1336208C (en) 1995-07-04
JPH0795239B2 (ja) 1995-10-11
ATE83329T1 (de) 1992-12-15
EP0309561B1 (en) 1992-12-09
DE3876569T2 (de) 1993-04-08
DE3876569D1 (de) 1993-01-21
AU598933B2 (en) 1990-07-05
EP0309561A1 (en) 1989-04-05

Similar Documents

Publication Publication Date Title
US6993481B2 (en) Detection of speech activity using feature model adaptation
US5611019A (en) Method and an apparatus for speech detection for determining whether an input signal is speech or nonspeech
EP0335521B1 (en) Voice activity detection
US5276765A (en) Voice activity detection
US5596680A (en) Method and apparatus for detecting speech activity using cepstrum vectors
EP2351020A1 (en) Methods and apparatus for noise estimation in audio signals
Haigh et al. A voice activity detector based on cepstral analysis.
Moattar et al. A new approach for robust realtime voice activity detection using spectral pattern
US5007093A (en) Adaptive threshold voiced detector
US5046100A (en) Adaptive multivariate estimating apparatus
Özaydın Examination of energy based voice activity detection algorithms for noisy speech signals
JPH01502858A (ja) 音声フレーム中の基本周波数の存在を検出する装置および方法
US4972490A (en) Distance measurement control of a multiple detector system
JP2797861B2 (ja) 音声検出方法および音声検出装置
Hu et al. A robust voice activity detector using an acoustic Doppler radar
JPH01502779A (ja) 適応多変数推定装置
JPH0449952B2 (ja)
EP0310636B1 (en) Distance measurement control of a multiple detector system
JPH01255000A (ja) 音声認識システムに使用されるテンプレートに雑音を選択的に付加するための装置及び方法
US20220068270A1 (en) Speech section detection method
Ozaydin Design of a Voice Activity Detection Algorithm based on Logarithmic Signal Energy
JP3032215B2 (ja) 有音検出装置及びその方法
Li et al. Voice activity detection under Rayleigh distribution
Moulsley et al. An adaptive voiced/unvoiced speech classifier.
Canli Speech protected active noise control system

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees