JPH0795239B2 - 音声フレーム中の基本周波数の存在を検出する装置および方法 - Google Patents

音声フレーム中の基本周波数の存在を検出する装置および方法

Info

Publication number
JPH0795239B2
JPH0795239B2 JP63503536A JP50353688A JPH0795239B2 JP H0795239 B2 JPH0795239 B2 JP H0795239B2 JP 63503536 A JP63503536 A JP 63503536A JP 50353688 A JP50353688 A JP 50353688A JP H0795239 B2 JPH0795239 B2 JP H0795239B2
Authority
JP
Japan
Prior art keywords
frame
value
response
calculating
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63503536A
Other languages
English (en)
Other versions
JPH01502858A (ja
Inventor
リン トムソン,デビッド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Corp filed Critical AT&T Corp
Publication of JPH01502858A publication Critical patent/JPH01502858A/ja
Publication of JPH0795239B2 publication Critical patent/JPH0795239B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Radio Relay Systems (AREA)
  • Oscillators With Electromechanical Resonators (AREA)
  • Interface Circuits In Exchanges (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Telephonic Communication Services (AREA)

Description

【発明の詳細な説明】 [技術分野] 本発明は通常有声音/無声音判別と呼ばれるところの音
声が基本周波数を含むか否かの判定に関する。さらにと
くには、無声音/有声音判別は2段有声音検出器により
行われ、統計的手法を用いて最終しきい値が音声環境に
適応的に計算される。
[背景技術及び問題点] 低ビット速度音声コーダにおいてはしばしば、不正確な
音声判別のために音声品質の低下が生ずる。これらの音
声判別を正確に行う際の困難な点は、単一の音声パラメ
ータすなわち類別子(classifier)では有声音音声と無
声音音声との識別に信頼性がないという事実にある。音
声判定を行うために、多重音声類別子を重みつき和の形
に組合わせることは当業者に周知である。この方法は通
常識別分析と呼ばれる。この方法は、デー・ピー・プレ
ザス(D.P.Prezas)他による「パターン認識および適応
時間−領域分析を用いた迅速かつ正確なピッチ検出」、
IEEE音響・音声および信号処理国際会議資料、第1巻、
109-112ページ、1986年4月(“Fast and Accurate Pit
ch Detection Using Pattern Recognition and Adaptiv
e Time-Domain Analysis"、Proc.IEEE Int.Conf.Acous
t.,Speech and Signal Proc.,Vol.1,pp109-112,April 1
986)に記載されている。この論文の説明のように、音
声類別子の重みつき和がもしある特定のしきい値より大
であれば音声フレームは有声音と宣言され、もしそうで
なければ無声音と宣言される。重み及びしきい値は有声
か無声かが既知である音声フレームからなるトレーニン
グセットに対する性能を最大化するように選択される。
固定重みつき和による方法に付帯する問題点は、音声環
境が変化する場合にそれが良好に実行しないことであ
る。その原因は、しきい値が、非線形ひずみ、及びろ波
による影響を受けて音声とは異なる学習セットから決定
されることである。
しきい値を変化する音声環境に適応させるための一方法
が、エイチ・ハサナイン(H.Hassanein)他の論文「改
良形音声検出器を用いたリアルタイム環境におけるGold
-Rabinerピッチ検出器の使用」、IEEE音響・音声および
信号処理学会トランザクション、1986年、東京、第ASSP
-33巻、第1号、319-320ページ(“Implementation of
the Gold-Rabiner Pitch Detector in a Real Time Env
ironment Using an Improved Voicing Detector"、IEEE
Transactions on Acoustic,Speech and Signal Proces
sing,1986,Tokyo,Vol,ASSP-33,No.1,pp319-320)に開示
されている。この論文は、3つの異なるパラメータをこ
れらのパラメータに付属の独立しきい値と比較し、各比
較に基づいて適応しきい値を1つずつ増加または減少す
る試行的方法を開示している。使用される3つのパラメ
ータは、信号のエネルギー、第1の反射係数、およびゼ
ロクロスカウント数である。例えば、もし音声信号エネ
ルギーがあらかじめ定義されたエネルギーレベルより小
さければ、適応しきい値が1つ増加される。一方もし音
声信号エネルギーが他のあらかじめ定義されたエネルギ
ーレベルより大きければ、適応しきい値が1つだけ減少
される。適応しきい値が計算された後に、それが基本ピ
ッチ検出器の出力から差引かれる。もし差引かれた結果
が正の数を与えれば、音声フレームは有声音と宣言さ
れ、そうでなければ音声フレームは無声音と宣言され
る。開示の方法に伴う問題点は、パラメータ自身が基本
ピッチ検出器において使用されないことである。従っ
て、適応しきい値の調節は特別のものであり、それが計
算される元の物理現象とは直接連結されていない。さら
に、しきい値は変化する音声環境には迅速に適応可能で
はない。
[解決法] 上記の問題点は、適応統計的装置を使用することにより
変化する環境に適応して音声判別を行う音声判別装置に
より解決されかつ技術的進歩が達成される。統計的値は
有声音検出器の出力に基づいて統計的手法を使用するこ
とにより変化する環境に適応される。フレームの音声属
性に応答して音声フレーム内における基本周波数の存在
を指示する一般値を発生する有声音検出器により統計的
パラメータが計算される。第2番目に、発生された値に
応答して音声フレームの無声音のものおよび有声音のも
のに対する平均が計算される。2つの平均は次に判別領
域を決定するのに使用され、判別領域および現在の音声
フレームとに応答して基本周波数の存在の判定が行われ
る。
現在および過去の音声フレームの音声属性に応答して、
現在の音声フレームが無声音である確率を計算するこ
と、あるフレームが無声音であろうという総合確率を計
算すること、および現在の音声フレームが有声音である
確率を計算すること、により無声音フレームに対する平
均が計算されることが好ましい。次に現在の音声フレー
ムが無声音である確率および総合確率とに応答して無声
音音声フレームの平均が計算される。さらに、現在の音
声フレームが有声音である確率および総合確率に応答し
て有声音音声フレームの平均が計算される。確率の計算
は最尤(ゆう)(maximum likelihood)統計的手法を用
いることにより実行されるのが好ましい。
一般値の発生は識別分析手法を用いて実行され、音声属
性は音声類別子であることが好ましい。
判定領域は、現在及び過去のフレームの一般値および有
声音および無声音のフレームに応答して、無声音および
有声音の音声フレームの平均、重み、および発生された
しきい値により定義される。
音声フレーム内における基本周波数の存在を検出するた
めの方法は、現在の音声のフレームの音声フレームを定
義する1組の類別子に応答して一般値を発生して基本周
波数の存在を指示するステップ、一般値に応答して1組
の統計的パラメータを計算するステップ、および一般値
と計算された統計的パラメータとに応答して基本周波数
の存在を判定するステップ、を含む。一般値を発生する
ステップは識別分析手法を用いて実行される。さらに基
本周波数を判定するステップは、1組のパラメータに応
答して重み値およびしきい値を計算するステップを含
む。
[図面の簡単な説明] 第1図は本発明をブロック図の形で表わした図; 第2図および第3図は第1図の有声音検出装置により実
行されるある種の機能をさらに詳細に表わした図であ
る。
[詳細な説明] 第1図は識別変数または一般変数を発生するために音声
類別子を処理するための識別有声音検出器をまず利用す
ることにより無声音/有声音判別動作を実行するための
装置を示す。後者の変数は有声音判別を行うために統計
的分析される。統計的分析は、種々の音声環境において
信頼できる性能を与えるように無声音/有声音判別を行
うときに利用されるしきい値に適応する。
ここで、第1図に示す装置の全体的動作を考えてみる。
類別子発生器100は各音声フレームに応答して、音声エ
ネルギーの対数(log)、LPC(線形予測分析)ゲインの
対数、第1反射係数の対数面積比、および1ピッチ周期
だけオフセットされている1フレーム長の2つの音声セ
グメントの二乗相関係数あることが好ましい類別子(cl
assifier)を発生する。これらの類別子の計算は、アナ
ログ音声をディジタルにサンプリングすること、ディジ
タルサンプルのフレームを形成すること、およびこれら
のフレームを処理すること、を含み、これは当業者には
周知である。発生器100は通路106を介して類別子を沈黙
検出器101および識別有声音検出器102に伝送する。識別
有声音検出器102は通路106を介して受けとられた類別子
に応答して識別値xを計算する。検出器102は式x=
c′y+dを実行することによりこの計算を実行する。
“c"は重みからなるベクトル、“y"は類別子からなるベ
クトル、および“d"はしきい値を表わすスカラーである
ことが好ましい。ベクトルcの成分は、音声エネルギー
の対数に対応する成分は0.3918606に、LPCゲインの対数
に対応する成分は−0.0520902に、第1反射係数の対数
面積比に対応する成分は0.5637082に、および二乗相関
係数に対応する成分は1.361249に等しく初期化し、また
dは最初−8.36454に等しく初期化することが好まし
い。識別変数xを計算した後に検出器102は通路111を介
してこの値を統計的計算器103および減算器107に伝送す
る。
沈黙検出器101は通路106を介して伝送された類別子に応
答して、通路109上で類別子発生器100によって受取られ
たデータ上に音声が存在するか否かを判定する。音声の
存在の指示は沈黙検出器101により通路110を介して統計
的計算器103に伝送される。
各音声フレームに対して検出器102は識別値xを発生し
それを通路111を介して伝送する。統計的計算器103は、
現在の沈黙でないフレームに対する識別値内でそれ以前
の沈黙でないフレームと平均をとることにより、通路11
1を介して受取られる識別値の平均を維持する。統計的
計算器103は通路110を介して受取られた信号に応答し
て、あるフレームが無声音である総合確率およびあるフ
レームが有声音である確率とを計算する。さらに統計的
計算器103は、そのフレームが無声音であった場合に現
フレームに対する識別値が有するであろう統計値および
そのフレームが有声音であった場合に現フレームに対す
る識別値が有するであろう統計値とを計算する。この統
計値は平均値であることが好ましい。計算器103により
行われる計算は、現フレームに基づくのみでなくそれ以
前のフレームにも基づいている。統計的計算器103は、
これらの計算を、通路106を介して受取られる現フレー
ムに対する識別値および類別子の平均に基づくのみでな
く、重みおよびフレームが無声音であるかまたは有声音
であるかを判別するところの、通路113を介して、しき
い値計算器104から受取られたしきい値に基づいて行
う。
計算器104は、計算器103により発生された通路112を介
して受取られた現フレームに対する類別子の確率及び統
計値に応答して、重み値aとして使用される値および現
フレームに対するしきい値b、とを再計算する。次にこ
れらの新しいaおよびbの値は通路113を介して統計的
計算器103に逆伝送される。
計算器104は、重み、しきい値及び統計値、とを通路114
を介してU/V判別器105に伝送する。後者の判別器は通路
114および115を介して伝送された情報に応答してこのフ
レームが無声音であるかまたは有声音であるかを判別
し、この判別を通路116を介して伝送する。
ここで、第1図に示すブロックの103、104、105および1
07の動作をさらに詳細に説明する。統計的計算器103
は、エヌ・イー・ディ(N.E.Day)著の「混合正規分布
の成分の推定」(“Estimating the Components of a M
ixture of Normal Distribution"、ビオメトリカ[Biom
etrika]誌、第56巻、第3号、463-474ページ、1969
年)という題名の文献に記載されたものに類似の改良EM
アルゴリズムを実行する。くずし平均(decaying avera
ge)の概念を用いて、計算器103は次式1、2および3
を計算することにより、現フレームおよびそれ以前のフ
レームに対する識別値の平均を計算する。
n=n+1 ifn<2000 (1) z=1/n (2) Xn=(1−z)Xn-1+zxn (3) xnは現フレームのための識別値であって通路111を介し
て検出器102から受取られ、2000までの処理フレーム数
である。zはくずし平均係数を示し、Xnは現フレームお
よび過去のフレームに対する識別子の平均を示す。統計
的計算器103はz、xnおよびXn値の受領に応答して、次
のようにまずxnの二次モーメントQnを計算することによ
り共分散値Tを計算する。
Qn=(1−z)Qn-1+▲zx2 n▼ (4) Qnが計算されると、次のようにTが計算される。
T=Qn−▲x2 n▼ (5) 現フレームの識別値から次のように平均値が差引かれ
る。
xn=xn−Xn (6) 次に計算器103は以下に示す式(7)を解くことによ
り、現在値xnにより表わされるフレームが無声音である
確率を決定する。
(7)式を解いた後に計算器103は次式を解くことによ
り、識別値が有声音フレームを表わす確率を決定する。
P(v|xn)=1−P(u|xn) (8) 次に計算器103はpnを求める式(9)を解くことによ
り、あるフレームが無声音であろうという総合確率を決
定する。
pn=(1−z)pn-1+zP(u|xn) (9) フレームが無声音であろうという確率を決定した後に、
計算器103は無声音型および有声音型の両方のフレーム
に対する識別値の平均値を与える2つの値uおよびvを
決定する。統計的平均無声音値である値uは、もしフレ
ームが無声音であるならば平均識別値を含み;また統計
的平均有声音値である値vは、もしフレームが音声音で
あるならば平均識別値を与える。以下に示すように、現
フレームに対する値uは式(10)を計算することにより
解かれ、現フレームに対する値vは式(11)を計算する
ことにより決定される。
un=(1−z)un-1+zxnP(u|xn)/pn−zxn(10)
vn=(1−z)vn-1+zxnP(v|xn)/(1−pn)−zxn
(11) ここで計算器103は、通路112を介してuおよびv、値
T、および確率Pnをしきい値計算器104に伝送する。
計算器104はこの情報に応答してaおよびbに対する新
しい値を計算する。次にこれらの新しい値は通路113を
介して統計的計算器103に逆伝送される。これにより変
化する環境に迅速に適応可能である。nが好ましくは99
以上になると、値aおよびbは次式のように計算され
る。値aは次式を解くことにより決定される。
値bは次式を解くことにより決定される。
式(12)および(13)を計算した後に、計算器104は通
路114を介して値a、u、およびvをブロック105に伝送
する。
判別器105はこの伝送された情報に応答して現フレーム
が有声音であるかまたは無声音であるかを判別する。も
し値が正であれば、このときは、もし次式が真であるな
らばフレームを有声音であると宣言される。
axn−a(un+vn)/2>0 (14) またはもし値が負であれば、このときは、もし次式が真
であるならばフレームは有声音であると宣言される。
axn−a(un+vn)/2<0 (15) 式(14)はまた次式のように表わされる。
axn+b−log[(1−pn)/pn]>0 式(15)はまた次式のようにも表わされる。
axn+b−log[(1−pn)/pn]<0 もし前記の条件が満たされないならば、判別器105はフ
レームが無声音であると宣言する。
第2図および第3図は第1図の装置により実施される操
作を流れ図の形式でさらに詳細に示す。ブロック200は
第1図のブロック101を実行する。ブロック202ないし21
8は統計的計算器103を実行する。ブロック222はしきい
値計算器104を実行し、ブロック226ないし238は第1図
のブロック105を実行する。減算器107はブロック208お
よびブロック224により実行される。ブロック202は現フ
レームとそれ以前の全てのフレームとに対する識別値の
平均を表わす値を計算する。ブロック200は現フレーム
内には音声が存在するか否かを判別し、そしてもし現フ
レーム内に音声が存在しなければ、制御が判別ブロック
226に引渡される前にブロック224により現識別値から識
別値に対する平均が差引かれる。
しかしながら、現フレーム内に音声が存在すれば、この
ときはブロック202ないし222により統計的計算および重
み計算が実行される。まず、第1番目にブロック202に
おいて平均値が求められる。第2番目にブロック206に
おいて2次モーメントが計算される。次にブロック206
においてもまた、現フレームおよび過去のフレームに対
する平均値Xと共に後者の値が使用されてTを計算す
る。次にブロック208において識別値xnから平均Xが差
引かれる。
ブロック210は、現在の重み値a、現在のしきい値b、
および現フレームに対する識別値xnとを利用することに
より、現フレームが無声音である確率を計算する。現フ
レームが無声音であるという確率を計算した後に、ブロ
ック212により現フレームが有声音であるという確率が
計算される。次にブロック214よりあるフレームが無声
音であろうという総合確率pnが計算される。
ブロック216および218は2つの値uおよびvを計算す
る。値uは、もしそのフレームが無声音であったならば
識別値がもつであろう統計的平均値を表わす。値vは、
もしそのフレームが有声音であったならば識別値がもつ
であろう統計的平均値を表わす。現フレームおよびそれ
以前のフレームに対する実際の識別値は値uまたは値v
の周りにクラスタ(集団化)される。もしこれらのフレ
ームが無声音であることが判ると、それ以前のフレーム
および現フレームに対する識別値は値uのまわりにクラ
スタされ;そうでなければそれ以前の値は値vのまわり
にクラスタされる。ブロック222は次に新しい重み値a
および新しいしきい値bを計算する。値aおよびbは第
2図内のそれ以前のブロックにより次に続くフレーム内
で使用される。
ブロック226ないし238は第1図のU/V判別器105を実行す
る。ブロック226は現フレームに対する値aが0より大
であるか否かを判別する。もしこの条件が真であれば、
このときは判別ブロック228が実行される。後者の判別
ブロックは、テストにより有声音かまたは無声音かを判
別する。もしブロック228の判別において有声音である
ことが判ると、このときフレームはブロック230により
有声音として表示され、いれ以外はブロック232により
無声音として表示される。もし値aが0より小であるな
らば、ブロック234ないし238の機能が実行されブロック
228ないし232と同様に機能する。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭61−48898(JP,A) 特開 昭60−200300(JP,A) 特開 昭60−114900(JP,A) IEEE Transactions on Acoustics,Speec h,and Signal Proces sing Vol.ASSP−24,No. 3,June 1976,P.201−212

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】非トレーニングセット音声のフレームの音
    声属性を定義する類別子のセットに応答して基本周波数
    の存在を指示する一般値を発生する手段と、 前記一般値に応答して統計的パラメータのセットを計算
    するパラメータセット計算手段と、 前記パラメータのセットに応答してしきい値を計算する
    手段と、 前記パラメータのセットに応答して重み値を計算する手
    段と、 他のフレームに対するパラメータのセットの計算に使用
    するために、前記重み値およびしきい値を前記パラメー
    タセット計算手段に通知する手段と、 前記重み値およびしきい値ならびに計算されたパラメー
    タのセットに応答して現在のフレーム中の基本周波数の
    存在を判定する手段とからなることを特徴とする、音声
    フレーム中の基本周波数の存在を検出する装置。
  2. 【請求項2】前記発生手段が前記一般値を発生するため
    に識別分析を実行する手段からなることを特徴とする請
    求項1の装置。
  3. 【請求項3】前記パラメータセット計算手段が、通知さ
    れた重み値およびしきい値ならびに前記他のフレームの
    一般値にさらに応答して他の統計的パラメータのセット
    を計算することを特徴とする請求項1の装置。
  4. 【請求項4】前記パラメータセット計算手段が、 現在および過去のフレームにわたる前記一般値の平均を
    計算する手段と、 前記一般値の平均、前記通知された重み値およびしきい
    値、ならびに前記他のフレームの一般値に応答して前記
    他の統計的パラメータのセットを決定する手段とをさら
    に有することを特徴とする請求項3の装置。
  5. 【請求項5】現在および過去の非トレーニング音声の各
    フレームの音声属性を定義する類別子のセットに応答し
    て基本周波数の存在を指示する一般値を発生する手段
    と、 現在および過去のフレームにわたる前記一般値の分散を
    計算する手段と、 現在および過去のフレームに応答して現在のフレームが
    無声フレームである第1確率を計算する手段と、 現在および過去のフレームならびに前記第1確率に応答
    して、いずれかのフレームが無声フレームである全確率
    を計算する手段と、 現在のフレームが有声フレームである第2確率を計算す
    る手段と、 前記第1確率、前記全確率および前記分散値に応答して
    無声フレームの平均を計算する手段と、 前記第2確率、前記全確率および前記分散値に応答して
    有声フレームの平均を計算する手段と、 前記無声フレームの平均、前記有声フレームの平均およ
    び前記分散値に応答して判別領域を決定する手段と、 現在のフレームに対する前記判別領域に応答して基本周
    波数の存在の判定を行う判定手段とからなることを特徴
    とする音声フレーム中の基本周波数の存在を検出する装
    置。
  6. 【請求項6】第1確率計算手段が、最尤統計的演算を実
    行することを特徴とする請求項5の装置。
  7. 【請求項7】第1確率計算手段が、重み値およびしきい
    値にさらに応答して最尤統計的演算を実行することを特
    徴とする請求項6の装置。
  8. 【請求項8】非トレーニングセット音声のフレームの音
    声属性を定義する類別子のセットに応答して基本周波数
    の存在を指示する一般値を発生するステップと、 前記一般値に応答して統計的パラメータのセットを計算
    するパラメータセット計算ステップと、 前記一般値および計算されたパラメータのセットに応答
    して前記フレーム中の基本周波数の存在を判定する判定
    ステップとからなる、音声フレーム中の基本周波数の存
    在を検出する方法であって、判定ステップが、 前記パラメータのセットに応答してしきい値を計算する
    ステップと、 前記パラメータのセットに応答して重み値を計算するス
    テップと、 他のフレームに対するパラメータのセットの計算に使用
    するために、前記重み値およびしきい値を通知するステ
    ップとからなることを特徴とする、音声フレーム中の基
    本周波数の存在を検出する方法。
  9. 【請求項9】前記発生ステップが前記一般値を発生する
    ために識別分析を実行するステップからなることを特徴
    とする請求項8の方法。
  10. 【請求項10】前記パラメータセット計算ステップが、
    通知された重み値およびしきい値ならびに前記他のフレ
    ームの一般値にさらに応答して他の統計的パラメータの
    セットを計算することを特徴とする請求項9の方法。
  11. 【請求項11】前記パラメータセット計算ステップが、 現在および過去のフレームにわたる前記一般値の平均を
    計算するステップと、 前記一般値の平均、前記通知された重み値およびしきい
    値、ならびに前記他のフレームの一般値に応答して前記
    他の統計的パラメータのセットを決定するステップとを
    さらに有することを特徴とする請求項10の方法。
JP63503536A 1987-04-03 1988-01-12 音声フレーム中の基本周波数の存在を検出する装置および方法 Expired - Fee Related JPH0795239B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US3429887A 1987-04-03 1987-04-03
US34298 1987-04-03
PCT/US1988/000031 WO1988007739A1 (en) 1987-04-03 1988-01-12 An adaptive threshold voiced detector

Publications (2)

Publication Number Publication Date
JPH01502858A JPH01502858A (ja) 1989-09-28
JPH0795239B2 true JPH0795239B2 (ja) 1995-10-11

Family

ID=21875533

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63503536A Expired - Fee Related JPH0795239B2 (ja) 1987-04-03 1988-01-12 音声フレーム中の基本周波数の存在を検出する装置および方法

Country Status (9)

Country Link
EP (1) EP0309561B1 (ja)
JP (1) JPH0795239B2 (ja)
AT (1) ATE83329T1 (ja)
AU (1) AU598933B2 (ja)
CA (1) CA1336208C (ja)
DE (1) DE3876569T2 (ja)
HK (1) HK21794A (ja)
SG (1) SG60993G (ja)
WO (1) WO1988007739A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3875894T2 (de) * 1987-04-03 1993-05-19 American Telephone & Telegraph Adaptive multivariable analyseeinrichtung.
US5195138A (en) * 1990-01-18 1993-03-16 Matsushita Electric Industrial Co., Ltd. Voice signal processing device
US5204906A (en) * 1990-02-13 1993-04-20 Matsushita Electric Industrial Co., Ltd. Voice signal processing device
DE69130687T2 (de) * 1990-05-28 1999-09-09 Matsushita Electric Industrial Co. Sprachsignalverarbeitungsvorrichtung zum Herausschneiden von einem Sprachsignal aus einem verrauschten Sprachsignal

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60114900A (ja) * 1983-11-25 1985-06-21 松下電器産業株式会社 有音・無音判定法
JPS60200300A (ja) * 1984-03-23 1985-10-09 松下電器産業株式会社 音声の始端・終端検出装置
JPS6148898A (ja) * 1984-08-16 1986-03-10 松下電器産業株式会社 音声の有声無声判定装置
DE3875894T2 (de) * 1987-04-03 1993-05-19 American Telephone & Telegraph Adaptive multivariable analyseeinrichtung.

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
IEEETransactionsonAcoustics,Speech,andSignalProcessingVol.ASSP−24,No.3,June1976,P.201−212

Also Published As

Publication number Publication date
HK21794A (en) 1994-03-18
JPH01502858A (ja) 1989-09-28
AU598933B2 (en) 1990-07-05
AU1700788A (en) 1988-11-02
EP0309561A1 (en) 1989-04-05
DE3876569T2 (de) 1993-04-08
WO1988007739A1 (en) 1988-10-06
CA1336208C (en) 1995-07-04
SG60993G (en) 1993-07-09
EP0309561B1 (en) 1992-12-09
DE3876569D1 (de) 1993-01-21
ATE83329T1 (de) 1992-12-15

Similar Documents

Publication Publication Date Title
EP1083542B1 (en) A method and apparatus for speech detection
US6275795B1 (en) Apparatus and method for normalizing an input speech signal
US5596680A (en) Method and apparatus for detecting speech activity using cepstrum vectors
CN109545188A (zh) 一种实时语音端点检测方法及装置
US9336777B2 (en) Speech processing device, speech processing method, and speech processing program
EP2031582B1 (en) Discrimination of speaker gender of a voice input
Ghitza Robustness against noise: The role of timing-synchrony measurement
US5007093A (en) Adaptive threshold voiced detector
Özaydın Examination of energy based voice activity detection algorithms for noisy speech signals
US5046100A (en) Adaptive multivariate estimating apparatus
JPH0795239B2 (ja) 音声フレーム中の基本周波数の存在を検出する装置および方法
JP2797861B2 (ja) 音声検出方法および音声検出装置
JPH0795237B2 (ja) 適応多変数推定装置
JP3091537B2 (ja) 音声パターン作成方法
Sudhakar et al. Automatic speech segmentation to improve speech synthesis performance
JPH01255000A (ja) 音声認識システムに使用されるテンプレートに雑音を選択的に付加するための装置及び方法
EP0310636B1 (en) Distance measurement control of a multiple detector system
Prezas et al. Fast and accurate pitch detection using pattern recognition and adaptive time-domain analysis
JPH034918B2 (ja)
JPH05249987A (ja) 音声検出方法および音声検出装置
JP4560899B2 (ja) 音声認識装置、及び音声認識方法
Zhang An energy-based adaptive voice detection approach
Smith A neurally motivated technique for voicing detection and F0 estimation for speech
Khaing et al. A Speech Recognition System for Myanmar Language
HIZLISOY et al. Pmt Ve Ses Aktivitesi Tespiti Metodları Kullanarak Gürültüye Dayanıklı Konuşma Tanıma

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees