JPH0756598A - 有声音・無声音判別装置 - Google Patents

有声音・無声音判別装置

Info

Publication number
JPH0756598A
JPH0756598A JP20324893A JP20324893A JPH0756598A JP H0756598 A JPH0756598 A JP H0756598A JP 20324893 A JP20324893 A JP 20324893A JP 20324893 A JP20324893 A JP 20324893A JP H0756598 A JPH0756598 A JP H0756598A
Authority
JP
Japan
Prior art keywords
sound
discrimination
voiced
voiced sound
unvoiced
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP20324893A
Other languages
English (en)
Other versions
JP3297156B2 (ja
Inventor
Tadashi Yamaura
正 山浦
Hirohisa Tazaki
裕久 田崎
Katsushi Yoriza
勝志 瀬座
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP20324893A priority Critical patent/JP3297156B2/ja
Publication of JPH0756598A publication Critical patent/JPH0756598A/ja
Priority to JP2000188987A priority patent/JP3394506B2/ja
Application granted granted Critical
Publication of JP3297156B2 publication Critical patent/JP3297156B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Time-Division Multiplex Systems (AREA)

Abstract

(57)【要約】 【目的】 背景雑音レベルの高低に依存せず判別誤りが
少なく、有声音、無声音、無音を判別できる有声音・無
声音判別装置を得ることを目的とする。 【構成】 音声信号の有声音、無声音の判別をする有声
音・無声音判別装置において、入力音声の背景雑音レベ
ルを求めて雑音レベル6として出力する雑音レベル判定
手段5と、上記の雑音レベル6の値により、有声音、無
声音、無音を判別する判別条件を複数の異なる判別条件
の中から選択し、入力音声のフレームを分析して得られ
た判別パラメータ(例えば、入力音声のフレームのパワ
ー1)と閾値とを照合して有声音、無声音、無音判別を
行う照合手段11とを備え、雑音レベル6の値により、
有声音、無声音、無音判別の閾値を変化させるようにし
たものである。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、音声をディジタル伝
送あるいは蓄積する場合に用いられる音声符号化復号化
装置の有声音・無声音判別装置に関するものである。
【0002】
【従来の技術】従来のこの種の有声音・無声音判別装置
として、例えば特開昭61−27800に示されたもの
があり、上記装置では、有声音、無声音の判別パラメー
タとしてケプストラムの低次項の和を用い、判別結果は
有声音と無声音の2値である。
【0003】図6は上記文献に示された従来の有声音・
無声音判別装置の構成ブロック図であり、図7は図6の
有声音・無声音判別装置の判別パラメータ20の分布を
例示する図である。図中、18はケプストラム、19は
加算回路、20は判別パラメータ、21は閾値比較回
路、22は判別結果である。
【0004】以下、図6の有声音・無声音判別装置の動
作について図6,7を参照して説明する。先ず、加算回
路19は入力されたケプストラム18の低次項の和を求
め、これを判別パラメータ20として出力する。閾値比
較回路21は入力された判別パラメータ20が所定の固
定閾値未満の場合は無声音、上記の固定閾値以上の場合
は有声音と判別し、判別結果22を出力する。
【0005】図7は背景雑音のパワーが音声信号のパワ
ーに比べて無視できない程大きい、即ち雑音レベルが高
い場合と、背景雑音のパワーが音声信号のパワーに比べ
て無視できる程小さい、即ち雑音レベルが低い場合の判
別パラメータ20の分布のモデルを示したものである。
図中、曲線Aは雑音レベルが低い場合の無声音、曲線C
は雑音レベルが高い場合の無声音、曲線Dは曲線Aと曲
線Cとを合わせた分布で、曲線Bは有声音の分布であ
る。有声音における判別パラメータ20の分布は雑音レ
ベルの高低によって大きく変化しない。いま、雑音レベ
ルが低い場合に無声音Aと有声音Bを最適に分離する固
定閾値をE1とした場合、雑音レベルが高い場合に無声
音Cを有声音Bと判別する判別誤りが増加する。一方、
雑音レベルが高い場合に無声音Cと有声音Bを最適に分
離する固定閾値をE2とした場合、雑音レベルが低い場
合に有声音Bを無声音Aと判別する判別誤りが増加す
る。また、E3を無声音Dと有声音Bを最適に分離する
固定閾値とすると、雑音レベルが小さい場合にE1を、
雑音レベルが大きい場合にE2を固定閾値に用いた場合
に比べて、判別誤りが増加するのは明かである。また、
以上のどの閾値を使う場合でも、判別パラメータ20が
その閾値近辺の値のときは判別誤りが多く、信頼性が低
くなる。
【0006】
【発明が解決しようとする課題】従来の有声音・無声音
判別装置は以上のように構成されており、ケプストラム
の低次項の和だけを判別パラメータとしているために、
判別パラメータが判別閾値近辺の値のときは判別誤りが
多く、また、有声音と無声音を判別する判別閾値を設定
するとき想定した背景雑音レベルと異なった雑音レベル
を持つ音声の場合に判別誤りが増加するという課題があ
る。また、音声信号には有声音的な特徴と無声音的な特
徴を合わせ持つ中間的な状態の音声フレームがしばしば
現れるが、従来の有声音・無声音判別装置では有声音と
無声音の中間的な状態を表現することができず、従って
判別できないという課題がある。
【0007】本発明は上記のような課題を解決するため
になされたもので、入力音声のフレームを分析して得る
判別パラメータの判別閾値近辺においても判別誤りが少
なく、また、背景雑音レベルの高低に依存せず判別誤り
が少ない有声音・無声音判別装置を得ることを目的とし
ている。また、有声音的な特徴と無声音的な特徴を合わ
せ持つ中間的な状態の音声フレームも判別できる有声音
・無声音判別装置を得ることを目的とする。
【0008】
【課題を解決するための手段】上記の目的を達成するた
めに、請求項1に係わる発明は、音声信号の有声音、無
声音の判別をする有声音・無声音判別装置において、入
力音声のフレームを分析して得る判別パラメータの値に
基づいて、有声音、無声音、無音を判別する判別条件を
複数の異なる判別条件、ケプストラムの低次項の中から
選択し、さらに、上記選択した判別条件に従って、パワ
ー、正規化自己相関のピーク値、零交差数、第1次の線
形予測係数、過去の音声フレームの判別結果、ケプスト
ラムの低次項の中から少なくとも一つを判別パラメータ
として用い、所定の閾値と照合することにより、有声
音、無声音、無音の判別結果を出力する照合手段を備
え、上記有声音、無声音、無音判別の判別誤りを少なく
するようにしたものである。
【0009】また、請求項2に係わる発明は、音声信号
の有声音、無声音の判別をする有声音・無声音判別装置
において、入力音声のフレームを分析して得る判別パラ
メータを有声音、無声音、無音判別の判別条件と照合
し、有声音、無声音、無音いずれかの区分に入る場合は
有声音、無声音、または無音を判別結果として出力し、
いずれの区分にも入らない場合、有声音的特徴を有する
ときは準有声音として、無音的特徴を有するときは準無
音として判別結果を出力する照合手段を備え、有声音、
無声音、または無音の他に中間的な準有声音、準無音を
判別結果として出力するようにしたものである。
【0010】また、請求項3に係わる発明は、音声信号
の有声音、無声音の判別をする有声音・無声音判別装置
において、入力音声の背景雑音レベルを求め雑音レベル
として出力する雑音レベル判定手段と、上記の雑音レベ
ルの値により、有声音、無声音、無音を判別する判別条
件を複数の異なる判別条件の中から選択し、入力音声の
フレームを分析して得られた判別パラメータと所定の閾
値とを照合して有声音、無声音、無音判別を行う照合手
段と、を備え、雑音レベルの値により、有声音、無声
音、無音判別の閾値を変化させるようにしたものであ
る。
【0011】また、請求項4に係わる発明は、請求項3
に係わる発明の雑音レベル判定手段として、入力音声の
フレームと過去の音声フレームの、判別結果、パワー、
正規化自己相関のピーク値の中から少なくとも一つを判
定パラメータとして用い、所定の閾値と照合することに
より、入力音声のフレームと過去の音声のフレームにつ
いて有声音区間と無音区間に該当する区間を決定し、上
記の有声音区間と無音区間のパワーの平均を算出して、
それぞれ有声音平均パワーと無音平均パワーとし、上記
の有声音平均パワーと上記無音平均パワーとを比較する
ことにより雑音レベルの高低を判定し出力する雑音レベ
ル判定手段を備えるようにしたものである。
【0012】また、請求項5に係わる発明は、請求項3
に係わる発明の雑音レベル判定手段として、過去の音声
フレームの平均パワーより入力音声のフレームのパワー
が大きいフレームのパワーの平均を入力音声のフレーム
毎に更新しながら算出して有声音平均パワーとし、且つ
過去の音声フレームの平均パワーより入力音声のフレー
ムのパワーが小さいフレームのパワーの平均を入力音声
のフレーム毎に更新しながら算出して無音平均パワーと
し、上記有声音平均パワーと上記無音平均パワーとを比
較することにより雑音レベルの高低を判定し出力する雑
音レベル判定手段を備えるようにしたものである。
【0013】
【作用】以上のように構成された請求項1に係わる発明
では、音声信号の有声音、無声音の判別をする有声音・
無声音判別装置において、入力音声フレームを分析して
得る判別パラメータの値に基づいて、有声音、無声音、
無音を判別する判別条件を複数の異なる判別条件の中か
ら選択し、さらに、上記の選択した判別条件に従って、
パワー、正規化自己相関のピーク値、零交差数、第1次
の線形予測係数、過去の音声フレームの判別結果、ケプ
ストラムの低次項の中から少なくとも一つを判別パラメ
ータとして用い、所定の閾値と照合して、上記有声音、
無声音、無音の判別結果を出力する照合手段が動作する
ことにより、有声音、無声音、無音判別の判別誤りを少
なくすることができる。
【0014】また、請求項2に係わる発明では、音声信
号の有声音、無声音の判別をする有声音・無声音判別装
置において、入力音声フレームを分析して得る判別パラ
メータを有声音、無声音、無音判別の判別条件と照合
し、いずれかの区分に入る場合は有声音、無声音、また
は無音を判別結果として出力し、いずれの区分にも確実
に入らぬ場合、有声音的特徴を有するときは準有声音と
して、無音的特徴を有するときは準無音として判別結果
を出力するよう照合手段が動作することにより、有声
音、無声音、または無音の他に中間的な準有声音、準無
音を判別結果として出力することができる。
【0015】また、請求項3に係わる発明では、音声信
号の有声音、無声音の判別をする有声音・無声音判別装
置において、入力音声フレームの背景雑音レベルを求め
雑音レベルとして出力するよう雑音レベル判定手段が動
作することにより、上記の雑音レベルの値により、有声
音、無声音、無音を判別する判別条件を複数の異なる判
別条件の中から選択し、入力音声のフレームを分析して
得られた判別パラメータと所定の閾値とを照合して有声
音、無声音、無音判別を行うよう照合手段が動作するこ
とにより、雑音レベルの値により、有声音、無声音、無
音判別の閾値を変化させることができる。
【0016】また、請求項4に係わる発明では、請求項
3に係わる発明の作用に加えて、雑音レベル判定手段
が、入力音声フレームと過去の音声フレームの、判別結
果、パワー、正規化自己相関のピーク値の中から少なく
とも一つを判別パラメータとして用い、所定の閾値と照
合することにより、入力音声フレームと過去の音声フレ
ームについて有声音区間と無音区間に該当する区間を決
定し、上記の有声音区間と無音区間のパワーの平均を算
出して、それぞれ有声音平均パワーと無音平均パワーと
し、上記の有声音平均パワーと上記無音平均パワーとを
比較することにより、雑音レベルの高低を判定し出力す
ることができる。
【0017】また、請求項5に係わる発明では、請求項
3に係わる発明の作用に加えて、雑音レベル判定手段
が、過去の音声フレームの平均パワーより入力音声のフ
レームのパワーが大きいフレームのパワーの平均を入力
音声のフレーム毎に更新しながら算出して有声音平均パ
ワーとし、且つ、過去の音声フレームの平均パワーより
入力音声のフレームのパワーが小さいフレームのパワー
の平均を入力音声のフレーム毎に更新しながら算出して
無音平均パワーとして、上記有声音平均パワーと上記無
音平均パワーとを比較することにより、雑音レベルの高
低を判定し出力することができる。
【0018】
【実施例】
実施例1.図1は本発明に係わる有声音・無声音判別装
置の実施例1を示す構成ブロック図である。図1におい
て、1は入力音声のフレームを分析して得る判別パラメ
ータとしてのパワー、2は正規化自己相関のピーク値、
3は零交差数、4は第1次の線形予測係数、5は雑音レ
ベル判定手段、6は雑音レベル、7は無音平均パワー、
8は有声音平均パワー、9は閾値算出手段、10はパワ
ー判別閾値、11は照合手段、12は判別結果、13は
レジスタ、14は過去の音声フレームのパワー、15は
過去の音声フレームの正規化自己相関ピーク値、16は
過去の音声フレームの判別結果、17はケプストラムの
低次項である。
【0019】以下、図1の有声音・無声音判別装置の動
作について図を参照して説明する。先ず、雑音レベル判
定手段5では、入力音声のフレームの正規化自己相関ピ
ーク値2と、レジスタ13に格納されている過去の正規
化自己相関ピーク値15と、過去の音声フレームの判別
結果16に対して予め設定している無音区間の判別条件
(例えば、10フレーム連続で正規化自己相関ピーク値
2が所定の閾値P1を下回り、かつ無音と判別されてい
る)を満足する区間の平均パワーを、入力音声のフレー
ムのパワー1と過去の音声フレームのパワー14とより
求め、無音平均パワー7として出力する。一方、有声音
区間の判別条件(例えば、5フレーム連続で正規化自己
相関のピーク値が所定の閾値P2以上である)を満足す
る区間の平均パワー有声音区間の判別条件を、入力音声
のフレームのパワー1と過去の音声フレームのパワー1
4とより求め、有声音平均パワー8として出力する。上
記の無音平均パワー7と上記の有声音平均パワー8との
差が、所定の閾値D1より小さい場合は、雑音レベルが高
いと判定し、雑音レベル判定手段5の出力である雑音レ
ベル6として“1”を出力し、一方、上記所定の閾値D
1より大きい場合は、雑音レベルが低いと判定し、雑音
レベル判定手段5の出力である雑音レベル6として
“0”を出力する。
【0020】次に、閾値算出手段9では、入力された雑
音レベル6が“0”の場合は式(1)により、“1”の
場合を式(2)により、雑音レベル判定手段5から入力
された無音平均パワー7をPUV、有声音平均パワー8
をPVとして、上記入力音声のフレームのパワーの判別
閾値を決定し、式(1)および式(2)に示す閾値算出
手段9の出力であるパワー判別閾値10を照合手段11
に送出する。
【0021】
【数1】
【0022】但し、TH1,TH2,TH3はパワーの
判別閾値、PUVは無音平均パワー、PVは有声音平均
パワーを表す。
【0023】次に、照合手段11では、入力音声フレー
ムのパワー1、正規化自己相関のピーク値2、零交差数
3、第1次の線形予測係数4、ケプストラムの低次項の
和17、雑音レベル判定手段5からの雑音レベル6、閾
値算出手段9からのパワー判別閾値10、レジスタ13
からの過去の音声フレームの判別結果16を、入力と
し、例えば、先ず、下記のaもしくは、b〜eの区分の
いずれかを選択する。aの場合、即ち判別条件の式
(3)のいずれかの論理積を満足する場合は無声音と判
別して判別結果12を出力する。b〜eの場合、b〜e
の区分のいずれの区分を選択するかは、閾値算出手段9
からのパワー判別閾値10であるTHの値と、入力音声
フレームのパワー1であるPOWの値の大小関係により
決める。以上において、aは無声音と判別できる場合、
bは有声音の確率が高い場合、cは有声音の確率がやや
高い場合、dは無音の確率がやや高い場合、eは無音の
確率が高い場合に相当する。
【0024】次に、上記のb〜eの区分のいずれの区分
を選択したかにより、それぞれ図2,図3,図4,図5
の判別フローに従い、有声音、準有声音、準無音、無音
のいずれかを判別し、判別結果12を出力する。なお、
a〜eの区分において、有声音、無声音、無音と判別で
きる判別条件はそれぞれ異なっているため、判別条件は
それぞれの区分において個別的に設定する必要が有り、
この判別条件は実験的に決定している。ここで、準有声
音とは有声音と判別される条件のいくつかが欠けている
場合を指し、また準無音とは無音と判別される条件のい
くつかが欠けている場合を指すものと定義する。
【0025】
【数2】
【0026】b:POW>TH1の場合、図2により判
別する。 c:TH1≧POW>TH2の場合、図3により判別す
る。 d:TH2≧POW>TH3の場合、図4により判別す
る。 e:POW≦TH3の場合、図5により判別する。 但し、上記のa区分の判別式、b〜e区分の図2,3,
4,5において、TH1,TH2,TH3はパワー判別
閾値10(但し、TH1>TH2>TH3)、PUVは
無音平均パワー7、PVは有声音平均パワー8、POW
はパワー1、ACは正規化自己相関のピーク値2、Cは
ケプストラムの低次項の和17、CMINはケプストラ
ムの低次項の和の判別閾値、Zは零交差数3、A1は第
1次の線形予測係数4、NLは雑音レベル6、VOは過
去の音声フレームの判別結果16、T1,T11,T12,T2,T21,
T22,T23,T24,T3,T31,T32,T33,T34,T4,T41,T42,T43,T44
は全て固定閾値を表す。
【0027】次に、レジスタ13では、入力音声のフレ
ームのパワー1、正規化自己相関のピーク値2、蓄積さ
れた過去の10フレームのパワー、正規化自己相関ピー
ク値、照合手段の判別結果を更新する。
【0028】実施例2.実施例1では、無音平均パワー
と有声音平均パワーによりパワーの判別閾値を決定して
いるが、過去の音声フレームのパワーの最大値よりパワ
ー判別閾値を、例えば、式(4)によって決定すること
も可能である。
【0029】
【数3】
【0030】但し、式(4)において、TH1,TH
2,TH3はパワーの判別閾値、Pmax は例えば、過去
30フレームにおけるパワーの最大値を表す。また、過
去の音声フレームにおけるパワーの最大値を用い、無音
平均パワーと有声音平均パワーより求められたパワー判
別閾値を補正する、または有声音、無声音、無音の判別
結果を補正することも可能である。
【0031】実施例3.実施例1では、図2に従い正規
化自己相関関数のピーク値、過去の音声フレームの判別
結果、雑音レベルによって無音判別をしているが、例え
ばケプストラム係数の低次項を用いて過去に無音と判別
されたフレームのスペクトル概形を求め、このスペクト
ル概形と入力音声のフレームのスペクトルの距離とによ
り無音判別を行うことも可能である。
【0032】実施例4.実施例1では、入力音声のフレ
ーム毎に分析して得られる判別パラメータを用いて判別
をしているが、入力音声のフレームを複数個のサブフレ
ームに分割し、サブフレーム毎に分析して得られるパラ
メータを用いて判別を行う、または判別結果を補正する
ことも可能である。
【0033】実施例5.実施例1では、判別条件の区分
をするのに判別パラメータとして入力音声のフレームの
パワーを用いているが、ケプストラムの低次項の和を用
いることも可能である。
【0034】実施例6.実施例1では、雑音レベルを2
値判別しているが、これを多値または連続的な数値とす
ることも可能である。
【0035】実施例7.実施例1において、フレーム内
最大振幅値を判別パラメータに含めることも可能であ
る。
【0036】
【発明の効果】以上のようにこの発明によれば、入力音
声のフレームを分析して得る判別パラメータの判別閾値
近辺においても、判別誤りが少なく、また、背景雑音レ
ベルの高低に依存せず、判別誤りが少ない有声音・無声
音判別装置を得ることができる。また、有声音的な特徴
と無声音的な特徴を合わせ持つ中間的な状態の音声フレ
ームも判別できる有声音・無声音判別装置を得ることが
できる。
【図面の簡単な説明】
【図1】本発明の実施例1を示す有声音・無声音判別装
置の構成ブロック図である。
【図2】図1の有声音・無声音判別装置の判別条件を例
示する図である。
【図3】図1の有声音・無声音判別装置の判別条件を例
示する図である。
【図4】図1の有声音・無声音判別装置の判別条件を例
示する図である。
【図5】図1の有声音・無声音判別装置の判別条件を例
示する図である。
【図6】従来の有声音・無声音判別装置を示す構成図で
ある。
【図7】図6の有声音・無声音判別装置の判別パラメー
タの分布を示す図である。
【符号の説明】
1 入力音声のフレームのパワー 2 正規化自己相関のピーク値 3 零交差数 4 第1次の線形予測係数 5 雑音レベル判定手段 6 雑音レベル 7 無音平均パワー 8 有声音平均パワー 9 閾値算出手段 10 パワー判別閾値 11 照合手段 12 判別結果 13 レジスタ 14 過去の音声フレームのパワー 15 過去の音声フレームの正規化自己相関ピーク値 16 過去の音声フレームの判別結果 17 ケプストラムの低次項 18 ケプストラム 19 加算回路 20 判別パラメータ 21 閾値比較回路 22 判別結果
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成5年11月30日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】0008
【補正方法】変更
【補正内容】
【0008】
【課題を解決するための手段】上記の目的を達成するた
めに、請求項1に係わる発明は、音声信号の有声音、無
声音の判別をする有声音・無声音判別装置において、入
力音声のフレームを分析して得る判別パラメータの値に
基づいて、有声音、無声音、無音を判別する判別条件を
複数の異なる判別条件の中から選択し、さらに、上記選
択した判別条件に従って、パワー、正規化自己相関のピ
ーク値、零交差数、第1次の線形予測係数、過去の音声
フレームの判別結果、ケプストラムの低次項の中から少
なくとも一つを判別パラメータとして用い、所定の閾値
と照合することにより、有声音、無声音、無音の判別結
果を出力する照合手段を備え、上記有声音、無声音、無
音判別の判別誤りを少なくするようにしたものである。

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 音声信号の有声音、無声音を判別をする
    有声音・無声音判別装置において、入力音声のフレーム
    を分析して得るパラメータの値に基づいて、有声音、無
    声音、無音を判別する判別条件を複数の異なる判別条件
    の中から選択し、さらに、上記選択した判別条件に従っ
    て、パワー、正規化自己相関のピーク値、零交差数、第
    1次の線形予測係数、過去の音声フレームの判別結果、
    ケプストラムの低次項の中から少なくとも一つを判別パ
    ラメータとして用い、所定の閾値と照合することによ
    り、有声音、無声音、無音の判別結果を出力する照合手
    段を備え、上記有声音、無声音、無音判別の判別誤りを
    少なくすることを特徴とする有声音・無声音判別装置。
  2. 【請求項2】 音声信号の有声音、無声音を判別をする
    有声音・無声音判別装置において、入力音声のフレーム
    を分析して得る判別パラメータを有声音、無声音、無音
    判別の判別条件と照合し、有声音、無声音、無音いずれ
    かの区分に入る場合は有声音、無声音、または無音を判
    別結果として出力し、いずれの区分にも確実に入らない
    場合、有声音的特徴を有するときは準有声音として、無
    音的特徴を有するときは準無音として判別結果を出力す
    る照合手段を備え、 有声音、無声音、または無音の他に中間的な準有声音、
    準無音を判別結果として出力することを特徴とする有声
    音・無声音判別装置。
  3. 【請求項3】 音声信号の有声音、無声音の判別をする
    有声音・無声音判別装置において、入力音声の背景雑音
    レベルを求め雑音レベルとして出力する雑音レベル判定
    手段と、上記の雑音レベルの値により、有声音、無声
    音、無音を判別する判別条件を複数の異なる判別条件の
    中から選択し、入力音声のフレームを分析して得られた
    判別パラメータと所定の閾値とを照合して有声音、無声
    音、無音判別を行う照合手段と、を備え、雑音レベルの
    値により、有声音、無声音、無音判別の閾値を変化させ
    ることを特徴とする有声音・無声音判別装置。
  4. 【請求項4】 雑音レベル判定手段として、入力音声の
    フレームと過去の音声フレームの、判別結果、パワー、
    正規化自己相関のピーク値の中から少なくとも一つを判
    別パラメータとして用い、所定の閾値と照合することに
    より、入力音声のフレームと過去の音声のフレームにつ
    いて有声音区間と無音区間に該当する区間を決定し、上
    記の有声音区間と無音区間のパワーの平均を算出して、
    それぞれ有声音平均パワーと無音平均パワーとし、上記
    の有声音平均パワーと上記無音平均パワーとを比較する
    ことにより雑音レベルの高低を判定し出力する雑音レベ
    ル判定手段を備えたことを特徴とする請求項3記載の有
    声音・無声音判別装置。
  5. 【請求項5】 雑音レベル判定手段として、過去の音声
    フレームの平均パワーより入力音声のフレームのパワー
    が大きいフレームのパワーの平均を入力音声のフレーム
    毎に更新しながら算出して有声音平均パワーとし、且つ
    過去の音声フレームの平均パワーより入力音声のフレー
    ムのパワーが小さいフレームのパワーの平均を入力音声
    のフレーム毎に更新しながら算出して無音平均パワーと
    し、上記有声音平均パワーと上記無音平均パワーとを比
    較することにより雑音レベルの高低を判定し出力する雑
    音レベル判定手段を備えたことを特徴とする請求項3記
    載の有声音・無声音判別装置。
JP20324893A 1993-08-17 1993-08-17 音声判別装置 Expired - Fee Related JP3297156B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP20324893A JP3297156B2 (ja) 1993-08-17 1993-08-17 音声判別装置
JP2000188987A JP3394506B2 (ja) 1993-08-17 2000-06-23 音声判別装置及び音声判別方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20324893A JP3297156B2 (ja) 1993-08-17 1993-08-17 音声判別装置

Related Child Applications (2)

Application Number Title Priority Date Filing Date
JP2000188987A Division JP3394506B2 (ja) 1993-08-17 2000-06-23 音声判別装置及び音声判別方法
JP2000188942A Division JP3328642B2 (ja) 1993-08-17 2000-06-23 音声判別装置及び音声判別方法

Publications (2)

Publication Number Publication Date
JPH0756598A true JPH0756598A (ja) 1995-03-03
JP3297156B2 JP3297156B2 (ja) 2002-07-02

Family

ID=16470888

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20324893A Expired - Fee Related JP3297156B2 (ja) 1993-08-17 1993-08-17 音声判別装置

Country Status (1)

Country Link
JP (1) JP3297156B2 (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09281996A (ja) * 1996-04-15 1997-10-31 Sony Corp 有声音/無声音判定方法及び装置、並びに音声符号化方法
JP2002261553A (ja) * 2001-03-02 2002-09-13 Ricoh Co Ltd 音声自動利得制御装置、音声自動利得制御方法、音声自動利得制御用のアルゴリズムを持つコンピュータプログラムを格納する記憶媒体及び音声自動利得制御用のアルゴリズムを持つコンピュータプログラム
WO2004040552A1 (ja) * 2002-10-31 2004-05-13 Nec Corporation トランスコーダ及び符号変換方法
WO2004040553A1 (ja) * 2002-10-31 2004-05-13 Nec Corporation 帯域拡張装置及び方法
US7117154B2 (en) 1997-10-28 2006-10-03 Yamaha Corporation Converting apparatus of voice signal by modulation of frequencies and amplitudes of sinusoidal wave components
KR100819848B1 (ko) * 2005-12-08 2008-04-08 한국전자통신연구원 발화검증을 위한 임계치값 자동 갱신을 이용한 음성인식장치 및 방법
US7486719B2 (en) 2002-10-31 2009-02-03 Nec Corporation Transcoder and code conversion method
US7606709B2 (en) 1998-06-15 2009-10-20 Yamaha Corporation Voice converter with extraction and modification of attribute data
JP2012252060A (ja) * 2011-05-31 2012-12-20 Fujitsu Ltd 話者判別装置、話者判別プログラム及び話者判別方法
JP2013011680A (ja) * 2011-06-28 2013-01-17 Fujitsu Ltd 話者判別装置、話者判別プログラム及び話者判別方法
JP2014517938A (ja) * 2011-05-24 2014-07-24 クゥアルコム・インコーポレイテッド 雑音ロバスト音声コード化のモード分類

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09281996A (ja) * 1996-04-15 1997-10-31 Sony Corp 有声音/無声音判定方法及び装置、並びに音声符号化方法
US7117154B2 (en) 1997-10-28 2006-10-03 Yamaha Corporation Converting apparatus of voice signal by modulation of frequencies and amplitudes of sinusoidal wave components
US7606709B2 (en) 1998-06-15 2009-10-20 Yamaha Corporation Voice converter with extraction and modification of attribute data
JP2002261553A (ja) * 2001-03-02 2002-09-13 Ricoh Co Ltd 音声自動利得制御装置、音声自動利得制御方法、音声自動利得制御用のアルゴリズムを持つコンピュータプログラムを格納する記憶媒体及び音声自動利得制御用のアルゴリズムを持つコンピュータプログラム
JP4548953B2 (ja) * 2001-03-02 2010-09-22 株式会社リコー 音声自動利得制御装置、音声自動利得制御方法、音声自動利得制御用のアルゴリズムを持つコンピュータプログラムを格納する記憶媒体及び音声自動利得制御用のアルゴリズムを持つコンピュータプログラム
WO2004040553A1 (ja) * 2002-10-31 2004-05-13 Nec Corporation 帯域拡張装置及び方法
US7486719B2 (en) 2002-10-31 2009-02-03 Nec Corporation Transcoder and code conversion method
US7684979B2 (en) 2002-10-31 2010-03-23 Nec Corporation Band extending apparatus and method
WO2004040552A1 (ja) * 2002-10-31 2004-05-13 Nec Corporation トランスコーダ及び符号変換方法
KR100819848B1 (ko) * 2005-12-08 2008-04-08 한국전자통신연구원 발화검증을 위한 임계치값 자동 갱신을 이용한 음성인식장치 및 방법
JP2014517938A (ja) * 2011-05-24 2014-07-24 クゥアルコム・インコーポレイテッド 雑音ロバスト音声コード化のモード分類
US8990074B2 (en) 2011-05-24 2015-03-24 Qualcomm Incorporated Noise-robust speech coding mode classification
JP2012252060A (ja) * 2011-05-31 2012-12-20 Fujitsu Ltd 話者判別装置、話者判別プログラム及び話者判別方法
JP2013011680A (ja) * 2011-06-28 2013-01-17 Fujitsu Ltd 話者判別装置、話者判別プログラム及び話者判別方法

Also Published As

Publication number Publication date
JP3297156B2 (ja) 2002-07-02

Similar Documents

Publication Publication Date Title
US7200558B2 (en) Prosody generating device, prosody generating method, and program
EP2089877B1 (en) Voice activity detection system and method
US7415408B2 (en) Speech recognizing apparatus with noise model adapting processing unit and speech recognizing method
EP3370230B1 (en) Voice interaction apparatus, its processing method, and program
US7272561B2 (en) Speech recognition device and speech recognition method
US7797156B2 (en) Speech analyzing system with adaptive noise codebook
JPH0756598A (ja) 有声音・無声音判別装置
JP2000172295A (ja) 低複雑性スピ―チ認識器の区分ベ―スの類似性方法
US5732393A (en) Voice recognition device using linear predictive coding
JP3119510B2 (ja) 音声認識装置
US6823304B2 (en) Speech recognition apparatus and method performing speech recognition with feature parameter preceding lead voiced sound as feature parameter of lead consonant
JP3394506B2 (ja) 音声判別装置及び音声判別方法
US7280961B1 (en) Pattern recognizing device and method, and providing medium
JP3328642B2 (ja) 音声判別装置及び音声判別方法
JPH0667698A (ja) 音声認識装置
US5727121A (en) Sound processing apparatus capable of correct and efficient extraction of significant section data
JP2006010739A (ja) 音声認識装置
JPH11212588A (ja) 音声処理装置、音声処理方法、及び音声処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3375655B2 (ja) 有音無音判定方法およびその装置
JP3584002B2 (ja) 音声認識装置および音声認識方法
JPH10124084A (ja) 音声処理装置
JPH07210197A (ja) 話者識別方法
Farsinejad et al. A Model-based Voice Activity Detection Algorithm using probabilistic neural networks
JP3600178B2 (ja) 音声認識装置および音声認識方法
JP2692553B2 (ja) 音声認識装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020402

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040520

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080412

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090412

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100412

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100412

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110412

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees