JPH06236195A - 音声区間検出方法 - Google Patents

音声区間検出方法

Info

Publication number
JPH06236195A
JPH06236195A JP5024543A JP2454393A JPH06236195A JP H06236195 A JPH06236195 A JP H06236195A JP 5024543 A JP5024543 A JP 5024543A JP 2454393 A JP2454393 A JP 2454393A JP H06236195 A JPH06236195 A JP H06236195A
Authority
JP
Japan
Prior art keywords
voice
value
frame
section
voice section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5024543A
Other languages
English (en)
Other versions
JP3413862B2 (ja
Inventor
Katsuki Minamino
活樹 南野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP02454393A priority Critical patent/JP3413862B2/ja
Publication of JPH06236195A publication Critical patent/JPH06236195A/ja
Application granted granted Critical
Publication of JP3413862B2 publication Critical patent/JP3413862B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【構成】 入力音声信号から処理すべき1フレーム分の
データを抽出し(S1)、該1フレームの実効値(RM
S値)Rを計算し(S2)する。また、音声区間の最新
の30フレームのRMSの平均値RV を計算しておき、
各フレーム毎のRMS値RをRV で除算した値R/RV
を求める。音声区間中は、この値R/RVが所定の閾値
V より小さくなることを検出し、これがm(例えば1
5)フレーム連続するか否かを判別して(S6)、YE
Sのときには無音声区間の開始点とする(S9)。 【効果】 雑音のある環境下でも音声区間の検出を確実
に行えるようにし、かつ演算量を少なくして電力消費を
低減することができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声信号中の音声の有
る区間を無音声区間と区別して検出する音声区間検出方
法に関し、特に、音声符号化の前処理として音声区間を
検出して無音声区間をゼロマスクする処理等に適用可能
な音声区間検出方法に関する。
【0002】
【従来の技術】入力された音声信号を所定の音声符号化
方式で符号化して伝送する場合(通信媒体を介して送信
したり記録媒体に記録する場合等)において、符号化に
先立って、入力信号中の音声が有る区間(有音声区間)
と無い区間(無音声区間)とを区別しておき、無音声区
間をゼロ信号でマスクする(ゼロマスクする)ような、
いわゆるVox制御あるいはVox処理が知られてい
る。
【0003】上記音声信号の符号化の具体的な例として
は、MBE(Multiband Excitation: マルチバンド励
起)符号化、SBE(Singleband Excitation:シングル
バンド励起)符号化、ハーモニック(Harmonic)符号
化、SBC(Sub-band Coding:帯域分割符号化)、LP
C(Linear Predictive Coding: 線形予測符号化)、あ
るいはDCT(離散コサイン変換)、MDCT(モデフ
ァイドDCT)、FFT(高速フーリエ変換)等があ
る。
【0004】
【発明が解決しようとする課題】ところで、音声信号に
は背景雑音が含まれていることが多く、このため音声区
間を切り出す際に、例えば無音声区間中に含まれたノイ
ズと音声を区別することが困難である。
【0005】すなわち、例えば入力音声信号の実効値
(いわゆるRMS、2乗平均根)を用いて音声の有無を
検出する方法があるが、この場合、無音声区間であるに
もかかわらず、環境雑音等のノイズが含まれていること
によって有音声と判断してしまうという問題があり、音
声とノイズとの区別が困難である。
【0006】また、信号に含まれている基本周期やピッ
チ等を検出したり、信号波形のゼロクロスの頻度を見た
り、周波数成分の分布を見ること等を併用することで、
音声区間検出の信頼性を高めることも考えられるが、処
理が複雑で計算量が増大するという問題がある。これ
は、音声符号化装置や電話装置等の消費電力の増加につ
ながり、電池駆動タイプの携帯用機器においては電池寿
命の短期化という欠点に結び付くことになる。
【0007】本発明は、上記実情に鑑みてなされたもの
であり、音声の有無を雑音等に影響されることなく確実
に判別でき、しかも処理が簡単で計算量も比較的小さく
て済み、適用される機器の消費電力を節約することがで
きる音声区間検出方法の提供を目的とする。
【0008】
【課題を解決するための手段】本発明に係る音声区間検
出方法は、上記課題を解決するために、入力された音声
信号を一定サンプル数のフレームを単位として分割し、
各フレーム毎に音声の有無を判別して音声の有る区間を
検出する音声区間検出方法において、音声区間とされた
複数フレームの平均パワーにより各フレームのパワーを
正規化する工程と、この正規化された値を所定の閾値と
比較して音声区間を検出する工程とを有することを特徴
としている。
【0009】この場合、1つあるいは2つの閾値を用い
て音声区間から無音声区間への移行点(無音声区間の開
始点)及び無音声区間から音声区間への移行点(音声区
間の開始点)を求めるようにしてもよいが、この音声区
間の開始点については、無音声区間とされた複数フレー
ムの平均パワーと各フレームのパワーとの比をとり、こ
の比の値を他の所定の閾値と比較して検出することが好
ましい。
【0010】また、上記無音声区間の開始点について
は、上記正規化された値が上記閾値以下となるフレーム
が所定数以上連続したとき上記音声区間が終了したこと
を検出することが好ましい。
【0011】さらに、これらの音声区間の開始点検出及
び無音声区間の開始点検出が誤検出となることを避ける
ために、上記フレームのパワーが所定の無声音区間パワ
ー閾値より小さいとき当該フレームを無音声区間とした
り、上記フレームのパワーが所定の有音声区間パワー閾
値より大きいとき当該フレームを有音声区間とすること
が望ましい。
【0012】
【作用】ノイズが含まれる入力音声信号に対しても音声
区間の検出が確実に行え、計算量も比較的少なくて済
む。
【0013】
【実施例】以下、本発明に係る音声区間検出方法の好ま
しい実施例について、図面を参照しながら説明する。図
1は、本発明の第1の実施例となる音声区間検出方法を
説明するためのフローチャートである。
【0014】この図1において、入力されたディジタル
音声信号に対して、ステップS1では処理すべき1フレ
ーム分のデータが抽出され、次のステップS2で1フレ
ームのパワーあるいは実効値、いわゆるRMS(2乗平
均根)の値Rが計算される。次のステップS3では、上
記実効値Rが所定の有音声区間パワー閾値CV 以上であ
るか否かを判別し、YESのときはステップS8に進
み、NOのときはステップS4に進む。ステップS4で
は、上記実効値Rが所定の無音声区間パワー閾値CN
あるか否かを判別し、YESのときはステップS9に進
み、NOのときはステップS5に進む。ステップS5で
は、時間的に前のフレームが有音声フレームか否かを判
別し、YES(有音声)のときはステップS6に進み、
NO(無音声)のときはステップS7に進む。
【0015】ステップS6では、音声区間と判別された
最新の一定nフレーム(例えば30フレーム)のパワー
(例えばRMS値)の平均値RV を求めておき、音声フ
レーム毎のパワー(RMS値)Rを上記音声区間のパワ
ー平均値RV で正規化した値R/RV を求め、この音声
区間パワー平均値によるフレーム毎のパワー正規化値R
/RV について、一定フレーム数m(例えば15フレー
ム)以上続けて所定の閾値KV (例えば0.1)よりも
小さくなっているか否かを判別している。このステップ
S6でNOと判別されたとき、すなわち上記正規化値R
/RV が上記閾値KV (例えば0.1)以上であるとき
にはステップS8に進み、YESと判別されたとき(R
/RV <KV のとき)にはステップS9に進む。
【0016】ステップS7では、無音声区間と判別され
た最新の一定nフレーム(例えば30フレーム)のパワ
ー(例えばRMS値)の平均値RN を求めておき、この
無音声区間のパワー平均値RN をフレーム毎のパワー
(RMS値)Rで除算した(割り算した)値RN /Rを
求め、この除算値RN /Rが所定の閾値KN (例えば
0.5)よりも小さいか否かを判別している。このステ
ップS7でYESと判別されたとき(RN /R<KN
とき)にはステップS8に進み、NOと判別されたとき
にはステップS9に進み、
【0017】ステップS8では、現在のフレームが有音
声区間であると判断すると共に、上記音声区間のパワー
平均値であるRV を更新する。ステップS9では、現在
のフレームが無音声区間であると判断すると共に、上記
無音声区間のパワー平均値であるRN を更新する。これ
らのステップS8あるいはS9の処理後に上記ステップ
S1に戻る。
【0018】以上のような音声区間検出方法の実施例に
よれば、音声信号にノイズが含まれていても、SN比が
ある程度大きい定常ノイズであれば、音声の有無を検出
でき、しかも計算量は比較的小さいものとなっている。
これにより、デジタル携帯電話等における音声信号の送
信において、送信パワーを節約することができる。
【0019】次に、図2のAに示すような入力音声信号
を、所定のサンプリング周波数fS(例えば8kHz)で
サンプリングし、図2のBに示すように所定サンプル数
(例えば160サンプル)を単位として分割してそれぞ
れを1フレームとし、各フレームに音声が含まれるか含
まれないかを検出するための操作の具体例について説明
する。
【0020】ここで、前述したようないわゆるVox処
理を行うフレームを図2のBに示すフレームとすると
き、この1フレーム160サンプルに時間的に連続する
65サンプル先までの合計225サンプル(図2のC)
の内の、最新の160サンプル(図2のD)を用いて上
記有声音区間か無声音区間かの判定を行う。
【0021】この図2のDに示す判定フレーム(160
サンプル)のサンプル値ついて、上記RMS(2乗平均
根)の値を求め、これをRとする。図3は具体的な入力
音声信号に対する上記RMS値の時間経過に伴う変化を
示しており、横軸に時間経過をフレーム数で表し、縦軸
に音声信号をパワーを上記RMS値で表している。この
場合の入力音声信号は、音声レベルは標準的なレベル
で、背景雑音なしのものを第1の音声信号試料として用
いている。
【0022】一方、音声区間の最新のn(例えば30)
フレームのRMS値の平均値を求めておき、これをRV
とする。同様に、無音声区間の最新のnフレームのRM
S平均値も求めておき、これをRN とする。
【0023】次に、各フレーム毎に、比R/RV 、RN
/Rを計算する。もし、背景雑音に比べて音声がある程
度大きく(例えば、音声区間のRMS平均値が背景雑音
のRMS平均値の10倍以上)、しかも背景雑音が定常
であれば、 (1) 比R/RV は音声区間では1.0近傍を変化し、無
音声区間では0.0近傍を変化する。 (2) 比RN /Rは無音声区間では1.0近傍を変化し、
音声区間になるとその定常性が崩れる。 と考えられる。
【0024】ここで図4及び図5は、上記図3に示した
フレーム毎のRMS値が得られるような上記第1の音声
信号試料が入力されるときの比R/RV の値及び比RN
/Rの値の時間変化を示している。
【0025】そこで音声区間中では上記比R/RV に着
目し、この比R/RV が1よりある程度小さくなり、か
つそれが一定区間続いたとき、例えば、R/RV <0.
1、という条件がm(例えば15)フレーム以上続いた
とき、を無音声区間の始まりとみなす。この閾値KV
0.1は、SN比20dB以上の背景雑音が存在して
も、無音区間が検知できるようにするときの条件であ
る。図4の具体例では、点aの時刻からR/RV が閾値
V =0.1を下回るようになり、これがmフレーム
(15フレーム)続いた時点bが無音声区間の始まりと
なる。
【0026】次に、無音声区間から音声区間への移行の
検知は、上記比R/RV を他の閾値で弁別して行うよう
にしてもよいが、本実施例では上記比RN /Rの変化に
着目して行っている。すなわち、無音声区間中では、上
記比RN /Rの定常性が崩れたとき、例えば、RN /R
<0.5(=KN )、となったとき(瞬間)を音声区間
の始まりとみなす。図5の具体例では、点aの時刻から
N /Rが閾値KN =0.5を下回り、この時点aが音
声区間の始まりとなる。
【0027】さらに、これらの無音声区間の始まり検出
や音声区間の始まり検出が、誤った検出となるのを避け
るため、上記比R/RV 、RN /Rの条件が満たされて
も、上記フレーム毎のRMS値がある閾値CV (例えば
200程度)より大きなフレームは有音声区間とみな
し、上記RMS値が他のある閾値CN (例えば、レベル
の小さな音声のRMS平均値の1/20程度)より小さ
なフレームは無音声区間とみなす。
【0028】ここで、上記CV は上記有音声区間パワー
閾値に相当し、従来において音声区間検出のために用い
られていた閾値より大きい値とすることができる。すな
わち本来の音声区間検出は上記R/RV を上記閾値KV
で弁別することにより行われ、上記閾値CV は誤検出防
止のために設定されるものであって、確実に音声区間と
判断できる程度の大きさとすればよいからである。ま
た、上記CN は上記無声音区間パワー閾値に相当し、例
えば音声があったとしても人の耳に聴こえない程度の値
に設定すればよい。
【0029】ところで上記図3〜図5は、入力音声信号
として、音声レベルが標準で、背景雑音なしの第1の音
声信号試料を用いた場合を示しているが、音声レベルが
小さい場合や、背景雑音がある場合でも、音声区間の検
出が確実に行える。
【0030】すなわち、図6は、音声レベルが小さく
(−20dB)、背景雑音なしの第2の音声信号試料を
入力信号としたときの各フレーム毎の上記RMS値を破
線で示し、音声レベルは標準で、背景雑音あり(SN比
26dB)の第3の音声信号試料を入力信号としたとき
の各フレーム毎のRMS値を実線で示している。この図
6から明らかなように、各フレーム毎のRMS値だけで
は上記第2の音声信号試料の音声区間と第3の音声信号
試料の無音声区間とを区別する閾値が得られず、例えば
第3の音声信号試料の無音声区間を音声区間と誤判定し
たり、第2の音声信号試料の音声区間を無音声区間と誤
判定するような不具合が生じる。
【0031】これに対して、各信号の音声区間の最新の
nフレームのRMS平均値で除算して正規化すると、図
7、図8に示すようなグラフが得られる。すなわち、図
7は上記第2の音声信号試料のフレーム毎のRMS値R
を、音声区間の最新の30フレームのRMS値の平均値
V で除算することで正規化した値R/RV を示してお
り、図8は上記第3の音声信号試料について同様な手順
で正規化して得られた値R/RV を示している。
【0032】これらの図7、図8においては、所定の閾
値KV (例えば0.1)により音声区間と無音声区間と
を確実に区別することができる。ここで、上述した実施
例と同様に、このR/RV の値を音声区間から無音声区
間への移行点を検出するような用途に用いる場合には、
音声区間中にR/RV が上記閾値KV =0.1を下回り
かつこれが所定のm(例えば15)フレーム連続する時
点を無音声区間の開始点とすればよい。図7の例では点
aからmフレーム後、点bからmフレーム後、図8の例
では点aからmフレーム後、点bからmフレーム後、等
が上記無音声区間の開始点になり得る。ただし、上記所
定数mを大きくとると各図の点aからmフレーム目は次
の音声区間内になってR/RV が閾値KV =0.1を超
えるため、無音声区間の開始点とはならなくなり、各図
の点bからmフレーム目のみが無音声区間の開始点とな
る。
【0033】音声区間の開始点は、上記図7、図8のR
/RV を他の所定の閾値で弁別して検出してもよいが、
上述したように、無音声区間の最新のnフレーム(例え
ば30フレーム)のRMS値の平均値RN を求めてお
き、各フレーム毎にRN /Rを計算して、このRN /R
の値が所定の閾値KN (例えば0.5)を下回った時点
を音声区間の開始点とすればよい。さらに、上述したよ
うに誤検出を防止するために、フレーム毎のRMS値を
上記有音声区間パワー閾値CV や上記無声音区間パワー
閾値CN で弁別して、音声区間の始まりや無音声区間の
始まりを検出するようにしてもよいことは勿論である。
【0034】このような実施例の音声区間の検出方法
は、例えばディジタル携帯電話の音声圧縮動作の前処理
に適用して好ましい。すなわち、一般に携帯電話装置
は、屋外等の雑音のある環境下で使用されることも多
く、音声区間の検出が重要とされるのみならず、本実施
例の検出方法は計算量も比較的少なく、電力消費が少な
くて済み、送信パワーを節約することができ、電池寿命
を長く保つことができる。
【0035】なお、本発明は上記実施例のみに限定され
るものではなく、例えば、入力音声信号の1フレーム内
のサンプル数や、RMS値の平均値(RV やRN )を得
るためのフレーム数nや、無音声区間の始まりを検出す
るときのフレーム数m等は、上記具体的数値以外に任意
に設定することができる。また、各閾値KV 、KN 、C
V 、CN 等も上記具体例に限定されない。さらに、各フ
レームのパワーとしては、上記RMS(2乗平均根)値
の代わりに、絶対値や、2乗値等を用いるようにしても
よい。
【0036】
【発明の効果】本発明に係る音声区間検出方法によれ
ば、音声区間とされた複数フレームの平均パワーにより
各フレームのパワーを正規化し、この正規化された値を
所定の閾値と比較して音声区間を検出しているため、ノ
イズが含まれる入力音声信号に対しても音声区間の検出
が確実に行え、計算量も比較的少なくて済む。従って、
特にディジタル携帯電話装置等に適用した場合に、雑音
のある環境下でも送信パワーを節約することができ、電
池寿命を長く保つことができる。
【0037】また、音声区間の開始点については、無音
声区間とされた複数フレームの平均パワーと各フレーム
のパワーとの比をとり、この比の値を他の所定の閾値と
比較して検出することが好ましい。無音声区間の開始点
については、上記正規化された値が上記閾値以下となる
フレームが所定数以上連続したとき上記音声区間が終了
したことを検出することが好ましい。さらに、これらの
音声区間の開始点検出及び無音声区間の開始点検出が誤
検出となることを避けるために、上記フレームのパワー
が所定の無声音区間パワー閾値より小さいとき当該フレ
ームを無音声区間としたり、上記フレームのパワーが所
定の有音声区間パワー閾値より大きいとき当該フレーム
を有音声区間とすることが好ましい。これらによって、
音声区間検出の精度及び信頼性をより高めることができ
る。
【図面の簡単な説明】
【図1】本発明に係る音声区間検出方法の一実施例を説
明するためのフローチャートである。
【図2】入力音声信号のフレーム区分を説明するための
図である。
【図3】第1の音声信号試料についてのフレーム毎のR
MS値を示すグラフである。
【図4】第1の音声信号試料についてのフレーム毎のR
MS値Rを音声区間の最新の30フレームのRMSの平
均値RV で除算した値R/RV を示すグラフである。
【図5】第1の音声信号試料についての無音声区間の最
新の30フレームのRMSの平均値RN をフレーム毎の
RMS値Rで除算した値RN /Rを示すグラフである。
【図6】第2の音声信号試料及び第3の音声信号試料に
ついてのフレーム毎のRMS値を示すグラフである。
【図7】第2の音声信号試料についてのフレーム毎のR
MS値Rを音声区間の最新の30フレームのRMSの平
均値RV で除算した値R/RV を示すグラフである。
【図8】第3の音声信号試料についてのフレーム毎のR
MS値Rを音声区間の最新の30フレームのRMSの平
均値RV で除算した値R/RV を示すグラフである。

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 入力された音声信号を一定サンプル数の
    フレームを単位として分割し、各フレーム毎に音声の有
    無を判別して音声の有る区間を検出する音声区間検出方
    法において、 音声区間とされた複数フレームの平均パワーにより各フ
    レームのパワーを正規化する工程と、 この正規化された値を所定の閾値と比較して音声区間を
    検出する工程とを有することを特徴とする音声区間検出
    方法。
  2. 【請求項2】 無音声区間とされた複数フレームの平均
    パワーと各フレームのパワーとの比をとる工程と、 この比の値を他の所定の閾値と比較して上記音声区間の
    開始点を検出する工程とを有することを特徴とする請求
    項1記載の音声区間検出方法。
  3. 【請求項3】 上記閾値以下となるフレームが所定数以
    上連続したとき上記音声区間が終了したことを検出する
    ことを特徴とする請求項1又は2記載の音声区間検出方
    法。
  4. 【請求項4】 上記フレームのパワーが所定の無声音区
    間パワー閾値より小さいとき、当該フレームを無音声区
    間とする工程を有することを特徴とする請求項1、2又
    は3記載の音声区間検出方法。
  5. 【請求項5】 上記フレームのパワーが所定の有音声区
    間パワー閾値より大きいとき、当該フレームを有音声区
    間とする工程を有することを特徴とする請求項1、2、
    3又は4記載の音声区間検出方法。
JP02454393A 1993-02-12 1993-02-12 音声区間検出方法 Expired - Fee Related JP3413862B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02454393A JP3413862B2 (ja) 1993-02-12 1993-02-12 音声区間検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02454393A JP3413862B2 (ja) 1993-02-12 1993-02-12 音声区間検出方法

Publications (2)

Publication Number Publication Date
JPH06236195A true JPH06236195A (ja) 1994-08-23
JP3413862B2 JP3413862B2 (ja) 2003-06-09

Family

ID=12141070

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02454393A Expired - Fee Related JP3413862B2 (ja) 1993-02-12 1993-02-12 音声区間検出方法

Country Status (1)

Country Link
JP (1) JP3413862B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005121786A (ja) * 2003-10-15 2005-05-12 National Institute Of Information & Communication Technology 音声レベル自動補正装置
JP2008209903A (ja) * 2007-01-30 2008-09-11 Victor Co Of Japan Ltd 再生装置、再生方法及び再生プログラム
WO2011077924A1 (ja) * 2009-12-24 2011-06-30 日本電気株式会社 音声検出装置、音声検出方法、および音声検出プログラム
JP2016167925A (ja) * 2015-03-10 2016-09-15 富士電機株式会社 三相インバータ装置及びその制御方法
CN109935240A (zh) * 2017-12-18 2019-06-25 上海智臻智能网络科技股份有限公司 通过语音识别情绪的方法
CN109935241A (zh) * 2017-12-18 2019-06-25 上海智臻智能网络科技股份有限公司 语音信息处理方法
CN109961803A (zh) * 2017-12-18 2019-07-02 上海智臻智能网络科技股份有限公司 语音情绪识别系统

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112069354B (zh) * 2020-09-04 2024-06-21 广州趣丸网络科技有限公司 一种音频数据的分类方法、装置、设备和存储介质

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005121786A (ja) * 2003-10-15 2005-05-12 National Institute Of Information & Communication Technology 音声レベル自動補正装置
JP4552064B2 (ja) * 2003-10-15 2010-09-29 独立行政法人情報通信研究機構 音声レベル自動補正装置
JP2008209903A (ja) * 2007-01-30 2008-09-11 Victor Co Of Japan Ltd 再生装置、再生方法及び再生プログラム
WO2011077924A1 (ja) * 2009-12-24 2011-06-30 日本電気株式会社 音声検出装置、音声検出方法、および音声検出プログラム
JPWO2011077924A1 (ja) * 2009-12-24 2013-05-02 日本電気株式会社 音声検出装置、音声検出方法、および音声検出プログラム
JP5621786B2 (ja) * 2009-12-24 2014-11-12 日本電気株式会社 音声検出装置、音声検出方法、および音声検出プログラム
JP2016167925A (ja) * 2015-03-10 2016-09-15 富士電機株式会社 三相インバータ装置及びその制御方法
CN109935240A (zh) * 2017-12-18 2019-06-25 上海智臻智能网络科技股份有限公司 通过语音识别情绪的方法
CN109935241A (zh) * 2017-12-18 2019-06-25 上海智臻智能网络科技股份有限公司 语音信息处理方法
CN109961803A (zh) * 2017-12-18 2019-07-02 上海智臻智能网络科技股份有限公司 语音情绪识别系统

Also Published As

Publication number Publication date
JP3413862B2 (ja) 2003-06-09

Similar Documents

Publication Publication Date Title
EP0979504B1 (en) System and method for noise threshold adaptation for voice activity detection in nonstationary noise environments
US8165880B2 (en) Speech end-pointer
US5617508A (en) Speech detection device for the detection of speech end points based on variance of frequency band limited energy
US6424938B1 (en) Complex signal activity detection for improved speech/noise classification of an audio signal
KR101437830B1 (ko) 음성 구간 검출 방법 및 장치
US6711536B2 (en) Speech processing apparatus and method
JP4868999B2 (ja) 音声認識方法、音声認識装置及びコンピュータプログラム
US5579431A (en) Speech detection in presence of noise by determining variance over time of frequency band limited energy
US5826230A (en) Speech detection device
US6236970B1 (en) Adaptive speech rate conversion without extension of input data duration, using speech interval detection
US20090154726A1 (en) System and Method for Noise Activity Detection
EP1724758A2 (en) Delay reduction for a combination of a speech preprocessor and speech encoder
EP1312075B1 (en) Method for noise robust classification in speech coding
JP2007534020A (ja) 信号符号化
JP2000148172A (ja) 音声の動作特性検出装置および検出方法
US20060100866A1 (en) Influencing automatic speech recognition signal-to-noise levels
WO1999010879A1 (en) Waveform-based periodicity detector
JP3413862B2 (ja) 音声区間検出方法
US6868378B1 (en) Process for voice recognition in a noisy acoustic signal and system implementing this process
US7299173B2 (en) Method and apparatus for speech detection using time-frequency variance
US8442817B2 (en) Apparatus and method for voice activity detection
Vahatalo et al. Voice activity detection for GSM adaptive multi-rate codec
JP2564821B2 (ja) 音声判定検出装置
KR100284772B1 (ko) 음성 검출 장치 및 그 방법
JP2656069B2 (ja) 音声検出装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030304

LAPS Cancellation because of no payment of annual fees