JPH10301593A - 音声区間検出方法およびその装置 - Google Patents

音声区間検出方法およびその装置

Info

Publication number
JPH10301593A
JPH10301593A JP9112822A JP11282297A JPH10301593A JP H10301593 A JPH10301593 A JP H10301593A JP 9112822 A JP9112822 A JP 9112822A JP 11282297 A JP11282297 A JP 11282297A JP H10301593 A JPH10301593 A JP H10301593A
Authority
JP
Japan
Prior art keywords
power
value
voice section
maximum value
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9112822A
Other languages
English (en)
Other versions
JP3160228B2 (ja
Inventor
Toru Tsugi
徹 都木
Nobumasa Seiyama
信正 清山
Atsushi Imai
篤 今井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP11282297A priority Critical patent/JP3160228B2/ja
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to US09/202,867 priority patent/US6236970B1/en
Priority to CA002392849A priority patent/CA2392849C/en
Priority to EP98917743A priority patent/EP0944036A4/en
Priority to EP08005875A priority patent/EP1944753A3/en
Priority to EP04027925A priority patent/EP1517299A3/en
Priority to KR1019980710777A priority patent/KR100302370B1/ko
Priority to PCT/JP1998/001984 priority patent/WO1998049673A1/ja
Priority to CA002258908A priority patent/CA2258908C/en
Priority to CN98800566A priority patent/CN1117343C/zh
Publication of JPH10301593A publication Critical patent/JPH10301593A/ja
Priority to NO19986172A priority patent/NO317600B1/no
Priority to US09/781,634 priority patent/US6374213B2/en
Application granted granted Critical
Publication of JP3160228B2 publication Critical patent/JP3160228B2/ja
Priority to CNB031192599A priority patent/CN1198263C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 入力音声、背景音、それぞれのレベルの変化
に逐次、適応しながら、リアルタイムで、入力音声が音
声区間か、非音声区間かを判別する。 【解決手段】 パワー算出部2によって、所定の時間間
隔毎に、所定の時間幅を有するフレーム単位で入力信号
データを処理して、そのパワーを算出するとともに、瞬
時パワー最大値保持部3および瞬時パワー最小値保持部
4によって、過去の所定の時間内におけるパワーの最大
値と最小値とを保持しながら、パワーしきい値決定部5
によって、最大値、ならびに最大値と最小値との差に応
じて逐次、変化するパワーに関するしきい値を決定し、
判別部6によって、前記しきい値に基づき、前記入力信
号データをフレーム単位で、音声区間と、非音声区間と
に区分する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、放送番組中や録音
テープあるいは日常生活で、雑音や背景音を伴って発声
された音声を加工して声の高さや話す速さを変えたり、
意味内容を機械的に認識したり、符号化して伝送あるい
は記録する場合などに、入力信号中の音声区間と、非音
声区間とを判別する音声区間検出方法およびその装置に
関する。
【0002】[発明の概要]本発明は、入力信号データ
に対し、所定の時間間隔毎に、所定の時間幅を有するフ
レーム単位で、そのパワーを算出し、過去の所定の時間
内におけるパワーの最大値と、最小値とを保持するとと
もに、その最大値、ならびに最大値と最小値との差に応
じて変化するパワーに関するしきい値を用いて、入力信
号中の音声と背景音とのそれぞれのパワーの変化に逐
次、適応しながら、フレーム毎に音声区間と、非音声区
間との判別を行なうことにより、入力信号中の音声区間
を正確に検出して、放送番組中や録音テープあるいは日
常生活で、雑音や背景音を伴って発声された音声を加工
して声の高さや話す速さを変えたり、意味内容を機械的
に認識したり、符号化して伝送あるいは記録する場合な
どに、加工音声の音質の向上、音声認識率の改善、符号
化効率の上昇や復号化音声の品質向上などを図る。
【0003】さらに、パワーという比較的、簡便に求め
られる特徴量のみを用いることにより、演算時間を短く
するとともに、コストを低減させ、リアルタイムに音声
処理を行なうことを可能にする。
【0004】
【従来の技術】従来の音声区間検出方式の1つとして、
音声信号のパワーなどを基に、雑音レベル、音声レベル
などを算出し、この算出結果に基づいてレベルしきい値
を設定し、このレベルしきい値と、入力信号とを比較し
て、入力信号のレベルが大である場合に、これを音声区
間と判定し、また小である場合に、これを非音声区間と
判定する方式が知られている。
【0005】この方式で用いるレベルしきい値を設定す
る方法としては、代表的な第1〜第3の方式があり、第
1の方式では、音声入力時の雑音レベル値に、予め定め
られている定数を加算した値をレベルしきい値とする。
またこれを改良した第2の方式では、入力音声信号レベ
ル最大値から雑音レベル値を減算した値が大であるとき
には、比較的大きい値に前記レベルしきい値を設定し、
小であるときには、比較的小さい値に前記レベルしきい
値を設定する(例えば、特開昭58−130395号公
報、特開昭61−272796号公報など)。
【0006】また、第3の方式では、これらの各レベル
しきい値の設定方法に加え、入力信号を連続的に観測
し、そのレベルが一定の時間以上にわたって定常なと
き、これを雑音レベルと見なし、逐次、雑音レベルを更
新しながら、音声区間検出のためのしきい値を設定する
(平成7年、電子情報通信学会総合大会講演論文集D−
695、301頁)。
【0007】
【発明が解決しようとする課題】しかしながら、上述し
た従来の音声区間検出方式においては、次に述べるよう
な問題があった。
【0008】まず、第1の方式は、簡便であるという利
点を持ち、音声の平均的なレベルが中程度の場合には、
うまく機能するものの、音声の平均的なレベルが大き過
ぎる場合には、雑音などを音声として誤検出し易く、ま
た小さ過ぎる場合には、音声の一部が欠落して検出され
易いという問題があった。
【0009】また、第2の方式は、このような第1の方
式の問題を解決することができるものの、入力信号中の
雑音や背景音のレベルがほぼ一定であることを前提にし
ていることから、音声のレベル変動に対しては、これに
追随するが、雑音や背景音のレベルが時々刻々、変化し
た場合には、正確な音声区間の検出が保証されていない
という問題があった。
【0010】また、第3の方式では、このような雑音レ
ベルの変動を考慮していることから、雑音レベルが逐
次、変化しても、誤検出が発生しない。
【0011】しかしながら、放送番組などでは、雑音の
みならず、効果音として、音楽や擬音などの背景音が存
在し、それらのレベルが時々刻々、変動するのが一般的
であり、しかもこれと同時に音声が常に発せられ続け、
入力信号レベルが一定時間以上にわたって定常になるこ
とが殆ど無いこともあり、このような場合には、第3の
方式でも、雑音レベルを正しく設定することができず、
音声区間を正確に検出することが難しいという問題があ
った。
【0012】本発明は上記の事情に鑑み、請求項1で
は、入力音声と、背景音とをそれぞれのレベルの変化に
逐次、適応しながら、リアルタイムで音声処理を行なっ
て、音声区間と、非音声区間とを判別することができる
音声区間検出方法を提供することを目的としている。
【0013】また、請求項2では、パワーという比較
的、簡便に求められる特徴量のみを用いていることか
ら、演算時間を短くするとともに、コストを低減させな
がら、入力音声と、背景音とをそれぞれのレベルの変化
に逐次、適応して、リアルタイムで音声処理を行なっ
て、音声区間と、非音声区間とを判別することができる
音声区間検出装置を提供することを目的としている。
【0014】
【課題を解決するための手段】上記の目的を達成するた
めに、本発明による音声区間検出方法では、入力された
信号データに対して、所定の時間間隔毎に、所定のフレ
ーム幅でフレームパワーを算出するとともに、過去の所
定の時間内のフレームパワーの最大値および最小値を保
持し、保持されている最大値、ならびに最大値と最小値
との差に応じて変化するパワーに関するしきい値を決定
し、このしきい値と、現在のフレームのパワーとを比較
して、現在のフレームが音声区間か、非音声区間かを決
定することを特徴としている。
【0015】また、本発明による音声区間検出装置で
は、入力された信号データに対して、所定の時間間隔毎
に、所定のフレーム幅でフレームパワーを算出するパワ
ー算出部と、過去の所定の時間内のフレームパワーの最
大値を保持する瞬時パワー最大値保持部と、過去の所定
の時間内のフレームパワーの最小値を保持する瞬時パワ
ー最小値保持部と、これら瞬時パワー最大値保持部、瞬
時パワー最小値保持部に保持されている最大値、ならび
に最大値と最小値との差の両者に応じて変化するパワー
に関するしきい値を決定するパワーしきい値決定部と、
このパワーしきい値決定部によって得られたしきい値と
現在のフレームのパワーとを比較して、音声区間か、非
音声区間かを決定する判定部とを備えたことを特徴とし
ている。
【0016】上記の構成により、本発明による音声区間
検出方法では、入力された信号データに対して、所定の
時間間隔毎に、所定のフレーム幅でフレームパワーを算
出し、過去の所定の時間内のフレームパワーの最大値お
よび最小値を保持し、保持されている最大値、ならびに
最大値と最小値との差に応じて変化するパワーに関する
しきい値を決定し、このしきい値と、現在のフレームの
パワーとを比較して、現在のフレームが音声区間か、非
音声区間かを決定することにより、入力音声と、背景音
とをそれぞれのレベルの変化に逐次、適応しながら、リ
アルタイムで音声処理を行なって、音声区間と、非音声
区間とを判別する。
【0017】また、本発明による音声区間検出装置で
は、パワー算出部によって、所定の時間間隔毎に、所定
の時間幅を有するフレーム単位で入力された信号データ
を処理して、そのパワーを算出するとともに、瞬時パワ
ー最大値保持部および瞬時パワー最小値保持部によっ
て、過去の所定の時間内におけるパワーの最大値と最小
値とを保持しながら、パワーしきい値決定部によって、
最大値、なよびに最大値と最小値との差に応じて逐次、
変化するパワーに関するしきい値を決定し、判別部によ
って、前記しきい値に基づき、前記入力信号データをフ
レーム単位で、音声区間と、非音声区間とに区分するこ
とにより、パワーという比較的、簡便に求められる特徴
量のみを用いて、演算時間を短くするとともに、コスト
を低減させながら、入力音声と、背景音とをそれぞれの
レベルの変化に逐次、適応して、リアルタイムで音声処
理を行なって、音声区間と、非音声区間とを判別する。
【0018】
【発明の実施の形態】
《発明の基本原理》本発明による音声区間検出方法およ
びその装置では、入力信号のパワーを指標とすると、入
力信号中の音声のレベル変動に関しては、直前までに入
力されたパワーの最大値に反映され、背景音のレベル変
動に関しては、直前までに入力されたパワーの最小値に
反映されていることに着目して、音声/非音声判別のし
きい値を決定する際、雑音が殆ど存在しないとき、直前
までに入力されたパワーの最大値から所定の値だけ減算
した値を基本のしきい値とし、直前までに入力されたパ
ワーの最大値から最小値を差し引いた値が小さくなるに
つれて(S/Nが小さくなるにつれて)、しきい値を大
きくしていくように、補正を加えるという処理で、しき
い値を決定する。
【0019】そして、入力音声データに対し、所定の時
間間隔毎に、所定の時間幅を有するフレーム単位で、そ
のパワーを算出し、過去の所定の時間内におけるパワー
の最大値と、最小値とを保持しながら、最大値、ならび
に最大値と最小値との差に応じて変化するパワーに関す
るしきい値を用いて、入力音声、背景音、それぞれのパ
ワーの変化に逐次、適応しながら、フレーム毎に音声区
間と、非音声区間とを判別する。
【0020】《実施の形態の説明》図1は本発明の実施
の形態としての音声区間検出装置の一例を示すブロック
図である。
【0021】この図に示す音声区間検出装置1は、デジ
タル化されて入力された入力信号データに対して所定の
時間間隔毎に所定のフレーム幅でパワーを算出するパワ
ー算出部2と、過去の所定の時間内のフレームパワーの
最大値を保持する瞬時パワー最大値保持部3と、過去の
所定の時間内のフレームパワーの最小値を保持する瞬時
パワー最小値保持部4と、これら瞬時パワー最大値保持
部3、瞬時パワー最小値保持部4に保持されている最大
値、ならびに最大値と最小値との差の両者に応じて変化
するパワーに関するしきい値を決定するパワーしきい値
決定部5と、このパワーしきい値決定部5によって決定
されたしきい値と現在のフレームのパワーとを比較して
音声区間か、非音声区間かを決定する判別部6とを備え
ている。
【0022】そして、この音声区間検出装置1では、入
力信号データに対し、所定の時間間隔毎に所定の時間幅
を有するフレーム単位でそのパワーを算出し、過去の所
定の時間内におけるパワーの最大値と最小値とを保持し
ながら、最大値、ならびに最大値と最小値との差に応じ
て変化するパワーに関するしきい値を用いて、入力音声
と背景音のそれぞれのパワーの変化に逐次適応しなが
ら、フレーム毎に音声区間と、非音声区間との判別を行
なう。
【0023】パワー算出部2では、例えば5msの時間
間隔で、例えば20msのフレーム幅にわたり、信号の
自乗和ないし自乗平均値を算出し、これを対数化、即ち
デシベル化して、その時刻のフレームパワーを“P”と
し、これを瞬時パワー最大値保持部3と、瞬時パワー最
小値保持部4と、判別部6とに供給する。
【0024】瞬時パワー最大値保持部3では、過去の所
定の時間内(例えば、6秒)のフレームパワー“P”の
最大値を保持するように設計されており、常にその保持
した値“Pupper”をパワーしきい値決定部5に供給す
る。但し、最大値“Pupper”は“P>Pupper”である
ような、フレームパワー“P”がパワー算出部2から供
給されると、直ちにその値が更新される。
【0025】また、瞬時パワー最小値保持部4では、過
去の所定の時間内(例えば、4秒)のフレームパワー
“P”の最小値を保持するように設計されており、常に
その保持した値“Plower”をパワーしきい値決定部5
に供給する。但し、最小値“Pl ower”は“P<
lower”であるような、フレームパワー“P”がパワ
ー算出部2から供給されると、直ちにその値が更新され
る。
【0026】パワーしきい値決定部5では、瞬時パワー
最大値保持部3および瞬時パワー最小値保持部4に保持
されている最大値“Pupper”と、最小値“Plower”と
を用いて、例えば、次式に示す演算を行なってパワーに
関するしきい値“Pthr”を決定し、これを判別部6に
供給する。
【0027】
【数1】Pupper−Plower≧60[dB]の場合: Pthr=Pupper−35 …(1) Pupper−Plower<60[dB]の場合: Pthr=Pupper−35+35・{1−(Pupper−Plower)/60}…(2)
【0028】但し、背景音のレベルが音声のレベルに近
接してきた場合の本発明装置の誤動作を防ぐために、P
thrは、Pthr=Pupper−13を上限とするのが望まし
い。また、上式中の定数35は、前述の雑音が殆ど存在
しないときの基本のしきい値である。
【0029】また、判定部6では、パワー算出部2から
フレーム毎に供給されるパワー“P”と、パワーしきい
値決定部5から供給されるしきい値“Pthr”とを比較
して、フレーム毎に、“P>Pthr”ならば、当該フレ
ームを音声区間と判定し、また“P≦Pthr”ならば、
当該フレームを非音声区間と判定し、これらの各判定結
果に基づき音声/非音声の判別信号を出力する。
【0030】これによって、図2に示すように、入力信
号データの値が変化しているとき、パワー算出部2から
出力されるパワー“P”に基づき、瞬時パワー最大値保
持部3と、瞬時パワー最小値保持部4とに各々、最大値
“Pupper”と、最小値“Pl ower”とが保持されるとと
もに、これら最大値“Pupper”と、最小値“Plower
とに基づいて、しきい値“Pthr”が決定され、このし
きい値“Pthr”に基づき、各フレームが音声区間、非
音声区間のいずれであるか判定される。
【0031】このように、この実施の形態では、入力信
号データに対し、所定の時間間隔毎に所定の時間幅を有
するフレーム単位でそのパワーを算出し、過去の所定の
時間内におけるパワーの最大値と最小値とを保持しなが
ら、最大値、なよびに最大値と最小値との差に応じて変
化するパワーに関するしきい値を用いて、入力音声、背
景音、それぞれのパワーの変化に逐次、適応しながら、
フレーム毎に音声区間と、非音声区間との判別を行なう
ようにしているので、放送番組中や録音テープあるいは
日常生活で、雑音や背景音を伴って発声された音声につ
いて、フレーム毎に、音声区間か、非音声区間かを正確
に判別することができる。
【0032】また、この実施の形態では、過去の所定の
時間内の瞬時パワーの最小値を基に、背景音のレベルを
推定しているので、放送番組中などで、背景音のレベル
が時々刻々、変動し、かつ同時に音声が発せられ続けて
いる場合においても、入力信号中の音声区間と、非音声
区間とを判別することができる。
【0033】この結果、入力信号中の音声に対して、
(a) 加工して声の高さや話す速さを変える、(b)
意味内容を機械的に音声認識する、(c) 符号化し
て伝送あるいは記録する、場合などにおいて、加工音声
の音質の向上、また音声認識率の改善、さらに符号化効
率の上昇や、復号化音声の品質の向上が可能となる。
【0034】また、パワーという比較的簡便に求められ
る特徴量のみを用いているので、演算時間を短縮するこ
とができるとともに、装置全体の構成を簡素化して、コ
ストを低減することができ、さらにリアルタイムに音声
処理を行なうことが可能となる。
【0035】
【発明の効果】以上説明したように本発明によれば、請
求項1では、入力音声と、背景音とをそれぞれのレベル
の変化に逐次、適応しながら、リアルタイムで音声処理
を行なって、音声区間と、非音声区間とを判別すること
ができる。
【0036】また、請求項2では、パワーという比較
的、簡便に求められる特徴量のみを用いていることか
ら、演算時間を短くするとともに、コストを低減させな
がら、入力音声と、背景音とをそれぞれのレベルの変化
に逐次、適応して、リアルタイムで音声処理を行なっ
て、音声区間と、非音声区間とを判別することができ
る。
【図面の簡単な説明】
【図1】本発明による音声区間検出方法およびその装置
の一形態を適用した音声区間検出装置の一例を示すブロ
ック図である。
【図2】図1に示す音声区間検出装置の動作例を示す模
式図である。
【符号の説明】
1 音声区間検出装置 2 パワー算出部 3 瞬時パワー最大値保持部 4 瞬時パワー最小値保持部 5 パワーしきい値決定部 6 判別部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 入力された信号データに対して、所定の
    時間間隔毎に、所定のフレーム幅でフレームパワーを算
    出するとともに、過去の所定の時間内のフレームパワー
    の最大値および最小値を保持し、 保持されている最大値、ならびに最大値と最小値との差
    に応じて変化するパワーに関するしきい値を決定し、 このしきい値と、現在のフレームのパワーとを比較し
    て、現在のフレームが音声区間か、非音声区間かを決定
    することを特徴とする音声区間検出方法。
  2. 【請求項2】 入力された信号データに対して、所定の
    時間間隔毎に、所定のフレーム幅でフレームパワーを算
    出するパワー算出部と、 過去の所定の時間内のフレームパワーの最大値を保持す
    る瞬時パワー最大値保持部と、 過去の所定の時間内のフレームパワーの最小値を保持す
    る瞬時パワー最小値保持部と、 これら瞬時パワー最大値保持部、瞬時パワー最小値保持
    部に保持されている最大値、ならびに最大値と最小値と
    の差の両者に応じて変化するパワーに関するしきい値を
    決定するパワーしきい値決定部と、 このパワーしきい値決定部によって得られたしきい値と
    現在のフレームのパワーとを比較して、音声区間か、非
    音声区間かを決定する判定部と、 を備えたことを特徴とする音声区間検出装置。
JP11282297A 1997-04-30 1997-04-30 音声区間検出方法およびその装置 Expired - Lifetime JP3160228B2 (ja)

Priority Applications (13)

Application Number Priority Date Filing Date Title
JP11282297A JP3160228B2 (ja) 1997-04-30 1997-04-30 音声区間検出方法およびその装置
PCT/JP1998/001984 WO1998049673A1 (fr) 1997-04-30 1998-04-30 Procede et dispositif destines a detecter des parties vocales, procede de conversion du debit de parole et dispositif utilisant ce procede et ce dispositif
EP98917743A EP0944036A4 (en) 1997-04-30 1998-04-30 METHOD AND DEVICE FOR DETECTING LANGUAGE AREAS, AND METHOD AND DEVICE FOR LANGUAGE SPEED CONVERSION
EP08005875A EP1944753A3 (en) 1997-04-30 1998-04-30 Method and device for detecting voice sections, and speech velocity conversion method and device utilizing said method and device
EP04027925A EP1517299A3 (en) 1997-04-30 1998-04-30 Speech interval detecting method and system, and speech speed converting method and system using the speech interval detecting method and system
KR1019980710777A KR100302370B1 (ko) 1997-04-30 1998-04-30 음성구간검출방법과시스템및그음성구간검출방법과시스템을이용한음성속도변환방법과시스템
US09/202,867 US6236970B1 (en) 1997-04-30 1998-04-30 Adaptive speech rate conversion without extension of input data duration, using speech interval detection
CA002258908A CA2258908C (en) 1997-04-30 1998-04-30 Speech rate conversion without extension of input data duration, using speech interval detection
CN98800566A CN1117343C (zh) 1997-04-30 1998-04-30 声音区域的检测方法及其装置,以及利用这个方法及装置的话速变换方法及其装置
CA002392849A CA2392849C (en) 1997-04-30 1998-04-30 Speech interval detecting method and device
NO19986172A NO317600B1 (no) 1997-04-30 1998-12-29 Taleomvandling for a gi bedret forstaelighet og basert pa deteksjon av taleintervaller
US09/781,634 US6374213B2 (en) 1997-04-30 2001-02-12 Adaptive speech rate conversion without extension of input data duration, using speech interval detection
CNB031192599A CN1198263C (zh) 1997-04-30 2003-03-06 话速变换方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11282297A JP3160228B2 (ja) 1997-04-30 1997-04-30 音声区間検出方法およびその装置

Publications (2)

Publication Number Publication Date
JPH10301593A true JPH10301593A (ja) 1998-11-13
JP3160228B2 JP3160228B2 (ja) 2001-04-25

Family

ID=14596411

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11282297A Expired - Lifetime JP3160228B2 (ja) 1997-04-30 1997-04-30 音声区間検出方法およびその装置

Country Status (1)

Country Link
JP (1) JP3160228B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002531882A (ja) * 1998-11-30 2002-09-24 マイクロソフト コーポレイション バレーパーセンテージを使用した純粋音声の検出
JP2005031632A (ja) * 2003-06-19 2005-02-03 Advanced Telecommunication Research Institute International 発話区間検出装置、音声エネルギ正規化装置、コンピュータプログラム及びコンピュータ
KR100491753B1 (ko) * 2002-10-10 2005-05-27 서울통신기술 주식회사 음성처리보드의 음성신호 검출 방법
JP2013160938A (ja) * 2012-02-06 2013-08-19 Mitsubishi Electric Corp 音声区間検出装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002531882A (ja) * 1998-11-30 2002-09-24 マイクロソフト コーポレイション バレーパーセンテージを使用した純粋音声の検出
KR100491753B1 (ko) * 2002-10-10 2005-05-27 서울통신기술 주식회사 음성처리보드의 음성신호 검출 방법
JP2005031632A (ja) * 2003-06-19 2005-02-03 Advanced Telecommunication Research Institute International 発話区間検出装置、音声エネルギ正規化装置、コンピュータプログラム及びコンピュータ
JP4521673B2 (ja) * 2003-06-19 2010-08-11 株式会社国際電気通信基礎技術研究所 発話区間検出装置、コンピュータプログラム及びコンピュータ
JP2013160938A (ja) * 2012-02-06 2013-08-19 Mitsubishi Electric Corp 音声区間検出装置

Also Published As

Publication number Publication date
JP3160228B2 (ja) 2001-04-25

Similar Documents

Publication Publication Date Title
KR101437830B1 (ko) 음성 구간 검출 방법 및 장치
JP3197155B2 (ja) ディジタル音声コーダにおける音声信号ピッチ周期の推定および分類のための方法および装置
RU2251750C2 (ru) Обнаружение активности сложного сигнала для усовершенствованной классификации речи/шума в аудиосигнале
US9401160B2 (en) Methods and voice activity detectors for speech encoders
US6236970B1 (en) Adaptive speech rate conversion without extension of input data duration, using speech interval detection
US5970441A (en) Detection of periodicity information from an audio signal
US6799161B2 (en) Variable bit rate speech encoding after gain suppression
KR101444099B1 (ko) 음성 구간 검출 방법 및 장치
JP3255584B2 (ja) 有音検知装置および方法
CA2488918A1 (en) Method and apparatus for selecting an encoding rate in a variable rate vocoder
JPH08505715A (ja) 定常的信号と非定常的信号との識別
US6226607B1 (en) Method and apparatus for eighth-rate random number generation for speech coders
RU2127912C1 (ru) Способ обнаружения и кодирования и/или декодирования стационарных фоновых звуков и устройство для кодирования и/или декодирования стационарных фоновых звуков
JP2000172283A (ja) 有音検出方式及び方法
JP3160228B2 (ja) 音声区間検出方法およびその装置
JP3109978B2 (ja) 音声区間検出装置
JP3413862B2 (ja) 音声区間検出方法
CN111105815B (zh) 一种基于语音活动检测的辅助检测方法、装置及存储介质
CN111128244B (zh) 基于过零率检测的短波通信语音激活检测方法
JP2656069B2 (ja) 音声検出装置
JPH11133997A (ja) 有音無音判定装置
US6157906A (en) Method for detecting speech in a vocoded signal
JPH07109559B2 (ja) 音声区間検出方法
JPH08202394A (ja) 音声検出器
JPH034918B2 (ja)

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090216

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100216

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110216

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120216

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130216

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140216

Year of fee payment: 13

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term