JPH03241400A - 音声検出器 - Google Patents
音声検出器Info
- Publication number
- JPH03241400A JPH03241400A JP2038842A JP3884290A JPH03241400A JP H03241400 A JPH03241400 A JP H03241400A JP 2038842 A JP2038842 A JP 2038842A JP 3884290 A JP3884290 A JP 3884290A JP H03241400 A JPH03241400 A JP H03241400A
- Authority
- JP
- Japan
- Prior art keywords
- sound
- utterance
- voiced sound
- prescribed threshold
- silent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003247 decreasing effect Effects 0.000 claims 1
- 230000005540 biological transmission Effects 0.000 abstract description 13
- 230000000694 effects Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 230000005236 sound signal Effects 0.000 description 5
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
Landscapes
- Time-Division Multiplex Systems (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔概 要]
フレーム単位に音声入力信号の電力と基準電力を比較し
、有音無音判定を行う第1の有音無音判定手段と、 フレーム単位に音声入力信号の零交叉数により有音無音
判定を行う第2の有音無音判定手段と、音声入力信号を
入力し、予測誤差を算出し、フレーム間予測誤差電力に
より有音無音判定を行う第3の有音無音判定手段と、 該第1の有音無音判定手段より送られた判定結果が有音
なら有音と判定し、無音であっても、該第2、第3の有
音無音判定手段よりの判定結果が有音なら有音と判定し
、判定結果を出力する第4の有音無音判定手段よりなる
音声検出器に関し、話頭切断が比較的生ぜず且つ伝送効
率を比較的良くすることが出来る音声検出器の提供を目
的とし、 該第4の有音無音判定手段の有音判定結果を複数フレー
ム間カウントし、カウント値が第4の所定の闇値より大
きい時は基準電力を太き(し、小さければ基準電力を小
さくする闇値可変手段を備えた構成とする。
、有音無音判定を行う第1の有音無音判定手段と、 フレーム単位に音声入力信号の零交叉数により有音無音
判定を行う第2の有音無音判定手段と、音声入力信号を
入力し、予測誤差を算出し、フレーム間予測誤差電力に
より有音無音判定を行う第3の有音無音判定手段と、 該第1の有音無音判定手段より送られた判定結果が有音
なら有音と判定し、無音であっても、該第2、第3の有
音無音判定手段よりの判定結果が有音なら有音と判定し
、判定結果を出力する第4の有音無音判定手段よりなる
音声検出器に関し、話頭切断が比較的生ぜず且つ伝送効
率を比較的良くすることが出来る音声検出器の提供を目
的とし、 該第4の有音無音判定手段の有音判定結果を複数フレー
ム間カウントし、カウント値が第4の所定の闇値より大
きい時は基準電力を太き(し、小さければ基準電力を小
さくする闇値可変手段を備えた構成とする。
本発明は、音声入力信号の無音区間に他の音声信号を挿
入して伝送する通話音声挿入装置(Digital
5peech Interpolation、以下D
SIと称す)等に使用する音声検出器の改良に関する。
入して伝送する通話音声挿入装置(Digital
5peech Interpolation、以下D
SIと称す)等に使用する音声検出器の改良に関する。
第4図は従来例の音声検出器のブロック図である。
第4図において、バイパスフィルタ10にて直流をカッ
トされた音声人力信号は、積分器14及び予測器6に入
力され、音声入力信号の符号が排他的論理和回路11に
人力する。
トされた音声人力信号は、積分器14及び予測器6に入
力され、音声入力信号の符号が排他的論理和回路11に
人力する。
積分器14では、入力する音声信号の1フレ一ム分の信
号電力を求め、比較器19に人力し、有音か無音かを判
定する電力値である閾値と比較し、該閾値より大きけれ
ば有音、小さければ無音として判定結果を有音無音判定
部4に入力する。
号電力を求め、比較器19に人力し、有音か無音かを判
定する電力値である閾値と比較し、該閾値より大きけれ
ば有音、小さければ無音として判定結果を有音無音判定
部4に入力する。
排他的論理和回路11では、入力する音声信号の符号ビ
ットを一方の端子に入力し、排他的論理和回路11の出
力を1サンプル遅延回路13にて遅延された信号を他方
の端子に入力し、両者が異なっていれば零交叉したとし
て1を出力しカウンタ12に入力する。
ットを一方の端子に入力し、排他的論理和回路11の出
力を1サンプル遅延回路13にて遅延された信号を他方
の端子に入力し、両者が異なっていれば零交叉したとし
て1を出力しカウンタ12に入力する。
カウンタ12は1フレ一ム分をカウントするもので、1
フレームの零交叉数をカウントし、カウント値を比較器
20に入力する。
フレームの零交叉数をカウントし、カウント値を比較器
20に入力する。
音声信号の周波数は通常300Hz〜3.4KHzの範
囲にあり、有音の場合の1フレームの零交叉数は上記の
周波数範囲より求めた所定の範囲にあり、無音の場合は
雑音で零交叉数は多いので、比較器20の比較する闇値
としては上記所定の範囲としてあり、人力するカウント
値を該閾値と比較し、閾値の範囲にあれば有音とし、範
囲外であれば無音とし判定結果を有音無音判定部4に人
力する。
囲にあり、有音の場合の1フレームの零交叉数は上記の
周波数範囲より求めた所定の範囲にあり、無音の場合は
雑音で零交叉数は多いので、比較器20の比較する闇値
としては上記所定の範囲としてあり、人力するカウント
値を該閾値と比較し、閾値の範囲にあれば有音とし、範
囲外であれば無音とし判定結果を有音無音判定部4に人
力する。
過去の入力信号から現在の入力信号を予測し、現在の人
力信号と予測値との差分を出力する予測器6では、予測
誤差信号を出力して積分器15に人力し、1フレ一ム分
積分して予測誤差電力を求め除算器16に入力する。
力信号と予測値との差分を出力する予測器6では、予測
誤差信号を出力して積分器15に人力し、1フレ一ム分
積分して予測誤差電力を求め除算器16に入力する。
除算器16には、積分器14にて求めた入力信号電力が
入力しており、該人力信号電力を該予測誤差電力で除算
し予測利得を求め、1フレーム遅延回路17と減算器1
8に入力する。
入力しており、該人力信号電力を該予測誤差電力で除算
し予測利得を求め、1フレーム遅延回路17と減算器1
8に入力する。
減算器18では、lフレーム遅延回路17を通った1フ
レーム前の予測利得との差を求め、予測利得が小さい方
から大きい方へ変動した変動幅又は大きい方から小さい
方へ変動した変動幅を求め比較器21に入力する。
レーム前の予測利得との差を求め、予測利得が小さい方
から大きい方へ変動した変動幅又は大きい方から小さい
方へ変動した変動幅を求め比較器21に入力する。
予測利得は、有音の場合は大きいが、無音の雑音の場合
は予測は困難であるので小さい。
は予測は困難であるので小さい。
即ち、予測利得が小さい方から大きい方への変動は有音
になったことを示し、大きい方から小さい方への変動は
無音になったことを示す。
になったことを示し、大きい方から小さい方への変動は
無音になったことを示す。
そこで、比較器21では、大きい方から小さい方への変
動で変動幅が閾値より大きい時は有音とし、逆に小さい
方から大きい方へ変動し変動幅が閾値より大きい時は無
音と判定し判定結果を有音無音判定部4に入力する。
動で変動幅が閾値より大きい時は有音とし、逆に小さい
方から大きい方へ変動し変動幅が閾値より大きい時は無
音と判定し判定結果を有音無音判定部4に入力する。
有音無音判定部4では、比較器19よりの入力が有音で
あれば有音とし、無音であっても、比較器20.21よ
りの人力が有音なら有音とし、他の場合は無音として出
力する。
あれば有音とし、無音であっても、比較器20.21よ
りの人力が有音なら有音とし、他の場合は無音として出
力する。
そして、このバイパスフィルタ10を通った音声入力信
号はDSIに送られ、無音と判定された時はDSIは他
の音声信号を挿入して出力する。
号はDSIに送られ、無音と判定された時はDSIは他
の音声信号を挿入して出力する。
〔発明が解決しようとする課B]
しかしながら、従来の音声検出器では、入力信号電力に
て有音、無音と判定する比較器19の閾値は一定であり
、この閾値を比較的高く定めると、無音区間より有音区
間となる場合成る程度立ち上がらないと有音と判定され
なくなるので話頭切断が生じ音声品質を劣化し、この閾
値を比較的低く定めると、有音区間が増加し、他の音声
信号を挿入する無音部分が滅じ、DSl等にての伝送効
率が悪くなる。
て有音、無音と判定する比較器19の閾値は一定であり
、この閾値を比較的高く定めると、無音区間より有音区
間となる場合成る程度立ち上がらないと有音と判定され
なくなるので話頭切断が生じ音声品質を劣化し、この閾
値を比較的低く定めると、有音区間が増加し、他の音声
信号を挿入する無音部分が滅じ、DSl等にての伝送効
率が悪くなる。
よって、DSl等にて、話頭切断が比較的生ぜず且つ比
較的伝送効率良くすることが困難な問題点がある。
較的伝送効率良くすることが困難な問題点がある。
本発明は、話頭切断が比較的生ぜず且つ伝送効率を比較
的良くすることが出来る音声検出器の提供を目的として
いる。
的良くすることが出来る音声検出器の提供を目的として
いる。
第1図は本発明の原理ブロック図である。
第1図に示す如く、フレーム単位に音声入力信号の電力
を算出し、第1の所定の闇値と比較し、大きい時は有音
で小さい時は無音と判定し、判定結果を第4の有音無音
判定手段4に送出する第1の有音無音判定手段1と、 フレーム単位に音声人力信号の零交叉数を算出し、音声
信号の零交叉数の範囲を示す第2の所定の閾値と比較し
、この範囲にあれば有音で範囲外であれば無音と判定し
、判定結果を該第4の有音無音判定手段4に送出する第
2の有音無音判定手段2と、 音声入力信号を入力し、予測誤差を出力する予測器6の
出力を用い1フレームの予測誤差電力を算出し、該第1
の有音無音判定手段1にて求めたフレーム単位の音声入
力信号の電力とで、予測利得を算出し、又1フレーム前
の予測利得との差で予測利得変動を算出し、予測利得が
小さい方から大きい方へ変動し変動幅が第3の所定の闇
値より大きくなった時を有音と判定し、予測利得が大き
い方から小さい方へ変動し変動幅が該第3の所定の閾値
より大きくなった時を無音と判定し、判定結果を該第4
の有音無音判定手段4に送出する第3の有音無音判定手
段3と、 該第1の有音無音判定手段lより送られた判定結果が有
音なら有音と判定し、無音であっても、該第2.第3の
有音無音判定手段2.3よりの判定結果が有音なら有音
と判定し、判定結果を出力する第4の有音無音判定手段
4よりなる音声検出器において、 該第4の有音無音判定手段4の有音判定結果を複数フレ
ーム間カウントし、カウント値が第4の所定の閾値より
大きい時は該第1の所定の閾値を大きくし、小さければ
該第1の所定の閾値を小さくする閾値可変手段5を備え
る。
を算出し、第1の所定の闇値と比較し、大きい時は有音
で小さい時は無音と判定し、判定結果を第4の有音無音
判定手段4に送出する第1の有音無音判定手段1と、 フレーム単位に音声人力信号の零交叉数を算出し、音声
信号の零交叉数の範囲を示す第2の所定の閾値と比較し
、この範囲にあれば有音で範囲外であれば無音と判定し
、判定結果を該第4の有音無音判定手段4に送出する第
2の有音無音判定手段2と、 音声入力信号を入力し、予測誤差を出力する予測器6の
出力を用い1フレームの予測誤差電力を算出し、該第1
の有音無音判定手段1にて求めたフレーム単位の音声入
力信号の電力とで、予測利得を算出し、又1フレーム前
の予測利得との差で予測利得変動を算出し、予測利得が
小さい方から大きい方へ変動し変動幅が第3の所定の闇
値より大きくなった時を有音と判定し、予測利得が大き
い方から小さい方へ変動し変動幅が該第3の所定の閾値
より大きくなった時を無音と判定し、判定結果を該第4
の有音無音判定手段4に送出する第3の有音無音判定手
段3と、 該第1の有音無音判定手段lより送られた判定結果が有
音なら有音と判定し、無音であっても、該第2.第3の
有音無音判定手段2.3よりの判定結果が有音なら有音
と判定し、判定結果を出力する第4の有音無音判定手段
4よりなる音声検出器において、 該第4の有音無音判定手段4の有音判定結果を複数フレ
ーム間カウントし、カウント値が第4の所定の閾値より
大きい時は該第1の所定の閾値を大きくし、小さければ
該第1の所定の閾値を小さくする閾値可変手段5を備え
る。
本発明によれば、第4の有音無音判定手段4にて有音と
判定した数を複数フレーム間カウントし、第4の所定の
閾値より大きい時は有音区間が長く、話頭切断が少ない
ので、有音時間/(有音時間十無音時間)のアクティビ
ティを一定にするよう第1の所定の闇値を大きくして無
音と判定される区間を増加させ伝送効率を上げる。
判定した数を複数フレーム間カウントし、第4の所定の
閾値より大きい時は有音区間が長く、話頭切断が少ない
ので、有音時間/(有音時間十無音時間)のアクティビ
ティを一定にするよう第1の所定の闇値を大きくして無
音と判定される区間を増加させ伝送効率を上げる。
第4の所定の闇値より小さい時は無音区間が長く伝送効
率が良いので、アクティビティを一定にするよう第1の
所定の閾値を小さくし、話頭が切断される量を小さくす
る。
率が良いので、アクティビティを一定にするよう第1の
所定の閾値を小さくし、話頭が切断される量を小さくす
る。
従って、話頭切断が比較的生ぜず且つ伝送効率を比較的
良くすることが出来る音声検出器が得られる。
良くすることが出来る音声検出器が得られる。
第2図は本発明の実施例の音声検出器のブロック図、第
3図は1例のアクティビティに対する人力信号電力の闇
値を示す図である。
3図は1例のアクティビティに対する人力信号電力の闇
値を示す図である。
、第2図で第4図の従来例と異なる点は、有音回数カウ
ンタ22を設け、有音回数カウンタ22にて有音回数を
カウントし、カウント値により、比較器19の閾値を変
化させる点であるので、この異なる点を中心に以下説明
する。
ンタ22を設け、有音回数カウンタ22にて有音回数を
カウントし、カウント値により、比較器19の閾値を変
化させる点であるので、この異なる点を中心に以下説明
する。
アクティビティは一般的に50%〜60%が期待される
ので、例えば第3図に示す如く、アクティビティが50
%以下になる有音回数カウンタ値ならば、闇値を60
d BmOとし、有音回数カウンタ値が50%〜55%
相当なら闇値を55dBmOとし、有音回数カウンタ値
が55%〜60%相当なら闇値を50 d BmOとし
、有音回数カウンタ値が60%以上相当なら闇値を45
dBmoと段々大きくする。
ので、例えば第3図に示す如く、アクティビティが50
%以下になる有音回数カウンタ値ならば、闇値を60
d BmOとし、有音回数カウンタ値が50%〜55%
相当なら闇値を55dBmOとし、有音回数カウンタ値
が55%〜60%相当なら闇値を50 d BmOとし
、有音回数カウンタ値が60%以上相当なら闇値を45
dBmoと段々大きくする。
このようにすると、有音回数カウント数が多くアクティ
ビティが大きい時は、闇値は大きくなるのでアクティビ
ティは下がり伝送効率は上がる。
ビティが大きい時は、闇値は大きくなるのでアクティビ
ティは下がり伝送効率は上がる。
尚この時は有音区間が長く、元々話頭切断の回数は少な
いので閾値は大きくしても比較的品質は悪くはならない
。
いので閾値は大きくしても比較的品質は悪くはならない
。
又有音回数カウント数が少ない時は、闇値は小さくなる
ので、話頭切断の量は少なくなり品質は向上する。
ので、話頭切断の量は少なくなり品質は向上する。
尚この時は、無音区間が長く、元々アクティビティが小
さく伝送効率は良いので闇値を小さくしても比較的伝送
効率は悪くはならない。
さく伝送効率は良いので闇値を小さくしても比較的伝送
効率は悪くはならない。
以上詳細に説明せる如く本発明によれば、DS■等で、
話頭切断が比較的生ぜず音声品質が良く且つ伝送効率を
比較的良くすることが出来る音声検出器が得られる効果
がある。
話頭切断が比較的生ぜず音声品質が良く且つ伝送効率を
比較的良くすることが出来る音声検出器が得られる効果
がある。
第1図は本発明の原理ブロック図、
第2図は本発明の実施例の音声検出器のブロック図、
第3図は1例のアクティビティに対する入力信号電力の
闇値を示す図、 第4図は従来例の音声検出器のブロック図である。 図において、 1.2.3は有音無音判定手段、 4は有音無音判定手段、有音無音判定部、5は閾値可変
手段、 6は予測器、 10はバイパスフィルタ、 11は排他的論理和回路、 12はカウンタ、 13は1サンプル遅延回路、 14.15は積分器、 16は除算器、 17は1フレーム遅延回路、 18は減算器、 ■9〜21は比較器、 奉χ明の実施例1の音P種出器のブロック間第 2図 アフティ巳ティ 1ず列のアワティビティに対するλカイ883電力の聞
f直を示す間第 3 図 909−
闇値を示す図、 第4図は従来例の音声検出器のブロック図である。 図において、 1.2.3は有音無音判定手段、 4は有音無音判定手段、有音無音判定部、5は閾値可変
手段、 6は予測器、 10はバイパスフィルタ、 11は排他的論理和回路、 12はカウンタ、 13は1サンプル遅延回路、 14.15は積分器、 16は除算器、 17は1フレーム遅延回路、 18は減算器、 ■9〜21は比較器、 奉χ明の実施例1の音P種出器のブロック間第 2図 アフティ巳ティ 1ず列のアワティビティに対するλカイ883電力の聞
f直を示す間第 3 図 909−
Claims (1)
- 【特許請求の範囲】 フレーム単位に音声入力信号の電力と基準電力を比較し
、有音無音判定を行う第1の有音無音判定手段(1)と
、 フレーム単位に音声入力信号の零交叉数により有音無音
判定を行う第2の有音無音判定手段(2)と、 音声入力信号を入力し、予測誤差を算出し、フレーム間
予測誤差電力により有音無音判定を行う第3の有音無音
判定手段(3)と、 該第1の有音無音判定手段(1)より送られた判定結果
が有音なら有音と判定し、無音であっても、該第2、第
3の有音無音判定手段(2、3)よりの判定結果が有音
なら有音と判定し、判定結果を出力する第4の有音無音
判定手段(4)よりなる音声検出器において、 該第4の有音無音判定手段(4)の有音判定結果を複数
フレーム間カウントし、カウント値が第4の所定の閾値
より大きい時は基準電力を大きくし、小さければ基準電
力を小さくする閾値可変手段(5)を備えたことを特徴
とする音声検出器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2038842A JPH03241400A (ja) | 1990-02-20 | 1990-02-20 | 音声検出器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2038842A JPH03241400A (ja) | 1990-02-20 | 1990-02-20 | 音声検出器 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH03241400A true JPH03241400A (ja) | 1991-10-28 |
Family
ID=12536456
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2038842A Pending JPH03241400A (ja) | 1990-02-20 | 1990-02-20 | 音声検出器 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH03241400A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5381482A (en) * | 1992-01-30 | 1995-01-10 | Matsushita Electric Industrial Co., Ltd. | Sound field controller |
JP2003058191A (ja) * | 2001-08-10 | 2003-02-28 | Dainippon Printing Co Ltd | 周波数解析方法および音響信号の符号化方法 |
KR100580109B1 (ko) * | 2003-12-19 | 2006-05-12 | 주식회사 팬택앤큐리텔 | 이동통신 단말기 및 이동통신 단말기의 촬영영상 녹화방법 |
JP2021503633A (ja) * | 2017-12-28 | 2021-02-12 | アイフライテック カンパニー,リミテッド | 音声ノイズ軽減方法、装置、サーバー及び記憶媒体 |
-
1990
- 1990-02-20 JP JP2038842A patent/JPH03241400A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5381482A (en) * | 1992-01-30 | 1995-01-10 | Matsushita Electric Industrial Co., Ltd. | Sound field controller |
JP2003058191A (ja) * | 2001-08-10 | 2003-02-28 | Dainippon Printing Co Ltd | 周波数解析方法および音響信号の符号化方法 |
KR100580109B1 (ko) * | 2003-12-19 | 2006-05-12 | 주식회사 팬택앤큐리텔 | 이동통신 단말기 및 이동통신 단말기의 촬영영상 녹화방법 |
JP2021503633A (ja) * | 2017-12-28 | 2021-02-12 | アイフライテック カンパニー,リミテッド | 音声ノイズ軽減方法、装置、サーバー及び記憶媒体 |
US11064296B2 (en) | 2017-12-28 | 2021-07-13 | Iflytek Co., Ltd. | Voice denoising method and apparatus, server and storage medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3363336B2 (ja) | フレーム音声決定方法および装置 | |
RU2450369C2 (ru) | Устройство и способ для кодирования многоканального звукового сигнала | |
RU2251750C2 (ru) | Обнаружение активности сложного сигнала для усовершенствованной классификации речи/шума в аудиосигнале | |
KR100302370B1 (ko) | 음성구간검출방법과시스템및그음성구간검출방법과시스템을이용한음성속도변환방법과시스템 | |
US6205420B1 (en) | Method and device for instantly changing the speed of a speech | |
EP0637011B1 (en) | Speech signal discrimination arrangement and audio device including such an arrangement | |
JP2006189907A (ja) | 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ | |
US4688256A (en) | Speech detector capable of avoiding an interruption by monitoring a variation of a spectrum of an input signal | |
JPH0713586A (ja) | 音声判別装置と音響再生装置 | |
JPH03241400A (ja) | 音声検出器 | |
JP3360423B2 (ja) | 音声強調装置 | |
US5459784A (en) | Dual-tone multifrequency (DTMF) signalling transparency for low-data-rate vocoders | |
JPH08256124A (ja) | マルチチャンネルオーディオ信号のためのノイズイメージング保護 | |
JP3603470B2 (ja) | 音声品質改善装置 | |
JPH05183523A (ja) | 音声・楽音符号化装置 | |
JP3420831B2 (ja) | 骨伝導音声のノイズ除去装置 | |
JP2656069B2 (ja) | 音声検出装置 | |
JP3298188B2 (ja) | 音声検出方法 | |
US7962334B2 (en) | Receiving device and method | |
JPH0467200A (ja) | 有音区間判定方法 | |
JPH08202394A (ja) | 音声検出器 | |
KR100263296B1 (ko) | G.729 음성 부호화기를 위한 음성 활성도 측정 방법 | |
JPH0832526A (ja) | 音声検出器 | |
KR100554165B1 (ko) | 피치 지연값의 배수에 의한 영향 제거가 가능한 celp기반 음성부호화기 및 피치 지연값의 배수에 의한 영향제거 방법 | |
JP3033158B2 (ja) | デイジタル信号符号化装置 |