JPH0451035B2 - - Google Patents
Info
- Publication number
- JPH0451035B2 JPH0451035B2 JP59068014A JP6801484A JPH0451035B2 JP H0451035 B2 JPH0451035 B2 JP H0451035B2 JP 59068014 A JP59068014 A JP 59068014A JP 6801484 A JP6801484 A JP 6801484A JP H0451035 B2 JPH0451035 B2 JP H0451035B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- circuit
- threshold
- value
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000001514 detection method Methods 0.000 claims description 40
- 230000005236 sound signal Effects 0.000 claims description 18
- 238000000034 method Methods 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 3
- 230000002441 reversible effect Effects 0.000 description 19
- 238000009825 accumulation Methods 0.000 description 15
- 206010019133 Hangover Diseases 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000007423 decrease Effects 0.000 description 4
- 230000001186 cumulative effect Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002996 emotional effect Effects 0.000 description 2
- 230000036039 immunity Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
Landscapes
- Time-Division Multiplex Systems (AREA)
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は、音声信号の有無を判定する音声検出
方法及び回路に関する。
方法及び回路に関する。
(従来技術とその問題点)
音声検出回路は主にDSI(Digital Speech
Interpolationの略称である。)装置に組込まれ
DSI装置への入力チヤンネルに音声信号が存在す
るか否かを判定するために用いられる。
Interpolationの略称である。)装置に組込まれ
DSI装置への入力チヤンネルに音声信号が存在す
るか否かを判定するために用いられる。
尚、DSI装置に関しては、例えば1976年3月発
行の文献、コムサツト テクニカル レビユー
(COMSAT TECHNICAL REVIEW)誌vol6No.
1の第127〜158頁に掲載されているエス ジエー
キヤンパネラ(S・J・Campanella)による
論文「デイジタル スピーチ インターポレーシ
ヨン(Digital Speech Interpolation)」に詳述
されているので参照されたい。
行の文献、コムサツト テクニカル レビユー
(COMSAT TECHNICAL REVIEW)誌vol6No.
1の第127〜158頁に掲載されているエス ジエー
キヤンパネラ(S・J・Campanella)による
論文「デイジタル スピーチ インターポレーシ
ヨン(Digital Speech Interpolation)」に詳述
されているので参照されたい。
従来、ハードウエア規模が簡単で検出論理が明
瞭である方法としてレベル検出法が知られている
が、この方法は入力信号の信号エネルギー(電力
及び振幅)を検出後、閾値と比較することにより
音声信号の有無を判定するものである。またレベ
ル検出法を用いた音声検出器の中で、入力信号の
振幅と予め定められた閾値とを比較する固定閾値
型音声検出器が最もハードウエア規模が簡単でか
つ、確実な音声検出器として知られている。
瞭である方法としてレベル検出法が知られている
が、この方法は入力信号の信号エネルギー(電力
及び振幅)を検出後、閾値と比較することにより
音声信号の有無を判定するものである。またレベ
ル検出法を用いた音声検出器の中で、入力信号の
振幅と予め定められた閾値とを比較する固定閾値
型音声検出器が最もハードウエア規模が簡単でか
つ、確実な音声検出器として知られている。
次に図面を参照しながら、この固定閾値型音声
検出器の原理を説明する。
検出器の原理を説明する。
第1図は固定閾型音声検出器の原理を示すブロ
ツク図であり、信号入力端子1、振幅閾値入力端
子2、振幅比較回路3、累積回路4、累積回路へ
の入力信号として+1,−1を与える増加・減少
制御線および6,5音声検出用フリツブフロツプ
7、音声検出用フリツブフロツプセツト・リセツ
ト制御線8および9、音声検出結果出力端子10
からなつている。なお、この場合累積回路は可逆
カウンタ(アツプダウン・カウンタ)で置換でき
る。
ツク図であり、信号入力端子1、振幅閾値入力端
子2、振幅比較回路3、累積回路4、累積回路へ
の入力信号として+1,−1を与える増加・減少
制御線および6,5音声検出用フリツブフロツプ
7、音声検出用フリツブフロツプセツト・リセツ
ト制御線8および9、音声検出結果出力端子10
からなつている。なお、この場合累積回路は可逆
カウンタ(アツプダウン・カウンタ)で置換でき
る。
第1図において、端子1より入力される入力信
号は標本化周期ごとに振幅比較回路3において、
端子2より入力される予め定められた振幅閾値
(THa)と比較される。その結果、入力信号振幅
が振幅閾値よりも大きいと、累積回路増加制御線
5を使つて累積回路4の内容が1だけ増加され
る。また、逆に入力信号振幅が振幅閾値よりも小
さいと、累積回路減少制御線6を使つて累積回路
4の内容が1だけ減少される。但し、累積回路の
内容は負の値にならないようになつている。
号は標本化周期ごとに振幅比較回路3において、
端子2より入力される予め定められた振幅閾値
(THa)と比較される。その結果、入力信号振幅
が振幅閾値よりも大きいと、累積回路増加制御線
5を使つて累積回路4の内容が1だけ増加され
る。また、逆に入力信号振幅が振幅閾値よりも小
さいと、累積回路減少制御線6を使つて累積回路
4の内容が1だけ減少される。但し、累積回路の
内容は負の値にならないようになつている。
音声信号が到来し、振幅閾値を超える入力が多
くなると、累積回路の内容は順次増加する。もち
ろん、その間に振幅閾値以下の入力が加わると、
可逆カウンタの内容は1だけ減少する。このよう
にして、累積回路の内容が予め設定された持続時
間の閾値(THt)に達すると、音声検出用フリ
ツプフロツプのセツト制御線8を使つて音声検出
用フリツプフロツプ7がセツトされ、音声が検出
されたことになり、端子10よりその結果が出力
される。
くなると、累積回路の内容は順次増加する。もち
ろん、その間に振幅閾値以下の入力が加わると、
可逆カウンタの内容は1だけ減少する。このよう
にして、累積回路の内容が予め設定された持続時
間の閾値(THt)に達すると、音声検出用フリ
ツプフロツプのセツト制御線8を使つて音声検出
用フリツプフロツプ7がセツトされ、音声が検出
されたことになり、端子10よりその結果が出力
される。
また、音声が検出されなくなると、例えば、そ
れは累積回路4の内容が0になることで示される
が、その時、音声検出用フリツプフロツプ7は音
声検出用フリツプフロツプのリセツト制御線9を
使つてリセツトされ、端子10よりその結果が出
力されるが、一般にはある一定時間の後にリセツ
トされる。これは、ハングオーバーと称され、通
話中の単語や句の間での切断に耳が敏感であるこ
とから設けられており、その時間長は100〜
250ms程度である。
れは累積回路4の内容が0になることで示される
が、その時、音声検出用フリツプフロツプ7は音
声検出用フリツプフロツプのリセツト制御線9を
使つてリセツトされ、端子10よりその結果が出
力されるが、一般にはある一定時間の後にリセツ
トされる。これは、ハングオーバーと称され、通
話中の単語や句の間での切断に耳が敏感であるこ
とから設けられており、その時間長は100〜
250ms程度である。
さらに理解を深めるために第1図で示される固
定閾値型音声検出器に第2図のaの11で示され
る信号が入力した場合を例にとつて説明を加え
る。
定閾値型音声検出器に第2図のaの11で示され
る信号が入力した場合を例にとつて説明を加え
る。
第2図では、aが入力信号11と振幅閾値1
2、同図bが累積回路の内容13、持続時間の閾
値14、同図cが音声検出結果出力15を示して
いる。
2、同図bが累積回路の内容13、持続時間の閾
値14、同図cが音声検出結果出力15を示して
いる。
まず、入力信号11が端子1から入力される
と、標本化周期Tsごとに振幅比較回路3により
振幅閾値12と比較される。第2図から判るよう
に時刻ta1になつて始めて入力信号の振幅の方が
振幅閾値よりも大きくなるので累積回路の内容1
3は時刻ta1で始めて1になり(第2図b)、以
後、時刻ta2まで1ずつ増加されていく。その結
果、時刻ta1になつて累積回路の内容13が持続
時間の閾値14よりも大きくなるので、音声が検
出されたことになり、出力15は1になる。とこ
ろで、時刻ta3になると、入力信号11の振幅が
振幅閾値12よりも小さくなるので、累積回路の
内容13は1ずつ減少していき、時刻ta2になり、
持続時間の閾値14よりも小さくなるので音声信
号が無くなつたと判定され前述の理由でハングオ
ーバーが付加されハングオーバー終了後、出力1
5は0になる。第2図のcにおけるTHがハング
オーバー時間を示している。
と、標本化周期Tsごとに振幅比較回路3により
振幅閾値12と比較される。第2図から判るよう
に時刻ta1になつて始めて入力信号の振幅の方が
振幅閾値よりも大きくなるので累積回路の内容1
3は時刻ta1で始めて1になり(第2図b)、以
後、時刻ta2まで1ずつ増加されていく。その結
果、時刻ta1になつて累積回路の内容13が持続
時間の閾値14よりも大きくなるので、音声が検
出されたことになり、出力15は1になる。とこ
ろで、時刻ta3になると、入力信号11の振幅が
振幅閾値12よりも小さくなるので、累積回路の
内容13は1ずつ減少していき、時刻ta2になり、
持続時間の閾値14よりも小さくなるので音声信
号が無くなつたと判定され前述の理由でハングオ
ーバーが付加されハングオーバー終了後、出力1
5は0になる。第2図のcにおけるTHがハング
オーバー時間を示している。
以上説明してきた様な固定閾値型音声検出器で
は確かにハードウエア規模は簡単ではあるが、一
度閾値が設定されると閾値以上の信号ならどんな
雑音でも検出してしまう欠点があつた。
は確かにハードウエア規模は簡単ではあるが、一
度閾値が設定されると閾値以上の信号ならどんな
雑音でも検出してしまう欠点があつた。
この様な固定閾値型音声検出器の欠点を改善し
たものとして可変閾値型音声検出器が知られてい
る。以下、従来の可変閾値型音声検出器について
図面を用いて詳細に説明する。第3図は従来の可
変閾値音声検出器であり、入力端子20、偶数ビ
ツト反転回路21、符号変換回路22、整流回路
23、電力計算回路24、第1の閾値発生回路2
5、レベル検出回路26、累積回路27、比較回
路28、第2の閾値発生回路29、可逆カウンタ
30、カウンタ設定回路37、判定回路32及び
出力端子33から構成されている。
たものとして可変閾値型音声検出器が知られてい
る。以下、従来の可変閾値型音声検出器について
図面を用いて詳細に説明する。第3図は従来の可
変閾値音声検出器であり、入力端子20、偶数ビ
ツト反転回路21、符号変換回路22、整流回路
23、電力計算回路24、第1の閾値発生回路2
5、レベル検出回路26、累積回路27、比較回
路28、第2の閾値発生回路29、可逆カウンタ
30、カウンタ設定回路37、判定回路32及び
出力端子33から構成されている。
例えば、国際電信電話諮問委員会、(CCITT;
Comit′e Consultatif International Te′leg−
raphaique et T′ele′phonique)からの勧告案
G・711に基づき非線形符号化され、8ビツトの
A−Law符号(オレンジブツクVol・−2,
pp409〜410参照のこと。)となつた入力信号が入
力端子20から入力する場合を例にとつて説明を
加える。通常電話回線を伝送されるA−Law符
号信号はMSB(Most Significant Bitの略称であ
る。)側からみて、偶数ビツト目が反転されてい
るので、偶数ビツト反転回路21により入力信号
は偶数ビツトが反転され伝送される前のものと信
号に戻される。もとに戻つたA−Law符号信号
は符号変換回路22で、第4図で示すように、正
のA−Law符号信号に対してはMBSだけ、負の
A−Law符号信号に対しては全ビツト反転され
8ビツトの2の補数Two′s complement)符号
信号に変換され、整流回路23へ入力される。整
流回路23では、この入力信号を絶対値信号(大
きさのみを表わす信号)に変換し、一方は電力計
算回路24へ、もう一方はレベル検出回路26へ
送り出す。
Comit′e Consultatif International Te′leg−
raphaique et T′ele′phonique)からの勧告案
G・711に基づき非線形符号化され、8ビツトの
A−Law符号(オレンジブツクVol・−2,
pp409〜410参照のこと。)となつた入力信号が入
力端子20から入力する場合を例にとつて説明を
加える。通常電話回線を伝送されるA−Law符
号信号はMSB(Most Significant Bitの略称であ
る。)側からみて、偶数ビツト目が反転されてい
るので、偶数ビツト反転回路21により入力信号
は偶数ビツトが反転され伝送される前のものと信
号に戻される。もとに戻つたA−Law符号信号
は符号変換回路22で、第4図で示すように、正
のA−Law符号信号に対してはMBSだけ、負の
A−Law符号信号に対しては全ビツト反転され
8ビツトの2の補数Two′s complement)符号
信号に変換され、整流回路23へ入力される。整
流回路23では、この入力信号を絶対値信号(大
きさのみを表わす信号)に変換し、一方は電力計
算回路24へ、もう一方はレベル検出回路26へ
送り出す。
電力計算回路24では、入力信号に含まれる雑
音を取り出し、雑音の平均電力を計算する。具体
的には、音声が検出されない時(例えば、後述す
る比較回路28の出力が0の時)はすべての入力
信号を雑音とみなすとともに、音声が検出された
時(例えば後述する比較回路28の出力が1の
時)であつても予め定められたレベル以下の信号
は雑音であるとみなし、この雑音を低域通過フイ
ルタに入力することにより雑音の平均電力を計算
し、その結果を第1の閾値発生回路25に送出す
る。従つて、雑音の平均電力を計算する際に除外
される音声信号とは、後述の比較回路の出力が1
でありかつ、予め定められたレベル以上の信号レ
ベルを有する信号である。第1の閾値発生回路2
5では、電力計算回路24からの出力を定数倍す
ることにより、レベル検出回路26で使用される
第1の閾値(TH1)と、該第1の閾値より6dB
高い所に第2の閾値(TH2)とを設定し、レベ
ル検出回路26へ送出する。
音を取り出し、雑音の平均電力を計算する。具体
的には、音声が検出されない時(例えば、後述す
る比較回路28の出力が0の時)はすべての入力
信号を雑音とみなすとともに、音声が検出された
時(例えば後述する比較回路28の出力が1の
時)であつても予め定められたレベル以下の信号
は雑音であるとみなし、この雑音を低域通過フイ
ルタに入力することにより雑音の平均電力を計算
し、その結果を第1の閾値発生回路25に送出す
る。従つて、雑音の平均電力を計算する際に除外
される音声信号とは、後述の比較回路の出力が1
でありかつ、予め定められたレベル以上の信号レ
ベルを有する信号である。第1の閾値発生回路2
5では、電力計算回路24からの出力を定数倍す
ることにより、レベル検出回路26で使用される
第1の閾値(TH1)と、該第1の閾値より6dB
高い所に第2の閾値(TH2)とを設定し、レベ
ル検出回路26へ送出する。
レベル検出回路26では整流回路23の出力
と、第1の閾値発生回路25より送出される第1
の閾値及び第2の閾値とを比較し、整流回路の出
力が第2の閾値より大きい場合には入力信号が音
声信号である確率が高いので+2、第1の閾値と
第2の閾値との間に位置する場合には入力信号が
音声信号である確率と雑音である確率とがほぼ等
しいかあるいは前者が少し高い程であるので+
1、第1の閾値より小さい場合には入力信号が雑
音である確率が高いので−1を出力する。累積回
路27では、レベル検出回路26の出力を累積し
ておりその累積値を比較回路28へ送出する。比
較回路28では、後述する第2の閾値発生回路2
9から出力される第3の閾値(TH3)と前記累
積値とを比較し、後者が前者よりも大きい場合に
は入力信号が音声信号であると判定し、+1を、
また、前者が後者よりも大きい場合には入力信号
は雑音であると判定し、0を出力する。第2の閾
値発生回路29では、前記比較回路28で使用さ
れる音声信号判定用の第3の閾値(TH3)とし
て、レベルの異なる閾値を2つ用意しておき、前
記比較回路28の出力が0の場合には高いレベル
の第3の閾値(TH3H)を発生し、また、前記
比較回路28の出力が1の場合には低いレベルの
第3の閾値(TH3L)を発生し前記比較回路28
へ送出する。
と、第1の閾値発生回路25より送出される第1
の閾値及び第2の閾値とを比較し、整流回路の出
力が第2の閾値より大きい場合には入力信号が音
声信号である確率が高いので+2、第1の閾値と
第2の閾値との間に位置する場合には入力信号が
音声信号である確率と雑音である確率とがほぼ等
しいかあるいは前者が少し高い程であるので+
1、第1の閾値より小さい場合には入力信号が雑
音である確率が高いので−1を出力する。累積回
路27では、レベル検出回路26の出力を累積し
ておりその累積値を比較回路28へ送出する。比
較回路28では、後述する第2の閾値発生回路2
9から出力される第3の閾値(TH3)と前記累
積値とを比較し、後者が前者よりも大きい場合に
は入力信号が音声信号であると判定し、+1を、
また、前者が後者よりも大きい場合には入力信号
は雑音であると判定し、0を出力する。第2の閾
値発生回路29では、前記比較回路28で使用さ
れる音声信号判定用の第3の閾値(TH3)とし
て、レベルの異なる閾値を2つ用意しておき、前
記比較回路28の出力が0の場合には高いレベル
の第3の閾値(TH3H)を発生し、また、前記
比較回路28の出力が1の場合には低いレベルの
第3の閾値(TH3L)を発生し前記比較回路28
へ送出する。
可逆カウンタ30では、前記比較回路28の出
力を入力し、該入力信号が1の時にはカウンタの
内容を1だけ増加させ、0の時にはカウンタの内
容を1だけ減少させ前記比較回路の出力を累積し
ている。また、カウンタ設定回路31は前記比較
回路の出力を監視しておりその出力が1から0に
変化する時点を検出し、その時点で、前記可逆カ
ウンタ30の内容が予め定められた値に設定す
る。判定回路32では、前記可逆カウンタ30の
内容が予め定められた値(通常は0を用いる。)
より大きい場合に音声信号が検出されたとして1
を出力端子33を介して外部に出力する。もちろ
ん小さい場合には0を出力するがこうすることに
より前述のハングオーバーも付加されることにな
る。
力を入力し、該入力信号が1の時にはカウンタの
内容を1だけ増加させ、0の時にはカウンタの内
容を1だけ減少させ前記比較回路の出力を累積し
ている。また、カウンタ設定回路31は前記比較
回路の出力を監視しておりその出力が1から0に
変化する時点を検出し、その時点で、前記可逆カ
ウンタ30の内容が予め定められた値に設定す
る。判定回路32では、前記可逆カウンタ30の
内容が予め定められた値(通常は0を用いる。)
より大きい場合に音声信号が検出されたとして1
を出力端子33を介して外部に出力する。もちろ
ん小さい場合には0を出力するがこうすることに
より前述のハングオーバーも付加されることにな
る。
第3図における電力計算回路24及び第2の閾
値発生回路25としては第5図の回路が使用で
き、絶対値信号入力端子50、雑音判定レベル入
力端子51、比較回路出力信号端子入力52、比
較器53、論理和回路54、乗算器55,56,
57,58,被乗数入力端子59,60,61,
62,63被乗数選択器64、加算器65、リミ
ツター66,67、メモリー68第1の閾値出力
端子69および第2の閾値出力端子70から構成
されている。絶対値入力信号は入力端子50より
入力され、一方は乗算器55へ、もう一方は比較
器53へ送られる。比較器53では、前記入力信
号と入力端子51より入力される雑音判定レベル
と比較され、前者が後者よりも大きい場合に0、
小さい場合に+1を出力し、論理和回路54で
は、比較器53の出力信号と、比較回路28から
の出力信号を反転した信号との論理和がとられ、
少なくともどちらか一方が+1のときに+1が出
力され、乗算器56の制御信号及び、被乗数選択
器64の選択制御信号となる。前記被乗数選択器
64では、前記選択制御信号が+1の時には被乗
数入力端子59より入力される被乗数が選択さ
れ、また0の時には被乗数入力端子60より入力
される被乗数(現在は0を用いている。)が選択
され乗算器55の被乗数となる。
値発生回路25としては第5図の回路が使用で
き、絶対値信号入力端子50、雑音判定レベル入
力端子51、比較回路出力信号端子入力52、比
較器53、論理和回路54、乗算器55,56,
57,58,被乗数入力端子59,60,61,
62,63被乗数選択器64、加算器65、リミ
ツター66,67、メモリー68第1の閾値出力
端子69および第2の閾値出力端子70から構成
されている。絶対値入力信号は入力端子50より
入力され、一方は乗算器55へ、もう一方は比較
器53へ送られる。比較器53では、前記入力信
号と入力端子51より入力される雑音判定レベル
と比較され、前者が後者よりも大きい場合に0、
小さい場合に+1を出力し、論理和回路54で
は、比較器53の出力信号と、比較回路28から
の出力信号を反転した信号との論理和がとられ、
少なくともどちらか一方が+1のときに+1が出
力され、乗算器56の制御信号及び、被乗数選択
器64の選択制御信号となる。前記被乗数選択器
64では、前記選択制御信号が+1の時には被乗
数入力端子59より入力される被乗数が選択さ
れ、また0の時には被乗数入力端子60より入力
される被乗数(現在は0を用いている。)が選択
され乗算器55の被乗数となる。
また、乗算器55では、絶対値入力信号と前述
のようにして選択された被乗数との積がとられ加
算器65へ送られる。一方、乗算器56では被乗
数入力端子61より入力される被乗数メモリー6
8の内容との積がとられ加算器65へ送られる。
但し、論理和回路54の出力が0の時はこの乗算
は行なわずメモリー68の内容がそのまま出力さ
れる。そして、加算器65で前述の乗算器55の
出力と乗算器56の出力との加算が行なわれその
結果がリミツター66を介してメモリー68に備
えられる。また、それと同時にリミツター66の
出力は乗算器57により、被乗数入力端子62よ
り入力される被乗数との積がとられ、リミツター
67を介して第1の閾値(TH1)として、出力
端子69より出力される。
のようにして選択された被乗数との積がとられ加
算器65へ送られる。一方、乗算器56では被乗
数入力端子61より入力される被乗数メモリー6
8の内容との積がとられ加算器65へ送られる。
但し、論理和回路54の出力が0の時はこの乗算
は行なわずメモリー68の内容がそのまま出力さ
れる。そして、加算器65で前述の乗算器55の
出力と乗算器56の出力との加算が行なわれその
結果がリミツター66を介してメモリー68に備
えられる。また、それと同時にリミツター66の
出力は乗算器57により、被乗数入力端子62よ
り入力される被乗数との積がとられ、リミツター
67を介して第1の閾値(TH1)として、出力
端子69より出力される。
また、リミツター67の出力は、乗算器58で
被乗数入力端子63より入力される被乗数(現在
は2を用いている。)との積がとられ、第2の閾
値(TH2)として、出力端子70より出力され
る。
被乗数入力端子63より入力される被乗数(現在
は2を用いている。)との積がとられ、第2の閾
値(TH2)として、出力端子70より出力され
る。
ここで、リミツター66,67を用いているの
はメモリー68の内容及び閾値(TH1)の可変
領域を制限することにより閾値調整速度を敏速に
かつ、音声検出器の受信感度および感動レベル範
囲を制限し、雑音に対する免役性を保障するため
である。
はメモリー68の内容及び閾値(TH1)の可変
領域を制限することにより閾値調整速度を敏速に
かつ、音声検出器の受信感度および感動レベル範
囲を制限し、雑音に対する免役性を保障するため
である。
尚、電力計算回路24は前述の様に絶対値信号
を一次の低域通過フイルタに通すことにより、雑
音のレベルを算出していたが、それは振幅分布が
Gauss分布であり分散がσ2である雑音をその絶対
値をとつて一次の低域通過フイルタに通して得ら
れる電力Pが次式で表す様に近似的に標準偏差σ
に比例した値となるためである。
を一次の低域通過フイルタに通すことにより、雑
音のレベルを算出していたが、それは振幅分布が
Gauss分布であり分散がσ2である雑音をその絶対
値をとつて一次の低域通過フイルタに通して得ら
れる電力Pが次式で表す様に近似的に標準偏差σ
に比例した値となるためである。
ここでx2=yとおくと2xdx=dy故
∫∞ -∞xexp(−x2/2σ2)dx
=∫00 01/2xep(−y/2σ2)dy=σ2
ゆえに(1)式は次のようになる。
したがつて
P≒0.8σ (3)
したがつて前記処理を施すことにより1次の低
域通過フイルタの出力で雑音の標準偏差σに近似
的に比例した値が得られることがわかる。
域通過フイルタの出力で雑音の標準偏差σに近似
的に比例した値が得られることがわかる。
また、第3図の如く第2の閾値発生回路29を
設け、比較回路28で使用される第3の閾値
(TH3)を2個用意し、比較回路28の出力を選
択信号とし、該選択信号が1の時には低いレベル
の第3の閾値(TH3L)を、0の時には高いレベ
ルの第3の閾値(TH3H)を選択し使用してい
るが、これは比較回路28の出力にヒステリシス
を設けることににより音声検出器の過剰なON−
OFFを避けるためである。
設け、比較回路28で使用される第3の閾値
(TH3)を2個用意し、比較回路28の出力を選
択信号とし、該選択信号が1の時には低いレベル
の第3の閾値(TH3L)を、0の時には高いレベ
ルの第3の閾値(TH3H)を選択し使用してい
るが、これは比較回路28の出力にヒステリシス
を設けることににより音声検出器の過剰なON−
OFFを避けるためである。
第3図で用いられる可逆カウンタ30、カウン
タ設定回路31及び判定回路32としては、第6
図の回路が使用でき、入力端子71、1サンプル
遅延回路72、論理積回路73、カウンタ設定値
入力端子74、可逆カウンタ75、比較回路7
6、閾値入力端子77及び出力端子78から構成
されており、破線で囲まれた30,31,32は
それぞれ第3図で示す可逆カウンタ、カウンタ設
定回路、判定回路を示している。入力端子71よ
り入力された入力信号は一方は可逆カウンタ75
へ、もう一方は1サンプル遅延回路72及び論理
積回路73へ送られる。
タ設定回路31及び判定回路32としては、第6
図の回路が使用でき、入力端子71、1サンプル
遅延回路72、論理積回路73、カウンタ設定値
入力端子74、可逆カウンタ75、比較回路7
6、閾値入力端子77及び出力端子78から構成
されており、破線で囲まれた30,31,32は
それぞれ第3図で示す可逆カウンタ、カウンタ設
定回路、判定回路を示している。入力端子71よ
り入力された入力信号は一方は可逆カウンタ75
へ、もう一方は1サンプル遅延回路72及び論理
積回路73へ送られる。
論理積回路73では現入力信号を反転した信号
と1サンプル時刻前の入力信号との積がとられ、
その結果を可逆カウンタ75へ送出する。可逆カ
ウンタ75では入力信号が1の時にはカウンタの
内容を1だけ増加させ、また、0の時にはカウン
タの内容を1だけ減少させるとともに、前記論理
積回路の出力が1の時、すなわち、入力信号が1
から0に変化する時に、カウンタの内容を強制的
にカウンタ設定値入力端子74から入力される予
め定められた値に設定される。比較器76では閾
値入力端子77より入力される閾値(実際は0を
使用している。)と前記可逆カウンタ75から出
力されるカウンタの内容とを比較し、カウンタの
内容が大きい場合に1を出力端子78を介して外
部に出力する。
と1サンプル時刻前の入力信号との積がとられ、
その結果を可逆カウンタ75へ送出する。可逆カ
ウンタ75では入力信号が1の時にはカウンタの
内容を1だけ増加させ、また、0の時にはカウン
タの内容を1だけ減少させるとともに、前記論理
積回路の出力が1の時、すなわち、入力信号が1
から0に変化する時に、カウンタの内容を強制的
にカウンタ設定値入力端子74から入力される予
め定められた値に設定される。比較器76では閾
値入力端子77より入力される閾値(実際は0を
使用している。)と前記可逆カウンタ75から出
力されるカウンタの内容とを比較し、カウンタの
内容が大きい場合に1を出力端子78を介して外
部に出力する。
以上のように従来の可変閾値音声検出回路では
PCM符号で信号処理を行なつていることにより
ハードウエア規模が増大しないこと、雑音レベル
に応じた閾値が得られ、疑似信号に対して免疫性
が強いこと、及び該閾値の最大値、最少値を規定
することにより受信感度や感動レベル範囲を任意
に設定できるという利点があるものの、英単語
“such”のように“su”と“ch”の間に一時的な
無音区間があり、その後に破裂性子音“ch”等
が続くと音声検出器は“su-”の部分のみを検出
し“ch”を雑音とみなして検出しなかつたり
(語尾切断)、たとえ検出しても“ch”の大部分
が失なわれたり(語中脱落)する。また、英単語
“end”等でも“en”と“d”との間を少し離し
て発音する場合等では“en-”と“d”の発声レ
ベルが“en-”の方に強く“d”の方に弱い等の
性質があり、この様な場合にも音声検出器は語尾
を検出できない場合が多かつた。
PCM符号で信号処理を行なつていることにより
ハードウエア規模が増大しないこと、雑音レベル
に応じた閾値が得られ、疑似信号に対して免疫性
が強いこと、及び該閾値の最大値、最少値を規定
することにより受信感度や感動レベル範囲を任意
に設定できるという利点があるものの、英単語
“such”のように“su”と“ch”の間に一時的な
無音区間があり、その後に破裂性子音“ch”等
が続くと音声検出器は“su-”の部分のみを検出
し“ch”を雑音とみなして検出しなかつたり
(語尾切断)、たとえ検出しても“ch”の大部分
が失なわれたり(語中脱落)する。また、英単語
“end”等でも“en”と“d”との間を少し離し
て発音する場合等では“en-”と“d”の発声レ
ベルが“en-”の方に強く“d”の方に弱い等の
性質があり、この様な場合にも音声検出器は語尾
を検出できない場合が多かつた。
(発明の目的)
本発明の目的は以上の様な語中脱落や語尾切断
が発生しにくい音声検出器を提供することにあ
る。
が発生しにくい音声検出器を提供することにあ
る。
(発明の構成)
本発明によれば、標本時刻毎に入力される入力
信号と該入力信号に含まれる雑音レベルに応じて
変動する第1の閾値及び第2の閾値との大小判定
結果を数値化した値を累積して該入力信号に含ま
れる音声信号の信号電力を求め、該信号電力と第
3の閾値とを比較し音声信号の有無を判定し、判
定結果が音声有りから無しに変わつた場合には予
め定められた時間を該判定結果を有音区間として
付加して出力を得る音声検出方法において、 前記第3の閾値としてレベルの異なる2つの値
を用意し、前記音声検出出力が音声信号有りを知
らせる時には低いレベルの値を用い、前記音声検
出出力が音声信号無しを知らせる時には高いレベ
ルの値を用いて音声検出を行ない付加された有音
区間でも低レベルの閾値を用いることを特徴とす
る音声検出方法が得られる。
信号と該入力信号に含まれる雑音レベルに応じて
変動する第1の閾値及び第2の閾値との大小判定
結果を数値化した値を累積して該入力信号に含ま
れる音声信号の信号電力を求め、該信号電力と第
3の閾値とを比較し音声信号の有無を判定し、判
定結果が音声有りから無しに変わつた場合には予
め定められた時間を該判定結果を有音区間として
付加して出力を得る音声検出方法において、 前記第3の閾値としてレベルの異なる2つの値
を用意し、前記音声検出出力が音声信号有りを知
らせる時には低いレベルの値を用い、前記音声検
出出力が音声信号無しを知らせる時には高いレベ
ルの値を用いて音声検出を行ない付加された有音
区間でも低レベルの閾値を用いることを特徴とす
る音声検出方法が得られる。
また本発明によれば、標本時刻毎に入力される
入力信号に含まれる雑音電力に応じて第1の閾値
及び第2の閾値を発生する手段と、前記入力信号
と前記第1の閾値及び第2の閾値とを比較し比較
結果を数値化して累積する手段と、該累積する手
段の出力を第3の閾値と比較し比較結果を示す信
号を出力する比較手段と、該比較手段の出力が
「大」から「小」へ変化した時刻を検出し、この
変化時刻の直後からのあらかじめ定められた長さ
の期間と前記比較手段の出力が「大」である期間
だけ「音声有」を示す判定信号を出力する判定手
段と、あらかじめ定められた高い値と低い値とが
入力され、前記判定手段より供給される前記判定
信号が「音声有」を示す場合には前記低い値を、
そうでない場合には前記高い値を前記第3の閾値
として前記比較手段に供給する手段とを少なくと
も備えたことを特徴とする音声検出回路が得られ
る。
入力信号に含まれる雑音電力に応じて第1の閾値
及び第2の閾値を発生する手段と、前記入力信号
と前記第1の閾値及び第2の閾値とを比較し比較
結果を数値化して累積する手段と、該累積する手
段の出力を第3の閾値と比較し比較結果を示す信
号を出力する比較手段と、該比較手段の出力が
「大」から「小」へ変化した時刻を検出し、この
変化時刻の直後からのあらかじめ定められた長さ
の期間と前記比較手段の出力が「大」である期間
だけ「音声有」を示す判定信号を出力する判定手
段と、あらかじめ定められた高い値と低い値とが
入力され、前記判定手段より供給される前記判定
信号が「音声有」を示す場合には前記低い値を、
そうでない場合には前記高い値を前記第3の閾値
として前記比較手段に供給する手段とを少なくと
も備えたことを特徴とする音声検出回路が得られ
る。
(実施例)
本発明は、上述の構成をとり、ハングオーバー
が付加されている時にも有音区間と同じ低いレベ
ルの第2の閾値を用いることにより、話中脱落や
語尾切断を低減している。
が付加されている時にも有音区間と同じ低いレベ
ルの第2の閾値を用いることにより、話中脱落や
語尾切断を低減している。
本発明を図面を参照しながら詳細に説明する。
第7図は本発明の一実施例であり、入力端子2
0、偶数ビツト反転回路21、符号変換回路2
2、整流回路23、電力計算回路24、第1の閾
値発生回路25、レベル検出回路26、累積回路
27、比較回路28、第2の閾値発生回路29、
可逆カウンタ30、カウンタ設定回路31及び出
力端子33、から構成されている。ここで、偶数
ビツト反転回路21、符号変換回路22、整流回
路23、電力計算回路24、第1の閾値発生回路
25、レベル検出回路26、累積回路27、比較
回路28、第2の閾値発生回路29、可逆カウン
タ30、カウンタ設定回路32の各々は第3図の
各々と同一である。第3図に示す従来形音声検出
器と第7図の本発明の音声検出器との相違点は、
第3図における第2の閾値発生回路29の制御端
子cに入力される信号が比較回路28の出力であ
つたのに対し、本発明の音声検出器においては第
2の閾値発生回路29の制御端子cに入力される
信号は出力端子33の信号に変わつている点であ
る。以降端子20から累積算回路27までの音声
検出のメカニズムの詳細は第3図で述べた従来形
音声検出器の動作の説明の部分に譲り、以下本発
明重要点である比較回路28、第2の閾値発生回
路29、可逆カウンタ30、カウンタ設定回路3
1、に関してその動作例を示した。第8図a〜d
をも参照して詳細に説明する。いま音声検出器に
第8図aで示す信号(音声信号130および13
1を含む)が入力された場合を考える、波形13
0が到来し、レベル検出回路26において、第1
の閾値及び第2の閾値と比較されその結果bで示
す波形132の様な出力が累積回路27の出力と
して得られたとすると、比較回路28では、累積
回路27の出力波形132と第3の閾値の変化波
形134とが比較される。
第7図は本発明の一実施例であり、入力端子2
0、偶数ビツト反転回路21、符号変換回路2
2、整流回路23、電力計算回路24、第1の閾
値発生回路25、レベル検出回路26、累積回路
27、比較回路28、第2の閾値発生回路29、
可逆カウンタ30、カウンタ設定回路31及び出
力端子33、から構成されている。ここで、偶数
ビツト反転回路21、符号変換回路22、整流回
路23、電力計算回路24、第1の閾値発生回路
25、レベル検出回路26、累積回路27、比較
回路28、第2の閾値発生回路29、可逆カウン
タ30、カウンタ設定回路32の各々は第3図の
各々と同一である。第3図に示す従来形音声検出
器と第7図の本発明の音声検出器との相違点は、
第3図における第2の閾値発生回路29の制御端
子cに入力される信号が比較回路28の出力であ
つたのに対し、本発明の音声検出器においては第
2の閾値発生回路29の制御端子cに入力される
信号は出力端子33の信号に変わつている点であ
る。以降端子20から累積算回路27までの音声
検出のメカニズムの詳細は第3図で述べた従来形
音声検出器の動作の説明の部分に譲り、以下本発
明重要点である比較回路28、第2の閾値発生回
路29、可逆カウンタ30、カウンタ設定回路3
1、に関してその動作例を示した。第8図a〜d
をも参照して詳細に説明する。いま音声検出器に
第8図aで示す信号(音声信号130および13
1を含む)が入力された場合を考える、波形13
0が到来し、レベル検出回路26において、第1
の閾値及び第2の閾値と比較されその結果bで示
す波形132の様な出力が累積回路27の出力と
して得られたとすると、比較回路28では、累積
回路27の出力波形132と第3の閾値の変化波
形134とが比較される。
時刻T1までは第3の閾値の変化波形134の
方が累積回路27の出力波形132よりも大きい
ので音声信号は検出されないが、時刻T1で後者
の方が大きくなるので比較回路28の出力波形1
35は1となり、出力を保持するための可逆カウ
ンタ30の内容波形137も増加し始める、それ
故、出力端子33の出力波形138も1となり音
声信号が検出されたことになる。
方が累積回路27の出力波形132よりも大きい
ので音声信号は検出されないが、時刻T1で後者
の方が大きくなるので比較回路28の出力波形1
35は1となり、出力を保持するための可逆カウ
ンタ30の内容波形137も増加し始める、それ
故、出力端子33の出力波形138も1となり音
声信号が検出されたことになる。
そこで、出力端子33の出力波形138が1と
なると、第2の閾値発生回路29では低レベルの
第3の閾値が選択されるので第8図bの様に低い
値に設定される。
なると、第2の閾値発生回路29では低レベルの
第3の閾値が選択されるので第8図bの様に低い
値に設定される。
その後第8図aに示す入力波形130の振幅が
小さくなり累積回路27の出力波形132が下が
り始め時刻T2で第3の閾値の変化波形134よ
り小さくなると、比較回路28の出力波形135
は第8図cに示す様に0になる。
小さくなり累積回路27の出力波形132が下が
り始め時刻T2で第3の閾値の変化波形134よ
り小さくなると、比較回路28の出力波形135
は第8図cに示す様に0になる。
しかしながら、可逆カウンタ30の内容波形1
37は第8図cで示すようにデータ設定回路31
によりハングオーバー用のデータがセツトされる
のでハングオーバーが付加される。
37は第8図cで示すようにデータ設定回路31
によりハングオーバー用のデータがセツトされる
のでハングオーバーが付加される。
ハングオーバーが付加されている時に、端子2
0に第8図aで示す波形131が到来すると時刻
T3で累積回路27の出力波形133が第2の閾
値発生回路29の出力する第8図bで示す波形1
34より大きくなるので、比較回路28の出力は
第8図cに示す波形が1となり、出力保持用可逆
カウンタ30の内容は第8図cに示す通り波形1
37は再び増加してゆく。そして累積回路27の
出力は第8図bに示す波形133が第2の閾値発
生回路29の出力である第8図bの134よりも
小さくなる時刻T4で比較回路28の出力は第8
図cの波形136が0となるので、ここで再びハ
ングオーバーが付加されることになる。
0に第8図aで示す波形131が到来すると時刻
T3で累積回路27の出力波形133が第2の閾
値発生回路29の出力する第8図bで示す波形1
34より大きくなるので、比較回路28の出力は
第8図cに示す波形が1となり、出力保持用可逆
カウンタ30の内容は第8図cに示す通り波形1
37は再び増加してゆく。そして累積回路27の
出力は第8図bに示す波形133が第2の閾値発
生回路29の出力である第8図bの134よりも
小さくなる時刻T4で比較回路28の出力は第8
図cの波形136が0となるので、ここで再びハ
ングオーバーが付加されることになる。
出力端子33が0に戻る時刻T5になると第2
の閾値発生回路29は第8図bの変化波形134
で示すように時刻T5で再び高い値にセツトされ
る。
の閾値発生回路29は第8図bの変化波形134
で示すように時刻T5で再び高い値にセツトされ
る。
従つて、第2の閾値発生回路29の制御を従来
通り比較回路28で行なうと時刻T3では第8図
bで示す波形131が検出されることはなかつた
が、本発明の音声検出器では図8aの波形131
に対しても検出が可能となる。それ故、本発明に
よる単語や語句の脱落や語尾の欠落を防止する能
力が向上することが理解できる。
通り比較回路28で行なうと時刻T3では第8図
bで示す波形131が検出されることはなかつた
が、本発明の音声検出器では図8aの波形131
に対しても検出が可能となる。それ故、本発明に
よる単語や語句の脱落や語尾の欠落を防止する能
力が向上することが理解できる。
(発明の効果)
以上詳細に説明した通り、本発明によれば単
語、語句の脱落や、誤尾の脱落を防止する能力を
向上させることができ、特に本発明をDSI装置に
用いた場合その効果はきわめて大きい。
語、語句の脱落や、誤尾の脱落を防止する能力を
向上させることができ、特に本発明をDSI装置に
用いた場合その効果はきわめて大きい。
第1図は従来の音声検出器を示すブロツク図、
第2図a,b,cは第1図の各部の波形を示す
図、第3図は他の従来の音声検出器を示すブロツ
ク図、第4図は符号変換方法を示す図、第5図、
第6図は第3図の1部を示す図、第7図は本発明
による可変閾値型音声検出器を示すブロツク図、
第8図a〜dは第7図の動作説明を行なう図、で
ある。 図において、20は入力端子、21は偶数ビツ
ト反転回路、22は符号変換回路、23は整流回
路、26はレベル検出回路、27は累積回路、2
8は比較回路、29は第2の閾値発生回路、30
は可逆カウンタ、31はカウンタ設定回路、32
は判定回路、33は出力端子である。
第2図a,b,cは第1図の各部の波形を示す
図、第3図は他の従来の音声検出器を示すブロツ
ク図、第4図は符号変換方法を示す図、第5図、
第6図は第3図の1部を示す図、第7図は本発明
による可変閾値型音声検出器を示すブロツク図、
第8図a〜dは第7図の動作説明を行なう図、で
ある。 図において、20は入力端子、21は偶数ビツ
ト反転回路、22は符号変換回路、23は整流回
路、26はレベル検出回路、27は累積回路、2
8は比較回路、29は第2の閾値発生回路、30
は可逆カウンタ、31はカウンタ設定回路、32
は判定回路、33は出力端子である。
Claims (1)
- 【特許請求の範囲】 1 標本時刻毎に入力される入力信号と該入力信
号に含まれる雑音レベルに応じて変動する第1の
閾値及び第2の閾値との大小判定結果を数値化し
た値を累積して該入力信号の信号電力を求め、該
信号電力と第3の閾値とを比較し音声信号の有無
を判定し、判定結果が音声信号有りから無しに変
わつた場合には予め定められた時間を該判定結果
に有音区間として付加して音声検出出力を得る音
声検出方法において、前記第3の閾値としてレベ
ルの異なる2つの値を用意し、前記音声検出出力
が音声信号有りを知らせる時には低いレベルの値
を用い、前記音声検出出力が音声信号無しを知ら
せる時には高いレベルの値を用いて音声検出を行
ない前記付加された有音区間でも低いレベルの閾
値を用いることを特徴とする音声検出方法。 2 標本時刻毎に入力される入力信号に含まれる
雑音電力に応じて第1の閾値及び第2の閾値を発
生する手段と、前記入力信号と前記第1の閾値及
び第2の閾値とを比較し比較結果を数値化して累
積する手段と該累積する手段の出力を第3の閾値
とを比較し音声信号の有無を示す信号を出力する
比較手段と、該比較手段の出力が音声信号有りか
ら無しへ変化した時刻を検出し、この変化時刻の
直後からのあらかじめ定められた長さの期間と前
記比較手段の出力が音声信号有りである期間だけ
「音声有」を示す判定信号を出力する判定手段と、
あらかじめ定められた高い値と低い値とが入力さ
れ、前記判定手段より供給される前記判定信号が
「音声有」を示す場合には前記低い値を、そうで
ない場合には前記高い値を前記第3の閾値として
前記比較手段に供給する手段とを少なくとも備え
たことを特徴とする音声検出回路。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59068014A JPS60211500A (ja) | 1984-04-05 | 1984-04-05 | 音声検出方法及び回路 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59068014A JPS60211500A (ja) | 1984-04-05 | 1984-04-05 | 音声検出方法及び回路 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS60211500A JPS60211500A (ja) | 1985-10-23 |
JPH0451035B2 true JPH0451035B2 (ja) | 1992-08-17 |
Family
ID=13361550
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59068014A Granted JPS60211500A (ja) | 1984-04-05 | 1984-04-05 | 音声検出方法及び回路 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS60211500A (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2884563B2 (ja) * | 1987-10-29 | 1999-04-19 | 松下電器産業株式会社 | 音声検出装置 |
-
1984
- 1984-04-05 JP JP59068014A patent/JPS60211500A/ja active Granted
Also Published As
Publication number | Publication date |
---|---|
JPS60211500A (ja) | 1985-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4700392A (en) | Speech signal detector having adaptive threshold values | |
US4028496A (en) | Digital speech detector | |
US6353404B1 (en) | D/A conversion apparatus and D/A conversion method | |
US6535844B1 (en) | Method of detecting silence in a packetized voice stream | |
JP3194135B2 (ja) | デジタルオーディオプロセッサ | |
US4393369A (en) | Floating-point A/D and D/A converter | |
JPH0451035B2 (ja) | ||
JPS60242500A (ja) | 音声検出方法及び回路 | |
JPH0371719B2 (ja) | ||
EP0090314A2 (en) | PCM encoder conformable to the A-law | |
JPH0464074B2 (ja) | ||
EP0167364A1 (en) | Speech-silence detection with subband coding | |
JPS61156296A (ja) | 可変閾値型音声検出器 | |
JPS59113500A (ja) | 相関関数計算装置 | |
JPS61151700A (ja) | 時定数変動型可変閾値音声検出器 | |
CN114205714A (zh) | 噪声整型式音量调整系统、方法 | |
US5594440A (en) | A/D converter having a variable integrator whose time constant can be changed | |
JPS61156297A (ja) | 可変閾値型音声検出器 | |
JPS61156298A (ja) | 時定数を変動させる可変閾値型音声検出器 | |
JP2680858B2 (ja) | レベル検出回路 | |
JPS639318A (ja) | ミユ−テイング方式 | |
JP3233517B2 (ja) | データ転送装置 | |
KR970002195B1 (ko) | 디지탈기기의 음소거장치 및 음소거 제어방법 | |
JPH0139146B2 (ja) | ||
JPS6051039A (ja) | 適応差分pcm装置 |