JPS6245730B2 - - Google Patents
Info
- Publication number
- JPS6245730B2 JPS6245730B2 JP57223893A JP22389382A JPS6245730B2 JP S6245730 B2 JPS6245730 B2 JP S6245730B2 JP 57223893 A JP57223893 A JP 57223893A JP 22389382 A JP22389382 A JP 22389382A JP S6245730 B2 JPS6245730 B2 JP S6245730B2
- Authority
- JP
- Japan
- Prior art keywords
- power
- signal
- voice
- circuit
- input signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000001514 detection method Methods 0.000 claims description 25
- 230000003595 spectral effect Effects 0.000 claims description 9
- 230000005236 sound signal Effects 0.000 claims description 6
- 230000002123 temporal effect Effects 0.000 claims description 5
- 230000005540 biological transmission Effects 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 8
- 206010019133 Hangover Diseases 0.000 description 4
- 238000000034 method Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/87—Detection of discrete points within a voice signal
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Transmitters (AREA)
- Radio Relay Systems (AREA)
- Time-Division Multiplex Systems (AREA)
Description
【発明の詳細な説明】
本発明は、入力信号から音声信号を検出する音
声検出器に関し、特に、音声信号の有無を検出す
る事によつて音声入力時のみ信号伝送を行い、高
能率な音声伝送を可能とする音声伝送装置に用い
られる音声検出器に関するものである。
声検出器に関し、特に、音声信号の有無を検出す
る事によつて音声入力時のみ信号伝送を行い、高
能率な音声伝送を可能とする音声伝送装置に用い
られる音声検出器に関するものである。
伝送路において音声を伝送する場合、高能率な
伝送手段として、入力音声の有無を検出し、無入
力時には音声伝送を停止して他のデータ等の伝送
を行う方法が考られている。実回線における通常
の会話では、片方向の回線利用率は40%程度と言
われており、音声検出機能を有する事は、伝送路
の利用率を上げるために非常に有効な手段であ
る。
伝送手段として、入力音声の有無を検出し、無入
力時には音声伝送を停止して他のデータ等の伝送
を行う方法が考られている。実回線における通常
の会話では、片方向の回線利用率は40%程度と言
われており、音声検出機能を有する事は、伝送路
の利用率を上げるために非常に有効な手段であ
る。
従来の音声伝送装置における音声検出器は、主
に入力信号の電力により音声検出を行つているた
め、話者の周囲に定常的な雑音源等が存在する場
合、常に有音として検出され回線の利用効率が悪
化し、また検出の閾値を上げると話頭切断が生じ
るという欠点があつた。また、雑音源のレベルに
追従して閾値を適応的に変化させる工夫もある程
度の効果を上げているが、雑音源のレベルが音声
のレベルと同等あるいは、それ以上の場合には、
話頭切断あるいは常時検出という欠点を避けるこ
とは不可能である。
に入力信号の電力により音声検出を行つているた
め、話者の周囲に定常的な雑音源等が存在する場
合、常に有音として検出され回線の利用効率が悪
化し、また検出の閾値を上げると話頭切断が生じ
るという欠点があつた。また、雑音源のレベルに
追従して閾値を適応的に変化させる工夫もある程
度の効果を上げているが、雑音源のレベルが音声
のレベルと同等あるいは、それ以上の場合には、
話頭切断あるいは常時検出という欠点を避けるこ
とは不可能である。
本発明の目的は、話頭切断が生じない、誤検出
の少ない音声検出器を提供することにある。
の少ない音声検出器を提供することにある。
本発明の別の目的は、前述のような信号対雑音
比が0デシベル以下の場合においても音声検出を
行うことが可能な音声検出器を提供することにあ
る。
比が0デシベル以下の場合においても音声検出を
行うことが可能な音声検出器を提供することにあ
る。
本発明によれば、入力信号から音声信号を検出
する音声検出器において、前記入力信号の電力を
検出する第1の電力検出回路と、該第1の電力検
出回路によつて検出された電力と予め定められた
第1の電力閾値とを比較する第1の比較器と、前
記入力信号のスペクトル情報の時間的な変化分に
ついての電力を検出する第2の電力検出回路と、
該第2の電力検出回路によつて検出された電力と
予め定められた第2の電力閾値とを比較する第2
の比較器と、前記第1及び第2の比較器の出力信
号を受けるオア回路とを有し、該オア回路の出力
端に音声検出信号が得られることを特徴とする音
声検出器が得られる。
する音声検出器において、前記入力信号の電力を
検出する第1の電力検出回路と、該第1の電力検
出回路によつて検出された電力と予め定められた
第1の電力閾値とを比較する第1の比較器と、前
記入力信号のスペクトル情報の時間的な変化分に
ついての電力を検出する第2の電力検出回路と、
該第2の電力検出回路によつて検出された電力と
予め定められた第2の電力閾値とを比較する第2
の比較器と、前記第1及び第2の比較器の出力信
号を受けるオア回路とを有し、該オア回路の出力
端に音声検出信号が得られることを特徴とする音
声検出器が得られる。
本発明の特徴は、入力信号の電力により音声検
出を行う回路に、上記入力信号より抽出されるス
ペクトル情報の時間的な変化分についての電力
(即ち、差分電力)により、有音/無音判別制御
を行う回路を付加した点にある。従来の音声検出
器が一次元の電力を使用しているのに対し、本発
明では多次元の情報を用いる。多次元の情報の変
化を検出する方法として固定の多次元閾値を設け
ることも考えられるが、元来、雑音のスペクトル
をあらかじめ知ることは不可能であるから、この
スペクトルの時間的な変化分を求め、その大きさ
を固定値と比較する方法が単純にして有効であ
る。
出を行う回路に、上記入力信号より抽出されるス
ペクトル情報の時間的な変化分についての電力
(即ち、差分電力)により、有音/無音判別制御
を行う回路を付加した点にある。従来の音声検出
器が一次元の電力を使用しているのに対し、本発
明では多次元の情報を用いる。多次元の情報の変
化を検出する方法として固定の多次元閾値を設け
ることも考えられるが、元来、雑音のスペクトル
をあらかじめ知ることは不可能であるから、この
スペクトルの時間的な変化分を求め、その大きさ
を固定値と比較する方法が単純にして有効であ
る。
本発明は、上述の如く、音声伝送装置における
音声検出機能を入力信号の電力およびスペクトル
情報の性質により行うものである。たとえば、話
者の周囲に電動機等のような定常的雑音源がある
場合や、電源ハムが直接入力側に混入している場
合、それらのスペクトル情報は時間的に定常的な
性質を示す事が知られている。一方、音声の話頭
等は信号の過渡部であり、一般的にスペクトル情
報は、非定常的な性質を持ち、特に摩擦子音等の
場合には顕著である。したがつて、このスペクト
ル情報の時間的な変化分についての電力(即ち、
差分電力)を利用すると、定常的な雑音中の話頭
の検出が可能となる。
音声検出機能を入力信号の電力およびスペクトル
情報の性質により行うものである。たとえば、話
者の周囲に電動機等のような定常的雑音源がある
場合や、電源ハムが直接入力側に混入している場
合、それらのスペクトル情報は時間的に定常的な
性質を示す事が知られている。一方、音声の話頭
等は信号の過渡部であり、一般的にスペクトル情
報は、非定常的な性質を持ち、特に摩擦子音等の
場合には顕著である。したがつて、このスペクト
ル情報の時間的な変化分についての電力(即ち、
差分電力)を利用すると、定常的な雑音中の話頭
の検出が可能となる。
次に図面を用いて本発明を詳細に説明する。
第1図を参照して、Aは定常的雑音が混入した
音声信号の電圧Vを示し、BはAで示される信号
の電力P0、CはAで示される信号のスペクトル情
報の差分ΔRの電力(ΔR)2である。また、第
1図において、Sは話頭の始まり時点を示す。
音声信号の電圧Vを示し、BはAで示される信号
の電力P0、CはAで示される信号のスペクトル情
報の差分ΔRの電力(ΔR)2である。また、第
1図において、Sは話頭の始まり時点を示す。
Aのような信号が入力された場合、Bで示され
るように信号の電力のみでは話頭の検出は非常に
困難である。しかしながら、Cで示されるスペク
トル情報の差分電力を用いると話頭が顕著に識別
されるため、Bの信号電力にCの差分電力および
適当なハングオーバ(hangover)時間を併用す
ることにより、話頭検出特性のよい音声検出器が
実現できる。
るように信号の電力のみでは話頭の検出は非常に
困難である。しかしながら、Cで示されるスペク
トル情報の差分電力を用いると話頭が顕著に識別
されるため、Bの信号電力にCの差分電力および
適当なハングオーバ(hangover)時間を併用す
ることにより、話頭検出特性のよい音声検出器が
実現できる。
第2図は本発明の一実施例を示すブロツク図で
ある。音声入力端子1より入力された信号は、第
1の電力検出回路2およびスペクトル情報抽出回
路3に入力される。前記スペクトル情報抽出回路
3の出力は、一方は直接、差分器4へまた他方は
遅延回路5を経由し、前記差分器4へ入力され
る。スペクトル情報の差分である前記差分器4の
出力は、二乗器6により電力に変換された後、予
め定められた差分電力閾値TH2と比較する比較器
7へ入力される。また前記電力検出回路2の出力
も予め定められた電力閾値TH1と比較する比較器
8へ入力され、この比較器8の出力は前記比較器
7の出力と共にオア回路9に入力される。前記オ
ア回路9の出力である有音/無音情報は、ハング
オーバ回路10を経由した後、音声検出出力端子
11より出力される。ハングオーバ回路10は有
音状態を一定時間保持する回路であつて、音声信
号中のポーズを除くためのものである。
ある。音声入力端子1より入力された信号は、第
1の電力検出回路2およびスペクトル情報抽出回
路3に入力される。前記スペクトル情報抽出回路
3の出力は、一方は直接、差分器4へまた他方は
遅延回路5を経由し、前記差分器4へ入力され
る。スペクトル情報の差分である前記差分器4の
出力は、二乗器6により電力に変換された後、予
め定められた差分電力閾値TH2と比較する比較器
7へ入力される。また前記電力検出回路2の出力
も予め定められた電力閾値TH1と比較する比較器
8へ入力され、この比較器8の出力は前記比較器
7の出力と共にオア回路9に入力される。前記オ
ア回路9の出力である有音/無音情報は、ハング
オーバ回路10を経由した後、音声検出出力端子
11より出力される。ハングオーバ回路10は有
音状態を一定時間保持する回路であつて、音声信
号中のポーズを除くためのものである。
なお、第2図のブロツク3,4,5及び6を含
む部分が、入力信号のスペクトル情報の時間的な
変化分についての電力を検出する第2の電力検出
回路を構成している。
む部分が、入力信号のスペクトル情報の時間的な
変化分についての電力を検出する第2の電力検出
回路を構成している。
以上説明したように、本発明によれば、従来の
入力信号の電力により有音/無音を検出する音声
検出器に、前記入力信号のスペクトル情報の時間
的な変化分についての電力(即ち差分電力)によ
る判定機能を付け加えることにより、話頭切断が
生じない、誤検出の少ない音声検出器を得ること
ができる。
入力信号の電力により有音/無音を検出する音声
検出器に、前記入力信号のスペクトル情報の時間
的な変化分についての電力(即ち差分電力)によ
る判定機能を付け加えることにより、話頭切断が
生じない、誤検出の少ない音声検出器を得ること
ができる。
第1図Aは、定常雑音中の音声信号を示し、第
1図Bは第1図Aで示される音声信号の電力を示
し、第1図Cは第1図Aで示される音声信号のス
ペクトル情報の差分電力を示す図である。第2図
は本発明の一実施例のブロツク図である。 1……音声入力端子、2……第1の電力検出回
路、3……スペクトル情報抽出回路、4……差分
器、5……遅延回路、6……二乗器、7……比較
器、8……比較器、9……オア回路、10……ハ
ングオーバ回路、11……音声検出出力端子。
1図Bは第1図Aで示される音声信号の電力を示
し、第1図Cは第1図Aで示される音声信号のス
ペクトル情報の差分電力を示す図である。第2図
は本発明の一実施例のブロツク図である。 1……音声入力端子、2……第1の電力検出回
路、3……スペクトル情報抽出回路、4……差分
器、5……遅延回路、6……二乗器、7……比較
器、8……比較器、9……オア回路、10……ハ
ングオーバ回路、11……音声検出出力端子。
Claims (1)
- 1 入力信号から音声信号を検出する音声検出器
において、前記入力信号の電力を検出する第1の
電力検出回路と、該第1の電力検出回路によつて
検出された電力と予め定められた第1の電力閾値
とを比較する第1の比較器と、前記入力信号のス
ペクトル情報の時間的な変化分についての電力を
検出する第2の電力検出回路と、該第2の電力検
出回路によつて検出された電力と予め定められた
第2の電力閾値とを比較する第2の比較器と、前
記第1及び第2の比較器の出力信号を受けるオア
回路とを有し、該オア回路の出力端に音声検出信
号が得られることを特徴とする音声検出器。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57223893A JPS59115625A (ja) | 1982-12-22 | 1982-12-22 | 音声検出器 |
CA000443914A CA1197014A (en) | 1982-12-22 | 1983-12-21 | Speech detector capable of avoiding an interruption by monitoring a variation of a spectrum of an input signal |
US06/564,651 US4688256A (en) | 1982-12-22 | 1983-12-22 | Speech detector capable of avoiding an interruption by monitoring a variation of a spectrum of an input signal |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57223893A JPS59115625A (ja) | 1982-12-22 | 1982-12-22 | 音声検出器 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS59115625A JPS59115625A (ja) | 1984-07-04 |
JPS6245730B2 true JPS6245730B2 (ja) | 1987-09-29 |
Family
ID=16805354
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57223893A Granted JPS59115625A (ja) | 1982-12-22 | 1982-12-22 | 音声検出器 |
Country Status (3)
Country | Link |
---|---|
US (1) | US4688256A (ja) |
JP (1) | JPS59115625A (ja) |
CA (1) | CA1197014A (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4920568A (en) * | 1985-07-16 | 1990-04-24 | Sharp Kabushiki Kaisha | Method of distinguishing voice from noise |
DE3739681A1 (de) * | 1987-11-24 | 1989-06-08 | Philips Patentverwaltung | Verfahren zum bestimmen von anfangs- und endpunkt isoliert gesprochener woerter in einem sprachsignal und anordnung zur durchfuehrung des verfahrens |
EP0548054B1 (en) * | 1988-03-11 | 2002-12-11 | BRITISH TELECOMMUNICATIONS public limited company | Voice activity detector |
JPH01307800A (ja) * | 1988-06-06 | 1989-12-12 | Nippon Telegr & Teleph Corp <Ntt> | 音声検出方法 |
US4965854A (en) * | 1988-11-30 | 1990-10-23 | General Electric Company | Noise blanker with continuous wave interference compensation |
JP2573352B2 (ja) * | 1989-04-10 | 1997-01-22 | 富士通株式会社 | 音声検出装置 |
US4979214A (en) * | 1989-05-15 | 1990-12-18 | Dialogic Corporation | Method and apparatus for identifying speech in telephone signals |
US5097510A (en) * | 1989-11-07 | 1992-03-17 | Gs Systems, Inc. | Artificial intelligence pattern-recognition-based noise reduction system for speech processing |
IN184794B (ja) * | 1993-09-14 | 2000-09-30 | British Telecomm | |
US5819217A (en) * | 1995-12-21 | 1998-10-06 | Nynex Science & Technology, Inc. | Method and system for differentiating between speech and noise |
US5765130A (en) * | 1996-05-21 | 1998-06-09 | Applied Language Technologies, Inc. | Method and apparatus for facilitating speech barge-in in connection with voice recognition systems |
US5864793A (en) * | 1996-08-06 | 1999-01-26 | Cirrus Logic, Inc. | Persistence and dynamic threshold based intermittent signal detector |
DE69922059D1 (de) * | 1998-03-13 | 2004-12-23 | Frank Uldall Leonhard | Signalverarbeitungsverfahren zur Analyse von Sprachsignal-Transienten |
AU1049601A (en) * | 1999-10-25 | 2001-05-08 | Lernout And Hauspie Speech Products N.V. | Small vocabulary speaker dependent speech recognition |
EP2107553B1 (en) * | 2008-03-31 | 2011-05-18 | Harman Becker Automotive Systems GmbH | Method for determining barge-in |
EP2148325B1 (en) * | 2008-07-22 | 2014-10-01 | Nuance Communications, Inc. | Method for determining the presence of a wanted signal component |
EP2850611B1 (en) | 2012-06-10 | 2019-08-21 | Nuance Communications, Inc. | Noise dependent signal processing for in-car communication systems with multiple acoustic zones |
CN104704560B (zh) | 2012-09-04 | 2018-06-05 | 纽昂斯通讯公司 | 共振峰依赖的语音信号增强 |
US9613633B2 (en) | 2012-10-30 | 2017-04-04 | Nuance Communications, Inc. | Speech enhancement |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2380612A1 (fr) * | 1977-02-09 | 1978-09-08 | Thomson Csf | Dispositif de discrimination des signaux de parole et systeme d'alternat comportant un tel dispositif |
JPS56104399A (en) * | 1980-01-23 | 1981-08-20 | Hitachi Ltd | Voice interval detection system |
-
1982
- 1982-12-22 JP JP57223893A patent/JPS59115625A/ja active Granted
-
1983
- 1983-12-21 CA CA000443914A patent/CA1197014A/en not_active Expired
- 1983-12-22 US US06/564,651 patent/US4688256A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPS59115625A (ja) | 1984-07-04 |
CA1197014A (en) | 1985-11-19 |
US4688256A (en) | 1987-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS6245730B2 (ja) | ||
US6266398B1 (en) | Method and apparatus for facilitating speech barge-in in connection with voice recognition systems | |
BR8907308A (pt) | Aparelho detector da atividade vocal,processo para a deteccao da atividade vocal,aparelho para a codificacao de sinais da fala e aparelho telefonico movel | |
JPS5852695A (ja) | 車両用音声検出装置 | |
KR950702732A (ko) | 정상신호와 비정상신호 판별방법 및 장치(Discriminating between stationary and non-stationary signals) | |
US3377428A (en) | Voiced sound detector circuits and systems | |
US5347611A (en) | Apparatus and method for transparent tone passing over narrowband digital channels | |
JP3413862B2 (ja) | 音声区間検出方法 | |
EP0160788B1 (en) | Apparatus and method for controlling a digital speech filing and retrieval system during playback mode | |
JP2564821B2 (ja) | 音声判定検出装置 | |
JP2992324B2 (ja) | 音声区間検出方法 | |
JP3355473B2 (ja) | 音声検出方法 | |
JPS5912185B2 (ja) | 有声無声判定装置 | |
JPH03114100A (ja) | 音声区間検出装置 | |
JP3033537B2 (ja) | 音声検出器 | |
KR100345402B1 (ko) | 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법 | |
JPS63118197A (ja) | 音声検出装置 | |
JPH0637734A (ja) | 音声伝送方式 | |
JPH06175676A (ja) | 音声検出器 | |
JPH0424693A (ja) | 音声区間検出方式 | |
JPH0240700A (ja) | 音声検出装置 | |
JPS63236099A (ja) | 音声信号検出方法 | |
JP2602641B2 (ja) | 音声符号化方式 | |
JPS62238599A (ja) | 音声区間検出方法 | |
JPH0573034B2 (ja) |