JPS6245730B2 - - Google Patents

Info

Publication number
JPS6245730B2
JPS6245730B2 JP57223893A JP22389382A JPS6245730B2 JP S6245730 B2 JPS6245730 B2 JP S6245730B2 JP 57223893 A JP57223893 A JP 57223893A JP 22389382 A JP22389382 A JP 22389382A JP S6245730 B2 JPS6245730 B2 JP S6245730B2
Authority
JP
Japan
Prior art keywords
power
signal
voice
circuit
input signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP57223893A
Other languages
English (en)
Other versions
JPS59115625A (ja
Inventor
Satoshi Yasunaga
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP57223893A priority Critical patent/JPS59115625A/ja
Priority to CA000443914A priority patent/CA1197014A/en
Priority to US06/564,651 priority patent/US4688256A/en
Publication of JPS59115625A publication Critical patent/JPS59115625A/ja
Publication of JPS6245730B2 publication Critical patent/JPS6245730B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/87Detection of discrete points within a voice signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Transmitters (AREA)
  • Radio Relay Systems (AREA)
  • Time-Division Multiplex Systems (AREA)

Description

【発明の詳細な説明】 本発明は、入力信号から音声信号を検出する音
声検出器に関し、特に、音声信号の有無を検出す
る事によつて音声入力時のみ信号伝送を行い、高
能率な音声伝送を可能とする音声伝送装置に用い
られる音声検出器に関するものである。
伝送路において音声を伝送する場合、高能率な
伝送手段として、入力音声の有無を検出し、無入
力時には音声伝送を停止して他のデータ等の伝送
を行う方法が考られている。実回線における通常
の会話では、片方向の回線利用率は40%程度と言
われており、音声検出機能を有する事は、伝送路
の利用率を上げるために非常に有効な手段であ
る。
従来の音声伝送装置における音声検出器は、主
に入力信号の電力により音声検出を行つているた
め、話者の周囲に定常的な雑音源等が存在する場
合、常に有音として検出され回線の利用効率が悪
化し、また検出の閾値を上げると話頭切断が生じ
るという欠点があつた。また、雑音源のレベルに
追従して閾値を適応的に変化させる工夫もある程
度の効果を上げているが、雑音源のレベルが音声
のレベルと同等あるいは、それ以上の場合には、
話頭切断あるいは常時検出という欠点を避けるこ
とは不可能である。
本発明の目的は、話頭切断が生じない、誤検出
の少ない音声検出器を提供することにある。
本発明の別の目的は、前述のような信号対雑音
比が0デシベル以下の場合においても音声検出を
行うことが可能な音声検出器を提供することにあ
る。
本発明によれば、入力信号から音声信号を検出
する音声検出器において、前記入力信号の電力を
検出する第1の電力検出回路と、該第1の電力検
出回路によつて検出された電力と予め定められた
第1の電力閾値とを比較する第1の比較器と、前
記入力信号のスペクトル情報の時間的な変化分に
ついての電力を検出する第2の電力検出回路と、
該第2の電力検出回路によつて検出された電力と
予め定められた第2の電力閾値とを比較する第2
の比較器と、前記第1及び第2の比較器の出力信
号を受けるオア回路とを有し、該オア回路の出力
端に音声検出信号が得られることを特徴とする音
声検出器が得られる。
本発明の特徴は、入力信号の電力により音声検
出を行う回路に、上記入力信号より抽出されるス
ペクトル情報の時間的な変化分についての電力
(即ち、差分電力)により、有音/無音判別制御
を行う回路を付加した点にある。従来の音声検出
器が一次元の電力を使用しているのに対し、本発
明では多次元の情報を用いる。多次元の情報の変
化を検出する方法として固定の多次元閾値を設け
ることも考えられるが、元来、雑音のスペクトル
をあらかじめ知ることは不可能であるから、この
スペクトルの時間的な変化分を求め、その大きさ
を固定値と比較する方法が単純にして有効であ
る。
本発明は、上述の如く、音声伝送装置における
音声検出機能を入力信号の電力およびスペクトル
情報の性質により行うものである。たとえば、話
者の周囲に電動機等のような定常的雑音源がある
場合や、電源ハムが直接入力側に混入している場
合、それらのスペクトル情報は時間的に定常的な
性質を示す事が知られている。一方、音声の話頭
等は信号の過渡部であり、一般的にスペクトル情
報は、非定常的な性質を持ち、特に摩擦子音等の
場合には顕著である。したがつて、このスペクト
ル情報の時間的な変化分についての電力(即ち、
差分電力)を利用すると、定常的な雑音中の話頭
の検出が可能となる。
次に図面を用いて本発明を詳細に説明する。
第1図を参照して、Aは定常的雑音が混入した
音声信号の電圧Vを示し、BはAで示される信号
の電力P0、CはAで示される信号のスペクトル情
報の差分ΔRの電力(ΔR)である。また、第
1図において、Sは話頭の始まり時点を示す。
Aのような信号が入力された場合、Bで示され
るように信号の電力のみでは話頭の検出は非常に
困難である。しかしながら、Cで示されるスペク
トル情報の差分電力を用いると話頭が顕著に識別
されるため、Bの信号電力にCの差分電力および
適当なハングオーバ(hangover)時間を併用す
ることにより、話頭検出特性のよい音声検出器が
実現できる。
第2図は本発明の一実施例を示すブロツク図で
ある。音声入力端子1より入力された信号は、第
1の電力検出回路2およびスペクトル情報抽出回
路3に入力される。前記スペクトル情報抽出回路
3の出力は、一方は直接、差分器4へまた他方は
遅延回路5を経由し、前記差分器4へ入力され
る。スペクトル情報の差分である前記差分器4の
出力は、二乗器6により電力に変換された後、予
め定められた差分電力閾値TH2と比較する比較器
7へ入力される。また前記電力検出回路2の出力
も予め定められた電力閾値TH1と比較する比較器
8へ入力され、この比較器8の出力は前記比較器
7の出力と共にオア回路9に入力される。前記オ
ア回路9の出力である有音/無音情報は、ハング
オーバ回路10を経由した後、音声検出出力端子
11より出力される。ハングオーバ回路10は有
音状態を一定時間保持する回路であつて、音声信
号中のポーズを除くためのものである。
なお、第2図のブロツク3,4,5及び6を含
む部分が、入力信号のスペクトル情報の時間的な
変化分についての電力を検出する第2の電力検出
回路を構成している。
以上説明したように、本発明によれば、従来の
入力信号の電力により有音/無音を検出する音声
検出器に、前記入力信号のスペクトル情報の時間
的な変化分についての電力(即ち差分電力)によ
る判定機能を付け加えることにより、話頭切断が
生じない、誤検出の少ない音声検出器を得ること
ができる。
【図面の簡単な説明】
第1図Aは、定常雑音中の音声信号を示し、第
1図Bは第1図Aで示される音声信号の電力を示
し、第1図Cは第1図Aで示される音声信号のス
ペクトル情報の差分電力を示す図である。第2図
は本発明の一実施例のブロツク図である。 1……音声入力端子、2……第1の電力検出回
路、3……スペクトル情報抽出回路、4……差分
器、5……遅延回路、6……二乗器、7……比較
器、8……比較器、9……オア回路、10……ハ
ングオーバ回路、11……音声検出出力端子。

Claims (1)

    【特許請求の範囲】
  1. 1 入力信号から音声信号を検出する音声検出器
    において、前記入力信号の電力を検出する第1の
    電力検出回路と、該第1の電力検出回路によつて
    検出された電力と予め定められた第1の電力閾値
    とを比較する第1の比較器と、前記入力信号のス
    ペクトル情報の時間的な変化分についての電力を
    検出する第2の電力検出回路と、該第2の電力検
    出回路によつて検出された電力と予め定められた
    第2の電力閾値とを比較する第2の比較器と、前
    記第1及び第2の比較器の出力信号を受けるオア
    回路とを有し、該オア回路の出力端に音声検出信
    号が得られることを特徴とする音声検出器。
JP57223893A 1982-12-22 1982-12-22 音声検出器 Granted JPS59115625A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP57223893A JPS59115625A (ja) 1982-12-22 1982-12-22 音声検出器
CA000443914A CA1197014A (en) 1982-12-22 1983-12-21 Speech detector capable of avoiding an interruption by monitoring a variation of a spectrum of an input signal
US06/564,651 US4688256A (en) 1982-12-22 1983-12-22 Speech detector capable of avoiding an interruption by monitoring a variation of a spectrum of an input signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57223893A JPS59115625A (ja) 1982-12-22 1982-12-22 音声検出器

Publications (2)

Publication Number Publication Date
JPS59115625A JPS59115625A (ja) 1984-07-04
JPS6245730B2 true JPS6245730B2 (ja) 1987-09-29

Family

ID=16805354

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57223893A Granted JPS59115625A (ja) 1982-12-22 1982-12-22 音声検出器

Country Status (3)

Country Link
US (1) US4688256A (ja)
JP (1) JPS59115625A (ja)
CA (1) CA1197014A (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4920568A (en) * 1985-07-16 1990-04-24 Sharp Kabushiki Kaisha Method of distinguishing voice from noise
DE3739681A1 (de) * 1987-11-24 1989-06-08 Philips Patentverwaltung Verfahren zum bestimmen von anfangs- und endpunkt isoliert gesprochener woerter in einem sprachsignal und anordnung zur durchfuehrung des verfahrens
EP0548054B1 (en) * 1988-03-11 2002-12-11 BRITISH TELECOMMUNICATIONS public limited company Voice activity detector
JPH01307800A (ja) * 1988-06-06 1989-12-12 Nippon Telegr & Teleph Corp <Ntt> 音声検出方法
US4965854A (en) * 1988-11-30 1990-10-23 General Electric Company Noise blanker with continuous wave interference compensation
JP2573352B2 (ja) * 1989-04-10 1997-01-22 富士通株式会社 音声検出装置
US4979214A (en) * 1989-05-15 1990-12-18 Dialogic Corporation Method and apparatus for identifying speech in telephone signals
US5097510A (en) * 1989-11-07 1992-03-17 Gs Systems, Inc. Artificial intelligence pattern-recognition-based noise reduction system for speech processing
IN184794B (ja) * 1993-09-14 2000-09-30 British Telecomm
US5819217A (en) * 1995-12-21 1998-10-06 Nynex Science & Technology, Inc. Method and system for differentiating between speech and noise
US5765130A (en) * 1996-05-21 1998-06-09 Applied Language Technologies, Inc. Method and apparatus for facilitating speech barge-in in connection with voice recognition systems
US5864793A (en) * 1996-08-06 1999-01-26 Cirrus Logic, Inc. Persistence and dynamic threshold based intermittent signal detector
DE69922059D1 (de) * 1998-03-13 2004-12-23 Frank Uldall Leonhard Signalverarbeitungsverfahren zur Analyse von Sprachsignal-Transienten
AU1049601A (en) * 1999-10-25 2001-05-08 Lernout And Hauspie Speech Products N.V. Small vocabulary speaker dependent speech recognition
EP2107553B1 (en) * 2008-03-31 2011-05-18 Harman Becker Automotive Systems GmbH Method for determining barge-in
EP2148325B1 (en) * 2008-07-22 2014-10-01 Nuance Communications, Inc. Method for determining the presence of a wanted signal component
EP2850611B1 (en) 2012-06-10 2019-08-21 Nuance Communications, Inc. Noise dependent signal processing for in-car communication systems with multiple acoustic zones
CN104704560B (zh) 2012-09-04 2018-06-05 纽昂斯通讯公司 共振峰依赖的语音信号增强
US9613633B2 (en) 2012-10-30 2017-04-04 Nuance Communications, Inc. Speech enhancement

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2380612A1 (fr) * 1977-02-09 1978-09-08 Thomson Csf Dispositif de discrimination des signaux de parole et systeme d'alternat comportant un tel dispositif
JPS56104399A (en) * 1980-01-23 1981-08-20 Hitachi Ltd Voice interval detection system

Also Published As

Publication number Publication date
JPS59115625A (ja) 1984-07-04
CA1197014A (en) 1985-11-19
US4688256A (en) 1987-08-18

Similar Documents

Publication Publication Date Title
JPS6245730B2 (ja)
US6266398B1 (en) Method and apparatus for facilitating speech barge-in in connection with voice recognition systems
BR8907308A (pt) Aparelho detector da atividade vocal,processo para a deteccao da atividade vocal,aparelho para a codificacao de sinais da fala e aparelho telefonico movel
JPS5852695A (ja) 車両用音声検出装置
KR950702732A (ko) 정상신호와 비정상신호 판별방법 및 장치(Discriminating between stationary and non-stationary signals)
US3377428A (en) Voiced sound detector circuits and systems
US5347611A (en) Apparatus and method for transparent tone passing over narrowband digital channels
JP3413862B2 (ja) 音声区間検出方法
EP0160788B1 (en) Apparatus and method for controlling a digital speech filing and retrieval system during playback mode
JP2564821B2 (ja) 音声判定検出装置
JP2992324B2 (ja) 音声区間検出方法
JP3355473B2 (ja) 音声検出方法
JPS5912185B2 (ja) 有声無声判定装置
JPH03114100A (ja) 音声区間検出装置
JP3033537B2 (ja) 音声検出器
KR100345402B1 (ko) 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법
JPS63118197A (ja) 音声検出装置
JPH0637734A (ja) 音声伝送方式
JPH06175676A (ja) 音声検出器
JPH0424693A (ja) 音声区間検出方式
JPH0240700A (ja) 音声検出装置
JPS63236099A (ja) 音声信号検出方法
JP2602641B2 (ja) 音声符号化方式
JPS62238599A (ja) 音声区間検出方法
JPH0573034B2 (ja)