JP3033537B2 - 音声検出器 - Google Patents

音声検出器

Info

Publication number
JP3033537B2
JP3033537B2 JP9223573A JP22357397A JP3033537B2 JP 3033537 B2 JP3033537 B2 JP 3033537B2 JP 9223573 A JP9223573 A JP 9223573A JP 22357397 A JP22357397 A JP 22357397A JP 3033537 B2 JP3033537 B2 JP 3033537B2
Authority
JP
Japan
Prior art keywords
value
power
average power
circuit
detection means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP9223573A
Other languages
English (en)
Other versions
JPH1168586A (ja
Inventor
晃 日置
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP9223573A priority Critical patent/JP3033537B2/ja
Publication of JPH1168586A publication Critical patent/JPH1168586A/ja
Application granted granted Critical
Publication of JP3033537B2 publication Critical patent/JP3033537B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Transmitters (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号中の有音
区間と無音区間とを識別する音声検出器に関する。
【0002】
【従来の技術】従来より音声検出器は、入力される信号
の電力及びスペクトル情報を用いて音声検出を行うもの
である。ここで、話者の周囲に背景雑音がある場合、入
力される信号のスペクトル情報は時間的に定常的なもの
となり、また、音声の話頭等は入力される信号の過渡部
となるため、一般的に、スペクトル情報の時間的な変化
分についての電力(即ち、差分電力)を利用すると、定
常的な雑音中の話頭を検出することができる。これらの
ことを用いて、従来の音声検出器においては、スペクト
ル情報に基づいた音声の有無の検出結果と電力に基づい
た音声の有無の検出結果とから音声の有無の判断が行わ
れていた。
【0003】図2は、従来の音声検出器の一構成例を示
す回路ブロック図であり、特開昭59−115625号
公報に開示されている音声検出器の構成を示している。
【0004】本従来例は図2に示すように、音声信号が
入力される音声入力端子1と、音声入力端子1を介して
入力された音声信号の瞬時における電力値を検出する瞬
時電力検出回路2と、音声入力端子1を介して入力され
た音声信号のスペクトル情報を抽出するスペクトル情報
抽出回路3と、瞬時電力検出回路2にて検出された電力
と予め設定されている電力しきい値TH1とを比較し、
比較結果を出力する比較器8と、スペクトル情報抽出回
路3にて抽出されたスペクトル情報を所定の時間だけ遅
延させて出力する遅延回路5と、スペクトル情報抽出回
路3にて抽出されたスペクトル情報と遅延回路5にて遅
延させられたスペクトル情報とが入力され、スペクトル
情報の時間的な差分を求めて出力する差分器4と、差分
器4から出力されたスペクトル情報の差分を二乗するこ
とにより電力に変換し、出力する二乗器6と、二乗器6
から出力された電力と予め設定されている差分電力しき
い値TH2とを比較し、比較結果を出力する比較器7
と、比較器8から出力された比較結果と比較器7から出
力された比較結果との論理和をとり、有音/無音情報と
して出力するOR回路9と、OR回路9から出力された
有音/無音情報を外部に出力する音声検出出力端子10
とから構成されている。
【0005】以下に、上記のように構成された音声検出
器における音声検出動作について説明する。
【0006】音声入力端子1を介して外部から音声信号
が入力されると、瞬時電力検出回路2において音声入力
端子1を介して入力された音声信号の瞬時における電力
が検出されるとともに、スペクトル情報抽出回路3にお
いて音声入力端子1を介して入力された音声信号のスペ
クトル情報が抽出される。
【0007】瞬時電力検出回路2にて検出された電力は
比較器8に入力され、比較器8において瞬時電力検出回
路2にて検出された電力と予め設定されている電力しき
い値TH1とが比較され、比較結果が出力される。
【0008】一方、スペクトル情報抽出回路3にて抽出
されたスペクトル情報は遅延回路5及び差分器4に入力
され、遅延回路5において所定の時間だけ遅延されて出
力される。
【0009】次に、差分器4において、スペクトル情報
抽出回路3にて抽出されたスペクトル情報と遅延回路5
にて遅延させられたスペクトル情報とから、スペクトル
情報の時間的な差分が求められて出力される。
【0010】差分器4から出力された差分は二乗器6に
入力され、二乗器6において差分器4から出力されたス
ペクトル情報の差分が二乗されることにより電力に変換
され、出力される。
【0011】二乗器6から出力された電力は比較器7に
入力され、比較器7において二乗器6から出力された電
力と予め設定されている電力しきい値TH2とが比較さ
れ、比較結果が出力される。
【0012】比較器7,8における比較結果はOR回路
9に入力され、OR回路9において、比較器8における
比較結果と比較器7における比較結果との論理和がとら
れ、有音/無音情報として出力される。
【0013】その後、OR回路9から出力された有音/
無音情報は、音声検出出力端子10を介して外部に出力
される。
【0014】
【発明が解決しようとする課題】上述したような従来の
音声検出器においては、音声の有無の判別に用いられる
差分電力が、連続する2サンプルの信号の電力差から求
められているが、2サンプル間という短時間での差分電
力値を用いた場合、雑音と同レベルの電力値となる子音
においては、その電力差分値が雑音の電力差分値にほぼ
等しい値となるため、差分電力のしきい値を用いて雑音
と音声とを正確に区別することは難しくなってしまう。
【0015】そのため、子音においては、有音であるの
にもかかわらず無音と判別され、話頭切断が生じてしま
うという問題点がある。
【0016】本発明は、上述したような従来の技術が有
する問題点に鑑みてなされたものであって、子音をより
正確に検出することにより、話頭切断を生じさせず、音
声検出の誤りを少なくすることができる音声検出器を提
供することを目的とする。
【0017】
【課題を解決するための手段】上記目的を達成するため
に本発明は、外部から入力される入力信号の電力値を用
いて音声信号を検出する音声検出器であって、前記入力
信号の瞬時における電力値を検出する瞬時電力検出手段
と、該瞬時電力検出手段にて検出された電力の平均電力
値を求める平均電力検出手段と、該平均電力検出手段に
て求められた平均電力値と予め設定されているしきい値
とを比較し、比較結果を出力する第1の比較手段と、前
記平均電力検出手段にて求められた平均電力値に基づい
て前記入力信号の最大値及び最小値を検出する最大値最
小値検出手段と、該最大値最小値検出手段における検出
結果に基づいて前記入力信号の電力変動値を検出する電
力変動値検出手段と、該電力変動値検出手段にて検出さ
れた電力変動値と予め設定されているしきい値とを比較
し、比較結果を出力する第2の比較手段と、前記第1及
び第2の比較手段における比較結果に基づいて、音声信
号の有無を判断する有音/無音判断手段とを有すること
を特徴とする。
【0018】また、前記有音/無音判断手段は、前記平
均電力検出手段にて求められた平均電力値が予め設定さ
れているしきい値よりも小さく、かつ、前記電力変動値
検出手段にて検出された電力変動値が予め設定されてい
るしきい値よりも小さい場合のみ、無音であると判断す
ることを特徴とする。
【0019】また、前記平均電力検出手段にて求められ
た平均電力値を、それぞれ所定の時間だけ遅延させて出
力する遅延回路を複数有し、前記最大値最小値検出手段
は、前記平均電力検出手段にて求められた平均電力値と
前記複数の遅延回路を介して出力された平均電力値とに
基づいて前記入力信号の最大値及び最小値を検出するこ
とを特徴とする。
【0020】(作用)上記のように構成された本発明に
おいては、平均電力検出手段において瞬時電力検出手段
にて検出された電力の平均電力値が求められ、最大値最
小値検出手段において平均電力検出手段にて求められた
平均電力値に基づいて入力信号の最大値及び最小値が検
出され、電力変動値検出手段において最大値最小値検出
手段における検出結果に基づいて入力信号の電力変動値
が検出され、有音/無音判断手段において平均電力検出
手段にて求められた平均電力値と電力変動値検出手段に
て検出された電力変動値とに基づいて、音声信号の有無
が判断される。
【0021】このように、入力信号の電力値の検出結果
に入力信号の電力変動値の検出結果が加味されて音声の
有無が判断されているので、背景雑音の電力とほぼ等価
となる子音においても有音と判断され、話頭切断が防止
される。
【0022】
【発明の実施の形態】以下に、本発明の実施の形態につ
いて図面を参照して説明する。
【0023】図1は、本発明の音声検出器の実施の一形
態を示す回路ブロック図である。なお、本形態において
は、入力信号の平均電力の算出には4サンプル分の電力
値、電力変動値の算出に必要な最大値及び最小値の検出
には4フレーム分の平均電力値が用いられている。ここ
で定義しているフレームは、4サンプル分を1つにまと
めた単位である。
【0024】本形態は図1に示すように、音声信号が入
力される音声入力端子1と、音声入力端子1を介して入
力された音声信号の瞬時における電力値を検出する瞬時
電力検出回路2と、瞬時電力検出回路2にて検出された
電力を所定の時間だけ遅延させて出力する遅延回路10
1と、瞬時電力検出回路2にて検出された電力と遅延回
路101から出力された電力とを加算する加算回路10
4と、遅延回路101から出力された電力を所定の時間
だけ遅延させて出力する遅延回路102と、遅延回路1
02から出力された電力を所定の時間だけ遅延させて出
力する遅延回路103と、遅延回路102から出力され
た電力と遅延回路103から出力された電力とを加算す
る加算回路106と、加算回路104における加算結果
と加算回路106における加算結果とを加算する加算回
路105と、加算回路105における加算結果を1/4
に除算することにより音声信号の平均電力値を求める平
均電力検出手段である除算回路107と、除算回路10
7における除算結果と予め設定されている電力しきい値
TH1とを比較し、比較結果を出力する第1の比較手段
である比較器8と、除算回路107における除算結果を
所定の時間だけ遅延させて出力する遅延回路108と、
遅延回路108からの出力を所定の時間だけ遅延させて
出力する遅延回路109と、遅延回路109からの出力
を所定の時間だけ遅延させて出力する遅延回路110
と、除算回路107における除算結果と遅延回路108
〜110の出力とに基づいて入力信号の最大値及び最小
値を検出する最大値最小値検出回路111と、最大値最
小値検出回路111における検出結果に基づいて入力信
号の電力変動値を検出する電力変動値検出回路112
と、電力変動値検出回路112にて検出された入力信号
の電力変動値と予め設定されている電力変動用しきい値
TH2とを比較し、比較結果を出力する第2の比較手段
である比較器7と、比較器8から出力された比較結果と
比較器7から出力された比較結果との論理和をとり、有
音/無音情報として出力する有音/無音判断手段である
OR回路9と、OR回路9から出力された有音/無音情
報を外部に出力する音声検出出力端子10とから構成さ
れている。
【0025】以下に、上記のように構成された音声検出
器における音声検出動作について説明する。
【0026】音声入力端子1を介して外部から音声信号
が入力されると、瞬時電力検出回路2において音声入力
端子1を介して入力された音声信号の瞬時における電力
が検出される。
【0027】瞬時電力検出回路2にて検出された電力は
遅延回路101及び加算回路104に入力され、遅延回
路101において所定の時間だけ遅延されて出力され
る。
【0028】遅延回路101から出力された電力は、遅
延回路102及び加算回路104に入力され、遅延回路
102において所定の時間だけ遅延されて出力されると
ともに、加算回路104において瞬時電力検出回路10
1にて検出された電力と遅延回路101から出力された
電力とが加算される。
【0029】遅延回路102から出力された電力は、遅
延回路103及び加算回路106に入力され、遅延回路
103において所定の時間だけ遅延されて出力される。
【0030】すると、加算回路106において、遅延回
路102から出力された電力と遅延回路103から出力
された電力とが加算される。
【0031】次に、加算回路105において、加算回路
104における加算結果と加算回路106における加算
結果とが加算され、それにより4サンプル分の瞬時電力
の加算値が求められる。
【0032】次に、除算回路107において、加算回路
105にて求められた加算値が1/4に除算され、それ
により、4サンプル分の平均電力値が求められる。
【0033】除算回路107にて求められた平均電力値
は比較器8、遅延回路108及び最大値最小値検出回路
111に入力され、比較器8において除算回路107に
て求められた平均電力値と予め設定されている電力しき
い値TH1とが比較されるとともに、遅延回路108に
おいて除算回路107にて求められた平均電力値が所定
の時間だけ遅延されて出力される。
【0034】遅延回路108から出力された平均電力値
は、遅延回路109及び最大値最小値検出回路111に
入力され、遅延回路109において所定の時間だけ遅延
されて出力される。
【0035】遅延回路109から出力された平均電力値
は、遅延回路110及び最大値最小値検出回路111に
入力され、遅延回路110において所定の時間だけ遅延
されて出力される。
【0036】最大値最小値検出回路111においては、
除算回路107における除算結果と遅延回路108〜1
10の出力とに基づいて入力信号の最大値及び最小値が
検出される。
【0037】最大値最小値検出回路111にて検出され
入力信号の最大値及び最小値は電力変動値検出回路11
2に入力され、電力変動値検出回路112において、入
力された入力信号の最大値及び最小値に基づいて入力信
号の電力変動値が検出される。
【0038】電力変動値検出回路112にて検出された
入力信号の電力変動値は比較器7に入力され、比較器7
において、電力変動値検出回路112にて検出された電
力変動値と予め設定されている電力変動用しきい値TH
2とが比較され、比較結果が出力される。
【0039】比較器7,8における比較結果はOR回路
9に入力され、OR回路9において、比較器8における
比較結果と比較器7における比較結果との論理和がとら
れ、有音/無音情報として出力される。
【0040】その後、OR回路9から出力された有音/
無音情報は、音声検出出力端子10を介して外部に出力
される。
【0041】ここで、比較器7,8及びOR回路9の出
力について下記表を用いて具体的に説明する。
【0042】
【表1】 比較器8の出力は、除算回路107にて求められた平均
電力値が電力しきい値TH1よりも大きな場合を1、小
さな場合を0とし、また、比較器7の出力は、電力変動
値検出回路112にて検出された入力信号の電力変動値
が電力変動用しきい値TH2よりも大きな場合を1、小
さな場合を0とする。
【0043】そして、比較器7,8の出力がOR回路9
に入力され、OR回路9において両者の論理和がとら
れ、論理和が1となる場合に有音、0となる場合に無音
と判断される。
【0044】
【発明の効果】以上説明したように本発明においては、
入力信号の電力値の検出結果に入力信号の電力変動値の
検出結果が加味されて音声の有無が判断される構成とし
たため、背景雑音の電力とほぼ等価となる子音において
も有音と判断され、話頭切断を防止することができる。
【図面の簡単な説明】
【図1】本発明の音声検出器の実施の一形態を示す回路
ブロック図である。
【図2】従来の音声検出器の一構成例を示す回路ブロッ
ク図である。
【符号の説明】
1 音声入力端子 2 瞬時電力検出回路 3 スペクトル情報抽出回路 7,8 比較器 9 OR回路 10 音声検出出力端子 101,102,103,108,109,110
遅延回路 104,105,106 加算回路 107 除算回路 111 最大値最小値検出回路 112 電力変動値検出回路
フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 11/02 G10L 15/04 H04B 1/04 G10L 101:065 INSPEC(DIALOG) JICSTファイル(JOIS) WPI(DIALOG)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 外部から入力される入力信号の電力値を
    用いて音声信号を検出する音声検出器であって、 前記入力信号の瞬時における電力値を検出する瞬時電力
    検出手段と、 該瞬時電力検出手段にて検出された電力の平均電力値を
    求める平均電力検出手段と、 該平均電力検出手段にて求められた平均電力値と予め設
    定されているしきい値とを比較し、比較結果を出力する
    第1の比較手段と、 前記平均電力検出手段にて求められた平均電力値に基づ
    いて前記入力信号の最大値及び最小値を検出する最大値
    最小値検出手段と、 該最大値最小値検出手段における検出結果に基づいて前
    記入力信号の電力変動値を検出する電力変動値検出手段
    と、 該電力変動値検出手段にて検出された電力変動値と予め
    設定されているしきい値とを比較し、比較結果を出力す
    る第2の比較手段と、 前記第1及び第2の比較手段における比較結果に基づい
    て、音声信号の有無を判断する有音/無音判断手段とを
    有することを特徴とする音声検出器。
  2. 【請求項2】 請求項1に記載の音声検出器において、 前記有音/無音判断手段は、前記平均電力検出手段にて
    求められた平均電力値が予め設定されているしきい値よ
    りも小さく、かつ、前記電力変動値検出手段にて検出さ
    れた電力変動値が予め設定されているしきい値よりも小
    さい場合のみ、無音であると判断することを特徴とする
    音声検出器。
  3. 【請求項3】 請求項1または請求項2に記載の音声検
    出器において、 前記平均電力検出手段にて求められた平均電力値を、そ
    れぞれ所定の時間だけ遅延させて出力する遅延回路を複
    数有し、 前記最大値最小値検出手段は、前記平均電力検出手段に
    て求められた平均電力値と前記複数の遅延回路を介して
    出力された平均電力値とに基づいて前記入力信号の最大
    値及び最小値を検出することを特徴とする音声検出器。
JP9223573A 1997-08-20 1997-08-20 音声検出器 Expired - Fee Related JP3033537B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9223573A JP3033537B2 (ja) 1997-08-20 1997-08-20 音声検出器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9223573A JP3033537B2 (ja) 1997-08-20 1997-08-20 音声検出器

Publications (2)

Publication Number Publication Date
JPH1168586A JPH1168586A (ja) 1999-03-09
JP3033537B2 true JP3033537B2 (ja) 2000-04-17

Family

ID=16800289

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9223573A Expired - Fee Related JP3033537B2 (ja) 1997-08-20 1997-08-20 音声検出器

Country Status (1)

Country Link
JP (1) JP3033537B2 (ja)

Also Published As

Publication number Publication date
JPH1168586A (ja) 1999-03-09

Similar Documents

Publication Publication Date Title
JP4236726B2 (ja) 音声活動検出方法及び音声活動検出装置
JPS6245730B2 (ja)
US6285979B1 (en) Phoneme analyzer
EP1751740B1 (en) System and method for babble noise detection
JP2007288242A (ja) オペレータ評価方法、装置、オペレータ評価プログラム、記録媒体
JP3033537B2 (ja) 音声検出器
KR100574883B1 (ko) 비음성 제거에 의한 음성 추출 방법
JPH07109559B2 (ja) 音声区間検出方法
JPS63281200A (ja) 音声区間検出方式
JPH03114100A (ja) 音声区間検出装置
JPH07225592A (ja) 有音区間検出装置
JPH09127982A (ja) 音声認識装置
JP2666296B2 (ja) 音声認識装置
KR100345402B1 (ko) 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법
KR100639930B1 (ko) 자동음성인식시스템의 음성 2단 끝점검출 장치 및 그 방법
JP2532618B2 (ja) ピッチ抽出装置
JPH02178699A (ja) 音声認識装置
JPH06175676A (ja) 音声検出器
JP2003271189A (ja) 話者方向検出回路及びその検出方法
JP2772598B2 (ja) 音声符号化装置
JP3008404B2 (ja) 音声認識装置
KR0128669B1 (ko) 음성 신호의 실시간 음성부 검출 방법
JP2969663B2 (ja) 音声認識装置
JPH07181990A (ja) 信号検出装置
KR100523905B1 (ko) 이중화된 검출조건을 이용한 음성 추출 방법

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees