JPH04251299A - 音声区間検出方法 - Google Patents

音声区間検出方法

Info

Publication number
JPH04251299A
JPH04251299A JP3001077A JP107791A JPH04251299A JP H04251299 A JPH04251299 A JP H04251299A JP 3001077 A JP3001077 A JP 3001077A JP 107791 A JP107791 A JP 107791A JP H04251299 A JPH04251299 A JP H04251299A
Authority
JP
Japan
Prior art keywords
spectrum
frame
speech section
voice
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3001077A
Other languages
English (en)
Inventor
Hideji Nishida
秀治 西田
Shozo Sugishita
正蔵 杉下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP3001077A priority Critical patent/JPH04251299A/ja
Publication of JPH04251299A publication Critical patent/JPH04251299A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はデジタル音声録音及び音
声認識する際の音声区間検出方法に関する。
【0002】
【従来の技術】入力信号の中から音声区間を判定する検
出方法としては、音声認識において利用されているもの
が知られている。それは入力音声信号を一定フレーム間
隔で切り出して音声区間の判定を行うもので、例えば入
力音声信号の最初の100msecは雑音区間であると
仮定し、雑音信号平均電力及び雑音信号零交差速度平均
を推定し、これより算出される電力及び零交差速度の閾
値を決定し、この閾値により以後の音声区間判定を判定
を行うようにした方法である。
【0003】尚、上記のように音声区間の判定を行う技
術については、例えば特開平1−286643号公報(
H04J3/17)に示されるものがある。
【0004】
【発明が解決しようとする課題】しかしながら、従来の
方式では信号電力と零交差速度により音声区間の判定を
行っているので対雑音性が乏しいという問題があった。
【0005】即ち、環境雑音の音声信号における電力及
び零交差速度に及ぼす影響は大きく、従来の方式では環
境雑音の殆どない場合にしか有効ではなかった。
【0006】また、環境雑音は非定常的である場合が普
通であり、この場合、雑音スペクトルの時間変動が考え
られるが、この点に関しても従来の方式ではほとんど対
処されていない。
【0007】
【課題を解決するための手段】本発明は上記課題を解決
するためのものであって、入力音声を一定の時間フレー
ム単位でLPCスペクトル分析を行い、低周波数帯域の
スペクトルピークと高周波数帯域の平均スペクトルのレ
ベル差が閾値を越えたときを音声区間と判定する際に、
1つ過去のフレームが音声区間でないと判定された時に
、現在のフレームのスペクトルから1フレーム過去のス
ペクトルを減算して修正フレームのスペクトルを作成し
、現在のフレームに代えて前記修正フレームのスペクト
ルを用いて上記音声区間の判定を行うことを特徴とした
音声区間検出方法を提案する。
【0008】
【作用】上記方法によると、対雑音性を有する音声区間
検出方法が可能になる。
【0009】
【実施例】次に、本発明の音声区間検出方法について以
下に説明する。
【0010】図1に於て、1は4000Hzまでの通過
帯域をもつロ−パスフィルタ、2はサンプリングレート
8kHz、ビット長12ビットでAD変換を行うAD変
換器、3はスペクトルであるデジタル音声信号(スペク
トル)を貯えるメモリで、その容量は16MBである。 4はスイッチ、5は時間軸圧縮伸長処理を行うDSPと
呼ばれる汎用信号処理チップで、ここでは品番320C
25(TI社製)を使用しており、その処理を以下に説
明する。
【0011】まず、音声信号の最初のフレームは音声区
間でないと見做して処理を開始し、メモリ3の初期値は
ゼロクリアされている。第1処理で固定長フレームによ
る音声信号の切出しを行う。1フレームは256デ−タ
(32msec)とする。第2処理ではフレーム信号の
LPCスペクトル分析を行う。分析次数は8次とし、L
PC分析により256個のスペクトルが得られる。得ら
れたスペクトルはピッチなどの微細構造を含まない滑ら
かなホルマント曲線となる。第3処理では分析されたス
ペクトルをメモリ3に記憶する。スペクトルは1つ過去
のフレームにおけるスペクトルと現在のフレームのスペ
クトルの2フレーム分記憶される。尚、1つ過去のフレ
ームが音声区間であると判定された場合にはスイッチ4
がA側に接続されて次の第4処理を介さずに現在のフレ
ームのままで第5処理以降の音声区間の判定を行う。
【0012】第4処理では1つ過去のフレームが音声区
間でないと判定された場合において、スイッチ4がB側
に接続されて、現在のフレームのスペクトルよりそれぞ
れ周波数に対応する1つ過去のフレームのスペクトルを
減算し、修正フレームを作成し、現在のフレームに代え
て前記修正フレームのスペクトルを用いて第5処理以降
の音声区間の判定を行う。
【0013】第5処理以降は音声区間の判定方法に関し
、その第5処理では100HZ〜1500HZ帯域のス
ペクトルのピーク検出を行い、求められたピークレベル
をPsとしてDSP5の内部RAMに記憶する。第6処
理では3500Hz以上の帯域における平均スペクトル
レベルPzを算出する。第7処理ではPs−Pzの計算
を行う。第8処理ではDSP5外部から入力される閾値
よりPs−Pzのレベルが大きければそのフレームを音
声区間と判定し、判定結果は出力されると同時にスイッ
チ4を制御して切り換えを行う。
【0014】尚、処理の開始及び終了は外部からのDS
P5への割り込み制御により行われ、処理命令期間中は
第1処理から第8処理までを連続して行う。
【0015】次に本発明の音声区間検出方法の1つのパ
ターンを図2を参照して説明する。図2aは雑音がほと
んどない場合の入力音声波形を示す図で、日本語男声の
音声波形を6.4sec分だけ示している。図2bは従
来の判定結果を示しており、ハイのときは音声区間であ
る。図2cは本発明の判定結果を示すもので、感度レベ
ルは20dBとしている。図2dは雑音を含む入力音声
信号波形(セグメンタルSNRによる音声信号の劣化は
−12dB)で、雑音源はヘリコプターの操縦席内の雑
音を用いた。図2eは従来の方法による図2dの入力信
号の判定結果を示すもので、全ての区間で音声区間でな
いと判断している。図2fは本発明方法による図2dの
入力信号の判定結果を示すもので、音声区間の判定が行
われており、感度レベルは10dBとしている。
【0016】
【発明の効果】本発明によると、例えばセグメンタルS
NRが−12dB程度劣化するような雑音環境下におい
ても音声区間の検出が可能となり、音声区間のみを録音
するICレコーダ等のメモリの節約となると共に音声に
より制御される家電製品などの雑音環境化における動作
を正確に行えるので極めて有益である。
【図面の簡単な説明】
【図1】本発明を説明するための概略ブロック図である
【図2】本発明を説明するための波形図である。
【符号の説明】
1  フィルタ 2  AD変換器 3  メモリ 4  スイッチ 5  DSP

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】  入力音声を一定の時間フレーム単位で
    LPCスペクトル分析を行い、低周波数帯域のスペクト
    ルピークと高周波数帯域の平均スペクトルのレベル差が
    閾値を越えたときを音声区間と判定する際に、1つ過去
    のフレームが音声区間でないと判定された時に、現在の
    フレームのスペクトルから1フレ−ム過去のスペクトル
    を減算して修正フレームを作成し、現在のフレームに代
    えて前記修正フレームのスペクトルを用いて上記音声区
    間の判定を行うことを特徴とした音声区間検出方法。
JP3001077A 1991-01-09 1991-01-09 音声区間検出方法 Pending JPH04251299A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3001077A JPH04251299A (ja) 1991-01-09 1991-01-09 音声区間検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3001077A JPH04251299A (ja) 1991-01-09 1991-01-09 音声区間検出方法

Publications (1)

Publication Number Publication Date
JPH04251299A true JPH04251299A (ja) 1992-09-07

Family

ID=11491441

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3001077A Pending JPH04251299A (ja) 1991-01-09 1991-01-09 音声区間検出方法

Country Status (1)

Country Link
JP (1) JPH04251299A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007094388A (ja) * 2005-09-26 2007-04-12 Samsung Electronics Co Ltd 音声区間検出装置及び音声区間検出方法
JP2019090962A (ja) * 2017-11-16 2019-06-13 清水建設株式会社 音声検知システム及び音声検知方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007094388A (ja) * 2005-09-26 2007-04-12 Samsung Electronics Co Ltd 音声区間検出装置及び音声区間検出方法
US7711558B2 (en) 2005-09-26 2010-05-04 Samsung Electronics Co., Ltd. Apparatus and method for detecting voice activity period
JP2019090962A (ja) * 2017-11-16 2019-06-13 清水建設株式会社 音声検知システム及び音声検知方法

Similar Documents

Publication Publication Date Title
EP0763811B1 (en) Speech signal processing apparatus for detecting a speech signal
US5617508A (en) Speech detection device for the detection of speech end points based on variance of frequency band limited energy
KR100307065B1 (ko) 음성검출장치
JP3423906B2 (ja) 音声の動作特性検出装置および検出方法
US5970441A (en) Detection of periodicity information from an audio signal
US4597098A (en) Speech recognition system in a variable noise environment
US9454976B2 (en) Efficient discrimination of voiced and unvoiced sounds
JPH02267599A (ja) 音声検出装置
JPS59115625A (ja) 音声検出器
JPH0431898A (ja) 音声雑音分離装置
Ramirez et al. Voice activity detection with noise reduction and long-term spectral divergence estimation
US4845753A (en) Pitch detecting device
JPH04251299A (ja) 音声区間検出方法
JP2000163099A (ja) 雑音除去装置、音声認識装置および記憶媒体
KR920009957B1 (ko) 과대음성 검출장치
JPH0449952B2 (ja)
JP2589468B2 (ja) 音声認識装置
JP2001166783A (ja) 音声区間検出方法
JPH04238399A (ja) 音声認識装置
JPH03114100A (ja) 音声区間検出装置
KR100345402B1 (ko) 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법
JPH04115299A (ja) 音声有音無音判定方法および装置
CN1064159C (zh) 语音检测装置
JPS6217800A (ja) 音声区間判定方式
JP2666296B2 (ja) 音声認識装置