JP3316308B2 - 雑音区間検出装置 - Google Patents

雑音区間検出装置

Info

Publication number
JP3316308B2
JP3316308B2 JP18138494A JP18138494A JP3316308B2 JP 3316308 B2 JP3316308 B2 JP 3316308B2 JP 18138494 A JP18138494 A JP 18138494A JP 18138494 A JP18138494 A JP 18138494A JP 3316308 B2 JP3316308 B2 JP 3316308B2
Authority
JP
Japan
Prior art keywords
short
audio signal
time power
noise
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP18138494A
Other languages
English (en)
Other versions
JPH0844385A (ja
Inventor
秀治 西田
弘明 畑中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP18138494A priority Critical patent/JP3316308B2/ja
Publication of JPH0844385A publication Critical patent/JPH0844385A/ja
Application granted granted Critical
Publication of JP3316308B2 publication Critical patent/JP3316308B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、雑音が含まれる音声信
号から、該雑音のみが存在する時間区間或いは、無音の
時間区間を雑音区間として検出する雑音区間検出装置に
関する。
【0002】具体的には、雑音区間を検出することによ
り、音声などの雑音以外の信号のみを録音し、録音メモ
リが節約できる音声録音装置或は、音声などの雑音以外
の信号のみを再生することによって再生時間を短縮でき
る音声再生装置、音声などの雑音以外の信号のみを伝送
することによって伝送回線の有効利用が可能になる音声
パケット通信装置、または、音声認識装置における音声
区間の切り出しなどに適用される。
【0003】
【従来の技術】従来、音声信号の所定区間が、雑音であ
るか有音であるかの判断は、所定区間の音声信号の特徴
量、たとえば、短時間パワー、短時間ゼロクロス数、又
は、短時間自己相関係数などを抽出し、該特徴量に基づ
いて算出されたしきい値を基準としていた。
【0004】即ち、音声信号の特徴量が、あらかじめ設
定されたしきい値以下であれば雑音区間であり、一方、
しきい値より大きければ、有音区間であると判断するこ
とが知られている。この時、非常に簡便で、最もよく用
いられるのが短時間パワーによる判定である。
【0005】従来、音声認識装置においては、IEEE Tra
n. ASSP-31(1983)pp678-684 ”A Statistical Approach
to the Design of an Adaptive Self-Normalizing Sil
enceDetector”(PETER DE SOUZA著)に示された如く、音
声信号レベルの大小や雑音信号レベルの大小による雑音
区間検出の誤りを防ぐために、音声信号入力前の入力信
号は、雑音信号のみであると仮定し、該音声信号入力前
に短時間パワー値の測定を行い、該短時間パワー値の平
均を雑音区間検出のためのしきい値として固定する方法
があった。
【0006】また、特開平04−152396号公報に
示された如く、雑音を含む音声信号の入力の他に雑音信
号のみの入力を行う別入力を設け、該雑音信号のみの入
力から短時間雑音パワー値を算出し、該短時間雑音パワ
ー値の平均値から、しきい値を決定し、前記雑音を含む
音声信号の入力より算出される短時間パワー値が該しき
い値以下ならば、雑音区間であると判断する方法があっ
た。
【0007】
【発明が解決しようとする課題】前述の如く、しきい値
をあらかじめ決められた設定値に固定する方法では、当
然ながら、音声信号入力レンジが変化した場合、誤って
有音区間を雑音区間として検出する恐れがあった。ま
た、雑音信号のみが入力される別信号から雑音レベルを
学習してしきい値を決定する場合は、複数の入力信号が
必要となり、特に、一度、磁気メモリや半導体メモリに
記録された音声信号を雑音以外の信号のみを再生して再
生時間を短縮できるような音声再生装置については適用
できなかった。
【0008】
【課題を解決するための手段】本発明の雑音区間検出装
置は、ディジタル音声信号をフレーム毎に順次記憶する
フレームメモリと、該フレームメモリに記憶されたディ
ジタル音声信号の短時間パワー値を算出する第1の算出
手段と、該短時間パワー値を時系列的に記憶する記憶手
段と、前記短時間パワー値から雑音区間を判定するため
のしきい値を算出する第2の算出手段と、該しきい値を
越えない前記ディジタル音声信号の短時間パワー値を有
するフレームを雑音区間と判定する判定手段と、を備え
た雑音区間検出装置であって、前記第2の算出手段は、
時系列的に記憶された前記短時間パワー値の内、直前の
フレームにおける短時間パワー値と比較してn倍(n>
0)以上の短時間パワー値となるフレームを選択し、該
フレームの短時間パワー値の平均或は、重み付け平均を
前記しきい値とすることを特徴としており、加えて、前
記フレームメモリは、短時間パワー計算用フレームメモ
リ及び音声信号格納用フレームメモリから構成されてい
ることを特徴としており、更に、前記短時間パワー計算
用フレームメモリは前記ディジタル音声信号からフレー
ム毎に該ディジタル音声信号の平均値を減じた補正音声
信号を記憶し、一方、音声信号格納用フレームメモリは
前記ディジタル音声信号を記憶することを特徴としてい
る。
【0009】また、前記しきい値は、予め決められた上
限値と下限値の間で設定されることを特徴としている。
【0010】
【作用】本発明の雑音区間検出装置は、ディジタル音声
信号をフレーム毎に順次フレームメモリに記憶する。
【0011】この時、該フレームメモリは、短時間パワ
ー計算用フレームメモリ及び音声信号格納用フレームメ
モリから構成されており、該短時間パワー計算用フレー
ムメモリは前記ディジタル音声信号からフレーム毎に該
ディジタル音声信号の平均値を減じた補正音声信号を記
憶し、一方、前記音声信号格納用フレームメモリは前記
ディジタル音声信号を記憶する。
【0012】次に、前記短時間パワー計算用フレームメ
モリに記憶されたディジタル音声信号の短時間パワー値
を算出し、時系列的に算出された短時間パワーの内、直
前のフレームの短時間パワー値のn倍(n>0)以上で
あるものの短時間パワー値を選択し、係る選択された過
去所定フレーム分の短時間パワー値を平均或は、重み付
け平均して前記しきい値を算出し、該しきい値は、予め
決められた上限値と下限値の間に制限され、該しきい値
を越えない短時間パワー値を有する前記音声信号格納用
フレームメモリに記憶された前記ディジタル音声信号を
雑音区間であると判定する。
【0013】
【実施例】図1は、本発明の雑音区間検出装置の概略構
成図を示したものであり、以下、本発明による実施例と
して、半導体メモリに録音された音声信号を再生する
際、録音された音声信号から雑音区間の判定を行い、該
雑音区間を再生しないことによって再生時間を短縮する
場合を説明する。
【0014】同図において、1はディジタル音声信号が
記録されたメインメモリであり、本実施例では、12k
Hzサンプリング、10ビットPCM量子化された音声
信号が記録されている。
【0015】2は本発明の特徴である雑音区間検出装置
であり、雑音区間検出装置2を経て、雑音区間が除かれ
たディジタル音声信号は、D/A変換器9でアナログ音
声信号に変換され、ローパスフィルタ10を経て音声出
力される。
【0016】以下、本発明よる雑音区間検出装置2につ
いて、詳細に説明する。
【0017】3はメインメモリ1に記録されている前記
ディジタル音声信号を所定量記憶するフレームメモリで
あり、フレームメモリ3は、短時間パワー計算用フレー
ムメモリ3a、および、音声信号格納用フレームメモリ
3bから構成されている。
【0018】4は、短時間パワー計算用フレームメモリ
3aに記憶されたディジタル音声信号から短時間パワー
値を算出する短時間パワー算出部、5は短時間パワー算
出部4で算出された短時間パワー値を過去所定フレーム
分記憶する短時間パワー記憶部、6は短時間パワー値か
らしきい値を算出するしきい値算出部、7はしきい値算
出部6で算出されたしきい値と短時間パワー算出部4で
算出された該短時間パワー値とを比較して雑音区間判定
を行う雑音区間判定部、8は雑音区間判定部7で生成さ
れた判定信号に基づいて、音声信号格納用フレームメモ
リ3bに記憶されているディジタル音声信号の出力制御
を行うスイッチ部である。
【0019】雑音区間検出装置2の出力制御により、雑
音区間が除かれたディジタル音声信号は、D/A変換器
9でアナログ音声信号に変換され、ローパスフィルタ1
0を経て音声出力される。この時のローパスフィルタ1
0のカットオフ周波数は、6kHzとした。同図中、破
線で示す信号線は、短時間パワー信号などを送信する制
御信号線を示している。
【0020】次に、図2は、雑音区間検出装置2におけ
る処理の流れを示したものであり、以下、図2に基づい
て、処理の流れを説明する。
【0021】まず、ステップS1では、重み付け平均パ
ワー値Paおよび現在のフレームの直前のフレームの短
時間パワー値P0の初期値の設定を行う。重み付け平均
パワー値とは、現在のデータを含む過去からのデータの
平均値を計算する際、過去のデータの平均値に重みをつ
け、現在のデータとの平均することによって算出される
値である。それぞれの値を以下のように設定した。Pa
の具体的な算出方法については後述する。
【0022】Pa=0x0c00、P0=0x8000
(0x値は16進表記) ステップS2では、メインメモリ1からディジタル音声
信号を1フレーム分読み取り、短時間パワー計算用フレ
ームメモリ3aおよび音声信号格納用フレームメモリ3
bにそれぞれ記憶させており、本実施例では1フレーム
を300サンプルとした。
【0023】ステップS3においては、短時間パワー計
算用フレームメモリ3aに記憶された前記ディジタル音
声信号の平均値を求め、ステップS4では、個々の前記
ディジタル音声信号から平均値を減じて、再び短時間パ
ワー計算用フレームメモリ3aに記憶する。
【0024】ステップS5では、短時間パワー計算用フ
レームメモリ3aに記憶された前記ディジタル音声信号
の二乗和を計算し、その値を現在のフレームのパワー値
Pとする。
【0025】ステップS6では、重み付け平均パワー値
Paをあらかじめ設定された値ndで除した値をしきい
値Bとする。
【0026】ステップS7においては、該しきい値Bと
設定値Bmaxとの大きさの比較を行い、該しきい値B
が最大値Bmaxをこえている場合は、ステップS8に
進み、Bmaxを新たなしきい値Bとする。
【0027】また、ステップS9では、前記しきい値B
と設定値Bminとの大きさの比較を行い、該しきい値
が最小値Bminより小さい場合は、ステップS10に
進み、Bminを新たにしきい値Bとする。本実施例で
は、 nd=16、Bmax=0xc000、Bmin=0x
800 とした。
【0028】ステップS11からステップS13では、
雑音区間の判定の前に重み付け平均パワー値Paおよび
P0の更新処理を行う。Paの更新は現在のフレームを
含む過去の所定フレーム数nfの重み付け平均パワー計
算により算出される。ステップS11に示す如く、対象
となる短時間パワー値は現在のフレームの短時間パワー
値Pが直前のフレームの短時間パワー値P0のn倍(設
定値、n>0)より大きい場合とする。本実施例では、 nf=16、n=3 とした。ステップS12に示す如く、更新後のPa値を
Pa’とすると Pa’=(Pa×15+P)/16 とし、ステップS13に進む、更新後のP0値をP0’
とすると P0’=P となる。図3は、横軸に時間をとり、矩形の大きさの変
化によりフレームごとの短時間パワー値の大きさの変化
を摸式的に表したものであるが、図中、斜線で示す矩形
の大きさが、Paの更新に関与する短時間パワー値に対
応する。すなわち、有音区間の開始時期など短時間パワ
ー値が急激に大きく変化する時の短時間パワー値により
Paが影響をうけ、これによって、図中、太線で示され
たようにしきい値が上限と下限の間を変化する。
【0029】最後に、現在のフレームの音声信号が、雑
音区間であるかどうかの判定を行う。
【0030】ステップS14では、先に決定しているし
きい値Bと現在のフレームの短時間パワー値Pとの大き
さの比較を行う。この時、ステップS15およびS16
の如く、P≦Bならば現在のフレームの音声信号は、雑
音区間であると判定され、一方、P>Bならば有音区間
と判定される。図3では、判定された有音区間を両端に
矢印のついた点線で示し、雑音区間を両端に矢印のつい
た実線で示す。
【0031】実施例では、雑音区間は再生せず、有音区
間のみをD/A変換器9に出力するよう制御している。
【0032】ところで、実施例による本発明の有効性を
検証した結果を表1に示す。比較のため従来方式とし
て、固定しきい値による判定結果を示す。
【0033】
【表1】
【0034】前記メインメモリに記録された検証用の音
声サンプルは2種類である。同表中、サンプル1として
TVドラマ音声、サンプル2としてテニスの実況録音音
声とし、それぞれ10ビット入力レンジおよび9ビット
入力レンジで録音されている。同表より、従来方式で
は、固定しきい値を大きめに設定すれば、入力レンジが
適正入力レンジ(10ビット入力レンジ)から半分のレ
ンジ(9ビット入力レンジ)になると、誤って雑音区間
の判定が多くなり、再生音の音切れが発生しやすくな
る。逆に、固定しきい値を小さめに設定すれば、再生音
の音切れはなくなるが誤って有音区間判定が多くなり期
待する再生時間よりも長くなる。本発明の雑音区間検出
装置によれば、音声信号の入力レンジに適応してしきい
値が変化するので良好な結果が得られている。
【0035】以上、本発明による雑音区間検出装置を音
声などの雑音以外の信号のみを再生することによって再
生時間を短縮できる音声再生装置に適用した場合の実施
例を説明したが、本発明による雑音区間検出装置はフレ
−ム毎に、係るフレームが雑音区間であるかどうかの判
定を行うことは明白であり、雑音区間を検出することに
より、音声などの雑音以外の信号のみを録音し、録音メ
モリが節約できる音声録音装置、音声などの雑音以外の
信号のみを伝送することによって伝送回線の有効利用が
可能になる音声パケット通信装置或は、音声認識装置に
おける音声区間の切り出しなどに適用されることは言う
までもない。
【0036】
【発明の効果】本発明に係る雑音区間検出装置による
と、たとえ音声入力レンジを録音や再生或は、伝送中に
変化させた場合であっても、誤って雑音区間を検出する
ことがないよう改善され、誤りの少ない雑音区間検出が
可能となる。また、雑音まじりの音声信号の入力のみに
適応的にしきい値が制御され、雑音区間検出が行えるの
で、磁気メモリや半導体メモリに既に記録された音声信
号から雑音区間検出を精度良く行える。
【図面の簡単な説明】
【図1】本発明の雑音区間検出装置の概略構成図であ
る。
【図2】本発明の雑音区間検出装置における処理の流れ
を示す図である。
【図3】本発明におけるディジタル音声信号の短時間パ
ワー値の変化によるしきい値変動を表す模式図である。
【符号の説明】
1 メインメモリ 2 雑音区間検出装置 3 フレームメモリ 3a 短時間パワー計算用フレームメモリ 3b 音声信号格納用フレームメモリ 4 短時間パワー算出部 5 短時間パワー記憶部 6 しきい値算出部 7 雑音区間判定部 8 切り替えスイッチ 9 D/A変換器 10 ローパスフィルタ
フロントページの続き (56)参考文献 特開 平4−204898(JP,A) 特開 平4−152396(JP,A) 特開 平3−15897(JP,A) 特開 昭61−46999(JP,A) 特開 昭62−123499(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 11/02 G10L 15/04

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 ディジタル音声信号をフレーム毎に順次
    記憶するフレームメモリと、該フレームメモリに記憶さ
    れたディジタル音声信号の短時間パワー値を算出する第
    1の算出手段と、該短時間パワー値を時系列的に記憶す
    る記憶手段と、前記短時間パワー値から雑音区間を判定
    するためのしきい値を算出する第2の算出手段と、該し
    きい値を越えない短時間パワー値を有する前記ディジタ
    ル音声信号のフレームを雑音区間と判定する判定手段
    と、を備えた雑音区間検出装置であって、 前記第2の算出手段は、時系列的に記憶された前記短時
    間パワー値の内、直前のフレームにおける短時間パワー
    値と比較してn倍(n>0)以上の短時間パワー値とな
    るフレームを選択し、該フレームの短時間パワー値の平
    均を前記しきい値とすることを特徴とした雑音区間検出
    装置。
  2. 【請求項2】 前記フレームメモリは、短時間パワー計
    算用フレームメモリ及び音声信号格納用フレームメモリ
    から構成されていることを特徴とする請求項1記載の雑
    音区間検出装置。
  3. 【請求項3】 前記短時間パワー計算用フレームメモリ
    は前記ディジタル音声信号からフレーム毎に該ディジタ
    ル音声信号の平均値を減じた補正音声信号を記憶し、一
    方、音声信号格納用フレームメモリは前記ディジタル音
    声信号を記憶することを特徴とする請求項2記載の雑音
    区間検出装置。
  4. 【請求項4】 前記しきい値は、予め決められた上限値
    と下限値の間で設定されることを特徴とする請求項1記
    載の雑音区間検出装置。
  5. 【請求項5】 前記第2の算出手段は、時系列的に記憶
    された前記短時間パワー値の内、直前のフレームにおけ
    る短時間パワー値と比較してn倍(n>0)以上の短時
    間パワー値となるフレームを選択し、係る選択された過
    去の短時間パワー値に重みを付けた平均を前記しきい値
    とすることを特徴とした請求項1記載の雑音区間検出装
    置。
JP18138494A 1994-08-02 1994-08-02 雑音区間検出装置 Expired - Fee Related JP3316308B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP18138494A JP3316308B2 (ja) 1994-08-02 1994-08-02 雑音区間検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP18138494A JP3316308B2 (ja) 1994-08-02 1994-08-02 雑音区間検出装置

Publications (2)

Publication Number Publication Date
JPH0844385A JPH0844385A (ja) 1996-02-16
JP3316308B2 true JP3316308B2 (ja) 2002-08-19

Family

ID=16099796

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18138494A Expired - Fee Related JP3316308B2 (ja) 1994-08-02 1994-08-02 雑音区間検出装置

Country Status (1)

Country Link
JP (1) JP3316308B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4715738B2 (ja) * 2006-12-19 2011-07-06 トヨタ自動車株式会社 発話検出装置及び発話検出方法
JP4548539B2 (ja) * 2008-12-26 2010-09-22 パナソニック株式会社 補聴器
CN112614507A (zh) * 2020-12-09 2021-04-06 腾讯音乐娱乐科技(深圳)有限公司 检测噪声的方法和装置

Also Published As

Publication number Publication date
JPH0844385A (ja) 1996-02-16

Similar Documents

Publication Publication Date Title
EP0637011B1 (en) Speech signal discrimination arrangement and audio device including such an arrangement
US7968786B2 (en) Volume adjusting apparatus and volume adjusting method
JP2955247B2 (ja) 話速変換方法およびその装置
KR100302370B1 (ko) 음성구간검출방법과시스템및그음성구간검출방법과시스템을이용한음성속도변환방법과시스템
KR0120112B1 (ko) 자동등화기
JP4940158B2 (ja) 音補正装置
JPH1188088A (ja) 自動音量補正方法及びその装置
JPH05134694A (ja) 音声認識装置
JP3840928B2 (ja) 信号処理装置および方法、記録媒体、並びにプログラム
US7233200B2 (en) AGC circuit, AGC circuit gain control method, and program for the AGC circuit gain control method
JP3316308B2 (ja) 雑音区間検出装置
US7848530B2 (en) Electronic device and its control method
JP2001188599A (ja) オーディオ信号復号装置
JPH0251200B2 (ja)
JPH06334457A (ja) 自動音量制御装置
JP3420831B2 (ja) 骨伝導音声のノイズ除去装置
JP3474596B2 (ja) 音声記録装置
JPH07111527A (ja) 音声の加工方法およびそれを用いた装置
JP3119677B2 (ja) 信号処理回路
JPS5862804A (ja) 記録レベル自動調整装置
JPH05184000A (ja) オーディオシステムの自動音場補正装置
JPH07235850A (ja) オーディオ装置
JPH0575366A (ja) オーデイオ装置における信号処理回路
JPH06253386A (ja) 収音装置
JP3292098B2 (ja) 聴覚補助装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees