JP2739811B2 - 雑音抑圧方式 - Google Patents

雑音抑圧方式

Info

Publication number
JP2739811B2
JP2739811B2 JP29717693A JP29717693A JP2739811B2 JP 2739811 B2 JP2739811 B2 JP 2739811B2 JP 29717693 A JP29717693 A JP 29717693A JP 29717693 A JP29717693 A JP 29717693A JP 2739811 B2 JP2739811 B2 JP 2739811B2
Authority
JP
Japan
Prior art keywords
noise
signal
voice
section
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP29717693A
Other languages
English (en)
Other versions
JPH07152395A (ja
Inventor
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP29717693A priority Critical patent/JP2739811B2/ja
Priority to DE1994623703 priority patent/DE69423703T2/de
Priority to EP19940118782 priority patent/EP0655731B1/en
Publication of JPH07152395A publication Critical patent/JPH07152395A/ja
Application granted granted Critical
Publication of JP2739811B2 publication Critical patent/JP2739811B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声信号に重畳した雑
音を抑圧する雑音抑圧方式に関し、特に、音声符号化の
前処理あるいは後処理において動作させる雑音抑圧方式
に関する。
【0002】
【従来の技術】音声符号化の前処理として、音声区間と
無音区間とを判別する方式としては、例えば、J.リンチ
Jr.(J.Lynch, Jr.)氏らによる“スピーチ/サイレンス
・セグメンテーション・フォー・リアル―タイム・コー
ディング・ヴィア・ルール・ベースド・アダプティヴ・
エンドポイント・ディテクション”(@Speech/silences
egmentation for real-time coding via rule based ad
aptive endpointdetection"(Proc. ICASSP, pp.1348-13
51, 1987) と題した論文(文献1)等に記載された音
声検出方法が知られている。また、雑音の重畳した音声
から、雑音成分を除去する方法として、特開平2-278298
号明細書(文献2)等に記載のスペクトルサブトラクシ
ョン法が知られている。
【0003】
【発明が解決しようとする課題】上述した文献1の従来
方式では、音声区間と無音区間の検出をしているのみで
あり、特に雑音抑圧は行っていなかった。仮に前記従来
方式を雑音抑圧に使おうとすると、音声区間に重畳した
非音声信号(雑音)の抑圧は困難である。さらに、上述
の文献2では、雑音の重畳したスペクトルから、雑音の
みのスペクトルを推定して除去することにより、雑音抑
圧を行う。しかしながら、音声符号化では、スペクトル
のみならず、位相成分も符号化して伝送するので、スペ
クトル上での雑音除去では雑音除去効果は不十分であ
り、波形上での雑音除去処理が必要である。また、上述
の従来方式は、音声符号化の後処理に適用することはで
きない。
【0004】本発明の目的は、上述した問題点を解決
し、音声符号化の前処理、後処理のいずれにも付加する
ことが可能で、音声区間、非音声区間いずれでも、波形
上で雑音信号を抑圧することのできる雑音抑圧方式を提
供することにある。
【0005】
【課題を解決するための手段】本発明によれば、音声信
号を入力しあらかじめ定められた時間長のフレームに分
割し、前記音声信号のスペクトル的特徴を含む特徴量を
計算する特徴量計算手段と、前記特徴量のうち少なくと
も1つを用いて、非音声区間と音声区間を検出する音声
検出手段と、非音声区間における平均振幅を記憶する記
憶手段と、前記音声区間と前記非音声区間の少なくとも
1つの区間において、前記スペクトル的特徴を表す特徴
量を用いて前記音声信号をフィルタリングし前記フィル
タリング結果と前記記憶手段の出力をもとに前記フィル
タリング結果に対して雑音信号を推定し、前記フィルタ
リング結果から雑音を抑圧し、さらに音声信号を復元し
て出力する雑音抑圧手段とを有することを特徴とする雑
音抑圧方式が得られる。
【0006】さらに本発明によれば、特徴量と音源信号
に関するインデクスを受信して復号する復号手段と、前
記特徴量のうちの少なくとも1つを用いて非音声区間と
音声区間を検出する音声検出手段と、非音声区間におけ
る平均振幅を記憶する記憶手段と、前記非音声区間と前
記音声区間の少なくとも1つの区間において、前記記憶
手段の出力をもとに前記音源信号における雑音信号を推
定し、前記音源信号から雑音を抑圧して出力する雑音抑
圧手段とを有することを特徴とする雑音抑圧方式が得ら
れる。
【0007】
【作用】本発明による雑音抑圧方式の作用を示す。
【0008】本発明では、音声区間に重畳した雑音信号
に対して抑圧を施す。音声信号をフレーム(例えば40
ms)に分割し、さらにサブフレーム(例えば8ms)
に分割する。特徴量計算部では、フレーム毎に、あるい
はサブフレーム毎に音声の特徴パラメータを計算する。
特徴パラメータとしては、種々のものが考えられるが、
ここでは、音声のスペクトル的特徴を表すスペクトルパ
ラメータと、音声の周期性を表すピッチ予測ゲインと、
平均振幅を計算する。なお、平均振幅のかわりに、パワ
ーを用いることもできる。
【0009】音声検出手段では、前記特徴量の一部、あ
るいは全てに対して、しきい値と比較することにより、
音声区間か、非音声区間かを判別する。ここで、しきい
値は固定の値でも良いし、ある規則に従い、時間的に変
化させても良い。
【0010】記憶手段では、前記音声検出手段で非音声
区間と判別された区間では、平均振幅、もしくは、前記
平均振幅を時間的に平滑化したものを記憶する。
【0011】雑音抑圧手段では、音声区間、もしくは非
音声区間の少なくとも1つの区間において、雑音信号を
抑圧する。まず、当該フレームで求めた、前記スペクト
ルパラメータを用いて、入力音声を下式に従い逆フィル
タリングし、フィルタリング結果e(n)を得る。 ここで、aiは特徴量計算手段で求めたスペクトルパラメ
ータである。P は逆フィルタの次数である。e(n)には、
音声信号と雑音信号とが重畳していると考えられるが、
有声区間では、音声信号の部分は、ピッチ構造のため、
振幅の比較的大きなパルス列となる。一方、雑音信号の
部分は、振幅の比較的小さな雑音状の信号となる。従っ
て、e(n)をしきい値と比較し、しきい値よりも小さな信
号を、あらかじめ定められた値だけ抑圧するか、もしく
は0としてしまう。
【0012】つまり、下式のような非線形な変換を行
う。 ここで、K は、0<K<1 の定数である。Th1 は、前記記憶
手段において、非音声区間で記憶しておいた平均振幅に
応じて決定する。
【0013】次に、e'(n) と前記スペクトルパラメータ
を用いて、下式により、雑音の抑圧された信号を復元す
る。 以上により、音声信号にはほとんど影響を与えることな
く重畳している雑音信号を効果的に抑圧することができ
る。
【0014】また本発明では、送信側での入力した音声
信号に対してではなく、音声復号側において音声信号を
復元するさいに、音声区間と非音声区間の少なくとも1
つの区間の雑音を抑圧する。雑音抑圧部の具体的な動作
は第1の発明の雑音抑圧手段と同一である。
【0015】
【実施例】次に、本発明について図面を参照して説明す
る。
【0016】図1は本発明による雑音抑圧方式の第1の
実施例を示すブロック図である。
【0017】図において、入力端子100から音声信号
を入力し、フレーム分割回路110では音声信号をフレ
ーム(例えば40ms)毎に分割し、サブフレーム分割
回路120では、フレームの音声信号をフレームよりも
短いサブフレーム(例えば8ms)に分割する。
【0018】特徴量計算回路150では、前記音声信号
の特徴量として、スペクトルパラメータと、ピッチ周期
性と、平均振幅を計算する。ここで、スペクトルパラメ
ータの計算では、少なくとも一つのサブフレームの音声
信号に対して、サブフレーム長よりも長い窓(例えば2
4ms)をかけて音声を切り出してスペクトルパラメー
タをあらかじめ定められた次数(例えば10次)計算す
る。スペクトルパラメータとしては、以下では線形予測
係数aiを用いることとし、スペクトルパラメータの計算
には、周知のLPC 分析や、Burg分析等を用いることがで
きる。ここでは、Burg分析を用いることとする。Burg分
析の詳細については、中溝著による”信号解析とシステ
ム同定”と題した単行本(コロナ社1988年刊)の8
2〜87頁(文献3)に記載されているので説明は略す
る。また、他の方法として、自己相関法や、共分散法な
どを使用することもできる。また、ピッチ周期性を表す
ピッチ予測ゲインは、(4) 式に従い計算できる。 ここで、x(n)は入力音声信号、T はピッチ周期を表す遅
延量である。
【0019】(4) 式のかわりに、簡便には、(5) 式を使
用することもできる。 また、平均振幅R の計算は下式に従う。
【0020】
【0021】音声検出回路200では、上記の特徴量の
少なくとも一つを使用して音声区間と非音声区間の検出
を行う。種々の検出法が考えられるが、ここでは下記の
方法を用いる。平滑化したピッチ予測ゲインPg' がしき
い値Th1 以下で、平滑化した平均振幅R'がしきい値Th2
以下のときは、非音声区間と判断し、それ以外の区間は
音声区間とする。ここで、平滑化は下式に従う。 Pj'=(1- δ)・P'j-1+δ・P (7) 上式でP は平滑化を施すパラメータ(例えばピッチ予測
ゲイン、平均振幅等)である。δは平滑化時定数であ
り、0<δ<1の値をとる。Pj' は平滑化後のj 時刻の値で
ある。しきい値Th1 、Th2 は固定でも良いし時間的に変
化させてもよい。
【0022】記憶回路250では、非音声区間におい
て、平均振幅に(7) 式を適用して求めた平滑化平均振幅
R'をフレーム毎に、あるいはサブフレーム毎に計算して
記憶する。
【0023】雑音抑圧回路300では、非音声区間およ
び音声区間の少なくとも一方の区間において、雑音信号
を抑圧する。ここで、雑音抑圧回路300の詳細を示す
ブロック図を図2に示す。
【0024】まず、逆フィルタリング回路310では、
当該フレームの特徴量計算回路150で求めた線形予測
係数aiを用いて前記(1) 式に従い逆フィルタリングを行
い、フィルタリング結果e(n)を求める。
【0025】次に、しきい値計算回路330では、記憶
回路250で記憶されていたR'をもとに例えば下式に従
いしきい値Th1 を計算する。 Th1=K2・R' (8) ここで0<K2とする。次に抑圧回路320では、音声区間
および非音声区間の少なくとも一方の区間において、
(2) 式に従い、e(n)に対して雑音抑圧処理を施し、抑圧
後の信号e'(n) を得る。
【0026】次に、復元回路340では、e'(n) を入力
し(3) 式に従い、雑音抑圧後の音声x'(n) を復元し、出
力する。
【0027】本発明の第2の実施例を図3に示す。図に
おいて、図1、図2と同一の構成番号を付した構成要素
は、図1と同様の動作を行うので説明を省略する。
【0028】復号回路410は、端子400より、音声
の特徴量(例えばスペクトルパラメータ、ピッチ周期、
平均振幅)と音源信号に関するインデクスを入力し復号
する。
【0029】雑音抑圧回路500の詳細なブロック図を
図4に示す。図4において、音声区間および非音声区間
と判別された区間のうち、少なくとも一方の区間では、
抑圧回路510が、音源信号v(n)に対して(10)式に従
い、雑音抑圧処理を施して音源信号v'(n) を求める。
【0030】
【0031】ここで、K は(2) 式のK と同一の値であ
る。しきい値Th1 も(2) 式と同じ値である。音声復号回
路520は、雑音が抑圧された音源信号v'(n) と特徴量
とを入力し、周知な方法により音声信号を復元して出力
する。本発明の意向を損なうことなく、上述した実施例
以外にも種々の変形が可能である。
【0032】特徴量計算回路におけるスペクトルパラメ
ータは線形予測係数以外にも他の周知なパラメータを用
いることができる。
【0033】音声検出回路での音声区間、非音声区間の
検出法は他の衆知な方法を用いることができる。
【0034】特徴量としては、実施例で述べたパラメー
タ以外に、他の衆知なパラメータを用いることができ
る。
【0035】また、第2の実施例において、特徴量が送
信側から伝送されないときは、受信側で音声を一旦復号
した後に、復号した音声波形から第1の実施例に示した
方法を用いて特徴量を計算し、雑音抑圧に使用する構成
としてもよい。
【0036】
【発明の効果】以上述べたように本発明ば、音声符号化
の前処理、後処理、いずれでも、雑音抑圧が可能であ
り、非音声区間の雑音の抑圧だけでなく、音声区間の音
声信号に重畳した非音声信号の抑圧を、波形上で実現す
ることができるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の第1の実施例のブロック図である。
【図2】図1中の雑音抑圧回路のブロック図である。
【図3】本発明の第2の実施例のブロック図である。
【図4】図3中の雑音抑圧回路のブロック図である。
【符号の説明】
110 フレーム分割回路 120 サブフレーム分割回路 150 特徴量計算回路 200 音声検出回路 250 記憶回路 300,500 雑音抑圧回路 310 逆フィルタリング回路 320,510 抑圧回路 330 しきい値回路 340 復元回路 520 音声復号回路

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 音声信号を入力しあらかじめ定められた
    時間長のフレームに分割し、前記音声信号のスペクトル
    的特徴を含む特徴量を計算する特徴量計算手段と、前記
    特徴量のうち少なくとも1つを用いて、非音声区間と音
    声区間を検出する音声検出手段と、非音声区間における
    平均振幅を記憶する記憶手段と、前記音声区間と前記非
    音声区間の少なくとも1つの区間において、前記スペク
    トル的特徴を表す特徴量を用いて前記音声信号をフィル
    タリングし前記フィルタリング結果と前記記憶手段の出
    力をもとに前記フィルタリング結果に対して雑音信号を
    推定し、前記フィルタリング結果から雑音を抑圧し、さ
    らに音声信号を復元して出力する雑音抑圧手段とを有す
    ることを特徴とする雑音抑圧方式。
  2. 【請求項2】 特徴量と音源信号に関するインデクスを
    受信して復号する復号手段と、前記特徴量のうちの少な
    くとも1つを用いて非音声区間と音声区間を検出する音
    声検出手段と、非音声区間における平均振幅を記憶する
    記憶手段と、前記非音声区間と前記音声区間の少なくと
    も1つの区間において、前記記憶手段の出力をもとに
    記音源信号における雑音信号を推定し、前記音源信号か
    ら雑音を抑圧して出力する雑音抑圧手段とを有すること
    を特徴とする雑音抑圧方式。
  3. 【請求項3】 前記特徴量計算手段が、入力された音声
    信号をフレーム毎に分割するフレーム分割回路と、フレ
    ームの音声信号をフレームよりも短いサブフレームに分
    割するサブフレーム分割回路と、前記音声信号の特徴量
    としてスペクトルパラメータとピッチ周期性と平均振幅
    を計算する特徴量計算回路とを有することを特徴とする
    請求項1記載の雑音抑圧方式。
JP29717693A 1993-11-29 1993-11-29 雑音抑圧方式 Expired - Lifetime JP2739811B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP29717693A JP2739811B2 (ja) 1993-11-29 1993-11-29 雑音抑圧方式
DE1994623703 DE69423703T2 (de) 1993-11-29 1994-11-29 Rauschunterdrückungseinrichtung zur Vorverarbeitung und/oder Nachbearbeitung von Sprachsignalen
EP19940118782 EP0655731B1 (en) 1993-11-29 1994-11-29 Noise suppressor available in pre-processing and/or post-processing of a speech signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP29717693A JP2739811B2 (ja) 1993-11-29 1993-11-29 雑音抑圧方式

Publications (2)

Publication Number Publication Date
JPH07152395A JPH07152395A (ja) 1995-06-16
JP2739811B2 true JP2739811B2 (ja) 1998-04-15

Family

ID=17843166

Family Applications (1)

Application Number Title Priority Date Filing Date
JP29717693A Expired - Lifetime JP2739811B2 (ja) 1993-11-29 1993-11-29 雑音抑圧方式

Country Status (3)

Country Link
EP (1) EP0655731B1 (ja)
JP (1) JP2739811B2 (ja)
DE (1) DE69423703T2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3591068B2 (ja) * 1995-06-30 2004-11-17 ソニー株式会社 音声信号の雑音低減方法
US7225001B1 (en) 2000-04-24 2007-05-29 Telefonaktiebolaget Lm Ericsson (Publ) System and method for distributed noise suppression
KR101235830B1 (ko) 2007-12-06 2013-02-21 한국전자통신연구원 음성코덱의 품질향상장치 및 그 방법
KR20140061285A (ko) * 2010-08-11 2014-05-21 본 톤 커뮤니케이션즈 엘티디. 사생활 보호 및 개인적 사용을 위한 배경 소리 제거 시스템, 방법 및 매체
JP6759898B2 (ja) 2016-09-08 2020-09-23 富士通株式会社 発話区間検出装置、発話区間検出方法及び発話区間検出用コンピュータプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU633673B2 (en) * 1990-01-18 1993-02-04 Matsushita Electric Industrial Co., Ltd. Signal processing device
KR950013551B1 (ko) * 1990-05-28 1995-11-08 마쯔시다덴기산교 가부시기가이샤 잡음신호예측장치
JPH05188994A (ja) * 1992-01-07 1993-07-30 Sony Corp 騒音抑圧装置

Also Published As

Publication number Publication date
JPH07152395A (ja) 1995-06-16
DE69423703D1 (de) 2000-05-04
DE69423703T2 (de) 2000-07-27
EP0655731A2 (en) 1995-05-31
EP0655731B1 (en) 2000-03-29
EP0655731A3 (en) 1997-05-28

Similar Documents

Publication Publication Date Title
KR100647336B1 (ko) 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법
CN104395958B (zh) 数字音频信号中的有效前回声衰减
KR101748517B1 (ko) 제 1 인코딩 알고리즘 및 고조파 감소를 이용하는 제 2 인코딩 알고리즘 중 하나를 선택하기 위한 장치 및 방법
EP1096476B1 (en) Speech signal decoding
JP4180677B2 (ja) 音声符号化並びに復号化方法及びその装置
EP1386313B1 (en) Speech enhancement device
KR20070007851A (ko) 계층 부호화 장치 및 계층 부호화 방법
US6246979B1 (en) Method for voice signal coding and/or decoding by means of a long term prediction and a multipulse excitation signal
JPH07160294A (ja) 音声復号装置
JP2739811B2 (ja) 雑音抑圧方式
JP3558031B2 (ja) 音声復号化装置
CN112086107B (zh) 用于辨别和衰减前回声的方法、设备、解码器和存储介质
JPWO2014034697A1 (ja) 復号方法、復号装置、プログラム、及びその記録媒体
JPH087597B2 (ja) 音声符号化器
JP3417362B2 (ja) 音声信号復号方法及び音声信号符号化復号方法
EP1100076A2 (en) Multimode speech encoder with gain smoothing
JP3089967B2 (ja) 音声符号化装置
JP2853170B2 (ja) 音声符号化復号化方式
JP3785363B2 (ja) 音声信号符号化装置、音声信号復号装置及び音声信号符号化方法
JPH08272394A (ja) 音声符号化装置
JP2001147700A (ja) 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体
JP2658438B2 (ja) 音声符号化方法とその装置
JPH1138998A (ja) 雑音抑圧装置および雑音抑圧処理プログラムを記録した記録媒体
JPH08211895A (ja) ピッチラグを評価するためのシステムおよび方法、ならびに音声符号化装置および方法
JPH1138999A (ja) 雑音抑圧装置および雑音抑圧処理プログラムを記録した記録媒体

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19971224

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080123

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090123

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100123

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110123

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110123

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120123

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130123

Year of fee payment: 15

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130123

Year of fee payment: 15

EXPY Cancellation because of completion of term