JP3183104B2 - ノイズ削減装置 - Google Patents

ノイズ削減装置

Info

Publication number
JP3183104B2
JP3183104B2 JP17848495A JP17848495A JP3183104B2 JP 3183104 B2 JP3183104 B2 JP 3183104B2 JP 17848495 A JP17848495 A JP 17848495A JP 17848495 A JP17848495 A JP 17848495A JP 3183104 B2 JP3183104 B2 JP 3183104B2
Authority
JP
Japan
Prior art keywords
spectrum
noise
unit
noise reduction
fourier transform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP17848495A
Other languages
English (en)
Other versions
JPH0934497A (ja
Inventor
利幸 森井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP17848495A priority Critical patent/JP3183104B2/ja
Priority to US08/559,667 priority patent/US5774846A/en
Priority to EP03024767A priority patent/EP1391879A3/en
Priority to EP95118647A priority patent/EP0718820B1/en
Priority to EP03024766A priority patent/EP1391878A3/en
Priority to DE69532879T priority patent/DE69532879T2/de
Publication of JPH0934497A publication Critical patent/JPH0934497A/ja
Priority to US09/059,568 priority patent/US6067518A/en
Priority to US09/475,248 priority patent/US6167373A/en
Priority to US09/475,249 priority patent/US6205421B1/en
Application granted granted Critical
Publication of JP3183104B2 publication Critical patent/JP3183104B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ディジタル携帯電話や
マルチメディア通信等に必要な音声符号化・復号化装置
(音声コーデック)や、機器のガイド音声出力等に必要
な音声合成装置を構成するための、ディジタル音声信号
を処理する装置に関するものである。
【0002】
【従来の技術】携帯電話等のディジタル移動通信の分野
では加入者の増加に対処するために低ビットレートの音
声の圧縮符号化法が求められており、各研究機関におい
て研究開発が進んでいる。日本国内においてはモトロー
ラ社の開発したビットレート11.2kbpsのVSE
LPという符号化法がディジタル携帯電話用の標準符号
化方式として採用された。(同方式を搭載したディジタ
ル携帯電話は1994年秋に国内において発売され
た。)また更に、NTT移動通信網株式会社の開発した
ビットレート5.6kbpsのPSI−CELPという
符号化方式が次期携帯電話の標準化方式として採用さ
れ、現在製品開発の段階にある。これらの方式はいずれ
もCELP(Code Exited Linear
Prediction)方式を改良したものである。こ
れは音声を音源情報と声道情報とに分離し、音源情報に
ついては符号帳に格納された複数の音源サンプルのイン
デクスによって符号化し声道情報についてはLPC(線
形予測係数)を符号化するということと、音源情報符号
化の際には声道情報を加味して入力音声と比較を行なう
という方法(A−b−S:Analysis by S
ynthesis)を採用していることに特徴がある。
【0003】上記技術により非常に低ビットレートで音
声信号を伝送することができるようになったが、それと
共に大きな問題点が明らかになった。それは、音声の発
声モデルに基づいて情報圧縮を行っているために、音声
信号以外の音響信号に対応できないという点である。そ
のため、音声信号中に背景ノイズや機器ノイズが含まれ
ていると、効率の良い符号化ができず、合成時(復号化
時)に異音を生じる結果となっていた。この問題を解決
するために、従来より入力音声信号からノイズを削減す
る手法が検討されてきた。上記標準化方式のPSI−C
ELPでは、符号化を行う前にノイズキヤンセラによっ
てノイズを削減するという処理を行っている。上記ノイ
ズキャンセラは、カルマンフィルタを基本として開発さ
れており、音声の有無を検出して適応的に制御を行うこ
とによりノイズを低減させている。このノイズキャンセ
ラによって、ある程度の背景ノイズを削減することがで
きる。しかし、ノイズレベルの高いノイズや、音声中の
ノイズ等に対しては余り良い性能が得られていなかっ
た。
【0004】一方、より強力なノイズ低減法として、ス
ペクトルサブトラクション法が(「サスペンション・オ
ブ・アコースティック・ノイズ・イン・スピーチ・ユー
ジング・スペクトラル・サブストラクション」エス.エ
フ.ボール著、アイ.イー.イー.イー.トランス.エ
ー.エス.エス.ピー.(S.F.Boll "Suppression ofAc
oustic Noise in Speech Using Spectral Subtractio
n",IEEE Trans.ASSP.,Vol.27,No.2,pp113-120,1979))
に記載されている。これは、入力音声信号に対して離散
フーリエ変換を行ないスペクトルに変換した後、ノイズ
をスペクトル上で減ずる方法であり、主に音声認識装置
の入力部等に応用されている。この方法を音声信号中の
ノイズ低減に応用した一例について図3を用いて説明す
る。まず、ノイズスペクトルの推定は次の手順で行われ
る。まず、音声を含んでいないノイズのみの信号31を
入力し、A/D変換部32においてディジタル信号に変
換する。次に一定時間の入力信号列(フレームと呼ぶ)
に対して離散フーリエ変換をフーリエ変換部33で行
い、ノイズのスペクトルを求める。そして、これを複数
のフレームに対して求めたノイズのスペクトルからノイ
ズの平均的スペクトルをノイズ分析部34で求め、これ
をノイズスペクトル格納部35に格納する。そして、ノ
イズの削減は以下の手順で行われる。まず、ノイズを含
む音声信号36を入力し、A/D変換部37においてデ
ィジタル信号に変換する。次に、上記と同様にして離散
フーリエ変換をフーリエ変換部38で行い、ノイズを含
んだ音声のスペクトルを求める。そしてノイズ削減部3
9で、ノイズスペクトル格納部35に格納されたノイズ
スペクトルを音声のスペクトルから減ずる。そして、そ
の結果得られたスペクトルに対して逆フーリエ変換を逆
フーリエ変換部40で行い、出力信号41を得る。な
お、このアルゴリズムにおけるスペクトルとしては振幅
スペクトル(複素数の複素平面上でのノルム、実数部と
虚数部を2乗して加算し、平方根をとることによって求
められる。)を用いるのが一般的である。また、振幅ス
ペクトルで減じた場合、逆フーリエ変換を行う時の位相
成分としては、入力信号の位相成分をそのまま用いると
いう方法が挙げられる。
【0005】上記スペクトルサブトラクション法は、よ
り強力なノイズ低減方法であるが、ノイズ推定方法やコ
スト(メモリ容量、計算量)等の問題があるために、こ
れまでのリアルタイムの音声処理装置に用いられた例は
少なかった。
【0006】
【発明が解決しようとする課題】ノイズを含んだ音声信
号からノイズを低減させる方法として、従来はカルマン
フィルタのような方法が用いられていた。より強力なノ
イズ低減方法としてスペクトルサブトラクション法が挙
げられるが、上記スペクトルサブトラクション法をリア
ルタイムの音声処理装置に応用するためには、次の様な
課題を有していた。 (1)音声がどのタイミングでデータ中に存在するかが
明らかでないために、ノイズスペクトル推定が困難であ
る。 (2)計算量が多い。 (3)必要なRAM容量が多い。 (4)ノイズレベルが高い時にスペクトルが大きく歪
み、音質の劣化を生ずる。
【0007】本発明は上記従来の課題を解決するもの
で、少ない計算量およびRAM容量でノイズスペクトル
推定が容易にでき、ノイズレベルが高い場合でも音質劣
化を防ぐことができるノイズ削減装置を提供することを
目的とする。
【0008】
【課題を解決するための手段】この目的を達成するため
に本発明のノイズ削減装置は、入力音声信号をディジタ
ル信号に変換するA/D変換部と、削減するノイズ量を
制御する係数を調節するノイズ削減係数調節部と、前記
A/D変換部により得られる一定時間長(1フレーム)
のディジタル信号に対して線形予測分析(LPC分析)
を行うLPC分析部と、前記A/D変換部により得られ
る一定時間長(1フレーム)のディジタル信号に対して
離散フーリエ変換を行うフーリエ変換部と、推定された
ノイズのスペクトルが格納されているノイズスペクトル
格納部と、前記フーリエ変換部により得られる入力スペ
クトルと前記ノイズスペクトル格納部に格納されている
ノイズスペクトルとを比較することによってノイズのス
ペクトルを推定して得られたノイズスペクトルを前記ノ
イズスペクトル格納部に格納するノイズ推定部と、前記
ノイズ削減係数調節部により得られる係数に基づいて前
記ノイズスペクトル格納部に格納されているノイズスペ
クトルを前記フーリエ変換部により得られる入力信号の
スペクトルから減ずるノイズ削減部と、前記ノイズ削減
部により得られるスペクトルを調べて減じ過ぎた周波数
のスペクトルを補償するスペクトル補償部と、前記スペ
クトル補償部により得られるスペクトルと前記フーリエ
変換部により得られる位相とに基づいて逆フーリエ変換
を行う逆フーリエ変換部と、前記逆フーリエ変換部によ
り得られる音響信号に対してスペクトル強調を行うスペ
クトル強調部と、前記スペクトル強調部により得られる
信号を前のフレームの信号と整合させる波形整合部とを
具備する構成を有している。
【0009】
【作用】この構成によって本発明は第1に、音声区間中
でも音声区間外でもノイズスペクトル推定を行うことが
できるので、ノイズスペクトル推定が容易にできる。ま
た、入力のスペクトル包絡の特徴を線形予測係数で強調
することができるので、ノイズレベルが高い場合でも音
質の劣化を防止できる。
【0010】また第2には、振幅スペクトルを求める際
に必要な平方根の計算が省略できるので、少ない計算量
で処理できる。
【0011】また第3には、連続する複数フレームの振
幅スペクトルの最低値を各周波数毎に求めることがで
き、これをノイズスペクトルとすることによって音声が
含まれている区間においてもノイズスペクトルの推定が
容易にできる。
【0012】また第4には、ノイズスペクトル格納部を
構成するためのRAM領域を数分の1に削減することが
できるので、少ないRAM容量で処理できる。また、長
く持続する単音をノイズと誤判定することを防ぐことも
できる。
【0013】また第5には、ノイズの穏やかな変化に適
応することができるので、ノイズスペクトル推定が容易
にできる。
【0014】また第6には、穏やかに変化するノイズに
適応したノイズスペクトル推定が可能になり、ノイズス
ペクトル推定が容易にできる。
【0015】また第7には、実際よりも低く推定される
ノイズレベルを実際のノイズレベルまで引き上げること
ができ、より適したノイズ削減が可能になるので、ノイ
ズスペクトル推定が容易にできる。
【0016】また第8には、補償された周波数の異音感
を低減すると同時に音声を含んでいない区間のパワーを
低減させることができるので、ノイズレベルが高い場合
でも音質の劣化を防止できる。
【0017】また第9には、ノイズ削減によって生じた
スペクトル歪みを補正し、聴感的に音質を向上させるこ
とができるので、ノイズレベルが高い場合でも音質の劣
化を防止できる。
【0018】
【実施例】
(実施例1)以下、本発明の1の実施例について、図1
を用いて説明する。
【0019】まず、図1に示すノイズ削減装置の各構成
要素を簡単に説明する。11は入力音声である。12は
アナログ信号をデジタル信号に変換するA/D変換部で
ある。13は安定化係数を格納する安定化係数格納部で
ある。14は、安定家系数格納部13に格納された安定
化係数を参照して、ノイズの削減量を制御するための係
数であるノイズ削減係数を調節するノイズ削減係数調節
部である。15は入力されたディジタル信号をメモリに
セットする入力波形設定部である。16は入力波形設定
部で設定されたディジタル信号に対してLPC分析を行
うLPC分析部である。17は同ディジタル信号に対し
てフーリエ変換を行うフーリエ変換部である。18は、
ノイズ削減係数調節部14で得られた安定化係数に基づ
き、フーリエ変換部17で得られたスペクトルから、ノ
イズスペクトル格納部25に格納されたノイズスペクト
ルを減ずるノイズ削減部である。19は、前スペクトル
格納部26に格納されたスペクトルを参照して、ノイズ
削減部18で得られたスペクトルの補償を行うスペクト
ル補償部である。20は、スペクトル補償部で得られた
スペクトルと、フーリエ変換部17で得られた位相スペ
クトルとを基に、逆フーリエ変換を行う逆フーリエ変換
部である。21は、LPC分析部16で得られたLPC
係数に基づき逆フーリエ変換部20で得られた信号のス
ペクトル強調を行うスペクトル強調部である。22は、
スペクトル強調部で得られた信号と前の処理区間の信号
とを整合させる波形整合部である。23は出力信号であ
る。24は、フーリエ変換部17で得られたスペクトル
に基づき、ノイズのスペクトルを推定するノイズ推定部
である。25は、ノイズ推定部24で得られたノイズス
ペクトルを格納するノイズスペクトル格納部である。2
6は前の処理区間のスペクトルを格納する前スペクトル
格納部である。27は出力信号23の波形を格納する前
波形格納部である。
【0020】次に、上記構成のノイズ削減装置の動作を
説明する。まず、入力音声信号11をA/D変換部12
でディジタル信号に変換する。前の処理区間の状態を参
照してノイズ削減係数をノイズ削減係数調整部14で調
節した後、LPC分析部16においてLPC分析によっ
てLPC係数を得る。次に、フーリエ変換17によって
スペクトルに変換し、ノイズのスペクトルをノイズ削減
係数に基づいてノイズ削減部18において減ずる。スペ
クトルが負になった場合は、スペクトル補償部19にお
いてスペクトル補償を行う。得られたスペクトルに対し
て、逆フーリエ変換部20において逆フーリエ変換を行
い信号を得る。更に、スペクトル強調部21においてL
PC係数を用いて極強調等のスペクトル強調処理を行
い、波形整合部22から出力信号を得る。
【0021】以下、本実施例のアルゴリズムの詳細な説
明を行う。まず、本実施例を実現するための、種々の固
定パラメータの名称と設定例とを以下に示す。
【0022】・フレーム長(設定例:160(8kHz
サンプリングデータで20msec)) ・先読みデータ長(設定例:60(8kHzサンプリン
グデータで7.5msec)) ・指定ノイズ削減係数(設定例:20.0) ・LPC予測次数(設定例:10) ・ノイズスペクトル基準持続数(設定例:100) ・指定最小パワー(設定例:10.0) ・MA強調係数(設定例:0.6) ・AR強調係数(設定例:0.7) ・高域強調係数(設定例:0.3) ・パワー強調係数(設定例:1.2) ・ノイズ基準パワー(設定例:2700.0) 次にスタティックのRAM領域を設定する。まず、安定
化係数格納部13、ノイズスペクトル格納部25、前ス
ペクトル格納部26、前波形格納部27をクリアする。
各格納部の説明と設定例を述べる。安定化係数格納部
は、ノイズ削減係数を調節するための安定化係数を格納
するエリアであり、初期値として2.0を格納してお
く。ノイズスペクトル格納部25は、1位候補のノイズ
スペクトルと2位候補のノイズスペクトルとそれぞれの
周波数のスペクトル値が何フレーム前に変化したかを示
すフレーム数(以後持続数と呼ぶ)を各周波数毎に格納
するエリアであり、ノイズスペクトルと持続数としてそ
れぞれに充分大きな数を初期値として格納しておく。ま
た、前スペクトル格納部26は、1つ前のフレームのス
ペクトル(前スペクトルと呼ぶ)と1つ前のフレームの
パワー(前パワーと呼ぶ)を格納するエリアであり、前
スペクトルとして全ての周波数に指定最小パワーを格納
しておき、前パワーとして0.0を格納しておく。ま
た、前波形格納部27は出力信号を整合させるための前
のフレームの出力信号の最後の先読みデータ長分のデー
タを格納するエリアであり、初期値として全てに0を格
納しておく。
【0023】次にノイズ削減アルゴリズムについて図1
を用いてブロック毎に説明する。まず、音声を含むアナ
ログの入力信号11をA/D変換部12でA/D変換
し、これを1フレーム長+先読みデータ長(上記設定例
では160+60=220ポイント)だけ入力する。
ノイズ削減係数調節部14においては、安定化係数格納
部13に格納された安定化係数と指定ノイズ削減係数を
基に、以下の(数1)によりノイズ削減係数を算出す
る。そして、得られた安定化係数を安定化係数格納部1
3に格納する。
【0024】
【数1】
【0025】安定化係数はノイズが含まれており、且つ
安定して推定されているかどうかを示す値であり、小さ
いほどより安定であることを示している。
【0026】入力波形設定部15においては、A/D変
換部12において入力された入力信号を、高速フーリエ
変換(FFT)するために、2の指数乗の長さを持つメ
モリ配列に後ろ詰めで書込む。前の部分は0を詰めてお
く。前述の設定例では256の長さの配列に0〜35ま
で0を書込み、36〜255までに入力信号を書込む。
この配列は8次のFFTの際に実数部として用いられ
る。また、虚数部として、実数部と同じ長さの配列を用
意し、全てに0を書込んでおく。
【0027】LPC分析部16においては、入力波形設
定部15で設定した実数部エリアに対してハミング窓を
掛け、窓掛け後の波形に対して自己相関分析を行って自
己相関係数を求め、自己相関法に基づくLPC分析を行
い、線形予測係数を得る。さらに、得られた線形予測係
数と、予め設定したMA強調係数、AR強調係数を用い
て、以下の(数2)の式に基づき、スペクトル強調部2
1で使用する極強調フィルタのMA係数とAR係数とを
算出する。
【0028】
【数2】
【0029】フーリエ変換部17では、入力波形設定部
15で得られる実数部、虚数部のメモリ配列を用いて、
FFTによる離散フーリエ変換を行う。得られた複素ス
ペクトルの実数部と虚数部の絶対値の和を計算すること
によって入力信号の疑似振幅スペクトル(以下に入力ス
ペクトルと呼ぶ)を求める。また、各周波数の入力スペ
クトル値の総和(以下に入力パワーと呼ぶ)を求める。
【0030】次にノイズ推定部24における処理を説明
する。まず、ノイズスペクトル格納部25に格納されて
いる1位候補、2位候補の全ての周波数の持続数を更新
する(1を加算する)。そして、1位候補の各周波数の
持続数を調べ、予め設定したノイズスペクトル基準持続
数より大きい場合は、2位候補のスペクトルと持続数を
1位候補とし、3位候補のスペクトルを2位候補のスペ
クトルとし持続数を0とする。ただし、この2位候補の
スペクトルの入れ替えにおいては、3位候補を格納せ
ず、2位候補を若干大きくしたもので代用することによ
って、メモリを節約することができる。本実施例では、
2位候補のスペクトルを1.2倍したものを代用するこ
ととする。
【0031】そして、持続数の更新の後に、各周波数毎
に、ノイズスペクトルと入力スペクトルの比較を行う。
まず、各周波数の入力スペクトルを1位候補のノイズス
ペクトルと比較し、もし入力スペクトルの方が小さい場
合は、1位候補のノイズスペクトルと持続数を2位候補
とし、入力スペクトルを1位候補のスペクトルとし1位
候補の持続数は0とする。前記の条件以外の場合は、入
力スペクトルと2位候補のノイズスペクトルとの比較を
行い、もし入力スペクトルの方が小さい場合は、入力ス
ペクトルを2位候補のスペクトルとし2位候補の持続数
は0とする。そして、得られた1、2位候補のスペクト
ルと持続数をノイズスペクトル格納部25に格納する。
【0032】上記ノイズ推定処理において、1つの周波
数のノイズスペクトルを複数の周波数の入力スペクトル
と対応させれば、ノイズスペクトル格納部25を構成す
るためのRAM容量を節約することができる。例とし
て、本実施例の256ポイントのFFTを用いる場合
に、1つの周波数のノイズスペクトルを4つの周波数の
入力スペクトルから推定するときのノイズスペクトル格
納部25のRAM容量を示す。(疑似)振幅スペクトル
が周波数軸上で左右対称であることを考慮すると、全て
の周波数で推定する場合は128個の周波数のスペクト
ルと持続数を格納するので、128(周波数)×2(ス
ペクトルと持続数)×2(1、2位候補)で計512W
のRAM容量が必要になる。これに対して、1つの周波
数のノイズスペクトルを4つの周波数の入力スペクトル
と対応させる場合は、32(周波数)×2(スペクトル
と持続数)×2(1、2位候補)で計128WのRAM
容量でよいことになる。この場合、ノイズスペクトルの
周波数解像度は低下することになるが、上記1対4の場
合は殆ど性能の劣化がないことを実験により確認してい
る。また、この発明は、1つの周波数のスペクトルでノ
イズスペクトルを推定しないことから、定常音(サイン
波、母音等)が長時間続いた場合に、そのスペクトルを
ノイズスペクトルと誤推定することを防ぐ効果もある。
【0033】さらに、上記ノイズスペクトル推定の後、
1位候補のノイズスペクトルの総和を求める(以後これ
をノイズパワーと呼ぶ)。そして、このノイズパワーが
ノイズ基準パワーよりも小さい時、ノイズが含まれてい
ないとして、安定化係数格納部13に格納されている安
定化係数を3.0として安定化係数格納部13に格納す
る。この処理により、入力信号にノイズが含まれていな
いことをノイズ削減係数調整部14に伝えることができ
る。よって、ノイズが含まれていないときに、ノイズ削
減係数を小さくすることができ、したがってノイズ削減
に伴う音声のスペクトル歪みを小さくすることができ
る。
【0034】次に、ノイズ削減部18における処理につ
いて説明する。まず、入力スペクトルからノイズスペク
トル格納部25に格納されている1位候補のノイズスペ
クトルにノイズ削減係数調節部14で得られたノイズ削
減係数を乗じたものを引く(以後、差スペクトルと呼
ぶ)。上記ノイズ推定部24の説明において示したノイ
ズスペクトル格納部25のRAM容量の節約を行った場
合は、入力スペクトルに対応する周波数のノイズスペク
トルに削減係数を乗じたものを引く。
【0035】次に、スペクトル補償部19における処理
について説明する。まず、安定化係数格納部13に格納
された安定化係数を参照し、これが1.4よりも大きい
場合は、前スペクトル格納部26に入力スペクトルを格
納する。次に、ノイズ削減部18で得られた差スペクト
ルを調べ、負である場合は、その周波数における入力ス
ペクトルと前スペクトル格納部26に格納された前フレ
ームのスペクトルとのうち小さい方の値とする。(この
処理後の差スペクトルを以後出力スペクトルと呼ぶ。)
そして、出力スペクトルを前スペクトル格納部26へ格
納する。(なお、この補償に、前スペクトルを用いず
に、入力スペクトル、又は入力スペクトルに係数を乗じ
たもののみを用いれば、さらにメモリ容量が節約でき
る。)ここで、音声が含まれていないノイズ区間のパワ
ーの変動による異音を抑えるために、前スペクトル格納
部26に格納された前フレームのパワーを用いてパワー
のスムージングを行う。処理の流れについて以下に説明
する。まず、出力スペクトルの総和を求める。(以後こ
れを出力パワーと呼ぶ。)次に、安定化係数格納部13
に格納された安定化係数を参照し、これが1.4よりも
大きい場合は、前スペクトル格納部26に前パワーとし
て出力パワーを格納する。そして、出力パワーが前パワ
ーの1.8倍よりも小さく、且つ、前パワーがノイズパ
ワーにノイズ削減係数と1.4を乗じたものよりも小さ
い場合に、以下の手順でスムージングを行う。
【0036】まず、以下の(数3)によって前パワーを
変換する。
【0037】
【数3】
【0038】そして、前スペクトルを出力スペクトルと
し、前パワーと共に前スペクトル格納部26に格納す
る。
【0039】逆フーリエ変換部20では、フーリエ変換
部17で得られた位相成分とスペクトル補償部19で得
られた出力スペクトルとに基づき、複素スペクトルを構
成し、FFTを用いて逆フーリエ変換を行う。(得られ
た信号を第1次出力信号と呼ぶ。) さらに、スペクトル強調部21における処理について説
明する。
【0040】まず、逆フーリエ変換部20において得ら
れた第1次出力信号に対して、LPC分析部16におい
て得られたMA係数とAR係数とを用いて極強調フィル
タを掛ける。このフィルタの伝達関数を以下の(数4)
に示す。
【0041】
【数4】
【0042】更に、高域成分を強調するために、予め設
定した高域強調係数を用いて、高域強調フィルタを掛け
る。このフィルタの伝達関数を以下の(数5)に示す。
【0043】
【数5】
【0044】更に、パワーを強調するために、予め設定
したパワー強調係数を信号に乗ずる。(この処理によっ
て得られた信号を第2次出力信号と呼ぶ。) 最後に、波形整合部22において、スペクトル強調部2
1で得られた第2次出力信号と、前波形格納部27に格
納された信号を三角窓によって重ね合せて出力信号を得
る。更に、この出力信号の最後の先読みデータ長分のデ
ータを前波形格納部27に格納する。このときの整合方
法を以下の(数6)に示す。
【0045】
【数6】
【0046】ここで注意が必要なのは、出力信号として
は先読みデータ長+フレーム長分のデータが出力される
が、この内信号として扱うことができるのはデータの始
端からフレーム長の長さの区間のみということである。
なぜなら、後ろの先読みデータ長のデータは次の出力信
号を出力するときに書き換えられるからである。ただ
し、出力信号の全区間内では連続性は補償されるので、
LPC分析やフィルタ分析等周波数分析には使用でき
る。
【0047】ここで、上記構成によるノイズ削減装置の
性能を評価するために、音声符号化装置(CELP方式
が基本)の音声入力部に本発明のノイズ削減装置を使用
して、音声符号化・復号化実験を行った。従来例で示し
た通り、現在の音声符号化装置、音声コーデックにおけ
る重大な課題は、入力音声に重畳しているノイズが符号
化・復号化後に異音になり、合成音が聞きづらくなると
いうことである。そこで、音声符号化・復号化で得られ
る合成音声を多数の試聴者に聞かせ、主観評価実験を行
った。
【0048】評価サンプルは図2に示すシステムにより
作成した。まず、ノイズを含む音声信号をまず本発明の
ノイズ削減装置に入力し、ノイズを削減する。次に、削
減後の信号を音声符号化装置に入力し符号を得る。そし
て、得られた符号を音声復号化装置に入力し、出力信号
を得る。そして、この出力信号をサンプルとして試聴実
験を行った。また、リファレンス用としては、ノイズ削
減装置を介さずに入力信号を音声符号化装置へ直接入力
することによって得られた出力信号を用いた。
【0049】ノイズ削減装置は上記実施例に示した設定
例の通りに作成した。メモリ容量はスタティックRAM
が約300W、ダイナミックRAMが約1.4kW、処
理量は約3MOPSである。
【0050】また、音声サンプルは男女2名づつ計4名
分の日本語短文データ(それぞれ2〜3秒間)でサンプ
リングレートは8kHz、ノイズの無い音声データであ
る。ノイズ付加データは、前述のノイズ無しデータに道
路騒音をS/N比20dBで付加することによって作成
した。また、試聴者は男女計16名である。評価は、5
段階(1:大変悪い、2:悪い、3:普通、4:良い、
5:大変良い)で行い、各評価者、各データについて得
られた評価値を平均してMOS(Mean OpinionScore)
を求めた。結果を以下の表1に示す。
【0051】
【表1】
【0052】これを見るとわかるように、ノイズの無い
データでは3.5という高いMOS値が得られている。
しかし、ノイズが含まれると異音感が増加し、ノイズ削
減装置を用いない場合は、MOS値で3.13と大きく
音質が劣化する。しかし、本発明のノイズ削減装置を用
いると、ノイズが削減され音質の劣化が起こらず、3.
5とノイズの無いときの音質とほぼ同じMOS値が得ら
れるようになった。
【0053】上記の実験から本発明の効果が高いことが
検証できた。
【0054】
【発明の効果】以上のように本発明は、第1に音声区間
中でも音声区間外でもノイズスペクトル推定を行うこと
ができ、音声がどのタイミングでデータ中に存在するか
が明らかでない場合でもノイズスペクトルを推定するこ
とができる。また、入力のスペクトル包絡の特徴を線形
予測係数で強調することができ、ノイズレベルが高い場
合でも音質の劣化を防ぐことができる。
【0055】第2に、振幅スペクトルを求める際に必要
な平方根の計算が省略でき、計算量を節約することがで
きる。
【0056】第3に、連続する複数フレームの振幅スペ
クトルの最低値を各周波数毎に求めることができ、これ
をノイズスペクトルとすることによって音声が含まれて
いる区間においてもノイズスペクトルの推定が容易にで
き、音声がどのタイミングでデータ中に存在するかが明
らかでない場合でもノイズスペクトルを推定することが
できる。
【0057】第4に、ノイズスペクトル格納部を構成す
るためのRAM領域を数分の1に削減することができ、
RAM容量を節約することができる。また、この発明に
より、長く持続する単音をノイズと誤判定することを防
ぐこともできる。
【0058】第5に、ノイズの穏やかな変化に適応する
ことができ、音声がどのタイミングでデータ中に存在す
るかが明らかでない場合でもノイズスペクトルを推定す
ることができる。
【0059】第6に、穏やかに変化するノイズに適応し
たノイズスペクトル推定が可能になり、音声がどのタイ
ミングでデータ中に存在するかが明らかでない場合でも
ノイズスペクトルを推定することができる。
【0060】第7に、実際よりも低く推定されるノイズ
レベルを実際のノイズレベルまで引き上げることがで
き、より適したノイズ削減が可能になり、音声がどのタ
イミングでデータ中に存在するかが明らかでない場合で
もノイズスペクトルを推定することができる。
【0061】第8に、補償された周波数の異音感を低減
すると同時に音声を含んでいない区間のパワーを低減さ
せることができ、ノイズレベルが高い場合でも音質の劣
化を防ぐことができる。
【0062】第9に、ノイズ削減によって生じたスペク
トル歪みを補正し、聴感的に音質を向上させることがで
き、ノイズレベルが高い場合でも音質の劣化を防ぐこと
ができる。
【図面の簡単な説明】
【図1】本発明のノイズ削減装置のブロック結線図
【図2】本発明の効果を評価するための評価データの作
成方法を示した図
【図3】従来のスペクトルサブトラクションによるノイ
ズ削減装置のブロック結線図
【符号の説明】
11 入力信号 12 A/D変換部 13 安定化係数格納部 14 ノイズ削減係数調節部 15 入力波形設定部 16 LPC分析部 17 フーリエ変換部 18 ノイズ削減部 19 スペクトル補償部 20 逆フーリエ変換部 21 スペクトル強調部 22 波形整合部 23 出力音声 24 ノイズ推定部 25 ノイズスペクトル格納部 26 前スペクトル格納部 27 前波形格納部 51 入力信号 52 ノイズ削減装置 53 音声符号化装置 54 音声復号化装置 55 出力信号 31 ノイズのみの入力信号 32 A/D変換部 33 フーリエ変換部 34 ノイズ分析部 35 ノイズスペクトル格納部 36 ノイズを含む入力信号 37 A/D変換部 38 フーリエ変換部 39 ノイズ削減部 40 逆フーリエ変換部 41 出力信号
フロントページの続き (56)参考文献 欧州特許出願公開718820(EP,A 2) 米国特許5774846(US,A) 米国特許6067518(US,A) 米国特許6167373(US,A) 電子情報通信学会技術研究報告[音声 ],Vol.93,No.463,SP93− 139,大室仲外「PSI−CELP音声 符号化の可変ビットレート化に関する検 討」,p.9−16(1994年2月17日発 行) 電子情報通信学会技術研究報告[音声 ],Vol.95,No.355,SP95− 80,森井利幸外「音声の短時間的特徴に 対応したマルチモードCELP符号 化」,p.55−62(1995年11月16日発 行) Proceedings of 1996 IEEE 46th Vehcular Technology Confer ence,N.Tanaka et a l,”A Multi−Mode Va riable Rate Speech Coder for CDMA Ce llular Systems”,p. 198−202,April 28−May 1,1996,Atlanta,Gerog ia,USA (58)調査した分野(Int.Cl.7,DB名) G10L 15/20 G10L 21/02 JICSTファイル(JOIS)

Claims (9)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力音声信号をディジタル信号に変換す
    るA/D変換部と、削減するノイズ量を制御する係数を
    調節するノイズ削減係数調節部と、前記A/D変換部に
    より得られる一定時間長(1フレーム)のディジタル信
    号に対して線形予測分析(LPC分析)を行うLPC分
    析部と、前記A/D変換部により得られる一定時間長
    (1フレーム)のディジタル信号に対して離散フーリエ
    変換を行うフーリエ変換部と、推定されたノイズのスペ
    クトルが格納されているノイズスペクトル格納部と、前
    記フーリエ変換部により得られる入力スペクトルと前記
    ノイズスペクトル格納部に格納されているノイズスペク
    トルとを比較することによってノイズのスペクトルを推
    定して得られたノイズスペクトルを前記ノイズスペクト
    ル格納部に格納するノイズ推定部と、前記ノイズ削減係
    数調節部により得られる係数に基づいて前記ノイズスペ
    クトル格納部に格納されているノイズスペクトルを前記
    フーリエ変換部により得られる入力信号のスペクトルか
    ら減ずるノイズ削減部と、前記ノイズ削減部により得ら
    れるスペクトルを調べて減じ過ぎた周波数のスペクトル
    を補償するスペクトル補償部と、前記スペクトル補償部
    により得られるスペクトルと前記フーリエ変換部により
    得られる位相とに基づいて逆フーリエ変換を行う逆フー
    リエ変換部と、前記逆フーリエ変換部により得られる音
    響信号に対してスペクトル強調を行うスペクトル強調部
    と、前記スペクトル強調部により得られる信号を前のフ
    レームの信号と整合させる波形整合部とを具備するノイ
    ズ削減装置。
  2. 【請求項2】 フーリエ変換部が、離散フーリエ変換を
    行って得られる複素スペクトルの実数部と虚数部の絶対
    値の和を計算することによって疑似的な振幅スペクトル
    を得るものである請求項1記載のノイズ削減装置。
  3. 【請求項3】 ノイズ推定部が、フーリエ変換部により
    得られる入力信号のスペクトルを各周波数毎にノイズス
    ペクトルと大小比較し、前記入力信号のスペクトルが前
    記ノイズスペクトルより小さい場合に、その周波数のノ
    イズスペクトルを入力信号のスペクトルとすることによ
    ってノイズスペクトルを推定するものである請求項1記
    載のノイズ削減装置。
  4. 【請求項4】 ノイズ推定部が、1つの周波数のノイズ
    スペクトルが複数の周波数の入力信号のスペクトルに対
    応しており、ノイズスペクトルの各周波数に対してそれ
    と対応する複数の周波数の入力信号のスペクトルとの比
    較を行い、最も小さい値をノイズスペクトルとしてノイ
    ズスペクトル格納部に格納するものである請求項1記載
    のノイズ削減装置。
  5. 【請求項5】 ノイズ推定部が、ノイズスペクトルとし
    て格納されている各周波数のノイズスペクトルが不変で
    あるフレーム数がある固定値以上の場合に、そのスペク
    トル値を強制的に放棄するものである請求項1記載のノ
    イズ削減装置。
  6. 【請求項6】 ノイズ推定部が、ノイズスペクトルの第
    2候補を抽出してノイズスペクトル格納部に格納してお
    き、ノイズスペクトルの放棄の際には、その第2候補に
    入れ替えるものである請求項5記載のノイズ削減装置。
  7. 【請求項7】 ノイズ削減部が、ノイズ削減係数調節部
    にて得られたノイズ削減係数をノイズスペクトル格納部
    に格納されたノイズスペクトルに乗じて、フーリエ変換
    部にて得られた入力信号のスペクトルから減ずるもので
    ある請求項1記載のノイズ削減装置。
  8. 【請求項8】 スペクトル補償部で補償されたスペクト
    ルを格納する前スペクトル格納部を有し、スペクトル補
    償部が、ノイズ削減部で負のスペクトル値となった周波
    数に対して、フーリエ変換部で得られる現フレームのス
    ペクトルと前記前スペクトル格納部に格納されたスペク
    トルとのうち、小さい方を用いて補償し、さらに得られ
    たスペクトルを前記前スペクトル格納部に格納するもの
    である請求項1記載のノイズ削減装置。
  9. 【請求項9】 スペクトル強調部が、逆フーリエ変換部
    にて得られた音響信号に対して、LPC分析部にて得ら
    れた線形予測係数による極強調フィルタ処理、高域強調
    フィルタ処理及びパワー強調処理によるスペクトル強調
    を行うものである請求項1記載のノイズ削減装置。
JP17848495A 1994-12-19 1995-07-14 ノイズ削減装置 Expired - Lifetime JP3183104B2 (ja)

Priority Applications (9)

Application Number Priority Date Filing Date Title
JP17848495A JP3183104B2 (ja) 1995-07-14 1995-07-14 ノイズ削減装置
US08/559,667 US5774846A (en) 1994-12-19 1995-11-20 Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
EP95118647A EP0718820B1 (en) 1994-12-19 1995-11-27 Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
EP03024766A EP1391878A3 (en) 1994-12-19 1995-11-27 Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
EP03024767A EP1391879A3 (en) 1994-12-19 1995-11-27 Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
DE69532879T DE69532879T2 (de) 1994-12-19 1995-11-27 Vorrichtung zur Sprachkodierung, zur linear-prädiktiven Analyse und zur Geräuschverminderung
US09/059,568 US6067518A (en) 1994-12-19 1998-04-14 Linear prediction speech coding apparatus
US09/475,248 US6167373A (en) 1994-12-19 1999-12-30 Linear prediction coefficient analyzing apparatus for the auto-correlation function of a digital speech signal
US09/475,249 US6205421B1 (en) 1994-12-19 1999-12-30 Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17848495A JP3183104B2 (ja) 1995-07-14 1995-07-14 ノイズ削減装置

Publications (2)

Publication Number Publication Date
JPH0934497A JPH0934497A (ja) 1997-02-07
JP3183104B2 true JP3183104B2 (ja) 2001-07-03

Family

ID=16049278

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17848495A Expired - Lifetime JP3183104B2 (ja) 1994-12-19 1995-07-14 ノイズ削減装置

Country Status (1)

Country Link
JP (1) JP3183104B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7180865B2 (ja) 2018-08-31 2022-11-30 株式会社サンセイアールアンドディ 遊技機
KR102548603B1 (ko) * 2021-08-31 2023-07-05 주식회사 코리아라이프라인 축광식 비상구 유도등 표지판

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4434813B2 (ja) 2004-03-30 2010-03-17 学校法人早稲田大学 雑音スペクトル推定方法、雑音抑圧方法および雑音抑圧装置
WO2007100137A1 (ja) * 2006-03-03 2007-09-07 Nippon Telegraph And Telephone Corporation 残響除去装置、残響除去方法、残響除去プログラム及び記録媒体
JP4887978B2 (ja) * 2006-08-28 2012-02-29 パナソニック電工株式会社 集合住宅用インターホンシステム
JP4753821B2 (ja) 2006-09-25 2011-08-24 富士通株式会社 音信号補正方法、音信号補正装置及びコンピュータプログラム
JP5231139B2 (ja) * 2008-08-27 2013-07-10 株式会社日立製作所 音源抽出装置
CN112312258B (zh) * 2020-09-08 2023-04-07 深圳市逸音科技有限公司 一种具有听力防护及听力补偿的智能耳机

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5774846A (en) 1994-12-19 1998-06-30 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5774846A (en) 1994-12-19 1998-06-30 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
US6067518A (en) 1994-12-19 2000-05-23 Matsushita Electric Industrial Co., Ltd. Linear prediction speech coding apparatus
US6167373A (en) 1994-12-19 2000-12-26 Matsushita Electric Industrial Co., Ltd. Linear prediction coefficient analyzing apparatus for the auto-correlation function of a digital speech signal

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Proceedings of 1996 IEEE 46th Vehcular Technology Conference,N.Tanaka et al,"A Multi−Mode Variable Rate Speech Coder for CDMA Cellular Systems",p.198−202,April 28−May 1,1996,Atlanta,Gerogia,USA
電子情報通信学会技術研究報告[音声],Vol.93,No.463,SP93−139,大室仲外「PSI−CELP音声符号化の可変ビットレート化に関する検討」,p.9−16(1994年2月17日発行)
電子情報通信学会技術研究報告[音声],Vol.95,No.355,SP95−80,森井利幸外「音声の短時間的特徴に対応したマルチモードCELP符号化」,p.55−62(1995年11月16日発行)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7180865B2 (ja) 2018-08-31 2022-11-30 株式会社サンセイアールアンドディ 遊技機
KR102548603B1 (ko) * 2021-08-31 2023-07-05 주식회사 코리아라이프라인 축광식 비상구 유도등 표지판

Also Published As

Publication number Publication date
JPH0934497A (ja) 1997-02-07

Similar Documents

Publication Publication Date Title
US7035797B2 (en) Data-driven filtering of cepstral time trajectories for robust speech recognition
KR100726960B1 (ko) 음성 처리에서의 인위적인 대역폭 확장 방법 및 장치
US6263307B1 (en) Adaptive weiner filtering using line spectral frequencies
US7181402B2 (en) Method and apparatus for synthetic widening of the bandwidth of voice signals
US6988066B2 (en) Method of bandwidth extension for narrow-band speech
US7216074B2 (en) System for bandwidth extension of narrow-band speech
US8249861B2 (en) High frequency compression integration
EP1739657B1 (en) Speech signal enhancement
US5706395A (en) Adaptive weiner filtering using a dynamic suppression factor
US8706497B2 (en) Speech signal restoration device and speech signal restoration method
US20070124140A1 (en) Method for extending the spectral bandwidth of a speech signal
EP1638083A1 (en) Bandwidth extension of bandlimited audio signals
US20100198588A1 (en) Signal bandwidth extending apparatus
US20100057476A1 (en) Signal bandwidth extension apparatus
EP1252621A1 (en) System and method for modifying speech signals
EP0929891B1 (en) Methods and devices for noise conditioning signals representative of audio information in compressed and digitized form
Pulakka et al. Speech bandwidth extension using gaussian mixture model-based estimation of the highband mel spectrum
US9947341B1 (en) Real-time voice masking in a computer network
US7606702B2 (en) Speech decoder, speech decoding method, program and storage media to improve voice clarity by emphasizing voice tract characteristics using estimated formants
Pulakka et al. Bandwidth extension of telephone speech to low frequencies using sinusoidal synthesis and a Gaussian mixture model
JP3183104B2 (ja) ノイズ削減装置
JP4006770B2 (ja) ノイズ推定装置、ノイズ削減装置、ノイズ推定方法、及びノイズ削減方法
Chanda et al. Speech intelligibility enhancement using tunable equalization filter
GB2536727A (en) A speech processing device
EP2063420A1 (en) Method and assembly to enhance the intelligibility of speech

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080427

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090427

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100427

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110427

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120427

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120427

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130427

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130427

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140427

Year of fee payment: 13

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term