JPH1138997A

JPH1138997A - 雑音抑圧装置および音声の雑音除去の処理をするための処理プログラムを記録した記録媒体

Info

Publication number: JPH1138997A
Application number: JP9191557A
Authority: JP
Inventors: 秀享 ▲高▼橋; Hideyuki Takahashi
Original assignee: Olympus Optical Co Ltd
Current assignee: Olympus Corp
Priority date: 1997-07-16
Filing date: 1997-07-16
Publication date: 1999-02-12

Abstract

(57)【要約】【課題】簡単な構成や処理により、Ｓ／Ｎ比を改善す
るとともに聴感的な音質を向上することができる雑音抑
圧装置等を提供する。【解決手段】所定の長さのフレーム信号を音声信号と
非音声信号とに判別する音声／非音声判別部３２と、上
記フレーム信号をスペクトルに変換するフーリエ変換部
３３と、上記音声／非音声判別部３２により非音声信号
と判別されたフレームの雑音スペクトルを推定する雑音
スペクトル推定部３５と、上記フーリエ変換部３３によ
り得られたスペクトルから上記推定された雑音スペクト
ルにサブトラクト係数を乗算したものを減算する振幅ス
ペクトル引算部３４と、この振幅スペクトル引算部３４
の出力信号であるスペクトルに聴感補正用の雑音スペク
トルを加算する聴感補正用雑音加算部３８と、この聴感
補正用雑音加算部３８の出力を逆フーリエ変換する逆フ
ーリエ変換部４０とを備えた雑音抑圧装置。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、スペクトル分析を
行ってフレーム信号に含まれる雑音信号の低減を行う雑
音抑圧装置および音声の雑音除去の処理をするための処
理プログラムを記録した記録媒体に関する。

【０００２】

【従来の技術】従来より、マイクロフォン等から得られ
る音声信号をディジタル信号に変換して例えば半導体メ
モリに記録しておき、再生時において、半導体メモリか
らこの音声信号を読み出してアナログ信号に変換し、ス
ピーカ等から音声として出力するタイプの音声記録再生
装置が提案されている。

【０００３】このようなタイプの音声記録再生装置にお
いては、半導体メモリに記録されるデータ量を節約する
ために、ディジタル化された音声信号に対して高能率な
符号化を施すことによって、発生するデータ量をできる
だけ少なくするように工夫している。特に近年では、デ
ィジタル信号処理技術の発展により種々の音声符号化技
術が開発されており、録音可能時間が飛躍的に長くなる
ようになっている。

【０００４】こうして開発された音声符号化技術の中
で、音声信号を能率良く符号化するために広く用いられ
ている手段として、音声信号を、スペクトル包絡を表す
線形予測パラメータと、線形予測残差信号に対応する音
源パラメータとを用いて符号化する方式がある。このよ
うな線形予測の手段を用いた音声符号化方式は、少ない
伝送容量で比較的高品質な合成音声を得られることか
ら、最近のハードウェア技術の進歩と相まって様々な応
用方式が盛んに研究、開発されており、その中でも例え
ばマルチパルス駆動ＬＰＣ(Linear Predictive Codin
g)、ＣＥＬＰ(Code Excited Linear Predictive Codin
g)等が良い音質が得られる方式として知られている。

【０００５】上述したような線形予測分析を基礎とした
音声符号化技術は、比較的低いビットレートで高品質な
符号化性能を得ることができるという利点を有している
が、一方で、特に背景雑音等が混入すると急激に音質が
劣化してしまうという難点も抱えている。

【０００６】上述したような音声符号化技術を適用する
分野としては、移動体電話や音声録音装置などが考えら
れており、これらは背景雑音が混入する場合を含む様々
な環境下で使用されるものと想定されるために、上記音
質劣化の問題点は、魅力的な製品を実現する上でどうし
ても解決しなければならない必須の課題である。

【０００７】そこで、こうした音声符号化の前処理また
は後処理として、音声信号に重畳された背景雑音を抑圧
する技術は、以前から盛んに研究されて開発が進められ
ているが、その中でもスペクトルサブトラクションとよ
ばれる方法は、比較的簡単な構成でかつ信号対雑音比
（以下、Ｓ／Ｎ比と記す）の改善効果が高いものとして
よく知られており、特に音声認識装置の前処理として多
く使用されている。このようなスペクトルサブトラクシ
ョンを用いた雑音抑圧装置としては、例えば特開平８−
１６０９９４号公報に記載されたものが挙げられる。

【０００８】上記スペクトルサブトラクションは、入力
信号のスペクトルに対して、推定した雑音スペクトルに
所定の係数を乗算した後に減算するものであり、この係
数はサブトラクト係数と呼ばれて１以上の値に設定され
ることが多い。１以上の値に設定すると、背景雑音だけ
でなく音声の成分までも引いてしまう可能性があるにも
かかわらず、このように設定することが多いのは、以下
の理由による。

【０００９】母音区間のように信号のエネルギーが大き
いところでは、多少スペクトルを引き過ぎても音声スペ
クトルの形状にはほとんど影響がない。

【００１０】逆に、子音区間のように信号のエネルギー
が小さいところでは、スペクトルの形状が大きく歪んで
しまうことになるが、信号のエネルギーが小さいところ
では混入した背景雑音の中から音声のスペクトルだけを
取り出すのはもともと困難であるために、スペクトルの
引き過ぎによる影響は実質的にあまり生じない。

【００１１】以上のような理由から、特に音声認識装置
においてはサブトラクト係数を１以上の値に設定するこ
とが多い。

【００１２】

【発明が解決しようとする課題】しかしながら、上述し
たようなスペクトルサブトラクション法は、音声認識装
置のような機械上のデータを改善するものであって、実
際の人間の聴感を考慮したものとはなっていないため
に、Ｓ／Ｎ比が改善されても、人間が聴いたときの音質
は必ずしも良くなっていない場合があることが知られて
いる。

【００１３】実際に、上述したようなスペクトルサブト
ラクションによる雑音抑圧処理を、単純に音声記録再生
装置における前処理または後処理として適用すると、Ｓ
／Ｎ比は大きく改善されるにもかかわらず、スペクトル
サブトラクションによる残留成分が不自然な音として知
覚されることが多く、かえって音質が劣化してしまうこ
とが少なくない。

【００１４】また、特に、入力が１系統のみによるスペ
クトルサブトラクションでは、音声／非音声の判別が必
要となるが、これを完全に判別することができる技術は
存在しておらず、判別ミスが生じて音質が劣化してしま
うことがある。

【００１５】さらに、特に入力が１系統のみによるスペ
クトルサブトラクションでは、非音声区間においては雑
音の推定を比較的精度良く行うことができるためにその
効果は大きいが、音声区間においては、該音声区間の直
前の非音声区間において推定された雑音成分が引かれる
ために、実際の音声区間に混入している背景雑音とは異
なった雑音成分が引かれることになる。この結果、非音
声区間と音声区間とでは雑音抑圧の効果が大きく異な
り、聴感的に不自然なものとなってしまう。

【００１６】このような問題点に対処するために、上述
したサブトラクト係数を調節する（例えば１以下の値に
設定する）ことが考えられるが、これを実行した場合に
は、聴感的な不自然さは解消されるものの、雑音抑圧効
果そのものが小さくなってしまう。

【００１７】本発明は上記事情に鑑みてなされたもので
あり、簡単な構成や処理により、Ｓ／Ｎ比を改善すると
ともに聴感的な音質を向上することができる雑音抑圧装
置および音声の雑音除去の処理をするための処理プログ
ラムを記録した記録媒体を提供することを目的としてい
る。

【００１８】

【課題を解決するための手段】上記の目的を達成するた
めに、第１の発明による雑音抑圧装置は、所定の長さの
フレームに分割されたフレーム信号を音声信号と非音声
信号とに判別する音声判別手段と、上記フレーム信号を
周波数領域信号であるスペクトルに変換するスペクトル
分析手段と、上記音声判別手段により非音声信号と判別
されたフレームにおいて、雑音スペクトルを推定する雑
音スペクトル推定手段と、この雑音スペクトル推定手段
により推定された雑音スペクトルに所定値を乗算したも
のを上記スペクトル分析手段により得られたスペクトル
から減算するスペクトル減算手段と、このスペクトル減
算手段の出力信号であるスペクトルに、所定のスペクト
ルを加算するスペクトル加算手段と、このスペクトル加
算手段の出力信号であるスペクトルを時間領域信号に変
換する時間領域信号変換手段とを備えたものである。

【００１９】また、第２の発明による雑音抑圧装置は、
上記第１の発明による雑音抑圧装置において、上記スペ
クトル加算手段に入力されるスペクトルが、音声判別手
段からスペクトル分析手段、雑音スペクトル推定手段、
およびスペクトル減算手段にわたる一連の処理を所定回
数繰り返して得られるものである。

【００２０】さらに、第３の発明による雑音抑圧装置
は、上記第１または第２の発明による雑音抑圧装置にお
いて、上記スペクトル加算手段により加算する所定のス
ペクトルが、その振幅レベルを任意に調整可能であるも
のである。

【００２１】そして、第４の発明による音声の雑音除去
の処理をするための処理プログラムを記録した記録媒体
は、コンピュータによって音声の雑音除去の処理をする
ための処理プログラムを記録した記録媒体であって、該
処理プログラムは、コンピュータに所定の長さのフレー
ムに分割されたフレーム信号を音声信号と非音声信号と
に判別させ、上記フレーム信号を周波数領域信号である
スペクトルに変換させ、非音声信号と判別されたフレー
ムにおいて雑音スペクトルを推定させ、推定された雑音
スペクトルに所定値を乗算してそれを上記フレームのス
ペクトルから減算させ、減算出力信号であるスペクトル
に所定のスペクトルを加算させ、加算出力信号であるス
ペクトルを時間領域信号に変換させるものである。

【００２２】従って、第１の発明による雑音抑圧装置
は、音声判別手段が所定の長さのフレームに分割された
フレーム信号を音声信号と非音声信号とに判別し、スペ
クトル分析手段が上記フレーム信号を周波数領域信号で
あるスペクトルに変換し、雑音スペクトル推定手段が上
記音声判別手段により非音声信号と判別されたフレーム
において雑音スペクトルを推定し、スペクトル減算手段
がこの雑音スペクトル推定手段により推定された雑音ス
ペクトルに所定値を乗算したものを上記スペクトル分析
手段により得られたスペクトルから減算し、スペクトル
加算手段がこのスペクトル減算手段の出力信号であるス
ペクトルに所定のスペクトルを加算し、時間領域信号変
換手段がこのスペクトル加算手段の出力信号であるスペ
クトルを時間領域信号に変換する。

【００２３】また、第２の発明による雑音抑圧装置は、
上記スペクトル加算手段に入力されるスペクトルを、音
声判別手段からスペクトル分析手段、雑音スペクトル推
定手段およびスペクトル減算手段にわたる一連の処理を
所定回数繰り返して得る。

【００２４】さらに、第３の発明による雑音抑圧装置
は、上記スペクトル加算手段により加算する所定のスペ
クトルの振幅レベルを任意に調整可能とする。

【００２５】そして、第４の発明による音声の雑音除去
の処理をするための処理プログラムを記録した記録媒体
は、コンピュータによって音声の雑音除去の処理をする
ための処理プログラムを記録した記録媒体であって、該
処理プログラムは、コンピュータに、所定の長さのフレ
ームに分割されたフレーム信号を音声信号と非音声信号
とに判別させ、上記フレーム信号を周波数領域信号であ
るスペクトルに変換させ、非音声信号と判別されたフレ
ームにおいて雑音スペクトルを推定させ、推定された雑
音スペクトルに所定値を乗算してそれを上記フレームの
スペクトルから減算させ、減算出力信号であるスペクト
ルに所定のスペクトルを加算させ、加算出力信号である
スペクトルを時間領域信号に変換させる。

【００２６】

【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。図１から図７は本発明の一実施形
態を示したものであり、図１は音声記録再生装置の全体
構成の一例を示すブロック図、図２は音声記録再生装置
の全体構成の他の例を示すブロック図、図３は記録媒体
に記録された音声データをコンピュータを用いて再生す
る構成を示すブロック図である。

【００２７】この実施形態は、音声記録再生装置やコン
ピュータを用いて音声を記録再生する際に、本発明の雑
音抑圧装置や記録媒体に記録された処理プログラムを適
用したものである。

【００２８】まず、図１を参照して音声記録再生装置の
一構成例について説明する。

【００２９】この音声記録再生装置は、図１に示すよう
に、音声を入力して電気信号に変換するマイク１と、こ
のマイク１からの音声信号を適正なレベルに増幅するた
めのマイクアンプ２と、このマイクアンプ２により増幅
された音声信号から不要な高域成分を除去するためのロ
ーパスフィルタ３と、このローパスフィルタ３から出力
されたアナログの音声信号をディジタルデータに変換す
るためのＡ／Ｄ変換器４と、このディジタルデータ化さ
れた音声信号に含まれる雑音信号成分を低減する雑音抑
圧装置である雑音抑圧部５と、この雑音抑圧部５から出
力された音声信号を録音動作時に符号化（圧縮）すると
ともに、再生動作時に符号化データの復号化（伸張）を
行う符号化／復号化部６と、後述するシステム制御部１
３から得られるアドレス情報に基づいて後述する音声メ
モリ８に音声情報を記録／再生する際のコントロールを
行うメモリ制御部７と、例えば半導体メモリ等で構成さ
れている音声メモリ８と、上記符号化／復号化部６から
出力されたディジタルの音声信号をアナログ信号に変換
するためのＤ／Ａ変換器１２と、このＤ／Ａ変換器１２
によりアナログ信号に変換された音声信号から不要な高
域成分を除去するためのローパスフィルタ１１と、この
ローパスフィルタ１１から出力されたアナログの音声信
号を増幅するパワーアンプ１０と、このパワーアンプ１
０により駆動されて音声を発するスピーカ９と、各種の
操作ボタン等により構成されている操作入力部１４と、
上述した符号化／復号化部６，メモリ制御部７，音声メ
モリ８を含むこの音声記録再生装置全体を統括的に制御
するものであり上記操作入力部１４の出力が接続されて
いるシステム制御部１３とを有して構成されている。

【００３０】この図１に示す例では、雑音抑圧部５を、
入力側に、つまり符号化／復号化部６における符号化部
の前段に配置している。上述したように線形予測分析を
基礎とした音声符号化では、背景雑音が混入すると良好
な符号化を行うことができないために、このように前処
理として雑音抑圧処理を行うことによって、より良好な
音質の符号化を行うことを可能としたものである。

【００３１】また、図２に示す音声記録再生装置は、雑
音抑圧部５を、出力側に、つまり符号化／復号化部６に
おける復号化部の後段に配置したものであり、その他の
部分は上記図１に示したものと同様である。上述したよ
うに線形予測分析を基礎とした音声符号化では、符号化
処理おける演算量が膨大となるが、復号化処理における
演算量は符号化処理におけるそれに比べてかなり少ない
ために、このように復号化処理を行った後に雑音抑圧処
理を行うようにすれば、実質的な処理時間に影響がでな
いという利点を有している。

【００３２】図３は、記録媒体に記録された音声データ
をコンピュータを用いて再生する構成を示すブロック図
である。

【００３３】コンピュータ２１の記録媒体ドライブ２１
ｂには、音声データを記録した記録媒体２２や、雑音抑
圧プログラムを記録した記録媒体２３が装着されて、こ
れらの記録媒体２２，２３に記録されたデータを読み取
ることができるようになっている。これら記録媒体２
２，２３としては、例えばフロッピーディスクやＣＤ−
ＲＯＭなどが挙げられる。

【００３４】上記ＣＰＵ２１ａには、処理制御を行う際
の作業領域となる内部メモリ２１ｄが接続されるととも
に、上記記録媒体ドライブ２１ｂにより読み取った上記
雑音抑圧プログラムや音声データを保存しておくための
内蔵ハードディスク２１ｃが接続されている。

【００３５】上述のような音声データは、内蔵ハードデ
ィスク２１ｃ等に格納されている音声の再生処理プログ
ラムにより所定の再生処理が施されるが、その際に上記
雑音抑圧プログラムも内蔵ハードディスク２１ｃから読
み出されて上記内部メモリ２１ｄに展開され実行される
ようになっている。

【００３６】さらに、上記ＣＰＵ２１ａには、このコン
ピュータ２１に取り付けられたキーボード２４が接続さ
れており、使用者が必要に応じて各種の指示入力を行う
ことができるようになっている。

【００３７】そして、このコンピュータ２１には、処理
に係る各種の情報を視覚的に表示するためのディスプレ
イ２５と、上述のような音声の再生処理プログラムによ
り処理された音声を発音するためのスピーカ２６とが接
続されている。

【００３８】このような構成において、音声信号に含ま
れる雑音信号を抑圧する処理をするための処理プログラ
ムを記録した記録媒体としては、上述した記録媒体２３
（フロッピーディスクやＣＤ−ＲＯＭなど）の他に、コ
ンピュータ２１の内蔵ハードディスク２１ｃやＲＡＭ等
の内部メモリ２１ｄも含まれている。

【００３９】次に、図４は、上記雑音抑圧部５の詳細な
構成を示すブロック図である。

【００４０】この雑音抑圧部５は、入力信号を所定の長
さのフレーム単位に分割するフレーム分割部３１と、該
フレーム分割された音声信号が有音（音声）であるか無
音（非音声）であるかをそのエネルギーレベルに基づい
て判別して例えばフラグ等の判別情報を付加するもので
あって後述する逆フーリエ変換部４０の出力も入力され
る音声判別手段たる音声／非音声判別部３２と、この音
声／非音声判別部３２の出力をフーリエ変換（ＦＦＴ）
することによりスペクトル成分を分析してスペクトル情
報を出力するスペクトル分析手段たるフーリエ変換部３
３と、このフーリエ変換部３３の出力が非音声フレーム
に係る出力である場合に、該出力と後述する第１スペク
トルメモリ３６または第２スペクトルメモリ３７の出力
とに基づいてこのフレームに含まれる雑音のスペクトル
を推定する雑音スペクトル推定手段たる雑音スペクトル
推定部３５と、この雑音スペクトル推定部３５により推
定された非音声フレームに係る雑音スペクトルを例えば
過去２フレーム分にわたって記憶しておく第１スペクト
ルメモリ３６および第２スペクトルメモリ３７と、上記
フーリエ変換部３３の出力からこの雑音スペクトル推定
部３５により推定された雑音のスペクトルに所定の係数
を乗算したものを減算するスペクトル減算手段たる振幅
スペクトル引算部３４と、聴感補正用雑音スペクトルの
振幅レベルを任意に調整可能とする振幅レベル調整器３
９と、上記振幅スペクトル引算部３４の出力とこの振幅
レベル調整器３９により振幅レベルを調整された聴感補
正用雑音スペクトルとの加算を行うスペクトル加算手段
たる聴感補正用雑音加算部３８と、この聴感補正用雑音
加算部３８の出力または上記振幅スペクトル引算部３４
の出力の逆フーリエ変換（ＩＦＦＴ）を行う時間領域信
号変換手段たる逆フーリエ変換部４０と、この逆フーリ
エ変換部４０の出力波形を加算して合成し出力する波形
加算合成部４１とを有して構成されている。

【００４１】図５は、上述したような雑音抑圧部５の動
作または上記コンピュータ２１において処理プログラム
により行われる制御を示すフローチャートである。

【００４２】動作がスタートすると、フレーム分割部３
１は、入力された信号を所定の長さのフレーム間隔に切
り出す（ステップＳ１）。

【００４３】次に、スペクトルサブトラクションの回数
をカウントするための変数ｆｃｏｕｎｔを初期化して０
に設定する（ステップＳ２）。

【００４４】そして、後段でフーリエ分析する際に必要
な周波数分解精度が得られるようにフレーム信号に対し
て窓かけ処理を行う（ステップＳ３）。このときフレー
ムはオーバラップするように処理が行われる。これは、
さらに後段の合成処理で合成して接続したときに、フレ
ーム境界で不連続な波形になるのを防止するためであ
る。

【００４５】この様子を図６に示す。図６は、オーバー
ラップするように窓かけ処理を行う様子を説明するため
の図である。この図に示す例においては、５０％ずつオ
ーバーラップさせた分析窓を選択している。

【００４６】そして、窓関数としては、例えば次の数式
１に示すようなハニング窓を用いる。

【００４７】

【数１】ｗ（ｎ）＝０．５−cos｛２πｎ／（Ｌ−１）｝ここに、Ｌは１フレームあたりのサンプル数、ｎはフレ
ーム内におけるサンプルの位置を表しており、すなわ
ち、ｎ＝（０，１，…，Ｌ−１）である。

【００４８】続いて、スペクトルサブトラクションの回
数を示すｆｃｏｕｎｔの値を１増加させて（ステップＳ
４）、窓かけ処理されたフレーム信号について、上記音
声／非音声判別部３２により音声／非音声判別処理を行
う（ステップＳ５）。この判別処理の方法については、
従来より各種の提案がなされているが、例えば本出願人
による特願平８−９２７６８号に記載した方法を適用す
ることができる。

【００４９】その後、フーリエ変換部３３において、フ
レーム信号に対してフーリエ変換（ＦＦＴ）を行うこと
により、スペクトル成分を分析してスペクトル情報を出
力する（ステップＳ６）。

【００５０】次に、上記ステップＳ５の判別結果に基づ
いて、現フレームが音声区間であるか否かを判定し（ス
テップＳ７）、音声区間でない場合には、さらにｆｃｏ
ｕｎｔ＝２であるか否かを判定する（ステップＳ８）。

【００５１】ここでｆｃｏｕｎｔ＝２でない場合には、
第１スペクトルメモリ３６から非音声フレームの過去２
フレームの振幅スペクトルを読み出して、これらと現フ
レームの振幅スペクトルとから平均振幅スペクトルを計
算し、その平均振幅スペクトルを推定雑音スペクトルと
する（ステップＳ９）。

【００５２】この第１スペクトルメモリ３６は、所定フ
レーム分（この例では２フレーム分）のスペクトルデー
タの記憶容量を有し、その初期値としては、処理開始か
ら最初の非音声フレームにおけるスペクトルデータであ
ってもよいし、全てを０としてもよい。

【００５３】次に、第１スペクトルメモリ３６の内容
を、図７に示すような手段により更新する（ステップＳ
１０）。

【００５４】図７は、スペクトルメモリを更新するとき
の動作を示す図である。

【００５５】このスペクトルメモリは、Ｎサンプルでな
るフレームデータを２フレーム分記憶することができる
ようになっており、非音声区間の内の１フレーム過去の
スペクトルデータの記憶領域を領域Ａ、非音声区間の内
の２フレーム過去のスペクトルデータの記憶領域を領域
Ｂとしている。

【００５６】このような構成において、スペクトルメモ
リを更新する際には、まず、領域Ａに記憶されているス
ペクトルデータを領域Ｂにコピーしてシフトさせ、次
に、現フレームのスペクトルデータを領域Ａにコピーす
ることにより行われる。

【００５７】次に、振幅スペクトル引算部３４におい
て、次の数式２に従って現フレームの振幅スペクトルか
ら推定雑音スペクトルにサブトラクト係数を掛けたもの
を減算する（ステップＳ１１）。

【００５８】

【数２】ただし、Ｓ（ｎ）は現フレームにおける入力信号の振幅
スペクトル、Ｎ（ｎ）は推定雑音スペクトル、ａはサブ
トラクト係数を示している。

【００５９】そして、ｆｃｏｕｎｔが２であるか否かを
判定する（ステップＳ１２）。ここでは上記ステップＳ
８における判断と同様に、現在はｆｃｏｕｎｔが２でな
いために、逆フーリエ変換部４０において逆フーリエ変
換（ＩＦＦＴ）を行う（ステップＳ１３）。

【００６０】さらにｆｃｏｕｎｔが２であるか否かを判
定し（ステップＳ１４）、ここでは上記ステップＳ８，
Ｓ１２と同様であるために、上記ステップＳ４に戻り、
上記ステップＳ４からＳ８までに示したのと同様の動作
を行う。

【００６１】そして、ステップＳ８においてｆｃｏｕｎ
ｔが２であると判定された場合には、第２スペクトルメ
モリ３７から非音声フレームの過去２フレームの振幅ス
ペクトルを読み出し、現フレームの振幅スペクトルとか
ら平均振幅スペクトルを計算して、その平均振幅スペク
トルを推定雑音スペクトルとする（ステップＳ１５）。

【００６２】この第２スペクトルメモリ３７も上記第１
スペクトルメモリと同様に、所定フレーム分（この例で
は２フレーム分）のスペクトルデータの記憶容量を有す
るものであり、上述と同様な初期値を用いると良い。

【００６３】次に、第２スペクトルメモリ３７の内容
を、上記図７に示したような手段によりシフトさせて更
新し（ステップＳ１６）、その後、上記ステップＳ１
１，Ｓ１２の動作を上述と同様に行う。

【００６４】このようにして、スペクトルサブトラクシ
ョンを複数回繰り返すようにしたために、音声のスペク
トル形状を大きく崩すことなく、大きなＳ／Ｎ比の改善
効果を得ることができる。

【００６５】ステップＳ１２においては、今度はｆｃｏ
ｕｎｔ＝２であると判定されるために、聴感補正用雑音
加算部３８において所定の聴感補正用雑音スペクトルを
加算する（ステップＳ１７）。この聴感補正用雑音スペ
クトルは、例えば、所定のスペクトルの傾きを有する雑
音スペクトルである。あるいは、上記音声／非音声判別
部３２において非音声であると判別された所定のフレー
ムのスペクトルを記憶しておいて、このスペクトルに１
より小さい所定値を乗算したものであっても良い。

【００６６】そしてステップＳ１３に進んで逆フーリエ
変換（ＩＦＦＴ）を行い、ステップＳ１４ではｆｃｏｕ
ｎｔ＝２であると判定されるために、波形加算合成部４
１において、上記図６に示したような方法で波形を加算
して合成し（ステップＳ１８）終了する。

【００６７】このような実施形態によれば、聴感補正用
雑音を加算することによりマスキング効果が生じて、ス
ペクトルサブトラクションによって発生する残留成分が
不自然な音として知覚されることがなくなる。

【００６８】さらに、非音声区間と音声区間とで雑音抑
圧の効果が大きく異なるために生じる聴感的な不自然さ
も、解消することができる。

【００６９】また、雑音抑圧部を出力側に設けた場合に
は、同様の効果を奏するとともに、聴感補正用雑音を不
快に感じることのないように、聴取者自身が聴感補正用
雑音のレベルを任意に設定することも可能となる。

【００７０】こうして、簡単な構成や処理により、Ｓ／
Ｎ比を改善するとともに聴感的な音質を向上することが
できる。

【００７１】なお、本発明は上述した各実施形態に限定
されるものではなく、発明の主旨を逸脱しない範囲内に
おいて種々の変形や応用が可能であることは勿論であ
る。

【００７２】［付記］以上詳述したような本発明の上記
実施形態によれば、以下のごとき構成を得ることができ
る。

【００７３】（１）所定の長さのフレームに分割され
たフレーム信号を音声信号と非音声信号とに判別する音
声判別手段と、上記フレーム信号を周波数領域信号であ
るスペクトルに変換するスペクトル分析手段と、上記音
声判別手段により非音声信号と判別されたフレームにお
いて、雑音スペクトルを推定する雑音スペクトル推定手
段と、この雑音スペクトル推定手段により推定された雑
音スペクトルに所定値を乗算したものを上記スペクトル
分析手段により得られたスペクトルから減算するスペク
トル減算手段と、このスペクトル減算手段の出力信号で
あるスペクトルに、所定のスペクトルを加算するスペク
トル加算手段と、このスペクトル加算手段の出力信号で
あるスペクトルを時間領域信号に変換する時間領域信号
変換手段と、を具備したことを特徴とする雑音抑圧装
置。

【００７４】（２）上記スペクトル加算手段に入力さ
れるスペクトルは、音声判別手段からスペクトル分析手
段、雑音スペクトル推定手段、およびスペクトル減算手
段にわたる一連の処理を所定回数繰り返して得られるも
のであることを特徴とする、付記（１）に記載の雑音抑
圧装置。

【００７５】（３）上記スペクトル加算手段により加
算する所定のスペクトルは、所定のスペクトルの傾きを
有する雑音スペクトルであることを特徴とする、付記
（１）または付記（２）に記載の雑音抑圧装置。

【００７６】（４）上記スペクトル加算手段により加
算する所定のスペクトルは、上記音声判別手段において
非音声と判別された所定のフレームのスペクトルに、１
より小さい値である所定値を乗算したものであることを
特徴とする、付記（１）または付記（２）に記載の雑音
抑圧装置。

【００７７】（５）コンピュータによって音声の雑音
除去の処理をするための処理プログラムを記録した記録
媒体であって、該処理プログラムは、所定の長さのフレ
ームに分割されたフレーム信号を音声信号と非音声信号
とに判別させる第１のステップと、上記フレーム信号を
周波数領域信号であるスペクトルに変換させる第２のス
テップと、非音声信号と判別されたフレームにおいて雑
音スペクトルを推定させる第３のステップと、推定され
た雑音スペクトルに所定値を乗算してそれを上記フレー
ムのスペクトルから減算させる第４のステップと、減算
出力信号であるスペクトルに所定のスペクトルを加算さ
せる第５のステップと、加算出力信号であるスペクトル
を時間領域信号に変換させる第６のステップと、を具備
したことを特徴とする、音声の雑音除去の処理をするた
めの処理プログラムを記録した記録媒体。

【００７８】（６）上記処理プログラムは、上記第１
から第４のステップにわたる一連の処理を所定回数繰り
返してから得られるスペクトルを用いて上記第５のステ
ップを行うものであることを特徴とする、付記（５）に
記載の音声の雑音除去の処理をするための処理プログラ
ムを記録した記録媒体。

【００７９】（７）上記第５のステップにおいて加算
する所定のスペクトルは、所定のスペクトルの傾きを有
する雑音スペクトルであることを特徴とする、付記
（５）または付記（６）に記載の音声の雑音除去の処理
をするための処理プログラムを記録した記録媒体。

【００８０】（８）上記第５のステップにおいて加算
する所定のスペクトルは、上記第１のステップにおいて
非音声と判別された所定のフレームのスペクトルに、１
より小さい値である所定値を乗算したものであることを
特徴とする、付記（５）または付記（６）に記載の音声
の雑音除去の処理をするための処理プログラムを記録し
た記録媒体。

【００８１】付記（１）に記載の雑音抑圧装置によれ
ば、簡単な構成により、Ｓ／Ｎ比を改善するとともに聴
感的な音質を向上することができる。

【００８２】付記（２）に記載の雑音抑圧装置によれ
ば、付記（１）に記載の発明と同様の効果を奏するとと
もに、スペクトル形状をあまり崩すことなく、大きなＳ
／Ｎ比の改善効果を得ることができる。

【００８３】付記（３）に記載の雑音抑圧装置によれ
ば、所定のスペクトルの傾きを有する雑音スペクトルを
用いて、付記（１）または付記（２）に記載の発明と同
様の効果を奏することができる。

【００８４】付記（４）に記載の雑音抑圧装置によれ
ば、非音声フレームのスペクトルを用いて、付記（１）
または付記（２）に記載の発明と同様の効果を奏するこ
とができる。

【００８５】付記（５）に記載の音声の雑音除去の処理
をするための処理プログラムを記録した記録媒体によれ
ば、簡単な処理をコンピュータに行わせることにより、
Ｓ／Ｎ比を改善するとともに聴感的な音質を向上するこ
とが可能となる。

【００８６】付記（６）に記載の音声の雑音除去の処理
をするための処理プログラムを記録した記録媒体によれ
ば、付記（５）に記載の発明と同様の効果を奏するとと
もに、スペクトル形状をあまり崩すことなく、大きなＳ
／Ｎ比の改善効果を得ることができる。

【００８７】付記（７）に記載の音声の雑音除去の処理
をするための処理プログラムを記録した記録媒体によれ
ば、所定のスペクトルの傾きを有する雑音スペクトルを
用いて、付記（５）または付記（６）に記載の発明と同
様の効果を奏することができる。

【００８８】付記（８）に記載の音声の雑音除去の処理
をするための処理プログラムを記録した記録媒体によれ
ば、非音声フレームのスペクトルを用いて、付記（５）
または付記（６）に記載の発明と同様の効果を奏するこ
とができる。

【００８９】

【発明の効果】以上説明したように、請求項１による本
発明の雑音抑圧装置によれば、簡単な構成により、Ｓ／
Ｎ比を改善するとともに聴感的な音質を向上することが
できる。

【００９０】また、請求項２による本発明の雑音抑圧装
置によれば、請求項１に記載の発明と同様の効果を奏す
るとともに、スペクトル形状をあまり崩すことなく、大
きなＳ／Ｎ比の改善効果を得ることができる。

【００９１】さらに、請求項３による本発明の雑音抑圧
装置によれば、請求項１または請求項２に記載の発明と
同様の効果を奏するとともに、所定のスペクトルの振幅
レベルを調整することにより、聴感的に最適となる状態
を選択することができる。

【００９２】そして、請求項４による本発明の音声の雑
音除去の処理をするための処理プログラムを記録した記
録媒体によれば、簡単な処理をコンピュータに行わせる
ことにより、Ｓ／Ｎ比を改善するとともに聴感的な音質
を向上することが可能となる。

【図面の簡単な説明】

【図１】本発明の一実施形態の音声記録再生装置の全体
構成の一例を示すブロック図。

【図２】上記実施形態の音声記録再生装置の全体構成の
他の例を示すブロック図。

【図３】上記実施形態において、記録媒体に記録された
音声データをコンピュータを用いて再生する構成を示す
ブロック図。

【図４】上記実施形態の雑音抑圧部の詳細な構成を示す
ブロック図。

【図５】上記実施形態の雑音抑圧部の動作またはコンピ
ュータにおいて処理プログラムにより行われる制御を示
すフローチャート。

【図６】上記実施形態において、オーバーラップするよ
うに窓かけ処理を行う様子を説明するための図。

【図７】上記実施形態において、スペクトルメモリを更
新するときの動作を示す図。

【符号の説明】

５…雑音抑圧部（雑音抑圧装置）２１…コンピュータ２１ｃ…内蔵ハードディスク（記録媒体）２１ｄ…内部メモリ（記録媒体）２３…記録媒体３２…音声／非音声判別部（音声判別手段）３３…フーリエ変換部（スペクトル分析手段）３４…振幅スペクトル引算部（スペクトル減算手段）３５…雑音スペクトル推定部（雑音スペクトル推定手
段）３８…聴感補正用雑音加算部（スペクトル加算手段）３９…振幅レベル調整器４０…逆フーリエ変換部（時間領域信号変換手段）

Claims

【特許請求の範囲】

【請求項１】所定の長さのフレームに分割されたフレ
ーム信号を音声信号と非音声信号とに判別する音声判別
手段と、上記フレーム信号を周波数領域信号であるスペクトルに
変換するスペクトル分析手段と、上記音声判別手段により非音声信号と判別されたフレー
ムにおいて、雑音スペクトルを推定する雑音スペクトル
推定手段と、この雑音スペクトル推定手段により推定された雑音スペ
クトルに所定値を乗算したものを上記スペクトル分析手
段により得られたスペクトルから減算するスペクトル減
算手段と、このスペクトル減算手段の出力信号であるスペクトル
に、所定のスペクトルを加算するスペクトル加算手段
と、このスペクトル加算手段の出力信号であるスペクトルを
時間領域信号に変換する時間領域信号変換手段と、を具備したことを特徴とする雑音抑圧装置。
【請求項２】上記スペクトル加算手段に入力されるス
ペクトルは、音声判別手段からスペクトル分析手段、雑
音スペクトル推定手段、およびスペクトル減算手段にわ
たる一連の処理を所定回数繰り返して得られるものであ
ることを特徴とする請求項１に記載の雑音抑圧装置。
【請求項３】上記スペクトル加算手段により加算する
所定のスペクトルは、その振幅レベルが任意に調整可能
であることを特徴とする請求項１または請求項２に記載
の雑音抑圧装置。
【請求項４】コンピュータによって音声の雑音除去の
処理をするための処理プログラムを記録した記録媒体で
あって、該処理プログラムは、コンピュータに所定の長さのフレ
ームに分割されたフレーム信号を音声信号と非音声信号
とに判別させ、上記フレーム信号を周波数領域信号であるスペクトルに
変換させ、非音声信号と判別されたフレームにおいて雑音スペクト
ルを推定させ、推定された雑音スペクトルに所定値を乗算してそれを上
記フレームのスペクトルから減算させ、減算出力信号であるスペクトルに所定のスペクトルを加
算させ、加算出力信号であるスペクトルを時間領域信号に変換さ
せることを特徴とする音声の雑音除去の処理をするため
の処理プログラムを記録した記録媒体。