JPH1138997A - 雑音抑圧装置および音声の雑音除去の処理をするための処理プログラムを記録した記録媒体 - Google Patents

雑音抑圧装置および音声の雑音除去の処理をするための処理プログラムを記録した記録媒体

Info

Publication number
JPH1138997A
JPH1138997A JP9191557A JP19155797A JPH1138997A JP H1138997 A JPH1138997 A JP H1138997A JP 9191557 A JP9191557 A JP 9191557A JP 19155797 A JP19155797 A JP 19155797A JP H1138997 A JPH1138997 A JP H1138997A
Authority
JP
Japan
Prior art keywords
spectrum
noise
signal
frame
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9191557A
Other languages
English (en)
Inventor
秀享 ▲高▼橋
Hideyuki Takahashi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Optical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Optical Co Ltd filed Critical Olympus Optical Co Ltd
Priority to JP9191557A priority Critical patent/JPH1138997A/ja
Priority to US09/114,401 priority patent/US6044341A/en
Publication of JPH1138997A publication Critical patent/JPH1138997A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 簡単な構成や処理により、S/N比を改善す
るとともに聴感的な音質を向上することができる雑音抑
圧装置等を提供する。 【解決手段】 所定の長さのフレーム信号を音声信号と
非音声信号とに判別する音声/非音声判別部32と、上
記フレーム信号をスペクトルに変換するフーリエ変換部
33と、上記音声/非音声判別部32により非音声信号
と判別されたフレームの雑音スペクトルを推定する雑音
スペクトル推定部35と、上記フーリエ変換部33によ
り得られたスペクトルから上記推定された雑音スペクト
ルにサブトラクト係数を乗算したものを減算する振幅ス
ペクトル引算部34と、この振幅スペクトル引算部34
の出力信号であるスペクトルに聴感補正用の雑音スペク
トルを加算する聴感補正用雑音加算部38と、この聴感
補正用雑音加算部38の出力を逆フーリエ変換する逆フ
ーリエ変換部40とを備えた雑音抑圧装置。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、スペクトル分析を
行ってフレーム信号に含まれる雑音信号の低減を行う雑
音抑圧装置および音声の雑音除去の処理をするための処
理プログラムを記録した記録媒体に関する。
【0002】
【従来の技術】従来より、マイクロフォン等から得られ
る音声信号をディジタル信号に変換して例えば半導体メ
モリに記録しておき、再生時において、半導体メモリか
らこの音声信号を読み出してアナログ信号に変換し、ス
ピーカ等から音声として出力するタイプの音声記録再生
装置が提案されている。
【0003】このようなタイプの音声記録再生装置にお
いては、半導体メモリに記録されるデータ量を節約する
ために、ディジタル化された音声信号に対して高能率な
符号化を施すことによって、発生するデータ量をできる
だけ少なくするように工夫している。特に近年では、デ
ィジタル信号処理技術の発展により種々の音声符号化技
術が開発されており、録音可能時間が飛躍的に長くなる
ようになっている。
【0004】こうして開発された音声符号化技術の中
で、音声信号を能率良く符号化するために広く用いられ
ている手段として、音声信号を、スペクトル包絡を表す
線形予測パラメータと、線形予測残差信号に対応する音
源パラメータとを用いて符号化する方式がある。このよ
うな線形予測の手段を用いた音声符号化方式は、少ない
伝送容量で比較的高品質な合成音声を得られることか
ら、最近のハードウェア技術の進歩と相まって様々な応
用方式が盛んに研究、開発されており、その中でも例え
ばマルチパルス駆動LPC(Linear Predictive Codin
g)、CELP(Code Excited Linear Predictive Codin
g)等が良い音質が得られる方式として知られている。
【0005】上述したような線形予測分析を基礎とした
音声符号化技術は、比較的低いビットレートで高品質な
符号化性能を得ることができるという利点を有している
が、一方で、特に背景雑音等が混入すると急激に音質が
劣化してしまうという難点も抱えている。
【0006】上述したような音声符号化技術を適用する
分野としては、移動体電話や音声録音装置などが考えら
れており、これらは背景雑音が混入する場合を含む様々
な環境下で使用されるものと想定されるために、上記音
質劣化の問題点は、魅力的な製品を実現する上でどうし
ても解決しなければならない必須の課題である。
【0007】そこで、こうした音声符号化の前処理また
は後処理として、音声信号に重畳された背景雑音を抑圧
する技術は、以前から盛んに研究されて開発が進められ
ているが、その中でもスペクトルサブトラクションとよ
ばれる方法は、比較的簡単な構成でかつ信号対雑音比
(以下、S/N比と記す)の改善効果が高いものとして
よく知られており、特に音声認識装置の前処理として多
く使用されている。このようなスペクトルサブトラクシ
ョンを用いた雑音抑圧装置としては、例えば特開平8−
160994号公報に記載されたものが挙げられる。
【0008】上記スペクトルサブトラクションは、入力
信号のスペクトルに対して、推定した雑音スペクトルに
所定の係数を乗算した後に減算するものであり、この係
数はサブトラクト係数と呼ばれて1以上の値に設定され
ることが多い。1以上の値に設定すると、背景雑音だけ
でなく音声の成分までも引いてしまう可能性があるにも
かかわらず、このように設定することが多いのは、以下
の理由による。
【0009】母音区間のように信号のエネルギーが大き
いところでは、多少スペクトルを引き過ぎても音声スペ
クトルの形状にはほとんど影響がない。
【0010】逆に、子音区間のように信号のエネルギー
が小さいところでは、スペクトルの形状が大きく歪んで
しまうことになるが、信号のエネルギーが小さいところ
では混入した背景雑音の中から音声のスペクトルだけを
取り出すのはもともと困難であるために、スペクトルの
引き過ぎによる影響は実質的にあまり生じない。
【0011】以上のような理由から、特に音声認識装置
においてはサブトラクト係数を1以上の値に設定するこ
とが多い。
【0012】
【発明が解決しようとする課題】しかしながら、上述し
たようなスペクトルサブトラクション法は、音声認識装
置のような機械上のデータを改善するものであって、実
際の人間の聴感を考慮したものとはなっていないため
に、S/N比が改善されても、人間が聴いたときの音質
は必ずしも良くなっていない場合があることが知られて
いる。
【0013】実際に、上述したようなスペクトルサブト
ラクションによる雑音抑圧処理を、単純に音声記録再生
装置における前処理または後処理として適用すると、S
/N比は大きく改善されるにもかかわらず、スペクトル
サブトラクションによる残留成分が不自然な音として知
覚されることが多く、かえって音質が劣化してしまうこ
とが少なくない。
【0014】また、特に、入力が1系統のみによるスペ
クトルサブトラクションでは、音声/非音声の判別が必
要となるが、これを完全に判別することができる技術は
存在しておらず、判別ミスが生じて音質が劣化してしま
うことがある。
【0015】さらに、特に入力が1系統のみによるスペ
クトルサブトラクションでは、非音声区間においては雑
音の推定を比較的精度良く行うことができるためにその
効果は大きいが、音声区間においては、該音声区間の直
前の非音声区間において推定された雑音成分が引かれる
ために、実際の音声区間に混入している背景雑音とは異
なった雑音成分が引かれることになる。この結果、非音
声区間と音声区間とでは雑音抑圧の効果が大きく異な
り、聴感的に不自然なものとなってしまう。
【0016】このような問題点に対処するために、上述
したサブトラクト係数を調節する(例えば1以下の値に
設定する)ことが考えられるが、これを実行した場合に
は、聴感的な不自然さは解消されるものの、雑音抑圧効
果そのものが小さくなってしまう。
【0017】本発明は上記事情に鑑みてなされたもので
あり、簡単な構成や処理により、S/N比を改善すると
ともに聴感的な音質を向上することができる雑音抑圧装
置および音声の雑音除去の処理をするための処理プログ
ラムを記録した記録媒体を提供することを目的としてい
る。
【0018】
【課題を解決するための手段】上記の目的を達成するた
めに、第1の発明による雑音抑圧装置は、所定の長さの
フレームに分割されたフレーム信号を音声信号と非音声
信号とに判別する音声判別手段と、上記フレーム信号を
周波数領域信号であるスペクトルに変換するスペクトル
分析手段と、上記音声判別手段により非音声信号と判別
されたフレームにおいて、雑音スペクトルを推定する雑
音スペクトル推定手段と、この雑音スペクトル推定手段
により推定された雑音スペクトルに所定値を乗算したも
のを上記スペクトル分析手段により得られたスペクトル
から減算するスペクトル減算手段と、このスペクトル減
算手段の出力信号であるスペクトルに、所定のスペクト
ルを加算するスペクトル加算手段と、このスペクトル加
算手段の出力信号であるスペクトルを時間領域信号に変
換する時間領域信号変換手段とを備えたものである。
【0019】また、第2の発明による雑音抑圧装置は、
上記第1の発明による雑音抑圧装置において、上記スペ
クトル加算手段に入力されるスペクトルが、音声判別手
段からスペクトル分析手段、雑音スペクトル推定手段、
およびスペクトル減算手段にわたる一連の処理を所定回
数繰り返して得られるものである。
【0020】さらに、第3の発明による雑音抑圧装置
は、上記第1または第2の発明による雑音抑圧装置にお
いて、上記スペクトル加算手段により加算する所定のス
ペクトルが、その振幅レベルを任意に調整可能であるも
のである。
【0021】そして、第4の発明による音声の雑音除去
の処理をするための処理プログラムを記録した記録媒体
は、コンピュータによって音声の雑音除去の処理をする
ための処理プログラムを記録した記録媒体であって、該
処理プログラムは、コンピュータに所定の長さのフレー
ムに分割されたフレーム信号を音声信号と非音声信号と
に判別させ、上記フレーム信号を周波数領域信号である
スペクトルに変換させ、非音声信号と判別されたフレー
ムにおいて雑音スペクトルを推定させ、推定された雑音
スペクトルに所定値を乗算してそれを上記フレームのス
ペクトルから減算させ、減算出力信号であるスペクトル
に所定のスペクトルを加算させ、加算出力信号であるス
ペクトルを時間領域信号に変換させるものである。
【0022】従って、第1の発明による雑音抑圧装置
は、音声判別手段が所定の長さのフレームに分割された
フレーム信号を音声信号と非音声信号とに判別し、スペ
クトル分析手段が上記フレーム信号を周波数領域信号で
あるスペクトルに変換し、雑音スペクトル推定手段が上
記音声判別手段により非音声信号と判別されたフレーム
において雑音スペクトルを推定し、スペクトル減算手段
がこの雑音スペクトル推定手段により推定された雑音ス
ペクトルに所定値を乗算したものを上記スペクトル分析
手段により得られたスペクトルから減算し、スペクトル
加算手段がこのスペクトル減算手段の出力信号であるス
ペクトルに所定のスペクトルを加算し、時間領域信号変
換手段がこのスペクトル加算手段の出力信号であるスペ
クトルを時間領域信号に変換する。
【0023】また、第2の発明による雑音抑圧装置は、
上記スペクトル加算手段に入力されるスペクトルを、音
声判別手段からスペクトル分析手段、雑音スペクトル推
定手段およびスペクトル減算手段にわたる一連の処理を
所定回数繰り返して得る。
【0024】さらに、第3の発明による雑音抑圧装置
は、上記スペクトル加算手段により加算する所定のスペ
クトルの振幅レベルを任意に調整可能とする。
【0025】そして、第4の発明による音声の雑音除去
の処理をするための処理プログラムを記録した記録媒体
は、コンピュータによって音声の雑音除去の処理をする
ための処理プログラムを記録した記録媒体であって、該
処理プログラムは、コンピュータに、所定の長さのフレ
ームに分割されたフレーム信号を音声信号と非音声信号
とに判別させ、上記フレーム信号を周波数領域信号であ
るスペクトルに変換させ、非音声信号と判別されたフレ
ームにおいて雑音スペクトルを推定させ、推定された雑
音スペクトルに所定値を乗算してそれを上記フレームの
スペクトルから減算させ、減算出力信号であるスペクト
ルに所定のスペクトルを加算させ、加算出力信号である
スペクトルを時間領域信号に変換させる。
【0026】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。図1から図7は本発明の一実施形
態を示したものであり、図1は音声記録再生装置の全体
構成の一例を示すブロック図、図2は音声記録再生装置
の全体構成の他の例を示すブロック図、図3は記録媒体
に記録された音声データをコンピュータを用いて再生す
る構成を示すブロック図である。
【0027】この実施形態は、音声記録再生装置やコン
ピュータを用いて音声を記録再生する際に、本発明の雑
音抑圧装置や記録媒体に記録された処理プログラムを適
用したものである。
【0028】まず、図1を参照して音声記録再生装置の
一構成例について説明する。
【0029】この音声記録再生装置は、図1に示すよう
に、音声を入力して電気信号に変換するマイク1と、こ
のマイク1からの音声信号を適正なレベルに増幅するた
めのマイクアンプ2と、このマイクアンプ2により増幅
された音声信号から不要な高域成分を除去するためのロ
ーパスフィルタ3と、このローパスフィルタ3から出力
されたアナログの音声信号をディジタルデータに変換す
るためのA/D変換器4と、このディジタルデータ化さ
れた音声信号に含まれる雑音信号成分を低減する雑音抑
圧装置である雑音抑圧部5と、この雑音抑圧部5から出
力された音声信号を録音動作時に符号化(圧縮)すると
ともに、再生動作時に符号化データの復号化(伸張)を
行う符号化/復号化部6と、後述するシステム制御部1
3から得られるアドレス情報に基づいて後述する音声メ
モリ8に音声情報を記録/再生する際のコントロールを
行うメモリ制御部7と、例えば半導体メモリ等で構成さ
れている音声メモリ8と、上記符号化/復号化部6から
出力されたディジタルの音声信号をアナログ信号に変換
するためのD/A変換器12と、このD/A変換器12
によりアナログ信号に変換された音声信号から不要な高
域成分を除去するためのローパスフィルタ11と、この
ローパスフィルタ11から出力されたアナログの音声信
号を増幅するパワーアンプ10と、このパワーアンプ1
0により駆動されて音声を発するスピーカ9と、各種の
操作ボタン等により構成されている操作入力部14と、
上述した符号化/復号化部6,メモリ制御部7,音声メ
モリ8を含むこの音声記録再生装置全体を統括的に制御
するものであり上記操作入力部14の出力が接続されて
いるシステム制御部13とを有して構成されている。
【0030】この図1に示す例では、雑音抑圧部5を、
入力側に、つまり符号化/復号化部6における符号化部
の前段に配置している。上述したように線形予測分析を
基礎とした音声符号化では、背景雑音が混入すると良好
な符号化を行うことができないために、このように前処
理として雑音抑圧処理を行うことによって、より良好な
音質の符号化を行うことを可能としたものである。
【0031】また、図2に示す音声記録再生装置は、雑
音抑圧部5を、出力側に、つまり符号化/復号化部6に
おける復号化部の後段に配置したものであり、その他の
部分は上記図1に示したものと同様である。上述したよ
うに線形予測分析を基礎とした音声符号化では、符号化
処理おける演算量が膨大となるが、復号化処理における
演算量は符号化処理におけるそれに比べてかなり少ない
ために、このように復号化処理を行った後に雑音抑圧処
理を行うようにすれば、実質的な処理時間に影響がでな
いという利点を有している。
【0032】図3は、記録媒体に記録された音声データ
をコンピュータを用いて再生する構成を示すブロック図
である。
【0033】コンピュータ21の記録媒体ドライブ21
bには、音声データを記録した記録媒体22や、雑音抑
圧プログラムを記録した記録媒体23が装着されて、こ
れらの記録媒体22,23に記録されたデータを読み取
ることができるようになっている。これら記録媒体2
2,23としては、例えばフロッピーディスクやCD−
ROMなどが挙げられる。
【0034】上記CPU21aには、処理制御を行う際
の作業領域となる内部メモリ21dが接続されるととも
に、上記記録媒体ドライブ21bにより読み取った上記
雑音抑圧プログラムや音声データを保存しておくための
内蔵ハードディスク21cが接続されている。
【0035】上述のような音声データは、内蔵ハードデ
ィスク21c等に格納されている音声の再生処理プログ
ラムにより所定の再生処理が施されるが、その際に上記
雑音抑圧プログラムも内蔵ハードディスク21cから読
み出されて上記内部メモリ21dに展開され実行される
ようになっている。
【0036】さらに、上記CPU21aには、このコン
ピュータ21に取り付けられたキーボード24が接続さ
れており、使用者が必要に応じて各種の指示入力を行う
ことができるようになっている。
【0037】そして、このコンピュータ21には、処理
に係る各種の情報を視覚的に表示するためのディスプレ
イ25と、上述のような音声の再生処理プログラムによ
り処理された音声を発音するためのスピーカ26とが接
続されている。
【0038】このような構成において、音声信号に含ま
れる雑音信号を抑圧する処理をするための処理プログラ
ムを記録した記録媒体としては、上述した記録媒体23
(フロッピーディスクやCD−ROMなど)の他に、コ
ンピュータ21の内蔵ハードディスク21cやRAM等
の内部メモリ21dも含まれている。
【0039】次に、図4は、上記雑音抑圧部5の詳細な
構成を示すブロック図である。
【0040】この雑音抑圧部5は、入力信号を所定の長
さのフレーム単位に分割するフレーム分割部31と、該
フレーム分割された音声信号が有音(音声)であるか無
音(非音声)であるかをそのエネルギーレベルに基づい
て判別して例えばフラグ等の判別情報を付加するもので
あって後述する逆フーリエ変換部40の出力も入力され
る音声判別手段たる音声/非音声判別部32と、この音
声/非音声判別部32の出力をフーリエ変換(FFT)
することによりスペクトル成分を分析してスペクトル情
報を出力するスペクトル分析手段たるフーリエ変換部3
3と、このフーリエ変換部33の出力が非音声フレーム
に係る出力である場合に、該出力と後述する第1スペク
トルメモリ36または第2スペクトルメモリ37の出力
とに基づいてこのフレームに含まれる雑音のスペクトル
を推定する雑音スペクトル推定手段たる雑音スペクトル
推定部35と、この雑音スペクトル推定部35により推
定された非音声フレームに係る雑音スペクトルを例えば
過去2フレーム分にわたって記憶しておく第1スペクト
ルメモリ36および第2スペクトルメモリ37と、上記
フーリエ変換部33の出力からこの雑音スペクトル推定
部35により推定された雑音のスペクトルに所定の係数
を乗算したものを減算するスペクトル減算手段たる振幅
スペクトル引算部34と、聴感補正用雑音スペクトルの
振幅レベルを任意に調整可能とする振幅レベル調整器3
9と、上記振幅スペクトル引算部34の出力とこの振幅
レベル調整器39により振幅レベルを調整された聴感補
正用雑音スペクトルとの加算を行うスペクトル加算手段
たる聴感補正用雑音加算部38と、この聴感補正用雑音
加算部38の出力または上記振幅スペクトル引算部34
の出力の逆フーリエ変換(IFFT)を行う時間領域信
号変換手段たる逆フーリエ変換部40と、この逆フーリ
エ変換部40の出力波形を加算して合成し出力する波形
加算合成部41とを有して構成されている。
【0041】図5は、上述したような雑音抑圧部5の動
作または上記コンピュータ21において処理プログラム
により行われる制御を示すフローチャートである。
【0042】動作がスタートすると、フレーム分割部3
1は、入力された信号を所定の長さのフレーム間隔に切
り出す(ステップS1)。
【0043】次に、スペクトルサブトラクションの回数
をカウントするための変数fcountを初期化して0
に設定する(ステップS2)。
【0044】そして、後段でフーリエ分析する際に必要
な周波数分解精度が得られるようにフレーム信号に対し
て窓かけ処理を行う(ステップS3)。このときフレー
ムはオーバラップするように処理が行われる。これは、
さらに後段の合成処理で合成して接続したときに、フレ
ーム境界で不連続な波形になるのを防止するためであ
る。
【0045】この様子を図6に示す。図6は、オーバー
ラップするように窓かけ処理を行う様子を説明するため
の図である。この図に示す例においては、50%ずつオ
ーバーラップさせた分析窓を選択している。
【0046】そして、窓関数としては、例えば次の数式
1に示すようなハニング窓を用いる。
【0047】
【数1】 w(n)=0.5−cos{2πn/(L−1)} ここに、Lは1フレームあたりのサンプル数、nはフレ
ーム内におけるサンプルの位置を表しており、すなわ
ち、n=(0,1,…,L−1)である。
【0048】続いて、スペクトルサブトラクションの回
数を示すfcountの値を1増加させて(ステップS
4)、窓かけ処理されたフレーム信号について、上記音
声/非音声判別部32により音声/非音声判別処理を行
う(ステップS5)。この判別処理の方法については、
従来より各種の提案がなされているが、例えば本出願人
による特願平8−92768号に記載した方法を適用す
ることができる。
【0049】その後、フーリエ変換部33において、フ
レーム信号に対してフーリエ変換(FFT)を行うこと
により、スペクトル成分を分析してスペクトル情報を出
力する(ステップS6)。
【0050】次に、上記ステップS5の判別結果に基づ
いて、現フレームが音声区間であるか否かを判定し(ス
テップS7)、音声区間でない場合には、さらにfco
unt=2であるか否かを判定する(ステップS8)。
【0051】ここでfcount=2でない場合には、
第1スペクトルメモリ36から非音声フレームの過去2
フレームの振幅スペクトルを読み出して、これらと現フ
レームの振幅スペクトルとから平均振幅スペクトルを計
算し、その平均振幅スペクトルを推定雑音スペクトルと
する(ステップS9)。
【0052】この第1スペクトルメモリ36は、所定フ
レーム分(この例では2フレーム分)のスペクトルデー
タの記憶容量を有し、その初期値としては、処理開始か
ら最初の非音声フレームにおけるスペクトルデータであ
ってもよいし、全てを0としてもよい。
【0053】次に、第1スペクトルメモリ36の内容
を、図7に示すような手段により更新する(ステップS
10)。
【0054】図7は、スペクトルメモリを更新するとき
の動作を示す図である。
【0055】このスペクトルメモリは、Nサンプルでな
るフレームデータを2フレーム分記憶することができる
ようになっており、非音声区間の内の1フレーム過去の
スペクトルデータの記憶領域を領域A、非音声区間の内
の2フレーム過去のスペクトルデータの記憶領域を領域
Bとしている。
【0056】このような構成において、スペクトルメモ
リを更新する際には、まず、領域Aに記憶されているス
ペクトルデータを領域Bにコピーしてシフトさせ、次
に、現フレームのスペクトルデータを領域Aにコピーす
ることにより行われる。
【0057】次に、振幅スペクトル引算部34におい
て、次の数式2に従って現フレームの振幅スペクトルか
ら推定雑音スペクトルにサブトラクト係数を掛けたもの
を減算する(ステップS11)。
【0058】
【数2】 ただし、S(n)は現フレームにおける入力信号の振幅
スペクトル、N(n)は推定雑音スペクトル、aはサブ
トラクト係数を示している。
【0059】そして、fcountが2であるか否かを
判定する(ステップS12)。ここでは上記ステップS
8における判断と同様に、現在はfcountが2でな
いために、逆フーリエ変換部40において逆フーリエ変
換(IFFT)を行う(ステップS13)。
【0060】さらにfcountが2であるか否かを判
定し(ステップS14)、ここでは上記ステップS8,
S12と同様であるために、上記ステップS4に戻り、
上記ステップS4からS8までに示したのと同様の動作
を行う。
【0061】そして、ステップS8においてfcoun
tが2であると判定された場合には、第2スペクトルメ
モリ37から非音声フレームの過去2フレームの振幅ス
ペクトルを読み出し、現フレームの振幅スペクトルとか
ら平均振幅スペクトルを計算して、その平均振幅スペク
トルを推定雑音スペクトルとする(ステップS15)。
【0062】この第2スペクトルメモリ37も上記第1
スペクトルメモリと同様に、所定フレーム分(この例で
は2フレーム分)のスペクトルデータの記憶容量を有す
るものであり、上述と同様な初期値を用いると良い。
【0063】次に、第2スペクトルメモリ37の内容
を、上記図7に示したような手段によりシフトさせて更
新し(ステップS16)、その後、上記ステップS1
1,S12の動作を上述と同様に行う。
【0064】このようにして、スペクトルサブトラクシ
ョンを複数回繰り返すようにしたために、音声のスペク
トル形状を大きく崩すことなく、大きなS/N比の改善
効果を得ることができる。
【0065】ステップS12においては、今度はfco
unt=2であると判定されるために、聴感補正用雑音
加算部38において所定の聴感補正用雑音スペクトルを
加算する(ステップS17)。この聴感補正用雑音スペ
クトルは、例えば、所定のスペクトルの傾きを有する雑
音スペクトルである。あるいは、上記音声/非音声判別
部32において非音声であると判別された所定のフレー
ムのスペクトルを記憶しておいて、このスペクトルに1
より小さい所定値を乗算したものであっても良い。
【0066】そしてステップS13に進んで逆フーリエ
変換(IFFT)を行い、ステップS14ではfcou
nt=2であると判定されるために、波形加算合成部4
1において、上記図6に示したような方法で波形を加算
して合成し(ステップS18)終了する。
【0067】このような実施形態によれば、聴感補正用
雑音を加算することによりマスキング効果が生じて、ス
ペクトルサブトラクションによって発生する残留成分が
不自然な音として知覚されることがなくなる。
【0068】さらに、非音声区間と音声区間とで雑音抑
圧の効果が大きく異なるために生じる聴感的な不自然さ
も、解消することができる。
【0069】また、雑音抑圧部を出力側に設けた場合に
は、同様の効果を奏するとともに、聴感補正用雑音を不
快に感じることのないように、聴取者自身が聴感補正用
雑音のレベルを任意に設定することも可能となる。
【0070】こうして、簡単な構成や処理により、S/
N比を改善するとともに聴感的な音質を向上することが
できる。
【0071】なお、本発明は上述した各実施形態に限定
されるものではなく、発明の主旨を逸脱しない範囲内に
おいて種々の変形や応用が可能であることは勿論であ
る。
【0072】[付記]以上詳述したような本発明の上記
実施形態によれば、以下のごとき構成を得ることができ
る。
【0073】(1) 所定の長さのフレームに分割され
たフレーム信号を音声信号と非音声信号とに判別する音
声判別手段と、上記フレーム信号を周波数領域信号であ
るスペクトルに変換するスペクトル分析手段と、上記音
声判別手段により非音声信号と判別されたフレームにお
いて、雑音スペクトルを推定する雑音スペクトル推定手
段と、この雑音スペクトル推定手段により推定された雑
音スペクトルに所定値を乗算したものを上記スペクトル
分析手段により得られたスペクトルから減算するスペク
トル減算手段と、このスペクトル減算手段の出力信号で
あるスペクトルに、所定のスペクトルを加算するスペク
トル加算手段と、このスペクトル加算手段の出力信号で
あるスペクトルを時間領域信号に変換する時間領域信号
変換手段と、を具備したことを特徴とする雑音抑圧装
置。
【0074】(2) 上記スペクトル加算手段に入力さ
れるスペクトルは、音声判別手段からスペクトル分析手
段、雑音スペクトル推定手段、およびスペクトル減算手
段にわたる一連の処理を所定回数繰り返して得られるも
のであることを特徴とする、付記(1)に記載の雑音抑
圧装置。
【0075】(3) 上記スペクトル加算手段により加
算する所定のスペクトルは、所定のスペクトルの傾きを
有する雑音スペクトルであることを特徴とする、付記
(1)または付記(2)に記載の雑音抑圧装置。
【0076】(4) 上記スペクトル加算手段により加
算する所定のスペクトルは、上記音声判別手段において
非音声と判別された所定のフレームのスペクトルに、1
より小さい値である所定値を乗算したものであることを
特徴とする、付記(1)または付記(2)に記載の雑音
抑圧装置。
【0077】(5) コンピュータによって音声の雑音
除去の処理をするための処理プログラムを記録した記録
媒体であって、該処理プログラムは、所定の長さのフレ
ームに分割されたフレーム信号を音声信号と非音声信号
とに判別させる第1のステップと、上記フレーム信号を
周波数領域信号であるスペクトルに変換させる第2のス
テップと、非音声信号と判別されたフレームにおいて雑
音スペクトルを推定させる第3のステップと、推定され
た雑音スペクトルに所定値を乗算してそれを上記フレー
ムのスペクトルから減算させる第4のステップと、減算
出力信号であるスペクトルに所定のスペクトルを加算さ
せる第5のステップと、加算出力信号であるスペクトル
を時間領域信号に変換させる第6のステップと、を具備
したことを特徴とする、音声の雑音除去の処理をするた
めの処理プログラムを記録した記録媒体。
【0078】(6) 上記処理プログラムは、上記第1
から第4のステップにわたる一連の処理を所定回数繰り
返してから得られるスペクトルを用いて上記第5のステ
ップを行うものであることを特徴とする、付記(5)に
記載の音声の雑音除去の処理をするための処理プログラ
ムを記録した記録媒体。
【0079】(7) 上記第5のステップにおいて加算
する所定のスペクトルは、所定のスペクトルの傾きを有
する雑音スペクトルであることを特徴とする、付記
(5)または付記(6)に記載の音声の雑音除去の処理
をするための処理プログラムを記録した記録媒体。
【0080】(8) 上記第5のステップにおいて加算
する所定のスペクトルは、上記第1のステップにおいて
非音声と判別された所定のフレームのスペクトルに、1
より小さい値である所定値を乗算したものであることを
特徴とする、付記(5)または付記(6)に記載の音声
の雑音除去の処理をするための処理プログラムを記録し
た記録媒体。
【0081】付記(1)に記載の雑音抑圧装置によれ
ば、簡単な構成により、S/N比を改善するとともに聴
感的な音質を向上することができる。
【0082】付記(2)に記載の雑音抑圧装置によれ
ば、付記(1)に記載の発明と同様の効果を奏するとと
もに、スペクトル形状をあまり崩すことなく、大きなS
/N比の改善効果を得ることができる。
【0083】付記(3)に記載の雑音抑圧装置によれ
ば、所定のスペクトルの傾きを有する雑音スペクトルを
用いて、付記(1)または付記(2)に記載の発明と同
様の効果を奏することができる。
【0084】付記(4)に記載の雑音抑圧装置によれ
ば、非音声フレームのスペクトルを用いて、付記(1)
または付記(2)に記載の発明と同様の効果を奏するこ
とができる。
【0085】付記(5)に記載の音声の雑音除去の処理
をするための処理プログラムを記録した記録媒体によれ
ば、簡単な処理をコンピュータに行わせることにより、
S/N比を改善するとともに聴感的な音質を向上するこ
とが可能となる。
【0086】付記(6)に記載の音声の雑音除去の処理
をするための処理プログラムを記録した記録媒体によれ
ば、付記(5)に記載の発明と同様の効果を奏するとと
もに、スペクトル形状をあまり崩すことなく、大きなS
/N比の改善効果を得ることができる。
【0087】付記(7)に記載の音声の雑音除去の処理
をするための処理プログラムを記録した記録媒体によれ
ば、所定のスペクトルの傾きを有する雑音スペクトルを
用いて、付記(5)または付記(6)に記載の発明と同
様の効果を奏することができる。
【0088】付記(8)に記載の音声の雑音除去の処理
をするための処理プログラムを記録した記録媒体によれ
ば、非音声フレームのスペクトルを用いて、付記(5)
または付記(6)に記載の発明と同様の効果を奏するこ
とができる。
【0089】
【発明の効果】以上説明したように、請求項1による本
発明の雑音抑圧装置によれば、簡単な構成により、S/
N比を改善するとともに聴感的な音質を向上することが
できる。
【0090】また、請求項2による本発明の雑音抑圧装
置によれば、請求項1に記載の発明と同様の効果を奏す
るとともに、スペクトル形状をあまり崩すことなく、大
きなS/N比の改善効果を得ることができる。
【0091】さらに、請求項3による本発明の雑音抑圧
装置によれば、請求項1または請求項2に記載の発明と
同様の効果を奏するとともに、所定のスペクトルの振幅
レベルを調整することにより、聴感的に最適となる状態
を選択することができる。
【0092】そして、請求項4による本発明の音声の雑
音除去の処理をするための処理プログラムを記録した記
録媒体によれば、簡単な処理をコンピュータに行わせる
ことにより、S/N比を改善するとともに聴感的な音質
を向上することが可能となる。
【図面の簡単な説明】
【図1】本発明の一実施形態の音声記録再生装置の全体
構成の一例を示すブロック図。
【図2】上記実施形態の音声記録再生装置の全体構成の
他の例を示すブロック図。
【図3】上記実施形態において、記録媒体に記録された
音声データをコンピュータを用いて再生する構成を示す
ブロック図。
【図4】上記実施形態の雑音抑圧部の詳細な構成を示す
ブロック図。
【図5】上記実施形態の雑音抑圧部の動作またはコンピ
ュータにおいて処理プログラムにより行われる制御を示
すフローチャート。
【図6】上記実施形態において、オーバーラップするよ
うに窓かけ処理を行う様子を説明するための図。
【図7】上記実施形態において、スペクトルメモリを更
新するときの動作を示す図。
【符号の説明】
5…雑音抑圧部(雑音抑圧装置) 21…コンピュータ 21c…内蔵ハードディスク(記録媒体) 21d…内部メモリ(記録媒体) 23…記録媒体 32…音声/非音声判別部(音声判別手段) 33…フーリエ変換部(スペクトル分析手段) 34…振幅スペクトル引算部(スペクトル減算手段) 35…雑音スペクトル推定部(雑音スペクトル推定手
段) 38…聴感補正用雑音加算部(スペクトル加算手段) 39…振幅レベル調整器 40…逆フーリエ変換部(時間領域信号変換手段)

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 所定の長さのフレームに分割されたフレ
    ーム信号を音声信号と非音声信号とに判別する音声判別
    手段と、 上記フレーム信号を周波数領域信号であるスペクトルに
    変換するスペクトル分析手段と、 上記音声判別手段により非音声信号と判別されたフレー
    ムにおいて、雑音スペクトルを推定する雑音スペクトル
    推定手段と、 この雑音スペクトル推定手段により推定された雑音スペ
    クトルに所定値を乗算したものを上記スペクトル分析手
    段により得られたスペクトルから減算するスペクトル減
    算手段と、 このスペクトル減算手段の出力信号であるスペクトル
    に、所定のスペクトルを加算するスペクトル加算手段
    と、 このスペクトル加算手段の出力信号であるスペクトルを
    時間領域信号に変換する時間領域信号変換手段と、 を具備したことを特徴とする雑音抑圧装置。
  2. 【請求項2】 上記スペクトル加算手段に入力されるス
    ペクトルは、音声判別手段からスペクトル分析手段、雑
    音スペクトル推定手段、およびスペクトル減算手段にわ
    たる一連の処理を所定回数繰り返して得られるものであ
    ることを特徴とする請求項1に記載の雑音抑圧装置。
  3. 【請求項3】 上記スペクトル加算手段により加算する
    所定のスペクトルは、その振幅レベルが任意に調整可能
    であることを特徴とする請求項1または請求項2に記載
    の雑音抑圧装置。
  4. 【請求項4】 コンピュータによって音声の雑音除去の
    処理をするための処理プログラムを記録した記録媒体で
    あって、 該処理プログラムは、コンピュータに所定の長さのフレ
    ームに分割されたフレーム信号を音声信号と非音声信号
    とに判別させ、 上記フレーム信号を周波数領域信号であるスペクトルに
    変換させ、 非音声信号と判別されたフレームにおいて雑音スペクト
    ルを推定させ、 推定された雑音スペクトルに所定値を乗算してそれを上
    記フレームのスペクトルから減算させ、 減算出力信号であるスペクトルに所定のスペクトルを加
    算させ、 加算出力信号であるスペクトルを時間領域信号に変換さ
    せることを特徴とする音声の雑音除去の処理をするため
    の処理プログラムを記録した記録媒体。
JP9191557A 1997-07-16 1997-07-16 雑音抑圧装置および音声の雑音除去の処理をするための処理プログラムを記録した記録媒体 Withdrawn JPH1138997A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP9191557A JPH1138997A (ja) 1997-07-16 1997-07-16 雑音抑圧装置および音声の雑音除去の処理をするための処理プログラムを記録した記録媒体
US09/114,401 US6044341A (en) 1997-07-16 1998-07-13 Noise suppression apparatus and recording medium recording processing program for performing noise removal from voice

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9191557A JPH1138997A (ja) 1997-07-16 1997-07-16 雑音抑圧装置および音声の雑音除去の処理をするための処理プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JPH1138997A true JPH1138997A (ja) 1999-02-12

Family

ID=16276663

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9191557A Withdrawn JPH1138997A (ja) 1997-07-16 1997-07-16 雑音抑圧装置および音声の雑音除去の処理をするための処理プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JPH1138997A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005057552A1 (ja) * 2003-12-09 2005-06-23 National Institute Of Advanced Industrial Science And Technology 音響信号除去装置、音響信号除去方法及び音響信号除去プログラム
WO2005057551A1 (ja) * 2003-12-09 2005-06-23 National Institute Of Advanced Industrial Science And Technology 音響信号除去装置、音響信号除去方法及び音響信号除去プログラム
WO2005112007A1 (ja) * 2004-05-13 2005-11-24 Fuji Television Network, Inc. 音響信号除去装置、音響信号除去方法及び音響信号除去プログラム
EP2270981A2 (en) 2009-06-19 2011-01-05 Fujitsu Limited Digital signal processing apparatus and digital signal processing method
JP2011248290A (ja) * 2010-05-31 2011-12-08 Nara Institute Of Schience And Technology 雑音抑圧装置
WO2014017371A1 (ja) * 2012-07-25 2014-01-30 株式会社ニコン 信号処理装置、撮像装置、及び、プログラム
US8649689B2 (en) 2009-06-24 2014-02-11 Fujitsu Limited Digital coherent receiving apparatus

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005057552A1 (ja) * 2003-12-09 2005-06-23 National Institute Of Advanced Industrial Science And Technology 音響信号除去装置、音響信号除去方法及び音響信号除去プログラム
WO2005057551A1 (ja) * 2003-12-09 2005-06-23 National Institute Of Advanced Industrial Science And Technology 音響信号除去装置、音響信号除去方法及び音響信号除去プログラム
WO2005112007A1 (ja) * 2004-05-13 2005-11-24 Fuji Television Network, Inc. 音響信号除去装置、音響信号除去方法及び音響信号除去プログラム
EP2270981A2 (en) 2009-06-19 2011-01-05 Fujitsu Limited Digital signal processing apparatus and digital signal processing method
US8649689B2 (en) 2009-06-24 2014-02-11 Fujitsu Limited Digital coherent receiving apparatus
US9444554B2 (en) 2009-06-24 2016-09-13 Fujitsu Limited Digital coherent receiving apparatus
JP2011248290A (ja) * 2010-05-31 2011-12-08 Nara Institute Of Schience And Technology 雑音抑圧装置
WO2014017371A1 (ja) * 2012-07-25 2014-01-30 株式会社ニコン 信号処理装置、撮像装置、及び、プログラム
CN104662605A (zh) * 2012-07-25 2015-05-27 株式会社尼康 信号处理装置、拍摄装置及程序

Similar Documents

Publication Publication Date Title
US6044341A (en) Noise suppression apparatus and recording medium recording processing program for performing noise removal from voice
US6336092B1 (en) Targeted vocal transformation
US7379866B2 (en) Simple noise suppression model
JP3875513B2 (ja) デジタルに圧縮されたスピーチの了解度を向上させる方法および装置
JP4792613B2 (ja) 情報処理装置および方法、並びに記録媒体
WO1999030315A1 (fr) Procede et dispositif de traitement du signal sonore
JP4490507B2 (ja) 音声分析装置および音声分析方法
JP2003044098A (ja) 音声帯域拡張装置及び音声帯域拡張方法
US20100217584A1 (en) Speech analysis device, speech analysis and synthesis device, correction rule information generation device, speech analysis system, speech analysis method, correction rule information generation method, and program
JP2020507819A (ja) スペクトル包絡線のフォルマントの周波数シフトによって声の音質を動的に修正するための方法および装置
JP2005157363A (ja) フォルマント帯域を利用したダイアログエンハンシング方法及び装置
JP3960834B2 (ja) 音声強調装置及び音声強調方法
JP5148414B2 (ja) 信号帯域拡張装置
JPH1138997A (ja) 雑音抑圧装置および音声の雑音除去の処理をするための処理プログラムを記録した記録媒体
JP4123835B2 (ja) 雑音抑圧装置および雑音抑圧方法
JP2004272292A (ja) 音信号加工方法
JP2002123298A (ja) 信号符号化方法、装置及び信号符号化プログラムを記録した記録媒体
JP7156084B2 (ja) 音信号処理プログラム、音信号処理方法及び音信号処理装置
JP3618217B2 (ja) 音声のピッチ符号化方法及び音声のピッチ符号化装置並びに音声のピッチ符号化プログラムが記録された記録媒体
JPH07199997A (ja) 音声信号の処理システムにおける音声信号の処理方法およびその処理における処理時間の短縮方法
JPH1138999A (ja) 雑音抑圧装置および雑音抑圧処理プログラムを記録した記録媒体
JPH1138998A (ja) 雑音抑圧装置および雑音抑圧処理プログラムを記録した記録媒体
JP2000122679A (ja) 音声帯域拡張方法及び装置、音声合成方法及び装置
KR100715013B1 (ko) 대역확장장치 및 방법
Hasan et al. An approach to voice conversion using feature statistical mapping

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20041005