JP2004029674A - 雑音信号符号化装置及び雑音信号復号化装置 - Google Patents

雑音信号符号化装置及び雑音信号復号化装置 Download PDF

Info

Publication number
JP2004029674A
JP2004029674A JP2002189904A JP2002189904A JP2004029674A JP 2004029674 A JP2004029674 A JP 2004029674A JP 2002189904 A JP2002189904 A JP 2002189904A JP 2002189904 A JP2002189904 A JP 2002189904A JP 2004029674 A JP2004029674 A JP 2004029674A
Authority
JP
Japan
Prior art keywords
noise
amplitude
base
information
phase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002189904A
Other languages
English (en)
Inventor
Yoka O
王 幼華
Koji Yoshida
吉田 幸司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2002189904A priority Critical patent/JP2004029674A/ja
Publication of JP2004029674A publication Critical patent/JP2004029674A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】少ない情報量で原音に近い雑音信号の伝送すること。
【解決手段】窓掛け部101は、雑音を含む入力音声信号を所定時間単位(フレーム)で分割してハニングウインドウ等を利用した窓掛け処理を行い、窓掛け処理後の入力音声信号をFFT部102に出力する。FFT部102は、窓掛け部101から出力されたフレーム単位の音声信号に直交変換を行い、音声信号を周波数領域に変換する。ノイズベース推定部103は、フレーム単位で音声スペクトル信号から雑音のみを含む信号のノイズベースを推定する。間引き処理部104は、所定の周波数間隔で、ノイズベースの振幅情報を抽出し、抽出されたノイズベースの振幅情報を振幅量子化部105に出力する。振幅量子化部105は、抽出されたノイズベースの振幅値を量子化し、その結果を雑音振幅情報として出力する。
【選択図】   図1

Description

【0001】
【発明の属する技術分野】
本発明は、雑音信号符号化装置及び雑音信号復号化装置に関し、特に通信装置に用いて好適な雑音信号符号化装置及び雑音信号復号化装置に関する。
【0002】
【従来の技術】
音声符号化の前処理として用いられる雑音抑圧は、低レート符号化の品質改善にとって重要である。しかし、低SN比である騒音環境下において雑音を抑圧する場合、雑音抑圧により生じた音声歪や残留雑音は、符号化及び復号化を通して不自然に聞こえる問題点がある。
【0003】
この問題を解決する方法として、入力信号を音声と雑音に分離して各々符号化して伝送し、この符号化した信号を復号した後、復号化した音声と雑音を加算して入力信号を再生する方法がある。この方法を用いることにより、高品質な音声と自然感のある周囲騒音を再生し、違和感のない通話の実現が期待されている。
【0004】
上記に示す音声と雑音を分離して符号化する手法、および雑音符号化手法の一例として、特開平11−242499号公報及び特開2000−99096号公報に記載されているものがある。特開平11−242499号公報及び特開2000−99096号公報に記載されている雑音信号符号化手法は、分離後の雑音信号に対して、DFT(Discrete Fourier  Transform)を用いて帯域分割し、帯域毎の平均化された雑音スペクトル振幅成分を符号化する手法である。
【0005】
この手法は、全ての帯域の平均化した雑音スペクトルの振幅情報を伝送するので多くの伝送情報量が必要になる。そこで、少ない情報量で全ての帯域の平均化した雑音スペクトルの振幅情報を伝送する場合、分割する帯域の数を少なくする必要がある。この結果、分割する帯域の数を少なくすると周波数分解能が悪くなる。
【0006】
また、雑音の振幅情報のみを用いて符号化及び復号化を行うので、ある周波数成分に雑音のエネルギーが集中し、かつ振幅値の変化が少ない雑音、例えば、車内ノイズや計算機ノイズなどに対して、原音に近い雑音の再生が難しい。
【0007】
【発明が解決しようとする課題】
このように、従来の装置においては、少ない情報量で原音に近い雑音信号の符号化及び復号化することが難しいという問題がある。
【0008】
本発明はかかる点に鑑みてなされたものであり、少ない情報量で効率よく原音に近い雑音信号の伝送を可能とする雑音信号符号化装置及び雑音信号復号化装置を提供することを目的とする。
【0009】
【課題を解決するための手段】
本発明の雑音信号符号化装置は、入力音声スペクトルのノイズベースを推定するノイズベース推定手段と、前記ノイズベースを間引きしてノイズベース振幅情報を抽出する抽出手段と、前記ノイズベース振幅情報を量子化して雑音符号化情報を作成する量子化手段と、を具備する構成を採る。
【0010】
この構成によれば、全ての帯域の雑音スペクトルの情報のうち、聴感上重要である雑音スペクトルの情報を抽出して雑音スペクトルの情報を間引きし、抽出した雑音スペクトル情報を符号化することにより、少ない情報量で効率よくノイズベースの振幅情報を抽出及び伝送することができる。
【0011】
本発明の雑音信号符号化装置は、抽出手段は、雑音エネルギーの多い周波数領域におけるノイズベースを抽出する周波数間隔を雑音エネルギーの少ない周波数領域におけるノイズベースを抽出する周波数間隔より小さくしてノイズベース振幅情報を抽出する構成を採る。
【0012】
この構成によれば、異なる間引き周波数間隔を用いてノイズベースの振幅情報を抽出し、大きなエネルギーの雑音信号が集中する周波数領域の情報を用いてノイズベースを復元することにより、少ない情報量で効率よくノイズベースの振幅情報を抽出及び伝送することができる。
【0013】
本発明の雑音信号符号化装置は、抽出手段は、ノイズベース振幅情報を抽出する周波数間隔について低周波数領域における周波数間隔を高周波数領域における周波数間隔より小さくする構成を採る。
【0014】
この構成によれば、大きなエネルギーの雑音信号が低周波数領域に集中する特性を利用して、異なる間引き周波数間隔を用いてノイズベースの振幅情報を抽出することにより、少ない情報量で効率よくノイズベースの振幅情報を抽出及び伝送することができる。
【0015】
本発明の雑音信号符号化装置は、抽出手段は、ノイズベース振幅情報を抽出する周波数を中心とした所定の周波数領域における振幅の最大値をノイズベース振幅情報とする構成を採る。
【0016】
この構成によれば、抽出されたノイズベースの振幅値をその近傍の周波数における振幅値と比較し、最大値をノイズベース振幅値として抽出することにより、聴感上では重要と思われるエネルギーの高いノイズベースの振幅情報を抽出することができ、よりよい雑音品質を再生することができる。
【0017】
本発明の雑音信号符号化装置は、抽出手段は、複数の周波数領域からそれぞれ少なくとも一つの周波数のノイズベース振幅情報を抽出する構成を採る。
【0018】
この構成によれば、間引きされたノイズベースに対して、複数の周波数領域に分割し、各周波数領域において、各符号化時間単位で量子化・伝送すべき少数のノイズベース振幅値を伝送することで、雑音信号符号化すべき情報量を大きく低減することができる。
【0019】
本発明の雑音信号符号化装置は、ノイズベースの中で最も大きい振幅をノイズベース最大振幅値として抽出する最大値抽出手段と、前記振幅が最も大きいノイズベースの周波数を最大値位置として抽出する最大値位置抽出手段と、前記最大値位置に基づいて振幅が最も大きいノイズベースの位相を抽出する位相抽出手段と、前記位相を量子化する位相量子化手段と、を具備する構成を採る。
【0020】
本発明の雑音信号符号化装置は、入力音声スペクトルから雑音成分のみのスペクトルであるノイズベースを推定するノイズベース推定手段と、ノイズベースの中で最も大きい振幅をノイズベース最大振幅値として抽出する最大値抽出手段と、前記振幅が最も大きいノイズベースの周波数を最大値位置として抽出する最大値位置抽出手段と、前記最大値位置に基づいて振幅が最も大きいノイズベースの位相を抽出する位相抽出手段と、前記位相を量子化する位相量子化手段と、を具備する構成を採る。
【0021】
これらの構成によれば、ノイズベースの最大振幅値およびその最大振幅値を有する周波数位置を抽出し、更に、前記最大振幅値を有する周波数およびその近傍の周波数のノイズベースに対応する位相を抽出し符号化することにより、特定の周波数成分にエネルギーが集中し、かつレベルの変化が少ない雑音信号に対して、この雑音信号を振幅値および位相を少ないビット数で符号化することにより、少ない情報量で、原音に近い雑音を符号化することができる。
【0022】
本発明の雑音信号符号化装置は、ノイズベースに基づいて雑音の特性を推定する雑音特性推定手段と、前記特性に基づいて推定するノイズベースの移動平均値を決定する移動平均係数計算手段と、を具備し、ノイズベース推定手段は、前記移動平均値を用いてノイズベースを平均化して推定する構成を採る。
【0023】
この構成によれば、ノイズベースの時間的変動の大きさに応じてノイズベースの移動平均係数の値を調整することによって、雑音の種類により異なる雑音スペクトルの時間的変動特性を反映できるノイズベース振幅情報の抽出ができ、実際の雑音に近い特性の雑音信号の符号化を行うことができる。
【0024】
本発明の雑音信号復号化装置は、ノイズベースから周波数方向で間引きして抽出されたノイズベース振幅情報を補間するノイズベース補間手段と、ランダムな位相を生成する乱数位相生成手段と、前記ノイズベース補間手段において補間されたノイズベース情報に前記ランダムな位相を乗算する乗算手段と、を具備する構成を採る。
【0025】
本発明の雑音信号復号化装置は、上記の雑音信号符号化装置において符号化されたノイズベースの振幅情報を補間するノイズベース補間手段と、ランダムな位相を生成する乱数位相生成手段と、前記ノイズベース補間手段において補間されたノイズベース情報に前記ランダムな位相を乗算する乗算手段と、を具備する構成を採る。
【0026】
これらの構成によれば、間引きされた雑音の振幅の情報を復号した結果に基づいてノイズベースの補間処理を行うことにより、ノイズベースの振幅情報を復元することができる。また、これらの構成によれば、復元されたノイズベースに対して乱数位相を与えて、雑音信号スペクトルを再構成し、再構成した雑音信号スペクトルを直交変換することによって、雑音信号を再生することができる。
【0027】
本発明の雑音信号復号化装置は、乗算手段は、振幅が最も大きいノイズベースの周波数領域について、振幅が最も大きいノイズベースの振幅値と位相とを乗算した結果をノイズベースとして出力する構成を採る。
【0028】
本発明の雑音信号復号化装置は、振幅が最も大きいノイズベースの振幅値と位相とを復号する復号化手段と、前記振幅値と前記位相とを乗算した結果をノイズベースとして出力する乗算手段と、を具備する構成を採る。
【0029】
これらの構成によれば、前記最大振幅値をもつノイズベースの振幅情報及び位相情報に基づいてノイズベースを復元することにより、少ない情報量で、原音に近い雑音を再生することができる。
【0030】
本発明の雑音信号符号化プログラムは、入力音声スペクトルから雑音成分のみのスペクトルであるノイズベースを推定するノイズベース推定ステップと、前記ノイズベースから周波数方向で間引きしてノイズベース振幅情報を抽出する間引きステップと、前記ノイズベース振幅情報を量子化して雑音符号化情報を作成する量子化ステップと、をコンピュータに実行させる構成を採る。
【0031】
この構成によれば、全ての帯域の雑音スペクトルの情報のうち、聴感上重要である雑音スペクトルの情報を抽出して雑音スペクトルの情報を間引きし、抽出した雑音スペクトル情報を符号化することにより、少ない情報量で効率よくノイズベースの振幅情報を抽出及び伝送することができる。
【0032】
本発明の雑音信号符号化プログラムは、入力音声スペクトルから雑音成分のみのスペクトルであるノイズベースを推定するノイズベース推定ステップと、振幅が最も大きいノイズベースの振幅をノイズベース最大振幅値として抽出する最大値抽出ステップと、前記振幅が最も大きいノイズベースの周波数を最大値位置として抽出する最大値位置抽出ステップと、前記最大値位置に基づいて振幅が最も大きいノイズベースの位相を抽出する位相抽出ステップと、前記位相を量子化する位相量子化ステップと、をコンピュータに実行させる構成を採る。
【0033】
この構成によれば、ノイズベースの最大振幅値およびその最大振幅値を有する周波数位置を抽出し、更に、前記最大振幅値を有する周波数およびその近傍の周波数のノイズベースに対応する位相を抽出し符号化することにより、特定の周波数成分にエネルギーが集中し、かつレベルの変化が少ない雑音信号に対して、この雑音信号を振幅値および位相を少ないビット数で符号化することにより、少ない情報量で、原音に近い雑音を符号化することができる。
【0034】
本発明の雑音信号復号化プログラムは、ノイズベースから周波数方向で間引きして抽出されたノイズベース情報を補間するノイズベース補間ステップと、ランダムな位相を生成する乱数位相生成ステップと、前記ノイズベース補間手段において補間されたノイズベース情報に前記ランダムな位相を乗算する乗算ステップと、をコンピュータに実行させる構成を採る。
【0035】
この構成によれば、間引きされた雑音の振幅の情報を復号した結果に基づいてノイズベースの補間処理を行うことにより、ノイズベースの振幅情報を復元することができる。また、本実施の形態の雑音信号復号化装置によれば、復元されたノイズベースに対して乱数位相を与えて、雑音信号スペクトルを再構成し、再構成した雑音信号スペクトルを逆フーリエ変換することによって、雑音信号を再生することができる。
【0036】
本発明の雑音信号復号化プログラムは、振幅が最も大きいノイズベースの振幅値と位相とを復号する復号化ステップと、前記振幅値と前記位相とを乗算した結果をノイズベースとして出力する乗算ステップと、をコンピュータに実行させる構成を採る。
【0037】
この構成によれば、前記最大振幅値をもつノイズベースの振幅情報及び位相情報に基づいてノイズベースを復元することにより、少ない情報量で、原音に近い雑音を再生することができる。
【0038】
本発明の雑音信号符号化・復号化方法は、符号化側において、入力音声スペクトルから雑音成分のみのスペクトルであるノイズベースを推定し、前記ノイズベースから周波数方向で間引きしてノイズベース振幅情報を抽出し、前記ノイズベース振幅情報を量子化して雑音符号化情報を作成し、復号化側において、前記ノイズベース情報を補間し、ランダムな位相を生成し、補間されたノイズベース情報に前記ランダムな位相を乗算するようにした。
【0039】
この方法によれば、全ての帯域の雑音スペクトルの情報のうち、聴感上重要である雑音スペクトルの情報を抽出して雑音スペクトルの情報を間引きし、抽出した雑音スペクトル情報を符号化することにより、少ない情報量で効率よくノイズベースの振幅情報を抽出及び伝送することができる。
【0040】
また、この方法によれば、間引きされた雑音の振幅の情報を復号した結果に基づいてノイズベースの補間処理を行うことにより、ノイズベースの振幅情報を復元することができる。また、この方法によれば、復元されたノイズベースに対して乱数位相を与えて、雑音信号スペクトルを再構成し、再構成した雑音信号スペクトルを逆フーリエ変換することによって、雑音信号を再生することができる。
【0041】
本発明の雑音信号符号化・復号化方法は、符号化側において、入力音声スペクトルから雑音成分のみのスペクトルであるノイズベースを推定し、振幅が最も大きいノイズベースの振幅値をノイズベース最大振幅値として抽出し、前記振幅が最も大きいノイズベースの周波数を最大値位置として抽出し、前記最大値位置に基づいて振幅が最も大きいノイズベースの位相を抽出し、復号化側において、前記振幅値と前記位相とを乗算した結果をノイズベースとして出力するようにした。
【0042】
この方法よれば、ノイズベースの最大振幅値およびその最大振幅値を有する周波数位置を抽出し、更に、前記最大振幅値を有する周波数およびその近傍の周波数のノイズベースに対応する位相を抽出し符号化することにより、特定の周波数成分にエネルギーが集中し、かつレベルの変化が少ない雑音信号に対して、この雑音信号を振幅値および位相を少ないビット数で符号化することにより、少ない情報量で、原音に近い雑音を符号化することができる。
【0043】
また、この方法によれば、ノイズベースの最大振幅値およびその最大振幅値を有する周波数位置を抽出し、更に、前記最大振幅値を有する周波数およびその近傍の周波数のノイズベースに対応する位相を抽出し符号化することにより、特定の周波数成分にエネルギーが集中し、かつレベルの変化が少ない雑音信号に対して、この雑音信号を振幅値および位相を少ないビット数で符号化することにより、少ない情報量で、原音に近い雑音を符号化することができる。
【0044】
【発明の実施の形態】
本発明者は、雑音を符号化する場合、全ての帯域の雑音スペクトルの情報を伝送することにより多くの伝送情報量が必要になることに着目し、本発明をするに至った。
【0045】
すなわち、本発明の骨子は、全ての帯域の雑音スペクトルの情報のうち、聴感上重要である雑音スペクトルの情報を抽出して雑音スペクトルの情報を間引きし、抽出した雑音スペクトル情報を符号化することである。
【0046】
以下、本発明の実施の形態について図面を参照して詳細に説明する。
(実施の形態1)
図1は、本発明の実施の形態1に係る雑音信号符号化装置の構成を示すブロック図である。図1の雑音信号符号化装置100は、窓掛け部101と、FFT部102と、ノイズベース推定部103と、間引き処理部104と、振幅量子化部105とから主に構成される。
【0047】
窓掛け部101は、雑音を含む入力音声信号を所定時間単位(フレーム)で分割してハニングウインドウ等を利用した窓掛け処理を行い、窓掛け処理後の入力音声信号をFFT部102に出力する。
【0048】
FFT部102は、窓掛け部101から出力されたフレーム単位の音声信号に直交変換を行い、音声信号を周波数領域に変換する。具体的には、FFT部102は、窓掛け部101から出力されたフレーム単位の音声信号にFFT(Fast Fourier  Transform)を行い、音声信号を周波数領域に変換する。そして、FFT部102は、得られた音声スペクトル信号をノイズベース推定部103に出力する。
【0049】
ノイズベース推定部103は、フレーム単位で音声スペクトル信号から雑音のみを含む信号の周波数振幅スペクトル(以下、「ノイズベース」という)を推定する。そして、ノイズベース推定部103は、推定されたノイズベースを間引き処理部104に出力する。
【0050】
以下、ノイズベース推定部103の詳細な動作について説明する。最初に、ノイズベース推定部103は、各周波数成分において、FFT部102から出力された音声スペクトル信号と前フレームのノイズベースを比較する。
【0051】
そして、ノイズベース推定部103は、音声スペクトル信号と前フレームのノイズベースの差が予め設定された閾値を超える場合は、フレームに音声成分が含まれていると判別し、ノイズベースの更新を行わない。また、ノイズベース推定部103は、この差が予め設定された閾値を超えない場合は、フレームに音声成分が含まれていないと判別し、ノイズベースの更新を行う。
【0052】
具体的には、まず、周波数成分kにおける入力音声パワースペクトル を式(1)を用いて計算する。
【0053】
【数1】
Figure 2004029674
ここで、kは、周波数成分を特定する番号を示す。また、Re{D(k)}は、FFT後の入力音声スペクトルD(k)の実数部を示し、Im{D(k)}は、FFT後の入力音声スペクトルD(k)の虚数部を示す。また、HBはFFT変換長を示す。
【0054】
そして、ノイズベース推定部103は、式(2)を用いてフレーム番号m、周波数成分kにおけるノイズベースを推定する。
【0055】
【数2】
Figure 2004029674
ここで、Nbase(m−1,k)は前フレームにおけるノイズベースの推定値を示す。また、αは、ノイズベースの移動平均係数であり、Θbaseは、音声と非音声を識別する閾値である。
【0056】
このように、ノイズベース推定部103は、音声スペクトルからノイズベースを推定して間引き処理部104に出力する。
【0057】
間引き処理部104は、所定の周波数間隔で、ノイズベースの振幅情報を抽出し、抽出されたノイズベースの振幅情報を振幅量子化部105に出力する。
【0058】
具体的には、間引き処理部104は、以下の式(3)を用いて予め設定された間引き周波数間隔 でノイズベースの振幅情報を抽出する。
【0059】
【数3】
Figure 2004029674
ここで、Dは、ノイズベースの振幅を抽出する周波数成分を示す。例えば、D=10は、10個の周波数成分毎に1個のノイズベースの振幅値を抽出することを意味する。また、Nbase dec(n)は、間引きされたノイズベースの振幅情報を示す。また、Nは、間引き後のノイズスペクトル振幅の個数であり、N=HB/(2・D)から求められる。
【0060】
振幅量子化部105は、抽出されたノイズベースの振幅値を量子化し、その結果を雑音振幅情報として出力する。
【0061】
雑音信号符号化装置100は、上記構成により雑音スペクトルの情報を抽出し、抽出した雑音スペクトル情報を符号化する。次に、本実施の形態に係る雑音信号符号化装置のノイズベースの間引きについて説明する。
【0062】
図2は、ノイズベースの一例を示す図である。図2において、破線は、間引き前のノイズベースを示し、実線は、間引きしたノイズベースを示す。また、点線は、ノイズベースの線形補間処理を示す。なお、縦軸は振幅値を示し、横軸は周波数を示す。
【0063】
ノイズベース推定部103は、音声スペクトルの破線で示されるノイズベースを推定する。このノイズベース情報を全て使用する場合、大きな情報量となる。
【0064】
そこで、間引き処理部104は、所定の周波数間隔で、ノイズベースの振幅情報を抽出する。図2の実線は、10個の周波数成分毎に振幅情報を抽出したノイズベースである。振幅量子化部105は、この抽出されたノイズベースの振幅情報を量子化する。抽出されたノイズベースは、間引きされた分、情報量が少なくなっている。
【0065】
復号側では、この抽出されたノイズベースに線形補間処理等の間引きした部分を補う処理を行い、ノイズベースを復元する。
【0066】
次に、復号側について説明する。図3は、本実施の形態の雑音信号復号化装置の構成を示すブロック図である。図3の雑音信号復号化装置300は、ノイズベース情報復号器301と、ノイズベース補間部302と、乱数位相生成器303と、乗算器304と、IFFT部305とから主に構成される。
【0067】
ノイズベース情報復号器301は、符号化されたノイズベースの振幅情報を復号化し、復号結果をノイズベース補間部302に出力する。
【0068】
ノイズベース補間部302は、雑音振幅復号情報に基づいて間引きされたノイズベース振幅値に対して補間処理を行い、ノイズベースを復元する。そして、ノイズベース補間部302は、復元したノイズベースを乱数位相生成器303に出力する。
【0069】
具体的には、ノイズベース補間部302は、以下の線形補間の式(4)を用いて間引きされたノイズベース振幅情報の補間処理を行う。
【0070】
【数4】
Figure 2004029674
ここで、Nbase int(m,k)は、ノイズベースを線形補間した結果である。また、Nbase int(0)=0とする。
【0071】
乱数位相生成器303は、ランダムに位相を生成し、生成した位相情報を乗算器304に出力する。
【0072】
乗算器304は、ノイズベース補間部302において復元されたノイズベースと乱数位相生成器303から生成された乱数位相と乗算して雑音信号のスペクトルを再構成する。そして、乗算器304は、再構成した雑音信号のスペクトルをIFFT部305に出力する。
【0073】
IFFT部305は、乗算器304から出力された雑音信号のスペクトルに逆フーリエ変換を行い、得られた雑音復号信号を出力する。具体的には、IFFT部305は、雑音信号のスペクトルにIFFT(Inverse  Fast  Fourier Transform)を行い、スペクトル信号を雑音復号信号に変換する。
【0074】
このように、本実施の形態の雑音信号符号化装置によれば、入力信号から雑音情報のみを含むノイズベースの推定を行い、このノイズベースに対して間引き処理を行うことによって、少ない情報量でノイズベースの振幅情報を符号化することができる。
【0075】
また、本実施の形態の雑音信号復号化装置によれば、間引きされた雑音の振幅の情報を復号した結果に基づいてノイズベースの補間処理を行うことにより、ノイズベースの振幅情報を復元することができる。また、本実施の形態の雑音信号復号化装置によれば、復元されたノイズベースに対して乱数位相を与えて、雑音信号スペクトルを再構成し、再構成した雑音信号スペクトルを逆フーリエ変換することによって、雑音信号を再生することができる。
【0076】
そして、本実施の形態の雑音信号符号化装置及び雑音信号復号化装置によれば、符号化側で入力信号から推定したノイズベースに対して間引き処理を行い、復号側で間引きしたノイズベースに基づいてノイズベースを補間することにより、少ない情報量で原音に近い雑音信号の伝送を可能とすることができる。
【0077】
(実施の形態2)
図4は、本発明の実施の形態2に係る雑音信号符号化装置の構成を示すブロック図である。但し、図1と同一の構成となるものについては、図1と同一番号を付し、詳しい説明を省略する。図4の雑音信号符号化装置400は、非均等間引き処理部401を具備し、雑音の特性を考慮して、周波数領域別に異なる周波数間隔で符号化すべきノイズベースの情報を抽出する点が、図1の雑音信号符号化装置と異なる。
【0078】
図4において、ノイズベース推定部103は、フレーム単位で音声スペクトル信号から雑音のみを含む信号のノイズベースを推定する。そして、ノイズベース推定部103は、推定されたノイズベースを非均等間引き処理部401に出力する。
【0079】
非均等間引き処理部401は、ノイズベース推定部103から出力されたノイズベース振幅情報を周波数領域別に異なる周波数間隔で符号化すべきノイズベースの情報を抽出する非均等間引き処理を行い、抽出したノイズベースの情報を振幅量子化部105に出力する。
【0080】
具体的には、非均等間引き処理部401は、雑音のエネルギーは通常低周波数領域に集中する特性を利用して、低周波数領域において、スペクトルから情報を抽出する周波数間隔を小さくし、高周波数領域において、スペクトルから情報を抽出する周波数間隔を大きくする。
【0081】
振幅量子化部105は、抽出されたノイズベースの振幅値を量子化し、その結果を雑音振幅情報として出力する。
【0082】
雑音信号符号化装置400は、上記構成により雑音スペクトルの情報を周波数領域別に異なる周波数間隔で抽出し、抽出した雑音スペクトル情報を符号化する。
【0083】
次に、本実施の形態に係る雑音信号符号化装置のノイズベースの間引きについて説明する。図5は、ノイズベースの一例を示す図である。図5において、破線は、間引き前のノイズベースを示し、実線は、間引きしたノイズベースを示す。また、点線は、ノイズベースの線形補間処理を示す。なお、縦軸は振幅値を示し、横軸は周波数(周波数成分の番号、×4000/256(=15.625)Hz)を示す。
【0084】
ノイズベース推定部103は、音声スペクトルの破線で示されるノイズベースを推定する。このノイズベース情報を全て使用する場合、大きな情報量となる。
【0085】
図5の破線のノイズベースにおいて、50番目の周波数成分(=約781Hz)未満の周波数領域では、ノイズベースの振幅が大きい、すなわちエネルギーが大きい。そして、50番目の周波数成分(=約781Hz)以上の周波数領域では、ノイズベースの振幅が小さい、すなわちエネルギーが小さい。
【0086】
そこで、非均等間引き処理部401は、ノイズベースの振幅の大きい低周波数領域においてノイズベースを抽出する周波数間隔を小さくし、ノイズベースの振幅の小さい高周波数領域においてノイズベースを抽出する周波数間隔を大きくする。図5の実線は、振幅情報を抽出したノイズベースである。
【0087】
振幅量子化部105は、この抽出されたノイズベースの振幅情報を量子化する。抽出されたノイズベースは、間引きされた分、情報量が少なくなっている。
【0088】
復号側では、この抽出されたノイズベースに線形補間処理等の間引きした部分を補う処理を行い、ノイズベースを復元する。雑音信号符号化装置400により符号化された雑音信号は、実施の形態1の雑音信号復号化装置300と同様に構成により復号化できる。
【0089】
このように、本実施の形態の雑音信号符号化装置によれば、大きなエネルギーの雑音信号が低周波数領域に集中する特性を利用して、異なる間引き周波数間隔を用いてノイズベースの振幅情報を抽出することにより、少ない情報量で効率よくノイズベースの振幅情報を抽出及び伝送することができる。
【0090】
具体的には、本実施の形態の雑音信号符号化装置によれば、ノイズベースの振幅情報の抽出において、ノイズベース情報を抽出する周波数間隔について雑音エネルギーの多い周波数領域における周波数間隔を雑音エネルギーの少ない周波数領域における周波数間隔より小さくすることにより、少ない情報量で効率よくノイズベースの振幅情報を抽出及び伝送することができる。
【0091】
(実施の形態3)
実施の形態3では、ノイズベース情報を抽出する周波数を中心とした所定の周波数領域の中で振幅が最も大きいノイズベースを抽出し、この振幅値を符号化するノイズベースの振幅情報とする例について説明する。
【0092】
図6は、本発明の実施の形態3に係る雑音信号符号化装置の構成を示すブロック図である。但し、図1または図4と同一の構成となるものについては、図1または図4と同一番号を付し、詳しい説明を省略する。図6の雑音信号符号化装置600は、振幅選択部601を具備し、ノイズベース情報を抽出する周波数を中心とした所定の周波数領域の中で振幅が最も大きいノイズベースを抽出し、この最大値を符号化すべきノイズベースの振幅情報とする点が、図4の雑音信号符号化装置と異なる。
【0093】
図6において、ノイズベース推定部103は、フレーム単位で音声スペクトル信号から雑音のみを含む信号のノイズベースを推定する。そして、ノイズベース推定部103は、推定されたノイズベースを非均等間引き処理部401と振幅選択部601に出力する。
【0094】
非均等間引き処理部401は、ノイズベース推定部103から出力されたノイズベース振幅情報を周波数領域別に異なる周波数間隔で符号化すべきノイズベースの情報を抽出する非均等間引き処理を行い、抽出したノイズベースの情報を振幅選択部601に出力する。
【0095】
振幅選択部601は、非均等間引き処理部401で抽出されたノイズベース振幅値とその近傍の周波数における振幅値を比較し、振幅が最大である振幅値を抽出する、そして、振幅選択部601は、抽出した振幅値をノイズベース振幅値として振幅量子化部105に出力する。
【0096】
振幅量子化部105は、抽出されたノイズベースの振幅値を量子化し、その結果を雑音振幅情報として出力する。
【0097】
雑音信号符号化装置600は、上記構成により雑音スペクトルの情報を抽出し、抽出した雑音スペクトル情報を符号化する。次に、本実施の形態に係る雑音信号符号化装置のノイズベースの振幅の比較の一例について説明する。
【0098】
振幅選択部601は、周波数成分kにおける間引きされたノイズベースの振幅値は、周波数成分k−1およびk+1におけるノイズベースの振幅値と比較して、そのうちの最大値を周波数成分kにおけるノイズベースの振幅値とする。
【0099】
以下、3つの例を用いて振幅値の比較及び抽出について説明する。図7は、ノイズベースの一例を示す図である。図7において、縦軸は振幅値を示し、横軸は周波数を示す。図7において、周波数成分kの振幅値701と、周波数成分k−1の振幅値702と、周波数成分k+1の振幅値703とを比較した場合、周波数成分kの振幅値701が最も大きい。そこで、振幅選択部601は、周波数成分kの振幅値701を周波数成分kにおけるノイズベースの振幅値とする。
【0100】
図8は、ノイズベースの一例を示す図である。図8において、縦軸は振幅値を示し、横軸は周波数を示す。図8において、周波数成分kの振幅値801と、周波数成分k−1の振幅値802と、周波数成分k+1の振幅値803とを比較した場合、周波数成分k−1の振幅値802が最も大きい。そこで、振幅選択部601は、周波数成分k−1の振幅値802を周波数成分kにおけるノイズベースの振幅値とする。
【0101】
図9は、ノイズベースの一例を示す図である。図9において、縦軸は振幅値を示し、横軸は周波数を示す。図9において、周波数成分kの振幅値901と、周波数成分k−1の振幅値902と、周波数成分k+1の振幅値903とを比較した場合、周波数成分k+1の振幅値903が最も大きい。そこで、振幅選択部601は、周波数成分k+1の振幅値903を周波数成分kにおけるノイズベースの振幅値とする。
【0102】
このように、本実施の形態の雑音信号符号化装置によれば、抽出されたノイズベースの振幅値をその近傍の周波数における振幅値と比較し、最大値をノイズベース振幅値として抽出することにより、聴感上では重要と思われるエネルギーの高いノイズベースの振幅情報を抽出することができ、よりよい雑音品質を再生することができる。
【0103】
なお、本実施の形態の雑音信号符号化装置は、実施の形態2の雑音符号化装置と同様に、周波数領域別に異なる周波数間隔で符号化すべきノイズベースの情報を抽出する例に適用しているが、抽出するノイズベースの周波数間隔は、特に限定されない。例えば、図1の雑音信号符号化装置100と組み合わせて適用しても良い。
【0104】
(実施の形態4)
図10は実施の形態4に係る雑音信号符号化装置の構成の例を示すブロック図である。但し、図4と共通する構成については図4と同一番号を付し、詳しい説明を省略する。
【0105】
図10の雑音信号符号化装置1000は、周波数分割部1001と順次更新部1002を具備し、各周波数領域における符号化すべきノイズベース情報から各符号化時間単位で更新する情報を順次選択して出力する点が、図4と異なる。
【0106】
図10において、ノイズベース推定部103は、フレーム単位で音声スペクトル信号から雑音のみを含む信号のノイズベースを推定する。そして、ノイズベース推定部103は、推定されたノイズベースを非均等間引き処理部401に出力する。
【0107】
非均等間引き処理部401は、ノイズベース推定部103から出力されたノイズベース振幅情報を周波数領域別に異なる周波数間隔で符号化すべきノイズベースの情報を抽出する非均等間引き処理を行い、抽出したノイズベースの情報を振幅量子化部105に出力する。
【0108】
周波数分割部1001は、間引き処理を行ったノイズベース情報を、少なくとも二つ以上の所定の周波数領域で分割し、各周波数領域のノイズベース振幅情報を順次更新部1002に出力する。
【0109】
順次更新部1002は、分割された各周波数領域において、各符号化時間単位で量子化・伝送すべき少数のノイズベース振幅値を、予め設定された更新順序に基づいてノイズベースの振幅情報を抽出し振幅量子化部105に出力する。
【0110】
振幅量子化部105は、抽出されたノイズベースの振幅値を量子化し、その結果を雑音振幅情報として出力する。
【0111】
雑音信号符号化装置1000は、上記構成により雑音スペクトルの情報を抽出し、抽出した雑音スペクトル情報を符号化する。次に、本実施の形態に係る雑音信号符号化装置のノイズベースの振幅の抽出手順の一例について説明する。
【0112】
図11は、ノイズベースの一例を示す図である。図11において縦軸は振幅値を示し、横軸は周波数を示す。周波数分割部1001は、所定の周波数領域を低周波数領域と高周波数領域に分割し、順次更新部1002は、各周波数領域において、間引きされたノイズベースに対して1個ずつのノイズベースの振幅情報を抽出する。
【0113】
すなわち、図11に示すように、間引き後のノイズベース振幅値として1101〜1109を有する低周波数領域と、1111〜1119を有する高周波数領域に対して、順次更新部1002は、あるフレームmにおいて、低周波数領域からそこに属する周波数成分nを有するノイズベースの振幅値1101を、また、高周波数領域からそこに属する周波数成分n+hを有するノイズベースの振幅値1111を抽出する。ここで、mは、処理するフレームと特定する数値であり、n及びhは周波数成分を示す数値である。
【0114】
次のフレームm+1において、順次更新部1002は、低周波数領域から周波数成分n+1を有するノイズベースの振幅値1102を、また高周波数領域から周波数成分n+1+hを有するノイズベースの振幅値1112を抽出する。
【0115】
順次更新部1002は、周波数を増加する順序で各周波数領域の最も終端の周波数におけるノイズベースの振幅値(低周波数領域では1109、高周波数領域では1119)を抽出したフレームの次フレームからは、同じ手順を再度繰返して以降同様にノイズベースの振幅情報の抽出を行う。
【0116】
このように、本実施の形態の雑音信号符号化装置によれば、間引きされたノイズベースに対して、複数の周波数領域に分割し、各周波数領域において、各符号化時間単位で量子化・伝送すべき少数のノイズベース振幅値を、予め設定された更新順序に基づいて伝送することで、雑音信号符号化すべき情報量を大きく低減することができる。
【0117】
なお、本実施の形態では、周波数を増加する順序で各周波数領域の最も終端の周波数におけるノイズベースの振幅値を抽出しているが、各周波数領域でノイズベースの振幅値を抽出する順序に限定はない。例えば、周波数を減少する順序で各周波数領域の最も終端の周波数におけるノイズベースの振幅値を抽出してもよい。
【0118】
次に復号側について説明する。図12は、実施の形態4に係る雑音信号復号化装置の構成の例を示すブロック図である。但し、図3と共通する構成については図3と同一番号を付し、詳しい説明を省略する。
【0119】
図12の雑音信号復号化装置1200は、記憶部1201を具備し、以前に処理したノイズベースの振幅情報を記憶し、記憶したノイズベース情報から全周波数領域における間引き後のノイズベース振幅情報を再構成する点が、図3と異なる。
【0120】
ノイズベース情報復号器301は、符号化されたノイズベースの振幅情報を復号化し、復号結果を記憶部1201に出力する。
【0121】
記憶部1201は、ノイズベース情報復号器301において復号化されたノイズベースの振幅情報を記憶して全周波数領域における間引き後のノイズベース振幅情報を再構成する。そして、記憶部1201は、再構成したノイズベース情報をノイズベース補間部302に出力する。
【0122】
例えば、記憶部1201は、フレームmで更新されたノイズベースの振幅情報、およびフレームm以前に更新されて保存されたノイズベースの振幅情報を用いて、全周波数領域における間引き後のノイズベース振幅情報を再構成する。
【0123】
ノイズベース補間部302は、雑音振幅復号情報に基づいて間引きされたノイズベース振幅値に対して補間処理を行い、ノイズベースを復元する。そして、ノイズベース補間部302は、復元したノイズベースを乱数位相生成器303に出力する。
【0124】
このように、本実施の形態の雑音信号復号化装置によれば、符号化側において抽出されたノイズベースの振幅情報を記憶し、全周波数領域における間引き後のノイズベースの振幅情報を再構成することにより、少ない情報量で伝送されたノイズベースの情報からノイズベースを復元することができる。
【0125】
なお、本実施の形態の雑音信号符号化装置は、実施の形態2の雑音符号化装置と同様に、周波数領域別に異なる周波数間隔で符号化すべきノイズベースの情報を抽出する例に適用しているが、抽出するノイズベースの周波数間隔は、特に限定されない。例えば、図1の雑音信号符号化装置100と組み合わせて適用しても良い。
【0126】
また、実施の形態4は、実施の形態3と組み合わせることができる。すなわち、図10の雑音信号符号化装置1000に実施の形態3に記載の振幅選択部601を用いれば、実施の形態3の効果も得ることができる。
【0127】
(実施の形態5)
図13は実施の形態5に係る雑音信号符号化装置の構成の例を示すブロック図である。但し、図1または図4と共通する構成については図1または図4と同一番号を付し、詳しい説明を省略する。
【0128】
図13の雑音信号符号化装置1300は、非均等間引き処理部1301と、交互更新部1302とを具備し、抽出したノイズベース情報を送信した後、ノイズベースを抽出する周波数を変える点が、図1または図4と異なる。
【0129】
図13において、ノイズベース推定部103は、フレーム単位で音声スペクトル信号から雑音のみを含む信号のノイズベースを推定する。そして、ノイズベース推定部103は、推定されたノイズベースを非均等間引き処理部1301に出力する。
【0130】
非均等間引き処理部1301は、ノイズベース推定部103から出力されたノイズベース振幅情報を周波数領域別に異なる周波数間隔で符号化すべきノイズベースの情報を抽出する非均等間引き処理を行い、抽出したノイズベースの情報を周波数分割部1001に出力する。そして、非均等間引き処理部1301は、所定のフレーム数分、ノイズベースの情報を抽出した後、ノイズベースの情報を抽出する周波数を変更する。この周波数は、先にノイズベースの情報を抽出する周波数と異なる周波数とする。
【0131】
周波数分割部1001は、間引き処理を行ったノイズベース情報に対して、少なくとも二つ以上の所定の周波数領域に分割し、各周波数領域のノイズベース振幅情報を交互更新部1302に出力する。
【0132】
交互更新部1302は、分割された各周波数領域において、各符号化時間単位で量子化・伝送すべき少数のノイズベース振幅値を、予め設定された更新順序に基づいてノイズベースの振幅情報を抽出し、振幅量子化部105に出力する。そして、非均等間引き処理部1301がノイズベースの情報を抽出する周波数を変更した後、交互更新部1302は、再び、各符号化時間単位で量子化・伝送すべき少数のノイズベース振幅値を、予め設定された更新順序に基づいてノイズベースの振幅情報を抽出し、振幅量子化部105に出力する。
【0133】
振幅量子化部105は、抽出されたノイズベースの振幅値を量子化し、その結果を雑音振幅情報として出力する。
【0134】
雑音信号符号化装置1300は、上記構成により雑音スペクトルの情報を抽出し、抽出した雑音スペクトル情報を符号化する。次に、本実施の形態に係る雑音信号符号化装置のノイズベースの振幅の抽出手順の一例について説明する。
【0135】
雑音信号符号化装置1300は、まず実施の形態4と図11と同様に所定の周波数領域を低周波数領域と高周波数領域に分割し、各周波数領域において、間引きされたノイズベースに対して1個ずつのノイズベースの振幅情報を抽出する。
【0136】
すなわち、図11に示すように、間引き後のノイズベース振幅値として1101〜1109を有する低周波数領域と、1111〜1119を有する高周波数領域に対して、順次更新部1002は、あるフレームmにおいて、低周波数領域からそこに属する周波数成分nを有するノイズベースの振幅値1101を、また、高周波数領域からそこに属する周波数成分n+hを有するノイズベースの振幅値1111を抽出する。ここで、mは、処理するフレームと特定する数値であり、n及びhは周波数成分を示す数値である。
【0137】
次のフレームm+1において、順次更新部1002は、低周波数領域から周波数成分n+1を有するノイズベースの振幅値1102を、また高周波数領域から周波数成分n+1+hを有するノイズベースの振幅値1112を抽出する。
【0138】
順次更新部1002は、周波数を増加する順序で各周波数領域の最も終端の周波数におけるノイズベースの振幅値(低周波数領域では1109、高周波数領域では1119)を抽出したフレームの次フレームからは、同じ手順を再度繰返して以降同様にノイズベースの振幅情報の抽出を行う。
【0139】
そして、全周波数領域の間引いたノイズベースの振幅情報を符号化した後、雑音信号符号化装置1300は、先にノイズベースの情報を抽出した周波数と異なる周波数でノイズベースの情報を抽出する。図14は、ノイズベースの一例を示す図である。図14において、縦軸は振幅値を示し、横軸は周波数を示す。
【0140】
図14のノイズベース1401〜1409及び1411〜1419の周波数は、図11のノイズベース1101〜1109及び1111〜1119と異なる周波数である。
【0141】
雑音信号符号化装置1300は、図11のノイズベース1101〜1109及び1111〜1119を符号化した後、図14のノイズベース1401〜1409及び1411〜1419を符号化する。
【0142】
具体的には、図14に示すように、間引き後のノイズベース振幅値として1401〜1409を有する低周波数領域と、1411〜1419を有する高周波数領域に対して、交互更新部1302は、あるフレームmにおいて、低周波数領域からそこに属する周波数成分nを有するノイズベースの振幅値1401を、また、高周波数領域からそこに属する周波数成分n+hを有するノイズベースの振幅値1411を抽出する。ここで、mは、処理するフレームと特定する数値であり、n及びhは周波数成分を示す数値である。
【0143】
次のフレームm+1において、交互更新部1302は、低周波数領域から周波数成分n+1を有するノイズベースの振幅値1402を、また高周波数領域から周波数成分n+1+hを有するノイズベースの振幅値1412を抽出する。
【0144】
交互更新部1302は、周波数を増加する順序で各周波数領域の最も終端の周波数におけるノイズベースの振幅値(低周波数領域では1409、高周波数領域では1419)を抽出したフレームの次フレームからは、再び、図11のノイズベース1101〜1109及び1111〜1119の振幅情報の抽出を行う。
【0145】
このように、本実施の形態の雑音符号化装置によれば、予め設定された二つ以上の更新順序に基づいて間引きされたノイズベースの振幅情報を更新することによって、少ない情報量で周波数分解能の高いノイズベースの振幅情報の更新を行うことができる。
【0146】
なお、実施の形態5は、実施の形態3と組み合わせることができる。すなわち、図6の雑音信号符号化装置に実施の形態3に記載の振幅選択手段を用いれば、実施の形態3の効果も得ることができる。
【0147】
(実施の形態6)
図15は実施の形態6に係る雑音信号符号化装置の構成の例を示すブロック図である。但し、図1及び図4と共通する構成については図1及び図4と同一番号を付し、詳しい説明を省略する。
【0148】
図15の雑音信号符号化装置1500は、最大値抽出部1501と、最大値位置抽出部1502と、最大値量子化部1503と、位相抽出部1504と、位相量子化部1505とを具備し、振幅値が最大であるノイズベースの振幅と位相の情報を符号化する点が図1及び図4の雑音信号符号化装置と異なる。
【0149】
図15において、ノイズベース推定部103は、フレーム単位で音声スペクトル信号から雑音のみを含む信号のノイズベースを推定する。そして、ノイズベース推定部103は、推定されたノイズベースを非均等間引き処理部401、最大値抽出部1501、及び最大値位置抽出部1502に出力する。
【0150】
最大値抽出部1501は、所定の周波数領域におけるノイズベースの最大振幅値を抽出し、最大振幅値を最大値量子化部1503に出力する。
【0151】
最大値位置抽出部1502は、所定の周波数領域におけるノイズベースの最大振幅値の周波数位置を抽出し、この周波数位置を最大値量子化部1503及び位相抽出部1504に出力する。
【0152】
最大値量子化部1503は、最大値抽出部1501から出力されたノイズベースの最大振幅値及び最大値位置抽出部1502から出力されたノイズベースの最大振幅値の周波数位置を量子化し、雑音最大値情報として出力する。
【0153】
位相抽出部1504は、最大値位置抽出部1502から抽出された最大振幅値の周波数位置情報およびFFT後の入力音声スペクトル情報に基づいて、ノイズベースの最大振幅値を有する周波数およびその近傍の周波数のノイズベースに対応する位相を抽出する。そして、位相抽出部1504はこの位相を位相量子化部1505に出力する。
【0154】
位相量子化部1505は、位相抽出部1504から抽出された位相を量子化し、雑音位相情報として出力する。
【0155】
雑音信号符号化装置1500は、上記構成により振幅値が最大のノイズベースの情報を抽出し、抽出した雑音スペクトル情報を符号化する。次に、本実施の形態に係る雑音信号符号化装置のノイズベースの位相情報の処理の一例について説明する。図16は、位相情報の量子化の一例を示す図である。
【0156】
雑音信号符号化装置1500は、雑音信号符号化ビットを低減するために、雑音のエネルギーが通常低周波数領域に集中する特性を利用して、所定の低周波数領域におけるノイズベースの最大振幅値およびその最大振幅値を有する周波数位置を抽出し、量子化を行うと共に、前記最大振幅値およびその近傍の周波数のノイズベースに対応する入力音声スペクトルの位相を雑音位相として抽出し、量子化を行う。
【0157】
例えば、位相量子化部1505は、位相を図16に示すπ/4、3π/4、5π/4、及び7π/4のいずれかの位相に量子化する。
【0158】
具体的には、位相量子化部1505は、位相が0〜π/2に位置する場合、位相をπ/4に量子化し、π/2〜πに位置する場合、位相を3π/4に量子化する。また、位相量子化部1505は、π〜3π/2に位置する場合、位相を5π/4に量子化し、3π/2〜2πに位置する場合、位相を7π/4に量子化する。
【0159】
このように、位相量子化部1505は、位相を4つの状態に量子化することにより2ビットの情報量で位相を表現することができる。
【0160】
そして、復号側で、間引きしたノイズベース雑音振幅情報と最大振幅値の振幅値と位相の情報からノイズベースを復元する。図17は、本実施の形態の雑音信号復号化装置の構成を示すブロック図である。
【0161】
図17の雑音信号復号化装置1700は、雑音最大値情報復号器1701と、雑音振幅生成器1702と、雑音位相情報復号器1703と、位相付加部1704とを具備し、間引きしたノイズベース雑音振幅情報と最大振幅値の振幅値と位相の情報からノイズベースを復元する点が、図3の雑音信号復号化装置と異なる。
【0162】
ノイズベース情報復号器301は、符号化されたノイズベースの振幅情報を復号化し、復号結果を雑音振幅生成器1702に出力する。
【0163】
雑音最大値情報復号器1701は、雑音最大値情報からノイズベースの振幅の最大値を復号し、この振幅の最大値を雑音振幅生成器1702に出力する。
【0164】
雑音振幅生成器1702は、ノイズベースの振幅情報とノイズベースの振幅の最大値から全周波数領域のノイズベースの振幅情報を生成し、生成したノイズベースの振幅情報をノイズベース補間部302に出力する。
【0165】
ノイズベース補間部302は、雑音振幅生成器1702において生成されたノイズベースの振幅情報に対して補間処理を行い、ノイズベースを復元する。そして、ノイズベース補間部302は、復元したノイズベースを位相付加部1704に出力する。
【0166】
乱数位相生成器303は、ランダムに位相を生成し、生成した位相情報を位相付加部1704に出力する。
【0167】
雑音位相情報復号器1703は、雑音位相情報から振幅値が最大のノイズベースの位相情報を復号し、この位相情報を位相付加部1704に出力する。
【0168】
位相付加部1704は、乱数位相生成器303において生成された乱数位相および雑音位相情報復号器1703から出力された位相情報を用いて、雑音のスペクトルを再構成し、再構成した雑音スペクトルをIFFT部305に出力する。
【0169】
IFFT部305は、乗算器304から出力された雑音信号のスペクトルに逆フーリエ変換を行い、得られた雑音復号信号を出力する。
【0170】
具体的には、IFFT部305は、以下の式(5)を用いて雑音のスペクトルを再構成する。
【0171】
【数5】
Figure 2004029674
ここで、Nbase int(m,k)は復元されたノイズベースの振幅値を示し、Kmaxはノイズベースの最大振幅値を有する周波数を示す。また、θphase(k)は復号された雑音位相情報を示す。例えば2ビットのスカラ量子化を行った場合は、θphaseは、図16に示されるように、π/4、3π/4、5π/4および7π/4に限定される。θrand(k)は乱数位相生成器で生成された乱数位相である。
【0172】
このように、本実施の形態の雑音信号符号化装置によれば、ノイズベースの最大振幅値およびその最大振幅値を有する周波数位置を抽出し、更に、前記最大振幅値を有する周波数およびその近傍の周波数のノイズベースに対応する位相を抽出し符号化することにより、特定の周波数成分にエネルギーが集中し、かつレベルの変化が少ない雑音信号に対して、この雑音信号を振幅値および位相を少ないビット数で符号化することにより、少ない情報量で、原音に近い雑音を符号化することができる。
【0173】
また、本実施の形態の雑音信号復号化装置によれば、前記最大振幅値をもつノイズベースの振幅情報及び位相情報に基づいてノイズベースを復元することにより、少ない情報量で、原音に近い雑音を再生することができる。
【0174】
なお、実施の形態6は、実施の形態3から実施の形態5までのいずれかと組み合わせることができる。すなわち、図15の雑音信号符号化装置に実施の形態3に記載の振幅選択部601を用いれば、実施の形態3の効果も得ることができる。また、図16の雑音信号符号化装置に実施の形態4に記載の周波数分割部1001および順次更新部1002を用いれば、実施の形態4の効果も得ることができ、図16の雑音信号符号化装置に実施の形態5に記載の周波数分割部1001および交互更新部1302を用いれば、実施の形態5の効果も得ることができる。
【0175】
(実施の形態7)
図18は実施の形態7に係る雑音信号符号化装置の構成の例を示すブロック図である。但し、図1と共通する構成については図1と同一番号を付し、詳しい説明を省略する。
【0176】
図18の雑音信号符号化装置1800は、音声/雑音フレーム判別部1801と、雑音特性推定部1802と、移動平均係数計算器1803と、ノイズベース推定部1804とを具備し、雑音の特性に応じてノイズベースの更新速度を調整する点が図1の雑音信号符号化装置と異なる。
【0177】
FFT部102は、窓掛け部101から出力されたフレーム単位の音声信号に直交変換を行い、音声信号を周波数領域に変換する。具体的には、FFT部102は、窓掛け部101から出力されたフレーム単位の音声信号にFFTを行い、音声信号を周波数領域に変換する。そして、FFT部102は、得られた音声スペクトル信号を音声/雑音フレーム判別部1801、雑音特性推定部1802、及びノイズベース推定部1804に出力する。
【0178】
音声/雑音フレーム判別部1801は、入力音声スペクトルおよびノイズベース推定値に基づいて、当該フレームが音声フレームか雑音フレームのいずれであるかを判別する。具体的には、音声/雑音フレーム判別部1801は、最初に各周波数成分において、式(6)を用いて、音声/非音声を判別するコムフィルタ を計算する。
【0179】
【数6】
Figure 2004029674
ここで、S(k)は入力音声パワースペクトルを示し、Θsnは音声と非音声を識別する閾値である。
【0180】
次に、音声/雑音フレーム判別部1801は、式(7)で定義するフレーム毎の音声帯域と雑音帯域のパワー比SNR(m)を計算する。
【0181】
【数7】
Figure 2004029674
もし、SNR(m)が連続して所定数のフレーム(例えば10フレーム)以上にわたって予め設定された閾値より小さい場合、音声/雑音フレーム判別部1801は、当該フレームを雑音フレームと判定し、これ以外の条件では当該フレームを音声フレームと判定する。
【0182】
雑音特性推定部1802は、入力音声スペクトル、ノイズベース推定値および音声/雑音フレームの判別結果に基づいて、雑音の特性を推定する。具体的には、雑音特性推定部1802は、雑音フレームと判別された区間で、以下の式(8)を用いて雑音スペクトルの時間的変動の大きさを推定するためのコムフィルタcomb_est(k)を計算する。
【0183】
【数8】
Figure 2004029674
ここで、Θestは音声/非音声識別閾値である。
【0184】
例えば、雑音スペクトルの時間的変動が大きければ大きいほど、comb_est(k)=1となる周波数帯域が増える。
【0185】
そこで、雑音特性推定部1802は、以下の式(9)を用いてcomb_est(k)=1となる周波数成分を雑音フレーム毎に全帯域に渡り加算して、加算結果の移動平均値を求める。この加算結果の移動平均値から、雑音スペクトルの時間的変動の大きさを推定できる。
【0186】
【数9】
Figure 2004029674
ここで、ns_est(m)は推定された雑音スペクトルの時間的変動量を表す値であり、βは移動平均係数である。
【0187】
移動平均係数計算器1803は、式(9)で推定された雑音の分散値に基づいてノイズベースの移動平均係数の値を計算する。そして、移動平均係数計算器1803は、ノイズベースの移動平均係数をノイズベース推定部1804に出力する。
【0188】
雑音スペクトルの時間的変動が大きい場合(例えば、街頭ノイズなど)、ノイズベース推定部1804は、移動平均係数の値を大きくしてノイズベースの更新速度を速くする。逆に、雑音スペクトルの時間的変動が小さい場合(例えば、車内ノイズなど)、ノイズベース推定部1804は、移動平均係数の値を小さくしてノイズベースの更新速度を遅くする。そして、ノイズベース推定部1804は、フレーム単位で音声スペクトル信号から雑音のみを含む信号のノイズベースを推定する。推定されたノイズベースは、実施の形態1から実施の形態6のいずれかの雑音信号符号化装置においてノイズベース情報を間引きされ、符号化される。
【0189】
このように、本実施の形態の雑音信号符号化装置によれば、ノイズベースの時間的変動の大きさに応じてノイズベースの移動平均係数の値を調整することによって、雑音の種類により異なる雑音スペクトルの時間的変動特性を反映できるノイズベース振幅情報の抽出ができ、実際の雑音に近い特性の雑音信号の符号化を行うことができる。
【0190】
(実施の形態8)
実施の形態8では、実施の形態1から実施の形態7のいずれかの雑音信号符号化装置及び雑音信号復号化装置を用いて音声と雑音とを個々に符号化する例について説明する。
【0191】
図19は、実施の形態8に係る音源分離符号化装置の構成を示すブロック図である。図19において、音源分離符号化装置1900は、音源分離部1901と、音声符号化部1902と、雑音符号化部1903と、から主に構成される。
【0192】
図19において、音源分離部1901は、入力音声信号を音声信号と雑音信号に分離する。そして、音源分離部1901は、分離された音声信号を音声符号化部1902に出力し、分離された雑音信号を雑音符号化部1903に出力する。
【0193】
具体的には、音源分離部1901は、スペクトルサブトラクションによる雑音抑圧手法を用いて入力音声信号に含まれる雑音信号を抑圧し、その結果を分離された音声信号とする。
【0194】
音声符号化部1902は、分離された音声の符号化を行い、その結果を音声符号化情報として出力する。
【0195】
一方、雑音符号化部1903は、雑音の分離および雑音符号化手法として、本発明の実施の形態1から実施の形態7に示された方法を用いて、雑音の分離および符号化を行い、その結果を雑音符号化情報として出力する。
【0196】
次に、音源分離復号化装置について説明する。図20は、実施の形態8に係る音源分離復号化装置の構成を示すブロック図である。図20の音源分離復号化装置2000は、音声復号化部2001と、雑音復号化部2002と、加算器2003から主に構成される。
【0197】
図20において、音声復号化部2001は、音声符号化情報に基づいて、音声信号の復号化を行い、復号化の結果を加算器2003に出力する。雑音復号化部2002は、雑音信号符号化情報に基づいて、雑音信号の復号化を行う。具体的には、本発明の実施の形態1または実施の形態6に示された雑音復号化の手法を用いて雑音の復号化を行い、復号化の結果を加算器2003に出力する。加算器2003は、復号された音声信号と復号された雑音信号を加算し、加算結果を再生音声として出力する。
【0198】
このように、本実施の形態の音源分離符号化装置及び音源分離復号化装置によれば、入力音声信号を音声信号と雑音信号に分離して各々符号化・伝送し、復号側で加算再生する構成にすることにより、高品質な音声と自然感のある周囲騒音を再生し、違和感のない通話を実現することができる。
【0199】
(実施の形態9)
図21は、実施の形態9に係る音源分離復号化装置の構成の例を示すブロック図である。但し、図20と共通する構成については図20と同一番号を付し、詳しい説明を省略する。
【0200】
図21の音源分離復号化装置2100は、雑音レベル調整部2101を具備し、復号化された雑音のレベルを調整する点が図20の雑音信号復号化装置と異なる。
【0201】
音声復号化部2001は、音声符号化情報に基づいて、音声信号の復号化を行い、復号化の結果を加算器2003に出力する。
【0202】
雑音復号化部2002は、雑音信号符号化情報に基づいて、雑音信号の復号化を行う。具体的には、本発明の実施の形態1または実施の形態6に示された雑音復号化の手法を用いて雑音の復号化を行い、復号化の結果を雑音レベル調整部2101に出力する。
【0203】
雑音レベル調整部2101は、復号された雑音信号のレベルを雑音の特性により調整し、その結果を加算器2003に出力する。
【0204】
具体的には、実施の形態7に示された雑音特性推定手法を用いて雑音の特性を推定し、雑音の特性の情報を復号側に送信する。そして、復号側において、雑音の特性の情報を用いて、雑音スペクトルの時間的変動の大きい雑音に対して雑音レベルの減衰を行わない或いは少ない減衰を行い、時間的変動の小さい雑音に対して雑音レベルの減衰を大きくする。
【0205】
加算器2003は、復号された音声信号と復号された雑音信号を加算し、加算結果を再生された入力音声として出力する。
【0206】
この結果、時間的変動の大きい雑音、例えば、街頭ノイズやバブルノイズなどに対して雑音を残してより自然感のある通話を実現することができる。一方、時間的変動の小さい雑音、例えば、車内ノイズや計算機ノイズなどに対して雑音を抑圧して耳障りの生じやすい雑音を低減することができる。
【0207】
このように、本実施の形態の音源分離復号化装置によれば、雑音の特性に基づいて復号化された雑音のレベルを調整し、雑音スペクトルの時間的変動に応じて雑音レベルの減衰量を調整することにより、耳障りな雑音を低減し、自然感のある通話を実現することができる。
【0208】
なお、本発明は上記実施の形態に限定されず、種々変更して実施することが可能である。例えば、上記実施の形態では、雑音信号符号化装置及び雑音信号復号化装置として行う場合について説明しているが、これに限られるものではなく、この雑音音声符号化方法及び雑音音声復号化方法をソフトウェアとして行うことも可能である。
【0209】
例えば、上記雑音音声符号化方法及び雑音音声復号化方法を実行するプログラムを予めROM(Read Only Memory)に格納しておき、そのプログラムをCPU(Central Processor Unit)によって動作させるようにしても良い。
【0210】
また、上記雑音音声符号化方法及び雑音音声復号化方法を実行するプログラムをコンピュータで読み取り可能な記憶媒体に格納し、記憶媒体に格納されたプログラムをコンピュータのRAM(Random Access memory)に記録して、コンピュータをそのプログラムにしたがって動作させるようにしても良い。
【0211】
また、本発明の雑音信号符号化装置、雑音信号復号化装置、雑音信号符号化装置、及び雑音信号復号化装置は、無線通信装置、基地局装置、または通信端末装置に搭載し、それぞれの通信において上記説明と同様の効果を得ることもできる。
【0212】
また、上記説明では、フーリエ変換及び逆フーリエ変換の処理は、直交変換を行う処理であればいずれも適用できる。例えば、DCT(Discrete Cosine
Transform)、DWT(Discrete Wavelet  Transform)等の直交変換を用いてもよい。
【0213】
【発明の効果】
以上説明したように、本発明の雑音信号符号化装置及び雑音信号復号化装置によれば、全ての帯域の雑音スペクトルの情報のうち、聴感上重要である雑音スペクトルの情報を抽出して雑音スペクトルの情報を間引きし、抽出した雑音スペクトル情報を符号化することにより、少ない情報量で原音に近い雑音信号を伝送することができる。
【0214】
また、本発明の雑音信号符号化装置及び雑音信号復号化装置によれば、入力音声信号を音声信号と雑音信号に分離して各々符号化・伝送し、復号側で加算再生する構成にすることにより、高品質な音声と自然感のある周囲騒音を再生し、違和感のない通話を実現することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1に係る雑音信号符号化装置の構成を示すブロック図
【図2】ノイズベースの一例を示す図
【図3】上記実施の形態の雑音信号復号化装置の構成を示すブロック図
【図4】本発明の実施の形態2に係る雑音信号符号化装置の構成を示すブロック図
【図5】ノイズベースの一例を示す図
【図6】本発明の実施の形態3に係る雑音信号符号化装置の構成を示すブロック図
【図7】ノイズベースの一例を示す図
【図8】ノイズベースの一例を示す図
【図9】ノイズベースの一例を示す図
【図10】実施の形態4に係る雑音信号符号化装置の構成の例を示すブロック図
【図11】ノイズベースの一例を示す図
【図12】実施の形態4に係る雑音信号復号化装置の構成の例を示すブロック図
【図13】実施の形態5に係る雑音信号符号化装置の構成の例を示すブロック図
【図14】ノイズベースの一例を示す図
【図15】実施の形態6に係る雑音信号符号化装置の構成の例を示すブロック図
【図16】位相情報の量子化の一例を示す図
【図17】上記実施の形態の雑音信号復号化装置の構成を示すブロック図
【図18】実施の形態7に係る雑音信号符号化装置の構成の例を示すブロック図
【図19】実施の形態8に係る音源分離復号化装置の構成を示すブロック図
【図20】実施の形態8に係る音源分離復号化装置の構成を示すブロック図
【図21】実施の形態9に係る音源分離復号化装置の構成の例を示すブロック図
【符号の説明】
101 窓掛け部
102 FFT部
103、1804 ノイズベース推定部
104 間引き処理部
105 振幅量子化部
301 ノイズベース情報復号器
302 ノイズベース補間部
303 乱数位相生成器
304 乗算器
305 IFFT部
401、1301 非均等間引き処理部
601 振幅選択部
1201 記憶部
1302 交互更新部
1501 最大値抽出部
1502 最大値位置抽出部
1503 最大値量子化部
1504 位相位置抽出部
1505 位相量子化部
1701 雑音最大値情報復号器
1702 雑音振幅生成器
1703 雑音位相情報復号器
1704 位相付加部
1801 音声/雑音フレーム判別器
1802 雑音特性推定部
1803 移動平均係数計算器
1901 音源分離部
1902 音声符号化部
1903 雑音符号化部
2001 音声復号化部
2002 雑音復号化部
2003 加算器
2101 雑音レベル調整部

Claims (18)

  1. 入力音声スペクトルのノイズベースを推定するノイズベース推定手段と、前記ノイズベースを間引きしてノイズベース振幅情報を抽出する抽出手段と、前記ノイズベース振幅情報を量子化して雑音符号化情報を作成する量子化手段と、を具備することを特徴とする雑音信号符号化装置。
  2. 抽出手段は、雑音エネルギーの多い周波数領域におけるノイズベースを抽出する周波数間隔を雑音エネルギーの少ない周波数領域におけるノイズベースを抽出する周波数間隔より小さくしてノイズベース振幅情報を抽出することを特徴とする請求項1に記載の雑音信号符号化装置。
  3. 抽出手段は、ノイズベース振幅情報を抽出する周波数間隔について低周波数領域における周波数間隔を高周波数領域における周波数間隔より小さくすることを特徴とする請求項2に記載の雑音信号符号化装置。
  4. 抽出手段は、ノイズベース振幅情報を抽出する周波数を中心とした所定の周波数領域における振幅の最大値をノイズベース振幅情報とすることを特徴とする請求項1から請求項3のいずれかに記載の雑音信号符号化装置。
  5. 抽出手段は、複数の周波数領域からそれぞれ少なくとも一つの周波数のノイズベース振幅情報を抽出することを特徴とする請求項1から請求項4のいずれかに記載の雑音信号符号化装置。
  6. ノイズベースの中で最も大きい振幅をノイズベース最大振幅値として抽出する最大値抽出手段と、前記振幅が最も大きいノイズベースの周波数を最大値位置として抽出する最大値位置抽出手段と、前記最大値位置に基づいて振幅が最も大きいノイズベースの位相を抽出する位相抽出手段と、前記位相を量子化する位相量子化手段と、を具備することを特徴とする請求項1から請求項5のいずれかに記載の雑音信号符号化装置。
  7. 入力音声スペクトルから雑音成分のみのスペクトルであるノイズベースを推定するノイズベース推定手段と、ノイズベースの中で最も大きい振幅をノイズベース最大振幅値として抽出する最大値抽出手段と、前記振幅が最も大きいノイズベースの周波数を最大値位置として抽出する最大値位置抽出手段と、前記最大値位置に基づいて振幅が最も大きいノイズベースの位相を抽出する位相抽出手段と、前記位相を量子化する位相量子化手段と、を具備することを特徴とする雑音信号符号化装置。
  8. ノイズベースに基づいて雑音の特性を推定する雑音特性推定手段と、前記特性に基づいて推定するノイズベースの移動平均値を決定する移動平均係数計算手段と、を具備し、ノイズベース推定手段は、前記移動平均値を用いてノイズベースを平均化して推定することを特徴とする請求項1から請求項7のいずれかに記載の雑音信号符号化装置。
  9. ノイズベースから周波数方向で間引きして抽出されたノイズベース振幅情報を補間するノイズベース補間手段と、ランダムな位相を生成する乱数位相生成手段と、前記ノイズベース補間手段において補間されたノイズベース情報に前記ランダムな位相を乗算する乗算手段と、を具備することを特徴とする雑音信号復号化装置。
  10. 請求項1から請求項8のいずれかに記載の雑音信号符号化装置において符号化されたノイズベースの振幅情報を補間するノイズベース補間手段と、ランダムな位相を生成する乱数位相生成手段と、前記ノイズベース補間手段において補間されたノイズベース情報に前記ランダムな位相を乗算する乗算手段と、を具備することを特徴とする雑音信号復号化装置。
  11. 乗算手段は、振幅が最も大きいノイズベースの周波数領域について、振幅が最も大きいノイズベースの振幅値と位相とを乗算した結果をノイズベースとして出力することを特徴とする請求項9または請求項10に記載の雑音信号復号化装置。
  12. 振幅が最も大きいノイズベースの振幅値と位相とを復号する復号化手段と、前記振幅値と前記位相とを乗算した結果をノイズベースとして出力する乗算手段と、を具備することを特徴とする雑音信号復号化装置。
  13. 入力音声スペクトルから雑音成分のみのスペクトルであるノイズベースを推定するノイズベース推定ステップと、前記ノイズベースから周波数方向で間引きしてノイズベース振幅情報を抽出する間引きステップと、前記ノイズベース振幅情報を量子化して雑音符号化情報を作成する量子化ステップと、をコンピュータに実行させることを特徴とする雑音信号符号化プログラム。
  14. 入力音声スペクトルから雑音成分のみのスペクトルであるノイズベースを推定するノイズベース推定ステップと、振幅が最も大きいノイズベースの振幅をノイズベース最大振幅値として抽出する最大値抽出ステップと、前記振幅が最も大きいノイズベースの周波数を最大値位置として抽出する最大値位置抽出ステップと、前記最大値位置に基づいて振幅が最も大きいノイズベースの位相を抽出する位相抽出ステップと、前記位相を量子化する位相量子化ステップと、をコンピュータに実行させることを特徴とする雑音信号符号化プログラム。
  15. ノイズベースから周波数方向で間引きして抽出されたノイズベース情報を補間するノイズベース補間ステップと、ランダムな位相を生成する乱数位相生成ステップと、前記ノイズベース補間手段において補間されたノイズベース情報に前記ランダムな位相を乗算する乗算ステップと、をコンピュータに実行させることを特徴とする雑音信号復号化プログラム。
  16. 振幅が最も大きいノイズベースの振幅値と位相とを復号する復号化ステップと、前記振幅値と前記位相とを乗算した結果をノイズベースとして出力する乗算ステップと、をコンピュータに実行させることを特徴とする雑音信号復号化プログラム。
  17. 符号化側において、入力音声スペクトルから雑音成分のみのスペクトルであるノイズベースを推定し、前記ノイズベースから周波数方向で間引きしてノイズベース振幅情報を抽出し、前記ノイズベース振幅情報を量子化して雑音符号化情報を作成し、復号化側において、前記ノイズベース情報を補間し、ランダムな位相を生成し、補間されたノイズベース情報に前記ランダムな位相を乗算することを特徴とする雑音信号符号化・復号化方法。
  18. 符号化側において、入力音声スペクトルから雑音成分のみのスペクトルであるノイズベースを推定し、振幅が最も大きいノイズベースの振幅値をノイズベース最大振幅値として抽出し、前記振幅が最も大きいノイズベースの周波数を最大値位置として抽出し、前記最大値位置に基づいて振幅が最も大きいノイズベースの位相を抽出し、復号化側において、前記振幅値と前記位相とを乗算した結果をノイズベースとして出力することを特徴とする雑音信号符号化・復号化方法。
JP2002189904A 2002-06-28 2002-06-28 雑音信号符号化装置及び雑音信号復号化装置 Pending JP2004029674A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002189904A JP2004029674A (ja) 2002-06-28 2002-06-28 雑音信号符号化装置及び雑音信号復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002189904A JP2004029674A (ja) 2002-06-28 2002-06-28 雑音信号符号化装置及び雑音信号復号化装置

Publications (1)

Publication Number Publication Date
JP2004029674A true JP2004029674A (ja) 2004-01-29

Family

ID=31184187

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002189904A Pending JP2004029674A (ja) 2002-06-28 2002-06-28 雑音信号符号化装置及び雑音信号復号化装置

Country Status (1)

Country Link
JP (1) JP2004029674A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011253126A (ja) * 2010-06-03 2011-12-15 Canon Inc 音声信号処理装置、及びその制御方法
CN110832557A (zh) * 2017-08-02 2020-02-21 欧姆龙株式会社 传感器装置、背景噪声数据发送方法和背景噪声数据发送程序
CN111887866A (zh) * 2020-06-11 2020-11-06 杭州师范大学 坐垫式实时多动症监测系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07147566A (ja) * 1993-11-24 1995-06-06 Nec Corp 音声信号伝送装置
JPH11242499A (ja) * 1997-08-29 1999-09-07 Toshiba Corp 音声符号化/復号化方法および音声信号の成分分離方法
JP2002149200A (ja) * 2000-08-31 2002-05-24 Matsushita Electric Ind Co Ltd 音声処理装置及び音声処理方法
JP2002156999A (ja) * 2000-09-06 2002-05-31 Univ Nagoya 雑音信号分析装置、雑音信号合成装置、雑音信号分析方法および雑音信号合成方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07147566A (ja) * 1993-11-24 1995-06-06 Nec Corp 音声信号伝送装置
JPH11242499A (ja) * 1997-08-29 1999-09-07 Toshiba Corp 音声符号化/復号化方法および音声信号の成分分離方法
JP2002149200A (ja) * 2000-08-31 2002-05-24 Matsushita Electric Ind Co Ltd 音声処理装置及び音声処理方法
JP2002156999A (ja) * 2000-09-06 2002-05-31 Univ Nagoya 雑音信号分析装置、雑音信号合成装置、雑音信号分析方法および雑音信号合成方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011253126A (ja) * 2010-06-03 2011-12-15 Canon Inc 音声信号処理装置、及びその制御方法
CN110832557A (zh) * 2017-08-02 2020-02-21 欧姆龙株式会社 传感器装置、背景噪声数据发送方法和背景噪声数据发送程序
CN110832557B (zh) * 2017-08-02 2022-04-19 欧姆龙株式会社 传感器装置、背景噪声数据发送方法和存储介质
CN111887866A (zh) * 2020-06-11 2020-11-06 杭州师范大学 坐垫式实时多动症监测系统及方法

Similar Documents

Publication Publication Date Title
US10236015B2 (en) Encoding device and method, decoding device and method, and program
US8065141B2 (en) Apparatus and method for processing signal, recording medium, and program
US6070137A (en) Integrated frequency-domain voice coding using an adaptive spectral enhancement filter
JP3881943B2 (ja) 音響符号化装置及び音響符号化方法
EP3131094B1 (en) Noise signal processing and generation method, encoder/decoder and encoding/decoding system
JP2019113858A (ja) Hoa信号の係数領域表現からこのhoa信号の混合した空間/係数領域表現を生成する方法および装置
JP3881946B2 (ja) 音響符号化装置及び音響符号化方法
US5623575A (en) Excitation synchronous time encoding vocoder and method
AU2013366642B2 (en) Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals
WO2000075919A1 (en) Methods and apparatus for generating comfort noise using parametric noise model statistics
JP6073456B2 (ja) 音声強調装置
JP4444295B2 (ja) 情報信号を量子化するための方法および装置
US5504834A (en) Pitch epoch synchronous linear predictive coding vocoder and method
KR20080026481A (ko) 오디오 신호 보간 방법 및 오디오 신호 보간 장치
JP2003280696A (ja) 音声強調装置及び音声強調方法
US8767974B1 (en) System and method for generating comfort noise
JP2004029674A (ja) 雑音信号符号化装置及び雑音信号復号化装置
JP4099879B2 (ja) 帯域幅拡張方法及び装置
JP5491193B2 (ja) 音声コード化の方法および装置
JP6859379B2 (ja) 快適雑音生成モード選択のための装置および方法
JP2002149198A (ja) 音声符号化装置及び音声復号化装置
JP4269364B2 (ja) 信号処理方法及び装置、並びに帯域幅拡張方法及び装置
JP2018124304A (ja) 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、プログラム、および記録媒体
JP2003508806A (ja) 改善されたエンコーダ及びデコーダを備える伝送システム
GB2349054A (en) Digital audio signal encoders

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050406

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080129

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090203