JP2002156999A - 雑音信号分析装置、雑音信号合成装置、雑音信号分析方法および雑音信号合成方法 - Google Patents

雑音信号分析装置、雑音信号合成装置、雑音信号分析方法および雑音信号合成方法

Info

Publication number
JP2002156999A
JP2002156999A JP2001070148A JP2001070148A JP2002156999A JP 2002156999 A JP2002156999 A JP 2002156999A JP 2001070148 A JP2001070148 A JP 2001070148A JP 2001070148 A JP2001070148 A JP 2001070148A JP 2002156999 A JP2002156999 A JP 2002156999A
Authority
JP
Japan
Prior art keywords
spectrum
noise signal
model
noise
quantization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001070148A
Other languages
English (en)
Other versions
JP3670217B2 (ja
Inventor
Fumitada Itakura
文忠 板倉
Koji Yoshida
幸司 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nagoya University NUC
Panasonic Mobile Communications Co Ltd
Original Assignee
Nagoya University NUC
Matsushita Communication Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nagoya University NUC, Matsushita Communication Industrial Co Ltd filed Critical Nagoya University NUC
Priority to JP2001070148A priority Critical patent/JP3670217B2/ja
Priority to PCT/JP2001/007630 priority patent/WO2002021091A1/ja
Priority to US10/129,076 priority patent/US6934650B2/en
Priority to AU2001282616A priority patent/AU2001282616A1/en
Priority to EP01961335A priority patent/EP1258715B1/en
Publication of JP2002156999A publication Critical patent/JP2002156999A/ja
Application granted granted Critical
Publication of JP3670217B2 publication Critical patent/JP3670217B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use

Abstract

(57)【要約】 【課題】 背景雑音信号を聴感的に高い品質で合成
すること。 【解決手段】 FFT部102は、窓かけがなされた入
力雑音信号を周波数スペクトルに変換する。スペクトル
モデル記憶部103は、スペクトルモデルに関するモデ
ル情報を記憶する。スペクトルモデル系列算出部104
は、スペクトルモデル記憶部103に記憶されたモデル
情報を用いて、入力雑音信号の振幅スペクトル系列に対
応するスペクトルモデル番号系列を算出する。継続長モ
デル・遷移確率算出部105は、スペクトルモデル系列
算出部104により算出されたスペクトルモデル番号系
列を用いてモデルパラメータを出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号に重畳さ
れている背景雑音信号の分析および合成を行う雑音信号
の分析・合成装置に関し、また、この分析・合成装置を
用いて音声信号の符号化を行う音声符号化装置に関す
る。
【0002】
【従来の技術】ディジタル移動通信や音声蓄積の分野に
おいては、電波や記憶媒体の有効利用のために、音声情
報を圧縮して低いビットレートで符号化する音声符号化
装置が用いられている。このような音声符号化装置にお
ける従来の技術として、ITU-T勧告のG.729 AnnexB
("A silence compression scheme for G.729 optimize
d for terminals conforming to Recommendation V.7
0")のDTX(Discontinuous Transmission)制御付きの
CS−ACELP符号化方式がある。
【0003】図19は、従来のDTX制御付きCS−A
CELP符号化方式を採用した符号化装置の構成を示す
ブロック図である。図19において、入力音声信号は、
有音/無音判定器11、CS−ACELP音声符号器1
2および無音区間符号器13に入力される。まず、有音
/無音判定器11において、入力音声信号が有音区間か
無音区間(背景雑音のみの区間)かの判定が行われる。
【0004】有音/無音判定器11により有音と判定さ
れた場合には、CS−ACELP音声符号器12では、
有音区間に対する音声符号化が行われる。有音区間の符
号化データは、DTX制御および多重化器14に出力さ
れる。
【0005】一方、有音/無音判定器11により無音と
判定された場合には、無音区間符号器13では、無音区
間に対する雑音信号の符号化が行われる。この無音区間
符号器13においては、入力音声信号を用いて、有音区
間の符号化におけるものと同様のLPC係数、および、
入力音声信号のLPC予測残差エネルギーが算出され、
これらが無音区間の符号化データとしてDTX制御およ
び多重化器14に出力される。ただし、無音区間の符号
化データは、入力信号の特性(LPC係数やエネルギ
ー)に所定の変化が検出された区間において間欠的に送
信されるものである。
【0006】DTX制御および多重化器14では、有音
/無音判定器11、CS−ACELP音声符号器12お
よび無音区間符号器13の出力を用いて、送信データと
して送信すべきデータが、制御および多重化された後、
送信データとして出力される。
【0007】上記のような従来の音声符号化装置におい
ては、入力音声信号における有音区間についてのみ、C
S−ACELP音声符号器を用いて符号化を行い、入力
音声信号における無音区間(雑音のみの区間)について
は、専用の無音区間符号器を用いて音声符号器より少な
いビット数でかつ間欠的に符号化を行うことにより、伝
送する信号の平均ビットレートを低減できる効果があ
る。
【0008】
【発明が解決しようとする課題】しかしながら、上記従
来の音声符号化方式においては、以下に示すような要因
により、送信側装置により符号化されたデータを受信す
る受信側装置では、無音区間中の雑音信号に対する復号
信号の品質が劣化するという問題がある。すなわち、ま
ず第1の要因として、送信側装置における無音区間符号
器(雑音信号の分析・符号化部)が、音声符号器と同様
な信号モデル(短区間(10〜50ms程度)毎にAR型の合
成フィルタ(LPC合成フィルタ)を雑音信号で駆動す
ることで復号信号を生成する)により符号化を行ってい
ることが挙げられる。
【0009】第2の要因として、受信側装置は、送信側
装置において入力雑音信号を間欠的に分析することによ
り得られた符号化データを用いて、雑音を合成(生成)
していることが挙げられる。
【0010】本発明は、かかる点に鑑みてなされたもの
であり、背景雑音信号を聴感的に高い品質で合成できる
雑音信号合成装置を提供することを目的とする。
【0011】
【課題を解決するための手段】本発明の雑音信号分析装
置は、雑音信号を用いて、振幅スペクトル時系列に関す
る統計的情報および前記振幅スペクトル時系列の継続時
間長に関する統計的情報を含む定常雑音モデルに関する
統計的情報と、前記定常雑音モデル間の遷移に関する統
計的情報と、を生成する分析手段を具備する構成を採
る。
【0012】本発明の雑音信号分析装置は、分析手段
が、雑音信号を周波数領域の信号に変換することによ
り、前記雑音信号のスペクトルを算出する周波数変換手
段と、定常雑音モデルに対するスペクトルに関する統計
的情報を記憶する記憶手段と、前記複数の定常雑音モデ
ルのうち、前記雑音信号のスペクトルに対応する定常雑
音モデルを選択する選択手段と、を具備し、選択された
モデルの系列を用いて定常雑音モデルに関する統計的情
報と、前記定常雑音モデル間の遷移に関する統計的情報
を生成する構成を採る。
【0013】これらの構成によれば、雑音信号を統計的
モデルで表現した信号に変換することにより、雑音信号
合成装置においては、聴感的に劣化の少ない雑音信号を
合成することができる。
【0014】本発明の雑音信号合成装置は、上記雑音信
号分析装置により生成された統計的情報を用いて、雑音
信号を生成する生成手段を具備する構成を採る。
【0015】本発明の雑音信号合成装置は、生成手段
が、定常雑音モデル間の遷移に関する統計的情報を用い
て、定常雑音モデルの遷移系列に関する情報を生成する
遷移系列生成手段と、定常雑音モデルに関する統計的情
報を用いて、合成すべき定常雑音モデルの継続時間長を
算出する継続時間長算出手段と、定常雑音モデルに対す
るスペクトルに関する統計的情報を記憶する記憶手段
と、生成された前記定常雑音モデルの遷移系列に関する
情報、算出された前記継続時間長、および、生成された
乱数位相を用いて、合成すべきスペクトル時系列を生成
するスペクトル生成手段と、生成されたスペクトルを時
間領域の信号に変換する逆周波数変換手段と、を具備す
る構成を採る。
【0016】これらの構成によれば、雑音信号分析装置
により生成された、雑音信号が統計的モデルで表現され
た信号を用いて、雑音信号を合成することにより、聴感
的に劣化の少ない雑音信号を合成することができる。
【0017】本発明の音声符号化装置は、上記雑音信号
分析装置を用いて、音声信号の無音区間における雑音信
号の符号化を行う構成を採る。
【0018】本発明の音声復号装置は、上記雑音信号合
成装置を用いて、音声信号の無音区間における雑音信号
の復号を行う構成を採る。
【0019】これらの構成によれば、雑音信号を統計的
モデルで表現することにより、聴感的に劣化の少ない雑
音信号を合成することが可能となる。
【0020】本発明の雑音信号分析装置は、分析手段
が、雑音信号を周波数領域の信号に変換することにより
前記雑音信号のスペクトルを算出する周波数変換手段
と、定常雑音モデルの振幅スペクトル時系列に関する統
計的情報であるスペクトルモデルパラメータの算出と量
子化を行うスペクトルモデルパラメータ算出・量子化手
段と、前記定常雑音モデルの振幅スペクトル時系列の継
続時間長に関する統計的情報および前記定常雑音モデル
間の遷移に関する統計的情報の算出と量子化を行う継続
長モデル・遷移確率算出・量子化手段と、を具備し、前
記スペクトルモデルパラメータ算出・量子化手段は、前
記周波数変換手段により得られた入力雑音信号の振幅ス
ペクトルに対してパワの正規化を行うパワ正規化手段
と、雑音信号を表す振幅スペクトルの代表ベクトルの集
合を記憶する記憶手段と、前記パワ正規化手段により得
られたパワ正規化振幅スペクトルに対して、前記記憶手
段に記憶されている代表ベクトル集合を用いてクラスタ
化を行うクラスタ化手段と、入力雑音信号のモデル化区
間単位で選択頻度の高い上位複数個のクラスタを選択
し、それらの選択されたクラスタに属する入力振幅スペ
クトルの平均スペクトルをクラスタ毎に算出するクラス
タ別平均スペクトル算出手段と、入力雑音信号のモデル
化区間の平均パワを算出し、その量子化を行うモデル化
区間平均パワ量子化手段と、前記クラスタ別平均スペク
トル算出手段により得られたクラスタ別平均スペクトル
およびモデル化区間平均パワ量子化手段により得られた
量子化されたモデル化区間平均パワを用いて、クラスタ
毎の誤差スペクトルとモデル化区間平均パワに対するパ
ワ補正値の量子化を行う、誤差スペクトル・パワ補正値
量子化手段と、を具備し、前記スペクトルモデルパラメ
ータ算出・量子化手段により得られた、選択されたクラ
スタに対応する代表ベクトル、モデル化区間平均パワ、
誤差スペクトルおよびパワ補正値を含むスペクトルモデ
ルパラメータの量子化インデクス、および継続長モデル
・遷移確率算出・量子化手段により得られた継続時間長
に関する統計的情報および雑音モデル間の遷移に関する
統計的情報の量子化インデクスを出力する構成を採る。
【0021】この構成によれば、雑音信号を統計的モデ
ルで表現した信号に変換し、それを量子化することによ
り、雑音信号合成装置においては、聴感的に劣化の少な
い雑音信号を合成することができると共に、前記定常雑
音モデルおよび定常雑音モデル間の遷移に関する統計的
情報を少ない情報量で量子化することができる。
【0022】本発明の雑音信号合成装置は、上記雑音信
号分析装置により生成された、統計的情報の量子化イン
デクスを用いて、雑音信号を生成する生成手段を具備す
る構成を採る。
【0023】本発明の雑音信号合成装置は、生成手段
が、定常雑音モデル間の遷移に関する統計的情報の量子
化インデクスを用いて、定常雑音モデルの遷移系列に関
する情報を生成する遷移系列生成手段と、前記継続時間
長に関する統計的情報の量子化インデクスを用いて、合
成すべき定常雑音モデルの継続時間長を算出する継続時
間長算出手段と、スペクトルモデルパラメータの量子化
インデクスを用いて前記スペクトルモデルパラメータを
復号するスペクトルモデルパラメータ復号手段と、生成
された前記定常雑音モデルの遷移系列に関する情報、算
出された前記継続時間長、前記スペクトルモデルパラメ
ータ、および、生成された乱数位相を用いて、合成すべ
きスペクトル時系列を生成するスペクトル生成手段と、
生成されたスペクトルを時間領域の信号に変換する逆周
波数変換手段と、を具備する構成を採る。
【0024】これらの構成によれば、雑音信号分析装置
により雑音信号を統計的モデルで表現しそれを少ない情
報量で量子化した情報を用いて、雑音信号を合成するこ
とにより、聴感的に劣化の少ない雑音信号を合成するこ
とができる。
【0025】本発明の音声符号化装置は、上記雑音信号
分析装置を用いて、音声信号の無音区間における雑音信
号の符号化を行う構成を採る。
【0026】本発明の音声復号装置は、上記雑音信号合
成装置を用いて、音声信号の無音区間における雑音信号
の復号を行う構成を採る。
【0027】これらの構成によれば、雑音信号を統計的
モデルで表現することにより、聴感的に劣化の少ない雑
音信号を合成することが可能となる。また、少ない情報
量、すなわち低ビットレートで雑音信号を伝送すること
が可能となる。
【0028】本発明の雑音信号分析方法は、雑音信号を
周波数領域の信号に変換することにより、前記雑音信号
のスペクトルを算出する周波数変換工程と、定常雑音モ
デルに対するスペクトルに関する統計的情報を記憶する
記憶工程と、前記複数の定常雑音モデルのうち、前記雑
音信号のスペクトルに対応する定常雑音モデルを選択す
る選択工程と、選択されたモデルの系列を用いて、振幅
スペクトル時系列に関する統計的情報および前記振幅ス
ペクトル時系列の継続時間長に関する統計的情報を含む
定常雑音モデルに関する統計的情報と、前記定常雑音モ
デル間の遷移に関する統計的情報とを生成する分析工程
と、を具備する。
【0029】この方法によれば、雑音信号を統計的モデ
ルで表現した信号に変換することにより、雑音信号合成
装置(受信側装置)においては、聴感的に劣化の少ない
雑音信号を合成することができる。
【0030】本発明の雑音信号合成方法は、上記雑音信
号分析方法により生成された統計的情報における定常雑
音モデル間の遷移に関する統計的情報を用いて、定常雑
音モデルの遷移系列に関する情報を生成する遷移系列生
成工程と、前記統計的情報における定常雑音モデルに関
する統計的情報を用いて、合成すべき定常雑音モデルの
継続時間長を算出する継続時間長算出工程と、定常雑音
モデルに対するスペクトルに関する統計的情報を記憶す
る記憶工程と、生成された前記定常雑音モデルの遷移系
列に関する情報、算出された前記継続時間長、および、
生成された乱数位相を用いて、合成すべきスペクトル時
系列を生成するスペクトル生成工程と、生成されたスペ
クトルを時間領域の信号に変換する逆周波数変換工程
と、を具備する。
【0031】この方法によれば、雑音信号分析装置によ
り生成された、雑音信号が統計的モデルで表現された信
号を用いて、雑音信号を合成することにより、聴感的に
劣化の少ない雑音信号を合成することができる。
【0032】本発明の雑音信号分析方法は、雑音信号を
周波数領域の信号に変換することにより前記雑音信号の
スペクトルを算出する周波数変換工程と、定常雑音モデ
ルの振幅スペクトル時系列に関する統計的情報であるス
ペクトルモデルパラメータの算出と量子化を行うスペク
トルモデルパラメータ算出・量子化工程と、前記定常雑
音モデルの振幅スペクトル時系列の継続時間長に関する
統計的情報および前記定常雑音モデル間の遷移に関する
統計的情報の算出と量子化を行う継続長モデル・遷移確
率算出・量子化工程と、を具備し、前記スペクトルモデ
ルパラメータ算出・量子化工程は、前記周波数変換手段
により得られた入力雑音信号の振幅スペクトルに対して
パワの正規化を行うパワ正規化工程と、雑音信号を表す
振幅スペクトルの代表ベクトルの集合を記憶する記憶工
程と、前記パワ正規化工程により得られたパワ正規化振
幅スペクトルに対して、前記記憶工程により記憶されて
いる代表ベクトル集合を用いてクラスタ化を行うクラス
タ化工程と、入力雑音信号のモデル化区間単位で選択頻
度の高い上位複数個のクラスタを選択し、それらの選択
されたクラスタに属する入力振幅スペクトルの平均スペ
クトルをクラスタ毎に算出するクラスタ別平均スペクト
ル算出工程と、入力雑音信号のモデル化区間の平均パワ
を算出し、その量子化を行うモデル化区間平均パワ量子
化工程と、前記クラスタ別平均スペクトル算出工程によ
り得られたクラスタ別平均スペクトルおよびモデル化区
間平均パワ量子化工程により得られた量子化されたモデ
ル化区間平均パワを用いて、クラスタ毎の誤差スペクト
ルとモデル化区間平均パワに対するパワ補正値の量子化
を行う、誤差スペクトル・パワ補正値量子化工程と、を
具備し、前記スペクトルモデルパラメータ算出・量子化
工程により得られた、選択されたクラスタに対応する代
表ベクトル、モデル化区間平均パワ、誤差スペクトルお
よびパワ補正値を含むスペクトルモデルパラメータの量
子化インデクス、および継続長モデル・遷移確率算出・
量子化工程により得られた継続時間長に関する統計的情
報および雑音モデル間の遷移に関する統計的情報の量子
化インデクスを出力する。
【0033】この方法によれば、雑音信号を統計的モデ
ルで表現した信号に変換し、それを量子化することによ
り、雑音信号合成装置(受信側装置)においては、聴感
的に劣化の少ない雑音信号を合成することができると共
に、前記定常雑音モデルおよび定常雑音モデル間の遷移
に関する統計的情報を少ない情報量で量子化することが
できる。
【0034】本発明の雑音信号合成方法は、上記雑音信
号分析方法により生成された統計的情報の量子化インデ
クスを入力する工程と、定常雑音モデル間の遷移に関す
る統計的情報の量子化インデクスを用いて、定常雑音モ
デルの遷移系列に関する情報を生成する遷移系列生成工
程と、前記継続時間長に関する統計的情報の量子化イン
デクスを用いて、合成すべき定常雑音モデルの継続時間
長を算出する継続時間長算出工程と、スペクトルモデル
パラメータの量子化インデクスを用いて前記スペクトル
モデルパラメータを復号するスペクトルモデルパラメー
タ復号工程と、生成された前記定常雑音モデルの遷移系
列に関する情報、算出された前記継続時間長、前記スペ
クトルモデルパラメータ、および、生成された乱数位相
を用いて、合成すべきスペクトル時系列を生成するスペ
クトル生成工程と、生成されたスペクトルを時間領域の
信号に変換する逆周波数変換工程と、を具備する。
【0035】この方法によれば、雑音信号分析装置によ
り雑音信号を統計的モデルで表現しそれを少ない情報量
で量子化した情報を用いて、雑音信号を合成することに
より、聴感的に劣化の少ない雑音信号を合成することが
できる。
【0036】
【発明の実施の形態】本発明の骨子は、雑音信号を統計
的モデルで表現することである。具体的には、雑音信号
を用いて、振幅スペクトル時系列に関する統計的情報お
よび前記振幅スペクトル時系列の継続時間長に関する統
計的情報を含む定常雑音モデルに関する統計的情報と、
前記定常雑音モデル間の遷移に関する統計的情報と、を
生成することである。
【0037】以下、本発明の実施の形態について、図面
を参照して詳細に説明する。
【0038】(実施の形態1)本発明においては、雑音
信号を統計的なモデルで表現する。すなわち、ある統計
的分布に従う継続時間長からなる別の統計的分布に従う
振幅スペクトル時系列で表された複数の定常雑音モデル
を用いて、その定常雑音モデル間を統計的に遷移するス
ペクトル系列として雑音信号を表現する。
【0039】より具体的には、定常雑音スペクトルは、
ある継続時間長(フレーム数)LiからなるM個の振幅ス
ペクトル時系列[Si(n)] (n=1,...,Li, i=1,...,
M)で表現し、かつ[Si(n)]およびLiは各々正規分布に
従うものとする。そして、そのスペクトル時系列モデル
[Si(n)]間を遷移確率p(i,j) (i,j=1,...,M)で遷移
するスペクトル系列として背景雑音を表現する。
【0040】図1は、本発明の実施の形態1にかかる雑
音信号分析装置の構成を示すブロック図である。図1に
示す雑音信号分析装置において、窓かけ部101は、一
定区間(以下「フレーム」という。)毎に入力された第
mフレーム(m=0,1,2,...)に対する入力雑音信号x(j)
(j=0,...,N-1; N:分析長)に対して、ハニング窓
等による窓かけを行う。FFT(高速フーリエ変換)部
102は、窓かけがなされた入力雑音信号を周波数スペ
クトルに変換して、第mフレームの入力振幅スペクトルX
(m)を算出する。
【0041】スペクトルモデル系列算出部104は、ス
ペクトルモデル記憶部103に蓄えられているスペクト
ルモデルSi (i=1,...,M)に関するモデル情報を用
いて、入力雑音信号の振幅スペクトル系列[X(m)] (m=0,
1,2,...)に対応するスペクトルモデル番号系列[inde
x(m)](1≦index(m)≦M, m=0,1,2,...)を算出す
る。ここで、スペクトルモデルSi (i=1,...,M)に
関するモデル情報は、Siの統計パラメータである平均
振幅Sav#iおよび標準偏差Sdv#iを含むものである。これ
らは、予め学習により用意しておくことが可能である。
また、対応するスペクトルモデル番号系列の算出は、入
力振幅スペクトルX(m)からの距離が最も小さい平均振幅
Sav#iを有するスペクトルモデルSiの番号iを求めるこ
とにより、なされる。
【0042】継続長モデル・遷移確率算出部105は、
スペクトルモデル系列算出部104により得られたスペ
クトルモデル番号系列[index(m)]を用いて、Si各々に
対する継続フレーム数Liに関する統計パラメータ(Liの
平均値Lav#iおよび標準偏差値Ldv#i)およびSi間の遷
移確率p(i,j)を算出し、それらを入力雑音信号に対する
モデルパラメータとして出力する。なお、これらのモデ
ルパラメータは、ある一定期間毎あるいは任意の間隔で
算出・伝送される。
【0043】図2は、本発明の実施の形態1にかかる雑
音信号合成装置の構成を示すブロック図である。図2に
示す雑音信号合成装置において、遷移系列生成部201
は、図1に示した雑音信号分析装置により得られたモデ
ルパラメータ(Liの平均値Lav#i,標準偏差値Ldv#iおよ
びSi間の遷移確率p(i,j))のうちSi間の遷移確率p
(i,j)を用いて、スペクトルモデルSiの遷移がその与
えられた遷移確率p(i,j)となるようなスペクトルモデル
番号遷移系列[index'(l)](1≦index'(l)≦M, l=0,1,
2,...)を生起させる。
【0044】スペクトル生成部205は、遷移系列生成
部201により得られたモデル番号index'(l)、およ
び、スペクトルモデル記憶部202に保持されているス
ペクトルモデルSi (i=1,...,M)に関するモデル情
報(Siの平均振幅Sav#iおよび標準偏差Sdv#i)用い
て、次式で示されるindex'(l)に対するスペクトル振幅
時系列[X'(n)]を生成する。
【0045】 {X'(n)]=[S index'(l)(n)], n=1,2,...,L −(1) ここで、S index'(l)は、i=index'(l)に対する平均振幅
Sav#i、標準偏差Sdv#iを有する正規分布に従うものと
し、また継続フレーム数Lは、継続長制御部203にお
いて、雑音信号分析装置から出力されたスペクトルモデ
ルSiに対する継続フレーム数Liの統計モデルパラメー
タ(Liの平均値Lav#i,標準偏差値Ldv#i)を用いて、i=
index'(l)に対する平均値Lav#i、標準偏差Ldv#iを有す
る正規分布に従うように制御されたものである。
【0046】さらに、スペクトル生成部205は、上記
の方法により、遷移系列[index'(l)]に沿って生成した
所定の時間長(フレーム数)のスペクトル振幅時系列に
対して、乱数位相生成部204により生成された乱数位
相を与えて、スペクトル時系列を作成する。なお、スペ
クトル生成部205において、生成された振幅スペクト
ル時系列に対してスペクトルが滑らかに変化するよう平
滑化を行ってもよい。
【0047】IFFT(逆高速フーリエ変換)部206
は、スペクトル生成部205により作成されたスペクト
ル時系列を時間領域の波形に変換する。重ね合わせ加算
部207は、フレーム間の信号の重ね合わせ加算を行う
ことにより、最終的な合成雑音信号を出力する。
【0048】次いで、上記構成を有する雑音信号分析装
置および雑音信号合成装置の動作について、さらに図3
および図4を参照して説明する。図3は、本発明の実施
の形態1にかかる雑音信号分析装置の動作を示すフロー
図である。図4は、本発明の実施の形態1にかかる雑音
信号合成装置の動作を示すフロー図である。
【0049】まず、本実施の形態にかかる雑音信号分析
装置の動作について、図3を参照して説明する。まず、
工程(以下「ST」という。)301において、フレー
ム毎の雑音信号x(j)(j=0,...,N-1; N:分析長)
が、窓かけ部101に入力される。ST302におい
て、第mフレーム(m=0,1,2,...)に対する入力雑音信
号に対してハニング窓等による窓かけが、窓かけ部10
1によりなされる。ST303において、窓かけがなさ
れた入力雑音信号は、FFT部102により、FFT
(高速フーリエ変換)がなされて、周波数スペクトルに
変換される。これにより、第mフレームの入力振幅スペ
クトルX(m)が算出される。
【0050】ST304において、スペクトルモデル系
列算出部104により、スペクトルモデルSi (i=
1,...,M)に関するモデル情報を用いて、入力雑音信
号の振幅スペクトル系列[X(m)] (m=0,1,2,...)に対
応するスペクトルモデル番号系列[index(m)](1≦index
(m)≦M, m=0,1,2,...)が算出される。
【0051】ここで、スペクトルモデルSi (i=
1,...,M)に関するモデル情報は、Siの統計パラメ
ータである平均振幅Sav#iおよび標準偏差Sdv#iを含むも
のである。これらは、予め学習により用意しておくこと
が可能なものである。また、対応するスペクトルモデル
番号系列の算出は、入力振幅スペクトルX(m)からの距離
が最も小さい平均振幅Sav#iを有するスペクトルモデル
Siの番号iを求めることにより、なされる。以上のS
T301〜ST304の処理がフレーム単位で行われ
る。
【0052】ST305では、ST304で得られたス
ペクトルモデル番号系列[index(m)]を用いて、継続長モ
デル・遷移確率算出部105により、Si各々に対する
継続フレーム数Liに関する統計パラメータ(Liの平均値
Lav#iおよび標準偏差値Ldv#i)およびSi間の遷移確率
p(i,j)が算出される。ST306において、これらは、
入力雑音信号に対するモデルパラメータとして出力され
る。なお、これらのモデルパラメータは、ある一定期間
毎あるいは任意の間隔で算出・伝送される。
【0053】本実施の形態にかかる雑音信号合成装置の
動作について、図4を参照して説明する。まず、ST4
01において、雑音信号分析装置により得られたモデル
パラメータ(Liの平均値Lav#i,標準偏差値Ldv#iおよび
Si間の遷移確率p(i,j))が、遷移系列生成部201お
よび継続長制御部203に入力される。
【0054】ST402において、入力されたモデルパ
ラメータのうちSi間の遷移確率p(i,j)を用いて、遷移
系列生成部201により、スペクトルモデルSiの遷移
がその与えられた遷移確率p(i,j)となるようなスペクト
ルモデル番号遷移系列[index'(l)](1≦index'(l)≦M,
l=0,1,2,...)が生起される。
【0055】次に、ST403において、入力されたモ
デルパラメータのうちスペクトルモデルSiに対する継
続フレーム数Liの統計モデルパラメータ(Liの平均値La
v#i,標準偏差値Ldv#i)を用いて、i=index'(l)に対し
て平均値Lav#i、標準偏差Ldv#iを有する正規分布に従う
ように制御された継続フレーム数Lが、継続長制御部2
03により生成される。また、ST404において、乱
数位相生成部204により乱数位相が生成される。
【0056】ST405において、ST402で得られ
たモデル番号index'(l)および予め用意されているスペ
クトルモデルSi (i=1,...,M)に関するモデル情報
(Siの平均振幅Sav#iおよび標準偏差Sdv#i)を用い
て、スペクトル生成部205により、式で示したinde
x'(l)に対するスペクトル振幅時系列[X'(n)]が生成され
る。なお、生成された振幅スペクトル時系列に対してス
ペクトルが滑らかに変化するよう平滑化を行っても良
い。
【0057】ここで、S index'(l)は、i=index'(l)に対
する平均振幅Sav#i、標準偏差Sdv#iを有する正規分布に
従うものとし、継続フレーム数Lは、ST404におい
て生成されたものである。
【0058】さらに、遷移系列[index'(l)]に沿って生
成した所定の時間長(フレーム数)のスペクトル振幅時
系列に対して、ST404により生成された乱数位相が
与えられて、スペクトル時系列が作成される。
【0059】ST406において、作成されたスペクト
ル時系列は、IFFT部206により時間領域の波形に
変換された後、ST407において、重ね合わせ加算部
207によりフレーム間の信号の重ねあわせ加算が行わ
れる。ST408において、重ね合わせ加算された信号
が最終的な合成雑音信号として出力される。
【0060】このように、本実施の形態においては、背
景雑音信号を統計的モデルで表現している。すなわち、
雑音信号分析装置(送信側装置)において、雑音信号を
用いて、雑音信号スペクトルのスペクトル変化を含めた
統計的情報(統計モデルパラメータ)を生成し、生成し
た情報を雑音信号合成装置(受信側装置)に送信してい
る。また、雑音信号合成装置(受信側装置)において
は、雑音信号分析装置(送信側装置)から送信された上
記情報(統計モデルパラメータ)を用いて、雑音信号を
合成している。これにより、雑音信号合成装置(受信側
装置)においては、間欠的に分析された雑音信号のスペ
クトルではなく、雑音信号スペクトルのスペクトル変化
を含めた統計的情報を用いて、雑音信号を合成すること
ができるので、聴感的に劣化の少ない雑音信号を合成す
ることができる。
【0061】なお、本実施の形態では、図1および図2
に示す構成の雑音信号分析装置・合成装置、および図3
および図4に示す雑音信号分析方法・合成方法を用い
て、上記に示した内容で説明したが、本発明の主旨に逸
脱することなく別の実現手段にて実現することも可能で
ある。たとえば、上記実施の形態では、スペクトルモデ
ル情報として、スペクトルSの統計モデル(Sの平均と標
準偏差)は予め学習により用意したものとして説明した
が、入力雑音信号に対して実時間的に学習する、または
LPC係数等別のスペクトル表現パラメータで量子化し
て合成側に伝送する形態にすることもできる。また、ス
ペクトル継続長の統計パラメータ(Lの平均Lav,標準偏
差Ldv)やスペクトルモデルSi間の統計遷移パラメー
タを予めパターン化しておき、その中から適切なもの
を、ある一定期間中の入力雑音信号に対して選択して伝
送し、それに基づき合成することも可能である。
【0062】(実施の形態2)本実施の形態では、実施
の形態1で説明した雑音信号分析装置を用いて音声符号
化装置を実現し、また、実施の形態1で説明した雑音信
号合成装置を用いて音声復号装置を実現する場合につい
て説明する。
【0063】まず、本実施の形態にかかる音声符号化装
置について、図5を参照して説明する。図5は、本発明
の実施の形態2にかかる音声符号化装置の構成を示すブ
ロック図である。図5において、入力音声信号は、有音
/無音判定器501、音声符号器502および雑音信号
符号器503に入力される。
【0064】有音/無音判定器501は、入力音声信号
に対して有音区間か無音区間(雑音のみの区間)かを判
定しその判定結果を出力する。有音/無音判定器501
は、任意のものでよく、一般には、入力信号のパワー、
スペクトルやピッチ周期などの複数のパラメータの瞬時
量または変化量等を用いて判定を行うものである。
【0065】音声符号器502は、有音/無音判定器5
01による判定結果が有音である場合に、入力音声信号
に対して音声符号化を行いその符号化データを、DTX
制御および多重化器504に出力する。この音声符号器
502は、有音区間用の符号器であり、音声を高能率に
符号化する任意の符号器である。
【0066】雑音信号符号器503は、有音/無音判定
器501による判定結果が無音である場合に、入力音声
信号に対して雑音信号の符号化を行い入力雑音信号に対
するモデルパラメータを出力する。この雑音信号符号器
503は、実施の形態1で説明した雑音信号分析装置
(図1参照)に対して、出力モデルパラメータを量子化
・符号化して符号化パラメータとして出力する構成を付
加したものである。
【0067】DTX制御および多重化器504は、有音
/無音判定器501、音声符号器502および雑音信号
符号器503からの出力を用いて送信データとして送信
すべき情報の制御と送信情報の多重化を行い、送信デー
タを出力する。
【0068】次に、本発明の実施の形態2にかかる音声
復号装置について、図6を参照して説明する。図6は、
本発明の実施の形態2にかかる音声復号装置の構成を示
すブロック図である。図6において、図5に示した音声
符号化装置により送信された送信データは、受信データ
として分離およびDTX制御器601に入力される。
【0069】分離およびDTX制御器601は、受信デ
ータを、音声復号および雑音生成に必要な、音声符号化
データまたは雑音モデル符号化パラメータおよび有音/
無音判定フラグに分離する。
【0070】音声復号器602は、前記有音/無音判定
フラグが有音区間を示す場合に、前記音声符号化データ
を用いて音声復号を行い復号音声を出力する。雑音信号
復号器603は、前記有音/無音判定フラグが無音区間
を示す場合に、前記雑音モデル符号化パラメータを用い
て雑音信号の生成を行い、雑音信号を出力する。この雑
音信号復号器603は、実施の形態1で説明した雑音信
号合成装置(図2)に対して、入力されたモデル符号化
パラメータを各々のモデルパラメータに復号する構成を
付加したものである。
【0071】出力切り替え器604は、音声復号器60
2の出力と雑音信号復号器603の出力を、有音/無音
判定フラグの結果に応じて切り替えて出力し、出力信号
とする。
【0072】次に、上記構成を有する音声符号化装置お
よび音声復号装置の動作について説明する。まず、音声
符号化装置の動作について、図7を参照して説明する。
図7は、本発明の実施の形態2にかかる音声符号化装置
の動作を示すフロー図である。
【0073】まず、ST701において、フレーム毎の
音声信号が入力され、ST702において、入力音声信
号に対して有音区間か無音区間(雑音のみの区間)かが
判定されその判定結果が出力される。この有音/無音判
定は任意の方法でよく、一般には、入力信号のパワー、
スペクトルやピッチ周期などの複数のパラメータの瞬時
量または変化量等を用いて判定が行われる。
【0074】ST702における有音/無音判定結果が
有音である場合には、ST704において入力音声信号
に対する音声符号化が行われ、その符号化データが出力
される。この音声符号化処理は有音区間用の符号化で、
音声を高能率に符号化する任意の方法でよい。
【0075】一方、前記有音/無音判定結果が無音であ
る場合には、ST705において、入力音声信号に対す
る雑音信号の符号化が行われ、入力雑音信号に対するモ
デルパラメータが出力される。この雑音信号符号化は、
実施の形態1にて説明した雑音信号の分析方法に対し
て、出力モデルパラメータを量子化・符号化して符号化
パラメータとして出力する工程を追加したものである。
【0076】ST706において、前記有音/無音判定
結果、音声符号化および雑音信号符号化からの出力を用
いて送信データとして送信すべき情報の制御(DTX制
御)と送信情報の多重化が行われ、ST707において
送信データとして出力される。
【0077】次に、音声復号装置の動作について、図8
を参照して説明する。図8は、本発明の実施の形態2に
かかる音声復号装置の動作を示すフロー図である。
【0078】まず、ST801において、符号化側で入
力信号に対して符号化され送信された送信データが受信
データとして受信される。ST802において、受信デ
ータは、音声復号および雑音生成に必要な、音声符号化
データまたは雑音モデル符号化パラメータおよび有音/
無音判定フラグに分離される。
【0079】前記有音/無音判定フラグが有音区間を示
す場合には、ST804において前記音声符号化データ
を用いて音声復号が行われ、復号音声が出力される。一
方、前記有音/無音判定フラグが無音区間を示す場合に
は、ST805において前記雑音モデル符号化パラメー
タを用いて雑音信号の生成が行われ、雑音信号が出力さ
れる。この雑音信号復号処理は、実施の形態1で説明し
た雑音信号の合成方法に対して、入力されたモデル符号
化パラメータを各々のモデルパラメータに復号する工程
を追加したものである。
【0080】ST806において、有音/無音判定フラ
グの結果に応じてST804における音声復号またはS
T805における雑音信号復号の出力が、復号信号とし
て出力される。
【0081】このように、本実施の形態によれば、有音
区間では音声信号を高品質で符号化できる音声符号化
で、無音区間では聴感的に劣化が少ない雑音信号分析装
置および合成装置を用いて雑音信号の符号化および復号
を行うことにより、背景雑音環境下においても高品質な
符号化を行える。また、実際の周囲騒音下での雑音信号
の統計的な特性は比較的長期間(例えば数秒〜十数秒)
に渡り一定であることが想定されることから、モデルパ
ラメータの伝送周期もその程度の長期間周期で良いた
め、復号側に伝送すべき雑音信号のモデルパラメータの
情報量は少なくて済み、効率的な伝送を実現できる。
【0082】(実施の形態3)図9は、本発明の実施の
形態3にかかる雑音信号分析装置の構成を示すブロック
図である。
【0083】本実施の形態においても、実施の形態1と
同様、定常雑音スペクトルをある継続時間長(フレーム
数)LiからなるM個の振幅スペクトル時系列[Si(n)]
(n=1,...,Li, i=1,...,M)で表現([Si(n)]およ
びLiは各々正規分布に従うものとする)し、そのスペク
トル時系列モデル[Si(n)]間を遷移確率p(i,j) (i,j=
1,...,M)で遷移するスペクトル系列として背景雑音
を表現する。
【0084】図9に示す雑音信号分析装置において、窓
かけ部901は、一定区間(以下「フレーム」とい
う。)毎に入力された第mフレーム(m=0,1,2,...)に
対する入力雑音信号x(j)(j=0,...,N-1; N:分析
長)に対して、ハニング窓等による窓かけを行う。FF
T(高速フーリエ変換)部902は、窓かけがなされた
入力雑音信号を周波数スペクトルに変換して、第mフレ
ームの入力振幅スペクトルX(m)を算出する。スペクトル
モデルパラメータ算出・量子化部903は、入力雑音信
号の振幅スペクトル系列[X(m)] (m=0,1,2,...)を一
定フレーム数の区間、または何らかの指標により適応的
に定められたフレーム数からなる区間をモデル化を行う
単位区間(モデル化区間)として区切り、そのモデル化
区間におけるスペクトルモデルパラメータの算出および
量子化を行い、スペクトルモデルパラメータの量子化イ
ンデクスを出力すると共に、入力雑音信号の振幅スペク
トル系列[X(m)]に対応するスペクトルモデル番号系列[i
ndex(m)](1≦index(m)≦M, m=mk,mk+1,mk+2,...,m
k+NFRM-1; mkは当該モデル化区間の先頭フレーム番号、
NFRMはモデル化区間のフレーム数)を出力する。ここ
で、スペクトルモデルパラメータとは、スペクトルモデ
ルSi (i=1,...,M)の統計パラメータである平均振
幅Sav#iおよび標準偏差Sdv#iを含むものである。このス
ペクトルモデルパラメータ算出・量子化部903の構成
については、図10により詳細に説明する。
【0085】継続長モデル・遷移確率算出・量子化部9
04は、スペクトルモデルパラメータ算出・量子化部9
03により得られたモデル化区間のスペクトルモデル番
号系列[index(m)]を用いて、Si各々に対する継続フレ
ーム数Liに関する統計パラメータ(継続長モデルパラメ
ータ)(Liの平均値Lav#iおよび標準偏差値Ldv#i)およ
びSi-Sj間の遷移確率p(i,j)を算出・量子化し、それ
らの量子化インデクスを出力する。量子化方法は任意で
あるが、Lav#i、Ldv#i、およびp(i,j)の各要素を各々ス
カラ量子化してもよい。
【0086】以上の、スペクトルモデルパラメータ、継
続長モデルパラメータおよび遷移確率パラメータの量子
化インデクスを、モデル化区間の入力雑音信号の統計モ
デルパラメータ量子化インデクスとして出力する。
【0087】図10は、図9のスペクトルモデルパラメ
ータ算出・量子化部903の詳細構成を示すブロック図
である。本実施例におけるスペクトルモデルパラメータ
算出・量子化部903は、予め用意した雑音信号を表す
振幅スペクトルの代表ベクトル集合の中から、入力雑音
のモデル化区間における入力振幅スペクトル時系列を表
すのに適切な代表ベクトルをモデル数(=M)個選択
し、それをベースにスペクトルモデルパラメータを算出
・量子化する。
【0088】まず、モデル化区間内のフレーム単位の入
力振幅スペクトルX(m) (m=mk,mk+1,mk+2,...,mk+NFR
M-1)に対して、パワ算出部1001で算出されたパワ値
を用いて、パワ正規化部1002でパワの正規化を行
う。そして、そのパワ正規化された入力振幅スペクトル
に対して、クラスタ化部1004において、雑音スペク
トル代表ベクトル記憶部1003の各代表ベクトルをク
ラスタ中心とするクラスタ化(ベクトル量子化)を行
い、各入力スペクトルがどのクラスタに所属するかの情
報を出力する。ここで、雑音スペクトル代表ベクトル記
憶部1003には、代表的な雑音信号の振幅スペクトル
を代表ベクトルとして予め学習により作成し、記憶して
いるもので、代表ベクトルの数は雑音モデル数(M)以上
とする。そして、クラスタ別平均スペクトル算出部10
05において、クラスタ化部1004で得られた所属す
るクラスタ(代表ベクトル)番号の系列に対して、モデ
ル化区間で所属頻度の高い上位M個のクラスタ(対応す
る代表ベクトルをCi(i=1,2,…,M)とする)を選択し、そ
の各クラスタに所属する入力雑音振幅スペクトルの平均
スペクトルをクラスタ毎に算出し、それらをスペクトル
モデルの平均振幅スペクトルSav#i(i=1,2,…,M)とす
る。また、入力雑音信号の振幅スペクトル系列[X(m)]に
対するスペクトルモデル番号系列[index(m)](1≦index
(m)≦M, m=mk,mk+1,mk+2,...,mk+NFRM-1)をあわせ
て出力する。この番号系列は、クラスタ化部1004で
得られた所属するクラスタ(代表ベクトル)番号の系列
をベースに,上位M個のクラスタに属す番号系列として
生成する。すなわち、上位M個のクラスタに属さないフ
レームに対しては、任意の方法(例えば、再度のクラス
タ化や前フレームのクラスタ番号に置換するなど)で上
記M個のクラスタの番号に対応付けるか、またはそのフ
レームは系列から削除するなどを行う。次に、モデル化
区間平均パワ量子化部1006において、パワ算出部1
001で算出されたフレーム毎のパワ値を、モデル化区
間全体で平均し、その平均パワに対してスカラ量子化な
ど任意の方法で量子化を行い、パワインデクスおよびモ
デル化区間平均パワ値(量子化値)Eを出力する。そし
て、誤差スペクトル・パワ補正値量子化部1007にお
いて、Sav#iを(2)式のように、対応する代表ベクトルC
i,Ciからの誤差スペクトルdi,モデル化区間平均パワ
Eおよび各スペクトルモデル別のEに対するパワ補正値
eiで表し、di, eiをスカラ量子化等任意の方法で量子化
する。
【0089】 Sav#i = sqrt(E)・ei・(Ci+di) (i=1,…,M) −(2) ここで、誤差スペクトルdiの量子化は、diを複数の帯域
に分割し、帯域毎に各帯域の平均値のスカラ量子化を行
う構成としてもよい。以上、クラスタ別平均スペクトル
算出部1005で得られたM個の代表ベクトルインデク
ス、誤差スペクトル・パワ補正値量子化部1007で得
られた、誤差スペクトル量子化インデクスおよびパワ補
正値量子化インデクス、モデル区間平均パワ量子化部1
006で得られたパワ量子化インデクスを、スペクトル
モデルパラメータの量子化インデクスとして出力する。
【0090】なお、スペクトルモデルパラメータのうち
標準偏差Sdv#iは、雑音スペクトル代表ベクトル学習時
に得られるCiに対するクラスタ内標準偏差値をそのまま
使用する。この値に関しては雑音スペクトル代表ベクト
ル記憶部に予め記憶させておくことで、量子化インデク
スの出力は不要である。また、クラスタ別平均スペクト
ル算出部1005で、平均スペクトル算出時に、クラス
タ内の標準偏差も算出し、その量子化を行ってもよい。
この場合は、その量子化インデクスをスペクトルモデル
パラメータの量子化インデクスの一部として出力する。
【0091】なお、上記実施の形態では、誤差スペクト
ルの量子化を帯域別のスカラ量子化により説明したが、
全帯域のベクトル量子化等他の方法で量子化することも
可能である。また、パワ情報をモデル化区間の平均パワ
とモデル別の平均パワに対する補正値により表現した構
成を説明したが、モデル別のパワのみでの表現や、モデ
ル化区間の平均パワで全モデルのパワを代表するように
してもよい。
【0092】次に、図11は、本発明の実施の形態3に
かかる雑音信号合成装置の構成を示すブロック図であ
る。図11に示す雑音信号合成装置において、まず遷移
系列生成部1101にて、図9に示した雑音信号分析装
置により得られた統計モデルパラメータ量子化インデク
スのうち、Si-Sj間の遷移確率p(i,j)の量子化インデク
スを用いて遷移確率p(i,j)を復号し、スペクトルモデル
Siの遷移が与えられた遷移確率p(i,j)となるようなス
ペクトルモデル番号遷移系列[index'(l)](1≦index'
(l)≦M, l=0,1,2,...)を生起させる。次に、スペ
クトルモデルパラメータ復号部1103においてスペク
トルモデルパラメータの量子化インデクスからスペクト
ルモデルSiの統計パラメータである平均振幅Sav#iお
よび標準偏差Sdv#i(i=1,...,M)を復号する。ここ
で、平均振幅Sav#iの復号は、符号化装置のスペクトル
パラメータ算出・量子化部903で得られた量子化イン
デクスおよび、スペクトルモデルパラメータ復号部11
03内に備えられた符号化側と同一の雑音スペクトル代
表ベクトル記憶部内の代表ベクトルを用い、(2)式に基
き復号する。また、標準偏差Sdv#iに関しては、符号化
装置にて雑音スペクトル代表ベクトル学習時に得られる
Ciに対するクラスタ内標準偏差値をそのまま使用した場
合には、該当する値を雑音スペクトル代表ベクトル記憶
部1003から得ることで復号する。そして、スペクト
ル生成部1105は、遷移系列生成部1101により得
られたモデル番号index'(l)、および、スペクトルモデ
ルパラメータ復号部1103で得られたスペクトルモデ
ルSi (i=1,...,M)に関するモデル情報(Siの平
均振幅Sav#iおよび標準偏差Sdv#i)用いて、次式で示さ
れるindex'(l)に対するスペクトル振幅時系列[X'(n)]を
生成する。
【0093】 {X'(n)}=[S index'(l)(n)], n=1,2,...,L −(3) ここで、S index'(l)は、i=index'(l)に対する平均振幅
Sav#i、標準偏差Sdv#iを有する正規分布に従うものと
し、また継続フレーム数Lは、継続長制御部1102に
おいて、雑音信号分析装置から出力されたスペクトルモ
デルSiに対する継続フレーム数Liの統計モデルパラメ
ータの量子化インデクスからの復号値(Liの平均値Lav#
i,標準偏差値Ldv#i)を用いて、i=index'(l)に対する
平均値Lav#i、標準偏差Ldv#iを有する正規分布に従うよ
うに制御されたものである。
【0094】さらに、スペクトル生成部1105は、上
記の方法により、遷移系列[index'(l)]に沿って生成し
た所定の時間長(=当該モデル化区間のフレーム数NFR
M)のスペクトル振幅時系列に対して、乱数位相生成部
1104により生成された乱数位相を与えて、スペクト
ル時系列を作成する。なお、スペクトル生成部1105
において、生成された振幅スペクトル時系列に対してス
ペクトルが滑らかに変化するよう平滑化を行ってもよ
い。
【0095】IFFT(逆高速フーリエ変換)部110
6は、スペクトル生成部1105により作成されたスペ
クトル時系列を時間領域の波形に変換する。重ね合わせ
加算部1107は、フレーム間の信号の重ね合わせ加算
を行うことにより、最終的な合成雑音信号を出力する。
【0096】次いで、上記構成を有する雑音信号分析装
置および雑音信号合成装置の動作について、さらに図1
2〜図14を参照して説明する。
【0097】まず、本実施の形態にかかる雑音信号分析
装置の動作について、図12を参照して説明する。ま
ず、工程(以下「ST」という。)1201において、
フレーム毎の雑音信号x(j)(j=0,...,N-1; N:分析
長)が、窓かけ部901に入力される。ST1202に
おいて、第mフレーム(m=0,1,2,...)に対する入力雑
音信号に対してハニング窓等による窓かけが、窓かけ部
901によりなされる。次に、ST1203において、
窓かけがなされた入力雑音信号に対して、FFT部90
2によりFFT(高速フーリエ変換)がなされて周波数
スペクトルに変換される。これにより第mフレームの入
力振幅スペクトルX(m)が算出される。ST1204にお
いて、スペクトルモデルパラメータ算出・量子化部90
3により、入力雑音信号の振幅スペクトル系列[X(m)]
(m=0,1,2,...)を一定フレーム数の区間、または何ら
かの指標により適応的に定められたフレーム数からなる
区間をモデル化を行う単位区間(モデル化区間)として
区切り、そのモデル化区間におけるスペクトルモデルパ
ラメータの算出および量子化が行われ、スペクトルモデ
ルパラメータの量子化インデクスが出力されると共に、
入力雑音信号の振幅スペクトル系列[X(m)]に対応するス
ペクトルモデル番号系列[index(m)](1≦index(m)≦M,
m= mk,mk+1,mk+2,...,mk+NFRM-1; mkは当該モデル
化区間の先頭フレーム番号、NFRMはモデル化区間のフレ
ーム数)が出力される。ここで、スペクトルモデルパラ
メータとは、スペクトルモデルSi (i=1,...,M)の
統計パラメータである平均振幅Sav#iおよび標準偏差Sdv
#iを含むものである。このST1204におけるスペク
トルモデルパラメータ算出・量子化部903の動作につ
いては、図13により詳細に説明する。
【0098】次に、ST1205において、継続長モデ
ル・遷移確率算出・量子化部904により、ST120
4にて得られたモデル化区間のスペクトルモデル番号系
列[index(m)]を用いて、Si各々に対する継続フレーム
数Liに関する統計パラメータ(継続長モデルパラメー
タ)(Liの平均値Lav#iおよび標準偏差値Ldv#i)および
Si-Sj間の遷移確率p(i,j)が算出・量子化され、それら
の量子化インデクスが出力される。量子化方法は任意で
あるが、Lav#i、Ldv#i、およびp(i,j)の各要素を各々ス
カラ量子化してもよい。
【0099】そして、ST1206において、以上の、
スペクトルモデルパラメータ、継続長モデルパラメータ
および遷移確率パラメータの量子化インデクスが、モデ
ル化区間の入力雑音信号の統計モデルパラメータ量子化
インデクスとして出力される。
【0100】図13は、図12のST1204における
スペクトルモデルパラメータ算出・量子化部903の詳
細動作を示すフロー図である。本実施例におけるスペク
トルモデルパラメータ算出・量子化部903は、予め用
意した雑音信号を表す振幅スペクトルの代表ベクトル集
合の中から、入力雑音のモデル化区間における入力振幅
スペクトル時系列を表すのに適切な代表ベクトルをモデ
ル数(=M)個選択し、それをベースにスペクトルモデ
ルパラメータを算出・量子化する。
【0101】まず、ST1301において、モデル化区
間内のフレーム単位の入力振幅スペクトルX(m) (m= mk,
mk+1,mk+2,...,mk+NFRM-1)が入力される。そして、
ST1302において、入力振幅スペクトルに対して、
パワ算出部1001により当該フレームのパワが算出さ
れ、ST1303において、パワ算出部1001で算出
されたパワ値を用いて、パワ正規化部1002によりパ
ワの正規化が行われる。次に、ST1304において、
そのパワ正規化された入力振幅スペクトルに対して、ク
ラスタ化部1004により、雑音スペクトル代表ベクト
ル記憶部1003の各代表ベクトルをクラスタ中心とす
るクラスタ化(ベクトル量子化)が行われ、各入力スペ
クトルがどのクラスタに所属するかの情報が出力され
る。そして、ST1305において、クラスタ別平均ス
ペクトル算出部1005により、クラスタ化部1004
で得られた所属するクラスタ(代表ベクトル)番号の系
列に対して、モデル化区間で所属頻度の高い上位M個の
クラスタ(対応する代表ベクトルをCi(i=1,2,…,M)とす
る)が選択される。その各クラスタに所属する入力雑音
振幅スペクトルの平均スペクトルがクラスタ毎に算出さ
れ、それらをスペクトルモデルの平均振幅スペクトルSa
v#i(i=1,2,…,M)とする。また、入力雑音信号の振幅ス
ペクトル系列[X(m)]に対するスペクトルモデル番号系列
[index(m)](1≦index(m)≦M, m= mk,mk+1,mk+
2,...,mk+NFRM-1)があわせて出力される。この番号
系列は、クラスタ化部1004で得られた所属するクラ
スタ(代表ベクトル)番号の系列をベースに、上位M個
のクラスタに属す番号系列として生成される。すなわ
ち、上位M個のクラスタに属さないフレームに対して
は、任意の方法(例えば、再度のクラスタ化や前フレー
ムのクラスタ番号に置換するなど)で上記M個のクラス
タの番号に対応付けるか、またはそのフレームは系列か
ら削除するなどが行われる。次に、ST1306におい
て、モデル化区間平均パワ量子化部1006により、1
001で算出されたフレーム毎のパワ値が、モデル化区
間全体で平均され、その平均パワに対してスカラ量子化
など任意の方法で量子化が行われ、パワインデクスおよ
びモデル化区間平均パワ値(量子化値)Eが出力され
る。そして、ST1307において、誤差スペクトル・
パワ補正値量子化部1007により、(2)式に示すよう
に、対応する代表ベクトルCi,Ciからの誤差スペクトル
di、モデル化区間平均パワEおよび各スペクトルモデル
別のEに対するパワ補正値eiで表されたSav#iに対し
て、di, eiがスカラ量子化等任意の方法で量子化され
る。
【0102】ここで、誤差スペクトルdiの量子化は、di
を複数の帯域に分割し、帯域毎に各帯域の平均値をスカ
ラ量子化を行うようにしてもよい。そして、ST130
8において、上記、ST1305にて得られたM個の代
表ベクトルインデクス、ST1307にて得られた誤差
スペクトル量子化インデクス、および、パワ補正値量子
化インデクス、ST1306にて得られたパワ量子化イ
ンデクスが、スペクトルモデルパラメータの量子化イン
デクスとして出力される。
【0103】なお、スペクトルモデルパラメータのうち
標準偏差Sdv#iは、雑音スペクトル代表ベクトル学習時
に得られるCiに対するクラスタ内標準偏差値がそのまま
使用される。この値に関しては雑音スペクトル代表ベク
トル記憶部に予め記憶させておくことで、量子化インデ
クスの出力は不要である。また、ST1305におい
て、クラスタ別平均スペクトル算出部1005による平
均スペクトル算出時にクラスタ内の標準偏差も算出し、
その量子化を行ってもよい。この場合は、その量子化イ
ンデクスが、スペクトルモデルパラメータの量子化イン
デクスの一部として出力される。
【0104】なお、上記実施の形態では、誤差スペクト
ルの量子化を帯域別のスカラ量子化により説明したが、
全帯域のベクトル量子化等他の方法で量子化することも
可能である。また、パワ情報をモデル化区間の平均パワ
とモデル別の平均パワに対する補正値により表現した構
成を説明したが、モデル別のパワのみでの表現や、モデ
ル化区間の平均パワで全モデルのパワを代表するように
してもよい。
【0105】次に、本実施の形態にかかる雑音信号合成
装置の動作について、図14を参照して説明する。ま
ず、ST1401において、雑音信号分析装置により得
られた統計モデルパラメータの各量子化インデクスが入
力される。そして、ST1402において、スペクトル
モデルパラメータ復号部1103によりスペクトルモデ
ルパラメータの量子化インデクスからスペクトルモデル
Siの統計パラメータである平均振幅Sav#iおよび標準
偏差Sdv#i(i=1,...,M)を復号する。次に、ST14
03において、遷移系列生成部1101により、Si-Sj
間の遷移確率p(i,j)の量子化インデクスを用いて遷移確
率p(i,j)が復号され、スペクトルモデルSiの遷移が与
えられた遷移確率p(i,j)となるようなスペクトルモデル
番号遷移系列[index'(l)](1≦index'(l)≦M, l=0,1,
2,...)が生起される。
【0106】次に、ST1404において、スペクトル
モデルSiに対する継続フレーム数Liの統計モデルパラ
メータの量子化インデクスからの復号値(Liの平均値La
v#i,標準偏差値Ldv#i)を用いて、i=index'(l)に対し
て平均値Lav#i、標準偏差Ldv#iを有する正規分布に従う
ように制御された継続フレーム数Lが、継続長制御部1
102により生成される。また、ST1405におい
て、乱数位相生成部1104により乱数位相が生成され
る。
【0107】そして、ST1406において、スペクト
ル生成部1105により、ST1403において得られ
たモデル番号index'(l)、および、ST1402におい
て得られたスペクトルモデルSi (i=1,...,M)に関
するモデル情報(Siの平均振幅Sav#iおよび標準偏差S
dv#i)を用いて、(3)式で示されるindex'(l)に対するス
ペクトル振幅時系列[X'(n)]が生成される。
【0108】ここで、S index'(l)は、i=index'(l)に対
する平均振幅Sav#i、標準偏差Sdv#iを有する正規分布に
従うものとし、また継続フレーム数Lは、ST1404
において生成されたものである。なお、生成された振幅
スペクトル時系列に対してスペクトルが滑らかに変化す
るよう平滑化を行ってもよい。さらに、遷移系列[inde
x'(l)]に沿って生成した所定の時間長(=当該モデル化
区間のフレーム数NFRM)のスペクトル振幅時系列に対し
て、ST1405において生成された乱数位相を与え
て、スペクトル時系列を作成する。
【0109】ST1407において、IFFT部110
6により、作成されたスペクトル時系列が時間領域の波
形に変換された後、ST1408において、重ね合わせ
加算部1107によりフレーム間の信号の重ね合わせ加
算が行なわれる。ST1409において、重ね合わせ加
算された信号が最終的な合成雑音信号として出力され
る。
【0110】このように、本実施の形態においては、背
景雑音信号を統計的モデルで表現している。すなわち、
雑音信号分析装置(送信側装置)において、雑音信号を
用いて、雑音信号スペクトルのスペクトル変化を含めた
統計的情報(統計モデルパラメータ)を生成し、生成し
た情報を雑音信号合成装置(受信側装置)に送信してい
る。また、雑音信号合成装置(受信側装置)において
は、雑音信号分析装置(送信側装置)から送信された上
記情報(統計モデルパラメータ)を用いて、雑音信号を
合成している。これにより、雑音信号合成装置(受信側
装置)においては、間欠的に分析された雑音信号のスペ
クトルではなく、雑音信号スペクトルのスペクトル変化
を含めた統計的情報を用いて、雑音信号を合成すること
ができるので、聴感的に劣化の少ない雑音信号を合成す
ることができる。また、実際の周囲騒音下での雑音信号
の統計的な特性は比較的長期間(例えば数秒〜十数秒)
に渡り一定であることが想定されることから、モデルパ
ラメータの伝送周期もその程度の長期間周期で良いた
め、復号側に伝送すべき雑音信号のモデルパラメータの
情報量は少なくて済み、効率的な伝送を実現できる。
【0111】(実施の形態4)本実施の形態では、実施
の形態3で説明した雑音信号分析装置を用いて音声符号
化装置を実現し、また、実施の形態3で説明した雑音信
号合成装置を用いて音声復号装置を実現する場合につい
て説明する。
【0112】まず、本実施の形態にかかる音声符号化装
置について、図15を参照して説明する。図15は、本
発明の実施の形態4にかかる音声符号化装置の構成を示
すブロック図である。図15において、入力音声信号
は、有音/無音判定器1501、音声符号器1502お
よび雑音信号符号器1503に入力される。
【0113】有音/無音判定器1501は、入力音声信
号に対して有音区間か無音区間(雑音のみの区間)かを
判定しその判定結果を出力する。有音/無音判定器15
01は、任意のものでよく、一般には、入力信号のパワ
ー、スペクトルやピッチ周期などの複数のパラメータの
瞬時量または変化量等を用いて判定を行うものである。
【0114】音声符号器1502は、有音/無音判定器
1501による判定結果が有音である場合に、入力音声
信号に対して音声符号化を行い、その符号化データをD
TX制御および多重化器1504に出力する。この音声
符号器1502は、有音区間用の符号器であり、音声を
高能率に符号化する任意の符号器である。
【0115】雑音信号符号器1503は、有音/無音判
定器1501による判定結果が無音である場合に、入力
音声信号に対して雑音信号の符号化を行い入力雑音信号
に対する統計モデルパラメータの量子化インデクスを符
号化データとして出力する。この雑音符号器1503と
して、実施の形態3で説明した雑音分析装置(図9)を用
いる。
【0116】DTX制御および多重化器1504は、有
音/無音判定器1501、音声符号器1502および雑
音信号符号器1503からの出力を用いて送信データと
して送信すべき情報の制御と送信情報の多重化を行い、
送信データを出力する。
【0117】次に、本発明の実施の形態4にかかる音声
復号装置について、図16を参照して説明する。図16
は、本発明の実施の形態4にかかる音声復号装置の構成
を示すブロック図である。図16において、図15に示
した音声符号化装置により送信された送信データは、受
信データとして分離およびDTX制御器1601に入力
される。
【0118】分離およびDTX制御器1601は、受信
データを音声復号および雑音生成に必要な音声符号化デ
ータ、または雑音モデル符号化データ、および有音/無
音判定フラグに分離する。
【0119】音声復号器1602は、前記有音/無音判
定フラグが有音区間を示す場合に、前記音声符号化デー
タを用いて音声復号を行い復号音声を出力する。雑音信
号復号器1603は、前記有音/無音判定フラグが無音
区間を示す場合に、前記雑音モデル符号化データを用い
て雑音信号の生成を行い、雑音信号を出力する。この雑
音信号復号器1603として、実施の形態3で説明した
雑音信号合成装置(図11)を用いる。
【0120】出力切り替え器1604は、音声復号器1
602の出力と雑音信号復号器1603の出力を、有音
/無音判定フラグの結果に応じて切り替えて出力し、出
力信号とする。
【0121】次に、上記構成を有する音声符号化装置お
よび音声復号装置の動作について説明する。まず、音声
符号化装置の動作について、図17を参照して説明す
る。図17は、本発明の実施の形態4にかかる音声符号
化装置の動作を示すフロー図である。
【0122】まず、ST1701において、フレーム毎
の音声信号が入力され、ST1702、ST1703に
おいて、入力音声信号に対して有音区間か無音区間(雑
音のみの区間)かが判定されその判定結果が出力され
る。この有音/無音判定は任意の方法でよく、一般に
は、入力信号のパワー、スペクトルやピッチ周期などの
複数のパラメータの瞬時量または変化量等を用いて判定
が行われる。
【0123】ST1702における有音/無音判定結果
が有音である場合には、ST1704において入力音声
信号に対する音声符号化が行われ、その符号化データが
出力される。この音声符号化処理は有音区間用の符号化
で、音声を高能率に符号化する任意の方法でよい。
【0124】一方、前記有音/無音判定結果が無音であ
る場合には、ST1705において、入力音声信号に対
する雑音信号の符号化が行われ、入力雑音信号に対する
モデルパラメータが出力される。この雑音信号符号化と
して、実施の形態3にて説明した雑音信号の分析方法を
用いる。
【0125】ST1706において、前記有音/無音判
定結果、音声符号化および雑音信号符号化からの出力を
用いて送信データとして送信すべき情報の制御(DTX
制御)と送信情報の多重化が行われ、ST1707にお
いて送信データとして出力される。
【0126】次に、音声復号装置の動作について、図1
8を参照して説明する。図18は、本発明の実施の形態
4にかかる音声復号装置の動作を示すフロー図である。
【0127】まず、ST1801において、符号化側で
入力信号に対して符号化され送信されたデータが受信デ
ータとして受信される。ST1802において、受信デ
ータは、音声復号および雑音生成に必要な音声符号化デ
ータ、または雑音モデル符号化パラメータ、および有音
/無音判定フラグに分離される。
【0128】前記有音/無音判定フラグが有音区間を示
す場合には、ST1804において前記音声符号化デー
タを用いて音声復号が行われ、復号音声が出力される。
一方、前記有音/無音判定フラグが無音区間を示す場合
には、ST1805において前記雑音モデル符号化パラ
メータを用いて雑音信号の生成が行われ、雑音信号が出
力される。この雑音信号復号処理として、実施の形態4
で説明した雑音信号の合成方法を用いる。
【0129】ST1806において、有音/無音判定フ
ラグの結果に応じてST1804における音声復号また
はST1805における雑音信号復号の出力が、復号信
号として出力される。
【0130】なお、上記実施の形態においては、復号信
号の出力を有音区間と無音区間で復号音声信号と合成雑
音信号の切り替えで出力されるものとして説明したが、
別の形態として、無音区間で合成した雑音信号を有音区
間においても復号音声信号に加算して出力するようにし
てもよい。さらに、音声符号化側で雑音信号を含む入力
音声信号を、雑音信号と雑音を含まない音声信号とに分
離する手段を設けて、分離後の音声信号および雑音信号
を符号化したデータを用いて、復号側で無音区間で合成
した雑音信号を、上記と同様に有音区間においても復号
音声信号に加算して出力するようにしてもよい。
【0131】このように、本実施の形態によれば、有音
区間では音声信号を高品質で符号化できる音声符号化
を、無音区間では聴感的に劣化が少ない雑音信号分析装
置および合成装置を用いて雑音信号の符号化および復号
を行うことにより、背景雑音環境下においても高品質な
符号化を行える。また、実際の周囲騒音下での雑音信号
の統計的な特性は比較的長期間(例えば数秒〜十数秒)
に渡り一定であることが想定されることから、モデルパ
ラメータの伝送周期もその程度の長期間周期で良いた
め、復号側に伝送すべき雑音信号のモデルパラメータの
情報量は少なくて済み、効率的な伝送を実現できる。
【0132】なお、上記実施の形態1および3で説明し
た雑音信号分析装置および雑音信号合成装置によりなさ
れる処理、ならびに、上記実施の形態2および4で説明
した音声符号化装置および音声復号装置によりなされる
処理をソフトウェア(プログラム)により実現し、この
ソフトウェア(プログラム)を、コンピュータにより読
み取ることが可能な記録媒体に格納することが可能であ
る。
【0133】
【発明の効果】以上説明したように、本発明によれば、
雑音信号を統計的モデルで表現することにより、聴感的
に劣化の少ない雑音信号を合成することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1にかかる雑音信号分析装
置の構成を示すブロック図
【図2】本発明の実施の形態1にかかる雑音信号合成装
置の構成を示すブロック図
【図3】本発明の実施の形態1にかかる雑音信号分析装
置の動作を示すフロー図
【図4】本発明の実施の形態1にかかる雑音信号合成装
置の動作を示すフロー図
【図5】本発明の実施の形態2にかかる音声符号化装置
の構成を示すブロック図
【図6】本発明の実施の形態2にかかる音声復号装置の
構成を示すブロック図
【図7】本発明の実施の形態2にかかる音声符号化装置
の動作を示すフロー図
【図8】本発明の実施の形態2にかかる音声復号装置の
動作を示すフロー図
【図9】本発明の実施の形態3にかかる雑音信号分析装
置の構成を示すブロック図
【図10】本発明の実施の形態3にかかるスペクトルモ
デルパラメータ算出・量子化部の構成を示すブロック図
【図11】本発明の実施の形態3にかかる雑音信号合成
装置の構成を示すブロック図
【図12】本発明の実施の形態3にかかる雑音信号分析
装置の動作を示すフロー図
【図13】本発明の実施の形態3にかかるスペクトルモ
デルパラメータ算出・量子化部の動作を示すフロー図
【図14】本発明の実施の形態3にかかる雑音信号合成
装置の動作を示すフロー図
【図15】本発明の実施の形態4にかかる音声符号化装
置の構成を示すブロック図
【図16】本発明の実施の形態4にかかる音声復号装置
の構成を示すブロック図
【図17】本発明の実施の形態4にかかる音声符号化装
置の動作を示すフロー図
【図18】本発明の実施の形態4にかかる音声復号装置
の動作を示すフロー図
【図19】従来のDTX制御付きCS−ACELP符号
化方式を採用した符号化装置の構成を示すブロック図
【符号の説明】
101 窓かけ部 102 FFT部 103 スペクトルモデル記憶部 104 スペクトルモデル系列算出部 105 継続長モデル・遷移確率算出部 201 遷移系列生成部 202 スペクトルモデル記憶部 203 継続長制御部 204 乱数位相生成部 205 スペクトル生成部 206 IFFT部 207 重ね合わせ加算部
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成13年9月12日(2001.9.1
2)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】特許請求の範囲
【補正方法】変更
【補正内容】
【特許請求の範囲】
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0011
【補正方法】変更
【補正内容】
【0011】
【課題を解決するための手段】本発明の雑音信号分析装
置は、ある統計的分布に従う振幅スペクトル時系列で表
され、かつ、その振幅スペクトル時系列の継続時間長が
別の統計的分布に従う複数の定常雑音モデルを生成する
生成手段と、前記複数の定常雑音モデル間を統計的に遷
移するスペクトル系列として雑音信号を処理する処理手
段と、を具備する構成を採る。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0012
【補正方法】変更
【補正内容】
【0012】本発明の雑音信号分析装置は、雑音信号
周波数領域の信号に変換して、前記雑音信号のスペクト
ルを算出する周波数変換手段と、定常雑音モデルのスペ
クトルに関する複数のモデル情報を記憶する記憶手段
と、前記複数のモデル情報のうち、所定の条件に基づい
て、前記雑音信号のスペクトルに対応するモデル情報
選択する選択手段と、選択されたモデル情報の時間的な
系列を用いて定常雑音モデルに関する統計パラメータと
複数の定常雑音モデル間を遷移する確率である遷移確率
情報を生成する情報生成手段と、を具備する構成を採
る。また、本発明のプログラムは、コンピュータを、雑
音信号を周波数領域の信号に変換して、前記雑音信号の
スペクトルを算出する周波数変換手段、定常雑音モデル
のスペクトルに関する複数のモデル情報を記憶する記憶
手段、前記複数のモデル情報のうち、所定の条件に基づ
いて前記雑音信号のスペクトルに対応するモデル情報を
選択する選択手段、選択されたモデル情報の時間的な系
列を用いて定常雑音モデルに関する統計パラメータと複
数の定常雑音モデル間を遷移する確率である確率情報を
生成する情報生成手段として機能させる。
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0013
【補正方法】変更
【補正内容】
【0013】これらの構成およびプログラムによれば、
雑音信号を統計的モデルで表現した信号に変換すること
により、雑音信号合成装置においては、聴感的に劣化の
少ない雑音信号を合成することができる。
【手続補正5】
【補正対象書類名】明細書
【補正対象項目名】0014
【補正方法】変更
【補正内容】
【0014】本発明の雑音信号合成装置は、上記雑音信
号分析装置により生成された統計パラメータと遷移確率
情報を用いて、雑音信号を生成する雑音信号生成手段
具備する構成を採る。
【手続補正6】
【補正対象書類名】明細書
【補正対象項目名】0015
【補正方法】変更
【補正内容】
【0015】本発明の雑音信号合成装置は、複数の定常
雑音モデル間を遷移する確率である遷移確率情報を用い
て、定常雑音モデルの遷移系列に関する情報を生成する
遷移系列生成手段と、定常雑音モデルに関する統計パラ
メータを用いて、定常雑音モデルの継続時間長を算出す
る継続時間長算出手段と、定常雑音モデルのスペクトル
に関するモデル情報を記憶する記憶手段と、乱数位相を
生成する乱数位相生成手段と、生成された前記定常雑音
モデルの遷移系列に関する情報、算出された前記継続時
間長、記憶された前記定常雑音モデルのスペクトルに関
するモデル情報、および、生成された乱数位相を用い
て、スペクトル時系列を生成するスペクトル生成手段
と、生成されたスペクトルを時間領域の信号に変換する
逆周波数変換手段と、を具備する構成を採る。また、本
発明のプログラムは、コンピュータを、複数の定常雑音
モデル間を遷移する確率である確率情報を用いて、定常
雑音モデルの遷移系列に関する情報を生成する遷移系列
生成手段、定常雑音モデルに関する統計パラメータを用
いて、定常雑音モデルの継続時間長を算出する継続時間
長算出手段、定常雑音モデルのスペクトルに関するモデ
ル情報を記憶する記憶手段、乱数位相を生成する乱数位
相生成手段、生成された前記定常雑音モデルの遷移系列
に関する情報、算出された前記継続時間長、記憶された
前記定常雑音モデルのスペクトルに関するモデル情報、
および、生成された乱数位相を用いて、スペクトル時系
列を生成するスペクトル生成手段、生成されたスペクト
ルを時間領域の信号に変換する逆周波数変換手段として
機能させる。
【手続補正7】
【補正対象書類名】明細書
【補正対象項目名】0016
【補正方法】変更
【補正内容】
【0016】これらの構成およびプログラムによれば、
雑音信号分析装置により生成された、雑音信号が統計的
モデルで表現された信号を用いて、雑音信号を合成する
ことにより、聴感的に劣化の少ない雑音信号を合成する
ことができる。
【手続補正8】
【補正対象書類名】明細書
【補正対象項目名】0020
【補正方法】変更
【補正内容】
【0020】本発明の雑音信号分析装置は、雑音信号
周波数領域の信号に変換して、前記雑音信号のスペクト
ルを算出する周波数変換手段と、定常雑音モデルの振幅
スペクトル時系列に関する統計パラメータであるスペク
トルモデルパラメータの算出と量子化を行い、量子化イ
ンデクスを出力するスペクトルモデルパラメータ算出・
量子化手段と、前記定常雑音モデルの振幅スペクトル時
系列の継続時間長に関する統計パラメータおよび複数の
定常雑音モデル間を遷移する確率である遷移確率情報
算出と量子化を行い、量子化インデクスを出力する継続
長モデル・遷移確率算出・量子化手段と、を具備する構
成を採る。また、本発明の雑音信号分析装置は、スペク
トルモデルパラメータ算出・量子化手段は、周波数変換
手段により得られた入力雑音信号の振幅スペクトルに対
してパワの正規化を行うパワ正規化手段と、雑音信号を
表す振幅スペクトルの代表ベクトルの集合を記憶する記
憶手段と、前記パワ正規化手段により得られたパワ正規
化振幅スペクトルに対して、前記記憶手段に記憶されて
いる代表ベクトル集合を用いてクラスタ化を行うクラス
タ化手段と、入力雑音信号のモデル化区間単位で選択頻
度の高い上位複数個のクラスタを選択し、それらの選択
されたクラスタに属する入力振幅スペクトルの平均スペ
クトルをクラスタ毎に算出するクラスタ別平均スペクト
ル算出手段と、入力雑音信号のモデル化区間の平均パワ
を算出し、その量子化を行うモデル化区間平均パワ量子
化手段と、前記クラスタ別平均スペクトル算出手段によ
り得られたクラスタ別平均スペクトルおよびモデル化区
間平均パワ量子化手段により得られた量子化されたモデ
ル化区間平均パワを用いて、クラスタ毎の誤差スペクト
ルとモデル化区間平均パワに対するパワ補正値の量子化
を行う、誤差スペクトル・パワ補正値量子化手段と、を
具備する構成を採る。
【手続補正9】
【補正対象書類名】明細書
【補正対象項目名】0022
【補正方法】変更
【補正内容】
【0022】本発明の雑音信号合成装置は、上記雑音信
号分析装置により生成された量子化インデクスを用い
て、雑音信号を生成する雑音信号生成手段を具備する構
成を採る。
【手続補正10】
【補正対象書類名】明細書
【補正対象項目名】0023
【補正方法】変更
【補正内容】
【0023】本発明の雑音信号合成装置は、複数の定常
雑音モデル間を遷移する確率である遷移確率情報の量子
化インデクスを用いて、定常雑音モデルの遷移系列に関
する情報を生成する遷移系列生成手段と、継続時間長
関する統計パラメータの量子化インデクスを用いて、
常雑音モデルの継続時間長を算出する継続時間長算出手
段と、スペクトルモデルパラメータの量子化インデクス
を用いて前記スペクトルモデルパラメータを復号するス
ペクトルモデルパラメータ復号手段と、乱数位相を生成
する乱数位相生成手段と、生成された前記定常雑音モデ
ルの遷移系列に関する情報、算出された前記継続時間
長、前記スペクトルモデルパラメータ、および、生成さ
れた乱数位相を用いて、スペクトル時系列を生成するス
ペクトル生成手段と、生成されたスペクトルを時間領域
の信号に変換する逆周波数変換手段と、を具備する構成
を採る。
【手続補正11】
【補正対象書類名】明細書
【補正対象項目名】0028
【補正方法】変更
【補正内容】
【0028】本発明の雑音信号分析方法は、雑音信号を
周波数領域の信号に変換して、前記雑音信号のスペクト
ルを算出する周波数変換工程と、定常雑音モデルスペ
クトルに関する複数のモデル情報を記憶する記憶工程
と、前記複数のモデル情報のうち、所定の条件に基づい
て、前記雑音信号のスペクトルに対応するモデル情報
選択する選択工程と、選択されたモデル情報の時間的な
系列を用いて定常雑音モデルに関する統計パラメータと
複数の定常雑音モデル間を遷移する確率である遷移確率
情報を生成する情報生成工程と、を具備する。
【手続補正12】
【補正対象書類名】明細書
【補正対象項目名】0030
【補正方法】変更
【補正内容】
【0030】本発明の雑音信号合成方法は、上記雑音信
号分析方法により生成された複数の定常雑音モデル間を
遷移する確率である遷移確率情報を用いて、定常雑音モ
デルの遷移系列に関する情報を生成する遷移系列生成工
程と、定常雑音モデルに関する統計パラメータを用い
て、定常雑音モデルの継続時間長を算出する継続時間長
算出工程と、定常雑音モデルスペクトルに関するモデ
ル情報を記憶する記憶工程と、乱数位相を生成する乱数
位相生成工程と、生成された前記定常雑音モデルの遷移
系列に関する情報、算出された前記継続時間長、記憶さ
れた前記定常雑音モデルのスペクトルに関するモデル情
報、および、生成された乱数位相を用いて、スペクトル
時系列を生成するスペクトル生成工程と、生成されたス
ペクトルを時間領域の信号に変換する逆周波数変換工程
と、を具備する。
【手続補正13】
【補正対象書類名】明細書
【補正対象項目名】0032
【補正方法】変更
【補正内容】
【0032】本発明の雑音信号分析方法は、雑音信号を
周波数領域の信号に変換して、前記雑音信号のスペクト
ルを算出する周波数変換工程と、定常雑音モデルの振幅
スペクトル時系列に関する統計パラメータであるスペク
トルモデルパラメータの算出と量子化を行い、量子化イ
ンデクスを出力するスペクトルモデルパラメータ算出・
量子化工程と、前記定常雑音モデルの振幅スペクトル時
系列の継続時間長に関する統計パラメータおよび複数の
定常雑音モデル間を遷移する確率である遷移確率情報の
算出と量子化を行い、量子化インデクスを出力する継続
長モデル・遷移確率算出・量子化工程と、を具備する。
また、本発明の雑音信号分析方法は、スペクトルモデル
パラメータ算出・量子化工程は、周波数変換工程により
得られた入力雑音信号の振幅スペクトルに対してパワの
正規化を行うパワ正規化工程と、雑音信号を表す振幅ス
ペクトルの代表ベクトルの集合を記憶する記憶工程と、
前記パワ正規化工程により得られたパワ正規化振幅スペ
クトルに対して、前記記憶工程により記憶されている代
表ベクトル集合を用いてクラスタ化を行うクラスタ化工
程と、入力雑音信号のモデル化区間単位で選択頻度の高
い上位複数個のクラスタを選択し、それらの選択された
クラスタに属する入力振幅スペクトルの平均スペクトル
をクラスタ毎に算出するクラスタ別平均スペクトル算出
工程と、入力雑音信号のモデル化区間の平均パワを算出
し、その量子化を行うモデル化区間平均パワ量子化工程
と、前記クラスタ別平均スペクトル算出工程により得ら
れたクラスタ別平均スペクトルおよびモデル化区間平均
パワ量子化工程により得られた量子化されたモデル化区
間平均パワを用いて、クラスタ毎の誤差スペクトルとモ
デル化区間平均パワに対するパワ補正値の量子化を行
う、誤差スペクトル・パワ補正値量子化工程と、を具備
する。
【手続補正14】
【補正対象書類名】明細書
【補正対象項目名】0034
【補正方法】変更
【補正内容】
【0034】本発明の雑音信号合成方法は、上記雑音信
号分析方法により生成された複数の定常雑音モデル間を
遷移する確率である遷移確率情報の量子化インデクスを
用いて、定常雑音モデルの遷移系列に関する情報を生成
する遷移系列生成工程と、継続時間長に関する統計パラ
メータの量子化インデクスを用いて、定常雑音モデル
継続時間長を算出する継続時間長算出工程と、スペクト
ルモデルパラメータの量子化インデクスを用いて前記ス
ペクトルモデルパラメータを復号するスペクトルモデル
パラメータ復号工程と、乱数位相を生成する乱数位相生
成工程と、生成された前記定常雑音モデルの遷移系列に
関する情報、算出された前記継続時間長、前記スペクト
ルモデルパラメータ、および、生成された乱数位相を用
いて、スペクトル時系列を生成するスペクトル生成工程
と、生成されたスペクトルを時間領域の信号に変換する
逆周波数変換工程と、を具備する。
フロントページの続き (72)発明者 吉田 幸司 神奈川県横浜市港北区綱島東四丁目3番1 号 松下通信工業株式会社内 Fターム(参考) 5D045 DA11 DA20 5J064 AA01 BA13 BA16 BC08 BC14 BC16 BC28 BD01

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 雑音信号を用いて、振幅スペクトル時系
    列に関する統計的情報および前記振幅スペクトル時系列
    の継続時間長に関する統計的情報を含む定常雑音モデル
    に関する統計的情報と、前記定常雑音モデル間の遷移に
    関する統計的情報と、を生成する分析手段を具備するこ
    とを特徴とする雑音信号分析装置。
  2. 【請求項2】 分析手段は、雑音信号を周波数領域の信
    号に変換することにより、前記雑音信号のスペクトルを
    算出する周波数変換手段と、定常雑音モデルに対するス
    ペクトルに関する統計的情報を記憶する記憶手段と、前
    記複数の定常雑音モデルのうち、前記雑音信号のスペク
    トルに対応する定常雑音モデルを選択する選択手段と、
    を具備し、選択されたモデルの系列を用いて定常雑音モ
    デルに関する統計的情報と、前記定常雑音モデル間の遷
    移に関する統計的情報を生成することを特徴とする請求
    項1に記載の雑音信号分析装置。
  3. 【請求項3】 請求項1または請求項2に記載の雑音信
    号分析装置により生成された統計的情報を用いて、雑音
    信号を生成する生成手段を具備することを特徴とする雑
    音信号合成装置。
  4. 【請求項4】 生成手段は、定常雑音モデル間の遷移に
    関する統計的情報を用いて、定常雑音モデルの遷移系列
    に関する情報を生成する遷移系列生成手段と、定常雑音
    モデルに関する統計的情報を用いて、合成すべき定常雑
    音モデルの継続時間長を算出する継続時間長算出手段
    と、定常雑音モデルに対するスペクトルに関する統計的
    情報を記憶する記憶手段と、生成された前記定常雑音モ
    デルの遷移系列に関する情報、算出された前記継続時間
    長、および、生成された乱数位相を用いて、合成すべき
    スペクトル時系列を生成するスペクトル生成手段と、生
    成されたスペクトルを時間領域の信号に変換する逆周波
    数変換手段と、を具備することを特徴とする請求項3に
    記載の雑音信号合成装置。
  5. 【請求項5】 請求項1または請求項2に記載の雑音信
    号分析装置を用いて、音声信号の無音区間における雑音
    信号の符号化を行うことを特徴とする音声符号化装置。
  6. 【請求項6】 請求項3または請求項4に記載の雑音信
    号合成装置を用いて、音声信号の無音区間における雑音
    信号の復号を行うことを特徴とする音声復号装置。
  7. 【請求項7】 分析手段は、雑音信号を周波数領域の信
    号に変換することにより前記雑音信号のスペクトルを算
    出する周波数変換手段と、定常雑音モデルの振幅スペク
    トル時系列に関する統計的情報であるスペクトルモデル
    パラメータの算出と量子化を行うスペクトルモデルパラ
    メータ算出・量子化手段と、前記定常雑音モデルの振幅
    スペクトル時系列の継続時間長に関する統計的情報およ
    び前記定常雑音モデル間の遷移に関する統計的情報の算
    出と量子化を行う継続長モデル・遷移確率算出・量子化
    手段と、を具備し、 前記スペクトルモデルパラメータ算出・量子化手段は、
    前記周波数変換手段により得られた入力雑音信号の振幅
    スペクトルに対してパワの正規化を行うパワ正規化手段
    と、雑音信号を表す振幅スペクトルの代表ベクトルの集
    合を記憶する記憶手段と、前記パワ正規化手段により得
    られたパワ正規化振幅スペクトルに対して、前記記憶手
    段に記憶されている代表ベクトル集合を用いてクラスタ
    化を行うクラスタ化手段と、入力雑音信号のモデル化区
    間単位で選択頻度の高い上位複数個のクラスタを選択
    し、それらの選択されたクラスタに属する入力振幅スペ
    クトルの平均スペクトルをクラスタ毎に算出するクラス
    タ別平均スペクトル算出手段と、入力雑音信号のモデル
    化区間の平均パワを算出し、その量子化を行うモデル化
    区間平均パワ量子化手段と、前記クラスタ別平均スペク
    トル算出手段により得られたクラスタ別平均スペクトル
    およびモデル化区間平均パワ量子化手段により得られた
    量子化されたモデル化区間平均パワを用いて、クラスタ
    毎の誤差スペクトルとモデル化区間平均パワに対するパ
    ワ補正値の量子化を行う、誤差スペクトル・パワ補正値
    量子化手段と、を具備し、 前記スペクトルモデルパラメータ算出・量子化手段によ
    り得られた、選択されたクラスタに対応する代表ベクト
    ル、モデル化区間平均パワ、誤差スペクトルおよびパワ
    補正値を含むスペクトルモデルパラメータの量子化イン
    デクス、並びに継続長モデル・遷移確率算出・量子化手
    段により得られた継続時間長に関する統計的情報および
    雑音モデル間の遷移に関する統計的情報の量子化インデ
    クスを出力することを特徴とする請求項1に記載の雑音
    信号分析装置。
  8. 【請求項8】 請求項7に記載の雑音信号分析装置によ
    り生成された統計的情報の量子化インデクスを用いて、
    雑音信号を生成する生成手段を具備することを特徴とす
    る雑音信号合成装置。
  9. 【請求項9】 生成手段は、定常雑音モデル間の遷移に
    関する統計的情報の量子化インデクスを用いて、定常雑
    音モデルの遷移系列に関する情報を生成する遷移系列生
    成手段と、前記継続時間長に関する統計的情報の量子化
    インデクスを用いて、合成すべき定常雑音モデルの継続
    時間長を算出する継続時間長算出手段と、スペクトルモ
    デルパラメータの量子化インデクスを用いて前記スペク
    トルモデルパラメータを復号するスペクトルモデルパラ
    メータ復号手段と、生成された前記定常雑音モデルの遷
    移系列に関する情報、算出された前記継続時間長、前記
    スペクトルモデルパラメータ、および、生成された乱数
    位相を用いて、合成すべきスペクトル時系列を生成する
    スペクトル生成手段と、生成されたスペクトルを時間領
    域の信号に変換する逆周波数変換手段と、を具備するこ
    とを特徴とする請求項8に記載の雑音信号合成装置。
  10. 【請求項10】 請求項7に記載の雑音信号分析装置を
    用いて、音声信号の無音区間における雑音信号の符号化
    を行うことを特徴とする音声符号化装置。
  11. 【請求項11】 請求項8または請求項9に記載の雑音
    信号合成装置を用いて、音声信号の無音区間における雑
    音信号の復号を行うことを特徴とする音声復号装置。
  12. 【請求項12】 雑音信号を周波数領域の信号に変換す
    ることにより、前記雑音信号のスペクトルを算出する周
    波数変換工程と、定常雑音モデルに対するスペクトルに
    関する統計的情報を記憶する記憶工程と、前記複数の定
    常雑音モデルのうち、前記雑音信号のスペクトルに対応
    する定常雑音モデルを選択する選択工程と、選択された
    モデルの系列を用いて、振幅スペクトル時系列に関する
    統計的情報および前記振幅スペクトル時系列の継続時間
    長に関する統計的情報を含む定常雑音モデルに関する統
    計的情報と、前記定常雑音モデル間の遷移に関する統計
    的情報とを生成する分析工程と、を具備することを特徴
    とする雑音信号分析方法。
  13. 【請求項13】 請求項12に記載の雑音信号分析方法
    により生成された統計的情報における定常雑音モデル間
    の遷移に関する統計的情報を用いて、定常雑音モデルの
    遷移系列に関する情報を生成する遷移系列生成工程と、
    前記統計的情報における定常雑音モデルに関する統計的
    情報を用いて、合成すべき定常雑音モデルの継続時間長
    を算出する継続時間長算出工程と、定常雑音モデルに対
    するスペクトルに関する統計的情報を記憶する記憶工程
    と、生成された前記定常雑音モデルの遷移系列に関する
    情報、算出された前記継続時間長、および、生成された
    乱数位相を用いて、合成すべきスペクトル時系列を生成
    するスペクトル生成工程と、生成されたスペクトルを時
    間領域の信号に変換する逆周波数変換工程と、を具備す
    ることを特徴とする雑音信号合成方法。
  14. 【請求項14】 雑音信号を周波数領域の信号に変換す
    ることにより前記雑音信号のスペクトルを算出する周波
    数変換工程と、定常雑音モデルの振幅スペクトル時系列
    に関する統計的情報であるスペクトルモデルパラメータ
    の算出と量子化を行うスペクトルモデルパラメータ算出
    ・量子化工程と、前記定常雑音モデルの振幅スペクトル
    時系列の継続時間長に関する統計的情報および前記定常
    雑音モデル間の遷移に関する統計的情報の算出と量子化
    を行う継続長モデル・遷移確率算出・量子化工程と、を
    具備し、 前記スペクトルモデルパラメータ算出・量子化工程は、
    前記周波数変換手段により得られた入力雑音信号の振幅
    スペクトルに対してパワの正規化を行うパワ正規化工程
    と、雑音信号を表す振幅スペクトルの代表ベクトルの集
    合を記憶する記憶工程と、前記パワ正規化工程により得
    られたパワ正規化振幅スペクトルに対して、前記記憶工
    程により記憶されている代表ベクトル集合を用いてクラ
    スタ化を行うクラスタ化工程と、入力雑音信号のモデル
    化区間単位で選択頻度の高い上位複数個のクラスタを選
    択し、それらの選択されたクラスタに属する入力振幅ス
    ペクトルの平均スペクトルをクラスタ毎に算出するクラ
    スタ別平均スペクトル算出工程と、入力雑音信号のモデ
    ル化区間の平均パワを算出し、その量子化を行うモデル
    化区間平均パワ量子化工程と、前記クラスタ別平均スペ
    クトル算出工程により得られたクラスタ別平均スペクト
    ルおよびモデル化区間平均パワ量子化工程により得られ
    た量子化されたモデル化区間平均パワを用いて、クラス
    タ毎の誤差スペクトルとモデル化区間平均パワに対する
    パワ補正値の量子化を行う、誤差スペクトル・パワ補正
    値量子化工程と、を具備し、 前記スペクトルモデルパラメータ算出・量子化工程によ
    り得られた、選択されたクラスタに対応する代表ベクト
    ル、モデル化区間平均パワ、誤差スペクトルおよびパワ
    補正値を含むスペクトルモデルパラメータの量子化イン
    デクス、および継続長モデル・遷移確率算出・量子化工
    程により得られた継続時間長に関する統計的情報および
    雑音モデル間の遷移に関する統計的情報の量子化インデ
    クスを出力することを特徴とする雑音信号分析方法。
  15. 【請求項15】 請求項14に記載の雑音信号分析方法
    により生成された統計的情報の量子化インデクスを入力
    する工程と、定常雑音モデル間の遷移に関する統計的情
    報の量子化インデクスを用いて、定常雑音モデルの遷移
    系列に関する情報を生成する遷移系列生成工程と、前記
    継続時間長に関する統計的情報の量子化インデクスを用
    いて、合成すべき定常雑音モデルの継続時間長を算出す
    る継続時間長算出工程と、スペクトルモデルパラメータ
    の量子化インデクスを用いて前記スペクトルモデルパラ
    メータを復号するスペクトルモデルパラメータ復号工程
    と、生成された前記定常雑音モデルの遷移系列に関する
    情報、算出された前記継続時間長、前記スペクトルモデ
    ルパラメータ、および、生成された乱数位相を用いて、
    合成すべきスペクトル時系列を生成するスペクトル生成
    工程と、生成されたスペクトルを時間領域の信号に変換
    する逆周波数変換工程と、を具備することを特徴とする
    雑音信号合成方法。
JP2001070148A 2000-09-06 2001-03-13 雑音符号化装置、雑音復号装置、雑音符号化方法および雑音復号方法 Expired - Fee Related JP3670217B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2001070148A JP3670217B2 (ja) 2000-09-06 2001-03-13 雑音符号化装置、雑音復号装置、雑音符号化方法および雑音復号方法
PCT/JP2001/007630 WO2002021091A1 (fr) 2000-09-06 2001-09-04 Analyseur de signal de bruit, synthetiseur de signal de bruit, procede d'analyse de signal de bruit et procede de synthese de signal de bruit
US10/129,076 US6934650B2 (en) 2000-09-06 2001-09-04 Noise signal analysis apparatus, noise signal synthesis apparatus, noise signal analysis method and noise signal synthesis method
AU2001282616A AU2001282616A1 (en) 2000-09-06 2001-09-04 Noise signal analyzer, noise signal synthesizer, noise signal analyzing method, and noise signal synthesizing method
EP01961335A EP1258715B1 (en) 2000-09-06 2001-09-04 Noise signal analyzer, noise signal synthesizer, noise signal analyzing method, and noise signal synthesizing method

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2000270588 2000-09-06
JP2000-270588 2000-09-06
JP2001070148A JP3670217B2 (ja) 2000-09-06 2001-03-13 雑音符号化装置、雑音復号装置、雑音符号化方法および雑音復号方法

Publications (2)

Publication Number Publication Date
JP2002156999A true JP2002156999A (ja) 2002-05-31
JP3670217B2 JP3670217B2 (ja) 2005-07-13

Family

ID=26599385

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001070148A Expired - Fee Related JP3670217B2 (ja) 2000-09-06 2001-03-13 雑音符号化装置、雑音復号装置、雑音符号化方法および雑音復号方法

Country Status (5)

Country Link
US (1) US6934650B2 (ja)
EP (1) EP1258715B1 (ja)
JP (1) JP3670217B2 (ja)
AU (1) AU2001282616A1 (ja)
WO (1) WO2002021091A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004029674A (ja) * 2002-06-28 2004-01-29 Matsushita Electric Ind Co Ltd 雑音信号符号化装置及び雑音信号復号化装置
JP2009522914A (ja) * 2006-01-06 2009-06-11 リアルネットワークス アジア パシフィック カンパニー リミテッド 通信網を介して加入者端末機に送信されるオーディオ信号の出力品質改善のためのオーディオ信号の処理方法およびこの方法を採用したオーディオ信号処理装置
JP2013088658A (ja) * 2011-10-19 2013-05-13 Olympus Corp 顕微鏡装置

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7171356B2 (en) * 2002-06-28 2007-01-30 Intel Corporation Low-power noise characterization over a distributed speech recognition channel
ES2634511T3 (es) * 2004-07-23 2017-09-28 Iii Holdings 12, Llc Aparato de codificación de audio y procedimiento de codificación de audio
CN1815550A (zh) * 2005-02-01 2006-08-09 松下电器产业株式会社 可识别环境中的语音与非语音的方法及系统
CN1953052B (zh) * 2005-10-20 2010-09-08 株式会社东芝 训练时长预测模型、时长预测和语音合成的方法及装置
US20080312916A1 (en) * 2007-06-15 2008-12-18 Mr. Alon Konchitsky Receiver Intelligibility Enhancement System
US8190440B2 (en) * 2008-02-29 2012-05-29 Broadcom Corporation Sub-band codec with native voice activity detection
EP2151821B1 (en) 2008-08-07 2011-12-14 Nuance Communications, Inc. Noise-reduction processing of speech signals
US10066962B2 (en) 2013-07-01 2018-09-04 Battelle Energy Alliance, Llc Apparatus, system, and method for sensor authentication
CN113066472A (zh) * 2019-12-13 2021-07-02 科大讯飞股份有限公司 合成语音处理方法及相关装置

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2102254B (en) * 1981-05-11 1985-08-07 Kokusai Denshin Denwa Co Ltd A speech analysis-synthesis system
US4720802A (en) * 1983-07-26 1988-01-19 Lear Siegler Noise compensation arrangement
US4897878A (en) * 1985-08-26 1990-01-30 Itt Corporation Noise compensation in speech recognition apparatus
US4852181A (en) * 1985-09-26 1989-07-25 Oki Electric Industry Co., Ltd. Speech recognition for recognizing the catagory of an input speech pattern
JPH0636158B2 (ja) * 1986-12-04 1994-05-11 沖電気工業株式会社 音声分析合成方法及び装置
EP0310636B1 (en) 1987-04-03 1992-09-09 AT&T Corp. Distance measurement control of a multiple detector system
ATE82426T1 (de) 1987-04-03 1992-11-15 American Telephone & Telegraph Adaptive multivariable analyseeinrichtung.
US5761639A (en) * 1989-03-13 1998-06-02 Kabushiki Kaisha Toshiba Method and apparatus for time series signal recognition with signal variation proof learning
US5148489A (en) * 1990-02-28 1992-09-15 Sri International Method for spectral estimation to improve noise robustness for speech recognition
US5465317A (en) * 1993-05-18 1995-11-07 International Business Machines Corporation Speech recognition system with improved rejection of words and sounds not in the system vocabulary
WO1995012920A1 (fr) * 1993-11-04 1995-05-11 Sony Corporation Codeur de signaux, decodeur de signaux, support d'enregistrement et procede de codage de signaux
US5774846A (en) * 1994-12-19 1998-06-30 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
JP3522012B2 (ja) 1995-08-23 2004-04-26 沖電気工業株式会社 コード励振線形予測符号化装置
US5794199A (en) 1996-01-29 1998-08-11 Texas Instruments Incorporated Method and system for improved discontinuous speech transmission
JP3866793B2 (ja) 1996-05-21 2007-01-10 ヒューレット・パッカード・カンパニー ネットワークシステム
SE507370C2 (sv) * 1996-09-13 1998-05-18 Ericsson Telefon Ab L M Metod och anordning för att alstra komfortbrus i linjärprediktiv talavkodare
JP4006770B2 (ja) 1996-11-21 2007-11-14 松下電器産業株式会社 ノイズ推定装置、ノイズ削減装置、ノイズ推定方法、及びノイズ削減方法
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
JP3464371B2 (ja) 1996-11-15 2003-11-10 ノキア モービル フォーンズ リミテッド 不連続伝送中に快適雑音を発生させる改善された方法
US5924065A (en) * 1997-06-16 1999-07-13 Digital Equipment Corporation Environmently compensated speech processing
US6144937A (en) * 1997-07-23 2000-11-07 Texas Instruments Incorporated Noise suppression of speech by signal processing including applying a transform to time domain input sequences of digital signals representing audio information
JP4216364B2 (ja) 1997-08-29 2009-01-28 株式会社東芝 音声符号化/復号化方法および音声信号の成分分離方法
JP3249457B2 (ja) 1997-11-28 2002-01-21 沖電気工業株式会社 ディジタル通信用音声送受信装置
US6182033B1 (en) * 1998-01-09 2001-01-30 At&T Corp. Modular approach to speech enhancement with an application to speech coding
US6453285B1 (en) * 1998-08-21 2002-09-17 Polycom, Inc. Speech activity detector for use in noise reduction system, and methods therefor
US20020116196A1 (en) * 1998-11-12 2002-08-22 Tran Bao Q. Speech recognizer

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004029674A (ja) * 2002-06-28 2004-01-29 Matsushita Electric Ind Co Ltd 雑音信号符号化装置及び雑音信号復号化装置
JP2009522914A (ja) * 2006-01-06 2009-06-11 リアルネットワークス アジア パシフィック カンパニー リミテッド 通信網を介して加入者端末機に送信されるオーディオ信号の出力品質改善のためのオーディオ信号の処理方法およびこの方法を採用したオーディオ信号処理装置
US8145479B2 (en) 2006-01-06 2012-03-27 Realnetworks, Inc. Improving the quality of output audio signal,transferred as coded speech to subscriber's terminal over a network, by speech coder and decoder tandem pre-processing
US8359198B2 (en) 2006-01-06 2013-01-22 Intel Corporation Pre-processing and speech codec encoding of ring-back audio signals transmitted over a communication network to a subscriber terminal
US8719013B2 (en) 2006-01-06 2014-05-06 Intel Corporation Pre-processing and encoding of audio signals transmitted over a communication network to a subscriber terminal
JP2013088658A (ja) * 2011-10-19 2013-05-13 Olympus Corp 顕微鏡装置

Also Published As

Publication number Publication date
EP1258715A1 (en) 2002-11-20
AU2001282616A1 (en) 2002-03-22
EP1258715A4 (en) 2005-10-12
US6934650B2 (en) 2005-08-23
JP3670217B2 (ja) 2005-07-13
US20020165681A1 (en) 2002-11-07
WO2002021091A1 (fr) 2002-03-14
EP1258715B1 (en) 2008-01-30

Similar Documents

Publication Publication Date Title
US7996233B2 (en) Acoustic coding of an enhancement frame having a shorter time length than a base frame
JP5343098B2 (ja) スーパーフレーム構造のlpcハーモニックボコーダ
US7599833B2 (en) Apparatus and method for coding residual signals of audio signals into a frequency domain and apparatus and method for decoding the same
CN101496098B (zh) 用于以与音频信号相关联的帧修改窗口的系统及方法
KR101171098B1 (ko) 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
KR101435893B1 (ko) 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치
WO2004097796A1 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
WO2006001218A1 (ja) 音声符号化装置、音声復号化装置、およびこれらの方法
JP3344962B2 (ja) オーディオ信号符号化装置、及びオーディオ信号復号化装置
WO2002043052A1 (en) Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound
JP3670217B2 (ja) 雑音符号化装置、雑音復号装置、雑音符号化方法および雑音復号方法
JP4603485B2 (ja) 音声・楽音符号化装置及び音声・楽音符号化方法
JP3344944B2 (ja) オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法
US20090210219A1 (en) Apparatus and method for coding and decoding residual signal
KR101403340B1 (ko) 변환 부호화 방법 및 장치
US8000975B2 (en) User adjustment of signal parameters of coded transient, sinusoidal and noise components of parametrically-coded audio before decoding
KR102052144B1 (ko) 음성 신호의 대역 선택적 양자화 방법 및 장치
JP3297749B2 (ja) 符号化方法
JP4578145B2 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JP2006047561A (ja) オーディオ信号符号化装置およびオーディオ信号復号化装置
JPH0990989A (ja) 変換符号化方法および変換復号化方法
JPH10111700A (ja) 音声圧縮符号化方法および音声圧縮符号化装置
JP4327420B2 (ja) オーディオ信号符号化方法、及びオーディオ信号復号化方法
JP2002073097A (ja) Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040330

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040531

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20040520

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040816

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040816

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20040816

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050412

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050413

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090422

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100422

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110422

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110422

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120422

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130422

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130422

Year of fee payment: 8

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees