JP2002140099A - 音声復号化装置 - Google Patents
音声復号化装置Info
- Publication number
- JP2002140099A JP2002140099A JP2000337805A JP2000337805A JP2002140099A JP 2002140099 A JP2002140099 A JP 2002140099A JP 2000337805 A JP2000337805 A JP 2000337805A JP 2000337805 A JP2000337805 A JP 2000337805A JP 2002140099 A JP2002140099 A JP 2002140099A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- circuit
- sound source
- source signal
- spectrum parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 72
- 238000001228 spectrum Methods 0.000 claims abstract description 68
- 238000009499 grossing Methods 0.000 claims abstract description 62
- 238000001914 filtration Methods 0.000 claims abstract description 6
- 238000004364 calculation method Methods 0.000 claims description 54
- 230000015572 biosynthetic process Effects 0.000 claims description 45
- 238000003786 synthesis reaction Methods 0.000 claims description 45
- 230000003595 spectral effect Effects 0.000 claims description 22
- 230000005284 excitation Effects 0.000 claims description 10
- 230000002194 synthesizing effect Effects 0.000 claims description 4
- 230000006866 deterioration Effects 0.000 abstract description 4
- 238000000034 method Methods 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 238000012805 post-processing Methods 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 101000622137 Homo sapiens P-selectin Proteins 0.000 description 1
- 102100023472 P-selectin Human genes 0.000 description 1
- 101000873420 Simian virus 40 SV40 early leader protein Proteins 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0012—Smoothing of parameters of the decoder interpolation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
符号化された背景雑音信号が重畳された音声信号を、少
ない演算量で劣化を抑制して復号化する。 【解決手段】 再生音声信号を用いてスペクトルパラメ
ータを計算するスペクトルパラメータ計算回路10と、
スペクトルパラメータとを用いて再生音声信号を逆フィ
ルタリングすることにより音源信号を計算する逆フィル
タ回路20と、音源信号のRMSとスペクトルパラメー
タとの少なくとも1つを時間方向に平滑化する平滑化回
路30と、平滑化回路30から出力されたスペクトルパ
ラメータを用いて合成フィルタを構成し、平滑化回路3
0から出力された音源信号を合成して出力する合成フィ
ルタ回路40と、再生音声信号のモードを判別するモー
ド判別回路50とを設け、逆フィルタ回路20、平滑化
回路30及び合成フィルタ回路40を再生音声信号のモ
ードに基づいて動作させる。
Description
する音声復号化装置に関し、特に、低いビットレートで
符号化された音声信号に含まれる背景雑音信号を良好に
復号化することができる音声復号化装置に関する。
ては、例えば、M.Schroeder and B.Atal 氏による論文
“Code-excited linear prediction: High quality spe
ech atvery low bit rates”(Proc. ICASSP, pp.937-9
40, 1985年)(以下、文献1と称する)や、Kleijn 氏
らによる論文“Improved speech quality and efficien
tvector quantization in SELP”(Proc. ICASSP, pp.1
55-158, 1988年)(以下、文献2と称する)等に記載さ
れているCELP(Code Excited Linear Predictive C
oding)が知られている。
ず、音声信号のフレーム毎(例えば20ms)に線形予
測(LPC:Linear Predictive Coding)分析を用い
て、音声信号のスペクトル特性を表すスペクトルパラメ
ータを抽出する。
(例えば5ms)に分割し、サブフレーム毎に過去の音
源信号に基づいて、適応コードブックにおけるパラメー
タ(ピッチ周期に対応する遅延パラメータとゲインパラ
メータ)を抽出し、適応コードブックによりサブフレー
ムの音声信号をピッチ予測する。
対して、予め決められた種類の雑音信号からなる音源コ
ードブック(ベクトル量子化コードブック)から最適な
音源コードベクトルを選択し、最適なゲインを計算する
ことにより、音源信号を量子化する。なお、音源コード
ベクトルの選択においては、選択した雑音信号により合
成した信号と残差信号との誤差電力を最小化するような
音源コードベクトルを選択する。
種類を表すインデクスとゲイン、並びにスペクトルパラ
メータと適応コードブックのパラメータをマルチプレク
サ部にて組み合わせて伝送する。
クトルを探索する際に必要となる演算量を低減する方法
として、種々のものが提案されており、その1つとし
て、例えば、C.Laflamme らによる論文“16 kbps wideb
and speech coding techniquebased on algebraic CEL
P”(Proc. ICASSP, pp. 13-16, 1991)(以下、文献3
と称する)に記載された、ACELP(Argebraic Code
Excited Linear Prediction)方式がある。
が複数個のパルスで表され、各パルスの位置が予め決め
られたビット数で表されて伝送されるが、各パルスの振
幅が+1.0もしくは−1.0に限定されているため、
パルス探索の演算量を大幅に低減することができる。
たような音声信号を符号化する方式においては、符号化
ビットレートを例えば8kb/s以下に削減すると、特
に、音声信号に背景雑音信号が重畳している場合に、背
景雑音信号の音質が劣化して全体の音質が劣化するとい
う問題点がある。この問題点は、特に、携帯電話等で音
声符号化を使用する場合に顕著に生じてしまう。
においては、符号化ビットレートを削減した場合、音源
コードブックのビット数が低減し、波形の再現精度が低
下してしまう。音声信号のように波形の相関の高い信号
においては波形の再現精度の低下はそれほど顕著ではな
いが、背景雑音信号のように相関が低い信号に対して
は、再現精度の低下が顕著になってしまう。
いては、音源信号がパルスの組み合わせで表されている
ため、音声信号に対してはモデルの整合性が高く良好な
音質を得ることができるものの、符号化ビットレートが
低い場合に、パルスの個数が充分でないために、符号化
音声の背景雑音部分の音質が極めて劣化してしまうとい
問題点がある。
スがピッチの開始点であるピッチパルスの近辺に集中す
るために少ない個数のパルスで効率的に表すことができ
るものの、背景雑音のようなランダム信号に対しては、
パルスをランダムに立てる必要があるため、少ない個数
のパルスでは背景雑音を良好に表すことは困難であり、
ビットレートが低減されてパルスの個数が削減された場
合に背景雑音に対する音質が急激に劣化してしまうこと
に起因するものである。
においても、上述したような符号化方式にて符号化され
た背景雑音信号が重畳された音声信号を、少ない演算量
で劣化を抑制して復号化することができる音声復号化装
置を提供することを目的とする。
の本発明は、符号化された音声信号を復号化する音声復
号化装置において、復号化された再生音声信号が入力さ
れ、該再生音声信号を用いてスペクトルパラメータを計
算するスペクトルパラメータ計算回路と、前記再生音声
信号と前記スペクトルパラメータ計算回路にて計算され
たスペクトルパラメータとを用いて音源信号を計算する
音源信号計算手段と、前記音源信号計算手段にて計算さ
れた音源信号のレベルと前記スペクトルパラメータ計算
回路にて計算されたスペクトルパラメータとのうちの少
なくとも1つを時間方向に平滑化して両者を出力する平
滑化回路と、前記平滑化回路から出力されたスペクトル
パラメータを用いて合成フィルタを構成し、前記平滑化
回路から出力された音源信号を前記合成フィルタにて合
成し、音声信号として出力する合成フィルタ回路とを有
し、前記音源信号計算手段、前記平滑化回路及び前記合
成フィルタ回路は、予め決められた条件下でのみ動作す
ることを特徴とする。
該特徴量に基づいて前記再生音声信号のモードを判別す
るモード判別回路を有し、前記音源信号計算手段、前記
平滑化回路及び前記合成フィルタ回路は、前記モード判
別回路にて前記再生音声信号が予め決められたモードで
あると判別された場合のみ動作することを特徴とする。
回路及び前記合成フィルタ回路は、前記モード判別回路
にて前記再生音声信号が無音状態であると判別された場
合のみ動作することを特徴とする。
回路及び前記合成フィルタ回路は、前記モード判別回路
にて前記再生音声信号が無声音状態であると判別された
場合のみ動作することを特徴とする。
音声復号化装置において、復号化された再生音声信号が
入力され、該再生音声信号を用いてスペクトルパラメー
タを計算するスペクトルパラメータ計算回路と、前記再
生音声信号と前記スペクトルパラメータ計算回路にて計
算されたスペクトルパラメータとを用いて音源信号を計
算する音源信号計算手段と、前記再生音声信号または前
記音源信号計算手段にて計算された音源信号からピッチ
周期を計算し、該ピッチ周期を用いてピッチ予測を行い
ピッチ予測信号を計算するとともに、前記音源信号から
前記ピッチ予測信号を減算することにより残差信号を求
めるピッチ予測回路と、前記ピッチ予測回路にて計算さ
れたピッチ予測信号と残差信号とのうち少なくとも1つ
のゲインを求めるゲイン計算回路と、前記前記スペクト
ルパラメータ計算回路にて計算されたスペクトルパラメ
ータと前記ゲイン計算回路にて計算されたゲインとのう
ち少なくとも1つを時間方向に平滑化して両者を出力す
る平滑化回路と、前記平滑化回路から出力されたスペク
トルパラメータを用いて合成フィルタを構成し、前記平
滑化回路から出力されたゲイン、並びに、前記ピッチ予
測信号及び前記残差信号から音源信号を作成し、該音源
信号を前記合成フィルタにて合成して音声信号として出
力する合成フィルタ回路とを有することを特徴とする。
クトルパラメータ計算回路にて計算されたスペクトルパ
ラメータを用いて前記再生音声信号を逆フィルタリング
することにより音源信号を計算することを特徴とする。
おいては、まず、スペクトルパラメータ計算回路におい
て、復号化された再生音声信号を用いてスペクトルパラ
メータが計算されるとともに、モード判別回路におい
て、再生音声信号の特徴量が求められ、該特徴量に基づ
いて再生音声信号のモードが判別される。スペクトルパ
ラメータ計算回路にて計算されたスペクトルパラメータ
は、音源信号計算手段に入力され、音源信号計算手段に
おいて、スペクトルパラメータ計算回路にて計算された
スペクトルパラメータを用いて再生音声信号を逆フィル
タリングすることにより音源信号が計算され、計算され
た音源信号は平滑化回路に入力される。平滑化回路にお
いては、音源信号計算手段にて計算された音源信号のレ
ベルとスペクトルパラメータ計算回路にて計算されたス
ペクトルパラメータとのうちの少なくとも1つが時間方
向に平滑化され、両者が出力される。その後、合成フィ
ルタ回路において、平滑化回路から出力されたスペクト
ルパラメータを用いて合成フィルタが構成され、平滑化
回路から出力された音源信号が合成フィルタにて合成さ
れ、音声信号として出力される。ここで、音源信号計算
手段、平滑化回路及び合成フィルタ回路は、モード判別
回路にて再生音声信号が予め決められたモード、例え
ば、無音状態あるいは無声音状態であると判別された場
合のみ動作する。
ルパラメータとのうちの少なくとも1つが時間方向に平
滑化され、平滑化されたものを用いて音声信号が再度合
成されているので、従来の音声復号化装置の構成を修正
することなく、完全な後処理として上述した一連の処理
を追加することにより、符号化ビットレートが低い場合
においても、背景雑音部におけるパラメータの局所的な
時間変動が抑制され、また、音源信号計算手段、平滑化
回路及び合成フィルタ回路が、モード判別回路にて再生
音声信号が予め決められたモード、例えば、無音状態あ
るいは無声音状態であると判別された場合のみ動作する
ので、音声区間に弊害を与えることなく、符号化ビット
レートが低い場合においても、背景雑音部におけるパラ
メータの局所的な時間変動が抑制される。
算手段にて計算された音源信号からピッチ周期を計算
し、該ピッチ周期を用いてピッチ予測を行いピッチ予測
信号を計算するとともに、前記音源信号から前記ピッチ
予測信号を減算することにより残差信号を求め、ピッチ
予測信号と残差信号とのうち少なくとも1つのゲインを
求め、平滑化回路において、スペクトルパラメータとゲ
インとのうち少なくとも1つを時間方向に平滑化し、合
成フィルタ回路において、平滑化回路から出力されたス
ペクトルパラメータを用いて合成フィルタを構成し、平
滑化回路から出力されたゲイン、並びに、ピッチ予測信
号及び残差信号から音源信号を作成し、該音源信号を合
成フィルタにて合成して音声信号として出力する場合
は、ゲイン、スペクトルパラメータとパラメータレベル
に分離して平滑化することにより、背景雑音部における
パラメータの局所的な時間変動が一層抑制される。
いて図面を参照して説明する。
声復号化装置の第1の実施の形態を示す図であり、復号
化された音声信号に対して後処理を行うセクションを示
す。
再生音声信号d(n)が入力され、再生音声信号d
(n)を用いて線形予測分析により予め決められた次数
のスペクトルパラメータαi(i=1,・・・,P:例
えばP=10次)を計算するスペクトルパラメータ計算
回路10と、再生音声信号d(n)とスペクトルパラメ
ータ計算回路10にて計算されたスペクトルパラメータ
αiとを用いて、再生音声信号d(n)を逆フィルタリ
ングし、それにより音源信号x(n)を計算する音源信
号計算手段である逆フィルタ回路20と、逆フィルタ回
路20にて計算された音源信号x(n)のRMSとスペ
クトルパラメータ計算回路10にて計算されたスペクト
ルパラメータαiとの少なくとも1つを時間方向に平滑
化して両者を出力する平滑化回路30と、平滑化回路3
0から出力されたスペクトルパラメータαiを用いて合
成フィルタを構成し、平滑化回路30から出力された音
源信号x(n)を合成フィルタにて合成し、音声信号と
して出力する合成フィルタ回路40とから構成されてい
る。
化装置における処理について説明する。
がスペクトルパラメータ計算回路10に入力されると、
スペクトルパラメータ計算回路10において、入力され
た再生音声信号d(n)を用いて線形予測分析により予
め決められた次数のスペクトルパラメータαiが計算さ
れる。なお、スペクトルパラメータαiの計算は、周知
のLPC分析や、Burg分析等を用いることにより行
われる。本形態においては、Burg分析を用いること
とする。Burg分析については、中溝著による“信号
解析とシステム同定”(コロナ社1988年刊)の82
〜87頁等に記載されている。
算されたスペクトルパラメータαiは、逆フィルタ回路
20及び平滑化回路30にそれぞれ入力される。
信号d(n)とスペクトルパラメータ計算回路10にて
計算されたスペクトルパラメータαiとを用いて、式
(1)に従って再生音声信号d(n)が逆フィルタリン
グされ、それにより音源信号x(n)が計算される。
ルタ回路20にて計算された音源信号x(n)のRMS
とスペクトルパラメータ計算回路10にて計算されたス
ペクトルパラメータαiとの少なくとも1つが時間方向
に平滑化され、両者が出力される。ここで、逆フィルタ
回路20にて計算された音源信号x(n)のRMS(R
MS(m))を平滑化する場合は、以下の式(2)に従
って行う。
にて計算されたスペクトルパラメータαiを平滑化する
場合は、以下の式(3)に従って行う。なお、本形態に
おいては、スペクトルパラメータαiの平滑化は、スペ
クトルパラメータαiを線形スペクトル(LSP)上に
て平滑化した後、スペクトルパラメータαi’に逆変換
することにより行う。スペクトルパラメータαiとLS
Pとの変換及び逆変換は、菅村他による論文“線スペク
トル対(LSP)音声分析合成方式による音声情報圧
縮”(電子通信学会論文誌、J64-A、pp.599-606、1981
年)に記載されている。
平滑化回路30から出力されたスペクトルパラメータα
iを用いて合成フィルタが構成され、平滑化回路30か
ら出力された音源信号x(n)が合成フィルタにて合成
され、音声信号として出力される。
声復号化装置の第2の実施の形態を示す図であり、復号
化された音声信号に対して後処理を行うセクションを示
す。
ものに対して、再生音声信号d(n)の特徴量を求め、
該特徴量に基づいて再生音声信号d(n)のモードを判
別し、判別結果を出力するモード判別回路50が新たに
設けられ、逆フィルタ回路20、平滑化回路30及び合
成フィルタ回路40が、モード判別回路50から出力さ
れた判別結果に基づいて、再生音声信号d(n)が予め
決められたモードである場合のみ動作するように構成さ
れている。
生音声信号d(n)が入力され、以下の式(4)に従っ
て再生音声信号d(n)の特徴量DTが求められる。
められた特徴量DTが予め決められたしきい値と比較さ
れ、それにより、再生音声信号d(n)のモードが判別
される。
逆フィルタ回路20、平滑化回路30及び合成フィルタ
回路40に入力され、逆フィルタ回路20、平滑化回路
300及び合成フィルタ回路40は、入力された判別結
果に基づいて再生音声信号d(n)が予め決められたモ
ード(例えば、無音状態、無声音状態等)の場合のみ、
第1の実施の形態にて説明したような動作を行い、ま
た、再生音声信号d(n)が他のモードである場合は動
作しない。
声復号化装置の第3の実施の形態を示す図であり、復号
化された音声信号に対して後処理を行うセクションを示
す。
ものに対して、再生音声信号d(n)または逆フィルタ
回路20にて計算された音源信号x(n)のいずれか一
方からピッチ周期Tを計算し、ピッチ周期Tを用いてピ
ッチ予測を行ってピッチ予測信号p(n)を計算すると
ともに、音源信号x(n)からピッチ予測信号p(n)
を減算し、残差信号e(n)を求めるピッチ予測回路6
0と、ピッチ予測回路60にて計算されたピッチ予測信
号p(n)と残差信号e(n)との少なくとも1つに対
してゲインを求め、該ゲイン、並びにピッチ予測信号p
(n)及び残差信号e(n)を平滑化回路30に対して
出力するゲイン計算回路70とが設けられ、平滑化回路
30が、スペクトルパラメータ計算回路10にて計算さ
れたスペクトルパラメータαiとゲイン計算回路70か
ら出力されたゲインとの少なくとも1つを時間方向に平
滑化し、当該スペクトルパラメータαi及びゲイン、並
びにピッチ予測信号p(n)及び残差信号e(n)を出
力し、合成フィルタ回路40が、平滑化回路30から出
力されたスペクトルパラメータαiを用いて合成フィル
タを構成し、平滑化回路30から出力されたゲイン、ピ
ッチ予測信号p(n)及び残差信号e(n)から音源信
号を作成し、該音源信号を合成フィルタにて合成して音
声信号として出力するように構成されている。
によって求められる特徴量DTの絶対値を最大化するピ
ッチ周期Tが計算され、さらに、ピッチ周期Tを用いて
ピッチ予測が行われ、ピッチ予測信号p(n)が計算さ
れる。また、音源信号x(n)からピッチ予測信号p
(n)が減算され、それにより、残差信号e(n)が求
められる。
ッチ予測回路60にて計算されたピッチ予測信号p
(n)と残差信号e(n)との少なくとも1つに対して
ゲインが求められ、求められたゲインが出力され、平滑
化回路30に入力される。
ラメータ計算回路10にて計算されたスペクトルパラメ
ータαiとゲイン計算回路70から出力されたゲインと
の少なくとも1つが時間方向に平滑化され、合成フィル
タ回路40に対して出力される。
回路30から出力されたスペクトルパラメータαiを用
いて合成フィルタが構成され、また、平滑化回路30か
ら出力されたゲイン、ピッチ予測信号p(n)及び残差
信号e(n)から音源信号が作成され、該音源信号が合
成フィルタにて合成されて音声信号として出力される。
態にて説明したものと同様である。
再生音声信号からスペクトルパラメータを計算し、さら
に逆フィルタリングにより音源信号を求め、音源信号の
RMS、スペクトルパラメータのうち少なくとも1つを
時間方向に平滑化したものを用いて、音声信号を合成し
直す構成としたため、従来の音声復号化装置の構成を修
正することなく、完全な後処理として処理を追加するこ
とより、符号化ビットレートが低い場合においても、背
景雑音部におけるパラメータの局所的な時間変動を抑制
することができ、音質的な劣化の少ない合成音声を提供
することができる。
合成フィルタ回路が、モード判別回路にて再生音声信号
が予め決められたモード、例えば、無音状態あるいは無
声音状態であると判別された場合のみ動作するため、音
声区間に弊害を与えることなく、符号化ビットレートが
低い場合においても、背景雑音部におけるパラメータの
局所的な時間変動を抑制することができる。
ピッチ予測信号を計算し、音源信号からピッチ予測信号
を減算し、残差信号を計算し、少なくとも1つのゲイン
を計算し、ゲインとスペクトルパラメータとのうち少な
くとも1つを時間方向に平滑化して音源信号を構成し、
音声信号を合成する構成としたものにおいては、ゲイ
ン、スペクトルパラメータとパラメータレベルとに分離
して平滑化することにより、背景雑音部におけるパラメ
ータの局所的な時間変動を一層抑制することができ、音
質的な劣化の少ない合成音声を提供することができる。
示す図である。
示す図である。
示す図である。
Claims (6)
- 【請求項1】 符号化された音声信号を復号化する音声
復号化装置において、 復号化された再生音声信号が入力され、該再生音声信号
を用いてスペクトルパラメータを計算するスペクトルパ
ラメータ計算回路と、 前記再生音声信号と前記スペクトルパラメータ計算回路
にて計算されたスペクトルパラメータとを用いて音源信
号を計算する音源信号計算手段と、 前記音源信号計算手段にて計算された音源信号のレベル
と前記スペクトルパラメータ計算回路にて計算されたス
ペクトルパラメータとのうちの少なくとも1つを時間方
向に平滑化して両者を出力する平滑化回路と、 前記平滑化回路から出力されたスペクトルパラメータを
用いて合成フィルタを構成し、前記平滑化回路から出力
された音源信号を前記合成フィルタにて合成し、音声信
号として出力する合成フィルタ回路とを有し、 前記音源信号計算手段、前記平滑化回路及び前記合成フ
ィルタ回路は、予め決められた条件下でのみ動作するこ
とを特徴とする音声復号化装置。 - 【請求項2】 請求項1に記載の音声復号化装置におい
て、 前記再生音声信号の特徴量を求め、該特徴量に基づいて
前記再生音声信号のモードを判別するモード判別回路を
有し、 前記音源信号計算手段、前記平滑化回路及び前記合成フ
ィルタ回路は、前記モード判別回路にて前記再生音声信
号が予め決められたモードであると判別された場合のみ
動作することを特徴とする音声復号化装置。 - 【請求項3】 請求項2に記載の音声復号化装置におい
て、 前記音源信号計算手段、前記平滑化回路及び前記合成フ
ィルタ回路は、前記モード判別回路にて前記再生音声信
号が無音状態であると判別された場合のみ動作すること
を特徴とする音声復号化装置。 - 【請求項4】 請求項2に記載の音声復号化装置におい
て、 前記音源信号計算手段、前記平滑化回路及び前記合成フ
ィルタ回路は、前記モード判別回路にて前記再生音声信
号が無声音状態であると判別された場合のみ動作するこ
とを特徴とする音声復号化装置。 - 【請求項5】 符号化された音声信号を復号化する音声
復号化装置において、 復号化された再生音声信号が入力され、該再生音声信号
を用いてスペクトルパラメータを計算するスペクトルパ
ラメータ計算回路と、 前記再生音声信号と前記スペクトルパラメータ計算回路
にて計算されたスペクトルパラメータとを用いて音源信
号を計算する音源信号計算手段と、 前記再生音声信号または前記音源信号計算手段にて計算
された音源信号からピッチ周期を計算し、該ピッチ周期
を用いてピッチ予測を行いピッチ予測信号を計算すると
ともに、前記音源信号から前記ピッチ予測信号を減算す
ることにより残差信号を求めるピッチ予測回路と、 前記ピッチ予測回路にて計算されたピッチ予測信号と残
差信号とのうち少なくとも1つのゲインを求めるゲイン
計算回路と、 前記前記スペクトルパラメータ計算回路にて計算された
スペクトルパラメータと前記ゲイン計算回路にて計算さ
れたゲインとのうち少なくとも1つを時間方向に平滑化
して両者を出力する平滑化回路と、 前記平滑化回路から出力されたスペクトルパラメータを
用いて合成フィルタを構成し、前記平滑化回路から出力
されたゲイン、並びに、前記ピッチ予測信号及び前記残
差信号から音源信号を作成し、該音源信号を前記合成フ
ィルタにて合成して音声信号として出力する合成フィル
タ回路とを有することを特徴とする音声復号化装置。 - 【請求項6】 請求項1乃至5のいずれか1項に記載の
音声復号化装置において、 前記音源信号計算手段は、前記スペクトルパラメータ計
算回路にて計算されたスペクトルパラメータを用いて前
記再生音声信号を逆フィルタリングすることにより音源
信号を計算することを特徴とする音声復号化装置。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000337805A JP3558031B2 (ja) | 2000-11-06 | 2000-11-06 | 音声復号化装置 |
US09/985,853 US7024354B2 (en) | 2000-11-06 | 2001-11-06 | Speech decoder capable of decoding background noise signal with high quality |
CNB011344997A CN1145144C (zh) | 2000-11-06 | 2001-11-06 | 对背景噪音信号进行高质量解码的语音解码器 |
DE60109111T DE60109111T2 (de) | 2000-11-06 | 2001-11-06 | Sprachdekoder zum hochqualitativen Dekodieren von Signalen mit Hintergrundrauschen |
EP01125496A EP1204092B1 (en) | 2000-11-06 | 2001-11-06 | Speech decoder capable of decoding background noise signal with high quality |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000337805A JP3558031B2 (ja) | 2000-11-06 | 2000-11-06 | 音声復号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002140099A true JP2002140099A (ja) | 2002-05-17 |
JP3558031B2 JP3558031B2 (ja) | 2004-08-25 |
Family
ID=18813128
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000337805A Expired - Fee Related JP3558031B2 (ja) | 2000-11-06 | 2000-11-06 | 音声復号化装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7024354B2 (ja) |
EP (1) | EP1204092B1 (ja) |
JP (1) | JP3558031B2 (ja) |
CN (1) | CN1145144C (ja) |
DE (1) | DE60109111T2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010520512A (ja) * | 2007-03-05 | 2010-06-10 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 定常的な背景雑音の平滑化を行うための方法及び装置 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8843378B2 (en) * | 2004-06-30 | 2014-09-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-channel synthesizer and method for generating a multi-channel output signal |
US7778826B2 (en) | 2005-01-13 | 2010-08-17 | Intel Corporation | Beamforming codebook generation system and associated methods |
KR100956877B1 (ko) * | 2005-04-01 | 2010-05-11 | 콸콤 인코포레이티드 | 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치 |
PT1875463T (pt) | 2005-04-22 | 2019-01-24 | Qualcomm Inc | Sistemas, métodos e aparelho para nivelamento de fator de ganho |
CN101266798B (zh) * | 2007-03-12 | 2011-06-15 | 华为技术有限公司 | 一种在语音解码器中进行增益平滑的方法及装置 |
US7822833B2 (en) * | 2008-04-30 | 2010-10-26 | Honeywell International Inc. | System for creating and validating configurations of offline field devices in a process control system |
US8731895B2 (en) * | 2008-05-20 | 2014-05-20 | Honeywell International Inc. | System and method for accessing and configuring field devices in a process control system |
US8108200B2 (en) * | 2008-05-20 | 2012-01-31 | Honeywell International Inc. | System and method for accessing and configuring field devices in a process control system using distributed control components |
US7983892B2 (en) * | 2008-05-20 | 2011-07-19 | Honeywell International Inc. | System and method for accessing and presenting health information for field devices in a process control system |
CN107369454B (zh) | 2014-03-21 | 2020-10-27 | 华为技术有限公司 | 语音频码流的解码方法及装置 |
US11714394B2 (en) * | 2018-09-28 | 2023-08-01 | Fisher-Rosemount Systems, Inc | Bulk commissioning of field devices within a process plant |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01267700A (ja) | 1988-04-20 | 1989-10-25 | Nec Corp | 音声処理装置 |
US5732389A (en) * | 1995-06-07 | 1998-03-24 | Lucent Technologies Inc. | Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures |
GB9512284D0 (en) * | 1995-06-16 | 1995-08-16 | Nokia Mobile Phones Ltd | Speech Synthesiser |
JP2806308B2 (ja) * | 1995-06-30 | 1998-09-30 | 日本電気株式会社 | 音声復号化装置 |
JPH0954600A (ja) | 1995-08-14 | 1997-02-25 | Toshiba Corp | 音声符号化通信装置 |
JPH09244695A (ja) | 1996-03-04 | 1997-09-19 | Kobe Steel Ltd | 音声符号化装置及び復号化装置 |
GB2312360B (en) | 1996-04-12 | 2001-01-24 | Olympus Optical Co | Voice signal coding apparatus |
JP3270922B2 (ja) | 1996-09-09 | 2002-04-02 | 富士通株式会社 | 符号化,復号化方法及び符号化,復号化装置 |
JPH10171497A (ja) | 1996-12-12 | 1998-06-26 | Oki Electric Ind Co Ltd | 背景雑音除去装置 |
JPH10247098A (ja) * | 1997-03-04 | 1998-09-14 | Mitsubishi Electric Corp | 可変レート音声符号化方法、可変レート音声復号化方法 |
IL135630A0 (en) * | 1997-12-08 | 2001-05-20 | Mitsubishi Electric Corp | Method and apparatus for processing sound signal |
JPH11175083A (ja) | 1997-12-16 | 1999-07-02 | Mitsubishi Electric Corp | 雑音らしさ算出方法および雑音らしさ算出装置 |
GB9811019D0 (en) * | 1998-05-21 | 1998-07-22 | Univ Surrey | Speech coders |
JP4308345B2 (ja) * | 1998-08-21 | 2009-08-05 | パナソニック株式会社 | マルチモード音声符号化装置及び復号化装置 |
US6556966B1 (en) * | 1998-08-24 | 2003-04-29 | Conexant Systems, Inc. | Codebook structure for changeable pulse multimode speech coding |
JP4295372B2 (ja) | 1998-09-11 | 2009-07-15 | パナソニック株式会社 | 音声符号化装置 |
JP3490324B2 (ja) | 1999-02-15 | 2004-01-26 | 日本電信電話株式会社 | 音響信号符号化装置、復号化装置、これらの方法、及びプログラム記録媒体 |
JP3478209B2 (ja) * | 1999-11-01 | 2003-12-15 | 日本電気株式会社 | 音声信号復号方法及び装置と音声信号符号化復号方法及び装置と記録媒体 |
-
2000
- 2000-11-06 JP JP2000337805A patent/JP3558031B2/ja not_active Expired - Fee Related
-
2001
- 2001-11-06 DE DE60109111T patent/DE60109111T2/de not_active Expired - Lifetime
- 2001-11-06 US US09/985,853 patent/US7024354B2/en not_active Expired - Lifetime
- 2001-11-06 CN CNB011344997A patent/CN1145144C/zh not_active Expired - Fee Related
- 2001-11-06 EP EP01125496A patent/EP1204092B1/en not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010520512A (ja) * | 2007-03-05 | 2010-06-10 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 定常的な背景雑音の平滑化を行うための方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
US20020087308A1 (en) | 2002-07-04 |
EP1204092A3 (en) | 2003-11-19 |
CN1145144C (zh) | 2004-04-07 |
JP3558031B2 (ja) | 2004-08-25 |
DE60109111D1 (de) | 2005-04-07 |
DE60109111T2 (de) | 2006-04-13 |
EP1204092A2 (en) | 2002-05-08 |
US7024354B2 (en) | 2006-04-04 |
CN1352451A (zh) | 2002-06-05 |
EP1204092B1 (en) | 2005-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3180762B2 (ja) | 音声符号化装置及び音声復号化装置 | |
JPH0990995A (ja) | 音声符号化装置 | |
JP3558031B2 (ja) | 音声復号化装置 | |
JP3582589B2 (ja) | 音声符号化装置及び音声復号化装置 | |
JP2000163096A (ja) | 音声符号化方法及び音声符号化装置 | |
JPH09160596A (ja) | 音声符号化装置 | |
JPH10143199A (ja) | 音声符号化方法および復号化方法 | |
JP2829978B2 (ja) | 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置 | |
JPH0782360B2 (ja) | 音声分析合成方法 | |
WO2000000963A1 (fr) | Codeur vocal | |
JP2001051699A (ja) | 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体 | |
JP3003531B2 (ja) | 音声符号化装置 | |
JP4438280B2 (ja) | トランスコーダ及び符号変換方法 | |
JP3144284B2 (ja) | 音声符号化装置 | |
JP3299099B2 (ja) | 音声符号化装置 | |
JP2000235400A (ja) | 音響信号符号化装置、復号化装置、これらの方法、及びプログラム記録媒体 | |
JP2001318698A (ja) | 音声符号化装置及び音声復号化装置 | |
JP3319396B2 (ja) | 音声符号化装置ならびに音声符号化復号化装置 | |
JPH0519795A (ja) | 音声の励振信号符号化・復号化方法 | |
JP2001142499A (ja) | 音声符号化装置ならびに音声復号化装置 | |
JP3552201B2 (ja) | 音声符号化方法および装置 | |
JP3984048B2 (ja) | 音声/音響信号の符号化方法及び電子装置 | |
JPH0519796A (ja) | 音声の励振信号符号化・復号化方法 | |
JP2004151423A (ja) | 帯域拡張装置及び方法 | |
JP2853170B2 (ja) | 音声符号化復号化方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040427 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040510 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 3558031 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090528 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100528 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110528 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110528 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120528 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120528 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130528 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140528 Year of fee payment: 10 |
|
LAPS | Cancellation because of no payment of annual fees |