JP2002140099A - 音声復号化装置 - Google Patents

音声復号化装置

Info

Publication number
JP2002140099A
JP2002140099A JP2000337805A JP2000337805A JP2002140099A JP 2002140099 A JP2002140099 A JP 2002140099A JP 2000337805 A JP2000337805 A JP 2000337805A JP 2000337805 A JP2000337805 A JP 2000337805A JP 2002140099 A JP2002140099 A JP 2002140099A
Authority
JP
Japan
Prior art keywords
signal
circuit
sound source
source signal
spectrum parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000337805A
Other languages
English (en)
Other versions
JP3558031B2 (ja
Inventor
Kazunori Ozawa
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2000337805A priority Critical patent/JP3558031B2/ja
Priority to US09/985,853 priority patent/US7024354B2/en
Priority to CNB011344997A priority patent/CN1145144C/zh
Priority to DE60109111T priority patent/DE60109111T2/de
Priority to EP01125496A priority patent/EP1204092B1/en
Publication of JP2002140099A publication Critical patent/JP2002140099A/ja
Application granted granted Critical
Publication of JP3558031B2 publication Critical patent/JP3558031B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0012Smoothing of parameters of the decoder interpolation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【課題】 符号化ビットレートが低い場合においても、
符号化された背景雑音信号が重畳された音声信号を、少
ない演算量で劣化を抑制して復号化する。 【解決手段】 再生音声信号を用いてスペクトルパラメ
ータを計算するスペクトルパラメータ計算回路10と、
スペクトルパラメータとを用いて再生音声信号を逆フィ
ルタリングすることにより音源信号を計算する逆フィル
タ回路20と、音源信号のRMSとスペクトルパラメー
タとの少なくとも1つを時間方向に平滑化する平滑化回
路30と、平滑化回路30から出力されたスペクトルパ
ラメータを用いて合成フィルタを構成し、平滑化回路3
0から出力された音源信号を合成して出力する合成フィ
ルタ回路40と、再生音声信号のモードを判別するモー
ド判別回路50とを設け、逆フィルタ回路20、平滑化
回路30及び合成フィルタ回路40を再生音声信号のモ
ードに基づいて動作させる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号を復号化
する音声復号化装置に関し、特に、低いビットレートで
符号化された音声信号に含まれる背景雑音信号を良好に
復号化することができる音声復号化装置に関する。
【0002】
【従来の技術】音声信号を高能率に符号化する方式とし
ては、例えば、M.Schroeder and B.Atal 氏による論文
“Code-excited linear prediction: High quality spe
ech atvery low bit rates”(Proc. ICASSP, pp.937-9
40, 1985年)(以下、文献1と称する)や、Kleijn 氏
らによる論文“Improved speech quality and efficien
tvector quantization in SELP”(Proc. ICASSP, pp.1
55-158, 1988年)(以下、文献2と称する)等に記載さ
れているCELP(Code Excited Linear Predictive C
oding)が知られている。
【0003】CELPにおいては、送信側において、ま
ず、音声信号のフレーム毎(例えば20ms)に線形予
測(LPC:Linear Predictive Coding)分析を用い
て、音声信号のスペクトル特性を表すスペクトルパラメ
ータを抽出する。
【0004】次に、各フレームをさらにサブフレーム
(例えば5ms)に分割し、サブフレーム毎に過去の音
源信号に基づいて、適応コードブックにおけるパラメー
タ(ピッチ周期に対応する遅延パラメータとゲインパラ
メータ)を抽出し、適応コードブックによりサブフレー
ムの音声信号をピッチ予測する。
【0005】次に、ピッチ予測により求めた音源信号に
対して、予め決められた種類の雑音信号からなる音源コ
ードブック(ベクトル量子化コードブック)から最適な
音源コードベクトルを選択し、最適なゲインを計算する
ことにより、音源信号を量子化する。なお、音源コード
ベクトルの選択においては、選択した雑音信号により合
成した信号と残差信号との誤差電力を最小化するような
音源コードベクトルを選択する。
【0006】その後、選択された音源コードベクトルの
種類を表すインデクスとゲイン、並びにスペクトルパラ
メータと適応コードブックのパラメータをマルチプレク
サ部にて組み合わせて伝送する。
【0007】また、音源コードブックから音源コードベ
クトルを探索する際に必要となる演算量を低減する方法
として、種々のものが提案されており、その1つとし
て、例えば、C.Laflamme らによる論文“16 kbps wideb
and speech coding techniquebased on algebraic CEL
P”(Proc. ICASSP, pp. 13-16, 1991)(以下、文献3
と称する)に記載された、ACELP(Argebraic Code
Excited Linear Prediction)方式がある。
【0008】このACELP方式においては、音源信号
が複数個のパルスで表され、各パルスの位置が予め決め
られたビット数で表されて伝送されるが、各パルスの振
幅が+1.0もしくは−1.0に限定されているため、
パルス探索の演算量を大幅に低減することができる。
【0009】
【発明が解決しようとする課題】しかしながら、上述し
たような音声信号を符号化する方式においては、符号化
ビットレートを例えば8kb/s以下に削減すると、特
に、音声信号に背景雑音信号が重畳している場合に、背
景雑音信号の音質が劣化して全体の音質が劣化するとい
う問題点がある。この問題点は、特に、携帯電話等で音
声符号化を使用する場合に顕著に生じてしまう。
【0010】文献1及び文献2に記載された符号化方式
においては、符号化ビットレートを削減した場合、音源
コードブックのビット数が低減し、波形の再現精度が低
下してしまう。音声信号のように波形の相関の高い信号
においては波形の再現精度の低下はそれほど顕著ではな
いが、背景雑音信号のように相関が低い信号に対して
は、再現精度の低下が顕著になってしまう。
【0011】また、文献3に記載された符号化方式にお
いては、音源信号がパルスの組み合わせで表されている
ため、音声信号に対してはモデルの整合性が高く良好な
音質を得ることができるものの、符号化ビットレートが
低い場合に、パルスの個数が充分でないために、符号化
音声の背景雑音部分の音質が極めて劣化してしまうとい
問題点がある。
【0012】この問題点は、音声の母音区間では、パル
スがピッチの開始点であるピッチパルスの近辺に集中す
るために少ない個数のパルスで効率的に表すことができ
るものの、背景雑音のようなランダム信号に対しては、
パルスをランダムに立てる必要があるため、少ない個数
のパルスでは背景雑音を良好に表すことは困難であり、
ビットレートが低減されてパルスの個数が削減された場
合に背景雑音に対する音質が急激に劣化してしまうこと
に起因するものである。
【0013】本発明は、符号化ビットレートが低い場合
においても、上述したような符号化方式にて符号化され
た背景雑音信号が重畳された音声信号を、少ない演算量
で劣化を抑制して復号化することができる音声復号化装
置を提供することを目的とする。
【0014】
【課題を解決するための手段】上記目的を達成するため
の本発明は、符号化された音声信号を復号化する音声復
号化装置において、復号化された再生音声信号が入力さ
れ、該再生音声信号を用いてスペクトルパラメータを計
算するスペクトルパラメータ計算回路と、前記再生音声
信号と前記スペクトルパラメータ計算回路にて計算され
たスペクトルパラメータとを用いて音源信号を計算する
音源信号計算手段と、前記音源信号計算手段にて計算さ
れた音源信号のレベルと前記スペクトルパラメータ計算
回路にて計算されたスペクトルパラメータとのうちの少
なくとも1つを時間方向に平滑化して両者を出力する平
滑化回路と、前記平滑化回路から出力されたスペクトル
パラメータを用いて合成フィルタを構成し、前記平滑化
回路から出力された音源信号を前記合成フィルタにて合
成し、音声信号として出力する合成フィルタ回路とを有
し、前記音源信号計算手段、前記平滑化回路及び前記合
成フィルタ回路は、予め決められた条件下でのみ動作す
ることを特徴とする。
【0015】また、前記再生音声信号の特徴量を求め、
該特徴量に基づいて前記再生音声信号のモードを判別す
るモード判別回路を有し、前記音源信号計算手段、前記
平滑化回路及び前記合成フィルタ回路は、前記モード判
別回路にて前記再生音声信号が予め決められたモードで
あると判別された場合のみ動作することを特徴とする。
【0016】また、前記音源信号計算手段、前記平滑化
回路及び前記合成フィルタ回路は、前記モード判別回路
にて前記再生音声信号が無音状態であると判別された場
合のみ動作することを特徴とする。
【0017】また、前記音源信号計算手段、前記平滑化
回路及び前記合成フィルタ回路は、前記モード判別回路
にて前記再生音声信号が無声音状態であると判別された
場合のみ動作することを特徴とする。
【0018】また、符号化された音声信号を復号化する
音声復号化装置において、復号化された再生音声信号が
入力され、該再生音声信号を用いてスペクトルパラメー
タを計算するスペクトルパラメータ計算回路と、前記再
生音声信号と前記スペクトルパラメータ計算回路にて計
算されたスペクトルパラメータとを用いて音源信号を計
算する音源信号計算手段と、前記再生音声信号または前
記音源信号計算手段にて計算された音源信号からピッチ
周期を計算し、該ピッチ周期を用いてピッチ予測を行い
ピッチ予測信号を計算するとともに、前記音源信号から
前記ピッチ予測信号を減算することにより残差信号を求
めるピッチ予測回路と、前記ピッチ予測回路にて計算さ
れたピッチ予測信号と残差信号とのうち少なくとも1つ
のゲインを求めるゲイン計算回路と、前記前記スペクト
ルパラメータ計算回路にて計算されたスペクトルパラメ
ータと前記ゲイン計算回路にて計算されたゲインとのう
ち少なくとも1つを時間方向に平滑化して両者を出力す
る平滑化回路と、前記平滑化回路から出力されたスペク
トルパラメータを用いて合成フィルタを構成し、前記平
滑化回路から出力されたゲイン、並びに、前記ピッチ予
測信号及び前記残差信号から音源信号を作成し、該音源
信号を前記合成フィルタにて合成して音声信号として出
力する合成フィルタ回路とを有することを特徴とする。
【0019】また、前記音源信号計算手段は、前記スペ
クトルパラメータ計算回路にて計算されたスペクトルパ
ラメータを用いて前記再生音声信号を逆フィルタリング
することにより音源信号を計算することを特徴とする。
【0020】(作用)上記のように構成された本発明に
おいては、まず、スペクトルパラメータ計算回路におい
て、復号化された再生音声信号を用いてスペクトルパラ
メータが計算されるとともに、モード判別回路におい
て、再生音声信号の特徴量が求められ、該特徴量に基づ
いて再生音声信号のモードが判別される。スペクトルパ
ラメータ計算回路にて計算されたスペクトルパラメータ
は、音源信号計算手段に入力され、音源信号計算手段に
おいて、スペクトルパラメータ計算回路にて計算された
スペクトルパラメータを用いて再生音声信号を逆フィル
タリングすることにより音源信号が計算され、計算され
た音源信号は平滑化回路に入力される。平滑化回路にお
いては、音源信号計算手段にて計算された音源信号のレ
ベルとスペクトルパラメータ計算回路にて計算されたス
ペクトルパラメータとのうちの少なくとも1つが時間方
向に平滑化され、両者が出力される。その後、合成フィ
ルタ回路において、平滑化回路から出力されたスペクト
ルパラメータを用いて合成フィルタが構成され、平滑化
回路から出力された音源信号が合成フィルタにて合成さ
れ、音声信号として出力される。ここで、音源信号計算
手段、平滑化回路及び合成フィルタ回路は、モード判別
回路にて再生音声信号が予め決められたモード、例え
ば、無音状態あるいは無声音状態であると判別された場
合のみ動作する。
【0021】このように、音源信号のレベルとスペクト
ルパラメータとのうちの少なくとも1つが時間方向に平
滑化され、平滑化されたものを用いて音声信号が再度合
成されているので、従来の音声復号化装置の構成を修正
することなく、完全な後処理として上述した一連の処理
を追加することにより、符号化ビットレートが低い場合
においても、背景雑音部におけるパラメータの局所的な
時間変動が抑制され、また、音源信号計算手段、平滑化
回路及び合成フィルタ回路が、モード判別回路にて再生
音声信号が予め決められたモード、例えば、無音状態あ
るいは無声音状態であると判別された場合のみ動作する
ので、音声区間に弊害を与えることなく、符号化ビット
レートが低い場合においても、背景雑音部におけるパラ
メータの局所的な時間変動が抑制される。
【0022】また、再生音声信号または前記音源信号計
算手段にて計算された音源信号からピッチ周期を計算
し、該ピッチ周期を用いてピッチ予測を行いピッチ予測
信号を計算するとともに、前記音源信号から前記ピッチ
予測信号を減算することにより残差信号を求め、ピッチ
予測信号と残差信号とのうち少なくとも1つのゲインを
求め、平滑化回路において、スペクトルパラメータとゲ
インとのうち少なくとも1つを時間方向に平滑化し、合
成フィルタ回路において、平滑化回路から出力されたス
ペクトルパラメータを用いて合成フィルタを構成し、平
滑化回路から出力されたゲイン、並びに、ピッチ予測信
号及び残差信号から音源信号を作成し、該音源信号を合
成フィルタにて合成して音声信号として出力する場合
は、ゲイン、スペクトルパラメータとパラメータレベル
に分離して平滑化することにより、背景雑音部における
パラメータの局所的な時間変動が一層抑制される。
【0023】
【発明の実施の形態】以下に、本発明の実施の形態につ
いて図面を参照して説明する。
【0024】(第1の実施の形態)図1は、本発明の音
声復号化装置の第1の実施の形態を示す図であり、復号
化された音声信号に対して後処理を行うセクションを示
す。
【0025】本形態は図1に示すように、復号化された
再生音声信号d(n)が入力され、再生音声信号d
(n)を用いて線形予測分析により予め決められた次数
のスペクトルパラメータαi(i=1,・・・,P:例
えばP=10次)を計算するスペクトルパラメータ計算
回路10と、再生音声信号d(n)とスペクトルパラメ
ータ計算回路10にて計算されたスペクトルパラメータ
αiとを用いて、再生音声信号d(n)を逆フィルタリ
ングし、それにより音源信号x(n)を計算する音源信
号計算手段である逆フィルタ回路20と、逆フィルタ回
路20にて計算された音源信号x(n)のRMSとスペ
クトルパラメータ計算回路10にて計算されたスペクト
ルパラメータαiとの少なくとも1つを時間方向に平滑
化して両者を出力する平滑化回路30と、平滑化回路3
0から出力されたスペクトルパラメータαiを用いて合
成フィルタを構成し、平滑化回路30から出力された音
源信号x(n)を合成フィルタにて合成し、音声信号と
して出力する合成フィルタ回路40とから構成されてい
る。
【0026】以下に、上記のように構成された音声復号
化装置における処理について説明する。
【0027】まず、復号化された再生音声信号d(n)
がスペクトルパラメータ計算回路10に入力されると、
スペクトルパラメータ計算回路10において、入力され
た再生音声信号d(n)を用いて線形予測分析により予
め決められた次数のスペクトルパラメータαiが計算さ
れる。なお、スペクトルパラメータαiの計算は、周知
のLPC分析や、Burg分析等を用いることにより行
われる。本形態においては、Burg分析を用いること
とする。Burg分析については、中溝著による“信号
解析とシステム同定”(コロナ社1988年刊)の82
〜87頁等に記載されている。
【0028】スペクトルパラメータ計算回路10にて計
算されたスペクトルパラメータαiは、逆フィルタ回路
20及び平滑化回路30にそれぞれ入力される。
【0029】逆フィルタ回路20においては、再生音声
信号d(n)とスペクトルパラメータ計算回路10にて
計算されたスペクトルパラメータαiとを用いて、式
(1)に従って再生音声信号d(n)が逆フィルタリン
グされ、それにより音源信号x(n)が計算される。
【0030】
【数1】
【0031】また、平滑化回路30においては、逆フィ
ルタ回路20にて計算された音源信号x(n)のRMS
とスペクトルパラメータ計算回路10にて計算されたス
ペクトルパラメータαiとの少なくとも1つが時間方向
に平滑化され、両者が出力される。ここで、逆フィルタ
回路20にて計算された音源信号x(n)のRMS(R
MS(m))を平滑化する場合は、以下の式(2)に従
って行う。
【0032】
【数2】
【0033】また、スペクトルパラメータ計算回路10
にて計算されたスペクトルパラメータαiを平滑化する
場合は、以下の式(3)に従って行う。なお、本形態に
おいては、スペクトルパラメータαiの平滑化は、スペ
クトルパラメータαiを線形スペクトル(LSP)上に
て平滑化した後、スペクトルパラメータαi’に逆変換
することにより行う。スペクトルパラメータαiとLS
Pとの変換及び逆変換は、菅村他による論文“線スペク
トル対(LSP)音声分析合成方式による音声情報圧
縮”(電子通信学会論文誌、J64-A、pp.599-606、1981
年)に記載されている。
【0034】
【数3】
【0035】その後、合成フィルタ回路40において、
平滑化回路30から出力されたスペクトルパラメータα
iを用いて合成フィルタが構成され、平滑化回路30か
ら出力された音源信号x(n)が合成フィルタにて合成
され、音声信号として出力される。
【0036】(第2の実施の形態)図2は、本発明の音
声復号化装置の第2の実施の形態を示す図であり、復号
化された音声信号に対して後処理を行うセクションを示
す。
【0037】本形態は図2に示すように、図1に示した
ものに対して、再生音声信号d(n)の特徴量を求め、
該特徴量に基づいて再生音声信号d(n)のモードを判
別し、判別結果を出力するモード判別回路50が新たに
設けられ、逆フィルタ回路20、平滑化回路30及び合
成フィルタ回路40が、モード判別回路50から出力さ
れた判別結果に基づいて、再生音声信号d(n)が予め
決められたモードである場合のみ動作するように構成さ
れている。
【0038】モード判別回路50においては、まず、再
生音声信号d(n)が入力され、以下の式(4)に従っ
て再生音声信号d(n)の特徴量DTが求められる。
【0039】
【数4】
【0040】その後、モード判別回路50において、求
められた特徴量DTが予め決められたしきい値と比較さ
れ、それにより、再生音声信号d(n)のモードが判別
される。
【0041】モード判別回路50における判別結果は、
逆フィルタ回路20、平滑化回路30及び合成フィルタ
回路40に入力され、逆フィルタ回路20、平滑化回路
300及び合成フィルタ回路40は、入力された判別結
果に基づいて再生音声信号d(n)が予め決められたモ
ード(例えば、無音状態、無声音状態等)の場合のみ、
第1の実施の形態にて説明したような動作を行い、ま
た、再生音声信号d(n)が他のモードである場合は動
作しない。
【0042】(第3の実施の形態)図3は、本発明の音
声復号化装置の第3の実施の形態を示す図であり、復号
化された音声信号に対して後処理を行うセクションを示
す。
【0043】本形態は図3に示すように、図1に示した
ものに対して、再生音声信号d(n)または逆フィルタ
回路20にて計算された音源信号x(n)のいずれか一
方からピッチ周期Tを計算し、ピッチ周期Tを用いてピ
ッチ予測を行ってピッチ予測信号p(n)を計算すると
ともに、音源信号x(n)からピッチ予測信号p(n)
を減算し、残差信号e(n)を求めるピッチ予測回路6
0と、ピッチ予測回路60にて計算されたピッチ予測信
号p(n)と残差信号e(n)との少なくとも1つに対
してゲインを求め、該ゲイン、並びにピッチ予測信号p
(n)及び残差信号e(n)を平滑化回路30に対して
出力するゲイン計算回路70とが設けられ、平滑化回路
30が、スペクトルパラメータ計算回路10にて計算さ
れたスペクトルパラメータαiとゲイン計算回路70か
ら出力されたゲインとの少なくとも1つを時間方向に平
滑化し、当該スペクトルパラメータαi及びゲイン、並
びにピッチ予測信号p(n)及び残差信号e(n)を出
力し、合成フィルタ回路40が、平滑化回路30から出
力されたスペクトルパラメータαiを用いて合成フィル
タを構成し、平滑化回路30から出力されたゲイン、ピ
ッチ予測信号p(n)及び残差信号e(n)から音源信
号を作成し、該音源信号を合成フィルタにて合成して音
声信号として出力するように構成されている。
【0044】ピッチ予測回路60においては、式(4)
によって求められる特徴量DTの絶対値を最大化するピ
ッチ周期Tが計算され、さらに、ピッチ周期Tを用いて
ピッチ予測が行われ、ピッチ予測信号p(n)が計算さ
れる。また、音源信号x(n)からピッチ予測信号p
(n)が減算され、それにより、残差信号e(n)が求
められる。
【0045】その後、ゲイン計算回路70において、ピ
ッチ予測回路60にて計算されたピッチ予測信号p
(n)と残差信号e(n)との少なくとも1つに対して
ゲインが求められ、求められたゲインが出力され、平滑
化回路30に入力される。
【0046】平滑化回路30においては、スペクトルパ
ラメータ計算回路10にて計算されたスペクトルパラメ
ータαiとゲイン計算回路70から出力されたゲインと
の少なくとも1つが時間方向に平滑化され、合成フィル
タ回路40に対して出力される。
【0047】合成フィルタ回路40においては、平滑化
回路30から出力されたスペクトルパラメータαiを用
いて合成フィルタが構成され、また、平滑化回路30か
ら出力されたゲイン、ピッチ予測信号p(n)及び残差
信号e(n)から音源信号が作成され、該音源信号が合
成フィルタにて合成されて音声信号として出力される。
【0048】その他の処理においては、第1の実施の形
態にて説明したものと同様である。
【0049】
【発明の効果】以上説明したように本発明においては、
再生音声信号からスペクトルパラメータを計算し、さら
に逆フィルタリングにより音源信号を求め、音源信号の
RMS、スペクトルパラメータのうち少なくとも1つを
時間方向に平滑化したものを用いて、音声信号を合成し
直す構成としたため、従来の音声復号化装置の構成を修
正することなく、完全な後処理として処理を追加するこ
とより、符号化ビットレートが低い場合においても、背
景雑音部におけるパラメータの局所的な時間変動を抑制
することができ、音質的な劣化の少ない合成音声を提供
することができる。
【0050】また、音源信号計算手段、平滑化回路及び
合成フィルタ回路が、モード判別回路にて再生音声信号
が予め決められたモード、例えば、無音状態あるいは無
声音状態であると判別された場合のみ動作するため、音
声区間に弊害を与えることなく、符号化ビットレートが
低い場合においても、背景雑音部におけるパラメータの
局所的な時間変動を抑制することができる。
【0051】また、音源信号からピッチ周期を計算し、
ピッチ予測信号を計算し、音源信号からピッチ予測信号
を減算し、残差信号を計算し、少なくとも1つのゲイン
を計算し、ゲインとスペクトルパラメータとのうち少な
くとも1つを時間方向に平滑化して音源信号を構成し、
音声信号を合成する構成としたものにおいては、ゲイ
ン、スペクトルパラメータとパラメータレベルとに分離
して平滑化することにより、背景雑音部におけるパラメ
ータの局所的な時間変動を一層抑制することができ、音
質的な劣化の少ない合成音声を提供することができる。
【図面の簡単な説明】
【図1】本発明の音声復号化装置の第1の実施の形態を
示す図である。
【図2】本発明の音声復号化装置の第2の実施の形態を
示す図である。
【図3】本発明の音声復号化装置の第3の実施の形態を
示す図である。
【符号の説明】
10 スペクトルパラメータ計算回路 20 逆フィルタ回路 30 平滑化回路 40 合成フィルタ回路 50 モード判別回路 60 ピッチ予測回路 70 ゲイン計算回路

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 符号化された音声信号を復号化する音声
    復号化装置において、 復号化された再生音声信号が入力され、該再生音声信号
    を用いてスペクトルパラメータを計算するスペクトルパ
    ラメータ計算回路と、 前記再生音声信号と前記スペクトルパラメータ計算回路
    にて計算されたスペクトルパラメータとを用いて音源信
    号を計算する音源信号計算手段と、 前記音源信号計算手段にて計算された音源信号のレベル
    と前記スペクトルパラメータ計算回路にて計算されたス
    ペクトルパラメータとのうちの少なくとも1つを時間方
    向に平滑化して両者を出力する平滑化回路と、 前記平滑化回路から出力されたスペクトルパラメータを
    用いて合成フィルタを構成し、前記平滑化回路から出力
    された音源信号を前記合成フィルタにて合成し、音声信
    号として出力する合成フィルタ回路とを有し、 前記音源信号計算手段、前記平滑化回路及び前記合成フ
    ィルタ回路は、予め決められた条件下でのみ動作するこ
    とを特徴とする音声復号化装置。
  2. 【請求項2】 請求項1に記載の音声復号化装置におい
    て、 前記再生音声信号の特徴量を求め、該特徴量に基づいて
    前記再生音声信号のモードを判別するモード判別回路を
    有し、 前記音源信号計算手段、前記平滑化回路及び前記合成フ
    ィルタ回路は、前記モード判別回路にて前記再生音声信
    号が予め決められたモードであると判別された場合のみ
    動作することを特徴とする音声復号化装置。
  3. 【請求項3】 請求項2に記載の音声復号化装置におい
    て、 前記音源信号計算手段、前記平滑化回路及び前記合成フ
    ィルタ回路は、前記モード判別回路にて前記再生音声信
    号が無音状態であると判別された場合のみ動作すること
    を特徴とする音声復号化装置。
  4. 【請求項4】 請求項2に記載の音声復号化装置におい
    て、 前記音源信号計算手段、前記平滑化回路及び前記合成フ
    ィルタ回路は、前記モード判別回路にて前記再生音声信
    号が無声音状態であると判別された場合のみ動作するこ
    とを特徴とする音声復号化装置。
  5. 【請求項5】 符号化された音声信号を復号化する音声
    復号化装置において、 復号化された再生音声信号が入力され、該再生音声信号
    を用いてスペクトルパラメータを計算するスペクトルパ
    ラメータ計算回路と、 前記再生音声信号と前記スペクトルパラメータ計算回路
    にて計算されたスペクトルパラメータとを用いて音源信
    号を計算する音源信号計算手段と、 前記再生音声信号または前記音源信号計算手段にて計算
    された音源信号からピッチ周期を計算し、該ピッチ周期
    を用いてピッチ予測を行いピッチ予測信号を計算すると
    ともに、前記音源信号から前記ピッチ予測信号を減算す
    ることにより残差信号を求めるピッチ予測回路と、 前記ピッチ予測回路にて計算されたピッチ予測信号と残
    差信号とのうち少なくとも1つのゲインを求めるゲイン
    計算回路と、 前記前記スペクトルパラメータ計算回路にて計算された
    スペクトルパラメータと前記ゲイン計算回路にて計算さ
    れたゲインとのうち少なくとも1つを時間方向に平滑化
    して両者を出力する平滑化回路と、 前記平滑化回路から出力されたスペクトルパラメータを
    用いて合成フィルタを構成し、前記平滑化回路から出力
    されたゲイン、並びに、前記ピッチ予測信号及び前記残
    差信号から音源信号を作成し、該音源信号を前記合成フ
    ィルタにて合成して音声信号として出力する合成フィル
    タ回路とを有することを特徴とする音声復号化装置。
  6. 【請求項6】 請求項1乃至5のいずれか1項に記載の
    音声復号化装置において、 前記音源信号計算手段は、前記スペクトルパラメータ計
    算回路にて計算されたスペクトルパラメータを用いて前
    記再生音声信号を逆フィルタリングすることにより音源
    信号を計算することを特徴とする音声復号化装置。
JP2000337805A 2000-11-06 2000-11-06 音声復号化装置 Expired - Fee Related JP3558031B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2000337805A JP3558031B2 (ja) 2000-11-06 2000-11-06 音声復号化装置
US09/985,853 US7024354B2 (en) 2000-11-06 2001-11-06 Speech decoder capable of decoding background noise signal with high quality
CNB011344997A CN1145144C (zh) 2000-11-06 2001-11-06 对背景噪音信号进行高质量解码的语音解码器
DE60109111T DE60109111T2 (de) 2000-11-06 2001-11-06 Sprachdekoder zum hochqualitativen Dekodieren von Signalen mit Hintergrundrauschen
EP01125496A EP1204092B1 (en) 2000-11-06 2001-11-06 Speech decoder capable of decoding background noise signal with high quality

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000337805A JP3558031B2 (ja) 2000-11-06 2000-11-06 音声復号化装置

Publications (2)

Publication Number Publication Date
JP2002140099A true JP2002140099A (ja) 2002-05-17
JP3558031B2 JP3558031B2 (ja) 2004-08-25

Family

ID=18813128

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000337805A Expired - Fee Related JP3558031B2 (ja) 2000-11-06 2000-11-06 音声復号化装置

Country Status (5)

Country Link
US (1) US7024354B2 (ja)
EP (1) EP1204092B1 (ja)
JP (1) JP3558031B2 (ja)
CN (1) CN1145144C (ja)
DE (1) DE60109111T2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010520512A (ja) * 2007-03-05 2010-06-10 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 定常的な背景雑音の平滑化を行うための方法及び装置

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
US7778826B2 (en) 2005-01-13 2010-08-17 Intel Corporation Beamforming codebook generation system and associated methods
KR100956877B1 (ko) * 2005-04-01 2010-05-11 콸콤 인코포레이티드 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치
PT1875463T (pt) 2005-04-22 2019-01-24 Qualcomm Inc Sistemas, métodos e aparelho para nivelamento de fator de ganho
CN101266798B (zh) * 2007-03-12 2011-06-15 华为技术有限公司 一种在语音解码器中进行增益平滑的方法及装置
US7822833B2 (en) * 2008-04-30 2010-10-26 Honeywell International Inc. System for creating and validating configurations of offline field devices in a process control system
US8731895B2 (en) * 2008-05-20 2014-05-20 Honeywell International Inc. System and method for accessing and configuring field devices in a process control system
US8108200B2 (en) * 2008-05-20 2012-01-31 Honeywell International Inc. System and method for accessing and configuring field devices in a process control system using distributed control components
US7983892B2 (en) * 2008-05-20 2011-07-19 Honeywell International Inc. System and method for accessing and presenting health information for field devices in a process control system
CN107369454B (zh) 2014-03-21 2020-10-27 华为技术有限公司 语音频码流的解码方法及装置
US11714394B2 (en) * 2018-09-28 2023-08-01 Fisher-Rosemount Systems, Inc Bulk commissioning of field devices within a process plant

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01267700A (ja) 1988-04-20 1989-10-25 Nec Corp 音声処理装置
US5732389A (en) * 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures
GB9512284D0 (en) * 1995-06-16 1995-08-16 Nokia Mobile Phones Ltd Speech Synthesiser
JP2806308B2 (ja) * 1995-06-30 1998-09-30 日本電気株式会社 音声復号化装置
JPH0954600A (ja) 1995-08-14 1997-02-25 Toshiba Corp 音声符号化通信装置
JPH09244695A (ja) 1996-03-04 1997-09-19 Kobe Steel Ltd 音声符号化装置及び復号化装置
GB2312360B (en) 1996-04-12 2001-01-24 Olympus Optical Co Voice signal coding apparatus
JP3270922B2 (ja) 1996-09-09 2002-04-02 富士通株式会社 符号化,復号化方法及び符号化,復号化装置
JPH10171497A (ja) 1996-12-12 1998-06-26 Oki Electric Ind Co Ltd 背景雑音除去装置
JPH10247098A (ja) * 1997-03-04 1998-09-14 Mitsubishi Electric Corp 可変レート音声符号化方法、可変レート音声復号化方法
IL135630A0 (en) * 1997-12-08 2001-05-20 Mitsubishi Electric Corp Method and apparatus for processing sound signal
JPH11175083A (ja) 1997-12-16 1999-07-02 Mitsubishi Electric Corp 雑音らしさ算出方法および雑音らしさ算出装置
GB9811019D0 (en) * 1998-05-21 1998-07-22 Univ Surrey Speech coders
JP4308345B2 (ja) * 1998-08-21 2009-08-05 パナソニック株式会社 マルチモード音声符号化装置及び復号化装置
US6556966B1 (en) * 1998-08-24 2003-04-29 Conexant Systems, Inc. Codebook structure for changeable pulse multimode speech coding
JP4295372B2 (ja) 1998-09-11 2009-07-15 パナソニック株式会社 音声符号化装置
JP3490324B2 (ja) 1999-02-15 2004-01-26 日本電信電話株式会社 音響信号符号化装置、復号化装置、これらの方法、及びプログラム記録媒体
JP3478209B2 (ja) * 1999-11-01 2003-12-15 日本電気株式会社 音声信号復号方法及び装置と音声信号符号化復号方法及び装置と記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010520512A (ja) * 2007-03-05 2010-06-10 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 定常的な背景雑音の平滑化を行うための方法及び装置

Also Published As

Publication number Publication date
US20020087308A1 (en) 2002-07-04
EP1204092A3 (en) 2003-11-19
CN1145144C (zh) 2004-04-07
JP3558031B2 (ja) 2004-08-25
DE60109111D1 (de) 2005-04-07
DE60109111T2 (de) 2006-04-13
EP1204092A2 (en) 2002-05-08
US7024354B2 (en) 2006-04-04
CN1352451A (zh) 2002-06-05
EP1204092B1 (en) 2005-03-02

Similar Documents

Publication Publication Date Title
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
JPH0990995A (ja) 音声符号化装置
JP3558031B2 (ja) 音声復号化装置
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JP2000163096A (ja) 音声符号化方法及び音声符号化装置
JPH09160596A (ja) 音声符号化装置
JPH10143199A (ja) 音声符号化方法および復号化方法
JP2829978B2 (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JPH0782360B2 (ja) 音声分析合成方法
WO2000000963A1 (fr) Codeur vocal
JP2001051699A (ja) 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
JP3003531B2 (ja) 音声符号化装置
JP4438280B2 (ja) トランスコーダ及び符号変換方法
JP3144284B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JP2000235400A (ja) 音響信号符号化装置、復号化装置、これらの方法、及びプログラム記録媒体
JP2001318698A (ja) 音声符号化装置及び音声復号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JPH0519795A (ja) 音声の励振信号符号化・復号化方法
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP3552201B2 (ja) 音声符号化方法および装置
JP3984048B2 (ja) 音声/音響信号の符号化方法及び電子装置
JPH0519796A (ja) 音声の励振信号符号化・復号化方法
JP2004151423A (ja) 帯域拡張装置及び方法
JP2853170B2 (ja) 音声符号化復号化方式

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040427

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040510

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 3558031

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090528

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100528

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110528

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110528

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120528

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120528

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130528

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140528

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees