JP2010145593A - 情報符号化装置 - Google Patents

情報符号化装置 Download PDF

Info

Publication number
JP2010145593A
JP2010145593A JP2008320779A JP2008320779A JP2010145593A JP 2010145593 A JP2010145593 A JP 2010145593A JP 2008320779 A JP2008320779 A JP 2008320779A JP 2008320779 A JP2008320779 A JP 2008320779A JP 2010145593 A JP2010145593 A JP 2010145593A
Authority
JP
Japan
Prior art keywords
filter
signal
unit
quantization
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008320779A
Other languages
English (en)
Other versions
JP4735711B2 (ja
Inventor
Yasuhiro Tokuri
康裕 戸栗
Atsushi Matsumoto
淳 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2008320779A priority Critical patent/JP4735711B2/ja
Priority to EP09252724A priority patent/EP2200195A2/en
Priority to US12/639,676 priority patent/US8311816B2/en
Publication of JP2010145593A publication Critical patent/JP2010145593A/ja
Application granted granted Critical
Publication of JP4735711B2 publication Critical patent/JP4735711B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B14/00Transmission systems not characterised by the medium used for transmission
    • H04B14/02Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
    • H04B14/06Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using differential modulation, e.g. delta modulation
    • H04B14/066Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using differential modulation, e.g. delta modulation using differential modulation with several bits [NDPCM]
    • H04B14/068Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using differential modulation, e.g. delta modulation using differential modulation with several bits [NDPCM] with adaptive feedback
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3002Conversion to or from differential modulation
    • H03M7/3044Conversion to or from differential modulation with several bits only, i.e. the difference between successive samples being coded by more than one bit, e.g. differential pulse code modulation [DPCM]
    • H03M7/3046Conversion to or from differential modulation with several bits only, i.e. the difference between successive samples being coded by more than one bit, e.g. differential pulse code modulation [DPCM] adaptive, e.g. adaptive differential pulse code modulation [ADPCM]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】復号後における量子化雑音の周波数特性を適切に制御する。
【解決手段】予測フィルタ決定部130は、減算部120により生成される予測残差信号に基づいて最適な予測フィルタ係数を決定して、予測フィルタ110および230に設定する。LPC分析部180は、線形予測分析によって推定される入力音声信号のスペクトル包絡情報に基づいて線形予測フィルタ係数を生成する。線形予測フィルタ220は、予測フィルタ110における予測フィルタ係数とは異なる線形予測フィルタ係数と、フィルタ調整部170からの調整パラメータとに基づいて演算処理を行う。フィードバック演算部200において、予測フィルタ230は、予測フィルタ110によって変調される量子化雑音の周波数特性を平坦な特性にする。加算器210および線形予測フィルタ220は、全極モデルに基づく線形予測フィルタを構成する。
【選択図】図1

Description

本発明は、情報符号化装置に関し、特に入力音声信号と予測音声信号との差分データを量子化する情報符号化装置に関する。
従来、時間領域における波形符号化方式としては、適応差分PCM(ADPCM:Adaptive Differential Pulse Code Modulation)がある。その他に、適応予測符号化(APC:adaptive Predictive Coding)などの波形符号化方式もある。このADPCMやAPCなどの符号化方式は、ノイズシェーピング技術と組み合わせて用いられることが多い。ここにいうノイズシェーピング技術とは、量子化誤差をフィードバックすることにより、聴覚マスキング効果が得られるように復号後における量子化雑音の周波数特性を変調する技術をいう。ここで、ノイズシェーピング技術と符号化とを組み合わせたADPCM方式の一例について簡単に説明する。
図13は、従来のADPCM方式による音声伝送システムの一構成例を示すブロック図である。図13(a)および(b)には、入力音声信号X(z)を符号化して量子化信号Xq(z)を出力する音声符号化装置と、その量子化信号Xq(z)を復号する音声復号装置とが示されている。
図13(a)は、従来のADPCM方式による音声符号化装置の一構成例を示すブロック図である。音声符号化装置700は、信号線701からフレーム単位により入力音声信号X(z)を入力して、信号線709から量子化信号Xq(z)を出力するものである。ここにいうフレームとは、標本化された離散時間信号のうち一定数のサンプル値のことをいう。
この音声符号化装置700は、予測フィルタP(z)710と、減算器720および730と、量子化部740と、減算器750と、フィードバック演算部R(z)760とを備える。
予測フィルタP(z)710は、入力音声信号X(z)のうち過去の音声信号と、予測信号を生成するための予測フィルタ係数とに基づいて現在の音声信号を予測するものである。この予測フィルタP(z)710は、過去のサンプル値と予測フィルタ係数とをそれぞれ積和演算することにより、現在のサンプル値を予測する。すなわち、この予測フィルタP(z)710は、式1に基づいて予測信号を生成する。
Figure 2010145593
ここで、P(z)は、入力音声信号X(z)の全極モデルに基づいた予測フィルタである。pは、予測信号を生成するための予測フィルタ係数である。この予測フィルタ係数pは、例えば、入力音声信号X(z)に対する線形予測符号(LPC:Linear Predictive Coding)分析によって求められる。ここにいうLPC分析とは、音声サンプル間の近接相関を利用して、入力音声信号の周波数特性を推定する手法である。すなわち、音声生成モデルにおける声道の特性を近似するフィルタの係数を入力音声信号から推定する手法である。Npは、予測フィルタP(z)の次数である。
また、この予測フィルタP(z)710は、その生成された予測信号を減算器720に出力する。
減算器720は、信号線701からの現在の音声信号と、予測フィルタP(z)710からの予測信号との差分を算出する減算器である。この減算器720は、信号線701における現在の音声信号から予測フィルタP(z)710の予測信号を減算することにより、予測残差信号を生成する。この減算器720は、その予測残差信号を減算器730に出力する。
減算器730は、減算器720からの予測残差信号に対してフィードバック演算部R(z)760の出力をフィードバックするものである。この減算器730は、減算器720からの予測残差信号と、フィードバック演算部R(z)760の出力との差分を算出する。この減算器730は、減算器720により出力された予測残差信号からフィードバック演算部R(z)760の出力を減算することにより、変形予測残差信号を生成する。この減算器730は、その生成された変形予測残差信号を量子化部740および減算器750に出力する。
量子化部740は、減算器730により生成された変形予測残差信号を一定のビット数に量子化する量子化器である。この量子化部740は、その量子化された量子化信号Xq(z)を信号線709および減算器750に出力する。
減算器750は、減算器730により生成された変形予測残差信号と、量子化部740により量子化された量子化信号Xq(z)との差分を算出する減算器である。この減算器750は、量子化部740により量子化された量子化信号Xq(z)から減算器730により生成された変形予測残差信号を減算することにより、量子化誤差信号E(z)を生成する。この減算器750は、その生成された量子化誤差信号E(z)をフィードバック演算部R(z)760に出力する。
フィードバック演算部R(z)760は、復号後における量子化雑音の周波数特性を制御するためのフィードバック信号Es(z)を、減算器750からの量子化誤差信号E(z)に基づいて生成するノイズシェーピングフィルタである。このフィードバック演算部R(z)760は、予測フィルタP(z)710に基づいて構成される。すなわち、フィードバック演算部R(z)760は、式2に基づいて演算処理を行い、その結果をフィードバック信号Es(z)として生成する。
Figure 2010145593
ここで、λは、復号後における量子化雑音の周波数特性におけるピークレベルを調整するための調整パラメータである。
また、フィードバック演算部R(z)760は、生成されたフィードバック信号Es(z)を減算器730に供給する。
このように、音声符号化装置700におけるフィードバック演算部R(z)760は、予測フィルタP(z)710に基づいて構成される。
図13(b)は、音声符号化装置700から出力された量子化信号Xq(z)を復号する音声復号装置の一構成例を示すブロック図である。音声復号装置800は、加算器810および予測フィルタP(z)820を備える。
加算器810は、信号線801を介して供給された量子化信号Xq(z)および予測フィルタP(z)820の出力を加算する加算器である。この加算器810は、量子化信号Xq(z)および予測フィルタP(z)820の出力を加算することにより、復号信号Y(z)を生成する。この加算器810は、その生成された復号信号Y(z)を信号線809および予測フィルタP(z)820に出力する。
予測フィルタP(z)820は、加算器810から出力された復号信号Y(z)に対して演算処理を行うフィルタである。この予測フィルタP(z)820は、音声符号化装置700における予測フィルタP(z)710と同一の構成のフィルタである。すなわち、この予測フィルタP(z)820には、予測フィルタP(z)710と同じ予測フィルタ係数pが用いられている。また、予測フィルタP(z)820は、式1に基づいて演算処理を行い、その結果を加算器810に供給する。
このように、音声復号装置800は、音声符号化装置700と同一構成の予測フィルタP(z)820および加算器810のみによって、量子化信号Xq(z)を復号する。このため、音声復号装置800の構成は、フィードバック演算部R(z)760の構成に影響されないことがわかる。
次に、音声復号装置800から出力される復号信号Y(z)に含まれる量子化雑音の特性について説明する。
まず、音声符号化装置700から出力される量子化信号Xq(z)の特性は、音声符号化装置700における量子化誤差をE(z)とすると、次式により表わされる。
Xq(z)=[1−P(z)]・X(z)+E(z)−Es(z)
=[1−P(z)]・X(z)+[1−R(z)]・E(z)
そして、音声復号装置800から出力される復号信号Y(z)の特性は、上式から、式3により表わされる。
Figure 2010145593
上式より、音声復号装置800から出力される復号信号Y(z)における量子化雑音特性は、P(z)およびR(z)によって制御することができることがわかる。ここで、P(z)=R(z)である場合における音声復号装置800から出力される量子化雑音の周波数特性を次図に示す。
図14は、P(z)=R(z)である場合における音声復号装置800から出力される量子化雑音の一例を示す図である。ここでは、入力音声信号の周波数特性780が実線により示され、量子化雑音の周波数特性881が破線により示されている。また、横軸を周波数とし、縦軸を強度とする。
入力音声信号の周波数特性780は、音声符号化装置700に入力された音声信号の周波数特性である。この入力音声信号の周波数特性780の波形は、3つのピーク(極)があり、周波数が低い順にそのピークのレベルが低くなっている。
量子化雑音の周波数特性881は、音声符号化装置700により符号化された入力音声信号を音声復号装置800によって復号した場合における復号信号Y(z)に含まれる量子化雑音の周波数特性である。
このように、P(z)=R(z)である場合には、入力音声信号の周波数特性780に関係なく、量子化雑音は平坦な周波数特性を示すことになる。この場合、入力音声信号の波形が谷の部分では、入力音声信号(Signal)と量子化雑音(Noise)とのレベルの比であるS/Nが悪くなるため、耳障りな雑音が聞こえ易くなる。このため、量子化雑音の周波数特性を入力音声信号の周波数特性の波形に合わせることによって、聴覚マスキング効果による聴覚上の雑音を低減させることが重要となる。ここで、音声符号化装置700におけるフィードバック演算部R(z)760によって変調された量子化雑音の周波数特性の一例について次図を参照して説明する。
図15は、音声符号化装置700におけるフィードバック演算部R(z)760により変調された量子化雑音の周波数特性の一例を示す図である。ここでは、入力音声信号の周波数特性780および量子化雑音の周波数特性882乃至884が示されている。また、横軸を周波数とし、縦軸を強度とする。なお、入力音声信号の周波数特性780は、図14と同様の特性であるため、ここでの説明を省略する。
量子化雑音の周波数特性882乃至884は、フィードバック演算部R(z)760における調整パラメータλを「0.0」、「0.5」、「1.0」にそれぞれ設定した場合における復号後における量子化雑音の周波数特性である。なお、調整パラメータλの値が「1.0」の場合には、P(z)=R(z)となるため、量子化雑音の周波数特性884は、図14に示した量子化雑音の周波数特性881と同じ平坦な特性を示す。
このように、フィードバック演算部R(z)760における調整パラメータλの値を低くすることによって、量子化雑音の周波数特性におけるピークレベルを調整することができる。なお、聴覚マスキング効果が得られるように調整パラメータλを極力小さくすることが望ましいが、調整パラメータλを小さくし過ぎると、フィードバック演算部R(z)760により生成されるフィードバック信号Es(z)のレベルが大きくなり過ぎてしまう。これにより、量子化できる範囲を超えた信号レベルが量子化部740に入力されてしまい、復号された音声が不自然なものとなってしまう。このため、調整パラメータλは、一般に、「0.4」乃至「0.8」程度に設定される。なお、量子化できる範囲を超えた信号レベルが量子化部に入力されることにより、量子化部の量子化信号が飽和してしまうことをクリップするという。
このように、復号後における量子化雑音を適切に制御するために、予測フィルタP(z)710に基づいてフィードバック演算部R(z)760を構成する音声符号化装置が提案されている(例えば、非特許文献1参照。)。
B. S. Atal, M. R. Schroeder: "Predictive coding of speech signals and subjective error criteria", IEEE Transactions on Acoustics, Speech and Signal Processing, vol.ASSP-27, p.247-254, June 1979
上述の従来技術では、予測フィルタに基づいてフィードバック演算部を構成することによって、量子化雑音の周波数特性を入力音声信号の周波数特性の波形に合わせることができる。この場合、複雑な入力音声信号の周波数特性の波形に量子化雑音の周波数特性を合わせるためには、予測フィルタの次数Npを十分に高くする必要が生じる。例えば、サンプリング周波数が48kHzである場合には、次数Npを「32」以上に設定する必要があると考えられる。
しかしながら、予測フィルタの次数Npを高くすることは、音声復号装置における予測フィルタの次数を高くすることになり、音声復号装置の演算量を大きくしまうことから、次数Npは、「1」乃至「16」程度に低く設定される場合が多い。また、伝送ビットレートを低減するために、予測フィルタの予測フィルタ係数をそのまま伝送せずに、予め定められた複数の予測フィルタのパターンを音声復号装置のテーブルに用意しておき、その予測フィルタのパターンに対応するインデックスを送る場合もある。このような場合には、量子化雑音の周波数特性を、入力音声信号の周波数特性の波形に合わせることは困難である。
図16は、予測フィルタの次数が低く、かつ、予測フィルタのパターンの数が少ない場合における量子化雑音の周波数特性の一例を示す図である。ここでは、入力音声信号の周波数特性780が実線により示され、量子化雑音の周波数特性885が点線により示されている。また、横軸を周波数とし、縦軸を強度とする。なお、入力音声信号の周波数特性780は、図14と同様の特性であるため、ここでの説明を省略する。
量子化雑音の周波数特性885は、予測フィルタの次数が低く、かつ、予測フィルタのパターンの数が少ない場合において音声復号装置800から出力される量子化雑音の周波数特性である。この量子化雑音の周波数特性885は、入力音声信号の周波数特性780の波形に比べて、ピークレベル(極)が2つと少なく、異なった波形になっている。
このように、限られたパターンの低次の予測フィルタを用いる場合には、入力音声信号の周波数特性780の波形に量子化雑音の周波数特性885の波形を近づけることができない。むしろ、この場合においては、入力音声信号の周波数特性780の波形における谷の帯域に量子化雑音を増大させてしまい、聴覚上の雑音を増大させている。
本発明はこのような状況に鑑みてなされたものであり、復号後における量子化雑音の周波数特性を適切に制御することを目的とする。
本発明は、上記課題を解決するためになされたものであり、その第1の側面は、入力音声信号のうち過去の音声信号と現在の音声信号を予測するための予測フィルタ係数とに基づいて予測信号を生成する予測信号生成部と、上記現在の音声信号と上記予測信号との差分を予測残差信号として生成する予測残差信号生成部と、上記予測残差信号に基づいて生成された量子化入力信号を量子化して量子化出力信号を生成する量子化部と、上記量子化入力信号と上記量子化出力信号との差分を量子化誤差信号として生成する量子化誤差信号生成部と、復号後における量子化雑音の周波数特性を制御するためのフィードバック信号を上記量子化誤差信号に基づいて生成するフィードバック信号生成部と、上記予測残差信号と上記フィードバック信号との差分を上記量子化入力信号として生成する量子化入力信号生成部とを具備し、上記フィードバック信号生成部は、上記入力音声信号により推定されたスペクトル包絡情報に基づく全極形フィルタにおけるフィルタ係数と上記全極形フィルタによる上記量子化雑音の周波数特性におけるピークレベルを調整するパラメータと上記予測フィルタ係数とを含む極零形フィルタにより構成される情報符号化装置である。これにより、入力音声信号により推定されたスペクトル包絡情報に基づく全極形フィルタにおけるフィルタ係数と、その全極形フィルタによる量子化雑音の周波数特性におけるピークレベルを調整するパラメータと、予測フィルタ係数とを含む極零形フィルタによって、復号後における量子化雑音の周波数特性を適切に変調させるためのフィードバック信号を生成させるという作用をもたらす。
また、この第1の側面において、上記フィードバック信号生成部は、上記量子化雑音における所定帯域のレベルを低下させるための補正フィルタにおけるフィルタ係数をさらに含む上記極零形フィルタにより構成されるようにしてもよい。これにより、復号後における量子化雑音における所定帯域のレベルを低下させるという作用をもたらす。この場合において、上記量子化部におけるフレームごとのクリップ頻度に基づいて上記補正フィルタの有無を上記フレームごとに切り替えるように制御する補正フィルタ制御部をさらに具備し、上記フィードバック信号生成部は、上記補正フィルタ制御部の制御に基づいて上記補正フィルタの有無を切り替える切替スイッチをさらに含むようにしてもよい。これにより、フィードバック信号生成部における補正フィルタの有無を、量子化部のクリップ頻度に基づいて切り替えさせえるという作用をもたらす。
また、上記フィードバック信号生成部は、上記量子化雑音における所定帯域のレベルを低下させるための補正フィルタにおけるフィルタ係数をさらに含む上記極零形フィルタにより構成される場合において、上記量子化誤差信号とフィードバック信号生成部の伝達関数とを用いて復号後における量子化雑音を計算して上記計算された量子化雑音と上記入力音声信号との所定帯域におけるレベルの比に基づいて上記補正フィルタの有無をフレームごとに切り替えるように制御する補正フィルタ制御部をさらに具備し、上記フィードバック信号生成部は、上記補正フィルタ制御部の制御に基づいて上記補正フィルタの有無を切り替える切替スイッチをさらに含むようにしてもよい。これにより、所定帯域における入力音声信号と、計算された量子化雑音とのレベル比に基づいてフィードバック信号生成部における補正フィルタの有無を切り替えさせるという作用をもたらす。
また、この第1の側面において、上記量子化部におけるフレームごとのクリップ頻度に基づいて上記パラメータの値を上記フレームごとに上記フィードバック信号生成部に設定するパラメータ設定部をさらに具備するようにしてもよい。これにより、量子化部におけるクリップ頻度に基づいて全極フィルタにより変調される量子化雑音の周波数特性におけるピークレベルを調整するパラメータの値を設定させるという作用をもたらす。
また、この第1の側面において、上記入力音声信号におけるスペクトルの極値振幅をフレームごとに検出して上記検出された極値振幅に基づいて上記パラメータの値を上記フレームごとに上記フィードバック信号生成部に設定するパラメータ設定部をさらに具備するようにしてもよい。これにより、入力音声信号におけるスペクトルの極値振幅に基づいてパラメータの値を設定させるという作用をもたらす。
また、この第1の側面において、線形予測分析による上記スペクトル包絡情報に基づいて算出された線形予測フィルタ係数を上記全極形フィルタにおけるフィルタ係数として上記フィードバック信号生成部に供給する線形予測分析部をさらに具備するようにしてもよい。これにより、全極形フィルタにおけるフィルタ係数を線形予測分析によって生成させるという作用をもたらす。
本発明によれば、復号後における量子化雑音の周波数特性を適切に制御することができるという優れた効果を奏し得る。
以下、本発明を実施するための最良の形態(以下、実施の形態と称する)について説明する。説明は以下の順序により行う。
1.第1の実施の形態(量子化雑音の制御:フィードバック演算部を全極モデルに基づく線形予測フィルタにした例)
2.第2の実施の形態(量子化雑音の制御:補正フィルタを追加した例)
3.第3の実施の形態(量子化雑音の制御:フィードバック演算部において切替スイッチを追加した例)
<1.第1の実施の形態>
[音声符号化装置の構成例]
図1は、本発明の第1の実施の形態における音声符号化装置の一構成例を示す図である。この音声符号化装置100は、信号線101からフレーム単位により入力音声信号X(z)を入力して、信号線109から量子化信号Xq(z)を出力するものである。ここにいうフレームとは、標本化された離散時間信号のうち一定数のサンプル値のことをいう。また、ここでは、信号線が実線により示され、データ線が点線により示されている。
この音声符号化装置100は、予測フィルタP(z)110と、減算器120と、予測フィルタ決定部130と、減算器140および160と、量子化部150と、フィルタ調整部170と、LPC分析部180と、フィードバック演算部R(z)200とを備える。また、フィードバック演算部R(z)200は、加算器210と、線形予測フィルタB(z)220と、予測フィルタP(z)230と、加算器270とを備える。
予測フィルタP(z)110は、入力音声信号X(z)のうち過去の音声信号と、予測フィルタ決定部130から供給される予測フィルタ係数とに基づいて現在の音声信号を予測するものである。この予測フィルタP(z)110は、過去のサンプル値と予測フィルタ係数とをそれぞれ積和演算することにより、現在のサンプル値を予測する。すなわち、この予測フィルタP(z)110は、式1に基づいて演算処理を行い、その結果を予測信号として生成する。この予測フィルタP(z)110は、その生成された予測信号を減算器120に供給する。なお、予測フィルタP(z)110は、特許請求の範囲に記載の予測信号生成部の一例である。
減算器120は、信号線101から供給された現在の音声信号と、予測フィルタ110により生成された予測信号との差分を算出する減算器である。この減算器120は、信号線101により供給された音声信号から予測信号を減算することにより、予測残差信号を生成する。この減算器120は、その生成された予測残差信号を減算器140に出力する。なお、減算器120は、特許請求の範囲に記載の予測残差信号生成部の一例である。
予測フィルタ決定部130は、予測フィルタパターンを生成するための予測フィルタ係数を複数保持しておき、入力音声信号X(z)に基づいて最適な予測フィルタ係数を決定するものである。この予測フィルタ決定部130は、例えば、P個(数個乃至数百個)の予測フィルタ係数を順次予測フィルタP(z)110に設定する。そして、この予測フィルタ決定部130は、P個の予測フィルタ係数のうち、減算器120からの予測残差信号の最大値が最も小さくなる予測フィルタ係数を最終的に予測フィルタ110および230に設定する。
また、この予測フィルタ決定部130は、例えば、LPC分析部180により求められる予測フィルタ係数pに基づいて、P個の予測フィルタ係数のうち、最も予測フィルタパターンの近い予測フィルタ係数を選択するようにしてもよい。また、この予測フィルタ決定部130は、例えば、LPC係数およびP個の予測フィルタ係数を線スペクトル対(LSP:Linear Spectral Pair)パラメータに変換する。そして、この予測フィルタ決定部130は、そのLSPパラメータ同士の距離を計算することによって、P個の予測フィルタ係数のうち最適な予測フィルタ係数を決定するようにしてもよい。
減算器140は、減算器120により出力された予測残差信号と、信号線103から供給されるフィードバック演算部R(z)200の出力であるフィードバック信号Es(z)との差分を算出する減算器である。この減算器140は、減算部120により生成された予測残差信号からフィードバック演算部R(z)200の出力を減算することにより、変形予測残差信号を生成する。この減算器140は、その生成された変形予測残差信号を量子化部150および減算器160に出力する。なお、減算器140は、特許請求の範囲に記載の量子化入力信号生成部の一例である。
量子化部150は、減算器140により生成された変形予測残差信号を一定のビット数に量子化する量子化器である。この量子化部150は、減算器140において予測残差信号に基づいて生成された量子化入力信号を量子化して量子化出力信号である量子化信号Xq(z)を生成する。また、量子化部150は、その量子化された量子化信号Xq(z)を信号線109および減算器160に出力する。なお、量子化部150は、特許請求の範囲に記載の量子化部の一例である。
減算器160は、減算器140により生成された変形予測残差信号と、量子化部150により量子化された量子化信号Xq(z)との差分を算出する減算器である。この減算器160は、量子化部150により量子化された量子化信号Xq(z)から変形予測残差信号を減算することにより、量子化誤差信号E(z)を生成する。すなわち、この減算器160は、量子化入力信号と量子化出力信号との差分を量子化誤差信号E(z)として生成する。この減算器160は、信号線102を介して、その生成された量子化誤差信号E(z)をフィードバック演算部R(z)200に出力する。なお、減算器160は、特許請求の範囲に記載の量子化誤差信号生成部の一例である。
LPC分析部180は、入力音声信号X(z)に対してLPC分析を行うものである。このLPC分析部180は、LPC分析により算出されたスペクトル包絡情報に基づいて線形予測フィルタ係数を生成する。このLPC分析部180は、その生成された線形予測フィルタ係数をフィードバック演算部R(z)200における線形予測フィルタB(z)220に供給する。なお、ここでは、LPC分析により線形予測フィルタB(z)220のフィルタ係数bを生成する例について説明したが、ケプストラム法を用いてフィルタ係数bを生成するようにしてもよい。なお、LPC分析部180は、特許請求の範囲に記載の線形予測分析部の一例である。
フィードバック演算部R(z)200は、復号後における量子化雑音の周波数特性を制御するためのフィードバック信号Es(z)を、減算器160からの量子化誤差信号E(z)に基づいて生成するノイズシェーピングフィルタである。このフィードバック演算部R(z)200は、極零形フィルタにより構成される。このフィードバック演算部R(z)200は、入力音声信号により推定されたスペクトル包絡情報に基づく全極形フィルタにおけるフィルタ係数と、全極形フィルタによる量子化雑音の周波数特性におけるピークレベルを調整するパラメータとを含む。さらに、このフィードバック演算部R(z)200は、前記予測フィルタ係数を含む。すなわち、このフィードバック演算部R(z)200は、式4に示す伝達関数により表わされる。なお、ここにいう極零形フィルタとは、全極形フィルタおよび全零形フィルタを組み合わせたフィルタのことをいう。
Figure 2010145593
ここで、P(z)は、式1に基づいて構成される。B(z)は、式5に基づいて構成される。
Figure 2010145593
ここで、B(z)は、入力音声信号X(z)の全極モデルに基づいた線形予測フィルタである。λは、復号後における量子化雑音の周波数特性におけるピークレベルを調整するための調整パラメータである。この調整パラメータλは、「0」以上、「1」以下の値に設定される。本発明の実施の形態では、調整パラメータλは、フィードバック演算部R(z)200の伝達関数における分母多項式に含まれるため、調整パラメータλの大小による復号後における量子化雑音の周波数特性の変化は、図15に示したものとは反対となる。例えば、本発明の実施の形態では、量子化雑音の周波数特性は、調整パラメータλが大きい(「1」に近い)ほど、入力音声信号X(z)の波形に近づき、調整パラメータλが小さい(「0」に近い)ほど、平坦な特性となる。なお、量子化雑音の周波数特性が平坦になりすぎると、雑音が聞こえ易くなるが、これに対して、ピークレベルが高すぎても、フィードバック信号Es(z)が大きくなり過ぎるため、量子化部150のクリップする頻度が高くなる。このため、調整パラメータλは、一般に「0.4」乃至「0.8」程度に設定される。
また、式5に示すbは、線形予測フィルタ係数であり、本発明の実施の形態では、LPC分析部180により生成される。この線形予測フィルタ係数bは、入力音声信号X(z)のスペクトル包絡情報を表わしている。Nbは、線形予測フィルタB(z)の次数であり、一般に「16」乃至「32」程度に設定される。
このように、フィードバック演算部R(z)200は、式4に基づいて演算処理が行われる。また、フィードバック演算部R(z)200は、信号線103を介して、その生成されたフィードバック信号Es(z)を減算器140に供給する。なお、このフィードバック演算部R(z)200は、特許請求の範囲に記載のフィードバック信号生成部の一例である。また、図1に示すフィードバック演算部R(z)200は、式4により実現される構成の一例であり、これに限られるものではない。
加算器210は、減算器160により生成された量子化誤差信号E(z)に対して線形予測フィルタB(z)220の出力をフィードバックするための加算器である。これにより、フィードバック演算部R(z)200の伝達関数には、分母に線形予測フィルタB(z)220の伝達関数が含まれることになる。すなわち、加算器210および線形予測フィルタB(z)220により、1/(1−B(z))の全極形フィルタが構成される。この加算器210は、量子化誤差信号E(z)に対して線形予測フィルタB(z)220の出力を加算して線形予測フィルタB(z)220および予測フィルタP(z)230に出力する。
線形予測フィルタB(z)220は、入力音声信号X(z)の全極モデルに基づく線形予測フィルタである。この線形予測フィルタB(z)220は、LPC分析部180により生成される線形予測フィルタ係数bと、フィルタ調整部170により生成される調整パラメータλと、加算器210からの出力とに基づいて積和演算する。すなわち、線形予測フィルタB(z)220は、式5に基づいて演算処理を行う。また、線形予測フィルタB(z)220は、式5に基づいて算出された結果を加算器210および減算器270に供給する。なお、線形予測フィルタB(z)220における線形予測フィルタ係数bおよび調整パラメータλは、特許請求の範囲に記載の全極形フィルタにおけるフィルタ係数および量子化雑音の周波数特性におけるピークレベルを調整するパラメータの一例である。
予測フィルタP(z)230は、予測フィルタP(z)110によって変調された量子化雑音の周波数特性を平坦なものにするためのフィルタである。この予測フィルタP(z)230は、予測フィルタ決定部130から供給される予測フィルタ係数pと加算器210からの出力とを積和演算する。すなわち、この予測フィルタP(z)230は、予測フィルタP(z)110と同一構成のフィルタであり、式1に基づいて演算処理を行う。また、予測フィルタP(z)230は、式1に基づいて算出された結果を減算器270に供給する。なお、予測フィルタP(z)230における予測フィルタ係数pは、特許請求の範囲に記載の予測フィルタ係数の一例である。
減算器270は、線形予測フィルタB(z)220の出力と、予測フィルタP(z)230の出力との差分を算出する減算器である。この減算器270は、予測フィルタP(z)230の出力に対して線形予測フィルタB(z)220の出力を減算することにより、
その加算された信号をフィードバック信号Es(z)として信号線103を介して減算器140に出力する。
フィルタ調整部170は、量子化部150におけるクリップ頻度に基づいて線形予測フィルタB(z)220の調整パラメータλを設定するものである。このフィルタ調整部170は、例えば、過去のフレームに対する量子化部150のクリップ頻度をカウントして、そのカウントされたクリップ回数に基づいて現在のフレームに対する調整パラメータλの値を設定する。この例において、フィルタ調整部170は、調整パラメータλの初期値を「0.8」に設定しておく。そして、フィルタ調整部170は、1つ前のフレームにおける量子化部150のクリップ回数が予め定められた下限の閾値Ta未満である場合には、その調整パラメータλを「0.001」だけ大きくする。一方、このフィルタ調整部170は、予め定められた上限値の閾値Tb以上である場合には、調整パラメータλを「0.001」だけ小さくする。
また、フィルタ調整部170は、例えば、現在のフレームにおける量子化部150のクリップ頻度をカウントして、そのカウントされたクリップ回数に基づいて現在のフレームに対する調整パラメータλの値を設定する。この例において、フィルタ調整部170は、調整パラメータλの初期値を「1.0」に設定しおく。そして、フィルタ調整部170は、入力されるフレーム内の全サンプル値(フレームデータ)が量子化される際における量子化部150のクリップ回数をカウントする。そして、フィルタ調整部170は、そのクリップ回数が予め定められた閾値Tc以上である場合には、調整パラメータλの下限を「0.3」として、調整パラメータλに「0.9」を乗じて再度、現在のフレームに対する量子化を行う。そして、フィルタ調整部170は、調整パラメータλが「0.3」未満になるか、閾値Tc未満になるまで、再量子化を繰り返す。なお、フィルタ調整部170は、特許請求の範囲に記載のパラメータ設定部の一例である。
このように、フィードバック演算部R(z)200は、加算器210および線形予測フィルタB(z)220により全極モデルに基づく線形予測フィルタ(1/(1−B(z))が構成される。このため、式2に示した伝達関数R(z)とは異なり、予測フィルタP(z)110の次数Npに制限されることなく、独自にB(z)の次数Nbを高く設定することができる。これにより、予測フィルタP(z)110の次数Npが低い場合または限られた予測フィルタパターンにより予測信号を生成する場合であっても、復号後における量子化雑音の周波数特性の波形を入力音声信号X(z)に近い波形にすることができる。
また、予測フィルタP(z)230を設けることによって、予測フィルタP(z)110に起因する量子化雑音の周波数特性を平坦なものにすることができる。このため、図16のように、次数Npの低い予測フィルタ(z)110などにより量子化雑音の周波数特性が不適切なものとなる場合であっても、予測フィルタP(z)110による影響を受けることなく、量子化雑音の周波数特性を適切に変調することができる。すなわち、全極モデルに基づく線形予測フィルタ(1/(1−B(z))のみの特性によって、量子化雑音の周波数特性を制御することができるようになる。
また、量子化部150のクリップ頻度に基づいて線形予測フィルタB(z)220における調整パラメータλを調整することによって、量子化部150のクリップ頻度を低減することができる。これにより、符号化による音質劣化を軽減することができる。
次に本発明の第1の実施の形態における音声符号化装置100におけるフィルタ調整部170の動作について図面を参照して説明する。
[調整パラメータの設定方法の例]
図2は、本発明の第1の実施の形態におけるフィルタ調整部170による調整パラメータの設定方法の処理手順の一例を示すフローチャートである。
まず、フィルタ調整部170により、線形予測フィルタB(z)220における調整パラメータλの値が初期値「0.8」に設定される(ステップS911)。次に、フィルタ調整部170においてクリップ回数Clip_Cntが初期値「0」に設定される(ステップS912)。なお、2回目以降は、前のフレームに対する量子化部150におけるクリップ回数の値がクリップ回数Clip_Cntに設定されている。
次に、フィルタ調整部170においてクリップ回数Clip_Cntの値が予め定められた閾値Ta以上であるか否かが判断される(ステップS913)。そして、クリップ回数Clip_Cntの値が閾値Ta未満である場合には、一定の値Δλ、例えば「0.001」が調整パラメータλの値に加算されて、その加算された値が線形予測フィルタB(z)220に設定される(ステップS919)。
一方、クリップ回数Clip_Cntの値が閾値Ta以上である場合には、クリップ回数Clip_Cntの値が予め定められた閾値Tbより大きいか否かが判断される(ステップS914)。そして、クリップ回数Clip_Cntの値が閾値Tb以下である場合には、ステップS916に進む。一方、クリップ回数Clip_Cntの値が閾値Tbより大きい場合には、一定の値Δλ、例えば「0.001」が調整パラメータλの値から減算されて、その減算された値が線形予測フィルタB(z)220に設定される(ステップS915)。
次に、量子化部150により、量子化の対象であるフレームの各サンプル値(フレームデータ)が量子化される(ステップS916)。このとき、フィルタ調整部170において、そのフレームに対する量子化部150におけるクリップの回数がカウントされ、そのカウントされた値がクリップ回数Clip_Cntに設定される(ステップS917)。
その後、量子化すべき次のフレームが有るか否かが判断される(ステップS918)。そして、次のフレームがある場合には、ステップS912に戻り、前のフレームにおけるクリップ回数Clip_Cntに基づいて調整パラメータλの値が設定される。一方、次のフレームがない場合には、フィルタ調整部170による調整パラメータλの設定処理が終了する。
[調整パラメータの設定方法の変形例]
図3は、本発明の第1の実施の形態におけるフィルタ調整部170による調整パラメータの設定方法の処理手順の変形例を示すフローチャートである。
まず、フィルタ調整部170により、線形予測フィルタB(z)220における調整パラメータλの値が「1.0」に設定される(ステップS921)。次に、量子化部150により、量子化の対象となる現在のフレームにおける各サンプル値が量子化される(ステップS922)。そして、フィルタ調整部170において、量子化部150におけるクリップ頻度がカウントされ、このクリップ回数が予め定められた閾値Tcより小さいか否かが判断される(ステップS923)。そして、クリップ回数が閾値Tc未満である場合には、現在のフレームに対する量子化の処理を終了する。
一方、クリップ回数が閾値Tc以上である場合には、調整パラメータλの値に「0.9」を乗じた値が線形予測フィルタB(z)220に設定される(ステップS924)。次に、フィルタ調整部170において、その算出された調整パラメータλの値が「0.3」以上であるか否かが判断される(ステップS925)。そして、調整パラメータλの値が「0.3」以上である場合には、ステップS912に戻り、再度、現在のフレームに対して量子化部150により量子化が行われ、そのクリップ回数が閾値Tc未満になるまで繰り返し行われる。一方、調整パラメータλの値が「0.3」未満である場合には、現在のフレームに対する量子化処理を終了して、次のフレームに対する量子化処理を行う。
このように、本発明の第1の実施の形態では、フィードバック演算部R(z)200において全極モデルに基づく線形予測フィルタ(1/(1−B(z))を構成することにより、復号後における量子化雑音の周波数特性の波形を入力音声信号に合せることができる。これにより、聴覚マスキング効果が働き、耳障りな雑音を軽減することができる。なお、全極モデルに基づく線形予測フィルタ(1/(1−B(z))では、量子化雑音の周波数特性における谷の部分を制御することが困難であり、入力音声信号における谷の部分において量子化雑音のレベルが入力音声信号より高くなってしまう場合がある。このため、入力音声信号の谷の部分における量子化雑音を低く抑えるように改良したものが、次に説明する本発明の第2の実施の形態である。
<2.第2の実施の形態>
[音声符号化装置の構成例]
図4は、本発明の第2の実施の形態における音声符号化装置100の一構成例を示す図である。ここでは、図1に示した音声符号化装置100における減算器270代えて、信号線201乃至204と、減算器240と、補正フィルタC(z)260と、加算器271とが示されている。また、これらの構成以外の他の構成は、図1に示したものと同様であるため、同一符号を付してここでの説明を省略する。また、ここでは、信号線が実線により示され、データ線が点線により示されている。
この例において、フィードバック演算部R(z)200は、図1に示したフィードバック演算部R(z)200に含まれるフィルタ係数に加えて、量子化雑音における低周波数帯域のレベルを低下させるための補正フィルタにおけるフィルタ係数をさらに含む。すなわち、フィードバック演算部R(z)200は、式6に示す伝達関数により表わされる。
Figure 2010145593
ここで、P(z)およびB(z)は、式1および式5に基づいてそれぞれ構成される。C(z)は、式7に基づいて構成される。
Figure 2010145593
ここで、C(z)は、全極形フィルタによる量子化雑音の低域成分のレベルを低下させる補正フィルタである。cは、予め定められた補正フィルタ係数である。Ncは、補正フィルタC(z)の次数である。なお、このフィードバック演算部R(z)200は、特許請求の範囲に記載のフィードバック信号生成部の一例である。また、図4に示すフィードバック演算部R(z)200は、式6により実現される構成の一例であり、これに限られるものではない。
減算器240は、信号線201から供給される加算器210の出力と信号線202から供給される予測フィルタP(z)230の出力との差分を算出する減算器である。この減算器240は、加算器210の出力から予測フィルタP(z)230の出力を減算することにより、信号線203を介して補正フィルタC(z)260に出力する。
補正フィルタC(z)260は、全極形フィルタによって変調される復号後における量子化雑音の低域成分におけるレベルを低減するためのフィルタである。この補正フィルタC(z)260は、式7に基づいて構成される。この補正フィルタC(z)260は、例えば、量子化雑音の低域成分を補正するために、次式に示す2次のハイパスフィルタ(HPF:High Pass Filter)を構成する。
1−C(z)=1−0.6z-1+0.09z-2
この補正フィルタC(z)260は、上式に基づいて演算処理を行い、信号線204を介してその結果を加算器271に供給する。これにより、フィードバック演算部R(z)200の伝達関数には、分子に補正フィルタC(z)260の伝達関数が含まれることになり、量子化雑音の低域成分のレベルが抑制される。なお、補正フィルタC(z)260における補正フィルタ係数cは、特許請求の範囲に記載の補正フィルタにおけるフィルタ係数の一例である。
加算器271は、符号反転させた線形予測フィルタB(z)220の出力と、予測フィルタP(z)230の出力と、補正フィルタC(z)260の出力とを加算するものである。この加算器271は、その加算された信号をフィードバック信号Es(z)として減算器140に出力する。
ここで、フィードバック演算部R(z)200において補正フィルタC(z)260を設けた場合における量子化雑音の周波数特性の一例について次図を参照して説明する。
[補正フィルタを設けたことによる量子化雑音の周波数特性の例]
図5は、フィードバック演算部R(z)200において補正フィルタC(z)260を設けることによる復号後における量子化雑音の周波数特の一例を示す図である。図5(a)は、補正フィルタC(z)260を設けていない場合における量子化雑音の周波数特性を示す図である。図5(b)は、補正フィルタC(z)260を設けた場合における量子化雑音の周波数特性を示す図である。ここでは、縦軸をレベルとし、横軸を周波数とする。
図5(a)には、入力音声信号の周波数特性410が実線により示され、量子化雑音の周波数特性510が点線により示されている。入力音声信号の周波数特性410は、音声符号化装置100に入力された入力音声信号X(z)の周波数特性である。この入力音声信号の周波数特性410の波形は、3つのピーク(極)があり、周波数が低い順にそのピークのレベルが低くなっている。
量子化雑音の周波数特性510は、補正フィルタC(z)260を設けていない場合における復号後における量子化雑音の周波数特性である。この量子化雑音の周波数特性510は、入力音声信号の周波数特性410と同じ周波数付近にピーク(極)を有する。
このように、全極形フィルタにより量子化雑音を変調する場合には、0Hz付近の帯域において量子化雑音の周波数特性510におけるレベルが入力音声信号の周波数特性410におけるレベルより高くなってしまうことが多い。この場合、低域における量子化雑音の影響により耳障りな雑音が聞こえ易くなってしまう。
図5(b)には、入力音声信号の周波数特性410が実線により示され、量子化雑音の周波数特性520が点線により示されている。ここでは、入力音声信号の周波数特性410は、図5(a)と同じ特性であるため、同一符号を付してここでの説明を省略する。量子化雑音の周波数特性420は、補正フィルタC(z)260をフィードバック演算部R(z)200に設けた場合における復号後における量子化雑音の周波数特性である。
このように、フィードバック演算部R(z)200に補正フィルタC(z)260を設けることによって、低い帯域において量子化雑音のレベルを入力音声信号に比べて抑えることができ、耳障りな雑音を軽減することができる。なお、この場合、量子化雑音の高域成分のレベルは若干上昇するが、人間の聴覚上、高域の雑音は聞こえ難いため、これによる影響は軽微である。
図6は、従来の音声符号化装置700による量子化雑音の周波数特性および図4に示したフィードバック演算部R(z)200の構成による量子化雑音の周波数特性の一例を示す図である。ここでは、入力音声信号の周波数特性410が実線により、量子化雑音の周波数特性520が点線により、従来の音声符号化装置700による量子化雑音の周波数特性840が破線により示されている。この例では、入力音声信号の周波数特性410および量子化雑音の周波数特性520は、図5(b)に示したものと同様であるため、同一符号を付してここでの説明を省略する。
従来の音声符号化装置700による量子化雑音の周波数特性840は、式2に基づいて構成されたフィードバック演算部R(z)760によって変調された量子化雑音の周波数特性である。この量子化雑音の周波数特性840は、ピーク(極)の数が2つであり、入力音声信号の周波数特性410より少ないものとなっている。また、この量子化雑音の周波数特性840は、低域において入力音声信号の周波数特性410より高いレベルとなっている。
このように、フィードバック演算部R(z)200では、予測フィルタP(z)110の次数Npが低い場合または固定された予測フィルタパターンを用いる場合であっても、入力音声信号における波形に合せることができる。さらに、フィードバック演算部R(z)200では、補正フィルタC(z)260を設けることによって、復号後における量子化雑音の低域成分のレベルを十分に抑制することができる。
このように、本発明の第2の実施の形態では、フィードバック演算部R(z)200に補正フィルタC(z)260を設けることによって、本発明の第1の実施の形態に比べて復号後における量子化雑音の低い帯域におけるレベルを低減することができる。これにより、量子化雑音の低域成分による耳障りな雑音を軽減することができる。なお、補正フィルタC(z)260を設けることによって、フィードバック演算部R(z)200により生成されるフィードバック信号Es(z)の値が大きくなり過ぎる場合がある。この場合、量子化部150におけるクリップ頻度が高くなってしまい、復号された音声が不自然なものとなってしまうことがある。このため、量子化部150におけるクリップ頻度を低く抑えるように改良したものが、次に説明する本発明の第3の実施の形態である。
<3.第3の実施の形態>
[音声符号化装置の構成例]
図7は、本発明の第3の実施の形態における音声符号化装置100の一構成例を示すブロック図である。ここでは、図4に示したフィルタ調整部170に代えて、フィルタ調整部171と、信号線205および206と、切替スイッチ250とが示されている。
フィルタ調整部171は、量子化部150におけるクリップ頻度に基づいて、フィードバック演算部R(z)200における補正フィルタC(z)260を有効にするか否かを判断するものである。すなわち、フィルタ調整部171は、フレームごとの量子化部150のクリップ頻度に基づいて、補正フィルタC(z)260の有無をフレームごとに切り替えるように切替スイッチ250を制御する。
このフィルタ調整部171は、例えば、現在のフレームに対する量子化部150のクリップ回数に基づいて、フィードバック演算部R(z)200における補正フィルタC(z)260を無効にするか否かを判断する。この例では、フィルタ調整部171は、現在のフレームデータが入力される前に切替スイッチ250をオンにしておく。そして、フィルタ調整部171は、量子化部150により現在のフレームデータが量子化されると、現在のフレームに対する量子化部150におけるクリップ回数をカウントする。次に、フィルタ調整部171は、そのカウントされたクリップ回数が予め定められた閾値Td以上である場合には、切替スイッチ250をオフにして再度、現在のフレームに対する量子化を行う。一方、現在のフレームにおける量子化部150のクリップ回数が閾値Td未満である場合には、次のフレームに対する量子化を行う。
また、フィルタ調整部171は、例えば、過去のフレームに対する量子化部150のクリップ回数に基づいて、フィードバック演算部R(z)200における補正フィルタC(z)260を有効または無効にする。この例では、フィルタ調整部171は、過去のフレームに対する量子化部150のクリップ回数が予め定められた閾値Te未満である場合には、切替スイッチ250をオンにして補正フィルタC(z)260を有効にする。一方、フィルタ調整部171は、量子化部150のクリップ回数が閾値Te以上である場合には、切替スイッチ250をオフにして補正フィルタC(z)260を無効にする。なお、フィルタ調整部171は、上述の動作以外は、フィルタ調整部170と同様の動作を行う。また、フィルタ調整部171は、特許請求の範囲に記載の補正フィルタ制御部の一例である。
切替スイッチ250は、フィルタ調整部171の制御に従って、補正フィルタC(z)260の有無を切り替えるものである。この切替スイッチ250は、フィルタ調整部171の制御に従って、信号線205を介して減算器240の出力を、信号線206を介して補正フィルタC(z)260に出力する。この切替スイッチ250は、例えば、スイッチがオンである場合には、減算器240の出力を補正フィルタC(z)260に出力する。なお、切替スイッチ250は、特許請求の範囲に記載の切替スイッチの一例である。
このように、本発明の第3の実施の形態では、フィルタ調整部171および切替スイッチ250を設けることによって、量子化部150におけるクリップ頻度に基づいて補正フィルタC(z)260の有無を切り替えることができる。これにより、量子化部150のクリップ頻度が高い場合には、クリップ頻度を抑えることにより不自然な音声になることを抑制することができ、クリップ頻度が低い場合には、量子化雑音の低域成分を低下させることにより耳障りな雑音を軽減することができる。
次に本発明の第3の実施の形態における音声符号化装置100におけるフィルタ調整部171の動作について図面を参照して説明する。
[フィルタ調整部による補正フィルタの有無の切替方法例]
図8は、本発明の第3の実施の形態におけるフィルタ調整部171によるフィードバック演算部R(z)200における補正フィルタC(z)260の有無の切替方法の処理手順例を示すフローチャートである。
まず、量子化の対象となるフレームが入力されて切替スイッチ250がオンに設定される(ステップS931)。次に、量子化部150により、入力されたフレームの各サンプル値が量子化される(ステップS932)。このとき、フィルタ調整部171において、入力されたフレームにおける量子化部150のクリップ回数がカウントされ、このクリップ回数が予め定められた閾値Td未満であるか否かが判断される(ステップS933)。そして、クリップ回数が閾値Td未満である場合には、量子化処理が終了して、次のフレームの処理が行われる。
一方、クリップ回数が閾値Td以上である場合には、フィルタ調整部171により、切替スイッチ250がオフに設定される(ステップS934)。そして、入力されたフレームが再度量子化され(ステップS935)、次のフレームの処理が行われる。
[フィルタ調整部による補正フィルタの有無の切替方法の変形例]
図9は、本発明の第3の実施の形態におけるフィルタ調整部171による補正フィルタC(z)260の有無の切替方法の処理手順の変形例を示すフローチャートである。
まず、フィルタ調整部171においてクリップ回数Clip_Cntが初期値、例えば「0」に設定される(ステップS941)。なお、2回目以降は、前のフレームに対する量子化部150におけるクリップ回数の値がクリップ回数Clip_Cntに設定されている。
次に、フィルタ調整部171においてクリップ回数Clip_Cntの値が予め定められた閾値Te以上であるか否かが判断される(ステップS942)。そして、クリップ回数Clip_Cntの値が閾値Te未満である場合には、フィルタ調整部171により、切替スイッチ250がオンに設定される(ステップS943)。一方、クリップ回数Clip_Cntの値が閾値Te以上である場合には、フィルタ調整部171により、切替スイッチ250がオフに設定される(ステップS947)。
次に、量子化部150により、フレームデータである一定数のサンプル値が量子化される(ステップS944)。このとき、フィルタ調整部171において、量子化されたフレームにおける量子化部150のクリップ回数がカウントされ、そのカウントされた値がクリップ回数Clip_Cntに設定される(ステップS945)。次に、量子化すべき次のフレームが有るか否かが判断される(ステップS946)。そして、次のフレームがある場合には、ステップS941に戻り、前のフレームにおけるクリップ回数Clip_Cntに基づいて補正フィルタC(z)260を有効にするか否かが判断される。一方、次のフレームがない場合には、フィルタ調整部171による補正フィルタC(z)260の有無の切替処理が終了する。
[音声符号化装置の構成の変形例]
図10は、本発明の第3の実施の形態の変形例における音声符号化装置100の構成を示すブロック図である。この音声符号化装置100は、図7に示した音声符号化装置100におけるフィルタ調整部170に代えて、パラメータ設定部310および補正フィルタ制御部320を備えている。ここでは、パラメータ設定部310および補正フィルタ制御部320以外の他の構成は、図7に示したものと同様であるため、同一符号を付してここでの説明を省略する。
パラメータ設定部310は、入力音声信号X(z)におけるスペクトルの極値振幅に基づいて線形予測フィルタB(z)220における調整パラメータλを設定するものである。ここにいうスペクトルの極値振幅とは、入力音声信号の周波数特性におけるスペクトル包絡成分以外の振幅成分のことをいう。このパラメータ設定部310は、入力音声信号X(z)におけるスペクトルの極値振幅をフレームごとに検出して、その検出された極値振幅に基づいて調整パラメータλの値をフレームごとに決定する。そして、このパラメータ設定部310は、その決定された調整パラメータλの値をフィードバック演算部R(z)200における線形予測フィルタB(z)220に設定する。なお、パラメータ設定部310は、特許請求の範囲に記載のパラメータ設定部の一例である。
補正フィルタ制御部320は、一定の帯域における入力音声信号X(z)と、復号後における量子化雑音とのレベルの比に基づいて補正フィルタC(z)260の要否を判断するものである。この補正フィルタ制御部320は、例えば、減算器160により生成された量子化誤差信号E(z)と、予測フィルタP(z)110およびフィードバック演算部R(z)200の伝達関数とを用いて式3に基づいて復号後における量子化雑音の周波数特性を計算する。また、この補正フィルタ制御部320は、例えば、式6を式3に代入することにより導出される次式に基づいて復号後における量子化雑音の周波数特性Ey(z)を算出する。
Ey(z)=(1−C(z))/(1−B(z))・E(z)
上式より、補正フィルタ制御部320は、線形予測フィルタB(z)220および補正フィルタC(z)260の伝達関数と、量子化誤差信号E(z)とに基づいて復号後における量子化雑音の周波数特性Ey(z)を計算する。すなわち、この補正フィルタ制御部320は、線形予測フィルタ係数bと、調整パラメータλと、補正フィルタ係数cと、量子化誤差信号E(z)とに基づいて復号後における量子化雑音を計算する。なお、ここでは、信号線321からの量子化誤差信号E(z)を用いて復号後における量子化雑音の周波数特性Ey(z)を計算する例について説明したが、量子化誤差信号E(z)を白色雑音であると想定し、E(z)=1として計算するようにしてもよい。
次に、この補正フィルタ制御部320は、その計算された低域における量子化雑音のレベル(Noise)と、低域における入力音声信号X(z)のレベル(Signal)とのレベル比であるS/Nをフレームごとに算出する。そして、補正フィルタ制御部320は、フレームごとに、その算出されたS/Nに基づいて補正フィルタC(z)260の有無を切り替えるように切替スイッチ250を制御する。
この補正フィルタ制御部320は、例えば、1つ前のフレームにおいて算出されたS/Nが予め定められた閾値Tf未満である場合には、切替スイッチ250をオンにして補正フィルタC(z)260を有効にする。一方、S/Nが閾値Tfより大きい場合には、切替スイッチ250をオフにして補正フィルタC(z)260を無効にする。なお、補正フィルタ制御部320は、特許請求の範囲に記載の補正フィルタ制御部の一例である。
[入力音声信号におけるスペクトルの極値振幅の検出手法の例]
図11は、本発明の第3の実施の形態の変形例におけるパラメータ設定部310による入力音声信号のスペクトルにおける極値振幅の検出手法に関する観念図である。ここでは、入力音声信号の周波数特性420が実線により、スペクトル包絡線430が点線により、量子化雑音の周波数特性530が破線により示されている。また、ここでは、縦軸をレベルとし、横軸を周波数とする。
入力音声信号の周波数特性420は、音声符号化装置100に入力された入力音声信号X(z)の周波数特性である。この入力音声信号の周波数特性420は、多くのピーク(極)を有する複雑な波形の周波数特性である。このような入力音声信号の周波数特性におけるスペクトル包絡成分以外の振幅成分、例えば隣接する極大点P1と極小点P2との振れ幅を、ここでは極値振幅という。なお、このような入力音声信号の周波数特性は、例えば、周期成分(ピッチ)が強い入力音声信号などに現われる。
スペクトル包絡線430は、LPC分析部180により推定されたスペクトル包絡情報に基づいて生成される入力音声信号のスペクトル包絡線である。このLPC分析部180によって推定されるスペクトル包絡線430は、入力音声信号の周波数特性420の極値振幅(隣接する極大点と極小点との振れ幅)の中心付近を通るように生成される。量子化雑音の周波数特性530は、フィードバック演算部R(z)200によって変調された復号後における量子化雑音の周波数特性である。
このように入力音声信号におけるスペクトルの極値振幅が大きい場合には、量子化雑音の周波数特性530は、スペクトル包絡線430に基づいて変調されるため、量子化雑音の一部の帯域において入力音声信号のレベルを超えてしまうことがある。このため、入力音声信号におけるスペクトルの極値振幅、例えば各ピークの極大レベルP1と極小レベルP2とのレベル差の平均を検出し、その検出結果に基づいて調整パラメータλを決定する。例えば、入力音声信号におけるスペクトルの極値振幅が大きいほど、調整パラメータλを小さくし、スペクトルの極値振幅が小さいほど、調整パラメータλを大きくする。なお、入力音声信号におけるスペクトルの極値振幅の検出においては、LPC分析部180により推定されたスペクトル包絡情報に基づいて入力音声信号のスペクトル包絡成分を除去することによって極値振幅成分のみを抽出する。そして、その抽出された極値振幅成分に基づいて入力音声信号におけるスペクトルの極値振幅を検出するようにしてもよい。また、ここでは、極値振幅を用いて調整パラメータλを決定する例について説明したが、極値振幅に代えて、ケプストラム分析による入力音声信号のピッチ成分の大きさやピッチ分析による入力音声信号のピッチ強度などを用いるようにしてもよい。
[フィルタ調整部による補正フィルタの有無の切替方法例]
図12は、本発明の第3の実施の形態の変形例における補正フィルタ制御部320による補正フィルタC(z)260の有無の切替方法の処理手順の一例を示すフローチャートである。
まず、補正フィルタ制御部320において低域におけるS/Nの初期値が設定される(ステップS951)。次に、補正フィルタ制御部320において、その低域におけるS/Nの値が予め定められた閾値Tf以上であるか否かが判断される(ステップS952)。そして、S/Nの値が閾値Tf未満である場合には、補正フィルタ制御部320により、切替スイッチ250がオンに設定される(ステップS953)。一方、S/Nの値が閾値Tf以上である場合には、補正フィルタ制御部320により、切替スイッチ250がオフに設定される(ステップS957)。
次に、量子化部150により、フレームデータである一定数のサンプル値が量子化される(ステップS954)。続いて、補正フィルタ制御部320において、減算器160により生成された量子化誤差信号E(z)と、フィードバック演算部R(z)200および予測フィルタP(z)110の伝達関数とに基づいて低域における量子化雑音の周波数特性が計算される。あるいは、減算器160により生成された量子化誤差信号E(z)と、線形予測フィルタB(z)220および補正フィルタC(z)260の伝達関数とに基づいて低域における量子化雑音の周波数特性が計算される。そして、補正フィルタ制御部320において、その計算された量子化雑音と入力音声信号とのレベル比であるS/Nの値が算出される(ステップS955)。
次に、量子化すべき次のフレームが有るか否かが判断される(ステップS956)。そして、次のフレームがある場合には、ステップS951に戻り、前のフレームにおけるS/Nの値に基づいて、補正フィルタC(z)260を有効にするか否かが判断される。一方、次のフレームがない場合には、補正フィルタ制御部320による補正フィルタC(z)260の有無の切替処理が終了する。
このように、本発明の第3の実施の形態の変形例では、パラメータ設定部310を設けることによって、入力音声信号の周波数特性の極値振幅に応じて調整パラメータλを設定することができる。また、補正フィルタ制御部320を設けることによって、低域におけるS/N値に基づいて、適切に補正フィルタC(z)260の要否を判断することができる。
このように、本発明の実施の形態によれば、フィードバック演算部R(z)200に全極形フィルタにおける線形予測フィルタB(z)220および補正フィルタC(z)260を設けることによって、復号後における量子化雑音を適切に制御することができる。これにより、符号化に伴う音質劣化を軽減することができる。
なお、本発明の実施の形態では、音声符号化装置100における量子化雑音の周波数特性の制御について説明したが、音響符号装置および情報符号化装置にも適用することができる。
なお、本発明の実施の形態は本発明を具現化するための一例を示したものであり、上述のように特許請求の範囲における発明特定事項とそれぞれ対応関係を有する。ただし、本発明は実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変形を施すことができる。
また、本発明の実施の形態において説明した処理手順は、これら一連の手順を有する方法として捉えてもよく、また、これら一連の手順をコンピュータに実行させるためのプログラム乃至そのプログラムを記憶する記録媒体として捉えてもよい。この記録媒体として、例えば、CD(Compact Disc)、MD(MiniDisc)、DVD(Digital Versatile Disk)、メモリカード、ブルーレイディスク(Blu-ray Disc(登録商標))等を用いることができる。
本発明の第1の実施の形態における音声符号化装置の一構成例を示す図である。 本発明の第1の実施の形態におけるフィルタ調整部170による調整パラメータの設定方法の処理手順の一例を示すフローチャートである。 本発明の第1の実施の形態におけるフィルタ調整部170による調整パラメータの設定方法の処理手順の変形例を示すフローチャートである。 本発明の第2の実施の形態における音声符号化装置100の一構成例を示す図である。 フィードバック演算部R(z)200において補正フィルタC(z)260を設けることによる復号後における量子化雑音の周波数特の一例を示す図である。 従来の音声符号化装置700による量子化雑音の周波数特性および図4に示したフィードバック演算部R(z)200の構成による量子化雑音の周波数特性の一例を示す図である。 本発明の第3の実施の形態における音声符号化装置100の一構成例を示すブロック図である。 本発明の第3の実施の形態におけるフィルタ調整部171によるフィードバック演算部R(z)200における補正フィルタC(z)260の有無の切替方法の処理手順の一例を示すフローチャートである。 本発明の第3の実施の形態におけるフィルタ調整部171による補正フィルタC(z)260の有無の切替方法の処理手順の変形例を示すフローチャートである。 本発明の第3の実施の形態の変形例における音声符号化装置100の構成を示すブロック図である。 本発明の第3の実施の形態の変形例におけるパラメータ設定部310による入力音声信号のスペクトルにおける極値振幅の検出手法に関する観念図である。 本発明の第3の実施の形態の変形例における補正フィルタ制御部320による補正フィルタC(z)260の有無の切替方法の処理手順の一例を示すフローチャートである。 従来のADPCM方式による音声伝送システムの一構成例を示すブロック図である。 P(z)=R(z)である場合における音声復号装置800から出力される量子化雑音の一例を示す図である。 音声符号化装置700におけるフィードバック演算部R(z)760により変調された量子化雑音の周波数特性の一例を示す図である。 予測フィルタの次数が低く、かつ、予測フィルタのパターンの数が少ない場合において音声復号装置800から出力される量子化雑音の周波数特性の一例を示す図である。
符号の説明
100 音声符号化装置
101〜103、109、201〜206 信号線
110、230 予測フィルタ
120、140、160、240、270 減算器
130 予測フィルタ決定部
150 量子化部
170、171 フィルタ調整部
180 LCP分析部
200 フィードバック演算部
210、271 加算器
220 線形予測フィルタ
250 切替スイッチ
260 補正フィルタ
310 パラメータ設定部
320 補正フィルタ制御部

Claims (7)

  1. 入力音声信号のうち過去の音声信号と現在の音声信号を予測するための予測フィルタ係数とに基づいて予測信号を生成する予測信号生成部と、
    前記現在の音声信号と前記予測信号との差分を予測残差信号として生成する予測残差信号生成部と、
    前記予測残差信号に基づいて生成された量子化入力信号を量子化して量子化出力信号を生成する量子化部と、
    前記量子化入力信号と前記量子化出力信号との差分を量子化誤差信号として生成する量子化誤差信号生成部と、
    復号後における量子化雑音の周波数特性を制御するためのフィードバック信号を前記量子化誤差信号に基づいて生成するフィードバック信号生成部と、
    前記予測残差信号と前記フィードバック信号との差分を前記量子化入力信号として生成する量子化入力信号生成部とを具備し、
    前記フィードバック信号生成部は、前記入力音声信号により推定されたスペクトル包絡情報に基づく全極形フィルタにおけるフィルタ係数と前記全極形フィルタによる前記量子化雑音の周波数特性におけるピークレベルを調整するパラメータと前記予測フィルタ係数とを含む極零形フィルタにより構成される
    情報符号化装置。
  2. 前記フィードバック信号生成部は、前記量子化雑音における所定帯域のレベルを低下させるための補正フィルタにおけるフィルタ係数をさらに含む前記極零形フィルタにより構成される請求項1記載の情報符号化装置。
  3. 前記量子化部におけるフレームごとのクリップ頻度に基づいて前記補正フィルタの有無を前記フレームごとに切り替えるように制御する補正フィルタ制御部をさらに具備し、
    前記フィードバック信号生成部は、前記補正フィルタ制御部の制御に基づいて前記補正フィルタの有無を切り替える切替スイッチをさらに含む
    請求項2記載の情報符号化装置。
  4. 前記量子化誤差信号とフィードバック信号生成部の伝達関数とを用いて復号後における量子化雑音を計算して前記計算された量子化雑音と前記入力音声信号との所定帯域におけるレベルの比に基づいて前記補正フィルタの有無をフレームごとに切り替えるように制御する補正フィルタ制御部をさらに具備し、
    前記フィードバック信号生成部は、前記補正フィルタ制御部の制御に基づいて前記補正フィルタの有無を切り替える切替スイッチをさらに含む
    請求項2記載の情報符号化装置。
  5. 前記量子化部におけるフレームごとのクリップ頻度に基づいて前記パラメータの値を前記フレームごとに前記フィードバック信号生成部に設定するパラメータ設定部をさらに具備する請求項1記載の情報符号化装置。
  6. 前記入力音声信号におけるスペクトルの極値振幅をフレームごとに検出して前記検出された極値振幅に基づいて前記パラメータの値を前記フレームごとに前記フィードバック信号生成部に設定するパラメータ設定部をさらに具備する請求項1記載の情報符号化装置。
  7. 線形予測分析による前記スペクトル包絡情報に基づいて算出された線形予測フィルタ係数を前記全極形フィルタにおけるフィルタ係数として前記フィードバック信号生成部に供給する線形予測分析部をさらに具備する請求項1記載の情報符号化装置。
JP2008320779A 2008-12-17 2008-12-17 情報符号化装置 Expired - Fee Related JP4735711B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2008320779A JP4735711B2 (ja) 2008-12-17 2008-12-17 情報符号化装置
EP09252724A EP2200195A2 (en) 2008-12-17 2009-12-03 Information coding apparatus
US12/639,676 US8311816B2 (en) 2008-12-17 2009-12-16 Noise shaping for predictive audio coding apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008320779A JP4735711B2 (ja) 2008-12-17 2008-12-17 情報符号化装置

Publications (2)

Publication Number Publication Date
JP2010145593A true JP2010145593A (ja) 2010-07-01
JP4735711B2 JP4735711B2 (ja) 2011-07-27

Family

ID=42115958

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008320779A Expired - Fee Related JP4735711B2 (ja) 2008-12-17 2008-12-17 情報符号化装置

Country Status (3)

Country Link
US (1) US8311816B2 (ja)
EP (1) EP2200195A2 (ja)
JP (1) JP4735711B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012185329A (ja) * 2011-03-04 2012-09-27 Jvc Kenwood Corp 音声信号補正装置、音声信号補正方法及びプログラム
WO2013121793A1 (ja) * 2012-02-16 2013-08-22 日本放送協会 多チャネル音響システム、伝送装置、受信装置、伝送用プログラム、および受信用プログラム
WO2015166734A1 (ja) * 2014-05-01 2015-11-05 日本電信電話株式会社 符号化装置、復号装置、及びその方法、プログラム
WO2015166733A1 (ja) * 2014-05-01 2015-11-05 日本電信電話株式会社 符号化装置、復号装置、及びその方法、プログラム

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104143986B (zh) * 2013-05-07 2019-04-19 中兴通讯股份有限公司 一种Delta Sigma调制器及其实现调制的方法
KR101987565B1 (ko) * 2014-08-28 2019-06-10 노키아 테크놀로지스 오와이 오디오 파라미터 양자화
CN110246508B (zh) * 2019-06-14 2021-08-31 腾讯音乐娱乐科技(深圳)有限公司 一种信号调制方法、装置和存储介质
US11610598B2 (en) * 2021-04-14 2023-03-21 Harris Global Communications, Inc. Voice enhancement in presence of noise

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5762096A (en) * 1980-09-30 1982-04-14 Nippon Electric Co Method and device for transmitting adaptive voice signal
JPH01221021A (ja) * 1988-02-29 1989-09-04 Sony Corp ノイズシエーピング方法
JPH01261930A (ja) * 1988-04-13 1989-10-18 Kokusai Denshin Denwa Co Ltd <Kdd> 音声復号器のポスト雑音整形フィルタ
JPH02309820A (ja) * 1989-05-25 1990-12-25 Sony Corp デイジタル信号処理装置
JP2007006317A (ja) * 2005-06-27 2007-01-11 Pioneer Electronic Corp Σδ型ノイズシェーパ

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
JP3601074B2 (ja) * 1994-05-31 2004-12-15 ソニー株式会社 信号処理方法及び信号処理装置
US5774837A (en) * 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
KR100701452B1 (ko) * 2000-05-17 2007-03-29 코닌클리케 필립스 일렉트로닉스 엔.브이. 스펙트럼 모델링
US6996523B1 (en) * 2001-02-13 2006-02-07 Hughes Electronics Corporation Prototype waveform magnitude quantization for a frequency domain interpolative speech codec system
US7353168B2 (en) * 2001-10-03 2008-04-01 Broadcom Corporation Method and apparatus to eliminate discontinuities in adaptively filtered signals
US6751587B2 (en) * 2002-01-04 2004-06-15 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5762096A (en) * 1980-09-30 1982-04-14 Nippon Electric Co Method and device for transmitting adaptive voice signal
JPH01221021A (ja) * 1988-02-29 1989-09-04 Sony Corp ノイズシエーピング方法
JPH01261930A (ja) * 1988-04-13 1989-10-18 Kokusai Denshin Denwa Co Ltd <Kdd> 音声復号器のポスト雑音整形フィルタ
JPH02309820A (ja) * 1989-05-25 1990-12-25 Sony Corp デイジタル信号処理装置
JP2007006317A (ja) * 2005-06-27 2007-01-11 Pioneer Electronic Corp Σδ型ノイズシェーパ

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012185329A (ja) * 2011-03-04 2012-09-27 Jvc Kenwood Corp 音声信号補正装置、音声信号補正方法及びプログラム
WO2013121793A1 (ja) * 2012-02-16 2013-08-22 日本放送協会 多チャネル音響システム、伝送装置、受信装置、伝送用プログラム、および受信用プログラム
WO2015166734A1 (ja) * 2014-05-01 2015-11-05 日本電信電話株式会社 符号化装置、復号装置、及びその方法、プログラム
WO2015166733A1 (ja) * 2014-05-01 2015-11-05 日本電信電話株式会社 符号化装置、復号装置、及びその方法、プログラム
JPWO2015166733A1 (ja) * 2014-05-01 2017-04-20 日本電信電話株式会社 符号化装置、復号装置、及びその方法、プログラム、記録媒体
JPWO2015166734A1 (ja) * 2014-05-01 2017-04-20 日本電信電話株式会社 符号化装置、復号装置、及びその方法、プログラム、記録媒体

Also Published As

Publication number Publication date
US20100153121A1 (en) 2010-06-17
US8311816B2 (en) 2012-11-13
JP4735711B2 (ja) 2011-07-27
EP2200195A2 (en) 2010-06-23

Similar Documents

Publication Publication Date Title
JP4735711B2 (ja) 情報符号化装置
JP6239007B2 (ja) オーディオエンコーダ、オーディオデコーダ、符号化されたオーディオ情報を生成する方法、復号されたオーディオ情報を生成する方法、コンピュータプログラム及び信号適応帯域幅拡張を用いる符号化表現
CN105009209B (zh) 用于降低时域解码器中的量化噪声的装置和方法
RU2660605C2 (ru) Концепция заполнения шумом
KR102105044B1 (ko) 낮은 레이트의 씨이엘피 디코더의 비 음성 콘텐츠의 개선
KR100905585B1 (ko) 음성신호의 대역폭 확장 제어 방법 및 장치
KR20190060887A (ko) 노이즈 신호 처리 방법, 노이즈 신호 생성 방법, 인코더, 디코더, 및 인코딩/디코딩 시스템
JP5365380B2 (ja) 音響信号処理装置、その処理方法およびプログラム
KR20160120713A (ko) 복호 장치, 부호화 장치, 복호 방법, 부호화 방법, 단말 장치, 및 기지국 장치
JP5098530B2 (ja) 復号化装置、復号化方法および復号化プログラム
EP2869299B1 (en) Decoding method, decoding apparatus, program, and recording medium therefor
JP6626123B2 (ja) オーディオ信号を符号化するためのオーディオエンコーダー及び方法
KR102428419B1 (ko) 시간 노이즈 성형
JP4454604B2 (ja) 信号処理方法、信号処理装置及びプログラム
JP2020190606A (ja) 音声雑音除去装置及びプログラム
JP3936370B2 (ja) 音声復号化装置及びその方法
JP4556866B2 (ja) 高能率符号化プログラム及び高能率符号化装置
JP4767289B2 (ja) 信号処理方法、信号処理装置及びプログラム
KR20220006510A (ko) 사운드 신호에 있어서의 어택을 검출하고 검출된 어택을 코딩하는 방법들 및 디바이스들
JP3817562B2 (ja) 音声復号化装置及びその方法
JP3936369B2 (ja) 音声復号化装置及びその方法
JP2019035839A (ja) 音声処理装置、音声処理方法、及び音声処理プログラム
CN114171035A (zh) 抗干扰方法及装置
JP2006078882A (ja) 音声録音再生装置
JP2009188449A (ja) 量子化歪み低減装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101013

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101026

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110118

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110307

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110329

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110411

R151 Written notification of patent or utility model registration

Ref document number: 4735711

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140513

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees