JP2004015537A - Audio signal encoding device - Google Patents

Audio signal encoding device Download PDF

Info

Publication number
JP2004015537A
JP2004015537A JP2002167571A JP2002167571A JP2004015537A JP 2004015537 A JP2004015537 A JP 2004015537A JP 2002167571 A JP2002167571 A JP 2002167571A JP 2002167571 A JP2002167571 A JP 2002167571A JP 2004015537 A JP2004015537 A JP 2004015537A
Authority
JP
Japan
Prior art keywords
prediction
block
audio signal
blocks
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002167571A
Other languages
Japanese (ja)
Other versions
JP3886851B2 (en
Inventor
Yasuhito Watanabe
渡邊 泰仁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2002167571A priority Critical patent/JP3886851B2/en
Publication of JP2004015537A publication Critical patent/JP2004015537A/en
Application granted granted Critical
Publication of JP3886851B2 publication Critical patent/JP3886851B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide an audio signal encoding device for removing the cause of sound quality deterioration which occurs when a quantizing noise included in an audio signal is suppressed. <P>SOLUTION: The device comprises: a prediction gain calculating means 110 for generating a linear prediction coefficient of discrete coefficient information in each frequency at every block, and calculating a prediction gain being the ratio of a linear prediction coefficient level and the level of an error in linear prediction; a threshold determining means 120 for determining whether each calculated prediction gain exceeds a prescribed threshold; a block selecting means 130 for selecting the number of blocks which is not greater than a prescribed number from the objective blocks corresponding to the prediction gain which is judged to exceed the threshold; and a quantizing noise suppressing means 140 for filtering each piece of the discrete coefficient information, suppressing the quantizing noise and generating the signal of a prediction residual difference being a linear prediction error at every block. <P>COPYRIGHT: (C)2004,JPO

Description

【0001】
【発明の属する技術分野】
本発明は、オーディオ信号を符号化し、オーディオ信号に含まれる量子化雑音を抑圧するオーディオ信号符号化装置に関するものである。
【0002】
【従来の技術】
従来、この種のオーディオ信号符号化装置は、動画およびオーディオを対象とした規格であるMPEG(Moving Picture Experts Group)のオーディオ規格などに準拠したものが普及している。
MPEGオーディオ規格によって規定されている量子化雑音を抑圧する処理であるTNS(Temporal Noise Shaping)は、オーディオ信号を複数のブロックに分割し、分割されたブロックについて、ブロックの長さに応じて量子化雑音を抑圧する処理の対象となる周波数、予測係数長、あるいは予測ゲイン閾値を決定する。また、ブロックに含まれる離散コサイン係数の一種であるMDCT(Modified Discrete Cosine Transform)係数に基づいて、公知の線形予測分析を用いて予測ゲインを算出する。予測ゲインと上記予測ゲイン閾値との比較を行い、予測ゲインが閾値よりも大きいか否かを比較する。算出された予測係数から反射係数に変換した後、非線形量子化して得られた係数であるフィルタ係数を生成する。生成されたフィルタ係数をMDCT係数に対してフィルタ処理を施し、予測残差の信号を生成する。これらの処理により、量子化雑音は、時間軸上全体に均一に分布しているが、上記のフィルタ処理によって量子化雑音は時間軸上で出力レベルの大きいところに分布されるため、プリエコーを低減することができる。
【0003】
【発明が解決しようとする課題】
しかしながら、このような従来のMPEGオーディオ規格に準拠したオーディオ信号符号化装置では、低速の伝送速度でオーディオ信号を送信する場合、オーディオ信号に含まれる量子化雑音を過剰に抑圧してしまうと、この抑圧に伴い生成される情報量が増加するために、周波数成分を符号化する情報が減少し、復号化の際に音質劣化を生じるという問題があった。また、オーディオ信号の性質を無視して符号化しているために、オーディオ信号を復号化すると音質劣化を生じるという問題があった。
本発明は、このような問題を解決するためになされたもので、オーディオ信号に含まれる量子化雑音を抑圧する際に生じる音質劣化を低減することが可能となるオーディオ信号符号化装置を提供するものである。
【0004】
【課題を解決するための手段】
本発明のオーディオ信号符号化装置は、オーディオ信号を複数のブロックに分割し、このブロック毎に変換して得られる周波数領域の情報である各離散係数情報に基づいて、前記ブロック毎に各周波数での離散係数情報に対して線形予測して線形予測係数を生成し、前記線形予測係数のレベルと前記線形予測の誤差のレベルとの比である予測ゲインを前記ブロック毎に算出する予測ゲイン算出手段と、前記各ブロックについて算出された前記各予測ゲインが所定の閾値を越えたか否かを判断する閾値判断手段と、前記閾値を越えたと判断された前記予測ゲインに対応するブロックである対象ブロックの中から、所定個数以下の個数のブロックを選択するブロック選択手段と、選択された前記対象ブロックから得られるフィルタ係数に基づいて、前記各離散係数情報をフィルタリングして量子化雑音を抑圧し、前記ブロック毎の線形予測の誤差である予測残差の信号を生成する量子化雑音抑圧手段とを備え、前記線形予測係数の次数は、所定の次数である最大次数以下とする構成を有している。この構成により、予測ゲインが上記閾値を越えたと判断されたブロックである対象ブロックを選択し、オーディオ信号に含まれる量子化雑音を過剰に抑圧しないため、オーディオ信号に含まれる量子化雑音を抑圧する際に生じる音質劣化を低減することが可能となる。
【0005】
また、本発明のオーディオ信号符号化装置は、オーディオ信号を複数のブロックに分割し、このブロック毎に変換して得られる周波数領域の情報である各離散係数情報に基づいて、前記ブロック毎に各周波数での離散係数情報に対して線形予測して線形予測係数を生成し、前記線形予測係数のレベルと前記線形予測の誤差のレベルとの比である予測ゲインを前記ブロック毎に算出する予測ゲイン算出手段と、前記各ブロックについて算出された前記各予測ゲインが所定の閾値を越えたか否かを判断する閾値判断手段と、前記閾値を越えたと判断された前記予測ゲインに対応するブロックである対象ブロックの中から、所定個数以下の個数のブロックを選択するブロック選択手段と、選択された前記対象ブロックから得られるフィルタ係数に基づいて、前記各離散係数情報をフィルタリングして量子化雑音を抑圧し、前記ブロック毎の線形予測の誤差である予測残差の信号を生成する量子化雑音抑圧手段とを備え、前記線形予測係数の次数は、所定の次数である最大次数以下とし、また前記予測ゲイン算出手段は、前記各離散係数情報に基づいて統計情報を生成し、前記統計情報に応じて周波数帯域の範囲を決定し、決定された周波数帯域の範囲に含まれる前記ブロック毎の離散係数情報に基づいて、前記予測ゲインを前記ブロック毎に算出する構成を有している。この構成により、離散係数情報に基づいて統計情報を生成しオーディオ信号の性質に応じて周波数成分を符号化するため、復号化の際に音質劣化を抑止することが可能となる。
【0006】
また、本発明のオーディオ信号符号化装置は、オーディオ信号を複数のブロックに分割し、このブロック毎に変換して得られる周波数領域の情報である各離散係数情報に基づいて、前記ブロック毎に各周波数での離散係数情報に対して線形予測して線形予測係数を生成し、前記線形予測係数のレベルと前記線形予測の誤差のレベルとの比である予測ゲインを前記ブロック毎に算出する予測ゲイン算出手段と、前記各ブロックについて算出された前記各予測ゲインが所定の閾値を越えたか否かを判断する閾値判断手段と、前記閾値を越えたと判断された前記予測ゲインに対応するブロックである対象ブロックの中から、所定個数以下の個数のブロックを選択するブロック選択手段と、選択された前記対象ブロックから得られるフィルタ係数に基づいて、前記各離散係数情報をフィルタリングして量子化雑音を抑圧し、前記ブロック毎の線形予測の誤差である予測残差の信号を生成する量子化雑音抑圧手段とを備え、前記線形予測係数の次数は、所定の次数である最大次数以下とし、またサンプリング周波数と伝送速度とチャンネル数とに基づいて圧縮率を算出する圧縮率算出手段を備え、前記ブロック選択手段は、前記圧縮率に応じて前記対象ブロックを選択する個数である選択数を決定し、決定された選択数以下の個数のブロックを選択する構成を有している。この構成により、オーディオ信号を符号化した情報を送信する際の圧縮率に応じて、自動的に選択数を決定することが可能となる。
【0007】
また、本発明のオーディオ信号符号化装置は、オーディオ信号を複数のブロックに分割し、このブロック毎に変換して得られる周波数領域の情報である各離散係数情報に基づいて、前記ブロック毎に各周波数での離散係数情報に対して線形予測して線形予測係数を生成し、前記線形予測係数のレベルと前記線形予測の誤差のレベルとの比である予測ゲインを前記ブロック毎に算出する予測ゲイン算出手段と、前記各ブロックについて算出された前記各予測ゲインが所定の閾値を越えたか否かを判断する閾値判断手段と、前記閾値を越えたと判断された前記予測ゲインに対応するブロックである対象ブロックの中から、所定個数以下の個数のブロックを選択するブロック選択手段と、選択された前記対象ブロックから得られるフィルタ係数に基づいて、前記各離散係数情報をフィルタリングして量子化雑音を抑圧し、前記ブロック毎の線形予測の誤差である予測残差の信号を生成する量子化雑音抑圧手段とを備え、前記線形予測係数の次数は、所定の次数である最大次数以下とし、また前記予測ゲイン算出手段は、前記圧縮率に応じて前記最大次数を決定し、決定された最大次数に基づいて前記予測ゲインを前記ブロック毎に算出する構成を有している。この構成により、オーディオ信号を符号化した情報を送信する際の圧縮率に応じて、自動的に最大次数を決定することが可能となる。
【0008】
また、本発明のオーディオ信号符号化装置は、オーディオ信号を複数のブロックに分割し、このブロック毎に変換して得られる周波数領域の情報である各離散係数情報に基づいて、前記ブロック毎に各周波数での離散係数情報に対して線形予測して線形予測係数を生成し、前記線形予測係数のレベルと前記線形予測の誤差のレベルとの比である予測ゲインを前記ブロック毎に算出する予測ゲイン算出手段と、前記各ブロックについて算出された前記各予測ゲインが所定の閾値を越えたか否かを判断する閾値判断手段と、前記閾値を越えたと判断された前記予測ゲインに対応するブロックである対象ブロックの中から、所定個数以下の個数のブロックを選択するブロック選択手段と、選択された前記対象ブロックから得られるフィルタ係数に基づいて、前記各離散係数情報をフィルタリングして量子化雑音を抑圧し、前記ブロック毎の線形予測の誤差である予測残差の信号を生成する量子化雑音抑圧手段とを備え、前記線形予測係数の次数は、所定の次数である最大次数以下とし、また前記閾値判断手段は、前記圧縮率に応じて閾値を決定し、決定された閾値を越えたか否かを判断する構成を有している。この構成により、オーディオ信号を符号化した情報を送信する際の圧縮率に応じて、自動的に閾値を決定することが可能となる。
【0009】
また、本発明のオーディオ信号符号化装置は、オーディオ信号を複数のブロックに分割し、このブロック毎に変換して得られる周波数領域の情報である各離散係数情報に基づいて、前記ブロック毎に各周波数での離散係数情報に対して線形予測して線形予測係数を生成し、前記線形予測係数のレベルと前記線形予測の誤差のレベルとの比である予測ゲインを前記ブロック毎に算出する予測ゲイン算出手段と、前記各ブロックについて算出された前記各予測ゲインが所定の閾値を越えたか否かを判断する閾値判断手段と、前記閾値を越えたと判断された前記予測ゲインに対応するブロックである対象ブロックの中から、所定個数以下の個数のブロックを選択するブロック選択手段と、選択された前記対象ブロックから得られるフィルタ係数に基づいて、前記各離散係数情報をフィルタリングして量子化雑音を抑圧し、前記ブロック毎の線形予測の誤差である予測残差の信号を生成する量子化雑音抑圧手段とを備え、前記線形予測係数の次数は、所定の次数である最大次数以下とし、また前記閾値判断手段は、前記圧縮率が所定の値以下であったとき、および前記線形予測係数の次数に応じて閾値を決定し、決定された閾値を越えたか否かを判断する構成を有している。この構成により、オーディオ信号を符号化した情報を送信する際の圧縮率および前記線形予測係数の次数に応じて、自動的に閾値を決定することが可能となる。
【0010】
また、本発明のオーディオ信号符号化装置は、オーディオ信号を複数のブロックに分割し、このブロック毎に変換して得られる周波数領域の情報である各離散係数情報に基づいて、前記ブロック毎に各周波数での離散係数情報に対して線形予測して線形予測係数を生成し、前記線形予測係数のレベルと前記線形予測の誤差のレベルとの比である予測ゲインを前記ブロック毎に算出する予測ゲイン算出手段と、前記各ブロックについて算出された前記各予測ゲインが所定の閾値を越えたか否かを判断する閾値判断手段と、前記閾値を越えたと判断された前記予測ゲインに対応するブロックである対象ブロックの中から、所定個数以下の個数のブロックを選択するブロック選択手段と、選択された前記対象ブロックから得られるフィルタ係数に基づいて、前記各離散係数情報をフィルタリングして量子化雑音を抑圧し、前記ブロック毎の線形予測の誤差である予測残差の信号を生成する量子化雑音抑圧手段とを備え、前記線形予測係数の次数は、所定の次数である最大次数以下とし、さらに前記圧縮率に応じて、前記量子化雑音抑圧手段によって生成された前記予測残差の信号を復元し、復元された情報と、復元の基となった前記各離散係数情報との誤差を判断し、判断した結果に応じて前記予測残差の信号、あるいは前記各離散係数情報を出力する手段とを備えた構成を有している。この構成により、離散係数情報と量子化雑音を抑圧した予測残差の信号を復元し得られた情報との誤差を判断して出力する情報を決定するため、復号化の際に音質劣化を低減することが可能となる。
【0011】
【発明の実施の形態】
以下、本発明の実施の形態について、図面を用いて説明する。
図1は、本発明の第1の実施の形態のオーディオ信号符号化装置のブロック構成を示す図である。本発明の第1の実施の形態のオーディオ信号符号化装置100は、予測ゲインを生成する予測ゲイン算出手段110、予測ゲインが所定の閾値を越えるか否かを判断する閾値判断手段120、予測ゲインが所定の閾値を越えるブロックを所定の個数選択するブロック選択手段130、およびブロックに含まれる量子化雑音を抑圧する量子化雑音抑圧手段140によって構成される。
【0012】
予測ゲイン算出手段110は、ブロック毎に変換して得られる周波数領域の情報である各離散係数情報を入力し、下記の線形予測係数と、予測ゲインとを生成する手段である。ここでブロックとは、オーディオ信号を複数に分割したものである。離散係数情報は、MPEGの規格書などに記載されているMDCT(Modified Discrete Cosine Transform)係数でもよい。
【0013】
予測ゲイン算出手段110は、入力された各離散係数情報に基づいて、前記ブロック毎に各周波数での離散係数情報の線形予測をして線形予測係数を生成する。なお、線形予測係数の生成方法は、公知のLevinson−Durbinアルゴリズムあるいはその他の方法でもよい。また、線形予測の次数は、所定の次数である最大次数以下となるように生成される。
【0014】
予測ゲイン算出手段110は、生成した線形予測係数のレベルと線形予測の誤差のレベルとの比である予測ゲインをブロック毎に算出し、各ブロックに対応する予測ゲインを閾値判断手段120に出力する。予測ゲインとは、ブロック内に量子化雑音が含まれている可能性を示すものであり、この可能性が高いと予測ゲインも大きくなる。また、予測ゲインの算出方法は、MPEGの規格書などに記載されている。
【0015】
また、予測ゲイン算出手段110は、各離散係数情報に基づいて統計情報を生成し、前記統計情報に応じて、周波数帯域の範囲を決定し、決定された周波数帯域の範囲に含まれる前記ブロック毎の離散係数情報に基づいて、前記予測ゲインを前記ブロック毎に算出してもよい。周波数帯域の範囲を決定する方法としては、周波数軸を分割する単位であるスケールファクタバンドに含まれるスペクトルの分散の大きさに応じて周波数帯域の範囲を狭く制限してもよい。
【0016】
閾値判断手段120は、予測ゲイン算出手段110によって出力された各ブロックに対応する予測ゲインを入力とし、入力された各予測ゲインが所定の閾値を越えたか否かを判断し、判断の結果に関する情報(以下、判断情報と呼ぶ)をブロック選択手段130に出力する手段である。判断情報は、各ブロックに付与される所定の閾値を越えるか否かを示す情報でもよい。
【0017】
ブロック選択手段130は、閾値判断手段120によって出力された判断情報を入力とし、判断情報に基づいて、予測ゲインが上記閾値を越えたと判断されたブロックである対象ブロックのうち、ブロックから得られる予測ゲインが大きいものから順番に所定の個数である選択数以下となるように選択する手段である。例えば、閾値を越えたと判断された対象ブロック数が5、選択数が3であった場合、予測ゲインが大きいものから順番にブロックを3個選択する。また、閾値を越えたと判断された対象ブロック数が2、選択数が3であった場合、ブロックを2個選択する。
【0018】
ブロック選択手段130は、選択の結果に関する情報(以下、選択情報と呼ぶ)と各ブロックとを量子化雑音抑圧手段140に出力する。選択情報は、各ブロックに付与される選択したか否かを示す情報でもよい。
【0019】
量子化雑音抑圧手段140は、ブロック選択手段130によって出力された選択情報を入力とし、選択されたブロックからフィルタ係数を算出し、算出されたフィルタ係数を適用したフィルタで離散係数情報をフィルタリングして、量子化雑音を抑圧する手段である。
【0020】
量子化雑音抑圧手段140は、前記ブロック毎の線形予測の誤差である予測残差の信号を生成し出力する。量子化雑音を抑圧する処理であるTNS(Temporal Noise Shaping)は、MPEGの規格書などに記載されている。
【0021】
以上説明したように、本発明の第1の実施の形態に係るオーディオ信号符号化装置は、予測ゲインが上記閾値を越えたと判断されたブロックである対象ブロックを選択し、オーディオ信号に含まれる量子化雑音を過剰に抑圧しないため、オーディオ信号に含まれる量子化雑音を抑圧する際に生じる音質劣化を低減することが可能となる。また、離散係数情報に基づいて統計情報を生成しオーディオ信号の性質に応じてオーディオ信号を符号化するため、復号化の際に音質劣化を低減することが可能となる。
【0022】
図2は、本発明の第2の実施の形態のオーディオ信号符号化装置のブロック構成を示す図である。本発明の第2の実施の形態のオーディオ信号符号化装置200は、予測ゲインを生成する予測ゲイン算出手段210、予測ゲインが所定の閾値を越えるか否かを判断する閾値判断手段220、ブロックを所定の個数選択するブロック選択手段230、ブロックに含まれる量子化雑音を抑圧する量子化雑音抑圧手段140、およびサンプリング周波数と伝送速度とチャンネル数とに基づいて圧縮率を算出する圧縮率算出手段250によって構成される。
なお、本発明の第2の実施の形態に係るオーディオ信号符号化装置200を構成する手段のうち、本発明の第1の実施の形態に係るオーディオ信号符号化装置100を構成する手段と同様の処理を行うものには同一の符号を付し、その説明を省略する。
【0023】
予測ゲイン算出手段210は、圧縮率算出手段250によって出力された圧縮率とブロック毎に変換して得られる周波数領域の情報である各離散係数情報とを入力し、下記の線形予測係数と、予測ゲインとを生成する手段である。ここでブロックとは、オーディオ信号を複数に分割したものである。離散係数情報は、MPEGの規格書などに記載されるMDCT(Modified Discrete Cosine Transform)係数でもよい。
【0024】
また、予測ゲイン算出手段210は、入力された圧縮率に応じて最大次数を決定する。例えば、最大次数を決定する方法としては、圧縮率と最大次数とが対応する表を予め作成しておき、この表に従って最大次数を求めてもよい。
【0025】
予測ゲイン算出手段210は、入力された各離散係数情報に基づいて、前記ブロック毎に各周波数での離散係数情報の線形予測をして線形予測係数を生成する。なお、線形予測係数の生成方法は、公知のLevinson−Durbinアルゴリズムあるいはその他の方法でもよい。また、線形予測係数の次数は、決定された最大次数以下となるように生成される。
【0026】
予測ゲイン算出手段210は、生成した線形予測係数のレベルと線形予測の誤差のレベルとの比である予測ゲインをブロック毎に算出し、各ブロックに対応する予測ゲインを閾値判断手段220に出力する。予測ゲインとは、ブロック内に量子化雑音が含まれている可能性を示すものであり、この可能性が高いと予測ゲインも大きくなる。また、予測ゲインの算出方法は、MPEGの規格書などに記載されている。
【0027】
また、予測ゲイン算出手段210は、各離散係数情報に基づいて統計情報を生成し、前記統計情報に応じて、周波数帯域の範囲を決定し、決定された周波数帯域の範囲に含まれる前記ブロック毎の離散係数情報に基づいて、前記予測ゲインを前記ブロック毎に算出してもよい。周波数帯域の範囲を決定する方法としては、周波数軸を分割する単位であるスケールファクタバンドに含まれるスペクトルの分散の大きさに応じて周波数帯域の範囲を狭く制限してもよい。
【0028】
閾値判断手段220は、圧縮率算出手段250によって出力された圧縮率と、予測ゲイン算出手段110によって出力された各ブロックに対応する予測ゲインを入力とし、入力された圧縮率に応じて閾値を決定する手段である。例えば、閾値を決定する方法としては、圧縮率と閾値とが対応する表を予め作成しておき、この表に従って閾値を求めてもよい。
【0029】
また、閾値判断手段220は、入力された圧縮率が所定の値以下であったとき、前記ブロック毎の線形予測係数の次数に応じて、前記閾値を決定する。例えば、この線形予測係数の次数が大きい場合、量子化雑音を抑圧する際に、この抑圧に伴い生成される情報量が増加することがある。よって、線形予測係数の次数が大きい場合、閾値も大きな値となるように決定する。
【0030】
閾値判断手段220は、入力された各予測ゲインが上記で決定された閾値を越えたか否かを判断し、判断の結果に関する情報(以下、判断情報と呼ぶ)と各ブロックとをブロック選択手段230に出力する。判断情報は、各ブロックに付与される所定の閾値を越えるか否かを示す情報でもよい。
【0031】
ブロック選択手段230は、圧縮率算出手段250によって出力された圧縮率と、閾値判断手段220によって出力された判断情報を入力とし、入力された圧縮率に応じて所定の個数である選択数を決定する手段である。例えば、選択数を決定する方法としては、圧縮率と選択数とが対応する表を予め作成しておき、この表に従って選択数を求めてもよい。
【0032】
また、ブロック選択手段230は、入力された判断情報に基づいて、予測ゲインが上記閾値を越えたと判断されたブロックである対象ブロックのうち、ブロックから得られる予測ゲインが大きいものから順番に所定の個数である選択数以下となるように選択する。
【0033】
ブロック選択手段230は、選択の結果に関する情報(以下、選択情報と呼ぶ)と各ブロックとを量子化雑音抑圧手段140に出力する。選択情報は、各ブロックに付与される選択したか否かを示す情報でもよい。
【0034】
圧縮率算出手段250は、サンプリング周波数と伝送速度とチャンネル数とに基づいて圧縮率を算出し、圧縮率を必要とする手段に出力する手段である。例えば、サンプリング周波数をfs、伝送速度をbr、チャンネル数をchとして表すと、圧縮率は、以下に示す式で求められる。
圧縮率=(fs/br)/ch
【0035】
以上説明したように、本発明の第2の実施の形態に係るオーディオ信号符号化装置は、オーディオ信号を符号化した情報を送信する際の圧縮率に応じて自動的に最大次数、閾値、または選択数を決定することが可能となる。
【0036】
図3は、本発明の第3の実施の形態のオーディオ信号符号化装置のブロック構成を示す図である。本発明の第3の実施の形態のオーディオ信号符号化装置300は、予測ゲインを生成する予測ゲイン算出手段210、予測ゲインが所定の閾値を越えるか否かを判断する閾値判断手段220、ブロックを所定の個数選択するブロック選択手段230、ブロックに含まれる量子化雑音を抑圧する量子化雑音抑圧手段140、圧縮率を算出する圧縮率算出手段250、および量子化雑音を抑圧した予測残差の信号に基づいて予測残差の信号を出力するか否かを判断する復号化判断手段360によって構成される。
なお、本発明の第3の実施の形態に係るオーディオ信号符号化装置300を構成する手段のうち、本発明の第2の実施の形態に係るオーディオ信号符号化装置200を構成する手段と同様の処理を行うものには同一の符号を付し、その説明を省略する。
【0037】
復号化判断手段360は、量子化雑音抑圧手段140によって出力された予測残差の信号と、予測ゲイン算出手段210によって出力された圧縮率算出手段250によって出力された圧縮率を入力とし、入力されたこれらの情報を処理する手段である。
【0038】
また、復号化判断手段360は、予測残差の信号を復元し得られた情報と、前記ブロックに含まれるオーディオ信号を前記ブロック毎に変換して得られる周波数領域の情報である前記ブロック毎の離散係数情報との誤差を算出する。
【0039】
例えば、予測残差の信号を復元する方法としては、圧縮率に応じて予測残差の信号に含まれるスペクトル数のみを復元し、すなわち圧縮率が非常に小さい場合、量子化できるスペクトル数が少なくなるため、圧縮率が小さい場合は,復元するスペクトル数も少なくする。また、符号化の際に周波数軸を分割する単位であるスケールファクタバンドでスペクトルの絶対値が大きいものから順に選択し、予測残差の信号を復元する。
例えば、予測残差の信号を復元し得られた情報と、離散係数情報との誤差を算出する方法としては、各スケールファクタバンドに含まれるエネルギー値等を使用し算出する。
【0040】
復号化判断手段360は、算出した上記誤差を判断し、予測残差の信号、あるいは離散係数情報を出力する。例えば、上記各スケールファクタバンドに含まれるエネルギー値によって得られた予測残差の信号を復元し得られた情報と、離散係数情報との誤差が基準値を越えていた場合、復号化の際に音質劣化を生じるため、予測残差の信号を出力せずに離散係数情報を出力する。上記誤差が基準値を以内であった場合、予測残差の信号を出力する。
【0041】
以上説明したように、本発明の第3の実施の形態に係るオーディオ信号符号化装置は、離散係数情報と量子化雑音を抑圧した予測残差の信号を復元し得られた情報との誤差を判断して出力する情報を決定するため、復号化の際に音質劣化を抑止することが可能となる。
【0042】
【発明の効果】
以上説明したように、本発明は、オーディオ信号に含まれる量子化雑音を抑圧する際に生じる音質劣化を低減するオーディオ信号符号化装置を提供することができるものである。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態のオーディオ信号符号化装置のブロック構成を示す図
【図2】本発明の第2の実施の形態のオーディオ信号符号化装置のブロック構成を示す図
【図3】本発明の第3の実施の形態のオーディオ信号符号化装置のブロック構成を示す図
【符号の説明】
100、200、300 オーディオ信号符号化装置
110、210 予測ゲイン算出手段
120、220 閾値判断手段
130、230 ブロック選択手段
140 量子化雑音抑圧手段
250 圧縮率算出手段
360 復号化判断手段
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an audio signal encoding device that encodes an audio signal and suppresses quantization noise included in the audio signal.
[0002]
[Prior art]
2. Description of the Related Art Conventionally, an audio signal encoding apparatus of this type that conforms to an audio standard such as MPEG (Moving Picture Experts Group), which is a standard for moving images and audio, has been widely used.
TNS (Temporal Noise Shaping), which is a process for suppressing quantization noise defined by the MPEG audio standard, divides an audio signal into a plurality of blocks and quantizes the divided blocks according to the block length. A target frequency, a prediction coefficient length, or a prediction gain threshold for noise suppression processing is determined. Further, a prediction gain is calculated by using a known linear prediction analysis based on an MDCT (Modified Discrete Cosine Transform) coefficient which is a kind of discrete cosine coefficient included in the block. The prediction gain is compared with the above-mentioned prediction gain threshold value, and whether or not the prediction gain is larger than the threshold value is compared. After converting the calculated prediction coefficient into a reflection coefficient, a filter coefficient, which is a coefficient obtained by nonlinear quantization, is generated. The generated filter coefficients are subjected to a filtering process on the MDCT coefficients to generate a prediction residual signal. By these processes, the quantization noise is uniformly distributed on the whole time axis, but since the quantization noise is distributed to a place where the output level is large on the time axis by the above filter processing, the pre-echo is reduced. can do.
[0003]
[Problems to be solved by the invention]
However, in such a conventional audio signal encoding device conforming to the MPEG audio standard, when an audio signal is transmitted at a low transmission rate, if the quantization noise included in the audio signal is excessively suppressed, the Since the amount of information generated due to the suppression increases, there is a problem that information for encoding the frequency component decreases and the sound quality deteriorates at the time of decoding. In addition, since the encoding is performed ignoring the properties of the audio signal, there is a problem that the audio quality is deteriorated when the audio signal is decoded.
The present invention has been made in order to solve such a problem, and provides an audio signal encoding device capable of reducing sound quality degradation that occurs when suppressing quantization noise included in an audio signal. Things.
[0004]
[Means for Solving the Problems]
The audio signal encoding apparatus according to the present invention divides an audio signal into a plurality of blocks, and converts each block into blocks based on discrete coefficient information that is information of a frequency domain obtained by converting each block. Predictive gain calculating means for performing linear prediction on the discrete coefficient information to generate a linear prediction coefficient, and calculating a prediction gain, which is a ratio between the level of the linear prediction coefficient and the level of the error of the linear prediction, for each of the blocks And a threshold determination unit that determines whether each of the prediction gains calculated for each of the blocks exceeds a predetermined threshold, and a target block that is a block corresponding to the prediction gain that is determined to have exceeded the threshold. From among them, block selecting means for selecting a number of blocks equal to or less than a predetermined number, based on a filter coefficient obtained from the selected target block. And a quantization noise suppressing unit that suppresses quantization noise by filtering the discrete coefficient information and generates a prediction residual signal that is an error of linear prediction for each block, wherein an order of the linear prediction coefficient is , A predetermined order or less. With this configuration, a target block that is a block whose prediction gain has been determined to exceed the threshold value is selected, and quantization noise included in the audio signal is suppressed because quantization noise included in the audio signal is not excessively suppressed. It is possible to reduce the sound quality deterioration that occurs at the time.
[0005]
Further, the audio signal encoding device of the present invention divides the audio signal into a plurality of blocks, and converts A prediction gain that performs linear prediction on discrete coefficient information at a frequency to generate a linear prediction coefficient, and calculates a prediction gain that is a ratio between a level of the linear prediction coefficient and an error level of the linear prediction for each of the blocks; Calculating means, threshold value determining means for determining whether each of the predicted gains calculated for each of the blocks has exceeded a predetermined threshold, and an object which is a block corresponding to the predicted gain determined to have exceeded the threshold. A block selecting means for selecting a number of blocks equal to or less than a predetermined number from the blocks; And a quantization noise suppressing unit that suppresses quantization noise by filtering the discrete coefficient information and generates a prediction residual signal that is a linear prediction error for each block. The order is equal to or less than a maximum order which is a predetermined order, and the prediction gain calculating means generates statistical information based on the discrete coefficient information, determines a frequency band range according to the statistical information, and determines The prediction gain is calculated for each of the blocks based on the discrete coefficient information for each of the blocks included in the range of the set frequency band. With this configuration, statistical information is generated based on the discrete coefficient information, and the frequency component is encoded according to the properties of the audio signal. Therefore, it is possible to suppress sound quality degradation during decoding.
[0006]
Further, the audio signal encoding apparatus of the present invention divides an audio signal into a plurality of blocks, and converts each of the blocks into blocks based on each discrete coefficient information that is frequency domain information obtained by converting the blocks. A prediction gain that performs linear prediction on discrete coefficient information at a frequency to generate a linear prediction coefficient, and calculates a prediction gain that is a ratio between a level of the linear prediction coefficient and an error level of the linear prediction for each of the blocks; Calculating means, threshold value determining means for determining whether each of the predicted gains calculated for each of the blocks has exceeded a predetermined threshold, and an object which is a block corresponding to the predicted gain determined to have exceeded the threshold. A block selecting means for selecting a number of blocks equal to or less than a predetermined number from the blocks; And a quantization noise suppressing unit that suppresses quantization noise by filtering the discrete coefficient information and generates a prediction residual signal that is a linear prediction error for each block. The order is equal to or less than the maximum order, which is a predetermined order, and further includes a compression ratio calculating unit that calculates a compression ratio based on a sampling frequency, a transmission speed, and the number of channels, and the block selecting unit is configured to change the compression ratio according to the compression ratio The number of selections that is the number for selecting the target block is determined, and the number of blocks equal to or less than the determined number of selections is selected. With this configuration, it is possible to automatically determine the number of selections in accordance with the compression ratio when transmitting information obtained by encoding the audio signal.
[0007]
Further, the audio signal encoding device of the present invention divides the audio signal into a plurality of blocks, and converts A prediction gain that performs linear prediction on discrete coefficient information at a frequency to generate a linear prediction coefficient, and calculates a prediction gain that is a ratio between a level of the linear prediction coefficient and an error level of the linear prediction for each of the blocks; Calculating means, threshold value determining means for determining whether each of the predicted gains calculated for each of the blocks has exceeded a predetermined threshold, and an object which is a block corresponding to the predicted gain determined to have exceeded the threshold. A block selecting means for selecting a number of blocks equal to or less than a predetermined number from the blocks; And a quantization noise suppressing unit that suppresses quantization noise by filtering the discrete coefficient information and generates a prediction residual signal that is a linear prediction error for each block. The order is equal to or less than a maximum order which is a predetermined order, and the prediction gain calculating means determines the maximum order according to the compression ratio, and sets the prediction gain for each of the blocks based on the determined maximum order. It has a configuration for calculating. With this configuration, it is possible to automatically determine the maximum order in accordance with the compression ratio when transmitting information obtained by encoding an audio signal.
[0008]
Further, the audio signal encoding apparatus of the present invention divides an audio signal into a plurality of blocks, and converts each of the blocks into blocks based on each discrete coefficient information that is frequency domain information obtained by converting the blocks. A prediction gain that performs linear prediction on discrete coefficient information at a frequency to generate a linear prediction coefficient, and calculates a prediction gain that is a ratio between a level of the linear prediction coefficient and an error level of the linear prediction for each of the blocks; Calculating means, threshold value determining means for determining whether each of the predicted gains calculated for each of the blocks has exceeded a predetermined threshold, and an object which is a block corresponding to the predicted gain determined to have exceeded the threshold. A block selecting means for selecting a number of blocks equal to or less than a predetermined number from the blocks; And a quantization noise suppressing unit that suppresses quantization noise by filtering the discrete coefficient information and generates a prediction residual signal that is a linear prediction error for each block. The degree is equal to or less than the maximum degree which is a predetermined degree, and the threshold value determining means determines a threshold value according to the compression ratio and determines whether or not the determined threshold value is exceeded. With this configuration, it is possible to automatically determine the threshold value according to the compression ratio at the time of transmitting the information obtained by encoding the audio signal.
[0009]
Further, the audio signal encoding apparatus of the present invention divides an audio signal into a plurality of blocks, and converts each of the blocks into blocks based on each discrete coefficient information that is frequency domain information obtained by converting the blocks. A prediction gain that performs linear prediction on discrete coefficient information at a frequency to generate a linear prediction coefficient, and calculates a prediction gain that is a ratio between a level of the linear prediction coefficient and an error level of the linear prediction for each of the blocks; Calculating means, threshold value determining means for determining whether each of the predicted gains calculated for each of the blocks has exceeded a predetermined threshold, and an object which is a block corresponding to the predicted gain determined to have exceeded the threshold. A block selecting means for selecting a number of blocks equal to or less than a predetermined number from the blocks; And a quantization noise suppressing unit that suppresses quantization noise by filtering the discrete coefficient information and generates a prediction residual signal that is a linear prediction error for each block. The order is equal to or less than a maximum order which is a predetermined order, and the threshold value judging means determines a threshold value when the compression ratio is equal to or less than a predetermined value and according to the order of the linear prediction coefficient. Has been determined to determine whether the threshold value has been exceeded. With this configuration, it is possible to automatically determine the threshold value according to the compression ratio when transmitting information obtained by encoding the audio signal and the order of the linear prediction coefficient.
[0010]
Further, the audio signal encoding apparatus of the present invention divides an audio signal into a plurality of blocks, and converts each of the blocks into blocks based on each discrete coefficient information that is frequency domain information obtained by converting the blocks. A prediction gain that performs linear prediction on discrete coefficient information at a frequency to generate a linear prediction coefficient, and calculates a prediction gain that is a ratio between a level of the linear prediction coefficient and an error level of the linear prediction for each of the blocks; Calculating means, threshold value determining means for determining whether each of the predicted gains calculated for each of the blocks has exceeded a predetermined threshold, and an object which is a block corresponding to the predicted gain determined to have exceeded the threshold. A block selecting means for selecting a number of blocks equal to or less than a predetermined number from the blocks; And a quantization noise suppressing unit that suppresses quantization noise by filtering the discrete coefficient information and generates a prediction residual signal that is a linear prediction error for each block. The order is equal to or less than a maximum order which is a predetermined order, and further, the prediction residual signal generated by the quantization noise suppressing means is restored according to the compression ratio, and the restored information and a base of the restoration are restored. And a means for outputting a signal of the prediction residual or each of the discrete coefficient information according to the result of the determination. With this configuration, an error between discrete coefficient information and information obtained by restoring a signal of a prediction residual in which quantization noise has been suppressed is determined, and information to be output is determined, so that sound quality degradation is reduced during decoding. It is possible to do.
[0011]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
FIG. 1 is a diagram showing a block configuration of an audio signal encoding device according to a first embodiment of the present invention. The audio signal encoding apparatus 100 according to the first embodiment of the present invention includes a prediction gain calculation unit 110 that generates a prediction gain, a threshold determination unit 120 that determines whether the prediction gain exceeds a predetermined threshold, a prediction gain Is comprised of a block selecting means 130 for selecting a predetermined number of blocks exceeding a predetermined threshold, and a quantization noise suppressing means 140 for suppressing quantization noise included in the block.
[0012]
The prediction gain calculation unit 110 is a unit that inputs each piece of discrete coefficient information that is information in the frequency domain obtained by conversion for each block, and generates the following linear prediction coefficient and prediction gain. Here, a block is obtained by dividing an audio signal into a plurality. The discrete coefficient information may be an MDCT (Modified Discrete Cosine Transform) coefficient described in an MPEG standard or the like.
[0013]
The prediction gain calculation means 110 performs linear prediction of the discrete coefficient information at each frequency for each block based on the input discrete coefficient information to generate a linear prediction coefficient. The method of generating the linear prediction coefficients may be a known Levinson-Durbin algorithm or another method. In addition, the order of the linear prediction is generated so as to be equal to or less than the maximum order which is a predetermined order.
[0014]
The prediction gain calculation unit 110 calculates a prediction gain, which is a ratio between the level of the generated linear prediction coefficient and the level of the error of the linear prediction, for each block, and outputs the prediction gain corresponding to each block to the threshold determination unit 120. . The prediction gain indicates the possibility that the block contains quantization noise. If the probability is high, the prediction gain increases. The method of calculating the prediction gain is described in an MPEG standard or the like.
[0015]
Further, the prediction gain calculating means 110 generates statistical information based on each discrete coefficient information, determines a frequency band range according to the statistical information, and determines each block included in the determined frequency band range. May be calculated for each of the blocks based on the discrete coefficient information. As a method of determining the range of the frequency band, the range of the frequency band may be narrowed according to the magnitude of dispersion of the spectrum included in the scale factor band, which is a unit for dividing the frequency axis.
[0016]
The threshold determination unit 120 receives the prediction gain corresponding to each block output by the prediction gain calculation unit 110 as input, determines whether each of the input prediction gains exceeds a predetermined threshold, and outputs information on the determination result. (Hereinafter, referred to as judgment information) to the block selecting means 130. The determination information may be information indicating whether or not a predetermined threshold value given to each block is exceeded.
[0017]
The block selecting unit 130 receives the judgment information output by the threshold judging unit 120 as an input and, based on the judging information, selects a prediction block obtained from a block among target blocks whose prediction gains are judged to exceed the threshold. This is a means for selecting in order from the one having the largest gain so as to be equal to or less than the predetermined number which is the selected number. For example, if the number of target blocks determined to exceed the threshold is 5 and the number of selections is 3, three blocks are selected in order from the one with the largest prediction gain. If the number of target blocks determined to exceed the threshold is 2 and the number of selections is 3, two blocks are selected.
[0018]
The block selection unit 130 outputs information on the result of the selection (hereinafter, referred to as selection information) and each block to the quantization noise suppression unit 140. The selection information may be information indicating whether or not a selection is given to each block.
[0019]
The quantization noise suppressing unit 140 receives the selection information output by the block selecting unit 130 as input, calculates a filter coefficient from the selected block, and filters the discrete coefficient information with a filter to which the calculated filter coefficient is applied. , Means for suppressing quantization noise.
[0020]
The quantization noise suppressing unit 140 generates and outputs a prediction residual signal which is an error of the linear prediction for each block. TNS (Temporal Noise Shaping), which is a process for suppressing quantization noise, is described in MPEG standards and the like.
[0021]
As described above, the audio signal encoding device according to the first embodiment of the present invention selects a target block that is a block whose prediction gain has been determined to have exceeded the threshold, and selects a target block included in the audio signal. Since the quantization noise is not excessively suppressed, it is possible to reduce the sound quality deterioration that occurs when the quantization noise included in the audio signal is suppressed. In addition, since statistical information is generated based on the discrete coefficient information and the audio signal is encoded according to the properties of the audio signal, it is possible to reduce sound quality deterioration during decoding.
[0022]
FIG. 2 is a diagram illustrating a block configuration of an audio signal encoding device according to a second embodiment of the present invention. The audio signal encoding device 200 according to the second embodiment of the present invention includes a prediction gain calculation unit 210 that generates a prediction gain, a threshold determination unit 220 that determines whether the prediction gain exceeds a predetermined threshold, and a block. A block selection unit 230 for selecting a predetermined number, a quantization noise suppression unit 140 for suppressing quantization noise included in a block, and a compression ratio calculation unit 250 for calculating a compression ratio based on a sampling frequency, a transmission speed, and the number of channels. It is constituted by.
Note that, of the units configuring the audio signal encoding device 200 according to the second embodiment of the present invention, the same units as the units configuring the audio signal encoding device 100 according to the first embodiment of the present invention. Those performing the processing are denoted by the same reference numerals, and description thereof will be omitted.
[0023]
The prediction gain calculation unit 210 receives the compression ratio output from the compression ratio calculation unit 250 and discrete coefficient information that is information in the frequency domain obtained by converting each block, and calculates the following linear prediction coefficient, And a means for generating a gain. Here, a block is obtained by dividing an audio signal into a plurality. The discrete coefficient information may be an MDCT (Modified Discrete Cosine Transform) coefficient described in an MPEG standard or the like.
[0024]
Further, the prediction gain calculation means 210 determines the maximum order according to the input compression ratio. For example, as a method of determining the maximum order, a table in which the compression rate and the maximum order correspond may be created in advance, and the maximum order may be obtained according to this table.
[0025]
The prediction gain calculation means 210 performs linear prediction of the discrete coefficient information at each frequency for each block based on the input discrete coefficient information to generate a linear prediction coefficient. The method of generating the linear prediction coefficients may be a known Levinson-Durbin algorithm or another method. The order of the linear prediction coefficient is generated so as to be equal to or less than the determined maximum order.
[0026]
The prediction gain calculation unit 210 calculates a prediction gain, which is a ratio between the level of the generated linear prediction coefficient and the level of the error of the linear prediction, for each block, and outputs the prediction gain corresponding to each block to the threshold determination unit 220. . The prediction gain indicates the possibility that the block contains quantization noise. If the probability is high, the prediction gain increases. The method of calculating the prediction gain is described in an MPEG standard or the like.
[0027]
Further, the prediction gain calculating means 210 generates statistical information based on each discrete coefficient information, determines a frequency band range according to the statistical information, and calculates a frequency band range for each of the blocks included in the determined frequency band range. May be calculated for each of the blocks based on the discrete coefficient information. As a method of determining the range of the frequency band, the range of the frequency band may be narrowed according to the magnitude of dispersion of the spectrum included in the scale factor band, which is a unit for dividing the frequency axis.
[0028]
The threshold value determining unit 220 receives the compression ratio output from the compression ratio calculating unit 250 and the prediction gain corresponding to each block output from the prediction gain calculating unit 110, and determines a threshold value according to the input compression ratio. It is a means to do. For example, as a method of determining the threshold, a table in which the compression ratio and the threshold correspond to each other may be created in advance, and the threshold may be determined according to this table.
[0029]
Further, when the input compression ratio is equal to or less than a predetermined value, the threshold determination unit 220 determines the threshold according to the order of the linear prediction coefficient for each block. For example, when the order of the linear prediction coefficient is large, when suppressing the quantization noise, the amount of information generated due to the suppression may increase. Therefore, when the order of the linear prediction coefficient is large, the threshold value is determined to be a large value.
[0030]
The threshold value determining means 220 determines whether or not each of the input prediction gains exceeds the threshold value determined as described above, and determines information relating to the result of the determination (hereinafter, referred to as determination information) and each block with the block selecting means 230. Output to The determination information may be information indicating whether or not a predetermined threshold value given to each block is exceeded.
[0031]
The block selection unit 230 receives the compression ratio output by the compression ratio calculation unit 250 and the determination information output by the threshold determination unit 220 as input, and determines a predetermined number of selections according to the input compression ratio. It is a means to do. For example, as a method of determining the number of selections, a table in which the compression ratio and the number of selections correspond may be created in advance, and the number of selections may be obtained according to this table.
[0032]
In addition, based on the input determination information, the block selection unit 230 determines a predetermined order from the target block whose prediction gain has been determined to have exceeded the threshold value, in descending order of prediction gain obtained from the block. The number is selected so as to be equal to or less than the selected number.
[0033]
The block selection unit 230 outputs information on the result of the selection (hereinafter, referred to as selection information) and each block to the quantization noise suppression unit 140. The selection information may be information indicating whether or not a selection is given to each block.
[0034]
The compression ratio calculation unit 250 is a unit that calculates a compression ratio based on the sampling frequency, the transmission speed, and the number of channels, and outputs the calculated compression ratio to a unit that requires the compression ratio. For example, when the sampling frequency is represented by fs, the transmission speed is represented by br, and the number of channels is represented by ch, the compression ratio is obtained by the following equation.
Compression rate = (fs / br) / ch
[0035]
As described above, the audio signal encoding apparatus according to the second embodiment of the present invention automatically sets the maximum order, the threshold, or the degree according to the compression rate when transmitting information obtained by encoding the audio signal. The number of selections can be determined.
[0036]
FIG. 3 is a diagram illustrating a block configuration of an audio signal encoding device according to a third embodiment of the present invention. The audio signal encoding apparatus 300 according to the third embodiment of the present invention includes a prediction gain calculation unit 210 that generates a prediction gain, a threshold determination unit 220 that determines whether the prediction gain exceeds a predetermined threshold, and a block. A block selection unit 230 for selecting a predetermined number, a quantization noise suppression unit 140 for suppressing quantization noise included in a block, a compression ratio calculation unit 250 for calculating a compression ratio, and a prediction residual signal with quantization noise suppressed The decoding decision means 360 decides whether or not to output the signal of the prediction residual based on
Note that, of the units configuring the audio signal encoding device 300 according to the third embodiment of the present invention, the same units as the units configuring the audio signal encoding device 200 according to the second embodiment of the present invention. Those performing the processing are denoted by the same reference numerals, and description thereof will be omitted.
[0037]
The decoding determining unit 360 receives the input of the prediction residual signal output by the quantization noise suppressing unit 140 and the compression ratio output by the compression ratio calculating unit 250 output by the prediction gain calculating unit 210. Means for processing such information.
[0038]
Further, the decoding determining means 360 calculates the information obtained by restoring the signal of the prediction residual, and the information for each block which is the information of the frequency domain obtained by converting the audio signal included in the block for each block. An error with the discrete coefficient information is calculated.
[0039]
For example, as a method of restoring the signal of the prediction residual, only the number of spectra included in the signal of the prediction residual is restored according to the compression ratio.In other words, when the compression ratio is very small, the number of spectra that can be quantized is small. Therefore, when the compression ratio is small, the number of spectra to be restored is also reduced. In addition, at the time of encoding, in the scale factor band, which is a unit for dividing the frequency axis, the absolute value of the spectrum is selected in descending order, and the signal of the prediction residual is restored.
For example, as a method of calculating an error between the information obtained by restoring the signal of the prediction residual and the discrete coefficient information, the calculation is performed using an energy value or the like included in each scale factor band.
[0040]
The decoding determining means 360 determines the calculated error and outputs a signal of a prediction residual or discrete coefficient information. For example, if the error between the information obtained by restoring the signal of the prediction residual obtained by the energy value included in each of the scale factor bands and the discrete coefficient information exceeds a reference value, when decoding, In order to cause sound quality deterioration, discrete coefficient information is output without outputting a prediction residual signal. If the error is within the reference value, a signal of the prediction residual is output.
[0041]
As described above, the audio signal encoding apparatus according to the third embodiment of the present invention calculates the error between the discrete coefficient information and the information obtained by restoring the signal of the prediction residual in which quantization noise is suppressed. Since the information to be determined and output is determined, it is possible to suppress sound quality deterioration during decoding.
[0042]
【The invention's effect】
As described above, the present invention can provide an audio signal encoding apparatus that reduces sound quality degradation that occurs when suppressing quantization noise included in an audio signal.
[Brief description of the drawings]
FIG. 1 is a diagram showing a block configuration of an audio signal encoding device according to a first embodiment of the present invention.
FIG. 2 is a diagram showing a block configuration of an audio signal encoding device according to a second embodiment of the present invention.
FIG. 3 is a diagram showing a block configuration of an audio signal encoding device according to a third embodiment of the present invention.
[Explanation of symbols]
100, 200, 300 audio signal encoding device
110, 210 Predicted gain calculating means
120, 220 threshold determination means
130, 230 block selecting means
140 Quantization noise suppression means
250 Compression ratio calculation means
360 decryption determination means

Claims (7)

オーディオ信号を複数のブロックに分割し、このブロック毎に変換して得られる周波数領域の情報である各離散係数情報に基づいて、前記ブロック毎に各周波数での離散係数情報に対して線形予測して線形予測係数を生成し、前記線形予測係数のレベルと前記線形予測の誤差のレベルとの比である予測ゲインを前記ブロック毎に算出する予測ゲイン算出手段と、前記各ブロックについて算出された前記各予測ゲインが所定の閾値を越えたか否かを判断する閾値判断手段と、前記閾値を越えたと判断された前記予測ゲインに対応するブロックである対象ブロックの中から、所定個数以下の個数のブロックを選択するブロック選択手段と、選択された前記対象ブロックから得られるフィルタ係数に基づいて、前記各離散係数情報をフィルタリングして量子化雑音を抑圧し、前記ブロック毎の線形予測の誤差である予測残差の信号を生成する量子化雑音抑圧手段とを備え、前記線形予測係数の次数は、所定の次数である最大次数以下とすることを特徴とするオーディオ信号符号化装置。The audio signal is divided into a plurality of blocks, and based on each discrete coefficient information which is frequency domain information obtained by converting each block, linear prediction is performed on the discrete coefficient information at each frequency for each block. Predictive gain calculating means for calculating, for each of the blocks, a predictive gain that is a ratio between the level of the linear predictive coefficient and the level of the error of the linear prediction; and Threshold value determining means for determining whether or not each prediction gain has exceeded a predetermined threshold; and a target number of blocks equal to or less than a predetermined number among target blocks corresponding to the prediction gains determined to have exceeded the threshold. And selecting each discrete coefficient information based on a filter coefficient obtained from the selected target block. Quantization noise suppressing means for suppressing the quantization noise and generating a prediction residual signal which is an error of the linear prediction for each block, wherein an order of the linear prediction coefficient is a maximum order which is a predetermined order. An audio signal encoding device characterized by the following. 前記予測ゲイン算出手段は、前記各離散係数情報に基づいて統計情報を生成し、前記統計情報に応じて周波数帯域の範囲を決定し、決定された周波数帯域の範囲に含まれる前記ブロック毎の離散係数情報に基づいて、前記予測ゲインを前記ブロック毎に算出することを特徴とする請求項1記載のオーディオ信号符号化装置。The predictive gain calculating means generates statistical information based on the discrete coefficient information, determines a frequency band range according to the statistical information, and calculates a discrete value for each block included in the determined frequency band range. The audio signal encoding device according to claim 1, wherein the prediction gain is calculated for each of the blocks based on coefficient information. サンプリング周波数と伝送速度とチャンネル数とに基づいて圧縮率を算出する圧縮率算出手段を備え、前記ブロック選択手段は、前記圧縮率に応じて前記対象ブロックを選択する個数である選択数を決定し、決定された選択数以下の個数のブロックを選択することを特徴とする請求項1又は請求項2記載のオーディオ信号符号化装置。A compression ratio calculation unit that calculates a compression ratio based on a sampling frequency, a transmission speed, and the number of channels is provided, and the block selection unit determines a selection number that is a number for selecting the target block according to the compression ratio. 3. The audio signal encoding apparatus according to claim 1, wherein a number of blocks equal to or less than the determined number of selections are selected. 前記予測ゲイン算出手段は、前記圧縮率に応じて前記最大次数を決定し、決定された最大次数に基づいて前記予測ゲインを前記ブロック毎に算出することを特徴とする請求項3記載のオーディオ信号符号化装置。4. The audio signal according to claim 3, wherein the prediction gain calculation unit determines the maximum order according to the compression ratio, and calculates the prediction gain for each of the blocks based on the determined maximum order. Encoding device. 前記閾値判断手段は、前記圧縮率に応じて閾値を決定し、決定された閾値を越えたか否かを判断することを特徴とする請求項3又は請求項4記載のオーディオ信号符号化装置。The audio signal encoding device according to claim 3, wherein the threshold value determining unit determines a threshold value according to the compression ratio, and determines whether the threshold value is exceeded. 前記閾値判断手段は、前記圧縮率が所定の値以下であったとき、および前記線形予測係数の次数に応じて閾値を決定し、決定された閾値を越えたか否かを判断することを特徴とする請求項3又は請求項4記載のオーディオ信号符号化装置。The threshold value determining means, when the compression ratio is equal to or less than a predetermined value, and determines a threshold value according to the order of the linear prediction coefficient, and determines whether or not exceeds the determined threshold value. The audio signal encoding device according to claim 3 or 4, wherein: 前記圧縮率に応じて、前記量子化雑音抑圧手段によって生成された前記予測残差の信号を復元し、復元された情報と、復元の基となった前記各離散係数情報との誤差を判断し、判断した結果に応じて前記予測残差の信号、あるいは前記各離散係数情報を出力する手段を備えたことを特徴とする請求項3乃至請求項6の何れかに記載のオーディオ信号符号化装置。According to the compression ratio, the signal of the prediction residual generated by the quantization noise suppression unit is restored, and an error between the restored information and each of the discrete coefficient information on which the restoration is based is determined. 7. The audio signal encoding apparatus according to claim 3, further comprising a unit that outputs the signal of the prediction residual or the discrete coefficient information according to a result of the determination. .
JP2002167571A 2002-06-07 2002-06-07 Audio signal encoding device Expired - Fee Related JP3886851B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002167571A JP3886851B2 (en) 2002-06-07 2002-06-07 Audio signal encoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002167571A JP3886851B2 (en) 2002-06-07 2002-06-07 Audio signal encoding device

Publications (2)

Publication Number Publication Date
JP2004015537A true JP2004015537A (en) 2004-01-15
JP3886851B2 JP3886851B2 (en) 2007-02-28

Family

ID=30434779

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002167571A Expired - Fee Related JP3886851B2 (en) 2002-06-07 2002-06-07 Audio signal encoding device

Country Status (1)

Country Link
JP (1) JP3886851B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008083363A (en) * 2006-09-27 2008-04-10 Casio Comput Co Ltd Voice encoding device, voice decoding device, voice encoding method, voice decoding method and program
WO2008138267A1 (en) * 2007-05-11 2008-11-20 Huawei Technologies Co., Ltd. A post-processing method and apparatus for realizing fundamental tone enhancement
EP2650117A1 (en) 2012-04-10 2013-10-16 Ricoh Company, Ltd. Sheet processing apparatus and image forming system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008083363A (en) * 2006-09-27 2008-04-10 Casio Comput Co Ltd Voice encoding device, voice decoding device, voice encoding method, voice decoding method and program
WO2008138267A1 (en) * 2007-05-11 2008-11-20 Huawei Technologies Co., Ltd. A post-processing method and apparatus for realizing fundamental tone enhancement
EP2650117A1 (en) 2012-04-10 2013-10-16 Ricoh Company, Ltd. Sheet processing apparatus and image forming system

Also Published As

Publication number Publication date
JP3886851B2 (en) 2007-02-28

Similar Documents

Publication Publication Date Title
KR100986924B1 (en) Information Signal Encoding
KR100814673B1 (en) audio coding
JP4531805B2 (en) Apparatus and method for determining step size of quantizer
JP5583881B2 (en) Audio signal conversion method and conversion apparatus, audio signal adaptive encoding method and adaptive encoding apparatus
CN1918630B (en) Method and device for quantizing an information signal
AU2012297805A1 (en) Encoding device and method, decoding device and method, and program
KR20070070189A (en) Sound encoder and sound encoding method
KR101033256B1 (en) Scale factor based bit shifting in fine granularity scalability audio coding
TWI438770B (en) Audio signal encoding employing interchannel and temporal redundancy reduction
KR100848370B1 (en) Audio Encoding
KR20130109793A (en) Audio encoding method and apparatus for noise reduction
US7668715B1 (en) Methods for selecting an initial quantization step size in audio encoders and systems using the same
JP3886851B2 (en) Audio signal encoding device
EP1351218A2 (en) Audio signal reproducing method and an apparatus for reproducing the same
JP5379871B2 (en) Quantization for audio coding
JP2003233397A (en) Device, program, and data transmission device for audio encoding
JP2008139781A (en) Speech encoding method and device
JP4721355B2 (en) Coding rule conversion method and apparatus for coded data
JP4273062B2 (en) Encoding method, encoding apparatus, decoding method, and decoding apparatus
JP6552986B2 (en) Speech coding apparatus, method and program
KR100640833B1 (en) Method for encording digital audio
JP2000137497A (en) Device and method for encoding digital audio signal, and medium storing digital audio signal encoding program
JP3257584B2 (en) Acoustic signal encoding method and acoustic signal encoding device
JP2002304184A (en) Device for embedding electronic watermark information
JP2001325000A (en) Audio signal coding device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050606

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060815

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060822

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061023

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061121

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061122

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091201

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101201

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111201

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121201

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121201

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131201

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees