JP5098530B2 - 復号化装置、復号化方法および復号化プログラム - Google Patents

復号化装置、復号化方法および復号化プログラム Download PDF

Info

Publication number
JP5098530B2
JP5098530B2 JP2007237217A JP2007237217A JP5098530B2 JP 5098530 B2 JP5098530 B2 JP 5098530B2 JP 2007237217 A JP2007237217 A JP 2007237217A JP 2007237217 A JP2007237217 A JP 2007237217A JP 5098530 B2 JP5098530 B2 JP 5098530B2
Authority
JP
Japan
Prior art keywords
frequency component
low
data
audio signal
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007237217A
Other languages
English (en)
Other versions
JP2009069430A (ja
Inventor
政直 鈴木
美由紀 白川
義照 土永
孝志 牧内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2007237217A priority Critical patent/JP5098530B2/ja
Priority to US12/232,096 priority patent/US8073687B2/en
Publication of JP2009069430A publication Critical patent/JP2009069430A/ja
Application granted granted Critical
Publication of JP5098530B2 publication Critical patent/JP5098530B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Description

この発明は、オーディオ信号の低域成分を符号化した第1の符号化データから低域成分を復号し、オーディオ信号の高域成分を復号する場合に利用する第2の符号化データおよび前記低域成分からオーディオ信号の高域成分を復号する復号化装置等に関するものである。
近年、音声や音楽を符号化する方式として、HE−AAC(High-Efficiency Advanced Audio Coding)方式が利用されている。このHE−AAC方式は、主に、映像圧縮規格MPEG−2(Moving Picture Experts Group phase 2)またはMPEG−4(Moving Picture Experts Group phase 4)などで使われる音声圧縮方式である。
HE−AAC方式による符号化は、符号化対象となるオーディオ信号(音声や音楽などに関する信号)の周波数の低域成分をAAC(Advanced Audio Coding)方式で符号化し、周波数の高域成分をSBR(Spectral Band Replication;帯域複製技術)方式で符号化する。SBR方式は、オーディオ信号の周波数の低域成分から予測できない部分のみを符号化することにより通常よりも少ないビット数によってオーディオ信号の周波数の高域成分を符号化することができる。以下、AAC方式によって符号化したデータをAACデータと表記し、SBR方式によって符号化したデータをSBRデータと表記する。
ここで、HE−AAC方式によって符号化されたデータ(以下、HE−AACデータと表記する)を復号化(デコード)するデコーダの一例について説明する。図19は、従来のデコーダの構成を示す機能ブロック図である。同図に示すように、このデコーダ10は、データ分離部11と、AAC復号部12と、分析フィルタ部13と、高域生成部14と、合成フィルタ部15とを備えて構成される。
ここで、データ分離部11は、HE−AACデータを取得した場合に、取得したHE−AACデータに含まれるAACデータおよびSBRデータをそれぞれ分離させ、AACデータをAAC復号部12に出力し、SBRデータを高域生成部14に出力する処理部である。
AAC復号部12は、AACデータを復号化し、復号化したAACデータをAAC出力音データとして分析フィルタ部13に出力する処理部である。分析フィルタ部13は、AAC復号部12から取得するAAC出力音データを基にして、オーディオ信号の低域成分にかかる時間と周波数との特性を算出し、算出結果を合成フィルタ部15および高域生成部14に出力する処理部である。以下、分析フィルタ部13から出力される算出結果を低域成分データと表記する。
高域生成部14は、データ分離部11から取得するSBRデータと分析フィルタ部13から取得する低域成分データとを基にして、オーディオ信号の高域成分を生成する処理部である。そして、高域生成部14は、生成した高域成分のデータを高域成分データとして合成フィルタ部15に出力する。
合成フィルタ部15は、分析フィルタ部13から取得する低域成分データと高域生成部14から取得する高域成分データとを合成し、合成したデータをHE−AAC出力音データとして出力する処理部である。
図20は、デコーダ10の処理の概要を説明するための説明図である。同図に示すように、デコーダ10は、低域成分データの一部を複製し、複製したデータの電力を調整することによって高域成分データを生成する。そして、低域成分データと高域成分データとを合成することにより、HE−AAC出力音データを生成する。このように、HE−AAC方式によって符号化されたHE−AACデータ(オーディオ信号など)は、デコーダ10によってHE−AAC出力音データに復号化されている。
なお、特許文献1では、オーディオ信号にかかるスケールファクタの値を調整することによりオーディオ信号の符号化の前後におけるパワーの不一致を補正し、聴感上の品質を向上させるという技術が公開されている。
特開2005−338637号公報
しかしながら、上述した従来の技術では、アタック音(急激な振幅変化を有する信号)が含まれるオーディオ信号を符号化(例えば、HE−AAC方式によって符号化)した後、かかる符号化されたオーディオ信号を復号化する場合に、オーディオ信号の周波数の高域成分を適切に復号化することができないという問題があった。
従来技術の問題点について具体的に説明する。図21は、従来技術の問題点を説明するための説明図である。同図に示すように、極めて短い時間幅で急激に振幅変化するアタック音を含むオーディオ信号をSBR方式によって符号化する場合には、SBR方式の特性上、SBR方式によって分割される時間領域と比較してアタック音の発生した時間領域が極めて短くなる場合(あるいはAAC方式にかかる時間分解能よりもSBR方式にかかる時間分解能が粗くなる場合)があり、アタック音を含む時間領域のパワーが平均化され、アタック音が時間的に間延びした状態で符号化されてしまうからである。
すなわち、HE−AAC方式によってアタック音を含むオーディオ信号の高域成分が適切に符号化されていない場合であっても、符号化されたオーディオ信号の高域成分を補正して適切にオーディオ信号を復号化することが極めて重要な課題となっている。特に、AAC方式で符号化された低域成分に、アタック音以外の定常成分が存在する場合であっても、高域成分に含まれるアタック音の時間幅を正確に補正することが重要な課題となっている。
この発明は、上述した従来技術による問題点を解消するためになされたものであり、符号化されたオーディオ信号の高域成分を補正して適切にオーディオ信号を復号化することができる復号化装置、復号化方法および復号化プログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するため、本発明は、オーディオ信号の低域成分を符号化した第1の符号化データから低域成分を復号し、オーディオ信号の高域成分を復号する場合に利用する第2の符号化データおよび前記低域成分からオーディオ信号の高域成分を復号する復号化装置であって、前記オーディオ信号が過渡性であるか否かを判定する過渡性判定手段と、前記オーディオ信号が過渡性である場合に、前記第1の符号化データを復号した低域成分に含まれる定常成分を補正した補正低域成分を生成する低域成分補正手段と、前記補正低域成分の時間幅に基づいて前記高域成分を補正した補正高域成分を生成する高域成分補正手段と、前記低域成分と前記補正高域成分とを合成して前記オーディオ信号を復号する復号手段と、を備えたことを特徴とする。
また、本発明は、上記発明において、前記低域成分補正手段は、前記低域成分に対してLPC分析を実行して当該低域成分のLPC係数を算出し、算出したLPC係数に基づいて前記低域成分に含まれる定常成分を補正した補正低域成分を生成することを特徴とする。
また、本発明は、上記発明において、前記過渡性判定手段は、過去に取得したオーディオ信号の低域成分から平均電力を算出し、新たに取得したオーディオ信号の低域成分の電力と前記平均電力とを比較することにより復号対象となるオーディオ信号が過渡性であるか否かを判定することを特徴とする。
また、本発明は、上記発明において、前記第1の符号化データを復号して得られる低域成分は前記オーディオ信号が過渡性であるか否かを示す窓切り替え情報を含み、前記過渡性判定手段は、前記窓切り替え情報を基にして前記オーディオ信号が過渡性であるか否かを判定することを特徴とする。
また、本発明は、上記発明において、前記低域成分補正手段は、前記低域成分のフレームを第1サブフレームおよび第2サブフレームに分割し、前記第1サブフレームに含まれる定常成分を過去のフレームに対してLPC分析を行った結果得られたLPC係数を用いて除去し、前記第2サブフレームに含まれる定常成分を当該第2サブフレームに対してLPC分析を行った結果得られるLPC係数を用いて除去することにより前記低域成分に含まれる定常成分を補正した補正低域成分を生成することを特徴とする。
また、本発明は、上記発明において、前記低域成分補正手段は、前記オーディオ信号が過渡性である場合に、前記低域成分のフレームを前記過渡性の音が存在する位置の前後でサブフレームに分割し、分割した各サブフレームに対してLPC分析を実行して各サブフレームに対応するLPC係数を算出し、算出したLPC係数に基づいて各サブフレームを補正することにより前記低域成分に含まれる定常成分を補正した補正低域成分を生成することを特徴とする。
また、本発明は、オーディオ信号の低域成分を符号化した第1の符号化データから低域成分を復号し、オーディオ信号の高域成分を復号する場合に利用する第2の符号化データおよび前記低域成分からオーディオ信号の高域成分を復号する復号化装置の復号化方法であって、前記オーディオ信号が過渡性であるか否かを判定する過渡性判定ステップと、前記オーディオ信号が過渡性である場合に、前記第1の符号化データを復号した低域成分に含まれる定常成分を補正した補正低域成分を生成する低域成分補正ステップと、前記補正低域成分の時間幅に基づいて前記高域成分を補正した補正高域成分を生成する高域成分補正ステップと、前記低域成分と前記補正高域成分とを合成して前記オーディオ信号を復号する復号ステップと、を含んだことを特徴とする。
また、本発明は、上記発明において、前記低域成分補正ステップは、前記低域成分に対してLPC分析を実行して当該低域成分のLPC係数を算出し、算出したLPC係数に基づいて前記低域成分に含まれる定常成分を補正した補正低域成分を生成することを特徴とする。
また、本発明は、オーディオ信号の低域成分を符号化した第1の符号化データから低域成分を復号し、オーディオ信号の高域成分を復号する場合に利用する第2の符号化データおよび前記低域成分からオーディオ信号の高域成分を復号する復号化プログラムであって、コンピュータに前記オーディオ信号が過渡性であるか否かを判定する過渡性判定手順と、前記オーディオ信号が過渡性である場合に、前記第1の符号化データを復号した低域成分に含まれる定常成分を補正した補正低域成分を生成する低域成分補正手順と、前記補正低域成分の時間幅に基づいて前記高域成分を補正した補正高域成分を生成する高域成分補正手順と、前記低域成分と前記補正高域成分とを合成して前記オーディオ信号を復号する復号手順と、を実行させることを特徴とする。
また、本発明は、上記発明において、前記低域成分補正手順は、前記低域成分に対してLPC分析を実行して当該低域成分のLPC係数を算出し、算出したLPC係数に基づいて前記低域成分に含まれる定常成分を補正した補正低域成分を生成することを特徴とする。
本発明によれば、低域成分データの定常成分を除去し、低域成分データの時間幅にあわせて、高域成分データを補正した後に、修正高域データと低域成分データとを合成してオーディオ信号を復号化するので、アタック音のような過渡性の強い音源を含むオーディオ信号を復号化した場合であっても、アタック音が時間的に間延びしてしまうことを防止し、オーディオ信号の音質劣化を防止することができる。また、本発明によれば、低域成分にアタック音以外の定常成分が存在する場合であっても、低域成分に含まれる定常成分を取り除いた補正低域成分に基づいて高域成分を補正するので、アタック音の高域成分の時間幅を正確に補正することができる。
また、本発明によれば、過去に取得したオーディオ信号の低域成分の平均電力と、新たに取得したオーディオ信号の低域成分の電力とを比較してオーディオ信号が過渡性であるか否かを判定するので、オーディオ信号の過渡性を的確に判断でき、オーディオ信号の音質劣化を防止することができる。
また、本発明によれば、オーディオ信号に含まれる窓切り替え情報に基づいて、オーディオ信号の過渡性を判定するので、処理を簡略化でき、過渡性判定にかかる負荷を軽減させることができる。
また、本発明によれば、低域成分のフレームを2つのサブフレームに分割し、各サブフレームで異なるLPC係数を算出することにより低域成分データの定常成分を除去するので、アタック音の位置に関わらず、低域成分データから定常成分を適切に除去することができる。
また、本発明によれば、過渡性の音が存在する位置に基づいてフレームを第1サブフレームおよび第2サブフレームに分割し、サブフレーム毎に異なるLPC係数を用いて定常成分を除去するので、アタック音の位置に関わらず、定常成分を適切に除去することができる。
以下に添付図面を参照して、この発明に係る復号化装置、復号化方法および復号化プログラムの好適な実施の形態を詳細に説明する。
まず、本実施例1にかかるデコーダの概要および特徴について説明する。図1は、本実施例1にかかるデコーダの概要および特徴を説明するための図である。本実施例1にかかるデコーダは、オーディオ信号の低域成分をAAC方式で符号化したAACデータと、オーディオ信号の高域成分をSBR方式で符号化したSBRデータとを利用して符号化されたオーディオ信号を復号化するデコーダである(HE−AAC方式によって符号化されたオーディオ信号を復号化するデコーダである)。
特に、本実施例1にかかるデコーダは、オーディオ信号にアタック音が含まれている場合(オーディオ信号が過渡性である場合)に、AACデータを復号化した低域成分データに含まれる定常成分を除去し、定常成分を除去した低域成分データ(修正低域データ)の時間幅にあわせて、高域成分データ(低域成分データおよびSBRデータによって生成されるオーディオ信号の高域成分データ)の時間幅を補正し、補正した高域成分データ(修正高域データ)と低域成分データとを合成してオーディオ信号を復号化する(図1参照)。
このように、本実施例1にかかるデコーダは、低域成分データの定常成分を除去し、低域成分データの時間幅にあわせて、高域成分データを補正した後に、修正高域データと低域成分データとを合成してオーディオ信号を復号化するので、アタック音のような過渡性の強い音源を含むオーディオ信号を復号化した場合であっても、アタック音が時間的に間延びしてしまうことを防止し、オーディオ信号の音質劣化を防止することができる。
また、本実施例1にかかるデコーダは、低域成分データに含まれる定常成分を取り除き、定常成分を取り除いた低域成分データの時間幅にあわせて、高域成分データを補正するので、高域成分データの時間幅を正しく補正することができる。
次に、本実施例1にかかるデコーダの構成について説明する。図2は、本実施例1にかかるデコーダ100の構成を示す図である。同図に示すように、このデコーダ100は、データ分離部110と、AAC復号部120と、SBR復号部125とを備えて構成され、SBR復号部125は、分析フィルタ部130と、高域生成部140と、過渡性検出部150と、LPC分析部160aと、LPC逆フィルタ部160bと、高域補正部170と、合成フィルタ部180とを備える。
データ分離部110は、HE−AACデータ(HE−AAC方式によって符号化されたオーディオ信号)を取得した場合に、取得したHE−AACデータに含まれるAACデータおよびSBRデータをそれぞれ分離させ、AACデータをAAC復号部120に出力し、SBRデータを高域生成部140に出力する処理部である。
AAC復号部120は、データ分離部110から取得するAACデータを復号化し、復号化したAACデータをAAC出力音データとして分析フィルタ部130および過渡性検出部150に出力する処理部である。AAC出力音データは、オーディオ信号の低域成分にかかる時間と電力(パワー)との特性を示すデータである。
分析フィルタ部130は、AAC復号部120から取得するAAC出力音データを基にして、オーディオ信号の低域成分にかかる時間と周波数との特性を算出し、算出結果をLPC分析部160a、LPC逆フィルタ部160bおよび合成フィルタ部180に出力する処理部である。以下、分析フィルタ部130から出力される算出結果を低域成分データと表記する。図3は、低域成分データを説明するための図である。本発明では、低域成分データの定常成分を取り除くため、低域成分データの各周波数帯域(HE−AACの場合は、32帯域)についてLPC分析を行う。
高域生成部140は、データ分離部110から取得するSBRデータと分析フィルタ部130から取得する低域成分データとを基にして、オーディオ信号の高域成分を生成する処理部である。高域生成部140は、生成した高域成分のデータ(以下、高域成分データ)を高域補正部170に出力する。
過渡性検出部150は、AAC復号部120からAAC出力音データを取得し、取得したAAC出力音データを基にしてHE−AACデータにアタック音が含まれているか否かを判定する(HE−AACデータが過渡性か否かを判定する)処理部である。
ここで、過渡性検出部150の処理を具体的に説明する。図4は、過渡性検出部150の処理を説明するための図である。過渡性検出部150は、過去に取得した複数のAAC出力音データを記憶部(図示略)に蓄積しており、かかる記憶部に記憶された各AAC出力音データの平均電力を算出し、算出結果を記憶している。そして、過渡性検出部150は、平均電力に所定の閾値を加算した加算値と、平均電力に所定の閾値を減算した減算値とを求め、記憶部に記憶する。
過渡性検出部150は、AAC出力音データを取得した場合に、取得したAAC出力音データの電力と、加算値と、減算値とを比較して、HE−AACデータが過渡性か否かを判定する。過渡性検出部150は、AAC出力音データの電力が加算値以上、減算値未満の場合には、過渡性と判定し、AAC出力音データの電力が減算値以上、加算値未満の場合には、定常性と判定する(図4参照)。過渡性検出部150は、判定結果を高域補正部170に出力する。
LPC分析部160aは、分析フィルタ部130から低域成分データを取得し、取得した低域成分データに対してLPC分析を実行し、LPC係数を算出する処理部である。低域成分データの周波数帯域がkの場合(図3参照)、Xlow(0,k)、Xlow(1,k)、・・・、Xlow(N−1,k)に対してLPC分析を行い、LPC係数α(k)(i=1、・・・、p)を求める。
ここで、Nは現フレーム(低域成分データ)の時間サンプル数であり、pはLPC係数の最大次数を示す。LPC係数の算出方法としては、自己相関法(Levinson-Durbin法)や共分散法など周知の方法を用いることができる。なお、低域成分データが複素数の場合は、低域成分データの実部と虚部とのそれぞれに対して上記のLPC分析を行う。
LPC逆フィルタ部160bは、分析フィルタ部130から低域成分データを取得し、LPC分析部160aから取得するLPC係数を用いて、低域成分データから定常成分を取り除いた修正低域データを生成する処理部である。
例えば、LPC係数の最大次数が2の場合(p=2の場合)、修正低域データの実部と虚部(実部と虚部の逆フィルタの式)は、下記の式で表すことができる。
Figure 0005098530
Figure 0005098530
低域成分データの周波数領域に対してLPC分析を行うと、定常成分の予測利得が十分であるのに対して、定常成分以外の低域成分の予測利得が十分ではない。したがって、上記の式(1)、式(2)に示す逆フィルタの式を用いると、予測利得が十分な定常成分のみが低域成分データから取り除かれることになる。
なお、上記の説明では、LPC係数の最大次数を2としたが、LPC係数の最大次数を2以上としてもよい。また、低域成分データの周波数帯域の平均電力が閾値以上の帯域のみ、低域成分データの定常成分を取り除く構成としてもよい。また、上記では、低域成分データが複素数の場合について説明したが、低域成分データが実数の場合は、実部のみ同様の処理を行えばよい。
高域補正部170は、過渡性検出部150から判定結果を取得し、HE−AACデータが過渡性である場合に、修正低域データの時間幅に基づいて高域成分データを補正する処理部である。高域補正部170は、補正した高域成分データ(修正高域データ)を合成フィルタ部180に出力する。なお、高域補正部170は、HE−AACデータが過渡性でない場合には、高域生成部140から取得する高域成分データをそのまま修正高域データとして合成フィルタ部180に出力する。
図5は、高域補正部170の構成を示す図である。同図に示すように、この高域補正部170は、電力計算部171,172と、補正係数算出部173と、補正係数乗算部174とを備える。
このうち、電力計算部171は、LPC逆フィルタ部160bから取得する修正低域データを電力に変換する処理部である。電力計算部171が変換した電力Eは、
Figure 0005098530
によって表すことができる。電力計算部171は、変換した電力Eを補正係数算出部173に出力する。
電力計算部172は、高域生成部140から取得する高域成分データを電力に変換する処理部である。電力計算部172が変換した電力Eは、
Figure 0005098530
によって表すことができる。電力計算部172は、変換した電力Eを補正係数算出部173に出力する。電力計算部171,172が変換した電力E、Eを時間周波数軸上で表すと図6のように表される。図6は、時間周波数軸上の電力E、Eを示す図である。
補正係数算出部173は、電力計算部171,172から取得する電力E、Eを基にして、高域成分データを補正するための補正係数を算出する処理部である。図7は、補正係数の算出方法を説明するための図である。
図7に示すように、低域が時間nのみに存在し、高域が時間nおよびn+1に存在する場合には、低域の電力Eを補正しない。高域については、低域と同じ時間幅に合わせて、補正前に存在する全時間幅の電力値を集中させる。周波数帯域「1」の補正後における高域の電力E’(n,1)は
Figure 0005098530
によって表すことができ、周波数帯域「1」の補正後における高域の電力E’(n+1,1)は、
Figure 0005098530
によって表すことができる。
同様に、周波数帯域「2」の補正後における高域の電力E’(n,2)は
Figure 0005098530
によって表すことができ、周波数帯域「2」の補正後における高域の電力E’(n+1,2)は、
Figure 0005098530
によって表すことができる。なお、ここでは、時間幅をnとn+1との2個としたが、時間幅が2個以上であっても高域の電力を補正する手法は同様である。
補正係数算出部173は、補正前の高域の電力Eと、補正後における高域の電力E’とを用いて、補正係数gainを
Figure 0005098530
によって求める。補正係数算出部173は、算出した補正係数を補正係数乗算部174に出力する。
補正係数乗算部174は、補正係数算出部173から補正係数を取得し、高域生成部140から取得する高域成分データの実部および虚部に補正係数を乗算することによって、高域成分データを補正した修正高域データを生成する処理部である。修正高域データの実部及び虚部は、
Figure 0005098530
Figure 0005098530
によって表すことができる。補正係数乗算部174は、修正高域データを合成フィルタ部180に出力する。
合成フィルタ部180は、分析フィルタ部130から取得する低域成分データと高域補正部170から取得する修正高域データとを合成し、合成したデータをHE−AAC復号音データとして出力する処理部である。
次に、本実施例1にかかるデコーダ100の処理手順について説明する。図8は、本実施例1にかかるデコーダ100の処理手順を示すフローチャートである。同図に示すように、デコーダ100は、データ分離部110がHE−AACデータを取得し(ステップS101)、AACデータおよびSBRデータに分割する(ステップS102)。
続いて、AAC復号部120は、AACデータからAAC出力音データを生成し(ステップS103)、分析フィルタ部130がAAC出力音データから低域成分データを生成し(ステップS104)、高域生成部140がSBRデータおよび低域成分データから高域成分データを生成する(ステップS105)。
過渡性検出部150は、AAC出力音データに基づいて過渡性か否かを判定し(ステップS106)、定常性と判定した場合には(ステップS107,No)、ステップS111に移行する。
一方、AAC出力音データに基づいて、過渡性と判定した場合には(ステップS107,Yes)、LPC分析部160aが、低域成分データをLPC分析してLPC係数を算出し(ステップS108)、LPC逆フィルタ部160bがLPC係数に基づいて修正低域データを生成する(ステップS109)。
そして、高域補正部170が高域成分データを補正して修正高域データを生成し(ステップS110)、合成フィルタ部180が、低域成分データと修正高域データとを合成してHE−AAC復号音データを生成し(ステップS111)、HE−AAC復号音データを出力する(ステップS112)。
このように、高域補正部170が、定常成分が除去された修正低域データを用いて高域成分データを補正するので、アタック音が時間的に間延びしてしまうことを防止し、オーディオ信号の音質劣化を防止することができる。
上述してきたように、本実施例1にかかるデコーダ100は、過渡性検出部150がHE−AACデータにアタック音が含まれていると判定した場合に、LPC分析部160aおよびLPC逆フィルタ部160bが低域成分データの定常成分を除去し、高域補正部170が修正低域データの時間幅に合わせて高域成分データを補正した修正高域データを生成し、合成フィルタ部180が低域成分データおよび修正高域データを合成することによりHE−AAC復号音データを生成するので、アタック音のような過渡性の強い音源を含むオーディオ信号を復号化した場合であっても、アタック音が時間的に間延びしてしまうことを防止し、オーディオ信号の音質劣化を防止することができる。
また、本実施例1にかかるデコーダ100は、高域補正部170が、低域成分データの定常成分を除去した修正低域データの時間幅にあわせて、高域成分データを補正するので、高域成分データの時間幅を最適な幅に合わせることができる。
次に、本実施例2にかかるデコーダについて説明する。本実施例2にかかるデコーダは、AACデータに含まれる窓切り替えデータを基にして過渡性の判定を行う。ここで、窓切り替えデータは、オーディオ信号を符号化するエンコーダが、オーディオ信号の過渡性の有無を判定した判定結果のデータが含まれている。
具体的に、オーディオ信号が過渡性である場合には、窓切り替えデータにSHORTが設定され、オーディオ信号が定常性である場合には、窓切り替えデータにLONGが設定される。AACではフレーム毎にSHORTまたはLONGが設定され、一般にアタック音などの過渡性信号ではSHORTが選択される。LONGは時間分解能が低く、SHORTは、時間分解能が高い。
したがって、本実施例2のデコーダは、窓切り替えデータを参照するだけで、HE−AACデータにアタック音が含まれているか否かを判定することができ、実施例1に示したように平均電力などを算出する必要がなくなるので、デコーダの処理負荷を軽減させることができる。
次に、本実施例2にかかるデコーダの構成について説明する。図9は、本実施例2にかかるデコーダ200の構成を示す図である。同図に示すように、このデコーダ200は、データ分離部210と、AAC復号部220と、SBR復号部225とを備えて構成され、SBR復号部225は、分析フィルタ部230と、高域生成部240と、過渡性検出部250と、定常性除去部260と、高域補正部270と、合成フィルタ部280とを備える。
このうち、データ分離部210、分析フィルタ部230、高域生成部240、高域補正部270、合成フィルタ部280に関する説明は、図2に示した、データ分離部110、分析フィルタ部130、高域生成部140、高域補正部170、合成フィルタ部180に関する説明と同様であるため説明を省略する。
AAC復号部220は、データ分離部210から取得するAACデータを復号化し、復号化したAAC出力音データを分析フィルタ部230に出力すると共に、復号化したAACデータに含まれる窓切り替えデータを抽出し、抽出した窓切り替えデータを過渡性検出部250に出力する処理部である。
過渡性検出部250は、AAC復号部220から窓切り替えデータを取得し、取得した窓切り替えデータに基づいてHE−AACデータが過渡性か否かを判定し、判定結果を高域補正部270に出力する処理部である。
具体的に、過渡性検出部250は、窓切り替えデータにSHORTが設定されている場合には、過渡性と判定し、窓切り替えデータにLONGが設定されている場合には、定常性と判定する。
定常性除去部260は、低域成分データに対してLPC分析を実行し、低域成分に含まれる定常成分を除去した修正低域データを生成する処理部である。なお、定常性除去部260の詳細な説明に関しては、実施例1において説明したLPC分析部160aの処理およびLPC逆フィルタ部160bの処理と同質であるため、定常性除去部260の説明を省略する。
次に、本実施例2にかかるデコーダ200の処理手順について説明する。図10は、本実施例2にかかるデコーダ200の処理手順を示すフローチャートである。同図に示すように、デコーダ200は、データ分離部210がHE−AACデータを取得し(ステップS201)、AACデータおよびSBRデータに分割する(ステップS202)。
続いて、AAC復号部220は、AACデータからAAC出力音データを生成し(ステップS203)、分析フィルタ部230が、AAC出力音データから低域成分データを生成し(ステップS204)、高域生成部240が、SBRデータおよび低域成分データから高域成分データを生成する(ステップS205)。
過渡性検出部250は、窓切り替えデータに基づいて時間分解能がSHORTかLONGかを判定し(ステップS206)、LONGの場合には(ステップS207,No)、ステップS211に移行する。
一方、時間分解能がSHORTの場合には(ステップS207,Yes)、定常性除去部260が、低域成分データをLPC分析してLPC係数を算出し(ステップS208)、算出したLPC係数に基づいて修正低域データを生成する(ステップS209)。
そして、高域補正部270が高域成分データを補正して修正高域データを生成し(ステップS210)、合成フィルタ部280が、低域成分データと修正高域データとを合成してHE−AAC復号音データを生成し(ステップS211)、HE−AAC復号音データを出力する(ステップS212)。
このように、過渡性検出部250が、窓切り替えデータに基づいて過渡性の有無を判定するので、過渡性判定にかかる処理負荷を軽減させることができる。
上述してきたように、本実施例2にかかるデコーダ200は、過渡性検出部250がHE−AACデータにアタック音が含まれているか否かを窓切り替えデータを基に判定し、アタック音が含まれている場合に、定常性除去部260が低域成分データの定常成分を除去し、高域補正部270が修正低域データの時間幅に合わせて高域成分データを補正した修正高域データを生成し、合成フィルタ部280が低域成分データおよび修正高域データを合成することによりHE−AAC復号音データを生成するので、過渡性判定にかかる処理負荷を軽減させると共に、アタック音のような過渡性の強い音源を含むオーディオ信号を復号化した場合であっても、アタック音が時間的に間延びしてしまうことを防止し、オーディオ信号の音質劣化を防止することができる。
次に、本実施例3にかかるデコーダの説明を行う。HE−AACデータ(オーディオ信号)にアタック音が存在する場合、アタック音の位置によっては、LPC分析の予測利得が不足し、低域成分データの定常成分を十分に除去できない場合がある。そこで、本実施例3にかかるデコーダは、低域成分データのフレームを2つのサブフレームに分割し、各サブフレームで異なるLPC係数を算出することにより低域成分データの定常成分を除去する。
図11は、本実施例3にかかるデコーダ300の構成を示す図である。同図に示すように、このデコーダ300は、データ分離部310と、AAC復号部320と、SBR復号部325とを備えて構成され、SBR復号部325は、分析フィルタ部330と、高域生成部340と、過渡性検出部350と、定常性除去部360と、高域補正部370と、合成フィルタ部380とを備える。
このうち、データ分離部310、分析フィルタ部330、高域生成部340、高域補正部370、合成フィルタ部380に関する説明は、図2に示した、データ分離部110、分析フィルタ部130、高域生成部140、高域補正部170、合成フィルタ部180に関する説明と同様であり、AAC復号部320および過渡性検出部350に関する説明は、図9に示したAAC復号部220および過渡性検出部250と同様であるため説明を省略する。
定常性除去部360は、分析フィルタ部330から取得する低域成分データのフレームを2つのサブフレームに分割し、各サブフレームで異なるLPC係数を算出し、各LPC係数に基づいて低域成分データの定常成分を取り除いた修正低域データを生成する処理部である。
図12は、本実施例3にかかる定常性除去部360の処理を説明するための図である。定常性除去部360は、現フレーム(低域成分データのフレーム)を取得した場合に、図12に示すように、現フレームを第1サブフレームおよび第2サブフレームに分割する。
そして、定常性除去部360は、第1サブフレームに対して、前フレーム(現フレームの1つ前に取得したフレーム)で求めたLPC係数を用いて第1サブフレームから定常成分を取り除いた第1の残差信号を生成する。LPC係数を用いて残差信号を求める場合には、低域成分データXlow(0,k)〜Xlow(N/2−1,k)(図12参照)および前フレームのLPC係数を式(1)、式(2)に代入すればよい。
また、定常性除去部360は、第2サブフレームについては、現フレームの低域成分データXlow(N/2,k)〜Xlow(N−1,k)(図12参照)に対して現フレームのLPC係数を求め、現フレームのLPC係数と低域成分データXlow(N/2,k)〜Xlow(N−1,k)とを式(1)、式(2)に代入することによって、第2サブフレームの定常成分を除去した第2の残差信号を生成する。
定常性除去部360は、上記の処理を低域成分データの全ての周波数帯域に対して実行する。なお、第1の残差信号と第2の残差信号とを組合せたものが、低域成分データの定常成分を除去した修正低域データとなる。このように、第1サブフレームと第2サブフレームとに分けて定常成分を除去することにより、アタック音の位置がフレームの最初または最後にない場合(例えば、中央にある場合)でも、十分な予測利得を確保することができるので、低域成分データの定常性を適切に除去することができる。
次に、本実施例3にかかるデコーダ300の処理手順について説明する。図13は、本実施例3にかかるデコーダ300の処理手順を示すフローチャートである。同図に示すように、デコーダ300は、データ分離部310がHE−AACデータを取得し(ステップS301)、AACデータおよびSBRデータに分割する(ステップS302)。
続いて、AAC復号部320は、AACデータからAAC出力音データを生成し(ステップS303)、分析フィルタ部330がAAC出力音データから低域成分データを生成し(ステップS304)、高域生成部340がSBRデータおよび低域成分データから高域成分データを生成する(ステップS305)。
過渡性検出部350は、窓切り替えデータに基づいて時間分解能がSHORTかLONGかを判定し(ステップS306)、LONGの場合には(ステップS307,No)、ステップS312に移行する。
一方、時間分解能がSHORTの場合には(ステップS307,Yes)、定常性除去部360が低域成分データのフレームを第1サブフレームおよび第2サブフレームに分割し(ステップS308)、第2サブフレームをLPC分析して第2サブフレームのLPC係数を算出し(ステップS309)、修正低域データを生成する(ステップS310)。なお、第1サブフレームのLPC係数は、前フレームのLPC係数を利用する。
そして、高域補正部370が高域成分データを補正して修正高域データを生成し(ステップS311)、合成フィルタ部380が、低域成分データと修正高域データとを合成してHE−AAC復号音データを生成し(ステップS312)、HE−AAC復号音データを出力する(ステップS313)。
このように、定常性除去部360が、フレームを第1サブフレームおよび第2サブフレームに分割し、第1サブフレームは前フレームのLPC係数を用いて定常成分を除去し、第2サブフレームは第2サブフレームに対して実行されるLPC分析の結果得られるLPC係数を利用して定常成分を除去するので、アタック音の位置に関わらず、低域成分データから定常成分を適切に除去することができる。
上述してきたように、本実施例3にかかるデコーダ300は、過渡性検出部350が、アタック音が含まれているか否かを窓切り替えデータを基に判定し、アタック音が含まれている場合に、定常性除去部360が低域成分データを第1サブフレームおよび第2サブフレームに分割して、それぞれのフレームに対応するLPC係数によって定常成分を除去し、高域補正部370が修正低域データの時間幅に合わせて高域成分データを補正した修正高域データを生成し、合成フィルタ部380が低域成分データおよび修正高域データを合成することによりHE−AAC復号音データを生成するので、低域成分データの定常成分を適切に除去し、アタック音のような過渡性の強い音源を含むオーディオ信号を復号化した場合であっても、アタック音が時間的に間延びしてしまうことを防止し、オーディオ信号の音質劣化を防止することができる。
次に、本実施例4にかかるデコーダの説明を行う。低域成分データのフレームにアタック音が存在する場合、アタック音の位置(時間)によっては、LPC分析の予測利得が不足し、低域成分データの定常成分を十分除去できない場合がある。そこで、本実施例4にかかるデコーダは、フレーム内のアタック音の位置を検出し、検出位置に基づいてフレームを複数のサブフレームに分割し、サブフレーム毎に異なるLPC係数を用いて定常性除去を行う。
このように、本実施例4にかかるデコーダは、低域成分データのフレーム内のアタック音の位置を検出し、検出位置に基づいてフレームを複数のサブフレームに分割し、サブフレーム毎に異なるLPC係数を用いて定常成分を除去するので、アタック音の位置に関わらず、定常成分を適切に除去することができる。
図14は、本実施例4にかかるデコーダ400の構成を示す図である。同図に示すように、このデコーダ400は、データ分離部410と、AAC復号部420と、SBR復号部425とを備えて構成され、SBR復号部425は、分析フィルタ部430と、高域生成部440と、過渡性検出部450と、定常性除去部460と、高域補正部470と、合成フィルタ部480とを備える。
このうち、データ分離部410、分析フィルタ部430、高域生成部440、高域補正部470、合成フィルタ部480に関する説明は、図2に示した、データ分離部110、分析フィルタ部130、高域生成部140、高域補正部170、合成フィルタ部180に関する説明と同様であるため説明を省略する。
AAC復号部420は、データ分離部410から取得するAACデータを復号化し、復号化したAAC出力音データを分析フィルタ部430に出力すると共に、復号化したAACデータに含まれる窓切り替えデータおよびグルーピングデータを抽出して、窓切り替えデータおよびグルーピングデータを過渡性検出部450に出力する。
ここで、窓切り替えデータは、実施例2において説明した窓切り替えデータと同様である。グルーピングデータは、アタック音の位置を検出する場合に利用されるデータである。AACでは、窓切り替えデータにSHORTが設定された場合に、更に1フレームを8個のサブフレームに分割する。この分割の仕方を表すのがグルーピングデータである。図15は、グルーピングデータを説明するための図である。
例えば、図15において、音の変化点が#3に存在する場合(アタック音が#3に存在する場合)、グルーピングデータは、#3のみを1つのグループ(グループ2)とし、その前後を別のグループ(グループ1、3)とする。したがって、グルーピングデータから音の変化点(図15では、#3)にアタック音があると判定することができる。
過渡性検出部450は、AAC復号部420から窓切り替えデータおよびグルーピングデータを取得し、取得した窓切り替えデータに基づいてHE−AACデータが過渡性であるか否かを判定し、判定結果を高域補正部470に出力する処理部である。また、過渡性検出部450は、HE−AACデータが過渡性であると判定した場合に、グルーピングデータに基づいて、アタック音の位置を検出し、アタック音の位置の情報(以下、アタック音位置データ)を定常性除去部460に出力する。
定常性除去部460は、分析フィルタ部430から取得する低域成分データのフレームをアタック音の位置に応じて分割し、各サブフレームで異なるLPC係数を算出し、各LPC係数に基づいて低域成分データの定常成分を取り除いた修正低域データを生成する処理部である。
図16は、本実施例4にかかる定常性除去部460の処理を説明するための図である。定常性除去部460は、過渡性検出部450からアタック音位置データを取得し、現フレーム(低域成分データのフレーム)をアタック音の前後で2つのサブフレーム(第1サブフレーム、第2サブフレーム)に分割する。
定常性除去部460は、第1サブフレームについては、現フレームの低域成分データXlow(0,k)〜Xlow(n,k)に対して現フレームのLPC係数を算出し、算出したLPC係数と低域成分データXlow(0,k)〜Xlow(n,k)とを式(1)、式(2)に代入することによって、第1サブフレームの定常成分を除去した第1の残差信号を生成する。
また、定常性除去部460は、第2サブフレームについては、現フレームの低域成分データXlow(n+1,k)〜Xlow(N−1,k)に対して現フレームのLPC係数を算出し、算出したLPC係数と低域成分データXlow(n+1,k)〜Xlow(N−1,k)とを式(1)、式(2)に代入することによって、第2サブフレームの定常成分を除去した第2の残差信号を生成する。
定常性除去部460は、上記の処理を低域成分データの全ての周波数帯域に対して実行する。なお、第1の残差信号と第2の残差信号とを組合せたものが、低域成分データの定常成分を除去した修正低域データとなる。このように、アタック音の位置に基づいて、第1サブフレームと第2サブフレームとに分けて定常成分を除去することにより、アタック音の位置が変化しても十分な予測利得を確保することができるので、低域成分データの定常性を適切に除去することができる。
なお、ここでは、定常性除去部460がアタック音の前後で2つのサブフレームに分割する例を示したが、3つ以上のサブフレームに分割し、それぞれのサブフレームに対するLPC係数を求め、定常成分を除去しても良い。
次に、本実施例4にかかるデコーダ400の処理手順について説明する。図17は、本実施例4にかかるデコーダ400の処理手順を示すフローチャートである。同図に示すように、デコーダ400は、データ分離部410がHE−AACデータを取得し(ステップS401)、AACデータおよびSBRデータに分離する(ステップS402)。
続いて、AAC復号部420は、AACデータからAAC出力音データを生成し(ステップS403)、窓切り替えデータおよびグルーピングデータを出力し(ステップS404)、分析フィルタ部430がAAC出力音データから低域成分データを生成する(ステップS405)。
そして、高域生成部440はSBRデータおよび低域成分データから高域成分データを生成し(ステップS406)、過渡性検出部450は、窓切り替えデータに基づいて時間分解能がSHORTかLONGかを判定し(ステップS407)、LONGの場合には(ステップS408,No)、ステップS413に移行する。
一方、時間分解能がSHORTの場合には(ステップS408,Yes)、定常性除去部460がアタック音の位置に応じて低域成分データのフレームを第1サブフレームおよび第2サブフレームに分割し(ステップS409)、各サブフレームをLPC分析して各サブフレームのLPC係数を算出し(ステップS410)、修正低域データを生成する(ステップS411)。
そして、高域補正部470が高域成分データを補正して修正高域データを生成し(ステップS412)、合成フィルタ部480が、低域成分データと修正高域データとを合成してHE−AAC復号音データを生成し(ステップS413)、HE−AAC復号音データを出力する(ステップS414)。
このように、定常性除去部460が、アタック音の位置に基づいてフレームを第1サブフレームおよび第2サブフレームに分割し、サブフレーム毎に異なるLPC係数を用いて定常成分を除去するので、アタック音の位置に関わらず、定常成分を適切に除去することができる。
上述してきたように、本実施例4にかかるデコーダ400は、アタック音が含まれている場合に、定常性除去部460がアタック音の位置に基づいて、低域成分データを第1サブフレームおよび第2サブフレームに分割し、それぞれのフレームに対応するLPC係数によって定常成分を除去し、高域補正部470が修正低域データの時間幅に合わせて高域成分データを補正した修正高域データを生成し、合成フィルタ部480が低域成分データおよび修正高域データを合成することによりHE−AAC復号音データを生成するので、アタック音の位置に関わらず低域成分データの定常成分を適切に除去し、アタック音のような過渡性の強い音源を含むオーディオ信号を復号化した場合であっても、アタック音が時間的に間延びしてしまうことを防止し、オーディオ信号の音質劣化を防止することができる。
なお、本実施例1〜4では、LPC逆フィルタ(短期予測逆フィルタ)によって、低域成分データの定常成分を除去していたが、これに限定されるものではなく、例えば、長期予測逆フィルタをLPC逆フィルタの代わりに用いてもよいし、LPC逆フィルタおよび長期予測逆フィルタを組合せて、低域成分データの定常成分を除去してもよい。
ところで、本実施例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部あるいは一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
また、図2、図9、図11、図14に示したデコーダ100〜400の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、各装置にて行われる各処理機能は、その全部または任意の一部がCPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
図18は、実施例1〜4にかかるデコーダを構成するコンピュータのハードウェア構成を示す図である。図18に示すように、このコンピュータ(デコーダ)500は、HE−AACデータ等のデータを受け付ける入力装置501、モニタ502、RAM(Random Access Memory)503、ROM(Read Only Memory)504、記憶媒体からデータを読み取る媒体読取装置505、他の装置との間でデータの送受信を行うネットワークインターフェース506、CPU(Central Processing Unit)507、HDD(Hard Disk Drive)508をバス509で接続して構成される。
そして、HDD508には、上記したデコーダ100〜400の機能と同様の機能を発揮するデコードプログラム508bが記憶されている。CPU407がデコードプログラム508bを読み出して実行することにより、デコードプロセス507aが起動される。このデコードプロセス507aは、データ分離部110,210,310,410、AAC復号部120,220,320,420、SBR復号部125,225,325,425に対応する。
また、HDD508には、入力装置501等によって取得されたHE−AACデータ508aが記憶される。CPU507は、HDD508に格納されたHE−AACデータ508aを読み出してRAM503に格納し、RAM503に格納されたHE−AACデータ503aを用いて、復号化を行い、復号化したHE−AAC復号音データ503bをRAM503に記憶する。
ところで、図18に示したデコードプログラム508bは、必ずしも最初からHDD508に記憶させておく必要はない。たとえば、コンピュータに挿入されるフレキシブルディスク(FD)、CD−ROM、DVDディスク、光磁気ディスク、ICカードなどの「可搬用の物理媒体」、または、コンピュータの内外に備えられるハードディスクドライブ(HDD)などの「固定用の物理媒体」、さらには、公衆回線、インターネット、LAN、WANなどを介してコンピュータに接続される「他のコンピュータ(またはサーバ)」などにデコードプログラム508bを記憶しておき、コンピュータがこれらからデコードプログラム508bを読み出して実行するようにしてもよい。
(付記1)オーディオ信号の低域成分を符号化した第1の符号化データから低域成分を復号し、オーディオ信号の高域成分を復号する場合に利用する第2の符号化データおよび前記低域成分からオーディオ信号の高域成分を復号する復号化装置であって、
前記オーディオ信号が過渡性であるか否かを判定する過渡性判定手段と、
前記オーディオ信号が過渡性である場合に、前記第1の符号化データを復号した低域成分に含まれる定常成分を補正した補正低域成分を生成する低域成分補正手段と、
前記補正低域成分の時間幅に基づいて前記高域成分を補正した補正高域成分を生成する高域成分補正手段と、
前記低域成分と前記補正高域成分とを合成して前記オーディオ信号を復号する復号手段と、
を備えたことを特徴とする復号化装置。
(付記2)前記低域成分補正手段は、前記低域成分に対してLPC分析を実行して当該低域成分のLPC係数を算出し、算出したLPC係数に基づいて前記低域成分に含まれる定常成分を補正した補正低域成分を生成することを特徴とする付記1に記載の復号化装置。
(付記3)前記過渡性判定手段は、過去に取得したオーディオ信号の低域成分から平均電力を算出し、新たに取得したオーディオ信号の低域成分の電力と前記平均電力とを比較することにより復号対象となるオーディオ信号が過渡性であるか否かを判定することを特徴とする付記1に記載の復号化装置。
(付記4)前記第1の符号化データを復号して得られる低域成分は前記オーディオ信号が過渡性であるか否かを示す窓切り替え情報を含み、前記過渡性判定手段は、前記窓切り替え情報を基にして前記オーディオ信号が過渡性であるか否かを判定することを特徴とする付記1に記載の復号化装置。
(付記5)前記低域成分補正手段は、前記低域成分のフレームを第1サブフレームおよび第2サブフレームに分割し、前記第1サブフレームに含まれる定常成分を過去のフレームに対してLPC分析を行った結果得られたLPC係数を用いて除去し、前記第2サブフレームに含まれる定常成分を当該第2サブフレームに対してLPC分析を行った結果得られるLPC係数を用いて除去することにより前記低域成分に含まれる定常成分を補正した補正低域成分を生成することを特徴とする付記1に記載の復号化装置。
(付記6)前記低域成分補正手段は、前記オーディオ信号が過渡性である場合に、前記低域成分のフレームを前記過渡性の音が存在する位置の前後でサブフレームに分割し、分割した各サブフレームに対してLPC分析を実行して各サブフレームに対応するLPC係数を算出し、算出したLPC係数に基づいて各サブフレームを補正することにより前記低域成分に含まれる定常成分を補正した補正低域成分を生成することを特徴とする付記1に記載の復号化装置。
(付記7)オーディオ信号の低域成分を符号化した第1の符号化データから低域成分を復号し、オーディオ信号の高域成分を復号する場合に利用する第2の符号化データおよび前記低域成分からオーディオ信号の高域成分を復号する復号化装置の復号化方法であって、
前記オーディオ信号が過渡性であるか否かを判定する過渡性判定ステップと、
前記オーディオ信号が過渡性である場合に、前記第1の符号化データを復号した低域成分に含まれる定常成分を補正した補正低域成分を生成する低域成分補正ステップと、
前記補正低域成分の時間幅に基づいて前記高域成分を補正した補正高域成分を生成する高域成分補正ステップと、
前記低域成分と前記補正高域成分とを合成して前記オーディオ信号を復号する復号ステップと、
を含んだことを特徴とする復号化方法。
(付記8)前記低域成分補正ステップは、前記低域成分に対してLPC分析を実行して当該低域成分のLPC係数を算出し、算出したLPC係数に基づいて前記低域成分に含まれる定常成分を補正した補正低域成分を生成することを特徴とする付記7に記載の復号化方法。
(付記9)前記過渡性判定ステップは、過去に取得したオーディオ信号の低域成分から平均電力を算出し、新たに取得したオーディオ信号の低域成分の電力と前記平均電力とを比較することにより復号対象となるオーディオ信号が過渡性であるか否かを判定することを特徴とする付記7に記載の復号化方法。
(付記10)前記第1の符号化データを復号して得られる低域成分は前記オーディオ信号が過渡性であるか否かを示す窓切り替え情報を含み、前記過渡性判定ステップは、前記窓切り替え情報を基にして前記オーディオ信号が過渡性であるか否かを判定することを特徴とする付記7に記載の復号化方法。
(付記11)前記低域成分補正ステップは、前記低域成分のフレームを第1サブフレームおよび第2サブフレームに分割し、前記第1サブフレームに含まれる定常成分を過去のフレームに対してLPC分析を行った結果得られたLPC係数を用いて除去し、前記第2サブフレームに含まれる定常成分を当該第2サブフレームに対してLPC分析を行った結果得られるLPC係数を用いて除去することにより前記低域成分に含まれる定常成分を補正した補正低域成分を生成することを特徴とする付記7に記載の復号化方法。
(付記12)前記低域成分補正ステップは、前記オーディオ信号が過渡性である場合に、前記低域成分のフレームを前記過渡性の音が存在する位置の前後でサブフレームに分割し、分割した各サブフレームに対してLPC分析を実行して各サブフレームに対応するLPC係数を算出し、算出したLPC係数に基づいて各サブフレームを補正することにより前記低域成分に含まれる定常成分を補正した補正低域成分を生成することを特徴とする付記7に記載の復号化方法。
(付記13)オーディオ信号の低域成分を符号化した第1の符号化データから低域成分を復号し、オーディオ信号の高域成分を復号する場合に利用する第2の符号化データおよび前記低域成分からオーディオ信号の高域成分を復号する復号化プログラムであって、
コンピュータに
前記オーディオ信号が過渡性であるか否かを判定する過渡性判定手順と、
前記オーディオ信号が過渡性である場合に、前記第1の符号化データを復号した低域成分に含まれる定常成分を補正した補正低域成分を生成する低域成分補正手順と、
前記補正低域成分の時間幅に基づいて前記高域成分を補正した補正高域成分を生成する高域成分補正手順と、
前記低域成分と前記補正高域成分とを合成して前記オーディオ信号を復号する復号手順と、
を実行させることを特徴とする復号化プログラム。
(付記14)前記低域成分補正手順は、前記低域成分に対してLPC分析を実行して当該低域成分のLPC係数を算出し、算出したLPC係数に基づいて前記低域成分に含まれる定常成分を補正した補正低域成分を生成することを特徴とする付記13に記載の復号化プログラム。
(付記15)前記過渡性判定手順は、過去に取得したオーディオ信号の低域成分から平均電力を算出し、新たに取得したオーディオ信号の低域成分の電力と前記平均電力とを比較することにより復号対象となるオーディオ信号が過渡性であるか否かを判定することを特徴とする付記13に記載の復号化プログラム。
(付記16)前記第1の符号化データを復号して得られる低域成分は前記オーディオ信号が過渡性であるか否かを示す窓切り替え情報を含み、前記過渡性判定手順は、前記窓切り替え情報を基にして前記オーディオ信号が過渡性であるか否かを判定することを特徴とする付記13に記載の復号化プログラム。
(付記17)前記低域成分補正手順は、前記低域成分のフレームを第1サブフレームおよび第2サブフレームに分割し、前記第1サブフレームに含まれる定常成分を過去のフレームに対してLPC分析を行った結果得られたLPC係数を用いて除去し、前記第2サブフレームに含まれる定常成分を当該第2サブフレームに対してLPC分析を行った結果得られるLPC係数を用いて除去することにより前記低域成分に含まれる定常成分を補正した補正低域成分を生成することを特徴とする付記13に記載の復号化プログラム。
(付記18)前記低域成分補正手順は、前記オーディオ信号が過渡性である場合に、前記低域成分のフレームを前記過渡性の音が存在する位置の前後でサブフレームに分割し、分割した各サブフレームに対してLPC分析を実行して各サブフレームに対応するLPC係数を算出し、算出したLPC係数に基づいて各サブフレームを補正することにより前記低域成分に含まれる定常成分を補正した補正低域成分を生成することを特徴とする付記13に記載の復号化プログラム。
以上のように、本発明にかかる復号化装置、復号化方法および復号化プログラムは、符号化されたオーディオ信号を復号化するデコーダ等に有用であり、特に、オーディオ信号にアタック音が含まれている場合であっても、適切に復号化する必要がある場合に適している。
本実施例1にかかるデコーダの概要および特徴を説明するための図である。 本実施例1にかかるデコーダの構成を示す図である。 低域成分データを説明するための図である。 過渡性検出部の処理を説明するための図である。 高域補正部の構成を示す図である。 時間周波数軸上の電力E、Eを示す図である。 補正係数の算出方法を説明するための図である。 本実施例1にかかるデコーダの処理手順を示すフローチャートである。 本実施例2にかかるデコーダの構成を示す図である。 本実施例2にかかるデコーダの処理手順を示すフローチャートである。 本実施例3にかかるデコーダの構成を示す図である。 本実施例3にかかる定常性除去部の処理を説明するための図である。 本実施例3にかかるデコーダの処理手順を示すフローチャートである。 本実施例4にかかるデコーダの構成を示す図である。 グルーピングデータを説明するための図である。 本実施例4にかかる定常性除去部の処理を説明するための図である。 本実施例4にかかるデコーダの処理手順を示すフローチャートである。 実施例1〜4にかかるデコーダを構成するコンピュータのハードウェア構成を示す図である。 従来のデコーダの構成を示す機能ブロック図である。 デコーダの処理の概要を説明するための説明図である。 従来技術の問題点を説明するための説明図である。
符号の説明
10,100,200,300,400 デコーダ
11,110,210,310,410 データ分離部
12,120,220,320,420 AAC復号部
13,130,230,330,430 分析フィルタ部
14,140,240,340,440 高域生成部
15,180,280,380,480 合成フィルタ部
125,225,325,425 SBR復号部
150,250,350,450 過渡性検出部
160a LPC分析部
160b LPC逆フィルタ部
170,270,370,470 高域補正部
171,172 電力計算部
173 補正係数算出部
174 補正係数乗算部
260,360,460 定常性除去部
500 コンピュータ
501 入力装置
502 モニタ
503 RAM
503a,508a HE−AACデータ
503b HE−AAC復号音データ
504 ROM
505 媒体読取装置
506 ネットワークインターフェース
507 CPU
507a デコードプロセス
508 HDD
508b デコードプログラム
509 バス

Claims (10)

  1. オーディオ信号の低域成分を符号化した第1の符号化データから低域成分を復号し、オーディオ信号の高域成分を復号する場合に利用する第2の符号化データおよび前記第1の符号化データから復号された低域成分からオーディオ信号の高域成分を復号する復号化装置であって、
    前記オーディオ信号のフレームに過渡性があるか否かを判定する過渡性判定手段と、
    前記オーディオ信号のフレームに過渡性がある場合に、前記第1の符号化データを復号した低域成分に含まれる定常成分を補正した補正低域成分を生成する低域成分補正手段と、
    前記補正低域成分の時間幅に基づいて前記高域成分を補正した補正高域成分を生成する高域成分補正手段と、
    フレームに過渡性がある場合には、前記低域成分と前記補正高域成分とを合成して前記オーディオ信号全体を復号する復号手段と、
    を備えたことを特徴とする復号化装置。
  2. 前記低域成分補正手段は、前記低域成分に対してLPC分析を実行して当該低域成分のLPC係数を算出し、算出したLPC係数に基づいて前記低域成分に含まれる定常成分を補正した補正低域成分を生成することを特徴とする請求項1に記載の復号化装置。
  3. 前記過渡性判定手段は、過去に取得したオーディオ信号の低域成分から平均電力を算出し、新たに取得したオーディオ信号の低域成分の電力と前記平均電力とを比較することにより復号対象となるオーディオ信号が過渡性であるか否かを判定することを特徴とする請求項1に記載の復号化装置。
  4. 前記第1の符号化データを復号して得られる低域成分は前記オーディオ信号が過渡性であるか否かを示す窓切り替え情報を含み、前記過渡性判定手段は、前記窓切り替え情報を基にして前記オーディオ信号が過渡性であるか否かを判定することを特徴とする請求項1に記載の復号化装置。
  5. 前記低域成分補正手段は、前記低域成分のフレームを第1サブフレームおよび第2サブフレームに分割し、前記第1サブフレームに含まれる定常成分を過去のフレームに対してLPC分析を行った結果得られたLPC係数を用いて除去し、前記第2サブフレームに含まれる定常成分を当該第2サブフレームに対してLPC分析を行った結果得られるLPC係数を用いて除去することにより前記低域成分に含まれる定常成分を補正した補正低域成分を生成することを特徴とする請求項1に記載の復号化装置。
  6. 前記低域成分補正手段は、前記オーディオ信号が過渡性である場合に、前記低域成分のフレームを前記過渡性の音が存在する位置の前後でサブフレームに分割し、分割した各サブフレームに対してLPC分析を実行して各サブフレームに対応するLPC係数を算出し、算出したLPC係数に基づいて各サブフレームを補正することにより前記低域成分に含まれる定常成分を補正した補正低域成分を生成することを特徴とする請求項1に記載の復号化装置。
  7. オーディオ信号の低域成分を符号化した第1の符号化データから低域成分を復号し、オーディオ信号の高域成分を復号する場合に利用する第2の符号化データおよび前記第1の符号化データから復号された低域成分からオーディオ信号の高域成分を復号する復号化装置の復号化方法であって、
    前記オーディオ信号のフレームに過渡性があるか否かを判定する過渡性判定ステップと、
    前記オーディオ信号のフレームに過渡性がある場合に、前記第1の符号化データを復号した低域成分に含まれる定常成分を補正した補正低域成分を生成する低域成分補正ステップと、
    前記補正低域成分の時間幅に基づいて前記高域成分を補正した補正高域成分を生成する高域成分補正ステップと、
    フレームに過渡性がある場合には、前記低域成分と前記補正高域成分とを合成して前記オーディオ信号全体を復号する復号ステップと、
    を含んだことを特徴とする復号化方法。
  8. 前記低域成分補正ステップは、前記低域成分に対してLPC分析を実行して当該低域成分のLPC係数を算出し、算出したLPC係数に基づいて前記低域成分に含まれる定常成分を補正した補正低域成分を生成することを特徴とする請求項7に記載の復号化方法。
  9. オーディオ信号の低域成分を符号化した第1の符号化データから低域成分を復号し、オーディオ信号の高域成分を復号する場合に利用する第2の符号化データおよび前記第1の符号化データから復号された低域成分からオーディオ信号の高域成分を復号する復号化プログラムであって、
    コンピュータに
    前記オーディオ信号のフレームに過渡性があるか否かを判定する過渡性判定手順と、
    前記オーディオ信号のフレームに過渡性がある場合に、前記第1の符号化データを復号した低域成分に含まれる定常成分を補正した補正低域成分を生成する低域成分補正手順と、
    前記補正低域成分の時間幅に基づいて前記高域成分を補正した補正高域成分を生成する高域成分補正手順と、
    フレームに過渡性がある場合には、前記低域成分と前記補正高域成分とを合成して前記オーディオ信号全体を復号する復号手順と、
    を実行させることを特徴とする復号化プログラム。
  10. 前記低域成分補正手順は、前記低域成分に対してLPC分析を実行して当該低域成分のLPC係数を算出し、算出したLPC係数に基づいて前記低域成分に含まれる定常成分を補正した補正低域成分を生成することを特徴とする請求項9に記載の復号化プログラム。
JP2007237217A 2007-09-12 2007-09-12 復号化装置、復号化方法および復号化プログラム Expired - Fee Related JP5098530B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007237217A JP5098530B2 (ja) 2007-09-12 2007-09-12 復号化装置、復号化方法および復号化プログラム
US12/232,096 US8073687B2 (en) 2007-09-12 2008-09-10 Audio regeneration method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007237217A JP5098530B2 (ja) 2007-09-12 2007-09-12 復号化装置、復号化方法および復号化プログラム

Publications (2)

Publication Number Publication Date
JP2009069430A JP2009069430A (ja) 2009-04-02
JP5098530B2 true JP5098530B2 (ja) 2012-12-12

Family

ID=40432836

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007237217A Expired - Fee Related JP5098530B2 (ja) 2007-09-12 2007-09-12 復号化装置、復号化方法および復号化プログラム

Country Status (2)

Country Link
US (1) US8073687B2 (ja)
JP (1) JP5098530B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5309944B2 (ja) * 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
TWI484473B (zh) 2009-10-30 2015-05-11 Dolby Int Ab 用於從編碼位元串流擷取音訊訊號之節奏資訊、及估算音訊訊號之知覺顯著節奏的方法及系統
US8560330B2 (en) * 2010-07-19 2013-10-15 Futurewei Technologies, Inc. Energy envelope perceptual correction for high band coding
KR102159194B1 (ko) * 2010-07-19 2020-09-23 돌비 인터네셔널 에이비 고주파 복원 동안 오디오 신호들의 프로세싱
JP5807453B2 (ja) * 2011-08-30 2015-11-10 富士通株式会社 符号化方法、符号化装置および符号化プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3068898B2 (ja) * 1991-08-01 2000-07-24 株式会社東芝 電流リード
JP4168976B2 (ja) 2004-05-28 2008-10-22 ソニー株式会社 オーディオ信号符号化装置及び方法
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
EP1798724B1 (en) * 2004-11-05 2014-06-18 Panasonic Corporation Encoder, decoder, encoding method, and decoding method
US7983904B2 (en) * 2004-11-05 2011-07-19 Panasonic Corporation Scalable decoding apparatus and scalable encoding apparatus
WO2007148925A1 (en) * 2006-06-21 2007-12-27 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band

Also Published As

Publication number Publication date
JP2009069430A (ja) 2009-04-02
US20090070120A1 (en) 2009-03-12
US8073687B2 (en) 2011-12-06

Similar Documents

Publication Publication Date Title
EP2693430B1 (en) Encoding apparatus and method, and program
US6134518A (en) Digital audio signal coding using a CELP coder and a transform coder
TWI480857B (zh) 在不活動階段期間利用雜訊合成之音訊編解碼器
KR101975066B1 (ko) 신호 처리 장치 및 방법, 및 컴퓨터 판독가능 기록 매체
JP5103880B2 (ja) 復号化装置および復号化方法
TWI480856B (zh) 音訊編解碼器中之雜訊產生技術
AU2012297804B2 (en) Encoding device and method, decoding device and method, and program
KR101427863B1 (ko) 오디오 신호 코딩 방법 및 장치
RU2627102C2 (ru) Декодер для формирования аудиосигнала с улучшенной частотной характеристикой, способ декодирования, кодер для формирования кодированного сигнала и способ кодирования с использованием компактной дополнительной информации для выбора
JP6530449B2 (ja) 符号化モード決定方法及び該装置、オーディオ符号化方法及び該装置、並びにオーディオ復号化方法及び該装置
JP6335190B2 (ja) 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加
JP5098530B2 (ja) 復号化装置、復号化方法および復号化プログラム
JP6979048B2 (ja) 低複雑度の調性適応音声信号量子化
US8428953B2 (en) Audio decoding device, audio decoding method, program, and integrated circuit
JP2007509363A (ja) オーディオ符号化方法及び装置
JP2007334261A (ja) 信号処理方法、信号処理装置及びプログラム
AU2015295679B2 (en) Apparatus and method for comfort noise generation mode selection
JP4767289B2 (ja) 信号処理方法、信号処理装置及びプログラム
JP2001343984A (ja) 有音/無音判定装置、音声復号化装置及び音声復号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100517

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110926

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111025

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120314

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120828

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120910

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151005

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees