JP2008268792A - オーディオ信号符号化装置およびそのビットレート変換装置 - Google Patents

オーディオ信号符号化装置およびそのビットレート変換装置 Download PDF

Info

Publication number
JP2008268792A
JP2008268792A JP2007115176A JP2007115176A JP2008268792A JP 2008268792 A JP2008268792 A JP 2008268792A JP 2007115176 A JP2007115176 A JP 2007115176A JP 2007115176 A JP2007115176 A JP 2007115176A JP 2008268792 A JP2008268792 A JP 2008268792A
Authority
JP
Japan
Prior art keywords
bit rate
spectrum signal
quantization
encoded
accuracy information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007115176A
Other languages
English (en)
Inventor
Kiyotaka Nagai
清隆 永井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2007115176A priority Critical patent/JP2008268792A/ja
Publication of JP2008268792A publication Critical patent/JP2008268792A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】少ない演算量で音質劣化のない高能率符号化データのビットレート変換を実現するオーディオ信号符号化装置およびそのビットレート変換装置を提供する。
【解決手段】第1のビットレートと第2のビットレートで量子化精度情報を算出する量子化情報算出部130と、第1のビットレートと第2のビットレートの差分量子化精度情報を生成、出力する補助データ生成部140とを備える。第1のビットレートの符号化データの補助データとして、音質に大きな影響を及ぼし、ビットレートに依存する前記差分量子化精度情報を付加することにより、第1のビットレートから第2のビットレートへの符号化データの変換を、少ない演算量で音質劣化なく実現することができる。
【選択図】図1

Description

本発明は、少ない演算量で音質劣化の少ないビットレート変換を行うための高能率符号化データを生成するオーディオ信号符号化装置およびそのビットレート変換装置に関するものである。
従来の高能率オーディオ符号化データのビットレート変換装置(以下、ビットレート変換装置)としては、オーディオ符号化データ復号化装置とオーディオ信号符号化装置を縦続接続した装置が、広く知られている。すなわち、前記従来のビットレート変換装置では、第1のビットレートで符号化したオーディオ符号化データをオーディオ符号化データ復号化装置で復号化して、信号を再生し、次に、オーディオ信号符号化装置で第2のビットレートで符号化することにより、第1のビットレートから第2のビットレートの符号化データに変換する。
このような従来のビットレート変換装置について、オーディオ信号の高能率符号化方式として、地上波デジタルテレビ放送の音声部などに広く使用されている非特許文献1記載のMPEG(Moving Picture Experts Group)−2 AAC(Advanced Audio Coding)を例として説明する。
図8は、前記従来のオーディオ符号化データ復号化装置の構成を示すブロック図である。
図8において、符号化データ復号化部800では、入力されたオーディオ符号化データを復号化して、量子化されたスペクトル信号(以下量子化スペクトル信号と呼ぶ)と副情報とを出力する。
逆量子化部810では、量子化スペクトル信号を逆量子化して、前記副情報に含まれる量子化精度情報(スケールファクタ)を使用して、再生スペクトル信号を算出し、出力する。
前記逆量子化は、量子化スペクトル信号をX、逆量子化した後のスペクトル信号をYとすると、(数1)により行う。
Figure 2008268792
ここで、sign(X)はXの符号を表し、X<0なら−1、X=0なら0、X>0なら1の値をとる関数、abs(X)はXの絶対値を表す関数である。次に、量子化精度情報sfを使用して、(数2)により逆量子化した後のスペクトル信号Yから再生スペクトル信号Zを算出する。ここで、SF_OFFSETの値は100である。
Figure 2008268792
周波数時間変換部820では、逆量子化部810から出力された周波数領域の再生スペクトル信号を入力として、時間領域のオーディオ信号に逆変換して出力する。前記逆変換としては、逆変形離散コサイン変換(以下IMDCT(Inverse Modified Discrete Cosine Transform)と呼ぶ)を用い、周波数領域のスペクトル信号(MDCT係数)を時間領域のオーディオ信号に変換する。
図9は、前記従来のオーディオ信号符号化装置の構成を示すブロック図である。
図9において、時間周波数変換部900では、時間領域のオーディオ信号を入力として、周波数領域のスペクトル信号(MDCT係数)に変換して出力する。
量子化符号化部910では、時間周波数変換部900からの前記スペクトル信号をスケールファクタバンドと呼ばれるバンド単位にグループ化して、前記スペクトル信号を前記バンド単位で量子化して、量子化スペクトル信号を算出する。次に、前記量子化スペクトル信号をハフマン符号によるエントロピー符号化して、符号化された量子化スペクトル信号(以下符号化スペクトル信号と呼ぶ)を算出し、出力する。前記スペクトル信号の量子化と符号化に際しては、量子化情報算出部930からの量子化情報を使用して、所定のビットレートで量子化と符号化を行う。量子化と符号化の詳細は、例えば、非特許文献2に記載されている。
符号化データ生成部920では、主情報である符号化スペクトル信号と量子化情報などの副情報を多重化して、符号化データを生成し、出力する。
量子化情報算出部930では、時間領域のオーディオ信号と周波数領域のスペクトル信号を使用して、心理聴覚モデルを使用して、所定のビットレートでスペクトル信号の量子化と符号化に必要な量子化情報を算出して、量子化符号化部910に出力する。量子化情報は、スペクトル信号の量子化精度情報(スケールファクタ)、量子化スペクトル信号のエントロピー符号化コード表(sect_cb)、帯域幅(max_sfb)などで構成される。なお、実際には、スケールファクタは、初期値を表すグローバルゲインと隣接スケールファクタバンド間の差分スケールファクタとに分けて、符号化データ生成部920で符号化される。
しかしながら、このような従来のビットレート変換装置は、オーディオ符号化データ復号化装置とオーディオ信号符号化装置をともに必要とするので、ビットレート変換に必要な演算量が多い、という課題を有していた。
そこで、少ない演算量でビットレート変換を実現する装置として、例えば特許文献1に記載のビットレート変換装置が提案されている。
図10は、前記特許文献1に記載された従来のビットレート変換装置の構成を示すブロック図である。
図10において、符号化データ復号化部1000は、第1のビットレートのオーディオ符号化データを入力し、復号化して主情報の量子化スペクトル信号と副情報とを出力する。
量子化スペクトル変更部1010では、符号化データ復号化部1000からの前記量子化スペクトル信号に同一値が多く含まれないように、例えば乱数を加算することにより、前記量子化スペクトル信号を変更して出力する。
逆量子化部1020では、量子化スペクトル変更部1010からの前記変更された量子化スペクトル信号を前記副情報に含まれる量子化精度情報に基づいて逆量子化して逆量子化したスペクトル信号を算出して出力する。
量子化符号化部1030では、ビットレート変更前の第1のビットレートのオーディオ符号化データの副情報に含まれる量子化精度情報を基に、所望のビットレートを満たすように前記量子化精度情報を変更して量子化と符号化を行う。具体的には、各スケールファクタバンドの量子化精度を表す差分スケールファクタはそのまま流用し、全帯域の量子化精度を表すグローバルゲインを変更することでビットレートの制御を行う。
符号化データ生成部1040では、主情報である符号化スペクトル信号と量子化精度情報などの副情報を多重化して符号化データを生成し、第2のビットレートのオーディオ符号化データを出力する。
以上のようにして、前記特許文献1に記載された従来のビットレート変換装置では、時間領域でなく、周波数領域でビットレート変換を行うことにより、周波数時間変換部820と時間周波数変換部900を不要とし、演算量を低減する。また、変換前の量子化精度情報を流用することにより、量子化情報算出部930での心理聴覚モデルを使用する量子化精度情報の算出を不要とし、演算量を低減する。
特開2003−15694号公報 イソ/アイイーシー 13818−7 インフォメーション テクノロジー ―― ジェネリック コーディング オブ ムービング ピクチャーズ アンド アソシエイティッド オーディオ インフォメーション ―― パート7:アドバンスト オーディオ コーディング (エイエイシー)(ISO/IEC 13818−7, Information Technology ―― Generic coding of moving pictures and associated audio information −− Part 7: Advanced Audio Coding (AAC)) イソ/アイイーシー 14496−3 スケーラブル ロスレス コーディング (エスエルエス)(ISO/IEC 14496−3 Scalable Lossless Coding (SLS))
しかしながら、前記特許文献1に記載された従来のビットレート変換装置では、ビットレート変換に伴う音質劣化が大きいという問題点を有していた。
つまり、前記特許文献1に記載された従来のビットレート変換装置では、ビットレート変換前のオーディオ符号化データの副情報に含まれている各スケールファクタバンドの量子化精度情報を使用しているため、変換後のビットレートに最適な量子化精度情報とは異なる。その結果、第1のビットレートから第2のビットレートへのビットレート変化が大きい場合に、音質劣化が大きくなるという問題点を有していた。
図11は、スペクトル信号と高いビットレートと低いビットレートにおける量子化精度情報(スケールファクタsf)との関係の例を示す図である。同図のスペクトル信号は、スケールファクタバンド内のスペクトル信号の絶対値の最大を表す。同図において、横軸は周波数でスケールファクタバンド番号を表し、縦軸は信号レベルを対数で表したものである。同図(a)は、従来のオーディオ符号化データ復号化装置とオーディオ信号符号化装置とを縦続接続したビットレート変換装置による場合、(b)は特許文献1に記載されたビットレート変換装置による場合である。スケールファクタバンド毎の量子化ノイズを制御するために、スケールファクタを使用してノイズシェーピング(ノイズの整形)を行っている。同図に示すように、低いビットレートと高いビットレートのスケールファクタの差分は、(a)ではスペクトル信号のレベルが大きいほど大きくなるのに対して、(b)では一定である。(a)では変換後のビットレートに適合したスケールファクタを用いているのに対し、(b)では変換前のスケールファクタを流用しているので、音質が劣化する。
本発明は上記従来の問題点を解決するもので、少ない演算量で音質劣化なくビットレート変換を実現するためのオーディオ符号化データを生成するオーディオ信号符号化装置とそのビットレート変換装置を提供することを目的とする。
上記課題を解決するため、本発明のオーディオ信号符号化装置は、時間領域のオーディオ信号を周波数領域のスペクトル信号に変換する時間周波数変換部と、前記スペクトル信号を量子化する際の量子化精度を示す量子化精度情報を、第1のビットレート及び第2のビットレートに対してそれぞれ算出する量子化情報算出部と、前記第1のビットレートの量子化精度情報を用いて前記スペクトル信号を量子化し、前記第1のビットレートで符号化した符号化スペクトル信号を算出する量子化符号化部と、前記符号化スペクトル信号と、符号化した前記第1のビットレートの量子化精度情報を多重化した第1のビットレートの符号化データを生成し、出力する符号化データ生成部と、前記第1のビットレートと第2のビットレートの量子化精度情報の差分である差分量子化精度情報を符号化した補助データを出力する補助データ生成部とを備え、前記第1のビットレートの符号化データの補助データとして量子化精度情報の差分を出力することにより、音質劣化のないビットレート変換を少ない演算量で実現することができる。
なお、前記補助データ生成部は、上記の差分量子化精度情報に代えて、第2のビットレートの量子化精度情報を符号化したものを補助データとして出力してもよい。
また、前記量子化情報算出部は、前記スペクトル信号を前記第1のビットレート及び第2のビットレートそれぞれの量子化精度情報に基づいて量子化した量子化スペクトル信号をエントロピー符号化する際の、第1のビットレート及び第2のビットレートのエントロピー符号化コード表をそれぞれ算出し、前記量子化符号化部は、第1のビットレートの量子化精度情報を利用して量子化した量子化スペクトル信号を、前記第1のビットレートのエントロピー符号化コード表を用いて符号化し、前記補助データ生成部は、前記第2のビットレートのエントロピー符号化コード表を符号化し、前記補助データに多重化することとしてもよい。
また、前記量子化情報算出部は、前記スペクトル信号を量子化精度情報に基づいて量子化する際の、第1のビットレート及び第2のビットレートの量子化スペクトル信号の帯域幅をそれぞれ算出し、前記量子化符号化部は、前記スペクトル信号を前記第1のビットレートの量子化スペクトル信号の帯域幅に基づいて前記第1のビットレートで量子化し、前記補助データ生成部は、前記第2のビットレートの量子化スペクトル信号の帯域幅を符号化し、前記補助データに多重化することとしてもよい。
さらに、本発明のオーディオ信号符号化装置は、前記第1のビットレートの符号化データと前記補助データを多重化した多重化符号化データを出力する多重化部を備えてもよい。
また、本発明のビットレート変換装置は、入力された第1のビットレートの符号化データを分離及び復号化して第1のビットレートの量子化スペクトル信号及び第1のビットレートの量子化精度情報を取得する符号化データ復号化部と、入力された補助データを復号化し、第1のビットレートと第2のビットレートの量子化精度情報の差分である差分量子化精度情報を抽出する補助データ復号化部と、前記差分量子化精度情報を使用して前記第1のビットレートの量子化スペクトル信号を第2のビットレートの量子化スペクトル信号へ変換し、符号化した、第2のビットレートの符号化スペクトル信号を算出する量子化符号化部と、前記第1のビットレートの量子化精度情報と前記差分量子化精度情報から第2のビットレートの量子化精度情報を算出して符号化し、前記第2のビットレートの符号化スペクトル信号と多重化して第2のビットレートの符号化データを出力する符号化データ生成部とを備え、前記補助データの差分量子化精度情報を使用して、少ない演算量で音質劣化のないビットレート変換を実現することができる。
なお、前記入力される補助データは、前記差分量子化精度情報に代えて、第2のビットレートの量子化精度情報を含んでいても良い。この場合、前記量子化符号化部は、第2のビットレートの量子化精度情報を使用して第1のビットレートの量子化スペクトル信号を第1のビットレートの量子化スペクトル信号へ変換し、符号化した、第2のビットレートの符号化スペクトル信号を算出する。
また、前記入力される補助データは、前記第2のビットレートの量子化スペクトル信号を符号化する際の第2のビットレートのエントロピー符号化コード表が符号化及び多重化されたものであり、前記補助データ復号化部は、前記補助データを復号化し前記第2のビットレートのエントロピー符号化コード表を抽出し、前記量子化符号化部は、前記第2のビットレートのエントロピー符号化コード表を用いて第2のビットレートの量子化スペクトル信号を符号化し、前記符号化データ生成部は、前記第2のビットレートのエントロピー符号化コード表を符号化し、前記第2のビットレートの符号化スペクトル信号に多重化することとしてもよい。
また、前記入力される補助データは、前記第2のビットレートの量子化スペクトル信号の帯域幅が符号化及び多重化されたものであり、前記補助データ復号化部は、前記補助データを復号化し前記第2のビットレートの量子化スペクトル信号の帯域幅を抽出し、前記量子化符号化部は、前記第2のビットレートの量子化スペクトル信号の帯域幅を用いて第1のビットレートの量子化スペクトル信号を第2の量子化スペクトル信号へ変換し、前記符号化データ生成部は、前記第2のビットレートの量子化スペクトル信号の帯域幅を符号化し、前記第2のビットレートの符号化スペクトル信号に多重化することとしてもよい。
さらに、本発明のビットレート変換装置は、入力された多重化符号化データを第1のビットレートの符号化データと補助データに分離する分離部を備えてもよい。
本発明によれば、補助データの差分量子化精度情報を使用して、第1のビットレートの量子化スペクトル信号を直接第2のビットレートの量子化スペクトル信号に変換することができるので、ビットレート変換に伴う音質劣化をなくすことができる。
また、符号化データを時間領域に戻すことなく、周波数領域でビットレート変換を行い、ビットレート変換時には、演算量の多い心理聴覚モデルを使用する量子化精度情報の算出を不要としているので、少ない演算量でビットレート変換を実現することができる。
すなわち、本発明によれば、少ない演算量で音質劣化のないビットレート変換を実現することができる。
以下本発明を実施するための最良の形態について、図面を参照しながら説明する。以下の実施の形態では、従来技術と同様に、オーディオ信号の高能率符号化データの符号化方式として、MPEG−2 AACを採用している場合を例にとって説明する。
(実施の形態1)
図1は、本発明の実施の形態1におけるオーディオ信号符号化装置の構成を示すブロック図である。
図1において、時間周波数変換部100では、入力された時間領域のオーディオ信号をMDCTにより周波数領域のスペクトル信号(MDCT係数)に変換して出力する。
量子化符号化部110では、時間周波数変換部100からのスペクトル信号をスケールファクタバンドと呼ばれるバンド単位でグループ化して、スケールファクタバンド単位で前記スペクトル信号を量子化して量子化スペクトル信号を算出する。スペクトル信号Wの量子化は、量子化情報算出部130から出力される量子化情報の量子化精度情報sfを使用して(数3)によって量子化スペクトル信号Xを算出することにより行う。
Figure 2008268792
ここで、sign(X)はXの符号を表し、X<0なら−1、X=0なら0、X>0なら1の値をとる関数、int(X)はX以下の値で最大の整数を表す関数、abs(X)はXの絶対値を表す関数である。SF_OFFSETの値は100であり、MAGIC_NUMBERの値は0.4054である。量子化符号化部110は、量子化情報算出部130からの第1のビットレート(ビットレート変換前のビットレート)と第2のビットレート(ビットレート変換後のビットレート)の量子化精度情報を使用して、第1のビットレートと第2のビットレートの量子化スペクトル信号を算出する。
次に前記第1のビットレートの量子化スペクトル信号をエントロピー符号化して第1のビットレートの符号化スペクトル信号を算出して、出力する。
符号化データ生成部120では、主情報である前記第1のビットレートの符号化スペクトル信号と前記第1のビットレートの量子化精度情報などの副情報を多重化して、第1のビットレートの符号化データを生成して出力する。
量子化情報算出部130では、時間領域のオーディオ信号と周波数領域のスペクトル信号を入力として、第1のビットレートと第2のビットレートで、心理聴覚モデルを使用して、スペクトル信号を量子化するときに必要な量子化情報を算出して、量子化符号化部110と補助データ生成部140に出力する。量子化情報算出部130では、量子化情報として、スケールファクタバンド単位の量子化精度を表す量子化精度情報(スケールファクタsf)、エントロピー符号化コード表(sect_cb)、帯域幅(max_sfb)を算出する。なお、量子化情報算出部130の入力として、時間領域のオーディオ信号を使用せず、周波数領域のスペクトル信号のみとしてもよい。
補助データ生成部140では、量子化情報算出部130からの量子化情報を入力として補助データを生成して、出力する。
多重化部150は、符号化データ生成部120からの第1のビットレートの符号化データに補助データ生成部140からの補助データを多重化して多重化符号化データを出力する。
図2は、本発明の実施の形態1における補助データ生成部140の構成を示すブロック図である。
図2において、差分算出部200では、量子化情報算出部130からの第1のビットレートの量子化精度情報sf1(sfb)と第2のビットレートの量子化精度情報sf2(sfb)とから差分量子化精度情報dsf(sfb)を(数4)により算出して出力する。
Figure 2008268792
ここで、sfbはスケールファクタバンド番号を表し、0≦sfb<min(max_sfb1、max_sfb2)である。min(x,y)は、xとyの大きくないほうの値を示し、max_sfb1とmax_sfb2は、それぞれ第1のビットレートの帯域幅、第2のビットレートの帯域幅を表す。
補助データ符号化部210では、前記差分量子化精度情報と量子化情報算出部130で算出した第2のビットレートの量子化スペクトルのエントロピー符号化コード表と帯域幅とを符号化し、多重化して補助データとして出力する。
なお、前記差分量子化精度情報の符号化に際しては、量子化精度情報を表すスケールファクタの符号化と同様にsfbの方向に差分符号化してもよいし、エントロピー符号化してもよい。
なお、前記エントロピー符号化コード表については、ビットレート変換時に算出することも可能なので補助データに含めなくてもよい。また、前記帯域幅に関しても、ビットレートに対する帯域幅をあらかじめ決めておくようにすれば、補助データに含めなくてもよい。
なお、本実施の形態では、第1のビットレートから第2のビットレートへの1種類のビットレート変換を想定しているが、第1のビットレートから第2のビットレート、第3のビットレート・・・第nのビットレートといった、2種類以上のビットレート変換を想定したオーディオ信号符号化装置を実現することも可能である。その場合には、量子化情報算出部130、補助データ生成部140を複数ビットレート変換に対応した構成に置き換える。
図3は、本発明の実施の形態1における多重化符号化データの1フレームのデータの例を示す図で、同図(a)は、256kbpsのAACの符号化データに、前記符号化データを128kbpsと64kbpsにビットレート変換するときに使用する量子化情報に関する補助データを多重化した例である。同図(b)は、(a)のAACの符号化データに非特許文献2記載のロスレスエンハンスメントレーヤー(LLE)の符号化データを多重化した例である。(b)では、ロスレスエンハンスメントレーヤの符号化データを復号化することにより、ロスレス復号化が可能である。
以上のように本実施の形態のオーディオ信号符号化装置では、第1のビットレートと第2のビットレートで量子化情報を算出する量子化情報算出部130と補助データ生成部140とを備え、第1のビットレートの符号化データの補助データとして、音質に大きな影響を及ぼし、ビットレートに依存する前記第1のビットレートと前記第2のビットレートの差分量子化精度情報を生成し、出力するので、前記第1のビットレートの符号化データの前記第2のビットレートへの符号化データ変換を、周波数領域において少ない演算量で音質劣化なく実現することができる。
なお、本実施の形態のオーディオ信号符号化装置では、符号化データに補助データを多重化して1本のストリームとして出力する多重化部150を設けたが、符号化データと補助データを別々の領域に保存する場合や異なる出力方法をとる場合には、多重化部150は不要である。
(実施の形態2)
図4は、本発明の実施の形態2におけるビットレート変換装置の構成を示すブロック図である。本実施の形態のビットレート変換装置は、実施の形態1のオーディオ信号符号化装置の多重化符号化データを入力としてビットレート変換を行い、ビットレート変換した符号化データを出力する。
図4において、分離部400では、多重化符号化データを入力として、第1のビットレートの符号化データと補助データとに分離する。
補助データ復号化部440は、補助データを復号化し、そこに含まれている第1のビットレートと第2のビットレートの差分量子化精度情報、第2のビットレートのエントロピー符号化コード表、第2のビットレートの帯域幅等の各種情報を抽出する。
符号化データ復号化部410では、前記第1のビットレートの符号化データを復号化して、第1のビットレートの量子化スペクトル信号と副情報とを算出して出力する。
量子化符号化部420では、補助データ復号化部440からの出力に含まれる情報を使用して、前記第1のビットレートの量子化スペクトル信号を前記第2のビットレートで量子化と符号化して第2のビットレートの符号化スペクトル信号を算出して出力する。
第1のビットレートの量子化スペクトル信号を第2のビットレートの量子化スペクトル信号へ変換する仕組みについて説明する。第2のビットレートの量子化スペクトル信号X2は、第1のビットレートの量子化スペクトル信号X1と補助データ復号化部440からの出力に含まれる第1のビットレートと第2のビットレートの差分量子化精度情報dsf(sfb)とを使用して、(数5)により行う。
Figure 2008268792
ここで、sign(X)、int(X)、abs(x)、MAGIC_NUMBERは実施の形態1において使用した関数と同じ関数であるので説明を省略する。また、dsf(sfb)は、実施の形態1で算出され差分量子化精度情報である。スケールファクタバンド番号sfbの値としては、補助データに含まれる第2のビットレートの帯域幅max_sfb2未満の範囲で第2のビットレートの量子化スペクトル信号を算出する。なお、(数5)を使って算出することができるのは、スケールファクタバンド番号sfbの値が、第1のビットレートの帯域幅max_sfb1未満の場合であり、これ以上については、量子化スペクトル信号を零とする。
ビットレートに対する帯域幅があらかじめテーブル等で決定されている場合は、当該テーブル等の参照により、第2のビットレートの帯域幅を決定することができる。この場合は、第2のビットレートの帯域幅の決定に補助データに含まれる情報を用いる必要はない。
次に、量子化符号化部420は、第2のビットレートの量子化スペクトル信号を符号化する処理を行う。補助データ復号化部440から出力される情報には、第2のビットレートの量子化スペクトル信号をエントロピー符号化する際に必要となるコード表が含まれている。量子化符号化部420はこのコード表を利用して、前記第2のビットレートの量子化スペクトル信号を符号化し、第2のビットレートの符号化スペクトル信号として出力する。
符号化データ生成部430では、前記第1のビットレートの副情報と前記補助データ復号化部440の出力に含まれる情報とから前記第2のビットレートの副情報を算出し、前記第2のビットレートの符号化スペクトル信号と多重化して、第2のビットレートの符号化データを生成し、出力する。
図5は、本発明の第2の実施の形態における符号化データ生成部430の構成を示すブロック図である。
図5において、副情報変更部500は、前記第1のビットレートの副情報と前記補助データに含まれる第1のビットレートと第2のビットレートの差分量子化精度情報、第2のビットレートのエントロピー符号化コード表、第2のビットレートの帯域幅を入力として、第1のビットレートの副情報の内、スペクトル信号の量子化と符号化に関する量子化情報(量子化精度情報、量子化スペクトル信号のエントロピー符号化コード表、帯域幅)を第2のビットレートの量子化情報で置き換えることにより、第2のビットレートの副情報を生成して、出力する。
第2のビットレートの量子化精度情報sf2(sfb)は、前記第1のビットレートの副情報に含まれる量子化精度情報sf1(sfb)と前記補助データに含まれる第1のビットレートと第2のビットレートの差分量子化精度情報dsfとを用いて(数6)により、算出する。
Figure 2008268792
多重化部510では、量子化符号化部420が出力した第2のビットレートの符号化スペクトル信号と副情報変更部500からの前記第2のビットレートの副情報とを多重化して、第2のビットレートの符号化データを生成して出力する。
なお、実施の形態2のビットレート変換装置において、第1のビットレートから第1のビットレートへビットレート変換をする場合(入力と出力のビットレートが同じ場合)には、符号化データ復号化部410、量子化符号化部420、符号化データ生成部430、補助データ復号化部440を経由せずに、分離部400から出力される第1のビットレートの符号化データのみを出力するようにしてもよい。
また、多重化符号化データに2種類以上のビットレート変換を可能にする情報が含まれている場合(例えば、実施の形態1において、2種類以上のビットレート変換を想定して出力された多重化符号化データが入力された場合)でも、本実施の形態において量子化符号化部420、副情報変更部500が複数の選択可能なビットレートから所望のビットレートを抽出する機能をもつことで、本実施の形態のビットレート変換装置は対応できる。
本実施の形態のビットレート変換装置では、符号化データを時間領域に戻すことなく、周波数領域でビットレート変換を行い、演算量の多い心理聴覚モデルを使用する量子化精度情報の算出を不要としているので、少ない演算量でビットレート変換を実現することができる。また、前記特許文献1に記載のビットレート変換装置と比較して、量子化値の変更(乱数加算等により同一値のスペクトル信号が出力されないようにする)や逆量子化の計算が不要であり、その分演算量が少ない。また、前記特許文献1に記載のビットレート変換装置では、音質に大きな影響を与える量子化精度情報が、第2のビットレートの量子化精度情報ではなく、第1のビットレートの量子化精度情報が用いられているが、本実施の形態では、補助データに含まれる差分量子化精度情報を使用して、第2のビットレートに適合した量子化精度情報を算出して使用するのでビットレート変換に伴う音質劣化が少ない。
以上のように本実施の形態のビットレート変換装置では、補助データに含まれる差分量子化精度情報を使用して、第1のビットレートの量子化スペクトル信号を直接第2のビットレートの量子化スペクトル信号に変換するので、少ない演算量で音質劣化のないビットレート変換を実現することができる。
(実施の形態3)
本発明の実施の形態3のオーディオ信号符号化装置では、実施の形態1のオーディオ信号符号化装置と比較して、補助データ生成部140の構成が異なり、補助データの内容が異なる。その他の点については実施の形態1と同一であるので説明を省略する。
図6は、本実施の形態における補助データ生成部140の構成を示すブロック図である。図6において、補助データ符号化部600では、量子化情報算出部130からの第2のビットレートの量子化精度情報、第2のビットレートの量子化スペクトル信号のエントロピー符号化コード表、第2のビットレートの帯域幅を入力として符号化し、多重化して、補助データとして出力する。本実施の形態では、実施の形態1の第1のビットレートと第2のビットレートの差分量子化精度情報に代わって、第2のビットレートの量子化精度情報を前記補助データとして生成し、出力する。
以上のように本実施の形態のオーディオ信号符号化装置は、第1のビットレートと第2のビットレートに対する量子化情報を算出する量子化情報算出部130と補助データ生成部140とを備え、前記第1のビットレートの符号化データの補助データとして、第2のビットレートの量子化精度情報を生成し、出力するので、前記第1のビットレートの符号化データを第2のビットレートへの符号化データへ変換する際の演算量及び音質劣化を少なくすることができる。
(実施の形態4)
本発明の実施の形態4のビットレート変換装置は、実施の形態3のオーディオ信号符号化装置の多重化符号化データを入力として、ビットレート変換を行い、ビットレート変換した符号化データを出力する。本実施の形態におけるビットレート変換装置は、実施の形態2のビットレート変換装置と比較して、補助データに含まれる内容が異なり、量子化符号化部420の動作の一部と符号化データ生成部430、補助データ復号化部440の構成が異なる。その他の点については実施の形態2と同一であるので説明を省略する。
本実施の形態の量子化符号化部420では、符号化データ復号化部410からの副情報に含まれる第1のビットレートでの量子化精度情報sf1(sfb)と補助データ復号化部440が補助データを復号化して抽出した第2のビットレートの量子化精度情報sf2(sfb)から差分量子化精度情報dsf(sfb)を(数4)にしたがって算出する。この動作が、実施の形態2と異なる。次に(数5)にしたがって第1のビットレートの量子化スペクトル信号X1から第2のビットレートの量子化スペクトル信号X2を算出する。次に、前記第2のビットレートの量子化スペクトル信号を補助データ復号化部440が前記補助データから抽出した第2のビットレートのエントロピー符号化コード表を使用して符号化し、第2のビットレートの符号化スペクトルを出力する。
符号化データ生成部430では、前記第2のビットレートの符号化スペクトル信号と前記第1のビットレートの副情報と補助データに含まれる各種情報を入力として、第2のビットレートの符号化データを生成し、出力する。
図7は、本実施の形態における符号化データ生成部430の構成を示すブロック図である。
図7において、副情報変更部700は第1のビットレートの副情報と復号化された補助データから抽出された第2のビットレートの量子化精度情報、第2のビットレートの量子化スペクトル信号のエントロピー符号化コード表、第2のビットレートの帯域幅を入力として、第2のビットレートの副情報を生成して、出力する。
入力された第1のビットレートの副情報は、当該副情報に含まれる第1のビットレートの量子化精度情報、量子化スペクトル信号のエントロピー符号化コード表、帯域幅を、復号化された補助データから抽出された第2のビットレートの量子化精度情報、量子化スペクトル信号のエントロピー符号化コード表、帯域幅で、それぞれ置き換えられ、第2のビットレートの副情報として出力する。
多重化部710は、量子化符号化部420からの第2のビットレートの符号化スペクトル信号と副情報変更部700からの第2のビットレートの副情報とを多重化した第2のビットレートの符号化データを出力する。
以上のように本実施の形態のビットレート変換装置では、補助データの第2のビットレートの量子化精度情報を使用して、少ない演算量で音質劣化の少ないビットレート変換を実現することができる。
(実施の形態5)
実施の形態5のオーディオ信号符号化装置は、実施の形態3のオーディオ信号符号化装置と比較して、量子化符号化部110と量子化情報算出部130の動作が異なる。その他の点については実施の形態3と同一であるので説明を省略する。
本実施の形態における量子化符号化部110は、実施の形態3と同一の量子化を行うとともに、実施の形態4の量子化符号化部420で行うビットレート変換による量子化も行う。
具体的には、量子化情報算出部130は、実施の形態3と同様に、第1のビットレートと第2のビットレートの量子化精度情報を算出し、これを量子化符号化部110へ出力する。量子化符号化部110は、量子化情報算出部130から入力される第1及び第2のビットレートの量子化精度情報を用いて、時間周波数変換部100からのスペクトル信号を、それぞれ量子化し、第1のビットレートの量子化スペクトル信号と、第2のビットレートの量子化スペクトル信号(以下、「基準量子化スペクトル信号」という)を算出する。あわせて、実施の形態4の量子化符号化部420と同様に、第1と第2のビットレートの量子化精度情報から差分量子化精度情報を算出し、前記第1のビットレートの量子化スペクトル信号をビットレート変換して第2のビットレートの量子化スペクトル信号(以下、「変換量子化スペクトル信号」という)を得る。
量子化情報算出部130は、前記の基準量子化スペクトル信号と変換量子化スペクトル信号とを比較し、両者が一致しない場合には、第2のビットレートの量子化精度情報の値を1ずつ補正して、基準量子化スペクトル信号と変換量子化スペクトル信号の両者を一致させる。量子化情報算出部130は、上記の処理で求めた補正後の第2のビットレートの量子化精度情報を補助データ生成部140に出力する。
以上のようにして、本実施の形態のオーディオ信号符号化装置では、ビットレート変換に伴う丸め誤差を補正して第2のビットレートの量子化情報を算出し、補助データとして出力するので、音質劣化のないビットレート変換を実現することができる。
以上のように本実施の形態のオーディオ信号符号化装置では、量子化符号化部110、量子化情報算出部130と補助データ生成部140とを備え、第1のビットレートの符号化データの補助データとして、補正された第2のビットレートの量子化精度情報を生成し、出力するので、前記第1のビットレートの符号化データの第2のビットレートへの符号化データ変換を、音質劣化なく実現することができる。
以上のように、本発明にかかるオーディオ信号符号化装置およびそのビットレート変換装置は、少ない演算量で音質劣化の少ないビットレート変換を実現することができるので、オーディオ信号の符号化装置およびそのビットレート変換装置等として有用である。
本発明の実施の形態1におけるオーディオ信号符号化装置の構成を示すブロック図 本発明の実施の形態1における補助データ生成部の構成を示すブロック図 本発明の実施の形態1における多重化符号化データの1フレームのデータの例を示す図 本発明の実施の形態2におけるビットレート変換装置の構成を示すブロック図 本発明の実施の形態2における符号化データ生成部の構成を示すブロック図 本発明の実施の形態3における補助データ生成部の構成を示すブロック図 本発明の実施の形態4における符号化データ生成部の構成を示すブロック図 従来のオーディオ符号化データ復号化装置の構成を示すブロック図 従来のオーディオ信号符号化装置の構成を示すブロック図 特許文献1に記載された従来のビットレート変換装置の構成を示すブロック図 スペクトル信号と高いビットレートと低いビットレートにおける量子化精度情報(スケールファクタsf)との関係の例を示す図
符号の説明
100 時間周波数変換部
110,420 量子化符号化部
120,430 符号化データ生成部
130 量子化情報算出部
140 補助データ生成部
150,510,710 多重化部
200 差分算出部
210,600 補助データ符号化部
400 分離部
410 符号化データ復号化部
440 補助データ復号化部
500,700 副情報変更部

Claims (10)

  1. 時間領域のオーディオ信号を周波数領域のスペクトル信号に変換する時間周波数変換部と、
    前記スペクトル信号を量子化する際の量子化精度を示す量子化精度情報を、第1のビットレート及び第2のビットレートに対してそれぞれ算出する量子化情報算出部と、
    前記第1のビットレートの量子化精度情報を用いて前記スペクトル信号を量子化し、前記第1のビットレートで符号化した符号化スペクトル信号を算出する量子化符号化部と、
    前記符号化スペクトル信号と、符号化した前記第1のビットレートの量子化精度情報を多重化した第1のビットレートの符号化データを生成し、出力する符号化データ生成部と、
    前記第1のビットレートと第2のビットレートの量子化精度情報の差分である差分量子化精度情報を符号化した補助データを出力する補助データ生成部とを備えたことを特徴とするオーディオ信号符号化装置。
  2. 時間領域のオーディオ信号を周波数領域のスペクトル信号に変換する時間周波数変換部と、
    前記スペクトル信号を量子化する際の量子化精度を示す量子化精度情報を、第1のビットレート及び第2のビットレートに対してそれぞれ算出する量子化情報算出部と、
    前記第1のビットレートの量子化精度情報を用いて前記スペクトル信号を量子化し、前記第1のビットレートで符号化した符号化スペクトル信号を算出する量子化符号化部と、
    前記符号化スペクトル信号と、符号化した前記第1のビットレートの量子化精度情報を多重化した第1のビットレートの符号化データを生成し、出力する符号化データ生成部と、
    前記第2のビットレートの量子化精度情報を符号化した補助データを出力する補助データ生成部とを備えたことを特徴とするオーディオ信号符号化装置。
  3. 前記量子化情報算出部は、前記スペクトル信号を前記第1のビットレート及び第2のビットレートそれぞれの量子化精度情報に基づいて量子化した量子化スペクトル信号をエントロピー符号化する際の、第1のビットレート及び第2のビットレートのエントロピー符号化コード表をそれぞれ算出し、
    前記量子化符号化部は、第1のビットレートの量子化精度情報を利用して量子化した量子化スペクトル信号を、前記第1のビットレートのエントロピー符号化コード表を用いて符号化し、
    前記補助データ生成部は、前記第2のビットレートのエントロピー符号化コード表を符号化し、前記補助データに多重化することを特徴とする請求項1乃至請求項2に記載のオーディオ信号符号化装置。
  4. 前記量子化情報算出部は、前記スペクトル信号を量子化精度情報に基づいて量子化する際の、第1のビットレート及び第2のビットレートの量子化スペクトル信号の帯域幅をそれぞれ算出し、
    前記量子化符号化部は、前記スペクトル信号を前記第1のビットレートの量子化スペクトル信号の帯域幅に基づいて前記第1のビットレートで量子化し、
    前記補助データ生成部は、前記第2のビットレートの量子化スペクトル信号の帯域幅を符号化し、前記補助データに多重化することを特徴とする請求項1乃至請求項3に記載のオーディオ信号符号化装置。
  5. 前記第1のビットレートの符号化データに前記補助データを多重化した多重化符号化データを出力する多重化部を備えたことを特徴とする請求項1乃至請求項4に記載のオーディオ信号符号化装置。
  6. 入力された第1のビットレートの符号化データを分離及び復号化して第1のビットレートの量子化スペクトル信号及び第1のビットレートの量子化精度情報を取得する符号化データ復号化部と、
    入力された補助データを復号化し、第1のビットレートと第2のビットレートの量子化精度情報の差分である差分量子化精度情報を抽出する補助データ復号化部と、
    前記差分量子化精度情報を使用して前記第1のビットレートの量子化スペクトル信号を第2のビットレートの量子化スペクトル信号へ変換し、符号化した、第2のビットレートの符号化スペクトル信号を算出する量子化符号化部と、
    前記第1のビットレートの量子化精度情報と前記差分量子化精度情報から第2のビットレートの量子化精度情報を算出して符号化し、前記第2のビットレートの符号化スペクトル信号と多重化して第2のビットレートの符号化データを出力する符号化データ生成部とを備えたことを特徴とするビットレート変換装置。
  7. 入力された第1のビットレートの符号化データを分離及び復号化して第1のビットレートの量子化スペクトル信号及び第1のビットレートの量子化精度情報を取得する符号化データ復号化部と、
    入力された補助データを復号化し、第2のビットレートの量子化精度情報を抽出する補助データ復号化部と、
    前記第2のビットレートの量子化精度情報を使用して前記第1のビットレートの量子化スペクトル信号を第2のビットレートの量子化スペクトル信号へ変換し、符号化した、第2のビットレートの符号化スペクトル信号を算出する量子化符号化部と、
    前記第2のビットレートの量子化精度情報を符号化し、前記第2のビットレートの符号化スペクトル信号と多重化して第2のビットレートの符号化データを出力する符号化データ生成部とを備えたことを特徴とするビットレート変換装置。
  8. 前記入力される補助データは、前記第2のビットレートの量子化スペクトル信号を符号化する際の第2のビットレートのエントロピー符号化コード表が符号化及び多重化されたものであり、
    前記補助データ復号化部は、前記補助データを復号化し前記第2のビットレートのエントロピー符号化コード表を抽出し、
    前記量子化符号化部は、前記第2のビットレートのエントロピー符号化コード表を用いて第2のビットレートの量子化スペクトル信号を符号化し、
    前記符号化データ生成部は、前記第2のビットレートのエントロピー符号化コード表を符号化し、前記第2のビットレートの符号化スペクトル信号に多重化することを特徴とする請求項6乃至請求項7に記載のビットレート変換装置。
  9. 前記入力される補助データは、前記第2のビットレートの量子化スペクトル信号の帯域幅が符号化及び多重化されたものであり、
    前記補助データ復号化部は、前記補助データを復号化し前記第2のビットレートの量子化スペクトル信号の帯域幅を抽出し、
    前記量子化符号化部は、前記第2のビットレートの量子化スペクトル信号の帯域幅を用いて第1のビットレートの量子化スペクトル信号を第2の量子化スペクトル信号へ変換し、
    前記符号化データ生成部は、前記第2のビットレートの量子化スペクトル信号の帯域幅を符号化し、前記第2のビットレートの符号化スペクトル信号に多重化することを特徴とする請求項6乃至請求項8に記載のビットレート変換装置。
  10. 入力された前記多重化符号化データを第1のビットレートの符号化データと補助データに分離する分離部を備えた、請求項6乃至請求項9に記載のビットレート変換装置。
JP2007115176A 2007-04-25 2007-04-25 オーディオ信号符号化装置およびそのビットレート変換装置 Pending JP2008268792A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007115176A JP2008268792A (ja) 2007-04-25 2007-04-25 オーディオ信号符号化装置およびそのビットレート変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007115176A JP2008268792A (ja) 2007-04-25 2007-04-25 オーディオ信号符号化装置およびそのビットレート変換装置

Publications (1)

Publication Number Publication Date
JP2008268792A true JP2008268792A (ja) 2008-11-06

Family

ID=40048341

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007115176A Pending JP2008268792A (ja) 2007-04-25 2007-04-25 オーディオ信号符号化装置およびそのビットレート変換装置

Country Status (1)

Country Link
JP (1) JP2008268792A (ja)

Similar Documents

Publication Publication Date Title
US7813932B2 (en) Apparatus and method of encoding and decoding bitrate adjusted audio data
US7617110B2 (en) Lossless audio decoding/encoding method, medium, and apparatus
US7761290B2 (en) Flexible frequency and time partitioning in perceptual transform coding of audio
EP0966793B1 (en) Audio coding method and apparatus
JP4081447B2 (ja) 時間離散オーディオ信号を符号化する装置と方法および符号化されたオーディオデータを復号化する装置と方法
JP5215994B2 (ja) 損失エンコ−ドされたデータ列および無損失拡張データ列を用いた、原信号の無損失エンコードのための方法および装置
KR101162275B1 (ko) 오디오 신호 처리 방법 및 장치
JP4640020B2 (ja) 音声符号化装置及び方法、並びに音声復号装置及び方法
US7774205B2 (en) Coding of sparse digital media spectral data
KR20230110842A (ko) 양자화 및 엔트로피 코딩을 이용한 방향성 오디오 코딩파라미터들을 인코딩 또는 디코딩하기 위한 장치 및 방법
JP5404412B2 (ja) 符号化装置、復号装置およびこれらの方法
US8515770B2 (en) Method and apparatus for encoding and decoding excitation patterns from which the masking levels for an audio signal encoding and decoding are determined
KR20070083997A (ko) 부호화 장치, 복호화 장치, 부호화 방법 및 복호화 방법
KR101726205B1 (ko) 감소된 복잡성 변환기 snr 계산
JP4063508B2 (ja) ビットレート変換装置およびビットレート変換方法
KR20080025636A (ko) 대역폭 확장 기법을 이용한 오디오 신호의 부호화/복호화방법 및 장치
JP3406275B2 (ja) ディジタル信号符号化方法、ディジタル信号復号化方法、これらの装置及びその各プログラム記録媒体
EP1310943B1 (en) Speech coding apparatus, speech decoding apparatus and speech coding/decoding method
WO2006008817A1 (ja) オーディオ符号化装置及びオーディオ符号化方法
Yu et al. A scalable lossy to lossless audio coder for MPEG-4 lossless audio coding
JP2006003580A (ja) オーディオ信号符号化装置及びオーディオ信号符号化方法
JP3191257B2 (ja) 音響信号符号化方法、音響信号復号化方法、音響信号符号化装置、音響信号復号化装置
JP2004246038A (ja) 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム
JP2008268792A (ja) オーディオ信号符号化装置およびそのビットレート変換装置
KR100947065B1 (ko) 무손실 오디오 부호화/복호화 방법 및 장치