JP2007133323A - オーディオ信号符号化装置および方法 - Google Patents

オーディオ信号符号化装置および方法 Download PDF

Info

Publication number
JP2007133323A
JP2007133323A JP2005328945A JP2005328945A JP2007133323A JP 2007133323 A JP2007133323 A JP 2007133323A JP 2005328945 A JP2005328945 A JP 2005328945A JP 2005328945 A JP2005328945 A JP 2005328945A JP 2007133323 A JP2007133323 A JP 2007133323A
Authority
JP
Japan
Prior art keywords
quantization
spectrum
bit
amount
information amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005328945A
Other languages
English (en)
Other versions
JP4822816B2 (ja
JP2007133323A5 (ja
Inventor
Masanobu Funakoshi
正伸 船越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005328945A priority Critical patent/JP4822816B2/ja
Priority to CN2005800395626A priority patent/CN101061534B/zh
Priority to PCT/JP2005/021014 priority patent/WO2006054583A1/ja
Priority to US11/749,563 priority patent/US7613605B2/en
Publication of JP2007133323A publication Critical patent/JP2007133323A/ja
Publication of JP2007133323A5 publication Critical patent/JP2007133323A5/ja
Application granted granted Critical
Publication of JP4822816B2 publication Critical patent/JP4822816B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】 聴覚心理分析を行わないように構成されたオーディオ信号符号化において、聴覚心理分析を行わないことによる音質劣化を最小限に留めつつ、量子化にかかる処理量を削減する。
【解決手段】 スペクトル情報量算出部(15)は量子化前スペクトル情報量を算出し、量子化スペクトル情報量予測部(16)はフレーム平均ビット量に基づいて量子化後スペクトル情報量を予測する。量子化ステップ決定部(7)は、上記量子化前スペクトル情報量から量子化後スペクトル情報量を減じ、その減算結果に、量子化粗さの刻み幅から得られる係数を乗じることで、フレーム全体の量子化ステップを決定する。スペクトル量子化部(8)は、この量子化ステップを利用して周波数スペクトルを量子化する。このスペクトル量子化部(8)はさらに、スペクトル割当ビット計算部(12)で計算されたスペクトル割当ビット量に基づいて符号量制御を行う。
【選択図】 図1

Description

本発明は、オーディオ信号の符号化装置および方法に関する。
近年、高音質かつ高効率なオーディオ信号符号化技術が、DVD-Videoの音声トラック、携帯オーディオプレーヤー、音楽配信、家庭内LANにおけるホームサーバへの楽曲蓄積などに広く利用され、幅広く普及するとともにその重要性も増している。
このようなオーディオ信号符号化技術の多くは、変換符号化技術を利用して時間周波数変換を行っている。例えば、MPEG-2 AACやDolby Digital(AC-3)などでは、MDCT (Modified Discrete Cosine Transform) などの直交変換単体でフィルタバンクを構成している。また、MPEG-1 Audio Layer III (MP3) やATRAC (MD(ミニディスク)に利用されている符号化方式) では、QMF (Quadrature Mirror Filter)などのサブバンド分割フィルタと直交変換を多段接続してフィルタバンクを構成している。
これらの変換符号化技術では、人間の聴覚特性を利用したマスキング分析が行われる。そして、マスクされると判断されるスペクトル成分を取り除く、あるいはマスクされる量子化誤差を許容することにより、スペクトル表現のための情報量を削減し、圧縮効率を高めている。
また、これらの変換符号化技術では、その多くが、スペクトル成分を非線形量子化することにより、スペクトルが持つ情報量を圧縮している。例えば、MP3やAACでは、各スペクトル成分を0.75乗することにより情報量を圧縮している。
また、これらの変換符号化技術では、フィルタバンクによって周波数成分に変換された入力信号を、人間の聴覚の周波数分解能に基づいて設定される分割周波数帯域ごとにまとめる。そして、量子化時に各分割周波数帯域毎の正規化係数を聴覚分析結果から決定し、正規化係数と量子化スペクトルの組み合わせで周波数成分を表現することで情報量を削減している。この正規化係数は、実際には分割帯域毎の量子化粗さの調整を行う変数であり、正規化係数が1変化することによって、量子化粗さは1ステップ分変化することになる。MPEG-2 AACでは、この分割周波数帯域をスケールファクタバンド(SFB)と呼び、正規化係数をスケールファクタと呼称する。
また、これらの変換符号化方式では、符号化単位である1フレーム全体の量子化粗さを制御することによって符号量を制御している。多くの変換符号化方式では、量子化粗さは、ある基数の整数乗幅でステップ状に制御されており、この整数を量子化ステップと呼ぶ。MPEGオーディオ規格では、この、フレーム全体の量子化粗さを設定する量子化ステップを「グローバルゲイン」もしくは「コモンスケールファクタ」と呼称している。また、前述のスケールファクタは量子化ステップとの相対値で表現することによって、これらの変数の符号に必要な情報量を削減している。
例えば、MP3やAACではこれらの変数が1変化することによって、実際の量子化粗さは2の3/16乗分変化する。
変換符号化方式の量子化処理では、スケールファクタを制御して聴覚演算の結果を反映して量子化誤差がマスクされるように量子化歪みを制御する。またこれと同時に、量子化ステップを制御してフレーム全体の量子化粗さを適宜調整することによってフレーム全体の符号量制御を行わなければならない。これらの量子化粗さを決める二種類の数値は、符号化品質に重大な影響を及ぼすため、慎重かつ正確に、この二つの制御を同時に効率よく行うことが求められる。
MPEG-1 Audio Layer III(MP3)の規格書(ISO/IEC 11172-3)やMPEG-2 AACの規格書(ISO/IEC 13818-7)を参照されたい。そこには、量子化時にスケールファクタとグローバルゲインを適宜制御する方法として、歪み制御ループ(アウターループ)と符号量制御ループ(インナーループ)の二重ループによって繰り返し処理を行う方法が紹介されている。以下、この方法を図面を用いて説明する。なお、便宜上、MPEG-2 AACの場合を例にとって説明を行う。
図10は、ISO/IEC規格書に記載されている量子化処理を簡単なフローチャートにしたものである。
まず、ステップS501では全てのSFBのスケールファクタと、グローバルゲインが0に初期化され、歪み制御ループ(アウターループ)に入る。
歪み制御ループでは、まず、符号量制御ループ(インナーループ)が実行される。
符号量制御ループでは、まず、ステップS502において、1フレーム分、すなわち、1024個のスペクトル成分が、下記の量子化式に従って量子化される。
Figure 2007133323
ただし、(1)式においてXqは量子化スペクトル、xiは量子化前のスペクトル(MDCT係数)、global_gainはグローバルゲイン、scalefacはこのスペクトル成分が含まれるSFBのスケールファクタである。
次に、ステップS503において、これらの量子化スペクトルをハフマン符号化した時の1フレーム分の使用ビット数が計算され、ステップS504でフレームに割り当てられたビット数と比較する。割り当てられたビット数より使用ビット数が大きい場合は、ステップS505においてグローバルゲインを1増加して、量子化粗さを粗くして、再びステップS502のスペクトル量子化に戻る。この繰り返しは量子化後に必要なビット数が割り当てられたビット数より少なくなるまで行われ、この時点でのグローバルゲインが決定されて、符号量制御ループが終了する。
ステップS506では、符号量制御ループによって量子化されたスペクトルを逆量子化して、量子化前のスペクトルとの差分を取ることによって量子化誤差を算出する。この量子化誤差は、SFB毎にまとめられる。
ステップS507では、全てのSFBでスケールファクタが0より大きくなったか、もしくは、量子化誤差が許容誤差範囲内に納まっているかどうかを調べる。このいずれの条件も満たさないSFBがある場合は、ステップS508に進み、許容誤差範囲内に量子化誤差が納まっていないSFBのスケールファクタを1増やし、再び歪み制御ループ処理を繰り返す。なお、SFB毎の許容誤差は聴覚演算によって量子化処理の前に求められている。
以上説明したように、ISO規格書に記載されている量子化処理方法は二重ループで構成されており、しかも、グローバルゲインとスケールファクタは1刻みの制御しか行われない。そのため、この処理が収束するまでに、スペクトル量子化とビット計算が幾度となく延々と繰り返されることになる。
ここで、例えばMPEG-2 AACの場合では、スペクトル量子化は1回処理するたびに式(1)の計算を1024回行うことになるため、計算量が多い処理である。また、ビット計算時に検索されるハフマン符号表が11種も存在するため、ハフマン符号表を全探索するとビット計算もやはり計算量が必然的に多くなる。
さらに、歪み制御ループでは逆量子化後に量子化誤差の計算を行っているが、この処理も計算量が多い。そのため、この二重ループが収束するまでには膨大な処理量がかかってしまう。
この問題を解決するために、二重ループの繰り返し回数を削減することによって、処理量を削減しようとする様々な試みがなされている。
例えば、特許文献1は、ハフマン符号表の特性に応じて決定したステップ数によって、コモンスケールファクタやスケールファクタを1刻みではなく飛び飛びに制御する技術を開示する。これにより、二重ループそれぞれのループ回数を減らし、処理量を削減している。
また、特許文献2は、最初に量子化ステップの推定値を算出した後、スケールファクタをMNRに応じて計算後、通常のインナーループを実行する方法を開示している。
また、非特許文献1は、式(1)を変形した式と、聴覚分析によって求められるSFB毎の許容誤差エネルギーを用いることによって、スケールファクタをスペクトル量子化に先行して適宜計算する技術を開示する。これにより、二重ループの外側の歪み制御ループを取り除き、処理量を削減している。
これらの従来技術を用いることによって、量子化処理の二重ループの収束を早め、量子化処理の処理量をある程度までは削減することができる。
ところで、量子化処理とともに処理量のかかる処理として、聴覚心理分析処理がある。そこで、符号化効率よりも処理量削減が優先されるような場合、具体的には例えば、比較的安価な携帯ビデオ撮影機器などにおいて音質よりも消費電力の低減が優先されるような場合では、聴覚心理分析を全く行わずに符号化することも可能である。このとき、量子化処理においては、全ての分割周波数帯域においてスケールファクタを一律に同一値に設定することによって、外側の歪み制御ループを取り除き、さらに処理量を削減することができる。
特開2003-271199号公報 特開2001-184091号公報 A.D.Duenes、R.Perez、B.Rivas 等, "A robust and efficient implementation of MPEG-2/4 AAC Natural Audio Coders", AES 112th Convention Paper(2002)
しかしながら、従来の技術では、ISO規格書に記載されている二重ループを完全に繰り返さないようにすることはできない。そのため、スペクトル量子化を数回から数十回繰り返さないと量子化処理を終えることができず、符号化処理全体に占める量子化処理の処理量は依然として大きかった。
この問題は聴覚心理分析を行わない場合においても同様である。全ての分割周波数帯域においてスケールファクタを一律に同じ値とした場合であっても、外側の歪み制御ループのみが省略できるだけであり、量子化ステップを量子化前に計算することは従来の技術では不可能である。そのため、従来の技術では符号量制御ループにおけるスペクトル量子化とビット計算をやはり繰り返し行っており、処理量を浪費しているという課題がある。
さらに、聴覚心理分析を行わない場合は、符号量制御の根拠となるPE(聴覚エントロピー)が算出されないため、ビットリザーバに蓄積されている余剰ビットをフレームに割り当てることができず、さらに音質が劣化してしまうという問題も生じる。
したがって本発明の目的は、聴覚心理分析を行わないように構成されたオーディオ信号符号化において、聴覚心理分析を行わないことによる音質劣化を最小限に留めつつ、量子化にかかる処理量を削減することにある。
本発明の一側面に係るオーディオ信号符号化装置は、オーディオ入力信号をチャネルごとに処理単位フレームに分割するフレーム分割部と、前記フレーム分割部より得られた連続する2フレームの時間領域信号を周波数スペクトルに変換する処理を、1フレームずつずらしながら行うフィルタバンク部と、前記フィルタバンク部より出力された周波数スペクトルの情報量を、量子化前のスペクトル情報量として算出するスペクトル情報量算出部と、ビットレートとサンプリングレートとから算出されるフレーム平均ビット量に基づいて、量子化後のスペクトル情報量を予測する量子化スペクトル情報量予測部と、前記スペクトル情報量算出部で算出された前記量子化前のスペクトル情報量から前記量子化スペクトル情報量予測部で予測された前記量子化後のスペクトル情報量を減じ、その減算結果に、量子化粗さの刻み幅から得られる係数を乗じることで、フレーム全体の量子化ステップをスペクトル量子化前に決定する量子化ステップ決定部と、前記量子化ステップ決定部で決定された前記量子化ステップを利用して前記周波数スペクトルを量子化するスペクトル量子化部と、符号化規格に準じた余剰ビット量を前記規格に合致するように管理するビットリザーバと、前記スペクトル量子化部で量子化された周波数スペクトルを所定のフォーマットに従って整形したビットストリームを生成するビット整形部と、前記フレーム平均ビットに、前記ビットリザーバに蓄積されている余剰ビット量の一部を随時加算してスペクトル割当ビットを計算するスペクトル割当ビット計算部とを備え、前記スペクトル量子化部は、前記スペクトル割当ビット計算部で計算された前記スペクトル割当ビット量に基づいて符号量制御を行うことを特徴とする。
本発明によれば、聴覚心理分析を行わないように構成されたオーディオ信号符号化において、聴覚心理分析を行わないことによる音質劣化を最小限に留めつつ、量子化にかかる処理量を削減することができる。
本発明は、基本的には量子化前の情報量を量子化後の情報量で割ることによって、全体の量子化粗さを求めることができるという考えに基づき、量子化ステップを実際の量子化前に求めようとするものである。ここで、量子化粗さは一般的に基数を量子化ステップ乗したものであるため、量子化ステップを求めるために底をこの基数にした対数をとると、情報量の除算は情報量の差分に変化する。この差分に、量子化の刻み幅によって決定される係数を積算すると正確な量子化ステップを求めることができる。さらに、実際の量子化後の情報量は量子化後でないと求めることができないが、フレームに割り当てられた符号量から予測することができるため、本発明はこの予測を利用して量子化前に正確な量子化ステップを求めるものである。
また、本発明は、量子化前の予測時にはフレーム平均符号量を利用し、実際の量子化時にはビットリザーバに蓄積されている余剰ビット量の一部を足し込み、この値を基準にして符号量を制御する。これにより、量子化ステップの予測値に多少の誤差が生じた場合でも一回のスペクトル量子化で量子化処理を終了し、かつ、情報量が多いフレームには聴覚分析せずとも自動的に余剰ビットの一部が割り当てられるようにする。
本発明においては、最初にスケールファクタを算出、確定した後に、その値を使用した計算で量子化ステップをほぼ正確に算出することができるので、ほぼ一回のスペクトル量子化とビット計算で量子化を終了することが可能になる。
以下、図面を参照して本発明の好適な実施形態について詳細に説明する。なお、本発明は以下の実施形態に限定されるものではなく、本発明の実施に有利な具体例を示すにすぎない。また、以下の実施形態の中で説明されている特徴の組み合わせの全てが本発明の課題解決手段として必須のものであるとは限らない。
(第1の実施形態)
図1は、本実施形態におけるオーディオ信号符号化装置の構成を示す図である。なお、同図において太線はデータ信号、細線は制御信号を示す。
図示の構成において、フレーム分割器1はオーディオ入力信号を処理単位であるフレームに分割する。フレーム単位に分割された入力信号はフィルタバンク3へ送出される。フィルタバンク3は、フレーム分割器1から入力された時間信号に対して、ウィンドウ掛けを行った後、所定のブロック長で時間−周波数変換を行い、周波数スペクトルに変換する。
量子化スペクトル情報量計算器15は、フィルタバンク3から出力された各周波数スペクトルの総計をとり、これに基づいて量子化前の周波数スペクトルが持つ情報量を計算する。量子化ステップ計算器7は、量子化スペクトル情報量計算器15で求めた量子化前のスペクトルが持つ情報量から、後述の量子化スペクトル情報量予測器16で予測した量子化後のスペクトル情報量を減じることによって量子化ステップを求める。スペクトル量子化器8は、各周波数スペクトルを量子化する。ビット整形器9は、スケールファクタと量子化スペクトルを適宜規定のフォーマットに整形してビットストリームを作成し、出力する。ビットリザーバ13は、各符号化規格により規定される余剰ビット(リザーブビット)数を管理する。
スペクトル割当ビット計算器12は、ビットリザーバ13から通知される余剰ビット量とフレーム平均ビットから量子化スペクトル符号に割り当てられるビット数を計算する。量子化スペクトル情報量予測器16は、各フレームに割り当てられる平均ビット数に基づいて量子化スペクトル情報量の予測計算を行う。
次に、上記構成によるオーディオ信号符号化装置における、オーディオ信号の符号化動作を説明する。なお、ここでは符号化方式としてMPEG-2 AACを例にとって説明するが、同様な量子化手法を適用可能なその他の符号化方式についても全く同様な方法で実現可能である。
まず、処理に先立ち、各部の初期化を行う。初期化によって、量子化ステップと全てのスケールファクタの値は0にセットされる。
オーディオPCM信号などのオーディオ入力信号はフレーム分割器1によってフレーム単位に分割され、フィルタバンク2に送出される。MPEG-2 AAC LC(Low-Complexity)プロファイルの場合、1フレームは1024サンプルのPCM信号で構成され、この信号が送出される。
フィルタバンク3では、フレーム分割器1から送出される1フレーム分の現入力信号と、前回の変換時に受け取った先行フレームの入力信号とを合わせて2フレーム分、すなわち2048サンプルの時間信号が1024サンプルの周波数成分に変換される。なお、本実施形態において、先行フレームの入力信号はフィルタバンク3内の図示しないバッファに保持されている。フィルタバンク3は、入力信号の2048サンプルを1つのブロックとして、窓掛けを実行後、MDCTを行い、1024個の周波数スペクトルを出力する。
スペクトル情報量計算器15は、フィルタバンク3から出力された各周波数スペクトルの総計をとり、これに基づいて量子化前の周波数スペクトルが持つ情報量を計算する。MPEG-2 AACの場合、量子化前のスペクトル全体が持つ情報量は次式で計算できる。
Figure 2007133323
ただし、xiは量子化前のスペクトルを示し、総計をとるiの範囲は1フレーム分、すなわち0≦i≦1023である。これは、各スペクトルの総計に対して底が2の対数をとったものである。
量子化スペクトル情報量予測器15は、各フレームに割り当てられる平均ビット数に基づいて量子化スペクトル情報量の予測計算を行う。この計算では、まず、フレーム平均ビットに基づいて量子化スペクトル総量の予測計算が行われる。本実施形態において、この計算は、従来の量子化器によって量子化した際の、フレームビットと量子化スペクトル総量との関係を実際に測定し、その結果に基づいて作成した近似式によって計算する。例えば、この近似式をF(x)として、フレーム平均ビットをaverage_bitsとすると、量子化スペクトル予測総量は次式によって求めることができる。
Figure 2007133323
ただし、Xqは量子化スペクトルであり、総計をとるiの範囲は1フレーム分、すなわち0≦i≦1023である。なお、本実施形態において、フレーム平均ビットはシステム初期化時にビットレートとサンプリングレートと入力チャネル数とから予め計算されている。この計算は当分野において公知であるため、ここでは詳述しない。システム上に保持されているフレーム平均ビットは、初期化時に計算された値が符号化処理中は不変のまま利用される。
次に、量子化スペクトル総量を量子化スペクトル情報量に変換する。本実施形態において、この計算は(3)式で求めた量子化スペクトル総量に対し、底が2の対数をとることによって行われる。すなわち、量子化スペクトル情報量は次のように表される。
Figure 2007133323
量子化ステップ計算器7は、スペクトル情報量計算器15から出力された量子化前スペクトルの情報量から、量子化スペクトル情報量予測器16から出力された量子化スペクトル情報量を減じる。その後、その減算結果に、量子化粗さの刻み幅から得られる係数を掛けることによって、フレーム全体の量子化粗さである量子化ステップを計算する。
具体的には、MPEG-2 AACの場合は、量子化ステップの予測値は次式によって得られる。
Figure 2007133323
ただし、Xqは量子化スペクトル、xiは量子化前のスペクトル、global_gainはグローバルゲイン(量子化ステップ)である。また、総計をとるiの範囲は1フレーム分、すなわち0≦i≦1023である。
ここで、(5)式における右辺の第1項は次のとおりである。
Figure 2007133323
これは、量子化前のスペクトル全体が持つ情報量であり、スペクトル情報量計算器15によって(2)式により計算された値である。また、右辺の第2項は次のとおりである。
Figure 2007133323
これは、量子化後のスペクトルが持つ情報量であり、量子化スペクトル情報量予測器16によって(4)式により予測された値である。
なお、(5)式は先述のスペクトル量子化式(1)を適宜変形し、スケールファクタscalefacに一律に0を代入することによって得ることができる。
スペクトル割当ビット計算器12は、ビットリザーバ13によって管理されている現在の余剰ビット量をビットリザーバ13から通知され、例えばそのうちの2割をフレーム平均ビットに加えてこれを割当ビットとし、スペクトル量子化器8に通知する。
スペクトル量子化器8は量子化ステップ計算器7が出力した量子化ステップに従って、1024本の周波数スペクトルを量子化する。例えば、MPEG-2 AACの場合では(1)式によって量子化スペクトルを算出し、フレーム全体で消費されるビット数をカウントする。
ここで、使用ビット数がスペクトル割当ビット計算器12から通知された割当ビット数を超えてしまった場合には、使用ビット数がスペクトル割当ビット数に収まるまで量子化ステップを増加して再度スペクトル量子化を行う。しかしながら、量子化ステップ計算器7の計算が正確であり、かつ、量子化ステップの予測計算が行われた時のビット量に加えて、余剰ビット量の一部が割当ビットに加算されている。このため、多くの場合、1回の量子化スペクトル計算とビット計算が行われるだけで量子化が完了する。
また、量子化ステップ計算器7で計算された量子化ステップでスペクトル量子化した場合に使用ビット量が足りなくなるようなフレームは、必然的に情報量が元々平均的なフレームよりも多いフレームである。そのため、余剰ビットの一部を割り当てビットに加算し、この値を基準にしてスペクトル量子化処理を行うことによって、このようなフレームには自動的により多くのビットが割り当てられることになる。
各SFBのスケールファクタと量子化スペクトルはビット整形器9によって定められた書式に従ってビットストリームに整形されて、出力される。
最後に、ビット整形器9は実際に使用したビット量をビットリザーバ13に通知する。ビットリザーバ13はビット整形器9から通知された使用ビット量とフレーム平均ビット量から実際に使用された余剰ビット量を計算し、リザーブビットを適宜加減する。
以上説明した本実施形態におけるオーディオ信号符号化装置は、処理負荷の重い聴覚心理分析を一切行わない。しかも、フレームに割り当てられたビット量から量子化後のスペクトル情報量を予測し、これを用いて量子化前後のスペクトル全体が持つ情報量の差分を計算することによって、スペクトル量子化の前に量子化ステップをほぼ正確に予測する。このため、量子化ステップの調整のための繰り返しを行うことが減るため、迅速に量子化処理を終了することができる。よって、符号化処理にかかる演算量を大幅に削減することができる。
また、本実施形態におけるオーディオ信号符号化装置は、フレーム平均ビット量に基づいて量子化ステップを予測しておき、余剰ビット量の一部を一律に足してから実際のスペクトル量子化を行う。これにより、多少の予測誤差が生じても量子化処理が1回の処理で済むとともに、元々の情報量が多いフレームに自動的にリザーブビットが割当てられることになるため、聴覚心理分析を行わないことによる音質劣化を最小限に留めることができる。
(第2の実施形態)
本発明は、パーソナルコンピュータ(PC)等の汎用的な計算機上で動作するソフトウェアプログラムとして実施することも可能である。以下、この場合について図面を用いて説明する。
図5は、本実施形態におけるオーディオ信号符号化装置の構成例を示す図である。
図示の構成において、100はCPUであり、オーディオ信号符号化処理のための演算、論理判断等を行い、102のバスを介して各構成要素を制御する。
101はメモリであり、本実施形態の構成例における基本I/Oプログラムや、実行しているプログラムコード、プログラム処理時に必要なデータなどを格納する。
102はバスであり、CPU100の制御の対象とする構成要素を指示するアドレス信号を転送し、CPU100の制御の対象とする各構成要素のコントロール信号を転送し、各構成機器相互間のデータ転送を行う。
103はキーボードやマウスなどの入力装置であり、装置の起動、各種条件や入力信号の設定、符号化開始の指示を行う。
104はデータやプログラム等を記憶するための外部記憶領域を提供する外部記憶装置であり、例えばハードディスク装置などによって実現される。ここに、OSをはじめとするプログラムやデータ等が保管され、また、保管されたデータやプログラムは必要な時にCPU100によって呼び出される。また、後述するように、オーディオ信号符号化処理プログラムもこの外部記憶装置104にインストールされることになる。
105はメディアドライブである。記録媒体(例えば、CD−ROM)に記録されているプログラムやデータ、デジタルオーディオ信号などはこのメディアドライブ105が読み取ることにより本オーディオ信号符号化装置にロードされる。また、外部記憶部104に蓄えられた各種データや実行プログラムを、記録媒体に書き込むこともできる。
なお上記の記録媒体は、CD−ROMに限らず、HDD、DVD、MO、半導体メモリなどを用いてもよい。
106はマイクロフォンであり、実際の音を集音してオーディオ信号に変換する。107はスピーカーであり、任意のオーディオ信号データを実際の音にして出力することができる。
108は通信網であり、LAN、公衆回線、無線回線、放送電波などで構成されている。109は通信インタフェースであり、通信網108に接続されている。本実施形態におけるオーディオ信号符号化装置はこの通信インタフェース109を介して通信網108を経由し、外部機器と通信を行い、データやプログラムを送受信することができる。
かかる構成を備えるオーディオ信号符号化装置は、入力装置103からの各種の入力に応じて作動する。入力装置103からの入力が供給されると、インタラプト信号がCPU100に送られることによって、CPU100がメモリ101内に記憶してある各種の制御信号を読出し、それらの制御信号に従って、各種の制御が行われる。
本実施形態のオーディオ信号符号化装置は、CPU100が、メモリ101に格納されている基本I/Oプログラムを実行し、これより外部記憶装置104に記憶されているOSをメモリ101にロードしてこれを実行することによって、動作する。具体的には、本装置の電源がONにされると、基本I/Oプログラム中のIPL(イニシャルプログラムローディング)機能により外部記憶部104からOSがメモリ101に読み込まれ、OSの動作が開始される。
オーディオ信号符号化処理プログラムは、図2に示されるオーディオ信号符号化処理手順のフローチャートに基づいてプログラムコード化されたものである。
図6は、オーディオ信号符号化処理プログラムおよび関連データを記録媒体に記録したときの内容構成例を示す図である。本実施形態において、オーディオ信号符号化処理プログラムおよびその関連データは記録媒体に記録されている。図示したように記録媒体の先頭領域には、この記録媒体のディレクトリ情報が記録されており、その後にこの記録媒体のコンテンツであるオーディオ信号符号化処理プログラムと、オーディオ信号符号化処理関連データがファイルとして記録されている。
図7は、オーディオ信号符号化処理プログラムのオーディオ信号符号化装置(PC)への導入を示す模式図である。記録媒体に記録されたオーディオ信号符号化処理プログラムおよびその関連データは、図7に示したようにメディアドライブ105を通じて本装置にロードすることができる。この記録媒体110をメディアドライブ105にセットすると、OS及び基本I/Oプログラムの制御のもとにオーディオ信号符号化処理プログラムおよびその関連データが記録媒体110から読み出され、外部記憶部104に格納される。その後、再起動時にこれらの情報がメモリ101にロードされて動作可能となる。
図8は、本実施形態におけるオーディオ信号符号化処理プログラムがメモリ101にロードされ実行可能となった状態のメモリマップを示す図である。図示のように、メモリ101のワークエリアには例えば、量子化前スペクトル聴覚情報量、量子化後スペクトル予測情報量、スペクトル割当ビット、スペクトルバッファ、量子化スペクトル、入力信号バッファが格納される。この他に、使用ビット、量子化ステップ、ビットレート、サンプリングレート、平均割当ビット、リザーブビット量も格納されている。
図9は、本実施形態におけるオーディオ信号符号化装置における入力信号バッファの一構成例を示す図である。図示の構成において、バッファサイズは1024×2サンプルであり、説明の便宜上1024サンプル毎に縦線で区切っている。入力信号は1フレーム分の1024サンプルずつ右側から入力されて、左から逐次処理される。太線の矢印は、入力信号の流れを示している。なお、図示の構成は1チャネル分の入力信号バッファを模式的に示したものであり、本実施形態では入力信号のチャネル分だけ同様なバッファが用意される。
以下、本実施形態においてCPU100で実行されるオーディオ信号符号化処理をフローチャートを用いて説明する。
図2は、本実施形態におけるオーディオ信号符号化処理のフローチャートである。このフローチャートに対応するプログラムはオーディオ信号符号化処理プログラムに含まれ、上記のとおりメモリ101にロードされCPU100によって実行される。
まず、ステップS1は、符号化する入力オーディオ信号をユーザが端末103を用いて指定する処理である。本実施形態において、符号化するオーディオ信号は、外部記憶104に格納されているオーディオPCMファイルでも良いし、マイク106で捉えたリアルタイムの音声信号をアナログ・デジタル変換した信号でも良い。この処理を終えると、ステップS2へ進む。
ステップS2は、符号化する入力オーディオ信号が終了したかどうかを判定する処理である。入力信号が終了している場合は、ステップS11へ処理が進む。未終了の場合は、ステップS3へ処理が進む。
ステップS3は、図9に示した入力信号バッファにおいて、右から2フレーム分、すなわち2048サンプルの時間信号を1フレーム分左にシフトするとともに、新たに1フレーム分、すなわち1024サンプルを右側に読み込む入力信号シフト処理である。この処理は入力信号に含まれる全てのチャネルに対して行われる。処理を終えると、ステップS5へ処理が進む。
ステップS5では、現行フレームの時間信号、すなわち、図9の入力信号バッファに格納されている2048サンプル(2フレーム分)の信号に対して窓掛けを行った後、時間−周波数変換を行う。この結果、MPEG-2 AACの場合、1024の周波数成分に分割されたスペクトルの組が1組得られる。なお本実施形態では、ブロックタイプは全て長いブロック長に設定されている。算出された計1024本のスペクトルは、メモリ101上のワークエリアにあるスペクトルバッファに格納される。このステップS5を終えると、処理はステップS7へと進む。
ステップS7は、量子化前のスペクトルが持つ情報量と量子化後のスペクトルが持つ情報量との差分から量子化ステップを計算する処理である。この処理の詳細は図3を用いて後述する。このステップS7を終えると、処理はステップS8へと進む。
ステップS8では、ステップS7で求めた量子化ステップに従って、1024本の周波数スペクトルを量子化して、使用ビットを計算する。さらに、その使用ビットがメモリ101上のワークエリアに格納されている割当ビットを超えた場合のみ、量子化ステップの増加と再量子化を行う。この処理の詳細は図4を用いて後述する。このステップS8を終えると、処理はステップS9へと進む。
ステップS9は、ステップS8で算出された量子化スペクトルと、スケールファクタとを、符号化方式によって定められたフォーマットに従って整形し、ビットストリームとして出力する処理である。本実施形態において、この処理によって出力されるビットストリームは、外部記憶装置104に格納されても良いし、あるいは、通信インタフェース109を介して通信網108に繋がっている外部機器に出力されても良い。このステップS9を終えると、処理はステップS10へと進む。
ステップS10は、ステップS9で出力されたビットストリームに使用されたビット量とフレーム平均ビットから、メモリ101上に格納されている余剰ビットの補正を行う処理である。このステップS10を終えると、処理はステップS2へと戻る。
ステップS11は、直交変換などで生じる遅延によってまだ出力されていない量子化スペクトルがメモリ101上に残っているため、それらをビットストリームに整形して出力する処理である。このステップS11を終えると、オーディオ信号符号化処理は終了する。
図3は、上記したステップS7の量子化ステップ予測処理の詳細を示すフローチャートである。
ステップS100は、量子化前のスペクトルが持つ情報量を算出する処理である。量子化前のスペクトル情報量は、各スペクトル成分の総量を求め、その対数を算出することによって求められる。例えば、MPEG-2 AACの場合、量子化前のスペクトル情報量は次式によって求めることができる。
Figure 2007133323
算出された量子化前スペクトル情報量はメモリ101上のワークエリアに保存される。このステップS100を終えると、処理はステップS103へ進む。
ステップS103は、メモリ101上のフレーム平均ビット数を用いて、量子化スペクトル総量の予測計算を行う処理である。この予測計算は、予め実験を実施することによって求めた近似式によって行う。例えば、この近似式をF(x)として、フレーム平均ビットをaverage_bitsとすると、量子化後スペクトル予測総量は次式によって求めることができる。
Figure 2007133323
算出された量子化スペクトル予測総量はメモリ101上のワークエリアに格納される。このステップS103を終えると、処理はステップS105へと進む。
ステップS105は、ステップS103で求めた量子化スペクトル予測総量の対数を計算し、量子化スペクトル予測情報量を算出する処理である。例えば、MPEG-2 AACの場合は次式によって算出することができる。
Figure 2007133323
この処理によって算出された量子化後のスペクトル情報量はメモリ101上のワークエリアに保存される。このステップS105を終えると、処理はステップS108へと進む。
ステップS108では、ステップS100で求めた量子化前スペクトル情報量から、ステップS105で求めた量子化スペクトル予測情報量を減じる処理を行う。次に、ステップS109で、ステップS108の減算結果に量子化粗さの刻み幅によって決定される係数を乗じ、グローバルゲイン、すなわち量子化ステップの予測値を算出する。MPEG-2 AACの場合は、この予測値は結局第1の実施形態と同じく式(5)を計算したことになる。
Figure 2007133323
算出された量子化ステップ予測値は、メモリ101上のワークエリアに量子化ステップとして格納される。以上でこの量子化ステップ予測処理を終了し、リターンする。
図4は、上記したステップS8のスペクトル量子化処理の詳細を示すフローチャートである。
ステップS200は、メモリ101上に格納されているフレーム平均ビットに、余剰ビット量の一部を加算して、スペクトル割当ビットを計算する処理である。例えば、本実施形態では、余剰ビット量の2割を一律にフレーム平均ビットに加算してスペクトル割当ビットとする。計算されたスペクトル割当ビットはメモリ101上のワークエリアに格納される。このステップS200を終えると、処理はステップS201へ進む。
ステップS201は、メモリ101上に格納されている量子化ステップに従って、スペクトルバッファに格納されている1024本のスペクトル成分を量子化する処理である。MPEG-2 AACの場合は、前出の(1)式に従って量子化スペクトルが計算される。このステップS201を終えると、処理はステップS202へ進む。
ステップS202は、ステップS202で計算された量子化スペクトル全てを符号化した時に使用されるビット数を計算する処理である。例えば、MPEG-2 AACの場合は、量子化スペクトルは複数個をまとめた上でハフマン符号化されるため、この処理においてハフマンコード表の探索が行われ、符号化ビット数の総計が計算される。計算された使用ビット数はメモリ101上のワークエリアに格納される。このステップS202を終えると、処理はステップS203へ進む。
ステップS203は、メモリ101上のスペクトル割当ビットと使用ビットとの大きさを比較する処理である。この比較の結果、使用ビットが割り当てられたビットよりも大きい場合は、ステップS204へ進み、符号量を削減するためにメモリ101に格納されている量子化ステップを増加した後、ステップS201に戻り再度スペクトルの量子化を行う。ただし、図3に示した前述の量子化ステップ予測処理(ステップS7)によってほぼ正確な量子化ステップが予測されており、かつ、フレーム平均ビットに基づいて量子化ステップの予測が行われている。これに対し、ステップS203では、それに余剰ビットの一部を加えたスペクトル割当ビットを基準にして符号量の制御を行っているため、ステップS204が実際に実行されることは極めて少ないであろう。
また、予測した量子化ステップで量子化した結果、使用したビットがフレーム平均ビットを超えてしまう場合も、余剰ビットの追加分を超えなければ1回のスペクトル量子化で量子化が終了することになる。かつ、このようなフレームは元々情報量が多いフレームであり、結果的に情報量が多いフレームに自動的により多くのビットが割当てられることになる。
ステップS203の比較において使用ビットが割り当てられたビットよりも小さい場合は、このスペクトル量子化処理を終了してリターンする。
以上説明した本実施形態におけるオーディオ信号符号化処理は、聴覚心理分析処理を一切省いたものである。そして、フレーム平均ビットから量子化後のスペクトルが持つ情報量を予測し、さらに、量子化前のスペクトル情報量との差分をとることによって量子化ステップを実際の量子化を行う前にほぼ正確に予測する。これによって、聴覚心理演算を行わなくても、量子化ステップの調整を極力避けることが可能になり、符号化処理全体にかかる処理量を大幅に削減することができる。
また、本実施形態におけるオーディオ信号符号化装置は、フレーム平均ビット量に基づいて量子化ステップを予測しておき、リザーブビット量の一部を一律に足してから実際のスペクトル量子化を行う。これにより、多少の予測誤差が生じても量子化処理が1回の処理で済むとともに、元々の情報量が多いフレームに自動的にリザーブビットが割り当てられることになるため、聴覚心理分析を行わないことによる音質劣化を最小限に留めることができる。
(他の実施形態)
本発明はその要旨を逸脱しない範囲で種々変形して実施することができる。
たとえば、上述の実施形態ではブロックスイッチングを全く行っていないが、聴覚分析を行わず、比較的簡易に入力信号の過渡状態を検知して、ブロックスイッチングを行うように構成された装置にも、本発明を同様に適用することが可能である。
また、本発明は、複数の機器から構成されるシステムに適用してもよいし、また、一つの機器からなる装置に適用してもよい。
なお、本発明は、前述した実施形態の各機能を実現するプログラムを、システムまたは装置に直接または遠隔から供給し、そのシステムまたは装置に含まれるコンピュータがその供給されたプログラムコードを読み出して実行することによっても達成される。
従って、本発明の機能・処理をコンピュータで実現するために、そのコンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、上記機能・処理を実現するためのコンピュータプログラム自体も本発明の一つである。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等、プログラムの形態を問わない。
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RWなどがある。また、記録媒体としては、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などもある。
また、プログラムは、クライアントコンピュータのブラウザを用いてインターネットのホームページからダウンロードしてもよい。すなわち、ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードしてもよい。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードする形態も考えられる。つまり、本発明の機能・処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明の構成要件となる場合がある。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布してもよい。この場合、所定条件をクリアしたユーザにのみ、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報で暗号化されたプログラムを復号して実行し、プログラムをコンピュータにインストールしてもよい。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現されてもよい。なお、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行ってもよい。もちろん、この場合も、前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれてもよい。そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ってもよい。このようにして、前述した実施形態の機能が実現されることもある。
図1は、本発明の第1の実施形態におけるオーディオ信号符号化装置の一構成例を示す図である。 図2は、本発明の第2の実施形態におけるオーディオ信号符号化処理のフローチャートである。 図3は、本発明の第2の実施形態における量子化ステップ予測処理のフローチャートである。 図4は、本発明の第2の実施形態におけるスペクトル量子化処理のフローチャートである。 図5は、本発明の第2の実施形態におけるオーディオ信号符号化装置の一構成例を示す図である。 図6は、本発明の第2の実施形態におけるオーディオ信号符号化処理プログラムを格納した記憶媒体の内容構成例を示す図である。 図7は、本発明の第2の実施形態におけるオーディオ信号符号化処理プログラムのPCへの導入を示す模式図である。 図8は、本発明の第2の実施形態におけるメモリマップの例を示す図である。 図9は、本発明の第2の実施形態における入力信号バッファの構成例を示す図である。 図10は、ISO規格書に従う量子化処理のフローチャートである。

Claims (6)

  1. オーディオ入力信号をチャネルごとに処理単位フレームに分割するフレーム分割部と、
    前記フレーム分割部より得られた連続する2フレームの時間領域信号を周波数スペクトルに変換する処理を、1フレームずつずらしながら行うフィルタバンク部と、
    前記フィルタバンク部より出力された周波数スペクトルの情報量を、量子化前のスペクトル情報量として算出するスペクトル情報量算出部と、
    ビットレートとサンプリングレートとから算出されるフレーム平均ビット量に基づいて、量子化後のスペクトル情報量を予測する量子化スペクトル情報量予測部と、
    前記スペクトル情報量算出部で算出された前記量子化前のスペクトル情報量から前記量子化スペクトル情報量予測部で予測された前記量子化後のスペクトル情報量を減じ、その減算結果に、量子化粗さの刻み幅から得られる係数を乗じることで、フレーム全体の量子化ステップをスペクトル量子化前に決定する量子化ステップ決定部と、
    前記量子化ステップ決定部で決定された前記量子化ステップを利用して前記周波数スペクトルを量子化するスペクトル量子化部と、
    符号化規格に準じた余剰ビット量を前記規格に合致するように管理するビットリザーバと、
    前記スペクトル量子化部で量子化された周波数スペクトルを所定のフォーマットに従って整形したビットストリームを生成するビット整形部と、
    前記フレーム平均ビットに、前記ビットリザーバに蓄積されている余剰ビット量の一部を随時加算してスペクトル割当ビットを計算するスペクトル割当ビット計算部と、
    を備え、
    前記スペクトル量子化部は、前記スペクトル割当ビット計算部で計算された前記スペクトル割当ビット量に基づいて符号量制御を行うことを特徴とするオーディオ信号符号化装置。
  2. 符号化形式がMPEG-1 Audio Layer IIIであることを特徴とする請求項1に記載のオーディオ信号符号化装置。
  3. 符号化形式がMPEG-2 AACであることを特徴とする請求項1に記載のオーディオ信号符号化装置。
  4. オーディオ入力信号をチャネルごとに処理単位フレームに分割するフレーム分割ステップと、
    前記フレーム分割ステップで得られた連続する2フレームの時間領域信号を周波数スペクトルに変換する処理を、1フレームずつずらしながら行う時間−周波数変換ステップと、
    前記時間−周波数変換ステップで得られた周波数スペクトルの情報量を、量子化前のスペクトル情報量として算出するスペクトル情報量算出ステップと、
    ビットレートとサンプリングレートとから算出されるフレーム平均ビット量に基づいて、量子化後のスペクトル情報量を予測する量子化スペクトル情報量予測ステップと、
    前記スペクトル情報量算出ステップで算出された前記量子化前のスペクトル情報量から前記量子化スペクトル情報量予測ステップで予測された前記量子化後のスペクトル情報量を減じ、その減算結果に、量子化粗さの刻み幅から得られる係数を乗じることで、フレーム全体の量子化ステップをスペクトル量子化前に決定する量子化ステップ決定ステップと、
    前記量子化ステップ決定ステップで決定された前記量子化ステップを利用して前記周波数スペクトルを量子化するスペクトル量子化ステップと、
    前記スペクトル量子化ステップで量子化された周波数スペクトルを所定のフォーマットに従って整形したビットストリームを生成するビット整形ステップと、
    前記フレーム平均ビットに、符号化規格に準じた余剰ビット量を前記規格に合致するように管理するビットリザーバに蓄積されている余剰ビット量の一部を随時加算してスペクトル割当ビットを計算するスペクトル割当ビット計算ステップと、
    を備え、
    前記スペクトル量子化ステップは、前記スペクトル割当ビット計算ステップで計算された前記スペクトル割当ビット量に基づいて符号量制御を行うことを特徴とするオーディオ信号符号化方法。
  5. 請求項4に記載のオーディオ信号符号化方法をコンピュータに実行させるためのプログラム。
  6. 請求項5に記載のプログラムを格納したコンピュータ読み取り可能な記憶媒体。
JP2005328945A 2004-11-18 2005-11-14 オーディオ信号符号化装置および方法 Expired - Fee Related JP4822816B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2005328945A JP4822816B2 (ja) 2005-11-14 2005-11-14 オーディオ信号符号化装置および方法
CN2005800395626A CN101061534B (zh) 2004-11-18 2005-11-16 音频信号编码装置及方法
PCT/JP2005/021014 WO2006054583A1 (ja) 2004-11-18 2005-11-16 オーディオ信号符号化装置および方法
US11/749,563 US7613605B2 (en) 2004-11-18 2007-05-16 Audio signal encoding apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005328945A JP4822816B2 (ja) 2005-11-14 2005-11-14 オーディオ信号符号化装置および方法

Publications (3)

Publication Number Publication Date
JP2007133323A true JP2007133323A (ja) 2007-05-31
JP2007133323A5 JP2007133323A5 (ja) 2009-01-08
JP4822816B2 JP4822816B2 (ja) 2011-11-24

Family

ID=38155018

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005328945A Expired - Fee Related JP4822816B2 (ja) 2004-11-18 2005-11-14 オーディオ信号符号化装置および方法

Country Status (1)

Country Link
JP (1) JP4822816B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012519309A (ja) * 2009-03-04 2012-08-23 コア ロジック,インコーポレイテッド オーディオ符号化のための量子化
JP2013045067A (ja) * 2011-08-26 2013-03-04 Fujitsu Ltd 符号化装置、符号化方法および符号化プログラム
CN111179946A (zh) * 2013-09-13 2020-05-19 三星电子株式会社 无损编码方法和无损解码方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06252773A (ja) * 1993-02-27 1994-09-09 Sony Corp 高能率符号化装置
JPH06259099A (ja) * 1992-04-20 1994-09-16 Mitsubishi Electric Corp 半導体メモリオーディオ記録・再生装置
JPH08237131A (ja) * 1995-02-24 1996-09-13 Sharp Corp 符号化復号化装置
JPH10233692A (ja) * 1997-01-16 1998-09-02 Sony Corp オーディオ信号符号化装置および符号化方法並びにオーディオ信号復号装置および復号方法
JP2001242895A (ja) * 2000-02-28 2001-09-07 Toshiba Corp オーディオ符号化装置およびオーディオ符号化方法
JP2002182695A (ja) * 2000-12-14 2002-06-26 Matsushita Electric Ind Co Ltd 高能率符号化方法及び装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06259099A (ja) * 1992-04-20 1994-09-16 Mitsubishi Electric Corp 半導体メモリオーディオ記録・再生装置
JPH06252773A (ja) * 1993-02-27 1994-09-09 Sony Corp 高能率符号化装置
JPH08237131A (ja) * 1995-02-24 1996-09-13 Sharp Corp 符号化復号化装置
JPH10233692A (ja) * 1997-01-16 1998-09-02 Sony Corp オーディオ信号符号化装置および符号化方法並びにオーディオ信号復号装置および復号方法
JP2001242895A (ja) * 2000-02-28 2001-09-07 Toshiba Corp オーディオ符号化装置およびオーディオ符号化方法
JP2002182695A (ja) * 2000-12-14 2002-06-26 Matsushita Electric Ind Co Ltd 高能率符号化方法及び装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012519309A (ja) * 2009-03-04 2012-08-23 コア ロジック,インコーポレイテッド オーディオ符号化のための量子化
JP2013045067A (ja) * 2011-08-26 2013-03-04 Fujitsu Ltd 符号化装置、符号化方法および符号化プログラム
CN111179946A (zh) * 2013-09-13 2020-05-19 三星电子株式会社 无损编码方法和无损解码方法
CN111179946B (zh) * 2013-09-13 2023-10-13 三星电子株式会社 无损编码方法和无损解码方法

Also Published As

Publication number Publication date
JP4822816B2 (ja) 2011-11-24

Similar Documents

Publication Publication Date Title
KR102248252B1 (ko) 대역폭 확장을 위한 고주파수 부호화/복호화 방법 및 장치
US11355129B2 (en) Energy lossless-encoding method and apparatus, audio encoding method and apparatus, energy lossless-decoding method and apparatus, and audio decoding method and apparatus
WO2006054583A1 (ja) オーディオ信号符号化装置および方法
JP6184519B2 (ja) 音声信号復号化または符号化の時間領域レベル調整
TWI397903B (zh) 編碼音訊之節約音量測量技術
KR100991448B1 (ko) 스펙트럼 홀 충전을 사용하는 오디오 코딩 시스템
JP5175028B2 (ja) デジタル信号の符号化方法及び装置ならびに復号化方法及び装置
KR101376098B1 (ko) 대역폭 확장 복호화 방법 및 장치
US20090132238A1 (en) Efficient method for reusing scale factors to improve the efficiency of an audio encoder
JP4639073B2 (ja) オーディオ信号符号化装置および方法
JP6979048B2 (ja) 低複雑度の調性適応音声信号量子化
JP2019514065A (ja) 高位周波数帯域における検出されたピークスペクトル領域を考慮してオーディオ信号を符号化するオーディオ符号器、オーディオ信号を符号化する方法、及びコンピュータプログラム
AU2015295624B2 (en) Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
JP4822816B2 (ja) オーディオ信号符号化装置および方法
EP2663978A1 (en) An audio encoder/decoder apparatus
JP2003233397A (ja) オーディオ符号化装置、オーディオ符号化プログラム及びオーディオ符号化データ伝送装置
JP4116628B2 (ja) オーディオ符号化方法およびオーディオ符号化装置
JP4024185B2 (ja) デジタルデータ符号化装置
JP2010175633A (ja) 符号化装置及び方法、並びにプログラム
JP2010175634A (ja) 符号化装置及び方法、並びにプログラム
JP2008026372A (ja) 符号化データの符号化則変換方法および装置
JP2005165056A (ja) オーディオ信号符号化装置及び方法
JP2005351977A (ja) オーディオ信号符号化装置及びオーディオ信号符号化方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081113

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110905

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110906

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140916

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees