JP2006163414A - オーディオ信号の変換方法及び変換装置、オーディオ信号の適応的符号化方法及び適応的符号化装置、オーディオ信号の逆変換方法及び逆変換装置、オーディオ信号の適応的復号化方法及び適応的復号化装置 - Google Patents

オーディオ信号の変換方法及び変換装置、オーディオ信号の適応的符号化方法及び適応的符号化装置、オーディオ信号の逆変換方法及び逆変換装置、オーディオ信号の適応的復号化方法及び適応的復号化装置 Download PDF

Info

Publication number
JP2006163414A
JP2006163414A JP2005352938A JP2005352938A JP2006163414A JP 2006163414 A JP2006163414 A JP 2006163414A JP 2005352938 A JP2005352938 A JP 2005352938A JP 2005352938 A JP2005352938 A JP 2005352938A JP 2006163414 A JP2006163414 A JP 2006163414A
Authority
JP
Japan
Prior art keywords
audio signal
frame
unit
frequency domain
transform unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005352938A
Other languages
English (en)
Other versions
JP5583881B2 (ja
Inventor
殷 美 ▲呉▼
Eun-Mi Oh
Jung-Hoe Kim
金 重 會
Boris Kudryashov
ボリス,クドリャショフ
Konstantin Osipov
コンスタンチン,オシポフ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2006163414A publication Critical patent/JP2006163414A/ja
Application granted granted Critical
Publication of JP5583881B2 publication Critical patent/JP5583881B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】オーディオ信号の変換方法及び変換装置、オーディオ信号の適応的符号化方法及び適応的符号化装置、オーディオ信号の逆変換方法及び逆変換装置、及びオーディオ信号の適応的復号化方法及び適応的復号化装置を提供する。
【解決手段】オーディオ信号を周波数領域に変換するための変換単位を決定するステップと、決定した変換単位により、“0”以外のウィンドウ係数を利用して時間領域のオーディオ信号を周波数領域の信号へ変換するステップと、を含むオーディオ信号の変換方法である。これにより、オーディオ信号の急激な変化に適応する最適なフレーム単位でオーディオ信号を周波数領域へ変換することにより、高い符号化率が要求されるオーディオ信号の符号化歪曲を最小化し、圧縮効率を向上させる。
【選択図】図3

Description

本発明は、オーディオ信号の符号化及び復号化に関し、より具体的には、オーディオ信号の変換単位である様々な長さのフレームの中から、オーディオ信号に適応するフレーム単位を決定し、オーディオ信号を、このフレーム単位で、“0”以外のウィンドウ係数を利用して符号化及び復号化するためのオーディオ信号の変換方法及び変換装置、オーディオ信号の適応的符号化方法及び適応的符号化装置、オーディオ信号の逆変換方法及び逆変換装置、及びオーディオ信号の適応的復号化方法及び適応的復号化装置に関する。
既存のオーディオ信号の符号化過程は、オーディオ信号を特定のフレーム単位で符号化変換し、変換したオーディオ信号を量子化し、ビット率を調節してビット列を生成する方式により行われている。オーディオ信号の場合には、フレームの大きさをオーディオ信号の変化の程度に応じて決定する。具体的には、時間領域での変化が激しい信号は、変換単位のフレームを小さくして周波数領域に変換しなければならない。こうすることで、時間領域において急激に変化するオーディオ信号を、周波数領域において広帯域で処理するため、より正確なビット列を生成できる。また、時間領域において変化が緩慢なオーディオ信号は、変換単位のフレームを大きくすることで、周波数領域では狭い帯域で処理するため、使用帯域を削減できる。
ところが、従来のフレームの種類は、長フレーム及び短フレーム等のフレームの種類が限定されており、時間領域において変化が激しいオーディオ信号を符号化する際には、オーバーサンプリング(oversampling)の変換を行うことができないため、符号化の歪曲を誘発するという問題点がある。
図1は、従来技術で使用されるフレームタイプと、それに対応するウィンドウ係数の一例を示す図である。図1に示すように、従来技術では、変換単位のフレームがロングフレームとショットフレームとに区分され、このようなフレームにより変換された信号は、ロングスタートフレームとロングストップフレームに区分される。変換されたロングスタートフレーム及びロングストップフレームの場合、ウィンドウイング(windowing)するときに、ウィンドウ係数が“0”のである部分が存在する。
図2は、周波数領域に変換するためのウィンドウ係数を例示的に示す図である。なお、図2に示すAないしB、及び1ないし10は、ウィンドウ係数の種類を示している。
ここで、図2を参照しつつ、オーディオ信号の変換方法及び逆変換方法を簡単に記述する。オーディオ信号を周波数領域へ変換する方法のうち、代表的なものが変形離散コサイン変換(Modified Discrete Cosine Transform:MDCT)による方法である。MDCTは、図2に示す入力時間軸のデータにウィンドウ係数を乗算して、オーディオ信号の変換のための中間変数となるz信号を生成するものである。
次に、上記の通りにウィンドウ係数を乗算して求めたこのz信号へ次の数式1を代入して最終スペクトルを計算する。
Figure 2006163414
ここで、Xi,kは、周波数領域の結果値であり、Z,は、ウィンドウイングをした入力シーケンスを意味し、nは、サンプルインデックス(sample index)を意味し、kは、周波数係数インデックスを意味し、iは、フレームインデックス(frame index)を意味し、Nは、フレーム長を意味し、n0は、(N/2+1)/2を表す。
このように変化されて符号化されたオーディオ信号の時間領域への逆変換過程は、次の数式2を利用して求める。
Figure 2006163414
,は、逆変換された結果値である。
上述のように、オーディオ信号を周波数領域に変換する場合、従来のMDCTで使用されるウィンドウ係数は、第1フレームでは、時間軸の“1538+128”部分から“2048”までを“0”のウィンドウ係数を用いて変換する。したがって、この部分の時間軸のフレームサンプルに“0”を乗算することにより無視されて、変換では入力されないことになる。しかしながら実際には、MDCTの特性上、“0”のウィンドウ係数を用いて変換した第1フレームを使用した場合にも依然として“1024”のスペクトル値が出力されてしまう。したがって、ウィンドウ係数が“0”の場合には、変換の効果が低下するという問題点がある。
本発明が達成しようとする技術的課題は、“0”以外のウィンドウ係数を利用したオーディオ信号の変換方法を提供するところにある。
本発明が達成しようとする他の技術的課題は、オーディオ信号の変化に適応するフレーム単位に信号を変換するためのオーディオ信号の変換方法を提供するところにある。
本発明が達成しようとする他の技術的課題は、オーディオ信号の変化に適応するフレーム単位に信号を変換及び符号化するためのオーディオ信号の適応的符号化方法を提供するところにある。
本発明が達成しようとする他の技術的課題は、“0”以外のウィンドウ係数を利用したオーディオ信号の変換装置を提供するところにある。
本発明が達成しようとする他の技術的課題は、オーディオ信号の変化に適応するフレーム単位に信号を変換するためのオーディオ信号の変換装置を提供するところにある。
本発明が達成しようとする他の技術的課題は、オーディオ信号の変化に適応するフレーム単位に信号を変換及び符号化するためのオーディオ信号の適応的符号化装置を提供するところにある。
本発明が達成しようとする他の技術的課題は、“0”以外のウィンドウ係数を利用して符号化したオーディオ信号の逆変換方法を提供するところにある。
本発明が達成しようとする他の技術的課題は、オーディオ信号の変化に適応するフレーム単位に符号化したオーディオ信号の逆変換方法を提供するところにある。
本発明が達成しようとする他の技術的課題は、オーディオ信号の変化に適応するフレーム単位に符号化されたオーディオ信号の適応的復号化方法を提供するところにある。
本発明が達成しようとする他の技術的課題は、“0”以外のウィンドウ係数を利用して符号化したオーディオ信号の逆変換装置を提供するところにある。
本発明が達成しようとする他の技術的課題は、オーディオ信号の変化に適応するフレーム単位に符号化したオーディオ信号の逆変換装置を提供するところにある。
本発明が達成しようとする他の技術的課題は、オーディオ信号の変化に適応するフレーム単位に符号化したオーディオ信号の適応的復号化装置を提供するところにある。
前記の課題を解決するために、本発明に係るオーディオ信号の変換方法は、
(a)オーディオ信号を周波数領域に変換するための変換単位を決定するステップと、(b)前記決定した変換単位により、“0”以外のウィンドウ係数を利用して、前記オーディオ信号を時間領域から周波数領域に変換するステップとを含み、
前記(b)ステップは、
(b1)前記決定した変換単位により、前記オーディオ信号を“0”以外のウィンドウ係数を利用してウィンドウイングするステップと、(b2)前記ウィンドウイングしたオーディオ信号を周波数領域に変換するステップと、を含むことを特徴とする。
前記の課題を解決するために、本発明に係るオーディオ信号の変換装置は、
オーディオ信号を周波数領域に変換するための変換単位を決定する変換単位決定部と、前記決定した変換単位により、“0”以外のウィンドウ係数を利用して前記オーディオ信号を時間領域から周波数領域に変換する周波数領域変換部と、を備え、
前記周波数領域変換部は、
前記決定した変換単位により、前記オーディオ信号を、“0”以外のウィンドウ係数を利用してウィンドウイングするウィンドウイング部と、前記ウィンドウイングしたオーディオ信号を周波数領域に変換する信号変換部と、を備えることを特徴とする。
前記の他の課題を達成するために、本発明に係るオーディオ信号の適応的符号化方法は、
(a)オーディオ信号を所定のサンプル単位にフィルタリングするステップと、(b)前記オーディオ信号の大きさが所定の閾値を超える時点に応じて、前記オーディオ信号を周波数領域に変換するための適応的変換単位を決定するステップと、(c)前記決定した適応的変換単位により、前記オーディオ信号を前記周波数領域に変換するステップと、(d)前記周波数領域に変換したオーディオ信号を量子化するステップと、(e)前記量子化したオーディオ信号を符号化するステップと、を含むことを特徴とする。
前記の他の課題を達成するために、本発明に係るオーディオ信号の適応的符号化装置は、
オーディオ信号を所定のサンプル単位にフィルタリングするフィルタリング部と、前記フィルタリングしたオーディオ信号の大きさが所定の閾値を超える時点に応じて、前記オーディオ信号を周波数領域に変換するための適応的変換単位を決定する適応的変換単位決定部と、前記決定した適応的変換単位により、前記オーディオ信号を前記周波数領域に変換する周波数領域変換部と、前記周波数領域に変換したオーディオ信号を量子化する量子化部と、前記量子化したオーディオ信号のビット率を調節するビット率調節部と、前記量子化したオーディオ信号を符号化する符号化部と、を備えることを特徴とする。
前記の他の課題を達成するために、本発明に係るオーディオ信号の適応的復号化方法は、
(a)符号化したオーディオデータを復号化するステップと、(b)前記復号化したオーディオデータを逆量子化するステップと、(c)前記逆量子化したオーディオデータから、オーディオ信号を周波数領域に変換するときに用いた適応的変換単位に関する情報を検出するステップと、(d)前記検出した適応的変換単位に関する情報を利用して、前記オーディオデータを前記検出した適応的変換単位により時間領域へ逆変換するステップと、を備えることを特徴とする。
前記の他の課題を達成するために、本発明に係るオーディオ信号の適応的復号化装置は、
符号化したオーディオデータを復号化する復号化部と、前記復号化したデータを逆量子化する逆量子化部と、前記逆量子化したオーディオデータから、オーディオ信号を周波数領域に変換するときに用いた適応的変換単位に関する情報を検出する変換単位情報検出部と、前記検出した適応的変換単位に関する情報を利用して、前記オーディオデータを前記検出した適応的変換単位により時間領域へ逆変換する時間領域逆変換部と、を備えることを特徴とする。
前記の他の課題を達成するために、本発明に係るオーディオ信号の逆変換方法は、
“0”以外のウィンドウ係数を利用してウィンドウイングを行い、周波数領域に変換してビット列を生成したオーディオデータを時間領域へ逆変換するステップを含むことを特徴とする。
また、本発明に係るオーディオ信号の逆変換方法は、
(a)オーディオデータから、オーディオ信号を周波数領域に変換するときに用いた適応的変換単位に関する情報を検出するステップと、(b)前記検出した適応的変換単位に関する情報を利用して、前記オーディオデータを前記検出した適応的変換単位により時間領域へ逆変換するステップと、を含むことを特徴とする。
前記の他の課題を達成するために、本発明に係るオーディオ信号の逆変換装置は、
“0”以外のウィンドウ係数を利用してウィンドウイングを行い、周波数領域に変換してビット列を生成したオーディオデータを時間領域へ逆変換する時間領域逆変換部を備え、
オーディオデータから、オーディオ信号を周波数領域に変換するときに用いた適応的変換単位に関する情報を検出する変換単位情報検出部と、前記検出した適応的変換単位に関する情報を利用して、前記オーディオデータを前記検出した適応的変換単位により時間領域へ逆変換する時間領域逆変換部と、を備えることを特徴とする。
本発明によるオーディオ信号の変換方法及び変換装置、オーディオ信号に適応する符号化方法及び符号化装置、オーディオ信号の逆変換方法及び逆変換装置、オーディオ信号に適応する復号化方法及び復号化装置は、オーディオ信号の急激な変化に適応する変換単位のフレームにより、オーディオ信号を周波数領域に変換することにより、高い符号化率が要求されるオーディオ信号の圧縮効率を向上させ、符号化による歪曲を低減できる。
以下、本発明によるオーディオ信号の変換方法を、添付の図面を参照しつつ、説明する。
図3は、本発明の実施形態に係わるオーディオ信号の変換方法を説明するためのフローチャートである。
まず、オーディオ信号を周波数領域に変換するための変換単位を決定する(S10)。
図4は、本実施形態に係るオーディオ信号の変換方法において使用される多様なフレームタイプの一例を示す図である。ここでは、オーディオ信号の変換単位を様々な長さのフレームで表しているが、ステップS10では、オーディオ信号の変化に応じて、この中の何れか一つのフレームを選択して決定する。
ステップS10で決定した変換単位を、“0”以外のウィンドウ係数を利用して、時間領域のオーディオ信号を周波数領域に変換する(S12)。
図5は、図3に示すステップS12を詳しく説明するためのフローチャートである。
決定した変換単位のオーディオ信号を、“0”以外のウィンドウ係数を利用してウィンドウイングを行う(S30)。
ウィンドウイングに際しては、MDCTの特性である逆変換により、原信号が復元されるように設定されたウィンドウ係数を利用する。
従来技術では、MPEG(Motion Picture Experts Groups)−4AAC(Advanced Audio Coding)/BSAC(Bit Sliced Arithmetic Coding)/TwinVQ等のオーディオコデックで使用するサインウィンドウ係数やカイザーベッセルウィンドウ係数を使用してウィンドウイングを行う。
しかし、本実施形態で用いるウィンドウ係数は、従来とは違って、“0”のウィンドウ係数は使用せずに、常に“0”以外の係数を使用する。例えば、図4に示すフレームから決定したフレームに該当するオーディオ信号を、“0”以外のウィンドウ係数を利用してウィンドウイングする。従来の変換方法とは異なり、“0”のウィンドウ係数を用いないため、オーディオ信号変換の効果が低下する問題点が発生しない。
ステップS30に続いて、ウィンドウイングされたオーディオ信号を周波数領域に変換する(S32)。オーディオ信号を周波数領域に変換する方法としては、離散コサイン変換(Discrete Cosine Transform:DCT)またはMDCTの方法などを使用する。
以下、本実施形態に係わるオーディオ信号の変換方法の変形例を説明する。
図6は、本実施形態に係わるオーディオ信号の変換方法の変形例を説明するためのフローチャートである。
まず、オーディオ信号を所定のサンプル単位でフィルタリングする(S50)。フィルタリングは、周波数帯域に応じて、オーディオ信号の中で必要な部分に対して行われる。なお、ここでいう所定のサンプル単位とは、サンプルしたオーディオ信号をあらかじめ定めた長さに区分する単位を意味する。図7は、図6に示すステップS50においてフィルタリングしたオーディオ信号の一例を示す図である。図7に示すように、例えば、オーディオ信号を“128”個のサンプルに区分してフィルタリングする。この場合、“128”サンプル単位のオーディオ信号のそれぞれを、インデックス符号としてXないしXを用いて表現する。
ステップS50の後、オーディオ信号の変換単位に関する所定の閾値に応じて、オーディオ信号を周波数領域に変換する際の適応的変換単位を決定する(S
52)。ここでいう所定の閾値とは、オーディオ信号が急激に変化すると判断できる程度の閾値を意味する。また、適応的変換単位とは、オーディオ信号が急激に変化する時点(所定の閾値)に照らして、オーディオ信号の歪曲を最小化する変換単位を意味する。適応的変換単位に該当するフレームは、図4に示すように、様々な長さに区分されている。フレームの長さを、例えば、最長フレームF(superlong)、長フレームF(long)、短フレームF(short)、最短フレームF(supershort)に区分し、これらのフレームのうち、何れか1つをオーディオ信号に変換するための変換単位として決定する。また、図4に示すT、T、T、T及びTは、F〜Fのフレームの変換単位を用いて変換したフレームを表している。例えば、フレームTは、長さ“2048”のFフレームと、長さ“1024”のFフレームの中間の長さである“1536”の長さを有するフレームである。また、図4の「周波数領域の長さ」と「時間領域の長さ」はそれぞれ、係数の個数によって表される。なお、これらは本実施形態を説明するために例示的に用いたものであり、フレームをさらに多様な長さに区分して、変換フレームを任意の長さに設定することが可能である。
図8は、図6に示すステップS52を詳細に説明するためのフローチャートである。
まず、フィルタリングしたオーディオ信号の変化の程度に応じて急激変化係数を算出する(S70)。ここでいう急激変化係数とは、フィルタリングしたオーディオ信号のうち、オーディオ信号が急激に変化するか否かを判断するための値である。例えば、図7に示すフィルタリングしたオーディオ信号について、フィルタリングしたサンプル単位ごとに急激変化係数を算出する。まず、インデックス符号XないしXで表されたフレームそれぞれについて、オーディオ信号の代表値yないしyを決定する。この代表値を決定する方法としては、インデックス符号のフレームそれぞれに含まれるオーディオ信号サンプルの中で、サンプル値が最も大きい値を代表値として決定する。このように決定したオーディオ信号の代表値について、次の数式3を利用して急激変化係数を算出する。
Figure 2006163414
ここで、Aは、インデックス符号Xについての急激変化係数を意味し、yは、インデックス符号Xのオーディオ信号についての代表値を意味し、Mは、インデックス符号Xより前のインデックス符号XないしXk−1のオーディオ信号の代表値を平均した値である。
数式3から、急激変化係数の値が大きいほど、急激変化係数を算出した位置でのオーディオ信号の変化が急激であることが分かる。
ステップS70に続いて、急激変化係数が所定の閾値を超えるか否かによって、急激変化開始長を算出する(S72)。所定の閾値とは、上述の通り、オーディオ信号が急激に変化すると判断できる程度の閾値を意味する。また、ここでいう急激変化開始長とは、フレームが始まる時間領域での位置と、オーディオ信号が急激に変化し始める時間領域での位置との間の長さを意味する。急激変化係数は、あらかじめ定められた所定の閾値を超えると、急激変化係数を算出した位置においてオーディオ信号が急激に変化することを意味する。したがって、急激変化開始長は、次の数式4に示す通り、フィルタリングしたオーディオ信号のサンプル単位の“128”に、急激変化係数を算出した位置のインデックス符号であるXの“k”を乗算して算出する。
Figure 2006163414
ここで、Bは急激変化開始長を意味し、128はフィルタリングするサンプル単位を意味し、kは急激変化係数を算出するときに用いるインデックス符号Xの下添字を意味する。
ステップS72に続いて、算出した急激変化開始長Bを、フレームタイプ別のそれぞれのフレーム長さと比較して、最適なフレームタイプを決定する(S74)。
図9は、図8に示す変換単位のフレームタイプを決定するためのステップS74を詳細に説明するためのフローチャートである。
まず、算出した急激変化開始長Bがフレームタイプにおける最長フレームFと最短フレームFとの長さを合算した値以上であるかを判定する(S80)。例えば、オーディオ信号の変換単位が、図4に示すようなフレームタイプで構成されているならば、急激変化開始長Bが最長フレームF及び最短フレームFの長さを合算した値以上であるかを判定する。
もし、判定の結果、急激変化開始長Bが、最長フレームF及び最短フレームFの長さを合算した値以上であれば、オーディオ信号の変換が行われた前フレームが最短フレームFであるか否かを判定する(S82)。例えば、急激変化開始長Bが、最長フレームF及び最短フレームFの長さを合算した値以上であれば、インデックス符号XないしXに該当するオーディオ信号の長さは、少なくとも、最長フレームFより長い可能性が高い。したがって、急激変化開始長Bが最長フレームF及び最短フレームFの長さを合算した値以上であるならば、フレームを決定する場合は、変換単位を最長フレームFまたは長フレームFに決定する必要性がある。
もし、ステップS82において、前フレームが最短フレームFではなければ、最長フレームFをオーディオ信号の周波数領域へ変換するためのフレームタイプに決定する(S84)。例えば、前フレームが図4に示す最短フレームFではなければ、少なくとも前フレームでは、オーディオ信号が急激に変化していないことを意味している。前フレームでオーディオ信号が急激に変化していないことから、オーディオ信号の変換単位のフレームとして、最長フレームFを決定しても、オーディオ信号の符号化歪曲に影響を及ぼさないことになる。言い換えれば、前フレームが最短フレームFでない場合は、現在変換を行おうとしているオーディオ信号の変換単位のフレームタイプとして、最長フレームFを決定する。
しかし、ステップS82において、前フレームが最短フレームFならば、長フレームFをオーディオ信号の変換単位のフレームタイプに決定する(S86)。これは、前フレームが最短フレームFであれば、少なくとも、前フレームでオーディオ信号が急激に変化したことを意味する。したがって、前フレームでオーディオ信号が急激に変化したことから、オーディオ信号の変換の単位として最長フレームFを選択するよりも、長フレームFを選択するほうが、オーディオ信号の符号化歪曲への影響を最小化できる。
一方、ステップS80において、算出した急激変化開始長Bが最長フレームF及び最短フレームFの長さを合算した値より小さければ、算出した急激変化開始長Bが、長フレームF及び最短フレームFの長さを合算した値以上であるか否かを判定する(S88)。急激変化開始長Bが、最長フレームF及び最短フレームFの長さを合算した値より小さい場合は、インデックス符号XないしXに該当するオーディオ信号の長さは、最長フレームFより短い可能性が高いことを意味する。したがって、急激変化開始長Bが、長フレームF及び最短フレームFの長さを合算した値以上であるか否かを判定する。
もし、算出した急激変化開始長Bが長フレームF及び最短フレームFの長さを合算した値以上であるならば、ステップS86に進み、長フレームFをオーディオ信号の変換単位のフレームタイプに決定する。例えば、急激変化開始長Bが長フレームF及び最短フレームFの長さを合算した値以上であるならば、インデックス符号XないしXに該当するオーディオ信号の長さは、少なくとも短フレームFより長い。したがって、オーディオ信号の変換単位のフレームタイプとして長フレームFを決定する。
しかし、算出した急激変化開始長Bが、長フレームF及び最短フレームFの長さを合算した値より小さい場合は、算出した急激変化開始長Bが、短フレームF及び最短フレームFの長さを合算した値以上であるか否かを判定する(S90)。例えば、急激変化開始長Bが、長フレームF及び最短フレームFの長さを合算した値より小さければ、インデックス符号XないしXに該当するオーディオ信号の長さは、長フレームFより短い可能性が高いということを意味する。したがって、算出した急激変化開始長Bが短フレームF及び最短フレームFの長さを合算した値以上であるか否かを判定する。
もし、算出した急激変化開始長Bが、短フレームF及び最短フレームFの長さを合算した値以上であれば、短フレームFをオーディオ信号の変換単位のフレームタイプに決定する(S92)。例えば、急激変化開始長Bが、短フレームF及び最短フレームFの長さを合算した値以上であれば、インデックス符号XないしXに該当するオーディオ信号の長さは、少なくとも、最短フレームFより長いことになる。したがって、短フレームFをオーディオ信号の変換単位のフレームタイプに決定する。しかし、算出した急激変化開始長Bが、短フレームF及び最短フレームFの長さを合算した値より小さい場合は、最短フレームFをオーディオ信号の変換単位のフレームタイプに決定する(S94)。急激変化開始長Bが、短フレームF及び最短フレームFの長さを合算した値より小さければ、インデックス符号XないしXに該当するオーディオ信号の長さは、短フレームFより短い可能性が高いことを意味する。したがって、算出した急激変化開始長Bが、短フレームF及び最短フレームFの長さを合算した値より小さい場合は、最短フレームFをオーディオ信号の変換単位のフレームタイプに決定する。
なお、上述の通り、算出した急激変化開始長Bと、変換単位のフレームタイプの長さを合算した値とを比較して、現オーディオ信号の変換単位のフレームタイプを決定する方法は、一実施形態に過ぎず、これ以外の方法により、算出した急激変化開始長Bと、フレームタイプ別に合算した値とを比較してフレームタイプを決定してもよい。例えば、ステップS80において、算出した急激変換開始長と比較する長さの対象として、最長フレームと最短フレームとの長さの合算の代りに、最長フレームと短フレームとの長さの合算でもよく、最長フレームのみ、あるいは最短フレーム及び短フレームの長さの合算を長さの比較対象としても良い。
図6に戻って、ステップS52の後、決定された適応的変換単位によってオーディオ信号を周波数領域に変換する(S54)。
図10は、図6に示すステップS54を詳細に説明するためのフローチャートである。
まず、適応的変換単位のオーディオ信号を、“0”以外のウィンドウ係数を利用してウィンドウイングする(S100)。ウィンドウイングを行う際には、従来とは異なり、“0”の係数を使用しない。本実施形態によれば、上記の説明の通り、多様なフレームの中からオーディオ信号の急激な変化に適応するフレームタイプを決定するため、この決定した適応的変換単位に該当するフレームタイプに従うならば、“0”以外のウィンドウ係数を利用してウィンドウイングを行うことが可能となる。したがって、従来のようなオーバーサンプルドトランスフォーム(over sanpled transform)を行うことなく、クリティカリサンプルドトランスフォーム(critically−sampled transform)により、符号化歪曲を最小化することが可能である。
ステップS100に続いて、ウィンドウイングされたオーディオ信号を周波数領域に変換する(S102)。オーディオ信号を周波数領域に変換する方法としては、DCTまたはMDCTの方法などを使用する。
以下、図面を参照しつつ、本実施形態に係わるオーディオ信号の適応的符号化方法をについて説明する。
図11は、本実施形態に係わるオーディオ信号の適応的符号化方法を説明するためのフローチャートである。
まず、オーディオ信号を所定のサンプル単位にフィルタリングする(S110)。なお、フィルタリングは、周波数帯域に応じて、オーディオ信号の中で必要な部分についてフィルタリングする。詳細は、前述の通りであるため、詳細な説明を省略する。
ステップS110後に、オーディオ信号の単位が所定の閾値を超える時点、つまり、信号が急激に変化する時点に応じて、オーディオ信号を周波数領域に変換するための適応的変換単位を決定する(S112)。適応的変換単位を決定するための詳細は、上述の通りであるため、説明を省略する。
ステップS112に続き、決定した適応的変換単位によりオーディオ信号を周波数領域に変換する(S114)。決定した適応的変換単位によって“0”以外のウィンドウ係数を利用してウィンドウイングしたオーディオ信号を周波数領域に変換する過程は、上述の通りであるため、詳細な説明を省略する。
ステップS114に続いて、周波数領域に変換されたオーディオ信号を量子化する(S116)。周波数成分に変換した周波数領域のオーディオ信号をビット割当情報であるビット率で量子化を行う。
ステップS116後、量子化したオーディオ信号を符号化する(S118)。ここでは、量子化したオーディオ信号を入力し、これを符号化して、この符号化したビット列を出力する。符号化方法には、損失符号化方法あるいは無損失符号化方法を含む。無損失符号化方法は、適当な確率分布を求め、ハフマン符号化や算術符号化等の無損失符号化方式を用いて行う。
以下、図面を参照しつつ、本実施形態に係わるオーディオ信号の変換装置について説明する。
図12は、本実施形態に係わるオーディオ信号の変換装置10を説明するためのブロック図である。変換装置10は、変換単位決定部200及び周波数領域変換部220から構成される。
変換単位決定部200は、オーディオ信号を周波数領域に変換するための変換単位を決定し、決定した結果を周波数領域変換部220に出力する。変換単位をフレームとする場合に変換単位決定部200は、オーディオ信号の変化に応じて、多様な長さのフレームタイプから1つを選択的に決定できる。例えば、変換単位決定部200は、変換単位を図4に示すような最長フレームF、長フレームF、短フレームF及び最短フレームFに区分する。変換単位決定部200は、これらのフレームFないしFのうち、オーディオ信号の急激な変化に適応する最適なフレームタイプを決定する。
周波数領域変換部220は、変換単位決定部200で決定した変換単位によって“0”以外のウィンドウ係数を利用してウィンドウイングしたオーディオ信号を時間領域から周波数領域へ変換する。
図13は、図12に示す周波数領域変換部220をさらに詳しく説明するためのブロック図である。
周波数領域変換部220は、ウィンドウイング部300及び信号変換部320から構成される。
ウィンドウイング部300は、決定した変換単位により、オーディオ信号を“0”以外のウィンドウ係数を利用してウィンドウイングし、ウィンドウイングした結果を信号変換部320に出力する。このとき、ウィンドウイング部300では、MDCTの特徴である逆変換により原信号を復元できるように設定されたウィンドウ係数を用いる。従来技術では、MPEG−4AAC/BSAC/TwinVQなどのオーディオコデックで使用するサインウィンドウやカイザーベッセルウィンドウ係数を使用するが、本実施形態のウィンドウイング部300では、“0”の係数を有するウィンドウ係数は使用せずに、常に“0”以外のウィンドウ係数を使用してウィンドウイングする。このように、“0”以外のウィンドウ係数を使用することにより、オーディオ信号の変換の効果が低下するという従来技術の問題点を解消することができる。
次に、信号変換部320は、ウィンドウイング部300でウィンドウイングされたオーディオ信号を周波数領域に変換する。信号変換部320では、DCTまたはMDCTの方法などを使用してオーディオ信号を周波数領域に変換する。
以下、図面を参照しつつ、本実施形態に係わるオーディオ信号変換装置について説明する。
図14は、本実施形態に係わるオーディオ信号変換装置40を説明するためのブロック図である。オーディオ信号の変換装置40は、フィルタリング部400、適応的変換単位決定部420及び周波数領域変換部440から構成される。
フィルタリング部400は、オーディオ信号を所定サンプル単位にフィルタリングし、フィルタリングした結果を適応的変換単位決定部420に出力する。フィルタリング部400は、周波数帯域に応じて信号の中で必要な部分に対してフィルタリングする。なお、所定サンプル単位とは、前述の通り、サンプリングしたオーディオ信号を所定長さに区分した単位である。フィルタリング部400がフィルタリングするサンプル単位は、図7に示すような単位にオーディオ信号を区分してフィルタリングを行う。
次に、適応的変換単位決定部420は、オーディオ信号の単位が所定の閾値を超える(信号が急激に変化する)時点に応じて、オーディオ信号を周波数領域に変換するための適応的変換単位を決定し、決定した結果を周波数領域変換部440に出力する。なお、所定の閾値とは、前述の通り、オーディオ信号が急激に変化すると判断できる程度の閾値を意味する。適応的変換単位とは、オーディオ信号の急激な変化時点に応じて決定する、オーディオ信号の歪曲を最小化する変換単位を意味する。
図15は、図14に示す適応的変換単位決定部420をさらに詳しく説明するためのブロック図である。
適応的変換単位決定部420は、急激変化係数算出部500、長さ検出部520及びフレームタイプ決定部540から構成される。
急激変化係数算出部500は、フィルタリング部400でフィルタリングしたオーディオ信号の変化程度に応じて急激変化係数を算出し、この算出した急激変化係数を長さ検出部520に出力する。この、急激変化係数は、前述の通り、フィルタリングされたオーディオ信号のうち、オーディオ信号が急激に変化するか否かを判断するための値である。急激変化係数の値が大きければ、急激変化係数を算出した位置においてオーディオ信号が急激に変化することを表している。なお、急激変化係数算出部500は、前述の数式3を利用して急激変化係数を算出する。
長さ検出部520は、急激変化係数が所定の閾値を超えるか否かの判定結果に応じて、急激変化開始長を算出し、算出した急激変化開始長をフレームタイプ決定部540に出力する。前述のように、所定の閾値は、オーディオ信号が急激に変化すると判断できる程度の閾値を意味する。急激変化開始長は、フレームが始まる時間領域の位置と、オーディオ信号が急激に変化し始める時間領域の位置との間の長さを意味する。もし、急激変化係数が、あらかじめ定められた所定閾値を超えるならば、急激変化係数を算出した位置においてオーディオ信号が急激に変化することを意味する。長さ検出部520は、前述の数式4を利用して急激変化開始長を算出する。
フレームタイプ決定部540は、長さ検出部520で算出した急激変化開始長を、上述の方法の通りに、フレームタイプのそれぞれの長さの合算値と比較して、フレームタイプを決定し、決定したフレームタイプを周波数領域変換部440に出力する。
例えば、変換単位であるフレームを、最長フレーム、長フレーム、短フレーム及び最短フレームに区分する場合、フレームタイプ決定部540は、それらのフレームのうち、オーディオ信号を変換するために最適な変換単位となるフレーム長さを、急激変化開始長と、区分フレームの長さをそれぞれに組み合わせて求めた合算値とを比較することにより決定する(図9参照)。
続いて、周波数領域変換部440は、適応的変換単位決定部420で決定された適応的変換単位でオーディオ信号を周波数領域に変換する。
図16は、図14に示す周波数領域変換部440をさらに詳しく説明するためのブロック図である。
周波数領域変換部440は、ウィンドウイング部600及び信号変換部620から構成される。
ウィンドウイング部600は、決定した適応的変換単位でオーディオ信号を、“0”以外のウィンドウ係数を利用してウィンドウイングし、この結果を信号変換部620に出力する。ウィンドウイング部600は、MDCTの特徴である逆変換により原信号を復元できるように設定されたウィンドウ係数を利用する。従来技術では、MPEG−4AAC/BSAC/TwinVQなどのオーディオコデックで使用するサインウィンドウやカイザーベッセルウィンドウ係数を使用するが、本実施形態のウィンドウイング部300では、“0”の係数を有するウィンドウ係数は使用せずに、常に“0”以外のウィンドウ係数を使用してウィンドウイングする。適応的変換単位に対応するフレームタイプに応じてオーディオ信号の変換を行うため、ウィンドウイング部600は、“0”以外のウィンドウ係数を利用してウィンドウイングすることが可能である。
続いて、信号変換部620は、ウィンドウイング部600でウィンドウイングされたオーディオ信号を周波数領域に変換する。信号変換部620は、DCTまたはMDCTの方法などを使用して、オーディオ信号を周波数領域に変換する。
以下、図面を参照しつつ、本実施形態に係わるオーディオ信号の適応的符号化装置について説明する。
図17は、本実施形態に係わるオーディオ信号符号化装置70を説明するためのブロック図である。
オーディオ信号符号化装置70は、フィルタリング部700、適応的変換単位決定部710、周波数領域変換部720、量子化部730、ビット率調節部740及び符号化部750から構成される。
フィルタリング部700は、オーディオ信号を所定サンプル単位にフィルタリングし、フィルタリングした結果を適応的変換単位決定部710に出力する。フィルタリング部700は、周波数帯域に応じて、オーディオ信号の中で必要な部分に対してフィルタリングする。フィルタリング部700についての詳細は、図14で説明したフィルタリング部400と同じであるため、詳細な説明を省略する。
適応的変換単位決定部710は、オーディオ信号の単位が所定の閾値を超える(信号が急激に変化する)時点に応じて、オーディオ信号を周波数領域に変換するように適応的変換単位を決定する。この決定した適応的変換単位を周波数領域変換部720に出力する。なお、適応的変換単位とは、前述の通り、オーディオ信号の急激な変化時点に応じて決定する、オーディオ信号の歪曲を最小化する変換単位を意味する。適応的変換単位決定部710についての詳細は、前述の適応的変換単位決定部420と同じであるため、詳細な説明を省略する。
周波数領域変換部720は、適応的変換単位決定部710で決定した変換単位でオーディオ信号を周波数領域に変換し、この変換した結果を量子化部730に出力する。具体的には、決定した適応的変換単位で“0”以外のウィンドウ係数を利用してオーディオ信号をウィンドウイングし、これを時間領域から周波数領域に変換する。なお、周波数領域変換部720についての説明は、図14の周波数領域変換部440と同じであるため、詳細な説明を省略する。
次に、量子化部730は、周波数領域変換部720から入力した周波数領域のオーディオ信号に対して、ビット率調節部740で割当てた符号化ビット率により量子化し、この量子化した結果を符号化部750に出力する。
ここで、ビット率調節部740の説明をする。ビット率調節部740は、符号化部750から入力したビット列のビット率に関する情報を利用して、ビット列のビット率に対応するビット割当パラメータを求め、これを量子化部730に出力する。このとき、ビット率調節部740は、出力するビット列のビット率を微細に調節して所望のビット率を出力する機能を担う。
符号化部750は、量子化部730で量子化したオーディオ信号を受信し、この量子化したオーディオ信号を符号化したビット列で出力する。なお、符号化部750は無損失符号化部及び損失符号化部(図示せず)を備える。特に、符号化部750は、適当な確率分布を求め、ハフマン符号化や算術符号化のような無損失符号化方式を使用してオーディオ信号を符号化する。
以下、本実施形態に係わるオーディオ信号の逆変換方法を説明する。
本実施形態に係わるオーディオ信号の逆変換方法は、“0”以外のウィンドウ係数を利用して、周波数領域に変換したビット列により生成されたオーディオデータを逆変換する方法である。“0”以外のウィンドウ係数を使用して符号化した周波数領域のオーディオデータを、再び時間領域の信号に変換するものである。したがって、“0”以外のウィンドウ係数により符号化したオーディオ信号を逆変換することにより、従来とは異なり、オーディオ信号の変換の効果が低下するという従来の問題点を解消できる。
以下、図面を参照しつつ、本実施形態に係わるオーディオ信号の逆変換方法について説明する。
図18は、本実施形態に係わるオーディオ信号の逆変換方法を説明するためのフローチャートである。
まず、オーディオデータからオーディオ信号を周波数領域に変換する際に用いた適応的変換単位に関する情報を検出する(S800)。なお、適応的変換単位とは、前述の通り、時間領域のオーディオ信号を周波数領域オーディオ信号に変換する際に、オーディオ信号の急激な変化の程度に応じて、適応的に決定した変換単位を意味する。この適応的変換単位に関する情報は符号化時にヘッダー情報に記録され、オーディオ信号を周波数領域から時間領域へ逆変換する際にヘッダー情報から検出される。
次に、ステップS800後、算出した適応的変換単位に関する情報を利用して、オーディオデータを適応的変換単位で逆変換する(S802)。
本実施形態では、“0”以外のウィンドウ係数を利用して、符号化した周波数領域のオーディオデータを適応的変換単位により時間領域のオーディオ信号に逆変換する。
以下、図面を参照しつつ、本実施形態に係わるオーディオ信号の適応的復号化方法について説明する。
図19は、本発明によるオーディオ信号の適応的復号化方法を説明するためのフローチャートである。
まず、符号化したオーディオデータを復号化する(S900)。復号化は、受信したビット列に対して符号化の逆過程を行う。ビット列が無損失符号化されている場合は、ビット列を算術復号化方法またはハフマン復号化方法により無損失復号化する。
ステップS900の後、復号化したオーディオデータを逆量子化する(S902)。この際、復号化したオーディオデータを量子化を行う前の本来のサイズの信号に復元する。
次に、逆量子化したオーディオデータからオーディオ信号を周波数領域に変換したときに利用した適応的変換単位に関する情報を検出する(S904)。なお、適応的変換単位とは、前述の通り、オーディオ信号を時間領域から周波数領域へ変換する際に、オーディオ信号の急激な変化の程度に応じて適応的に決定する変換単位を意味する。適応的変換単位に関する情報は、符号化時にヘッダー情報に記録され、オーディオ信号を周波数領域から時間領域へ逆変換する際にヘッダー情報から検出される。
ステップS904の後、検出した適応的変換単位に関する情報を利用して、オーディオデータを適応的変換単位により逆量子化した周波数領域のオーディオ信号を再び時間領域の信号に逆変換する(S906)。本実施形態では、“0”以外のウィンドウ係数を利用して符号化した周波数領域のオーディオデータを適応的変換単位で時間領域のオーディオ信号に逆変換する。
以下、図面を参照しつつ、本実施形態に係わるオーディオ信号の逆変換装置について説明する。
図20は、本実施形態に係わるオーディオ信号の逆変換装置100について説明するためのブロック図である。
オーディオ信号の逆変換装置100は、時間領域逆変換部1000から構成される。
時間領域逆変換部1000は、“0”以外のウィンドウ係数を使用して符号化した周波数領域のオーディオデータを再び時間領域の信号に逆変換する。
以下、図20に示すオーディオ信号の逆変換装置の変形例について説明する。
図21は、オーディオ信号の逆変換装置100’を説明するためのブロック図である。
オーディオ信号の逆変換装置100’は、変換単位情報検出部1100及び時間領域逆変換部1120から構成される。
変換単位情報検出部1100は、オーディオデータからオーディオ信号を周波数領域に変換する際に利用した適応的変換単位に関する情報を検出し、検出した情報を時間領域逆変換部1120に出力する。なお、適応的変換単位とは、前述の通り、オーディオ信号を時間領域から周波数領域へ変換する際に、オーディオ信号の急激な変化の程度に応じて適応的に決定する変換単位を意味する。適応的変換単位に関する情報は、符号化時にヘッダー情報に記録され、オーディオ信号を周波数領域から時間領域へ逆変換する際にヘッダー情報から検出する。
時間領域逆変換部1120は、検出した適応的変換単位に関する情報を利用して、オーディオデータを適応的変換単位で逆変換する。具体的には、時間領域逆変換部1120は、周波数領域のオーディオ信号を適応的変換単位で再び時間領域の信号に変換する。このとき、時間領域逆変換部1120は、“0”以外のウィンドウ係数を利用して、周波数領域に変換したビット列により生成したオーディオデータを適応的変換単位で時間領域に逆変換することを特徴とする。
以下、図面を参照しつつ、本実施形態に係わるオーディオ信号の適応的復号化装置について説明する。
図22は、本実施形態に係わるオーディオ信号の適応的復号化装置120を説明するためのブロック図である。
オーディオ信号の適応的復号化装置120は、復号化部1200、逆量子化部1220、変換単位情報検出部1240及び時間領域逆変換部1260から構成される。
復号化部1200は、符号化したオーディオデータを復号化し、この復号化した結果を逆量子化部1220に出力する。復号化部1200は、受信したビット列について符号化部750での逆過程を行う。復号化部1200は、受信したビット列が無損失符号化されている場合は、算術復号化方法により復号化するか、またはハフマン復号化方法により無損失復号化する。
次に、逆量子化部1220は、復号化部1200で復号化したオーディオデータを逆量子化し、この逆量子化した結果を変換単位情報検出部1240に出力する。逆量子化部1220は、復号化したオーディオデータを量子化する前の本来のサイズの信号に復元する。
続いて、変換単位情報検出部1240は、オーディオデータからオーディオ信号を周波数領域に変換する際に利用した適応的変換単位に関する情報を検出し、検出した情報を時間領域逆変換部1260に出力する。符号化するときに適応的変換単位に関する情報がオーディオデータのヘッダー情報に記録されている場合は、変換単位情報検出部1240は、ヘッダー情報からこの適応的変換単位に関する情報を検出する。
さらに、時間領域逆変換部1260では、検出した適応的変換単位に関する情報を利用して、オーディオデータを適応的変換単位で時間領域に逆変換する。具体的には、時間領域逆変換部1260は、オーディオ信号を適応的変換単位で周波数領域から再び時間領域の信号に変換する。本実施形態に係わる時間領域逆変換部1260は、“0”以外のウィンドウ係数を利用して、周波数領域に変換し、ビット列により生成したオーディオデータを適応的変換単位で逆変換することを特徴とする。
上述の通り、本発明に係わるオーディオ信号の変換方法及び変換装置、オーディオ信号の適応的符号化方法及び適応的符号化装置、オーディオ信号の逆変換方法及び逆変換装置、オーディオ信号の適応的復号化方法及び適応的復号化装置を、添付の図面を参照しつつ実施形態に従って説明したが、これは、本発明の理解を容易にするために例示したに過ぎず、当業者ならば、本発明に係わる実施形態から、多様な変形及び均等な他の実施形態を想到することが可能であることは理解に難くない。したがって、本発明の真の技術的保護範囲は、特許請求の範囲によって決まるべきである。
本発明は、オーディオ信号処理に関連した技術分野に好適に適用することができる。
従来技術で使用されるフレームタイプ及びそれに対応するウィンドウ係数の一例を示す図である “0”のウィンドウイング係数が存在する場合に、オーディオ信号をウィンドウイングによって周波数領域へ変換したときの波形グラフである。 本発明の実施形態に係わるオーディオ信号の変換方法を説明するためのフローチャートである。 本実施形態に係るオーディオ信号の変換方法において使用される多様なフレームタイプの一例を示す図である。 図3に示すステップS12を説明するためのフローチャートである。 本実施形態に係るオーディオ信号の変換方法を説明するためのフローチャートである。 図6に示すステップS50においてフィルタリングしたオーディオ信号の一例を示す図である。 図6に示すステップS52を説明するためのフローチャートである。 図8に示すステップS74を説明するためのフローチャートである。 図6に示すステップS54を説明するためのフローチャートである。 本実施形態に係るオーディオ信号の適応的符号化方法を説明するためのフローチャートである。 本実施形態に係るオーディオ信号の変換装置を説明するためのブロック図である。 図12に示す周波数領域変換部を説明するためのブロック図である。 本実施形態に係るオーディオ信号の変換装置を説明するためのブロック図である。 図14に示す適応的変換単位決定部を説明するためのブロック図である。 図14に示す周波数領域変換部を説明するためのブロック図である。 本実施形態に係るオーディオ信号の適応的符号化装置を説明するためのブロック図である。 本実施形態に係るオーディオ信号の逆変換方法を説明するためのフローチャートである。 本実施形態に係るオーディオ信号の適応的な復号化方法を説明するためのフローチャートである。 本実施形態に係るオーディオ信号の逆変換装置を説明するためのブロック図である。 本実施形態に係るオーディオ信号の逆変換装置を説明するためのブロック図である。 本実施形態に係るオーディオ信号の適応的復号化装置を説明するためのブロック図である。

Claims (25)

  1. (a)オーディオ信号を周波数領域に変換するための変換単位を決定するステップと、
    (b)前記決定した変換単位により、“0”以外のウィンドウ係数を利用して、前記オーディオ信号を時間領域から周波数領域に変換するステップと、
    を含むことを特徴とするオーディオ信号の変換方法。
  2. 前記(b)ステップは、
    (b1)前記決定した変換単位により、前記オーディオ信号を“0”以外のウィンドウ係数を利用してウィンドウイングするステップと、
    (b2)前記ウィンドウイングしたオーディオ信号を周波数領域に変換するステップと、
    を含むことを特徴とする請求項1に記載のオーディオ信号の変換方法。
  3. (a)オーディオ信号を所定のサンプル単位にフィルタリングするステップと、
    (b)前記オーディオ信号の大きさが所定の閾値を超える時点に応じて、前記オーディオ信号を周波数領域に変換するための適応的変換単位を決定するステップと、
    (c)前記決定した適応的変換単位により、前記オーディオ信号を前記周波数領域に変換するステップと、
    を含むことを特徴とするオーディオ信号の変換方法。
  4. 前記(b)ステップは、
    (b1)前記適応的変換単位をフレームとするときに、前記フィルタリングしたオーディオ信号の変化程度に応じて急激変化係数を算出するステップと、
    (b2)前記急激変化係数が前記所定の閾値を超えるか否かによって、前記オーディオ信号の急激変化開始長を算出するステップと、
    (b3)前記算出した急激変化開始長を、フレームタイプのいずれか2つの長さを合算した値と比較して、適応的変換単位として前記フレームタイプを決定するステップと、
    を含むことを特徴とする請求項3に記載のオーディオ信号の変換方法。
  5. 前記(b3)ステップは、
    前記フレームタイプとして最長フレーム、長フレーム、短フレーム及び最短フレームを含むことを特徴とする請求項4に記載のオーディオ信号の変換方法。
  6. 前記(b3)ステップは、
    (b31)前記算出した急激変換開始長が、前記最長フレーム及び前記最短フレームの長さを合算した値以上であるか否かを判定するステップと、
    (b32)前記算出した急激変化開始長が、前記最長フレーム及び前記最短フレームの長さを合算した値以上である場合は、前記オーディオ信号の変換を行った前フレームが前記最短フレームであるか否かを判定するステップと、
    (b33)前記前フレームが前記最短フレームでない場合は、前記最長フレームを、前記オーディオ信号を周波数領域へ変換するための前記フレームタイプに決定するステップと、
    (b34)前記前フレームが前記最短フレームであれば、前記長フレームを、前記オーディオ信号を周波数領域へ変換するための前記フレームタイプに決定するステップと、
    (b35)前記算出した急激変化開始長が、前記最長フレーム及び前記最短フレームの長さを合算した値より小さい場合は、前記算出した急激変化開始長が、前記長フレーム及び前記最短フレームの長さを合算した値以上であるかを判定するステップと、
    (b36)前記算出した急激変化開始長が、前記長フレーム及び前記最短フレームの長さを合算した値以上である場合は、前記長フレームを、前記オーディオ信号を周波数領域へ変換するための前記フレームタイプに決定するステップと、
    (b37)前記算出した急激変化開始長が、前記長フレーム及び前記最短フレームの長さを合算した値より小さい場合は、前記算出した急激変化開始長が、前記短フレーム及び前記最短フレームの長さを合算した値以上であるかを判定するステップと、
    (b38)前記算出した急激変化開始長が、前記短フレーム及び前記最短フレームの長さを合算した値以上である場合は、前記短フレームを、前記オーディオ信号を周波数領域へ変換するための前記フレームタイプに決定するステップと、
    (b39)前記算出した急激変化開始長が、前記短フレーム及び前記最短フレームの長さを合算した値より小さい場合は、前記最短フレームを、前記オーディオ信号を周波数領域へ変換するための前記フレームタイプに決定するステップと、
    を含むことを特徴とする請求項5に記載のオーディオ信号の変換方法。
  7. 前記(c)ステップは、
    (c1)前記決定した適応的変換単位により、前記オーディオ信号を、“0”以外のウィンドウ係数を利用してウィンドウイングするステップと、
    (c2)前記ウィンドウイングしたオーディオ信号を周波数領域に変換するステップと、
    を含むことを特徴とする請求項3に記載のオーディオ信号の変換方法。
  8. (a)オーディオ信号を所定のサンプル単位にフィルタリングするステップと、
    (b)前記オーディオ信号の大きさが所定の閾値を超える時点に応じて、前記オーディオ信号を周波数領域に変換するための適応的変換単位を決定するステップと、
    (c)前記決定した適応的変換単位により、前記オーディオ信号を前記周波数領域に変換するステップと、
    (d)前記周波数領域に変換したオーディオ信号を量子化するステップと、
    (e)前記量子化したオーディオ信号を符号化するステップと、
    を含むことを特徴とするオーディオ信号の適応的符号化方法。
  9. オーディオ信号を周波数領域に変換するための変換単位を決定する変換単位決定部と、
    前記決定した変換単位により、“0”以外のウィンドウ係数を利用して前記オーディオ信号を時間領域から周波数領域に変換する周波数領域変換部と、
    を備えることを特徴とするオーディオ信号の変換装置。
  10. 前記周波数領域変換部は、
    前記決定した変換単位により、前記オーディオ信号を、“0”以外のウィンドウ係数を利用してウィンドウイングするウィンドウイング部と、
    前記ウィンドウイングしたオーディオ信号を周波数領域に変換する信号変換部と、
    を備えることを特徴とする請求項9に記載のオーディオ信号の変換装置。
  11. オーディオ信号を所定のサンプル単位にフィルタリングするフィルタリング部と、
    前記フィルタリングしたオーディオ信号の大きさが所定の閾値を超える時点に応じて、前記オーディオ信号を周波数領域に変換するための適応的変換単位を決定する適応的変換単位決定部と、
    前記決定した適応的変換単位により、前記オーディオ信号を前記周波数領域に変換する周波数領域変換部と、
    を備えることを特徴とするオーディオ信号の変換装置。
  12. 前記適応的変換単位決定部は、
    前記適応的変換単位をフレームにするときに、前記フィルタリングしたオーディオ信号の変化程度による急激変化係数を算出する急激変化係数算出部と、
    前記急激変化係数が前記所定の閾値を超えるか否かによって、前記オーディオ信号の急激変化開始長を算出する長さ検出部と、
    前記算出した急激変化開始長を、フレームタイプのいずれか2つの長さを合算した値と比較して、前記フレームタイプを決定するフレームタイプ決定部と、
    を備えることを特徴とする請求項11に記載のオーディオ信号の変換装置。
  13. 前記フレームタイプ決定部は、
    前記フレームタイプとして最長フレーム、長フレーム、短フレーム及び最短フレームのうち、何れか1つを決定することを特徴とする請求項12に記載のオーディオ信号の変換装置。
  14. 前記周波数領域変換部は、
    前記決定した適応的変換単位により、前記オーディオ信号を、“0”以外のウィンドウ係数を利用してウィンドウイングするウィンドウイング部と、
    前記ウィンドウイングしたオーディオ信号を周波数領域に変換する信号変換部と、を備えることを特徴とする請求項11に記載のオーディオ信号の変換装置。
  15. オーディオ信号を所定のサンプル単位にフィルタリングするフィルタリング部と、
    前記フィルタリングしたオーディオ信号の大きさが所定の閾値を超える時点に応じて、前記オーディオ信号を周波数領域に変換するための適応的変換単位を決定する適応的変換単位決定部と、
    前記決定した適応的変換単位により、前記オーディオ信号を前記周波数領域に変換する周波数領域変換部と、
    前記周波数領域に変換したオーディオ信号を量子化する量子化部と、
    前記量子化したオーディオ信号のビット率を調節するビット率調節部と、
    前記量子化したオーディオ信号を符号化する符号化部と、
    を備えることを特徴とするオーディオ信号の適応的符号化装置。
  16. “0”以外のウィンドウ係数を利用してウィンドウイングを行い、周波数領域に変換してビット列を生成したオーディオデータを時間領域へ逆変換するステップを含むことを特徴とするオーディオ信号の逆変換方法。
  17. (a)オーディオデータから、オーディオ信号を周波数領域に変換するときに用いた適応的変換単位に関する情報を検出するステップと、
    (b)前記検出した適応的変換単位に関する情報を利用して、前記オーディオデータを前記検出した適応的変換単位により時間領域へ逆変換するステップと、
    を含むことを特徴とするオーディオ信号の逆変換方法。
  18. 前記(b)ステップは、
    “0”以外のウィンドウ係数を利用してウィンドウイングを行い、周波数領域に変換してビット列を生成したオーディオデータを前記検出した適応的変換単位により時間領域へ逆変換することを特徴とする請求項17に記載のオーディオ信号の逆変換方法。
  19. (a)符号化したオーディオデータを復号化するステップと、
    (b)前記復号化したオーディオデータを逆量子化するステップと、
    (c)前記逆量子化したオーディオデータから、オーディオ信号を周波数領域に変換するときに用いた適応的変換単位に関する情報を検出するステップと、
    (d)前記検出した適応的変換単位に関する情報を利用して、前記オーディオデータを前記検出した適応的変換単位により時間領域へ逆変換するステップと、
    を含むことを特徴とするオーディオ信号の適応的復号化方法。
  20. 前記(d)ステップは、
    “0”以外のウィンドウ係数を利用してウィンドウイングを行い、周波数領域に変換してビット列を生成したオーディオデータを前記検出した適応的変換単位により時間領域へ逆変換することを特徴とする請求項19に記載のオーディオ信号の適応的復号化方法。
  21. “0”以外のウィンドウ係数を利用してウィンドウイングを行い、周波数領域に変換してビット列を生成したオーディオデータを時間領域へ逆変換する時間領域逆変換部を備えることを特徴とするオーディオ信号の逆変換装置。
  22. オーディオデータから、オーディオ信号を周波数領域に変換するときに用いた適応的変換単位に関する情報を検出する変換単位情報検出部と、
    前記検出した適応的変換単位に関する情報を利用して、前記オーディオデータを前記検出した適応的変換単位により時間領域へ逆変換する時間領域逆変換部と、
    を備えることを特徴とするオーディオ信号の逆変換装置。
  23. 前記時間領域逆変換部は、
    “0”以外のウィンドウ係数を利用してウィンドウイングを行い、周波数領域に変換してビット列を生成したオーディオデータを前記検出した適応的変換単位により時間領域へ逆変換することを特徴とする請求項22に記載のオーディオ信号の逆変換装置。
  24. 符号化したオーディオデータを復号化する復号化部と、
    前記復号化したデータを逆量子化する逆量子化部と、
    前記逆量子化したオーディオデータから、オーディオ信号を周波数領域に変換するときに用いた適応的変換単位に関する情報を検出する変換単位情報検出部と、
    前記検出した適応的変換単位に関する情報を利用して、前記オーディオデータを前記検出した適応的変換単位により時間領域へ逆変換する時間領域逆変換部と、
    を備えることを特徴とするオーディオ信号の適応的復号化装置。
  25. 前記時間領域逆変換部は、
    “0”以外のウィンドウ係数を利用してウィンドウイングを行い、周波数領域に変換してビット列を生成したオーディオデータを前記検出した適応的変換単位により時間領域へ逆変換することを特徴とする請求項24に記載のオーディオ信号の適応的復号化装置。
JP2005352938A 2004-12-07 2005-12-07 オーディオ信号の変換方法及び変換装置、オーディオ信号の適応的符号化方法及び適応的符号化装置 Expired - Fee Related JP5583881B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2004-0102303 2004-12-07
KR1020040102303A KR100668319B1 (ko) 2004-12-07 2004-12-07 오디오 신호의 변환방법 및 장치와 오디오 신호에적응적인 부호화방법 및 장치, 오디오 신호의 역변환 방법및 장치와 오디오 신호에 적응적인 복호화 방법 및 장치

Publications (2)

Publication Number Publication Date
JP2006163414A true JP2006163414A (ja) 2006-06-22
JP5583881B2 JP5583881B2 (ja) 2014-09-03

Family

ID=35589631

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005352938A Expired - Fee Related JP5583881B2 (ja) 2004-12-07 2005-12-07 オーディオ信号の変換方法及び変換装置、オーディオ信号の適応的符号化方法及び適応的符号化装置

Country Status (5)

Country Link
US (1) US8086446B2 (ja)
EP (1) EP1669982A3 (ja)
JP (1) JP5583881B2 (ja)
KR (1) KR100668319B1 (ja)
CN (1) CN1787383B (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101435893B1 (ko) * 2006-09-22 2014-09-02 삼성전자주식회사 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치
KR20080053739A (ko) * 2006-12-11 2008-06-16 삼성전자주식회사 적응적으로 윈도우 크기를 적용하는 부호화 장치 및 방법
CN101308655B (zh) * 2007-05-16 2011-07-06 展讯通信(上海)有限公司 一种音频编解码方法与装置
KR101235830B1 (ko) * 2007-12-06 2013-02-21 한국전자통신연구원 음성코덱의 품질향상장치 및 그 방법
WO2010003563A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding audio samples
WO2010058931A2 (en) * 2008-11-14 2010-05-27 Lg Electronics Inc. A method and an apparatus for processing a signal
US20110087494A1 (en) * 2009-10-09 2011-04-14 Samsung Electronics Co., Ltd. Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme
CN103854653B (zh) 2012-12-06 2016-12-28 华为技术有限公司 信号解码的方法和设备
WO2014128194A1 (en) 2013-02-20 2014-08-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an encoded signal or for decoding an encoded audio signal using a multi overlap portion
EP2830058A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frequency-domain audio coding supporting transform length switching
KR102231756B1 (ko) * 2013-09-05 2021-03-30 마이클 안토니 스톤 오디오 신호의 부호화, 복호화 방법 및 장치
US10984808B2 (en) * 2019-07-09 2021-04-20 Blackberry Limited Method for multi-stage compression in sub-band processing

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002536681A (ja) * 1999-01-28 2002-10-29 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 適応性のあるブロック長符号化システムのためのデータ構成

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1203906A (en) 1982-10-21 1986-04-29 Tetsu Taguchi Variable frame length vocoder
DE3902948A1 (de) * 1989-02-01 1990-08-09 Telefunken Fernseh & Rundfunk Verfahren zur uebertragung eines signals
DE69028176T2 (de) * 1989-11-14 1997-01-23 Nec Corp Adaptive Transformationskodierung durch optimale Blocklängenselektion in Abhängigkeit von Unterschieden zwischen aufeinanderfolgenden Blöcken
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
JP3531177B2 (ja) * 1993-03-11 2004-05-24 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法
US5960390A (en) * 1995-10-05 1999-09-28 Sony Corporation Coding method for using multi channel audio signals
US5848391A (en) * 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
KR100234264B1 (ko) * 1997-04-15 1999-12-15 윤종용 타겟윈도우 이동을 통한 블록 매칭방법
DE19736669C1 (de) * 1997-08-22 1998-10-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erfassen eines Anschlags in einem zeitdiskreten Audiosignal sowie Vorrichtung und Verfahren zum Codieren eines Audiosignals
DE19921122C1 (de) * 1999-05-07 2001-01-25 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals
US7127390B1 (en) * 2000-02-08 2006-10-24 Mindspeed Technologies, Inc. Rate determination coding
JP4021124B2 (ja) * 2000-05-30 2007-12-12 株式会社リコー デジタル音響信号符号化装置、方法及び記録媒体
JP2002076904A (ja) 2000-09-04 2002-03-15 Victor Co Of Japan Ltd 符号化されたオーディオ信号の復号化方法、及び符号化されたオーディオ信号の復号化装置
US7460993B2 (en) * 2001-12-14 2008-12-02 Microsoft Corporation Adaptive window-size selection in transform coding
KR100477649B1 (ko) 2002-06-05 2005-03-23 삼성전자주식회사 다양한 프레임 사이즈를 지원하는 정수 코딩 방법 및 그를적용한 코덱 장치
EP1394772A1 (en) * 2002-08-28 2004-03-03 Deutsche Thomson-Brandt Gmbh Signaling of window switchings in a MPEG layer 3 audio data stream
TW594674B (en) * 2003-03-14 2004-06-21 Mediatek Inc Encoder and a encoding method capable of detecting audio signal transient
US7283968B2 (en) * 2003-09-29 2007-10-16 Sony Corporation Method for grouping short windows in audio encoding
US7325023B2 (en) * 2003-09-29 2008-01-29 Sony Corporation Method of making a window type decision based on MDCT data in audio encoding
KR100651731B1 (ko) * 2003-12-26 2006-12-01 한국전자통신연구원 가변 프레임 음성 부호화/복호화 장치 및 그 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002536681A (ja) * 1999-01-28 2002-10-29 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 適応性のあるブロック長符号化システムのためのデータ構成

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN7011002396; '3rd Generation Partnership Project;Technical Specification Group Service and System Aspects;Audio co' [online] , 20040930, 3GPP Organizational Partners (ARIB, ATIS, CCSA, ET *

Also Published As

Publication number Publication date
EP1669982A2 (en) 2006-06-14
KR20060063198A (ko) 2006-06-12
CN1787383A (zh) 2006-06-14
JP5583881B2 (ja) 2014-09-03
US20060122825A1 (en) 2006-06-08
EP1669982A3 (en) 2008-08-27
CN1787383B (zh) 2012-02-29
US8086446B2 (en) 2011-12-27
KR100668319B1 (ko) 2007-01-12

Similar Documents

Publication Publication Date Title
JP5583881B2 (ja) オーディオ信号の変換方法及び変換装置、オーディオ信号の適応的符号化方法及び適応的符号化装置
EP2282310B1 (en) Entropy coding by adapting coding between level and run-length/level modes
JP5688861B2 (ja) レベル・モードとラン・レングス/レベル・モードの間での符号化を適応させるエントロピー符号化
US7433824B2 (en) Entropy coding by adapting coding between level and run-length/level modes
CA2838170C (en) Audio-encoding method and apparatus, audio-decoding method and apparatus, recoding medium thereof, and multimedia device employing same
TWI779381B (zh) 用於解碼高階保真立體音響表示之方法、裝置及非暫態電腦可讀取儲存媒體
RU2630887C2 (ru) Звуковые кодирующее устройство и декодирующее устройство
US20070168186A1 (en) Audio coding apparatus, audio decoding apparatus, audio coding method and audio decoding method
JP4533386B2 (ja) オーディオ符号化装置及びオーディオ符号化方法
JP2000151413A (ja) オーディオ符号化における適応ダイナミック可変ビット割り当て方法
JP4091506B2 (ja) 2段音声画像符号化方法、その装置及びプログラム及びこのプログラムを記録した記録媒体
WO2003056546A1 (en) Signal coding apparatus, signal coding method, and program
JP4848049B2 (ja) 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
JP3886851B2 (ja) オーディオ信号符号化装置
JP6712643B2 (ja) サンプル列変形装置、信号符号化装置、信号復号装置、サンプル列変形方法、信号符号化方法、信号復号方法、およびプログラム

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20061114

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20061129

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080801

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110705

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111005

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111011

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111205

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120105

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120731

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121030

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20121030

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130131

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130507

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130807

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130812

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131107

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20131210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140410

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20140418

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140617

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140717

R150 Certificate of patent or registration of utility model

Ref document number: 5583881

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees