JP2010078915A - オーディオ復号方法、装置、及びプログラム - Google Patents
オーディオ復号方法、装置、及びプログラム Download PDFInfo
- Publication number
- JP2010078915A JP2010078915A JP2008247213A JP2008247213A JP2010078915A JP 2010078915 A JP2010078915 A JP 2010078915A JP 2008247213 A JP2008247213 A JP 2008247213A JP 2008247213 A JP2008247213 A JP 2008247213A JP 2010078915 A JP2010078915 A JP 2010078915A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- distortion
- stereo
- decoded
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 93
- 238000012937 correction Methods 0.000 claims abstract description 95
- 230000005236 sound signal Effects 0.000 claims abstract description 41
- 238000004458 analytical method Methods 0.000 claims abstract description 34
- 238000001514 detection method Methods 0.000 claims description 69
- 238000009499 grossing Methods 0.000 claims description 19
- 238000001228 spectrum Methods 0.000 abstract description 57
- 238000006243 chemical reaction Methods 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 34
- 238000010586 diagram Methods 0.000 description 18
- 238000012545 processing Methods 0.000 description 12
- 230000003595 spectral effect Effects 0.000 description 6
- 238000000926 separation method Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 3
- 230000006866 deterioration Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000007639 printing Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
Abstract
【解決手段】復号音分析部104は、PS復号部103にて復号された周波数域ステレオ復号信号L(b) とR(b)とについて、復号された音声信号から新たに、第2類似度109と第2強度差110を算出する。スペクトル補正部105は、復号側にて算出された第2類似度109及び第2強度差110を、符号化側にて算出され伝送されてきた第1類似度107及び第1強度差108と比較することにより、パラメトリックステレオ化によって付加された歪みを検出し、周波数域ステレオ復号信号L(b) とR(b) のスペクトルを補正する。
【選択図】図1
Description
ここで、c1 x(t)は#1のマイク1501に到達する直接波、c2 h(t)*x(t) は部屋の壁等で反射してから#1のマイク1501に到達する反射波である。ここでtは時間であり、h(t) は部屋の伝達特性を表すインパルス応答である。また、記号「* 」は畳み込み演算を表し、c1 及びc2 はゲインである。同様にして、c3 x(t) は#2のマイク1501に到達する直接波であり、c4 h(t)*x(t) は#2のマイク1501に到達する反射波である。従って、#1及び#2のマイク1501で録音される信号をそれぞれ、l(t),r(t) とすると、l(t) とr(t) は次式のように直接波と反射波の線形和で表すことができる。
まず、データ分離部1901は、受信される入力データを、コア符号化データとPSデータに分離する。
Audio Coding )方式やSBR(Spectral Band Replication )方式などの従来のオーディオ符号化・復号方式に基づくものを用いることができる。
PS復号部1903は、PSデータの情報に基づいて、モノラル信号S(b) を周波数域ステレオ復号信号L(b) とR(b) に変換する。
図16の説明において前述した原理に基づいて、モノラル信号S(b) に対して、遅延付加部2001にて遅延が付加され、非相関化部2002によって非相関化されることによ
り、残響成分D(b) が作成される。
ステレオ信号生成部2005は、モノラル信号S(b) と残響成分D(b) と上記係数行列Hとに基づいて、前述の数11式と等価な下記数12式により、ステレオ信号L(b) とR(b) を生成する。
号補助情報とに基づいて元音声信号を再現する音声復号方式において、音質の劣化を低減させることにある。
歪み補正手段(105、504)は、第2の復号音声信号において、歪み検出ステップにて検出された歪みを補正する。
原理説明
まず、本実施形態の原理について説明する。図1は、パラメトリックステレオ復号装置の実施形態の原理構成図、図2は、その概略動作を示す動作フローチャートである。以下の説明では、随時、図1の101〜110の各部と、図2のステップS201〜S206を参照するものとする。
分である。
周波数時間(F/T)変換部106(L)及び106(R)はそれぞれ、スペクトル補正されたLチャネル周波数域復号信号及びRチャネル周波数域復号信号を、Lチャネル時間域復号信号L(t) 及びRチャネル時間域復号信号R(t)に変換する(S206)。この構成は、図19の従来技術における周波数時間変換部1904(L)及び1904(R)と同じ構成である。
上述の原理構成に基づく第1の実施形態について、以下に説明する。
図5は、図1の原理構成に基づくパラメトリックステレオ復号装置の第1の実施形態の
構成図である。
図5では、図1のコア復号部102が、AAC復号部501とSBR復号部502に具体化され、図1のスペクトル補正部105が、歪み検出部503とスペクトル補正部504に具体化されている。
まず、図5において、PS復号部103から出力されるステレオ復号信号を、Lチャネル復号信号L(b,t) 、Rチャネル復号信号R(b,t) とする。bは周波数帯域を示すインデックスであり、tは離散時間を示すインデックスである。
次に、歪み検出部503は、図7の動作フローチャートに基づいて、離散時間t毎に、周波数帯域b毎の歪み量α(b) と歪み発生チャネルch(b) の検出を行う。以下の説明では、図7のステップS701〜S712を随時参照するものとする。
まず、歪み検出部503は、図5の復号音分析部104から出力される第2強度差110の値から図5のPS復号部103から出力される第1強度差108の値を減算することにより、周波数帯域bにおける強度差の差分β(b) を算出する(ステップS704)。
図10は、図5のデータ分離部101に入力される入力データのデータフォーマット例を示す図である。
入力データは、大きく分けるとADTSヘッダ1001、モノラル音声AAC符号化データであるAACデータ1002、拡張データ領域(FILLエレメント)1003とから構成される。
次に、第2の実施形態について説明する。
第2の実施形態の構成は、スペクトル補正部504の動作以外は図5に示される第1の実施形態の構成と同一なので、その構成図は省略する。
ここで、「復号音の電力」とは、Lチャネル復号信号L(b,t) 又はRチャネル復号信号R(b,t) のうち、補正対象となったチャネルの周波数帯域bにおける電力を指す。
次に、第3の実施形態について説明する。
図12は、パラメトリックステレオ復号装置の第3の実施形態の構成図である。
図12において、図5の第1の実施形態の構成と同じ番号が付された部分は図5の場合と同じ機能を有するものとする。
最後に、第4の実施形態について説明する。
図13は、パラメトリックステレオ復号装置の第4の実施形態の構成図である。
図13の構成が図5の構成と異なる点は、時間周波数(F/T)変換部106(L)及び106(R)の代わりに、QMF処理部1301(L)及び1301(R)が使用される点である。
第1の実施形態の場合と同様に、あるフレームNの周波数帯域bにおけるLチャネルのスペクトル補正量γL (b) を計算し、スペクトルL(b,t) に対して次式により補正を行う。ここで、HE−AAC v2デコーダのQMF係数は、複素数であることに留意する。
図14は、上記第1〜第4の実施形態によって実現されるシステムを実現できるコンピュータのハードウェア構成の一例を示す図である。
可搬記録媒体駆動装置1406は、光ディスクやSDRAM、コンパクトフラッシュ(登録商標)等の可搬記録媒体1409を収容するもので、外部記憶装置1405の補助の役割を有する。
前述の第1〜第4の実施形態によるパラメトリックステレオ復号装置のシステムは、それに必要な機能を搭載したプログラムをCPU1401が実行することで実現される。そのプログラムは、例えば外部記憶装置1405や可搬記録媒体1409に記録して配布してもよく、或いはネットワーク接続装置1407によりネットワークから取得できるようにしてもよい。
(付記1)
符号化音声データから第1の復号音声信号と第1の音声復号補助情報とを復号し、該第1の復号音声信号及び第1の音声復号補助情報に基づいて第2の復号音声信号を復号する音声復号方法において、
前記第1の音声復号補助情報に対応する第2の音声復号補助情報を前記第2の復号音声信号から算出する復号音分析ステップと、
該第2の音声復号補助情報と前記第1の音声復号補助情報とを比較することにより、前記第2の復号音声信号の復号過程で生じた歪みを検出する歪み検出ステップと、
前記第2の復号音声信号において、前記歪み検出ステップにて検出された歪みを補正する歪み補正ステップと、
を含むことを特徴とするオーディオ復号方法。
(付記2)
パラメトリックステレオ方式により符号化された音声データからモノラル音声復号信号とパラメトリックステレオパラメータ情報を復号し、該モノラル音声復号信号及びパラメトリックステレオパラメータ情報に基づいてステレオ音声復号信号を復号する音声復号方法において、
前記パラメトリックステレオパラメータ情報を第1のパラメトリックステレオパラメータ情報として、それに対応する第2のパラメトリックステレオパラメータ情報を前記ステレオ音声復号信号から算出する復号音分析ステップと、
該第2のパラメトリックステレオパラメータ情報と前記第1のパラメトリックステレオパラメータ情報とを比較することにより、前記ステレオ音声復号信号の復号過程で生じた歪みを検出する歪み検出ステップと、
前記ステレオ音声復号信号において、前記歪み検出ステップにて検出された歪みを補正する歪み補正ステップと、
を含むことを特徴とするオーディオ復号方法。
(付記3)
前記パラメトリックステレオパラメータ情報はステレオ音声チャネル間の類似度を示す類似度情報であり、
前記復号音分析ステップは、前記第1のパラメトリックステレオパラメータ情報である第1の類似度情報に対応する第2の類似度情報を前記ステレオ音声復号信号から算出し、
前記歪み検出ステップは、前記第2の類似度情報と前記第1の類似度情報とを周波数帯域毎に比較することにより、前記ステレオ音声復号信号の復号過程で生じた前記周波数帯域毎の歪みを検出し、
前記歪み補正ステップは、前記ステレオ音声復号信号において、前記歪み検出ステップにて検出された前記周波数帯域毎の歪みを補正する、
ことを特徴とする付記2に記載のオーディオ復号方法。
(付記4)
前記歪み検出ステップは、前記第2の類似度情報と前記第1の類似度情報の差分から歪み量を検出する、
ことを特徴とする付記3に記載のオーディオ復号方法。
(付記5)
前記歪み補正ステップは、前記歪み量に基づいて前記歪みの補正量を決定する、
ことを特徴とする付記4に記載のオーディオ復号方法。
(付記6)
前記歪み補正ステップは、前記歪み量と前記ステレオ音声復号信号の電力とに基づいて前記歪みの補正量を決定する、
ことを特徴とする付記4に記載のオーディオ復号方法。
(付記7)
前記パラメトリックステレオパラメータ情報はステレオ音声チャネル間の類似度と強度差をそれぞれ示す類似度情報及び強度差情報であり、
前記復号音分析ステップは、前記第1のパラメトリックステレオパラメータ情報である第1の類似度情報及び第1の強度差情報に対応する第2の類似度情報及び第2の強度差情報を前記ステレオ音声復号信号から算出し、
前記歪み検出ステップは、前記第2の類似度情報と前記第1の類似度情報及び前記第2の強度差情報と前記第1の強度差情報とをそれぞれ前記周波数帯域毎に比較することにより、前記ステレオ音声復号信号の復号過程で生じた前記周波数帯域毎及び前記ステレオ音声チャネル毎の歪みを検出し、
前記歪み補正ステップは、前記ステレオ音声復号信号において、前記歪み検出ステップにて検出された前記周波数帯域毎及び前記ステレオ音声チャネル毎の歪みを補正する、
ことを特徴とする付記2に記載のオーディオ復号方法。
(付記8)
前記歪み検出ステップは、前記第2の類似度情報と前記第1の類似度情報の差分から歪み量を検出し、前記第2の強度差情報と前記第1の強度差情報の差分から歪み発生ステレオ音声チャネルを検出する、
ことを特徴とする付記7に記載のオーディオ復号方法。
(付記9)
前記歪み補正ステップは、前記歪み量に基づいて前記歪みの補正量を決定し、前記歪み発生ステレオ音声チャネルに基づいて補正を行う前記ステレオ音声チャネルを決定する、
ことを特徴とする付記8に記載のオーディオ復号方法。
(付記10)
前記歪み補正ステップは、前記歪み量と前記ステレオ音声復号信号の電力とに基づいて前記歪みの補正量を決定し、前記歪み発生ステレオ音声チャネルに基づいて補正を行う前記ステレオ音声チャネルを決定する、
ことを特徴とする付記8に記載のオーディオ復号方法。
(付記11)
前記歪み補正ステップによって補正が行われたステレオ音声復号信号を、時間軸方向又は周波数軸方向に平滑化する平滑化ステップを更に含む、
ことを特徴とする付記2乃至10の何れか1項に記載のオーディオ復号方法。
(付記12)
前記復号音分析ステップ、前記歪み検出ステップ、及び前記歪み補正ステップは、時間
周波数領域にて実行される、
ことを特徴とする付記2乃至11の何れか1項に記載のオーディオ復号方法。
(付記13)
符号化音声データから第1の復号音声信号と第1の音声復号補助情報とを復号し、該第1の復号音声信号及び第1の音声復号補助情報に基づいて第2の復号音声信号を復号する音声復号装置において、
前記第1の音声復号補助情報に対応する第2の音声復号補助情報を前記第2の復号音声信号から算出する復号音分析手段と、
該第2の音声復号補助情報と前記第1の音声復号補助情報とを比較することにより、前記第2の復号音声信号の復号過程で生じた歪みを検出する歪み検出手段と、
前記第2の復号音声信号において、前記歪み検出手段にて検出された歪みを補正する歪み補正手段と、
を含むことを特徴とするオーディオ復号装置。
(付記14)
パラメトリックステレオ方式により符号化された音声データからモノラル音声復号信号とパラメトリックステレオパラメータ情報を復号し、該モノラル音声復号信号及びパラメトリックステレオパラメータ情報に基づいてステレオ音声復号信号を復号する音声復号装置において、
前記パラメトリックステレオパラメータ情報を第1のパラメトリックステレオパラメータ情報として、それに対応する第2のパラメトリックステレオパラメータ情報を前記ステレオ音声復号信号から算出する復号音分析手段と、
該第2のパラメトリックステレオパラメータ情報と前記第1のパラメトリックステレオパラメータ情報とを比較することにより、前記ステレオ音声復号信号の復号過程で生じた歪みを検出する歪み検出手段と、
前記ステレオ音声復号信号において、前記歪み検出手段にて検出された歪みを補正する歪み補正手段と、
を含むことを特徴とするオーディオ復号装置。
(付記15)
前記パラメトリックステレオパラメータ情報はステレオ音声チャネル間の類似度を示す類似度情報であり、
前記復号音分析手段は、前記第1のパラメトリックステレオパラメータ情報である第1の類似度情報に対応する第2の類似度情報を前記ステレオ音声復号信号から算出し、
前記歪み検出手段は、前記第2の類似度情報と前記第1の類似度情報とを周波数帯域毎に比較することにより、前記ステレオ音声復号信号の復号過程で生じた前記周波数帯域毎の歪みを検出し、
前記歪み補正手段は、前記ステレオ音声復号信号において、前記歪み検出手段にて検出された前記周波数帯域毎の歪みを補正する、
ことを特徴とする付記14に記載のオーディオ復号装置。
(付記16)
前記歪み検出手段は、前記第2の類似度情報と前記第1の類似度情報の差分から歪み量を検出する、
ことを特徴とする付記15に記載のオーディオ復号装置。
(付記17)
前記歪み補正手段は、前記歪み量に基づいて前記歪みの補正量を決定する、
ことを特徴とする付記16に記載のオーディオ復号装置。
(付記18)
前記歪み補正手段は、前記歪み量と前記ステレオ音声復号信号の電力とに基づいて前記歪みの補正量を決定する、
ことを特徴とする付記16に記載のオーディオ復号装置。
(付記19)
前記パラメトリックステレオパラメータ情報はステレオ音声チャネル間の類似度と強度差をそれぞれ示す類似度情報及び強度差情報であり、
前記復号音分析手段は、前記第1のパラメトリックステレオパラメータ情報である第1の類似度情報及び第1の強度差情報に対応する第2の類似度情報及び第2の強度差情報を前記ステレオ音声復号信号から算出し、
前記歪み検出手段は、前記第2の類似度情報と前記第1の類似度情報及び前記第2の強度差情報と前記第1の強度差情報とをそれぞれ前記周波数帯域毎に比較することにより、前記ステレオ音声復号信号の復号過程で生じた前記周波数帯域毎及び前記ステレオ音声チャネル毎の歪みを検出し、
前記歪み補正手段は、前記ステレオ音声復号信号において、前記歪み検出手段にて検出された前記周波数帯域毎及び前記ステレオ音声チャネル毎の歪みを補正する、
ことを特徴とする付記14に記載のオーディオ復号装置。
(付記20)
前記歪み検出手段は、前記第2の類似度情報と前記第1の類似度情報の差分から歪み量を検出し、前記第2の強度差情報と前記第1の強度差情報の差分から歪み発生ステレオ音声チャネルを検出する、
ことを特徴とする付記17に記載のオーディオ復号装置。
(付記21)
前記歪み補正手段は、前記歪み量に基づいて前記歪みの補正量を決定し、前記歪み発生ステレオ音声チャネルに基づいて補正を行う前記ステレオ音声チャネルを決定する、
ことを特徴とする付記20に記載のオーディオ復号装置。
(付記22)
前記歪み補正手段は、前記歪み量と前記ステレオ音声復号信号の電力とに基づいて前記歪みの補正量を決定し、前記歪み発生ステレオ音声チャネルに基づいて補正を行う前記ステレオ音声チャネルを決定する、
ことを特徴とする付記20に記載のオーディオ復号装置。
(付記23)
前記歪み補正手段によって補正が行われたステレオ音声復号信号を、時間軸方向又は周波数軸方向に平滑化する平滑化手段を更に含む、
ことを特徴とする付記14乃至22の何れか1項に記載のオーディオ復号装置。
(付記24)
前記復号音分析手段、前記歪み検出手段、及び前記歪み補正手段は、時間周波数領域にて実行される、
ことを特徴とする付記14乃至23の何れか1項に記載のオーディオ復号装置。
(付記25)
符号化音声データから第1の復号音声信号と第1の音声復号補助情報とを復号し、該第1の復号音声信号及び第1の音声復号補助情報に基づいて第2の復号音声信号を復号するコンピュータに、
前記第1の音声復号補助情報に対応する第2の音声復号補助情報を前記第2の復号音声信号から算出する復号音分析機能と、
該第2の音声復号補助情報と前記第1の音声復号補助情報とを比較することにより、前記第2の復号音声信号の復号過程で生じた歪みを検出する歪み検出機能と、
前記第2の復号音声信号において、前記歪み検出機能にて検出された歪みを補正する歪み補正機能と、
を実行させるためのプログラム。
(付記26)
パラメトリックステレオ方式により符号化された音声データからモノラル音声復号信号とパラメトリックステレオパラメータ情報を復号し、該モノラル音声復号信号及びパラメトリックステレオパラメータ情報に基づいてステレオ音声復号信号を復号するコンピュータに、
前記パラメトリックステレオパラメータ情報を第1のパラメトリックステレオパラメータ情報として、それに対応する第2のパラメトリックステレオパラメータ情報を前記ステレオ音声復号信号から算出する復号音分析機能と、
該第2のパラメトリックステレオパラメータ情報と前記第1のパラメトリックステレオパラメータ情報とを比較することにより、前記ステレオ音声復号信号の復号過程で生じた歪みを検出する歪み検出機能と、
前記ステレオ音声復号信号において、前記歪み検出機能にて検出された歪みを補正する歪み補正機能と、
を実行させるためのプログラム。
(付記27)
前記パラメトリックステレオパラメータ情報はステレオ音声チャネル間の類似度を示す類似度情報であり、
前記復号音分析機能は、前記第1のパラメトリックステレオパラメータ情報である第1の類似度情報に対応する第2の類似度情報を前記ステレオ音声復号信号から算出し、
前記歪み検出機能は、前記第2の類似度情報と前記第1の類似度情報とを周波数帯域毎に比較することにより、前記ステレオ音声復号信号の復号過程で生じた前記周波数帯域毎の歪みを検出し、
前記歪み補正機能は、前記ステレオ音声復号信号において、前記歪み検出機能にて検出された前記周波数帯域毎の歪みを補正する、
ことを特徴とする付記26に記載のプログラム。
(付記28)
前記歪み検出機能は、前記第2の類似度情報と前記第1の類似度情報の差分から歪み量を検出する、
ことを特徴とする付記27に記載のプログラム。
(付記29)
前記歪み補正機能は、前記歪み量に基づいて前記歪みの補正量を決定する、
ことを特徴とする付記28に記載のプログラム。
(付記30)
前記歪み補正機能は、前記歪み量と前記ステレオ音声復号信号の電力とに基づいて前記歪みの補正量を決定する、
ことを特徴とする付記28に記載のプログラム。
(付記31)
前記パラメトリックステレオパラメータ情報はステレオ音声チャネル間の類似度と強度差をそれぞれ示す類似度情報及び強度差情報であり、
前記復号音分析機能は、前記第1のパラメトリックステレオパラメータ情報である第1の類似度情報及び第1の強度差情報に対応する第2の類似度情報及び第2の強度差情報を前記ステレオ音声復号信号から算出し、
前記歪み検出機能は、前記第2の類似度情報と前記第1の類似度情報及び前記第2の強度差情報と前記第1の強度差情報とをそれぞれ前記周波数帯域毎に比較することにより、前記ステレオ音声復号信号の復号過程で生じた前記周波数帯域毎及び前記ステレオ音声チャネル毎の歪みを検出し、
前記歪み補正機能は、前記ステレオ音声復号信号において、前記歪み検出機能にて検出された前記周波数帯域毎及び前記ステレオ音声チャネル毎の歪みを補正する、
ことを特徴とする付記26に記載のプログラム。
(付記32)
前記歪み検出機能は、前記第2の類似度情報と前記第1の類似度情報の差分から歪み量を検出し、前記第2の強度差情報と前記第1の強度差情報の差分から歪み発生ステレオ音声チャネルを検出する、
ことを特徴とする付記29に記載のプログラム。
(付記33)
前記歪み補正機能は、前記歪み量に基づいて前記歪みの補正量を決定し、前記歪み発生ステレオ音声チャネルに基づいて補正を行う前記ステレオ音声チャネルを決定する、
ことを特徴とする付記32に記載のプログラム。
(付記34)
前記歪み補正機能は、前記歪み量と前記ステレオ音声復号信号の電力とに基づいて前記歪みの補正量を決定し、前記歪み発生ステレオ音声チャネルに基づいて補正を行う前記ステレオ音声チャネルを決定する、
ことを特徴とする付記32に記載のプログラム。
(付記35)
前記歪み補正機能によって補正が行われたステレオ音声復号信号を、時間軸方向又は周波数軸方向に平滑化する平滑化機能を更に含む、
ことを特徴とする付記26乃至34の何れか1項に記載のプログラム。
(付記36)
前記復号音分析機能、前記歪み検出機能、及び前記歪み補正機能は、時間周波数領域にて実行される、
ことを特徴とする付記26乃至35の何れか1項に記載のプログラム。
102、1902 コア復号部
103、1903 PS復号部
104 復号音分析部
105、504 スペクトル補正部
106(L)、106(R)、1904(L)、1904(R) 周波数時間(F/T
)変換部
107 第1類似度
108 第1強度差
109 第2類似度
110 第2強度差
501 AAC復号部
502 SBR復号部
503 歪み検出部
504 スペクトル補正部
1001 ADTSヘッダ
1002 AACデータ
1003 FILLエレメント
1004 SBRデータ
1005 sbr_extension
1006 PSデータ
1201 スペクトル保持部
1202 スペクトル平滑化部
1301(L)及び1301(R) QMF処理部
1401 CPU
1402 メモリ
1403 入力装置
1404 出力装置
1405 外部記憶装置
1406 可搬記録媒体駆動装置
1407 ネットワーク接続装置
1408 バス
1409 可搬記録媒体
1501 マイク
2001 遅延付加部
2002 非相関化部
2003 PS解析部
2004 係数計算部
2005 ステレオ信号生成部
Claims (10)
- 符号化音声データから第1の復号音声信号と第1の音声復号補助情報とを復号し、該第1の復号音声信号及び第1の音声復号補助情報に基づいて第2の復号音声信号を復号する音声復号方法において、
前記第1の音声復号補助情報に対応する第2の音声復号補助情報を前記第2の復号音声信号から算出する復号音分析ステップと、
該第2の音声復号補助情報と前記第1の音声復号補助情報とを比較することにより、前記第2の復号音声信号の復号過程で生じた歪みを検出する歪み検出ステップと、
前記第2の復号音声信号において、前記歪み検出ステップにて検出された歪みを補正する歪み補正ステップと、
を含むことを特徴とするオーディオ復号方法。 - パラメトリックステレオ方式により符号化された音声データからモノラル音声復号信号とパラメトリックステレオパラメータ情報を復号し、該モノラル音声復号信号及びパラメトリックステレオパラメータ情報に基づいてステレオ音声復号信号を復号する音声復号方法において、
前記パラメトリックステレオパラメータ情報を第1のパラメトリックステレオパラメータ情報として、それに対応する第2のパラメトリックステレオパラメータ情報を前記ステレオ音声復号信号から算出する復号音分析ステップと、
該第2のパラメトリックステレオパラメータ情報と前記第1のパラメトリックステレオパラメータ情報とを比較することにより、前記ステレオ音声復号信号の復号過程で生じた歪みを検出する歪み検出ステップと、
前記ステレオ音声復号信号において、前記歪み検出ステップにて検出された歪みを補正する歪み補正ステップと、
を含むことを特徴とするオーディオ復号方法。 - 前記パラメトリックステレオパラメータ情報はステレオ音声チャネル間の類似度と強度差をそれぞれ示す類似度情報及び強度差情報であり、
前記復号音分析ステップは、前記第1のパラメトリックステレオパラメータ情報である第1の類似度情報及び第1の強度差情報に対応する第2の類似度情報及び第2の強度差情報を前記ステレオ音声復号信号から算出し、
前記歪み検出ステップは、前記第2の類似度情報と前記第1の類似度情報及び前記第2の強度差情報と前記第1の強度差情報とをそれぞれ前記周波数帯域毎に比較することにより、前記ステレオ音声復号信号の復号過程で生じた前記周波数帯域毎及び前記ステレオ音声チャネル毎の歪みを検出し、
前記歪み補正ステップは、前記ステレオ音声復号信号において、前記歪み検出ステップにて検出された前記周波数帯域毎及び前記ステレオ音声チャネル毎の歪みを補正する、
ことを特徴とする請求項2に記載のオーディオ復号方法。 - 前記歪み検出ステップは、前記第2の類似度情報と前記第1の類似度情報の差分から歪み量を検出し、前記第2の強度差情報と前記第1の強度差情報の差分から歪み発生ステレオ音声チャネルを検出する、
ことを特徴とする請求項3に記載のオーディオ復号方法。 - 前記歪み補正ステップは、前記歪み量に基づいて前記歪みの補正量を決定し、前記歪み発生ステレオ音声チャネルに基づいて補正を行う前記ステレオ音声チャネルを決定する、
ことを特徴とする請求項4に記載のオーディオ復号方法。 - 前記歪み補正ステップは、前記歪み量と前記ステレオ音声復号信号の電力とに基づいて
前記歪みの補正量を決定し、前記歪み発生ステレオ音声チャネルに基づいて補正を行う前記ステレオ音声チャネルを決定する、
ことを特徴とする請求項4に記載のオーディオ復号方法。 - 前記歪み補正ステップによって補正が行われたステレオ音声復号信号を、時間軸方向又は周波数軸方向に平滑化する平滑化ステップを更に含む、
ことを特徴とする請求項2乃至6の何れか1項に記載のオーディオ復号方法。 - 前記復号音分析ステップ、前記歪み検出ステップ、及び前記歪み補正ステップは、時間周波数領域にて実行される、
ことを特徴とする請求項2乃至7の何れか1項に記載のオーディオ復号方法。 - パラメトリックステレオ方式により符号化された音声データからモノラル音声復号信号とパラメトリックステレオパラメータ情報を復号し、該モノラル音声復号信号及びパラメトリックステレオパラメータ情報に基づいてステレオ音声復号信号を復号する音声復号装置において、
前記パラメトリックステレオパラメータ情報を第1のパラメトリックステレオパラメータ情報として、それに対応する第2のパラメトリックステレオパラメータ情報を前記ステレオ音声復号信号から算出する復号音分析手段と、
該第2のパラメトリックステレオパラメータ情報と前記第1のパラメトリックステレオパラメータ情報とを比較することにより、前記ステレオ音声復号信号の復号過程で生じた歪みを検出する歪み検出手段と、
前記ステレオ音声復号信号において、前記歪み検出手段にて検出された歪みを補正する歪み補正手段と、
を含むことを特徴とするオーディオ復号装置。 - パラメトリックステレオ方式により符号化された音声データからモノラル音声復号信号とパラメトリックステレオパラメータ情報を復号し、該モノラル音声復号信号及びパラメトリックステレオパラメータ情報に基づいてステレオ音声復号信号を復号するコンピュータに、
前記パラメトリックステレオパラメータ情報を第1のパラメトリックステレオパラメータ情報として、それに対応する第2のパラメトリックステレオパラメータ情報を前記ステレオ音声復号信号から算出する復号音分析機能と、
該第2のパラメトリックステレオパラメータ情報と前記第1のパラメトリックステレオパラメータ情報とを比較することにより、前記ステレオ音声復号信号の復号過程で生じた歪みを検出する歪み検出機能と、
前記ステレオ音声復号信号において、前記歪み検出機能にて検出された歪みを補正する歪み補正機能と、
を実行させるためのプログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008247213A JP5326465B2 (ja) | 2008-09-26 | 2008-09-26 | オーディオ復号方法、装置、及びプログラム |
EP09169818A EP2169667B1 (en) | 2008-09-26 | 2009-09-09 | Parametric stereo audio decoding method and apparatus |
AT09169818T ATE540400T1 (de) | 2008-09-26 | 2009-09-09 | Verfahren und vorrichtung zur parametrischen stereo-audiodekodierung |
US12/563,890 US8619999B2 (en) | 2008-09-26 | 2009-09-21 | Audio decoding method and apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008247213A JP5326465B2 (ja) | 2008-09-26 | 2008-09-26 | オーディオ復号方法、装置、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010078915A true JP2010078915A (ja) | 2010-04-08 |
JP5326465B2 JP5326465B2 (ja) | 2013-10-30 |
Family
ID=41508849
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008247213A Expired - Fee Related JP5326465B2 (ja) | 2008-09-26 | 2008-09-26 | オーディオ復号方法、装置、及びプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US8619999B2 (ja) |
EP (1) | EP2169667B1 (ja) |
JP (1) | JP5326465B2 (ja) |
AT (1) | ATE540400T1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011048792A1 (ja) * | 2009-10-21 | 2011-04-28 | パナソニック株式会社 | 音響信号処理装置、音響符号化装置および音響復号装置 |
JP2013050540A (ja) * | 2011-08-30 | 2013-03-14 | Fujitsu Ltd | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5309944B2 (ja) * | 2008-12-11 | 2013-10-09 | 富士通株式会社 | オーディオ復号装置、方法、及びプログラム |
EP2434783B1 (en) * | 2010-09-24 | 2014-06-11 | Panasonic Automotive Systems Europe GmbH | Automatic stereo adaptation |
US9299355B2 (en) * | 2011-08-04 | 2016-03-29 | Dolby International Ab | FM stereo radio receiver by using parametric stereo |
RU2627102C2 (ru) | 2013-01-29 | 2017-08-03 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Декодер для формирования аудиосигнала с улучшенной частотной характеристикой, способ декодирования, кодер для формирования кодированного сигнала и способ кодирования с использованием компактной дополнительной информации для выбора |
WO2014126689A1 (en) | 2013-02-14 | 2014-08-21 | Dolby Laboratories Licensing Corporation | Methods for controlling the inter-channel coherence of upmixed audio signals |
TWI618050B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
US9830917B2 (en) | 2013-02-14 | 2017-11-28 | Dolby Laboratories Licensing Corporation | Methods for audio signal transient detection and decorrelation control |
TWI618051B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06236198A (ja) * | 1993-02-09 | 1994-08-23 | Nec Corp | 音質主観評価予測方式 |
JPH10294668A (ja) * | 1997-04-22 | 1998-11-04 | Matsushita Electric Ind Co Ltd | オーディオ符号化データ復号化方法、オーディオ符号化データ復号化装置、及び記録媒体 |
JP2002223167A (ja) * | 2001-01-25 | 2002-08-09 | Sony Corp | データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体 |
JP2002525897A (ja) * | 1998-09-16 | 2002-08-13 | テレフオンアクチーボラゲツト エル エム エリクソン | 線形予測合成解析符号化方法と符号化器 |
JP2006067367A (ja) * | 2004-08-27 | 2006-03-09 | Matsushita Electric Ind Co Ltd | 符号化オーディオ信号の編集装置 |
JP2008519306A (ja) * | 2004-11-04 | 2008-06-05 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 信号の組のエンコード及びデコード |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7082220B2 (en) | 2001-01-25 | 2006-07-25 | Sony Corporation | Data processing apparatus |
TWI393121B (zh) * | 2004-08-25 | 2013-04-11 | Dolby Lab Licensing Corp | 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式 |
SE0402652D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
RU2419249C2 (ru) * | 2005-09-13 | 2011-05-20 | Кониклейке Филипс Электроникс Н.В. | Аудиокодирование |
JP4512016B2 (ja) | 2005-09-16 | 2010-07-28 | 日本電信電話株式会社 | ステレオ信号符号化装置、ステレオ信号符号化方法、プログラム及び記録媒体 |
JP5309944B2 (ja) * | 2008-12-11 | 2013-10-09 | 富士通株式会社 | オーディオ復号装置、方法、及びプログラム |
-
2008
- 2008-09-26 JP JP2008247213A patent/JP5326465B2/ja not_active Expired - Fee Related
-
2009
- 2009-09-09 AT AT09169818T patent/ATE540400T1/de active
- 2009-09-09 EP EP09169818A patent/EP2169667B1/en not_active Not-in-force
- 2009-09-21 US US12/563,890 patent/US8619999B2/en not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06236198A (ja) * | 1993-02-09 | 1994-08-23 | Nec Corp | 音質主観評価予測方式 |
JPH10294668A (ja) * | 1997-04-22 | 1998-11-04 | Matsushita Electric Ind Co Ltd | オーディオ符号化データ復号化方法、オーディオ符号化データ復号化装置、及び記録媒体 |
JP2002525897A (ja) * | 1998-09-16 | 2002-08-13 | テレフオンアクチーボラゲツト エル エム エリクソン | 線形予測合成解析符号化方法と符号化器 |
JP2002223167A (ja) * | 2001-01-25 | 2002-08-09 | Sony Corp | データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体 |
JP2006067367A (ja) * | 2004-08-27 | 2006-03-09 | Matsushita Electric Ind Co Ltd | 符号化オーディオ信号の編集装置 |
JP2008519306A (ja) * | 2004-11-04 | 2008-06-05 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 信号の組のエンコード及びデコード |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011048792A1 (ja) * | 2009-10-21 | 2011-04-28 | パナソニック株式会社 | 音響信号処理装置、音響符号化装置および音響復号装置 |
JP5422664B2 (ja) * | 2009-10-21 | 2014-02-19 | パナソニック株式会社 | 音響信号処理装置、音響符号化装置および音響復号装置 |
US9026236B2 (en) | 2009-10-21 | 2015-05-05 | Panasonic Intellectual Property Corporation Of America | Audio signal processing apparatus, audio coding apparatus, and audio decoding apparatus |
JP2013050540A (ja) * | 2011-08-30 | 2013-03-14 | Fujitsu Ltd | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5326465B2 (ja) | 2013-10-30 |
EP2169667A1 (en) | 2010-03-31 |
EP2169667B1 (en) | 2012-01-04 |
US20100080397A1 (en) | 2010-04-01 |
ATE540400T1 (de) | 2012-01-15 |
US8619999B2 (en) | 2013-12-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5326465B2 (ja) | オーディオ復号方法、装置、及びプログラム | |
JP6698903B2 (ja) | 高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置 | |
KR102219752B1 (ko) | 채널 간 시간 차를 추정하기 위한 장치 및 방법 | |
JP5267362B2 (ja) | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置 | |
JP5485909B2 (ja) | オーディオ信号処理方法及び装置 | |
JP5292498B2 (ja) | 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形 | |
JP4347698B2 (ja) | パラメトリックオーディオ符号化 | |
KR20180056662A (ko) | 2차 채널을 인코딩하기 위하여 1차 채널의 코딩 파라메타들을 이용하여 스테레오 사운드 신호를 인코딩하는 방법 및 시스템 | |
JP5737077B2 (ja) | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム | |
JP2015520411A5 (ja) | ||
US20230419976A1 (en) | Apparatus for Encoding or Decoding an Encoded Multichannel Signal Using a Filling Signal Generated by a Broad Band Filter | |
WO2010016270A1 (ja) | 量子化装置、符号化装置、量子化方法及び符号化方法 | |
JP5309944B2 (ja) | オーディオ復号装置、方法、及びプログラム | |
JPWO2010140350A1 (ja) | ダウンミックス装置、符号化装置、及びこれらの方法 | |
JP2004184975A (ja) | 少ない計算量で高周波数成分を復元するオーディオデコーディング方法及び装置 | |
WO2012006942A1 (zh) | 一种音频数据的编码方法及装置 | |
US11176954B2 (en) | Encoding and decoding of multichannel or stereo audio signals | |
JP4454603B2 (ja) | 信号処理方法、信号処理装置及びプログラム | |
JP4454604B2 (ja) | 信号処理方法、信号処理装置及びプログラム | |
JP5189760B2 (ja) | 信号処理方法、信号処理装置及びプログラム | |
JP4767289B2 (ja) | 信号処理方法、信号処理装置及びプログラム | |
JP4767290B2 (ja) | 信号処理方法、信号処理装置及びプログラム | |
EP3252763A1 (en) | Low-delay audio coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110708 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120719 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120731 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121001 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130409 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130603 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130625 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130708 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |