JP2013044923A - 符号化装置および方法、並びにプログラム - Google Patents

符号化装置および方法、並びにプログラム Download PDF

Info

Publication number
JP2013044923A
JP2013044923A JP2011182450A JP2011182450A JP2013044923A JP 2013044923 A JP2013044923 A JP 2013044923A JP 2011182450 A JP2011182450 A JP 2011182450A JP 2011182450 A JP2011182450 A JP 2011182450A JP 2013044923 A JP2013044923 A JP 2013044923A
Authority
JP
Japan
Prior art keywords
subband
power
signal
band
high frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011182450A
Other languages
English (en)
Other versions
JP5975243B2 (ja
JP2013044923A5 (ja
Inventor
Yuki Yamamoto
優樹 山本
Toru Chinen
徹 知念
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2011182450A priority Critical patent/JP5975243B2/ja
Application filed by Sony Corp filed Critical Sony Corp
Priority to EP12826007.2A priority patent/EP2750134B1/en
Priority to AU2012297805A priority patent/AU2012297805A1/en
Priority to BR112014003680A priority patent/BR112014003680A2/pt
Priority to KR1020147003662A priority patent/KR102055022B1/ko
Priority to CN201280040017.9A priority patent/CN103765509B/zh
Priority to CA2840785A priority patent/CA2840785A1/en
Priority to EP22202002.6A priority patent/EP4156184A1/en
Priority to RU2014105812/08A priority patent/RU2595544C2/ru
Priority to PCT/JP2012/070684 priority patent/WO2013027631A1/ja
Priority to MX2014001870A priority patent/MX2014001870A/es
Priority to US14/237,990 priority patent/US9361900B2/en
Publication of JP2013044923A publication Critical patent/JP2013044923A/ja
Priority to ZA2014/01182A priority patent/ZA201401182B/en
Publication of JP2013044923A5 publication Critical patent/JP2013044923A5/ja
Application granted granted Critical
Publication of JP5975243B2 publication Critical patent/JP5975243B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】音質を向上させることができるようにする。
【解決手段】QMFサブバンドパワー算出部は、入力信号を構成する複数のQMFサブバンドのうち、高域のQMFサブバンドのQMFサブバンド信号のパワーを算出する。高域サブバンドパワー算出部は、高域のいくつかのQMFサブバンドからなるサブバンドについて、大きいQMFサブバンドパワーに、より大きい重みがかかる演算を行い、サブバンドの高域サブバンドパワーを算出する。多重化回路は、高域サブバンドパワーに基づいて選択された、入力信号の高域成分を推定により得るための情報を符号化して得られる高域符号化データと、入力信号の低域成分を符号化して得られた低域符号化データとを多重化して出力する。本技術は、符号化装置に適用することができる。
【選択図】図3

Description

本技術は符号化装置および方法、並びにプログラムに関し、特に、音質を向上させることができるようにした符号化装置および方法、並びにプログラムに関する。
従来、音声信号の符号化手法として、HE-AAC(High Efficiency MPEG(Moving Picture Experts Group)4 AAC(Advanced Audio Coding))(国際標準規格ISO/IEC14496-3)が知られている。
この符号化手法では、SBR(Spectral Band Replication)と呼ばれる高域特徴符号化技術が用いられている(例えば、特許文献1参照)。SBRでは、音声信号の符号化時に、符号化された音声信号の低域成分とともに、音声信号の高域成分を生成するためのSBR情報が出力される。具体的には、高域成分のスケールファクターバンドと呼ばれる各周波数帯域のパワー(エネルギ)が量子化されたものがSBR情報とされる。
また、復号装置では、符号化された音声信号の低域成分が復号されるとともに、復号により得られた低域信号とSBR情報とが用いられて高域信号が生成され、低域信号と高域信号とからなる音声信号が得られる。
特表2001−521648号公報
ところが上述した技術では、高域のスケールファクターバンドを構成する各周波数帯域のパワーの平均値を、そのスケールファクターバンドのパワーとしていたため、復号時にもとの信号のパワーを再現することができなくなってしまうことがあった。そのような場合、復号により得られた音声信号の明瞭度が失われ、聴感上の音質の劣化が生じてしまう。
本技術は、このような状況に鑑みてなされたものであり、音質を向上させることができるようにするものである。
本技術の一側面の符号化装置は、入力信号の帯域分割を行なって、前記入力信号の高域側の第1のサブバンドの第1のサブバンド信号を生成するサブバンド分割部と、前記第1のサブバンド信号に基づいて、前記第1のサブバンド信号の第1のサブバンドパワーを算出する第1のサブバンドパワー算出部と、より大きい前記第1のサブバンドパワーにより大きな重みがかかる演算を行なって、連続するいくつかの前記第1のサブバンドからなる第2のサブバンドの信号の第2のサブバンドパワーを算出する第2のサブバンドパワー算出部と、前記第2のサブバンドパワーに基づいて、前記入力信号の高域成分を推定により得るためのデータを生成する生成部と、前記入力信号の低域信号を符号化して低域符号化データを生成する低域符号化部と、前記データと前記低域符号化データとを多重化して出力符号列を生成する多重化部とを備える。
符号化装置には、前記入力信号または前記低域信号から得られる特徴量に基づいて、前記第2のサブバンドパワーの推定値である擬似高域サブバンドパワーを算出する疑似高域サブバンドパワー算出部をさらに設け、前記生成部には、前記第2のサブバンドパワーと前記擬似高域サブバンドパワーとを比較させて、前記データを生成させることができる。
前記疑似高域サブバンドパワー算出部には、前記特徴量と、予め用意された推定係数とに基づいて前記擬似高域サブバンドパワーを算出させ、前記生成部には、複数の前記推定係数のうちの何れかを得るための前記データを生成させることができる。
符号化装置には、前記データを符号化して高域符号化データを生成する高域符号化部をさらに設け、前記多重化部には、前記高域符号化データと前記低域符号化データとを多重化させて前記出力符号列を生成させることができる。
前記第2のサブバンドパワー算出部には、前記第1のサブバンドパワーのm乗値の平均値を1/m乗することにより前記第2のサブバンドパワーを算出させることができる。
前記第2のサブバンドパワー算出部には、前記第1のサブバンドパワーが大きいほどより値が大きくなる重みを用いて、前記第1のサブバンドパワーの重み付き平均値を求めることにより前記第2のサブバンドパワーを算出させることができる。
本技術の一側面の符号化方法またはプログラムは、入力信号の帯域分割を行なって、前記入力信号の高域側の第1のサブバンドの第1のサブバンド信号を生成し、前記第1のサブバンド信号に基づいて、前記第1のサブバンド信号の第1のサブバンドパワーを算出し、より大きい前記第1のサブバンドパワーにより大きな重みがかかる演算を行なって、連続するいくつかの前記第1のサブバンドからなる第2のサブバンドの信号の第2のサブバンドパワーを算出し、前記第2のサブバンドパワーに基づいて、前記入力信号の高域成分を推定により得るためのデータを生成し、前記入力信号の低域信号を符号化して低域符号化データを生成し、前記データと前記低域符号化データとを多重化して出力符号列を生成するステップを含む。
本技術の一側面においては、入力信号の帯域分割が行なわれて、前記入力信号の高域側の第1のサブバンドの第1のサブバンド信号が生成され、前記第1のサブバンド信号に基づいて、前記第1のサブバンド信号の第1のサブバンドパワーが算出され、より大きい前記第1のサブバンドパワーにより大きな重みがかかる演算が行なわれて、連続するいくつかの前記第1のサブバンドからなる第2のサブバンドの信号の第2のサブバンドパワーが算出され、前記第2のサブバンドパワーに基づいて、前記入力信号の高域成分を推定により得るためのデータが生成され、前記入力信号の低域信号が符号化されて低域符号化データが生成され、前記データと前記低域符号化データとが多重化されて出力符号列が生成される。
本技術の一側面によれば、音質を向上させることができる。
入力信号のサブバンドについて説明するための図である。 サブバンドとQMFサブバンドについて説明するための図である。 本技術を適用した符号化装置の構成例を示す図である。 符号化処理について説明するフローチャートである。 復号装置の構成例を示す図である。 コンピュータの構成例を示す図である。
以下、図面を参照して、本技術を適用した実施の形態について説明する。
〈本技術の概要〉
[入力信号の符号化について]
本技術は、例えば音楽信号などの音声信号を入力信号として、入力信号の符号化を行なうものである。
入力信号の符号化を行なう符号化装置では、符号化時において図1に示すように、入力信号が所定の帯域幅の複数の周波数帯域(以下、サブバンドと称する)のサブバンド信号に分割されて各処理が行なわれる。なお、図1において、縦軸は入力信号の各周波数のパワーを示しており、横軸は入力信号の各周波数を示している。また、曲線C11は入力信号の各周波数成分のパワーを示しており、図中、縦方向の点線は各サブバンドの境界位置を示している。
符号化装置では、入力信号の周波数成分のうち、予め定められた周波数以下の低域側の成分が、所定の符号化方式により符号化され、低域符号化データが生成される。
図1の例では、各サブバンドを特定するインデックスがsbであるサブバンドsbの上限の周波数以下の周波数のサブバンドが入力信号の低域成分とされており、サブバンドsbの上限の周波数よりも高い周波数のサブバンドが入力信号の高域成分とされている。
低域符号化データが得られると、次に入力信号の低域成分と高域成分とに基づいて、高域成分の各サブバンドのサブバンド信号を再現するための情報が生成され、その情報が、適宜、所定の符号化方式により符号化されて高域符号化データが生成される。
具体的には、周波数方向に連続して並ぶ低域側の最も周波数が高い4つのサブバンドsb−3乃至サブバンドsbの成分と、高域側の連続して並ぶ(eb-(sb+1)+1)個のサブバンドsb+1乃至サブバンドebの成分とから、高域符号化データが生成される。
ここで、サブバンドsb+1はサブバンドsbに隣接する、最も低域側に位置する高域のサブバンドであり、サブバンドebは、連続して並ぶサブバンドsb+1乃至サブバンドebのうちの最も周波数が高いサブバンドである。
高域成分の符号化で得られる高域符号化データは、高域側のサブバンドib(但し、sb+1≦ib≦eb)のサブバンド信号を推定により生成するための情報であり、高域符号化データには、各サブバンド信号の推定に用いられる推定係数を得るための係数インデックスが含まれている。
すなわち、サブバンドibのサブバンド信号の推定には、低域側のサブバンドkb(但し、sb−3≦kb≦sb)のサブバンド信号のパワーに乗算される係数Aib(kb)と、定数項である係数Bibからなる推定係数が用いられる。高域符号化データに含まれる係数インデックスは、各サブバンドibの係数Aib(kb)と係数Bibからなる推定係数のセットを得るための情報、例えば推定係数のセットを特定する情報である。
より詳細には、高域符号化データの生成時には、低域側の各サブバンドkbのサブバンド信号のパワー(以下、低域サブバンドパワーとも称する)に係数Aib(kb)が乗算される。そして、係数Aib(kb)が乗算された低域サブバンドパワーの総和に係数Bibが加算されて、高域側のサブバンドibのサブバンド信号のパワーの推定値である擬似高域サブバンドパワーが算出される。
さらに、高域側の各サブバンドの擬似高域サブバンドパワーと、実際の高域側の各サブバンドのサブバンド信号のパワーとが比較されて、その比較結果から最適な推定係数が選択され、選択された推定係数の係数インデックスを含むデータが符号化されて、高域符号化データとされる。
以上のようにして低域符号化データと高域符号化データが得られると、それらの低域符号化データと高域符号化データが多重化されて出力符号列とされ、出力される。
また、出力符号列の供給を受けた復号装置は、低域符号化データを復号して低域側の各サブバンドのサブバンド信号からなる復号低域信号を得るとともに、復号低域信号と、高域符号化データを復号して得られた情報とから高域側の各サブバンドのサブバンド信号を推定により生成する。そして、復号装置は、推定により得られた高域側の各サブバンドのサブバンド信号からなる復号高域信号と、復号低域信号とから出力信号を生成する。このようにして得られた出力信号は、符号化された入力信号を復号することで得られた信号である。
[QMFサブバンドについて]
なお、上述したように符号化装置では、入力信号が各サブバンドの成分に分割されて処理されるが、より詳細には、各サブバンドのパワーは、サブバンドよりも帯域幅の狭い帯域の成分から算出される。
例えば図2に示すように、符号化装置では、入力信号がQMF(Quadrature Mirror Filter)分析フィルタを用いたフィルタ処理によって、上述したサブバンドよりも帯域幅の狭いQMFサブバンドの信号(以下、QMFサブバンド信号と称する)に分割される。そして、いくつかのQMFサブバンドが束ねられて1つのサブバンドとされる。
なお、図2において、縦軸は入力信号の各周波数のパワーを示しており、横軸は入力信号の各周波数を示している。また、曲線C12は入力信号の各周波数成分のパワーを示しており、図中、縦方向の点線は各サブバンドの境界位置を示している。
図2の例では、P11乃至P17のそれぞれは、各サブバンドのパワー(以下、サブバンドパワーとも称する)を表している。例えば、図中、右側に示すように1つのサブバンドは、3つのQMFサブバンドib0乃至QMFサブバンドib2から構成される。
したがって、例えばサブバンドパワーP17を算出する場合には、まずそのサブバンドを構成するQMFサブバンドib0乃至QMFサブバンドib2の各QMFサブバンドのパワー(以下、QMFサブバンドパワーとも称する)が算出される。すなわち、QMFサブバンドib0乃至QMFサブバンドib2について、QMFサブバンドパワーQ11乃至QMFサブバンドパワーQ13が算出される。
そして、これらのQMFサブバンドパワーQ11乃至QMFサブバンドパワーQ13に基づいて、サブバンドパワーP17が算出される。
具体的には例えば、インデックスがibQMFであるフレームJのQMFサブバンド信号がsigQMF(ibQMF,n)であり、1フレームにおけるQMFサブバンド信号のサンプル数がFSIZEQMFであるとする。ここで、インデックスibQMFは、図2におけるインデックスib0,ib1,ib2に相当する。
この場合、QMFサブバンドibQMFのQMFサブバンドパワーpowerQMF(ibQMF,J)は、次式(1)により求められる。
Figure 2013044923
すなわち、QMFサブバンドパワーpowerQMF(ibQMF,J)は、フレームJのQMFサブバンド信号の各サンプルのサンプル値の二乗平均値により求められる。なお、QMFサブバンド信号sigQMF(ibQMF,n)におけるnは、離散時間のインデックスを示している。
また、各QMFサブバンドのQMFサブバンドパワーpowerQMF(ibQMF,J)から、高域側のサブバンドibのサブバンドパワーを求める方法として、次式(2)の計算によりサブバンドパワーpower(ib,J)を算出する方法が考えられる。
Figure 2013044923
なお、式(2)において、start(ib)およびend(ib)は、それぞれサブバンドibを構成するQMFサブバンドのうち、最も周波数が低いQMFサブバンド、および最も周波数が高いQMFサブバンドのインデックスを示している。例えば、図2の例では、右端のサブバンドのインデックスをibとすると、start(ib)=ib0,end(ib)=ib2である。
したがって、サブバンドパワーpower(ib,J)は、サブバンドibを構成する各QMFサブバンドのQMFサブバンドパワーの平均値を対数化することにより求められる。
式(2)の演算によりサブバンドパワーが求められる場合、例えばサブバンドパワーP17は、QMFサブバンドパワーQ11乃至QMFサブバンドパワーQ13の平均値を対数化することにより算出されることになる。そのような場合、例えば図2に示すようにサブバンドパワーP17は、QMFサブバンドパワーQ11やQMFサブバンドパワーQ13より大きく、QMFサブバンドパワーQ12よりも小さくなる。
符号化時には、高域側の各サブバンドのサブバンドパワー(以下、高域サブバンドパワーとも称する)と、擬似高域サブバンドパワーとが比較され、高域サブバンドパワーに最も近い擬似高域サブバンドパワーが得られる推定係数が選択される。そして、選択された推定係数の係数インデックスが高域符号化データに含められる。
復号側では、高域符号化データに含まれる係数インデックスで特定される推定係数と、低域サブバンドパワーとから高域側の各サブバンドの擬似高域サブバンドパワーが生成され、擬似高域サブバンドパワーから高域側の各サブバンドのサブバンド信号が推定により求められる。
ところが、QMFサブバンドib1のように、QMFサブバンドパワーQ12がサブバンドパワーP17よりも大きい帯域では、復号時にもとの入力信号のパワーを再現することができなくなってしまう。すなわち、もとのQMFサブバンド信号のパワーを再現することができなくなってしまい、その結果、復号により得られた音声信号の明瞭度が失われ、聴感上の音質の劣化が生じてしまう。
本出願人による解析では、各サブバンドを構成するQMFサブバンドのうち、より大きなQMFサブバンドパワーに値が近くなるようにサブバンドパワーを求めることで、音質の劣化を抑えられることが分かっている。より大きなQMFサブバンドパワーを持つQMFサブバンドの方が、聴感上の音質を決定する要素としての比重が大きいからである。
そこで、本技術を適用した符号化装置は、サブバンドパワーの算出時に、より大きいQMFサブバンドパワーにより大きい重みがかかる演算を行なって、サブバンドパワーの値が、大きい値のQMFサブバンドパワーにより近い値となるようにする。これにより、復号時にもとの入力信号の音質により近い音声信号が得られるようになる。すなわち、QMFサブバンドパワーが大きいQMFサブバンドについて、復号時にもとのQMFサブバンド信号のパワーにより近いパワーが再現されるようになり、聴感上の音質が向上する。
〈第1の実施の形態〉
[符号化装置の構成例]
次に、以上において説明した入力信号の符号化技術の具体的な実施の形態について説明する。まず、入力信号の符号化を行なう符号化装置の構成について説明する。図3は、符号化装置の構成例を示す図である。
符号化装置11は、低域通過フィルタ31、低域符号化回路32、QMFサブバンド分割回路33、特徴量算出回路34、擬似高域サブバンドパワー算出回路35、擬似高域サブバンドパワー差分算出回路36、高域符号化回路37、および多重化回路38から構成される。符号化装置11では、符号化対象の入力信号が低域通過フィルタ31およびQMFサブバンド分割回路33に供給される。
低域通過フィルタ31は、供給された入力信号を所定の遮断周波数でフィルタリングし、その結果得られた、遮断周波数より低域の信号(以下、低域信号と称する)を、低域符号化回路32、QMFサブバンド分割回路33、および特徴量算出回路34に供給する。
低域符号化回路32は、低域通過フィルタ31からの低域信号を符号化し、その結果得られた低域符号化データを多重化回路38に供給する。
QMFサブバンド分割回路33は、低域通過フィルタ31からの低域信号を複数のQMFサブバンド信号に等分割し、これにより得られたQMFサブバンド信号(以下、低域QMFサブバンド信号とも称する)を特徴量算出回路34に供給する。
また、QMFサブバンド分割回路33は、供給された入力信号を複数のQMFサブバンド信号に等分割し、これにより得られたQMFサブバンド信号のうち、高域側の所定の帯域に含まれる各QMFサブバンドのQMFサブバンド信号を、擬似高域サブバンドパワー差分算出回路36に供給する。なお、以下、QMFサブバンド分割回路33から擬似高域サブバンドパワー差分算出回路36に供給される各QMFサブバンドのQMFサブバンド信号を、高域QMFサブバンド信号とも称する。
特徴量算出回路34は、低域通過フィルタ31からの低域信号、またはQMFサブバンド分割回路33からの低域QMFサブバンド信号の少なくとも何れかに基づいて特徴量を算出し、擬似高域サブバンドパワー算出回路35に供給する。
擬似高域サブバンドパワー算出回路35は、特徴量算出回路34からの特徴量に基づいて、高域側の各サブバンドのサブバンド信号(以下、高域サブバンド信号とも称する)のパワーの推定値である擬似高域サブバンドパワーを算出し、擬似高域サブバンドパワー差分算出回路36に供給する。なお、擬似高域サブバンドパワー算出回路35には、統計学習により得られた推定係数のセットが複数記録されており、擬似高域サブバンドパワーは、推定係数と特徴量に基づいて算出される。
擬似高域サブバンドパワー差分算出回路36は、QMFサブバンド分割回路33からの高域QMFサブバンド信号と、擬似高域サブバンドパワー算出回路35からの擬似高域サブバンドパワーとに基づいて複数の推定係数のなかから最適な推定係数を選択する。
擬似高域サブバンドパワー差分算出回路36は、QMFサブバンドパワー算出部51および高域サブバンドパワー算出部52を備えている。
QMFサブバンドパワー算出部51は、高域QMFサブバンド信号に基づいて、高域側の各QMFサブバンドのQMFサブバンドパワーを算出する。高域サブバンドパワー算出部52は、QMFサブバンドパワーに基づいて、高域側の各サブバンドの高域サブバンドパワーを算出する。
また、擬似高域サブバンドパワー差分算出回路36は、擬似高域サブバンドパワーと高域サブバンドパワーとに基づいて、入力信号の実際の高域成分と、推定係数を用いて推定された高域成分との誤差を示す評価値を算出する。この評価値は、推定係数による高域成分の推定精度を示している。
擬似高域サブバンドパワー差分算出回路36は、各推定係数について求められた評価値に基づいて、複数の推定係数から1つの推定係数を選択し、選択した推定係数を特定する係数インデックスを高域符号化回路37に供給する。
高域符号化回路37は、擬似高域サブバンドパワー差分算出回路36から供給された係数インデックスを符号化し、その結果得られる高域符号化データを多重化回路38に供給する。多重化回路38は、低域符号化回路32からの低域符号化データと、高域符号化回路37からの高域符号化データとを多重化し、出力符号列として出力する。
[符号化処理の説明]
図3に示した符号化装置11は、入力信号が供給されて、入力信号の符号化が指示されると符号化処理を行なって、復号装置に出力符号列を出力する。以下、図4のフローチャートを参照して、符号化装置11による符号化処理について説明する。なお、この符号化処理は、入力信号を構成するフレームごとに行なわれる。
ステップS11において、低域通過フィルタ31は、供給された処理対象のフレームの入力信号を低域通過フィルタによって所定の遮断周波数でフィルタリングし、その結果得られた低域信号を低域符号化回路32、QMFサブバンド分割回路33、および特徴量算出回路34に供給する。
ステップS12において、低域符号化回路32は、低域通過フィルタ31から供給された低域信号を符号化し、その結果得られた低域符号化データを多重化回路38に供給する。
ステップS13において、QMFサブバンド分割回路33は、QMF分析フィルタを用いたフィルタ処理により、入力信号および低域信号を複数のQMFサブバンド信号に等分割する。
すなわち、QMFサブバンド分割回路33は、供給された入力信号を各QMFサブバンドのQMFサブバンド信号に分割する。そして、QMFサブバンド分割回路33は、その結果得られた高域側のサブバンドsb+1からサブバンドebまでの帯域を構成する各QMFサブバンドの高域QMFサブバンド信号を擬似高域サブバンドパワー差分算出回路36に供給する。
また、QMFサブバンド分割回路33は、低域通過フィルタ31から供給された低域信号を各QMFサブバンドのQMFサブバンド信号に分割する。そして、QMFサブバンド分割回路33は、その結果得られた低域側のサブバンドsb−3からサブバンドsbまでの帯域を構成する各QMFサブバンドの低域QMFサブバンド信号を特徴量算出回路34に供給する。
ステップS14において、特徴量算出回路34は、低域通過フィルタ31からの低域信号、またはQMFサブバンド分割回路33からの低域QMFサブバンド信号の少なくとも何れかに基づいて特徴量を算出し、擬似高域サブバンドパワー算出回路35に供給する。
例えば、特徴量として各低域サブバンド信号のパワー(低域サブバンドパワー)が算出される。
具体的には、特徴量算出回路34は、上述した式(1)と同様の計算を行なうことで、低域側の各QMFサブバンドのQMFサブバンドパワーを算出する。すなわち、特徴量算出回路34は、1フレーム分の低域QMFサブバンド信号を構成する各サンプルのサンプル値の二乗平均値を求めて、QMFサブバンドパワーとする。
また、特徴量算出回路34は、上述した式(2)と同様の計算を行なうことで、デシベルで表現される処理対象のフレームJの低域のサブバンドib(但し、sb−3≦ib≦sb)のサブバンドパワーpower(ib,J)を算出する。すなわち、各サブバンドを構成するQMFサブバンドのQMFサブバンドパワーの平均値を対数化することにより、低域サブバンドパワーが算出される。
低域の各サブバンドibの低域サブバンドパワーが得られると、特徴量算出回路34は、特徴量として算出した低域サブバンドパワーを擬似高域サブバンドパワー算出回路35に供給し、処理はステップS15に進む。
ステップS15において、擬似高域サブバンドパワー算出回路35は、特徴量算出回路34から供給された特徴量に基づいて、擬似高域サブバンドパワーを算出し、擬似高域サブバンドパワー差分算出回路36に供給する。
具体的には擬似高域サブバンドパワー算出回路35は、予め記録している推定係数ごとに、次式(3)に示す計算を行なって、高域側の各サブバンドのサブバンドパワーpowerest(ib,J)を算出する。ステップS15で得られるサブバンドパワーpowerest(ib,J)は、処理対象のフレームJにおける高域側のサブバンドib(但し、sb+1≦ib≦eb)の高域サブバンドパワーの推定値である擬似高域サブバンドパワーである。
Figure 2013044923
なお、式(3)において、係数Aib(kb)および係数Bibは、高域側のサブバンドibについて用意された推定係数のセットを示している。すなわち、係数Aib(kb)は、サブバンドkb(但し、sb−3≦kb≦sb)の低域サブバンドパワーpower(ib,J)に乗算される係数であり、係数Bibは、係数Aib(kb)が乗算されたサブバンドkbのサブバンドパワーを線形結合するときに用いられる定数項である。
したがって、高域側のサブバンドibの擬似高域サブバンドパワーpowerest(ib,J)は、低域側の各サブバンドの低域サブバンドパワーに、サブバンドごとの係数Aib(kb)を乗算し、係数が乗算された低域サブバンドパワーの和に、さらに係数Bibを加算することで得られる。
擬似高域サブバンドパワー算出回路35では、予め記録されている推定係数ごとに高域側の各サブバンドの擬似高域サブバンドパワーが算出される。例えば、係数インデックスが1乃至K(但し、2≦K)のK個の推定係数のセットが予め用意されている場合、K個の推定係数のセットについて、各サブバンドの擬似高域サブバンドパワーが算出される。
ステップS16において、QMFサブバンドパワー算出部51は、QMFサブバンド分割回路33から供給された高域QMFサブバンド信号に基づいて、高域側の各QMFサブバンドのQMFサブバンドパワーを算出する。例えば、QMFサブバンドパワー算出部51は上述した式(1)を計算することで、高域側の各QMFサブバンドのQMFサブバンドパワーpowerQMF(ibQMF,J)を算出する。
ステップS17において、高域サブバンドパワー算出部52は、QMFサブバンドパワー算出部51により算出されたQMFサブバンドパワーに基づいて、次式(4)の計算を行い、高域側の各サブバンドの高域サブバンドパワーを算出する。
Figure 2013044923
なお、式(4)において、start(ib)およびend(ib)は、それぞれサブバンドibを構成するQMFサブバンドのうち、最も周波数が低いQMFサブバンド、および最も周波数が高いQMFサブバンドのインデックスを示している。また、powerQMF(ibQMF,J)は、フレームJにおける高域のサブバンドib(但し、sb+1≦ib≦eb)を構成するQMFサブバンドibQMFのQMFサブバンドパワーを示している。
したがって、式(4)の演算では、サブバンドibを構成する各QMFサブバンドのQMFサブバンドパワーの3乗値の平均値が求められ、求められた平均値が1/3乗されて得られた値がさらに対数化される。そして、その結果得られた値が高域のサブバンドibの高域サブバンドパワーpower(ib,J)とされる。
このように、QMFサブバンドパワーの平均値を求めるときに、QMFサブバンドパワーの次数を上げることにより、より値の大きいQMFサブバンドパワーに重みがかかった平均値を算出することができる。すなわち、平均値の算出時にQMFサブバンドパワーをべき乗すると、QMFサブバンドパワー同士の差がより大きくなるので、より大きい値のQMFサブバンドパワーにより大きい重みが付けられた平均値が得られることになる。
その結果、QMFサブバンドパワーが大きいQMFサブバンドについて、入力信号の復号時にもとのQMFサブバンド信号のパワーにより近いパワーを再現することができるようになり、復号で得られる音声信号の聴感上の音質を向上させることができる。
なお、式(4)においては、QMFサブバンドパワーの平均値を求めるときに、QMFサブバンドパワーが3乗されているが、QMFサブバンドパワーがm乗(但し、1<m)されるようにしてもよい。そのような場合、QMFサブバンドパワーのm乗値の平均値を1/m乗し、その結果得られた値を対数化することで、高域サブバンドパワーが求められる。
このようにして、高域の各サブバンドの高域サブバンドパワーと、推定係数ごとに求められた高域の各サブバンドの擬似高域サブバンドパワーとが得られると、ステップS18の処理が行なわれ、推定係数ごとに評価値が算出される。
すなわち、ステップS18において、擬似高域サブバンドパワー差分算出回路36は、K個の推定係数ごとに、処理対象となっている現フレームJを用いた評価値Res(id,J)を算出する。
具体的には、擬似高域サブバンドパワー差分算出回路36は、次式(5)を計算し、残差二乗平均値Resstd(id,J)を算出する。
Figure 2013044923
すなわち、高域側の各サブバンドib(但し、sb+1≦ib≦eb)について、フレームJの高域サブバンドパワーpower(ib,J)と擬似高域サブバンドパワーpowerest(ib,id,J)の差分が求められ、それらの差分の二乗平均値が残差二乗平均値Resstd(id,J)とされる。
なお、擬似高域サブバンドパワーpowerest(ib,id,J)は、フレームJにおいて、係数インデックスがidである推定係数について求められた、サブバンドibの擬似高域サブバンドパワーを示している。
続いて、擬似高域サブバンドパワー差分算出回路36は、次式(6)を計算し、残差最大値Resmax(id,J)を算出する。
Figure 2013044923
なお、式(6)において、maxib{|power(ib,J)−powerest(ib,id,J)|}は、各サブバンドibの高域サブバンドパワーpower(ib,J)と擬似高域サブバンドパワーpowerest(ib,id,J)の差分の絶対値のうちの最大のものを示している。したがって、フレームJにおける高域サブバンドパワーpower(ib,J)と擬似高域サブバンドパワーpowerest(ib,id,J)の差分の絶対値の最大値が残差最大値Resmax(id,J)とされる。
また、擬似高域サブバンドパワー差分算出回路36は、次式(7)を計算し、残差平均値Resave(id,J)を算出する。
Figure 2013044923
すなわち、高域側の各サブバンドibについて、フレームJの高域サブバンドパワーpower(ib,J)と擬似高域サブバンドパワーpowerest(ib,id,J)の差分が求められ、それらの差分の総和が求められる。そして、得られた差分の総和を高域側のサブバンド数(eb−sb)で除算して得られる値の絶対値が残差平均値Resave(id,J)とされる。この残差平均値Resave(id,J)は、符号が考慮された各サブバンドの推定誤差の平均値の大きさを示している。
さらに、残差二乗平均値Resstd(id,J)、残差最大値Resmax(id,J)、および残差平均値Resave(id,J)が得られると、擬似高域サブバンドパワー差分算出回路36は、次式(8)を計算し、最終的な評価値Res(id,J)を算出する。
Figure 2013044923
すなわち、残差二乗平均値Resstd(id,J)、残差最大値Resmax(id,J)、および残差平均値Resave(id,J)が重み付き加算されて、最終的な評価値Res(id,J)とされる。なお、式(8)において、Wstd、WmaxおよびWaveは、予め定められた重みであり、例えばWstd=1、Wmax=0.5、Wave=0.5などとされる。
擬似高域サブバンドパワー差分算出回路36は、以上の処理を行って、K個の推定係数ごとに、すなわちK個の係数インデックスidごとに、評価値Res(id,J)を算出する。
ステップS19において、擬似高域サブバンドパワー差分算出回路36は、求めた係数インデックスidごとの評価値Res(id,J)に基づいて、係数インデックスidを選択する。
ステップS18の処理で得られた評価値Res(id,J)は、実際の高域サブバンド信号から算出された高域サブバンドパワーと、係数インデックスがidである推定係数を用いて算出された擬似高域サブバンドパワーとの類似の度合いを示している。つまり、高域成分の推定誤差の大きさを示している。
したがって、評価値Res(id,J)が小さいほど、推定係数を用いた演算により、実際の高域サブバンド信号により近い信号が得られることになる。そこで、擬似高域サブバンドパワー差分算出回路36は、K個の評価値Res(id,J)のうち、値が最小となる評価値を選択し、その評価値に対応する推定係数を示す係数インデックスを、高域符号化回路37に供給する。
ステップS20において、高域符号化回路37は、擬似高域サブバンドパワー差分算出回路36から供給された係数インデックスを符号化し、その結果得られた高域符号化データを多重化回路38に供給する。
例えば、ステップS20では、係数インデックスに対してエントロピー符号化などが行なわれる。なお、高域符号化データは、最適な推定係数が得られる情報であれば、どのような情報であってもよく、例えば、係数インデックスがそのまま高域符号化データとされてもよい。
ステップS21において、多重化回路38は、低域符号化回路32から供給された低域符号化データと、高域符号化回路37から供給された高域符号化データとを多重化し、その結果得られた出力符号列を出力して符号化処理は終了する。
以上のようにして符号化装置11は、記録している推定係数ごとに高域成分の推定誤差を示す評価値を算出し、評価値が最小となる推定係数を選択する。そして、符号化装置11は、選択した推定係数を示す係数インデックスを符号化して高域符号化データとし、低域符号化データと高域符号化データを多重化して出力符号列とする。
このように、低域符号化データとともに、係数インデックスを符号化して得られた高域符号化データを出力符号列として出力することで、この出力符号列の入力を受ける復号装置では、高域成分の推定に最も適した推定係数を得ることができる。これにより、より高音質な信号を得ることができるようになる。
しかも、評価値の算出に用いられる高域サブバンドパワーを算出するときに、より大きいQMFサブバンドパワーにより大きい重みがかかる演算を行なうことで、出力符号列の復号時に、入力信号においてQMFサブバンドパワーが大きいQMFサブバンドについて、もとのQMFサブバンド信号のパワーにより近いパワーを再現することができる。これにより、復号時に入力信号の音質により近い音声信号を得ることができるようになり、聴感上の音質を向上させることができる。
〈変形例〉
[サブバンドパワーの算出について]
なお、以上においては、式(4)の演算により高域サブバンドパワーを算出すると説明したが、QMFサブバンドパワーの重み付き平均値を計算することで高域サブバンドパワーを算出するようにしてもよい。
そのような場合、例えば図4のステップS17において、高域サブバンドパワー算出部52は次式(9)の計算を行なうことで、処理対象のフレームJの高域のサブバンドib(但し、sb+1≦ib≦eb)のサブバンドパワーpower(ib,J)を算出する。
Figure 2013044923
なお、式(9)において、start(ib)およびend(ib)は、それぞれサブバンドibを構成するQMFサブバンドのうち、最も周波数が低いQMFサブバンド、および最も周波数が高いQMFサブバンドのインデックスを示している。また、powerQMF(ibQMF,J)は、フレームJにおける高域のサブバンドibを構成するQMFサブバンドibQMFのQMFサブバンドパワーを示している。
さらに、式(9)において、WQMF(powerQMF(ibQMF,J))は、QMFサブバンドパワーpowerQMF(ibQMF,J)の大きさに応じて変化する重みであり、例えば、次式(10)のように算出される。
Figure 2013044923
すなわち、重みWQMF(powerQMF(ibQMF,J))は、QMFサブバンドパワーpowerQMF(ibQMF,J)が大きいほど大きくなる。
したがって式(9)では、QMFサブバンドパワーの大きさに応じて変化する重みが付けられて、各QMFサブバンドのQMFサブバンドパワーが重み付き加算され、その結果得られた値がQMFサブバンド数(end(ib)-start(ib)+1)で除算される。そして、さらにその結果得られた値が対数化されて高域サブバンドパワーとされる。つまり、各QMFサブバンドパワーの重み付き平均値を求めることで、高域サブバンドパワーが求められる。
このような重み付き平均値の計算により高域サブバンドパワーを求める場合でも、より大きいQMFサブバンドパワーにより大きい重みが付けられるので、出力符号列の復号時に、もとのQMFサブバンド信号のパワーにより近いパワーを再現することができる。したがって、復号時に入力信号により近い音声信号を得ることができるようになり、聴感上の音質を向上させることができる。
[復号装置の構成]
次に符号化装置11から出力された出力符号列の供給を受け、出力符号列の復号を行なう復号装置について説明する。
そのような復号装置は、例えば図5に示すように構成される。
復号装置81は、非多重化回路91、低域復号回路92、サブバンド分割回路93、特徴量算出回路94、高域復号回路95、復号高域サブバンドパワー算出回路96、復号高域信号生成回路97、および合成回路98から構成される。
非多重化回路91は、符号化装置11から受信した出力符号列を入力符号列として、入力符号列を高域符号化データと低域符号化データに非多重化する。また、非多重化回路91は、非多重化により得られた低域符号化データを低域復号回路92に供給し、非多重化により得られた高域符号化データを高域復号回路95に供給する。
低域復号回路92は、非多重化回路91からの低域符号化データを復号し、その結果得られた復号低域信号を、サブバンド分割回路93、および合成回路98に供給する。
サブバンド分割回路93は、低域復号回路92からの復号低域信号を、所定の帯域幅を持つ複数の低域サブバンド信号に等分割し、得られた低域サブバンド信号を特徴量算出回路94および復号高域信号生成回路97に供給する。
特徴量算出回路94は、サブバンド分割回路93からの低域サブバンド信号に基づいて、低域側の各サブバンドの低域サブバンドパワーを特徴量として算出し、復号高域サブバンドパワー算出回路96に供給する。
高域復号回路95は、非多重化回路91からの高域符号化データを復号し、その結果得られた係数インデックスにより特定される推定係数を復号高域サブバンドパワー算出回路96に供給する。すなわち、高域復号回路95には予め複数の係数インデックスと、その係数インデックスにより特定される推定係数とが対応付けられて記録されており、高域復号回路95は高域符号化データに含まれる係数インデックスに対応する推定係数を出力する。
復号高域サブバンドパワー算出回路96は、高域復号回路95からの推定係数と、特徴量算出回路94からの低域サブバンドパワーとに基づいて、フレームごとに高域側の各サブバンドのサブバンドパワーの推定値である復号高域サブバンドパワーを算出する。例えば、上述した式(3)と同様の演算が行なわれて、復号高域サブバンドパワーが算出される。復号高域サブバンドパワー算出回路96は、算出した各サブバンドの復号高域サブバンドパワーを復号高域信号生成回路97に供給する。
復号高域信号生成回路97は、サブバンド分割回路93からの低域サブバンド信号と、復号高域サブバンドパワー算出回路96からの復号高域サブバンドパワーとに基づいて復号高域信号を生成し、合成回路98に供給する。
具体的には、復号高域信号生成回路97は、低域サブバンド信号の低域サブバンドパワーを算出し、復号高域サブバンドパワーと低域サブバンドパワーとの比に応じて低域サブバンド信号を振幅変調する。さらに、復号高域信号生成回路97は、振幅変調された低域サブバンド信号を周波数変調することにより、高域側の各サブバンドの復号高域サブバンド信号を生成する。このようにして得られた復号高域サブバンド信号は、入力信号の高域側の各サブバンドの高域サブバンド信号の推定値である。復号高域信号生成回路97は、得られた各サブバンドの復号高域サブバンド信号からなる復号高域信号を合成回路98に供給する。
合成回路98は、低域復号回路92からの復号低域信号と、復号高域信号生成回路97からの復号高域信号とを合成し、出力信号として出力する。この出力信号は、符号化された入力信号を復号して得られる信号であり、高域成分と低域成分からなる信号である。
なお、以上において説明した本技術は、例えばHE-AAC(国際標準規格ISO/IEC14496-3)や、AAC(MPEG2 AAC(Advanced Audio Coding))(国際標準規格ISO/IEC13818-7)などの音声符号化方式に適用することが可能である。
HE-AACでは、SBRと呼ばれる高域特徴符号化技術が用いられる。SBRでは、上述したように音声信号の符号化時に、符号化された音声信号の低域成分とともに、音声信号の高域成分を生成するためのSBR情報が出力される。
具体的には、入力信号がQMF分析フィルタにより複数のQMFサブバンドのQMFサブバンド信号に分割され、連続するQMFサブバンドが複数束ねられたサブバンドごとにパワーの代表値が求められる。このパワーの代表値が図4のステップS17の処理で算出される高域サブバンドパワーに対応する。
そして、高域の各サブバンドのパワーの代表値が量子化されてSBR情報とされ、このSBR情報と低域符号化データを含むビットストリームが出力符号列として復号装置に出力される。
また、AACでは、MDCT(Modified Discrete Cosine Transform)により時間信号が周波数領域の表現であるMDCT係数に変換され、量子化された値の情報が浮動小数表現でビットストリームに含められる。このAACにおいては、連続するMDCT係数が複数束ねられた帯域が、スケールファクターバンドと呼ばれている。
MDCT係数の浮動小数表現におけるスケールファクター(指数部)として、各スケールファクターバンドに含まれるMDCT係数に対して、それぞれ共通して1つのスケールファクターが用いられることになっている。
符号化装置は、スケールファクターバンドごとに複数のMDCT係数から代表値を求め、その代表値を適切に記述できるようにスケールファクターの値を決定し、その情報をビットストリームに含める。本技術は、複数のMDCT係数から、スケールファクターバンドごとにスケールファクターの値を決定するための代表値の算出に適用することができる。
なお、上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。
図6は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
コンピュータにおいて、CPU(Central Processing Unit)301,ROM(Read Only Memory)302,RAM(Random Access Memory)303は、バス304により相互に接続されている。
バス304には、さらに、入出力インターフェース305が接続されている。入出力インターフェース305には、キーボード、マウス、マイクロホンなどよりなる入力部306、ディスプレイ、スピーカなどよりなる出力部307、ハードディスクや不揮発性のメモリなどよりなる記録部308、ネットワークインターフェースなどよりなる通信部309、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア311を駆動するドライブ310が接続されている。
以上のように構成されるコンピュータでは、CPU301が、例えば、記録部308に記録されているプログラムを、入出力インターフェース305及びバス304を介して、RAM303にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ(CPU301)が実行するプログラムは、例えば、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)等)、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア311に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供される。
そして、プログラムは、リムーバブルメディア311をドライブ310に装着することにより、入出力インターフェース305を介して、記録部308にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部309で受信し、記録部308にインストールすることができる。その他、プログラムは、ROM302や記録部308に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
さらに、本技術は、以下の構成とすることも可能である。
[1]
入力信号の帯域分割を行なって、前記入力信号の高域側の第1のサブバンドの第1のサブバンド信号を生成するサブバンド分割部と、
前記第1のサブバンド信号に基づいて、前記第1のサブバンド信号の第1のサブバンドパワーを算出する第1のサブバンドパワー算出部と、
より大きい前記第1のサブバンドパワーにより大きな重みがかかる演算を行なって、連続するいくつかの前記第1のサブバンドからなる第2のサブバンドの信号の第2のサブバンドパワーを算出する第2のサブバンドパワー算出部と、
前記第2のサブバンドパワーに基づいて、前記入力信号の高域成分を推定により得るためのデータを生成する生成部と、
前記入力信号の低域信号を符号化して低域符号化データを生成する低域符号化部と、
前記データと前記低域符号化データとを多重化して出力符号列を生成する多重化部と
を備える符号化装置。
[2]
前記入力信号または前記低域信号から得られる特徴量に基づいて、前記第2のサブバンドパワーの推定値である擬似高域サブバンドパワーを算出する疑似高域サブバンドパワー算出部をさらに備え、
前記生成部は、前記第2のサブバンドパワーと前記擬似高域サブバンドパワーとを比較して、前記データを生成する
[1]に記載の符号化装置。
[3]
前記疑似高域サブバンドパワー算出部は、前記特徴量と、予め用意された推定係数とに基づいて前記擬似高域サブバンドパワーを算出し、
前記生成部は、複数の前記推定係数のうちの何れかを得るための前記データを生成する
[2]に記載の符号化装置。
[4]
前記データを符号化して高域符号化データを生成する高域符号化部をさらに備え、
前記多重化部は、前記高域符号化データと前記低域符号化データとを多重化して前記出力符号列を生成する
[1]乃至[3]の何れかに記載の符号化装置。
[5]
前記第2のサブバンドパワー算出部は、前記第1のサブバンドパワーのm乗値の平均値を1/m乗することにより前記第2のサブバンドパワーを算出する
[1]乃至[4]の何れかに記載の符号化装置。
[6]
前記第2のサブバンドパワー算出部は、前記第1のサブバンドパワーが大きいほどより値が大きくなる重みを用いて、前記第1のサブバンドパワーの重み付き平均値を求めることにより前記第2のサブバンドパワーを算出する
[1]乃至[4]の何れかに記載の符号化装置。
11 符号化装置, 32 低域符号化回路, 33 QMFサブバンド分割回路, 34 特徴量算出回路, 35 擬似高域サブバンドパワー算出回路, 36 擬似高域サブバンドパワー差分算出回路, 37 高域符号化回路, 38 多重化回路, 51 QMFサブバンドパワー算出部, 52 高域サブバンドパワー算出部

Claims (8)

  1. 入力信号の帯域分割を行なって、前記入力信号の高域側の第1のサブバンドの第1のサブバンド信号を生成するサブバンド分割部と、
    前記第1のサブバンド信号に基づいて、前記第1のサブバンド信号の第1のサブバンドパワーを算出する第1のサブバンドパワー算出部と、
    より大きい前記第1のサブバンドパワーにより大きな重みがかかる演算を行なって、連続するいくつかの前記第1のサブバンドからなる第2のサブバンドの信号の第2のサブバンドパワーを算出する第2のサブバンドパワー算出部と、
    前記第2のサブバンドパワーに基づいて、前記入力信号の高域成分を推定により得るためのデータを生成する生成部と、
    前記入力信号の低域信号を符号化して低域符号化データを生成する低域符号化部と、
    前記データと前記低域符号化データとを多重化して出力符号列を生成する多重化部と
    を備える符号化装置。
  2. 前記入力信号または前記低域信号から得られる特徴量に基づいて、前記第2のサブバンドパワーの推定値である擬似高域サブバンドパワーを算出する疑似高域サブバンドパワー算出部をさらに備え、
    前記生成部は、前記第2のサブバンドパワーと前記擬似高域サブバンドパワーとを比較して、前記データを生成する
    請求項1に記載の符号化装置。
  3. 前記疑似高域サブバンドパワー算出部は、前記特徴量と、予め用意された推定係数とに基づいて前記擬似高域サブバンドパワーを算出し、
    前記生成部は、複数の前記推定係数のうちの何れかを得るための前記データを生成する
    請求項2に記載の符号化装置。
  4. 前記データを符号化して高域符号化データを生成する高域符号化部をさらに備え、
    前記多重化部は、前記高域符号化データと前記低域符号化データとを多重化して前記出力符号列を生成する
    請求項3に記載の符号化装置。
  5. 前記第2のサブバンドパワー算出部は、前記第1のサブバンドパワーのm乗値の平均値を1/m乗することにより前記第2のサブバンドパワーを算出する
    請求項4に記載の符号化装置。
  6. 前記第2のサブバンドパワー算出部は、前記第1のサブバンドパワーが大きいほどより値が大きくなる重みを用いて、前記第1のサブバンドパワーの重み付き平均値を求めることにより前記第2のサブバンドパワーを算出する
    請求項4に記載の符号化装置。
  7. 入力信号の帯域分割を行なって、前記入力信号の高域側の第1のサブバンドの第1のサブバンド信号を生成し、
    前記第1のサブバンド信号に基づいて、前記第1のサブバンド信号の第1のサブバンドパワーを算出し、
    より大きい前記第1のサブバンドパワーにより大きな重みがかかる演算を行なって、連続するいくつかの前記第1のサブバンドからなる第2のサブバンドの信号の第2のサブバンドパワーを算出し、
    前記第2のサブバンドパワーに基づいて、前記入力信号の高域成分を推定により得るためのデータを生成し、
    前記入力信号の低域信号を符号化して低域符号化データを生成し、
    前記データと前記低域符号化データとを多重化して出力符号列を生成する
    ステップを含む符号化方法。
  8. 入力信号の帯域分割を行なって、前記入力信号の高域側の第1のサブバンドの第1のサブバンド信号を生成し、
    前記第1のサブバンド信号に基づいて、前記第1のサブバンド信号の第1のサブバンドパワーを算出し、
    より大きい前記第1のサブバンドパワーにより大きな重みがかかる演算を行なって、連続するいくつかの前記第1のサブバンドからなる第2のサブバンドの信号の第2のサブバンドパワーを算出し、
    前記第2のサブバンドパワーに基づいて、前記入力信号の高域成分を推定により得るためのデータを生成し、
    前記入力信号の低域信号を符号化して低域符号化データを生成し、
    前記データと前記低域符号化データとを多重化して出力符号列を生成する
    ステップを含む処理をコンピュータに実行させるプログラム。
JP2011182450A 2011-08-24 2011-08-24 符号化装置および方法、並びにプログラム Active JP5975243B2 (ja)

Priority Applications (13)

Application Number Priority Date Filing Date Title
JP2011182450A JP5975243B2 (ja) 2011-08-24 2011-08-24 符号化装置および方法、並びにプログラム
MX2014001870A MX2014001870A (es) 2011-08-24 2012-08-14 Dispositivo y metodo de codificacion, dispositivo y metodo de decodificacion, y programa.
BR112014003680A BR112014003680A2 (pt) 2011-08-24 2012-08-14 dispositivos e métodos de codificação e de decodificação, e, programa
KR1020147003662A KR102055022B1 (ko) 2011-08-24 2012-08-14 부호화 장치 및 방법, 복호 장치 및 방법, 및 프로그램
CN201280040017.9A CN103765509B (zh) 2011-08-24 2012-08-14 编码装置及方法、解码装置及方法
CA2840785A CA2840785A1 (en) 2011-08-24 2012-08-14 Encoding device and method, decoding device and method, and program
EP22202002.6A EP4156184A1 (en) 2011-08-24 2012-08-14 Encoding device and method, decoding device and method, and program
RU2014105812/08A RU2595544C2 (ru) 2011-08-24 2012-08-14 Устройство и способ кодирования, устройство и способ декодирования и программа
EP12826007.2A EP2750134B1 (en) 2011-08-24 2012-08-14 Encoding device and method, decoding device and method, and program
AU2012297805A AU2012297805A1 (en) 2011-08-24 2012-08-14 Encoding device and method, decoding device and method, and program
US14/237,990 US9361900B2 (en) 2011-08-24 2012-08-14 Encoding device and method, decoding device and method, and program
PCT/JP2012/070684 WO2013027631A1 (ja) 2011-08-24 2012-08-14 符号化装置および方法、復号装置および方法、並びにプログラム
ZA2014/01182A ZA201401182B (en) 2011-08-24 2014-02-17 Encoding device and method,decoding device and method,and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011182450A JP5975243B2 (ja) 2011-08-24 2011-08-24 符号化装置および方法、並びにプログラム

Publications (3)

Publication Number Publication Date
JP2013044923A true JP2013044923A (ja) 2013-03-04
JP2013044923A5 JP2013044923A5 (ja) 2014-10-09
JP5975243B2 JP5975243B2 (ja) 2016-08-23

Family

ID=47746378

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011182450A Active JP5975243B2 (ja) 2011-08-24 2011-08-24 符号化装置および方法、並びにプログラム

Country Status (12)

Country Link
US (1) US9361900B2 (ja)
EP (2) EP2750134B1 (ja)
JP (1) JP5975243B2 (ja)
KR (1) KR102055022B1 (ja)
CN (1) CN103765509B (ja)
AU (1) AU2012297805A1 (ja)
BR (1) BR112014003680A2 (ja)
CA (1) CA2840785A1 (ja)
MX (1) MX2014001870A (ja)
RU (1) RU2595544C2 (ja)
WO (1) WO2013027631A1 (ja)
ZA (1) ZA201401182B (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5704397B2 (ja) 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP6037156B2 (ja) 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
US10083700B2 (en) 2012-07-02 2018-09-25 Sony Corporation Decoding device, decoding method, encoding device, encoding method, and program
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
CA3162763A1 (en) 2013-12-27 2015-07-02 Sony Corporation Decoding apparatus and method, and program
KR102384790B1 (ko) 2014-08-25 2022-04-08 한국전자통신연구원 레이어드 디비전 멀티플렉싱을 이용한 방송 신호 프레임 생성 장치 및 방송 신호 프레임 생성 방법
WO2016032196A1 (ko) * 2014-08-25 2016-03-03 한국전자통신연구원 레이어드 디비전 멀티플렉싱을 이용한 방송신호 프레임 생성 장치 및 방송 신호 프레임 생성 방법
CA3065394C (en) 2015-03-06 2022-05-17 Electronics And Telecommunications Research Institute Broadcast signal frame generating apparatus and broadcast signal frame generating method using bootstrap and preamble
KR102454643B1 (ko) 2015-03-06 2022-10-17 한국전자통신연구원 부트스트랩 및 프리앰블을 이용한 방송 신호 프레임 생성 장치 및 방송 신호 프레임 생성 방법
CN112233685B (zh) * 2020-09-08 2024-04-19 厦门亿联网络技术股份有限公司 基于深度学习注意力机制的频带扩展方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005111568A1 (ja) * 2004-05-14 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法
JP2008139844A (ja) * 2006-11-09 2008-06-19 Sony Corp 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体
JP2010020251A (ja) * 2008-07-14 2010-01-28 Ntt Docomo Inc 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法
JP2010079275A (ja) * 2008-08-29 2010-04-08 Sony Corp 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム
JP2010526331A (ja) * 2007-04-30 2010-07-29 サムスン エレクトロニクス カンパニー リミテッド 高周波数領域の符号化及び復号化の方法並びに装置
WO2011043227A1 (ja) * 2009-10-07 2011-04-14 ソニー株式会社 波数帯域拡大装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5651090A (en) * 1994-05-06 1997-07-22 Nippon Telegraph And Telephone Corporation Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
WO2006049205A1 (ja) 2004-11-05 2006-05-11 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置およびスケーラブル符号化装置
JP4899359B2 (ja) * 2005-07-11 2012-03-21 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
KR100813259B1 (ko) * 2005-07-13 2008-03-13 삼성전자주식회사 입력신호의 계층적 부호화/복호화 장치 및 방법
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
JP2007333785A (ja) 2006-06-12 2007-12-27 Matsushita Electric Ind Co Ltd オーディオ信号符号化装置およびオーディオ信号符号化方法
EP2294770B1 (en) * 2008-06-20 2013-08-07 Rambus, Inc. Frequency responsive bus coding
GB0822537D0 (en) * 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
GB2466201B (en) * 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
CN101996640B (zh) * 2009-08-31 2012-04-04 华为技术有限公司 频带扩展方法及装置
JP5598536B2 (ja) * 2010-03-31 2014-10-01 富士通株式会社 帯域拡張装置および帯域拡張方法
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US8560330B2 (en) * 2010-07-19 2013-10-15 Futurewei Technologies, Inc. Energy envelope perceptual correction for high band coding
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) * 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5704397B2 (ja) 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5942358B2 (ja) * 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP6037156B2 (ja) * 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5997592B2 (ja) * 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005111568A1 (ja) * 2004-05-14 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法
JP2008139844A (ja) * 2006-11-09 2008-06-19 Sony Corp 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体
JP2010526331A (ja) * 2007-04-30 2010-07-29 サムスン エレクトロニクス カンパニー リミテッド 高周波数領域の符号化及び復号化の方法並びに装置
JP2010020251A (ja) * 2008-07-14 2010-01-28 Ntt Docomo Inc 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法
JP2010079275A (ja) * 2008-08-29 2010-04-08 Sony Corp 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム
WO2011043227A1 (ja) * 2009-10-07 2011-04-14 ソニー株式会社 波数帯域拡大装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム

Also Published As

Publication number Publication date
BR112014003680A2 (pt) 2017-03-01
RU2595544C2 (ru) 2016-08-27
JP5975243B2 (ja) 2016-08-23
CA2840785A1 (en) 2013-02-24
EP2750134A1 (en) 2014-07-02
RU2014105812A (ru) 2015-08-27
KR20140050054A (ko) 2014-04-28
WO2013027631A1 (ja) 2013-02-28
US9361900B2 (en) 2016-06-07
ZA201401182B (en) 2014-09-25
AU2012297805A1 (en) 2014-02-06
CN103765509B (zh) 2016-06-22
MX2014001870A (es) 2014-05-30
CN103765509A (zh) 2014-04-30
EP2750134A4 (en) 2015-04-29
EP2750134B1 (en) 2022-11-16
EP4156184A1 (en) 2023-03-29
KR102055022B1 (ko) 2019-12-11
US20140200900A1 (en) 2014-07-17

Similar Documents

Publication Publication Date Title
JP5975243B2 (ja) 符号化装置および方法、並びにプログラム
US10546594B2 (en) Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
JP5942358B2 (ja) 符号化装置および方法、復号装置および方法、並びにプログラム
JP6037156B2 (ja) 符号化装置および方法、並びにプログラム
US9691410B2 (en) Frequency band extending device and method, encoding device and method, decoding device and method, and program
JP5400059B2 (ja) オーディオ信号処理方法及び装置
US8949119B2 (en) Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
JP5788833B2 (ja) オーディオ信号の符号化方法、オーディオ信号の復号化方法及び記録媒体
KR101428487B1 (ko) 멀티 채널 부호화 및 복호화 방법 및 장치
JP6508551B2 (ja) 復号装置および方法、並びにプログラム
JP2004004530A (ja) 符号化装置、復号化装置およびその方法
JP2007333785A (ja) オーディオ信号符号化装置およびオーディオ信号符号化方法
JP6042900B2 (ja) 音声信号の帯域選択的量子化方法及び装置
KR101387808B1 (ko) 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
JP2016035501A (ja) 音声符号化装置、音声符号化方法、音声符号化用コンピュータプログラム、音声復号装置、音声復号方法及び音声復号用コンピュータプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140822

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140822

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160623

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160706

R151 Written notification of patent or utility model registration

Ref document number: 5975243

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250