JP2013044921A - 符号化装置および方法、並びにプログラム - Google Patents

符号化装置および方法、並びにプログラム Download PDF

Info

Publication number
JP2013044921A
JP2013044921A JP2011182448A JP2011182448A JP2013044921A JP 2013044921 A JP2013044921 A JP 2013044921A JP 2011182448 A JP2011182448 A JP 2011182448A JP 2011182448 A JP2011182448 A JP 2011182448A JP 2013044921 A JP2013044921 A JP 2013044921A
Authority
JP
Japan
Prior art keywords
band
sub
high frequency
frequency
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011182448A
Other languages
English (en)
Other versions
JP5942358B2 (ja
JP2013044921A5 (ja
Inventor
Yuki Yamamoto
優樹 山本
Toru Chinen
徹 知念
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2011182448A priority Critical patent/JP5942358B2/ja
Application filed by Sony Corp filed Critical Sony Corp
Priority to KR1020147003279A priority patent/KR20140050044A/ko
Priority to EP12825891.0A priority patent/EP2750132A4/en
Priority to PCT/JP2012/070682 priority patent/WO2013027629A1/ja
Priority to CN201280040030.4A priority patent/CN103733258B/zh
Priority to BR112014003676A priority patent/BR112014003676A2/pt
Priority to US14/237,933 priority patent/US9390717B2/en
Publication of JP2013044921A publication Critical patent/JP2013044921A/ja
Publication of JP2013044921A5 publication Critical patent/JP2013044921A5/ja
Application granted granted Critical
Publication of JP5942358B2 publication Critical patent/JP5942358B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】より少ない符号量で高音質な音声を得ることができるようにする。
【解決手段】符号化装置は、入力信号の低域成分を符号化して得られた低域符号化データと、入力信号の高域成分を推定により求めるための推定係数を含むデータを符号化して得られる高域符号化データとを多重化して出力する。入力信号の符号化時には、算出部は処理対象のフレームの直前のフレームで選択された推定係数と、入力信号の高域成分とから高域成分のパワーの推定値である擬似高域サブバンドパワーを算出する。そして、判定部は、算出された擬似高域サブバンドパワーと、実際の高域成分のパワーとの比較結果に基づいて、処理対象のフレームにおいて、直前のフレームの推定係数の再利用が可能か否かを判定する。本技術は、符号化装置に適用することができる。
【選択図】図5

Description

本技術は符号化装置および方法、並びにプログラムに関し、特に、より少ない符号量で高音質な音声を得ることができるようにした符号化装置および方法、並びにプログラムに関する。
従来、音声信号の符号化手法として、HE-AAC(High Efficiency MPEG(Moving Picture Experts Group)4 AAC(Advanced Audio Coding))(国際標準規格ISO/IEC14496-3)や、AAC(MPEG2 AAC)(国際標準規格ISO/IEC13818-7)などが知られている。
例えば音声信号の符号化手法として、低域成分を符号化して得られた低域符号化情報と、低域成分および高域成分から生成された、高域成分の推定値を得るための高域符号化情報とを符号化で得られた符号として出力する手法が提案されている(例えば、特許文献1参照)。この手法では、高域符号化情報には、高域の周波数成分を得るためのスケールファクタ、振幅調整係数、スペクトル残差など、高域成分の推定値を算出するのに必要となる情報が含まれている。
また、復号の際には低域符号化情報を復号して得られる低域成分と、高域符号化情報を復号して得られる情報とに基づいて高域成分が推定され、推定により得られた高域成分と、復号で得られた低域成分とが合成されて復号で得られた音声信号とされる。
このような符号化手法では、高域成分の推定値を得るための情報だけを高域の信号成分に関する情報として符号化するので、音質の劣化を抑えつつ、符号化効率を向上させることができる。
国際公開第WO2006/049205号
しかしながら、上述した技術では復号時に高音質な音声を得ることはできるが、音声信号の処理単位ごとに高域成分の推定値を算出するための情報を生成しなければならず、高域符号化情報の符号量が充分に少ないとはいえなかった。
本技術は、このような状況に鑑みてなされたものであり、より少ない符号量で高音質な音声を得ることができるようにするものである。
本技術の一側面の符号化装置は、入力信号の帯域分割を行なって、前記入力信号の高域側のサブバンドの高域サブバンド信号を生成するサブバンド分割部と、前記入力信号の低域信号から得られた特徴量と、予め用意された複数の推定係数のうちの前記入力信号の処理対象のフレームの直前のフレームで選択された推定係数とに基づいて、前記処理対象のフレームの前記高域サブバンド信号の高域サブバンドパワーの推定値である擬似高域サブバンドパワーを算出する算出部と、前記擬似高域サブバンドパワーと、前記高域サブバンド信号から得られた前記高域サブバンドパワーとに基づいて、前記処理対象のフレームにおいて、前記直前のフレームの前記推定係数が再利用可能であるとされた場合、前記再利用可能であるとされた前記推定係数を得るためのデータを生成する生成部と、前記低域信号を符号化して低域符号化データを生成する低域符号化部と、前記データと前記低域符号化データとを多重化して出力符号列を生成する多重化部とを備える。
符号化装置には、前記複数の前記推定係数ごとに、前記特徴量と前記推定係数とに基づいて前記擬似高域サブバンドパワーを算出する擬似高域サブバンドパワー算出部と、前記擬似高域サブバンドパワー算出部により算出された前記擬似高域サブバンドパワーと、前記高域サブバンドパワーとを比較し、前記複数の前記推定係数のうちの何れかを選択する選択部とをさらに設け、前記生成部には、前記直前のフレームの前記推定係数が再利用可能でないとされた場合、前記選択部により選択された前記推定係数を得るための前記データを生成させることができる。
符号化装置には、前記データを符号化して高域符号化データを生成する高域符号化部をさらに設け、前記多重化部には、前記高域符号化データと前記低域符号化データとを多重化させて前記出力符号列を生成させることができる。
高域側のサブバンドの前記擬似高域サブバンドパワーと前記高域サブバンドパワーとの差分の二乗和が所定の閾値以下である場合、前記推定係数が再利用可能であるとすることができる。
高域側のサブバンドの前記擬似高域サブバンドパワーと前記高域サブバンドパワーとに基づいて算出された、前記擬似高域サブバンドパワーと前記高域サブバンドパワーの類似の度合いを示す評価値と所定の閾値との比較結果に応じて、前記推定係数が再利用可能であるとすることができる。
本技術の一側面の符号化方法またはプログラムは、入力信号の帯域分割を行なって、前記入力信号の高域側のサブバンドの高域サブバンド信号を生成し、前記入力信号の低域信号から得られた特徴量と、予め用意された複数の推定係数のうちの前記入力信号の処理対象のフレームの直前のフレームで選択された推定係数とに基づいて、前記処理対象のフレームの前記高域サブバンド信号の高域サブバンドパワーの推定値である擬似高域サブバンドパワーを算出し、前記擬似高域サブバンドパワーと、前記高域サブバンド信号から得られた前記高域サブバンドパワーとに基づいて、前記処理対象のフレームにおいて、前記直前のフレームの前記推定係数が再利用可能であるとされた場合、前記再利用可能であるとされた前記推定係数を得るためのデータを生成し、前記低域信号を符号化して低域符号化データを生成し、前記データと前記低域符号化データとを多重化して出力符号列を生成するステップを含む。
本技術の一側面においては、入力信号の帯域分割が行なわれて、前記入力信号の高域側のサブバンドの高域サブバンド信号が生成され、前記入力信号の低域信号から得られた特徴量と、予め用意された複数の推定係数のうちの前記入力信号の処理対象のフレームの直前のフレームで選択された推定係数とに基づいて、前記処理対象のフレームの前記高域サブバンド信号の高域サブバンドパワーの推定値である擬似高域サブバンドパワーが算出され、前記擬似高域サブバンドパワーと、前記高域サブバンド信号から得られた前記高域サブバンドパワーとに基づいて、前記処理対象のフレームにおいて、前記直前のフレームの前記推定係数が再利用可能であるとされた場合、前記再利用可能であるとされた前記推定係数を得るためのデータが生成され、前記低域信号を符号化して低域符号化データが生成され、前記データと前記低域符号化データとが多重化されて出力符号列が生成される。
本技術の一側面によれば、より少ない符号量で高音質な音声を得ることができる。
入力信号のサブバンドについて説明するための図である。 可変長方式による高域成分の符号化について説明する図である。 固定長方式による高域成分の符号化について説明する図である。 係数インデックスの再利用について説明する図である。 本技術を適用した符号化装置の構成例を示す図である。 符号化処理について説明するフローチャートである。 符号化処理について説明するフローチャートである。 復号装置の構成例を示す図である。 コンピュータの構成例を示す図である。
以下、図面を参照して、本技術を適用した実施の形態について説明する。
〈本技術の概要〉
[入力信号の符号化について]
本技術は、例えば音楽信号などの音声信号を入力信号として、入力信号の符号化を行なうものである。
入力信号の符号化を行なう符号化装置では、符号化時において図1に示すように、入力信号は所定の帯域幅の複数の周波数帯域(以下、サブバンドと称する)のサブバンド信号に分割される。なお、図1において、縦軸は入力信号の各周波数のパワーを示しており、横軸は入力信号の各周波数を示している。また、曲線C11は入力信号の各周波数成分のパワーを示しており、図中、縦方向の点線は各サブバンドの境界位置を示している。
入力信号が各サブバンドのサブバンド信号に分割されると、入力信号の周波数成分のうち、予め定められた周波数以下の低域側の成分が、所定の符号化方式により符号化され、低域符号化データが生成される。
図1の例では、各サブバンドを特定するインデックスがsbであるサブバンドsbの上限の周波数以下の周波数のサブバンドが入力信号の低域成分とされており、サブバンドsbの上限の周波数よりも高い周波数のサブバンドが入力信号の高域成分とされている。
低域符号化データが得られると、次に入力信号の低域成分と高域成分とに基づいて、高域成分の各サブバンドのサブバンド信号を再現するための情報が生成され、その情報が、適宜、所定の符号化方式により符号化されて高域符号化データが生成される。
具体的には、周波数方向に連続して並ぶ低域側の最も周波数が高い4つのサブバンドsb−3乃至サブバンドsbの成分と、高域側の連続して並ぶ(eb-(sb+1)+1)個のサブバンドsb+1乃至サブバンドebの成分とから、高域符号化データが生成される。
ここで、サブバンドsb+1はサブバンドsbに隣接する、最も低域側に位置する高域のサブバンドであり、サブバンドebは、連続して並ぶサブバンドsb+1乃至サブバンドebのうちの最も周波数が高いサブバンドである。
高域成分の符号化で得られる高域符号化データは、高域側のサブバンドib(但し、sb+1≦ib≦eb)のサブバンド信号を推定により生成するための情報であり、高域符号化データには、各サブバンド信号の推定に用いられる推定係数を得るための係数インデックスが含まれている。
すなわち、サブバンドibのサブバンド信号の推定には、低域側のサブバンドkb(但し、sb−3≦kb≦sb)のサブバンド信号のパワーに乗算される係数Aib(kb)と、定数項である係数Bibからなる推定係数が用いられる。高域符号化データに含まれる係数インデックスは、各サブバンドibの係数Aib(kb)と係数Bibからなる推定係数のセットを得るための情報、例えば推定係数のセットを特定する情報である。
以上のようにして低域符号化データと高域符号化データが得られると、それらの低域符号化データと高域符号化データが多重化されて出力符号列とされ、出力される。
このように高域符号化データに、推定係数を得るための係数インデックスを含めるようにすることで、フレームごとに高域成分を算出するためのスケールファクタや振幅調整係数などを含める場合と比べて、高域符号化データの符号量を大幅に削減することができる。
また、出力符号列の供給を受けた復号装置は、低域符号化データを復号して低域側の各サブバンドのサブバンド信号からなる復号低域信号を得るとともに、復号低域信号と、高域符号化データを復号して得られた情報とから高域側の各サブバンドのサブバンド信号を推定により生成する。そして、復号装置は、推定により得られた高域側の各サブバンドのサブバンド信号からなる復号高域信号と、復号低域信号とから出力信号を生成する。このようにして得られた出力信号は、符号化された入力信号を復号することで得られた音声信号である。
[出力符号列について]
ところで、入力信号の符号化では入力信号の所定の時間長の区間ごと、すなわちフレームごとに、予め用意された複数の推定係数のなかから、処理対象となっているフレームに対して適切な推定係数(係数インデックス)が選択される。
符号化装置では、各フレームの係数インデックスをそのまま高域符号化データに含めるのではなく、時間方向において係数インデックスが変化する時間の情報と、変化した係数インデックスの値を高域符号化データに含めることで更なる符号量の削減が図られている。
特に、入力信号が、各周波数成分の時間方向への変動が少ない定常信号である場合には、選択された推定係数、すなわち係数インデックスは時間方向に同じものが連続して続くことが多い。そこで、高域符号化データに含まれる係数インデックスの時間方向の情報量を削減するために、適宜、可変長方式と固定長方式とが切り替えられながら、入力信号の高域成分の符号化が行なわれる。
[可変長方式について]
以下、可変長方式と固定長方式による高域成分の符号化について説明する。
高域成分の符号化時には、予め定められた所定のフレーム長の区間ごとに、可変長方式と固定長方式の切り替えが行なわれる。例えば、以下では16フレームごとに可変長方式と固定長方式の切り替えが行なわれるものとして説明を続けることとし、入力信号の16フレーム分の区間を処理対象区間とも称することとする。つまり、符号化装置では、処理対象区間である16フレームを単位として、出力符号列が出力される。
まず、可変長方式について説明する。可変長方式による高域成分の符号化では、方式フラグ、係数インデックス、区間情報、および個数情報からなるデータが符号化され、高域符号化データとされる。
なお、方式フラグは、高域符号化データを生成する方式を示す情報、すなわち高域成分の符号化時に可変長方式と固定長方式の何れの方式が選択されたかを示す情報である。
また、区間情報とは、処理対象区間に含まれる連続するフレームからなる区間であって、同じ係数インデックスが選択されたフレームからなる区間(以下、連続フレーム区間とも称する)の長さを示す情報である。さらに、個数情報とは、処理対象区間に含まれる連続フレーム区間の個数を示す情報である。
例えば、可変長方式では図2に示すように位置FST1から位置FSE1までの間に含まれる16フレームの区間が1つの処理対象区間とされる。なお、図2において、図中、横方向は時間を示しており、1つの四角形は1つのフレームを表している。また、フレームを表す四角形内の数値は、そのフレームについて選択された推定係数を特定する係数インデックスの値を示している。
可変長方式による高域成分の符号化では、まず、処理対象区間が、同じ係数インデックスが選択された、連続するフレームからなる連続フレーム区間に分割される。すなわち、異なる係数インデックスが選択された、互いに隣接するフレームの境界位置が、各連続フレーム区間の境界位置とされる。
この例では、処理対象区間は、位置FST1から位置FC1の区間、位置FC1から位置FC2の区間、および位置FC2から位置FSE1の区間の3つの区間に分割される。例えば、位置FST1から位置FC1までの連続フレーム区間では、各フレームにおいて、同じ係数インデックス「2」が選択されている。
このようにして処理対象区間が連続フレーム区間に分割されると、処理対象区間内の連続フレーム区間数を示す個数情報、各連続フレーム区間で選択された係数インデックス、各連続フレーム区間の長さを示す区間情報、および方式フラグからなるデータが生成される。
ここでは、処理対象区間は3つの連続フレーム区間に分割されているので、連続フレーム区間数「3」を示す情報が個数情報とされる。図2では個数情報が「num_length=3」で表されている。
また、例えば処理対象区間内の最初の連続フレーム区間の区間情報は、その連続フレーム区間のフレームを単位とする長さ「5」とされ、図2では「length0=5」で表されている。なお、各区間情報は、処理対象区間の先頭から何番目にある連続フレーム区間の区間情報であるかが特定できるようにされている。換言すれば、区間情報には、処理対象区間内における連続フレーム区間の位置を特定するための情報も含まれている。
このようにして、処理対象区間について個数情報、係数インデックス、区間情報、および方式フラグからなるデータが生成されると、このデータが符号化されて高域符号化データとされる。このとき、符号化されるデータには、連続フレーム区間ごとに係数インデックスが含まれるようにされる。この場合、複数フレームで連続して同じ係数インデックスが選択されるときには、フレームごとに係数インデックスを送信する必要がなくなるので、伝送する出力符号列のデータ量を削減し、より効率的に符号化,復号を行なうことができる。
[固定長方式について]
次に、固定長方式による高域成分の符号化について説明する。
固定長方式では図3に示すように、16フレームからなる処理対象区間が、所定のフレーム数からなる区間(以下、固定長区間と称する)に等分割される。なお、図3において、横方向は時間を示しており、1つの四角形は1つのフレームを表している。また、フレームを表す四角形内の数値は、そのフレームについて選択された推定係数を特定する係数インデックスの値を示している。さらに、図3において、図2における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
固定長方式においては、処理対象区間がいくつかの固定長区間に分割される。このとき、固定長区間の長さは、固定長区間内の各フレームで選択されている係数インデックスが同じであり、かつ固定長区間の長さが最も長くなるように定められる。
図3の例では、固定長区間の長さ(以下、単に固定長とも称する)は、4フレームとされており、処理対象区間は4つの固定長区間に等分されている。すなわち、処理対象区間は、位置FST1から位置FC21までの区間、位置FC21から位置FC22までの区間、位置FC22から位置FC23までの区間、および位置FC23から位置FSE1までの区間に分割される。これらの固定長区間における係数インデックスは、処理対象区間の先頭の固定長区間から順番に、係数インデックス「1」,「2」,「2」,「3」とされている。
このようにして、処理対象区間がいくつかの固定長区間に分割されると、処理対象区間内の固定長区間の固定長を示す固定長インデックス、係数インデックス、切り替わりフラグ、および方式フラグからなるデータが生成される。
ここで、切り替わりフラグとは、固定長区間の境界位置、つまり所定の固定長区間の最後のフレームと、その固定長区間の次の固定長区間の先頭のフレームとで、係数インデックスが変化したか否かを示す情報である。例えば、i番目(i=0,1,2,・・・)の切り替わりフラグgridflg_iは、処理対象区間の先頭から(i+1)番目と(i+2)番目の固定長区間の境界位置において、係数インデックスが変化した場合「1」とされ、変化していない場合「0」とされる。
図3の例では、処理対象区間の1番目の固定長区間の境界位置(位置FC21)の切り替わりフラグgridflg_0は、1番目の固定長区間の係数インデックス「1」と、2番目の固定長区間の係数インデックス「2」とが異なるため「1」とされている。また、位置FC22の切り替わりフラグgridflg_1は、2番目の固定長区間の係数インデックス「2」と、3番目の固定長区間の係数インデックス「2」とが同じであるため「0」とされている。
さらに、固定長インデックスの値は、固定長から求められる値などとされる。具体的には、例えば固定長インデックスlength_idは、固定長fixed_length=16/2length_idを満たす値とされる。図3の例では、固定長fixed_length=4であるので、固定長インデックスlength_id=2とされている。
処理対象区間が固定長区間に分割され、固定長インデックス、係数インデックス、切り替わりフラグ、および方式フラグからなるデータが生成されると、このデータが符号化されて高域符号化データとされる。
図3の例では、位置FC21乃至位置FC23における切り替わりフラグgridflg_0=1、gridflg_1=0、およびgridflg_2=1と、固定長インデックスlength_id=2、各固定長区間の係数インデックス「1」,「2」,「3」、および固定長方式である旨の方式フラグとからなるデータが符号化されて、高域符号化データとされる。
ここで、各固定長区間の境界位置の切り替わりフラグは、処理対象区間の先頭から何番目にある境界位置の切り替わりフラグであるかが特定できるようにされている。換言すれば、切り替わりフラグには、処理対象区間内における固定長区間の境界位置を特定するための情報も含まれている。
また、高域符号化データに含まれる各係数インデックスは、それらの係数インデックスが選択された順番、つまり固定長区間が並ぶ順番に並べられている。例えば、図3の例では、係数インデックス「1」,「2」,「3」の順に並べられて、それらの係数インデックスが符号化データに含められる。
なお、図3の例では、処理対象区間の先頭から2番目と3番目の固定長区間の係数インデックスが「2」であるが、高域符号化データには、係数インデックス「2」が1つだけ含まれるようにされる。連続する固定長区間の係数インデックスが同じである場合、すなわち連続する固定長区間の境界位置における切り替わりフラグが0の場合には、それらの固定長区間の数だけ同じ係数インデックスが高域符号化データに含まれるのではなく、1つの係数インデックスが高域符号化データに含まれることになる。
このように、固定長インデックス、係数インデックス、切り替わりフラグ、および方式フラグからなるデータから高域符号化データを生成すれば、フレームごとに係数インデックスを送信する必要がなくなるので、伝送する出力符号列のデータ量を削減することができる。これにより、より効率的に符号化,復号を行なうことができる。
[推定係数の再利用について]
また、入力信号の符号化時においては、処理対象となっているフレームの推定係数、つまり係数インデックスを選択するときに、処理対象のフレームの直前のフレームで選択された係数インデックスが再利用可能であるか否かが判定され、適宜再利用が行なわれる。
すなわち、例えば図4に示すように、処理対象区間内の最初のフレームで係数インデックス「2」が選択されたとする。なお、図4において、横方向は時間を示しており、1つの四角形は1つのフレームを表している。また、フレームを表す四角形内の数値は、そのフレームの推定係数を特定する係数インデックスを示している。
処理対象区間内の最初のフレームで係数インデックス「2」が選択されると、次のフレームの係数インデックスの選択が行なわれるが、このとき直前のフレームの係数インデックス「2」の再利用が可能であるか否かが判定される。
例えば、現時点で処理対象となっている処理対象区間の2番目のフレームについて、係数インデックス「2」により特定される推定係数が用いられて、2番目のフレームの高域成分が推定され、その推定結果と実際の高域成分とが比較される。
そして、比較の結果、係数インデックス「2」により特定される推定係数を用いて、充分な推定精度で高域成分が得られる場合には、その推定係数の係数インデックスの再利用が可能であると判定され、2番目のフレームの係数インデックスが「2」とされる。図4の例では、処理対象区間の先頭から2番目のフレームの係数インデックスは、その直前のフレームの係数インデックスと同じ「2」となっている。
これに対して、推定により得られた高域成分と、実際の高域成分との比較の結果、充分な推定精度で高域成分が得られなかった場合には、予め用意された複数の推定係数のうちの最も適した推定係数の係数インデックスが選択される。
例えば、処理対象区間内の先頭から4番目のフレームでは、その直前のフレームの係数インデックスの再利用が可能でないと判定されたため、3番目のフレームの係数インデックス「2」とは異なる係数インデックス「3」が選択されている。
このように、各フレームについて、直前のフレームの係数インデックスにより特定される推定係数を用いて高域成分の推定を行った場合に、充分な推定精度が得られるときには、直前のフレームの係数インデックスが再利用される。このような係数インデックスの再利用によって、フレームごとに選択される係数インデックスが、時間方向に必要以上に変化することを防止することができる。
これにより、連続フレーム区間がより長くなるので、処理対象区間の高域符号化データに含まれる係数インデックスの数等をより少なくすることができ、高域符号化データのデータ量をより少なくすることができる。
また、推定係数によって高域成分の推定誤差等の特性が異なるため、係数インデックスの時間方向での変動が必要以上に多いと、復号で得られる音声信号には、復号前の入力信号にはない不自然な周波数包絡の時間変動が生じ、聴感上、音質が劣化してしまう。このような音質の劣化は、高域成分の時間変動が少ない定常的な音声信号ほど顕著である。
しかし、本技術のように、充分な推定精度が得られる場合に係数インデックスを再利用すれば、係数インデックスが必要以上に変動することを防止することができるので、復号で得られる音声の高域成分の不自然な変動を抑制し、音質を向上させることができる。
〈第1の実施の形態〉
[符号化装置の構成例]
次に、以上において説明した入力信号の符号化技術の具体的な実施の形態について説明する。まず、入力信号の符号化を行なう符号化装置の構成について説明する。図5は、符号化装置の構成例を示す図である。
符号化装置11は、低域通過フィルタ31、低域符号化回路32、サブバンド分割回路33、特徴量算出回路34、擬似高域サブバンドパワー算出回路35、擬似高域サブバンドパワー差分算出回路36、高域符号化回路37、および多重化回路38から構成される。符号化装置11では、符号化対象の入力信号が低域通過フィルタ31およびサブバンド分割回路33に供給される。
低域通過フィルタ31は、供給された入力信号を所定の遮断周波数でフィルタリングし、その結果得られた、遮断周波数より低域の信号(以下、低域信号と称する)を、低域符号化回路32およびサブバンド分割回路33に供給する。
低域符号化回路32は、低域通過フィルタ31からの低域信号を符号化し、その結果得られた低域符号化データを多重化回路38に供給する。
サブバンド分割回路33は、低域通過フィルタ31からの低域信号を複数のサブバンドのサブバンド信号(以下、低域サブバンド信号とも称する)に等分割し、これにより得られた低域サブバンド信号を特徴量算出回路34に供給する。低域サブバンド信号は、入力信号の低域側の各サブバンドの信号である。
また、サブバンド分割回路33は、供給された入力信号を複数のサブバンドのサブバンド信号に等分割し、これにより得られたサブバンド信号のうち、高域側の所定の帯域に含まれる各サブバンドのサブバンド信号を、擬似高域サブバンドパワー差分算出回路36に供給する。なお、以下、サブバンド分割回路33から擬似高域サブバンドパワー差分算出回路36に供給される各サブバンドのサブバンド信号を、高域サブバンド信号とも称する。
特徴量算出回路34は、サブバンド分割回路33からの低域サブバンド信号に基づいて特徴量を算出し、擬似高域サブバンドパワー算出回路35、および擬似高域サブバンドパワー差分算出回路36に供給する。
擬似高域サブバンドパワー算出回路35は、特徴量算出回路34からの特徴量に基づいて、高域サブバンド信号のパワーの推定値(以下、擬似高域サブバンドパワーとも称する)を算出し、擬似高域サブバンドパワー差分算出回路36に供給する。なお、擬似高域サブバンドパワー算出回路35には、統計学習により得られた推定係数のセットが複数記録されており、擬似高域サブバンドパワーは、推定係数と特徴量に基づいて算出される。
擬似高域サブバンドパワー差分算出回路36は、サブバンド分割回路33から供給された高域サブバンド信号のパワー(以下、高域サブバンドパワーとも称する)を算出し、これと、擬似高域サブバンドパワーとの差分を示す擬似高域サブバンドパワー差分の二乗和を算出する。
擬似高域サブバンドパワー差分算出回路36は、算出部51、判定部52、および生成部53を備えている。
算出部51は、処理対象のフレームの直前のフレームで選択された係数インデックスにより特定される推定係数を擬似高域サブバンドパワー算出回路35から取得し、取得した推定係数と、特徴量算出回路34からの特徴量に基づいて擬似高域サブバンドパワーを算出する。擬似高域サブバンドパワー差分算出回路36は、適宜、算出部51により算出された擬似高域サブバンドパワー、または擬似高域サブバンドパワー算出回路35から供給された擬似高域サブバンドパワーの何れかを用いて、擬似高域サブバンドパワー差分の二乗和を算出する。
判定部52は、算出部51により算出された擬似高域サブバンドパワーが用いられて算出された擬似高域サブバンドパワー差分の二乗和に基づいて、係数インデックスの再利用が可能であるか否かを判定する。擬似高域サブバンドパワー差分算出回路36は、擬似高域サブバンドパワー差分の二乗和と、判定部52による判定結果とに基づいて、入力信号のフレームごとに係数インデックスを選択する。
生成部53は、入力信号の処理対象区間の各フレームにおける係数インデックスの選択結果に基づいて、可変長方式または固定長方式の切り替えを行い、選択された方式で高域符号化データを得るためのデータを生成し、高域符号化回路37に供給する。
高域符号化回路37は、擬似高域サブバンドパワー差分算出回路36から供給されたデータを符号化し、その結果得られる高域符号化データを多重化回路38に供給する。多重化回路38は、低域符号化回路32からの低域符号化データと、高域符号化回路37からの高域符号化データとを多重化し、出力符号列として出力する。
[符号化処理の説明]
図5に示した符号化装置11は、入力信号が供給されて、入力信号の符号化が指示されると符号化処理を行なって、復号装置に出力符号列を出力する。以下、図6および図7のフローチャートを参照して、符号化装置11による符号化処理について説明する。なお、この符号化処理は、予め定められたフレーム数、つまり処理対象区間ごとに行なわれる。
ステップS11において、低域通過フィルタ31は、供給された処理対象のフレームの入力信号を所定の遮断周波数でフィルタリングし、その結果得られた低域信号を低域符号化回路32およびサブバンド分割回路33に供給する。
ステップS12において、低域符号化回路32は、低域通過フィルタ31から供給された低域信号を符号化し、その結果得られた低域符号化データを多重化回路38に供給する。
ステップS13において、サブバンド分割回路33は、入力信号および低域信号を所定の帯域幅の複数のサブバンド信号に等分割する。
すなわち、サブバンド分割回路33は、供給された入力信号を各サブバンドのサブバンド信号に分割し、これにより得られた高域側のサブバンドsb+1乃至サブバンドebの各サブバンド信号を擬似高域サブバンドパワー差分算出回路36に供給する。
また、サブバンド分割回路33は、低域通過フィルタ31から供給された低域信号を各サブバンドのサブバンド信号に分割し、これにより得られた低域側のサブバンドsb−3乃至サブバンドsbの各サブバンド信号を特徴量算出回路34に供給する。
ステップS14において、特徴量算出回路34は、サブバンド分割回路33から供給された低域サブバンド信号に基づいて特徴量を算出し、擬似高域サブバンドパワー算出回路35、および擬似高域サブバンドパワー差分算出回路36に供給する。
例えば、特徴量として各低域サブバンド信号のパワーが算出される。なお、以下、低域サブバンド信号のパワーを特に低域サブバンドパワーとも称することとする。また、低域サブバンド信号や高域サブバンド信号など、各サブバンドのサブバンド信号のパワーを、適宜、サブバンドパワーとも称することとする。
具体的には、特徴量算出回路34は、次式(1)を計算することで、デシベルで表現される処理対象のフレームJのサブバンドib(但し、sb−3≦ib≦sb)のサブバンドパワーpower(ib,J)を算出する。
Figure 2013044921
なお、式(1)においてx(ib,n)は、サブバンドibのサブバンド信号の値(サンプルのサンプル値)を示しており、x(ib,n)におけるnは、離散時間のインデックスを示している。また、式(1)におけるFSIZEは、1フレームを構成するサブバンド信号のサンプル数を示している。
したがって、フレームJの低域サブバンドパワーpower(ib,J)は、フレームJを構成する低域サブバンド信号の各サンプルのサンプル値の二乗平均値を対数化することにより算出される。なお、以下では、特徴量算出回路34において、特徴量として低域サブバンドパワーが算出されるものとして説明を続ける。
ステップS15において、算出部51は特徴量算出回路34から供給された特徴量としての低域サブバンドパワーと、処理対象となっているフレームJの直前のフレーム(J−1)で選択された係数インデックスとに基づいて、擬似高域サブバンドパワーを算出する。
例えば、算出部51は、直前のフレーム(J−1)で選択された係数インデックスにより特定される推定係数のセットを擬似高域サブバンドパワー算出回路35から取得する。
そして、算出部51は、取得した推定係数と、低域サブバンドパワーpower(ib,J)とから次式(2)を計算し、高域側の各サブバンドの擬似高域サブバンドパワーpowerest(ib,J)(但し、sb+1≦ib≦eb)を算出する。
Figure 2013044921
なお、式(2)において、係数Aib(kb)および係数Bibは、高域側のサブバンドibについて用意された推定係数のセットを示している。すなわち、係数Aib(kb)は、サブバンドkb(但し、sb−3≦kb≦sb)の低域サブバンドパワーpower(kb,J)に乗算される係数であり、係数Bibは、サブバンドkbのサブバンドパワーを線形結合するときに用いられる定数項である。
したがって、高域側のサブバンドibの擬似高域サブバンドパワーpowerest(ib,J)は、低域側の各サブバンドの低域サブバンドパワーに、サブバンドごとの係数Aib(kb)を乗算し、係数が乗算された低域サブバンドパワーの和に、さらに係数Bibを加算することで得られる。
ステップS16において、擬似高域サブバンドパワー差分算出回路36は、サブバンド分割回路33から供給された高域サブバンド信号と、算出部51により算出された擬似高域サブバンドパワーとに基づいて、擬似高域サブバンドパワー差分を算出する。
より具体的には擬似高域サブバンドパワー差分算出回路36は、サブバンド分割回路33からの高域サブバンド信号について、上述した式(1)と同様の演算を行い、フレームJにおける高域サブバンドパワーpower(ib,J)(但し、sb+1≦ib≦eb)を算出する。
そして、擬似高域サブバンドパワー差分算出回路36は、次式(3)を計算することで、高域サブバンドパワーpower(ib,J)と、擬似高域サブバンドパワーpowerest(ib,J)との差分である擬似高域サブバンドパワー差分powerdiff(ib,J)を算出する。
Figure 2013044921
ステップS17において、擬似高域サブバンドパワー差分算出回路36は、高域側の各サブバンドib(但し、sb+1≦ib≦eb)について求めた擬似高域サブバンドパワー差分を用いて次式(4)を計算し、擬似高域サブバンドパワー差分の二乗和を算出する。
Figure 2013044921
なお、式(4)において、差分二乗和E(J,id(J-1))は、処理対象のフレームJの直前のフレーム(J−1)において選択された係数インデックスid(J-1)により特定される推定係数について求められた、フレームJの擬似高域サブバンドパワー差分の二乗和を示している。
また、式(4)において、powerdiff(ib,J,id(J-1))は、係数インデックスid(J-1)により特定される推定係数について求められた、フレームJの高域側のサブバンドibの擬似高域サブバンドパワー差分powerdiff(ib,J)を示している。
このようにして得られた差分二乗和E(J,id(J-1))は、実際の高域サブバンド信号から算出されたフレームJの高域サブバンドパワーと、直前のフレーム(J−1)で選択された係数インデックスにより特定される推定係数を用いて算出された擬似高域サブバンドパワーとの類似の度合いを示している。
つまり、高域サブバンドパワーの真値に対する推定値の誤差を示している。したがって、差分二乗和E(J,id(J-1))が小さいほど、推定係数を用いた演算により、実際の入力信号の高域成分に、より近い信号が得られることになる。
したがって、フレームJについて算出された差分二乗和E(J,id(J-1))がある程度小さい場合には、フレームJにおいて、直前のフレーム(J−1)で選択された推定係数を用いても充分な精度で高域成分の推定を行うことができるはずである。つまり、直前のフレーム(J−1)の推定係数(係数インデックス)の再利用が可能である。
これに対して、差分二乗和E(J,id(J-1))が大きいと、実際の入力信号の高域成分と、推定により得られた高域成分との誤差が大きく、復号時に聴感上の音質の劣化が生じる恐れがある。したがってこのような場合、係数インデックスの再利用はすべきではない。
ステップS18において、判定部52は、ステップS17の処理で算出された差分二乗和E(J,id(J-1))に基づいて、係数インデックスを再利用するか否かを判定する。例えば、差分二乗和E(J,id(J-1))が所定の閾値以下である場合、再利用すると判定される。例えば、閾値は「3」などの予め定められた値とされる。
ステップS18において、係数インデックスの再利用が可能であると判定された場合、ステップS19において、擬似高域サブバンドパワー差分算出回路36は、直前のフレーム(J−1)で選択された係数インデックスを、フレームJの係数インデックスとして選択する。つまり、係数インデックス(推定係数)が再利用されることになる。
フレームJの係数インデックスが選択されると、その後、処理はステップS24に進む。なお、ステップS19において選択されたフレームJの係数インデックスは、次のフレーム(J+1)について行なわれるステップS15の処理において、処理対象のフレームの直前のフレームで選択された係数インデックスとして用いられる。
これに対して、ステップS18において、係数インデックスを再利用しないと判定された場合、ステップS20において、擬似高域サブバンドパワー算出回路35は、特徴量算出回路34から供給された特徴量に基づいて、擬似高域サブバンドパワーを算出する。
具体的には擬似高域サブバンドパワー算出回路35は、予め記録している推定係数ごとに、上述した式(2)の演算を行なって擬似高域サブバンドパワーpowerest(ib,J)を算出し、擬似高域サブバンドパワー差分算出回路36に供給する。例えば、係数インデックスが1乃至K(但し、2≦K)のK個の推定係数のセットが予め用意されている場合、K個の推定係数のセットについて、各サブバンドの擬似高域サブバンドパワーが算出される。
ステップS21において、擬似高域サブバンドパワー差分算出回路36は、サブバンド分割回路33からの高域サブバンド信号と、擬似高域サブバンドパワー算出回路35からの擬似高域サブバンドパワーとに基づいて、擬似高域サブバンドパワー差分を算出する。そして、ステップS22において、擬似高域サブバンドパワー差分算出回路36は、推定係数ごとに擬似高域サブバンドパワー差分の二乗和を算出する。
なお、ステップS21およびステップS22では、上述したステップS16およびステップS17と同様の処理が行なわれる。これにより、K個の推定係数のセットごとに擬似高域サブバンドパワー差分の二乗和(差分二乗和)が算出される。
ステップS23において、擬似高域サブバンドパワー差分算出回路36は、K個の推定係数のセットごとの差分二乗和のうち、値が最小となる差分二乗和に対応する推定係数を示す係数インデックスを、フレームJの係数インデックスとして選択する。
ここで、値が最小となる差分二乗和の算出に用いられた推定係数は、実際の入力信号の高域成分と、推定係数を用いた推定により得られる高域成分との誤差が最小となる推定係数である。このように、推定係数(係数インデックス)が再利用できない場合には、予め記録されている推定係数のセットのうち、処理対象のフレームに最も適した推定係数のセットが選択される。係数インデックスが選択されると、その後、処理はステップS24に進む。
ステップS19またはステップS23において、処理対象のフレームJについての係数インデックスが選択されると、ステップS24において、擬似高域サブバンドパワー差分算出回路36は、所定フレーム長だけ処理を行ったか否かを判定する。すなわち、処理対象区間を構成する全てのフレームについて、係数インデックスが選択されたか否かが判定される。
ステップS24において、所定フレーム長だけ処理を行なっていないと判定された場合、処理はステップS11に戻り、上述した処理が繰り返される。すなわち、処理対象区間のまだ処理対象となっていないフレームが、次の処理対象のフレームとされて、そのフレームの係数インデックスが選択される。
これに対してステップS24において、所定フレーム長だけ処理を行ったと判定された場合、処理はステップS25に進む。
ステップS25において、生成部53は、高域符号化データを生成する方式を、固定長方式とするか否かを判定する。
すなわち、生成部53は、処理対象区間における各フレームの係数インデックスの選択結果に基づいて、固定長方式により生成したときの高域符号化データと、可変長方式により生成したときの高域符号化データとの符号量を比較する。そして、生成部53は、固定長方式の高域符号化データの符号量が、可変長方式の高域符号化データの符号量よりも少ない場合、固定長方式とすると判定する。
ステップS25において、固定長方式とすると判定された場合、処理はステップS26に進む。ステップS26において、生成部53は、固定長方式が選択された旨の方式フラグ、固定長インデックス、係数インデックス、および切り替わりフラグからなるデータを生成し、高域符号化回路37に供給する。
例えば、図3の例では、生成部53は、固定長を4フレームとして、位置FST1から位置FSE1までの処理対象区間を、4つの固定長区間に分割する。そして、生成部53は、固定長インデックス「2」、係数インデックス「1」,「2」,「3」、切り替わりフラグ「1」,「0」,「1」、および方式フラグからなるデータを生成する。
なお、図3では処理対象区間の先頭から2番目と3番目の固定長区間の係数インデックスはともに「2」であるが、これらの固定長区間は連続して並んでいるため、生成部53から出力されるデータには、係数インデックス「2」が1つだけ含まれるようにされる。
ステップS27において、高域符号化回路37は、生成部53から供給された、方式フラグ、固定長インデックス、係数インデックス、および切り替わりフラグからなるデータを符号化し、高域符号化データを生成する。例えば、必要に応じて、方式フラグ、固定長インデックス、係数インデックス、および切り替わりフラグのうちの一部または全部の情報に対してエントロピー符号化などが行なわれる。
高域符号化回路37は、生成した高域符号化データを多重化回路38に供給し、その後、処理はステップS30に進む。
これに対して、ステップS25において、固定長方式としないと判定された場合、つまり可変長方式とすると判定された場合、処理はステップS28に進む。ステップS28において、生成部53は、可変長方式が選択された旨の方式フラグ、係数インデックス、区間情報、および個数情報からなるデータを生成し、高域符号化回路37に供給する。
例えば、図2の例では、生成部53は、位置FST1から位置FSE1までの処理対象区間を、3つの連続フレーム区間に分割する。そして、生成部53は、可変長方式が選択された旨の方式フラグ、および連続フレーム区間の個数「3」を示す個数情報「num_length=3」と、各連続フレーム区間の長さを示す区間情報「length0=5」、および「length1=7」、並びにそれらの連続フレーム区間の係数インデックス「2」、「5」、および「1」とからなるデータを生成する。
なお、各連続フレーム区間の係数インデックスは、区間情報と対応付けられて、どの連続フレーム区間の係数インデックスかが特定できるようにされる。また、図2の例では、処理対象区間の先頭と、その次の連続フレーム区間の区間情報から、処理対象区間の最後の連続フレーム区間を構成するフレーム数が特定可能であるので、最後の連続フレーム区間については区間情報が生成されていない。
ステップS29において、高域符号化回路37は、生成部53から供給された、方式フラグ、係数インデックス、区間情報、および個数情報からなるデータを符号化し、高域符号化データを生成する。
例えば、ステップS29では、方式フラグ、係数インデックス、区間情報、および個数情報のうちの一部または全部の情報に対してエントロピー符号化などが行なわれる。なお、高域符号化データは、最適な推定係数が得られる情報であれば、どのような情報であってもよく、例えば方式フラグ、係数インデックス、区間情報、および個数情報からなるデータがそのまま高域符号化データとされてもよい。同様に、上述したステップS27においても、係数インデックス等のデータがそのまま高域符号化データとされてもよい。
高域符号化回路37は、生成した高域符号化データを多重化回路38に供給し、その後、処理はステップS30に進む。
ステップS27またはステップS29において、高域符号化データが生成されると、ステップS30において、多重化回路38は、低域符号化回路32から供給された低域符号化データと、高域符号化回路37から供給された高域符号化データとを多重化する。そして、多重化回路38は、多重化により得られた出力符号列を出力し、符号化処理は終了する。
以上のようにして符号化装置11は、各フレームの係数インデックスを選択する場合に、直前のフレームの係数インデックスが再利用可能か否かを判定し、その判定結果に応じて係数インデックスを再利用する。また、符号化装置11は、選択された係数インデックスを含むデータを符号化し、高域符号化データとする。
このように、係数インデックスを含むデータを符号化し、高域符号化データとすることで、スケールファクタ等の高域の推定演算に用いられるデータそのものを符号化する場合と比べて、高域符号化データの符号量をより少なくすることができる。
しかも、必要に応じて係数インデックスの再利用を行なうことで、係数インデックスが時間方向に必要以上に変化することを防止することができ、高域符号化データの符号量をさらに少なくすることができるとともに、復号で得られる音声の音質を向上させることができる。
また、固定長方式と可変長方式のうち、より符号量が少なくなる方式を処理対象区間ごとに選択して高域符号化データを生成することで、より出力符号列の符号量を低減させることができ、より効率よく音声の符号化や復号を行なうことができる。
なお、以上においては、係数インデックスの再利用が可能か否かを判定するために、差分二乗和E(J,id(J-1))を利用する例について説明したが、実際の高域成分と推定により得られた高域成分との比較結果を示すものであれば、どのようなものが用いられてもよい。
例えば、高域側の各サブバンドib(但し、sb+1≦ib≦eb)について、高域サブバンドパワーpower(ib,J)と、擬似高域サブバンドパワーpowerest(ib,J)の差分を求め、それらの差分の二乗平均値である残差二乗平均値Resstdが再利用可能か否かの判定に用いられてもよい。
また、高域側の各サブバンドibの高域サブバンドパワーと、擬似高域サブバンドパワーの差分の絶対値のうちの最大値である残差最大値Resmaxや、各サブバンドibの高域サブバンドパワーと、擬似高域サブバンドパワーの差分の平均値の絶対値である残差平均値Resaveが利用されてもよい。
その他、上述した残差二乗平均値Resstd、残差最大値Resmax、および残差平均値Resaveを所定の重みで重み付き加算(線形結合)して得られる評価値Resが、係数インデックスの再利用が可能であるか否かの判定に利用されてもよい。この評価値Resは、その値が大きいほど、実際の高域成分と、推定係数による推定で得られた高域成分との誤差が小さいことになる。
この場合、擬似高域サブバンドパワー差分算出回路36は、処理対象のフレームJにおいて、直前のフレーム(J−1)で選択された係数インデックスにより特定される推定係数を用いて評価値Resを算出する。そして、判定部52は、得られた評価値Resと閾値(例えば、10など)とを比較し、評価値Resが閾値以下である場合、係数インデックスの再利用が可能であるとする。この場合、フレーム(J−1)の係数インデックスが、フレームJの係数インデックスとしても選択(採用)されることになる。
[復号装置の構成]
次に符号化装置11から出力された出力符号列の供給を受け、出力符号列の復号を行なう復号装置について説明する。
そのような復号装置は、例えば図8に示すように構成される。
復号装置81は、非多重化回路91、低域復号回路92、サブバンド分割回路93、特徴量算出回路94、高域復号回路95、復号高域サブバンドパワー算出回路96、復号高域信号生成回路97、および合成回路98から構成される。
非多重化回路91は、符号化装置11から受信した出力符号列を入力符号列として、入力符号列を高域符号化データと低域符号化データに非多重化する。また、非多重化回路91は、非多重化により得られた低域符号化データを低域復号回路92に供給し、非多重化により得られた高域符号化データを高域復号回路95に供給する。
低域復号回路92は、非多重化回路91からの低域符号化データを復号し、その結果得られた入力信号の復号低域信号を、サブバンド分割回路93、および合成回路98に供給する。
サブバンド分割回路93は、低域復号回路92からの復号低域信号を、所定の帯域幅を持つ複数の低域サブバンド信号に等分割し、得られた低域サブバンド信号を特徴量算出回路94および復号高域信号生成回路97に供給する。
特徴量算出回路94は、サブバンド分割回路93からの低域サブバンド信号に基づいて、低域側の各サブバンドの低域サブバンドパワーを特徴量として算出し、復号高域サブバンドパワー算出回路96に供給する。
高域復号回路95は、非多重化回路91からの高域符号化データを復号し、その結果得られたデータと、そのデータに含まれる係数インデックスにより特定される推定係数とを復号高域サブバンドパワー算出回路96に供給する。すなわち、高域復号回路95には予め複数の係数インデックスと、その係数インデックスにより特定される推定係数とが対応付けられて記録されており、高域復号回路95は高域符号化データに含まれる係数インデックスに対応する推定係数を出力する。
復号高域サブバンドパワー算出回路96は、高域復号回路95からのデータおよび推定係数と、特徴量算出回路94からの低域サブバンドパワーとに基づいて、フレームごとに高域側の各サブバンドのサブバンドパワーの推定値である復号高域サブバンドパワーを算出する。例えば、上述した式(2)と同様の演算が行なわれて、復号高域サブバンドパワーが算出される。復号高域サブバンドパワー算出回路96は、算出した各サブバンドの復号高域サブバンドパワーを復号高域信号生成回路97に供給する。
復号高域信号生成回路97は、サブバンド分割回路93からの低域サブバンド信号と、復号高域サブバンドパワー算出回路96からの復号高域サブバンドパワーとに基づいて復号高域信号を生成し、合成回路98に供給する。
具体的には、復号高域信号生成回路97は、低域サブバンド信号の低域サブバンドパワーを算出し、復号高域サブバンドパワーと低域サブバンドパワーとの比に応じて低域サブバンド信号を振幅変調する。さらに、復号高域信号生成回路97は、振幅変調された低域サブバンド信号を周波数変調することにより、高域側の各サブバンドの復号高域サブバンド信号を生成する。このようにして得られた復号高域サブバンド信号は、入力信号の高域側の各サブバンドの高域サブバンド信号の推定値である。復号高域信号生成回路97は、得られた各サブバンドの復号高域サブバンド信号からなる復号高域信号を合成回路98に供給する。
合成回路98は、低域復号回路92からの復号低域信号と、復号高域信号生成回路97からの復号高域信号とを合成し、出力信号として出力する。この出力信号は、符号化された入力信号を復号して得られる信号であり、高域成分と低域成分からなる信号である。
なお、上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。
図9は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
コンピュータにおいて、CPU(Central Processing Unit)301,ROM(Read Only Memory)302,RAM(Random Access Memory)303は、バス304により相互に接続されている。
バス304には、さらに、入出力インターフェース305が接続されている。入出力インターフェース305には、キーボード、マウス、マイクロホンなどよりなる入力部306、ディスプレイ、スピーカなどよりなる出力部307、ハードディスクや不揮発性のメモリなどよりなる記録部308、ネットワークインターフェースなどよりなる通信部309、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア311を駆動するドライブ310が接続されている。
以上のように構成されるコンピュータでは、CPU301が、例えば、記録部308に記録されているプログラムを、入出力インターフェース305及びバス304を介して、RAM303にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ(CPU301)が実行するプログラムは、例えば、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)等)、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア311に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供される。
そして、プログラムは、リムーバブルメディア311をドライブ310に装着することにより、入出力インターフェース305を介して、記録部308にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部309で受信し、記録部308にインストールすることができる。その他、プログラムは、ROM302や記録部308に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
さらに、本技術は、以下の構成とすることも可能である。
[1]
入力信号の帯域分割を行なって、前記入力信号の高域側のサブバンドの高域サブバンド信号を生成するサブバンド分割部と、
前記入力信号の低域信号から得られた特徴量と、予め用意された複数の推定係数のうちの前記入力信号の処理対象のフレームの直前のフレームで選択された推定係数とに基づいて、前記処理対象のフレームの前記高域サブバンド信号の高域サブバンドパワーの推定値である擬似高域サブバンドパワーを算出する算出部と、
前記擬似高域サブバンドパワーと、前記高域サブバンド信号から得られた前記高域サブバンドパワーとに基づいて、前記処理対象のフレームにおいて、前記直前のフレームの前記推定係数が再利用可能であるとされた場合、前記再利用可能であるとされた前記推定係数を得るためのデータを生成する生成部と、
前記低域信号を符号化して低域符号化データを生成する低域符号化部と、
前記データと前記低域符号化データとを多重化して出力符号列を生成する多重化部と
を備える符号化装置。
[2]
前記複数の前記推定係数ごとに、前記特徴量と前記推定係数とに基づいて前記擬似高域サブバンドパワーを算出する擬似高域サブバンドパワー算出部と、
前記擬似高域サブバンドパワー算出部により算出された前記擬似高域サブバンドパワーと、前記高域サブバンドパワーとを比較し、前記複数の前記推定係数のうちの何れかを選択する選択部とをさらに備え、
前記生成部は、前記直前のフレームの前記推定係数が再利用可能でないとされた場合、前記選択部により選択された前記推定係数を得るための前記データを生成する
[1]に記載の符号化装置。
[3]
前記データを符号化して高域符号化データを生成する高域符号化部をさらに備え、
前記多重化部は、前記高域符号化データと前記低域符号化データとを多重化して前記出力符号列を生成する
[1]または[2]に記載の符号化装置。
[4]
高域側のサブバンドの前記擬似高域サブバンドパワーと前記高域サブバンドパワーとの差分の二乗和が所定の閾値以下である場合、前記推定係数が再利用可能であるとされる
[1]乃至[3]の何れかに記載の符号化装置。
[5]
高域側のサブバンドの前記擬似高域サブバンドパワーと前記高域サブバンドパワーとに基づいて算出された、前記擬似高域サブバンドパワーと前記高域サブバンドパワーの類似の度合いを示す評価値と所定の閾値との比較結果に応じて、前記推定係数が再利用可能であるとされる
[1]乃至[3]の何れかに記載の符号化装置。
11 符号化装置, 32 低域符号化回路, 33 サブバンド分割回路, 34 特徴量算出回路, 35 擬似高域サブバンドパワー算出回路, 36 擬似高域サブバンドパワー差分算出回路, 37 高域符号化回路, 38 多重化回路, 51 算出部, 52 判定部, 53 生成部

Claims (7)

  1. 入力信号の帯域分割を行なって、前記入力信号の高域側のサブバンドの高域サブバンド信号を生成するサブバンド分割部と、
    前記入力信号の低域信号から得られた特徴量と、予め用意された複数の推定係数のうちの前記入力信号の処理対象のフレームの直前のフレームで選択された推定係数とに基づいて、前記処理対象のフレームの前記高域サブバンド信号の高域サブバンドパワーの推定値である擬似高域サブバンドパワーを算出する算出部と、
    前記擬似高域サブバンドパワーと、前記高域サブバンド信号から得られた前記高域サブバンドパワーとに基づいて、前記処理対象のフレームにおいて、前記直前のフレームの前記推定係数が再利用可能であるとされた場合、前記再利用可能であるとされた前記推定係数を得るためのデータを生成する生成部と、
    前記低域信号を符号化して低域符号化データを生成する低域符号化部と、
    前記データと前記低域符号化データとを多重化して出力符号列を生成する多重化部と
    を備える符号化装置。
  2. 前記複数の前記推定係数ごとに、前記特徴量と前記推定係数とに基づいて前記擬似高域サブバンドパワーを算出する擬似高域サブバンドパワー算出部と、
    前記擬似高域サブバンドパワー算出部により算出された前記擬似高域サブバンドパワーと、前記高域サブバンドパワーとを比較し、前記複数の前記推定係数のうちの何れかを選択する選択部とをさらに備え、
    前記生成部は、前記直前のフレームの前記推定係数が再利用可能でないとされた場合、前記選択部により選択された前記推定係数を得るための前記データを生成する
    請求項1に記載の符号化装置。
  3. 前記データを符号化して高域符号化データを生成する高域符号化部をさらに備え、
    前記多重化部は、前記高域符号化データと前記低域符号化データとを多重化して前記出力符号列を生成する
    請求項2に記載の符号化装置。
  4. 高域側のサブバンドの前記擬似高域サブバンドパワーと前記高域サブバンドパワーとの差分の二乗和が所定の閾値以下である場合、前記推定係数が再利用可能であるとされる
    請求項3に記載の符号化装置。
  5. 高域側のサブバンドの前記擬似高域サブバンドパワーと前記高域サブバンドパワーとに基づいて算出された、前記擬似高域サブバンドパワーと前記高域サブバンドパワーの類似の度合いを示す評価値と所定の閾値との比較結果に応じて、前記推定係数が再利用可能であるとされる
    請求項3に記載の符号化装置。
  6. 入力信号の帯域分割を行なって、前記入力信号の高域側のサブバンドの高域サブバンド信号を生成し、
    前記入力信号の低域信号から得られた特徴量と、予め用意された複数の推定係数のうちの前記入力信号の処理対象のフレームの直前のフレームで選択された推定係数とに基づいて、前記処理対象のフレームの前記高域サブバンド信号の高域サブバンドパワーの推定値である擬似高域サブバンドパワーを算出し、
    前記擬似高域サブバンドパワーと、前記高域サブバンド信号から得られた前記高域サブバンドパワーとに基づいて、前記処理対象のフレームにおいて、前記直前のフレームの前記推定係数が再利用可能であるとされた場合、前記再利用可能であるとされた前記推定係数を得るためのデータを生成し、
    前記低域信号を符号化して低域符号化データを生成し、
    前記データと前記低域符号化データとを多重化して出力符号列を生成する
    ステップを含む符号化方法。
  7. 入力信号の帯域分割を行なって、前記入力信号の高域側のサブバンドの高域サブバンド信号を生成し、
    前記入力信号の低域信号から得られた特徴量と、予め用意された複数の推定係数のうちの前記入力信号の処理対象のフレームの直前のフレームで選択された推定係数とに基づいて、前記処理対象のフレームの前記高域サブバンド信号の高域サブバンドパワーの推定値である擬似高域サブバンドパワーを算出し、
    前記擬似高域サブバンドパワーと、前記高域サブバンド信号から得られた前記高域サブバンドパワーとに基づいて、前記処理対象のフレームにおいて、前記直前のフレームの前記推定係数が再利用可能であるとされた場合、前記再利用可能であるとされた前記推定係数を得るためのデータを生成し、
    前記低域信号を符号化して低域符号化データを生成し、
    前記データと前記低域符号化データとを多重化して出力符号列を生成する
    ステップを含む処理をコンピュータに実行させるプログラム。
JP2011182448A 2011-08-24 2011-08-24 符号化装置および方法、復号装置および方法、並びにプログラム Active JP5942358B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP2011182448A JP5942358B2 (ja) 2011-08-24 2011-08-24 符号化装置および方法、復号装置および方法、並びにプログラム
EP12825891.0A EP2750132A4 (en) 2011-08-24 2012-08-14 CODING DEVICE AND METHOD, DECODING DEVICE AND METHOD AND PROGRAM THEREFOR
PCT/JP2012/070682 WO2013027629A1 (ja) 2011-08-24 2012-08-14 符号化装置および方法、復号装置および方法、並びにプログラム
CN201280040030.4A CN103733258B (zh) 2011-08-24 2012-08-14 编码装置和方法、解码装置和方法
KR1020147003279A KR20140050044A (ko) 2011-08-24 2012-08-14 부호화 장치 및 방법, 복호 장치 및 방법과 프로그램
BR112014003676A BR112014003676A2 (pt) 2011-08-24 2012-08-14 dispositivo e método de codificação, dispositivo e método de decodificação, e programa
US14/237,933 US9390717B2 (en) 2011-08-24 2012-08-14 Encoding device and method, decoding device and method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011182448A JP5942358B2 (ja) 2011-08-24 2011-08-24 符号化装置および方法、復号装置および方法、並びにプログラム

Publications (3)

Publication Number Publication Date
JP2013044921A true JP2013044921A (ja) 2013-03-04
JP2013044921A5 JP2013044921A5 (ja) 2014-10-09
JP5942358B2 JP5942358B2 (ja) 2016-06-29

Family

ID=47746376

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011182448A Active JP5942358B2 (ja) 2011-08-24 2011-08-24 符号化装置および方法、復号装置および方法、並びにプログラム

Country Status (7)

Country Link
US (1) US9390717B2 (ja)
EP (1) EP2750132A4 (ja)
JP (1) JP5942358B2 (ja)
KR (1) KR20140050044A (ja)
CN (1) CN103733258B (ja)
BR (1) BR112014003676A2 (ja)
WO (1) WO2013027629A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI697892B (zh) * 2017-08-10 2020-07-01 大陸商華為技術有限公司 音訊編解碼模式確定方法和相關產品

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5704397B2 (ja) 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
JP6037156B2 (ja) 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5975243B2 (ja) * 2011-08-24 2016-08-23 ソニー株式会社 符号化装置および方法、並びにプログラム
US10083700B2 (en) 2012-07-02 2018-09-25 Sony Corporation Decoding device, decoding method, encoding device, encoding method, and program
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
JP6593173B2 (ja) 2013-12-27 2019-10-23 ソニー株式会社 復号化装置および方法、並びにプログラム
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
KR102546098B1 (ko) * 2016-03-21 2023-06-22 한국전자통신연구원 블록 기반의 오디오 부호화/복호화 장치 및 그 방법
EP3288031A1 (en) 2016-08-23 2018-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding an audio signal using a compensation value
CN109509465B (zh) * 2017-09-15 2023-07-25 阿里巴巴集团控股有限公司 语音信号的处理方法、组件、设备及介质
JP7017960B2 (ja) 2018-03-19 2022-02-09 株式会社エクセディ ボールベアリングの保持構造
CN113518227B (zh) * 2020-04-09 2023-02-10 于江鸿 数据处理的方法和系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5581653A (en) * 1993-08-31 1996-12-03 Dolby Laboratories Licensing Corporation Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder
US5809173A (en) * 1995-04-18 1998-09-15 Advanced Micro Devices, Inc. Method and apparatus for improved video decompression using previous frame DCT coefficients
JP2008139844A (ja) * 2006-11-09 2008-06-19 Sony Corp 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体
JP2009116371A (ja) * 2001-11-14 2009-05-28 Panasonic Corp 符号化装置および復号化装置
JP2010020251A (ja) * 2008-07-14 2010-01-28 Ntt Docomo Inc 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法
JP2010079275A (ja) * 2008-08-29 2010-04-08 Sony Corp 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム
WO2011043227A1 (ja) * 2009-10-07 2011-04-14 ソニー株式会社 波数帯域拡大装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03254223A (ja) 1990-03-02 1991-11-13 Eastman Kodak Japan Kk アナログデータ伝送方式
JPH1020888A (ja) 1996-07-02 1998-01-23 Matsushita Electric Ind Co Ltd 音声符号化・復号化装置
JP3926726B2 (ja) 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
WO2003065353A1 (en) * 2002-01-30 2003-08-07 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device and methods thereof
JP2003255973A (ja) 2002-02-28 2003-09-10 Nec Corp 音声帯域拡張システムおよび方法
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
CA2453814C (en) 2002-07-19 2010-03-09 Nec Corporation Audio decoding apparatus and decoding method and program
JP4728568B2 (ja) 2002-09-04 2011-07-20 マイクロソフト コーポレーション レベル・モードとラン・レングス/レベル・モードの間での符号化を適応させるエントロピー符号化
JP3881943B2 (ja) 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
KR20050027179A (ko) 2003-09-13 2005-03-18 삼성전자주식회사 오디오 데이터 복원 방법 및 그 장치
KR100587953B1 (ko) 2003-12-26 2006-06-08 한국전자통신연구원 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
ATE474310T1 (de) 2004-05-28 2010-07-15 Nokia Corp Mehrkanalige audio-erweiterung
KR100608062B1 (ko) 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
JP4977471B2 (ja) 2004-11-05 2012-07-18 パナソニック株式会社 符号化装置及び符号化方法
BRPI0517780A2 (pt) 2004-11-05 2011-04-19 Matsushita Electric Ind Co Ltd aparelho de decodificação escalável e aparelho de codificação escalável
WO2006075563A1 (ja) 2005-01-11 2006-07-20 Nec Corporation オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム
SG161223A1 (en) 2005-04-01 2010-05-27 Qualcomm Inc Method and apparatus for vector quantizing of a spectral envelope representation
US20070005351A1 (en) 2005-06-30 2007-01-04 Sathyendra Harsha M Method and system for bandwidth expansion for voice communications
US8326638B2 (en) * 2005-11-04 2012-12-04 Nokia Corporation Audio compression
JP4876574B2 (ja) 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US7953604B2 (en) 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7590523B2 (en) 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
EP2323131A1 (en) 2006-04-27 2011-05-18 Panasonic Corporation Audio encoding device, audio decoding device, and their method
WO2007148925A1 (en) * 2006-06-21 2007-12-27 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
US8295507B2 (en) 2006-11-09 2012-10-23 Sony Corporation Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
US8554349B2 (en) 2007-10-23 2013-10-08 Clarion Co., Ltd. High-frequency interpolation device and high-frequency interpolation method
CN101925953B (zh) 2008-01-25 2012-06-20 松下电器产业株式会社 编码装置、解码装置以及其方法
US8532983B2 (en) 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
US8457975B2 (en) 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
US8600749B2 (en) 2009-12-08 2013-12-03 At&T Intellectual Property I, L.P. System and method for training adaptation-specific acoustic models for automatic speech recognition
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US8560330B2 (en) 2010-07-19 2013-10-15 Futurewei Technologies, Inc. Energy envelope perceptual correction for high band coding
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5704397B2 (ja) 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5975243B2 (ja) 2011-08-24 2016-08-23 ソニー株式会社 符号化装置および方法、並びにプログラム
JP6037156B2 (ja) 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5581653A (en) * 1993-08-31 1996-12-03 Dolby Laboratories Licensing Corporation Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder
US5809173A (en) * 1995-04-18 1998-09-15 Advanced Micro Devices, Inc. Method and apparatus for improved video decompression using previous frame DCT coefficients
JP2009116371A (ja) * 2001-11-14 2009-05-28 Panasonic Corp 符号化装置および復号化装置
JP2008139844A (ja) * 2006-11-09 2008-06-19 Sony Corp 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体
JP2010020251A (ja) * 2008-07-14 2010-01-28 Ntt Docomo Inc 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法
JP2010079275A (ja) * 2008-08-29 2010-04-08 Sony Corp 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム
WO2011043227A1 (ja) * 2009-10-07 2011-04-14 ソニー株式会社 波数帯域拡大装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI697892B (zh) * 2017-08-10 2020-07-01 大陸商華為技術有限公司 音訊編解碼模式確定方法和相關產品
US11120807B2 (en) 2017-08-10 2021-09-14 Huawei Technologies Co., Ltd. Method for determining audio coding/decoding mode and related product
US11935547B2 (en) 2017-08-10 2024-03-19 Huawei Technologies Co., Ltd. Method for determining audio coding/decoding mode and related product

Also Published As

Publication number Publication date
JP5942358B2 (ja) 2016-06-29
CN103733258B (zh) 2016-09-14
EP2750132A4 (en) 2015-05-13
BR112014003676A2 (pt) 2017-03-21
WO2013027629A1 (ja) 2013-02-28
US20140205101A1 (en) 2014-07-24
EP2750132A1 (en) 2014-07-02
KR20140050044A (ko) 2014-04-28
CN103733258A (zh) 2014-04-16
US9390717B2 (en) 2016-07-12

Similar Documents

Publication Publication Date Title
JP5942358B2 (ja) 符号化装置および方法、復号装置および方法、並びにプログラム
US10546594B2 (en) Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
JP6037156B2 (ja) 符号化装置および方法、並びにプログラム
JP5704397B2 (ja) 符号化装置および方法、並びにプログラム
KR102055022B1 (ko) 부호화 장치 및 방법, 복호 장치 및 방법, 및 프로그램
US20150120307A1 (en) Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140822

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140822

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151008

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160426

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160509

R151 Written notification of patent or utility model registration

Ref document number: 5942358

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250