JP2013044922A - 符号化装置および方法、並びにプログラム - Google Patents

符号化装置および方法、並びにプログラム Download PDF

Info

Publication number
JP2013044922A
JP2013044922A JP2011182449A JP2011182449A JP2013044922A JP 2013044922 A JP2013044922 A JP 2013044922A JP 2011182449 A JP2011182449 A JP 2011182449A JP 2011182449 A JP2011182449 A JP 2011182449A JP 2013044922 A JP2013044922 A JP 2013044922A
Authority
JP
Japan
Prior art keywords
section
high frequency
frequency
band
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011182449A
Other languages
English (en)
Other versions
JP6037156B2 (ja
JP2013044922A5 (ja
Inventor
Yuki Yamamoto
優樹 山本
Toru Chinen
徹 知念
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2011182449A priority Critical patent/JP6037156B2/ja
Application filed by Sony Corp filed Critical Sony Corp
Priority to PCT/JP2012/070683 priority patent/WO2013027630A1/ja
Priority to BR112014003672A priority patent/BR112014003672A2/pt
Priority to RU2014105814/08A priority patent/RU2586011C2/ru
Priority to CA2840788A priority patent/CA2840788A1/en
Priority to MX2014001871A priority patent/MX2014001871A/es
Priority to EP12825849.8A priority patent/EP2750131A4/en
Priority to US14/236,350 priority patent/US9842603B2/en
Priority to KR1020147003607A priority patent/KR20140050050A/ko
Priority to AU2012297804A priority patent/AU2012297804B2/en
Priority to CN201280040029.1A priority patent/CN103765510B/zh
Publication of JP2013044922A publication Critical patent/JP2013044922A/ja
Priority to ZA2014/01181A priority patent/ZA201401181B/en
Publication of JP2013044922A5 publication Critical patent/JP2013044922A5/ja
Application granted granted Critical
Publication of JP6037156B2 publication Critical patent/JP6037156B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information

Abstract

【課題】より少ない符号量で高音質な音声を得ることができるようにする。
【解決手段】区間数決定特徴量算出回路は、入力信号を構成する複数のサブバンドのサブバンド信号に基づいて、処理対象区間を、同じ推定係数が選択されるフレームからなる連続フレーム区間に分割する分割数を定めるための区間数決定特徴量を算出する。擬似高域サブバンドパワー差分算出回路は、区間数決定特徴量に基づいて処理対象区間内の連続フレーム区間数を決定するとともに、各連続フレーム区間について、入力信号の高域成分を推定により求めるための推定係数を選択し、それらの推定係数を得るための係数インデックスを含むデータを生成する。高域符号化回路は、得られたデータを符号化し、高域符号化データを生成する。本技術は、符号化装置に適用することができる。
【選択図】図4

Description

本技術は符号化装置および方法、並びにプログラムに関し、特に、より少ない符号量で高音質な音声を得ることができるようにした符号化装置および方法、並びにプログラムに関する。
従来、音声信号の符号化手法として、HE-AAC(High Efficiency MPEG(Moving Picture Experts Group)4 AAC(Advanced Audio Coding))(国際標準規格ISO/IEC14496-3)や、AAC(MPEG2 AAC)(国際標準規格ISO/IEC13818-7)などが知られている。
例えば音声信号の符号化手法として、低域成分を符号化して得られた低域符号化情報と、低域成分および高域成分から生成された、高域成分の推定値を得るための高域符号化情報とを符号化で得られた符号として出力する手法が提案されている(例えば、特許文献1参照)。この手法では、高域符号化情報には、高域の周波数成分を得るためのスケールファクタ、振幅調整係数、スペクトル残差など、高域成分の推定値を算出するのに必要となる情報が含まれている。
また、復号の際には低域符号化情報を復号して得られる低域成分と、高域符号化情報を復号して得られる情報とに基づいて高域成分が推定され、推定により得られた高域成分と、復号で得られた低域成分とが合成されて復号で得られた音声信号とされる。
このような符号化手法では、高域成分の推定値を得るための情報だけを高域の信号成分に関する情報として符号化するので、音質の劣化を抑えつつ、符号化効率を向上させることができる。
国際公開第WO2006/049205号
しかしながら、上述した技術では復号時に高音質な音声を得ることはできるが、音声信号の処理単位ごとに高域成分の推定値を算出するための情報を生成しなければならず、高域符号化情報の符号量が充分に少ないとはいえなかった。
本技術は、このような状況に鑑みてなされたものであり、より少ない符号量で高音質な音声を得ることができるようにするものである。
本技術の一側面の符号化装置は、入力信号の低域側のサブバンドの低域サブバンド信号と、前記入力信号の高域側のサブバンドの高域サブバンド信号とを生成するサブバンド分割部と、前記低域サブバンド信号と所定の推定係数とに基づいて、前記高域サブバンド信号の高域サブバンドパワーの推定値である擬似高域サブバンドパワーを算出する擬似高域サブバンドパワー算出部と、前記低域サブバンド信号または前記高域サブバンド信号の少なくとも何れかに基づいて、区間数決定特徴量を算出する特徴量算出部と、前記区間数決定特徴量に基づいて、前記入力信号の複数フレームからなる処理対象区間における、同じ前記推定係数が選択されたフレームからなる連続フレーム区間の数を決定する決定部と、決定された前記連続フレーム区間の数に基づいて前記処理対象区間を分割して得られる各前記連続フレーム区間について、前記擬似高域サブバンドパワーと前記高域サブバンドパワーに基づいて、複数の前記推定係数のなかから前記連続フレーム区間を構成するフレームの前記推定係数を選択する選択部と、前記処理対象区間を構成する各前記連続フレーム区間のフレームで選択された前記推定係数を得るためのデータを生成する生成部と、前記入力信号の低域信号を符号化して低域符号化データを生成する低域符号化部と、前記データと前記低域符号化データとを多重化して出力符号列を生成する多重化部とを備える。
前記区間数決定特徴量を、前記高域サブバンドパワーの和を示す特徴量とすることができる。
前記区間数決定特徴量を、前記高域サブバンドパワーの和の時間変動を示す特徴量とすることができる。
前記区間数決定特徴量を、前記入力信号の周波数形状を示す特徴量とすることができる。
前記区間数決定特徴量を、複数の特徴量の線形和または非線形和とすることができる。
符号化装置には、前記推定係数ごとに算出された、前記フレームにおける前記擬似高域サブバンドパワーと前記高域サブバンドパワーの誤差を示す評価値に基づいて、前記推定係数ごとに、前記連続フレーム区間を構成する各フレームの前記評価値の和を算出する評価値和算出部をさらに設け、前記選択部には、前記推定係数ごとに算出された前記評価値の和に基づいて、前記連続フレーム区間のフレームの前記推定係数を選択させることができる。
決定された前記連続フレーム区間の数に前記処理対象区間を等分割して得られた各区間を、前記連続フレーム区間とすることができる。
前記選択部には、決定された前記連続フレーム区間の数に前記処理対象区間を分割するときに取り得る前記処理対象区間の分割の組み合わせごとに、前記評価値の和に基づいて前記連続フレーム区間のフレームの前記推定係数を選択させるとともに、各前記組み合わせのうち、前記処理対象区間を構成する全ての前記フレームの選択された前記推定係数の前記評価値の和が最小となる前記組み合わせを特定させ、特定された前記組み合わせにおいて、各フレームで選択された前記推定係数を、それらのフレームの前記推定係数とさせることができる。
符号化装置には、前記データを符号化して高域符号化データを生成する高域符号化部をさらに設け、前記多重化部には、前記高域符号化データと前記低域符号化データとを多重化して前記出力符号列を生成させることができる。
前記決定部には、決定された前記連続フレーム区間の数に基づいて、前記処理対象区間の前記高域符号化データの符号量をさらに算出させ、前記低域符号化部には、前記処理対象区間に対して予め定められた符号量と、算出された前記高域符号化データの符号量とから定まる符号量で前記低域信号を符号化させることができる。
本技術の一側面の符号化方法またはプログラムは、入力信号の低域側のサブバンドの低域サブバンド信号と、前記入力信号の高域側のサブバンドの高域サブバンド信号とを生成し、前記低域サブバンド信号と所定の推定係数とに基づいて、前記高域サブバンド信号の高域サブバンドパワーの推定値である擬似高域サブバンドパワーを算出し、前記低域サブバンド信号または前記高域サブバンド信号の少なくとも何れかに基づいて、区間数決定特徴量を算出し、前記区間数決定特徴量に基づいて、前記入力信号の複数フレームからなる処理対象区間における、同じ前記推定係数が選択されたフレームからなる連続フレーム区間の数を決定し、決定された前記連続フレーム区間の数に基づいて前記処理対象区間を分割して得られる各前記連続フレーム区間について、前記擬似高域サブバンドパワーと前記高域サブバンドパワーに基づいて、複数の前記推定係数のなかから前記連続フレーム区間を構成するフレームの前記推定係数を選択し、前記処理対象区間を構成する各前記連続フレーム区間のフレームで選択された前記推定係数を得るためのデータを生成し、前記入力信号の低域信号を符号化して低域符号化データを生成し、前記データと前記低域符号化データとを多重化して出力符号列を生成するステップを含む。
本技術の一側面においては、入力信号の低域側のサブバンドの低域サブバンド信号と、前記入力信号の高域側のサブバンドの高域サブバンド信号とが生成され、前記低域サブバンド信号と所定の推定係数とに基づいて、前記高域サブバンド信号の高域サブバンドパワーの推定値である擬似高域サブバンドパワーが算出され、前記低域サブバンド信号または前記高域サブバンド信号の少なくとも何れかに基づいて、区間数決定特徴量が算出され、前記区間数決定特徴量に基づいて、前記入力信号の複数フレームからなる処理対象区間における、同じ前記推定係数が選択されたフレームからなる連続フレーム区間の数が決定され、決定された前記連続フレーム区間の数に基づいて前記処理対象区間を分割して得られる各前記連続フレーム区間について、前記擬似高域サブバンドパワーと前記高域サブバンドパワーに基づいて、複数の前記推定係数のなかから前記連続フレーム区間を構成するフレームの前記推定係数が選択され、前記処理対象区間を構成する各前記連続フレーム区間のフレームで選択された前記推定係数を得るためのデータが生成され、前記入力信号の低域信号を符号化して低域符号化データが生成され、前記データと前記低域符号化データとが多重化されて出力符号列が生成される。
本技術の一側面によれば、より少ない符号量で高音質な音声を得ることができる。
入力信号のサブバンドについて説明するための図である。 可変長方式による高域成分の符号化について説明する図である。 固定長方式による高域成分の符号化について説明する図である。 本技術を適用した符号化装置の構成例を示す図である。 符号化処理について説明するフローチャートである。 復号装置の構成例を示す図である。 符号化処理について説明するフローチャートである。 符号化処理について説明するフローチャートである。 符号化処理について説明するフローチャートである。 符号化処理について説明するフローチャートである。 符号化処理について説明するフローチャートである。 符号化装置の他の構成例を示す図である。 符号化処理について説明するフローチャートである。 コンピュータの構成例を示す図である。
以下、図面を参照して、本技術を適用した実施の形態について説明する。
〈本技術の概要〉
[入力信号の符号化について]
本技術は、例えば音楽信号などの音声信号を入力信号として、入力信号の符号化を行なうものである。
入力信号の符号化を行なう符号化装置では、符号化時において図1に示すように、入力信号は所定の帯域幅の複数の周波数帯域(以下、サブバンドと称する)のサブバンド信号に分割される。なお、図1において、縦軸は入力信号の各周波数のパワーを示しており、横軸は入力信号の各周波数を示している。また、曲線C11は入力信号の各周波数成分のパワーを示しており、図中、縦方向の点線は各サブバンドの境界位置を示している。
入力信号が各サブバンドのサブバンド信号に分割されると、入力信号の周波数成分のうち、予め定められた周波数以下の低域側の成分が、所定の符号化方式により符号化され、低域符号化データが生成される。
図1の例では、各サブバンドを特定するインデックスがsbであるサブバンドsbの上限の周波数以下の周波数のサブバンドが入力信号の低域成分とされており、サブバンドsbの上限の周波数よりも高い周波数のサブバンドが入力信号の高域成分とされている。
低域符号化データが得られると、次に入力信号の低域成分と高域成分とに基づいて、高域成分の各サブバンドのサブバンド信号を再現するための情報が生成され、その情報が、適宜、所定の符号化方式により符号化されて高域符号化データが生成される。
具体的には、周波数方向に連続して並ぶ低域側の最も周波数が高い4つのサブバンドsb−3乃至サブバンドsbの成分と、高域側の連続して並ぶ(eb-(sb+1)+1)個のサブバンドsb+1乃至サブバンドebの成分とから、高域符号化データが生成される。
ここで、サブバンドsb+1はサブバンドsbに隣接する、最も低域側に位置する高域のサブバンドであり、サブバンドebは、連続して並ぶサブバンドsb+1乃至サブバンドebのうちの最も周波数が高いサブバンドである。
高域成分の符号化で得られる高域符号化データは、高域側のサブバンドib(但し、sb+1≦ib≦eb)のサブバンド信号を推定により生成するための情報であり、高域符号化データには、各サブバンド信号の推定に用いられる推定係数を得るための係数インデックスが含まれている。
すなわち、サブバンドibのサブバンド信号の推定には、低域側の各サブバンドkb(但し、sb−3≦kb≦sb)のサブバンド信号のパワーに乗算される係数Aib(kb)と、定数項である係数Bibからなる推定係数が用いられる。高域符号化データに含まれる係数インデックスは、各サブバンドibの係数Aib(kb)と係数Bibからなる推定係数のセットを得るための情報、例えば推定係数のセットを特定する情報である。
以上のようにして低域符号化データと高域符号化データが得られると、それらの低域符号化データと高域符号化データが多重化されて出力符号列とされ、出力される。
このように高域符号化データに、推定係数を得るための係数インデックスを含めるようにすることで、フレームごとに高域成分を算出するためのスケールファクタや振幅調整係数などを含める場合と比べて、高域符号化データの符号量を大幅に削減することができる。
また、出力符号列の供給を受けた復号装置は、低域符号化データを復号して低域側の各サブバンドのサブバンド信号からなる復号低域信号を得るとともに、復号低域信号と、高域符号化データを復号して得られた情報とから高域側の各サブバンドのサブバンド信号を推定により生成する。そして、復号装置は、推定により得られた高域側の各サブバンドのサブバンド信号からなる復号高域信号と、復号低域信号とから出力信号を生成する。このようにして得られた出力信号は、符号化された入力信号を復号することで得られた信号である。
[出力符号列について]
ところで、入力信号の符号化では入力信号の所定の時間長の区間ごと、すなわちフレームごとに、予め用意された複数の推定係数のなかから、処理対象となっているフレームに対して適切な推定係数が選択される。
符号化装置では、各フレームの係数インデックスをそのまま高域符号化データに含めるのではなく、時間方向において係数インデックスが変化する時間の情報と、変化した係数インデックスの値を高域符号化データに含めることで更なる符号量の削減が図られている。
特に、入力信号が、各周波数成分の時間方向への変動が少ない定常信号である場合には、選択された推定係数、すなわち係数インデックスは時間方向に同じものが連続して続くことが多い。そこで、高域符号化データに含まれる係数インデックスの時間方向の情報量を削減するために、適宜、可変長方式と固定長方式とが切り替えられながら、入力信号の高域成分の符号化が行なわれる。
[可変長方式について]
以下、可変長方式と固定長方式による高域成分の符号化について説明する。
高域成分の符号化時には、予め定められた所定のフレーム長の区間ごとに、可変長方式と固定長方式の切り替えが行なわれる。例えば、以下では16フレームごとに可変長方式と固定長方式の切り替えが行なわれるものとして説明を続けることとし、入力信号の16フレーム分の区間を処理対象区間とも称することとする。つまり、符号化装置では、処理対象区間である16フレームを単位として、出力符号列が出力される。
まず、可変長方式について説明する。可変長方式による高域成分の符号化では、方式フラグ、係数インデックス、区間情報、および個数情報からなるデータが符号化され、高域符号化データとされる。
なお、方式フラグは、高域符号化データを生成する方式を示す情報、すなわち高域成分の符号化時に可変長方式と固定長方式の何れの方式が選択されたかを示す情報である。
また、区間情報とは、処理対象区間に含まれる連続するフレームからなる区間であって、同じ係数インデックスが選択されたフレームからなる区間(以下、連続フレーム区間とも称する)の長さを示す情報である。また、個数情報とは、処理対象区間に含まれる連続フレーム区間の個数を示す情報である。
例えば、可変長方式では図2に示すように位置FST1から位置FSE1までの間に含まれる16フレームの区間が1つの処理対象区間とされる。なお、図2において、図中、横方向は時間を示しており、1つの四角形は1つのフレームを表している。また、フレームを表す四角形内の数値は、そのフレームについて選択された推定係数を特定する係数インデックスの値を示している。
可変長方式による高域成分の符号化では、まず、処理対象区間が、同じ係数インデックスが選択される、連続するフレームからなる連続フレーム区間に分割される。すなわち、異なる係数インデックスが選択される、互いに隣接するフレームの境界位置が、各連続フレーム区間の境界位置とされる。
この例では、処理対象区間は、位置FST1から位置FC1の区間、位置FC1から位置FC2の区間、および位置FC2から位置FSE1の区間の3つの区間に分割される。例えば、位置FST1から位置FC1までの連続フレーム区間では、各フレームにおいて、同じ係数インデックス「2」が選択されている。
このようにして処理対象区間が連続フレーム区間に分割されると、処理対象区間内の連続フレーム区間数を示す個数情報、各連続フレーム区間で選択された係数インデックス、各連続フレーム区間の長さを示す区間情報、および方式フラグからなるデータが生成される。
ここでは、処理対象区間は3つの連続フレーム区間に分割されているので、連続フレーム区間数「3」を示す情報が個数情報とされる。図2では個数情報が「num_length=3」で表されている。
また、例えば処理対象区間内の最初の連続フレーム区間の区間情報は、その連続フレーム区間のフレームを単位とする長さ「5」とされ、図2では「length0=5」で表されている。なお、各区間情報は、処理対象区間の先頭から何番目にある連続フレーム区間の区間情報であるかが特定できるようにされている。換言すれば、区間情報には、処理対象区間内における連続フレーム区間の位置を特定するための情報も含まれている。
このようにして、処理対象区間について個数情報、係数インデックス、区間情報、および方式フラグからなるデータが生成されると、このデータが符号化されて高域符号化データとされる。この場合、複数フレームで連続して同じ係数インデックスが選択されるときには、フレームごとに係数インデックスを送信する必要がなくなるので、伝送する出力符号列のデータ量を削減し、より効率的に符号化,復号を行なうことができる。
[固定長方式について]
次に、固定長方式による高域成分の符号化について説明する。
固定長方式では図3に示すように、16フレームからなる処理対象区間が、所定のフレーム数からなる区間(以下、固定長区間と称する)に等分割される。なお、図3において、横方向は時間を示しており、1つの四角形は1つのフレームを表している。また、フレームを表す四角形内の数値は、そのフレームについて選択された推定係数を特定する係数インデックスの値を示している。さらに、図3において、図2における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
固定長方式においては、処理対象区間がいくつかの固定長区間に分割される。このとき、固定長区間の長さは、固定長区間内の各フレームで選択されている係数インデックスが同じであり、かつ固定長区間の長さが最も長くなるように定められる。
図3の例では、固定長区間の長さ(以下、単に固定長とも称する)は、4フレームとされており、処理対象区間は4つの固定長区間に等分されている。すなわち、処理対象区間は、位置FST1から位置FC21までの区間、位置FC21から位置FC22までの区間、位置FC22から位置FC23までの区間、および位置FC23から位置FSE1までの区間に分割される。これらの固定長区間における係数インデックスは、処理対象区間の先頭の固定長区間から順番に、係数インデックス「1」,「2」,「2」,「3」とされている。
このようにして、処理対象区間がいくつかの固定長区間に分割されると、処理対象区間内の固定長区間の固定長を示す固定長インデックス、係数インデックス、切り替わりフラグ、および方式フラグからなるデータが生成される。
ここで、切り替わりフラグとは、固定長区間の境界位置、つまり所定の固定長区間の最後のフレームと、その固定長区間の次の固定長区間の先頭のフレームとで、係数インデックスが変化したか否かを示す情報である。例えば、i番目(i=0,1,2,・・・)の切り替わりフラグgridflg_iは、処理対象区間の先頭から(i+1)番目と(i+2)番目の固定長区間の境界位置において、係数インデックスが変化した場合「1」とされ、変化していない場合「0」とされる。
図3の例では、処理対象区間の1番目の固定長区間の境界位置(位置FC21)の切り替わりフラグgridflg_0は、1番目の固定長区間の係数インデックス「1」と、2番目の固定長区間の係数インデックス「2」とが異なるため「1」とされている。また、位置FC22の切り替わりフラグgridflg_1は、2番目の固定長区間の係数インデックス「2」と、3番目の固定長区間の係数インデックス「2」とが同じであるため「0」とされている。
さらに、固定長インデックスの値は、固定長から求められる値などとされる。具体的には、例えば固定長インデックスlength_idは、固定長fixed_length=16/2length_idを満たす値とされる。図3の例では、固定長fixed_length=4であるので、固定長インデックスlength_id=2とされる。
処理対象区間が固定長区間に分割され、固定長インデックス、係数インデックス、切り替わりフラグ、および方式フラグからなるデータが生成されると、このデータが符号化されて高域符号化データとされる。
図3の例では、位置FC21乃至位置FC23における切り替わりフラグgridflg_0=1、gridflg_1=0、およびgridflg_2=1と、固定長インデックスlength_id=2、各固定長区間の係数インデックス「1」,「2」,「3」、および固定長方式である旨の方式フラグとからなるデータが符号化されて、高域符号化データとされる。
ここで、各固定長区間の境界位置の切り替わりフラグは、処理対象区間の先頭から何番目にある境界位置の切り替わりフラグであるかが特定できるようにされている。換言すれば、切り替わりフラグには、処理対象区間内における固定長区間の境界位置を特定するための情報も含まれている。
また、高域符号化データに含まれる各係数インデックスは、それらの係数インデックスが選択された順番、つまり固定長区間が並ぶ順番に並べられている。例えば、図3の例では、係数インデックス「1」,「2」,「3」の順に並べられて、それらの係数インデックスがデータに含められる。
なお、図3の例では、処理対象区間の先頭から2番目と3番目の固定長区間の係数インデックスが「2」であるが、高域符号化データには、係数インデックス「2」が1つだけ含まれるようにされる。連続する固定長区間の係数インデックスが同じである場合、すなわち連続する固定長区間の境界位置における切り替わりフラグが0の場合には、それらの固定長区間の数だけ同じ係数インデックスが高域符号化データに含まれるのではなく、1つの係数インデックスが高域符号化データに含まれることになる。
このように、固定長インデックス、係数インデックス、切り替わりフラグ、および方式フラグからなるデータから高域符号化データを生成すれば、フレームごとに係数インデックスを送信する必要がなくなるので、伝送する出力符号列のデータ量を削減することができる。これにより、より効率的に符号化,復号を行なうことができる。
[連続フレーム区間数について]
また、入力信号の符号化時においては、入力信号の各サブバンドのサブバンド信号に基づいて、処理対象区間を構成する連続フレーム区間の最適な数が定められ、定められた連続フレーム区間数に基づいて各フレームの係数インデックス(推定係数)が選択される。例えば処理対象区間を構成する最適な連続フレーム区間数は、高域側のサブバンドのサブバンドパワーから定まる特徴量(以下、区間数決定特徴量とも称する)に基づいて定められる。
このように、処理対象区間を構成する連続フレーム区間の数を、高域の特徴を示す区間数決定特徴量に基づいて定めることで、フレームごとに選択される係数インデックスが、時間方向に必要以上に変化することを防止することができる。
これにより、処理対象区間の高域符号化データに含まれる係数インデックスの数等を必要最小限に抑えることができ、高域符号化データの符号量をより少なくすることができる。
また、推定係数によって高域成分の推定誤差等の特性が異なるため、係数インデックスの時間方向の変動が必要以上に多いと、復号で得られる音声信号には、復号前の入力信号にはない不自然な周波数包絡の時間変動が生じ、聴感上、音質が劣化してしまう。このような音質の劣化は、高域成分の時間変動が少ない定常的な音声信号ほど顕著である。
しかし、処理対象区間を構成する連続フレーム区間数を適切に定めてから各フレームの係数インデックスを選択すれば、係数インデックスが必要以上に変動することを防止することができる。これにより、復号で得られる音声の高域成分の不自然な時間変動を抑制し、音質を向上させることができる。
〈第1の実施の形態〉
[符号化装置の構成例]
次に、以上において説明した入力信号の符号化技術の具体的な実施の形態について説明する。まず、入力信号の符号化を行なう符号化装置の構成について説明する。図4は、符号化装置の構成例を示す図である。
符号化装置11は、低域通過フィルタ31、低域符号化回路32、サブバンド分割回路33、特徴量算出回路34、擬似高域サブバンドパワー算出回路35、区間数決定特徴量算出回路36、擬似高域サブバンドパワー差分算出回路37、高域符号化回路38、および多重化回路39から構成される。符号化装置11では、符号化対象の入力信号が低域通過フィルタ31およびサブバンド分割回路33に供給される。
低域通過フィルタ31は、供給された入力信号を所定の遮断周波数でフィルタリングし、その結果得られた、遮断周波数より低域の信号(以下、低域信号と称する)を、低域符号化回路32およびサブバンド分割回路33に供給する。
低域符号化回路32は、低域通過フィルタ31からの低域信号を符号化し、その結果得られた低域符号化データを多重化回路39に供給する。
サブバンド分割回路33は、低域通過フィルタ31からの低域信号を複数のサブバンドのサブバンド信号(以下、低域サブバンド信号とも称する)に等分割し、これにより得られた低域サブバンド信号を特徴量算出回路34および区間数決定特徴量算出回路36に供給する。低域サブバンド信号は、入力信号の低域側の各サブバンドの信号である。
また、サブバンド分割回路33は、供給された入力信号を複数のサブバンドのサブバンド信号に等分割し、これにより得られたサブバンド信号のうち、高域側の所定の帯域に含まれる各サブバンドのサブバンド信号を、区間数決定特徴量算出回路36および擬似高域サブバンドパワー差分算出回路37に供給する。なお、以下、サブバンド分割回路33から区間数決定特徴量算出回路36および擬似高域サブバンドパワー差分算出回路37に供給される各サブバンドのサブバンド信号を、高域サブバンド信号とも称する。
特徴量算出回路34は、サブバンド分割回路33からの低域サブバンド信号に基づいて特徴量を算出し、擬似高域サブバンドパワー算出回路35に供給する。
擬似高域サブバンドパワー算出回路35は、特徴量算出回路34からの特徴量に基づいて、高域サブバンド信号のパワーの推定値(以下、擬似高域サブバンドパワーとも称する)を算出し、擬似高域サブバンドパワー差分算出回路37に供給する。なお、擬似高域サブバンドパワー算出回路35には、統計学習により得られた推定係数のセットが複数記録されており、擬似高域サブバンドパワーは、推定係数と特徴量に基づいて算出される。
区間数決定特徴量算出回路36は、サブバンド分割回路33から供給された低域サブバンド信号および高域サブバンド信号に基づいて、区間数決定特徴量を算出し、擬似高域サブバンドパワー差分算出回路37に供給する。
擬似高域サブバンドパワー差分算出回路37は、各フレームについて、そのフレームの高域成分を推定するのに適した推定係数を示す係数インデックスを選択する。擬似高域サブバンドパワー差分算出回路37は、決定部51、評価値和算出部52、選択部53、および生成部54を備えている。
決定部51は、区間数決定特徴量算出回路36から供給された区間数決定特徴量に基づいて、処理対象区間を構成する連続フレーム区間の数を決定する。
擬似高域サブバンドパワー差分算出回路37は、サブバンド分割回路33からの高域サブバンド信号のパワー(以下、高域サブバンドパワーとも称する)と、擬似高域サブバンドパワー算出回路35からの擬似高域サブバンドパワーとに基づいて、各フレームについて推定係数ごとに評価値を算出する。この評価値は、入力信号の実際の高域成分と、推定係数を用いて推定された高域成分との誤差を示す値である。
評価値和算出部52は、決定部51により決定された連続フレーム区間数と、各フレームの評価値とに基づいて、連続するフレームの評価値の和を算出する。選択部53は、評価値和算出部52により算出された評価値の和に基づいて各フレームの係数インデックスを選択する。
生成部54は、入力信号の処理対象区間の各フレームにおける係数インデックスの選択結果に基づいて、可変長方式または固定長方式の切り替えを行い、選択された方式で高域符号化データを得るためのデータを生成し、高域符号化回路38に供給する。
高域符号化回路38は、擬似高域サブバンドパワー差分算出回路37から供給されたデータを符号化し、その結果得られる高域符号化データを多重化回路39に供給する。多重化回路39は、低域符号化回路32からの低域符号化データと、高域符号化回路38からの高域符号化データとを多重化し、出力符号列として出力する。
[符号化処理の説明]
図4に示した符号化装置11は、入力信号が供給されて、入力信号の符号化が指示されると符号化処理を行なって、復号装置に出力符号列を出力する。以下、図5のフローチャートを参照して、符号化装置11による符号化処理について説明する。なお、この符号化処理は、予め定められたフレーム数、つまり処理対象区間ごとに行なわれる。
ステップS11において、低域通過フィルタ31は、供給された処理対象のフレームの入力信号を低域通過フィルタによって所定の遮断周波数でフィルタリングし、その結果得られた低域信号を低域符号化回路32およびサブバンド分割回路33に供給する。
ステップS12において、低域符号化回路32は、低域通過フィルタ31から供給された低域信号を符号化し、その結果得られた低域符号化データを多重化回路39に供給する。
ステップS13において、サブバンド分割回路33は、入力信号および低域信号を所定の帯域幅の複数のサブバンド信号に等分割する。
すなわち、サブバンド分割回路33は、入力信号を各サブバンドのサブバンド信号に分割し、これにより得られた高域側のサブバンドsb+1乃至サブバンドebの各サブバンド信号を、区間数決定特徴量算出回路36および擬似高域サブバンドパワー差分算出回路37に供給する。
また、サブバンド分割回路33は、低域通過フィルタ31からの低域信号を各サブバンドのサブバンド信号に分割し、これにより得られた低域側のサブバンドsb−3乃至サブバンドsbの各サブバンド信号を、特徴量算出回路34および区間数決定特徴量算出回路36に供給する。
ステップS14において、区間数決定特徴量算出回路36は、サブバンド分割回路33から供給された低域サブバンド信号および高域サブバンド信号の少なくとも何れかに基づいて区間数決定特徴量を算出し、擬似高域サブバンドパワー差分算出回路37に供給する。
例えば、区間数決定特徴量算出回路36は次式(1)を計算することで、処理対象のフレームJの推定帯域、つまり高域側の各サブバンドのサブバンド信号のパワーの和であるサブバンドパワー和powerhigh(J)を算出する。
Figure 2013044922
なお、式(1)において、powerlin(ib,J)は、フレームJのサブバンドib(但し、sb+1≦ib≦eb)のサブバンド信号の各サンプルのサンプル値の二乗平均値を示している。したがって、サブバンドパワー和powerhigh(J)は、高域側の各サブバンドについて求めた二乗平均値powerlin(ib,J)の和を対数化することにより得られる。
このようにして得られるサブバンドパワー和powerhigh(J)は、入力信号の高域側の各サブバンドの高域サブバンドパワーの和を示しており、各サブバンドのパワーの和が大きいほどサブバンドパワー和powerhigh(J)の値も大きくなる。つまり、入力信号の高域成分のパワーが全体的に大きいほど、サブバンドパワー和powerhigh(J)も大きくなる。
ステップS15において、特徴量算出回路34は、サブバンド分割回路33から供給された低域サブバンド信号に基づいて特徴量を算出し、擬似高域サブバンドパワー算出回路35に供給する。
例えば、特徴量として各低域サブバンド信号のパワーが算出される。なお、以下、低域サブバンド信号のパワーを特に低域サブバンドパワーとも称することとする。また、低域サブバンド信号や高域サブバンド信号など、各サブバンド信号のパワーを、適宜、サブバンドパワーとも称することとする。
具体的には、特徴量算出回路34は、次式(2)を計算することで、デシベルで表現される処理対象のフレームJのサブバンドib(但し、sb−3≦ib≦sb)のサブバンドパワーpower(ib,J)を算出する。
Figure 2013044922
なお、式(2)においてx(ib,n)は、サブバンドibのサブバンド信号の値(サンプルのサンプル値)を示しており、x(ib,n)におけるnは、離散時間のインデックスを示している。また、式(2)におけるFSIZEは、1フレームを構成するサブバンド信号のサンプル数を示している。
したがって、フレームJの低域サブバンドパワーpower(ib,J)は、フレームJを構成する低域サブバンド信号の各サンプルのサンプル値の二乗平均値を対数化することにより算出される。なお、以下では、特徴量算出回路34において、特徴量として低域サブバンドパワーが算出されるものとして説明を続ける。
ステップS16において、擬似高域サブバンドパワー算出回路35は、予め記録している推定係数ごとに、特徴量算出回路34から供給された特徴量としての低域サブバンドパワーと、記録している推定係数とに基づいて擬似高域サブバンドパワーを算出する。
例えば、係数インデックスが1乃至K(但し、2≦K)のK個の推定係数のセットが予め用意されている場合、K個の推定係数のセットについて、各サブバンドの擬似高域サブバンドパワーが算出される。
具体的には、擬似高域サブバンドパワー算出回路35は次式(3)を計算し、処理対象のフレームJの高域側の各サブバンドの擬似高域サブバンドパワーpowerest(ib,J)(但し、sb+1≦ib≦eb)を算出する。
Figure 2013044922
なお、式(3)において、係数Aib(kb)および係数Bibは、高域側のサブバンドibについて用意された推定係数のセットを示している。すなわち、係数Aib(kb)は、サブバンドkb(但し、sb−3≦kb≦sb)の低域サブバンドパワーpower(kb,J)に乗算される係数であり、係数Bibは、低域サブバンドパワーを線形結合するときに用いられる定数項である。
したがって、高域側のサブバンドibの擬似高域サブバンドパワーpowerest(ib,J)は、低域側の各サブバンドの低域サブバンドパワーに、サブバンドごとの係数Aib(kb)を乗算し、係数が乗算された低域サブバンドパワーの和に、さらに係数Bibを加算することで得られる。
擬似高域サブバンドパワー算出回路35は、推定係数のセットごとに高域の各サブバンドの擬似高域サブバンドパワーを算出すると、算出した擬似高域サブバンドパワーを擬似高域サブバンドパワー差分算出回路37に供給する。
ステップS17において、擬似高域サブバンドパワー差分算出回路37は、係数インデックスidで特定される推定係数のセット全てについて、処理対象のフレームJを用いた評価値Res(id,J)を算出する。
具体的には、擬似高域サブバンドパワー差分算出回路37は、サブバンド分割回路33から供給された各サブバンドの高域サブバンド信号を用いて、上述した式(2)と同様の演算を行ない、フレームJにおける高域サブバンドパワーpower(ib,J)を算出する。
高域サブバンドパワーpower(ib,J)が得られると、擬似高域サブバンドパワー差分算出回路37は、次式(4)を計算し、残差二乗平均値Resstd(id,J)を算出する。
Figure 2013044922
すなわち、高域側の各サブバンドib(但し、sb+1≦ib≦eb)について、フレームJの高域サブバンドパワーpower(ib,J)と擬似高域サブバンドパワーpowerest(ib,id,J)の差分が求められ、それらの差分の二乗平均値が残差二乗平均値Resstd(id,J)とされる。
なお、擬似高域サブバンドパワーpowerest(ib,id,J)は、フレームJにおいて、係数インデックスがidである推定係数について求められた、サブバンドibの擬似高域サブバンドパワーを示している。
続いて、擬似高域サブバンドパワー差分算出回路37は、次式(5)を計算し、残差最大値Resmax(id,J)を算出する。
Figure 2013044922
なお、式(5)において、maxib{|power(ib,J)−powerest(ib,id,J)|}は、各サブバンドibの高域サブバンドパワーpower(ib,J)と擬似高域サブバンドパワーpowerest(ib,id,J)の差分の絶対値のうちの最大のものを示している。したがって、フレームJにおける高域サブバンドパワーpower(ib,J)と擬似高域サブバンドパワーpowerest(ib,id,J)の差分の絶対値の最大値が残差最大値Resmax(id,J)とされる。
また、擬似高域サブバンドパワー差分算出回路37は、次式(6)を計算し、残差平均値Resave(id,J)を算出する。
Figure 2013044922
すなわち、高域側の各サブバンドibについて、フレームJの高域サブバンドパワーpower(ib,J)と擬似高域サブバンドパワーpowerest(ib,id,J)の差分が求められ、それらの差分の総和が求められる。そして、得られた差分の総和を高域側のサブバンド数(eb−sb)で除算して得られる値の絶対値が残差平均値Resave(id,J)とされる。この残差平均値Resave(id,J)は、符号が考慮された各サブバンドの推定誤差の平均値の大きさを示している。
さらに、残差二乗平均値Resstd(id,J)、残差最大値Resmax(id,J)、および残差平均値Resave(id,J)が得られると、擬似高域サブバンドパワー差分算出回路37は、次式(7)を計算し、最終的な評価値Res(id,J)を算出する。
Figure 2013044922
すなわち、残差二乗平均値Resstd(id,J)、残差最大値Resmax(id,J)、および残差平均値Resave(id,J)が重み付き加算されて、最終的な評価値Res(id,J)とされる。なお、式(7)において、Wstd、WmaxおよびWaveは、予め定められた重みであり、例えばWstd=1、Wmax=0.5、Wave=0.5などとされる。
擬似高域サブバンドパワー差分算出回路37は、以上の処理を行って、K個の推定係数ごとに、すなわちK個の係数インデックスidごとに、評価値Res(id,J)を算出する。
このようにして得られた評価値Res(id,J)は、実際の入力信号から算出された高域サブバンドパワーと、係数インデックスがidである推定係数を用いて算出された擬似高域サブバンドパワーとの類似の度合いを示している。つまり、高域成分の推定誤差の大きさを示している。
したがって、評価値Res(id,J)が小さいほど、推定係数を用いた演算により、実際の入力信号の高域成分により近い信号が得られることになる。
ステップS18において、擬似高域サブバンドパワー差分算出回路37は、所定フレーム長だけ処理を行ったか否かを判定する。すなわち、処理対象区間を構成する全てのフレームについて、区間数決定特徴量と評価値が算出されたか否かが判定される。
ステップS18において、所定フレーム長だけ処理を行なっていないと判定された場合、処理はステップS11に戻り、上述した処理が繰り返される。すなわち、処理対象区間のまだ処理対象となっていないフレームが、次の処理対象のフレームとされて、そのフレームの区間数決定特徴量と評価値が算出される。
これに対してステップS18において、所定フレーム長だけ処理を行ったと判定された場合、処理はステップS19に進む。
ステップS19において、決定部51は、区間数決定特徴量算出回路36から供給された、処理対象区間を構成する各フレームの区間数決定特徴量に基づいて、処理対象区間を構成する連続フレーム区間数を決定する。
具体的には決定部51は、処理対象区間を構成する各フレームの区間数決定特徴量から、それらの区間数決定特徴量の代表値を求める。例えば、各フレームの区間数決定特徴量のうちの最大値、つまり最も大きい区間数決定特徴量が代表値とされる。
次に、決定部51は求めた代表値と予め定めた閾値とを比較することで、連続フレーム区間数を決定する。例えば連続フレーム区間数は、代表値が100以上である場合、16とされ、代表値が80以上100未満である場合、8とされ、代表値が60以上80未満である場合、4とされる。また、代表値が40以上60未満である場合、連続フレーム区間数は2とされ、代表値が40未満である場合、連続フレーム区間数は1とされる。
連続フレーム区間数の決定時に閾値処理される区間数決定特徴量(代表値)は、高域サブバンドパワーの和を示している。入力信号等の音声信号において、高域側のサブバンドパワーの和が大きい区間は、サブバンドパワーが小さい区間と比べて聴感上、高域成分がより耳に付く(はっきりと聞こえる)ので、復号時には、より原信号に近い信号が推定により得られるようにする必要がある。
そこで、決定部51は区間数決定特徴量の代表値が大きい場合には、連続フレーム区間数を多くして、復号側においてより高精度に各フレームの高域成分を推定できるようにする。これにより、復号により得られる音声信号の明瞭度を上げることができ、聴感上の音質を向上させることができる。
これに対して、代表値が小さい場合には、高域成分のパワーは小さいので、推定係数による高域成分の推定精度がある程度低くても、復号で得られる音声の音質の聴感上の劣化は知覚されにくくなる。そのため、決定部51は、代表値が小さい場合には、連続フレーム区間数を少なくして、音質を劣化させることなく高域符号化データの符号量を削減する。
ステップS20において、評価値和算出部52は、各フレームについて係数インデックス(推定係数のセット)ごとに算出した評価値を用いて、連続フレーム区間を構成するフレームの評価値の和を係数インデックスごとに算出する。
例えば、ステップS19で決定された連続フレーム区間数がndivであり、処理対象区間が16フレームで構成されるものとする。そのような場合、例えば評価値和算出部52は、処理対象区間をndiv個の区間に等分し、得られた各区間を連続フレーム区間とする。この場合、各連続フレーム区間は、16/ndiv個の連続するフレームから構成されることになる。
さらに、評価値和算出部52は次式(8)を計算して、係数インデックスごとに各連続フレーム区間を構成するフレームの評価値の和である評価値和Ressum(id,igp)を算出する。
Figure 2013044922
なお、式(8)において、igpは処理対象区間内の連続フレーム区間を識別するインデックスであり、Res(id,ifr)は、係数インデックスidについて求められた、連続フレーム区間を構成するフレームifrの評価値Res(id,ifr)を示している。
したがって、連続フレーム区間の係数インデックスidについての評価値和Ressum(id,igp)は、その連続フレーム区間を構成する、同じ係数インデックスidの各フレームの評価値の和を計算することにより算出される。
ステップS21において、選択部53は、各連続フレーム区間について係数インデックスごとに求められた評価値和に基づいて、各フレームの係数インデックスを選択する。
各フレームの評価値Res(id,J)は、その値が小さいほど推定係数を用いた演算により、実際の高域成分により近い信号が得られるから、評価値和Ressum(id,igp)が小さい係数インデックスほど、その係数インデックスが連続フレーム区間に適したものであるといえる。
そこで、選択部53は、複数の係数インデックスのうち、連続フレーム区間について求めた評価値和Ressum(id,igp)が最小となる係数インデックスを、その連続フレーム区間を構成する各フレームの係数インデックスとして選択する。したがって、連続フレーム区間では、各フレームで同じ係数インデックスが選択されることになる。
このようにして選択部53は、処理対象区間を構成する連続フレーム区間ごとに、その連続フレーム区間を構成するフレームの係数インデックスを選択する。
なお、連続フレーム区間ごとに評価値和に基づいて係数インデックスを選択すると、場合によっては、互いに隣接する連続フレーム区間で同じ係数インデックスが選択されることもある。そのような場合、符号化装置11は、同じ係数インデックスが選択されたそれらの連続して並ぶ連続フレーム区間を、1つの連続フレーム区間として扱う。
ステップS22において、生成部54は、高域符号化データを生成する方式を、固定長方式とするか否かを判定する。
すなわち、生成部54は、処理対象区間における各フレームの係数インデックスの選択結果に基づいて、固定長方式により生成したときの高域符号化データと、可変長方式により生成したときの高域符号化データとの符号量を比較する。そして、生成部54は、固定長方式の高域符号化データの符号量が、可変長方式の高域符号化データの符号量よりも少ない場合、固定長方式とすると判定する。
ステップS22において、固定長方式とすると判定された場合、処理はステップS23に進む。ステップS23において、生成部54は、固定長方式が選択された旨の方式フラグ、固定長インデックス、係数インデックス、および切り替わりフラグからなるデータを生成し、高域符号化回路38に供給する。
例えば、図3の例では、生成部54は、固定長を4フレームとして、位置FST1から位置FSE1までの処理対象区間を、4つの固定長区間に分割する。そして、生成部54は、固定長インデックス「2」、係数インデックス「1」,「2」,「3」、切り替わりフラグ「1」,「0」,「1」、および方式フラグからなるデータを生成する。
なお、図3では処理対象区間の先頭から2番目と3番目の固定長区間の係数インデックスはともに「2」であるが、これらの固定長区間は連続して並んでいるため、生成部54から出力されるデータには、係数インデックス「2」が1つだけ含まれるようにされる。
ステップS24において、高域符号化回路38は、生成部54から供給された、方式フラグ、固定長インデックス、係数インデックス、および切り替わりフラグからなるデータを符号化し、高域符号化データを生成する。
例えば、必要に応じて、方式フラグ、固定長インデックス、係数インデックス、および切り替わりフラグのうちの一部または全部の情報に対してエントロピー符号化などが行なわれる。なお、方式フラグや固定長インデックスなどからなるデータが、そのまま高域符号化データとされてもよい。
高域符号化回路38は、生成した高域符号化データを多重化回路39に供給し、その後、処理はステップS27に進む。
これに対して、ステップS22において、固定長方式としないと判定された場合、つまり可変長方式とすると判定された場合、処理はステップS25に進む。ステップS25において、生成部54は、可変長方式が選択された旨の方式フラグ、係数インデックス、区間情報、および個数情報からなるデータを生成し、高域符号化回路38に供給する。
例えば、図2の例では、位置FST1から位置FSE1までの処理対象区間が、3つの連続フレーム区間に分割されている。生成部54は、可変長方式が選択された旨の方式フラグ、および連続フレーム区間の個数「3」を示す個数情報「num_length=3」と、各連続フレーム区間の長さを示す区間情報「length0=5」、および「length1=7」、並びにそれらの連続フレーム区間の係数インデックス「2」、「5」、および「1」とからなるデータを生成する。
なお、各連続フレーム区間の係数インデックスは、区間情報と対応付けられて、どの連続フレーム区間の係数インデックスかが特定できるようにされる。また、図2の例では、処理対象区間の先頭と、その次の連続フレーム区間の区間情報から、処理対象区間の最後の連続フレーム区間を構成するフレーム数が特定可能であるので、最後の連続フレーム区間については区間情報が生成されていない。
ステップS26において、高域符号化回路38は、生成部54から供給された、方式フラグ、係数インデックス、区間情報、および個数情報からなるデータを符号化し、高域符号化データを生成する。
例えば、ステップS26では、方式フラグ、係数インデックス、区間情報、および個数情報のうちの一部または全部の情報に対してエントロピー符号化などが行なわれる。なお、高域符号化データは、推定係数が得られる情報であれば、どのような情報であってもよく、例えば方式フラグ、係数インデックス、区間情報、および個数情報からなるデータがそのまま高域符号化データとされてもよい。
高域符号化回路38は、生成した高域符号化データを多重化回路39に供給し、その後、処理はステップS27に進む。
ステップS24またはステップS26において、高域符号化データが生成されると、ステップS27において、多重化回路39は、低域符号化回路32から供給された低域符号化データと、高域符号化回路38から供給された高域符号化データとを多重化する。そして、多重化回路39は、多重化により得られた出力符号列を出力し、符号化処理は終了する。
以上のようにして符号化装置11は、入力信号から得られたサブバンド信号に基づいて区間数決定特徴量を算出し、区間数決定特徴量から連続フレーム区間数を定めるとともに、連続フレーム区間ごとに評価値和を算出し、各フレームの係数インデックスを選択する。そして、符号化装置11は、選択した係数インデックスを含むデータを符号化し、高域符号化データとする。
このように、係数インデックスを含むデータを符号化し、高域符号化データとすることで、スケールファクタ等の高域の推定演算に用いられるデータそのものを符号化する場合と比べて、高域符号化データの符号量をより少なくすることができる。
また、区間数決定特徴量に基づいて連続フレーム区間数を定めることにより、時間方向に対して必要以上に係数インデックスが変動することを抑制し、復号で得られる音声の聴感上の音質を向上させるとともに、出力符号列の符号量を削減することができる。これにより、入力信号の符号化効率を向上させることができる。
さらに、連続フレーム区間ごとに評価値和を算出して係数インデックスを選択することで、連続フレーム区間ごとにより適した推定係数の係数インデックスを得ることができる。特に、処理対象区間を構成する各連続フレーム区間の長さを等しくすることで、演算量を削減し、より迅速に係数インデックスを選択することができる。
[復号装置の構成]
次に符号化装置11から出力された出力符号列の供給を受け、出力符号列の復号を行なう復号装置について説明する。
そのような復号装置は、例えば図6に示すように構成される。
復号装置81は、非多重化回路91、低域復号回路92、サブバンド分割回路93、特徴量算出回路94、高域復号回路95、復号高域サブバンドパワー算出回路96、復号高域信号生成回路97、および合成回路98から構成される。
非多重化回路91は、符号化装置11から受信した出力符号列を入力符号列として、入力符号列を高域符号化データと低域符号化データに非多重化する。また、非多重化回路91は、非多重化により得られた低域符号化データを低域復号回路92に供給し、非多重化により得られた高域符号化データを高域復号回路95に供給する。
低域復号回路92は、非多重化回路91からの低域符号化データを復号し、その結果得られた入力信号の復号低域信号を、サブバンド分割回路93、および合成回路98に供給する。
サブバンド分割回路93は、低域復号回路92からの復号低域信号を、所定の帯域幅を持つ複数の低域サブバンド信号に等分割し、得られた低域サブバンド信号を特徴量算出回路94および復号高域信号生成回路97に供給する。
特徴量算出回路94は、サブバンド分割回路93からの低域サブバンド信号に基づいて、低域側の各サブバンドの低域サブバンドパワーを特徴量として算出し、復号高域サブバンドパワー算出回路96に供給する。
高域復号回路95は、非多重化回路91からの高域符号化データを復号し、その結果得られたデータと、そのデータに含まれる係数インデックスにより特定される推定係数とを復号高域サブバンドパワー算出回路96に供給する。すなわち、高域復号回路95には予め複数の係数インデックスと、その係数インデックスにより特定される推定係数とが対応付けられて記録されており、高域復号回路95は高域符号化データに含まれる係数インデックスに対応する推定係数を出力する。
復号高域サブバンドパワー算出回路96は、高域復号回路95からのデータおよび推定係数と、特徴量算出回路94からの低域サブバンドパワーとに基づいて、フレームごとに高域側の各サブバンドのサブバンドパワーの推定値である復号高域サブバンドパワーを算出する。例えば、上述した式(3)と同様の演算が行なわれて、復号高域サブバンドパワーが算出される。復号高域サブバンドパワー算出回路96は、算出した各サブバンドの復号高域サブバンドパワーを復号高域信号生成回路97に供給する。
復号高域信号生成回路97は、サブバンド分割回路93からの低域サブバンド信号と、復号高域サブバンドパワー算出回路96からの復号高域サブバンドパワーとに基づいて復号高域信号を生成し、合成回路98に供給する。
具体的には、復号高域信号生成回路97は、低域サブバンド信号の低域サブバンドパワーを算出し、復号高域サブバンドパワーと低域サブバンドパワーとの比に応じて低域サブバンド信号を振幅変調する。さらに、復号高域信号生成回路97は、振幅変調された低域サブバンド信号を周波数変調することにより、高域側の各サブバンドの復号高域サブバンド信号を生成する。このようにして得られた復号高域サブバンド信号は、入力信号の高域側の各サブバンドの高域サブバンド信号の推定値である。復号高域信号生成回路97は、得られた各サブバンドの復号高域サブバンド信号からなる復号高域信号を合成回路98に供給する。
合成回路98は、低域復号回路92からの復号低域信号と、復号高域信号生成回路97からの復号高域信号とを合成し、出力信号として出力する。この出力信号は、符号化された入力信号を復号して得られる信号であり、高域成分と低域成分からなる信号である。
〈変形例1〉
[符号化処理の説明]
なお、以上においては、区間数決定特徴量として、高域サブバンドパワーの和を求める場合について説明したが、高域サブバンドパワーの和の時間変動を示す特徴量が、区間数決定特徴量とされてもよい。
高域サブバンドパワーの和の時間変動を示す特徴量として、例えば高域サブバンドパワーが時間とともにどの程度大きくなったかを示す特徴量、すなわちアタック性を示す特徴量が区間数決定特徴量とされてもよい。
そのような場合、符号化装置11は、例えば図7に示す符号化処理を行なう。以下、図7のフローチャートを参照して、符号化装置11による符号化処理について説明する。
なお、ステップS51乃至ステップS53の処理は、図5のステップS11乃至ステップS13の処理と同様であるので、その説明は省略する。
ステップS54において、区間数決定特徴量算出回路36は、サブバンド分割回路33から供給された高域サブバンド信号に基づいて、アタック性を示す区間数決定特徴量を算出し、擬似高域サブバンドパワー差分算出回路37に供給する。
例えば、区間数決定特徴量算出回路36は上述した式(1)を計算することで、処理対象のフレームJの高域サブバンド信号のサブバンドパワー和powerhigh(J)を算出する。
さらに、区間数決定特徴量算出回路36は、処理対象のフレームJを含む直近(L+1)フレーム分のサブバンドパワー和に基づいて、次式(9)を計算し、アタック性を示す区間数決定特徴量として、特徴量powerattack(J)を算出する。このとき、例えばL=16などとされる。
Figure 2013044922
なお、式(9)において、MIN{powerhigh(J), powerhigh(J-1),・・・powerhigh(J-L)}は、サブバンドパワー和powerhigh(J)乃至サブバンドパワー和powerhigh(J-L)のうちの最小値を出力する関数を示している。したがって、特徴量powerattack(J)は、処理対象のフレームJのサブバンドパワー和powerhigh(J)と、処理対象のフレームJを含む直近(L+1)フレームのサブバンドパワーの最小値との差分を計算することにより求められる。
このようにして得られた特徴量powerattack(J)は、サブバンドパワー和の時間方向への立ち上がりの速さ、つまり大きくなる速さを示しているので、特徴量powerattack(J)が大きいほど、高域成分のアタック性が強いということができる。
区間数決定特徴量算出回路36が算出した特徴量powerattack(J)を擬似高域サブバンドパワー差分算出回路37に供給すると、その後、ステップS55乃至ステップS67の処理が行なわれて符号化処理は終了する。
なお、これらの処理は図5のステップS15乃至ステップS27の処理と同様であるので、その説明は省略する。但しステップS59では、決定部51は区間数決定特徴量として算出した、アタック性を示す特徴量powerattack(J)の代表値と閾値とを比較することで、処理対象区間を構成する連続フレーム区間数を決定する。
具体的には、例えば処理対象区間内の各フレームの区間数決定特徴量の最大値が代表値とされ、代表値が40以上である場合、連続フレーム区間数は16とされ、代表値が30以上40未満である場合、連続フレーム区間数は8とされる。また、代表値が20以上30未満である場合、連続フレーム区間数は4とされ、代表値が10以上20未満である場合、連続フレーム区間数は2とされ、代表値が10未満である場合、連続フレーム区間数は1とされる。
例えば、区間数決定特徴量が大きくアタック性が強い区間は、サブバンドパワー和の時間変動が大きい区間である。つまり、最適な推定係数の時間方向の変動が大きい区間である。そこで、決定部51は区間数決定特徴量の代表値が大きい区間では連続フレーム区間数を多くすることで、復号側において、より原信号に近い高域サブバンド信号を推定により得られるようにする。これにより、復号により得られる音声信号の明瞭度を上げることができ、聴感上の音質を向上させることができる。
これに対して、決定部51は代表値が小さい区間では連続フレーム区間数を少なくすることで、音質を劣化させることなく高域符号化データの符号量を削減する。
このように、アタック性を示す区間数決定特徴量を用いた場合においても、復号で得られる音声の聴感上の音質を向上させるとともに出力符号列の符号量を削減し、入力信号の符号化効率を向上させることができる。
〈変形例2〉
[符号化処理の説明]
また、高域サブバンドパワーの和の時間変動を示す区間数決定特徴量として、ディケイ性を示す特徴量が用いられてもよい。
そのような場合、符号化装置11は、例えば図8に示す符号化処理を行なう。以下、図8のフローチャートを参照して、符号化装置11による符号化処理について説明する。なお、ステップS91乃至ステップS93の処理は、図5のステップS11乃至ステップS13の処理と同様であるので、その説明は省略する。
ステップS94において、区間数決定特徴量算出回路36は、サブバンド分割回路33から供給された高域サブバンド信号に基づいて、ディケイ性を示す区間数決定特徴量を算出し、擬似高域サブバンドパワー差分算出回路37に供給する。
例えば、区間数決定特徴量算出回路36は上述した式(1)を計算することで、処理対象のフレームJの高域サブバンド信号のサブバンドパワー和powerhigh(J)を算出する。
さらに、区間数決定特徴量算出回路36は、処理対象のフレームJを含む直近(M+1)フレーム分のサブバンドパワー和に基づいて、次式(10)を計算し、ディケイ性を示す区間数決定特徴量として特徴量powerdecay(J)を算出する。このとき、例えばM=16などとされる。
Figure 2013044922
なお、式(10)において、MAX{powerhigh(J),powerhigh(J-1),・・・powerhigh(J-M)}は、サブバンドパワー和powerhigh(J)乃至サブバンドパワー和powerhigh(J-M)のうちの最大値を出力する関数を示している。したがって、特徴量powerdecay(J)は、処理対象のフレームJを含む直近(M+1)フレームのサブバンドパワーの最大値と、処理対象のフレームJのサブバンドパワー和との差分を計算することにより求められる。
このようにして得られた特徴量powerdecay(J)は、サブバンドパワー和の時間方向への立ち下がりの速さ、つまり小さくなる速さを示しているので、特徴量powerdecay(J)が大きいほど、高域成分のディケイ性が強いということができる。
区間数決定特徴量算出回路36が算出した特徴量powerdecay(J)を擬似高域サブバンドパワー差分算出回路37に供給すると、その後、ステップS95乃至ステップS107の処理が行なわれて符号化処理は終了する。
なお、これらの処理は図5のステップS15乃至ステップS27の処理と同様であるので、その説明は省略する。但しステップS99では、決定部51はディケイ性を示す区間数決定特徴量として算出した特徴量powerdecay(J)の代表値と閾値とを比較することで、処理対象区間を構成する連続フレーム区間数を決定する。
具体的には、例えば処理対象区間内の各フレームの区間数決定特徴量の最大値が代表値とされ、代表値が40以上である場合、連続フレーム区間数は16とされ、代表値が30以上40未満である場合、連続フレーム区間数は8とされる。また、代表値が20以上30未満である場合、連続フレーム区間数は4とされ、代表値が10以上20未満である場合、連続フレーム区間数は2とされ、代表値が10未満である場合、連続フレーム区間数は1とされる。
例えば、区間数決定特徴量が大きくディケイ性が強い区間は、サブバンドパワー和の時間変動が大きい区間である。そこで、決定部51は、アタック性を示す区間数決定特徴量の場合と同様に、区間数決定特徴量の代表値がより大きい区間ほど、連続フレーム区間数をより多くする。これにより、復号で得られる音声の聴感上の音質を向上させるとともに出力符号列の符号量を削減し、入力信号の符号化効率を向上させることができる。
〈変形例3〉
[符号化処理の説明]
また、区間数決定特徴量として、入力信号の周波数形状を示す特徴量が用いられるようにしてもよい。
そのような場合、符号化装置11は、例えば図9に示す符号化処理を行なう。以下、図9のフローチャートを参照して、符号化装置11による符号化処理について説明する。なお、ステップS131乃至ステップS133の処理は、図5のステップS11乃至ステップS13の処理と同様であるので、その説明は省略する。
ステップS134において、区間数決定特徴量算出回路36は、サブバンド分割回路33から供給された低域サブバンド信号と高域サブバンド信号に基づいて、周波数形状を示す区間数決定特徴量を算出し、擬似高域サブバンドパワー差分算出回路37に供給する。
例えば、区間数決定特徴量算出回路36は上述した式(1)を計算することで、処理対象のフレームJの高域サブバンド信号のサブバンドパワー和powerhigh(J)を算出する。
さらに、区間数決定特徴量算出回路36は次式(11)を計算し、周波数形状を示す区間数決定特徴量として特徴量powertilt(J)を算出する。
Figure 2013044922
なお式(11)において、Σpowerlin(ib,J)は低域側のサブバンドib(但し、0≦ib≦sb)のサブバンド信号の各サンプルのサンプル値の二乗平均値の和を示している。
したがって、特徴量powertilt(J)は、処理対象のフレームJについて、低域側のサブバンドのサブバンド信号のサンプルの二乗平均値の和を対数化して得られた値、すなわち低域のサブバンドパワー和を、高域のサブバンドパワー和powerhigh(J)から減算することで得られる。つまり、特徴量powertilt(J)は、低域と高域のサブバンドパワー和の差分を求めることで算出される。
このようにして得られた特徴量powertilt(J)は、処理対象のフレームJにおける低域のサブバンドパワー和に対する、推定対象となる高域のサブバンドパワー和の割合を示している。したがって、特徴量powertilt(J)の値が大きいほど、フレームJにおいては、低域に対する高域の相対的なパワーが大きいことになる。
区間数決定特徴量算出回路36が算出した特徴量powertilt(J)を擬似高域サブバンドパワー差分算出回路37に供給すると、その後、ステップS135乃至ステップS147の処理が行なわれて符号化処理は終了する。
なお、これらの処理は図5のステップS15乃至ステップS27の処理と同様であるので、その説明は省略する。但しステップS139では、決定部51は周波数形状を示す区間数決定特徴量として算出した特徴量powertilt(J)の代表値と閾値とを比較することで、処理対象区間を構成する連続フレーム区間数を決定する。
具体的には、例えば処理対象区間内の各フレームの区間数決定特徴量の最大値が代表値とされ、代表値が40以上である場合、連続フレーム区間数は16とされ、代表値が30以上40未満である場合、連続フレーム区間数は8とされる。また、代表値が20以上30未満である場合、連続フレーム区間数は4とされ、代表値が10以上20未満である場合、連続フレーム区間数は2とされ、代表値が10未満である場合、連続フレーム区間数は1とされる。
例えば、入力信号の処理対象のフレームが、人の声の子音部や楽器のハイハットの部分などである場合には、低域のサブバンドパワー和よりも高域のサブバンドパワー和が大きくなる。つまり、区間数決定特徴量としての特徴量powertilt(J)の値が大きくなる。
このような入力信号のフレームでは、比較的高域の符号化による音質劣化が目立ってしまう。そこで、決定部51は、区間数決定特徴量の代表値が大きい区間では連続フレーム区間数を多くすることで、復号側において、より原信号に近い高域サブバンド信号を推定により得られるようにする。これにより、復号により得られる音声信号の明瞭度を上げることができ、聴感上の音質を向上させることができる。
これに対して、決定部51は代表値が小さい区間では連続フレーム区間数を少なくすることで、音質を劣化させることなく高域符号化データの符号量を削減する。
このように、周波数形状を示す区間数決定特徴量を用いた場合においても、復号で得られる音声の聴感上の音質を向上させるとともに出力符号列の符号量を削減し、入力信号の符号化効率を向上させることができる。
〈変形例4〉
[符号化処理の説明]
さらに、上述したサブバンドパワー和、アタック性やディケイ性を示す特徴量、周波数形状を示す特徴量などの複数の特徴量のうちの任意のものの線形和を区間数決定特徴量としてもよい。
そのような場合、符号化装置11は、例えば図10に示す符号化処理を行なう。以下、図10のフローチャートを参照して、符号化装置11による符号化処理について説明する。なお、ステップS171乃至ステップS173の処理は、図5のステップS11乃至ステップS13の処理と同様であるので、その説明は省略する。
ステップS174において、区間数決定特徴量算出回路36は、サブバンド分割回路33から供給された低域サブバンド信号と高域サブバンド信号に基づいて複数の特徴量を算出し、それらの特徴量の線形和を求めることで区間数決定特徴量を算出する。
例えば、区間数決定特徴量算出回路36は、上述した式(1)、式(9)、式(10)、および式(11)を計算することで、サブバンドパワー和powerhigh(J)、特徴量powerattack(J)、特徴量powerdecay(J)、および特徴量powertilt(J)を算出する。
さらに、区間数決定特徴量算出回路36は、次式(12)を計算することで、求めたサブバンドパワー和powerhigh(J)や特徴量powerattack(J)などの特徴量の線形和を求め、特徴量feature(J)を算出する。
Figure 2013044922
なお式(12)において、Whigh、Wattack、Wdecay、およびWtiltは、それぞれサブバンドパワー和powerhigh(J)、特徴量powerattack(J)、特徴量powerdecay(J)、および特徴量powertilt(J)に乗算される重みであり、例えばWhigh=1,Wattack=3,Wdecay=3,Wtilt=3などとされる。
このようにして得られた特徴量feature(J)の値は、高域のサブバンドパワー和が大きく、そのサブバンドパワー和の時間変動が大きいほど、また低域に対して高域のサブバンドパワーが大きいほど、大きくなる。なお、複数の特徴量の非線形和を区間数決定特徴量として算出してもよい。
区間数決定特徴量算出回路36が区間数決定特徴量として算出した特徴量feature(J)を擬似高域サブバンドパワー差分算出回路37に供給すると、その後、ステップS175乃至ステップS187の処理が行なわれて符号化処理は終了する。
なお、これらの処理は図5のステップS15乃至ステップS27の処理と同様であるので、その説明は省略する。但しステップS179では、決定部51は特徴量feature(J)の代表値と閾値とを比較することで、処理対象区間を構成する連続フレーム区間数を決定する。
具体的には、例えば処理対象区間内の各フレームの区間数決定特徴量の最大値が代表値とされ、代表値が460以上である場合、連続フレーム区間数は16とされ、代表値が350以上460未満である場合、連続フレーム区間数は8とされる。また、代表値が240以上350未満である場合、連続フレーム区間数は4とされ、代表値が130以上240未満である場合、連続フレーム区間数は2とされ、代表値が130未満である場合、連続フレーム区間数は1とされる。
区間数決定特徴量として特徴量feature(J)を用いる場合においても、区間数決定特徴量が大きい区間ほど連続フレーム区間数を多くすることで、復号で得られる音声の聴感上の音質を向上させるとともに出力符号列の符号量を削減することができる。これにより、入力信号の符号化効率を向上させることができる。
〈第2の実施の形態〉
[符号化処理の説明]
さらに、以上においては、処理対象区間を等しい区間長のいくつかの連続フレーム区間に分割すると説明したが、処理対象区間を構成する各連続フレーム区間が、互いに異なる長さとなるようにしてもよい。各連続フレーム区間を必要に応じて異なる長さとすれば、より適切に各フレームの係数インデックスを選択することができ、復号で得られる音声の音質をさらに向上させることができるようになる。
このように、各連続フレーム区間を必要に応じて異なる長さとする場合、符号化装置11は図11に示す符号化処理を行なう。以下、図11のフローチャートを参照して、符号化装置11による符号化処理について説明する。なお、ステップS211乃至ステップS219の処理は、図5のステップS11乃至ステップS19の処理と同様であるので、その説明は省略する。
ステップS220において、評価値和算出部52は、各フレームについて係数インデックス(推定係数のセット)ごとに算出した評価値を用いて、連続フレーム区間を構成するフレームの評価値の和を係数インデックスごとに算出する。
例えば、ステップS219で決定された連続フレーム区間数がndivであるとすると、評価値和算出部52は、処理対象区間をndiv個の任意の長さの連続フレーム区間に分割する。このとき、各連続フレーム区間は、同じ長さであってもよいし、異なる長さであってもよい。
具体的には、連続フレーム区間数ndivが3である場合、例えば図2に示した処理対象区間が、位置FST1から位置FC1までの区間、位置FC1から位置FC2までの区間、および位置FC2から位置FSE1までの区間の合計3つの区間に分割される。そして、それらの3つの区間がそれぞれ連続フレーム区間とされる。
処理対象区間を連続フレーム区間に分割すると、評価値和算出部52は上述した式(8)の計算を行なって、係数インデックスごとに連続フレーム区間を構成するフレームの評価値和Ressum(id,igp)を算出する。
例えば、図2の位置FST1から位置FC1までの区間について、その区間を構成するフレームの評価値の和が係数インデックスごとに算出される。同様に、位置FC1から位置FC2までの区間、および位置FC2から位置FSE1までの区間についても、係数インデックスごとに評価値の和が算出される。
これにより、処理対象区間を構成する各連続フレーム区間について、係数インデックスごとに連続フレーム区間の評価値和Ressum(id,igp)が得られることになる。
評価値和算出部52は、処理対象区間をndiv個の連続フレーム区間に分割する場合に取り得る全ての分割の組み合わせについて、係数インデックスごとに処理対象区間の各連続フレーム区間の評価値和を算出する。例えば、図2に示した例は、処理対象区間が3つの連続フレーム区間に分割される場合における、1つの分割の組み合わせを示している。
ステップS221において、選択部53は、処理対象区間の分割の組み合わせごとに求められた、各係数インデックスの連続フレーム区間の評価値和に基づいて、各フレームの係数インデックスを選択する。
具体的には、選択部53は、処理対象区間の分割の各組み合わせについて、その組み合わせの連続フレーム区間ごとに、係数インデックスを選択する。すなわち、選択部53は、複数の係数インデックスのうち、連続フレーム区間について求めた評価値和が最小となる係数インデックスを、その連続フレーム区間の係数インデックスとして選択する。
さらに、選択部53は、処理対象となっている処理対象区間の分割の組み合わせについて、各連続フレーム区間で選択された係数インデックスの評価値和の和を求める。
例えば、図2に示す例で、位置FST1から位置FC1までの区間、位置FC1から位置FC2までの区間、および位置FC2から位置FSE1までの区間のそれぞれで、係数インデックス「2」、「5」、および「1」が選択されたとする。
この場合、位置FST1から位置FC1までの区間の係数インデックス「2」の評価値和、位置FC1から位置FC2までの区間の係数インデックス「5」の評価値和、および位置FC2から位置FSE1までの区間の係数インデックス「1」の評価値和の和が求められる。
このようにして求められる評価値和の和は、処理対象区間の所定の分割の組み合わせについてフレームごとに係数インデックスを選択した場合における、各フレームの係数インデックスの評価値の和ということができる。したがって、評価値和の和が最小となる分割の組み合わせが、処理対象区間全体でみた場合に、各フレームで最も適切な係数インデックスが選択される組み合わせとなる。
選択部53は、処理対象区間の分割の組み合わせごとに評価値和の和を求めると、それらの評価値和の和が最小となる組み合わせを特定する。そして、選択部53は、特定された組み合わせの各連続フレーム区間を最終的な連続フレーム区間とするとともに、それらの連続フレーム区間で選択された係数インデックスを、連続フレーム区間を構成する各フレームの最終的な係数インデックスとして選択する。
このようにして連続フレーム区間ごとに、連続フレーム区間を構成するフレームの係数インデックスが選択されると、その後、ステップS222乃至ステップS227の処理が行なわれて符号化処理は終了する。なお、これらの処理は図5のステップS22乃至ステップS27の処理と同様であるので、その説明は省略する。
以上のように、符号化装置11は区間数決定特徴量を算出し、区間数決定特徴量から連続フレーム区間数を定めるとともに、連続フレーム区間の組み合わせごとに連続フレーム区間の評価値和の和を算出し、評価値和の和から各フレームの係数インデックスを選択する。
このように連続フレーム区間の組み合わせごとに連続フレーム区間の評価値和の和を算出し、最適な連続フレーム区間の組み合わせと、各連続フレーム区間の係数インデックスとを定めることで、復号時により高精度に高域成分を推定することができるようになる。これにより、復号で得られる音声の聴感上の音質を向上させるとともに、出力符号列の符号量を削減することができ、入力信号の符号化効率を向上させることができる。
なお、図11のステップS214において、サブバンドパワー和powerhigh(J)が区間数決定特徴量として算出される場合について説明したが、他の特徴量が区間数決定特徴量として算出されるようにしてもよい。例えば、上述した特徴量powerattack(J)、特徴量powerdecay(J)、特徴量powertilt(J)、特徴量feature(J)などが区間数決定特徴量として求められるようにしてもよい。
〈第3の実施の形態〉
[符号化装置の構成例]
また、本技術は、入力信号の高域符号化データの符号量を考慮して低域成分を符号化する場合に適用すると、より簡単かつ迅速に符号化を行なうことができる。低域成分の符号化時に高域符号化データの符号量が考慮される場合、符号化装置は例えば図12に示すように構成される。
図12の符号化装置131は、音声信号である入力信号を、例えば16フレームなどの複数フレームからなる処理対象区間を単位として符号化し、その結果得られた出力符号列を出力するものである。また、以下では、符号化装置131が可変長方式で高域符号化データを生成する場合を例として説明する。但し、符号化装置131では、可変長方式と固定長方式の切り替えは行なわれないので、高域符号化データには、方式フラグは含まれないものとする。
符号化装置131は、サブバンド分割回路141、高域符号量算出回路142、低域通過フィルタ143、低域符号化回路144、低域復号回路145、サブバンド分割回路146、遅延回路147、遅延回路148、遅延回路149、高域符号化回路150、符号量調整回路151、符号量一時蓄積回路152、遅延回路153、および多重化回路154から構成される。
サブバンド分割回路141は、入力信号を複数のサブバンド信号に分割し、得られた低域サブバンド信号を高域符号量算出回路142へ供給するとともに、高域サブバンド信号を高域符号量算出回路142、および遅延回路149に供給する。
高域符号量算出回路142は、サブバンド分割回路141から供給された低域サブバンド信号および高域サブバンド信号に基づいて、入力信号の高域成分を符号化して得られる高域符号化データの符号量(以下、高域符号量と称する)を算出する。
高域符号量算出回路142は、特徴量算出部161を備えており、特徴量算出部161は、低域サブバンド信号または高域サブバンド信号の少なくとも何れかに基づいて、区間数決定特徴量を算出する。また、高域符号量算出回路142は、区間数決定特徴量に基づいて処理対象区間の連続フレーム区間数を決定するとともに、連続フレーム区間数から高域符号量を算出する。
高域符号量算出回路142は、連続フレーム区間数を遅延回路148に供給するとともに、高域符号量を低域符号化回路144、および遅延回路148に供給する。
低域通過フィルタ143は、供給された入力信号をフィルタリングして、その結果得られた、入力信号の低域成分である低域信号を低域符号化回路144に供給する。
低域符号化回路144は、低域信号を符号化して得られる低域符号化データの符号量が、入力信号の処理対象区間で使用可能な符号量から、高域符号量算出回路142から供給された高域符号量を減じた符号量以下となるように、低域通過フィルタ143からの低域信号を符号化する。低域符号化回路144は、低域信号の符号化により得られた低域符号化データを低域復号回路145、および遅延回路153に供給する。
低域復号回路145は、低域符号化回路144から供給された低域符号化データの復号を行い、その結果得られた復号低域信号をサブバンド分割回路146に供給する。サブバンド分割回路146は、低域復号回路145から供給された復号低域信号を、低域側の複数のサブバンドのサブバンド信号(以下、復号低域サブバンド信号と称する)に分割し、遅延回路147に供給する。ここで、復号低域サブバンド信号のサブバンドのそれぞれは、低域サブバンド信号のサブバンドのそれぞれと同じ周波数帯域とされる。
遅延回路147は、サブバンド分割回路146からの復号低域サブバンド信号を遅延させ、高域符号化回路150に供給する。遅延回路148は、高域符号量算出回路142からの高域符号量および連続フレーム区間数を一定期間だけ遅延させ、高域符号化回路150に供給する。遅延回路149は、サブバンド分割回路141からの高域サブバンド信号を遅延させ、高域符号化回路150に供給する。
高域符号化回路150は、遅延回路147からの復号低域サブバンド信号から得られる特徴量と、遅延回路148からの連続フレーム区間数とに基づいて、遅延回路148からの高域符号量以下の符号量となるように、遅延回路149からの高域サブバンド信号のパワーを推定により得るための情報を符号化する。
高域符号化回路150は、算出部162および選択部163を備えている。算出部162は、推定係数を示す係数インデックスごとに高域側の各サブバンドの評価値を算出し、選択部163は、算出部162により算出された評価値に基づいて、各フレームの係数インデックスを選択する。
また、高域符号化回路150は、係数インデックスを含むデータを符号化して得られた高域符号化データを多重化回路154に供給するとともに、高域符号化データの高域符号量を、符号量調整回路151に供給する。
符号量調整回路151は、高域符号化回路150で得られた実際の高域符号量が、遅延回路148を通して得られる高域符号量算出回路142の高域符号量未満であった場合、その剰余符号量を符号量一時蓄積回路152に供給する。符号量一時蓄積回路152は、剰余符号量の蓄積を行なう。この剰余符号量は、次回以降の処理対象区間で適宜使用される。
遅延回路153は、低域符号化回路144で得られた低域符号化データを一定期間だけ遅延させ、多重化回路154に供給する。多重化回路154は、遅延回路153からの低域符号化データと、高域符号化回路150からの高域符号化データを多重化し、その結果得られた出力符号列を出力する。
[符号化処理の説明]
次に、符号化装置131の動作について説明する。符号化装置131に入力信号が供給され、入力信号の符号化が指示されると、符号化装置131は符号化処理を行って、入力信号を符号化する。
以下、図13のフローチャートを参照して、符号化装置131による符号化処理について説明する。なお、この符号化処理は、入力信号の処理対象区間(例えば、16フレーム)を単位として行なわれる。
ステップS251において、サブバンド分割回路141は、供給された入力信号を、所定の帯域幅を持つ複数のサブバンド信号に等分割する。ここで得られたサブバンド信号のうちの低域側の特定の範囲のサブバンド信号が低域サブバンド信号とされ、高域側の特定の範囲のサブバンド信号が高域サブバンド信号とされる。
サブバンド分割回路141は、サブバンド分割により得られた低域サブバンド信号を高域符号量算出回路142に供給し、高域サブバンド信号を高域符号量算出回路142および遅延回路149に供給する。
例えば、高域サブバンド信号のサブバンドの範囲は、入力信号の性質やビットレートなどに応じて符号化装置131側で設定される。また、低域サブバンド信号のサブバンド範囲は、高域サブバンド信号のサブバンドの最低域のサブバンドよりも、1つ低域側のサブバンドを低域サブバンド信号の最高域のサブバンドとした、所定数のサブバンドからなる周波数帯域とされる。
なお、低域サブバンド信号と高域サブバンド信号のサブバンドの範囲は、符号化装置131と、復号装置側とで同一の範囲とされる。
ステップS252において、高域符号量算出回路142の特徴量算出部161は、サブバンド分割回路141から供給された低域サブバンド信号または高域サブバンド信号の少なくとも何れかに基づいて、区間数決定特徴量を算出する。
例えば、特徴量算出部161は、上述した式(9)の演算を行なって、高域のアタック性を示す特徴量powerattack(J)を区間数決定特徴量として算出する。区間数決定特徴量は、処理対象区間を構成するフレームごとに算出される。
なお、区間数決定特徴量として、上述したサブバンドパワー和powerhigh(J)、特徴量powerdecay(J)、特徴量powertilt(J)、特徴量feature(J)や、複数の特徴量の非線形和などが算出されるようにしてもよい。
ステップS253において、高域符号量算出回路142は、処理対象区間の各フレームの区間数決定特徴量に基づいて、連続フレーム区間数を決定する。
例えば、高域符号量算出回路142は、処理対象区間の各フレームの区間数決定特徴量のうちの最大値を、区間数決定特徴量の代表値とし、代表値と予め定めた閾値とを比較することで、連続フレーム区間数を決定する。
具体的には、例えば代表値が40以上である場合、連続フレーム区間数は16とされ、代表値が30以上40未満である場合、連続フレーム区間数は8とされる。また、代表値が20以上30未満である場合、連続フレーム区間数は4とされ、代表値が10以上20未満である場合、連続フレーム区間数は2とされ、代表値が10未満である場合、連続フレーム区間数は1とされる。
ステップS254において、高域符号量算出回路142は決定した連続フレーム区間数に基づいて、高域符号化データの高域符号量を算出する。
符号化装置131では、可変長方式で高域符号化データが生成されるので、高域符号化データには、個数情報、区間情報、および係数インデックスが含まれることになる。
現時点において、処理対象区間を構成する連続フレーム区間数が決定されているので、連続フレーム区間数がnDivであるとすると、高域符号化データには、1つの個数情報、(nDiv-1)個の区間情報、およびnDiv個の係数インデックスが含まれることになる。
なお、区間情報が(nDiv-1)個とされるのは、処理対象区間の長さは予め定められており、(nDiv-1)個の連続フレーム区間の長さが分かれば、残りの1つの連続フレーム区間の長さを特定することができるからである。
以上のことから高域符号化データの符号量は、(個数情報の記述に必要なビット数)+(nDiv-1)×(1つの区間情報の記述に必要なビット数)+(nDiv)×(1つの係数インデックスの記述に必要なビット数)により求めることができる。
このように、符号化装置131では、実際に入力信号の高域成分を符号化しなくても、少ない演算量で高域符号化データの高域符号量を求めることができるので、より迅速に低域成分の符号化を開始することができる。
すなわち、従来の処理では、高域符号化データに必要な符号量を決定するときに、入力信号の低域サブバンドパワーと高域サブバンドパワーを算出してフレームごとに係数インデックスを選択しなければ、必要となる符号量を求めることができなかった。これに対して、符号化装置131では、区間数決定特徴量を算出するだけでよいので、より少ない演算で迅速に高域符号量を決定することができる。
なお、ステップS254では、可変長方式により高域符号化データが生成される場合を例として説明したが、高域符号化データが固定長方式で生成される場合でも、連続フレーム区間数に基づいて高域符号量を算出することができる。
固定長方式で高域符号化データが生成される場合、高域符号化データには、固定長インデックス、切り替わりフラグ、および係数インデックスが含まれることになる。
この場合、図3から分かるように高域符号化データには、1つの固定長インデックス、(nDiv-1)個の切り替わりフラグ、およびnDiv個の係数インデックスが含まれることになる。したがって、高域符号化データの符号量は、(固定長インデックスの記述に必要なビット数)+(nDiv-1)×(1つの切り替わりフラグの記述に必要なビット数)+(nDiv)×(1つの係数インデックスの記述に必要なビット数)により求めることができる。
高域符号量算出回路142は、高域符号量を算出すると、算出した高域符号量を低域符号化回路144および遅延回路148に供給するとともに、連続フレーム区間数を遅延回路148に供給する。
ステップS255において、低域通過フィルタ143は、供給された入力信号を低域通過フィルタでフィルタリングし、その結果得られた低域信号を低域符号化回路144に供給する。このフィルタ処理に用いる低域通過フィルタの遮断周波数としては、任意の周波数を設定することが可能であるが、本実施の形態では、上述の低域サブバンド信号の上端の周波数に対応して遮断周波数が設定される。
ステップS256において、低域符号化回路144は、低域符号化データの符号量が低域符号量以下の符号量となるように、低域通過フィルタ143からの低域信号を符号化し、その結果得られた低域符号化データを、低域復号回路145および遅延回路153に供給する。
ここで、低域符号量とは、低域符号化データの目標とする符号量である。低域符号化回路144は、予め定められた処理対象区間全体で使用可能な符号量から、高域符号量算出回路142から供給された高域符号量を減じ、さらに符号量一時蓄積回路152に蓄積されている剰余符号量を加算することで低域符号量を算出する。
低域符号化回路144は、実際に低域信号を符号化して得られた低域符号化データの符号量が、低域符号量未満であった場合、低域符号化データの実際の符号量と低域符号量とを符号量調整回路151に供給する。
そして、符号量調整回路151は、低域符号化回路144から供給された低域符号量から、低域符号化データの実際の符号量を減じて得られる符号量を符号量一時蓄積回路152に供給して、剰余符号量に加算させる。これにより、符号量一時蓄積回路152に記録されている剰余符号量が更新される。
これに対して、低域符号化データの実際の符号量と低域符号量が一致する場合、符号量調整回路151は、剰余符号量の増加分を0として符号量一時蓄積回路152に剰余符号量の更新を行なわせる。
ステップS257において、低域復号回路145は、低域符号化回路144から供給された低域符号化データの復号を行い、これにより得られた復号低域信号をサブバンド分割回路146に供給する。なお、符号化装置131では、低域信号の符号化および復号を行う符号化方式は様々な方式をとることができ、例えば、ACELP(Algebraic Code Excited Linear Prediction)や、AAC(Advanced Audio Coding)などを採用することができる。
ステップS258において、サブバンド分割回路146は、低域復号回路145から供給された復号低域信号を複数のサブバンドの復号低域サブバンド信号に分割し、遅延回路147に供給する。このサブバンド分割における、各サブバンドの下端及び上端の周波数は、ステップS251においてサブバンド分割回路141が行うサブバンド分割と同一とされる。つまり、復号低域サブバンド信号の各サブバンドは、低域サブバンド信号の各サブバンドと同じ周波数帯域とされる。
ステップS259において、遅延回路147は、サブバンド分割回路146から供給された復号低域サブバンド信号を特定の時間サンプルだけ遅延させ、高域符号化回路150に供給する。また、遅延回路148および遅延回路149も、連続フレーム区間数と高域符号量、および高域サブバンド信号を遅延させ、高域符号化回路150に供給する。
遅延回路147や遅延回路148での遅延量は、高域サブバンド信号、高域符号量、および復号低域サブバンド信号の同期をとるためのものであり、低域、高域それぞれの符号化方式によって、適切な値を設定する必要がある。当然、符号化方式の構成によっては、各遅延回路の遅延量が0である場合もあり得る。なお、遅延回路153の機能は、遅延回路147が果たす機能と同等であるので、ここではその説明を省略する。
ステップS260において、高域符号化回路150は、遅延回路147からの復号低域サブバンド信号、遅延回路148からの連続フレーム区間数、および遅延回路149からの高域サブバンド信号に基づいて、遅延回路148からの高域符号量以下の符号量となるように、入力信号の高域成分を符号化する。
例えば、算出部162は、復号低域サブバンド信号に基づいて上述した式(2)と同様の演算を行い、低域の各サブバンドの低域サブバンドパワーpower(ib,J)を算出するとともに、同様の演算を行なって、高域サブバンド信号から高域の各サブバンドの高域サブバンドパワーを算出する。また、算出部162は、低域サブバンドパワーと、予め記録している推定係数のセットとに基づいて式(3)の演算を行ない、高域の各サブバンドの擬似高域サブバンドパワーを算出する。
算出部162は、高域サブバンドパワーと擬似高域サブバンドパワーとに基づいて、上述した式(4)乃至式(7)の演算を行い、各フレームの評価値Res(id,J)を算出する。なお、評価値Res(id,J)の算出は、低域サブバンドパワーの計算に用いられる推定係数のセットを示す係数インデックスごとに行なわれる。
さらに、算出部162は、処理対象区間を連続フレーム区間数により示される数の区間に等分し、分割された各区間を連続フレーム区間とする。算出部162は、各フレームについて係数インデックスごとに算出した評価値を用いて上述した式(8)を計算し、係数インデックスごとに評価値和Ressum(id,igp)を算出する。
また、選択部163は、各連続フレーム区間について係数インデックスごとに求められた評価値和に基づいて、図5のステップS21と同様の処理を行い、各フレームの係数インデックスを選択する。すなわち、連続フレーム区間について求めた評価値和Ressum(id,igp)が最小となる係数インデックスが、その連続フレーム区間を構成する各フレームの係数インデックスとして選択される。
なお、互いに隣接する連続フレーム区間で同じ係数インデックスが選択されることがあるので、そのような場合には、同じ係数インデックスが選択された連続して並ぶ連続フレーム区間が、最終的な1つの連続フレーム区間とされる。
各フレームの係数インデックスが選択されると、高域符号化回路150は、図5のステップS25およびステップS26と同様の処理を行なって、区間情報、個数情報、および係数インデックスからなるデータを生成して符号化し、高域符号化データを生成する。
以上のようにして得られた高域符号化データの符号量は、必ず高域符号量以下となる。例えば、連続して並ぶ連続フレーム区間で同じ係数インデックスが選択された場合、最終的な連続フレーム区間の数は、高域符号量算出回路142で得られた連続フレーム区間数未満となる。この場合、高域符号化データに含まれる係数インデックスの数が、高域符号量算出回路142で得られた連続フレーム区間数未満となるだけでなく、区間情報の数も少なくなる。
したがって、このような場合には、実際の高域符号化データの符号量は、高域符号量算出回路142で得られた高域符号量未満となる。
これに対して、連続して並ぶ連続フレーム区間で同じ係数インデックスが選択されなかった場合には、連続フレーム区間の数は、高域符号量算出回路142で得られた連続フレーム区間数と一致するので、実際の高域符号化データの符号量も高域符号量と一致する。
なお、ステップS260においては、処理対象区間が等分割されて連続フレーム区間とされる場合について説明したが、処理対象区間が任意の長さの連続フレーム区間に分割されるようにしてもよい。
そのような場合、ステップS260では、各フレームの評価値Res(id,J)が算出された後、図11のステップS220およびステップS221と同様の処理が行なわれて、各フレームの係数インデックスが選択される。そして、その後、選択された係数インデックスを、固定長インデックス、および切り替わりフラグからなるデータが符号化されて高域符号化データが生成される。
ステップS261において、高域符号化回路150は、符号化により得られた高域符号化データの符号量が、ステップS254で算出された高域符号量未満であるか否かを判定する。
ステップS261において、高域符号量未満でないと判定された場合、つまり高域符号化データの符号量が高域符号量と一致する場合、符号の剰余は発生しないので、処理はステップS265に進む。このとき、高域符号化回路150は、高域の符号化により得られた高域符号化データを多重化回路154に供給する。
これに対して、ステップS261において、高域符号量未満であると判定された場合、ステップS262において、符号量調整回路151は、高域符号化データの符号量と、高域符号量との差分の符号量一時蓄積回路152への蓄積を行なう。すなわち、高域符号化データの符号量と高域符号量の差の分の符号量が、符号量一時蓄積回路152に蓄積されている剰余符号量に加算されていき、剰余符号量が更新される。このような符号量一時蓄積回路152は、AACにおいてもビットリゾルバという名称で使われており、処理フレーム間での符号量の調整が行なわれる。
ステップS263において、符号量調整回路151は、符号量一時蓄積回路152に蓄積している剰余符号量が予め定められた上限に達したか否かを判定する。
例えば、符号量一時蓄積回路152では、剰余符号量とすることの可能な符号量の上限(以下、上限符号量と称する)が予め定められている。符号量調整回路151は、ステップS262で開始した、高域符号化データの符号量と高域符号量の差分の符号量一時蓄積回路152への蓄積時に、剰余符号量が上限符号量に達した場合、ステップS263において剰余符号量が上限に達したと判定する。
ステップS263において、剰余符号量が上限に達していないと判定された場合、高域符号化データの符号量と、高域符号量の差分が、全て剰余符号量に加算され、剰余符号量が更新される。そして、その後、高域符号化回路150は、高域の符号化により得られた高域符号化データを多重化回路154に供給し、処理はステップS265に進む。
一方、ステップS263において、剰余符号量が上限に達したと判定された場合、ステップS264において、高域符号化回路150は、高域符号化データに対するゼロ詰めを行なう。
高域符号化データの符号量と、高域符号量との差分を剰余符号量に加算していくときに、剰余符号量が上限符号量に達した場合、高域符号化データの符号量と、高域符号量との差分のうち、まだ剰余符号量への加算が行なわれていない未処理の符号量が余ることになる。この未処理の符号量は、剰余符号量に加算することはできないので、高域符号化回路150は、この未処理の符号量の分だけ、高域符号化データの最後尾に符号「0」を付加し、未処理の符号量を見かけ上、高域符号化データの生成に用いたこととする。なお、復号時においては、高域符号化データの最後尾に付加された符号「0」は、入力信号の復号には用いられない。
高域符号化回路150は、高域符号化データの最後尾に符号「0」を付加するゼロ詰めを行なうと、ゼロ詰め後の高域符号化データを多重化回路154に供給し、処理はステップS265に進む。
ステップS261において高域符号量未満でないと判定されたか、ステップS263において剰余符号量が上限に達していないと判定されたか、またはステップS264においてゼロ詰めが行なわれると、ステップS265の処理が行われる。
すなわち、ステップS265において、多重化回路154は、遅延回路153からの低域符号化データと、高域符号化回路150からの高域符号化データとを多重化して出力符号列を生成し、出力符号列を出力する。このとき、多重化回路154は、低域符号化データや高域符号化データとともに、入力信号の低域側の上端と下端のサブバンドを示すインデックスも多重化する。このようにして出力符号列が出力されると、符号化処理は終了する。
以上のように、符号化装置131は、高域および低域のサブバンド信号から連続フレーム区間数を算出して高域符号量を算出し、この高域符号量から定まる符号量で低域信号を符号化するとともに、低域符号化データを復号して得られた復号低域信号や高域符号量に基づいて、高域成分の符号化を行なう。
このように、連続フレーム区間数から高域符号量を算出することで、高域成分の符号化を行なうことなく高域の符号化に必要な符号量を算出することができる。したがって、従来の手法と比べて、各フレームの係数インデックスを選択するために必要となる演算の分だけ、高域符号量の算出時の演算量を削減することができる。また、入力信号の特性を考慮して、従来よりも適切に高域符号化データのビット使用量(符号量)を定めることができる。
さらに、以上において説明した符号化技術は、例えば音声符号化方式の1つであるAC-3(ATSC A/52 “Digital Audio Compression Standard(AC-3)”)などにも適用することができる。
AC-3では、音声信号の1フレームが複数のブロックで構成されており、各ブロックで1つ前のブロックにおける、周波数変換後の係数の浮動小数表現における指数部の値をそのまま使うか否かの情報がビットストリームに含まれる。
ここで、1フレーム内で同じ指数部の値を共有する連続するブロックの集合を、連続ブロック区間と呼ぶこととする。一般的なAC-3方式の符号化装置では、フレーム内において符号化対象となる入力信号が定常的、つまり時間変動が少ない場合には、1フレーム内での連続ブロック区間の数は多く構成される。
このような連続ブロック区間数を、以上において説明した本技術を適用して、適切に決定することで、必要最小限の連続ブロック区間、すなわち必要最小限のビット使用量で効率的に符号化を行なうことができるようになる。
なお、上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。
図14は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
コンピュータにおいて、CPU(Central Processing Unit)301,ROM(Read Only Memory)302,RAM(Random Access Memory)303は、バス304により相互に接続されている。
バス304には、さらに、入出力インターフェース305が接続されている。入出力インターフェース305には、キーボード、マウス、マイクロホンなどよりなる入力部306、ディスプレイ、スピーカなどよりなる出力部307、ハードディスクや不揮発性のメモリなどよりなる記録部308、ネットワークインターフェースなどよりなる通信部309、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア311を駆動するドライブ310が接続されている。
以上のように構成されるコンピュータでは、CPU301が、例えば、記録部308に記録されているプログラムを、入出力インターフェース305及びバス304を介して、RAM303にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ(CPU301)が実行するプログラムは、例えば、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)等)、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア311に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供される。
そして、プログラムは、リムーバブルメディア311をドライブ310に装着することにより、入出力インターフェース305を介して、記録部308にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部309で受信し、記録部308にインストールすることができる。その他、プログラムは、ROM302や記録部308に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
さらに、本技術は、以下の構成とすることも可能である。
[1]
入力信号の低域側のサブバンドの低域サブバンド信号と、前記入力信号の高域側のサブバンドの高域サブバンド信号とを生成するサブバンド分割部と、
前記低域サブバンド信号と所定の推定係数とに基づいて、前記高域サブバンド信号の高域サブバンドパワーの推定値である擬似高域サブバンドパワーを算出する擬似高域サブバンドパワー算出部と、
前記低域サブバンド信号または前記高域サブバンド信号の少なくとも何れかに基づいて、区間数決定特徴量を算出する特徴量算出部と、
前記区間数決定特徴量に基づいて、前記入力信号の複数フレームからなる処理対象区間における、同じ前記推定係数が選択されたフレームからなる連続フレーム区間の数を決定する決定部と、
決定された前記連続フレーム区間の数に基づいて前記処理対象区間を分割して得られる各前記連続フレーム区間について、前記擬似高域サブバンドパワーと前記高域サブバンドパワーに基づいて、複数の前記推定係数のなかから前記連続フレーム区間を構成するフレームの前記推定係数を選択する選択部と、
前記処理対象区間を構成する各前記連続フレーム区間のフレームで選択された前記推定係数を得るためのデータを生成する生成部と、
前記入力信号の低域信号を符号化して低域符号化データを生成する低域符号化部と、
前記データと前記低域符号化データとを多重化して出力符号列を生成する多重化部と
を備える符号化装置。
[2]
前記区間数決定特徴量は、前記高域サブバンドパワーの和を示す特徴量である
[1]に記載の符号化装置。
[3]
前記区間数決定特徴量は、前記高域サブバンドパワーの和の時間変動を示す特徴量である
[1]に記載の符号化装置。
[4]
前記区間数決定特徴量は、前記入力信号の周波数形状を示す特徴量である
[1]に記載の符号化装置。
[5]
前記区間数決定特徴量は、複数の特徴量の線形和または非線形和である
[1]に記載の符号化装置。
[6]
前記推定係数ごとに算出された、前記フレームにおける前記擬似高域サブバンドパワーと前記高域サブバンドパワーの誤差を示す評価値に基づいて、前記推定係数ごとに、前記連続フレーム区間を構成する各フレームの前記評価値の和を算出する評価値和算出部をさらに備え、
前記選択部は、前記推定係数ごとに算出された前記評価値の和に基づいて、前記連続フレーム区間のフレームの前記推定係数を選択する
[1]乃至[5]の何れかに記載の符号化装置。
[7]
決定された前記連続フレーム区間の数に前記処理対象区間を等分割して得られた各区間が、前記連続フレーム区間とされる
[6]に記載の符号化装置。
[8]
前記選択部は、決定された前記連続フレーム区間の数に前記処理対象区間を分割するときに取り得る前記処理対象区間の分割の組み合わせごとに、前記評価値の和に基づいて前記連続フレーム区間のフレームの前記推定係数を選択するとともに、各前記組み合わせのうち、前記処理対象区間を構成する全ての前記フレームの選択された前記推定係数の前記評価値の和が最小となる前記組み合わせを特定し、特定された前記組み合わせにおいて、各フレームで選択された前記推定係数を、それらのフレームの前記推定係数とする
[6]に記載の符号化装置。
[9]
前記データを符号化して高域符号化データを生成する高域符号化部をさらに備え、
前記多重化部は、前記高域符号化データと前記低域符号化データとを多重化して前記出力符号列を生成する
[1]乃至[8]の何れかに記載の符号化装置。
[10]
前記決定部は、決定された前記連続フレーム区間の数に基づいて、前記処理対象区間の前記高域符号化データの符号量をさらに算出し、
前記低域符号化部は、前記処理対象区間に対して予め定められた符号量と、算出された前記高域符号化データの符号量とから定まる符号量で前記低域信号を符号化する
[9]に記載の符号化装置。
11 符号化装置, 32 低域符号化回路, 33 サブバンド分割回路, 34 特徴量算出回路, 35 擬似高域サブバンドパワー算出回路, 36 区間数決定特徴量算出回路, 37 擬似高域サブバンドパワー差分算出回路, 38 高域符号化回路, 39 多重化回路, 51 決定部, 52 評価値算出部, 53 選択部, 54 生成部

Claims (12)

  1. 入力信号の低域側のサブバンドの低域サブバンド信号と、前記入力信号の高域側のサブバンドの高域サブバンド信号とを生成するサブバンド分割部と、
    前記低域サブバンド信号と所定の推定係数とに基づいて、前記高域サブバンド信号の高域サブバンドパワーの推定値である擬似高域サブバンドパワーを算出する擬似高域サブバンドパワー算出部と、
    前記低域サブバンド信号または前記高域サブバンド信号の少なくとも何れかに基づいて、区間数決定特徴量を算出する特徴量算出部と、
    前記区間数決定特徴量に基づいて、前記入力信号の複数フレームからなる処理対象区間における、同じ前記推定係数が選択されたフレームからなる連続フレーム区間の数を決定する決定部と、
    決定された前記連続フレーム区間の数に基づいて前記処理対象区間を分割して得られる各前記連続フレーム区間について、前記擬似高域サブバンドパワーと前記高域サブバンドパワーに基づいて、複数の前記推定係数のなかから前記連続フレーム区間を構成するフレームの前記推定係数を選択する選択部と、
    前記処理対象区間を構成する各前記連続フレーム区間のフレームで選択された前記推定係数を得るためのデータを生成する生成部と、
    前記入力信号の低域信号を符号化して低域符号化データを生成する低域符号化部と、
    前記データと前記低域符号化データとを多重化して出力符号列を生成する多重化部と
    を備える符号化装置。
  2. 前記区間数決定特徴量は、前記高域サブバンドパワーの和を示す特徴量である
    請求項1に記載の符号化装置。
  3. 前記区間数決定特徴量は、前記高域サブバンドパワーの和の時間変動を示す特徴量である
    請求項1に記載の符号化装置。
  4. 前記区間数決定特徴量は、前記入力信号の周波数形状を示す特徴量である
    請求項1に記載の符号化装置。
  5. 前記区間数決定特徴量は、複数の特徴量の線形和または非線形和である
    請求項1に記載の符号化装置。
  6. 前記推定係数ごとに算出された、前記フレームにおける前記擬似高域サブバンドパワーと前記高域サブバンドパワーの誤差を示す評価値に基づいて、前記推定係数ごとに、前記連続フレーム区間を構成する各フレームの前記評価値の和を算出する評価値和算出部をさらに備え、
    前記選択部は、前記推定係数ごとに算出された前記評価値の和に基づいて、前記連続フレーム区間のフレームの前記推定係数を選択する
    請求項1に記載の符号化装置。
  7. 決定された前記連続フレーム区間の数に前記処理対象区間を等分割して得られた各区間が、前記連続フレーム区間とされる
    請求項6に記載の符号化装置。
  8. 前記選択部は、決定された前記連続フレーム区間の数に前記処理対象区間を分割するときに取り得る前記処理対象区間の分割の組み合わせごとに、前記評価値の和に基づいて前記連続フレーム区間のフレームの前記推定係数を選択するとともに、各前記組み合わせのうち、前記処理対象区間を構成する全ての前記フレームの選択された前記推定係数の前記評価値の和が最小となる前記組み合わせを特定し、特定された前記組み合わせにおいて、各フレームで選択された前記推定係数を、それらのフレームの前記推定係数とする
    請求項6に記載の符号化装置。
  9. 前記データを符号化して高域符号化データを生成する高域符号化部をさらに備え、
    前記多重化部は、前記高域符号化データと前記低域符号化データとを多重化して前記出力符号列を生成する
    請求項1に記載の符号化装置。
  10. 前記決定部は、決定された前記連続フレーム区間の数に基づいて、前記処理対象区間の前記高域符号化データの符号量をさらに算出し、
    前記低域符号化部は、前記処理対象区間に対して予め定められた符号量と、算出された前記高域符号化データの符号量とから定まる符号量で前記低域信号を符号化する
    請求項9に記載の符号化装置。
  11. 入力信号の低域側のサブバンドの低域サブバンド信号と、前記入力信号の高域側のサブバンドの高域サブバンド信号とを生成し、
    前記低域サブバンド信号と所定の推定係数とに基づいて、前記高域サブバンド信号の高域サブバンドパワーの推定値である擬似高域サブバンドパワーを算出し、
    前記低域サブバンド信号または前記高域サブバンド信号の少なくとも何れかに基づいて、区間数決定特徴量を算出し、
    前記区間数決定特徴量に基づいて、前記入力信号の複数フレームからなる処理対象区間における、同じ前記推定係数が選択されたフレームからなる連続フレーム区間の数を決定し、
    決定された前記連続フレーム区間の数に基づいて前記処理対象区間を分割して得られる各前記連続フレーム区間について、前記擬似高域サブバンドパワーと前記高域サブバンドパワーに基づいて、複数の前記推定係数のなかから前記連続フレーム区間を構成するフレームの前記推定係数を選択し、
    前記処理対象区間を構成する各前記連続フレーム区間のフレームで選択された前記推定係数を得るためのデータを生成し、
    前記入力信号の低域信号を符号化して低域符号化データを生成し、
    前記データと前記低域符号化データとを多重化して出力符号列を生成する
    ステップを含む符号化方法。
  12. 入力信号の低域側のサブバンドの低域サブバンド信号と、前記入力信号の高域側のサブバンドの高域サブバンド信号とを生成し、
    前記低域サブバンド信号と所定の推定係数とに基づいて、前記高域サブバンド信号の高域サブバンドパワーの推定値である擬似高域サブバンドパワーを算出し、
    前記低域サブバンド信号または前記高域サブバンド信号の少なくとも何れかに基づいて、区間数決定特徴量を算出し、
    前記区間数決定特徴量に基づいて、前記入力信号の複数フレームからなる処理対象区間における、同じ前記推定係数が選択されたフレームからなる連続フレーム区間の数を決定し、
    決定された前記連続フレーム区間の数に基づいて前記処理対象区間を分割して得られる各前記連続フレーム区間について、前記擬似高域サブバンドパワーと前記高域サブバンドパワーに基づいて、複数の前記推定係数のなかから前記連続フレーム区間を構成するフレームの前記推定係数を選択し、
    前記処理対象区間を構成する各前記連続フレーム区間のフレームで選択された前記推定係数を得るためのデータを生成し、
    前記入力信号の低域信号を符号化して低域符号化データを生成し、
    前記データと前記低域符号化データとを多重化して出力符号列を生成する
    ステップを含む処理をコンピュータに実行させるプログラム。
JP2011182449A 2011-08-24 2011-08-24 符号化装置および方法、並びにプログラム Expired - Fee Related JP6037156B2 (ja)

Priority Applications (12)

Application Number Priority Date Filing Date Title
JP2011182449A JP6037156B2 (ja) 2011-08-24 2011-08-24 符号化装置および方法、並びにプログラム
CN201280040029.1A CN103765510B (zh) 2011-08-24 2012-08-14 编码装置和方法、解码装置和方法
RU2014105814/08A RU2586011C2 (ru) 2011-08-24 2012-08-14 Устройство и способ кодирования, устройство и способ декодирования и программа
CA2840788A CA2840788A1 (en) 2011-08-24 2012-08-14 Encoding device and encoding method, decoding device and decoding method, and program
MX2014001871A MX2014001871A (es) 2011-08-24 2012-08-14 Dispositivo de codificacion y metodo de codificacion, dispositivo de decodificacion y metodo de decodificacion, y programa.
EP12825849.8A EP2750131A4 (en) 2011-08-24 2012-08-14 DEVICE AND ENCODING METHOD, DEVICE, AND DECODING METHOD, AND PROGRAM
PCT/JP2012/070683 WO2013027630A1 (ja) 2011-08-24 2012-08-14 符号化装置および方法、復号装置および方法、並びにプログラム
KR1020147003607A KR20140050050A (ko) 2011-08-24 2012-08-14 부호화 장치 및 방법, 복호 장치 및 방법, 및 프로그램
AU2012297804A AU2012297804B2 (en) 2011-08-24 2012-08-14 Encoding device and method, decoding device and method, and program
BR112014003672A BR112014003672A2 (pt) 2011-08-24 2012-08-14 dispositivos e métodos de decodificação e codificação, e, programa
US14/236,350 US9842603B2 (en) 2011-08-24 2012-08-14 Encoding device and encoding method, decoding device and decoding method, and program
ZA2014/01181A ZA201401181B (en) 2011-08-24 2014-02-17 Encoding device and method,decoding device and method,and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011182449A JP6037156B2 (ja) 2011-08-24 2011-08-24 符号化装置および方法、並びにプログラム

Publications (3)

Publication Number Publication Date
JP2013044922A true JP2013044922A (ja) 2013-03-04
JP2013044922A5 JP2013044922A5 (ja) 2014-10-09
JP6037156B2 JP6037156B2 (ja) 2016-11-30

Family

ID=47746377

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011182449A Expired - Fee Related JP6037156B2 (ja) 2011-08-24 2011-08-24 符号化装置および方法、並びにプログラム

Country Status (12)

Country Link
US (1) US9842603B2 (ja)
EP (1) EP2750131A4 (ja)
JP (1) JP6037156B2 (ja)
KR (1) KR20140050050A (ja)
CN (1) CN103765510B (ja)
AU (1) AU2012297804B2 (ja)
BR (1) BR112014003672A2 (ja)
CA (1) CA2840788A1 (ja)
MX (1) MX2014001871A (ja)
RU (1) RU2586011C2 (ja)
WO (1) WO2013027630A1 (ja)
ZA (1) ZA201401181B (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5704397B2 (ja) 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5975243B2 (ja) * 2011-08-24 2016-08-23 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
EP2631906A1 (en) * 2012-02-27 2013-08-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Phase coherence control for harmonic signals in perceptual audio codecs
AU2013284703B2 (en) 2012-07-02 2019-01-17 Sony Corporation Decoding device and method, encoding device and method, and program
CN105122359B (zh) * 2013-04-10 2019-04-23 杜比实验室特许公司 语音去混响的方法、设备和系统
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
TWI557726B (zh) * 2013-08-29 2016-11-11 杜比國際公司 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
CN111292757A (zh) 2013-09-12 2020-06-16 杜比国际公司 基于qmf的处理数据的时间对齐
WO2015041070A1 (ja) 2013-09-19 2015-03-26 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
KR20230042410A (ko) 2013-12-27 2023-03-28 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
CN109963338B (zh) * 2017-12-25 2023-07-21 成都鼎桥通信技术有限公司 一种特殊的lte-fdd小区中上行载波的调度方法和系统
CN110989983B (zh) * 2019-11-28 2022-11-29 深圳航天智慧城市系统技术研究院有限公司 一种零编码的应用软件快速构建系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007178529A (ja) * 2005-12-27 2007-07-12 Matsushita Electric Ind Co Ltd 符号化オーディオ信号再生装置及び符号化オーディオ信号再生方法

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW294867B (ja) * 1994-12-23 1997-01-01 Qualcomm Inc
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
KR100393618B1 (ko) * 2000-08-18 2003-08-02 삼성전자주식회사 부호분할다중접속 이동통신시스템의 채널 부호화/복호화장치 및 방법
JP4810422B2 (ja) 2004-05-14 2011-11-09 パナソニック株式会社 符号化装置、復号化装置、およびこれらの方法
BRPI0517780A2 (pt) 2004-11-05 2011-04-19 Matsushita Electric Ind Co Ltd aparelho de decodificação escalável e aparelho de codificação escalável
JP4899359B2 (ja) 2005-07-11 2012-03-21 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
KR100813259B1 (ko) 2005-07-13 2008-03-13 삼성전자주식회사 입력신호의 계층적 부호화/복호화 장치 및 방법
CN101129063B (zh) * 2005-11-18 2010-05-19 索尼株式会社 编码设备和方法、解码设备和方法以及传输系统
JP2007333785A (ja) 2006-06-12 2007-12-27 Matsushita Electric Ind Co Ltd オーディオ信号符号化装置およびオーディオ信号符号化方法
JP5141180B2 (ja) 2006-11-09 2013-02-13 ソニー株式会社 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体
KR101355376B1 (ko) 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
US8498344B2 (en) 2008-06-20 2013-07-30 Rambus Inc. Frequency responsive bus coding
JP5203077B2 (ja) * 2008-07-14 2013-06-05 株式会社エヌ・ティ・ティ・ドコモ 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法
JP2010079275A (ja) * 2008-08-29 2010-04-08 Sony Corp 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム
GB2466201B (en) 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
JP5106484B2 (ja) * 2009-06-15 2012-12-26 富士通テレコムネットワークス株式会社 可変電源装置とモータ駆動制御装置とそれらの保護回路動作方法
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
WO2011121782A1 (ja) 2010-03-31 2011-10-06 富士通株式会社 帯域拡張装置および帯域拡張方法
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US8560330B2 (en) 2010-07-19 2013-10-15 Futurewei Technologies, Inc. Energy envelope perceptual correction for high band coding
US9047875B2 (en) 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5704397B2 (ja) 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
EP2702585B1 (en) * 2011-04-28 2014-12-31 Telefonaktiebolaget LM Ericsson (PUBL) Frame based audio signal classification
JP5975243B2 (ja) 2011-08-24 2016-08-23 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5845760B2 (ja) 2011-09-15 2016-01-20 ソニー株式会社 音声処理装置および方法、並びにプログラム
WO2013154027A1 (ja) 2012-04-13 2013-10-17 ソニー株式会社 復号装置および方法、オーディオ信号処理装置および方法、並びにプログラム
JP5997592B2 (ja) 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
AU2013284703B2 (en) 2012-07-02 2019-01-17 Sony Corporation Decoding device and method, encoding device and method, and program
CN103748629B (zh) 2012-07-02 2017-04-05 索尼公司 解码装置和方法、编码装置和方法以及程序
JP2014123011A (ja) 2012-12-21 2014-07-03 Sony Corp 雑音検出装置および方法、並びに、プログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007178529A (ja) * 2005-12-27 2007-07-12 Matsushita Electric Ind Co Ltd 符号化オーディオ信号再生装置及び符号化オーディオ信号再生方法

Also Published As

Publication number Publication date
CN103765510B (zh) 2016-08-17
MX2014001871A (es) 2014-05-30
RU2586011C2 (ru) 2016-06-10
EP2750131A1 (en) 2014-07-02
AU2012297804A1 (en) 2014-02-06
BR112014003672A2 (pt) 2017-03-01
KR20140050050A (ko) 2014-04-28
JP6037156B2 (ja) 2016-11-30
CN103765510A (zh) 2014-04-30
ZA201401181B (en) 2014-09-25
US9842603B2 (en) 2017-12-12
US20140200899A1 (en) 2014-07-17
AU2012297804B2 (en) 2016-12-01
RU2014105814A (ru) 2015-08-27
EP2750131A4 (en) 2015-04-22
WO2013027630A1 (ja) 2013-02-28
CA2840788A1 (en) 2013-02-24

Similar Documents

Publication Publication Date Title
JP6037156B2 (ja) 符号化装置および方法、並びにプログラム
JP5942358B2 (ja) 符号化装置および方法、復号装置および方法、並びにプログラム
US10546594B2 (en) Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
JP5975243B2 (ja) 符号化装置および方法、並びにプログラム
KR102110727B1 (ko) 복호 장치 및 방법, 및 기록 매체
US9659573B2 (en) Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
KR101835910B1 (ko) 부호화 장치 및 방법, 복호 장치 및 방법, 및 컴퓨터 판독가능한 기록 매체
KR101975066B1 (ko) 신호 처리 장치 및 방법, 및 컴퓨터 판독가능 기록 매체
JP5704397B2 (ja) 符号化装置および方法、並びにプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140822

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140822

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160426

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160531

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161006

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161019

R151 Written notification of patent or utility model registration

Ref document number: 6037156

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees