JPWO2013176177A1 - 符号化方法、復号方法、符号化装置、復号装置、プログラム、および記録媒体 - Google Patents
符号化方法、復号方法、符号化装置、復号装置、プログラム、および記録媒体 Download PDFInfo
- Publication number
- JPWO2013176177A1 JPWO2013176177A1 JP2014516829A JP2014516829A JPWO2013176177A1 JP WO2013176177 A1 JPWO2013176177 A1 JP WO2013176177A1 JP 2014516829 A JP2014516829 A JP 2014516829A JP 2014516829 A JP2014516829 A JP 2014516829A JP WO2013176177 A1 JPWO2013176177 A1 JP WO2013176177A1
- Authority
- JP
- Japan
- Prior art keywords
- pitch period
- frequency domain
- domain pitch
- sample
- interval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 150
- 238000006243 chemical reaction Methods 0.000 claims abstract description 241
- 230000007774 longterm Effects 0.000 claims description 232
- 238000004458 analytical method Methods 0.000 claims description 105
- 230000008707 rearrangement Effects 0.000 claims description 79
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 49
- 230000008569 process Effects 0.000 claims description 47
- 238000011084 recovery Methods 0.000 claims description 18
- 230000015572 biosynthetic process Effects 0.000 claims description 14
- 238000003786 synthesis reaction Methods 0.000 claims description 14
- 238000005070 sampling Methods 0.000 claims description 12
- 238000013519 translation Methods 0.000 claims description 9
- 230000005236 sound signal Effects 0.000 claims description 6
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 230000000737 periodic effect Effects 0.000 claims 2
- 241000209094 Oryza Species 0.000 description 150
- 235000007164 Oryza sativa Nutrition 0.000 description 150
- 235000009566 rice Nutrition 0.000 description 150
- 238000012545 processing Methods 0.000 description 68
- 238000010606 normalization Methods 0.000 description 24
- 238000001228 spectrum Methods 0.000 description 20
- 238000012986 modification Methods 0.000 description 16
- 230000004048 modification Effects 0.000 description 16
- 230000006870 function Effects 0.000 description 13
- 238000013139 quantization Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 230000009467 reduction Effects 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 238000012937 correction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
- G10L2025/903—Pitch determination of speech signals using a laryngograph
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
- G10L2025/906—Pitch tracking
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
「符号化装置11」
図1を参照して符号化装置11が行う符号化処理を説明する。符号化装置11の各部は、所定の時間区間であるフレーム単位に、以下の動作をする。以下の説明では、フレームのサンプル数がNtであり、1フレーム分のディジタル音響信号がディジタル音響信号列x(1),...,x(Nt)であるとしている。
(概要)
長期予測分析部111は、所定の時間区間であるフレーム単位に、入力されたディジタル音響信号列x(1),...,x(Nt)に対応する時間領域のピッチ周期Lを得て(ステップS111−1)、当該時間領域のピッチ周期Lに対応するピッチ利得gpを算出し(ステップS111−2)、当該ピッチ利得gpに基づいて長期予測を実行するか否かを示す長期予測選択情報を求めて出力し(ステップS111−3)、長期予測選択情報が長期予測を実行することを示す場合には、少なくとも時間領域のピッチ周期Lと、時間領域のピッチ周期Lを特定する時間領域ピッチ周期符号CLとを更に出力する(ステップS111−4)。
長期予測分析部111は、例えば、予め定めた時間領域のピッチ周期の候補τの中から、式(A1)により得られる値が最大となる候補τをディジタル音響信号列x(1),...,x(Nt)に対応する時間領域のピッチ周期Lとして選択する。
候補τおよび時間領域のピッチ周期Lは、整数のみを用いて表現される場合(整数精度)のみならず、整数と小数値(分数値)とを用いて表現される場合(小数精度)もある。小数精度の候補τに対する式(A1)の値を求める場合には、複数のディジタル音響信号サンプルに重み付き平均操作を行う補間フィルタを用いてx(t-τ)を求める。
長期予測分析部111は、ピッチ利得gpが予め定めた値以上である場合には長期予測を実行することを示す長期予測選択情報を得て出力し、ピッチ利得gpが上記の予め定めた値未満である場合には長期予測を実行しないとを示す長期予測選択情報を得て出力する。
長期予測選択情報が長期予測を実行することを示す場合には、長期予測分析部111は、以下を行う。
そして、長期予測分析部111は、上記の長期予測選択情報に加えて、時間領域のピッチ周期Lと、時間領域ピッチ周期符号CLと、を出力する。
そして、長期予測分析部111は、上記の長期予測選択情報と、時間領域のピッチ周期Lと、時間領域ピッチ周期符号CLと、に加えて、量子化済みピッチ利得gp^と、ピッチ利得符号Cgpとを出力する。
長期予測分析部111が出力した長期予測選択情報が長期予測を実行することを示す場合には、長期予測残差生成部112は、所定の時間区間であるフレーム単位に、入力されたディジタル音響信号列から長期予測された信号を除いた長期予測残差信号列を生成して出力する。例えば、入力されたディジタル音響信号列x(1),...,x(Nt)と時間領域のピッチ周期Lと量子化済みピッチ利得gp^に基づき、式(A3)により長期予測残差信号列xp(1),...,xp(Nt)を算出することにより生成する。長期予測分析部111が量子化済みピッチ利得gp^を出力しない場合には、gp^として例えば0.5などの予め定めた値を用いる。
xp(t) = x(t)-gp^x(t-L) (A3)
まず、周波数領域変換部113aがフレーム単位で、長期予測分析部111が出力した長期予測選択情報が長期予測を実行することを示す場合には入力された長期予測残差信号列xp(1),...,xp(Nt)を、長期予測分析部111が出力した長期予測選択情報が長期予測を実行しないことを示す場合には入力されたディジタル音響信号列x(1),...,x(Nt)を、周波数領域のN点(Nを「変換フレーム長」と呼ぶ)のMDCT係数列X(1),...,X(N)に変換する(ステップS113a)。周波数領域変換部113aは、時間領域で2*N点の長期予測残差信号列またはディジタル音響信号列に窓をかけた後の信号列のMDCT変換を行い、周波数領域でN点の係数を得る。なお、記号*は乗算を表す。周波数領域変換部113aは、時間領域での窓をN点ずつずらすことでフレームを更新する。この際、隣り合うフレームのサンプルはN点ずつ重複する。長期予測分析の対象サンプルとMDCT変換での窓の対象サンプルとは独立で、遅延や、重ね合わせの程度で窓の形を設定できる。例えば長期予測分析の対象サンプルとして重ね合わせのないサンプル部分からNt点を取りだせばよい。また重ね合わせのあるサンプルに対しても長期予測分析を行う場合には、重ね合わせ処理と長期予測の差分と合成の処理の適応順序などを設定し、符号化装置と復号装置で大きな誤差を生じないようにする必要がある。
重み付け包絡正規化部113bが、フレーム単位のディジタル音響信号列に対する線形予測分析によって求められた線形予測係数を用いて推定されたディジタル音響信号列のパワースペクトル包絡係数列によって、入力されたMDCT係数列の各係数を正規化し、重み付け正規化MDCT係数列を出力する(ステップS113b)。ここでは聴覚的に歪が小さくなるような量子化の実現のために、重み付け包絡正規化部113bは、パワースペクトル包絡を鈍らせた重み付けパワースペクトル包絡係数列を用いて、フレーム単位でMDCT係数列の各係数を正規化する。この結果、重み付け正規化MDCT係数列は、入力されたMDCT係数列ほどの大きな振幅の傾きや振幅の凹凸を持たないが、音声音響ディジタル信号のパワースペクトル包絡係数列と類似の大小関係を有するもの、すなわち、低い周波数に対応する係数側の領域にやや大きな振幅を持ち、時間領域のピッチ周期に起因する微細構造をもつもの、となる。
N点のMDCT係数列の各係数X(1),・・・,X(N)に対応するパワースペクトル包絡係数列の各係数W(1),・・・,W(N)は、線形予測係数を周波数領域に変換して得ることができる。例えば、全極型モデルであるp次自己回帰過程により、時刻に対応するサンプル点tのディジタル音響信号x(t)は、p時点(pは正整数)まで遡った過去の自分自身の値x(t-1),・・・,x(t-p)と予測残差e(t)と線形予測係数α1,・・・,αpによって式(1)で表される。このとき、パワースペクトル包絡係数列の各係数W(n)[1≦n≦N]は式(2)で表される。exp(・)はネイピア数を底とする指数関数、jは虚数単位、σ2は予測残差エネルギーである。
<例1>
重み付け包絡正規化部113bは、MDCT係数列の各係数X(1),・・・,X(N)を当該各係数に対応するパワースペクトル包絡係数列の各係数の補正値Wγ(1),・・・,Wγ(N)で除算することによって、重み付け正規化MDCT係数列の各係数X(1)/Wγ(1),・・・,X(N)/Wγ(N)を得る処理を行う。補正値Wγ(n)[1≦n≦N]は式(3)で与えられる。但し、γは1以下の正の定数であり、パワースペクトル係数を鈍らせる定数である。
重み付け包絡正規化部113bは、MDCT係数列の各係数X(1),・・・,X(N)を当該各係数に対応するパワースペクトル包絡係数列の各係数のβ乗(0<β<1)の値W(1)β,・・・,W(N)βで除算することによって、重み付け正規化MDCT係数列の各係数X(1)/W(1)β,・・・,X(N)/W(N)βを得る処理を行う。
次に、正規化利得計算部113cが、重み付け正規化MDCT係数列を入力とし、フレームごとに、重み付け正規化MDCT係数列の各係数を与えられた総ビット数で量子化できるように、全周波数に亘る振幅値の和またはエネルギー値を用いて量子化ステップ幅を決定し、この量子化ステップ幅になるように重み付け正規化MDCT係数列の各係数を割り算する係数(以下、利得という。)を求める(ステップS113c)。この利得を表す情報は、利得情報として復号側へ伝送される。正規化利得計算部113cは、フレームごとに、入力された重み付け正規化MDCT係数列の各係数をこの利得で正規化(除算)して出力する。
次に、量子化部113dが、フレームごとに、利得で正規化された重み付け正規化MDCT係数列の各係数をステップS113cの処理で決定された量子化ステップ幅で量子化し、得られた量子化MDCT係数列を「周波数領域のサンプル列」として出力する(ステップS113d)。
周期換算部114は、長期予測選択情報が長期予測を実行することを示す場合には、入力された時間領域のピッチ周期Lと周波数領域のサンプル点数Nとに基づき、式(A4)により換算間隔T1を求めて出力する。式(A4)の「INT()」は、()内の数値の小数点以下を切り捨てたものを表す。
T1=INT(N*2/L) (A4)
なお理論的な換算周期はN*2/L‐1/2であるが、換算間隔T1を整数値とする場合にはこれを四捨五入するために1/2を加えて切り捨てる。または、N*2/L‐1/2を予め定めた小数点桁数以下を四捨五入して換算間隔T1としてもよい。例えば、N*2/L‐1/2が2進5桁の小数部をもつ疑似浮動小数点形式で保持し、整数値としてのピッチ周期を四捨五入で求める場合は、25*(N*2/L‐1/2+1/2)を切り捨てた値を換算間隔T1とし、T1を整数倍した結果を1/25=1/32倍して浮動小数点数に戻した値を候補として、周波数領域のピッチ周期を決定しても良い。
周期換算部114は、長期予測選択情報が長期予測を実行しないことを示す場合には、何もしない。ただし、長期予測選択情報が長期予測を実行する場合と同様の処理を行っても問題は無い。すなわち、周期換算部114には、長期予測選択情報が入力されず、入力された時間領域のピッチ周期Lと周波数領域のサンプル点数Nとが入力され、換算間隔T1を求めて出力する構成であってもよい。
周波数領域ピッチ周期分析部115は、長期予測選択情報が長期予測を実行することを示す場合には、入力された換算間隔T1および換算間隔T1の整数倍の値U×T1を候補値として、周波数領域ピッチ周期Tを決定し、周波数領域ピッチ周期Tと周波数領域ピッチ周期Tが換算間隔T1の何倍であるかを示す周波数領域ピッチ周期符号とを出力する。ただし、Uは予め定めた第1の範囲の整数である。例えばUは0を除く整数であり、例えばU≧2である。例えば、予め定めた第1の範囲の整数が2以上8以下である場合は、換算間隔T1、換算間隔T1の2倍〜8倍の2T1、3T1、4T1、5T1、6T1、7T1、8T1の計8個の値が周波数領域ピッチ周期の候補値であり、これらの候補値の中から周波数領域ピッチ周期Tが選択される。この場合は、周波数領域ピッチ周期符号は、少なくとも3ビットの、1以上8以下の整数それぞれと一対一に対応する符号である。
ただし、ρは(1/N)1/2などの係数であり、kは周波数に対応するインデックスk=1,...,Nである。すなわち各MDCT係数列X(k)は、例えば、以下の2*N次元の正規直交基底ベクトルB(k)と信号列ベクトル(xp’(1),...,xp’(2*N))との内積である。
T1’=2*N/L≒2*N/n*Pf= (2*N/Pf)/n (A41)
つまり、間隔T1’は理想換算間隔(2*N/Pf)の1/n倍で近似することができる。このような場合、間隔T1’そのものではなく、間隔の整数倍n*T1’が理想換算間隔2*N/Pfに対応する。
さらに、周波数領域におけるサンプリング間隔の整数倍は、理想換算間隔2*N/Pfに対応しているとは限らない。例えば、図4の例では、理想換算間隔2*N/PfがMDCT係数列X(1),...,X(N)の隣接サンプル間隔の整数倍となっていないため、理想換算間隔2*N/Pfを周波数領域ピッチ周期Tとしてサンプル群を選択することができない。しかし、周波数領域のピッチ周期に基づいて選択されるサンプル群へのエネルギーの集中度を大きくするという目的においては、理想換算間隔2*N/Pfそのものが周波数領域のピッチ周期として選択できなくても、理想換算間隔2*N/Pfのm倍(ただし、mは正整数)を周波数領域ピッチ周期T=m*2*N/Pfとしてサンプル群を選択することで、選択されたサンプル群へのエネルギーの集中度を示す指標値を大きくすることができる。つまり、選択されるサンプル群へのエネルギーの集中度を大きくするという目的においては、周波数領域ピッチ周期Tと換算間隔T1’との関係は、式(A41)を用いて以下のように書ける。
T=m*(2*N/Pf) ≒m*n*T1’ (A42)
さらに、式(A42)は式(A4)の換算間隔T1を用いて以下のように近似できる。
T≒m*n*INT(T1’)=m*n*INT(2*N/L)=m*n*T1 (A43)
つまり、周波数領域のピッチ周期Tは、換算間隔T1の整数倍で近似することができる。言い換えれば、換算間隔T1の整数倍の値の方が、それ以外の値よりもサンプル群へのエネルギーの集中度を示す指標値を大きくするような周波数領域のピッチ周期Tである可能性が高い。すなわち、換算間隔T1および換算間隔T1の整数倍とその近傍の値を候補値として、周波数領域ピッチ周期Tを決定することで、サンプル群へのエネルギーの集中度を示す指標値を大きくすることができる。
上述のように、nは値が小さいものほど使われる可能性が高い傾向にあり、mは正整数なので、周波数領域においては、周波数領域ピッチ周期Tの換算間隔T1に対する乗数m*nが小さいものほど、周波数領域ピッチ周期Tとして決定されやすい傾向にあると言える。すなわち、換算間隔T1の整数倍の倍数値が小さいほど周波数領域ピッチ周期Tとして決定されやすい傾向にあるといえる。
周波数領域ピッチ周期考慮符号化部116は、並べ替え処理部116aと符号化部116bとを備え、周波数領域ピッチ周期Tに基づく符号化方法で、入力された周波数領域のサンプル列を符号化し、それによって得られた符号列を出力する。
並べ替え処理部116aは、(1)周波数領域のサンプル列の全てのサンプルを含み、かつ、(2)周波数領域のサンプル列のうちの周波数領域ピッチ周期分析部115が決定した周波数領域ピッチ周期Tに対応するサンプルを含む一つまたは連続する複数のサンプルおよび、周波数領域サンプル列のうちの周波数領域ピッチ周期Tの整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるようにサンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、を並べ替え後のサンプル列として出力する。つまり、周波数領域ピッチ周期Tに対応するサンプルを含む一つまたは連続する複数のサンプルおよび、当該周波数領域ピッチ周期Tの整数倍に対応するサンプルを含む一つまたは連続する複数のサンプルが集まるように、入力されたサンプル列に含まれる少なくとも一部のサンプルが並べ替えられる。
このように並べ替えられた後のサンプル列は、周波数を横軸とし、サンプルの指標を縦軸とした場合に、サンプルの指標の包絡線が周波数の増大に伴って増大傾向を示すことになる。換言すれば、並べ替え処理部116aは、サンプルの指標の包絡線が周波数の増大に伴って増大傾向を示すように入力されたサンプル列に含まれる少なくとも一部のサンプルを並べ替えると言ってもよい。
また、この実施形態では、各サンプル群に含まれるサンプルの個数が、周波数領域ピッチ周期Tないしその整数倍に対応するサンプル(以下、中心サンプルという)とその前後1サンプルの計3サンプルであるという固定された個数の例を示した。しかしながら、サンプル群に含まれるサンプルの個数やサンプルインデックスを可変とする場合には、並び替え処理部116aは、サンプル群に含まれるサンプルの個数とサンプルインデックスの組み合わせが異なる複数の選択肢の中から選択された一つを表す情報を補助情報(第1補助情報)として出力する。
例えば、選択肢として、
(1)中心サンプルのみ、F(nT)
(2)中心サンプルとその前後1サンプルの計3サンプル、F(nT-1),F(nT),F(nT+1)
(3)中心サンプルとその前2サンプルの計3サンプル、F(nT-2),F(nT-1),F(nT)
(4)中心サンプルとその前3サンプルの計4サンプル、F(nT-3),F(nT-2),F(nT-1),F(nT)
(5)中心サンプルとその後2サンプルの計3サンプル、F(nT),F(nT+1),F(nT+2)
(6)中心サンプルとその後3サンプルの計4サンプル、F(nT),F(nT+1),F(nT+2),F(nT+3)
が設定されている場合に、(4)が選択されたならば、この(4)が選択されたことを表す情報を第1補助情報とする。この例であれば、選択された選択肢を表す情報として3ビットあれば十分である。
次に、符号化部116bが、並べ替え処理部116aが出力したサンプル列を符号化し、得られた符号列を出力する(ステップS116b)。例えば、符号化部116bは、並べ替え処理部116aが出力したサンプル列に含まれるサンプルの振幅の偏りに応じて可変長符号化の方法を切り替えて符号化する。つまり、並べ替え処理部116aによってフレーム内で、低域側(あるいは高域側)に振幅の大きなサンプルが集められているので、符号化部116bはその偏りに適した方法による可変長符号化を行う。並べ替え処理部116aが出力したサンプル列のように、局所的な領域ごとに同等か同程度の振幅を持つサンプルが集まっていると、例えば領域ごとに異なるライスパラメータでライス符号化することによって平均符号量を削減できる。以下、フレーム内で低域側(フレームの先頭に近い側)に振幅の大きなサンプルが集められている場合を例に採って説明する。
具体例として、符号化部116bは、大きな振幅を持つサンプルが集まっている領域ではサンプルごとにライス符号化(ゴロム-ライス符号化ともいう)を適用する。この領域以外の領域では、符号化部116bは、複数のサンプルをまとめたサンプルの集合に対する符号化にも適するエントロピー符号化(ハフマン符号化や算術符号化など)を適用する。ライス符号化の適用に関して、ライス符号化の適用領域とライスパラメータが固定されていてもよいし、あるいは、ライス符号化の適用領域とライスパラメータの組み合わせが異なる複数の選択肢の中から一つ選択できる構成であってもよい。このような複数の選択肢から一つを選択する際、ライス符号化の選択情報として、例えば下記のような可変長符号(記号""で囲まれたバイナリ値)を使うことができ、符号化部116bは選択情報も出力する。
"1":ライス符号化を適用しない
"01":ライス符号化を先頭から1/32の領域にライスパラメータを1として適用する。
"001":ライス符号化を先頭から1/32の領域にライスパラメータを2として適用する。
"0001":ライス符号化を先頭から1/16の領域にライスパラメータを1として適用する。
"00001":ライス符号化を先頭から1/16の領域にライスパラメータを2として適用する。
"00000":ライス符号化を先頭から1/32の領域にライスパラメータを3として適用する。
図2を参照して復号装置12が行う復号処理を説明する。
復号装置12には、少なくとも、上記長期予測選択情報と、上記利得情報と、上記周波数領域ピッチ周期符号と、上記符号列が入力される。また、上記長期予測選択情報が長期予測を実行することを示す場合には、少なくとも時間領域ピッチ周期符号CLが入力される。時間領域ピッチ周期符号CLに加えてピッチ利得符号Cgpも入力される場合もある。なお、符号化装置11から選択情報や第1補助情報や第2補助情報が出力された場合にはこの選択情報や第1補助情報や第2補助情報も復号装置12に入力される。
周波数領域ピッチ周期考慮復号部123は、復号部123aと回復部123bとを備え、周波数領域ピッチ周期Tに基づく復号方法で、入力された符号列を復号して元のサンプルの並びを得て出力する。
復号部123aが、フレームごとに、入力された符号列を復号して周波数領域のサンプル列を出力する(ステップS123a)。
長期予測情報復号部121は、長期予測選択情報が長期予測を実行することを示す場合には、入力された時間領域ピッチ周期符号CLを復号して時間領域のピッチ周期Lを得て出力する。ピッチ利得符号Cgpも入力された場合には、さらに、ピッチ利得符号Cgpを復号して量子化済みピッチ利得gp^を得て出力する。
周期換算部122は、長期予測選択情報が長期予測を実行することを示す場合には、入力された周波数領域ピッチ周期符号を復号して周波数領域ピッチ周期Tが換算間隔T1の何倍であるかを示す整数値を得て、時間領域のピッチ周期Lと周波数領域のサンプル点数Nとに基づき式(A4)によって換算間隔T1を得て、換算間隔T1に整数値を乗算することで周波数領域ピッチ周期Tを得て出力する。
周期換算部122は、長期予測選択情報が長期予測を実行しないことを示す場合には、入力された周波数領域ピッチ周期符号を復号して周波数領域ピッチ周期Tを得て出力する。
次に、回復部123bが、フレームごとに、周期換算部122が得た周波数領域ピッチ周期Tに従って、または、復号装置12に補助情報が入力された場合には周期換算部122が得た周波数領域ピッチ周期Tと入力された補助情報とに従って、復号部123aが出力した周波数領域のサンプル列から元のサンプルの並びを得て出力する(ステップS123b)。ここで「元のサンプルの並び」とは、符号化装置11の周波数領域サンプル列生成部113から出力された「周波数領域のサンプル列」に相当する。上述のとおり、符号化装置11の並べ替え処理部116aによる並べ替え方法や並べ替え方法に対応する並べ替えの選択肢は種々あるが、並べ替えが実行された場合には実行された並べ替えは一つであり、その並べ替えは周波数領域ピッチ周期Tと補助情報とによって特定できる。
次に、利得乗算部124aが、フレームごとに、復号部123aまたは回復部123bが出力したサンプル列の各係数に、上記利得情報で特定される利得を乗じて、「正規化された重み付け正規化MDCT係数列」を得て出力する(ステップS124a)。
次に、重み付け包絡逆正規化部124bが、フレームごとに、利得乗算部124aが出力した「正規化された重み付け正規化MDCT係数列」の各係数に、前述のように伝送されたパワースペクトル包絡係数列から得られる補正係数を適用することで「MDCT係数列」を得て出力する(ステップS124b)。符号化装置11で実行された重み付け包絡正規化処理の例に対応させて具体例を説明すると、重み付け包絡逆正規化部124bは、利得乗算部124aが出力した「正規化された重み付け正規化MDCT係数列」の各係数に、当該各係数に対応するパワースペクトル包絡係数列の各係数のβ乗(0<β<1)の値W(1)β,・・・,W(N)βを乗算することによって、MDCT係数列の各係数X(1),・・・,X(N)を得る。
次に、時間領域変換部124cが、フレームごとに、重み付け包絡逆正規化部124bが出力した「MDCT係数列」を時間領域に変換してフレーム単位の信号列(時間領域の信号列)を得て出力する(ステップS124c)。長期予測情報復号部121が出力した長期予測選択情報が長期予測を実行することを示す場合には、時間領域変換部124cが得た信号列は長期予測残差信号列xp(1),...,xp(Nt)として長期予測合成部125に入力される。長期予測情報復号部121が出力した長期予測選択情報が長期予測を実行しないことを示す場合には、時間領域変換部124cが得た信号列はディジタル音響信号列x(1),...,x(Nt)として復号装置12から出力される。
長期予測合成部125は、長期予測選択情報が長期予測を実行することを示す場合には、時間領域変換部124cが得た長期予測残差信号列xp(1),...,xp(Nt)と、長期予測情報復号部121が出力した時間領域のピッチ周期Lと量子化済みピッチ利得gp^と、長期予測合成部125が生成した過去のディジタル音響信号とに基づき、式(A5)によって、ディジタル音響信号列x(1),...,x(Nt)を得る。長期予測情報復号部121が量子化済みピッチ利得gp^を出力しない場合、すなわち、復号装置12にピッチ利得符号Cgpが入力されなかった場合には、gp^として例えば0.5などの予め定めた値を用いる。この場合のgp^の値は、符号化装置11と復号装置12とで同じ値を用いることができるよう、長期予測情報復号部121内に予め記憶しておく。
x(t)= xp(t)+gp^x(t-L) (A5)
そして、長期予測合成部125が得た信号列はディジタル音響信号列x(1),...,x(Nt)として復号装置12から出力される。
長期予測合成部125は、長期予測選択情報が長期予測を実行しないことを示す場合には、何もしない。
第1実施形態の符号化装置11では換算間隔T1および換算間隔T1の整数倍の値U×T1を候補値として周波数領域ピッチ周期Tを決定したが、換算間隔T1の整数倍の値U×T1以外の倍数値も候補値として周波数領域ピッチ周期Tを決定してもよい。以下、第1実施形態と異なる点について説明する。
本変形例の符号化装置11’が第1実施形態の符号化装置11と異なるのは、周波数領域ピッチ周期分析部115に替えて周波数領域ピッチ周期分析部115’を備える点である。本変形例では、周波数領域ピッチ周期分析部115’が、換算間隔T1および換算間隔T1の整数倍の値U×T1および換算間隔T1の整数倍U×T1以外の予め定めた倍数の値を候補値として、周波数領域ピッチ周期Tを決定して出力する。周波数領域ピッチ周期分析部115’は、長期予測選択情報が長期予測を実行しないことを示す場合には、第1実施形態と同様に、予め定めた第2の範囲の整数値を候補値として周波数領域ピッチ周期Tを決定して出力する。
周波数領域ピッチ周期分析部115’は、換算間隔T1および換算間隔T1の整数倍の値U×T1および換算間隔T1の整数倍U×T1以外の予め定めた倍数の値を候補値として、周波数領域ピッチ周期Tを決定し(換算間隔T1および換算間隔T1の整数倍の値U×T1を含む候補値の中から周波数領域ピッチ周期Tを決定し)、周波数領域ピッチ周期Tと周波数領域ピッチ周期Tが換算間隔T1の何倍であるかを示す周波数領域ピッチ周期符号とを出力する。
本変形例の復号装置12’が第1実施形態の復号装置12と異なるのは、周期換算部122に替えて周期換算部122’を備える点である。
周期換算部122’は、長期予測選択情報が長期予測を実行することを示す場合には、周波数領域ピッチ周期符号を復号して周波数領域ピッチ周期Tが換算間隔T1の何倍であるかを示す値(倍数値)を得て、時間領域のピッチ周期Lと周波数領域のサンプル点数Nとに基づき式(A4)によって換算間隔T1を得て、換算間隔T1に何倍であるかを示す値を乗算することで周波数領域ピッチ周期Tを得て出力する。
周期換算部122’は、長期予測選択情報が長期予測を実行しないことを示す場合には、周波数領域ピッチ周期符号を復号して周波数領域ピッチ周期Tを得て出力する。
第1実施例の変形例1では、換算間隔T1の整数倍の値U×T1以外の倍数値も候補値として周波数領域ピッチ周期Tを決定した。このとき、整数倍の値U×T1の方がそれ以外の値よりも周波数領域ピッチ周期Tとなる可能性が高いという特性があることを反映し、第1実施形態の変形例2では、周波数領域ピッチ周期符号の長さを可変長符号帳により決定する。
また、周波数領域ピッチ周期分析部115’’において、周波数領域ピッチ周期符号の長さも考慮して、ピッチ周期Tを決定する。
「周波数領域ピッチ周期分析部115’’」
周波数領域ピッチ周期分析部115’’は、換算間隔T1および換算間隔T1の整数倍の値U×T1および換算間隔T1の整数倍U×T1以外の予め定めた倍数の値を候補値として、周波数領域ピッチ周期Tを決定し(換算間隔T1および換算間隔T1の整数倍の値U×T1を含む候補値の中から周波数領域ピッチ周期Tを決定し)、周波数領域ピッチ周期Tと周波数領域ピッチ周期Tが換算間隔T1の何倍であるかを示す周波数領域ピッチ周期符号とを出力する。
変形した集中度指標=集中度の指標−c*(換算間隔T1との関係を示す符号の長さ)
とし、変形した集中度指標が最大となる周波数領域ピッチ周期Tを決定する。
[符号化装置21]
本実施形態の符号化装置21が第1実施形態の符号化装置11と異なるのは、周波数領域ピッチ周期分析部115に替えて周波数領域ピッチ周期分析部215を備える点である。本実施形態では、周波数領域ピッチ周期分析部215が、長期予測選択情報が長期予測を実行することを示す場合には、換算間隔T1および換算間隔T1の整数倍の値U×T1の中から中間候補値を決定し、中間候補値および中間候補値の近傍の予め定めた第3の範囲の値の中から周波数領域ピッチ周期Tを決定して出力する。周波数領域ピッチ周期分析部215は、長期予測選択情報が長期予測を実行しないことを示す場合には、第1実施形態と同様に、予め定めた第2の範囲の整数値を候補値として周波数領域ピッチ周期Tを決定して出力する。以下、第1実施形態と異なる点について説明する。
周波数領域ピッチ周期分析部215は、長期予測選択情報が長期予測を実行することを示す場合には、まず、換算間隔T1および換算間隔T1の整数倍の値U×T1を候補値として、中間候補値を決定する。次に周波数領域ピッチ周期分析部215は、中間候補値および中間候補値の近傍の予め定めた第3の範囲の値を候補値として、周波数領域ピッチ周期Tを決定し周波数領域ピッチ周期Tを出力する。さらに、周波数領域ピッチ周期分析部215は、中間候補値が換算間隔T1の何倍であるかを示す情報と、周波数領域ピッチ周期Tと中間候補値との差を示す情報と、を周波数領域ピッチ周期符号として出力する。
本実施形態の復号装置22が第1実施形態の復号装置12と異なるのは、周期換算部122に替えて周期換算部222を備える点である。本実施形態では、周期換算部222が、長期予測選択情報が長期予測を実行することを示す場合には、周波数領域ピッチ周期符号を復号して、中間候補値が換算間隔T1の何倍であるかの整数値と、周波数領域ピッチ周期Tと中間候補値との差の値と、を得て、換算間隔T1に整数値を乗算して得られる値に上記の差の値を加算したものを周波数領域ピッチ周期Tとして得て出力する。周期換算部222は、長期予測選択情報が長期予測を実行しないことを示す場合には、周波数領域ピッチ周期符号を復号して周波数領域ピッチ周期Tを得て出力する。
[符号化装置31]
本実施形態の符号化装置31が第1実施形態、第1実施形態の変形例、および第2実施形態の符号化装置11,11’,21と異なるのは、周波数領域ピッチ周期分析部115,115’,215に替えて周波数領域ピッチ周期分析部315を備える点である。本実施形態では、周波数領域ピッチ周期分析部315は、「長期予測選択情報が長期予測を実行することを示す場合」に替えて「量子化済みピッチ利得gp^が予め定めた値以上である場合」、「長期予測選択情報が長期予測を実行しないことを示す場合」に替えて「量子化済みピッチ利得gp^が予め定めた値より小さい場合」、として処理を行う。これ以外は、第1実施形態および第2実施形態と同様である。なお、本実施形態は、第1実施形態のうち、符号化装置31が量子化済みピッチ利得gp^およびピッチ利得符号Cgpを得る構成が前提となる。
本実施形態の復号装置32が第1実施形態および第2実施形態の復号装置12,12’,22と異なるのは、周期換算部122,122’,222に替えて周期換算部322を備える点である。本実施形態では、周期換算部322は、「長期予測選択情報が長期予測を実行することを示す場合」に替えて「量子化済みピッチ利得gp^が予め定めた値以上である場合」、「長期予測選択情報が長期予測を実行しないことを示す場合」に替えて「量子化済みピッチ利得gp^が予め定めた値より小さい場合」、として処理を行う。これ以外は、第1実施形態および第2実施形態と同様である。なお、本実施形態は、第1実施形態のうち、復号装置32にピッチ利得符号Cgpが入力され量子化済みピッチ利得gp^を得る構成、が前提となる。
[符号化装置41]
本実施形態の符号化装置41が第1実施形態、第1実施形態の変形例、および第2実施形態の符号化装置11,11’,21と異なるのは、長期予測分析部111、長期予測残差生成部112、周波数領域変換部113a、周期換算部114、周波数領域ピッチ周期分析部115,115’,215のそれぞれに替えて、長期予測分析部411、長期予測残差生成部412 、周波数領域変換部413a、周期換算部414、周波数領域ピッチ周期分析部415を備える点である。
本実施形態の復号装置42が第1実施形態および第2実施形態の復号装置12,12’,22と異なるのは、復号部123a、長期予測情報復号部121、周期換算部122,122’,222、時間領域変換部124c、長期予測合成部125のそれぞれに替えて、復号部423a、長期予測情報復号部421、周期換算部422、時間領域変換部424c、長期予測合成部425を備える点である。本実施形態は、長期予測選択情報や量子化済みピッチ利得gp^の値に関わらず長期予測合成を行う。従って、本実施形態の復号装置42には、長期予測選択情報は入力される必要は無い。
上記の各実施形態の符号化装置11,11’,21,31,41では、周波数領域変換部113a,413aと重み付け包絡正規化部113bと正規化利得計算部113cと量子化部113dを備えて、量子化部113dで得られたフレーム単位の量子化MDCT係数列を周波数領域ピッチ周期分析部115,115’,215,315,415の入力とした。しかしながら、符号化装置11,11’,21,31,41が、周波数領域変換部113a,413aと重み付け包絡正規化部113bと正規化利得計算部113cと量子化部113d以外の処理部を備えたり、一部の処理部を省略した処理を行ってもよい。すなわち、符号化装置11,11’,21,31,41は、一例として周波数領域変換部113a,413aと重み付け包絡正規化部113bと正規化利得計算部113cと量子化部113dとにより構成される、周波数領域サンプル列生成部113を備えていることになる。符号化装置11,11’,21,31,41が備える周波数領域サンプル列生成部113は、長期予測を実行する場合には上記長期予測残差信号に由来する周波数領域のサンプル列を得る処理を行い、長期予測を実行しない場合には上記音響信号に由来する周波数領域のサンプル列を得る処理を行う。周波数領域サンプル列生成部113が得たサンプル列は周波数領域ピッチ周期分析部115,115’,215,315,415に入力される。
[符号化装置51]
図8に示すように、本実施形態の符号化装置51が第1実施形態、第1実施形態の変形例、第2実施形態、第3実施形態および第4実施形態の符号化装置11,11’,21,31,41と異なるのは、符号化装置51が周波数領域ピッチ周期考慮符号化部116を含まない点である。この場合は、符号化装置51は、周波数領域ピッチ周期を特定するための符号を得る符号化装置として機能する。符号化装置51から出力された周波数領域のサンプル列も符号化する場合は、符号化装置51から出力された周波数領域のサンプル列は、例えば、符号化装置51の外部の周波数領域ピッチ周期考慮符号化部116に入力されて符号化されるが、その他の符号化手段を用いて符号化してもよい。その他は、第1実施形態、第1実施形態の変形例、第2実施形態、第3実施形態および第4実施形態の符号化装置11,11’,21,31,41と同じである。
図9に示すように、本実施形態の復号装置52が第1実施形態、第1実施形態の変形例、第2実施形態、第3実施形態および第4実施形態の復号装置12,12’,22,32,42と異なるのは、復号装置52が周波数領域ピッチ周期考慮復号部123、時間領域信号列生成部124、および長期予測合成部125を含まない点である。この場合は、復号装置52は、符号列に含まれる少なくとも周波数領域ピッチ周期符号と時間領域ピッチ周期符号とから、少なくとも長期予測周波数領域ピッチ周期Tと時間領域のピッチ周期Lとを得る復号装置として機能する。例えば、復号装置52から出力された時間領域のピッチ周期Lおよび量子化済みピッチ利得gp^は、長期予測合成部125の入力となる。また、例えば、符号列、復号装置52から出力された周波数領域ピッチ周期T、(および、補助情報が入力された場合には補助情報)は、周波数領域ピッチ周期考慮復号部123の入力となる。その他は、第1実施形態、第1実施形態の変形例、第2実施形態、第3実施形態および第4実施形態の復号装置12,12’,22,32,42と同じである。
図10および図11に示すように、本実施形態の符号化装置61および復号装置62が第1実施形態、第1実施形態の変形例、第2実施形態、第3実施形態および第4実施形態と異なるのは、周波数領域ピッチ周期考慮符号化部116に替えて周波数領域ピッチ周期考慮符号化部616が構成され、周波数領域ピッチ周期考慮復号部123に替えて周波数領域ピッチ周期考慮復号部623が構成される点である。周波数領域のサンプル列は、周波数領域ピッチ周期考慮符号化部616の入力となる。符号列、周波数領域ピッチ周期Tおよび補助情報は、周波数領域ピッチ周期考慮復号部623の入力となる。以下では、周波数領域ピッチ周期考慮符号化部616および周波数領域ピッチ周期考慮復号部623のみを説明する。
周波数領域ピッチ周期考慮符号化部616は、符号化部616bを備え、周波数領域ピッチ周期Tに基づく符号化方法で、入力された周波数領域のサンプル列を符号化し、それによって得られた符号列を出力する。
符号化部616bは、周波数領域のサンプル列のうちの周波数領域ピッチ周期Tに対応するサンプルを含む一つまたは連続する複数のサンプルおよび、周波数領域のサンプル列のうちの周波数領域ピッチ周期Tの整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルによるサンプル群G1と、周波数領域のサンプル列のうちのサンプル群G1に含まれないサンプルによるサンプル群G2と、を異なる基準に従って(区別して)符号化し、それによって得られた符号列を出力する。
「周波数領域のサンプル列のうちの周波数領域ピッチ周期Tに対応するサンプルを含む一つまたは連続する複数のサンプルおよび、周波数領域のサンプル列のうちの周波数領域ピッチ周期Tの整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプル」の具体例は第1実施形態と同じであり、このようなサンプルによる群がサンプル群G1である。第1実施形態で説明したように、このようなサンプル群G1の設定方法には様々な選択肢がある。例えば、符号化部616bに入力されたサンプル列のうち、周波数領域ピッチ周期Tの整数倍に対応するサンプルF(nT)の前後のサンプルF(nT-1),F(nT+1)を含めた3個のサンプルF(nT-1),F(nT),F(nT+1)によるサンプル群の集合がサンプル群G1の例である。例えば、nが1から5までの各整数を表す場合、第1のサンプル群F(T-1),F(T),F(T+1)、第2のサンプル群F(2T-1),F(2T),F(2T+1)、第3のサンプル群F(3T-1),F(3T),F(3T+1)、第4のサンプル群F(4T-1),F(4T),F(4T+1)、第5のサンプル群F(5T-1),F(5T),F(5T+1)からなる群がサンプル群G1である。
符号化部616bは、サンプル群G1,G2に含まれるサンプルの並び替えを行うことなく、サンプル群G1とサンプル群G2とを互いに異なる基準に従って符号化し、それによって得られた符号列を出力する。
可変長符号化として1サンプルごとのライス符号化を用いる例を説明する。
この場合、符号化部616bは、サンプル群G1に含まれるサンプルの振幅の大きさまたはその推定値に対応するライスパラメータを用いてサンプル群G1に含まれるサンプルを1サンプルごとにライス符号化する。また符号化部616bは、サンプル群G2に含まれるサンプルの振幅の大きさまたはその推定値に対応するライスパラメータを用いてサンプル群G2に含まれるサンプルを1サンプルごとにライス符号化する。符号化部616bは、ライス符号化によって得られた符号列と、ライスパラメータを特定するための補助情報とを出力する。
サンプル群G1に含まれるサンプルX(k)を1サンプルごとにライス符号化して得られる符号は、サンプル群G1のライスパラメータsに対応する値でサンプルX(k)を除算して得られる商q(k)をアルファ符号化したprefix(k)と、その剰余を特定するsub(k)とを含む。すなわち、この例でのサンプルX(k)に対応する符号はprefix(k)とsub(k)とを含む。なお、ライス符号化対象となるサンプルX(k)は整数表現されたものである。
ライスパラメータs>0の場合、以下のように商q(k)が生成される。ただし、floor(χ)はχ以下の最大の整数である。
q(k)=floor(X(k)/2s-1) (for X(k)≧0) …(B1)
q(k)=floor{(-X(k)-1)/2s-1} (for X(k)<0) …(B2)
ライスパラメータs=0の場合、以下のように商q(k)が生成される。
q(k)=2*X(k) (for X(k)≧0) …(B3)
q(k)=-2*X(k)-1 (for X(k)<0) …(B4)
ライスパラメータs>0の場合、以下のようにsub(k)が生成される。
sub(k)=X(k)-2s−1*q(k)+2s-1 (for X(k)≧0) …(B5)
sub(k)=(-X(k)-1)-2s-1*q(k) (for X(k)<0) …(B6)
ライスパラメータs=0の場合、sub(k)はnullである(sub(k)=null)。
q(k)=floor{(2*|X(k)|-z)/2s} (z=0 or 1 or 2) …(B7)
ライス符号化の場合、prefix(k)は商q(k)をアルファ符号化した符号であり、その符号量は、式(B7)を用いて以下のように表現できる。
floor{(2*|X(k)|-z)/2s}+1 …(B8)
s’=log2{ln2*(2*D/|G1|-z)} …(B11)
D/|G1|がzよりも十分大きいならば、式(B11)は以下のように近似できる。
s’=log2{ln2*(2・D/|G1|)} …(B12)
式(B12)で得られるs’は整数化されていないため、s’を整数に量子化した値をライスパラメータsとする。このライスパラメータsは、サンプル群G1に含まれるサンプルの振幅の大きさの平均D/|G1|に対応し(式(B12)参照)、サンプル群G1に含まれるサンプルX(k)に対応する符号の総符号量を最小化する。
サンプル群G1に対応するライスパラメータとサンプル群G2に対応するライスパラメータとを区別して扱う場合、復号側では、サンプル群G1に対応するライスパラメータを特定するための補助情報(第3補助情報)と、サンプル群G2に対応するライスパラメータを特定するための補助情報(第4補助情報)とが必要となる。そのため、符号化部616bは、サンプル列を1サンプルごとにライス符号化して得られた符号からなる符号列に加え、第3補助情報および第4補助情報を出力してもよい。
音響信号が符号化対象である場合、サンプル群G1に含まれるサンプルの振幅の大きさの平均はサンプル群G2に含まれるサンプルの振幅の大きさの平均よりも大きく、サンプル群G1に対応するライスパラメータがサンプル群G2に対応するライスパラメータよりも大きい。このことを利用してライスパラメータを特定するための補助情報の符号量を削減することもできる。
単独でサンプル群G1に対応するライスパラメータを特定できる情報を第5補助情報とし、サンプル群G1に対応するライスパラメータとサンプル群G2に対応するライスパラメータとの差分を特定できる情報を第6補助情報としてもよい。逆に、単独でサンプル群G2に対応するライスパラメータを特定できる情報を第6補助情報とし、サンプル群G1に対応するライスパラメータとサンプル群G2に対応するライスパラメータとの差分を特定できる情報を第5補助情報としてもよい。なお、サンプル群G1に対応するライスパラメータがサンプル群G2に対応するライスパラメータよりも大きいことが分かっているため、サンプル群G1に対応するライスパラメータとサンプル群G2に対応するライスパラメータとの大小関係を表す補助情報(正負を表す情報など)は不要である。
フレーム全体に割り当てられる符号ビット数が定められている場合には、ステップS113cで求められる利得の値もかなり制約され、サンプルの振幅のとり得る範囲も大きく制約される。この場合、フレーム全体に割り当てられる符号ビット数からサンプルの振幅の大きさの平均を或る程度の精度で推定できる。符号化部616bは、当該サンプルの振幅の大きさの平均の推定値から推定されるライスパラメータを用いてライス符号化を行ってもよい。
サンプル群G1に含まれるサンプルの振幅の大きさが均等ではない場合や、サンプル群G2に含まれるサンプルの振幅の大きさが均等ではない場合であっても、サンプル列X(1),...,X(N)の振幅の包絡情報をたよりに、符号量削減効果がより大きなライスパラメータを推定することもできる。たとえば、サンプルの振幅の大きさが高域ほど大きい場合には、サンプル群G1に含まれるサンプルのうち高域側のサンプルに対応するライスパラメータを固定的に増加させ、サンプル群G2に含まれるサンプルのうち高域側のサンプルに対応するライスパラメータを固定的に増加させることで、符号量をより削減できる。以下に具体例を示す。
周波数領域ピッチ周期考慮復号部623は、復号部623aを備え、周波数領域ピッチ周期Tに基づく復号方法で符号列を復号して周波数領域のサンプル列を得て出力する。
復号部623aは、周波数領域のサンプル列を、周波数領域のサンプル列のうちの周波数領域ピッチ周期Tに対応するサンプルを含む一つまたは連続する複数のサンプルおよび、周波数領域のサンプル列のうちの周波数領域ピッチ周期Tの整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルによるサンプル群G1と、周波数領域のサンプル列のうちのサンプル群G1に含まれないサンプルによるサンプル群G2と、を異なる基準に従った(区別された)復号処理により符号列を復号することにより得て出力する。
復号部623aは、入力された周波数領域ピッチ周期Tによって(第1補助情報が入力される場合には周波数領域ピッチ周期Tと第1補助情報とによって)、フレームごとに、入力された符号列に含まれる符号群C1およびC2、およびそれぞれの符号群が対応するサンプル群G1およびG2に含まれるサンプル番号を特定し、符号群C1およびC2を復号して得られるサンプル値群を各符号が対応するサンプル番号に割り当てることでサンプル群G1およびG2を得ることにより周波数領域のサンプル列を得る。符号群C1は、符号列のうちサンプル群G1に含まれるサンプルに対応する符号からなり、符号群C2は、符号列のうちサンプル群G2に含まれるサンプルに対応する符号からなる。復号部623aでの符号群C1およびC2の特定方法は、符号化部616bでのサンプル群G1およびG2の設定方法に対応し、例えば、前述のサンプル群G1およびG2の設定方法での「サンプル」を「符号」に、「F(j)」を「C(j)」に、「サンプル群G1」を「符号群C1」に、「サンプル群G2」を「符号群C2」に置換したものである。ただし、C(j)はサンプルF(j)に対応する符号である。
復号部623aは、符号群C1と符号群C2とを互いに異なる基準に従って復号し、それによって周波数領域のサンプル列を得て出力する。例えば、復号部623aは、符号群C1に対応するサンプル群G1に含まれるサンプルの振幅の大きさまたはその推定値に対応する基準に従って符号群C1に含まれる符号を復号し、符号群C2に対応するサンプル群G2に含まれるサンプルの振幅の大きさまたはその推定値に対応する基準に従って符号群C2に含まれる符号を復号する。
1サンプルごとのライス符号化によって符号列が得られている場合を例示する。
この場合、復号部623aは、フレームごとに、入力された補助情報(第1〜9補助情報の少なくとも一部)から特定される、サンプル群G1に対応するライスパラメータを符号群C1に対応するライスパラメータとし、サンプル群G2に対応するライスパラメータを符号群C2に対応するライスパラメータとする。以下に前述の[ライスパラメータを特定するための補助情報の例1〜5]に対応するライスパラメータの特定方法を例示する。
例えば、第3補助情報および第4補助情報が入力された復号部623aは、第3補助情報からサンプル群G1に対応するライスパラメータを特定し、それを符号群C1に対応するライスパラメータとし、第4補助情報からサンプル群G2に対応するライスパラメータを特定し、それを符号群C2に対応するライスパラメータとする。
例えば、符号列の他に第4補助情報のみが入力された復号部623aは、第4補助情報から符号群C2に対応するライスパラメータを特定し、符号群C2に対応するライスパラメータに固定値(例えば1)を加えたものを符号群C1に対応するライスパラメータとする。或いは、符号列の他に第3補助情報のみが入力された復号部623aは、第3補助情報から符号群C1に対応するライスパラメータを特定し、符号群C1に対応するライスパラメータから固定値(例えば1)を減じたものを符号群C2に対応するライスパラメータとする。
例えば、ライスパラメータを特定する第5補助情報および差分を特定する第6補助情報が入力された復号部623aは、第5補助情報からサンプル群G1に対応するライスパラメータを特定し、それを符号群C1に対応するライスパラメータとする。さらに、符号群C1に対応するライスパラメータから、第6補助情報から特定した差分を減じた値を符号群C2に対応するライスパラメータとする。
例えば、差分を特定する第5補助情報およびライスパラメータを特定する第6補助情報が入力された復号部623aは、第6補助情報からサンプル群G1に対応するライスパラメータを特定し、それを符号群C1に対応するライスパラメータとする。さらに、符号群C2に対応するライスパラメータに第5補助情報から特定した差分を加算した値を符号群C1に対応するライスパラメータとする。
例えば、第7補助情報が入力された復号部623aは、フレーム全体に割り当てられる符号ビット数から推定されるライスパラメータを符号群C2に対応するライスパラメータとし、これに第7補助情報から特定される第1差分値を加算したものを符号群C1に対応するライスパラメータとする。
例えば、第8補助情報が入力された復号部623aは、フレーム全体に割り当てられる符号ビット数から推定されるライスパラメータを符号群C1に対応するライスパラメータとし、これから、第8補助情報から特定される第2差分値を減じたものを符号群C2に対応するライスパラメータとする。
例えば、上述のライスパラメータを特定するための補助情報に加え、さらに第9補助情報が入力された復号部623aは、補助情報3〜8の少なくとも一部を用いてs1およびs2を特定し、第9補助情報に基づいてs1およびs2を前述の[表1]ように調整することで、符号群C1およびC2にそれぞれ対応するライスパラメータを得る。
第9補助情報が入力されない場合であっても、包絡情報が既知であって、符号化部616bがs1およびs2を前述の[表1]ように調整することでサンプル群G1およびG2にそれぞれ対応するライスパラメータを得ている場合には、復号部623aは、s1およびs2を前述の[表1]ように調整することで、符号群C1およびC2にそれぞれ対応するライスパラメータを得る。
第6実施形態では、符号化装置61の内部に周波数領域ピッチ周期考慮符号化部616が構成され、復号装置62の内部に周波数領域ピッチ周期考慮復号部623が構成される例を示した。しかしながら、符号化装置61に周波数領域ピッチ周期考慮符号化部616を含まない構成とし、復号装置62に周波数領域ピッチ周期考慮復号部623を含まない構成としてもよい。これは、第1実施形態、第1実施形態の変形例、第2実施形態、第3実施形態、第4実施形態に対する第5実施形態と同じ構成の差異であるので、詳細な説明は省略する。
[符号化装置81]
図14に示すように、本実施形態の符号化装置81が第5実施形態の符号化装置51と異なるのは、符号化装置81が長期予測分析部111と長期予測残差生成部112と周波数領域サンプル列生成部113とを含まない点である。この場合は、符号化装置81は、符号化装置81の外部から時間領域のピッチ周期Lと時間領域ピッチ周期符号CLと周波数領域サンプル列とが入力され、周波数領域サンプル列に対する周波数領域ピッチ周期を特定するための符号を得る符号化装置として機能する。
図15に示すように、本実施形態の復号装置82が第5実施形態の復号装置52と異なるのは、復号装置82が長期予測情報復号部121を含まない点である。この場合は、復号装置82は、復号装置82の外部の長期予測情報復号部121により得た時間領域ピッチ周期Lと、入力される符号列に含まれる少なくとも周波数領域ピッチ周期符号と時間領域ピッチ周期符号とから、少なくとも周波数領域ピッチ周期Tを得る復号装置として機能する。例えば、符号列、復号装置52から出力された周波数領域ピッチ周期T、(および、補助情報が入力された場合には補助情報)は、周波数領域ピッチ周期考慮復号部123の入力となる。その他は、第5実施形態の復号装置52と同じである。
[周波数領域ピッチ周期分析装置91]
また、第5実施形態、第7実施形態、第8実施形態では、符号化装置51、81で求めた周波数領域ピッチ周期Tを、外部の周波数領域ピッチ周期考慮符号化部116、616で周波数領域のサンプル列の符号化に用いることを前提とし、周波数領域ピッチ周期Tに対応する周波数領域ピッチ周期符号を出力していた。しかし、周波数領域ピッチ周期Tを、符号化以外の目的に使うことも可能であり、その場合、周波数領域ピッチ周期Tに対応する周波数領域ピッチ周期符号を出力しなくても良い。符号化以外の目的としては、例えば、音声や楽音の分析、複数の音声や楽音の分離、音声や楽音の認識などが考えられる。
なお、第1実施形態、第1実施形態の変形例、第2実施形態、第3実施形態、第4実施形態では、周波数領域ピッチ周期考慮符号化部として並べ替え処理部116aと符号化部116bとによる構成を説明し、第6実施形態では、周波数領域ピッチ周期考慮符号化部として符号化部616bによる構成を説明したが、何れの周波数領域ピッチ周期考慮符号化部も「周波数領域ピッチ周期Tに基づく符号化方法で、入力された周波数領域のサンプル列を符号化し、それによって得られた符号列を出力する。」ものであり、より詳細には、「周波数領域のサンプル列のうちの周波数領域ピッチ周期Tに対応するサンプルを含む一つまたは連続する複数のサンプルおよび、周波数領域のサンプル列のうちの周波数領域ピッチ周期Tの整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルによるサンプル群と、周波数領域のサンプル列のうちのサンプル群G1に含まれないサンプルによるサンプル群と、を異なる基準に従って(区別して)符号化し、それによって得られた符号列を出力する。」ものである。
上述の実施形態に関わる符号化装置/復号装置は、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、CPU(Central Processing Unit)〔キャッシュメモリなどを備えていてもよい。〕、メモリであるRAM(Random Access Memory)やROM(Read Only Memory)、ハードディスクである外部記憶装置、およびこれらの入力部、出力部、CPU、RAM、ROM、外部記憶装置間のデータのやり取りが可能なように接続するバスなどを備えている。また必要に応じて、符号化装置/復号装置に、CD−ROMなどの記憶媒体を読み書きできる装置(ドライブ)などを設けるとしてもよい。
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。例えば、上述の復号処理において、長期予測情報復号部121による処理と復号部123a,523aによる処理とは、並列に実行することができる。
サンプル群G1に含まれるサンプルの振幅の大きさが均等ではない場合や、サンプル群G2に含まれるサンプルの振幅の大きさが均等ではない場合であっても、サンプル列X(1),...,X(N)の振幅の包絡情報をたよりに、符号量削減効果がより大きなライスパラメータを推定することもできる。たとえば、サンプルの振幅の大きさが高域ほど大きい場合には、サンプル群G1に含まれるサンプルのうち高域側のサンプルに対応するライスパラメータを固定的に増加させ、サンプル群G2に含まれるサンプルのうち高域側のサンプルに対応するライスパラメータを固定的に増加させることで、符号量をより削減できる。以下に具体例を示す。
図15に示すように、本実施形態の復号装置82が第5実施形態の復号装置52と異なるのは、復号装置82が長期予測情報復号部121を含まない点である。この場合は、復号装置82は、復号装置82の外部の長期予測情報復号部121により得た時間領域ピッチ周期Lと、入力される符号列に含まれる少なくとも周波数領域ピッチ周期符号と時間領域ピッチ周期符号とから、少なくとも周波数領域ピッチ周期Tを得る復号装置として機能する。例えば、符号列、符号化装置81から出力された周波数領域ピッチ周期T、(および、補助情報が入力された場合には補助情報)は、周波数領域ピッチ周期考慮復号部123の入力となる。その他は、第5実施形態の復号装置52と同じである。
なお、第1実施形態、第1実施形態の変形例、第2実施形態、第3実施形態、第4実施形態では、周波数領域ピッチ周期考慮符号化部として並べ替え処理部116aと符号化部116bとによる構成を説明し、第6実施形態では、周波数領域ピッチ周期考慮符号化部として符号化部616bによる構成を説明したが、何れの周波数領域ピッチ周期考慮符号化部も「周波数領域ピッチ周期Tに基づく符号化方法で、入力された周波数領域のサンプル列を符号化し、それによって得られた符号列を出力する。」ものであり、より詳細には、「周波数領域のサンプル列のうちの周波数領域ピッチ周期Tに対応するサンプルを含む一つまたは連続する複数のサンプルおよび、周波数領域のサンプル列のうちの周波数領域ピッチ周期Tの整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルによるサンプル群G1と、周波数領域のサンプル列のうちのサンプル群G1に含まれないサンプルによるサンプル群と、を異なる基準に従って(区別して)符号化し、それによって得られた符号列を出力する。」ものである。
Claims (41)
- 所定の時間区間の音響信号の時間領域ピッチ周期符号に時間領域のピッチ周期Lが対応し、上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を換算間隔T1として得る周期換算ステップと、
上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1(ただし、Uは予め定めた第1の範囲の整数)を含む候補値の中から上記音響信号に由来する周波数領域サンプル列のピッチ周期(以下、「第1周波数領域ピッチ周期」という。)Tを決定し、上記第1周波数領域ピッチ周期Tが上記換算間隔T1の何倍であるかを示す第1周波数領域ピッチ周期符号を得る周波数領域ピッチ周期分析ステップと、
を有する符号化方法。 - 所定の時間区間の音響信号の時間領域での長期予測分析を行い時間領域のピッチ周期Lと当該時間領域のピッチ周期Lに対応する時間領域ピッチ周期符号を得る長期予測分析ステップと、
上記時間領域のピッチ周期Lを用いて上記音響信号の長期予測残差信号を得る長期予測残差生成ステップと、
上記長期予測残差信号に由来する周波数領域のサンプル列または上記音響信号に由来する周波数領域のサンプル列を得る周波数領域サンプル列生成ステップと、
上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を換算間隔T1として得る周期換算ステップと、
上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1(ただし、Uは予め定めた第1の範囲の整数)を含む候補値の中から上記周波数領域サンプル列のピッチ周期(以下、「第1周波数領域ピッチ周期」という。)Tを決定し、上記第1周波数領域ピッチ周期Tが上記換算間隔T1の何倍であるかを示す第1周波数領域ピッチ周期符号を得る周波数領域ピッチ周期分析ステップと、
を有する符号化方法。 - 請求項1または2に記載の符号化方法であって、
上記周波数領域ピッチ周期分析ステップは、
上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1を含む候補値の中から中間候補値を決定し、上記中間候補値および上記中間候補値の近傍の予め定めた第3の範囲の値の中から上記第1周波数領域ピッチ周期Tを決定し、上記中間候補値が上記換算間隔T1の何倍であるかを示す情報と、上記第1周波数領域ピッチ周期Tと上記中間候補値との差を示す情報と、を上記第1周波数領域ピッチ周期符号として得る
ことを特徴とする符号化方法。 - 所定の時間区間の音響信号の時間領域での長期予測分析を行い、長期予測を実行するか否かを示す長期予測選択情報、長期予測を実行する場合は時間領域のピッチ周期Lと当該時間領域のピッチ周期に対応する時間領域ピッチ周期符号、を得る長期予測分析ステップと、
長期予測を実行する場合には、上記時間領域のピッチ周期Lを用いて上記音響信号の長期予測残差信号を得る長期予測残差生成ステップと、
長期予測を実行する場合には上記長期予測残差信号に、長期予測を実行しない場合には上記音響信号に、由来する周波数領域のサンプル列を得る周波数領域サンプル列生成ステップと、
上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を換算間隔T1として得る周期換算ステップと、
長期予測を実行する場合には、上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1(ただし、Uは予め定めた第1の範囲の整数)を含む候補値の中から上記周波数領域サンプル列のピッチ周期(以下、「第1周波数領域ピッチ周期」という。)Tを決定し、上記周波数領域ピッチ周期Tが上記換算間隔T1の何倍であるかを示す第1周波数領域ピッチ周期符号を得て、長期予測を実行しない場合には、予め定めた第2の範囲の整数値を候補値の中から上記周波数領域サンプル列のピッチ周期(以下、「第2周波数領域ピッチ周期」という。)Tを決定し、上記第2周波数領域ピッチ周期Tを示す第2周波数領域ピッチ周期符号を得る周波数領域ピッチ周期分析ステップと、
を有する符号化方法。 - 請求項4に記載の符号化方法であって、
上記周波数領域ピッチ周期分析ステップは、
長期予測を実行する場合には、上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1を含む候補値の中から中間候補値を決定し、上記中間候補値および上記中間候補値の近傍の予め定めた第3の範囲の値の中から上記第1周波数領域ピッチ周期Tを決定し、上記中間候補値が上記換算間隔T1の何倍であるかを示す情報と、上記第1周波数領域ピッチ周期Tと上記中間候補値との差を示す情報と、を上記第1周波数領域ピッチ周期符号として得て、長期予測を実行しない場合には、上記予め定めた第2の範囲の整数値を候補値として上記第2周波数領域ピッチ周期Tを決定し、上記第2周波数領域ピッチ周期Tと上記第2周波数領域ピッチ周期Tを示す上記第2周波数領域ピッチ周期符号とを得る
ことを特徴とする符号化方法。 - 所定の時間区間の音響信号の時間領域での長期予測分析を行い、長期予測を実行するか否かを示す長期予測選択情報、長期予測を実行する場合は時間領域のピッチ周期Lと当該時間領域のピッチ周期に対応する時間領域ピッチ周期符号とピッチ利得、を得る長期予測分析ステップと、
長期予測を実行する場合には、上記時間領域のピッチ周期Lと上記ピッチ利得とを用いて上記音響信号の長期予測残差信号を得る長期予測残差生成ステップと、
長期予測を実行する場合には上記長期予測残差信号に、長期予測を実行しない場合には上記音響信号に、由来する周波数領域のサンプル列を得る周波数領域サンプル列生成ステップと、
上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を換算間隔T1として得る周期換算ステップと、
量子化済みピッチ利得が予め定めた値以上である場合には、上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1(ただし、Uは予め定めた第1の範囲の整数)を含む候補値の中から上記周波数領域サンプル列のピッチ周期(以下、「第1周波数領域ピッチ周期」という。)Tを決定し、上記第1周波数領域ピッチ周期Tと上記第1周波数領域ピッチ周期Tが上記換算間隔T1の何倍であるかを示す第1周波数領域ピッチ周期符号とを得て、上記量子化済みピッチ利得が予め定めた値より小さい場合には、予め定めた第2の範囲の整数値を候補値の中から上記周波数領域サンプル列のピッチ周期(以下、「第2周波数領域ピッチ周期」という。)Tを決定し、上記第2周波数領域ピッチ周期Tと上記第2周波数領域ピッチ周期Tを示す第2周波数領域ピッチ周期符号とを得る周波数領域ピッチ周期分析ステップと、
を有する符号化方法。 - 請求項6に記載の符号化方法であって、
上記周波数領域ピッチ周期分析ステップは、
上記量子化済みピッチ利得が予め定めた値以上である場合には、上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1を含む候補値の中から中間候補値を決定し、上記中間候補値および上記中間候補値の近傍の予め定めた第3の範囲の値の中から上記第1周波数領域ピッチ周期Tを決定し、上記中間候補値が上記換算間隔T1の何倍であるかを示す情報と、上記第1周波数領域ピッチ周期Tと上記中間候補値との差を示す情報と、を上記第1周波数領域ピッチ周期符号として得て、上記量子化済みピッチ利得が予め定めた値より小さい場合には、上記予め定めた第2の範囲の整数値を候補値として上記第2周波数領域ピッチ周期Tを決定し、上記第2周波数領域ピッチ周期Tと上記第2周波数領域ピッチ周期Tを示す上記第2周波数領域ピッチ周期符号とを得る
ことを特徴とする符号化方法。 - 請求項1から7の何れかに記載の符号化方法であって、
上記第1または2周波数領域ピッチ周期Tに基づく符号化方法で上記周波数領域のサンプル列を符号化する周波数領域ピッチ周期考慮符号化ステップ
を更に有する符号化方法。 - 請求項8に記載の符号化方法であって、
上記第1または2周波数領域ピッチ周期Tに基づく符号化方法は、
上記周波数領域のサンプル列のうちの上記第1または2周波数領域ピッチ周期Tに対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記周波数領域のサンプル列のうちの上記第1または2周波数領域ピッチ周期Tの整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルによるサンプル群と、上記サンプル列のうちの上記サンプル群に含まれないサンプルによるサンプル群と、を異なる基準に従って符号化する符号化方法である
符号化方法。 - 請求項8に記載の符号化方法であって、
上記周波数領域ピッチ周期考慮符号化ステップは、
(1)上記サンプル列の全てのサンプルが含まれ、かつ、
(2)上記サンプル列のうちの上記第1または2周波数領域ピッチ周期Tに対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記第1または2周波数領域ピッチ周期Tの整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
を並べ替え後のサンプル列として得る並べ替えステップと、
上記並べ替えステップで得られたサンプル列を符号化する符号化ステップと、
を含む符号化方法。 - 請求項10に記載の符号化方法であって、
上記並べ替えステップでは、
上記所定の時間区間の音響信号に対応する予測利得またはその推定値が予め定めた閾値以下である場合は、上記サンプル列を並べ替え後のサンプル列として出力する
ことを特徴とする符号化方法。 - 請求項1,2,4,6の何れかに記載の符号化方法であって、
上記第1周波数領域ピッチ周期符号は、上記第1周波数領域ピッチ周期Tが
上記換算間隔T1そのものである場合、
上記換算間隔T1の整数倍である場合、
の符号長のほうが、
それ以外の場合の符号長よりも短い
ことを特徴とする符号化方法。 - 請求項1,2,4,6の何れかに記載の符号化方法であって、
上記第1周波数領域ピッチ周期符号は、上記第1周波数領域ピッチ周期Tが
上記換算間隔T1そのものである場合、
上記換算間隔T1の整数倍である場合、
上記換算間隔T1の近傍である場合、
上記換算間隔T1の整数倍の近傍である場合、
の符号長のほうが、
それ以外の場合の符号長よりも短い
ことを特徴とする符号化方法。 - 請求項1,2,4,6の何れかに記載の符号化方法であって、
上記第1周波数領域ピッチ周期符号は、上記第1周波数領域ピッチ周期Tが
上記換算間隔T1そのものである場合、
の符号長のほうが、
上記換算間隔T1の近傍である場合の符号長よりも短い
ことを特徴とする符号化方法。 - 請求項1,2,4,6の何れかに記載の符号化方法であって、
上記第1周波数領域ピッチ周期符号は、上記第1周波数領域ピッチ周期Tが
上記換算間隔T1の整数倍である場合、
の符号長のほうが、
上記換算間隔T1の整数倍の近傍である場合の符号長よりも短い
ことを特徴とする符号化方法。 - 請求項12乃至15のいずれかに記載の符号化方法であって、
少なくとも、上記第1周波数領域ピッチ周期Tが上記換算間隔T1の整数倍の値V×T1(ただし、Vは正の整数)である場合の上記第1周波数領域ピッチ周期符号の符号長は、
上記整数Vの大きさに対して単調非減少の関係にある
ことを特徴とする符号化方法。 - 時間領域ピッチ周期符号を復号して時間領域のピッチ周期Lを得る長期予測情報復号ステップと、
上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を換算間隔T1として得、第1周波数領域ピッチ周期符号を復号して第1周波数領域ピッチ周期Tが上記換算間隔T1の何倍であるかを示す倍数値を得、上記換算間隔T1に上記倍数値を乗算したものを上記第1周波数領域ピッチ周期Tとして得る周期換算ステップと
を有する復号方法。 - 請求項17に記載の復号方法であって、
上記周期換算ステップは、
上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を上記換算間隔T1として得、上記第1周波数領域ピッチ周期符号を復号して、中間候補値が上記換算間隔T1の何倍であるかの倍数値と、上記第1周波数領域ピッチ周期Tと上記中間候補値との差の値と、を得、上記換算間隔T1に上記倍数値を乗算して得られる値に上記差の値を加算したものを上記第1周波数領域ピッチ周期Tとして得る
ことを特徴とする復号方法。 - 長期予測選択情報が長期予測を実行することを示す場合に、時間領域ピッチ周期符号を復号して時間領域のピッチ周期Lを得る長期予測情報復号ステップと、
上記長期予測選択情報が長期予測を実行することを示す場合には、上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を換算間隔T1として得、第1周波数領域ピッチ周期符号を復号して第1周波数領域ピッチ周期Tが上記換算間隔T1の何倍であるかを示す倍数値を得、上記換算間隔T1に上記倍数値を乗算したものを上記第1周波数領域ピッチ周期Tとして得て、上記長期予測選択情報が長期予測を実行しないことを示す場合には、第2周波数領域ピッチ周期符号を復号して上記第2周波数領域ピッチ周期Tを得る周期換算ステップと
を有する復号方法。 - 請求項19に記載の復号方法であって、
上記周期換算ステップは、
上記長期予測選択情報が長期予測を実行することを示す場合には、上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を上記換算間隔T1として得、上記第1周波数領域ピッチ周期符号を復号して、中間候補値が上記換算間隔T1の何倍であるかの倍数値と、上記第1周波数領域ピッチ周期Tと上記中間候補値との差の値と、を得、上記換算間隔T1に上記倍数値を乗算して得られる値に上記差の値を加算したものを上記第1周波数領域ピッチ周期Tとして得て、上記長期予測選択情報が長期予測を実行しないことを示す場合には、上記第2周波数領域ピッチ周期符号を復号して上記第2周波数領域ピッチ周期Tを得る
ことを特徴とする復号方法。 - 長期予測選択情報が長期予測を実行することを示す場合に、時間領域ピッチ周期符号を復号して時間領域のピッチ周期Lを得て、利得符号を復号して量子化済みピッチ利得を得る長期予測情報復号ステップと、
上記量子化済みピッチ利得が予め定めた値以上である場合には、上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を換算間隔T1として得、第1周波数領域ピッチ周期符号を復号して第1周波数領域ピッチ周期Tが上記換算間隔T1の何倍であるかを示す倍数値を得、上記換算間隔T1に上記倍数値をしたものを上記第1周波数領域ピッチ周期Tとして得て、上記量子化済みピッチ利得が予め定めた値より小さい場合には、第2周波数領域ピッチ周期符号を復号して第2周波数領域ピッチ周期Tを得る周期換算ステップと
を有する復号方法。 - 請求項21に記載の復号方法であって、
上記周期換算ステップは、
上記量子化済みピッチ利得が予め定めた値以上である場合には、上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を上記換算間隔T1として得、上記第1周波数領域ピッチ周期符号を復号して、中間候補値が上記換算間隔T1の何倍であるかの倍数値と、上記第1周波数領域ピッチ周期Tと上記中間候補値との差の値と、を得、上記換算間隔T1に上記倍数値を乗算して得られる値に上記差の値を加算したものを上記第1周波数領域ピッチ周期Tとして得て、上記量子化済みピッチ利得が予め定めた値より小さい場合には、上記第2周波数領域ピッチ周期符号を復号して上記第2周波数領域ピッチ周期Tを得る
ことを特徴とする復号方法。 - 請求項17から22の何れかに記載の復号方法であって、
上記第1または2周波数領域ピッチ周期Tに基づく復号方法で符号列を復号して周波数領域のサンプル列を得る周波数領域ピッチ周期考慮復号ステップと、
上記周波数領域のサンプル列に由来する時間領域の信号列を得る時間領域信号列生成ステップと、
上記時間領域の信号列と上記時間領域のピッチ周期Lと過去の復号音響信号列を用いて、復号音響信号列を得る長期予測合成ステップと、
を更に有する復号方法。 - 請求項23に記載の復号方法であって、
上記第1または2周波数領域ピッチ周期Tに基づく復号方法は、
上記周波数領域のサンプル列のうちの上記第1または2周波数領域ピッチ周期Tに対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記周波数領域のサンプル列のうちの上記第1または2周波数領域ピッチ周期Tの整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルによるサンプル群と、上記周波数領域のサンプル列のうちの上記サンプル群に含まれないサンプルによるサンプル群と、が異なる基準に従った復号処理により得られる復号方法である
ことを特徴とする復号方法。 - 請求項23に記載の復号方法であって、
上記周波数領域ピッチ周期考慮復号ステップは、
上記符号列を復号してサンプル列を得る復号ステップと
上記第1または2周波数領域ピッチ周期Tに従って上記サンプル列から周波数順のサンプルの並びである周波数領域のサンプル列を得る回復ステップを含む
ことを特徴とする復号方法。 - 請求項25に記載の復号方法であって、
上記回復ステップでは、
所定の時間区間の予測利得の推定値が予め定めた閾値以下である場合は、上記符号列を復号して得られたサンプル列を元のサンプルの並びである周波数領域のサンプル列として出力する
ことを特徴とする復号方法。 - 所定の時間区間の音響信号に由来する周波数領域サンプル列のピッチ周期(以下、「周波数領域ピッチ周期」という。)Tを決定する周波数領域ピッチ周期分析方法であって、
上記音響信号の時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を換算間隔T1として得る周期換算ステップと、
上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1(ただし、Uは予め定めた第1の範囲の整数)を含む候補値の中から上記周波数領域ピッチ周期Tを決定する周波数領域ピッチ周期分析ステップと、
を有する周波数領域ピッチ周期分析方法。 - 請求項27に記載の周波数領域ピッチ周期分析方法であって、
上記周波数領域ピッチ周期分析ステップは、
上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1を含む候補値の中から中間候補値を決定し、上記中間候補値および上記中間候補値の近傍の予め定めた第3の範囲の値の中から周波数領域ピッチ周期Tを決定する
ことを特徴とする周波数領域ピッチ周期分析方法。 - 所定の時間区間の音響信号の時間領域ピッチ周期符号に時間領域のピッチ周期Lが対応し、上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を換算間隔T1として得る周期換算部と、
上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1(ただし、Uは予め定めた第1の範囲の整数)を含む候補値の中から上記音響信号に由来する周波数領域サンプル列のピッチ周期(以下、「第1周波数領域ピッチ周期」という。)Tを決定し、上記第1周波数領域ピッチ周期Tが上記換算間隔T1の何倍であるかを示す第1周波数領域ピッチ周期符号を得る周波数領域ピッチ周期分析部と、
を有する符号化装置。 - 所定の時間区間の音響信号の時間領域での長期予測分析を行い時間領域のピッチ周期Lと当該時間領域のピッチ周期Lに対応する時間領域ピッチ周期符号を得る長期予測分析部と、
上記時間領域のピッチ周期Lを用いて上記音響信号の長期予測残差信号を得る長期予測残差生成部と、
上記長期予測残差信号に由来する周波数領域のサンプル列または上記音響信号に由来する周波数領域のサンプル列を得る周波数領域サンプル列生成部と、
上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を換算間隔T1として得る周期換算部と、
上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1(ただし、Uは予め定めた第1の範囲の整数)を含む候補値の中から上記周波数領域サンプル列のピッチ周期(以下、「第1周波数領域ピッチ周期」という。)Tを決定し、上記第1周波数領域ピッチ周期Tが上記換算間隔T1の何倍であるかを示す第1周波数領域ピッチ周期符号を得る周波数領域ピッチ周期分析部と、
を有する符号化装置。 - 請求項29または30に記載の符号化装置であって、
上記周波数領域ピッチ周期分析部は、
上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1を含む候補値の中から中間候補値を決定し、上記中間候補値および上記中間候補値の近傍の予め定めた第3の範囲の値の中から上記第1周波数領域ピッチ周期Tを決定し、上記中間候補値が上記換算間隔T1の何倍であるかを示す情報と、上記第1周波数領域ピッチ周期Tと上記中間候補値との差を示す情報と、を上記第1周波数領域ピッチ周期符号として得る
ことを特徴とする符号化装置。 - 時間領域ピッチ周期符号を復号して時間領域のピッチ周期Lを得る長期予測情報復号部と、
上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を換算間隔T1として得、第1周波数領域ピッチ周期符号を復号して第1周波数領域ピッチ周期Tが上記換算間隔T1の何倍であるかを示す倍数値を得、上記換算間隔T1に上記倍数値を乗算したものを上記第1周波数領域ピッチ周期Tとして得る周期換算部と
を有する復号装置。 - 請求項32に記載の復号装置であって、
上記周期換算部は、
上記時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を上記換算間隔T1として得、上記第1周波数領域ピッチ周期符号を復号して、中間候補値が上記換算間隔T1の何倍であるかの倍数値と、上記第1周波数領域ピッチ周期Tと上記中間候補値との差の値と、を得、上記換算間隔T1に上記倍数値を乗算して得られる値に上記差の値を加算したものを上記第1周波数領域ピッチ周期Tとして得る
ことを特徴とする復号装置。 - 所定の時間区間の音響信号に由来する周波数領域サンプル列のピッチ周期(以下、「周波数領域ピッチ周期」という。)Tを決定する周波数領域ピッチ周期分析装置であって、
上記音響信号の時間領域のピッチ周期Lに対応する周波数領域のサンプル間隔を換算間隔T1として得る周期換算部と、
上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1(ただし、Uは予め定めた第1の範囲の整数)を含む候補値の中から上記周波数領域ピッチ周期Tを決定する周波数領域ピッチ周期分析部と、
を有する周波数領域ピッチ周期分析装置。 - 請求項34に記載の周波数領域ピッチ周期分析装置であって、
上記周波数領域ピッチ周期分析部は、
上記換算間隔T1および上記換算間隔T1の整数倍の値U×T1を含む候補値の中から中間候補値を決定し、上記中間候補値および上記中間候補値の近傍の予め定めた第3の範囲の値の中から周波数領域ピッチ周期Tを決定する
ことを特徴とする周波数領域ピッチ周期分析装置。 - 請求項1から16の何れかに記載の符号化方法の各ステップをコンピュータに実行させるためのプログラム。
- 請求項17から26の何れかに記載の復号方法の各ステップをコンピュータに実行させるためのプログラム。
- 請求項27または28の周波数領域ピッチ周期分析方法の各ステップをコンピュータに実行させるためのプログラム。
- 請求項1から16の何れかに記載の符号化方法の各ステップをコンピュータに実行させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。
- 請求項17から26の何れかに記載の復号方法の各ステップをコンピュータに実行させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。
- 請求項27または28の周波数領域ピッチ周期分析方法の各ステップをコンピュータに実行させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014516829A JP6053196B2 (ja) | 2012-05-23 | 2013-05-22 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、および記録媒体 |
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012117172 | 2012-05-23 | ||
JP2012117172 | 2012-05-23 | ||
JP2012171155 | 2012-08-01 | ||
JP2012171155 | 2012-08-01 | ||
JP2014516829A JP6053196B2 (ja) | 2012-05-23 | 2013-05-22 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、および記録媒体 |
PCT/JP2013/064209 WO2013176177A1 (ja) | 2012-05-23 | 2013-05-22 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、および記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2013176177A1 true JPWO2013176177A1 (ja) | 2016-01-14 |
JP6053196B2 JP6053196B2 (ja) | 2016-12-27 |
Family
ID=49623862
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014516829A Active JP6053196B2 (ja) | 2012-05-23 | 2013-05-22 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、および記録媒体 |
Country Status (8)
Country | Link |
---|---|
US (3) | US9947331B2 (ja) |
EP (3) | EP3576089B1 (ja) |
JP (1) | JP6053196B2 (ja) |
KR (4) | KR20140143438A (ja) |
CN (3) | CN108962270B (ja) |
ES (3) | ES2689072T3 (ja) |
PL (2) | PL2830057T3 (ja) |
WO (1) | WO2013176177A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2689072T3 (es) * | 2012-05-23 | 2018-11-08 | Nippon Telegraph And Telephone Corporation | Codificación de una señal de audio |
WO2016121826A1 (ja) * | 2015-01-30 | 2016-08-04 | 日本電信電話株式会社 | 符号化装置、復号装置、これらの方法、プログラム及び記録媒体 |
US10276186B2 (en) * | 2015-01-30 | 2019-04-30 | Nippon Telegraph And Telephone Corporation | Parameter determination device, method, program and recording medium for determining a parameter indicating a characteristic of sound signal |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
EP3270376B1 (en) * | 2015-04-13 | 2020-03-18 | Nippon Telegraph and Telephone Corporation | Sound signal linear predictive coding |
CN106373594B (zh) * | 2016-08-31 | 2019-11-26 | 华为技术有限公司 | 一种音调检测方法及装置 |
CN110291583B (zh) * | 2016-09-09 | 2023-06-16 | Dts公司 | 用于音频编解码器中的长期预测的系统和方法 |
JP6712643B2 (ja) * | 2016-09-15 | 2020-06-24 | 日本電信電話株式会社 | サンプル列変形装置、信号符号化装置、信号復号装置、サンプル列変形方法、信号符号化方法、信号復号方法、およびプログラム |
EP3742441B1 (en) * | 2018-01-17 | 2023-04-12 | Nippon Telegraph And Telephone Corporation | Encoding device, decoding device, fricative determination device, and method and program thereof |
CN110728990B (zh) * | 2019-09-24 | 2022-04-05 | 维沃移动通信有限公司 | 基音检测方法、装置、终端设备和介质 |
US11769071B2 (en) * | 2020-11-30 | 2023-09-26 | IonQ, Inc. | System and method for error correction in quantum computing |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001249698A (ja) * | 2000-03-06 | 2001-09-14 | Yrp Kokino Idotai Tsushin Kenkyusho:Kk | 音声符号化パラメータ取得方法、音声復号方法及び装置 |
JP2002516420A (ja) * | 1998-05-21 | 2002-06-04 | ユニバーシティ オブ サリー | 音声コーダ |
WO2012046685A1 (ja) * | 2010-10-05 | 2012-04-12 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4797926A (en) | 1986-09-11 | 1989-01-10 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech vocoder |
US5003604A (en) * | 1988-03-14 | 1991-03-26 | Fujitsu Limited | Voice coding apparatus |
US5127053A (en) * | 1990-12-24 | 1992-06-30 | General Electric Company | Low-complexity method for improving the performance of autocorrelation-based pitch detectors |
JP3362471B2 (ja) * | 1993-07-27 | 2003-01-07 | ソニー株式会社 | 音声信号の符号化方法及び復号化方法 |
JP3890605B2 (ja) * | 1994-08-22 | 2007-03-07 | ソニー株式会社 | 送受信装置 |
TW321810B (ja) * | 1995-10-26 | 1997-12-01 | Sony Co Ltd | |
WO1999059139A2 (en) * | 1998-05-11 | 1999-11-18 | Koninklijke Philips Electronics N.V. | Speech coding based on determining a noise contribution from a phase change |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
JP4550176B2 (ja) * | 1998-10-08 | 2010-09-22 | 株式会社東芝 | 音声符号化方法 |
JP2000267700A (ja) * | 1999-03-17 | 2000-09-29 | Yrp Kokino Idotai Tsushin Kenkyusho:Kk | 音声符号化復号方法および装置 |
JP4005359B2 (ja) * | 1999-09-14 | 2007-11-07 | 富士通株式会社 | 音声符号化及び音声復号化装置 |
CA2388352A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
JP3731575B2 (ja) * | 2002-10-21 | 2006-01-05 | ソニー株式会社 | 符号化装置及び復号装置 |
EP1619664B1 (en) * | 2003-04-30 | 2012-01-25 | Panasonic Corporation | Speech coding apparatus, speech decoding apparatus and methods thereof |
BRPI0517246A (pt) | 2004-10-28 | 2008-10-07 | Matsushita Electric Ind Co Ltd | aparelho de codificação escalável, aparelho de decodificação escalável e métodos para os mesmos |
WO2006075605A1 (ja) * | 2005-01-12 | 2006-07-20 | Nippon Telegraph And Telephone Corporation | 長期予測符号化方法、長期予測復号化方法、これら装置、そのプログラム及び記録媒体 |
ES2351935T3 (es) * | 2005-04-01 | 2011-02-14 | Qualcomm Incorporated | Procedimiento y aparato para la cuantificación vectorial de una representación de envolvente espectral. |
KR100647336B1 (ko) * | 2005-11-08 | 2006-11-23 | 삼성전자주식회사 | 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법 |
JP4964114B2 (ja) | 2007-12-25 | 2012-06-27 | 日本電信電話株式会社 | 符号化装置、復号化装置、符号化方法、復号化方法、符号化プログラム、復号化プログラム、および記録媒体 |
WO2010140546A1 (ja) * | 2009-06-03 | 2010-12-09 | 日本電信電話株式会社 | 符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、復号化プログラム及びこれらの記録媒体 |
ES2689072T3 (es) * | 2012-05-23 | 2018-11-08 | Nippon Telegraph And Telephone Corporation | Codificación de una señal de audio |
US9589570B2 (en) * | 2012-09-18 | 2017-03-07 | Huawei Technologies Co., Ltd. | Audio classification based on perceptual quality for low or medium bit rates |
-
2013
- 2013-05-22 ES ES13793620.9T patent/ES2689072T3/es active Active
- 2013-05-22 WO PCT/JP2013/064209 patent/WO2013176177A1/ja active Application Filing
- 2013-05-22 EP EP19185171.6A patent/EP3576089B1/en active Active
- 2013-05-22 ES ES18173806T patent/ES2762160T3/es active Active
- 2013-05-22 CN CN201811010320.XA patent/CN108962270B/zh active Active
- 2013-05-22 KR KR1020147030874A patent/KR20140143438A/ko active Application Filing
- 2013-05-22 KR KR1020177016696A patent/KR101762204B1/ko active IP Right Grant
- 2013-05-22 PL PL13793620T patent/PL2830057T3/pl unknown
- 2013-05-22 KR KR1020167021875A patent/KR101663607B1/ko active IP Right Grant
- 2013-05-22 JP JP2014516829A patent/JP6053196B2/ja active Active
- 2013-05-22 CN CN201811009738.9A patent/CN109147827B/zh active Active
- 2013-05-22 CN CN201380026430.4A patent/CN104321814B/zh active Active
- 2013-05-22 US US14/391,534 patent/US9947331B2/en active Active
- 2013-05-22 EP EP18173806.3A patent/EP3385950B1/en active Active
- 2013-05-22 EP EP13793620.9A patent/EP2830057B1/en active Active
- 2013-05-22 PL PL18173806T patent/PL3385950T3/pl unknown
- 2013-05-22 ES ES19185171T patent/ES2834391T3/es active Active
- 2013-05-22 KR KR1020167018299A patent/KR101750071B1/ko active IP Right Grant
-
2018
- 2018-02-23 US US15/904,159 patent/US10096327B2/en active Active
- 2018-02-23 US US15/904,140 patent/US10083703B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002516420A (ja) * | 1998-05-21 | 2002-06-04 | ユニバーシティ オブ サリー | 音声コーダ |
JP2001249698A (ja) * | 2000-03-06 | 2001-09-14 | Yrp Kokino Idotai Tsushin Kenkyusho:Kk | 音声符号化パラメータ取得方法、音声復号方法及び装置 |
WO2012046685A1 (ja) * | 2010-10-05 | 2012-04-12 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6053196B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、および記録媒体 | |
JP5612698B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 | |
JP5596800B2 (ja) | 符号化方法、周期性特徴量決定方法、周期性特徴量決定装置、プログラム | |
JP5603484B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 | |
JP5893153B2 (ja) | 符号化方法、符号化装置、プログラム、および記録媒体 | |
JP5694751B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160322 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20160518 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160701 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161122 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161128 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6053196 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |