JP2016045462A - 周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置及びプログラム - Google Patents
周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置及びプログラム Download PDFInfo
- Publication number
- JP2016045462A JP2016045462A JP2014171776A JP2014171776A JP2016045462A JP 2016045462 A JP2016045462 A JP 2016045462A JP 2014171776 A JP2014171776 A JP 2014171776A JP 2014171776 A JP2014171776 A JP 2014171776A JP 2016045462 A JP2016045462 A JP 2016045462A
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- frequency domain
- frequency
- parameter
- domain parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 100
- 238000006243 chemical reaction Methods 0.000 claims abstract description 169
- 230000005236 sound signal Effects 0.000 claims abstract description 66
- 239000011159 matrix material Substances 0.000 claims description 157
- 230000009466 transformation Effects 0.000 claims description 105
- 238000012937 correction Methods 0.000 claims description 27
- 238000005070 sampling Methods 0.000 claims description 21
- 230000007423 decrease Effects 0.000 claims description 16
- 238000009499 grossing Methods 0.000 abstract description 57
- 238000012545 processing Methods 0.000 abstract description 33
- 230000003044 adaptive effect Effects 0.000 abstract description 2
- 230000001788 irregular Effects 0.000 abstract 1
- 238000001228 spectrum Methods 0.000 description 251
- 230000008602 contraction Effects 0.000 description 175
- 230000000875 corresponding effect Effects 0.000 description 150
- 238000004458 analytical method Methods 0.000 description 29
- 238000010606 normalization Methods 0.000 description 29
- 238000004364 calculation method Methods 0.000 description 23
- 230000008569 process Effects 0.000 description 19
- 230000006870 function Effects 0.000 description 16
- 239000013598 vector Substances 0.000 description 10
- 238000013139 quantization Methods 0.000 description 9
- 230000008859 change Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 230000005484 gravity Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 241000209094 Oryza Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【解決手段】伸縮対応平滑化LSP線形変換部328は、pを1以上の整数とし、ω[1],ω[2],…,ω[p]を所定の時間区間の音信号に対応する隣接するサンプル点間の周波数の間隔が不均等な周波数領域の係数列をサンプル点の周波数の間隔が均等であると見做したときの時間領域の信号に対応する線形予測係数列に由来する周波数領域パラメータ列とし、周波数領域パラメータ列ω[1],ω[2],…,ω[p]を入力として、変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]における各~ω[i](i=1,2,…,p)を、ω[i]とω[i]に近接する1つまたは複数の周波数領域パラメータとの値の関係に基づく線形変換により変換後周波数領域パラメータ~ω[i]の値を求める。
【選択図】図11
Description
周波数領域変換部11には、時間領域の音信号が入力される。音信号は、例えば音声信号又は音響信号である。
線形予測分析部12には、時間領域の音信号が入力される。
パワースペクトル包絡系列生成部13には、線形予測分析部12が生成した量子化線形予測係数^α1,^α2,…,^αpが入力される。
包絡正規化部14には、周波数領域変換部11が生成したMDCT係数列X(0),X(1),…,X(N-1)及びパワースペクトル包絡系列生成部13が出力した平滑化パワースペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)が入力される。
符号化部15には、包絡正規化部14が生成した正規化MDCT係数列XN(0),XN(1),…,XN(N-1)が入力される。
まず、従来技術で説明した符号化処理を例に技術的背景について説明する。
(第一実施形態の符号化)
第一実施形態の符号化装置の構成例を図2に示す。第一実施形態の符号化装置は、図2に示すように、周波数領域変換部21と、伸縮疑似パワースペクトル系列生成部22と、線形予測分析部23と、伸縮パワースペクトル包絡系列生成部24と、逆伸縮変換部25と、包絡正規化部26と、符号化部27とを例えば備えている。この符号化装置により実現される第一実施形態の符号化方法の各処理の例を図3に示す。
周波数領域変換部21には、時間領域の音信号が入力される。音信号の例は、音声ディジタル信号又は音響ディジタル信号である。
伸縮疑似パワースペクトル系列生成部22には、周波数領域変換部21が変換したMDCT係数列X(0),X(1),…,X(N-1)が入力される。
線形予測分析部23には、伸縮疑似パワースペクトル系列生成部22が生成した伸縮疑似パワースペクトル系列~Y(0),~Y(1),…,~Y(N-1)が入力される。
伸縮パワースペクトル包絡系列生成部24には、線形予測分析部23が生成した量子化伸縮線形予測係数^β1,^β2,…,^βpが入力される。
逆伸縮変換部25には、伸縮パワースペクトル包絡系列生成部24が生成した伸縮パワースペクトル包絡系列~W(0),~W(1),…,~W(N-1)が入力される。
包絡正規化部26には、周波数領域変換部21が変換したMDCT係数列X(0),X(1),…,X(N-1)及び逆伸縮変換部25が変換したパワースペクトル包絡系列W(0),W(1),…,W(N-1)が入力される。
符号化部27には、包絡正規化部26が生成した正規化された周波数領域サンプル列が入力される。この例では、正規化された周波数領域サンプル列は、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)である。
線形離散化サンプル点列から非線形離散化サンプル点列への線形変換を実現する変換行列Uと、非線形離散化サンプル点列から線形離散化サンプル点列への線形変換を実現する変換行列Vとは、例えば予め学習によって求めておくことができる。ここでU,Vの要素はすべて負でないという制約をつける。変換前後のベクトルはパワースペクトルまたはその包絡であるため、すべて正値であるためである。
第一実施形態の符号化装置に対応する復号装置の構成例を図9に示す。第一実施形態の復号装置は、図9に示すように、伸縮線形予測係数復号部31と、伸縮パワースペクトル包絡系列生成部32と、逆伸縮変換部33と、復号部34と、包絡逆正規化部35と、時間領域変換部36とを例えば備えている。この復号装置により実現される第一実施形態の復号方法の各処理の例を図10に示す。
伸縮線形予測係数復号部31には、符号化装置が出力した伸縮線形予測係数符号が入力される。
伸縮パワースペクトル包絡系列生成部32には、伸縮線形予測係数復号部31が生成した復号伸縮線形予測係数^β1,^β2,…,^βpが入力される。
逆伸縮変換部33には、伸縮パワースペクトル包絡系列生成部32が生成した伸縮パワースペクトル包絡系列~W(0),~W(1),…,~W(N-1)が入力される。
復号部34には、符号化装置が出力した正規化MDCT係数列XN(0),XN(1),…,XN(N-1)に対応する符号が入力される。
包絡逆正規化部35には、逆伸縮変換部33が変換したパワースペクトル包絡系列W(0),W(1),…,W(N-1)及び復号部34が生成した復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)が入力される。
時間領域変換部36には、包絡逆正規化部35が生成した復号MDCT係数列^X(0),^X(1),…,^X(N-1)が入力される。
(第二実施形態の符号化)
第二実施形態の符号化装置の構成例は、図2に示した第一実施形態の符号化装置の構成例と同様である。
第二実施形態の復号装置の構成例は、図9に示した第一実施形態の復号装置の構成例と同様である。
(第三実施形態の符号化)
第三実施形態の符号化装置の構成例を図11に示す。第三実施形態の符号化装置は、図11に示すように、周波数領域変換部21と、伸縮疑似パワースペクトル系列生成部22と、逆伸縮変換部25と、包絡正規化部26と、符号化部27とを、第一実施形態及び第二実施形態の符号化装置と同様に備え、さらに線形予測分析部323と、伸縮パワースペクトル包絡系列生成部324と、伸縮対応平滑化LSP線形変換部328を例えば備えている。線形予測分析部323は、線形予測係数算出部3231と、LSP計算部3232と、LSP符号化部3233とを例えば備えている。この符号化装置により実現される第三実施形態の符号化方法の各処理の例を図12に示す。
線形予測分析部323には、伸縮疑似パワースペクトル系列生成部22が生成した伸縮疑似パワースペクトル系列~Y(0),~Y(1),…,~Y(N-1)が入力される。
線形予測係数算出部3231には、伸縮疑似パワースペクトル生成部22が生成した伸縮疑似パワースペクトル系列~Y(0),~Y(1),…,~Y(N-1)が入力される。
LSP計算部3232は、線形予測係数算出部3231が生成した伸縮線形予測係数β1,β2,…,βpを受け取り、伸縮線形予測係数β1,β2,…,βpから伸縮LSPパラメータφ[1],φ[2],…,φ[p]を生成する。
LSP符号化部3233は、LSP計算部3232が生成した伸縮LSPパラメータφ[1],φ[2],…,φ[p]を受け取り、伸縮LSPパラメータφ[1],φ[2],…,φ[p]を符号化して、伸縮LSP符号CLfと、伸縮LSP符号に対応する量子化伸縮LSPパラメータ^φ[1],^φ[2],…,^φ[p]とを生成する。なお、量子化伸縮LSPパラメータは、伸縮LSPパラメータを量子化したものである。「"ITU-T Recommendation G.729", ITU, 1996(参考文献1)」では、伸縮LSPパラメータφ[1],φ[2],…,φ[p]の過去のフレームからの重み付き差分ベクトルを求め、重み付き差分ベクトルを低次側と高次側の2つのサブベクトルに分け、各サブベクトルが2つの符号帳からのサブベクトルの和となるように符号化する方法で符号化しているが、符号化方法には様々な従来技術がある。したがって、伸縮LSPパラメータの符号化には、参考文献1に記載された方法、多段でベクトル量子化する方法、スカラ量子化する方法、これらを組み合わせた方法、などの様々な周知の符号化方法が採用されることがある。
伸縮対応平滑化LSP線形変換部328では、LSPパラメータの性質を利用して、LSP符号化部3233が生成した量子化伸縮LSPパラメータ^φ[1],^φ[2],…,^φ[p]に近似的な線形変換を施して近似量子化伸縮平滑化LSPパラメータ^φγ[1],^φγ[2],…,^φγ[p]を生成し(ステップE8)、出力する。
0<θγ[1]<θγ[2]…<θγ[p]<π
の性質を満たす。
^Φγ1=(^φγ1[1],^φγ1[2],…,^φγ1[p])Tとし、
^Φγ2=(^φγ2[1],^φγ2[2],…,^φγ2[p])Tとして、
伸縮対応平滑化LSP線形変換部328で用いる行列Kは以下のような方法により予め求めておき、符号化装置および復号装置内の記憶部に格納しておく。
^Φ(r) γ1=(^φ(r)[1],^φ(r)[2],…,^φ(r)[p])T
とする。
^Φ(r) γ2=(^φγ (r)[1],^φγ (r)[2],…,^φγ (r)[p])T
とする。
Q={(^Φ(r) γ1, ^Φ(r) γ2)|r=1,…,R}
である。なお、学習用データ集合Qを生成する際に用いる補正係数γの値は全て共通(固定値)とする。
x1 =-0.90066, y1 = 0.14433,
z2 = 0.087751,x2 =-0.82430, y2= 0.25040,
z3 = 0.160411,x3 =-0.75856, y3= 0.25114,
z4 = 0.19919, x4 =-0.71534, y4= 0.26285,
z5 = 0.21522, x5 =-0.67187, y5= 0.23377,
z6 = 0.20770, x6 =-0.64609, y6= 0.22998,
z7 = 0.19009, x7 =-0.66693, y7= 0.26844,
z8 = 0.14418, x8 =-0.60680, y8= 0.28027,
z9 = 0.15397, x9 =-0.56066, y9= 0.25356,
z10= 0.16542, x10=-0.53646, y10=0.24035,
z11= 0.15644, x11=-0.52384, y11=0.25126,
z12= 0.14787, x12=-0.48204, y12=0.22857,
z13= 0.15112, x13=-0.45085, y13=0.19629,
z14= 0.14692, x14=-0.41358, y14=0.14839,
z15= 0.15744, x15=-0.45656, y15=0.17932,
z16= 0.10929, x16=-0.36787
伸縮パワースペクトル包絡系列計算部324は、伸縮対応平滑化LSP線形変換部328から出力された近似量子化伸縮平滑化LSPパラメータ^φγ[1],^φγ[2],…,^φγ[p]を用いて、式(15)により伸縮パワースペクトル包絡系列^W(1),^W(2),…,^W(N)を求めて出力する(ステップE4)。
第三実施形態の符号化装置に対応する復号装置の構成例を図16に示す。第三実施形態の復号装置は、図16に示すように、逆伸縮変換部33と、復号部34と、包絡逆正規化部35と、時間領域変換部36とを、第一実施形態及び第二実施形態の復号装置と同様に備え、さらに伸縮線形予測係数復号部431と、伸縮パワースペクトル包絡系列生成部432と、伸縮対応平滑化LSP線形変換部438とを例えば備えている。この復号装置により実現される第三実施形態の復号方法の各処理の例を図17に示す。
伸縮線形予測係数復号部431は、伸縮LSP符号CLfを受け取り、伸縮LSP符号CLfを復号して復号伸縮LSPパラメータ^φ[1],^φ[2],…,^φ[p]を得て出力する(ステップD1)。符号化装置が出力した伸縮LSP符号CLfが誤りなく復号装置に入力されていれば、得られる復号伸縮LSPパラメータは、符号化装置のLSP符号化部3233で得られた量子化伸縮LSPパラメータと同じになる。
伸縮対応平滑化LSP線形変換部438には、伸縮線形予測係数復号部431で得られた復号伸縮LSPパラメータ^φ[1],^φ[2],…,^φ[p]が入力される。
伸縮パワースペクトル包絡系列計算部432は、伸縮パワースペクトル包絡系列計算部324と同様に、近似復号伸縮平滑化LSPパラメータ^φγ[1],^φγ[2],…,^φγ[p]を用いて、上記の式(15)により、伸縮パワースペクトル包絡系列^W(1),^W(2),…,^W(N)を求めて出力する(ステップD2)。
第三実施形態の符号化装置及び復号装置は伸縮パワースペクトル包絡系列生成部において、第一実施形態の符号化装置や復号装置よりも少ない演算量で伸縮パワースペクトル包絡系列を求めることができる。
第三実施形態の符号化装置が備える伸縮対応平滑化LSP線形変換部328、第三実施形態の復号装置が備える伸縮対応平滑化LSP線形変換部438を、独立した周波数領域パラメータ変換装置として構成することも可能である。
第四実施形態の周波数領域パラメータ変換装置10は、図18に示すように、パラメータ列変換部20を例えば含み、周波数領域パラメータω[1],ω[2],…,ω[p]を入力とし、変換後周波数領域パラメータ~ω[1],~ω[2],…,~ω[p]を出力する。
なお、LSPはLSFなどと呼ばれることもあり、ISPはISFなどと呼ばれることもある。
a[1]×(γ1),a[2]×(γ1)2,…,a[p]×(γ1)p
と等価な周波数領域のパラメータ列、もしくは、その量子化値である。また、変換後周波数領域パラメータ~ω[1],~ω[2],…,~ω[p]は、線形予測係数a[1],a[2],…,a[p]の各係数a[i]に係数γ2のi乗を乗じることにより補正した係数列である
a[1]×(γ2),a[2]×(γ2)2,…,a[p]×(γ2)p
と等価な周波数領域のパラメータ列を近似する系列となる。
第四実施形態の周波数領域パラメータ変換装置は、第三実施形態の符号化装置や復号装置と同様に、第一実施形態や第二実施形態の符号化装置や復号装置のような周波数領域パラメータから線形予測係数を介して変換後周波数領域パラメータを求める場合よりも少ない演算量で、周波数領域パラメータから変換後周波数領域パラメータを求めることができる。
上記周波数領域パラメータ変換方法、符号化方法、復号方法、これらの装置において説明した処理は、記載の順にしたがって時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。
12 線形予測分析部
13 パワースペクトル包絡系列生成部
14 包絡正規化部
15 符号化部
21 周波数領域変換部
22 伸縮疑似パワースペクトル系列生成部
23 線形予測分析部
24 伸縮パワースペクトル包絡系列生成部
25 逆伸縮変換部
26 包絡正規化部
27 符号化部
31 伸縮線形予測係数復号部
32 伸縮パワースペクトル包絡系列生成部
33 逆伸縮変換部
34 復号部
35 包絡逆正規化部
36 時間領域変換部
323 線形予測分析部
3231 線形予測係数算出部
3232 LSP計算部
3233 LSP符号化部
324 伸縮パワースペクトル包絡系列生成部
328 伸縮対応平滑化LSP線形変換部
431 伸縮線形予測係数復号部
432 伸縮パワースペクトル包絡系列生成部
438 伸縮対応平滑化LSP線形変換部
10 周波数領域パラメータ変換装置
20 パラメータ列変換部
Claims (20)
- pを1以上の整数とし、ω[1],ω[2],…,ω[p]を所定の時間区間の音信号に対応する隣接するサンプル点間の周波数の間隔が不均等な周波数領域の係数列をサンプル点の周波数の間隔が均等であると見做したときの時間領域の信号に対応する線形予測係数列に由来する周波数領域パラメータ列とし、
上記周波数領域パラメータ列ω[1],ω[2],…,ω[p]を入力として、変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を求めるパラメータ列変換ステップを含み、
上記パラメータ列変換ステップは、
上記変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]における各~ω[i](i=1,2,…,p)を、
ω[i]とω[i]に近接する1つまたは複数の周波数領域パラメータとの値の関係に基づく線形変換により変換後周波数領域パラメータ~ω[i]の値を求める
周波数領域パラメータ列生成方法。 - 請求項1に記載の周波数領域パラメータ列生成方法であって、
上記線形変換は、
上記周波数領域パラメータ列ω[1],ω[2],…,ω[p]よりも、上記変換後周波数領域パラメータ列のほうが、パラメータ値の間隔が均等間隔に近くなるか遠くなり、かつ、低い周波数に対応するパラメータの方が高い周波数に対応するパラメータよりも上記周波数領域パラメータと上記変換後周波数領域パラメータとの差が小さくなるような線形変換である
周波数領域パラメータ列生成方法。 - 請求項1に記載の周波数領域パラメータ列生成方法であって、
上記線形変換は、
上記周波数領域パラメータ列ω[1],ω[2],…,ω[p]よりも、上記変換後周波数領域パラメータ列のほうが、パラメータ値の間隔が均等間隔に近くなるか遠くなり、かつ、高い周波数に対応するパラメータの方が低い周波数に対応するパラメータよりも上記周波数領域パラメータと上記変換後周波数領域パラメータとの差が小さくなるような線形変換である
周波数領域パラメータ列生成方法。 - pを1以上の整数としω[1],ω[2],…,ω[p]を所定の時間区間の音信号に対応する隣接するサンプル点間の周波数の間隔が不均等な周波数領域の係数列をサンプル点の周波数の間隔が均等であると見做したときの時間領域の信号に対応する線形予測係数列に由来する周波数領域パラメータ列とし、
上記周波数領域パラメータ列ω[1],ω[2],…,ω[p]を入力として、変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を求めるパラメータ列変換ステップを含み、
上記パラメータ列変換ステップは、
上記変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]における各~ω[i](i=1,2,…,p)を、
ω[i]がω[i+1]とω[i-1]との中点よりもω[i+1]に近い場合には、~ω[i]が~ω[i+1]と~ω[i-1]との中点よりも~ω[i+1]に近く、かつ、ω[i+1]-ω[i]よりも~ω[i+1]-~ω[i]の方が値が小さく、かつ、iの値が小さいほど~ω[i]-ω[i]の絶対値が小さくなるように求め、
ω[i]がω[i+1]とω[i-1]との中点よりもω[i-1]に近い場合には、~ω[i]が~ω[i+1]と~ω[i-1]との中点よりも~ω[i-1]に近く、かつ、ω[i]-ω[i-1]よりも~ω[i]-~ω[i-1]の方が値が小さく、かつ、iの値が小さいほどω[i]-~ω[i]の絶対値が小さくなるように求める
周波数領域パラメータ列生成方法。 - pを1以上の整数とし、ω[1],ω[2],…,ω[p]を所定の時間区間の音信号に対応する隣接するサンプル点間の周波数の間隔が不均等な周波数領域の係数列をサンプル点の周波数の間隔が均等であると見做したときの時間領域の信号に対応する線形予測係数列に由来する周波数領域パラメータ列とし、
上記周波数領域パラメータ列ω[1],ω[2],…,ω[p]を入力として、変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を求めるパラメータ列変換ステップを含み、
上記パラメータ列変換ステップは、
上記変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]における各~ω[i](i=1,2,…,p)を、
ω[i]がω[i+1]とω[i-1]との中点よりもω[i+1]に近い場合には、~ω[i]が~ω[i+1]と~ω[i-1]との中点よりも~ω[i+1]に近く、かつ、ω[i+1]-ω[i]よりも~ω[i+1]-~ω[i]の方が値が小さく、かつ、iの値が大きいほど~ω[i]-ω[i]の絶対値が小さくなるように求め、
ω[i]がω[i+1]とω[i-1]との中点よりもω[i-1]に近い場合には、~ω[i]が~ω[i+1]と~ω[i-1]との中点よりも~ω[i-1]に近く、かつ、ω[i]-ω[i-1]よりも~ω[i]-~ω[i-1]の方が値が小さく、かつ、iの値が大きいほどω[i]-~ω[i]の絶対値が小さくなるように求める
周波数領域パラメータ列生成方法。 - pを1以上の整数とし、ω[1],ω[2],…,ω[p]を所定の時間区間の音信号に対応する隣接するサンプル点間の周波数の間隔が不均等な周波数領域の係数列をサンプル点の周波数の間隔が均等であると見做したときの時間領域の信号に対応する線形予測係数列に由来する周波数領域パラメータ列とし、
上記周波数領域パラメータ列ω[1],ω[2],…,ω[p]を入力として、変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を求めるパラメータ列変換ステップを含み、
上記パラメータ列変換ステップは、
上記変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]における各~ω[i](i=1,2,…,p)を、
ω[i]がω[i+1]とω[i-1]との中点よりもω[i+1]に近い場合には、~ω[i]が~ω[i+1]と~ω[i-1]との中点よりも~ω[i+1]に近く、かつ、ω[i+1]-ω[i]よりも~ω[i+1]-~ω[i]の方が値が大きく、かつ、iの値が小さいほど~ω[i]-ω[i]の絶対値が小さくなるように求め、
ω[i]がω[i+1]とω[i-1]との中点よりもω[i-1]に近い場合には、~ω[i]が~ω[i+1]と~ω[i-1]との中点よりも~ω[i-1]に近く、かつ、ω[i]-ω[i-1]よりも~ω[i]-~ω[i-1]の方が値が大きく、かつ、iの値が小さいほどω[i]-~ω[i]の絶対値が小さくなるように求める
周波数領域パラメータ列生成方法。 - pを1以上の整数とし、ω[1],ω[2],…,ω[p]を所定の時間区間の音信号に対応する隣接するサンプル点間の周波数の間隔が不均等な周波数領域の係数列をサンプル点の周波数の間隔が均等であると見做したときの時間領域の信号に対応する線形予測係数列に由来する周波数領域パラメータ列とし、
上記周波数領域パラメータ列ω[1],ω[2],…,ω[p]を入力として、変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を求めるパラメータ列変換ステップを含み、
上記パラメータ列変換ステップは、
上記変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]における各~ω[i](i=1,2,…,p)を、
ω[i]がω[i+1]とω[i-1]との中点よりもω[i+1]に近い場合には、~ω[i]が~ω[i+1]と~ω[i-1]との中点よりも~ω[i+1]に近く、かつ、ω[i+1]-ω[i]よりも~ω[i+1]-~ω[i]の方が値が大きく、かつ、iの値が大きいほど~ω[i]-ω[i]の絶対値が小さくなるように求め、
ω[i]がω[i+1]とω[i-1]との中点よりもω[i-1]に近い場合には、~ω[i]が~ω[i+1]と~ω[i-1]との中点よりも~ω[i-1]に近く、かつ、ω[i]-ω[i-1]よりも~ω[i]-~ω[i-1]の方が値が大きく、かつ、iの値が大きいほどω[i]-~ω[i]の絶対値が小さくなるように求める
周波数領域パラメータ列生成方法。 - pを1以上の整数とし、a[1],a[2],…,a[p]を所定の時間区間の音信号に対応する隣接するサンプル点間の周波数の間隔が不均等な周波数領域の係数列をサンプル点の周波数の間隔が均等であると見做したときの時間領域の信号に対応する線形予測係数列とし、
ω[1],ω[2]…,ω[p]を、
上記線形予測係数列a[1],a[2],…,a[p]に由来するLSPパラメータ列、
上記線形予測係数列a[1],a[2],…,a[p]に由来するLSFパラメータ列、
上記線形予測係数列a[1],a[2],…,a[p]に由来し、かつ、ω[1],ω[2]…,ω[p]の全てが0からπまでの間に存在し、かつ、線形予測係数列に含まれる全ての線形予測係数が0である場合にはω[1],ω[2]…,ω[p]が0からπまでの間に均等間隔に存在する周波数領域パラメータ列、のいずれかとし、
γ1及びγ2をそれぞれ1以下の正の定数である補正係数とし、Kを予め定められたp×pの帯行列とし、
次式により定義される変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を生成するパラメータ列変換ステップを含む
周波数領域パラメータ列生成方法。 - pを1以上の整数とし、a[1],a[2],…,a[p+1]を所定の時間区間の音信号に対応する隣接するサンプル点間の周波数の間隔が不均等な周波数領域の係数列をサンプル点の周波数の間隔が均等であると見做したときの時間領域の信号に対応する(p+1)次の線形予測係数列とし、
ω[1],ω[2]…,ω[p+1]を、
上記線形予測係数列a[1],a[2],…,a[p+1]に由来するISPパラメータ列、
上記線形予測係数列a[1],a[2],…,a[p+1]に由来するISFパラメータ列、
上記線形予測係数列a[1],a[2],…,a[p+1]に由来し、かつ、ω[1],ω[2]…,ω[p]の全てが0からπまでの間に存在し、かつ、線形予測係数列に含まれる全ての線形予測係数が0である場合にはω[1],ω[2]…,ω[p]が0からπまでの間に均等間隔に存在する周波数領域パラメータ列、のいずれかとし、
γ1及びγ2をそれぞれ1以下の正の定数である補正係数とし、Kを予め定められたp×pの帯行列とし、
次式により定義される変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を生成するパラメータ列変換ステップを含む
周波数領域パラメータ列生成方法。 - 請求項1から8のいずれかに記載の周波数領域パラメータ列生成方法であって、
γ1を1以下の正の定数とし、
上記線形予測係数列をa[1],a[2],…,a[p]とし、
上記周波数領域パラメータ列ω[1],ω[2],…,ω[p]における各ω[i](i=1,2,…,p)は、
aγ1[i]=a[i]×(γ1)iとして、
aγ1[1],aγ1[2],…,aγ1[p]と等価な周波数領域のパラメータまたはその量子化値、
または、
上記音信号に対応する隣接するサンプル点間の周波数の間隔が均等な周波数領域の係数列を線形離散化サンプル点列とし、
上記音信号に対応する隣接するサンプル点間の周波数の間隔が不均等な周波数領域の係数列を非線形離散化サンプル点列とし、
上記線形離散化サンプル点列と上記非線形離散化サンプル点列のサンプル点数をNとし、
上記非線形離散化サンプル点列でk番目のインデックスに対応するサンプル点の周波数の、上記線形離散化サンプル点列での相対的な周波数位置をf(k)とし、
とし、
aγ1[i]=a[i]×(γ1)ig(k)として、
aγ1[1],aγ1[2],…,aγ1[p]と等価な周波数領域のパラメータまたはその量子化値、
である
周波数領域パラメータ列生成方法。 - 請求項8または9に記載の周波数領域パラメータ列生成方法であって、
上記帯行列Kは、対角要素が0以上の値であり、行方向において対角要素に隣接する要素が0以下の値であり、対角要素の左上の成分の絶対値は右下の成分の絶対値よりも大きい
周波数領域パラメータ列生成方法。 - 請求項8または9に記載の周波数領域パラメータ列生成方法であって、
上記帯行列Kは、対角要素が0以上の値であり、行方向において対角要素に隣接する要素が0以下の値であり、対角要素の左上の成分の絶対値は右下の成分の絶対値よりも小さい
周波数領域パラメータ列生成方法。 - pを1以上の整数とし、ω[1],ω[2],…,ω[p]を所定の時間区間の音信号に対応する隣接するサンプル点間の周波数の間隔が不均等な周波数領域の係数列をサンプル点の周波数の間隔が均等であると見做したときの時間領域の信号に対応する線形予測係数列に由来する周波数領域パラメータ列とし、
上記周波数領域パラメータ列ω[1],ω[2],…,ω[p]を入力として、変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を求めるパラメータ列変換部を含み、
上記パラメータ列変換部は、
上記変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]における各~ω[i](i=1,2,…,p)を、
ω[i]とω[i]に近接する1つまたは複数の周波数領域パラメータとの値の関係に基づく線形変換により変換後周波数領域パラメータ~ω[i]の値を求める
周波数領域パラメータ列生成装置。 - pを1以上の整数とし、ω[1],ω[2],…,ω[p]を所定の時間区間の音信号に対応する隣接するサンプル点間の周波数の間隔が不均等な周波数領域の係数列をサンプル点の周波数の間隔が均等であると見做したときの時間領域の信号に対応する線形予測係数列に由来する周波数領域パラメータ列とし、
上記周波数領域パラメータ列ω[1],ω[2],…,ω[p]を入力として、変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を求めるパラメータ列変換部を含み、
上記パラメータ列変換部は、
上記変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]における各~ω[i](i=1,2,…,p)を、
ω[i]がω[i+1]とω[i-1]との中点よりもω[i+1]に近い場合には、~ω[i]が~ω[i+1]と~ω[i-1]との中点よりも~ω[i+1]に近く、かつ、ω[i+1]-ω[i]よりも~ω[i+1]-~ω[i]の方が値が小さく、かつ、iの値が小さいほど~ω[i]-ω[i]の絶対値が小さくなるように求め、
ω[i]がω[i+1]とω[i-1]との中点よりもω[i-1]に近い場合には、~ω[i]が~ω[i+1]と~ω[i-1]との中点よりも~ω[i-1]に近く、かつ、ω[i]-ω[i-1]よりも~ω[i]-~ω[i-1]の方が値が小さく、かつ、iの値が小さいほどω[i]-~ω[i]の絶対値が小さくなるように求める
周波数領域パラメータ列生成装置。 - pを1以上の整数とし、ω[1],ω[2],…,ω[p]を所定の時間区間の音信号に対応する隣接するサンプル点間の周波数の間隔が不均等な周波数領域の係数列をサンプル点の周波数の間隔が均等であると見做したときの時間領域の信号に対応する線形予測係数列に由来する周波数領域パラメータ列とし、
上記周波数領域パラメータ列ω[1],ω[2],…,ω[p]を入力として、変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を求めるパラメータ列変換部を含み、
上記パラメータ列変換部は、
上記変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]における各~ω[i](i=1,2,…,p)を、
ω[i]がω[i+1]とω[i-1]との中点よりもω[i+1]に近い場合には、~ω[i]が~ω[i+1]と~ω[i-1]との中点よりも~ω[i+1]に近く、かつ、ω[i+1]-ω[i]よりも~ω[i+1]-~ω[i]の方が値が小さく、かつ、iの値が大きいほど~ω[i]-ω[i]の絶対値が小さくなるように求め、
ω[i]がω[i+1]とω[i-1]との中点よりもω[i-1]に近い場合には、~ω[i]が~ω[i+1]と~ω[i-1]との中点よりも~ω[i-1]に近く、かつ、ω[i]-ω[i-1]よりも~ω[i]-~ω[i-1]の方が値が小さく、かつ、iの値が大きいほどω[i]-~ω[i]の絶対値が小さくなるように求める
周波数領域パラメータ列生成装置。 - pを1以上の整数とし、ω[1],ω[2],…,ω[p]を所定の時間区間の音信号に対応する隣接するサンプル点間の周波数の間隔が不均等な周波数領域の係数列をサンプル点の周波数の間隔が均等であると見做したときの時間領域の信号に対応する線形予測係数列に由来する周波数領域パラメータ列とし、
上記周波数領域パラメータ列ω[1],ω[2],…,ω[p]を入力として、変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を求めるパラメータ列変換部を含み、
上記パラメータ列変換部は、
上記変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]における各~ω[i](i=1,2,…,p)を、
ω[i]がω[i+1]とω[i-1]との中点よりもω[i+1]に近い場合には、~ω[i]が~ω[i+1]と~ω[i-1]との中点よりも~ω[i+1]に近く、かつ、ω[i+1]-ω[i]よりも~ω[i+1]-~ω[i]の方が値が大きく、かつ、iの値が小さいほど~ω[i]-ω[i]の絶対値が小さくなるように求め、
ω[i]がω[i+1]とω[i-1]との中点よりもω[i-1]に近い場合には、~ω[i]が~ω[i+1]と~ω[i-1]との中点よりも~ω[i-1]に近く、かつ、ω[i]-ω[i-1]よりも~ω[i]-~ω[i-1]の方が値が大きく、かつ、iの値が小さいほどω[i]-~ω[i]の絶対値が小さくなるように求める
周波数領域パラメータ列生成装置。 - pを1以上の整数とし、ω[1],ω[2],…,ω[p]を所定の時間区間の音信号に対応する隣接するサンプル点間の周波数の間隔が不均等な周波数領域の係数列をサンプル点の周波数の間隔が均等であると見做したときの時間領域の信号に対応する線形予測係数列に由来する周波数領域パラメータ列とし、
上記周波数領域パラメータ列ω[1],ω[2],…,ω[p]を入力として、変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を求めるパラメータ列変換部を含み、
上記パラメータ列変換部は、
上記変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]における各~ω[i](i=1,2,…,p)を、
ω[i]がω[i+1]とω[i-1]との中点よりもω[i+1]に近い場合には、~ω[i]が~ω[i+1]と~ω[i-1]との中点よりも~ω[i+1]に近く、かつ、ω[i+1]-ω[i]よりも~ω[i+1]-~ω[i]の方が値が大きく、かつ、iの値が大きいほど~ω[i]-ω[i]の絶対値が小さくなるように求め、
ω[i]がω[i+1]とω[i-1]との中点よりもω[i-1]に近い場合には、~ω[i]が~ω[i+1]と~ω[i-1]との中点よりも~ω[i-1]に近く、かつ、ω[i]-ω[i-1]よりも~ω[i]-~ω[i-1]の方が値が大きく、かつ、iの値が大きいほどω[i]-~ω[i]の絶対値が小さくなるように求める
周波数領域パラメータ列生成装置。 - pを1以上の整数とし、a[1],a[2],…,a[p]を所定の時間区間の音信号に対応する隣接するサンプル点間の周波数の間隔が不均等な周波数領域の係数列をサンプル点の周波数の間隔が均等であると見做したときの時間領域の信号に対応する線形予測係数列とし、
ω[1],ω[2]…,ω[p]を、
上記線形予測係数列a[1],a[2],…,a[p]に由来するLSPパラメータ列、
上記線形予測係数列a[1],a[2],…,a[p]に由来するLSFパラメータ列、
上記線形予測係数列a[1],a[2],…,a[p]に由来し、かつ、ω[1],ω[2]…,ω[p]の全てが0からπまでの間に存在し、かつ、線形予測係数列に含まれる全ての線形予測係数が0である場合にはω[1],ω[2]…,ω[p]が0からπまでの間に均等間隔に存在する周波数領域パラメータ列、のいずれかとし、
γ1及びγ2をそれぞれ1以下の正の定数である補正係数とし、Kを予め定められたp×pの帯行列とし、
次式により定義される変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を生成するパラメータ列変換部を含む
周波数領域パラメータ列生成装置。 - pを1以上の整数とし、a[1],a[2],…,a[p+1]を所定の時間区間の音信号に対応する隣接するサンプル点間の周波数の間隔が不均等な周波数領域の係数列をサンプル点の周波数の間隔が均等であると見做したときの時間領域の信号に対応する(p+1)次の線形予測係数列とし、
ω[1],ω[2]…,ω[p+1]を、
上記線形予測係数列a[1],a[2],…,a[p+1]に由来するISPパラメータ列、
上記線形予測係数列a[1],a[2],…,a[p+1]に由来するISFパラメータ列、
上記線形予測係数列a[1],a[2],…,a[p+1]に由来し、かつ、ω[1],ω[2]…,ω[p]の全てが0からπまでの間に存在し、かつ、線形予測係数列に含まれる全ての線形予測係数が0である場合にはω[1],ω[2]…,ω[p]が0からπまでの間に均等間隔に存在する周波数領域パラメータ列、のいずれかとし、
γ1及びγ2をそれぞれ1以下の正の定数である補正係数とし、Kを予め定められたp×pの帯行列とし、
次式により定義される変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を生成するパラメータ列変換部を含む
周波数領域パラメータ列生成装置。 - 請求項1から12のいずれかに記載の周波数領域パラメータ列生成方法の各ステップをコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014171776A JP6259378B2 (ja) | 2014-08-26 | 2014-08-26 | 周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014171776A JP6259378B2 (ja) | 2014-08-26 | 2014-08-26 | 周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016045462A true JP2016045462A (ja) | 2016-04-04 |
JP6259378B2 JP6259378B2 (ja) | 2018-01-10 |
Family
ID=55636048
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014171776A Active JP6259378B2 (ja) | 2014-08-26 | 2014-08-26 | 周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6259378B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006235243A (ja) * | 2005-02-24 | 2006-09-07 | Secom Co Ltd | 音響信号分析装置及び音響信号分析プログラム |
JP2009251029A (ja) * | 2008-04-01 | 2009-10-29 | Toshiba Corp | 音声処理装置、音声処理方法及びプログラム |
WO2012046685A1 (ja) * | 2010-10-05 | 2012-04-12 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
-
2014
- 2014-08-26 JP JP2014171776A patent/JP6259378B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006235243A (ja) * | 2005-02-24 | 2006-09-07 | Secom Co Ltd | 音響信号分析装置及び音響信号分析プログラム |
JP2009251029A (ja) * | 2008-04-01 | 2009-10-29 | Toshiba Corp | 音声処理装置、音声処理方法及びプログラム |
WO2012046685A1 (ja) * | 2010-10-05 | 2012-04-12 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
Non-Patent Citations (2)
Title |
---|
KAZUHITO KOISHIDA: "A WIDEBAND CELP SPEECH CODER AT 16 KBIT/S BASED ON MEL_GENERALIZED CEPSTRAL ANALYSIS", ACOUSTICS,SPEECH AND SIGNAL PROCESSING,1998. PROCEEDINGS ON THE 1998 IEEE INTERNATIONAL CONFERENCE O, JPN7017003992, 15 March 1998 (1998-03-15), US, pages 161 - 164, ISSN: 0003695781 * |
間野一則: "音声の高能率符号化", 信号処理, vol. 2, no. 6, JPN7017003165, 4 March 2008 (2008-03-04), JP, ISSN: 0003655796 * |
Also Published As
Publication number | Publication date |
---|---|
JP6259378B2 (ja) | 2018-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10720172B2 (en) | Encoder for encoding an audio signal, audio transmission system and method for determining correction values | |
JP6484358B2 (ja) | 符号化装置、及びその方法、プログラム、記録媒体 | |
JP6422813B2 (ja) | 符号化装置、復号装置、これらの方法及びプログラム | |
JP6674992B2 (ja) | 周期性統合包絡系列生成装置、周期性統合包絡系列生成方法、周期性統合包絡系列生成プログラム、記録媒体 | |
JP6650540B2 (ja) | 周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置、及びプログラム | |
CN107408390B (zh) | 线性预测编码装置、线性预测解码装置、它们的方法以及记录介质 | |
JP2019215587A (ja) | 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム、復号プログラム、記録媒体 | |
JP6457552B2 (ja) | 符号化装置、復号装置、これらの方法及びプログラム | |
EP2571170B1 (en) | Encoding method, decoding method, encoding device, decoding device, program, and recording medium | |
JP6259378B2 (ja) | 周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置及びプログラム | |
JP6220701B2 (ja) | サンプル列生成方法、符号化方法、復号方法、これらの装置及びプログラム | |
Ramabadran et al. | An iterative interpolative transform method for modeling harmonic magnitudes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160907 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170815 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171010 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171114 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171208 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6259378 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |