JP2018067010A - 符号化方法、符号化装置、プログラム及び記録媒体 - Google Patents
符号化方法、符号化装置、プログラム及び記録媒体 Download PDFInfo
- Publication number
- JP2018067010A JP2018067010A JP2017247615A JP2017247615A JP2018067010A JP 2018067010 A JP2018067010 A JP 2018067010A JP 2017247615 A JP2017247615 A JP 2017247615A JP 2017247615 A JP2017247615 A JP 2017247615A JP 2018067010 A JP2018067010 A JP 2018067010A
- Authority
- JP
- Japan
- Prior art keywords
- lsp
- sequence
- corrected
- frequency domain
- quantized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 107
- 238000006243 chemical reaction Methods 0.000 claims abstract description 46
- 230000005236 sound signal Effects 0.000 claims abstract description 22
- 238000001228 spectrum Methods 0.000 claims description 92
- 238000004364 calculation method Methods 0.000 claims description 34
- 239000011159 matrix material Substances 0.000 claims description 34
- 230000009466 transformation Effects 0.000 claims description 34
- 238000010586 diagram Methods 0.000 description 23
- 238000000605 extraction Methods 0.000 description 14
- 238000009499 grossing Methods 0.000 description 13
- 230000015572 biosynthetic process Effects 0.000 description 12
- 238000003786 synthesis reaction Methods 0.000 description 12
- 230000004048 modification Effects 0.000 description 11
- 238000012986 modification Methods 0.000 description 11
- 108010076504 Protein Sorting Signals Proteins 0.000 description 10
- 230000000694 effects Effects 0.000 description 8
- 230000001174 ascending effect Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 5
- 238000013139 quantization Methods 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 230000035807 sensation Effects 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000001934 delay Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/12—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【解決手段】LSP線形変換部(300)は、pを1以上の整数とし、a[1],a[2],…,a[p]を所定の時間区間の音信号を線形予測分析して得られる線形予測係数列とし、ω[1],ω[2],…,ω[p]を線形予測係数列a[1],a[2],…,a[p]に由来する周波数領域パラメータ列とし、周波数領域パラメータ列ω[1],ω[2],…,ω[p]を入力として、変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]における各変換後周波数領域パラメータ~ω[i](i=1,2,…,p)を、ω[i]とω[i]に近接する1つまたは複数の周波数領域パラメータとの値の関係に基づく線形変換により求める。
【選択図】図8
Description
θ[i]=θ[f][i]
である。
0<θ[1]<θ[2]<…<θ[p]<π
を満たす。
で定義される系列WγR[1],WγR[2],…,WγR[N]は、式(6)で定義される入力音響信号のパワースペクトル包絡系列W[1],W[2],…,W[N]の振幅の凹凸を平滑化したものに相当する。すなわち、線形予測係数a[i]に補正係数γRのi乗を乗じることにより線形予測係数を補正する処理は、周波数領域においてパワースペクトル包絡の振幅の凹凸を鈍らせる処理(パワースペクトル包絡を平滑化する処理)に相当する。したがって、式(7)で定義される系列WγR[1],WγR[2],…,WγR[N]を、平滑化済パワースペクトル包絡系列と呼ぶ。
^a[1]×(γR),^a[2]×(γR)2,…,^a[p]×(γR)p
を用いる。
~a[1]×(γR),~a[2]×(γR)2,…,~a[p]×(γR)p
を用いる。
aγR[i]=a[i]×(γR)i(i=1,…,p)
であるとして、補正済量子化済線形予測係数列^a[1]×(γR),^a[2]×(γR)2,…,^a[p]×(γR)pは補正済線形予測係数列aγR[1],aγR[2],…,aγR[p]を高精度で近似する系列であることが望ましい。
第一実施形態の符号化装置は、時間領域での符号化を行うフレームでは線形予測係数から変換されたLSPパラメータを符号化してLSP符号を得て、周波数領域での符号化を行うフレームでは補正された線形予測係数から変換された補正済LSPパラメータを符号化して補正済LSP符号を得て、周波数領域での符号化を行ったフレームの次のフレームで時間領域での符号化を行うときには、補正済LSP符号に対応するLSPパラメータに対応する線形予測係数を逆補正して得られる線形予測係数をLSPに変換したものを次のフレームの時間領域での符号化で用いるLSPパラメータとするものである。
符号化装置1は、図4に示すように、従来の符号化装置9と同様に、入力部100、線形予測分析部105、LSP生成部110、LSP符号化部115、特徴量抽出部120、周波数領域符号化部150、遅延入力部165、時間領域符号化部170及び出力部175を例えば含み、さらに、線形予測係数補正部125、補正済LSP生成部130、補正済LSP符号化部135、量子化済線形予測係数生成部140、第1量子化済平滑化済パワースペクトル包絡系列計算部145、量子化済線形予測係数逆補正部155、逆補正済LSP生成部160を例えば含む。
図5を参照して、第一実施形態の符号化方法を説明する。以下では、上述の従来技術との相違点を中心に説明する。
0<θγR[1]<θγR[2]<…<θγR[p]<π
を満たす。
0<^θ’[1]<^θ’[2]<…<^θ’[p]<π
を満たす系列である。
復号装置2は、図6に示すように、入力部200、識別符号復号部205、LSP符号復号部210、補正済LSP符号復号部215、復号線形予測係数生成部220、第1復号平滑化済パワースペクトル包絡系列計算部225、周波数領域復号部230、復号線形予測係数逆補正部235、復号逆補正済LSP生成部240、遅延入力部245、時間領域復号部250及び出力部255を例えば含む。
図7を参照して、第一実施形態の復号方法を説明する。
^a[1]×(γR),^a[2]×(γR)2,…,^a[p]×(γR)p
を用いる。
~a[1]×(γR),~a[2]×(γR)2,…,~a[p]×(γR)p
を用いる。つまり、
~θ[i]=0.5×^θ[f-1][i]+0.5×^θ[i](i=1,…,p)
である。
符号化装置1の補正済LSP符号化部135では、補正済LSPパラメータ列θγR[1],θγR[2],…,θγR[p]と補正済量子化済LSPパラメータ列^θγR[1],^θγR[2],…,^θγR[p]との量子化歪を最小化するような補正済量子化済LSPパラメータ列^θγR[1],^θγR[2],…,^θγR[p]を求める。これにより、聴感覚を考慮した(すなわち、補正係数γRで平滑化した)パワースペクトル包絡系列を高精度で近似するように補正済量子化済LSPパラメータ列^θγR[1],^θγR[2],…,^θγR[p]を決定することができる。補正済量子化済LSPパラメータ列^θγR[1],^θγR[2],…,^θγR[p]を周波数領域に展開して得られるパワースペクトル包絡系列である量子化済平滑化済パワースペクトル包絡系列^WγR[1],^WγR[2],…,^WγR[N]は、平滑化済パワースペクトル包絡系列WγR[1],WγR[2],…,WγR[N]を高精度で近似することができる。LSP符号C1と補正済LSP符号Cγの符号量が同じであれば、第一実施形態の方が従来よりも周波数領域の符号化の符号化歪を小さくできる。また、従来の符号化方法と同じ符号化歪を仮定した場合は、LSP符号C1よりも補正済LSP符号Cγの方が従来よりも符号量が小さくなる。したがって、従来と同じ符号化歪であれば従来よりも符号量を小さくし、従来と同じ符号量であれば従来よりも符号化歪を小さくすることができる。
第一実施形態の符号化装置1及び復号装置2では、特に逆補正済LSP生成部160、復号逆補正済LSP生成部240の計算コストが大きい。そこで、第二実施形態の符号化装置3では、線形予測係数を経由することなく、補正済量子化済LSPパラメータ列^θγR[1],^θγR[2],…,^θγR[p]から量子化済LSPパラメータ列^θ[1],^θ[2],…,^θ[p]の各値の近似値の系列である近似量子化済LSPパラメータ列^θ[1]app,^θ[2]app,…,^θ[p]appを直接生成する。同様に、第二実施形態の復号装置4では、線形予測係数を経由することなく、復号補正済LSPパラメータ列^θγR[1],^θγR[2],…,^θγR[p]から復号LSPパラメータ列^θ[1],^θ[2],…,^θ[p]の各値の近似値の系列である復号近似LSPパラメータ列^θ[1]app,^θ[2]app,…,^θ[p]appを直接生成する。
図8に、第二実施形態の符号化装置3の機能構成を示す。
となり、すべてのi=1,…,p-1についてθ[i]とθ[i+1]の間隔が等間隔になる。また、γ=1としたとき、補正済LSPパラメータ列θγ=1[1],θγ=1[2],…,θγ=1[p]とLSPパラメータ列θ[1],θ[2],…,θ[p]は等価である。なお、補正済LSPパラメータは、
0<θγ[1]<θγ[2]…<θγ[p]<π
の性質を満たす。
ただし、Kは式(14)で定義されるp×p行列である。
が成り立つ。γ1>γ2ならば直線補間、γ1<γ2ならば直線外挿を意味する。
とすれば、~θγ2[i]=−θγ2[i]となり、式(13a)のモデルにより得られる~θγ2[i]は、二次元平面上の点(γ1,θγ1[i])と点(0,θγ=0[i])を結ぶ直線により直線近似した場合のγ2に対応するLSPパラメータの値の推定値−θγ2[i]と一致する。
が成り立つ。
図12を参照して、第二実施形態の符号化方法を説明する。以下では、上述の実施形態との相違点を中心に説明する。
により近似量子化済LSPパラメータ列^θ[1]app,^θ[2]app,…,^θ[p]appを求めて出力する。つまり、式(13b)を用いて量子化済LSPパラメータ列の近似値の系列^θ[1]app,^θ[2]app,…,^θ[p]appを求める。なお、γ1とγ2は定数であるので、式(18)の行列Kに代えて行列Kの各要素に(γ2-γ1)を乗算して得られる行列K'を用い
により近似量子化済LSPパラメータ列^θ[1]app,^θ[2]app,…,^θ[p]appを求めてもよい。
<復号装置>
図13に、第二実施形態の復号装置4の機能構成を示す。
図14を参照して、第二実施形態の復号方法を説明する。以下では、上述の実施形態との相違点を中心に説明する。
LSP線形変換部300及び復号LSP線形変換部400で用いる変換行列Kは、以下のような方法により予め求めておき、符号化装置3及び復号装置4内の記憶部(図示せず)に格納しておく。
ここで、
^Θ(m) γ1=(^θγ=1 (m)[1],…,^θγ=1 (m)[p])T
とする。
aγ (m)[i]=a(m)[i]×(γL)i
を計算する。
ここで、
^Θ(m) γ2=(^θγL (m)[1],…,^θγL (m)[p])T
とする。
として、
により、Bを得る。ここで、
である。
xx1 =1.11499, yy1 =-0.54272,
zz2 =-0.83414f,xx2 =1.59810f,yy2 =-0.70966,
zz3 =-0.49432, xx3 =1.38370, yy3 =-0.78076,
zz4 =-0.39319, xx4 =1.23032, yy4 =-0.67921,
zz5 =-0.39166, xx5 =1.18521, yy5 =-0.69088,
zz6 =-0.34784, xx6 =1.04839, yy6 =-0.60619,
zz7 =-0.41279, xx7 =1.13305, yy7 =-0.63247,
zz8 =-0.36450, xx8 =0.95694, yy8 =-0.53039,
zz9 =-0.43984, xx9 =1.01910, yy9 =-0.51707,
zz10=-0.40120, xx10=0.90395, yy10=-0.44594,
zz11=-0.49262, xx11=1.07345, yy11=-0.51892,
zz12=-0.41695, xx12=0.96596, yy12=-0.49247,
zz13=-0.45002, xx13=1.00336, yy13=-0.48790,
zz14=-0.46854, xx14=0.93258, yy14=-0.41927,
zz15=-0.45020, xx15=0.88783
xx1 =-0.557012055,yy1 =0.213853042,
zz2 =0.110112745,xx2 =-0.534830085,yy2 =0.2440903,
zz3 =0.149879603,xx3 =-0.522734808,yy3 =0.23494022,
zz4 =0.144479327,xx4 =-0.533013231,yy4 =0.259021145,
zz5 =0.136523255,xx5 =-0.502606738,yy5 =0.248139539,
zz6 =0.138005088,xx6 =-0.478327709,yy6 =0.244219107,
zz7 =0.133771751,xx7 =-0.467186849,yy7 =0.243988642,
zz8 =0.13667916, xx8 =-0.408737408,yy8 =0.192803054,
zz9 =0.160602461,xx9 =-0.427436157,yy9 =0.190554547,
zz10=0.147621742,xx10=-0.383087812,yy10=0.165954888,
zz11=0.18358465, xx11=-0.434034351,yy11=0.183004742,
zz12=0.166249458,xx12=-0.409482196,yy12=0.170107295,
zz13=0.162343147,xx13=-0.409804718,yy13=0.165221097,
zz14=0.178158258,xx14=-0.400869431,yy14=0.123020055,
zz15=0.171958144,xx15=-0.447472325
^Θ(m) γ1=(^θγL (m)[1],…,^θγL (m)[p])T
とし、(ステップ4)では^Θ(m) γ2を
^Θ(m) γ2=(^θγ=1 (m)[1],…,^θγ=1 (m)[p])T
とし、(ステップ5)では学習用データQに含まれる各LSPパラメータ列の組(^Θ(m) γ1,^Θ(m) γ2)について、γ1=1,γ2=γL,^Θγ1=^Θ(m) γ1,^Θγ2=^Θ(m) γ2として、式(13b)のモデルに代入し、自乗誤差基準で行列Kの係数を学習した場合に相当する。
第二実施形態の符号化装置3は、第一実施形態と同様に、従来の符号化装置9における量子化済線形予測係数生成部900、量子化済線形予測係数補正部905及び近似平滑化済パワースペクトル包絡系列計算部910を、線形予測係数補正部125、補正済LSP生成部130、補正済LSP符号化部135、量子化済線形予測係数生成部140及び第1量子化済平滑化済パワースペクトル包絡系列計算部145に置き換えた構成であるため、第一実施形態の符号化装置1と同様の効果を有する。すなわち、従来と同じ符号化歪であれば従来よりも符号量を小さくし、従来と同じ符号量であれば従来よりも符号化歪を小さくすることができる。
第二実施形態の符号化装置3では、フレーム毎に、時間領域での符号化を行うか周波数領域での符号化を行うかを、入力音響信号の時間変動の大きさに基づいて決定している。入力音響信号の時間変動が大きく、周波数領域での符号化が選択されたフレームでも、実際には時間領域での符号化によって再構成される音響信号のほうが周波数領域での符号化によって再構成される信号よりも入力音響信号との歪を小さくできる場合も有り得る。また、入力音響信号の時間変動が小さく、時間領域での符号化が選択されたフレームでも、実際には周波数領域での符号化によって再構成される音響信号のほうが時間領域での符号化によって再構成される音響信号よりも入力音響信号との歪を小さくできる場合も有り得る。すなわち、第二実施形態の符号化装置3では、時間領域での符号化と周波数領域での符号化のうちの、入力音響信号との歪が小さくできる符号化方法を必ず選択できているわけではない。そこで、第二実施形態の変形例の符号化装置8では、フレーム毎に、時間領域での符号化と周波数領域での符号化の両方を行って、入力音響信号との歪を小さくできるほうを選択する。
図15に、第二実施形態の変形例の符号化装置8の機能構成を示す。
図16を参照して、第二実施形態の変形例の符号化方法を説明する。以下では、第二実施形態との相違点を中心に説明する。
第二実施形態の変形例の符号化装置8が出力した符号列は、第二実施形態の符号化装置3が出力した符号列と同様に、第二実施形態の復号装置4で復号できる。
第二実施形態の変形例の符号化装置8は、第二実施形態の符号化装置3と同様の効果を奏するものであり、さらに、第二実施形態の符号化装置3よりも出力する符号量を小さくする効果を奏するものである。
第一実施形態の符号化装置1及び第二実施形態の符号化装置3では、補正済量子化済LSPパラメータ列^θγR[1],^θγR[2],…,^θγR[p]を線形予測係数に一旦変換してから、量子化済平滑化済パワースペクトル包絡系列^WγR[1],^WγR[2],…,^WγR[N]を計算していた。第三実施形態の符号化装置5では、補正済量子化済LSPパラメータ列を線形予測係数に変換することなく、補正済量子化済LSPパラメータ列^θγR[1],^θγR[2],…,^θγR[p]から量子化済平滑化済パワースペクトル包絡系列^WγR[1],^WγR[2],…,^WγR[N]を直接計算する。同様に、第三実施形態の復号装置6では、復号補正済LSPパラメータ列を線形予測係数に変換することなく、復号補正済LSPパラメータ列^θγR[1],^θγR[2],…,^θγR[p]から復号平滑化済パワースペクトル包絡系列^WγR[1],^WγR[2],…,^WγR[N]を直接計算する。
図17に、第三実施形態の符号化装置5の機能構成を示す。
図18を参照して、第三実施形態の符号化方法を説明する。以下では、上述の実施形態との相違点を中心に説明する。
図19に、第三実施形態の復号装置6の機能構成を示す。
図20を参照して、第三実施形態の復号方法を説明する。以下では、上述の実施形態との相違点を中心に説明する。
量子化済LSPパラメータ列^θ[1],^θ[2],…,^θ[p]は、
0<^θ[1]<…<^θ[p]<π
を満たす系列である。つまり、昇順に並んだ系列である。一方、LSP線形変換部300で生成される近似量子化済LSPパラメータ列^θ[1]app,^θ[2]app,…,^θ[p]appは近似的な変換により生成したものであるため、昇順にならないことがある。そこで、第四実施形態ではLSP線形変換部300から出力される近似量子化済LSPパラメータ列^θ[1]app,^θ[2]app,…,^θ[p]appを昇順に並べ替える処理を追加する。
図21に、第四実施形態の符号化装置7の機能構成を示す。
符号化装置7は、第二実施形態の符号化装置5と比較して、近似LSP系列修正部700をさらに含む点が異なる。
図22を参照して、第四実施形態の符号化方法を説明する。以下では、上述の実施形態との相違点を中心に説明する。
上述の実施形態ではLSPパラメータを前提として説明したが、LSPパラメータ列の代わりに、ISPパラメータ列を用いてもよい。ISPパラメータ列ISP[1],…,ISP[p]は、p-1次のLSPパラメータ列とp次(最高次)のPARCOR係数kpからなる系列と等価である。つまり、
ISP[i]=θ[i] for i=1,…,p-1
ISP[p]=kp
である。
^ISPγR[1]=^θγR[i]
^ISPγR[p]=^kp
である。^kpはkpの量子化値である。
(ステップ1)^Θγ1=(^ISPγR[1],…,^ISPγR[p-1])Tとし、pをp-1に置き換えて、式(18)を計算して、^θ[1]app,…,^θ[p-1]appを求める。
ここで、
^ISP[i]app=^θ[i]app(i=1,…,p-1)
とする。
(ステップ2)以下の式で定義される^ISP[p]appを求める。
^ISP[p]app=^ISPγR[p]・(1/γR)p
[第五実施形態]
符号化装置3、5、7、8が備えるLSP線形変換部300、復号装置4、6が備える復号LSP線形変換部400を、独立した周波数領域パラメータ列生成装置として構成することも可能である。
第五実施形態の周波数領域パラメータ列生成装置10は、図23に示すように、パラメータ列変換部20を例えば含み、周波数領域パラメータω[1],ω[2],…,ω[p]を入力とし、変換後周波数領域パラメータ~ω[1],~ω[2],…,~ω[p]を出力する。
とすることで、導出することができる。この場合、周波数領域パラメータω[1],ω[2],…,ω[p]は、線形予測係数a[1],a[2],…,a[p]の各係数a[i]に係数γ1のi乗を乗じることにより補正した係数列である
a[1]×(γ1),a[2]×(γ1)2,…,a[p]×(γ1)p
と等価な周波数領域のパラメータ列、もしくは、その量子化値である。また、変換後周波数領域パラメータ~ω[1],~ω[2],…,~ω[p]は、線形予測係数a[1],a[2],…,a[p]の各係数a[i]に係数γ2のi乗を乗じることにより補正した係数列である
a[1]×(γ2),a[2]×(γ2)2,…,a[p]×(γ2)p
と等価な周波数領域のパラメータ列を近似する系列となる。
第五実施形態の周波数領域パラメータ列生成装置は、符号化装置3、5、7、8や復号装置4、6と同様に、符号化装置1や復号装置2のような周波数領域パラメータから線形予測係数を介して変換後周波数領域パラメータを求める場合よりも少ない演算量で、周波数領域パラメータから変換後周波数領域パラメータを求めることができる。
上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
Claims (10)
- pを1以上の整数とし、γを1以下の正の定数である補正係数とし、a[1],a[2],…,a[p]を所定の時間区間の音信号を線形予測分析して得られる線形予測係数列とし、
上記線形予測係数列a[1],a[2],…,a[p]を上記補正係数γを用いてaγ[i]=a[i]×γiにより補正した補正済線形予測係数列aγ[1],aγ[2],…,aγ[p]を生成する線形予測係数補正ステップと、
上記補正済線形予測係数列aγ[1],aγ[2],…,aγ[p]を用いて補正済LSPパラメータ列θγ[1],θγ[2],…,θγ[p]を生成する補正済LSP生成ステップと、
上記補正済LSPパラメータ列θγ[1],θγ[2],…,θγ[p]を符号化して、補正済LSP符号及び上記補正済LSP符号に対応する補正済量子化済LSPパラメータ列^θγ[1],^θγ[2],…,^θγ[p]を生成する補正済LSP符号化ステップと、
周波数領域パラメータ列ω[1],ω[2],…,ω[p]を上記補正済量子化済LSPパラメータ列^θγ[1],^θγ[2],…,^θγ[p]とし、上記周波数領域パラメータ列ω[1],ω[2],…,ω[p]を入力として変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を求めるパラメータ列変換ステップを実行することにより、上記変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を近似量子化済LSPパラメータ列^θapp[1],^θapp[2],…,^θapp[p]として生成するLSP線形変換ステップと、
上記補正済量子化済LSPパラメータ列^θγ[1],^θγ[2],…,^θγ[p]を線形予測係数に変換した補正済量子化済線形予測係数列^aγ[1],^aγ[2],…,^aγ[p]を生成する量子化済線形予測係数列生成ステップと、
上記補正済量子化済線形予測係数列^aγ[1],^aγ[2],…,^aγ[p]に対応する周波数領域の系列である量子化済平滑化済パワースペクトル包絡系列^Wγ[1],^Wγ[2],…,^Wγ[N]を計算する量子化済平滑化済パワースペクトル包絡系列計算ステップと、
上記音信号に対応する周波数領域サンプル列X[1],X[2],…,X[N]を、上記量子化済平滑化済パワースペクトル包絡系列^Wγ[1],^Wγ[2],…,^Wγ[N]を用いて符号化した周波数領域信号符号を生成する周波数領域符号化ステップと、
上記線形予測係数列a[1],a[2],…,a[p]を用いてLSPパラメータ列θ[1],θ[2],…,θ[p]を生成するLSP生成ステップと、
上記LSPパラメータ列θ[1],θ[2],…,θ[p]を符号化して、LSP符号及び上記LSP符号に対応する量子化済LSPパラメータ列^θ[1],^θ[2],…,^θ[p]を生成するLSP符号化ステップと、
上記音信号を、前の時間区間の上記LSP符号化ステップで得た量子化済LSPパラメータ列と、前の時間区間のLSP線形変換ステップで得た近似量子化済LSPパラメータ列のいずれかと、上記所定の時間区間の量子化済LSPパラメータ列とを用いて、符号化して時間領域信号符号を生成する時間領域符号化ステップと、
を含み、
上記パラメータ列変換ステップは、
上記変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]における各変換後周波数領域パラメータ~ω[i](i=1,2,…,p)を、
ω[i]とω[i]に近接する1つまたは複数の周波数領域パラメータとの値の関係に基づく線形変換により求める、
符号化方法。 - pを1以上の整数とし、γを1以下の正の定数である補正係数とし、a[1],a[2],…,a[p]を所定の時間区間の音信号を線形予測分析して得られる線形予測係数列とし、
上記線形予測係数列a[1],a[2],…,a[p]を上記補正係数γを用いてaγ[i]=a[i]×γiにより補正した補正済線形予測係数列aγ[1],aγ[2],…,aγ[p]を生成する線形予測係数補正ステップと、
上記補正済線形予測係数列aγ[1],aγ[2],…,aγ[p]を用いて補正済LSPパラメータ列θγ[1],θγ[2],…,θγ[p]を生成する補正済LSP生成ステップと、
上記補正済LSPパラメータ列θγ[1],θγ[2],…,θγ[p]を符号化して、補正済LSP符号及び上記補正済LSP符号に対応する補正済量子化済LSPパラメータ列^θγ[1],^θγ[2],…,^θγ[p]を生成する補正済LSP符号化ステップと、
周波数領域パラメータ列ω[1],ω[2],…,ω[p]を上記補正済量子化済LSPパラメータ列^θγ[1],^θγ[2],…,^θγ[p]とし、上記周波数領域パラメータ列ω[1],ω[2],…,ω[p]を入力として変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を求めるパラメータ列変換ステップを実行することにより、上記変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を近似量子化済LSPパラメータ列^θapp[1],^θapp[2],…,^θapp[p]として生成するLSP線形変換ステップと、
上記補正済量子化済LSPパラメータ列^θγ[1],^θγ[2],…,^θγ[p]に基づいて量子化済平滑化済パワースペクトル包絡系列^Wγ[1],^Wγ[2],…,^Wγ[N]を計算する量子化済平滑化済パワースペクトル包絡系列計算ステップと、
上記音信号に対応する周波数領域サンプル列X[1],X[2],…,X[N]を、上記量子化済平滑化済パワースペクトル包絡系列^Wγ[1],^Wγ[2],…,^Wγ[N]を用いて符号化した周波数領域信号符号を生成する周波数領域符号化ステップと、
上記線形予測係数列a[1],a[2],…,a[p]を用いてLSPパラメータ列θ[1],θ[2],…,θ[p]を生成するLSP生成ステップと、
上記LSPパラメータ列θ[1],θ[2],…,θ[p]を符号化して、LSP符号及び上記LSP符号に対応する量子化済LSPパラメータ列^θ[1],^θ[2],…,^θ[p]を生成するLSP符号化ステップと、
上記音信号を、前の時間区間の上記LSP符号化ステップで得た量子化済LSPパラメータ列と、前の時間区間のLSP線形変換ステップで得た近似量子化済LSPパラメータ列のいずれかと、上記所定の時間区間の量子化済LSPパラメータ列とを用いて、符号化して時間領域信号符号を生成する時間領域符号化ステップと、
を含み、
上記パラメータ列変換ステップは、
上記変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]における各変換後周波数領域パラメータ~ω[i](i=1,2,…,p)を、
ω[i]とω[i]に近接する1つまたは複数の周波数領域パラメータとの値の関係に基づく線形変換により求める、
符号化方法。 - 請求項1または2に記載の符号化方法であって、
上記周波数領域符号化ステップで生成した周波数領域信号符号と、上記時間領域符号化ステップで生成した時間領域信号符号と、のいずれかを出力する出力ステップ
を更に有し、
上記時間領域符号化ステップは、
前の時間区間の出力ステップにおいて周波数領域信号符号が出力された場合には、前の時間区間のLSP線形変換ステップで得た近似量子化済LSPパラメータ列を用いた符号化を行い、
前の時間区間の出力ステップにおいて時間領域信号符号が出力された場合には、前の時間区間のLSP生成ステップで得た量子化済LSPパラメータ列を用いた符号化を行う
符号化方法。 - 請求項4に記載の符号化方法であって、
上記帯行列Kは、対角要素が正の値であり、行方向において対角要素に隣接する要素が負の値である
符号化方法。 - 請求項4に記載の符号化方法であって、
上記帯行列Kは、対角要素が負の値であり、行方向において対角要素に隣接する要素が正の値である
符号化方法。 - pを1以上の整数とし、γを1以下の正の定数である補正係数とし、a[1],a[2],…,a[p]を所定の時間区間の音信号を線形予測分析して得られる線形予測係数列とし、
上記線形予測係数列a[1],a[2],…,a[p]を上記補正係数γを用いてaγ[i]=a[i]×γiにより補正した補正済線形予測係数列aγ[1],aγ[2],…,aγ[p]を生成する線形予測係数補正部と、
上記補正済線形予測係数列aγ[1],aγ[2],…,aγ[p]を用いて補正済LSPパラメータ列θγ[1],θγ[2],…,θγ[p]を生成する補正済LSP生成部と、
上記補正済LSPパラメータ列θγ[1],θγ[2],…,θγ[p]を符号化して、補正済LSP符号及び上記補正済LSP符号に対応する補正済量子化済LSPパラメータ列^θγ[1],^θγ[2],…,^θγ[p]を生成する補正済LSP符号化部と、
周波数領域パラメータ列ω[1],ω[2],…,ω[p]を上記補正済量子化済LSPパラメータ列^θγ[1],^θγ[2],…,^θγ[p]とし、上記周波数領域パラメータ列ω[1],ω[2],…,ω[p]を入力として変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を求めるパラメータ列変換部を実行することにより、上記変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を近似量子化済LSPパラメータ列^θapp[1],^θapp[2],…,^θapp[p]として生成するLSP線形変換部と、
上記補正済量子化済LSPパラメータ列^θγ[1],^θγ[2],…,^θγ[p]を線形予測係数に変換した補正済量子化済線形予測係数列^aγ[1],^aγ[2],…,^aγ[p]を生成する量子化済線形予測係数列生成部と、
上記補正済量子化済線形予測係数列^aγ[1],^aγ[2],…,^aγ[p]に対応する周波数領域の系列である量子化済平滑化済パワースペクトル包絡系列^Wγ[1],^Wγ[2],…,^Wγ[N]を計算する量子化済平滑化済パワースペクトル包絡系列計算部と、
上記音信号に対応する周波数領域サンプル列X[1],X[2],…,X[N]を、上記量子化済平滑化済パワースペクトル包絡系列^Wγ[1],^Wγ[2],…,^Wγ[N]を用いて符号化した周波数領域信号符号を生成する周波数領域符号化部と、
上記線形予測係数列a[1],a[2],…,a[p]を用いてLSPパラメータ列θ[1],θ[2],…,θ[p]を生成するLSP生成部と、
上記LSPパラメータ列θ[1],θ[2],…,θ[p]を符号化して、LSP符号及び上記LSP符号に対応する量子化済LSPパラメータ列^θ[1],^θ[2],…,^θ[p]を生成するLSP符号化部と、
上記音信号を、前の時間区間の上記LSP符号化部で得た量子化済LSPパラメータ列と、前の時間区間のLSP線形変換部で得た近似量子化済LSPパラメータ列のいずれかと、上記所定の時間区間の量子化済LSPパラメータ列とを用いて、符号化して時間領域信号符号を生成する時間領域符号化部と、
を含み、
上記パラメータ列変換部は、
上記変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]における各変換後周波数領域パラメータ~ω[i](i=1,2,…,p)を、
ω[i]とω[i]に近接する1つまたは複数の周波数領域パラメータとの値の関係に基づく線形変換により求める、
符号化装置。 - pを1以上の整数とし、γを1以下の正の定数である補正係数とし、a[1],a[2],…,a[p]を所定の時間区間の音信号を線形予測分析して得られる線形予測係数列とし、
上記線形予測係数列a[1],a[2],…,a[p]を上記補正係数γを用いてaγ[i]=a[i]×γiにより補正した補正済線形予測係数列aγ[1],aγ[2],…,aγ[p]を生成する線形予測係数補正部と、
上記補正済線形予測係数列aγ[1],aγ[2],…,aγ[p]を用いて補正済LSPパラメータ列θγ[1],θγ[2],…,θγ[p]を生成する補正済LSP生成部と、
上記補正済LSPパラメータ列θγ[1],θγ[2],…,θγ[p]を符号化して、補正済LSP符号及び上記補正済LSP符号に対応する補正済LSPパラメータ列の各値を量子化した補正済量子化済LSPパラメータ列^θγ[1],^θγ[2],…,^θγ[p]を生成する補正済LSP符号化部と、
周波数領域パラメータ列ω[1],ω[2],…,ω[p]を上記補正済量子化済LSPパラメータ列^θγ[1],^θγ[2],…,^θγ[p]とし、上記周波数領域パラメータ列ω[1],ω[2],…,ω[p]を入力として変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を求めるパラメータ列変換部を実行することにより、上記変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を近似量子化済LSPパラメータ列^θapp[1],^θapp[2],…,^θapp[p]として生成するLSP線形変換部と、
上記補正済量子化済LSPパラメータ列^θγ[1],^θγ[2],…,^θγ[p]に基づいて量子化済平滑化済パワースペクトル包絡系列^Wγ[1],^Wγ[2],…,^Wγ[N]を計算する量子化済平滑化済パワースペクトル包絡系列計算部と、
上記音信号に対応する周波数領域サンプル列X[1],X[2],…,X[N]を、上記量子化済平滑化済パワースペクトル包絡系列^Wγ[1],^Wγ[2],…,^Wγ[N]を用いて符号化した周波数領域信号符号を生成する周波数領域符号化部と、
上記線形予測係数列a[1],a[2],…,a[p]を用いてLSPパラメータ列θ[1],θ[2],…,θ[p]を生成するLSP生成部と、
上記LSPパラメータ列θ[1],θ[2],…,θ[p]を符号化して、LSP符号及び上記LSP符号に対応する量子化済LSPパラメータ列^θ[1],^θ[2],…,^θ[p]を生成するLSP符号化部と、
上記音信号を、前の時間区間の上記LSP符号化部で得た量子化済LSPパラメータ列と、前の時間区間のLSP線形変換部で得た近似量子化済LSPパラメータ列のいずれかと、上記所定の時間区間の量子化済LSPパラメータ列とを用いて、符号化して時間領域信号符号を生成する時間領域符号化部と、
を含み、
上記パラメータ列変換部は、
上記変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]における各変換後周波数領域パラメータ~ω[i](i=1,2,…,p)を、
ω[i]とω[i]に近接する1つまたは複数の周波数領域パラメータとの値の関係に基づく線形変換により求める、
符号化装置。 - 請求項1から6のいずれかに記載の符号化方法の各ステップをコンピュータに実行させるためのプログラム。
- 請求項1から6のいずれかに記載の符号化方法の各ステップをコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014089895 | 2014-04-24 | ||
JP2014089895 | 2014-04-24 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016514752A Division JP6270992B2 (ja) | 2014-04-24 | 2015-02-16 | 周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置、プログラム及び記録媒体 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019027368A Division JP6650540B2 (ja) | 2014-04-24 | 2019-02-19 | 周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018067010A true JP2018067010A (ja) | 2018-04-26 |
JP6486450B2 JP6486450B2 (ja) | 2019-03-20 |
Family
ID=54332153
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016514752A Active JP6270992B2 (ja) | 2014-04-24 | 2015-02-16 | 周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置、プログラム及び記録媒体 |
JP2017247615A Active JP6486450B2 (ja) | 2014-04-24 | 2017-12-25 | 符号化方法、符号化装置、プログラム及び記録媒体 |
JP2017247616A Active JP6484325B2 (ja) | 2014-04-24 | 2017-12-25 | 復号方法、復号装置、プログラム及び記録媒体 |
JP2019027368A Active JP6650540B2 (ja) | 2014-04-24 | 2019-02-19 | 周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置、及びプログラム |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016514752A Active JP6270992B2 (ja) | 2014-04-24 | 2015-02-16 | 周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置、プログラム及び記録媒体 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017247616A Active JP6484325B2 (ja) | 2014-04-24 | 2017-12-25 | 復号方法、復号装置、プログラム及び記録媒体 |
JP2019027368A Active JP6650540B2 (ja) | 2014-04-24 | 2019-02-19 | 周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置、及びプログラム |
Country Status (9)
Country | Link |
---|---|
US (3) | US10332533B2 (ja) |
EP (3) | EP3136387B1 (ja) |
JP (4) | JP6270992B2 (ja) |
KR (3) | KR101972007B1 (ja) |
CN (3) | CN106233383B (ja) |
ES (3) | ES2795198T3 (ja) |
PL (3) | PL3136387T3 (ja) |
TR (1) | TR201900472T4 (ja) |
WO (1) | WO2015162979A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101972007B1 (ko) * | 2014-04-24 | 2019-04-24 | 니폰 덴신 덴와 가부시끼가이샤 | 주파수 영역 파라미터열 생성 방법, 부호화 방법, 복호 방법, 주파수 영역 파라미터열 생성 장치, 부호화 장치, 복호 장치, 프로그램 및 기록 매체 |
JP6517924B2 (ja) * | 2015-04-13 | 2019-05-22 | 日本電信電話株式会社 | 線形予測符号化装置、方法、プログラム及び記録媒体 |
JP7395901B2 (ja) * | 2019-09-19 | 2023-12-12 | ヤマハ株式会社 | コンテンツ制御装置、コンテンツ制御方法およびプログラム |
CN116151130B (zh) * | 2023-04-19 | 2023-08-15 | 国网浙江新兴科技有限公司 | 风电场最大频率阻尼系数计算方法、装置、设备及介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58181096A (ja) * | 1982-04-19 | 1983-10-22 | 株式会社日立製作所 | 音声分析合成方式 |
JPH045700A (ja) * | 1990-04-23 | 1992-01-09 | Mitsubishi Electric Corp | 音声復号化装置及び音声符号化・復号化装置 |
JPH08305397A (ja) * | 1995-05-12 | 1996-11-22 | Mitsubishi Electric Corp | 音声加工フィルタ及び音声合成装置 |
JPH09230896A (ja) * | 1996-02-28 | 1997-09-05 | Sony Corp | 音声合成装置 |
JP2000242298A (ja) * | 1999-02-24 | 2000-09-08 | Mitsubishi Electric Corp | Lsp補正装置,音声符号化装置及び音声復号化装置 |
JP2000250597A (ja) * | 1999-02-24 | 2000-09-14 | Mitsubishi Electric Corp | Lsp補正装置,音声符号化装置及び音声復号化装置 |
JP2004086102A (ja) * | 2002-08-29 | 2004-03-18 | Fujitsu Ltd | 音声処理装置及び移動通信端末装置 |
Family Cites Families (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5003604A (en) * | 1988-03-14 | 1991-03-26 | Fujitsu Limited | Voice coding apparatus |
US5504833A (en) * | 1991-08-22 | 1996-04-02 | George; E. Bryan | Speech approximation using successive sinusoidal overlap-add models and pitch-scale modifications |
US5327518A (en) * | 1991-08-22 | 1994-07-05 | Georgia Tech Research Corporation | Audio analysis/synthesis system |
JP2778567B2 (ja) * | 1995-12-23 | 1998-07-23 | 日本電気株式会社 | 信号符号化装置及び方法 |
FI964975A (fi) * | 1996-12-12 | 1998-06-13 | Nokia Mobile Phones Ltd | Menetelmä ja laite puheen koodaamiseksi |
US7272556B1 (en) * | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
ATE553472T1 (de) * | 2000-04-24 | 2012-04-15 | Qualcomm Inc | Prädikitve dequantisierung von stimmhaften sprachsignalen |
EP1339040B1 (en) * | 2000-11-30 | 2009-01-07 | Panasonic Corporation | Vector quantizing device for lpc parameters |
US7003454B2 (en) * | 2001-05-16 | 2006-02-21 | Nokia Corporation | Method and system for line spectral frequency vector quantization in speech codec |
JP3859462B2 (ja) * | 2001-05-18 | 2006-12-20 | 株式会社東芝 | 予測パラメータ分析装置および予測パラメータ分析方法 |
BRPI0510303A (pt) * | 2004-04-27 | 2007-10-02 | Matsushita Electric Ind Co Ltd | dispositivo de codificação escalável, dispositivo de decodificação escalável, e seu método |
CN101656077B (zh) * | 2004-05-14 | 2012-08-29 | 松下电器产业株式会社 | 音频编码装置、音频编码方法以及通信终端和基站装置 |
ATE416455T1 (de) * | 2004-06-21 | 2008-12-15 | Koninkl Philips Electronics Nv | Verfahren und vorrichtung zum kodieren und dekodieren von mehrkanaltonsignalen |
US8239190B2 (en) * | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
KR101565919B1 (ko) * | 2006-11-17 | 2015-11-05 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 방법 및 장치 |
US8688437B2 (en) * | 2006-12-26 | 2014-04-01 | Huawei Technologies Co., Ltd. | Packet loss concealment for speech coding |
JP5006774B2 (ja) * | 2007-12-04 | 2012-08-22 | 日本電信電話株式会社 | 符号化方法、復号化方法、これらの方法を用いた装置、プログラム、記録媒体 |
EP2077550B8 (en) * | 2008-01-04 | 2012-03-14 | Dolby International AB | Audio encoder and decoder |
WO2009093714A1 (ja) * | 2008-01-24 | 2009-07-30 | Nippon Telegraph And Telephone Corporation | 符号化方法、復号化方法、それらの装置、及びそれらのプログラムと記録媒体 |
CN102449689B (zh) * | 2009-06-03 | 2014-08-06 | 日本电信电话株式会社 | 编码方法、编码装置、编码程序、以及它们的记录介质 |
JP5223786B2 (ja) * | 2009-06-10 | 2013-06-26 | 富士通株式会社 | 音声帯域拡張装置、音声帯域拡張方法及び音声帯域拡張用コンピュータプログラムならびに電話機 |
CN104021793B (zh) * | 2010-03-23 | 2017-05-17 | Lg电子株式会社 | 处理音频信号的方法和装置 |
ES2935911T3 (es) * | 2010-04-09 | 2023-03-13 | Dolby Int Ab | Descodificación estéreo de predicción compleja basada en MDCT |
EP2596494B1 (en) * | 2010-07-20 | 2020-08-05 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Audio decoder, audio decoding method and computer program |
KR101747917B1 (ko) * | 2010-10-18 | 2017-06-15 | 삼성전자주식회사 | 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법 |
JP5694751B2 (ja) * | 2010-12-13 | 2015-04-01 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
CN103329199B (zh) * | 2011-01-25 | 2015-04-08 | 日本电信电话株式会社 | 编码方法、编码装置、周期性特征量决定方法、周期性特征量决定装置、程序、记录介质 |
JP5613781B2 (ja) * | 2011-02-16 | 2014-10-29 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体 |
EP2696343B1 (en) * | 2011-04-05 | 2016-12-21 | Nippon Telegraph And Telephone Corporation | Encoding an acoustic signal |
AU2012246799B2 (en) * | 2011-04-21 | 2016-03-03 | Samsung Electronics Co., Ltd. | Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium |
US9916538B2 (en) * | 2012-09-15 | 2018-03-13 | Z Advanced Computing, Inc. | Method and system for feature detection |
WO2014054556A1 (ja) * | 2012-10-01 | 2014-04-10 | 日本電信電話株式会社 | 符号化方法、符号化装置、プログラム、および記録媒体 |
WO2014144579A1 (en) * | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
KR101972007B1 (ko) * | 2014-04-24 | 2019-04-24 | 니폰 덴신 덴와 가부시끼가이샤 | 주파수 영역 파라미터열 생성 방법, 부호화 방법, 복호 방법, 주파수 영역 파라미터열 생성 장치, 부호화 장치, 복호 장치, 프로그램 및 기록 매체 |
US20170154188A1 (en) * | 2015-03-31 | 2017-06-01 | Philipp MEIER | Context-sensitive copy and paste block |
US20160292445A1 (en) * | 2015-03-31 | 2016-10-06 | Secude Ag | Context-based data classification |
US10542961B2 (en) * | 2015-06-15 | 2020-01-28 | The Research Foundation For The State University Of New York | System and method for infrasonic cardiac monitoring |
US10839302B2 (en) * | 2015-11-24 | 2020-11-17 | The Research Foundation For The State University Of New York | Approximate value iteration with complex returns by bounding |
US11205103B2 (en) * | 2016-12-09 | 2021-12-21 | The Research Foundation for the State University | Semisupervised autoencoder for sentiment analysis |
US11568236B2 (en) * | 2018-01-25 | 2023-01-31 | The Research Foundation For The State University Of New York | Framework and methods of diverse exploration for fast and safe policy improvement |
-
2015
- 2015-02-16 KR KR1020187017973A patent/KR101972007B1/ko active IP Right Grant
- 2015-02-16 ES ES18200102T patent/ES2795198T3/es active Active
- 2015-02-16 EP EP15783646.1A patent/EP3136387B1/en active Active
- 2015-02-16 PL PL15783646T patent/PL3136387T3/pl unknown
- 2015-02-16 PL PL19216781T patent/PL3648103T3/pl unknown
- 2015-02-16 ES ES15783646T patent/ES2713410T3/es active Active
- 2015-02-16 JP JP2016514752A patent/JP6270992B2/ja active Active
- 2015-02-16 KR KR1020167029133A patent/KR101872905B1/ko active IP Right Grant
- 2015-02-16 CN CN201580020682.5A patent/CN106233383B/zh active Active
- 2015-02-16 CN CN201910757348.8A patent/CN110503964B/zh active Active
- 2015-02-16 PL PL18200102T patent/PL3447766T3/pl unknown
- 2015-02-16 KR KR1020187017982A patent/KR101972087B1/ko active IP Right Grant
- 2015-02-16 EP EP18200102.4A patent/EP3447766B1/en active Active
- 2015-02-16 US US15/302,094 patent/US10332533B2/en active Active
- 2015-02-16 EP EP19216781.5A patent/EP3648103B1/en active Active
- 2015-02-16 TR TR2019/00472T patent/TR201900472T4/tr unknown
- 2015-02-16 WO PCT/JP2015/054135 patent/WO2015162979A1/ja active Application Filing
- 2015-02-16 ES ES19216781T patent/ES2901749T3/es active Active
- 2015-02-16 CN CN201910757241.3A patent/CN110503963B/zh active Active
-
2017
- 2017-12-25 JP JP2017247615A patent/JP6486450B2/ja active Active
- 2017-12-25 JP JP2017247616A patent/JP6484325B2/ja active Active
-
2019
- 2019-02-19 JP JP2019027368A patent/JP6650540B2/ja active Active
- 2019-04-30 US US16/398,429 patent/US10504533B2/en active Active
- 2019-10-15 US US16/601,740 patent/US10643631B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58181096A (ja) * | 1982-04-19 | 1983-10-22 | 株式会社日立製作所 | 音声分析合成方式 |
JPH045700A (ja) * | 1990-04-23 | 1992-01-09 | Mitsubishi Electric Corp | 音声復号化装置及び音声符号化・復号化装置 |
JPH08305397A (ja) * | 1995-05-12 | 1996-11-22 | Mitsubishi Electric Corp | 音声加工フィルタ及び音声合成装置 |
JPH09230896A (ja) * | 1996-02-28 | 1997-09-05 | Sony Corp | 音声合成装置 |
JP2000242298A (ja) * | 1999-02-24 | 2000-09-08 | Mitsubishi Electric Corp | Lsp補正装置,音声符号化装置及び音声復号化装置 |
JP2000250597A (ja) * | 1999-02-24 | 2000-09-14 | Mitsubishi Electric Corp | Lsp補正装置,音声符号化装置及び音声復号化装置 |
JP2004086102A (ja) * | 2002-08-29 | 2004-03-18 | Fujitsu Ltd | 音声処理装置及び移動通信端末装置 |
Non-Patent Citations (1)
Title |
---|
NEUENDORF ET AL.: "MPEG Unified Speech and Audio Coding - The ISO/MPEG Standard for High-Efficiency Audio Coding of all", AUDIO ENGINEERING SOCIETY, vol. 132nd Convention, JPN6015015557, 26 April 2012 (2012-04-26), HU * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6650540B2 (ja) | 周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置、及びプログラム | |
CN1947173B (zh) | 分层编码装置及分层编码方法 | |
JP2019079069A (ja) | 線形予測復号装置、方法、プログラム及び記録媒体 | |
JP6457552B2 (ja) | 符号化装置、復号装置、これらの方法及びプログラム | |
JP2017515154A (ja) | 音声符号化方法および関連装置 | |
JPWO2008072732A1 (ja) | 音声符号化装置および音声符号化方法 | |
KR102569784B1 (ko) | 오디오 코덱의 장기 예측을 위한 시스템 및 방법 | |
JP5320508B2 (ja) | 符号化装置、復号装置、これらの方法、プログラム及び記録媒体 | |
JP3578933B2 (ja) | 重み符号帳の作成方法及び符号帳設計時における学習時のma予測係数の初期値の設定方法並びに音響信号の符号化方法及びその復号方法並びに符号化プログラムが記憶されたコンピュータに読み取り可能な記憶媒体及び復号プログラムが記憶されたコンピュータに読み取り可能な記憶媒体 | |
JP3024467B2 (ja) | 音声符号化装置 | |
JP3192051B2 (ja) | 音声符号化装置 | |
JP3576805B2 (ja) | 音声符号化方法及びシステム並びに音声復号化方法及びシステム | |
JP2006262292A (ja) | 符号化装置、復号装置、符号化方法及び復号方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190219 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6486450 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |