JPWO2015166694A1 - 周期性統合包絡系列生成装置、周期性統合包絡系列生成方法、周期性統合包絡系列生成プログラム、記録媒体 - Google Patents
周期性統合包絡系列生成装置、周期性統合包絡系列生成方法、周期性統合包絡系列生成プログラム、記録媒体 Download PDFInfo
- Publication number
- JPWO2015166694A1 JPWO2015166694A1 JP2016515879A JP2016515879A JPWO2015166694A1 JP WO2015166694 A1 JPWO2015166694 A1 JP WO2015166694A1 JP 2016515879 A JP2016515879 A JP 2016515879A JP 2016515879 A JP2016515879 A JP 2016515879A JP WO2015166694 A1 JPWO2015166694 A1 JP WO2015166694A1
- Authority
- JP
- Japan
- Prior art keywords
- periodic integrated
- sequence
- integrated envelope
- envelope sequence
- periodic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000000737 periodic effect Effects 0.000 title claims abstract description 249
- 238000000034 method Methods 0.000 title claims description 56
- 238000001228 spectrum Methods 0.000 claims abstract description 110
- 238000004364 calculation method Methods 0.000 claims abstract description 71
- 230000003595 spectral effect Effects 0.000 claims description 32
- 230000001131 transforming effect Effects 0.000 claims description 2
- 241000209094 Oryza Species 0.000 description 34
- 235000007164 Oryza sativa Nutrition 0.000 description 34
- 235000009566 rice Nutrition 0.000 description 34
- 238000010606 normalization Methods 0.000 description 33
- 238000004458 analytical method Methods 0.000 description 31
- 238000010586 diagram Methods 0.000 description 18
- 230000004048 modification Effects 0.000 description 17
- 238000012986 modification Methods 0.000 description 17
- 230000000694 effects Effects 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 9
- 230000005236 sound signal Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 238000009499 grossing Methods 0.000 description 5
- 108010014173 Factor X Proteins 0.000 description 4
- 230000010354 integration Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Error Detection And Correction (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Peptides Or Proteins (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
Description
(step1)所定の時間区間であるフレーム単位で、入力された時間領域の音響ディジタル信号(以下、入力音響信号)に対する線形予測分析を行って線形予測係数α1,…,αPを求める。ただし、Pは予測次数を示す正整数である。例えば、全極型モデルであるP次自己回帰過程により、時刻tでの入力音響信号x(t)は、P時点まで遡った過去の自分自身の値x(t-1),…,x(t-P)と予測残差e(t)と線形予測係数α1,…,αpによって式(1)で表される。
x(t)=α1x(t-1)+…+αp x(t-P)+e(t) (1)
スペクトル包絡系列計算部120は、入力音響信号x(t)の時間領域の線形予測に基づき、入力音響信号の振幅スペクトル包絡系列W[1],…,W[N]を計算する(S120)。ただし、Nは正整数である。スペクトル包絡系列計算部120は、従来技術と同じであり、以下の手順で計算すればよい。
周波数領域変換部110は、所定の時間区間であるフレーム単位で、入力された時間領域の入力音響信号を周波数領域のN点の係数列X[1],…,X[N]に変換して出力する(S110)。周波数領域への変換は、MDCT(変形離散コサイン変換)やDFT(離散フーリエ変換)などの方法で行えばよい。
周期性分析部130は、係数列X[1],…,X[N]を入力とし、当該係数列X[1],…,X[N]の周期Tを求め、周期Tを出力する(S130)。
周期性包絡系列生成部140は、間隔Tを入力とし、周期性包絡系列P[1],…,P[N]を出力する(S140)。周期性包絡系列P[1],…,P[N]は、ピッチ周期に起因する周期でピークを持つ周波数領域の離散系列、すなわち調波モデルに対応する離散系列である。図3に周期性包絡系列P[1],…,P[N]の例を示す。周期性包絡系列P[1],…,P[N]は、図3に示された波形のように、間隔Tの整数倍の近傍の整数値であるインデックスと、その前後所定数のインデックスに対応する周期性包絡の値のみ正の値を持ち、それ以外は0であるような系列である。間隔Tの整数倍の近傍の整数値であるインデックスが周期的に最大値(ピーク)をとり、その前後所定数のインデックスに対応するP[n]の値は、そのインデックスnがピークに対応するインデックスから離れるにつれて単調減少する関係にある。図3の横軸の1,2,…,は離散化サンプル点のインデックス(以下、「周波数インデックス」)を表す。
周期性統合包絡生成部150は、少なくとも、周期性包絡系列P[1],…,P[N]、振幅スペクトル包絡系列W[1],…,W[N]を入力とし、周期性統合包絡系列WM[1],…,WM[N]を求める(S150)。具体的には、周期性統合包絡WM[n]を次式のように求める。
図4に同じ音響信号に対して生成された系列の違いを説明するための例を示す。図4(A)に係数列X[1],…,X[N]を補間した曲線の形状を、図4(B)に周期性包絡系列P[1],…,P[N]を補間した曲線の形状を、図4(C)に平滑化振幅スペクトル包絡系列~W[1],…,~W[N]を補間した曲線の形状を、図4(D)に周期性統合包絡系列WM[1],…,WM[N]を補間した曲線の形状を示す。図4に示すとおり、周期性統合包絡系列WM[1],…,WM[N]は、平滑化振幅スペクトル包絡系列~W[1],…,~W[N]に比べて、係数列X[1],…,X[N]に現れる周期的なピークを含んだ形状となっている。また、周期性統合包絡系列WM[1],…,WM[N]は、スペクトル包絡を表す情報である線形予測係数または量子化済線形予測係数の他に、間隔T、または、間隔Tと値δの情報があれば生成できる。したがって、入力音響信号のスペクトル包絡を表す情報に少ない情報量を追加するだけで、入力音響信号のピッチ周期に起因する振幅のピークを、線形予測係数により求まるスペクトル包絡より高精度に表現することができる。すなわち、線形予測係数または量子化済線形予測係数と、間隔T、または、間隔Tと値δと、の少ない情報量で入力音響信号の振幅を高精度に推定することができることになる。なお、平滑化振幅スペクトル包絡~W[n]は次式で表現される包絡であり、γは振幅スペクトル係数を鈍らせる(平滑化する)ための1以下の正の定数である。
実施例1の周期性統合包絡系列生成装置100では、周期性統合包絡生成部150が係数列X[1],…,X[N]の周期性成分に基づいて、振幅スペクトル包絡系列W[1],…,W[N]を変形し、周期性統合包絡系列WM[1],…,WM[N]としている点が最も重要なポイントである。特に、係数列X[1],…,X[N]の周期性の程度が大きいほど、すなわち、周期性を有する成分の大きさが大きいほど、振幅スペクトル包絡系列W[1],…,W[N]のうち間隔T(周期)の整数倍およびそれらの近傍のサンプルの値を大きく変更すれば、上記の効果を得やすい。「近傍のサンプル」とは、間隔Tの整数倍の近傍の整数値であるインデックスで示されるサンプルである。また、「近傍」とは、例えば、式(3)〜(5)などのあらかじめ定めた方法で決まる範囲とすればよい。
変形例1の周期性統合包絡系列生成装置も図1に示す。また、変形例1の周期性統合包絡系列生成装置の処理フローも図2に示す。周期性統合包絡系列生成装置101は、周波数領域系列正規化部111も備える点と、スペクトル包絡系列計算部121、周期性分析部131が周期性統合包絡系列生成装置100と異なり、その他の構成は同じである。以下では相違点についてのみ説明する。
スペクトル包絡系列計算部121は、振幅スペクトル包絡系列W[1],…,W[N]だけではなく、平滑化振幅スペクトル包絡系列~W[1],…,~W[N]も求める。
周波数領域系列正規化部111は、係数列X[1],…,X[N]の各係数を平滑化振幅スペクトル包絡系列~W[1],…,~W[N]の各係数で除算して正規化係数列XN[1],…,XN[N]を得る。すなわち、n=1,…,Nに対して
XN[n]=X[n]/~W[n] (11)
の計算を行い、正規化係数列XN[1],…,XN[N]を求める(S111)。
周期性分析部131は、正規化係数列XN[1],…,XN[N]を入力とし、当該正規化係数列XN[1],…,XN[N]の周期Tを求め、周期Tを出力する(S131)。すなわち、本変形例では、入力音響信号に由来する周波数領域の係数列である正規化係数列XN[1],…,XN[N]の周期性を有する成分の間隔を周期Tとして求める。また、周期性分析部131は、必要に応じて、係数列X[1],…,X[N]を入力とし、周期性の程度を示す指標Sも求めて出力してもよい。
本発明の周期性統合包絡系列生成装置を符号化装置や復号装置が内部に備えている場合には、符号化装置や復号装置に含まれる周期性統合包絡系列生成装置以外の処理部で、係数列X[1],…,X[N]、正規化係数列XN[1],…,XN[N]、量子化済線形予測係数^αp、量子化済平滑化線形予測係数^αpγp、振幅スペクトル包絡W[1],…,W[N]、平滑化振幅スペクトル包絡系列~W[1],…,~W[N]、周期T、指標Sなどが求められていることがある。このような場合は、周期性統合包絡系列生成装置に、周波数領域変換部、周波数領域正規化部、スペクトル包絡系列計算部、周期性分析部の少なくとも何れかを備えない構成としてもよい。この場合には、符号化装置内の周期性統合包絡系列生成装置以外の処理部から、量子化済線形予測係数^αpを特定する符号(線形予測係数符号CL)、周期Tや時間領域の周期を特定する符号(周期符号CT)、指標Sを特定する符号、などが出力され、復号装置に入力される。したがって、この場合には、符号化装置内の周期性統合包絡系列生成装置からは、量子化済線形予測係数^αpを特定する符号(線形予測係数符号CL)、周期Tや時間領域の周期を特定する符号(周期符号CT)、指標Sを特定する符号、などを出力する必要がない。
図5に実施例2の符号化装置の機能構成例を、図6に実施例2の符号化装置の処理フローを示す。符号化装置200は、スペクトル包絡系列計算部221、周波数領域変換部110、周波数領域系列正規化部111、周期性分析部230、周期性包絡系列生成部140、周期性統合包絡生成部250、可変長符号化パラメータ計算部260、可変長符号化部270を備える。符号化装置200は、入力された時間領域の音響ディジタル信号を入力音響信号x(t)とし、少なくとも量子化済線形予測係数^α1,…,^αPを示す符号CL、正規化係数列XN[1],…,XN[N]の周期を表す間隔Tの符号CT、正規化係数列XN[1],…,XN[N]を可変長符号化した可変長符号CXを出力する。周波数領域系列正規化部111は実施例1変形例1と同じである。周波数領域変換部110と周期性包絡系列生成部140は実施例1と同じである。以下では異なる構成部について説明する。
スペクトル包絡系列計算部221は、入力音響信号x(t)の時間領域の線形予測に基づき、入力音響信号の振幅スペクトル包絡系列W[1],…,W[N]と平滑化振幅スペクトル包絡系列~W[1],…,~W[N]を計算し、計算の過程で得た量子化済線形予測係数^α1,…,^αPを示す符号CLも求める(S221)。ただし、Nは正整数である。スペクトル包絡系列計算部221は、以下の手順で処理すればよい。
周期性分析部230は、正規化係数列XN[1],…,XN[N]を入力とし、当該正規化係数列XN[1],…,XN[N]の間隔T(周期的に大きな値となる間隔)を求め、間隔Tと間隔Tを示す符号CTを出力する(S230)。また、周期性分析部230は、必要に応じて、周期性の程度を示す指標S(すなわち、周波数領域のサンプル列の周期性の程度を示す指標)、も求めて出力する。また、周期性分析部230は、必要に応じて、指標Sを示す符号CSも得て出力する。なお、指標Sと間隔T自体は実施例1変形例1の周期性分析部131と同じである。
周期性統合包絡生成部250は、少なくとも、周期性包絡系列P[1],…,P[N]、振幅スペクトル包絡系列W[1],…,W[N]を入力とし、周期性統合包絡系列WM[1],…,WM[N]を求めて周期性統合包絡WM[n]を出力する。また、周期性統合包絡生成部150は、値δとして、予め定めた1つの値ではなく、予め定めた複数の候補値のうちの何れかを選択する場合には、係数列X[1], …, X[N]も入力とし、予め定めた複数の候補値のうち周期性統合包絡WM[n]と係数X[n]の絶対値系列の形状が近くなる候補値を値δとして求め、値δを示す符号Cδも出力する(S250)。
可変長符号化パラメータ計算部260は、周期性統合包絡系列WM[1],…,WM[N]と平滑化振幅スペクトル包絡系列~W[1],…,~W[N]と正規化係数列XN[1],…,XN[N]を入力とし、可変長符号化パラメータrnを求める(S260)。可変長符号化パラメータ計算部260は、周期性統合包絡系列WM[1],…,WM[N]から求めた振幅値に依存して可変長符号化パラメータrnを計算することを特徴としている。
可変長符号化部270は、可変長符号化パラメータ計算部260で求めた可変長符号化パラメータrnを用いて正規化係数列XN[1],…,XN[N]を可変長符号化し、可変長符号CXを出力する(S270)。例えば、可変長符号化部270は、可変長符号化パラメータ計算部260で求めたライスパラメータrnを用いて正規化係数列XN[1],…,XN[N]をライス符号化し、得られた符号を可変長符号CXとして出力する。可変長符号化パラメータ計算部260で求めたライスパラメータrnは、周期性統合包絡系列の振幅値に依存する可変長符号化パラメータであり、周期性統合包絡系列の値が大きい周波数ほど大きな値となっている。ライス符号化は、振幅値に依存する可変長符号化の公知技術のうちの1つであり、ライスパラメータrnを用いて振幅値に依存する可変長符号化を行うものである。また、周期性統合包絡生成部250で生成した周期性統合包絡系列は、入力音響信号のスペクトル包絡を高精度に表現するものである。すなわち、可変長符号化部270は、周期性統合包絡系列の値が大きい周波数ほど、前記入力音響信号の周波数領域の係数列であるX[1],…,X[N]の振幅が大きいとことを前提に、正規化係数列XN[1],…,XN[N]を可変長符号化していることになり、言い換えれば、可変長符号化パラメータを用いて、振幅値に依存する可変長符号化により、正規化係数列XN[1],…,XN[N]を符号化していることになる。ここでいう振幅値とは、符号化対象の係数列の平均振幅値、係数列に含まれる各係数の振幅の推定値、係数列の振幅の包絡の推定値などである。
なお、符号化装置としては、周期性包絡系列生成部140と周期性統合包絡生成部250と可変長符号化パラメータ計算部260と可変長符号化部270だけを備え、符号化装置の外部で生成された平滑化振幅スペクトル包絡系列~W[1],…,~W[N]と、正規化係数列XN[1],…,XN[N]、間隔Tと、必要に応じて振幅スペクトル包絡系列W[1],…, W[N]と、必要に応じて指標Sとを入力とし、可変長符号CXを出力してもよい。
上述の周期性分析部230では正規化係数列XN[1],…,XN[N]を入力として間隔Tを求めているが、周期性分析部230では周波数領域変換部110が出力した係数列X[1],…,X[N]を入力として間隔Tを求めてもよい。この場合は、実施例1の周期性分析部130と同じ方法で間隔Tを求める。
図7に実施例2の復号装置の機能構成例を、図8に実施例2の復号装置の処理フローを示す。復号装置400は、スペクトル包絡系列計算部421、周期性包絡系列生成部440、周期性統合包絡生成部450、可変長符号化パラメータ計算部460、可変長復号部470、周波数領域系列逆正規化部411、周波数領域逆変換部410を備える。復号装置400は、量子化済線形予測係数^α1,…,^αPを示す符号CL、間隔Tを示す符号CT、正規化係数列XN[1],…,XN[N]を可変長符号化した可変長符号CXを受け取り、音響信号を出力する。なお、必要に応じて値δを示す符号Cδと基準となる可変長符号化パラメータsbを示す符号Csbと指標Sを示す符号CSも受け取る。以下に、各構成部の詳細を示す。
スペクトル包絡系列計算部421は、符号CLを入力とし、振幅スペクトル包絡系列W[1],…,W[N]と平滑化振幅スペクトル包絡系列~W[1],…,~W[N]を計算する(S421)。より具体的には、以下の手順で処理すればよい。
周期性包絡系列生成部440は、間隔Tを示す符号CTを入力とし、符号CTを復号し、間隔Tを得る。そして、符号化装置200の周期性包絡系列生成部140と同じ方法で周期性包絡系列P[1],…,P[N]を求め、出力する(S440)。
周期性統合包絡生成部450には、周期性包絡系列P[1],…,P[N]、振幅スペクトル包絡系列W[1],…,W[N]、符号Cδ、符号CSが入力される。ただし、符号Cδ、符号CSは入力されない場合もある。周期性統合包絡生成部450は、符号Cδを復号し、値δを取得する。ただし、符号Cδが入力されない場合は、符号Cδの復号は行わず、周期性統合包絡生成部450に予め記憶された値δを取得する。なお、周期性統合包絡生成部450は、符号CSが入力された場合には、符号CSを復号して指標Sを取得し、取得した指標Sが、周期性が高いことに対応するフレームの場合には符号Cδを復号して値δを取得し、取得した指標Sが、周期性が低いことに対応するフレームである場合には符号Cδの復号は行わず、周期性統合包絡生成部450に予め記憶された値δを取得する。そして、周期性統合包絡生成部450は、式(6)によって、周期性統合包絡系列WM[1],…,WM[N]を求める。(S450)
可変長符号化パラメータ計算部460は、周期性統合包絡系列WM[1],…,WM[N]と平滑化振幅スペクトル包絡系列~W[1],…,~W[N]と符号Csbを入力とし、可変長符号化パラメータrnを得る(S460)。ただし、復号装置400に伝送される別の情報から振幅の平均値を推定できる場合は、別の情報から推定した振幅の平均値の推定値からsbを近似的に決定する方法を決めておいてもよい。この場合は、符号Csbは入力されない。以下に、1サンプルごとにライス復号を行う場合を例に、可変長符号化パラメータの計算方法を説明する。
可変長復号部470は、可変長符号化パラメータ計算部460で求めた可変長符号化パラメータrnを用いて可変長符号CXを復号して復号正規化係数列^XN[1],…,^XN[N]を得る(S470)。例えば、可変長復号部470は、可変長符号化パラメータ計算部460で求めたライスパラメータrnを用いて可変長符号CXを復号して復号正規化係数列^XN[1],…,^XN[N]を得る。可変長復号部470の復号方法は、可変長符号化部270の符号化方法に対応するものである。
周波数領域系列逆正規化部411は、復号正規化係数列^XN[1],…,^XN[N]と平滑化振幅スペクトル包絡系列~W[1],…,~W[N]を入力とし、
^X[n]=^XN[n]・~W[n] (15)
のように、復号係数列^X[1],…,^X[N]を求めて出力する(S411)。
周波数領域逆変換部410は、復号係数列^X[1],…,^X[N]を入力とし、復号係数列^X[1],…,^X[N]を所定の時間区間であるフレーム単位の音響信号(時間領域)に変換する(S410)。
なお、復号装置としては、周期性包絡系列生成部440と周期性統合包絡生成部450と可変長符号化パラメータ計算部460と可変長復号部470だけを備え、復号装置に必要に応じて入力される符号Cδと符号Csbに加えて、復号装置の外部で得られた平滑化振幅スペクトル包絡系列~W[1],…,~W[N]、振幅スペクトル包絡系列W[1],…,W[N]、間隔T、必要に応じて指標Sも入力とし、正規化係数列XN[1],…,XN[N]を出力し、外部で平滑化振幅スペクトル包絡系列を乗算して時間領域の音響信号に変換してもよい。
可変長符号化は、符号化対象の入力値の振幅の取りうる範囲に合わせて適応的に符号を決定することで符号化効率を向上させる符号化方法である。実施例2では周波数領域の係数列である正規化係数列XN[1],…,XN[N]を符号化対象としているが、符号化対象の係数列に含まれる各係数の振幅の情報をより正確に用いて求めた可変長符号化パラメータを用いて可変長符号化をすれば符号化装置が行う可変長符号化自体の符号化効率は高くなる。しかし、復号装置が可変長符号化パラメータを求めるために、符号化装置から復号装置に対して符号化対象の係数列に含まれる各係数の振幅の情報をより正確に送る必要があり、その分だけ符号化装置から復号装置に送る符号量が増大してしまう。
・量子化済線形予測係数^α1,…,^αPの情報(符号CL)
・間隔Tを示す情報(符号CT)
・値δを示す情報(符号Cδ)
である。すなわち、実施例2の符号化装置と復号装置によれば、符号化装置に入力された入力音響信号のピッチ周期に起因する振幅のピークを含む包絡を、符号CL、符号CT、符号Cδのみの少ない情報量で、復号装置で再現することが可能となる。
上述の効果を得るというポイントで実施例2の符号化装置、復号装置を考えると、符号化装置200が、
・所定時間区間の入力音響信号から求めた線形予測係数符号に対応する周波数領域の系列であるスペクトル包絡系列と、入力音響信号から求めた周期符号に対応する周波数領域の周期と、に基づく周波数領域の系列である周期性統合包絡系列を生成する周期性統合包絡生成部250
・周期性統合包絡系列の値が大きい周波数ほど、入力音響信号の振幅が大きいことを前提に、入力音響信号に由来する周波数領域の系列を符号化する可変長符号化部270
を有し、復号装置400が、
・線形予測係数符号に対応する周波数領域の系列であるスペクトル包絡系列と、周期符号に対応する周波数領域の周期と、に基づく周波数領域の系列である周期性統合包絡系列を生成する周期性統合包絡生成部450
・周期性統合包絡系列の値が大きい周波数ほど、音響信号の振幅が大きいことを前提に、可変長符号を復号して周波数領域の系列を得る可変長復号部470、
を有することを特徴とすればよい。なお、「周期性統合包絡系列の値が大きい周波数ほど、入力音響信号の振幅が大きいことを前提に」と「周期性統合包絡系列の値が大きい周波数ほど、音響信号の振幅が大きいことを前提に」とは、周期性統合包絡系列が、入力音響信号または音響信号の振幅の大きい周波数において大きい値になることを特徴としていることを示している。また、「入力音響信号に由来する」とは、入力音響信号から求められることや入力音響信号に対応していることを意味している。例えば、係数列X[1],…,X[N]や正規化係数列XN[1],…,XN[N]は、入力音響信号に由来する周波数領域の系列である。
図9に実施例3の符号化装置の機能構成例を、図10に実施例3の符号化装置の処理フローを示す。符号化装置300は、スペクトル包絡系列計算部221、周波数領域変換部110、周波数領域系列正規化部111、周期性分析部330、周期性包絡系列生成部140、周期性統合包絡生成部250、可変長符号化パラメータ計算部260、第2可変長符号化パラメータ計算部380、可変長符号化部370を備える。符号化装置300は、入力された時間領域の音響ディジタル信号を入力音響信号x(t)とし、少なくとも量子化済線形予測係数^α1,…,^αPを示す符号CL、正規化係数列XN[1],…,XN[N]の周期を表す間隔Tの符号CT、係数列X[1],…,X[N]または正規化係数列XN[1],…,XN[N]の周期性の程度を示す所定の指標Sと指標Sを示す符号CS、正規化係数列XN[1],…,XN[N]を可変長符号化した可変長符号CXを出力する。周波数領域系列正規化部111は実施例1変形例1と同じである。周波数領域変換部110と周期性包絡系列生成部140は実施例1と同じである。振幅スペクトル包絡系列計算部221、周期性統合包絡生成部250、可変長符号化パラメータ計算部260は、実施例2と同じである。以下では異なる構成部について説明する。
周期性分析部330は、正規化係数列XN[1],…,XN[N]を入力とし、
当該正規化係数列XN[1],…,XN[N]の周期性の程度を示す指標Sと間隔T(周期的に大きな値となる間隔)とを求め、指標Sと指標Sを示す符号CSと間隔Tと間隔Tを示す符号CTを出力する(S330)。なお、指標Sと間隔T自体は実施例1変形例1の周期性分析部131と同じである。
第2可変長符号化パラメータ計算部380は、振幅スペクトル包絡系列W[1],…,W[N]と平滑化振幅スペクトル包絡系列~W[1],…,~W[N]と正規化係数列XN[1],…,XN[N]を入力とし、可変長符号化パラメータrnを求める(S380)。可変長符号化パラメータ計算部260は、周期性統合包絡系列WM[1],…,WM[N]から求めた振幅値に依存して可変長符号化パラメータrnを計算することを特徴としているのに対して、第2可変長符号化パラメータ計算部380は、振幅スペクトル包絡系列から求めた振幅値に依存して可変長符号化パラメータを計算することを特徴としている。以下に、1サンプルごとにライス符号化を行う場合を例に、可変長符号化パラメータの計算方法を説明する。
可変長符号化部370は、可変長符号化パラメータrnを用いて正規化係数列XN[1],…,XN[N]を可変長符号化し、可変長符号CXを出力する(S370)。ただし、可変長符号化パラメータrnは、指標Sがあらかじめ定めた周期性の程度が大きいことを示す範囲の場合は、可変長符号化パラメータ計算部260が計算した可変長符号化パラメータrnであり、指標Sがあらかじめ定めた周期性の程度が大きいことを示す範囲ではない場合は、第2可変長符号化パラメータ計算部380が計算した可変長符号化パラメータrnである。
なお、符号化装置としては、周期性包絡系列生成部140と周期性統合包絡生成部250と可変長符号化パラメータ計算部260と第2可変長符号化パラメータ計算部380と可変長符号化部370だけを備え、符号化装置の外部で生成された平滑化振幅スペクトル包絡系列~W[1],…,~W[N]と正規化係数列XN[1],…,XN[N]、間隔Tと、必要に応じて振幅スペクトル包絡系列W[1],…, W[N]と、必要に応じて指標Sとを入力とし、可変長符号CXを出力してもよい。
上述の周期性分析部330では正規化係数列XN[1],…,XN[N]を入力として間隔Tを求めているが、周期性分析部330では周波数領域変換部110が出力した係数列X [1],…,X [N]を入力として間隔Tを求めてもよい。この場合は、実施例1の周期性分析部130と同じ方法で間隔Tを求める。
図11に実施例3の復号装置の機能構成例を、図12に実施例3の復号装置の処理フローを示す。復号装置500は、スペクトル包絡系列計算部421、指標復号部530、周期性包絡系列生成部440、周期性統合包絡生成部450、可変長符号化パラメータ計算部460、第2可変長符号化パラメータ計算部580、可変長復号部570、周波数領域系列逆正規化部411、周波数領域逆変換部410を備える。復号装置500は、量子化済線形予測係数^α1,…,^αPを示す符号CL、指標Sを示す符号CS、間隔Tを示す符号CT、正規化係数列XN[1],…,XN[N]を可変長符号化した可変長符号CXを受け取り、音響信号を出力する。なお、必要に応じて値δを示す符号Cδと基準となる可変長符号化パラメータsbを示す符号Csbも受け取る。スペクトル包絡系列計算部421、周期性包絡系列生成部440、周期性統合包絡生成部450、可変長符号化パラメータ計算部460、周波数領域系列逆正規化部411、周波数領域逆変換部410は実施例2と同じである。以下では異なる構成部について説明する。
指標復号部530は、符号CSを復号し、指標Sを得る。復号装置500では、指標Sがあらかじめ定めた周期性の程度が大きいことを示す範囲の場合は、可変長符号化パラメータ計算部460が可変長符号化パラメータrnを計算し、指標Sがあらかじめ定めた周期性の程度が大きいことを示す範囲ではない場合は、第2可変長符号化パラメータ計算部580が可変長符号化パラメータrnを計算する(S590)。なお、「あらかじめ定めた周期性の程度が大きいことを示す範囲」は、符号化装置300と同じ範囲である。
第2可変長符号化パラメータ計算部580は、振幅スペクトル包絡系列W[1],…,W[N]と平滑化振幅スペクトル包絡系列~W[1],…,~W[N]と符号Csbを入力とし、可変長符号化パラメータrnを求める(S580)。ただし、復号装置500に伝送される別の情報から振幅の平均値を推定できる場合は、別の情報から推定した振幅の平均値の推定値からsbを近似的に決定する方法を決めておいてもよい。この場合は、符号Csbは入力されない。以下に、1サンプルごとにライス復号を行う場合を例に、可変長符号化パラメータの計算方法を説明する。
可変長復号部570は、可変長符号化パラメータrnを用いて可変長符号CXを復号して復号正規化係数列^XN[1],…,^XN[N]を求める(S570)。ただし、可変長符号化パラメータrnは、指標Sがあらかじめ定めた周期性の程度が大きいことを示す範囲の場合は、可変長符号化パラメータ計算部460が計算した可変長符号化パラメータrnであり、指標Sがあらかじめ定めた周期性の程度が大きいことを示す範囲ではない場合は、第2可変長符号化パラメータ計算部580が計算した可変長符号化パラメータrnである。
なお、復号装置としては、周期性包絡系列生成部440と周期性統合包絡生成部450と可変長符号化パラメータ計算部460と第2可変長符号化パラメータ計算部580と可変長復号部570だけを備え、復号装置に必要に応じて入力される符号Cδと符号Csbに加えて、復号装置の外部で得られた平滑化振幅スペクトル包絡系列~W[1],…,~W[N]、振幅スペクトル包絡系列W[1],…,W[N]、間隔T、指標Sも入力とし、正規化係数列XN[1],…,XN[N]を出力し、外部で平滑化振幅スペクトル包絡系列を乗算して時間領域の音響信号に変換してもよい。
入力音響信号の周期性の程度が小さい場合には、入力音響信号のピッチ周期に起因する振幅のピークは小さい。そこで、実施例3の符号化装置、復号装置は、符号化の対象となる音響信号の周期性の程度が大きい場合には周期性統合包絡系列を用いて可変長符号化パラメータを求め、符号化の対象となる音響信号の周期性の程度が大きくない場合には振幅スペクトル包絡系列を用いて可変長符号化パラメータを求めるため、より適した可変長符号化パラメータを用いて可変長符号化でき、符号化精度を上げることができるという効果がある。
上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
110 周波数領域変換部 111 周波数領域係数正規化部
120、121、221、421 スペクトル包絡系列計算部
130,131、230、330 周期性分析部
140、440 周期性包絡系列生成部
150、250、450 周期性統合包絡生成部
200、300 符号化装置
260、360、460 可変長符号化パラメータ計算部
270、370 可変長符号化部
380、580 第2可変長符号化パラメータ計算部
400、500 復号装置
410 周波数領域逆変換部 411 周波数領域系列逆正規化部
470、570 可変長復号部 530 指標復号部
図4A〜4Dに同じ音響信号に対して生成された系列の違いを説明するための例を示す。図4Aに係数列X[1],…,X[N]を補間した曲線の形状を、図4Bに周期性包絡系列P[1],…,P[N]を補間した曲線の形状を、図4Cに平滑化振幅スペクトル包絡系列~W[1],…,~W[N]を補間した曲線の形状を、図4Dに周期性統合包絡系列WM[1],…,WM[N]を補間した曲線の形状を示す。図4A〜4Dに示すとおり、周期性統合包絡系列WM[1],…,WM[N]は、平滑化振幅スペクトル包絡系列~W[1],…,~W[N]に比べて、係数列X[1],…,X[N]に現れる周期的なピークを含んだ形状となっている。また、周期性統合包絡系列WM[1],…,WM[N]は、スペクトル包絡を表す情報である線形予測係数または量子化済線形予測係数の他に、間隔T、または、間隔Tと値δの情報があれば生成できる。したがって、入力音響信号のスペクトル包絡を表す情報に少ない情報量を追加するだけで、入力音響信号のピッチ周期に起因する振幅のピークを、線形予測係数により求まるスペクトル包絡より高精度に表現することができる。すなわち、線形予測係数または量子化済線形予測係数と、間隔T、または、間隔Tと値δと、の少ない情報量で入力音響信号の振幅を高精度に推定することができることになる。なお、平滑化振幅スペクトル包絡~W[n]は次式で表現される包絡であり、γは振幅スペクトル係数を鈍らせる(平滑化する)ための1以下の正の定数である。
周期性統合包絡生成部250は、少なくとも、周期性包絡系列P[1],…,P[N]、振幅スペクトル包絡系列W[1],…,W[N]を入力とし、周期性統合包絡系列WM[1],…,WM[N]を求めて周期性統合包絡WM[n]を出力する。また、周期性統合包絡生成部250は、値δとして、予め定めた1つの値ではなく、予め定めた複数の候補値のうちの何れかを選択する場合には、係数列X[1], …, X[N]も入力とし、予め定めた複数の候補値のうち周期性統合包絡WM[n]と係数X[n]の絶対値系列の形状が近くなる候補値を値δとして求め、値δを示す符号Cδも出力する(S250)。
110 周波数領域変換部 111 周波数領域系列正規化部
120、121、221、421 スペクトル包絡系列計算部
130,131、230、330 周期性分析部
140、440 周期性包絡系列生成部
150、250、450 周期性統合包絡生成部
200、300 符号化装置
260、360、460 可変長符号化パラメータ計算部
270、370 可変長符号化部
380、580 第2可変長符号化パラメータ計算部
400、500 復号装置
410 周波数領域逆変換部 411 周波数領域系列逆正規化部
470、570 可変長復号部 530 指標復号部
Claims (20)
- 所定の時間区間であるフレーム単位の時間領域の音響ディジタル信号を入力音響信号とし、
前入力音響信号の時間領域の線形予測に基づき、前記入力音響信号のスペクトル包絡系列を計算するスペクトル包絡系列計算部と、
前記入力音響信号の周波数領域での周期性成分に基づいて、前記スペクトル包絡系列を変形し、周期性統合包絡系列とする周期性統合包絡生成部と
を備える周期性統合包絡系列生成装置。 - 請求項1記載の周期性統合包絡系列生成装置であって、
前記周期性統合包絡生成部は、前記入力音響信号の周波数領域での周期が大きいほど、前記スペクトル包絡系列のうちの少なくとも前記入力音響信号の周波数領域での周期の整数倍および周期の整数倍の近傍のサンプルの値を大きく変更して得られる系列を周期性統合包絡系列とする
ことを特徴とする周期性統合包絡系列生成装置。 - 請求項1または2記載の周期性統合包絡系列生成装置であって、
前記周期性統合包絡生成部は、
周期性統合包絡系列の形状と前記入力音響信号に対応する周波数領域の係数の絶対値系列の形状とが近くなるように、前記スペクトル包絡系列のうちの少なくとも前記入力音響信号の周波数領域での周期の整数倍および周期の整数倍の近傍のサンプルの値を変更して得られる系列を周期性統合包絡系列とする
周期性統合包絡系列生成装置。 - 請求項1または2記載の周期性統合包絡系列生成装置であって、
前記周期性統合包絡生成部は、
前記入力音響信号の周期性の程度が大きい場合は、
周期性統合包絡系列の形状と前記入力音響信号に対応する周波数領域の係数の絶対値系列の形状とが近くなるように、前記スペクトル包絡系列のうちの少なくとも前記入力音響信号の周波数領域での周期の整数倍および周期の整数倍の近傍のサンプルの値を変更して得られる系列を周期性統合包絡系列とする
周期性統合包絡系列生成装置。 - 請求項1または2記載の周期性統合包絡系列生成装置であって、
前記周期性統合包絡生成部は、前記入力音響信号の周期性の程度が大きいほど、前記スペクトル包絡系列のうちの少なくとも前記入力音響信号の周波数領域での周期の整数倍および周期の整数倍の近傍のサンプルの値を大きく変更して得られる系列を周期性統合包絡系列とする
周期性統合包絡系列生成装置。 - 請求項1から5のいずれかに記載の周期性統合包絡系列生成装置であって、
前記周期性統合包絡生成部は、前記入力音響信号の周波数領域での周期が大きいほど、前記振幅スペクトル包絡系列うちの前記入力音響信号の周波数領域での周期の整数倍の近傍の多くのサンプルの値を変更して得られる系列を周期性統合包絡系列とする
ことを特徴とする周期性統合包絡系列生成装置。 - 請求項1から6のいずれかに記載の周期性統合包絡系列生成装置であって、
NとUを正の整数、Tを前記入力音響信号に由来する周波数領域の係数列の周期性を有する成分の間隔、Lを間隔Tの小数点以下の桁数、vを1以上の整数、floor(・)を小数点以下を切り捨てて整数値を返す関数、Round(・)を小数点第一位を四捨五入して整数値を返す関数、T’=T×2L、W[1],…,W[N]を振幅スペクトル包絡系列、δを振幅スペクトル包絡W[n]と周期性包絡P[n]の混合比率を決める値とし、
(U×T’)/2L−v≦n≦(U×T’)/2L+v
の範囲の整数nについて、
のように周期性包絡系列P[1],…,P[N]を求める周期性包絡系列生成部も備え、
前記周期性統合包絡生成部は、
のように前記周期性統合包絡系列WM[1],…,WM[N]を求める
ことを特徴とする周期性統合包絡系列生成装置。 - 所定の時間区間であるフレーム単位の時間領域の音響ディジタル信号を入力音響信号とし、
前入力音響信号の時間領域の線形予測に基づき、前記入力音響信号のスペクトル包絡系列を計算するスペクトル包絡系列計算ステップと、
前記入力音響信号の周波数領域での周期性成分に基づいて、前記スペクトル包絡系列を変形し、周期性統合包絡系列とする周期性統合包絡生成ステップと
を実行する周期性統合包絡系列生成方法。 - 請求項10記載の周期性統合系列生成方法であって、
前記周期性統合包絡生成ステップは、前記入力音響信号の周波数領域での周期が大きいほど、前記スペクトル包絡系列のうちの少なくとも前記入力音響信号の周波数領域での周期の整数倍および周期の整数倍の近傍のサンプルの値を大きく変更して得られる系列を周期性統合包絡系列とする
周期性統合包絡系列生成方法。 - 請求項10または11記載の周期性統合包絡系列生成方法であって、
前記周期性統合包絡生成ステップは、
周期性統合包絡系列の形状と前記入力音響信号に対応する周波数領域の係数の絶対値系列の形状とが近くなるように、前記スペクトル包絡系列のうちの少なくとも前記入力音響信号の周波数領域での周期の整数倍および周期の整数倍の近傍のサンプルの値を変更して得られる系列を周期性統合包絡系列とする
周期性統合包絡系列生成方法。 - 請求項10または11記載の周期性統合包絡系列生成方法であって、
前記周期性統合包絡生成ステップは、
前記入力音響信号の周期性の程度が大きい場合は、
周期性統合包絡系列の形状と前記入力音響信号に対応する周波数領域の係数の絶対値系列の形状とが近くなるように、前記スペクトル包絡系列のうちの少なくとも前記入力音響信号の周波数領域での周期の整数倍および周期の整数倍の近傍のサンプルの値を変更して得られる系列を周期性統合包絡系列とする
周期性統合包絡系列生成方法。 - 請求項10または11記載の周期性統合包絡系列生成方法であって、
前記周期性統合包絡生成ステップは、前記入力音響信号の周期性の程度が大きいほど、前記スペクトル包絡系列のうちの少なくとも前記入力音響信号の周波数領域での周期の整数倍および周期の整数倍の近傍のサンプルの値を大きく変更して得られる系列を周期性統合包絡系列とする
周期性統合包絡系列生成方法。 - 請求項10から14のいずれかに記載の周期性統合包絡系列生成方法であって、
前記周期性統合包絡生成ステップは、前記入力音響信号の周波数領域での周期が大きいほど、前記振幅スペクトル包絡系列うちの前記入力音響信号の周波数領域での周期の整数倍の近傍の多くのサンプルの値を変更して得られる系列を周期性統合包絡系列とする
ことを特徴とする周期性統合包絡系列生成方法。 - 請求項10〜15のいずれかに記載の周期性統合包絡系列生成方法であって、
NとUを正の整数、Tを前記入力音響信号に由来する周波数領域の係数列の周期性を有する成分の間隔、Lを間隔Tの小数点以下の桁数、vを1以上の整数、floor(・)を小数点以下を切り捨てて整数値を返す関数、Round(・)を小数点第一位を四捨五入して整数値を返す関数、T’=T×2L、W[1],…,W[N]を振幅スペクトル包絡系列、δを振幅スペクトル包絡W[n]と周期性包絡P[n]の混合比率を決める値とし、
(U×T’)/2L−v≦n≦(U×T’)/2L+v
の範囲の整数nについて、
のように周期性包絡系列P[1],…,P[N]を求める周期性包絡系列生成ステップも有し、
前記周期性統合包絡生成ステップは、
のように前記周期性統合包絡系列WM[1],…,WM[N]を求める
ことを特徴とする周期性統合包絡系列生成方法。 - 請求項1から9のいずれかに記載の周期性統合包絡系列生成装置としてコンピュータを機能させるための周期性統合包絡系列生成プログラム。
- 請求項1から9のいずれかに記載の周期性統合包絡系列生成装置としてコンピュータを機能させるための周期性統合包絡系列生成プログラムを記録したコンピュータが読み取り可能な記録媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014094880 | 2014-05-01 | ||
JP2014094880 | 2014-05-01 | ||
PCT/JP2015/054718 WO2015166694A1 (ja) | 2014-05-01 | 2015-02-20 | 周期性統合包絡系列生成装置、周期性統合包絡系列生成方法、周期性統合包絡系列生成プログラム、記録媒体 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017174631A Division JP6412994B2 (ja) | 2014-05-01 | 2017-09-12 | 周期性統合包絡系列生成装置、周期性統合包絡系列生成方法、周期性統合包絡系列生成プログラム、記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2015166694A1 true JPWO2015166694A1 (ja) | 2017-04-20 |
JP6276846B2 JP6276846B2 (ja) | 2018-02-07 |
Family
ID=54358435
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016515879A Active JP6276846B2 (ja) | 2014-05-01 | 2015-02-20 | 周期性統合包絡系列生成装置、周期性統合包絡系列生成方法、周期性統合包絡系列生成プログラム、記録媒体 |
JP2017174631A Active JP6412994B2 (ja) | 2014-05-01 | 2017-09-12 | 周期性統合包絡系列生成装置、周期性統合包絡系列生成方法、周期性統合包絡系列生成プログラム、記録媒体 |
JP2018186413A Active JP6674992B2 (ja) | 2014-05-01 | 2018-10-01 | 周期性統合包絡系列生成装置、周期性統合包絡系列生成方法、周期性統合包絡系列生成プログラム、記録媒体 |
JP2020039489A Active JP6867528B2 (ja) | 2014-05-01 | 2020-03-09 | 周期性統合包絡系列生成装置、周期性統合包絡系列生成方法、周期性統合包絡系列生成プログラム、記録媒体 |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017174631A Active JP6412994B2 (ja) | 2014-05-01 | 2017-09-12 | 周期性統合包絡系列生成装置、周期性統合包絡系列生成方法、周期性統合包絡系列生成プログラム、記録媒体 |
JP2018186413A Active JP6674992B2 (ja) | 2014-05-01 | 2018-10-01 | 周期性統合包絡系列生成装置、周期性統合包絡系列生成方法、周期性統合包絡系列生成プログラム、記録媒体 |
JP2020039489A Active JP6867528B2 (ja) | 2014-05-01 | 2020-03-09 | 周期性統合包絡系列生成装置、周期性統合包絡系列生成方法、周期性統合包絡系列生成プログラム、記録媒体 |
Country Status (9)
Country | Link |
---|---|
US (6) | US10204633B2 (ja) |
EP (4) | EP3139381B1 (ja) |
JP (4) | JP6276846B2 (ja) |
KR (4) | KR101860146B1 (ja) |
CN (4) | CN110289008B (ja) |
ES (4) | ES2738723T3 (ja) |
PL (4) | PL3699910T3 (ja) |
TR (1) | TR201910806T4 (ja) |
WO (1) | WO2015166694A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9911427B2 (en) | 2014-03-24 | 2018-03-06 | Nippon Telegraph And Telephone Corporation | Gain adjustment coding for audio encoder by periodicity-based and non-periodicity-based encoding methods |
WO2017125840A1 (en) * | 2016-01-19 | 2017-07-27 | Hua Kanru | Method for analysis and synthesis of aperiodic signals |
US10242696B2 (en) | 2016-10-11 | 2019-03-26 | Cirrus Logic, Inc. | Detection of acoustic impulse events in voice applications |
US10475471B2 (en) * | 2016-10-11 | 2019-11-12 | Cirrus Logic, Inc. | Detection of acoustic impulse events in voice applications using a neural network |
KR102643277B1 (ko) | 2022-03-10 | 2024-03-05 | 주식회사 메사쿠어컴퍼니 | 얼굴인식을 이용한 비밀번호 입력 방법 및 시스템 |
KR20230136288A (ko) | 2022-03-18 | 2023-09-26 | 주식회사 메사쿠어컴퍼니 | 얼굴의 부분영역으로 얼굴인증을 수행하는 방법 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58168094A (ja) * | 1982-03-29 | 1983-10-04 | 藤崎 博也 | 音声分析処理方式 |
JPS5994795A (ja) * | 1982-11-22 | 1984-05-31 | 藤崎 博也 | 音声分析処理方式 |
Family Cites Families (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5528723A (en) * | 1990-12-28 | 1996-06-18 | Motorola, Inc. | Digital speech coder and method utilizing harmonic noise weighting |
BE1007617A3 (nl) * | 1993-10-11 | 1995-08-22 | Philips Electronics Nv | Transmissiesysteem met gebruik van verschillende codeerprincipes. |
US7092881B1 (en) * | 1999-07-26 | 2006-08-15 | Lucent Technologies Inc. | Parametric speech codec for representing synthetic speech in the presence of background noise |
AU2001294974A1 (en) * | 2000-10-02 | 2002-04-15 | The Regents Of The University Of California | Perceptual harmonic cepstral coefficients as the front-end for speech recognition |
US7013269B1 (en) * | 2001-02-13 | 2006-03-14 | Hughes Electronics Corporation | Voicing measure for a speech CODEC system |
EP1422693B1 (en) * | 2001-08-31 | 2008-11-05 | Kenwood Corporation | Pitch waveform signal generation apparatus; pitch waveform signal generation method; and program |
US7027980B2 (en) * | 2002-03-28 | 2006-04-11 | Motorola, Inc. | Method for modeling speech harmonic magnitudes |
WO2004008437A2 (en) * | 2002-07-16 | 2004-01-22 | Koninklijke Philips Electronics N.V. | Audio coding |
JP4977472B2 (ja) * | 2004-11-05 | 2012-07-18 | パナソニック株式会社 | スケーラブル復号化装置 |
KR20060067016A (ko) * | 2004-12-14 | 2006-06-19 | 엘지전자 주식회사 | 음성 부호화 장치 및 방법 |
US7580910B2 (en) | 2005-04-06 | 2009-08-25 | Content Analyst Company, Llc | Perturbing latent semantic indexing spaces |
TWI279774B (en) * | 2005-04-14 | 2007-04-21 | Ind Tech Res Inst | Adaptive pulse allocation mechanism for multi-pulse CELP coder |
CN101138274B (zh) * | 2005-04-15 | 2011-07-06 | 杜比国际公司 | 用于处理去相干信号或组合信号的设备和方法 |
US7930176B2 (en) * | 2005-05-20 | 2011-04-19 | Broadcom Corporation | Packet loss concealment for block-independent speech codecs |
US7596231B2 (en) | 2005-05-23 | 2009-09-29 | Hewlett-Packard Development Company, L.P. | Reducing noise in an audio signal |
US20070011001A1 (en) * | 2005-07-11 | 2007-01-11 | Samsung Electronics Co., Ltd. | Apparatus for predicting the spectral information of voice signals and a method therefor |
KR100770839B1 (ko) * | 2006-04-04 | 2007-10-26 | 삼성전자주식회사 | 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치 |
KR100762596B1 (ko) * | 2006-04-05 | 2007-10-01 | 삼성전자주식회사 | 음성 신호 전처리 시스템 및 음성 신호 특징 정보 추출방법 |
US8688437B2 (en) * | 2006-12-26 | 2014-04-01 | Huawei Technologies Co., Ltd. | Packet loss concealment for speech coding |
JP4294724B2 (ja) * | 2007-08-10 | 2009-07-15 | パナソニック株式会社 | 音声分離装置、音声合成装置および声質変換装置 |
WO2009044525A1 (ja) * | 2007-10-01 | 2009-04-09 | Panasonic Corporation | 音声強調装置および音声強調方法 |
EP2077550B8 (en) * | 2008-01-04 | 2012-03-14 | Dolby International AB | Audio encoder and decoder |
US8401845B2 (en) * | 2008-03-05 | 2013-03-19 | Voiceage Corporation | System and method for enhancing a decoded tonal sound signal |
JP5038995B2 (ja) * | 2008-08-25 | 2012-10-03 | 株式会社東芝 | 声質変換装置及び方法、音声合成装置及び方法 |
EP3975587A1 (en) * | 2009-02-03 | 2022-03-30 | Cochlear Limited | Enhanced envelope encoded tone sound processor and system |
US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
CN102449691B (zh) * | 2009-06-03 | 2013-11-06 | 日本电信电话株式会社 | Parcor系数量化方法、parcor系数量化装置、程序以及记录介质 |
JP5223786B2 (ja) * | 2009-06-10 | 2013-06-26 | 富士通株式会社 | 音声帯域拡張装置、音声帯域拡張方法及び音声帯域拡張用コンピュータプログラムならびに電話機 |
JP5314771B2 (ja) * | 2010-01-08 | 2013-10-16 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラムおよび記録媒体 |
CN102714040A (zh) * | 2010-01-14 | 2012-10-03 | 松下电器产业株式会社 | 编码装置、解码装置、频谱变动量计算方法和频谱振幅调整方法 |
JP5749462B2 (ja) * | 2010-08-13 | 2015-07-15 | 株式会社Nttドコモ | オーディオ復号装置、オーディオ復号方法、オーディオ復号プログラム、オーディオ符号化装置、オーディオ符号化方法、及び、オーディオ符号化プログラム |
WO2012063185A1 (en) * | 2010-11-10 | 2012-05-18 | Koninklijke Philips Electronics N.V. | Method and device for estimating a pattern in a signal |
WO2012102149A1 (ja) * | 2011-01-25 | 2012-08-02 | 日本電信電話株式会社 | 符号化方法、符号化装置、周期性特徴量決定方法、周期性特徴量決定装置、プログラム、記録媒体 |
CN103477387B (zh) * | 2011-02-14 | 2015-11-25 | 弗兰霍菲尔运输应用研究公司 | 使用频谱域噪声整形的基于线性预测的编码方案 |
RU2559709C2 (ru) * | 2011-02-16 | 2015-08-10 | Ниппон Телеграф Энд Телефон Корпорейшн | Способ кодирования, способ декодирования, кодер, декодер, программа и носитель записи |
RU2571561C2 (ru) * | 2011-04-05 | 2015-12-20 | Ниппон Телеграф Энд Телефон Корпорейшн | Способ кодирования, способ декодирования, кодер, декодер, программа и носитель записи |
US8620646B2 (en) * | 2011-08-08 | 2013-12-31 | The Intellisis Corporation | System and method for tracking sound pitch across an audio signal using harmonic envelope |
CA2877161C (en) * | 2012-06-28 | 2020-01-21 | Tom Backstrom | Linear prediction based audio coding using improved probability distribution estimation |
EP2682941A1 (de) * | 2012-07-02 | 2014-01-08 | Technische Universität Ilmenau | Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne |
CN103827964B (zh) * | 2012-07-05 | 2018-01-16 | 松下知识产权经营株式会社 | 编解码系统、解码装置、编码装置以及编解码方法 |
MX347921B (es) * | 2012-10-05 | 2017-05-17 | Fraunhofer Ges Forschung | Un aparato para la codificacion de una señal de voz que emplea prediccion lineal excitada por codigos algebraico en el dominio de autocorrelacion. |
CN105247614B (zh) * | 2013-04-05 | 2019-04-05 | 杜比国际公司 | 音频编码器和解码器 |
US9418671B2 (en) * | 2013-08-15 | 2016-08-16 | Huawei Technologies Co., Ltd. | Adaptive high-pass post-filter |
MY181965A (en) * | 2013-10-18 | 2021-01-15 | Fraunhofer Ges Forschung | Coding of spectral coefficients of a spectrum of an audio signal |
US9697843B2 (en) * | 2014-04-30 | 2017-07-04 | Qualcomm Incorporated | High band excitation signal generation |
-
2015
- 2015-02-20 ES ES15786322T patent/ES2738723T3/es active Active
- 2015-02-20 KR KR1020187006358A patent/KR101860146B1/ko active IP Right Grant
- 2015-02-20 EP EP15786322.6A patent/EP3139381B1/en active Active
- 2015-02-20 ES ES20167434T patent/ES2878061T3/es active Active
- 2015-02-20 KR KR1020187006351A patent/KR101860143B1/ko active IP Right Grant
- 2015-02-20 EP EP20167436.3A patent/EP3699910B1/en active Active
- 2015-02-20 CN CN201910432900.6A patent/CN110289008B/zh active Active
- 2015-02-20 ES ES20167436T patent/ES2884034T3/es active Active
- 2015-02-20 US US15/302,205 patent/US10204633B2/en active Active
- 2015-02-20 CN CN201580022816.7A patent/CN106537500B/zh active Active
- 2015-02-20 PL PL20167436T patent/PL3699910T3/pl unknown
- 2015-02-20 CN CN201910728046.8A patent/CN110491401B/zh active Active
- 2015-02-20 PL PL15786322T patent/PL3139381T3/pl unknown
- 2015-02-20 KR KR1020187006347A patent/KR101860139B1/ko active IP Right Grant
- 2015-02-20 JP JP2016515879A patent/JP6276846B2/ja active Active
- 2015-02-20 PL PL20167434T patent/PL3696816T3/pl unknown
- 2015-02-20 ES ES19163214T patent/ES2805275T3/es active Active
- 2015-02-20 PL PL19163214T patent/PL3537439T3/pl unknown
- 2015-02-20 KR KR1020167029936A patent/KR101837153B1/ko active IP Right Grant
- 2015-02-20 CN CN201910728067.XA patent/CN110491402B/zh active Active
- 2015-02-20 EP EP19163214.0A patent/EP3537439B1/en active Active
- 2015-02-20 WO PCT/JP2015/054718 patent/WO2015166694A1/ja active Application Filing
- 2015-02-20 TR TR2019/10806T patent/TR201910806T4/tr unknown
- 2015-02-20 EP EP20167434.8A patent/EP3696816B1/en active Active
-
2017
- 2017-09-12 JP JP2017174631A patent/JP6412994B2/ja active Active
-
2018
- 2018-10-01 JP JP2018186413A patent/JP6674992B2/ja active Active
- 2018-12-21 US US16/228,980 patent/US10734009B2/en active Active
-
2020
- 2020-03-09 JP JP2020039489A patent/JP6867528B2/ja active Active
- 2020-05-14 US US15/931,694 patent/US11100938B2/en active Active
-
2021
- 2021-06-18 US US17/351,559 patent/US11501788B2/en active Active
-
2022
- 2022-09-29 US US17/955,980 patent/US11848021B2/en active Active
-
2023
- 2023-10-25 US US18/383,594 patent/US20240062767A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58168094A (ja) * | 1982-03-29 | 1983-10-04 | 藤崎 博也 | 音声分析処理方式 |
JPS5994795A (ja) * | 1982-11-22 | 1984-05-31 | 藤崎 博也 | 音声分析処理方式 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6412994B2 (ja) | 周期性統合包絡系列生成装置、周期性統合包絡系列生成方法、周期性統合包絡系列生成プログラム、記録媒体 | |
JP6595684B2 (ja) | 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム、復号プログラム、記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161004 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161004 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170912 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171226 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180112 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6276846 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |