JPWO2008155919A1 - 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法 - Google Patents
適応音源ベクトル量子化装置および適応音源ベクトル量子化方法 Download PDFInfo
- Publication number
- JPWO2008155919A1 JPWO2008155919A1 JP2009520334A JP2009520334A JPWO2008155919A1 JP WO2008155919 A1 JPWO2008155919 A1 JP WO2008155919A1 JP 2009520334 A JP2009520334 A JP 2009520334A JP 2009520334 A JP2009520334 A JP 2009520334A JP WO2008155919 A1 JPWO2008155919 A1 JP WO2008155919A1
- Authority
- JP
- Japan
- Prior art keywords
- subframe
- pitch period
- current frame
- adaptive excitation
- pitch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
Abstract
サブフレーム毎に行う適応音源ベクトル量子化の量子化精度を向上することができる適応音源ベクトル量子化装置等を開示する。この装置において、ピッチ周期指示部(101)は、フルサーチ範囲を第1サブフレームのピッチ周期探索範囲として出力し、ピッチ周期記憶部(107)は、各サブフレームのピッチ周期を記憶し、ピッチ周期比較部(108)は、現フレームの第1サブフレームのピッチ周期が過去フレームの第2サブフレームのピッチ周期を含む所定範囲に存在するか否かを判定し、判定結果として「1」または「2」を出力し、ピッチ周期指示部(101)は、ピッチ周期比較部(108)の出力が「1」である場合には、上記の所定範囲を現フレームの第2サブフレームのピッチ周期探索範囲として出力し、ピッチ周期比較部(108)の出力が「2」である場合には、上記のフルサーチ範囲を現フレームの第2サブフレームのピッチ周期探索範囲として出力する。
Description
本発明は、CELP方式の音声符号化において適応音源のベクトル量子化を行う適応音源ベクトル量子化装置および適応音源ベクトル量子化方法に関し、特にインターネット通信に代表されるパケット通信システムや、移動通信システムなどの分野で、音声信号の伝送を行う音声符号化/復号装置に用いられ適応音源のベクトル量子化を行う適応音源ベクトル量子化装置および適応音源ベクトル量子化方法に関する。
ディジタル無線通信や、インターネット通信に代表されるパケット通信、あるいは音声蓄積などの分野においては、電波などの伝送路容量や記憶媒体の有効利用を図るため、音声信号の符号化/復号技術が不可欠である。特に、CELP方式の音声符号化/復号技術が主流の技術となっている(例えば、非特許文献1参照)。
CELP方式の音声符号化装置は、予め記憶された音声モデルに基づいて入力音声を符号化する。具体的には、CELP方式の音声符号化装置は、ディジタル化された音声信号を10〜20ms程度の一定時間間隔のフレームに区切り、各フレーム内の音声信号に対して線形予測分析を行い線形予測係数(LPC:Linear Prediction Coefficient)と線形予測残差ベクトルを求め、線形予測係数および線形予測残差ベクトルをそれぞれ個別に符号化する。CELP方式の音声符号化/復号装置において、線形予測残差ベクトルは、過去に生成された駆動音源信号を格納している適応音源符号帳と、固定の形状のベクトル(固定コードベクトル)を特定数個格納している固定符号帳を用いて、符号化/復号される。そのうち、適応音源符号帳は、線形予測残差ベクトルが有する周期的成分を表現するために用いられる一方、固定符号帳は、線形予測残差ベクトルのうち適応音源符号帳では表現できない非周期的成分を表現するために用いられる。
なお、線形予測残差ベクトルの符号化/復号処理においては、フレームをさらに短い時間単位(5ms〜10ms程度)に分割したサブフレーム単位で行われるのが一般的である。非特許文献2に記載されているITU−T勧告G.729では、フレームを2つのサブフレームに分割し、2つのサブフレーム各々に対し適応音源符号帳を用いてピッチ周期を探索することにより適応音源のベクトル量子化を行う。具体的には、第1サブフレームでは固定の範囲内からピッチ周期を求め、第2サブフレームでは第1サブフレームで求められたピッチ周期の近傍の範囲内からピッチ周期を求めるという「デルタラグ」と呼ばれる方法が挙げられる。このような、サブフレーム単位の適応音源ベクトル量子化方法は、フレーム単位の適応音源ベクトル量子化方法よりも計算量を低減することができる。
M.R.Schroeder、B.S.Atal著、「IEEE proc. ICASSP」、1985、「Code Excited Linear Prediction: High Quality Speech at Low Bit Rate」、p.937−940 "ITU-T Recommendation G.729", ITU-T, 1996/3, pp.17-19
M.R.Schroeder、B.S.Atal著、「IEEE proc. ICASSP」、1985、「Code Excited Linear Prediction: High Quality Speech at Low Bit Rate」、p.937−940 "ITU-T Recommendation G.729", ITU-T, 1996/3, pp.17-19
しかしながら、上記のような第1サブフレームのピッチ周期の近傍の範囲を第2サブフレームのピッチ周期探索範囲とする「デルタラグ」という適応音源ベクトル量子化においては、第1サブフレームと第2サブフレームとの間のピッチ周期の連続性は考慮されるものの、過去フレームの第2サブフレームと現フレームの第1サブフレームとの間のピッチ周期の連続性は考慮されず、さらに現フレームの第1サブフレームと第2サブフレームと間にピッチ周期の変動が大きく、第2サブフレームのピッチ周期を第1サブフレームのピッチ周期のデルタラグで正確に表せない場合には、適応音源ベクトル量子化の精度が劣化するという問題が生じる。
本発明の目的は、サブフレーム単位で線形予測符号化を行うCELP音声符号化装置において、過去フレームの第2サブフレームと現フレームの第1サブフレームとの間のピッチ周期の連続性、および現フレームの第1サブフレームと第2サブフレームとの間のピッチ周期の連続性の両方を考慮し、現フレームの第1サブフレームと第2サブフレームと間にピッチ周期の変動が大きい場合でも、適応音源ベクトル量子化の精度を向上することができる適応音源ベクトル量子化装置および適応音源ベクトル量子化方法を提供することである。
本発明の適応音源ベクトル量子化装置は、1フレームを複数のサブフレームに分割して行われた線形予測分析により求められた、サブフレーム毎の線形予測残差ベクトルおよび線形予測係数を用いて適応音源のベクトル量子化を行う適応音源ベクトル量子化装置であって、現フレームの第1サブフレームの線形予測残差ベクトルおよび線形予測係数を用いて所定のフルサーチ範囲において前記現フレームの第1サブフレームのピッチ周期を探索する探索手段と、前記各サブフレームのピッチ周期を記憶するピッチ周期記憶手段と、前記現フレームの第1サブフレームのピッチ周期が前記過去フレームの第2サブフレームのピッチ周期を含む所定範囲に存在するか否かを判定する判定手段と、前記現フレームの第1サブフレームのピッチ周期が前記所定範囲に存在する場合には、前記現フレームの第1サブフレームのピッチ周期と前記過去フレームの第2サブフレームのピッチ周期との差分を算出する差分算出手段と、前記差分と現フレームの第2サブフレームのピッチ周期とをそれぞれ符号化する符号化手段と、を具備する構成を採る。
本発明の適応音源ベクトル量子化方法は、1フレームを複数のサブフレームに分割して行われた線形予測分析により求められた、サブフレーム毎の線形予測残差ベクトルおよび線形予測係数を用いて適応音源のベクトル量子化を行う適応音源ベクトル量子化方法であって、現フレームの第1サブフレームの線形予測残差ベクトルおよび線形予測係数を用いて所定のフルサーチ範囲において前記現フレームの第1サブフレームのピッチ周期を探索するステップと、前記各サブフレームのピッチ周期を記憶するステップと、前記現フレームの第1サブフレームのピッチ周期が前記過去フレームの第2サブフレームのピッチ周期を含む所定範囲に存在するか否かを判定するステップと、前記現フレームの第1サブフレームのピッチ周期が前記所定範囲に存在する場合には、前記現フレームの第1サブフレームのピッチ周期と前記過去フレームの第2サブフレームのピッチ周期との差分を算出するステップと、前記差分と現フレームの第2サブフレームのピッチ周期とをそれぞれ符号化するステップと、を具備するようにした。
本発明によれば、サブフレーム単位で線形予測符号化を行うCELP音声符号化装置において、過去フレームの第2サブフレームと現フレームの第1サブフレームとの間のピッチ周期の連続性、および現フレームの第1サブフレームと第2サブフレームとの間のピッチ周期の連続性の両方を考慮し、現フレームの第1サブフレームと第2サブフレームと間にピッチ周期の変動が大きい場合でも、適応音源ベクトル量子化の精度を向上することができる。
本発明の各実施の形態では、適応音源ベクトル量子化装置を含むCELP音声符号化装置において、16kHzの音声信号を構成する各フレームをそれぞれ2つのサブフレームに分割し、各サブフレームに対し線形予測分析を行ってサブフレーム毎の線形予測係数および線形予測残差ベクトルを求める場合を例にとる。なお、以下の説明では、フレーム長をnと記し、サブフレーム長をmと記す。
以下、本発明の一実施の形態について、添付図面を参照して詳細に説明する。
図1は、本発明の一実施の形態に係る適応音源ベクトル量子化装置100の主要な構成を示すブロック図である。
図1において、適応音源ベクトル量子化装置100は、ピッチ周期指示部101、適応音源符号帳102、適応音源ベクトル生成部103、合成フィルタ104、評価尺度算出部105、評価尺度比較部106、ピッチ周期記憶部107、ピッチ周期比較部108、デルタラグ算出部109、およびピッチ周期符号化部110を備え、サブフレームインデックス、線形予測係数、およびターゲットベクトルがサブフレーム毎に入力される。そのうち、サブフレームインデックスは、本実施の形態に係る適応音源ベクトル量子化装置100を含むCELP音声符号化装置において得られた各サブフレームがフレーム内において何番目のサブフレームであるかを表し、線形予測係数およびターゲットベクトルは、CELP音声符号化装置において各サブフレームに対し線形予測分析を行って求められたサブフレーム毎の線形予測係数および線形予測残差(励振信号)ベクトルを表す。線形予測係数としては、LPCパラメータ、もしくは、LPCパラメータと一対一で相互変換可能な周波数領域のパラメータであるLSF(Line Spectral Frequency)パラメータ、LSP(Line Spectral Pairs)パラメータなどを用いる。
ピッチ周期指示部101は、サブフレーム毎に入力されるサブフレームインデックス、ピッチ周期記憶部107から入力される第1サブフレームのピッチ周期、およびピッチ周期比較部108から入力される比較結果、すなわち現フレームの第1サブフレームを過去フレームの第2サブフレームのデルタラグとして表現できるか否かの判定結果に基づき、予め設定されているピッチ周期探索範囲内のピッチ周期を適応音源ベクトル生成部103へ順次指示する。
適応音源符号帳102は、駆動音源を格納するバッファを内蔵しており、サブフレーム単位でのピッチ周期探索が終了する度に、評価尺度比較部106からフィードバックされるピッチ周期を用いて駆動音源を更新する。
適応音源ベクトル生成部103は、ピッチ周期指示部101から指示されるピッチ周期候補を有する適応音源ベクトルを適応音源符号帳102からサブフレーム長mだけ切り出し、評価尺度算出部105に出力する。
合成フィルタ104は、サブフレーム毎に入力される線形予測係数を用いて合成フィルタを構成し、サブフレーム毎に入力されるサブフレームインデックスに基づき合成フィルタのインパルス応答行列を生成して評価尺度算出部105に出力する。
評価尺度算出部105は、適応音源ベクトル生成部103から入力される適応音源ベクトル、合成フィルタ104から入力されるインパルス応答行列、およびフレーム毎に入力されるターゲットベクトルを用いて、ピッチ周期探索用の評価尺度を算出して評価尺度比較部106に出力する。
評価尺度比較部106は、フレーム毎に入力されるサブフレームインデックスに基づき、各サブフレームにおいて、評価尺度算出部105から入力される評価尺度が最大となる時のピッチ周期候補を対応するサブフレームのピッチ周期として求め、適応音源符号帳102、ピッチ周期記憶部107、ピッチ周期比較部108、デルタラグ算出部109、およびピッチ周期符号化部110に出力する。
ピッチ周期記憶部107は、評価尺度比較部106から入力される第1サブフレームのピッチ周期を記憶し、記憶している過去1サブフレームのピッチ周期をピッチ周期指示部101、ピッチ周期比較部108およびデルタラグ算出部109に出力する。
ピッチ周期比較部108は、ピッチ周期記憶部107に記憶されている過去フレームの第2サブフレームのピッチ周期と、評価尺度比較部106から入力される現フレームの第1サブフレームのピッチ周期とを比較し、現フレームの第1サブフレームを過去フレームの第2サブフレームのデルタラグとして表現できるか否かを判定し、ピッチ周期をデルタラグで表すサブフレームの番号を比較結果としてピッチ周期指示部101、デルタラグ算出部109、およびピッチ周期符号化部110に出力する。すなわち、ピッチ周期比較部108は、現フレームの第1サブフレームを過去フレームの第2サブフレームのデルタラグとして表現できると判定した場合には、ピッチ周期をデルタラグで表すサブフレームの番号として「1」を出力し、現フレームの第1サブフレームを過去フレームの第2サブフレームのデルタラグとして表現できないと判定した場合には、ピッチ周期をデルタラグで表すサブフレームの番号として「2」を出力する。
デルタラグ算出部109は、ピッチ周期比較部108から入力される比較結果に基づき、すなわち現フレームの第1サブフレームを過去フレームの第2サブフレームのデルタラグとして表現できるか否かの判定結果に基づき、評価尺度比較部106から入力される現フレームの第1サブフレームのピッチ周期と、ピッチ周期記憶部107から入力される過去フレームの第2サブフレームのピッチ周期との差分、または評価尺度比較部106から入力される第2サブフレームのピッチ周期と、ピッチ周期記憶部107から入力される現フレームの第1サブフレームのピッチ周期との差分をデルタラグとして算出し、ピッチ周期符号化部110に出力する。
ピッチ周期符号化部110は、ピッチ周期比較部108から入力される比較結果と、デルタラグ算出部109から入力されるデルタラグと、評価尺度比較部106から入力されるインデックスとを符号化し、得られるピッチ周期符号化データを出力する。
適応音源ベクトル量子化装置100の各部は、以下の動作を行う。
ピッチ周期指示部101は、サブフレーム毎に入力されるサブフレームインデックスが第1サブフレームを示す場合、予め設定されているピッチ周期探索範囲内のピッチ周期T_int、例えば「32」から「287」までの8ビットに対応する256通りのピッチ周期T_int(T_int=32、33、…、287)を適応音源ベクトル生成部103へ順次指示する。ここで、「32」から「287」まではピッチ周期を示すインデックスである。また、ピッチ周期指示部101は、サブフレーム毎に入力されるサブフレームインデックスが第2サブフレームを示す場合には、ピッチ周期比較部108から入力される比較結果に応じたピッチ周期T_intを適応音源ベクトル生成部103に順次指示する。具体的には、ピッチ周期比較部108から入力される比較結果に基づき、ピッチ周期をデルタラグで表すサブフレームの番号が「1」である場合には、ピッチ周期指示部101は、第2サブフレームのピッチ周期の探索範囲としてピッチ周期T_int(T_int=32、33、…、287)を適応音源ベクトル生成部103に順次指示し、ピッチ周期をデルタラグで表すサブフレームの番号が「2」である場合には、第2サブフレームのピッチ周期の探索範囲としてピッチ周期T_int(T_int=T1’−7、T1’−6、…、T1’、…、T1’+8)を適応音源ベクトル生成部103に順次指示する。ここで、T1’は、ピッチ周期記憶部107から入力される第1サブフレームのピッチ周期である。
適応音源符号帳102は、駆動音源を格納するバッファを内蔵しており、サブフレーム単位でピッチ周期探索が終了する度に、評価尺度比較部106からフィードバックされるピッチ周期T’を有する適応音源ベクトルを用いて駆動音源を更新する。
適応音源ベクトル生成部103は、ピッチ周期指示部101から指示されるピッチ周期候補Tを有する適応音源ベクトルを適応音源符号帳102からサブフレーム長mだけ切り出し、適応音源ベクトルP(T)として評価尺度算出部105に出力する。例えば、適応音源符号帳102がexc(0),exc(1),…,exc(e−1)で表されるようにeの長さを持つベクトルからなる場合、適応音源ベクトル生成部103において生成される適応音源ベクトルP(T)は、下記の式(1)で表される。
図2は、適応音源符号帳102が備える駆動音源を示す図である。
図2において、eは駆動音源121の長さを表し、mは適応音源ベクトルP(T)の長さを示し、Tはピッチ周期指示部101から指示されるピッチ周期候補を示す。図2に示すように、適応音源ベクトル生成部103は、駆動音源121(適応音源符号帳102)の末尾(eの位置)からTだけ離れた位置を起点とし、ここから末尾eの方向へサブフレーム長mの部分122を切り出し、適応音源ベクトルP(T)を生成する。ここで、Tの値がmより小さい場合、適応音源ベクトル生成部103は、切り出した区間をサブフレーム長mになるまで反復して充足させると良い。なお、適応音源ベクトル生成部103は、上記の式(1)で表される切り出し処理を、ピッチ周期指示部101から指示される探索範囲内のすべてのTに対し繰り返す。
合成フィルタ104は、サブフレーム毎に入力される線形予測係数を用いて合成フィルタを構成し、サブフレーム毎に入力されるサブフレームインデックスが第1サブフレームを示す場合は、下記の式(2)で表されるインパルス応答行列を生成する一方、サブフレームインデックスが第2サブフレームを示す場合は、下記の式(3)で表されるインパルス応答行列を生成して評価尺度算出部105に出力する。
式(2)および式(3)に示すように、サブフレームインデックスが第1サブフレームを示す場合のインパルス応答行列H、およびサブフレームインデックスが第2サブフレームを示す場合のインパルス応答行列H_aheadは、何れもサブフレーム長mだけ求められる。
評価尺度算出部105は、サブフレーム毎に入力されるサブフレームインデックスが第1サブフレームを示す場合には、下記の式(4)に示すターゲットベクトルXが入力されるとともに、合成フィルタ104からインパルス応答行列Hが入力され、下記の式(5)に従ってピッチ周期探索用の評価尺度Dist(T)を算出し評価尺度比較部106に出力する。また、評価尺度算出部105は、適応音源ベクトル量子化装置100にフレーム毎に入力されるサブフレームインデックスが第2サブフレームを示す場合には、下記の式(6)に示すターゲットベクトルX_aheadが入力されるとともに、合成フィルタ104からインパルス応答行列H_aheadが入力され、下記の式(7)に従ってピッチ周期探索用の評価尺度Dist(T)を算出し評価尺度比較部106に出力する。
式(5)および式(7)に示すように、評価尺度算出部105は、合成フィルタ104で生成されたインパルス応答行列HまたはH_aheadと、適応音源ベクトル生成部103で生成された適応音源ベクトルP(T)とを畳み込んで得られる再生ベクトルと、ターゲットベクトルXまたはX_aheadとの二乗誤差を評価尺度として求める。なお、評価尺度算出部105において評価尺度Dist(T)を算出する際は、上記の式(5)または式(7)中のインパルス応答行列HまたはH_aheadの代わりに、インパルス応答行列HまたはH_aheadと、CELP音声符号化装置に含まれる聴覚重み付けフィルタのインパルス応答行列Wとを乗算して得られる行列H’(=H×W)またはH’_ahead(=H_ahead×W)を用いることが一般的である。ただし、以下の説明では、HまたはH_aheadと、H’またはH’_aheadとを区別せずHまたはH_aheadと記載することとする。
評価尺度比較部106は、サブフレーム毎に入力されるサブフレームインデックスに基づき、各サブフレームにおいて、評価尺度算出部105から入力される評価尺度Dist(T)が最大となる時のピッチ周期候補Tを各サブフレームのピッチ周期T’として求め、適応音源符号帳102、ピッチ周期記憶部107、ピッチ周期比較部108、デルタラグ算出部109、およびピッチ周期符号化部110に出力する。
ピッチ周期記憶部107は、第1サブフレームのピッチ周期を記憶するバッファからなり、サブフレーム単位でのピッチ周期探索が終了する度に、評価尺度比較部106からフィードバックされるピッチ周期T’を用いて内蔵のバッファを更新する。
ピッチ周期比較部108は、ピッチ周期記憶部107から入力される過去フレームの第2サブフレームのピッチ周期T2’_preと、評価尺度比較部106から入力される現フレームの第1サブフレームのピッチ周期T1’とを比較し、現フレームの第1サブフレームのピッチ周期T1’を過去フレームの第2サブフレームのピッチ周期T2’_preのデルタラグで表現できるか否か判定する。具体的には、T1’がT2’_pre−7からT2’_pre+8までの範囲(T2’_pre−7、T2’_pre−6、…、T2’_pre、T2’_pre+1、…、T2’_pre+8)に含まれていれば、ピッチ周期比較部108は、T1’をT2’_preのデルタラグとして表現できると判定する。現フレームの第1サブフレームのピッチ周期T1’を過去フレームの第2サブフレームのピッチ周期T2’_preのデルタラグで表現できれば、現フレームの第1サブフレームのピッチ周期を4ビットの情報量で符号化することができ、その代わりに現フレームの第2サブフレームにおいて8ビットの情報量でピッチ周期のフルサーチを行うことができる。
一方、現フレームの第1サブフレームのピッチ周期T1’を過去フレームの第2サブフレームのピッチ周期T2’_preのデルタラグで表現できない場合には、現フレームの第1サブフレームのピッチ周期を符号化するには8ビットの情報量が必要となり、現フレームの第2サブフレームにおいては4ビットの情報量で「デルタラグ」のピッチ周期探索を行うこととなる。ピッチ周期比較部108は、比較結果として、ピッチ周期をデルタラグで表すサブフレームの番号「1」または「2」をピッチ周期指示部101、デルタラグ算出部109、およびピッチ周期符号化部110に出力する。
デルタラグ算出部109は、ピッチ周期比較部108から入力される比較結果が「1」である場合には、評価尺度比較部106から入力される現フレームの第1サブフレームのピッチ周期T1’と、ピッチ周期記憶部107から入力される過去フレームの第2サブフレームのピッチ周期T2’_preとの差分をデルタラグとして算出し、ピッチ周期符号化部110に出力する。例えば、デルタラグ算出部109は、現フレームの第1サブフレームのピッチ周期T1’と、過去フレームの第2サブフレームのピッチ周期T2’_preとの差分(T1’−T2’_pre)を表す「−7、−6、…、0、…、7、8」の16通りの候補のうちの1つをピッチ周期符号化部110に出力する。
一方、デルタラグ算出部109は、ピッチ周期比較部108から入力される比較結果が「2」である場合には、評価尺度比較部106から入力される現フレームの第2サブフレームのピッチ周期T2’と、ピッチ周期記憶部107から入力される現フレームの第1サブフレームのピッチ周期T1’との差分をデルタラグとして算出し、ピッチ周期符号化部110に出力する。例えば、デルタラグ算出部109は、現フレームの第2サブフレームのピッチ周期T2’と、現フレームの第1サブフレームのピッチ周期T1’との差分(T2’−T1’)を表す「−7、−6、…、0、…、7、8」の16通りの候補のうちの1つをピッチ周期符号化部110に出力する。
ピッチ周期符号化部110は、ピッチ周期比較部108から入力される比較結果が「1」である場合には、現フレームの第1サブフレームのピッチ周期T’を表すパラメータ、すなわち、デルタラグ算出部109から入力されるデルタラグを4ビットの情報量で符号化するとともに、評価尺度比較部106から入力される現フレームの第2サブフレームのピッチ周期T2’を8ビットの情報量で符号化する。例えば、ピッチ周期符号化部110は、現フレームの第1サブフレームのピッチ周期T1’と、過去フレームの第2サブフレームのピッチ周期T2’_preとの差分(T1’−T2’_pre)を表す「−7、−6、…、0、…、7、8」の16通りの候補のうちの1つを4ビットで符号化し、「32、33、…、287」の256通りの候補のうちの1つで表される現フレームの第2サブフレームのピッチ周期T2’を8ビットで符号化する。
一方、ピッチ周期符号化部110は、ピッチ周期比較部108から入力される比較結果が「2」である場合には、評価尺度比較部106から入力される現フレームの第1サブフレームのピッチ周期T1’を8ビットの情報量で符号化し、現フレームの第2サブフレームのピッチ周期T2’を表すパラメータ、すなわち、デルタラグ算出部109から入力されるデルタラグを4ビットの情報量で符号化する。例えば、ピッチ周期符号化部110は、「32、33、…、287」の256通りの候補のうちの1つで表される現フレームの第1サブフレームのピッチ周期T1’を8ビットで符号化し、現フレームの第2サブフレームのピッチ周期T2’と、現フレームの第1サブフレームのピッチ周期T1’との差分(T2’−T1’)を表す「−7、−6、…、0、…、7、8」の16通りの候補のうちの1つを4ビットで符号化する。
また、ピッチ周期符号化部110は、ピッチ周期比較部108から入力される比較結果、すなわち、ピッチ周期をデルタラグで表すサブフレームの番号を1ビットの情報量で符号化する。
ピッチ周期符号化部110は、符号化された各サブフレームのピッチ周期またはデルタラグと、符号化された比較結果とをピッチ周期符号化データとしてCELP音声符号化装置に出力する。
以上、本実施の形態に係る適応音源ベクトル量子化装置100の構成および動作について説明した。
適応音源ベクトル量子化装置100を含むCELP音声符号化装置は、ピッチ周期符号化部110において生成されたピッチ周期符号化データを含む音声符号化情報を、本実施の形態に係る適応音源ベクトル逆量子化装置を含むCELP音声復号装置に送信する。CELP音声復号装置は、受信した音声符号化情報を復号し各サブフレームのピッチ周期のインデックスまたはデルタラグと、比較結果とを含むピッチ周期復号データを得て、本実施の形態に係る適応音源ベクトル逆量子化装置へ出力する。なお、CELP音声復号装置における音声復号処理も、CELP音声符号化装置における音声符号化処理と同様にサブフレームに単位で行われ、CELP音声復号装置はサブフレームインデックスを本実施の形態に係る適応音源ベクトル逆量子化装置へ出力する。
図3は、本実施の形態に係る適応音源ベクトル逆量子化装置200の主要な構成を示すブロック図である。
図3において、適応音源ベクトル逆量子化装置200は、分離部201、ピッチ周期生成部202、ピッチ周期記憶部203、適応音源符号帳204、および適応音源ベクトル生成部205を備え、CELP音声復号装置において生成されたサブフレームインデックス、およびピッチ周期復号データが入力される。
分離部201は、入力されるピッチ周期復号データから各サブフレームのピッチ周期のインデックスまたはデルタラグと、比較結果とを分離してピッチ周期生成部202に出力する。
ピッチ周期生成部202は、分離部201から入力される比較結果に基づき各サブフレームのピッチ周期T’’を生成してピッチ周期記憶部203、適応音源符号帳204および適応音源ベクトル生成部205に出力する。具体的には、比較結果が「1」である場合には、ピッチ周期生成部202は、分離部201から入力される現フレームの第1サブフレームのピッチ周期のデルタラグと、ピッチ周期記憶部203から読み出す過去フレームの第2サブフレームのピッチ周期のインデックスとを加算し、得られるインデックスが示すピッチ周期を現フレームの第1サブフレームのピッチ周期T1’’とし、分離部201から入力される現フレームの第2サブフレームのインデックスが示すピッチ周期を直接現フレームの第2サブフレームのピッチ周期T2’’とする。
一方、比較結果が「2」である場合には、ピッチ周期生成部202は、分離部201から入力される現フレームの第1サブフレームのインデックスが示すピッチ周期を直接現フレームの第1サブフレームのピッチ周期T1’’とし、分離部201から入力される現フレームの第2サブフレームのピッチ周期のインデックスと、ピッチ周期記憶部203から読み出す現フレームの第1サブフレームのピッチ周期を表すインデックスとを加算し、得られるインデックスが示すピッチ周期を現フレームの第2サブフレームのピッチ周期T2’’とする。
ピッチ周期記憶部203は、ピッチ周期生成部202から入力される各サブフレームのピッチ周期T’’を記憶し、後続のサブフレームの処理においてピッチ周期生成部202により読み出される。
適応音源符号帳204は、適応音源ベクトル量子化装置100の適応音源符号帳102が備える駆動音源と同様な駆動音源を格納するバッファを内蔵しており、サブフレーム毎の適応音源復号処理が終わる度に、ピッチ周期生成部202から入力されるピッチ周期T’’を有する適応音源ベクトルを用いて駆動音源を更新する。
適応音源ベクトル生成部205は、ピッチ周期生成部202から入力されるピッチ周期T’’を有する適応音源ベクトルP’(T’’)を適応音源符号帳204からサブフレーム長mだけ切り出し、サブフレーム毎の適応音源ベクトルとして出力する。適応音源ベクトル生成部205において生成される適応音源ベクトルP’(T’’)は、下記の式(8)で表される。
このように、本実施の形態によれば、現フレームの第1サブフレームのピッチ周期と過去フレームの第2サブフレームとを比較した結果に基づき、現フレームの第1サブフレームのピッチ周期を過去フレームの第2サブフレームのデルタラグとして表し符号化するため、過去フレームの第2サブフレームのピッチ周期と第1サブフレームのピッチ周期との時間的な連続性を考慮することができ、また、第2サブフレームのピッチ周期探索をフルサーチに変更することにより、第1サブフレームと第2サブフレームとの間のピッチ周期の変動が大きい場合でも第2サブフレームにおいてフルサーチにより変動の大きさに対応することができ、より効率的なピッチ周期探索を行うことができる。
すなわち、現フレームの第1サブフレームのピッチ周期と過去フレームの第2サブフレームとを比較した結果に基づき、ピッチ周期をデルタラグで表すサブフレームを判定するため、過去フレームの第2サブフレームのピッチ周期と第1サブフレームのピッチ周期との時間的な連続性、および現フレームの第1サブフレームのピッチ周期と第2サブフレームのピッチ周期との時間的な連続性の両方を考慮することができ、現フレームの第1サブフレームと第2サブフレームと間にピッチ周期の変動が大きい場合でも、適応音源ベクトル量子化の精度を向上することができる。
なお、本実施の形態では、線形予測残差ベクトルを入力とし、適応音源符号帳を用いて線形予測残差ベクトルのピッチ周期を探索する場合を例にとって説明したが、本発明はこれに限定されず、音声信号そのものを入力とし、音声信号そのもののピッチ周期を直接探索しても良い。
また、本実施の形態では、ピッチ周期の候補として「20」から「237」までの範囲を例にとって説明したが、本発明はこれに限定されず、他の範囲をピッチ周期の候補としても良い。
また、本実施の形態では、適応音源ベクトル量子化装置100を含むCELP音声符号化装置において1つのフレームを2つのサブフレームに分割して各々のサブフレームに対し線形予測分析を行うことを前提として説明したが、本発明はこれに限定されず、CELP方式の音声符号化装置において、1つのフレームを3つ以上のサブフレームに分割して各々のサブフレームに対し線形予測分析を行うことを前提としても良い。例えば、3つのサブフレームに分割して本発明を適用する場合、第1サブフレームのピッチ周期探索をフルサーチに固定し、第2サブフレームのピッチ周期探索と第3サブフレームのピッチ周期探索との間でフルサーチとデルタラグとを切り替える構成にしても良い。この構成によれば、第1サブフレームが常にフルサーチでピッチ周期探索を行うため、現フレームにおいて前フレームのピッチ周期の情報を必要とせず、フレーム損失等の伝送誤りが発生するような場合においても誤り伝播の影響を受けないことが可能である。
本発明に係る適応音源ベクトル量子化装置および適応音源ベクトル逆量子化装置は、音声伝送を行う移動体通信システムにおける通信端末装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置を提供することができる。
なお、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係る適応音源ベクトル量子化方法のアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係る適応音源ベクトル量子化装置と同様の機能を実現することができる。
また、上記実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部または全てを含むように1チップ化されても良い。
また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適用等が可能性としてあり得る。
2007年6月21日出願の特願2007−163772の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
本発明に係る適応音源ベクトル量子化装置、および適応音源ベクトル量子化方法は、音声符号化および音声復号等の用途に適用することができる。
本発明は、CELP方式の音声符号化において適応音源のベクトル量子化を行う適応音源ベクトル量子化装置および適応音源ベクトル量子化方法に関し、特にインターネット通信に代表されるパケット通信システムや、移動通信システムなどの分野で、音声信号の伝送を行う音声符号化/復号装置に用いられ適応音源のベクトル量子化を行う適応音源ベクトル量子化装置および適応音源ベクトル量子化方法に関する。
ディジタル無線通信や、インターネット通信に代表されるパケット通信、あるいは音声蓄積などの分野においては、電波などの伝送路容量や記憶媒体の有効利用を図るため、音声信号の符号化/復号技術が不可欠である。特に、CELP方式の音声符号化/復号技術が主流の技術となっている(例えば、非特許文献1参照)。
CELP方式の音声符号化装置は、予め記憶された音声モデルに基づいて入力音声を符号化する。具体的には、CELP方式の音声符号化装置は、ディジタル化された音声信号を10〜20ms程度の一定時間間隔のフレームに区切り、各フレーム内の音声信号に対して線形予測分析を行い線形予測係数(LPC:Linear Prediction Coefficient)と線形予測残差ベクトルを求め、線形予測係数および線形予測残差ベクトルをそれぞれ個別に符号化する。CELP方式の音声符号化/復号装置において、線形予測残差ベクトルは、過去に生成された駆動音源信号を格納している適応音源符号帳と、固定の形状のベクトル(固定コードベクトル)を特定数個格納している固定符号帳を用いて、符号化/復号される。そのうち、適応音源符号帳は、線形予測残差ベクトルが有する周期的成分を表現するために用いられる一方、固定符号帳は、線形予測残差ベクトルのうち適応音源符号帳では表現できない非周期的成分を表現するために用いられる。
なお、線形予測残差ベクトルの符号化/復号処理においては、フレームをさらに短い時間単位(5ms〜10ms程度)に分割したサブフレーム単位で行われるのが一般的である。非特許文献2に記載されているITU−T勧告G.729では、フレームを2つのサブフレームに分割し、2つのサブフレーム各々に対し適応音源符号帳を用いてピッチ周期を探索することにより適応音源のベクトル量子化を行う。具体的には、第1サブフレームでは固定の範囲内からピッチ周期を求め、第2サブフレームでは第1サブフレームで求められたピッチ周期の近傍の範囲内からピッチ周期を求めるという「デルタラグ」と呼ばれる方法が挙げられる。このような、サブフレーム単位の適応音源ベクトル量子化方法は、フレーム単位の適応音源ベクトル量子化方法よりも計算量を低減することができる。
M.R.Schroeder、B.S.Atal著、「IEEE proc. ICASSP」、1985、「Code Excited Linear Prediction: High Quality Speech at Low Bit Rate」、p.937−940 "ITU-T Recommendation G.729", ITU-T, 1996/3, pp.17-19
M.R.Schroeder、B.S.Atal著、「IEEE proc. ICASSP」、1985、「Code Excited Linear Prediction: High Quality Speech at Low Bit Rate」、p.937−940 "ITU-T Recommendation G.729", ITU-T, 1996/3, pp.17-19
しかしながら、上記のような第1サブフレームのピッチ周期の近傍の範囲を第2サブフレームのピッチ周期探索範囲とする「デルタラグ」という適応音源ベクトル量子化においては、第1サブフレームと第2サブフレームとの間のピッチ周期の連続性は考慮されるものの、過去フレームの第2サブフレームと現フレームの第1サブフレームとの間のピッチ周期の連続性は考慮されず、さらに現フレームの第1サブフレームと第2サブフレームと間にピッチ周期の変動が大きく、第2サブフレームのピッチ周期を第1サブフレームのピ
ッチ周期のデルタラグで正確に表せない場合には、適応音源ベクトル量子化の精度が劣化するという問題が生じる。
ッチ周期のデルタラグで正確に表せない場合には、適応音源ベクトル量子化の精度が劣化するという問題が生じる。
本発明の目的は、サブフレーム単位で線形予測符号化を行うCELP音声符号化装置において、過去フレームの第2サブフレームと現フレームの第1サブフレームとの間のピッチ周期の連続性、および現フレームの第1サブフレームと第2サブフレームとの間のピッチ周期の連続性の両方を考慮し、現フレームの第1サブフレームと第2サブフレームと間にピッチ周期の変動が大きい場合でも、適応音源ベクトル量子化の精度を向上することができる適応音源ベクトル量子化装置および適応音源ベクトル量子化方法を提供することである。
本発明の適応音源ベクトル量子化装置は、1フレームを複数のサブフレームに分割して行われた線形予測分析により求められた、サブフレーム毎の線形予測残差ベクトルおよび線形予測係数を用いて適応音源のベクトル量子化を行う適応音源ベクトル量子化装置であって、現フレームの第1サブフレームの線形予測残差ベクトルおよび線形予測係数を用いて所定のフルサーチ範囲において前記現フレームの第1サブフレームのピッチ周期を探索する探索手段と、前記各サブフレームのピッチ周期を記憶するピッチ周期記憶手段と、前記現フレームの第1サブフレームのピッチ周期が前記過去フレームの第2サブフレームのピッチ周期を含む所定範囲に存在するか否かを判定する判定手段と、前記現フレームの第1サブフレームのピッチ周期が前記所定範囲に存在する場合には、前記現フレームの第1サブフレームのピッチ周期と前記過去フレームの第2サブフレームのピッチ周期との差分を算出する差分算出手段と、前記差分と現フレームの第2サブフレームのピッチ周期とをそれぞれ符号化する符号化手段と、を具備する構成を採る。
本発明の適応音源ベクトル量子化方法は、1フレームを複数のサブフレームに分割して行われた線形予測分析により求められた、サブフレーム毎の線形予測残差ベクトルおよび線形予測係数を用いて適応音源のベクトル量子化を行う適応音源ベクトル量子化方法であって、現フレームの第1サブフレームの線形予測残差ベクトルおよび線形予測係数を用いて所定のフルサーチ範囲において前記現フレームの第1サブフレームのピッチ周期を探索するステップと、前記各サブフレームのピッチ周期を記憶するステップと、前記現フレームの第1サブフレームのピッチ周期が前記過去フレームの第2サブフレームのピッチ周期を含む所定範囲に存在するか否かを判定するステップと、前記現フレームの第1サブフレームのピッチ周期が前記所定範囲に存在する場合には、前記現フレームの第1サブフレームのピッチ周期と前記過去フレームの第2サブフレームのピッチ周期との差分を算出するステップと、前記差分と現フレームの第2サブフレームのピッチ周期とをそれぞれ符号化するステップと、を具備するようにした。
本発明によれば、サブフレーム単位で線形予測符号化を行うCELP音声符号化装置において、過去フレームの第2サブフレームと現フレームの第1サブフレームとの間のピッチ周期の連続性、および現フレームの第1サブフレームと第2サブフレームとの間のピッチ周期の連続性の両方を考慮し、現フレームの第1サブフレームと第2サブフレームと間にピッチ周期の変動が大きい場合でも、適応音源ベクトル量子化の精度を向上することができる。
本発明の各実施の形態では、適応音源ベクトル量子化装置を含むCELP音声符号化装置において、16kHzの音声信号を構成する各フレームをそれぞれ2つのサブフレームに分割し、各サブフレームに対し線形予測分析を行ってサブフレーム毎の線形予測係数および線形予測残差ベクトルを求める場合を例にとる。なお、以下の説明では、フレーム長をnと記し、サブフレーム長をmと記す。
以下、本発明の一実施の形態について、添付図面を参照して詳細に説明する。
図1は、本発明の一実施の形態に係る適応音源ベクトル量子化装置100の主要な構成を示すブロック図である。
図1において、適応音源ベクトル量子化装置100は、ピッチ周期指示部101、適応音源符号帳102、適応音源ベクトル生成部103、合成フィルタ104、評価尺度算出部105、評価尺度比較部106、ピッチ周期記憶部107、ピッチ周期比較部108、デルタラグ算出部109、およびピッチ周期符号化部110を備え、サブフレームインデックス、線形予測係数、およびターゲットベクトルがサブフレーム毎に入力される。そのうち、サブフレームインデックスは、本実施の形態に係る適応音源ベクトル量子化装置100を含むCELP音声符号化装置において得られた各サブフレームがフレーム内において何番目のサブフレームであるかを表し、線形予測係数およびターゲットベクトルは、CELP音声符号化装置において各サブフレームに対し線形予測分析を行って求められたサブフレーム毎の線形予測係数および線形予測残差(励振信号)ベクトルを表す。線形予測係数としては、LPCパラメータ、もしくは、LPCパラメータと一対一で相互変換可能な周波数領域のパラメータであるLSF(Line Spectral Frequency)パラメータ、LSP(Line Spectral Pairs)パラメータなどを用いる。
ピッチ周期指示部101は、サブフレーム毎に入力されるサブフレームインデックス、ピッチ周期記憶部107から入力される第1サブフレームのピッチ周期、およびピッチ周期比較部108から入力される比較結果、すなわち現フレームの第1サブフレームを過去フレームの第2サブフレームのデルタラグとして表現できるか否かの判定結果に基づき、予め設定されているピッチ周期探索範囲内のピッチ周期を適応音源ベクトル生成部103へ順次指示する。
適応音源符号帳102は、駆動音源を格納するバッファを内蔵しており、サブフレーム単位でのピッチ周期探索が終了する度に、評価尺度比較部106からフィードバックされるピッチ周期を用いて駆動音源を更新する。
適応音源ベクトル生成部103は、ピッチ周期指示部101から指示されるピッチ周期候補を有する適応音源ベクトルを適応音源符号帳102からサブフレーム長mだけ切り出し、評価尺度算出部105に出力する。
合成フィルタ104は、サブフレーム毎に入力される線形予測係数を用いて合成フィルタを構成し、サブフレーム毎に入力されるサブフレームインデックスに基づき合成フィルタのインパルス応答行列を生成して評価尺度算出部105に出力する。
評価尺度算出部105は、適応音源ベクトル生成部103から入力される適応音源ベクトル、合成フィルタ104から入力されるインパルス応答行列、およびフレーム毎に入力
されるターゲットベクトルを用いて、ピッチ周期探索用の評価尺度を算出して評価尺度比較部106に出力する。
されるターゲットベクトルを用いて、ピッチ周期探索用の評価尺度を算出して評価尺度比較部106に出力する。
評価尺度比較部106は、フレーム毎に入力されるサブフレームインデックスに基づき、各サブフレームにおいて、評価尺度算出部105から入力される評価尺度が最大となる時のピッチ周期候補を対応するサブフレームのピッチ周期として求め、適応音源符号帳102、ピッチ周期記憶部107、ピッチ周期比較部108、デルタラグ算出部109、およびピッチ周期符号化部110に出力する。
ピッチ周期記憶部107は、評価尺度比較部106から入力される第1サブフレームのピッチ周期を記憶し、記憶している過去1サブフレームのピッチ周期をピッチ周期指示部101、ピッチ周期比較部108およびデルタラグ算出部109に出力する。
ピッチ周期比較部108は、ピッチ周期記憶部107に記憶されている過去フレームの第2サブフレームのピッチ周期と、評価尺度比較部106から入力される現フレームの第1サブフレームのピッチ周期とを比較し、現フレームの第1サブフレームを過去フレームの第2サブフレームのデルタラグとして表現できるか否かを判定し、ピッチ周期をデルタラグで表すサブフレームの番号を比較結果としてピッチ周期指示部101、デルタラグ算出部109、およびピッチ周期符号化部110に出力する。すなわち、ピッチ周期比較部108は、現フレームの第1サブフレームを過去フレームの第2サブフレームのデルタラグとして表現できると判定した場合には、ピッチ周期をデルタラグで表すサブフレームの番号として「1」を出力し、現フレームの第1サブフレームを過去フレームの第2サブフレームのデルタラグとして表現できないと判定した場合には、ピッチ周期をデルタラグで表すサブフレームの番号として「2」を出力する。
デルタラグ算出部109は、ピッチ周期比較部108から入力される比較結果に基づき、すなわち現フレームの第1サブフレームを過去フレームの第2サブフレームのデルタラグとして表現できるか否かの判定結果に基づき、評価尺度比較部106から入力される現フレームの第1サブフレームのピッチ周期と、ピッチ周期記憶部107から入力される過去フレームの第2サブフレームのピッチ周期との差分、または評価尺度比較部106から入力される第2サブフレームのピッチ周期と、ピッチ周期記憶部107から入力される現フレームの第1サブフレームのピッチ周期との差分をデルタラグとして算出し、ピッチ周期符号化部110に出力する。
ピッチ周期符号化部110は、ピッチ周期比較部108から入力される比較結果と、デルタラグ算出部109から入力されるデルタラグと、評価尺度比較部106から入力されるインデックスとを符号化し、得られるピッチ周期符号化データを出力する。
適応音源ベクトル量子化装置100の各部は、以下の動作を行う。
ピッチ周期指示部101は、サブフレーム毎に入力されるサブフレームインデックスが第1サブフレームを示す場合、予め設定されているピッチ周期探索範囲内のピッチ周期T_int、例えば「32」から「287」までの8ビットに対応する256通りのピッチ周期T_int(T_int=32、33、…、287)を適応音源ベクトル生成部103へ順次指示する。ここで、「32」から「287」まではピッチ周期を示すインデックスである。また、ピッチ周期指示部101は、サブフレーム毎に入力されるサブフレームインデックスが第2サブフレームを示す場合には、ピッチ周期比較部108から入力される比較結果に応じたピッチ周期T_intを適応音源ベクトル生成部103に順次指示する。具体的には、ピッチ周期比較部108から入力される比較結果に基づき、ピッチ周期をデルタラグで表すサブフレームの番号が「1」である場合には、ピッチ周期指示部10
1は、第2サブフレームのピッチ周期の探索範囲としてピッチ周期T_int(T_int=32、33、…、287)を適応音源ベクトル生成部103に順次指示し、ピッチ周期をデルタラグで表すサブフレームの番号が「2」である場合には、第2サブフレームのピッチ周期の探索範囲としてピッチ周期T_int(T_int=T1’−7、T1’−6、…、T1’、…、T1’+8)を適応音源ベクトル生成部103に順次指示する。ここで、T1’は、ピッチ周期記憶部107から入力される第1サブフレームのピッチ周期である。
1は、第2サブフレームのピッチ周期の探索範囲としてピッチ周期T_int(T_int=32、33、…、287)を適応音源ベクトル生成部103に順次指示し、ピッチ周期をデルタラグで表すサブフレームの番号が「2」である場合には、第2サブフレームのピッチ周期の探索範囲としてピッチ周期T_int(T_int=T1’−7、T1’−6、…、T1’、…、T1’+8)を適応音源ベクトル生成部103に順次指示する。ここで、T1’は、ピッチ周期記憶部107から入力される第1サブフレームのピッチ周期である。
適応音源符号帳102は、駆動音源を格納するバッファを内蔵しており、サブフレーム単位でピッチ周期探索が終了する度に、評価尺度比較部106からフィードバックされるピッチ周期T’を有する適応音源ベクトルを用いて駆動音源を更新する。
適応音源ベクトル生成部103は、ピッチ周期指示部101から指示されるピッチ周期候補Tを有する適応音源ベクトルを適応音源符号帳102からサブフレーム長mだけ切り出し、適応音源ベクトルP(T)として評価尺度算出部105に出力する。例えば、適応音源符号帳102がexc(0),exc(1),…,exc(e−1)で表されるようにeの長さを持つベクトルからなる場合、適応音源ベクトル生成部103において生成される適応音源ベクトルP(T)は、下記の式(1)で表される。
図2は、適応音源符号帳102が備える駆動音源を示す図である。
図2において、eは駆動音源121の長さを表し、mは適応音源ベクトルP(T)の長さを示し、Tはピッチ周期指示部101から指示されるピッチ周期候補を示す。図2に示すように、適応音源ベクトル生成部103は、駆動音源121(適応音源符号帳102)の末尾(eの位置)からTだけ離れた位置を起点とし、ここから末尾eの方向へサブフレーム長mの部分122を切り出し、適応音源ベクトルP(T)を生成する。ここで、Tの値がmより小さい場合、適応音源ベクトル生成部103は、切り出した区間をサブフレーム長mになるまで反復して充足させると良い。なお、適応音源ベクトル生成部103は、上記の式(1)で表される切り出し処理を、ピッチ周期指示部101から指示される探索範囲内のすべてのTに対し繰り返す。
合成フィルタ104は、サブフレーム毎に入力される線形予測係数を用いて合成フィルタを構成し、サブフレーム毎に入力されるサブフレームインデックスが第1サブフレームを示す場合は、下記の式(2)で表されるインパルス応答行列を生成する一方、サブフレームインデックスが第2サブフレームを示す場合は、下記の式(3)で表されるインパルス応答行列を生成して評価尺度算出部105に出力する。
式(2)および式(3)に示すように、サブフレームインデックスが第1サブフレームを示す場合のインパルス応答行列H、およびサブフレームインデックスが第2サブフレームを示す場合のインパルス応答行列H_aheadは、何れもサブフレーム長mだけ求められる。
評価尺度算出部105は、サブフレーム毎に入力されるサブフレームインデックスが第1サブフレームを示す場合には、下記の式(4)に示すターゲットベクトルXが入力されるとともに、合成フィルタ104からインパルス応答行列Hが入力され、下記の式(5)に従ってピッチ周期探索用の評価尺度Dist(T)を算出し評価尺度比較部106に出力する。また、評価尺度算出部105は、適応音源ベクトル量子化装置100にフレーム毎に入力されるサブフレームインデックスが第2サブフレームを示す場合には、下記の式(6)に示すターゲットベクトルX_aheadが入力されるとともに、合成フィルタ104からインパルス応答行列H_aheadが入力され、下記の式(7)に従ってピッチ周期探索用の評価尺度Dist(T)を算出し評価尺度比較部106に出力する。
式(5)および式(7)に示すように、評価尺度算出部105は、合成フィルタ104で生成されたインパルス応答行列HまたはH_aheadと、適応音源ベクトル生成部103で生成された適応音源ベクトルP(T)とを畳み込んで得られる再生ベクトルと、ターゲットベクトルXまたはX_aheadとの二乗誤差を評価尺度として求める。なお、評価尺度算出部105において評価尺度Dist(T)を算出する際は、上記の式(5)または式(7)中のインパルス応答行列HまたはH_aheadの代わりに、インパルス
応答行列HまたはH_aheadと、CELP音声符号化装置に含まれる聴覚重み付けフィルタのインパルス応答行列Wとを乗算して得られる行列H’(=H×W)またはH’_ahead(=H_ahead×W)を用いることが一般的である。ただし、以下の説明では、HまたはH_aheadと、H’またはH’_aheadとを区別せずHまたはH_aheadと記載することとする。
応答行列HまたはH_aheadと、CELP音声符号化装置に含まれる聴覚重み付けフィルタのインパルス応答行列Wとを乗算して得られる行列H’(=H×W)またはH’_ahead(=H_ahead×W)を用いることが一般的である。ただし、以下の説明では、HまたはH_aheadと、H’またはH’_aheadとを区別せずHまたはH_aheadと記載することとする。
評価尺度比較部106は、サブフレーム毎に入力されるサブフレームインデックスに基づき、各サブフレームにおいて、評価尺度算出部105から入力される評価尺度Dist(T)が最大となる時のピッチ周期候補Tを各サブフレームのピッチ周期T’として求め、適応音源符号帳102、ピッチ周期記憶部107、ピッチ周期比較部108、デルタラグ算出部109、およびピッチ周期符号化部110に出力する。
ピッチ周期記憶部107は、第1サブフレームのピッチ周期を記憶するバッファからなり、サブフレーム単位でのピッチ周期探索が終了する度に、評価尺度比較部106からフィードバックされるピッチ周期T’を用いて内蔵のバッファを更新する。
ピッチ周期比較部108は、ピッチ周期記憶部107から入力される過去フレームの第2サブフレームのピッチ周期T2’_preと、評価尺度比較部106から入力される現フレームの第1サブフレームのピッチ周期T1’とを比較し、現フレームの第1サブフレームのピッチ周期T1’を過去フレームの第2サブフレームのピッチ周期T2’_preのデルタラグで表現できるか否か判定する。具体的には、T1’がT2’_pre−7からT2’_pre+8までの範囲(T2’_pre−7、T2’_pre−6、…、T2’_pre、T2’_pre+1、…、T2’_pre+8)に含まれていれば、ピッチ周期比較部108は、T1’をT2’_preのデルタラグとして表現できると判定する。現フレームの第1サブフレームのピッチ周期T1’を過去フレームの第2サブフレームのピッチ周期T2’_preのデルタラグで表現できれば、現フレームの第1サブフレームのピッチ周期を4ビットの情報量で符号化することができ、その代わりに現フレームの第2サブフレームにおいて8ビットの情報量でピッチ周期のフルサーチを行うことができる。
一方、現フレームの第1サブフレームのピッチ周期T1’を過去フレームの第2サブフレームのピッチ周期T2’_preのデルタラグで表現できない場合には、現フレームの第1サブフレームのピッチ周期を符号化するには8ビットの情報量が必要となり、現フレームの第2サブフレームにおいては4ビットの情報量で「デルタラグ」のピッチ周期探索を行うこととなる。ピッチ周期比較部108は、比較結果として、ピッチ周期をデルタラグで表すサブフレームの番号「1」または「2」をピッチ周期指示部101、デルタラグ算出部109、およびピッチ周期符号化部110に出力する。
デルタラグ算出部109は、ピッチ周期比較部108から入力される比較結果が「1」である場合には、評価尺度比較部106から入力される現フレームの第1サブフレームのピッチ周期T1’と、ピッチ周期記憶部107から入力される過去フレームの第2サブフレームのピッチ周期T2’_preとの差分をデルタラグとして算出し、ピッチ周期符号化部110に出力する。例えば、デルタラグ算出部109は、現フレームの第1サブフレームのピッチ周期T1’と、過去フレームの第2サブフレームのピッチ周期T2’_preとの差分(T1’−T2’_pre)を表す「−7、−6、…、0、…、7、8」の16通りの候補のうちの1つをピッチ周期符号化部110に出力する。
一方、デルタラグ算出部109は、ピッチ周期比較部108から入力される比較結果が「2」である場合には、評価尺度比較部106から入力される現フレームの第2サブフレームのピッチ周期T2’と、ピッチ周期記憶部107から入力される現フレームの第1サ
ブフレームのピッチ周期T1’との差分をデルタラグとして算出し、ピッチ周期符号化部110に出力する。例えば、デルタラグ算出部109は、現フレームの第2サブフレームのピッチ周期T2’と、現フレームの第1サブフレームのピッチ周期T1’との差分(T2’−T1’)を表す「−7、−6、…、0、…、7、8」の16通りの候補のうちの1つをピッチ周期符号化部110に出力する。
ブフレームのピッチ周期T1’との差分をデルタラグとして算出し、ピッチ周期符号化部110に出力する。例えば、デルタラグ算出部109は、現フレームの第2サブフレームのピッチ周期T2’と、現フレームの第1サブフレームのピッチ周期T1’との差分(T2’−T1’)を表す「−7、−6、…、0、…、7、8」の16通りの候補のうちの1つをピッチ周期符号化部110に出力する。
ピッチ周期符号化部110は、ピッチ周期比較部108から入力される比較結果が「1」である場合には、現フレームの第1サブフレームのピッチ周期T’を表すパラメータ、すなわち、デルタラグ算出部109から入力されるデルタラグを4ビットの情報量で符号化するとともに、評価尺度比較部106から入力される現フレームの第2サブフレームのピッチ周期T2’を8ビットの情報量で符号化する。例えば、ピッチ周期符号化部110は、現フレームの第1サブフレームのピッチ周期T1’と、過去フレームの第2サブフレームのピッチ周期T2’_preとの差分(T1’−T2’_pre)を表す「−7、−6、…、0、…、7、8」の16通りの候補のうちの1つを4ビットで符号化し、「32、33、…、287」の256通りの候補のうちの1つで表される現フレームの第2サブフレームのピッチ周期T2’を8ビットで符号化する。
一方、ピッチ周期符号化部110は、ピッチ周期比較部108から入力される比較結果が「2」である場合には、評価尺度比較部106から入力される現フレームの第1サブフレームのピッチ周期T1’を8ビットの情報量で符号化し、現フレームの第2サブフレームのピッチ周期T2’を表すパラメータ、すなわち、デルタラグ算出部109から入力されるデルタラグを4ビットの情報量で符号化する。例えば、ピッチ周期符号化部110は、「32、33、…、287」の256通りの候補のうちの1つで表される現フレームの第1サブフレームのピッチ周期T1’を8ビットで符号化し、現フレームの第2サブフレームのピッチ周期T2’と、現フレームの第1サブフレームのピッチ周期T1’との差分(T2’−T1’)を表す「−7、−6、…、0、…、7、8」の16通りの候補のうちの1つを4ビットで符号化する。
また、ピッチ周期符号化部110は、ピッチ周期比較部108から入力される比較結果、すなわち、ピッチ周期をデルタラグで表すサブフレームの番号を1ビットの情報量で符号化する。
ピッチ周期符号化部110は、符号化された各サブフレームのピッチ周期またはデルタラグと、符号化された比較結果とをピッチ周期符号化データとしてCELP音声符号化装置に出力する。
以上、本実施の形態に係る適応音源ベクトル量子化装置100の構成および動作について説明した。
適応音源ベクトル量子化装置100を含むCELP音声符号化装置は、ピッチ周期符号化部110において生成されたピッチ周期符号化データを含む音声符号化情報を、本実施の形態に係る適応音源ベクトル逆量子化装置を含むCELP音声復号装置に送信する。CELP音声復号装置は、受信した音声符号化情報を復号し各サブフレームのピッチ周期のインデックスまたはデルタラグと、比較結果とを含むピッチ周期復号データを得て、本実施の形態に係る適応音源ベクトル逆量子化装置へ出力する。なお、CELP音声復号装置における音声復号処理も、CELP音声符号化装置における音声符号化処理と同様にサブフレームに単位で行われ、CELP音声復号装置はサブフレームインデックスを本実施の形態に係る適応音源ベクトル逆量子化装置へ出力する。
図3は、本実施の形態に係る適応音源ベクトル逆量子化装置200の主要な構成を示す
ブロック図である。
ブロック図である。
図3において、適応音源ベクトル逆量子化装置200は、分離部201、ピッチ周期生成部202、ピッチ周期記憶部203、適応音源符号帳204、および適応音源ベクトル生成部205を備え、CELP音声復号装置において生成されたサブフレームインデックス、およびピッチ周期復号データが入力される。
分離部201は、入力されるピッチ周期復号データから各サブフレームのピッチ周期のインデックスまたはデルタラグと、比較結果とを分離してピッチ周期生成部202に出力する。
ピッチ周期生成部202は、分離部201から入力される比較結果に基づき各サブフレームのピッチ周期T’’を生成してピッチ周期記憶部203、適応音源符号帳204および適応音源ベクトル生成部205に出力する。具体的には、比較結果が「1」である場合には、ピッチ周期生成部202は、分離部201から入力される現フレームの第1サブフレームのピッチ周期のデルタラグと、ピッチ周期記憶部203から読み出す過去フレームの第2サブフレームのピッチ周期のインデックスとを加算し、得られるインデックスが示すピッチ周期を現フレームの第1サブフレームのピッチ周期T1’’とし、分離部201から入力される現フレームの第2サブフレームのインデックスが示すピッチ周期を直接現フレームの第2サブフレームのピッチ周期T2’’とする。
一方、比較結果が「2」である場合には、ピッチ周期生成部202は、分離部201から入力される現フレームの第1サブフレームのインデックスが示すピッチ周期を直接現フレームの第1サブフレームのピッチ周期T1’’とし、分離部201から入力される現フレームの第2サブフレームのピッチ周期のインデックスと、ピッチ周期記憶部203から読み出す現フレームの第1サブフレームのピッチ周期を表すインデックスとを加算し、得られるインデックスが示すピッチ周期を現フレームの第2サブフレームのピッチ周期T2’’とする。
ピッチ周期記憶部203は、ピッチ周期生成部202から入力される各サブフレームのピッチ周期T’’を記憶し、後続のサブフレームの処理においてピッチ周期生成部202により読み出される。
適応音源符号帳204は、適応音源ベクトル量子化装置100の適応音源符号帳102が備える駆動音源と同様な駆動音源を格納するバッファを内蔵しており、サブフレーム毎の適応音源復号処理が終わる度に、ピッチ周期生成部202から入力されるピッチ周期T’’を有する適応音源ベクトルを用いて駆動音源を更新する。
適応音源ベクトル生成部205は、ピッチ周期生成部202から入力されるピッチ周期T’’を有する適応音源ベクトルP’(T’’)を適応音源符号帳204からサブフレーム長mだけ切り出し、サブフレーム毎の適応音源ベクトルとして出力する。適応音源ベクトル生成部205において生成される適応音源ベクトルP’(T’’)は、下記の式(8)で表される。
このように、本実施の形態によれば、現フレームの第1サブフレームのピッチ周期と過去フレームの第2サブフレームとを比較した結果に基づき、現フレームの第1サブフレームのピッチ周期を過去フレームの第2サブフレームのデルタラグとして表し符号化するため、過去フレームの第2サブフレームのピッチ周期と第1サブフレームのピッチ周期との時間的な連続性を考慮することができ、また、第2サブフレームのピッチ周期探索をフルサーチに変更することにより、第1サブフレームと第2サブフレームとの間のピッチ周期の変動が大きい場合でも第2サブフレームにおいてフルサーチにより変動の大きさに対応することができ、より効率的なピッチ周期探索を行うことができる。
すなわち、現フレームの第1サブフレームのピッチ周期と過去フレームの第2サブフレームとを比較した結果に基づき、ピッチ周期をデルタラグで表すサブフレームを判定するため、過去フレームの第2サブフレームのピッチ周期と第1サブフレームのピッチ周期との時間的な連続性、および現フレームの第1サブフレームのピッチ周期と第2サブフレームのピッチ周期との時間的な連続性の両方を考慮することができ、現フレームの第1サブフレームと第2サブフレームと間にピッチ周期の変動が大きい場合でも、適応音源ベクトル量子化の精度を向上することができる。
なお、本実施の形態では、線形予測残差ベクトルを入力とし、適応音源符号帳を用いて線形予測残差ベクトルのピッチ周期を探索する場合を例にとって説明したが、本発明はこれに限定されず、音声信号そのものを入力とし、音声信号そのもののピッチ周期を直接探索しても良い。
また、本実施の形態では、ピッチ周期の候補として「20」から「237」までの範囲を例にとって説明したが、本発明はこれに限定されず、他の範囲をピッチ周期の候補としても良い。
また、本実施の形態では、適応音源ベクトル量子化装置100を含むCELP音声符号化装置において1つのフレームを2つのサブフレームに分割して各々のサブフレームに対し線形予測分析を行うことを前提として説明したが、本発明はこれに限定されず、CELP方式の音声符号化装置において、1つのフレームを3つ以上のサブフレームに分割して各々のサブフレームに対し線形予測分析を行うことを前提としても良い。例えば、3つのサブフレームに分割して本発明を適用する場合、第1サブフレームのピッチ周期探索をフルサーチに固定し、第2サブフレームのピッチ周期探索と第3サブフレームのピッチ周期探索との間でフルサーチとデルタラグとを切り替える構成にしても良い。この構成によれば、第1サブフレームが常にフルサーチでピッチ周期探索を行うため、現フレームにおいて前フレームのピッチ周期の情報を必要とせず、フレーム損失等の伝送誤りが発生するような場合においても誤り伝播の影響を受けないことが可能である。
本発明に係る適応音源ベクトル量子化装置および適応音源ベクトル逆量子化装置は、音声伝送を行う移動体通信システムにおける通信端末装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置を提供することができる。
なお、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係る適応音源ベクトル量子化方法のアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係る適応音源ベクトル量子化装置と同様の機能を実現することができる。
また、上記実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるL
SIとして実現される。これらは個別に1チップ化されても良いし、一部または全てを含むように1チップ化されても良い。
SIとして実現される。これらは個別に1チップ化されても良いし、一部または全てを含むように1チップ化されても良い。
また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適用等が可能性としてあり得る。
2007年6月21日出願の特願2007−163772の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
本発明に係る適応音源ベクトル量子化装置、および適応音源ベクトル量子化方法は、音声符号化および音声復号等の用途に適用することができる。
Claims (3)
- 1フレームを複数のサブフレームに分割して行われた線形予測分析により求められた、サブフレーム毎の線形予測残差ベクトルおよび線形予測係数を用いて適応音源のベクトル量子化を行う適応音源ベクトル量子化装置であって、
現フレームの第1サブフレームの線形予測残差ベクトルおよび線形予測係数を用いて所定のフルサーチ範囲において前記現フレームの第1サブフレームのピッチ周期を探索する探索手段と、
前記各サブフレームのピッチ周期を記憶するピッチ周期記憶手段と、
前記現フレームの第1サブフレームのピッチ周期が前記過去フレームの第2サブフレームのピッチ周期を含む所定範囲に存在するか否かを判定する判定手段と、
前記現フレームの第1サブフレームのピッチ周期が前記所定範囲に存在する場合には、前記現フレームの第1サブフレームのピッチ周期と前記過去フレームの第2サブフレームのピッチ周期との差分を算出する差分算出手段と、
前記差分と現フレームの第2サブフレームのピッチ周期とをそれぞれ符号化する符号化手段と、
を具備する適応音源ベクトル量子化装置。 - 前記探索手段は、
前記現フレームの第1サブフレームのピッチ周期が前記所定範囲に存在する場合には、前記フルサーチ範囲において前記現フレームの第2サブフレームのピッチ周期を探索し、 前記現フレームの第1サブフレームのピッチ周期が前記所定範囲に存在しない場合には、前記所定範囲において前記現フレームの第2サブフレームのピッチ周期を探索する、
請求項1記載の適応音源ベクトル量子化装置。 - 1フレームを複数のサブフレームに分割して行われた線形予測分析により求められた、サブフレーム毎の線形予測残差ベクトルおよび線形予測係数を用いて適応音源のベクトル量子化を行う適応音源ベクトル量子化方法であって、
現フレームの第1サブフレームの線形予測残差ベクトルおよび線形予測係数を用いて所定のフルサーチ範囲において前記現フレームの第1サブフレームのピッチ周期を探索するステップと、
前記各サブフレームのピッチ周期を記憶するステップと、
前記現フレームの第1サブフレームのピッチ周期が前記過去フレームの第2サブフレームのピッチ周期を含む所定範囲に存在するか否かを判定するステップと、
前記現フレームの第1サブフレームのピッチ周期が前記所定範囲に存在する場合には、前記現フレームの第1サブフレームのピッチ周期と前記過去フレームの第2サブフレームのピッチ周期との差分を算出するステップと、
前記差分と現フレームの第2サブフレームのピッチ周期とをそれぞれ符号化するステップと、
を具備する適応音源ベクトル量子化方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007163772 | 2007-06-21 | ||
JP2007163772 | 2007-06-21 | ||
PCT/JP2008/001598 WO2008155919A1 (ja) | 2007-06-21 | 2008-06-20 | 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2008155919A1 true JPWO2008155919A1 (ja) | 2010-08-26 |
Family
ID=40156083
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009520334A Withdrawn JPWO2008155919A1 (ja) | 2007-06-21 | 2008-06-20 | 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20100185442A1 (ja) |
JP (1) | JPWO2008155919A1 (ja) |
WO (1) | WO2008155919A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1279167B1 (en) * | 2000-04-24 | 2007-05-30 | QUALCOMM Incorporated | Method and apparatus for predictively quantizing voiced speech |
US20110026581A1 (en) * | 2007-10-16 | 2011-02-03 | Nokia Corporation | Scalable Coding with Partial Eror Protection |
WO2010016270A1 (ja) * | 2008-08-08 | 2010-02-11 | パナソニック株式会社 | 量子化装置、符号化装置、量子化方法及び符号化方法 |
US9269366B2 (en) * | 2009-08-03 | 2016-02-23 | Broadcom Corporation | Hybrid instantaneous/differential pitch period coding |
US9082416B2 (en) * | 2010-09-16 | 2015-07-14 | Qualcomm Incorporated | Estimating a pitch lag |
US10249305B2 (en) * | 2016-05-19 | 2019-04-02 | Microsoft Technology Licensing, Llc | Permutation invariant training for talker-independent multi-talker speech separation |
DK3582513T3 (da) * | 2018-06-12 | 2022-01-31 | Oticon As | Høreanordning omfattende adaptiv lydkildefrekvensreduktion |
CN111696580B (zh) * | 2020-04-22 | 2023-06-16 | 广州多益网络股份有限公司 | 一种语音检测方法、装置、电子设备及存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2870608B2 (ja) * | 1991-02-27 | 1999-03-17 | シャープ株式会社 | 音声ピッチ予測装置 |
JP3435310B2 (ja) * | 1997-06-12 | 2003-08-11 | 株式会社東芝 | 音声符号化方法および装置 |
US6202046B1 (en) * | 1997-01-23 | 2001-03-13 | Kabushiki Kaisha Toshiba | Background noise/speech classification method |
JP3618217B2 (ja) * | 1998-02-26 | 2005-02-09 | パイオニア株式会社 | 音声のピッチ符号化方法及び音声のピッチ符号化装置並びに音声のピッチ符号化プログラムが記録された記録媒体 |
JP4550176B2 (ja) * | 1998-10-08 | 2010-09-22 | 株式会社東芝 | 音声符号化方法 |
JP3180786B2 (ja) * | 1998-11-27 | 2001-06-25 | 日本電気株式会社 | 音声符号化方法及び音声符号化装置 |
-
2008
- 2008-06-20 US US12/665,424 patent/US20100185442A1/en not_active Abandoned
- 2008-06-20 WO PCT/JP2008/001598 patent/WO2008155919A1/ja active Application Filing
- 2008-06-20 JP JP2009520334A patent/JPWO2008155919A1/ja not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
WO2008155919A1 (ja) | 2008-12-24 |
US20100185442A1 (en) | 2010-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5511372B2 (ja) | 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法 | |
JP5230444B2 (ja) | 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法 | |
JP5596341B2 (ja) | 音声符号化装置および音声符号化方法 | |
JPWO2008155919A1 (ja) | 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法 | |
US8452590B2 (en) | Fixed codebook searching apparatus and fixed codebook searching method | |
JP5241509B2 (ja) | 適応音源ベクトル量子化装置、適応音源ベクトル逆量子化装置、およびこれらの方法 | |
JP6122961B2 (ja) | 自己相関ドメインにおけるacelpを用いたスピーチ信号の符号化装置 | |
JPWO2009090875A1 (ja) | ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法 | |
JPH04344699A (ja) | 音声符号化・復号化方法 | |
US20100049508A1 (en) | Audio encoding device and audio encoding method | |
JPH113098A (ja) | 音声符号化方法および装置 | |
JPH0519795A (ja) | 音声の励振信号符号化・復号化方法 | |
JP3192051B2 (ja) | 音声符号化装置 | |
JPH0511799A (ja) | 音声符号化方式 | |
JP3284874B2 (ja) | 音声符号化装置 | |
JPH10207495A (ja) | 音声情報処理装置 | |
JPH10124091A (ja) | 音声符号化装置および情報記憶媒体 | |
JP2000330596A (ja) | 拡散音源ベクトル生成装置及び拡散音源ベクトル生成方法 | |
JP2000338999A (ja) | Celp型音声符号化装置及びcelp型音声符号化方法 | |
JP2000330595A (ja) | 拡散音源ベクトル生成装置及び拡散音源ベクトル生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110527 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20120405 |