JP2003015699A - 固定音源符号帳並びにそれを用いた音声符号化装置及び音声復号化装置 - Google Patents
固定音源符号帳並びにそれを用いた音声符号化装置及び音声復号化装置Info
- Publication number
- JP2003015699A JP2003015699A JP2001195469A JP2001195469A JP2003015699A JP 2003015699 A JP2003015699 A JP 2003015699A JP 2001195469 A JP2001195469 A JP 2001195469A JP 2001195469 A JP2001195469 A JP 2001195469A JP 2003015699 A JP2003015699 A JP 2003015699A
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- pulse
- signal
- codebook
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
ットレートにおいて、固定符号帳のピッチ周期化処理を
有効に機能させること。 【解決手段】 線形補間ピッチ算出部4031で、前
(サブ)フレームのピッチ情報及び現(サブ)フレーム
のピッチ情報とに基づいて線形補間ピッチを算出し、パ
ルス符号帳401からのパルス位置情報に対応する線形
補間ピッチを抽出する。この線形補間ピッチ情報は、周
期化処理部4032に出力される。周期化処理部403
2では、パルス符号帳から出力されたパルスに対応して
抽出された線形補間ピッチでパルス形状ベクトルを周期
化する。これにより、時間経過と共にピッチが大きくな
るようにピッチ周期化されたパルス形状ベクトル404
が生成される。
Description
信システムにおいて使用される低ビットレート用の音声
符号化装置に用いる固定音源符号帳、並びにそれを用い
た音声符号化装置及び音声復号化装置、特にCELP
(Code Excited Linear Prediction)型音声符号化装置
及び音声復号化装置に関する。
通信に代表されるパケット通信、あるいは音声蓄積など
の分野においては、無線信号などの伝送路容量や記憶媒
体の有効利用のために、音声情報を圧縮し、高能率で符
号化するための音声符号化装置が用いられている。中で
もCELP方式をベースにした方式が中・低ビットレー
トの音声符号化装置において広く実用化されている。C
ELPの技術については、M.R.Schroeder and b.s.Ata
l:"Code-ExcitedLinearPrediction(CELP): High-qualit
y Speech at Very Low Bit Rates", Proc. ICASSP-85,
25.1.1, pp.937-940, 1985" に示されている。
化された音声信号を一定のフレーム長(5ms〜50m
s程度)に区切り、フレーム毎に音声の線形予測を行
い、フレーム毎の線形予測による予測残差(励振信号)
を、既知の波形からなる適応符号帳と雑音(固定)符号
帳とを用いて符号化する方式である。
レームに分割し、サブフレーム毎に励振信号の符号化を
行う。適応符号帳は、過去に生成した駆動音源信号を格
納しており、音声信号の周期成分を表現するために用い
られる。固定音源符号帳は、予め用意された定められた
数の定められた形状を有するベクトルを格納しており、
適応符号帳では表現できない非周期的成分を主として表
現するために用いられる。
は、ランダムな雑音系列から成るベクトルや、何本かの
パルスの組み合わせによって表現されるベクトルなどが
用いられる。また、有声定常部など周期性が強く、その
周期が(サブ)フレーム長より短い信号の場合、固定音
源符号帳の出力にも周期性を持たせることが必要とな
る。このため、何らかの周期化処理を固定音源符号帳の
出力ベクトルに対して行うのが一般的である。
クトルを表現し、ピッチフィルタにより固定音源符号帳
の出力にピッチ周期性を持たせているものの例として、
ITU−T勧告G.729(CS−ACELP)の固定
音源符号帳が挙げられる。
て以下に具体的に説明する。図9は、G.729と同様
の構成を有する代数的固定音源符号帳から固定音源ベク
トルが生成される様子を示した図である。図9では、3
本の単位パルス(振幅値が1)が異なるトラックから生
成され、極性付与器901で各パルスに適切な極性を付
した後、加算器902で3本のパルスを足し合わせて固
定音源ベクトルを生成する。
異なっており、図9においては、第1トラックは{0,3,
6,9,12,15,18,21}の8箇所のうちのいずれかに配置
し、第2トラックは{1,4,7,10,13,16,19,22}の8箇所
のうちのいずれかに配置し、第3トラックは{2,5,8,1
1,14,17,20,23}の8箇所のうちのいずれかに配置し、
それぞれ単位パルスを1本ずつ立てることができる構成
となっている。
り、極性が正負の2通り、であるので、位置情報3ビッ
ト、極性情報1ビット、が各音源パルスを表現するため
に用いられる。したがって、合計12ビットの固定音源
符号帳となる。3本のパルスから成る固定音源ベクトル
は、ピッチフィルタPF(z)によって周期性が強調され
る。図9において、Tはピッチ周期、βは周期化ゲイン
を示しており、Tは現サブフレームにおけるピッチ周期
(整数)、βは直前のサブフレームにおけるピッチゲイ
ン(適応符号帳利得)が用いられる。ただし、βには上
限値と下限値が予め決められている。
来のピッチ周期化の構造を有する固定音源符号帳では、
ピッチ周期が(サブ)フレーム内で固定であるため、
(サブ)フレーム内でのピッチ周期の変化が無視できな
い場合に周期化が有効に機能しないという問題がある。
すなわち、2周期以上のピッチ波形が(サブ)フレーム
内に含まれる場合、全てのピッチ周期を1つの値で表す
ことができなくなることがあり、このような場合は特定
のピッチ周期に特化して周期化を行うこととなり、ピッ
チ周期化が固定音源符号帳の性能改善に寄与できなくな
る。特に、(サブ)フレーム長を長くして3kbit/
s以下のような低ビットレート化を行うと、(サブ)フ
レーム内のピッチ周期の変化が無視できなくなり、ピッ
チ周期化が有効に機能しなくなるケースが多くなる。
あり、特に4kbit/s以下のような低ビットレート
において、固定音源符号帳のピッチ周期化処理を有効に
機能させる固定音源符号帳並びにそれを用いた音声符号
化装置及び音声復号化装置を提供することを目的とす
る。
は、パルス符号帳から出力されたパルスのパルス位置情
報に基づいて線形補間ピッチを決定する線形補間ピッチ
算出手段と、前記線形補間ピッチを用いて音源ベクトル
に対して周期化処理を行うことによりピッチ周期が時間
的に変化する固定音源ベクトルを出力する周期化手段
と、を具備する構成を採る。
のピッチ周期の変化が無視できない場合でも、周期化の
ピッチ周期がそれに対応して変化するため、ピッチ周期
化が有効に機能しなくなるということを防止することが
できる。
いて、固定音源ベクトルが、ピッチ周期で並べたパルス
列を組み合わせてなる構成を採る。
のピッチ周期の変化が無視できない場合でも、その変化
するピッチに対応して並べたパルス列を音源ベクトルと
して用いるため、効果的に励振音源を表現することがで
きる。
いて、パルス列のパルスが、単位パルスでなく予め定め
られた形状を有する構成を採る。
効果的な形状を有するパルスを用いて音源ベクトルを生
成するため、より複雑な形状を有する励振音源ベクトル
を表現することが可能となる。
いて、線形補間ピッチは、現フレームのピッチ周期と前
フレームのピッチ周期とを用いた補間処理によって求め
られる構成を採る。
チは現(サブ)フレームと前(サブ)フレームとの補間
処理によって求められるため、変化するピッチ周期を表
すための情報量を増やさずに、効果的なピッチ周期化が
可能である。
フレームのピッチと前フレームのピッチとを用いて現フ
レームの各サンプルにおける補間ピッチを算出する線形
補間ピッチ算出手段と、予め定められたパルス形状を生
成するパルス形状生成手段と、前記パルス形状を前記補
間ピッチを用いて周期化する周期化手段と、音源パルス
を生成するパルス符号帳と、前記音源パルスに前記周期
化されたパルス形状を畳み込む畳み込み演算手段と、を
具備する構成を採る。
(サブ)フレーム内でピッチ周期が変化する音源ベクト
ルを生成でき、特に(サブ)フレームが長く2ピッチ以
上を含む有声(サブ)フレームの場合に、効果的な固定
音源ベクトルを生成することが可能となる。
フレームのピッチと前フレームのピッチとを用いて現フ
レームの各サンプルにおける補間ピッチを算出する工程
と、予め定められたパルス形状を生成する工程と、前記
パルス形状を前記補間ピッチを用いて周期化する工程
と、音源パルスを生成する工程と、前記音源パルスに対
して前記周期化されたパルス形状を畳み込む工程と、を
具備する。
(サブ)フレーム内でピッチ周期が変化する音源ベクト
ルを生成でき、特に(サブ)フレームが長く2ピッチ以
上を含む有声(サブ)フレームの場合に、効果的な固定
音源ベクトルを生成することが可能となる。
ログラムを格納し、コンピュータにより読み取り可能で
ある記録媒体であって、前記音源ベクトル生成プログラ
ムは、現フレームのピッチと前フレームのピッチを用い
て現フレームの各サンプルにおける補間ピッチを算出す
る手順と、前記補間ピッチを用いて周期的波形を生成す
る手順と、パルス音源を生成する手順と、前記パルス音
源に前記周期的波形を畳み込む手順と、を含む構成を採
る。
コンピュータにより動作可能であり、現フレームのピッ
チと前フレームのピッチを用いて現フレームの各サンプ
ルにおける補間ピッチを算出する手順と、前記補間ピッ
チを用いて周期的波形を生成する手順と、パルス音源を
生成する手順と、前記パルス音源に前記周期的波形を畳
み込む手順と、を含む構成を採る。
ラムにおいて、上記いずれかの作用効果を得ることがで
きる。
符号帳と、入力音声信号の周期成分を表し、フレーム間
で補間され時間的に変化するピッチ周期を用いる適応音
源符号帳と、入力音声信号のスペクトル特性を表すパラ
メータを量子化・符号化する手段と、前記固定音源符号
帳と前記適応音源符号帳とから生成される各音源ベクト
ルと前記パラメータとを用いて合成音声信号を合成する
手段と、入力音声信号と前記合成音声信号との歪みが小
さくなるように前記固定音源符号帳と前記適応符号帳か
らの最終的な出力を決定する手段と、を具備する構成を
採る。
果を固定音源符号帳で得られるので、低ビットレートで
高品質な音声符号化を実現可能となる。
符号帳と、合成音声信号の周期成分を表す適応音源符号
帳と、音声符号化装置によって符号化されたスペクトル
特性を表すパラメータを復号化する手段と、前記音声符
号化装置において決定された音源ベクトルを固定音源符
号帳と適応音源符号帳とから復号し、復号された音源ベ
クトルと前記パラメータとから合成音声信号を合成する
手段と、を具備する構成を採る。
果を固定音源符号帳で得られるので、低ビットレートで
高品質な音声信号を復号することが可能となる。
音声符号化装置を備えたことを特徴とする。また、本発
明の音声信号受信装置は、上記構成の音声復号化装置を
備えたことを特徴とする。
号送信装置及び/又は音声信号受信装置を備えたことを
特徴とする。また、本発明の通信端末装置は、上記構成
の音声信号送信装置及び/又は音声信号受信装置を備え
たことを特徴とする。
て、添付図面を参照して詳細に説明する。図1は、本発
明の実施の形態に係る音声符号化装置及び音声復号化装
置を備えた音声信号送信装置及び音声信号受信装置を示
すブロック図である。
置102によって電気的信号に変換されA/D変換装置
103に出力される。A/D変換装置103は、入力装
置102から出力された(アナログ)信号をディジタル
信号に変換し、ディジタル信号を音声符号化装置104
へ出力する。
103から出力されたディジタル信号を後述する音声符
号化方法を用いて符号化し、符号化した音声符号化情報
をRF変調装置105へ出力する。RF変調装置105
は、音声符号化装置104から出力された音声符号化情
報を電波などの伝送媒体に載せて送出するための無線信
号に変換し、送信アンテナ106へ出力する。送信アン
テナ106は、RF変調装置105から出力された出力
信号を無線信号(RF信号)として送出する。なお、図
中参照符号107は、送信アンテナ106から送出され
た無線信号(RF信号)を表す。以上の説明が音声信号
送信装置の構成及び動作である。
108は、受信アンテナ109によって受信され、RF
復調装置110へ出力される。なお、図1中のRF信号
108は、音声信号受信装置側から見たRF信号107
のことであり、伝播路において信号の減衰や雑音の重畳
がなければRF信号107と全く同じ信号となる。
9から出力されたRF信号から音声符号化情報を復調
し、復調後の音声信号を音声復号化装置111へ出力す
る。音声復号化装置111は、RF復調装置110から
出力された音声符号化情報から後述する音声復号化方法
を用いて音声信号を復号し、復号した音声信号をD/A
変換装置112へ出力する。
111から出力されたディジタル音声信号をアナログの
電気的信号に変換し、アナログ信号を出力装置113へ
出力する。出力装置113は、電気的信号を空気の振動
に変換し、音波として人間の耳に聴こえるように出力す
る。なお、図1中参照符号114は、出力された音波を
表す。以上の説明が音声信号受信装置の構成及び動作で
ある。
号受信装置の少なくとも一方を備えることにより、移動
通信システムにおける基地局装置及び通信端末装置を構
成することができる。
104にその特徴を有する。図2は、本発明の実施の形
態に係る音声符号化装置の構成を示すブロック図であ
る。
/D変換装置103から出力される信号であり、前処理
部200に入力される。前処理部200では、直流(D
C)成分を取り除くハイパスフィルタ処理などを行った
後に、直前のフレーム末尾におけるピッチ周期と現在の
フレーム末尾におけるピッチ周期との間で、ピッチ周期
が滑らかに変化するように、例えば現フレーム内の各サ
ンプルにおけるピッチ周期が前記2種類のピッチ周期を
線形補間して得られるピッチ周期となるように、前処理
を行い、この前処理後の信号(Xin)をLPC分析部2
01及び加算器204に出力する。
内で滑らかに変化するような前処理はLPC分析後に行
う構成としても良く、前記位置に限定するものではな
い。このような前処理を用いるCELP方式は、例えば
特開平6−214600号公報などに開示されている。
予測分析を行い、分析結果(線形予測係数)をLPC量
子化部202へ出力する。LPC量子化部202は、L
PC分析部201から出力された線形予測係数(LP
C)の量子化処理を行い、量子化LPCを合成フィルタ
203へ出力すると共に前記量子化LPCを表す符号L
を多重化部213へ出力する。
算器210から出力される駆動音源とを用いて前記量子
化LPCに対してフィルタ合成を行い、得られた合成信
号を加算器204へ出力する。加算器204は、前記X
inと前記合成信号との誤差信号を算出し、誤差信号を聴
覚重み付け部211へ出力する。聴覚重み付け部211
は、加算器204から出力された誤差信号に対して聴覚
的な重み付けを行い、聴覚重み付け領域での前記Xinと
前記合成信号との歪みを算出し、歪み情報をパラメータ
決定部212へ出力する。
部211から出力された前記符号化歪みが最小となるよ
うに、適応音源符号帳205と固定音源符号帳207と
量子化利得生成手段206とから生成される信号を決定
する。
10によって出力された音源信号をバッファリングして
おり、パラメータ決定部212から出力された信号
(A)によって特定される位置から適応音源ベクトルを
切り出して乗算器208へ出力する。
部212から出力された信号(F)によって特定される
形状を有するベクトルを乗算器209へ出力する。量子
化利得生成部206は、パラメータ決定部212から出
力された信号(G)によって特定される適応音源利得と
固定音源利得とをそれぞれ乗算器208,209へ出力
する。
から出力された量子化適応音源利得を、適応音源符号帳
205から出力された適応音源ベクトルに乗じて、加算
器210へ出力する。乗算器209は、量子化利得生成
部206から出力された量子化固定音源利得を、固定音
源符号帳207から出力された固定音源ベクトルに乗じ
て、加算器210へ出力する。
クトルと固定音源ベクトルとをそれぞれ乗算器208,
209から入力し、ベクトル加算をして合成フィルタ2
03及び適応音源符号帳205へ出力する。最後に、多
重化部213は、LPC量子化部202から量子化LP
Cを表す符号Lを入力し、パラメータ決定部212から
適応音源ベクトルを表す符号A及び固定音源ベクトルを
表す符号F及び量子化利得を表す符号Gを入力し、これ
らの情報を多重化して符号化情報として伝送路へ出力す
る。
帳207の具体的構成にその特徴を有する。図3及び図
4は、固定音源符号帳207の構成を示す図である。な
お、適応符号帳においても、前記前処理によって行われ
た補間ピッチを用いた適応符号ベクトルの生成、あるい
は後述するような固定音源符号帳における補間したピッ
チを用いた周期化処理、が適用されていることを前提と
する。そのような処理は、例えば特開平6−21460
0号公報に開示されている。
ブ)フレームのピッチP(N−1)と現(サブ)フレー
ムのピッチP(N)とを補間して得られる現(サブ)フ
レーム内におけるピッチP(T)(縦軸)と時刻(サン
プル)T(横軸)との関係を示すグラフである。ここで
は、補間方法の最も簡単な例として線形補間を用いてい
るが、この補間方法に限定されない。また、ピッチ周期
の精度に限定を加えて前記グラフを階段状にしたり、予
め定められた区間毎に同じピッチ周期を用いるようにし
て前記グラフを階段状にしたりするなどして後述の補間
処理や符号帳探索処理に必要な演算量を削減することも
可能である。
第2のパルス列(パルス列2)303は、それぞれ4本
のパルスから構成されており、それぞれのパルス間隔は
各パルスの位置によって図示されたように定められる。
これらのパルス列を特定するには、先頭パルスの位置の
みを特定すればよく、先頭パルスの位置情報が伝送され
る。先頭パルスの位置は、例えば従来の代数符号帳のよ
うに、予め位置の候補が決められているようにすれば良
い。なお、本実施の形態においては、2種類のパルス列
のみで固定音源ベクトルを生成しているが、3種類以上
のパルス列を組み合わせる構成でも良い。また、前記音
源パルス数は音源ベクトル長とピッチ周期及び先頭パル
スの位置によって定まるもので、4本に限定されるもの
ではない。
性を与えるものであり、図3の例ではパルス列1に対し
て+、パルス列2に対して−の極性をそれぞれ与えてい
る。極性(符号)が乗ぜられた各パルス列は、加算器3
06によってベクトル加算され、固定音源符号帳音源ベ
クトル307が生成される。そして、パルス列の位置情
報は、ピッチ周期化に用いる線形補間ピッチの情報とし
て用いられる。
す図であり、図3におけるパルス列に形状を持たせる構
成例を示している。
(サブ)フレーム内の点にパルスを立てたベクトルを生
成する。パルスを立てる位置は従来の代数符号帳のよう
に予め定められた位置候補の中から選ぶようにすれば良
い。パルス形状ベクトル402は、予め学習などによっ
て得られた形状を有するベクトルである。ベクトル長
は、最短ピッチ周期にあわせて20サンプル程度に制限
しても良く、制限しなくても良い。最短ピッチ長は、音
声符号化装置の設計によって決まるものであり、音声信
号にあり得る最も短いピッチ周期を考慮して定められ
る。一般的には、8kHzサンプリングで15サンプル
〜20サンプル程度の値が用いられる。
化部403によって周期化され、周期化されたパルス形
状ベクトル404が畳み込み演算部405へ出力され
る。周期化に用いられる周期には、参照符号301に示
したように(サブ)フレーム内で補間された周期が用い
られ、(サブ)フレーム内の位置によってピッチ周期は
変化する。なお、具体的な周期化方法については図5を
用いて後述する。
に、パルス符号帳401からのパルス位置情報と、前
(サブ)フレームのピッチ情報及び現(サブ)フレーム
のピッチ情報とに基づいて線形補間ピッチを算出する線
形補間ピッチ算出部4031と、算出された線形補間ピ
ッチを周期化処理部4032とを備えている。
部403においては、線形補間ピッチ算出部4031
で、前(サブ)フレームのピッチ情報及び現(サブ)フ
レームのピッチ情報とに基づいて線形補間ピッチを算出
し、パルス符号帳401からのパルス位置情報に対応す
る線形補間ピッチを抽出する。この線形補間ピッチ情報
は、周期化処理部4032に出力される。
から出力されたパルスに対応して抽出された線形補間ピ
ッチでパルス形状ベクトルを周期化する。これにより、
時間経過と共にピッチが大きくなるようにピッチ周期化
されたパルス形状ベクトル404が生成される。
ルスに対応し、時間経過と共にピッチが大きくなるよう
にピッチ周期化されたパルス形状ベクトルを生成するこ
とができる。このパルス形状ベクトル404は、畳み込
み演算部405に出力される。
び現(サブ)フレームのピッチ情報とに基づいて線形補
間ピッチを算出するので、時間的に変化するピッチは現
(サブ)フレームと前(サブ)フレームとの補間処理に
よって求めることができ、変化するピッチ周期を表すた
めの情報量を増やさずに、効果的なピッチ周期化が可能
となる。
401から出力されたパルスベクトルに対して、周期化
されたパルス形状ベクトル404が畳み込まれて固定音
源符号帳音源ベクトル406が生成される。
図3における一つのパルス列として、図3に示すように
タイミングをシフトさせて組み合わせることにより、複
数種類の固定音源符号帳音源ベクトル406を組み合わ
せた固定音源符号帳音源を生成することができる。この
場合も、音源ベクトルを表すにはパルス符号帳が出力し
たパルスの位置と極性を指定すれば良く、従来の代数符
号帳と同様にして探索及び符号化を行うことが可能であ
る。
ムのピッチと前フレームのピッチとを用いて現フレーム
の各サンプルにおける補間ピッチを算出する線形補間ピ
ッチ算出部と、予め定められたパルス形状を生成するパ
ルス形状生成部と、パルス形状を補間ピッチを用いて周
期化する周期化部と、音源パルスを生成するパルス符号
帳と、音源パルスに周期化されたパルス形状を畳み込む
畳み込み演算部と、により固定音源ベクトル生成装置を
構成することができる。
(サブ)フレーム内でピッチ周期が変化する音源ベクト
ルを生成でき、特に(サブ)フレームが長く2ピッチ以
上を含む有声(サブ)フレームの場合に、効果的な固定
音源ベクトルを生成することが可能となる。
号化装置におけるパルス形状波形の周期化方法を説明す
るための図である。
ッチのみがオリジナルのパルス形状であり、その後の各
点においては補間ピッチP(t)を用いてオリジナルのパ
ルス形状を時間軸方向に伸縮した波形に相当するものを
並べる方法である。
満たす最初の区間が1ピッチ目となり、t>P(t)の
区間については、1ピッチ周期さかのぼった点を、例え
ば式1を用いて補間して新たな1ピッチ波形を生成する
ことにより周期化を行う。
縮されることはなく、パルス形状ベクトルを配置する位
置(パルス形状ベクトルの振幅ピークの位置)のみが補
間ピッチP(t)にしたがって決定される方法である。周
期化方法Bでは、パルス形状ベクトルを時間軸方向に伸
縮しないので、予め十分なサンプリング周波数でアップ
サンプルしたパルス形状ベクトルをメモリに用意してお
けば、上記式1のように各サンプルの値を計算せずに、
2周期目以降のパルス形状ベクトルを配置される位置に
したがって必要な補間点を前記アップサンプルしたパル
ス形状ベクトルからコピーするだけで良い。したがっ
て、周期化方法Aに比べると周期化処理に必要な演算量
を低減することも可能となる。
の実施の形態に係る音声符号化装置における固定音源符
号帳を探索する動作を示すフロー図である。
れ、よく知られているように、下記式2の最大化によっ
て行なわれる。式2において、xは固定音源符号帳の音
源ベクトルによって(合成フィルタから)合成されるべ
きベクトル(ターゲットベクトル)を示し、Hは合成フ
ィルタのインパルス応答を畳み込むための下三角行列を
示し、fは固定音源符号帳から出力される音源ベクトル
を示す。なお、「’」は転置を表し、Hに用いられるイ
ンパルス応答は聴覚重みを考慮したもの(一般的には聴
覚重み付けフィルタと合成フィルタを従属接続した聴覚
重みつき合成フィルタのインパルス応答)が用いられ
る。
パルス形状を畳み込んだものとして表現できるので、下
記式3のように表すことができる。式3において、c及
びSはそれぞれパルス音源ベクトルとパルス形状畳み込
み下三角行列を示し、両者ともパルス位置によって異な
るベクトルおよび行列となる。
Tと省略する)701で式3の分子項を求めるためのベ
クトルx’HSが算出される。x’HSはLv次元のベ
クトルである。ただし、Sはパルス音源ベクトルのパル
ス位置ごとに異なる行列であるため、Lv種類のベクト
ルx’HSが存在する。ところが、x’HScはベクト
ルx’HSとベクトルcの内積であるので、音源ベクト
ルcのi番目の要素(c[i])に関係するのはベクトル
x’HSのi番目の要素x’HS[i]のみであり、他の
x’HSの要素は必要ない。
ルスに対して乗ぜられる行列をSiとすれば、x’HS
[i]=x’HSi[i]とすることにより、1種類のベクト
ルx’HSを用意すれば良いこととなる。したがって、
予めこのようなx’HSを算出しておけば、固定音源符
号帳の音源ベクトルCとの内積を求めるだけで分子項
x’HSCを求めることが可能である。固定音源符号帳
が代数符号帳である場合は、ITU−T勧告G.729
や特表平10−513571号公報に開示されているよ
うに、音源パルス数分だけベクトルx’HSから要素を
抜き出して総和を取ればよい。なお、音源パルスの極性
は、ITU−T勧告G.729などに示されているよう
に、x’HSに事前に乗算しておくことができる。
を求めるための行列S’H’HSが算出される。S’
H’HSはLv×Lv行列である。ただし、上述のよう
に、行列S(Lv×Lvの行列)は音源ベクトルcの位
置によって異なる種類のものが用いられる。したがっ
て、行列HSはLv種類あり、行列S’H’もLv種類
あり、行列S’H’HSはLv×Lv種類存在すること
になる(実際は、(Si)’H’HSj=Sj’H’iな
ので、((Lv+1)×Lv)/2通りである)。
置によって行列Sが決まるようになっているので、S’
H’HS[i][j]=S’H’HS[j][i]=(Si)’H’H
Sj[i][j]=(Si)’H’HSj[j][i]=(Sj)’H’
HSi[i][j]=(Sj)’H’HSi[j][i]、ここで、S
iはパルス位置iにおけるパルス形状ベクトル畳み込み
行列を示し、Sjはパルス位置jにおけるパルス形状畳
み込み行列を示し、[i][j]はi行j列の行列要素を示
す、というようにすれば、一つの行列S’H’HSとし
てまとめることができる。
求めておけば、ITU−T勧告G.729や特表平10
−513571号公報に開示されているように、音源パ
ルスに関連する要素を行列S’H’HSから抜き出して
和を取ることにより、c’S’H’HScを求めること
ができる。
勧告G.729などに示されているように、S’H’H
Sに事前に乗算しておくことができる。また、音源パル
ス毎に異なるパルス形状を畳み込む固定音源符号帳の構
成は、例えば特開平10-232696号公報などに開
示されている。
*x’HSc)/c’S’H’HScを最大にする固定
音源符号帳音源ベクトルの探索が行われる。固定音源符
号帳が代数符号帳の場合、パルス数に応じたネスト構造
の探索ループによって、各パルスの位置を予め定められ
た位置候補の中で順次変えながら全てのパルス位置の組
み合わせを調べることによって探索を行う。また、良く
行われるように、外側の探索ループから順番にパルス位
置を決定していく構成としたり(この場合、各パルスを
何番目のループで探索するかを探索ループに入る前に事
前に決めたりする)、外側の探索ループで(x’HSc
*x’HSc)/c’S’H’HScの値が大きくなり
そうかどうかを閾値処理などによって判定して、より内
側の探索ループに進む構成としたりする、いわゆるfocu
sed searchを導入することによって、演算量を大きく削
減することも可能である。ST703にて,(x’HS
c*x’HSc)/c’S’H’HScを最大とする音
源ベクトルCが固定音源符号帳の出力音源ベクトルとし
て選ばれる。
直交化して探索する場合も、同様の前処理によって行列
やベクトルを求めることによって、従来の代数符号帳の
探索と同様にして固定音源符号帳の探索が可能である。
直交化した場合の行列及びベクトルについては、例え
ば、特開平11−126096号公報などに開示されて
いる。
号化装置の構成を示すブロック図である。
から出力された符号化情報は、多重化分離部801にお
いて、多重化されている符号化情報を個々の符号情報に
分離される。分離されたLPC符号Lは、LPC復号化
部802に出力され、分離された適応音源ベクトル符号
Aは、適応音源符号帳805に出力され、分離された音
源利得符号Gは、量子化利得生成部806に出力され、
分離された固定音源ベクトル符号Fは、固定音源符号帳
807へ出力される。
01から出力された符号LからLPCを復号し、合成フ
ィルタ803に出力する。適応音源符号帳805は、多
重化分離部801から出力された符号Aからピッチラグ
が復号され、復号されたピッチラグと直前フレームの復
号ピッチラグとを用いて現フレームの各サンプルにおけ
るピッチラグが補間により算出される。補間されたピッ
チラグを用いて適応音源ベクトルを生成し、その適応音
源ベクトルを乗算器808へ出力する。
01から出力された符号Fで指定される固定音源ベクト
ルを生成し、その固定音源ベクトルを乗算器809へ出
力する。固定音源ベクトルには、前記補間されたピッチ
を用いたピッチ周期化が適用されている。
801から出力された音源利得符号Gで指定される適応
音源ベクトル利得と固定音源ベクトル利得を復号して、
この適応音源ベクトル利得と固定音源ベクトル利得を乗
算器808,809へそれぞれ出力する。
前記適応符号ベクトル利得を乗算して、その乗算結果を
加算器810へ出力する。乗算器809は、前記固定符
号ベクトルに前記固定符号ベクトル利得を乗算して、そ
の乗算結果を加算器810へ出力する。加算器810
は、乗算器808及び乗算器809から出力された利得
乗算後の適応音源ベクトルと固定音源ベクトルの加算を
行い、その加算結果を合成フィルタ803へ出力する。
出力された音源ベクトルを駆動信号として、LPC復号
化部802によって復号されたフィルタ係数を用いて、
フィルタ合成を行い、合成した信号を後処理部804へ
出力する。後処理部804は、ホルマント強調やピッチ
強調といったような音声の主観的な品質を改善する処理
や、定常雑音の主観的品質を改善する処理などを合成し
た信号に対して施した上で、最終的な復号音声信号とし
て出力する。なお、固定音源符号帳807の構成は前述
の固定音源符号帳207と同じで、図3及び図4で示し
たものである。
は、入力音声信号における有声定常部などの周期的信号
区間にのみ適用し、その他の区間に対しては従来のCE
LP符号化・復号化処理を適用する構成とすることも可
能である。
内でのピッチ周期の変化が無視できない場合でも、周期
化のピッチ周期がそれに対応して変化するため、ピッチ
周期化が有効に機能しなくなるということを防止するこ
とができる。また、(サブ)フレーム内でのピッチ周期
の変化が無視できない場合でも、その変化するピッチに
対応して並べたパルス列を音源ベクトルとして用いるた
め、効果的に励振音源を表現することができる。
ず、種々変更して実施することが可能である。
ルス符号帳から出力されたパルスのパルス位置情報に基
づいて線形補間ピッチを決定し、この線形補間ピッチを
用いて音源ベクトルに対して周期化処理を行うことによ
りピッチ周期が時間的に変化する固定音源ベクトルを出
力するので、(サブ)フレーム内でのピッチ周期の変化
が無視できない場合でも、その変化するピッチに対応し
て並べたパルス列を音源ベクトルとして用いるため、効
果的に励振音源を表現することができる。
音声復号化装置を備えた音声信号送信装置及び音声信号
受信装置を示すブロック図
成を示すブロック図
いられる固定音源符号帳を示す図
いられる固定音源符号帳を示す図
ロック図
けるパルス形状波形の周期化方法を説明するための図
ける固定音源符号帳を探索する動作を示すフロー図
成を示すブロック図
Claims (14)
- 【請求項1】 パルス符号帳から出力されたパルスのパ
ルス位置情報に基づいて線形補間ピッチを決定する線形
補間ピッチ算出手段と、前記線形補間ピッチを用いて音
源ベクトルに対して周期化処理を行うことによりピッチ
周期が時間的に変化する固定音源ベクトルを出力する周
期化手段と、を具備することを特徴とする固定音源符号
帳。 - 【請求項2】 固定音源ベクトルは、ピッチ周期で並べ
たパルス列を組み合わせてなることを特徴とする請求項
1記載の固定音源符号帳。 - 【請求項3】 パルス列のパルスが、単位パルスでなく
予め定められた形状を有することを特徴とする請求項2
記載の固定音源符号帳。 - 【請求項4】 線形補間ピッチは、現フレームのピッチ
周期と前フレームのピッチ周期とを用いた補間処理によ
って求められることを特徴とする請求項1から請求項3
のいずれかに記載の固定音源符号帳。 - 【請求項5】 現フレームのピッチと前フレームのピッ
チとを用いて現フレームの各サンプルにおける補間ピッ
チを算出する線形補間ピッチ算出手段と、予め定められ
たパルス形状を生成するパルス形状生成手段と、前記パ
ルス形状を前記補間ピッチを用いて周期化する周期化手
段と、音源パルスを生成するパルス符号帳と、前記音源
パルスに前記周期化されたパルス形状を畳み込む畳み込
み演算手段と、を具備することを特徴とする固定音源ベ
クトル生成装置。 - 【請求項6】 現フレームのピッチと前フレームのピッ
チとを用いて現フレームの各サンプルにおける補間ピッ
チを算出する工程と、予め定められたパルス形状を生成
する工程と、前記パルス形状を前記補間ピッチを用いて
周期化する工程と、音源パルスを生成する工程と、前記
音源パルスに対して前記周期化されたパルス形状を畳み
込む工程と、を具備することを特徴とする固定音源ベク
トル生成方法。 - 【請求項7】 音源ベクトル生成プログラムを格納し、
コンピュータにより読み取り可能である記録媒体であっ
て、前記音源ベクトル生成プログラムは、現フレームの
ピッチと前フレームのピッチを用いて現フレームの各サ
ンプルにおける補間ピッチを算出する手順と、前記補間
ピッチを用いて周期的波形を生成する手順と、パルス音
源を生成する手順と、前記パルス音源に前記周期的波形
を畳み込む手順と、を含むことを特徴とする可能な記憶
媒体。 - 【請求項8】 コンピュータにより動作可能であり、現
フレームのピッチと前フレームのピッチを用いて現フレ
ームの各サンプルにおける補間ピッチを算出する手順
と、前記補間ピッチを用いて周期的波形を生成する手順
と、パルス音源を生成する手順と、前記パルス音源に前
記周期的波形を畳み込む手順と、を含むことを特徴とす
る音源ベクトル生成プログラム。 - 【請求項9】 請求項1から請求項4のいずれかに記載
の固定音源符号帳と、入力音声信号の周期成分を表し、
フレーム間で補間され時間的に変化するピッチ周期を用
いる適応音源符号帳と、入力音声信号のスペクトル特性
を表すパラメータを量子化・符号化する手段と、前記固
定音源符号帳と前記適応音源符号帳とから生成される各
音源ベクトルと前記パラメータとを用いて合成音声信号
を合成する手段と、入力音声信号と前記合成音声信号と
の歪みが小さくなるように前記固定音源符号帳と前記適
応符号帳からの最終的な出力を決定する手段と、を具備
することを特徴とする音声符号化装置。 - 【請求項10】 請求項1から請求項4のいずれかに記
載の固定音源符号帳と、合成音声信号の周期成分を表す
適応音源符号帳と、音声符号化装置によって符号化され
たスペクトル特性を表すパラメータを復号化する手段
と、前記音声符号化装置において決定された音源ベクト
ルを固定音源符号帳と適応音源符号帳とから復号し、復
号された音源ベクトルと前記パラメータとから合成音声
信号を合成する手段と、を具備することを特徴とする音
声復号化装置。 - 【請求項11】 音声信号を電気的信号に変換する音声
入力装置と、この音声入力信号装置から出力される信号
をディジタル信号に変換するA/D変換装置と、このA
/D変換装置から出力されるディジタル信号を入力音声
信号として符号化を行う請求項9記載の音声符号化装置
と、この音声符号化装置から出力される符号化情報に対
して変調処理等を行うRF変調装置と、このRF変調装
置から出力された信号を電波に変換して送信する送信ア
ンテナと、を具備することを特徴とする音声信号送信装
置。 - 【請求項12】 受信電波を受信する受信アンテナと、
前記受信アンテナで受信した音声信号の復号化処理を行
う請求項10記載の音声復号化装置と、前記音声復号化
装置によって復号化されたディジタル音声信号をD/A
変換するD/A変換装置と、前記D/A変換装置から出
力される電気的信号を音声信号に変換する音声出力装置
と、を具備することを特徴とする音声信号受信装置。 - 【請求項13】 請求項11記載の音声信号送信装置及
び請求項12記載の音声信号受信装置の少なくとも一方
を備え、基地局装置との間で無線通信を行うことを特徴
とする通信端末装置。 - 【請求項14】 請求項11記載の音声信号送信装置及
び請求項12記載の音声信号受信装置の少なくとも一方
を備え、通信端末装置との間で無線通信を行うことを特
徴とする基地局装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001195469A JP2003015699A (ja) | 2001-06-27 | 2001-06-27 | 固定音源符号帳並びにそれを用いた音声符号化装置及び音声復号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001195469A JP2003015699A (ja) | 2001-06-27 | 2001-06-27 | 固定音源符号帳並びにそれを用いた音声符号化装置及び音声復号化装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003015699A true JP2003015699A (ja) | 2003-01-17 |
Family
ID=19033436
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001195469A Pending JP2003015699A (ja) | 2001-06-27 | 2001-06-27 | 固定音源符号帳並びにそれを用いた音声符号化装置及び音声復号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2003015699A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012507751A (ja) * | 2008-10-30 | 2012-03-29 | クゥアルコム・インコーポレイテッド | 低ビットレート適用例のための遷移音声フレームのコーディング |
US8768690B2 (en) | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
-
2001
- 2001-06-27 JP JP2001195469A patent/JP2003015699A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8768690B2 (en) | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
JP2012507751A (ja) * | 2008-10-30 | 2012-03-29 | クゥアルコム・インコーポレイテッド | 低ビットレート適用例のための遷移音声フレームのコーディング |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0409239B1 (en) | Speech coding/decoding method | |
US6691084B2 (en) | Multiple mode variable rate speech coding | |
JP4005359B2 (ja) | 音声符号化及び音声復号化装置 | |
JP4550289B2 (ja) | Celp符号変換 | |
US20060074644A1 (en) | Voice code conversion apparatus | |
EP1768105B1 (en) | Speech coding | |
US20020016711A1 (en) | Encoding of periodic speech using prototype waveforms | |
US9972325B2 (en) | System and method for mixed codebook excitation for speech coding | |
JP2004514182A (ja) | 広帯域信号コーディング用の代数コードブック中のパルス位置と符号の索引付け方法 | |
JP3343082B2 (ja) | Celp型音声符号化装置 | |
JP3236592B2 (ja) | デジタル音声符号器において使用するための音声符号化方法 | |
JP3888097B2 (ja) | ピッチ周期探索範囲設定装置、ピッチ周期探索装置、復号化適応音源ベクトル生成装置、音声符号化装置、音声復号化装置、音声信号送信装置、音声信号受信装置、移動局装置、及び基地局装置 | |
JP4578145B2 (ja) | 音声符号化装置、音声復号化装置及びこれらの方法 | |
JP2829978B2 (ja) | 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置 | |
JP3579276B2 (ja) | 音声符号化/復号化方法 | |
JP2003015699A (ja) | 固定音源符号帳並びにそれを用いた音声符号化装置及び音声復号化装置 | |
JP3510168B2 (ja) | 音声符号化方法及び音声復号化方法 | |
JP3984048B2 (ja) | 音声/音響信号の符号化方法及び電子装置 | |
JP3071800B2 (ja) | 適応ポストフィルタ | |
JPH02160300A (ja) | 音声符号化方式 | |
JP3017747B2 (ja) | 音声符号化装置 | |
JP3984021B2 (ja) | 音声/音響信号の符号化方法及び電子装置 | |
JP3144244B2 (ja) | 音声符号化装置 | |
JPH034300A (ja) | 音声符号化復号化方式 | |
JPH0291699A (ja) | 音声符号化復号化方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040119 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060324 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070220 |