JP2000214900A - 音声符号化/復号化方法 - Google Patents
音声符号化/復号化方法Info
- Publication number
- JP2000214900A JP2000214900A JP11014455A JP1445599A JP2000214900A JP 2000214900 A JP2000214900 A JP 2000214900A JP 11014455 A JP11014455 A JP 11014455A JP 1445599 A JP1445599 A JP 1445599A JP 2000214900 A JP2000214900 A JP 2000214900A
- Authority
- JP
- Japan
- Prior art keywords
- pulse
- integer
- speech
- pulse position
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 37
- 230000005236 sound signal Effects 0.000 claims abstract description 11
- 239000013598 vector Substances 0.000 claims description 68
- 230000015572 biosynthetic process Effects 0.000 claims description 36
- 238000003786 synthesis reaction Methods 0.000 claims description 36
- 238000005070 sampling Methods 0.000 claims description 10
- 230000002194 synthesizing effect Effects 0.000 abstract description 5
- 239000011295 pitch Substances 0.000 description 37
- 230000003044 adaptive effect Effects 0.000 description 18
- 230000005284 excitation Effects 0.000 description 12
- 230000006978 adaptation Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000013139 quantization Methods 0.000 description 6
- 230000000295 complement effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 101150087426 Gnal gene Proteins 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
補数に多くの符号化ビットを割り当てることを可能とし
て高音質な音声符号化を実現する。 【解決手段】入力端子101への入力音声信号をLPC
分析部102、LPC量子化部103を経てLPC合成
部104に与えて合成フィルタを構成し、入力音声信号
を合成フィルタの特性を表す量子化LPC係数と合成フ
ィルタを駆動するための駆動信号とで表現して符号化す
る際、パルス音源部105Aにおいてパルス位置選択部
111でパルス位置符号帳110に格納されている整数
パルス位置および非整数パルス位置からパルス位置候補
を選択して、整数位置パルス生成部112および非整数
位置パルス生成部113により駆動信号のサンプル点の
位置に設定される整数位置パルスおよびサンプル点の中
間位置に設定される非整数位置パルスを生成し、これら
を統合して駆動信号の元となるパルス列を生成する。
Description
ボイスメモなどに用いられる低レート音声符号化/復号
化方法に関する。
音声信号や楽音の情報を少ない情報量に圧縮して伝送ま
たは蓄積するための符号化技術として、CELP方式(C
ode Excited Linear Prediction (M.R.Schroeder and
B.S.Atal, "Code Excited Linear Prediction (CELP) :
High Quality Speech at Very Low Bit Rates," Proc.
ICASSP, pp.937-940, 1985 (文献1)がよく用いられ
ている。
化方式であり、入力音声信号は線形予測分析によって音
韻情報を表す線形予測係数と、音の高さ等を表す予測残
差信号に分けられる。線形予測係数を基に合成フィルタ
と呼ばれる再帰型のディジタルフィルタが構成され、こ
の合成フィルタに予測残差信号を駆動信号として入力す
ることで元の入力音声信号を復元することができる。低
レートで符号化するためには、これらの線形予測係数と
予測残差信号をより少ない情報量で符号化する必要があ
る。
ベクトルと雑音ベクトルという2種類のベクトルにゲイ
ンを乗じて足し合わせることで得られる駆動信号を用い
て近似する。雑音ベクトルは通常、多数の候補を符号帳
に格納しておき、この中から最適なものを探索する方法
で生成される。この探索には、全ての雑音ベクトルをピ
ッチベクトルと合わせて合成フィルタに通すことで合成
音声信号を生成し、この合成音声信号の歪み(入力音声
信号に対する誤差)が最も小さい合成音声信号を生成す
る雑音ベクトル選ぶという方法がとられる。従って、如
何に効率よく雑音ベクトルを符号帳に格納しておくかが
CELP方式の重要なポイントになる。
ベクトルを数個のパルスからなるパルス列で表現するパ
ルス音源が知られている。文献2(K.Ozawa and T. Aras
eki,"Low Bit Rate Multi-pulse Speech Coder with Na
tural Speech Quality," IEEE Proc. ICASSP'86, pp.45
7-460, 1986)に開示されているマルチパルス方式などが
その例である。
k)(J-P.Adoul et al, "Fast CELP oding based on alge
braic codes", Proc. ICASSP'87, pp.1957-1960(文献
3)は、雑音ベクトルをパルスの有無と極性(+,−)
だけで表す簡単な構造である。マルチパルスと異なり、
パルスの振幅が1という制限があるにも関わらず、音質
がそれほど劣化しない点や、高速な探索方法が提案され
ている点から、近年低レート符号化で広く用いられてい
る。さらに、代数構造符号帳を用いる方式には、文献4
(Chang Deyuan, "An 8kb/s low complexity ACELP spee
ch codec, "1996 3rd International Conference on Si
gnal Processing, pp. 671-4, 1996)に示されているよ
うに、パルスに振幅をもたせる改良方式も提案されてい
る。
音源では、パルスを配置するパルス位置候補が整数サン
プル位置、つまり雑音ベクトルのサンプル点の位置に限
定されているため、雑音ベクトルの性能を向上させるべ
くパルス位置候補に割り当てるビット数を増やそうとし
ても、フレーム内に含まれるサンプル数を表すのに必要
なビット数以上のビットを割り当てることができないと
いう問題がある。
ているようにパルス位置候補の適応化を行う場合におい
ても、位置情報を表すビット数が多いときは、パルス位
置侯補を分散させた箇所にもほとんどのサンプルにパル
ス位置候補が設定されてしまい、集中させた箇所との差
が出にくくなり、適応化の効果が薄くなるという問題が
生じる。
ーム内に含まれる駆動信号のサンプル数にかかわらずパ
ルス位置情報に任意のビット数を割り当てることがで
き、音質の向上を可能とする音声符号化/復号化方法を
提供することを目的とする。
め、本発明は合成フィルタを駆動する駆動信号の構成法
に特徴を有する。すなわち、本発明に係る音声符号化/
復号化方法では、駆動信号はパルス列により構成され、
パルス列は駆動信号のサンプル点の位置に設定される第
1のパルスおよび駆動信号のサンプル点とサンプル点と
の間の位置に設定される第2のパルスのいずれかから選
択されたパルスを含んで構成される。
では、駆動信号がピッチベクトルと雑音ベクトルから構
成され、雑音ベクトルは雑音ベクトルのサンプル点の位
置に設定される第1のパルスおよび雑音ベクトルのサン
プル点とサンプル点との間の位置に設定される第2のパ
ルスのいずれかから選択されたパルスを含むパルス列に
より構成される。
では、同様に駆動信号がピッチベクトルと雑音ベクトル
から構成され、雑音ベクトルはピッチベクトルの形状に
基づいて適応化されるパルス位置候補から選ばれた所定
数のパルス位置にパルスを配置することで生成されたパ
ルス列を用いて構成される。そして、パルス位置候補は
雑音ベクトルのサンプル点の位置に設定される第1のパ
ルスおよび雑音ベクトルのサンプル点とサンプル点との
間の位置に設定される第2のパルスのいずれかから選択
されたパルスを含むパルス列により構成される。
位置侯補数が駆動信号/雑音ベクトルのサンプル点の数
以下に限定されていたのに対し、本発明ではこれにサン
プル点とサンプル点との間の位置を加えることで、理論
的には無限個のパルス位置候補数の設定が可能となる。
その結果、サンプル数に無関係にパルス位置候補に多く
の符号化ビットを割り当てることができるようになり、
復号音声信号の音質向上、さらには符号化効率の改善が
可能となる。
施の形態を説明する。 (第1の実施形態) [符号化側について]図1に、本発明の第1の実施形態
に係る音声信号符号化方法を適用した音声信号符号化シ
ステムの構成を示す。
101、LPC分析部102、LPC量子化部103、
LPC合成部104、パルス音源部105A、利得乗算
部106、減算部107および符号選択部108から構
成される。また、パルス音源部105Aは、パルス位置
符号帳110、パルス位置選択部111、整数位置パル
ス生成部112、非整数位置パルス生成部113および
切替部114,115から構成される。
声信号信号が1フレーム分の長さの単位で入力され、こ
れに同期してLPC分析部102で線形予測分析が行わ
れることにより、声道特性に相当する線形予測係数(L
PC係数)が求められる。LPC係数はLPC量子化部
103で量子化され、この量子化値がLPC合成部10
4に入力されると共に、量子化値を指し示すインデック
スAが符号化結果として図示しない多重化部へ出力され
る。
08から入力されたインデックス(コード)Cに従っ
て、パルス位置選択部111でパルス位置符号帳110
に格納されているパルス位置候補が選択される。ここ
で、パルス位置符号帳110には後に詳しく説明するよ
うに、駆動信号の整数サンプルにパルスを立てることを
示す整数パルス位置と、非整数サンプルにパルスを立て
ることを示す非整数パルス位置が混在して格納されてい
る。パルス位置選択部111が選択するパルス位置候補
の数は通常予め決められており、1つあるいは数個であ
る。
ス位置候補が整数パルス位置か非整数パルス位置かに応
じて切替部114,115を制御して、選択したパルス
位置候補が整数パルス位置の場合は整数位置パルス生成
部112によって生成された整数位置パルス(第1のパ
ルス)が出力されるようにし、選択したパルス位置候補
が非整数パルス位置の場合は非整数位置パルス生成部1
13によって生成された非整数位置パルス(第2のパル
ス)が出力されるようにする。このようにして得られた
各パルスは、一系統のパルス列に合成されてパルス音源
部105Aから出力される。
ス列は、利得乗算部106で各パルス毎またはパルス列
全体に対して、インデックスGに対応して図示しない利
得符号帳から選択された利得(極性も含む)が与えられ
た後、LPC合成部104に入力される。LPC合成部
104は、合成フィルタと呼ばれる再帰型のディジタル
フィルタにより構成され、入力されたパルス列から合成
音声信号を生成する。この合成音声信号の歪み、つまり
合成音声信号と入力音声信号との誤差が減算部107で
求められ、符号選択部108に入力される。誤差の計算
時には、通常、パルス列に与える利得は最適な値に設定
される。
応してLPC合成部104で生成される合成音声信号の
歪み(合成音声信号と入力音声信号との差)を評価し
て、これが最小となるインデックスCを選択し、そのイ
ンデックスCを図示しない利得符号帳を探索することで
得られた利得を表すインデックスGと共に図示しない多
重化部へ出力する。
105Aにおいて、パルス位置符号帳110に格納され
るパルス位置候補に非整数パルス位置を追加した点と、
これに対応して整数パルス位置生成部112に加えて非
整数位置パルスを生成するための非整数位置パルス生成
部113を追加している点である。以下、図2を用いて
非整数位置パルスの生成方法を説明する。
り本実施形態で整数位置パルスと称しているパルスの生
成法である。△印がパルス位置を示しており、太い矢印
がその位置に立てられた整数位置パルス(第1のパル
ス)である。短い縦線は駆動信号のサンプル点を示して
おり、従来法ではパルス位置はこのサンプル点上にのみ
設定されていた。
ルス位置のみ値が存在し、その他が0という波形の連続
値での表現は、図2(a)の破線で示された補間フィル
タと呼ばれる波形と同一になる。この波形を駆動信号波
形として、これを一定間隔のサンプル点でサンプリング
すると、パルス位置以外のサンプル点では破線で示す駆
動信号波形の値が0になっているため、パルス位置のみ
に値が存在する結果となっている。
パルス(第2のパルス)の生成法である。△印がパルス
位置であり、サンプル点とサンプル点との間の位置この
例ではサンプル点のちょうど中間の位置に設定されてい
る。破線で示される波形は、このパルス位置に設定され
るパルスの連続値での表現である。この波形を駆動信号
波形として一定間隔のサンプル点でサンプリングするこ
とで、離散値を得ることができる。このサンプリングさ
れた値を太い矢印で示す。
ス位置の前後のサンプル点に立つ複数のパルスのセット
で表すことにする。破線の波形は無限の幅を持っている
が、実現上有限の長さで打ち切り、数本のパルスのセッ
トで表現する。打ち切る場合には、必要に応じてハミン
グ窓などの適当な窓をかけることもある。パルスの数は
多いほど打ち切る前の状態に近いので望ましいが、△印
の両側のパルスのみからなる2本のパルスセットでも十
分な性能が得られる。
れるパルス列の例を示す。CELP方式では、LPC合
成部の入力となる駆動信号は所定のフレーム(サブフレ
ーム)長単位で生成される。本実施形態のようなパルス
音源を用いる方式では、このサブフレーム内に数本のパ
ルスを立てることで駆動信号が生成される。図3はフレ
ーム長が26で、パルス数が2の場合のパルス列を示し
ている。図3の(1)が整数位置パルスであり、パルス
位置は5である。また、図3の(2)が非整数位置パル
スであり、パルス位置は15.5である。非整数位置パ
ルスは4本のパルスのセットで表している。
Cで示されるパルス位置候補をパルス位置符号帳110
から選び、パルス毎に整数位置パルス生成部112と非
整数位置パルス生成部113を使い分け、図3に示した
ようなパルス列を生成する。パルス列は整数位置パルス
のみで構成される場合や、非整数位置パルスのみで構成
される場合もあり、最終的に目標ベクトルとの歪みが最
小となるパルス位置候補が選ばれる。
位置パルスを用いることで、パルス位置符号帳110に
格納し得るパルス位置候補の数が理論上は無限個とな
り、より精度の高いパルス位置の設定が可能となる。 [復号化側について]次に、図4を用いて図1の音声符
号化システムに対応する本実施形態に係る音声復号シス
テムについて説明する。
化部203、LPC合成部204、パルス音源部205
Aおよび利得乗算部103から構成される。また、パル
ス音源部205Aは図1のパルス音源部105Aと同
様、パルス位置符号帳210、パルス位置選択部21
1、整数位置パルス生成部212、非整数位置パルス生
成部213および切替部214,215から構成され
る。
符号化システムから伝送されてきた符号化ストリームが
入力される。この符号化ストリームは、図示しない逆多
重化部によって前述したLPC合成部で用いられる量子
化されたLPC係数を示すインデックスA、パルス音源
部205Aで生成されるパルス列の各パルスの位置情報
を示すインデックスC、および図示しない利得符号帳の
探索で選ばれた利得を示すインデックスGに分離されて
取り出される。
1で復号され、量子化LPC係数が得られる。この量子
化LPC係数は、LPC合成部204に合成フィルタの
係数として与えられる。
のパルス位置選択部211に入力される。パルス音源部
205Aでは、図1のパルス音源部105Aと同様に、
インデックスCに従ってパルス位置選択部211でパル
ス位置符号帳210に格納されている整数パルス位置と
非整数パルス位置が混在したパルス位置候補が選択され
ると共に、パルス位置選択部211により選択されたパ
ルス位置候補が整数パルス位置か非整数パルス位置かに
応じて切替部214,215が制御される。
したパルス位置候補が整数パルス位置の場合は整数位置
パルス生成部212によって生成された整数位置パル
ス、また選択したパルス位置候補が非整数パルス位置の
場合は非整数位置パルス生成部213によって生成され
た非整数位置パルスがそれぞれ出力され、これらが一系
統のパルス列に合成されてパルス音源部205Aから出
力される。
ス列は、利得乗算部206で各パルス毎またはパルス列
全体に対してインデックスGに従って図示しない利得符
号帳から得られた利得が与えられた後、LPC合成部2
04に入力される。LPC合成部204は、図1の合成
フィルタ104と同様に合成フィルタによって構成さ
れ、入力されたパルス列から合成音声信号(復号音声信
号)を生成する。
ルタを駆動するための駆動信号を構成するパルス列に、
従来の整数位置パルスに加えて非整数位置パルスを用い
ることで、パルス位置符号帳110,210に格納し得
るパルス位置候補の数が理論上は無限個となるため、パ
ルス位置候補により多くの符号化ビットを割り当てるこ
とが可能となり、高音質な音声符号化/復号化を実現す
ることができる。
に係る音声符号化方法を適用した音声符号化システムの
構成を示す。
104の合成フィルタを駆動するための駆動信号をピッ
チベクトルと雑音ベクトルにより構成する場合の例であ
る。図5において図1と相対応する部分に同一符号を付
して説明すると、この音声符号化システムは、図1に示
した第1の実施形態の音声符号化システムに、聴覚重み
付け部121、適応符号帳122、パルス位置候補探索
部123、利得乗算部124、入力端子125、ピッチ
フィルタ126および加算部127が加わり、さらにパ
ルス音源部105Bにおいて図1のパルス位置符号帳1
10が適応パルス位置符号帳120に置き換わった構成
になっている。
号が1フレーム分の長さの単位で入力され、第1の実施
形態の音声符号化システムと同様にしてLPC分析部1
02およびLPC量子化部103を介して量子化された
LPC係数が生成されると共に、そのインデックスAが
出力される。
04で合成された合成音声信号と入力音声信号との差が
減算部107で求められ、聴覚重み付け部121で聴覚
重み付けがなされた後、符号選択部108に入力され
る。この符号選択部108によって、聴覚重み付け部1
21で重み付けがなされた後の合成音声信号と入力音声
信号との差のパワが最小となるピッチベクトルが選ばれ
る。なお、音声の立上り部などではピッチベクトルの代
わりに固定の符号帳から得られた符号ベクトルが用いら
れることもあるが、本発明ではこれらをまとめてピッチ
ベクトルと呼ぶことにする。
部104に入力された駆動信号のピッチベクトルが格納
されており、符号選択部108からのインデックスBに
従って一つのピッチベクトルが選択される。適応符号帳
122から選択されたピッチベクトルは、利得乗算部1
24でインデックスG0に従って図示しない利得符号帳
から得られた利得が乗じられた後、加算部127に入力
される。
号帳122から選択されたピッチベクトルの形状に基づ
いて適応化された、サブフレーム内のパルス位置候補が
生成される。パルス位置候補に割り当てるビット数が少
ない場合は、サブフレーム内の全てのサンプルをパルス
位置候補とするにはビット数が不足してしまう。そこ
で、本実施形態では特開平9−355748に開示され
ている方法を用いて効率の良いパルス位置を選択する。
このとき、本発明に従いパルス位置候補に整数パルス位
置だけでなく非整数パルス位置を含めることにより、パ
ルス位置候補の適応化がより効果的となる。
にして得られたパルス位置候補が格納されている。この
適応パルス位置符号帳120には、サブフレーム内の一
部のパルス位置(非整数パルス位置を含む)しか格納さ
れていないが、これらはピッチベクトルの形状に基づい
て適応化された少数の候補であるため、低ビットレート
で高音質な合成音声信号が得られる。
態の音声符号化システムと同様の手法でパルス列が出力
され、このパルス列は必要に応じてピッチフィルタ12
6により、入力端子125に与えられたピッチ周期Lの
情報に従ってピッチ周期化される。
要に応じてピッチフィルタ126によってピッチ周期化
されたパルス列は、利得乗算部106でインデックスG
1により図示しない利得符号帳から得られた利得が乗じ
られた後、加算部127に入力され、この加算部127
で適応符号帳122から選択されかつ利得乗算部124
で利得が乗じられたピッチベクトルと加算される。そし
て、この加算部127の出力信号がLPC合成部104
に合成フィルタの駆動信号として与えられる。
ス位置候補探索部122において整数パルス位置候補の
みならず非整数パルス位置候補をも含むパルス位置候補
をピッチベクトルの形状に基づいて適応化することによ
り、特開平9−355748に開示されている整数パル
ス位置候補のみからなるパルス位置候補を適応化する場
合に比べて、適応化の効果が大きく向上する点である。
以下、図6を用いてこの効果を説明する。
むパルス位置候補の適応化方法(従来法)を示し、図6
(b)は整数パルス位置候補に加えて非整数パルス位置
候補を含むパルス位置候補を適応化する本実施形態の適
応化方法を示している。短い縦線がサンプル点、Δ印が
適応化で選ばれたパルス位置候補、波形はピッチベクト
ルの振幅包絡を示している。いずれもサブフレーム内の
サンプル点の数は16個、パルス位置候補の数は10個
である。
集中している近辺にパルス位置候補が集中しているが、
パルス位置候補の数が10個と多いため、ピッチベクト
ルのパワが集中している点とそこからやや離れてパワが
大きく減少している点に、同等の密度でパルス位置候補
が配置される飽和現象が発生している。その結果、振幅
包絡の形状とパルス位置候補の配置の具合にずれが生
じ、適応化の効果が薄れるという問題がある。
に加えて1/2サンプル点の非整数パルス位置を含むパ
ルス位置候補に対して適応化を行った場合である。パワ
の集中点にパルス位置候補が集中し、パワの減少ととも
にパルス位置候補が減少する配置が可能となり、適応化
が効率良く機能することが分かる。このようにパルス位
置候補の数が多い場合は、本発明による非整数パルス位
置を用いることで、パルス位置候補数の飽和現象を解決
でき、適応化の効果を最大限に引き出すことが可能にな
る。 [復号化側について]次に、図7を用いて図5の音声符
号化システムに対応する本実施形態に係る音声復号シス
テムについて説明する。
付して説明すると、図7の音声復号化システムは、LP
C逆量子化部203、LPC合成部204、パルス音源
部205B、利得乗算部206、適応符号帳222、パ
ルス位置候補探索部223、ピッチ周期情報の入力端子
225、ピッチフィルタ226および加算部227から
構成される。また、パルス音源部205Bは、図5のパ
ルス音源部105Bと同様、適応パルス位置符号帳22
0、パルス位置選択部211、整数位置パルス生成部2
12、非整数位置パルス生成部213および切替部21
4,215から構成される。
符号化システムから伝送されてきた符号化ストリームが
入力される。この符号化ストリームは、図示しない逆多
重化部によって前述したLPC合成部で用いられる量子
化されたLPC係数を示すインデックスA、パルス音源
部205Bで生成されるパルス列の各パルスの位置情報
を示すインデックスC、および図示しない利得符号帳の
探索で選ばれた利得を示すインデックスG0,G1に分
離されて取り出される。
1で復号され、量子化LPC係数が得られる。この量子
化LPC係数は、LPC合成部204に合成フィルタの
係数として与えられる。
のパルス位置選択部211に入力される。パルス音源部
205Bでは、図5のパルス音源部105Bと同様に、
インデックスCに従ってパルス位置選択部211で適応
パルス位置符号帳220に格納されている整数パルス位
置と非整数パルス位置が混在したパルス位置候補が選択
されるとともに、パルス位置選択部211により選択さ
れたパルス位置候補が整数パルス位置か非整数パルス位
置かに応じて切替部214,215が制御される。
したパルス位置候補が整数パルス位置の場合は整数位置
パルス生成部212によって生成された整数位置パル
ス、また選択したパルス位置候補が非整数パルス位置の
場合は非整数位置パルス生成部213によって生成され
た非整数位置パルスがそれぞれ出力され、これらが一系
統のパルス列に合成されてパルス音源部205Bから出
力される。
ス列は、必要に応じてピッチフィルタ226により入力
端子225に与えられたピッチ周期Lの情報に従ってピ
ッチ周期化され、さらに利得乗算部206で各パルス毎
またはパルス列全体に対してインデックスG1に従って
図示しない利得符号帳から得られた利得が与えられた
後、加算部227に入力され、この加算部227で適応
符号帳222から選択されかつ利得乗算部224でイン
デックスG0に従って図示しない利得符号帳から得られ
た利得が乗じられたピッチベクトルと加算される。そし
て、この加算部227の出力信号がLPC合成部204
に合成フィルタの駆動信号として与えられることによ
り、合成音声信号(復号音声信号)が生成される。
ルス位置候補を含むパルス位置候補をピッチベクトルの
形状に基づき適応化することで、ピッチベクトルの形状
により忠実なパルス位置候補の配置が可能となり、パル
ス位置候補数の飽和現象が解決されるため、高音質な符
号化/復号化を実現することができる。この効果はパル
ス位置候補数が多い場合、特に顕著になる。
に係る音声符号化方法を適用した音声符号化システムの
構成を示す。この音声符号化システムは、図5に示した
音声符号化システムと機能的には同じであるが、具体的
な実現手段が異なっている。
一符号を付して説明すると、この音声符号化システム
は、パルス音源部105Cが適応パルス位置符号帳12
0、パルス生成部131、ダウンサンプリング部132
およびパルス位置選択部111で構成され、さらにパル
ス位置候補探索部123に代えてマルチレートパルス位
置候補探索部133を用いる点が図5に示した第2の実
施形態の音声符号化システムと異なる。
は、雑音ベクトルをアップサンプリングしたパルス位置
候補を出力する。すなわち、1/Nサンプルまでの非整
数パルス位置候補を扱う場合、マルチレートパルス位置
候補探索部133はN倍のアップサンプリングを行って
非整数パルス位置候補を整数パルス位置候補に変換す
る。フレーム内の雑音ベクトルのサンプル点の数がMの
場合、図5のパルス位置候補探索部123は0〜M−1
の範囲の1/N刻みの整数パルス位置または非整数パル
ス位置を出力するのに対し、マルチレートパルス位置候
補探索部133では0〜NM−1の範囲の整数パルス位
置を出力することになる。
格納されるパルス位置候補は、全て整数値となるが、実
際のパルス位置をN倍した値となる。パルス生成部13
1では、適応パルス位置符号帳120から取り出された
パルス位置候補を受けてN倍のアップサンプリングがさ
れている状態でパルスを立てることにより、長さがNM
のパルス列を得る。ダウンサンプリング部132では、
これを1/N倍にダウンサンプリングして長さMのパル
ス列を得る。
出力されるアップサンプリングされた状態で配置された
パルスは、最終的にダウンサンプリング部132でダウ
ンサンプリングされて間引かれる。前述した第2の実施
形態は、この間引かれたパルスを非整数パルス位置に対
応するパルスのセットとして予め用意しておき、実際に
アップサンプリングの処理を行わずとも等価な結果を得
るものである。しかしながら、プログラムの構成等によ
り本実施形態のように実際にアップサンプリングを行っ
た方が見通しが良い場合もある。
で整数化されたパルス位置候補を出力する別の方法とし
て、ピッチベクトルをアップサンプリングした後、整数
パルス位置のみを用いるパルス位置適応化を行っても同
等の結果が得られるなど、様々な処理方法を用いること
が可能である。 [復号化側について]図9は、図8の音声符号化システ
ムに対応する本実施形態の音声復号化システムの構成を
示す図であり、パルス音源部205Cが図8のパルス音
源部105Cと同様に適応パルス位置符号帳220、パ
ルス生成部231、ダウンサンプリング部232および
パルス位置選択部211で構成され、さらにパルス位置
候補探索部223に代えてマルチレートパルス位置候補
探索部233を用いる点が図7に示した音声復号化シス
テムと異なる。
と動作は、図7の音声復号化システムと図8の音声符号
化システムの説明から自明であるため、説明は省略す
る。
成フィルタの駆動信号を構成するパルス列を生成する際
に、フレーム内のサンプル点の数に関係なく多くのパル
ス位置候補を用いることが可能となり、高音質な符号化
/復号化を実現できる。
合、ピッチベクトルの形状により忠実なパルス位置候補
の配置を可能とすることによって、パルス位置候補数の
飽和現象の問題を解決し、より高音質な音声符号化/復
号化を実現することができる。
テムの構成を示すブロック図
す図
ルス列の例を示す図
テムの構成を示すブロック図
テムの構成を示すブロック図
いたパルス位置候補の適応化の様子を示す図
テムの構成を示すブロック図
テムの構成を示すブロック図
テムの構成を示すブロック図
Claims (6)
- 【請求項1】音声信号を少なくとも合成フィルタの特性
を表す情報と該合成フィルタを駆動するための駆動信号
とで表現して符号化する音声符号化方法において、 前記駆動信号は、該駆動信号のサンプル点の位置に設定
される第1のパルスおよび該駆動信号のサンプル点とサ
ンプル点との間の位置に設定される第2のパルスのいず
れかから選択されたパルスを含むパルス列により構成さ
れることを特徴とする音声符号化方法。 - 【請求項2】音声信号を少なくとも合成フィルタの特性
を表す情報と該合成フィルタを駆動するためのピッチベ
クトルおよび雑音ベクトルからなる駆動信号とで表現し
て符号化する音声符号化方法において、 前記雑音ベクトルは、該雑音ベクトルのサンプル点の位
置に設定される第1のパルスおよび該雑音ベクトルのサ
ンプル点とサンプル点との間の位置に設定される第2の
パルスのいずれかから選択されたパルスを含むパルス列
により構成されることを特徴とする音声符号化方法。 - 【請求項3】音声信号を少なくとも合成フィルタの特性
を表す情報と該合成フィルタを駆動するためのピッチベ
クトルおよび雑音ベクトルからなる駆動信号とで表現し
て符号化する音声符号化方法において、 前記雑音ベクトルは、前記ピッチベクトルの形状に基づ
いて適応化されるパルス位置候補から選ばれた所定数の
パルス位置にパルスを配置することで生成されたパルス
列を用いて構成され、 前記パルス位置候補は、前記雑音ベクトルのサンプル点
に設定される第1のパルス位置候補および該雑音ベクト
ルのサンプル点とサンプル点との間の位置に設定される
第2のパルス位置候補を含むことを特徴とする音声符号
化方法。 - 【請求項4】駆動信号を合成フィルタに入力して音声信
号を復号化する方法であって、 前記駆動信号は、該駆動信号のサンプル点の位置に設定
される第1のパルスおよび該駆動信号のサンプル点とサ
ンプル点との間の位置に設定される第2のパルスのいず
れかから選択されたパルスを含むパルス列により構成さ
れることを特徴とする音声復号化方法。 - 【請求項5】雑音ベクトルとピッチベクトルとからなる
駆動信号を合成フィルタに入力して音声信号を復号化す
る方法であって、 前記雑音ベクトルは、該雑音ベクトルのサンプル点の位
置に設定される第1のパルスおよび該雑音ベクトルのサ
ンプル点とサンプル点との間の位置に設定される第2の
パルスのいずれかから選択されたパルスを含むパルス列
により構成されることを特徴とする音声復号化方法。 - 【請求項6】ピッチベクトルの形状に基づいて適応化さ
れるパルス位置候補から選ばれた所定数のパルス位置に
パルスを配置することで生成されたパルス列を用いて構
成される雑音ベクトルとピッチベクトルとからなる駆動
信号を合成フィルタに入力して音声信号を復号化する方
法であって、 前記パルス位置候補は、前記雑音ベクトルのサンプル点
に設定される第1のパルス位置候補および該雑音ベクト
ルのサンプル点とサンプル点との間の位置に設定される
第2のパルス位置候補を含むことを特徴とする音声復号
化方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP01445599A JP4008607B2 (ja) | 1999-01-22 | 1999-01-22 | 音声符号化/復号化方法 |
US09/488,748 US6611797B1 (en) | 1999-01-22 | 2000-01-21 | Speech coding/decoding method and apparatus |
US10/427,948 US6768978B2 (en) | 1999-01-22 | 2003-05-02 | Speech coding/decoding method and apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP01445599A JP4008607B2 (ja) | 1999-01-22 | 1999-01-22 | 音声符号化/復号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000214900A true JP2000214900A (ja) | 2000-08-04 |
JP4008607B2 JP4008607B2 (ja) | 2007-11-14 |
Family
ID=11861529
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP01445599A Expired - Fee Related JP4008607B2 (ja) | 1999-01-22 | 1999-01-22 | 音声符号化/復号化方法 |
Country Status (2)
Country | Link |
---|---|
US (2) | US6611797B1 (ja) |
JP (1) | JP4008607B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002071394A1 (en) * | 2001-03-07 | 2002-09-12 | Nec Corporation | Sound encoding apparatus and method, and sound decoding apparatus and method |
JP2008504578A (ja) * | 2004-06-30 | 2008-02-14 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャネル出力信号を発生するためのマルチチャネルシンセサイザおよび方法 |
JP2011525256A (ja) * | 2008-06-20 | 2011-09-15 | クゥアルコム・インコーポレイテッド | 低ビットレート適用のための遷移音声フレームの符号化 |
US8768690B2 (en) | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4008607B2 (ja) * | 1999-01-22 | 2007-11-14 | 株式会社東芝 | 音声符号化/復号化方法 |
US8818871B2 (en) * | 2001-06-21 | 2014-08-26 | Thomson Licensing | Method and system for electronic purchases using an intelligent data carrier medium, electronic coupon system, and interactive TV infrastructure |
JP2004061646A (ja) * | 2002-07-25 | 2004-02-26 | Fujitsu Ltd | Tfo機能を有する音声符号化器および方法 |
US7983922B2 (en) * | 2005-04-15 | 2011-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing |
WO2007068610A1 (en) * | 2005-12-15 | 2007-06-21 | Thomson Licensing | Packet loss recovery method and device for voice over internet protocol |
WO2008049221A1 (en) * | 2006-10-24 | 2008-05-02 | Voiceage Corporation | Method and device for coding transition frames in speech signals |
EP2157573B1 (en) | 2007-04-29 | 2014-11-26 | Huawei Technologies Co., Ltd. | An encoding and decoding method |
CN102299760B (zh) | 2010-06-24 | 2014-03-12 | 华为技术有限公司 | 脉冲编解码方法及脉冲编解码器 |
US11480965B2 (en) | 2010-11-19 | 2022-10-25 | Maid Ip Holdings Pty/Ltd | Automatic location placement system |
CN102623012B (zh) * | 2011-01-26 | 2014-08-20 | 华为技术有限公司 | 矢量联合编解码方法及编解码器 |
US9063931B2 (en) * | 2011-02-16 | 2015-06-23 | Ming-Yuan Wu | Multiple language translation system |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3789144A (en) * | 1971-07-21 | 1974-01-29 | Master Specialties Co | Method for compressing and synthesizing a cyclic analog signal based upon half cycles |
JPS62194296A (ja) * | 1986-02-21 | 1987-08-26 | 株式会社日立製作所 | 音声符号化方式 |
JP2903533B2 (ja) * | 1989-03-22 | 1999-06-07 | 日本電気株式会社 | 音声符号化方式 |
JP2940005B2 (ja) * | 1989-07-20 | 1999-08-25 | 日本電気株式会社 | 音声符号化装置 |
JP2906968B2 (ja) * | 1993-12-10 | 1999-06-21 | 日本電気株式会社 | マルチパルス符号化方法とその装置並びに分析器及び合成器 |
SE506379C3 (sv) * | 1995-03-22 | 1998-01-19 | Ericsson Telefon Ab L M | Lpc-talkodare med kombinerad excitation |
US6393391B1 (en) * | 1998-04-15 | 2002-05-21 | Nec Corporation | Speech coder for high quality at low bit rates |
JP4063911B2 (ja) | 1996-02-21 | 2008-03-19 | 松下電器産業株式会社 | 音声符号化装置 |
AU3708597A (en) * | 1996-08-02 | 1998-02-25 | Matsushita Electric Industrial Co., Ltd. | Voice encoder, voice decoder, recording medium on which program for realizing voice encoding/decoding is recorded and mobile communication apparatus |
US6385576B2 (en) * | 1997-12-24 | 2002-05-07 | Kabushiki Kaisha Toshiba | Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch |
JP4008607B2 (ja) * | 1999-01-22 | 2007-11-14 | 株式会社東芝 | 音声符号化/復号化方法 |
US6385574B1 (en) * | 1999-11-08 | 2002-05-07 | Lucent Technologies, Inc. | Reusing invalid pulse positions in CELP vocoding |
-
1999
- 1999-01-22 JP JP01445599A patent/JP4008607B2/ja not_active Expired - Fee Related
-
2000
- 2000-01-21 US US09/488,748 patent/US6611797B1/en not_active Expired - Fee Related
-
2003
- 2003-05-02 US US10/427,948 patent/US6768978B2/en not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002071394A1 (en) * | 2001-03-07 | 2002-09-12 | Nec Corporation | Sound encoding apparatus and method, and sound decoding apparatus and method |
CN1293535C (zh) * | 2001-03-07 | 2007-01-03 | 日本电气株式会社 | 声音编码设备和方法以及声音解码设备和方法 |
JP2008504578A (ja) * | 2004-06-30 | 2008-02-14 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャネル出力信号を発生するためのマルチチャネルシンセサイザおよび方法 |
JP4712799B2 (ja) * | 2004-06-30 | 2011-06-29 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャネル出力信号を発生するためのマルチチャネルシンセサイザおよび方法 |
JP2011525256A (ja) * | 2008-06-20 | 2011-09-15 | クゥアルコム・インコーポレイテッド | 低ビットレート適用のための遷移音声フレームの符号化 |
US8768690B2 (en) | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
Also Published As
Publication number | Publication date |
---|---|
JP4008607B2 (ja) | 2007-11-14 |
US20030195746A1 (en) | 2003-10-16 |
US6611797B1 (en) | 2003-08-26 |
US6768978B2 (en) | 2004-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3134817B2 (ja) | 音声符号化復号装置 | |
JP3346765B2 (ja) | 音声復号化方法及び音声復号化装置 | |
EP0926660B1 (en) | Speech encoding/decoding method | |
JP3180762B2 (ja) | 音声符号化装置及び音声復号化装置 | |
JPH0353300A (ja) | 音声符号化装置 | |
JPH1091194A (ja) | 音声復号化方法及び装置 | |
JP4008607B2 (ja) | 音声符号化/復号化方法 | |
JPH0990995A (ja) | 音声符号化装置 | |
JP2002268686A (ja) | 音声符号化装置及び音声復号化装置 | |
JP3275247B2 (ja) | 音声符号化・復号化方法 | |
JP3531780B2 (ja) | 音声符号化方法および復号化方法 | |
JP3268750B2 (ja) | 音声合成方法及びシステム | |
JP3579276B2 (ja) | 音声符号化/復号化方法 | |
JP3319396B2 (ja) | 音声符号化装置ならびに音声符号化復号化装置 | |
JP3232701B2 (ja) | 音声符号化方法 | |
JP2968109B2 (ja) | コード励振線形予測符号化器及び復号化器 | |
JP3292227B2 (ja) | 符号励振線形予測音声符号化方法及びその復号化方法 | |
JP3874851B2 (ja) | 音声符号化装置 | |
JP3410931B2 (ja) | 音声符号化方法及び装置 | |
JP3063087B2 (ja) | 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置 | |
JP2853170B2 (ja) | 音声符号化復号化方式 | |
JP3166697B2 (ja) | 音声符号化・復号装置及びシステム | |
JPH09179593A (ja) | 音声符号化装置 | |
JP3071800B2 (ja) | 適応ポストフィルタ | |
JP3563400B2 (ja) | 音声復号化装置及び音声復号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050311 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070529 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070605 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070803 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070828 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070830 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100907 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100907 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110907 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110907 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120907 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |