JPH02120898A - 音声符号化方式 - Google Patents

音声符号化方式

Info

Publication number
JPH02120898A
JPH02120898A JP63276513A JP27651388A JPH02120898A JP H02120898 A JPH02120898 A JP H02120898A JP 63276513 A JP63276513 A JP 63276513A JP 27651388 A JP27651388 A JP 27651388A JP H02120898 A JPH02120898 A JP H02120898A
Authority
JP
Japan
Prior art keywords
parameters
sound source
parameter
audio signal
pitch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63276513A
Other languages
English (en)
Inventor
Shigeru Ono
茂 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63276513A priority Critical patent/JPH02120898A/ja
Publication of JPH02120898A publication Critical patent/JPH02120898A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、離散音声信号を線形予測パラメータとピッチ
予測パラメータと予測残差に相当する音源パラメータと
で表す音声符号化方式に関する。
(従来の技術) 線形予測器とピッチ予測器を伴う予測符号化方式におい
ては、予測残差の量子化方法が低ビツトレートで高品質
な再生音声信号を得る為の重要な要因の一つである。量
子化対象信号の統計的な性質が分かっているとき、与え
られたビット数のもとで単位サンプル当りの量子化歪を
最小にする量子化法はベクトル量子化である。ベクトル
量子化は、量子化対象信号を−サンプルずつ量子化する
スカラー量子化とは異なり、複数のサンプルからなるベ
クトル(x (1)、x (2)、・・・ X(K))
を−括して量子化する方法である。ベクトル量子化は、
実際には、予め蓄えられた標準パタンのベクトル集合(
コードブックと呼ぶ)から適当な評価関数のもとで最適
と判断されるものを選択し、入力ベクトルを選択された
ベクトルで置き換える、という手続きで行われる。
ベクトル量子化は、与えられた評価関数のもので最も効
率のよい量子化法であることが情報理論的に示されてお
り、多くの音声符号化方式で用いられている。しかし、
このような理論的長所に反して、ベクトル量子化はベク
トル次元や量子化ビット数が大きくなると演算量が指数
関数的に増大する処理量の問題、或は、量子化対象信号
の統計的性質を反映したベクトル量子化器を設計するに
は多くのトレーニングサンプルが必要になること、更に
トレーニングサンプルで設計された量子化器が非トレー
ニングサンプルに対しては最適性を保証していないとい
う設計上の問題がある。特に、後者の問題は、どんな入
力が入ってくるか分からない実用システムに対しては大
きな欠点になる。
非トレーニングサンプルに対する特性劣化の欠点を解決
する方法の一つとして、量子化対象信号のサンプル当り
の統計分布をモデル化し、モデル化した統計分布に従っ
て量子化器を設計するという方法が提案されている。し
かし−この方法は、飽くまでも対象信号の静的な特性の
みに依存した量子化法であり、音声信号のようなサンプ
ルの時間的発生順序が大切な時系列信号を対象とする場
合には、さらに順序関係をモデル化しなければ成らず、
現状の方法論のままで量子化歪の小さい量子化器を設計
するためには量子化ビット数を大幅に増やす必要がある
。そうすると必然的な前者の問題、即ち所望の標準パタ
ンを検索するのに多くの演算量が掛かるという問題が伴
ってくる。
一方、ベクトル量子化における演算量を軽減するアプロ
ーチとして、ベクトル量子化を多段に接続する方法が提
案されている。これは、2 Nl+N2個の標準パタン
を持つコードブックから所望の標準パタンを検索するの
に通常ならば2 NI+N2の標準パタンとの間の距離
を計算しなければならない。
しかし、これを2N1個と2N2個の標準パタンを持つ
二つのコードブックを用意して、始めに2 N1個の標
準パタンをもつコードブックで量子化した後の量子化誤
差を2 N2個標準パタンを持つコードブックで量子化
するという方法が提案されている。
本方式は、確かに検索に要する処理量を軽減させる効果
をもつが、先に述べたような設計に関する問題点を解決
するものではなく、更に一つのコードブックを独立に二
つに分割することで量子化器としての効率自体を劣化さ
せるという欠点がある。
(発明が解決しようとする課題) 以上述べた様に、時系列信号である音声信号の音源パラ
メータを効率的に量子化するためには、単にベクトル量
子化を適用していたのでは、多くの処理量と共に最適な
量子化器の設計に関する実用的な問題が伴ってくる。
本発明の目的は、音声信号を線形予測パラメータとピッ
チ予測パラメータと予測残差に相当する音源パラメータ
とで表す音声符号化方式における音源パラメータの量子
化に対して、始めにベクトル量子化で音源パラメータの
平均的な特性を効率的に量子化した後、音源パラメータ
から時系列として大切な局所的成分を抽出し、それを個
別に補正することで高品質な音声符号化方式を提供する
ことにある。
(課題を解決するための手段) 本発明の音声符号化方式は、一定間隔のフレームに分割
された入力音声信号から線形予測パラメータとピッチ予
測パラメータとを抽出し、前記線形予測パラメータと前
記ピッチ予測パラメータと前記入力音声信号とから定ま
る予測残差に相当する音源パラメータを抽出し、前記入
力音声信号と前記線形予測パラメータと前記ピッチ予測
パラメータとを観測しながら前記音源パラメータを予め
蓄積されている幾つかの標準パタン集合の−っで置き換
え、前記入力音声信号と前記線形予測パラメータと前記
ピッチ予測パラメータとを観測しながら前記選択された
標準パタンの音源パラメータから予め定められた数のパ
ラメータを抽出して補正を施すことを特徴とする。
(作用) 本発明の作用を第1図に示すブロック図を用いて説明す
る。
先ず、入力端子1から入力される1フレーム分Nサンプ
ルの音声信号s (n)の自己相関関数を基に、線形予
測分析部2で線形予測係数或はPARCOR係数などの
線形予測パラメータを計算する。ピッチ予測分析部3は
、入力音声信号の自己相関関数を基に、音声信号の周期
構造を表すピッチ周期とピッチ予測係数とを推定する。
推定された線形予測パラメータとピッチ予測パラメータ
とから入力音声信号の予測残差に相当する音源パラメー
タが音源パラメータ抽出部4で求められる。
求めた音源パラメータはベクトル量子化部5でベクトル
量子化される。ベクトル量子化部5はコードブック6に
予め蓄えられている標準パタンを検索することで行なわ
れる。標準パタンの選択には、ピッチ予測係数と線形予
測係数とコードブックに蓄えられている音源パラメータ
とで合成される再生音声信号と入力音声信号との平均的
な誤差が計算され、その誤差が小さくなる標準パタンが
所望のものとして選択されるというプロセスが取られる
。誤差の計算には、入力音声信号の特性に依存した重み
を掛けることも考えられる。ベクトル量子化部5で選択
され外標準パタンはスカラー量子化部7へ送られ、その
標準パタンを指すインデックスは再生側のコードブック
9へ送られる。コードブック6とコードブック9とは同
じ構成であることが保証されているとする。スカラー量
子化部7では、入力音声信号とピッチ予測係数と線形予
測パラメータとを基に、ベクトル量子化部5で選ばれた
標準パタンの音源パラメータがら、前記再生音声信号と
入力音声信号との誤差を大きくする予め定められた数の
パラメータを選択し、前記誤差が小さく成るように前記
選択された音源パラメータに対して補正を施す、施され
る補正項はスカラー量子化され、音源パラメータ再生部
8に送られる。音源パラメータ再生部8では送られた音
源パラメータの補正項とコードブック9から送られる音
源パラメータの標準パラメータとから所望の音源パラメ
ータを再生し、それらを音源信号再生部10へ出力する
。音源信号再生部10は、音源パラメータ再生部8から
供給される音源パラメータをもとに音源信号を再生し、
それを再生音声信号部11へ出力する。再生音声信号部
11は、音源信号再生部10から供給される音源信号と
、線形予測分析部2から供給される線形予測パラメータ
と、ピッチ予測分析部3から入力されるピッチ予測パラ
メータとをもとに再生音声信号を計算し、それを出力端
子12を介して外部に出力する。
(実施例) 第2図は、本発明の音声符号化方式の一実施例を適用し
た音声符号化復号化装置を示すブロック図である。
図において、音声信号は入力端子100を介して入力バ
ッファ101に一フレーム分Nサンプル蓄えられる。−
フレーム分の音声信号(S(n))n=o、・・・、N
−1は線形予測分析器110とピッチ予測分析器120
と音源パラメータ抽出器130とに出力される。線形予
測分析器110は、入力音声信号の自己相関関数を基に
線形予測係数或はPARCOR係数を求め、それを予め
定められたビット数で量子化したあと、音源パラメータ
抽出器130とベクトル量子化器140とスカラー量子
化器150と線形予測符号器73とへ出力する。音源パ
ラメータ抽出器130は予測残差信号に相当する音源パ
ラメータを抽出するが、本実施例においては、予測残差
を直接ベクトル量子化するものを説明する。このとき音
源パラメータ抽出器130では、入力バッファ101か
ら入力される音声信号s (n)と線形予測分析器11
0がら入力される線形係数(aK)k=1.・・・、に
とピッチ予測分析器120から入力されるピッチ周期T
とピッチ予測係数すとがら予測残差e (n)を 8(n)=S(n)−Σak、 s (n−k )−b
Σats(n−に−T)−bs(n−T)  (1)と
して求めそれを音源パラメータとして、ベクトル量子化
器140へ出力される。計算された予測残差はベクトル
量子化器140において、コードブック50に蓄えられ
ているL個の標準パタンの内の一つで置き換えられる。
いま、コードブック140に蓄えられている標準パタン
の集合を(CL  (n) ) i=1. ・=、Lと
する。各c1(n)はNサンプルの要素からなるベクト
ルである。このコードブックの要素から最適な標準パタ
ンのインデックスl aptを求めるための基準は、次
のような入力音声信号と再生音声信号とのフレーム全体
に渡る平均乗誤差最小化基準である。
Lpt =(i 1IIin ここで、h (n)は、線形予測分析器110から供給
される線形予測係数(atlk=1.・・・、にとピッ
チ予測分析器120から入力されるピッチ周期Tとピッ
チ予測係数すをフィルタ係数に持つ全極フィルタのイン
パルス応答で、本は畳み込みを表す演算子である。具体
的には、 として計算される。ここで、h (n)のn<Oにおけ
る初期値は0とする。この第3式から分かるように、本
実施例では、敢えて線形予測残差を計算する必要がなく
、最適な標準パタンのインデックスは、 と直接入力音声信号から求めることもできる。前記第2
式或は第3式から定まったインデックス162.はイン
デックス符号器71へ、そのインデックスに対応する標
準パタンC1゜、j(n)はスカラー量子化器150へ
とそれぞれ出力される。
スカラー量子化器150では、入力バッファ101から
入力音声信号s (n)と、線形予測分析器110から
線形予測パラメータと、ピッチ予測分析器120からピ
ッチ予測パラメータとを入力し、それらを基にベクトル
量子化器140から入力される前記10.tに対応する
標準パタンc i met  (n )の複数のサンプ
ルを選択すると共にそれらの振幅を補正してスカラー量
子化する。
サンプルの抽出並びに振幅の輔正項を求めるための評価
関数は、次のような入力音声信号と再生音声信号と平均
二乗誤差である。
ここで、(gs 、mt )l=1.”・、Mが補正さ
れるサンプルの補正値と補正されるサンプル点の位置を
示している。尚、第5式に於て、適当な重み関数を掛け
て入力音声信号と再生音声との誤差を定義することもで
きる*(gt+m+)を求める為には、種々の方法が考
えられるが、ここでは、各パラメータを遂次求める方法
を説明する。それは、第5式のEをglで偏微分して、
それを零とおく。
(但し、  S、 (n)mh(n)* ci、 e 
t(n))ココテ、i=1からに−1までの(gm +
 mk)は既に定まっているとする。すると、第4式を
満たすgkは、 このときのEは となる。したがって第5式を最小化するgkを与えるm
kを検索することでmhを求め、そのmkによって決ま
るgkを第5式から定めるという手順をkに関して遂次
行っていけば、所望の補正サンプル位置(m、)と補正
値(g、)が決定される。決定された(g+ l mt
 )は量子化された後、補正値符号器72に出力される
。線形予測符号器73は、線形予測分析器120で抽出
された線形予測係数或はPARCOR係数などの線形予
測パラメータを符号に変換して、マルチプレクサ160
へそれを出力する。ピッチ予測符号器74は、ピッチ予
測分析器120から供給されるピッチ予測パラメータ(
ピッチ周期やピッチ予測係数)と符号に変換して、マル
チプレクサ160へそれを出力する。インデックス符号
器71は、コードブック50から入力されるIk3it
Iな標準パタンを示すインデクスl setを符号に変
換して、マルチプレクサ160へ出力する。補正値符号
器72は、スカラー量子化器150から入力される量子
化された補正パラメータ(gt + mt )を符号に
変換としてマルチプレクサ160へ出力される。マルチ
プレクサ160は、線形予測符号器73とインデックス
符号器71と補正値符号器72とピッチ予測符号器74
とから供給される符号を多重化して、符号出力端子17
0を介して符号列を復号側に伝送する。符号入力端子2
00は、符号化側から多重化された符号列を入力する符
号入力端子である。多重化された符号列はデマルチプレ
クサ210で分解され、線形予測係数或はPARCOR
係数を表す符号は線形予測復号器83へ、ピッチ予測パ
ラメータ(ピッチ予測係数やピッチ周期)を表す符号は
ピッチ予測復号器84は、コードブックのインデックス
を表すインデックス復号器81へ、補正パラメータを表
す符号を補正値復号器82へと出力される。線形予測復
号器83は、デマルチプレクサ210より入力する線形
予測係数或はPARCOR係数を表す符号列を復号して
、線形予測係数(a k) k =1 +・・・、Kを
再生し、それを再生音声信号生成器240へ出力する。
インデックス復号器82は符号化側で選ばれた最適標準
パタンを表すインデックスl aptを表す符号を復号
し、それをコードブック6oへ出力する。
補正値復号器82は補正パラメータ(ffl4. Q−
)を表す符号を復号して、それらを音源パラメータ再生
器220へ出力する。コードブック6oはインデックス
復号器81から供給されるインデックスに対応する標準
パタンを音源パラメータ再生器220へ出力する。音源
パラメータ再生器220は、コードブック60から供給
されるF!A準パタンci*et(n)と補正値復号器
82から供給される補正パラメータ(Q+、Q+lとか
ら音源パラメータを再生する。再生された音源パラメー
タは音源信号再生器230へと出力される。音源信号再
生器230では、音源パラメータ再生器220より供給
される音源パラメータを用いて、音源信v(n)=  
CLet  (n)+Σ gl δ(n−111)  
      (8)を再生する。再生された音源信号は
再生音声生成器240へ出力される。再生音声生成器2
40は、線形子8I!I復号器83から供給される線形
予測係数(aklとピッチ予測復号器84から供給され
るピッチ周期T、ピッチ予測係数すと音源信号再生器2
30から供給される音源信号v(n)とから・、例えば
、 5(n)=Σa 欺5(n−k)+bs(n−T)十b
Σ a  *  5(n−に−T)+v(n)    
   (9)して計算される。計算された再生音声信号
は出力バッファ241へ出力される。出力バッファ24
1は一フレームの再生音声信号を蓄えるもので、過去に
再生されたものから出力端子250を介して外部に出力
される。
以上の実施例では、ベクトル量子化される音源パラメー
タとして、線形予測残差を直接用いたが、これは、例え
ば、マルチパルスで表された音源パラメータやCOS関
数などでモデル化された音源パラメータなどでも同様な
音声符号化・復号化装置が実現される。また、以前にも
述べたが、ベクトル量子化やスカラー量子化を行う際の
評価関数として、単純な平均二乗誤差を用いたが、これ
に所望の重み間数を掛けてもよく、また周波数領域での
評価関数を使ってもよい。
(発明の効果) 以上に説明したように、本発明は、音声信号を線形予測
パラメータとピッチ予測パラメータ音源パラメータとで
表す音声符号化復号化方式における音源パラメータの量
子化方式として、ベクトル量子化の誤差をスカラー量子
化で補正するという構成をとることにより、ベクトル量
子化だけでは難しい音源パラメータの時間方向の局所的
な追随ができる特性をもつ0本構成により、ベクトル量
子化で音源パラメータの平均的な特性を抽出したあと、
音源パラメータの時系列として大切な局所的な特性を抽
出し、それを個別に補正するという柔軟な量子化法が提
供できる。また、本構成により、ベクトル量子化では設
計並びに探索処理量などで経済的な実現が難しい局所的
な特性を効率的に表す量子化器が実現できることになり
、従来より音声信号の時系列としての特性を生かした高
品質な音声符号化復号化方式が提供できるという効果が
ある。さらに、本構成では、ピッチ予測構造が音源パラ
メータとは別に抽出されているので、ベクトル量子化器
の設計がピッチ予測J7R遠を含まないものと比べて効
率的であるという効果をもつ。
【図面の簡単な説明】
第1図は本発明方式の作用を示すブロック図、第2図・
は本発明の一実施例を適用した音声符号化復号化装置の
ブロック図である。 1・・・入力端子、2・・・線形予測分析部、3・・・
ピッチ予測分析部、4・・・音源パラメータ抽出部、5
・・・ベクトル量子化部、6・・・コードブック、7・
・・スカラー量子化部、8・・・音源パラメータ再生部
、9・・・コードブック、10・・・音源信号再生部、
11・・・再生音声信号部、12・・・出力端子、50
・・・コードブック、60・・・コードブック、71・
・・インデックス符号器、72・・・補正値符号器、7
3・・・線形予測符号器、74・・・ピッチ予測符号器
、81・・・インデックス復号器、82・・・補正値復
号器、83・・・線形予測復号器、84・・・ピッチ予
測復号器、100・・・入力端子、101・・・入力バ
ッファ、110・・・線形予測分析器、120・・・ピ
ッチ予測分析器、130・・・音源パラメータ抽出部、
140・・・ベクトル量子化器、150・・・スカラー
量子化器、160・・・マルチプレクサ、170・・・
符号出力端子、200・・・符号入力端子、210・・
・デマルチブレフサ、220・・・音源パラメータ再生
器、230・・・音源信号再生器、240・・・再生音
声信号生成器、241・・・出カバ・ツファ、250・
・・出力端子。

Claims (1)

    【特許請求の範囲】
  1. 一定間隔のフレームに分割された入力音声信号から線形
    予測パラメータとピッチ予測パラメータとを抽出し、前
    記線形予測パラメータと前記ピッチ予測パラメータと前
    記入力音声信号とから定まる予測残差に相当する音源パ
    ラメータを抽出し、前記入力音声信号と前記線形予測パ
    ラメータと前記ピッチ予測パラメータとを観測しながら
    前記音源パラメータを予め蓄積されている幾つかの標準
    パタン集合の一つで置き換え、前記入力音声信号と前記
    線形予測パラメータと前記ピッチ予測パラメータとを観
    測しながら前記選択された標準パタンの音源パラメータ
    から予め定められた数のパラメータを抽出して補正を施
    すことを特徴とする音声符号化方式。
JP63276513A 1988-10-31 1988-10-31 音声符号化方式 Pending JPH02120898A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63276513A JPH02120898A (ja) 1988-10-31 1988-10-31 音声符号化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63276513A JPH02120898A (ja) 1988-10-31 1988-10-31 音声符号化方式

Publications (1)

Publication Number Publication Date
JPH02120898A true JPH02120898A (ja) 1990-05-08

Family

ID=17570519

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63276513A Pending JPH02120898A (ja) 1988-10-31 1988-10-31 音声符号化方式

Country Status (1)

Country Link
JP (1) JPH02120898A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6268787B1 (en) 1998-12-04 2001-07-31 Tdk Corporation Ferrite-core housing case anti-noise component wire harness and electronic equipment
US6346673B1 (en) 1998-12-07 2002-02-12 Tdk Corporation Noise preventing split ferrite core

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6268787B1 (en) 1998-12-04 2001-07-31 Tdk Corporation Ferrite-core housing case anti-noise component wire harness and electronic equipment
US6346673B1 (en) 1998-12-07 2002-02-12 Tdk Corporation Noise preventing split ferrite core

Similar Documents

Publication Publication Date Title
JP3354138B2 (ja) 音声符号化
CN113223540B (zh) 在声音信号编码器和解码器中使用的方法、设备和存储器
JP3143956B2 (ja) 音声パラメータ符号化方式
KR102171293B1 (ko) 음성 부호화 장치, 음성 부호화 방법, 음성 부호화 프로그램, 음성 복호 장치, 음성 복호 방법 및 음성 복호 프로그램
US5664053A (en) Predictive split-matrix quantization of spectral parameters for efficient coding of speech
US6330531B1 (en) Comb codebook structure
JPH02120898A (ja) 音声符号化方式
JPH0854898A (ja) 音声符号化装置
KR100554164B1 (ko) 서로 다른 celp 방식의 음성 코덱 간의 상호부호화장치 및 그 방법
KR20120032444A (ko) 적응 코드북 업데이트를 이용한 오디오 신호 디코딩 방법 및 장치
JP3194930B2 (ja) 音声符号化装置
JP3107620B2 (ja) 音声符号化方法
JPH02118700A (ja) 音声符号化復号化方式とその装置
JP3102017B2 (ja) 音声符号化方法
JP2808841B2 (ja) 音声符号化方式
JP3192051B2 (ja) 音声符号化装置
JPH041800A (ja) 音声帯域信号符号化方法
JPH0283600A (ja) 音声符号化・復号化方式
KR20230023560A (ko) 부호화 방법 및 복호화 방법, 상기 방법을 수행하는 부호화기 및 복호화기
JP2898641B2 (ja) 音声符号化装置
JP3229784B2 (ja) 音声符号化復号化装置及び音声復号化装置
JPH0511799A (ja) 音声符号化方式
KR100389898B1 (ko) 음성부호화에 있어서 선스펙트럼쌍 계수의 양자화 방법
JPH09120300A (ja) ベクトル量子化装置
JP3714786B2 (ja) 音声符号化装置