JPH0315900A - 音声信号符号化装置 - Google Patents

音声信号符号化装置

Info

Publication number
JPH0315900A
JPH0315900A JP1150770A JP15077089A JPH0315900A JP H0315900 A JPH0315900 A JP H0315900A JP 1150770 A JP1150770 A JP 1150770A JP 15077089 A JP15077089 A JP 15077089A JP H0315900 A JPH0315900 A JP H0315900A
Authority
JP
Japan
Prior art keywords
sequence
audio signal
sound source
initial phase
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1150770A
Other languages
English (en)
Inventor
Yoshihiro Unno
海野 義博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1150770A priority Critical patent/JPH0315900A/ja
Priority to DE1990631749 priority patent/DE69031749T2/de
Priority to EP19900111360 priority patent/EP0402947B1/en
Publication of JPH0315900A publication Critical patent/JPH0315900A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音声信号の低ビットレート波形符号化手段に
利用する。特に、伝送情報量を15kbps以下とする
符号化手段に関する。
〔概要〕
本発明は、音声信号の低ビットレート波形符号化手段に
おいて、 音源パルス系列の振幅にスペクトルパラメータおよび初
期位相を組合わせることにより、良好な音質が得られる
音声信号に符号化することができるようにしたものであ
る。
〔従来の技術〕
音声信号を16kbps程度に少ない演算量で符号化す
る従来例装置では、声道の特性をデジタルフィルタで表
し、音源を等間隔のパルス列の組合せで比較的良好に表
すレギュラーパルス音声符号化装置が知られている。こ
の装置では、フィルタの係数と音源パルスの情報(パル
スの初期位相および振幅〉を20ms程度のフレーム毎
に求めて伝送する。
この装置で用いる方法は、例えば、Hellwig氏ら
による”MATS,−D Speech Codec:
Regular−PulseExcitation L
PC (Second Nordic Seminar
 on Oigi−tal Land Mobile 
Radio CorntnunIcation 14−
150ctober. 1986, Stockhol
m, Sweden ページ257)(文献1〉に説明
されている。
〔発明が解決しようとする問題点〕
しかし、このような従来例は演算量が少ないが、再生音
声の品質が低い欠点がある。これは音源パルス系列の振
幅の求め方に起因する。従来装置では、まず原信号を短
時間スペクトル包絡を表すフィルタの逆特性のフィルタ
を通した予測残差を求める。次にサブフレーム(文献1
では5ms)毎に予測残差を初期位相だけずらす。そし
て、あらかじめ定められたサンプル数(文献1では3サ
ンプル)ごとに予測残差をまびいて得られた信号を量子
化する。
本発明は、従来例と復号化手段は同様であるが、従来例
よりもはるかに良好な音質が得られる音声信号符号化装
置を提供するこどを目的とする。
〔問題点を解決するための手段〕
本発明は、離散的な音声信号系列を入力し、駆動音源信
号を出力する音声信号符号化装置において、上記音声信
号系列を所定時間長の音声信号系列に区切り、この区切
られた音声信号系列に基づき短時間スペクトル包絡を表
すスペクトルパラメータを抽出し、このスペクトルパラ
メータに基づきインパルス応答系列を算出する手段と、
このインパルス応答系列の自己相関関数列および上記区
切られた音声信号系列と上記インパルス応答系列との相
互相関関数列を算出する手段と、この相互泪関関数列に
基づき駆動音源信号の初期位相を算出し、この初期位相
、上記自己相関関数列および上記相互相関関数列に基づ
き上記区切られた音声信号系列に対して上記駆動音源信
号の振幅系列を算出する手段と、上記スペクトルパラメ
ータを示す符号、上記駆動音源信号の初期位相を示す符
号および上記駆動音源信号の振幅系列を示す符号とを組
み合わせた符号を生戊する手段とを備えたことを特徴と
する。
〔作用〕
#I教的な音声信号を入力し、この音声信号系列をあら
かじめ定められたサンプル数だけずらせながら区切る。
この区切られた音声信号系列を用いて短時間スペクトル
包絡を表すスペクトルパラメータを抽出する。このスペ
クトルパラメータをもとにインパルス応答系列を計算し
、このインパルス応答系列を用いて自己相関関数列を計
算する。
また、音声信号系列とインパルス応答系列との相互相関
関数列を計算する。二の相互相関関数列を用いて駆動音
源信号の初期位相を求めて符号化し、自己相関関数列と
相互相関関数列と駆動音源信号の初期位相とを用いて音
声信号系列に対し駆動音源信号の振幅系列を求めて符号
化する。スペクトルパラメータの符号と駆動音源信号の
初期位相を表す符号と、前期駆動音源信号の振幅系列を
表す符号とを組み合わせて出力する。
すなわち、本発明は、音源パルス系列の位置の求め方は
文献1と同じであるが、振幅を計算するアルゴリズムに
特徴がある。
以下にこのアルゴリズムを説明スる。
まず、文献1に示したレギュラーパルス音声符号化では
、k番目のパルスの位置mkは、TTIk=p J+q
 (0≦j≦N/p−1)− (t)で求められる。こ
こでpはあらかじめ定められた駆動音源パルスの間隔、
qは初期位相である。
次に、パルス振幅の求め方を説明する。1フレーム内の
任意の時刻nでの音源パルス系列d (n)はd (n
) = g k・δn, mk− (2)で表される。
ここで、δnおよびmkはクロネッカーのδ関数を表し
、n=mkの場合にIであり、n≠m,の場合は0であ
る。また、g,は位置mkのバルスの振幅を表す。
d (n)は合戊フィルタに入力して得られる再生信号
x (n)は、合或フィルタの予測パラメータをal(
1≦i≦NP ;ここで、N,は合成フィルタの次数を
示す〉とすると、 x(n)=d(n)−1:at − x  (n − 
i)   −(3)1−1 で表される。
次に、入力音声信号X (n)と再生信号X (n)と
の1フレーム内の重み付け2乗誤差Jは、 で表される。ここで、*は畳み込み積分を表す。
また、Nは1フレームのサンプル数を示す。
ここで、重み付け関数ω(n)は周波数軸上で重み付け
を行うものであり、その2変換値をW(Z)とすると、
合威フィルタの予測パラメータa,を用いて、 W (2) =( 1  ”’a t Z − ’ )
 / ( 1  4’a r r ’ Z − ’ )
(5〕 で表される。上式では、r=Q≦r≦1の定数であり、
W (Z)の周波数特性を決定する。すなわち、r=1
とするとW(Z)=1になり、その周波数特性は平坦に
なる。一方、r=0とするとW (Z)は合或フィルタ
の周波数特性の逆特性になる。したがって、rの値によ
ってI!l(Z)の特性を変えることができる。また、
(5)式で示したようにW (Z)を合或フィルタの周
波数特性に依存させて決めているのは聴感的なマスク効
果を利用しているためである。すなわち、入力音声信号
のスペクトルのパワーが大きなところではく例えばフォ
ルマントの近傍〉、再生信号のスペクトルとの誤差が多
少大きくてもその誤差は耳につき難いという聴感的な性
質による。
(4〕式はさらに に変形できる。
ここで、X (n) *ω(rl)の項は次式に従って
変形される。
とおく。(7)式の両辺を2変換すると、L(Z) =
X(2) − W(2)         − (8)
で表される。X (Z)は、さらに、 X (2) = }! (2) − D C2)   
       − (9)で表される。ここで、D(Z
)は(2)式のZ変換を示し、}1(Z)は合成フィル
タのインパルス応答のz変mtを示す。(9)式を(8
)式に代入すると、X. (Z) =H(2) ・D(
Z) − W(2)        αOになり、H.
(Z) =H(Z> − W(Z)とおき、αO式を逆
Z変換し、H. (Z)の逆変換値をh . (n)と
すると、X.(n)= d(n)* hw(n)   
       −Ql)を得る。ここで、h,(n)は
合戒フィルタと重み付け回路の縦続接続フィルタのイン
パルス応答を示す。
αυ式に(2)式を代入して、 J−Z (X− ()  ,” g t h − ( 
n  m t) ) ’  −−− (131を得る。
このように、(4)式はaJ式のように表せる。
αつ式を最小とする音源パルス系列の振幅gkで偏微分
して0とおくと、 (ただし、φ1 =φgh(  mk)g+φBB (
m 1 , mu )”’  gi(−+φhh(ml
−++ m+=) )が導かれる。ここで、φ+th(
)はX . (n)とh.(n)から計算した相互相関
数列を、φhh(・)はh . (n)の自己相関関数
列をそれぞれ表し、 φ.h(−mk)  =Σ K.(n) h , ( 
n  m1. )h−1 =φhイ(m,) (l≦mk≦N)         αSを得る。ここ
で、Kは1フレームにたてるパルス数を示す。
(7)式および(自)式を(6)式に代入すれば、(1
≦mi  ,mエ ≦N)     α■で表される。
なお、φ,,(・)は音声信号処理の分野では共分散関
数と呼ばれることが多い。GO式によれば、パルスの位
置mkをパラメータとして位置mkに対応した振幅が計
算できる。
いま、入力音声信号系列が定常であると仮定すれば、α
つ式で示した共分散関数φhh(mi,mk)は遅れ(
m.,−mk)に依存した自己相関関数Rhh(・)に
等しいとおけるので、 φhh(mi, mm) = Rhh(mi  mk)
   −−α力で表される。ここで、Rhh(・)はh
 , (n)の自己相関関数を表し、 R hh (m +  rrb+) =Σh. (n)
h.(n −(mt−m++))(1≦mi−mk  
≦N)......  αOで表される。
したがって、αつ式はαの式を用いて、(ただし、φ2
=φX?1(  mk)  g+Rhh(m+  m*
)−  g k−+ Rhh(mk−+  mk) )
に修正できる。
次に、初期位相qはαつ式で求めた相互相関関数を用い
て が得られ、(イ)式を満足するようなqとして決定でき
る。
〔実施例〕 以下、本発明の一実施例を図面を用いて説明する。
この実施例は図に示すように、音声信号系列を所定時間
長の音声信号系列に区切り、この区切られた音声信号系
列に基づき短時間スペクトル包絡を表すスペクトルパラ
メータを抽出し、このスペクトルパラメータに基づきイ
ンパルス応答系列を算出する手段であるバッファメモリ
回路350 、LAR計算回路280およびインパルス
応答計数回路210 と、このインパルス応答系列の自
己相関関数列および上記区切られた音声信号系列と上記
インパルス応答系列との相互相関関数列を算出する手段
である自己相関関数計算回18360および相互相関関
数計算回路235と、この相互相関関数列に基づき駆動
音源信号の初期位相を算出し、この初期位相、上記自己
相関関数列および上記相互相関関数列に基づき上記区切
られた音声信号系列に対して上記駆動音源信号の振幅系
列を算出する手段である初期位相計算回路370および
パルス振幅計算回路240 と、上記スペクトルパラメ
ータを示す符号、上記駆動音源信号の初期位相を示す符
号および上記駆動音源信号の振幅系列を示す符号とを組
み合わせた符号を生成する手段であるパルス符号化回路
250とを備える。
次に、この実施例の動作を説明する。離散的な音声信号
系列が入力端子100を通じてバッファメモリ回路35
0に入力される。この音声信号系列は一定時間長のフレ
ーム(例えば20mS)毎に分割される。次に、LAR
計算回路280はこのフレームの音声信号を衆知の方法
でLPG分析してあらかじめ定められた次数のLAR係
数を求める。LAR符号化回路200はこのLAR係数
を量子化する(文献l)。LAR符号化回路200はL
AR係数を量子化した符号をマルチブレクサ回路260
に出力する。また、LAR符号化回路200は符号化さ
れたLAR係数を復号化し、復号値LARi′をインパ
ルス応答計算回路210、重み付け回路290および合
或フィルタ回路320に出力する。インパルス応答計算
回路210は復号値LAR.’を入力し、a1)式に示
すh w (n) (合或フィルタと重み付け回路の縦
続接続からなるフィルタのインパルス応答)の計算をあ
らかじめ定められたサンプル数だけ行い、求まったh,
(n)を自己相関関数計算回路360および相互相関関
数計算回路253へ出力する。自己相関関数計算回路3
60はあらかじめ定められたサンプル数のh . (n
)を入力し、00式にしたがって自己相関関数Rhh(
mi−mu)を計算し、これをパルス振幅計算回路24
0に出力する。
次に、減算回路285 はバッファメモリ回路350に
蓄積された音声信号系列X (n)を入力し、これがら
合戊フィルタ回路320の出力系列を1フレーム分減算
した減算結果を重み付け回路290へ出力する。ここで
、合或フィルタ回路320には、現フレームからIフレ
ーム過去の音源パルス系列を駆動信号として応答系列を
求め、その後に駆動信号を「0」として現フレームに延
ばした駆動信号として応答系列を求め、その後に駆動信
号を「0」として現フレームに延ばした信号系列が1フ
レーム分蓄積されている。この演算は合戒フィルタのイ
ンパルス応答の意味のあるサンプル数が高々2フレーム
程度であるとすれば、現フレームの音声信号系列は1フ
レーム過去の音源パルスによって駆動された合戊フィル
タ出力信号を現フレームへ延ばした信号系列と現フレー
ムの音源パルス系列との和によって表現できるという論
理に基づき行われる。
重み付け回路290はLAR符号化回路200から復号
値L A R + ’を入力し、重み付け関数ω(n)
を(5)式に従い計算する。これは、他の周波数重み付
け方法を用いて計算してもよい。また、重み付け回路2
90は減算回路285の減算結果を入力し、これとω(
n)との畳み込み積分計算を行い、得られたX IT 
(n)を相互相関関数計算回路235に出力する。相互
相関関数計算回路235はあらかじめX.(n)および
h . (n)を入力し、05)式にしたがって相互相
関関数φWh (−m,)(1≦m,≦N)を計算し、
これを初期位相計算回路370およびパルス振幅計算回
路240に出力する。初期位相計算回路370は(イ)
式にしたがって初期位相qを計算し、これをパルス振幅
計算回路240およびパルス符号化回路250に出力す
る。パルス振幅計算回路240はαつ式を用いてパルス
の振幅gkを計算する。例えば、l回目のパルス振幅計
算では、00式でk=1とおき、振幅gIを位置J =
pj+q (0≦j≦N/p−1)の関数として求める
。次に、2回目の計算では、09式で、k=2とおき求
める。2回目の計算では、1回目の計算で求められたパ
ルスによる影響を差し引いた後に求められる。3回目以
降のパルスも同様にして計算できる。あらかじめ定めら
れた個数だけ計算を行った後に各パルスの振幅g,がバ
ルス符号化回路250に出力される。パルス符号化回路
250は初期位相計算回路370およびパルス振幅計算
回路240から音源パルス系列の初期位相および振幅を
入力し、これらを正規化係数を用いて符号化し、qおよ
びgkを表す符号をマルチブレクサ260に出力する。
また、パルス符号化回路250はqおよびgkの復号化
値q′およびg,′をパルス系列発生回路300へ出力
する。
ここで、振幅の符号化の方法のひとつに、周知の方法と
して、振幅の確率分布を正規型と仮定して正規型の場合
の最適量子化器を用いる方法がある。これについては、
ジエー・マックス(J − MAX)氏によるアイ・ア
ール・イー・トランザクションズ・オン・インフォメー
ション・セオリー(IRE!TRANSACTIONS
 ON INFORMATIONS THOEORY)
の1960年3月号、7〜12ページに掲載の「クオン
タイジンク・フォー・ミニマム・ディストーション」〈
Q[IANTIZING FOR MINIMUM D
ISTORTfON) (文献2〉等に詳述されている
。また、他の方法として、l伝送フレーム内のパルス系
列の振幅の絶対値の最大値を正規化係数とし、この値を
用いて各パルスの振幅を正規化した後に量子化、符号化
する方法もある。
なお、パルス系列の符号化については、ここで説明した
符号化方法に限らず衆知の最良の方法を用いることがで
きる。
パルス系列発生回路300は入力したq′およびgk′
を用いてmk’の位置に振幅g,′を持つ音源パルス系
列をl伝送フレーム長Nにわたって計算し、これを合戒
フィルタ回路320に出力する。
合戒フィルタ回路320はLAR符号化回路200から
逆量子化値LAR+’を入力し、これを予測パラメータ
at  (1≦i≦N,)に衆知の方法を用いて変換す
る。つぎに、合戊フィルタ回路320はパルス系列発生
回路300から1フレーム分の駆動音源振動を入力し、
このlフレーム分の信号に1分析フレーム分Oを付加し
、この2フレームの信号に対する応答信号系列X (n
)を求める。さらに、第2フレームの零信号系列を計算
する際には、合或フィルタ回路320はLAR符号化回
路200から新たにLAR+’を入力し、これを用いて
行う。つぎに、マルチプレクサ回路260はLAR符号
化回路200の出力符号とパルス符号化回路250の出
力符号とを入力し、これらを組み合わせて送信出力端子
270から通信路へ出力する。
この実施例では、パルス系列の計算はフレーム単位で行
ったが、フレームをいくつかのサブフレームに分割し,
そのサブフレーム毎にパルス系列を計算するような構或
にしても同等の特性が得られる。また、スペクトルパラ
メータとしては、LAR以外に衆知のパラメータ例えば
PARCORを用いることもできる。
〔発明の効果〕
本発明は、以上述べたように、同一の伝送情報量の場合
により良好な品質を得ることができる効果がある。
算回路、290・・・重み付け回路、300・・・パル
ス系列発生回路、320・・・合威フィルタ回路、35
0・・・バッファメモリ回路、360・・・自己相関関
数計算回路、370・・・初期位相計算回路。

Claims (1)

  1. 【特許請求の範囲】 1、離散的な音声信号系列を入力し、駆動音源信号を出
    力する音声信号符号化装置において、上記音声信号系列
    を所定時間長の音声信号系列に区切り、この区切られた
    音声信号系列に基づき短時間スペクトル包絡を表すスペ
    クトルパラメータを抽出し、このスペクトルパラメータ
    に基づきインパルス応答系列を算出する手段と、 このインパルス応答系列の自己相関関数列および上記区
    切られた音声信号系列と上記インパルス応答系列との相
    互相関関数列を算出する手段と、この相互相関関数列に
    基づき駆動音源信号の初期位相を算出し、この初期位相
    、上記自己相関関数列および上記相互相関関数列に基づ
    き上記区切られた音声信号系列に対して上記駆動音源信
    号の振幅系列を算出する手段と、 上記スペクトルパラメータを示す符号、上記駆動音源信
    号の初期位相を示す符号および上記駆動音源信号の振幅
    系列を示す符号とを組み合わせた符号を生成する手段と を備えたことを特徴とする音声信号符号化装置。
JP1150770A 1989-06-14 1989-06-14 音声信号符号化装置 Pending JPH0315900A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP1150770A JPH0315900A (ja) 1989-06-14 1989-06-14 音声信号符号化装置
DE1990631749 DE69031749T2 (de) 1989-06-14 1990-06-15 Einrichtung und Verfahren zur Sprachkodierung mit Regular-Pulsanregung
EP19900111360 EP0402947B1 (en) 1989-06-14 1990-06-15 Arrangement and method for encoding speech signal using regular pulse excitation scheme

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1150770A JPH0315900A (ja) 1989-06-14 1989-06-14 音声信号符号化装置

Publications (1)

Publication Number Publication Date
JPH0315900A true JPH0315900A (ja) 1991-01-24

Family

ID=15504040

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1150770A Pending JPH0315900A (ja) 1989-06-14 1989-06-14 音声信号符号化装置

Country Status (1)

Country Link
JP (1) JPH0315900A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11164384A (ja) * 1997-11-25 1999-06-18 Nec Corp 超指向性スピーカ及びスピーカの駆動方法
US6049814A (en) * 1996-12-27 2000-04-11 Nec Corporation Spectrum feature parameter extracting system based on frequency weight estimation function

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6049814A (en) * 1996-12-27 2000-04-11 Nec Corporation Spectrum feature parameter extracting system based on frequency weight estimation function
JPH11164384A (ja) * 1997-11-25 1999-06-18 Nec Corp 超指向性スピーカ及びスピーカの駆動方法
US6678381B1 (en) 1997-11-25 2004-01-13 Nec Corporation Ultra-directional speaker

Similar Documents

Publication Publication Date Title
JP2940005B2 (ja) 音声符号化装置
US8374856B2 (en) Method and apparatus for concealing packet loss, and apparatus for transmitting and receiving speech signal
JPH04270400A (ja) 音声符号化方式
JPH09127996A (ja) 音声復号化方法及び装置
JPWO2005112005A1 (ja) スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
US9082398B2 (en) System and method for post excitation enhancement for low bit rate speech coding
JPH04134400A (ja) 音声符号化装置
US6243674B1 (en) Adaptively compressing sound with multiple codebooks
JP3266178B2 (ja) 音声符号化装置
JPH02249000A (ja) 音声符号化方式
EP0724252B1 (en) A CELP-type speech encoder having an improved long-term predictor
JPH09319398A (ja) 信号符号化装置
JPH0315900A (ja) 音声信号符号化装置
JP2979943B2 (ja) 音声符号化装置
JP2900431B2 (ja) 音声信号符号化装置
JP4820954B2 (ja) デジタル音声符号器における高調波ノイズ重み付け
JP3249144B2 (ja) 音声符号化装置
JP2658794B2 (ja) 音声符号化方式
JP3468862B2 (ja) 音声符号化装置
Nagarajan et al. Efficient implementation of linear predictive coding algorithms
JP2892462B2 (ja) コード励振線形予測符号化器
JP2853170B2 (ja) 音声符号化復号化方式
JP3148920B2 (ja) 音声符号化復号化装置
JPH02160300A (ja) 音声符号化方式
JP2658438B2 (ja) 音声符号化方法とその装置