JPH01255900A - 音声符号化方式 - Google Patents

音声符号化方式

Info

Publication number
JPH01255900A
JPH01255900A JP63084296A JP8429688A JPH01255900A JP H01255900 A JPH01255900 A JP H01255900A JP 63084296 A JP63084296 A JP 63084296A JP 8429688 A JP8429688 A JP 8429688A JP H01255900 A JPH01255900 A JP H01255900A
Authority
JP
Japan
Prior art keywords
audio
audio signal
pitch
coefficient
reproduced
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63084296A
Other languages
English (en)
Other versions
JP2778035B2 (ja
Inventor
Shigeru Ono
茂 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63084296A priority Critical patent/JP2778035B2/ja
Publication of JPH01255900A publication Critical patent/JPH01255900A/ja
Application granted granted Critical
Publication of JP2778035B2 publication Critical patent/JP2778035B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 し産業上の利用分野〕 本発明は、離散音声信号を特定区間の基準再生音声信号
の線形結合で表す音声符号化方式に関する。
〔従来技術〕
単区間の音声信号5(n)を、位相の異なる線形フィル
タのインパルス応答の和で表すものがマルチパルス駆動
型音声符号化法として知られており、初めビー・エスー
アタル(B、S、Atal  )らにょシ、文献1:「
ア ニエウー モデル オブ エルビーシー エキサイ
ティジョン フォー グロデューシングナチェラル サ
ウンデイング スピーチ アット ロウ ビットレイト
(A   new  model  of  LPCa
xeitationfor producing na
tural Bounding 5peech at 
lowbit rates ) J、アイ・シーーニー
拳ニス・ニス・ビー82 (ICASSP  82) 
(7)614がら617ページで提案された。この符号
化法は16kb/8 程度のビットレイトでは自然性の
賜い再生Hf提供できることが確認されているが、ビッ
トレイトをさらに低くすると、パルスの数、即ちインパ
ルス応答の数が少なくなり、再生音声の品質が劣化する
これに対する対策として、ピッチ予測を組み込むもの(
文献2:小火、小野、葉間「マルチパルス駆動型音声符
号化法の品質改善」音響学会音声研死金資料、583−
78(昭59)がある0水力式のブロック図を第2図に
示す。
入力端子10は一定間隔のフレームに分割された離散的
な音声信号を入力する入力端子である。
フレームの長さは20 ms@cから30m5ecが普
通である。入力された音声信号は、線形予測分析器20
とピッチ予測分析器30とバッファ40とに供給される
。線形予測分析器20においては、線形予測係数或はP
ARCOR係数を求め、それを局所マルチパルス符号器
50と局所マルチパルス復号器60に供給するとともに
マルチプレクサ90へ出力する。ピッチ予測分析630
は、入力音声信号の自己相関関数を計算しその最大値を
与える時間遅れの値から入力音声信号の基本周期(ピッ
チ周期)並びにピッチ予測係数を算出するものである。
算出されたピッチ周期並びにピッチ予測係数はピッチ予
測器70とマルチプレクサ90とに出力される。バッフ
ァ40は入力音声信号をピッチ予測分析器30で抽出さ
れたピッチ周期毎に分割し、各ピッチ周期毎に入力音声
信号を減算器80に出力し、ピッチ予測器70の出力と
の差即ちピッチ予測残差を計算する。計算されたピッチ
予測残差は局所マルチパルス符号器50に供給される。
局所マルチパルス符号器50は、減算器80から入力さ
れるピッチ予測残差に前記文献1の符号化方法を適用す
るもので、線形予測分析器20から入力される線形予測
係数で定まるフィルタのインパルス応答とピッチ予測残
差とをもとにピッチ予測残差も最も良く表すインパルス
応答の線形結合パラメータ、即ち音源パルスの振幅並び
に位置を算出し、出力するものである。算出されたパル
ス振幅並びに位置はマルチプレクサ90と局所マルチパ
ルス復号器60とに出力される0局所マルチパルス復号
器60は局所マルチパルス符号器50から出力されるパ
ルスの振幅並びに位置を受は取り、それと線形予測分析
器20から田方される線形予測係数とをもとに当該区間
の再生信号を合成するものである8合成された再生信号
は、加算器85に送られ、そこでピッチ予測器70の出
力と加算されて当該区間の再生音声信号となる。再生音
声信号はピッチ予測器70に供給される。マルチプレク
サ90は線形予測係数とピッチ情報とパルス振幅とパル
ス位置とを表す符号を多重化して出力端子99に出力す
る。
〔発明が解決しようとしている課題〕
しかし、前記文献2の従来方式ではフレーム内のピッチ
周期を一定としており、フレーム内におけるピッチ周期
の変動成分はピッチ予測残差に含まれることに7にる。
一般に音声イキ号は時間的に大きく変動しているため、
このようにフレーム内のピッチ変動を無視する構成では
ピッチ予測残差の変動成分は大きく、それを高品質で表
すには多く音源パルス情報を必要とする。ピッチ情報は
、音声知覚の上で重gな特徴と考えら7するため、時間
的に変動するピッチ情@Iを高品質に符号化することは
高品質音声符号化にとって大変重要である。
本発明の目的は、フレーム内の音声信号の基本周期長の
平均的な特性を表す基準再生音声信号を合成し、入力音
声信号を前記基準再生音声信号の線形和で表し、この線
形結合を形成するための係数並びに位相成分全前記久方
音声のピッチ変動に忠実に追随するように求めることで
、フレーム内のピッチ変動を吸収することを可能にする
高品質音声符号化方式を提供することと、前記線形結合
係数を量子化する際に線形結合係数と基本周期情報との
間にある相関を利用して低ビツトレート音声符号化方式
とを提供することでるる。
〔課題を解決するための手段〕
本発明によれば、一定間隔に分割された離散的列から前
記基本周期成分に相当する区間長の平均的な特性を表す
基準再生音声信号列を合成し、前記基準再生音声信号列
の線形結合からなる再生音声信号列形成する音声符号化
方式でろって、前記入力音声信号列と前記再生音声信号
とが近くなるよう前記結合係数金求めることを特徴とす
る音声符号化方式が得られる。
〔作 用〕
いま、−フレーム内の音声信号をs (n) (注:こ
こでnは当該フレーム内のサンプル点を表している)、
8(mlの線形予測分析により定まる線形予測係数を係
数に持つ全極フィルタのインパルス応答をh(5)とす
ると、当該フレームの一ピツチ区間の平均的な特性を表
す基準再生音声信号b(n)は、b(n)=Σg−h 
(n −m i)      (1)と表せる。係数(
gi)、位置(mi)、i=1゜・・・、M(M:b(
n)を形成するインパルス応答h(社)の数)の決定法
は幾つか考えられるが、最も望ましいものは、次の恵み
付き平均二乗誤差Eを最小化するものである。
E=Σしく5(n)−iajb(n−jT−τ))*w
(n)]    (2)ここで、*は畳み込みを示し、
Tはフレーム内の平均ピッチ周期、7口は重み関数でる
る、W(社)は、目的に合った任意の関数を選択するこ
とができる1例えば、文献lのように入力音声信号のス
ペクトル包絡によって決筐るものや、音声信号の周期性
を強調するコムフィルタ特性を用いるものなどがある。
尚、第(2)式において(aj)と(gi)とは積の関
係にあるので、(g )を陽に求めることは難しい、そ
こで、例えば、全てのajを1、τを0として求めるこ
ととする。すると、第(2)式と表される。ここで、T
は既知であるから、第(3)式をできるだけ小さくする
(g4.)  と (mi)を求める問題は、前記文献
1にあるマルチパルス符号化におけるパルスの振幅と位
相を求める問題と同一になり、従来から良く知られてい
る0例えば、そのためのアルゴリズムは、前記文献1や
文献3:に、オザワ、S、オノ、およびT、アラセキ[
アスタデイ オン パルス サーチ ロガリズムズフォ
ー マルチ−パルス エフサイテッド スピーチ コー
グ リアライゼイシlンJ IEEE SAC。
M4巻、 133−141頁、1月、 1986 (K
、Oz awa。
5−Ono、 and T、Araseki、 ”A 
5tudy on Pu1seSearch Logo
rithrns for Multi−Pulse E
xcitedSpeech Codar Realiz
ation、= IEEE  SAC。
Vol−4,pp、133−141 、January
 1986.) K記載されているものを利用すること
ができる。これは、第(3)式の両辺を(g、)で偏微
分して零として正規方程式を求め、 Gaussの消去
法などの数値解析の手法を用いて正規方程式の解を求め
るものである。
次に、定まったb (n)の線形結合で入力音声信号s
 (n)を表すことを考える。これは、次式の近似問題
を解くことに等しく、重み付き平均二乗誤差をなるべく
小さくする(Ck)と(d、)、k=1゜・・・・・・
K(K:&!形結合を形成するb (n)の数)を求め
るものである。(Ck)と(dk)を求める問題は、や
はシ、第(3)式の場合と同様にマルチパルス符号化に
おけるパルス探索問題となシ、従来例である前記文献1
や前記文献3に詳しく述べられているアルゴリズムを用
いて解くことができる。具体的に、(ck)と(dk)
をkに関して逐次的に求める方法を説明する。いま、(
ctJ、(diJがi = lからに−1まで定まって
いて、新たにに番目のckとdkを求めるとする。その
とき第(4)式は、 と 写る。この第(5)式をckで偏微分し、零とおくとこ
れから、 (n−d ))/Σb”(n −d k)   (6)
n このときのEスは となる。したがって、第(6)式のdkにフレーム内の
全サンプルを代入し、それぞれのe kt計算する。そ
して、計算されたckに対して第(7)式のE。
全最小化、またはCk を最大化するdkを求める。こ
のようにして計算したckとdkが所望の第に番目のパ
ラメータとなる。この第(6)式と第(7)式の計算を
に=1からKまで行えば全て(ek)と(dk)が求ま
る。
一方、音声再生するためには x(n)=Σckδ(n−dk) y(n)=Σg・δ(n −J T −m j)なる信
号を形成し、 v (n) = x (n)* y (ω      
  (8)なるv(n)で線形予測係数合成フィルタを
駆動すればよい。
上記の説明から分かるように、(dk)の自己相関関数
はピッチ周期Tに近い周期性を示すことが期待される。
従って、(dk)e量子化する際には、ピッチ周期Tを
利用することが考えられ、(dk)を直接量子化するの
でなく、dkとkTとの差を童子化するようにすれば効
率的になる。
また、(ck) はピッチ周期毎の入力音声信号系列と
基準再生音声信号系列との相関係数という性質を持って
いるので、入力音声信号が急峻に変化しない限り隣シ合
う(ck) には高い相関があると考えられるので、(
ck)と直接量子化する代わりにck二、と ckとの
差を量子化することで高い圧縮率が期待できる。
以上で、本発明の原理に関する説明を終える。
〔実施例〕
第1因に本発明の一実施例である音声符号化方式を表す
ブロック図を示す0図の符号化側の処理において、10
0は入力端子で、一定間隔のフレームに分割されたNサ
ンプルの離散的音声信号(例えば、8 kHzサンプリ
ングで、N = 160 (20msec ))を入力
し、線形予測分析器110とピッチ予測分析器120と
に供給する。線形予測分析器110は入力端子100か
ら入力した音声信号からPARCOR係数を求め、量子
化した後、基準音声成分計算器130とマルチプレクサ
150とに出力する。ピッチ分析a120は、当該フレ
ーム内の音声信号の基本周期成分と平均的なピッチ予測
係数を求めるもので、入力音声信号の自己相関関数の最
大値から定められる。その他の平均ピッチ周期成分子t
−求める手段は、例えば、文献4:古井著、ディジタル
音声処理、東海大学出版会(昭和60)の第4章に纏め
られている。計算されたピッチは量子化した後、基準音
声成分計算器130と音声変動成分計算器140とマル
チプレクサ150とに出力される。
基準音声成分計算器130は、前記(作用)の第(1)
式で示したb(n)を求めるものである。線形予測分析
器110から供給されるPARCOR係数を逆量子化し
たあとそれを線形予測係数に変換し当該全極フィルタの
インパルス応答h(n)を計算する。計算されたh(5
)と、入力端子100から入力される離散音声信号と、
ピッチ分析器120から入力されるピッチ周期とから前
記第(3)式で表される最小化問題を解いて、所望の(
g・) と (mi)とt求める。
前記第(3)式にろる重み関数W(5)は、例えば前記
文献1にろるように、 w(n)=δ(5)+ハ・δ(n−i) 7r’aiw
(n−i) (9)δ0:単位インパルス (&i)二線形予測係数 r:係数(0くγ<1) として計算できる。1だ、この重み関数は、線形予測係
数の時間的変化、即ち過去のフレームに於ける線形予測
係数に応じて選ぶこともできる。
(g、) と (ml)  との計算の仕方は、前記文
献4の外、例えば文献5:特許願「音声符号化方法」(
昭58−150783  ”)に詳しく説明されている
ので、ここでは簡単に説明する。まず、第(3)式の両
辺を(gi)で偏微分して零とおく、それは整理すると
次のような正規方程式になる。
Σa(n)−9h(n−jT−m−)=ΣCog −h
(n−iT−mi) )n   J         
   J    nl   1(Σh(n−jT−mj
))  (10)コ (記載の簡易化のため重み関数w(n)は省略しである
) 例えば、上式全jが1から所望の値までの各問題に対し
て解いていけばよい、(mj) は各にと全ての可能な
m 3 VC5”Jして第(10)式で求めた(gj)
に対して第(3)式を計算し、その時の値を最も小さく
するmjが求めるものとなる。計算した(gi)と(m
i)は量子化されたマルチプレクサ150に供給される
とともに、第(1)式のb(nlに相当する信号に変換
されて音声変動成分計算器140に供給される。音声変
動成分計算器140は、入力端子100から入力する音
声信号と基準音声成分計算器130から入力する基準音
声成分b(5)と、ピッチ分析器120から入力するピ
ッチ周期と、線形予測分析器110から入力される線形
予測係数とから、前記第(4)式の最小化問題を解いて
、所望の(ek)と〔dk)とを求めるものである。こ
れは例えば、前記作用で説明したように第(6)式と第
(7)式とを循環的に解いて求めることができる。ここ
で、重荷関数は前記第(6)式と同じもの金剛いる。 
(dk)と(ek)の量子化は、前記作用で述べたよう
に、ピッチ周期情報を使うことで効率良く実現できる。
ここでは、(dk)をd 1=d1 d’  =(dk−d工)−(k−1)Tと変換して、
(ak)k!量子化る。また(Ck)は、0°1:el e  k” ek−ck−1 と変換して(Ck)を量子化する。更に、(dk)を求
める際に、パルス位置(dk)がピッチ周期内に偏らな
いように(dk)の各要素間の距離がピッチ周期Tを用
いて制御させることで、より(d″よ)の変動を小さく
することもできる。求めた(ck)と(dk)とは、量
子化された後、マルチプレクサ150に出力される。マ
ルチプレクサ150は、線形予測分析器110からPA
RCOR係数を表す符号を、ピッチ分析器120から平
均ピッチ周期を表す符号を、基準音声成分計算器130
から基準音声成分の(gl)と(mi)とを表す符号を
、音声変動成分計算器140から音声変動成分の(ck
)と(匂)とを表す符号と全入力し、それらを多重化し
て出力端子160から出力する。復号化側では、符号入
力端子200より多重化された符号列を入力し、デマル
チプレクサ210で、音声の変動成分(ck)と(dk
)と表す符号と、基準音声成分(g・)と(mi)とを
表す符号と、平均ピッチ周期Tを表す符号を音源再生器
220へ出力し、PARCOR係数’1f−ffす符号
を音声再生器230へ出力する。音源再生器220は、
復号化・逆量子化した各パラメータから、 e(n)=(Σgiδ(n−ml) )*(ΣCkδ(
n−dk) )    (11)を計算して、音源信号
5(n)を再生する。再生されたe (n)は音声再生
器230へ出力される。音声再生器230では、デマル
チプレクサ210によシ供給されるPARCOR係数か
ら線形予測係数(、、)を求め、音源再生器220から
供給される音源e(n)から次式に従って再生音声8(
5)全計算する。
5(n)=−Σais(n−i )+a(nl    
   (12)再生音声5(nlは出力端子240より
出力される。
尚、以上の説明において、パルス振幅(gi)並びに(
泳)の針化法は種々前えられ、例えばスカラー量子化を
用いる場合は文献6のジャイヤントとノルの著書、ディ
ジタル コーディング オブウェイプフォーム、プレン
ティスホール、1984(N、S、Jaiyant a
nd Peter No11. DIGITALCOD
ING OF WAVEFORMS、 Pr5ntic
e−Halll 984、)の渠4章に詳しく記載され
ている。−方、PARCOR係数の量子化法も既に良く
知られており、例えば文献7:北脇、板倉、斉藤、′P
ARCOR形音声分析合成系における最適符号構成、′
電子通信学会論文誌J61−A、2、pp、119〜1
26(昭53−2)に詳しく述べられている。
〔発明の効果〕
本発明は、フレーム内におけるピッチ構造(主にピッチ
周期)の時間的変化を高品質に符号化するために、フレ
ーム内音声の平均的な特性を表す一定区間長(例えばビ
ーフチ周期と同じ長さ)の基準音声信号を基本に、その
基準音声信号の線形結合を形成させながらフレーム内の
ピッチM 造の’R化に追随するようにしたことと、吻
形結合パラメータを量子化においてパラメータ変動とピ
ッチ周期との関係を利用した効率的な量子化器を備えて
いる。この構成により本発明は、ピッチ構造のパラメー
タ全フレーム内で固定する従来方式と比較して、高品質
でかつ低いビットレートにピッチ情報全符号化できる効
果がある。
【図面の簡単な説明】
第1図は不発明の一実施例金示すブロック図で、第2図
は従来例を示すブロック図である。 10・・・・・・入力端子、20・・・・・・線形予測
分析器、30・・・・・・ピッチ予測分析器、40・・
・・・・バッファ、50・・・・・・局所マルチパルス
符号器、60・・・・・・局所マルチパルス復号器、7
0・・・・・・ピッチ予測器、80・・・・・・減算器
、85・・・・・・加算器、90・・・・・・マルチプ
レクサ、99・・・・・・出力端子、100・・・・・
・入力端子、110・・・・・・線形予測分析器、12
0・・・・・・ピッチ分析器、130・・・・・・基準
音声成分計算器、140・・・・・・音声変動成分計算
器、150・・・・・・マルチプレクサ、160・・・
・・・出力端子、200・・・・・・符号入力端子、2
10・・・・・・デマルチプレクサ、220・・・・・
・音源再生器、230・・・・・・音声再生器、240
・・・・・・再生音声出力端子。

Claims (1)

    【特許請求の範囲】
  1. 一定間隔に分割された離散的な音声信号列を入力し、前
    記入力した音声信号列の基本周期成分を抽出し、前記入
    力した音声信号列から前記基本周期成分に相当する区間
    長の平均的な特性を表す基準再生音声信号列を合成し、
    前記基準再生音声信号列の線形結合からなる再生音声信
    号列形成する音声符号化方式であって、前記入力音声信
    号列と前記再生音声信号とが近くなるよう前記結合係数
    を求めることを特徴とする音声符号化方式。
JP63084296A 1988-04-05 1988-04-05 音声符号化方式 Expired - Lifetime JP2778035B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63084296A JP2778035B2 (ja) 1988-04-05 1988-04-05 音声符号化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63084296A JP2778035B2 (ja) 1988-04-05 1988-04-05 音声符号化方式

Publications (2)

Publication Number Publication Date
JPH01255900A true JPH01255900A (ja) 1989-10-12
JP2778035B2 JP2778035B2 (ja) 1998-07-23

Family

ID=13826508

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63084296A Expired - Lifetime JP2778035B2 (ja) 1988-04-05 1988-04-05 音声符号化方式

Country Status (1)

Country Link
JP (1) JP2778035B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020006164A (ko) * 2000-07-11 2002-01-19 송문섭 음성 신호 부호화시 격자방법을 이용한 고정소수점선형예측부호화 계수 추출 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020006164A (ko) * 2000-07-11 2002-01-19 송문섭 음성 신호 부호화시 격자방법을 이용한 고정소수점선형예측부호화 계수 추출 방법

Also Published As

Publication number Publication date
JP2778035B2 (ja) 1998-07-23

Similar Documents

Publication Publication Date Title
JPH0353300A (ja) 音声符号化装置
US20040111257A1 (en) Transcoding apparatus and method between CELP-based codecs using bandwidth extension
KR100499047B1 (ko) 서로 다른 대역폭을 갖는 켈프 방식 코덱들 간의 상호부호화 장치 및 그 방법
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JP2003150200A (ja) 符号変換方法及び装置とプログラム並びに記憶媒体
JPH0341500A (ja) 低遅延低ビツトレート音声コーダ
JPH08179797A (ja) 音声符号化装置
JP2615548B2 (ja) 高能率音声符号化方式とその装置
JPH01255900A (ja) 音声符号化方式
JP2829978B2 (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
Ozawa et al. Low bit rate multi-pulse speech coder with natural speech quality
JPH08234795A (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JPH0738116B2 (ja) マルチパルス符号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JPH01205199A (ja) 音声符号化方式
JPH06202698A (ja) 適応ポストフィルタ
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP3071800B2 (ja) 適応ポストフィルタ
JP3274451B2 (ja) 適応ポストフィルタ及び適応ポストフィルタリング方法
JP3128226B2 (ja) 音声符号化方法
JP2508002B2 (ja) 音声符号化方法とその装置
JPH02280200A (ja) 音声符号化復号化方式
JP3103108B2 (ja) 音声符号化装置
JP3144244B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term