JPH02282800A - 音声符号化方式 - Google Patents

音声符号化方式

Info

Publication number
JPH02282800A
JPH02282800A JP1103410A JP10341089A JPH02282800A JP H02282800 A JPH02282800 A JP H02282800A JP 1103410 A JP1103410 A JP 1103410A JP 10341089 A JP10341089 A JP 10341089A JP H02282800 A JPH02282800 A JP H02282800A
Authority
JP
Japan
Prior art keywords
pitch
sound source
source signal
parameter
pulse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1103410A
Other languages
English (en)
Other versions
JP2946525B2 (ja
Inventor
Kazunori Ozawa
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1103410A priority Critical patent/JP2946525B2/ja
Publication of JPH02282800A publication Critical patent/JPH02282800A/ja
Application granted granted Critical
Publication of JP2946525B2 publication Critical patent/JP2946525B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音声信号を低いビットレート、特に4.8k
b/s程度で、比較的少ない演算量により高品質に符号
化するための音声符号化方式に関する。
〔従来の技術〕
音声信号を4 、8kb/s程度の低いビットレートで
符号化する方式としては、例えば特願昭59−2724
35号明細書(文献1)や特願昭60−178911号
明細書(文献2)等に記載されているピッチ補間マルチ
パルス法が知られている。この方法によれば、送信側で
は、フレーム毎の音声信号から音声信号のスペクトル特
性を表すスペクトルパラメータとピッチを表すピッチパ
ラメータとを抽出し、音声信号の有声区間では、1フレ
ームの音源信号を、1フレームをピッチ区間毎に分割し
た複数個のピッチ区間のうちの一つのピッチ区間(代表
区間)について少数のマルチパルスで表し、代表区間に
おけるマルチパルスの振幅2位相と、スペクトル、ピッ
チパラメータを伝送する。また無声区間では、1フレー
ムの音源を少数のマルチパルスと雑音信号で表し、マル
チパルスの振幅2位相と、雑音信号のゲイン、インデッ
クスを伝送する。
受信側においては、有声区間では、現フレームの代表区
間のマルチパルスと隣接フレームの代表区間のマルチパ
ルスとを用いてマルチパルス同士の振幅と位相を補間し
て、現フレームの代表区間以外のピッチ区間のマルチパ
ルスを復元しフレームの駆動音源信号を復元する。また
、無声区間では、マルチパルスと雑音信号のインデック
ス、ゲインを用いてフレームの駆動音源信号を復元する
さらに、復元した駆動音源信号を、スペクトルパラメー
タを用いた合成フィルタに入力して合成音声信号を出力
する。
〔発明が解決しようとする課題〕
上述した従来方式によれば、有声区間では代表区間にた
てた少数のマルチパルスと隣接フレームの代表区間にお
けるマルチパルスとを補間して音源信号を表していた。
しかるにマルチパルスの振幅9位相という2種類の伝送
パラメータが必要であり、これらを符号化するのに、1
パルス当り合計で10ビット程度のビット数が必要であ
る。従って、4.8kb/s程度のビットレートに適用
するためには、Ozawa、 Araseki氏らの論
文”Multi−pulsespeech codin
g 1nith natural 5peech qu
ality(ICASSP、 pp、457−460.
1986年)(文献3)等に記載されているように、フ
レーム長を20m5とすると代表区間にたてるマルチパ
ルスの個数を4個程度と少なくする必要がある。従って
このように少ない個数では代表区間の音源信号の近似度
が十分ではなく、特にピッチ周期の長い男性話者では音
質が劣化するという問題点があった。
さらに従来方式では、音声信号のスペクトル包絡特性を
表す合成フィルタの係数は、線形予測(LPC”)分析
法を用いて計算する。しかしLPC分析法では、ピッチ
周期の短い女性台に対しては、ピッチの影響を受けるた
めに合成フィルタの近似度が低下し音声のスペクトル包
絡を良好に表すことが困難で、このような合成フィルタ
を用いて合成した合成音声の音質が低下していた。この
ことはビットレートが低くパルスの個数が少ない領域、
特に4.8kb/s以下で顕著であった。
本発明の目的は、上述した問題点を解決し、比較的少な
い演算量により4.8kb八程へで音質の良好な音声符
号化方式を提供することにある。
〔課題を解決するための手段〕
第1の発明である音声符号化方式は、入力した離散的な
音声信号から、スペクトル包絡を表すスペクトル、パラ
メータとピッチを表すピッチパラメータとを予め定めら
れた時間長のフレーム毎に求め、前記フレームの音声信
号を前記ピッチパラメータから求めたピッチ周期に応じ
たピッチ区間毎に分割し、前記ピッチ区間の内の1つの
ピッチ区間の音源信号をパルスと前記音源信号のスペク
トル包絡特性を表すコードブックとで表し、前記パルス
と前記コードブックにより得られる復元音源信号と前記
スペクトルパラメータにより得られる合成信号と前記音
声信号との誤差を小さくするように前記パルスの振幅と
位相を求め、前記コードブックから一つのコードワード
を選択すると共に、前記復元音源信号をもとに前記スペ
クトルパラメータを修正し、前記ピッチパラメータと前
記スペクトルパラメータと前記パルスの振幅1位相と前
記コードワードを表す情報とを出力することを特徴とす
る。
第2の発明である音声符号化方式は、入力した離散的な
音声信号から、スペクトル包絡を表すスペクトルパラメ
ータとピッチを表すピッチパラメータとを予め定められ
た時間長のフレーム毎に求め、前記ピッチパラメータか
ら求めたピッチ周期に応じたピッチ区間毎に前記フレー
ムの音声信号を分割し、前記ピッチ区間の内の1つのピ
ッチ区間の音源信号をパルスと前記音源信号のスペクト
ル包絡特性を表すコードブックとで表し、さらに前記ピ
ッチ区間以外の他のピッチ区間では前記パルスの振幅9
位相を補正する補正係数を求め、前記パルスと前記補正
係数と前記コードブックにより得られる復元音源信号と
前記スペクトルパラメータとから求めた合成音声と前記
音声信号との誤差を小さくするように前記パルスの振幅
と位相を求め前記コードブックから一つのコードワード
を選択すると共に、前記復元音源信号をもとに前記スペ
クトルパラメータを修正し、前記ピッチパラメータと前
記スペクトルパラメータと前記パルスの振幅2位相と、
前記補正係数と、前記コードワードを表す情報とを出力
することを特徴とする。
〔作用〕
本発明による音声符号化方式の第1の特徴は、有声区間
において、第3図のブロック図に示すように、フレーム
(通常20m5程度)内のピッチ区間の音源信号を、振
幅及び位相を与えるための少数のパルスを発生するパル
ス発生部700と、音源信号のスペクトル包絡を表すフ
ィルタの係数のコードブック、あるいはフィルタのイン
パルス応答のコードブック720 と、コードブック7
20から一つのコードワードを選択して音源信号を形成
する音源信号形成部710により表すことである。この
ようにして表した音源信号により合成フィルタ730を
駆動して合成音声を得る。
また第2の特徴は、前述のように表した音源信号を用い
て合成フィルタ730のスペクトルパラメータ(以下フ
ィルタ係数)を求め直すことである。
今、−例としてパルス発生部700のパルスの個数を1
とする。また前記コードブックは、音源信号のスペクト
ル包絡を表すフィルタのインパルス応答の集合からなる
ものとする。これをhj(n)(j=1−2に)とする
。このインパルス応答は種々の方法により求めることが
できる。例えば、音声信号をLPG分析して得た予測残
差信号のフレーム毎の予め定められたサンプル数をFF
T(高速フーリエ変換)して絶対値スペクトルを求め、
これを逆FFTするとインパルス応答が求まる。別の方
法としては、前記予測残差信号を周知のLPG分析によ
りフィルタの係数を求め、このフィルタのインパルス応
答を求める。以上の他、周知の方法を用いることができ
る。コードブックは多量の音声データに対してトレーニ
ングを行いあらかじめ作成しておく。
前記パルスの振幅g1位相m、コードブックからのコー
ドワードhi(n)の選択は次のように行う、第4図(
a)に成るフレームの音声波形を示す。フレームを音声
信号から求めたピッチパラメータのピッチ周期T毎のピ
ッチ区間に区切り、一つのピッチ区間(代表区間)に着
目する(第4図(b))。この区間での音声信号をxk
(n)とする。この区間におけるパルスの振幅g1位相
m、コードブックからの最適なコードワードの選択は、
次式で示す重みづけ誤差電力を最小化するように行う。
代表区間における重みづけ誤差電力Ellは、 Et==Σ((x−(n) −ik(n−m))*w 
(n) ) ”          ・ ・ ・(1)
で表される。ただし、 im (n  m)=g−h= (n  m) *hs
 (n)である。ここで、w (n)は聴感重みづけフ
ィルタのインパルス応答を示す。具体的な構成例は、へ
ta1氏らによる“A New Model of L
PCExcitationfor Producing
 Natural  Sounding 5peech
 at  lowBit Rates   、  Pr
oc、  ICASSP+  ILL  614−61
7+  1982+文献4)を参照することができる。
ただし、このフィルタはなくてもよい。1−(n)は、
パルスとコードブックから選択したj番目のコードワー
ドとを用いて音源信号を表し、さらにこれを合成フィル
タに通して再生した再生音声を示す。またり、(n)は
音声を合成するための合成フィルタのインパルス応答を
示す。記号*は畳み込み積分を示す。(2)式を(1)
式に代入してgで偏微分して0とおき次式を得る。
g=ΣXwi+ (n ) X ’ wl+ (n  
m)/ΣX’ wk (n  m)  X’ Wk C
n  m)・ ・ ・(3) ここで、 x、= (n)=x−(n)*w (n)x’ wk 
(n−m)=hi (n−m)* ha (n)*w 
(n)・ ・ ・(4) である。(1)式を最小化する最適なglm、hJの組
は次のように求められる。インパルス応答系列り、とし
てまず成るコードワードを用いて(3)式を計算し、(
1)式を最小化するようにg、 mを求める。
これには、 g・ΣXwk (n ) X ’ wk (n  m)
/ΣX’ wl+ (n  m)  X’ wk (n
  m)を最大化するg、  mを求めればよい。以上
の処理を全てのjについて行い、 g’ΣXwk Cn ) X ’ wk(n  m)/
ΣX ’ −k(n  m)  X ’ wk (n 
 m)の値が最も大きいg、  m、  jの組が求め
る組である。
以上の処理により、着目するピッチ区間においてパルス
の振幅2位相、コードワードが求まる。
第4図(C)、(d)に、求めたパルス、求めたパルス
と選択したコードワードにより発生した代表区間の音源
信号により合成フィルタを駆動して得た合成波形x、(
n)をそれぞれ示す8以上の処理はフレーム内の全ての
ピッチ区間で行ってもよいし、一つのピッチ区間(代表
区間)についてのみ行ってもよい。
次に合成フィルタの係数の求め直しについて説明する。
上述のようにパルスとコードブックにより求めた代表区
間の音源信号をv (n)とする。
v (n) =g −hj(n−m)     −−−
(5)合成フィルタの係数をalとし、音源信号v (
n)を合成フィルタに通して求めた音声は、x (n)
 =v (n)+Σai’X (n−i)+e (n)
・・・(6) で表され、e (n)は誤差信号を示す。係数aiは次
式を最小化するように求められる。
E=Σe(n)”             ・ ・ 
・(7)(6)式を(7)式に代入して係数aiを偏微
分して0とおき次式を得る。
=Σa、Σx  (n−i)  x  (n−i)五n ・ ・ ・(8) ここで(8)式の左辺第1項はx (n)の自己相関、
第2項はv (n)とx (n)の相互相関である。
(8)式の解法には、例えばRabiner、 5ch
afer氏らによる“Digital process
ing of 5peech signalsl′と題
した刊行物(Prentice−Hal1社1978)
 (文献5)等を参照できる。
〔実施例〕
第1図は、第1の本発明による音声符号化方式を実施す
る音声符号化装置を示す。
第1図において、入力端子100から音声信号を入力し
、1フレ一ム分(例えば20m5 )の音声信号x (
n)をバッファメモリ110に格納する。
スペクトルパラメータ計算回路140は、フレームの音
声信号のスペクトル特性を表すスペクトルパラメータと
して、線形予測係数aiを前記フレームの音声信号から
周知のLPG分析を行い、予め定められた次数Mだけ計
算し、インパルス応答計算回路1701重みづけ回路2
00へ出力する。
ピッチ計算回路130は、フレームの音声信号からピッ
チパラメータとして平均ピッチ周期Tを計従って(8)
式を解くことによりai は求められる。
算する。この方法としては例えば自己相関法にもとづく
方法が知られており、詳細は前記文献1゜2のピッチ抽
出回路を参照することができる。また、この方法以外に
も他の周知な方法(例えば、ケプストラム法、5IFT
法、変相開法など)を用いることができる。
ピッチ符号化回路150は、平均ピッチ周期Tを予め定
められたビット数で量子化して得た符号をマルチプレク
サ260へ出力するとともに、これを復号化して得た復
号ピッチ周期T′をピッチ分割回路205.音源信号計
算回路220へ出力する。
コードブック175は、音源信号のスペクトル包絡を表
すフィルタのインパルス応答の系列J (n)(n=1
−L)の集合(コードブック)を2重4種類格納してい
る。ここでコードブックは予め多量の音声信号の予測残
差信号から分析した、残差信号ノスペクトル包絡を表す
フィルタのインパルス応答データから学習により作成し
ておく、この学習の方法としては、ベクトル量子化の学
習法が知られており、例えばMakhou1氏らによる
“Vector口uantization  in  
5peech  Coding、    (Proc、
  IEEE。
vol、73.11.1551−1588.1985)
 (文献6)等を参照することができる。また、残差信
号のスペクトル包絡を表すフィルタの特性の求め方とし
ては、周知の種々の方法を用いることができる。例えば
、残差信号に対してLPG分析、共分散分析、改良ケプ
ストラム分析などを用いることができる。LPG分析、
共分散分析については、前記文献5などを参照できる。
改良ケプストラム分析については、今井氏らによる“改
良ケプストラム法によるスペクトル包絡の抽出” (電
子通信学会論文誌。
J62−A、 21?−233頁、 1979年)(文
献7)等を参照できる。コードブック175は、2M個
のインパルス応答系列hj(n)(j=1 2’)につ
いて、j=1から順にj=2’まで一つずつ取り出して
インパルス応答計算回路170へ出力する。
インパルス応答計算回路170は、スペクトルパラメー
タ計算回路140からの線形予測係数aiを用いて、聴
感重みづけを行った合成フィルタのインパルス応答り、
(n)を計算し、さらにコードブック175からの出力
h=(n)と(4)式に従いたたみこみ計算を行って得
たインパルス応答X’wk(n−m)を、自己相関関数
計算回路180へ出力する。
自己相関関数計算回路180は、インパルス応答X ’
 whr (n  m)の自己相関関数Rhh(n)を
予め定められた遅れ時間まで計算して出力する。自己相
関関数計算回路180の動作は前記文献1. 2等を参
照することができる。
減算器190は、フレームの音声信号x (n)から合
成フィルタ281の出力を1フレーム分減算し、減算結
果を重みづけ回路200へ出力する。
重みづけ回路200は、前記減算結果をインパルス応答
がw (n)で表される聴感重みづけフィルタに通し、
重みづけ信号x、(n)を得てこれを出力する4重みづ
けの方法は前記文献1.2等を参照できる。
ピッチ分割回路205は、フレームの音声信号を復号化
されたピッチ周期T′を用いてT′毎に分割する。
相互相関関数計算回路210は、重みづけ信号x、(n
)とインパルス応答X ’ wk (n  m)を入力
して相互相関関数φ□を予め定められた遅れ時間まで計
算し出力する。この計算法は前記文献1.2等を参照で
きる。
音源信号計算回路220では、フレーム内の代表的な1
つのピッチ区間(代表区間)について、音源信号をコー
ドブックh=(n)と1個のパルスで表すために、コー
ドワードとパルスの振幅gと位相mを求める。このとき
g、mの計算には前記(3)式を用いる。次に前記作用
の項で述べたように、ht (n)として2重種類につ
いてコードブック175から出力し以上の処理を繰り返
し行い、(1)式の誤差電力を最小化するglm、hj
(n)の組を作用の項で述べた方法により求める。そし
て選択されたコードブックのインデックスを示す符号を
マルチプレクサ260に出力し、gtmを符号器230
へ出力する。
符号器230は、代表区間のパルスの振幅g1位相mを
予め定められたビット数で符号化して出力する。また、
代表区間のサブフレーム位置を示す情報Ptを予め定め
られたビット数で符号化してマルチプレクサ260へ出
力する。さらに、これらを復号化して駆動信号復元回路
283.パラメータ修正回路178へ出力する。
パラメータ修正回路178は、代表区間において求めた
パルスの振幅9位相、選択したコードワードを用いて代
表区間において音源信号v (n)を発生する。さらに
音声信号x (n)を用い前記(8)式に従い線形予測
係数a1を求め直し、これをにパラメータに変換しパラ
メータ符号化回路160に出力する。
パラメータ符号化回路160はにパラメータを符号化し
て、符号2kをマルチプレクサ260へ出力する。また
この復号値を線形予測係数a 、 Iに変換し合成フィ
ルタ281へ出力する。
駆動信号復元回路283は、代表区間において求めたパ
ルスの振幅1位相、選択したコードワードを用いて代表
区間において音源信号を発生する。
他のピッチ区間においては、前後のフレームの代表区間
におけるパルスの振幅を用いて振幅同士を線形補間して
、他のピッチ区間のパルスを求める。
また、選択したコードワードに対しては、代表区間のコ
ードワード同士を線形補間して、他のピッチ区間におけ
る音源信号のスペクトル包絡を表すインパルス応答を求
める。以上の処理によりフレームの音源信号を復元して
発生する。
合成フィルタ281は、前記復元された音源信号を入力
し、パラメータ符号化回路160からの線形予測係数a
i′を入力して1フレ一ム分の合成音声信号を求めると
共に、次のフレームへの影響信号を1フレーム分計算し
、これを減算器190へ出力する。なお、影響信号の計
算法は特願昭57−231605号明細書(文献8)等
を参照できる。
マルチプレクサ260は、代表区間におけるパルスの振
幅9位相を表す符号、代表区間の位置を表す符号、Kパ
ラメータを表す符号、ピッチ周期を表す符号、選択され
たコードワードを表す符号を組み合わせて出力する。
次に、第2の本発明による実施例を説明する。
第2図は、第2の本発明による音声符号化方式を実施す
る音声符号化装置を示す。図において第1図と同一の参
照番号を付した構成要素は第1図と同様の動作をするの
で説明は省略する。
第2図において、225は振幅・位相補正計算回路であ
る。振幅・位相補正計算回路225では、同一フレーム
内の代表区間以外のピッチ区間において代表区間のパル
スの振幅1位相を補正するための補正係数を各ピッチ区
間毎に計算する。具体的には次のように求める。第i番
目のピッチ区間における入力音声、振幅補正係数1位相
補正係数を、それぞれxz(n)、C1tdi とする
第i番目のピッチ区間において代表区間のパルスの振幅
9位相とコードワードにより復元した音源信号の振幅と
位相を補正して合成フィルタに通して再生した再生信号
又= (n)と入力音声信号Xi (n)との聴感重み
づけ誤差電力は次のように書ける。
E w i =Σ ((xz (n)−cix= (n
−T’−d、))*w (n))”・ ・ ・(9) ここで、 マt(n  ’r’   at) =g −h  (n−m−T’−d、)* hs (n
)・・・θω である。振幅1位相補正係数c、、d、は00)式を最
小化するように求めることができる。00式を振幅補正
係数C1で偏微分して0とおき次式を得る。
ci=ΣXwA(n)iw= (n−T’ −d4 )
/ΣMwi (n  T’  dt ) 2wt (n
  T’  dt )・・・01) 種々の位相補正係数d、について00式を計算し、(1
1)式を最大化するc、、dlの組を求めればよい。
以上の処理をフレーム内の代表区間以外の全てのピッチ
区間について行い、各区間の振幅・位相補正係数を符号
器230へ出力する。
駆動信号復元回路285は、フレームの代表区間ではパ
ルスの振幅1位相及び選ばれたコードヮードを用いて音
源信号v (n)を発生させる。また同一フレーム内の
代表区間以外のi番目のピッチ区間においては、代表区
間の音源信号v (n)を振幅9位相補正係数cz、d
zを用いて次式に従い補正してi番目のピッチ区間の音
源信号d、(n)を発生させる。
d+ (n)=C!  ・v (n−T’−d、)・ 
・02) ただし v (n)=g−hj(n−m)     ・・・側こ
こでhJ(n)、g、mはコードブックのコードワード
、パルスの振幅、パルスの位相である。
以上には本発明の各実施例を説明したが、上述した各実
施例はあくまで本発明の一例に過ぎず、その変形例も種
々考えられる。
例えば、パラメータ修正回路178で求め直した線形予
測係数a1を用いて音源信号計算回路220において代
表区間のパルスを計算し直してもよい。
このためには前記求め直した線形予測係数をインパルス
応答計算回路170に通してインパルス応答を計算し直
し、さらに自己相関関数計算回路180゜相互相関関数
計算回路210で自己相関、相互相関を計算し直し、こ
れらを音源信号計算回路220へ出力してパルスを求め
直せばよい。また、パルス計算、線形予測係数の修正、
パルスの求め直しの処理を、あらかじめ定められた回数
だけ繰り返してもよい。このような構成をとることによ
り演算量は増加するが特性は改善される。
また、パルスの振幅1位相の計算及びコードワードの選
択を代表区間のみではなくフレーム内の全ピッチ区間に
おいて行うようにしてもよい。このような構成とすると
、音源情報の伝送に必要な情報量は増大するが特性は向
上する。
また、代表区間は例えばフレームの中央部というように
フレーム内で固定的に決めてもよいし、合成音声と入力
音声との誤差を最も小さくするピッチ区間を探索して求
めてもよい。後者の具体的な方法については前記文献l
を参照できる。
また、代表区間のパルスの個数は2以上でもよい。この
ようにすると特性は改善されるが、伝送情報量が増大す
る。
また、コードワードに関しては代表区間以外の他のピッ
チ区間においては線形補間してもよいし、しなくてもよ
い。
また、コードブックとして、音声信号の予測残差信号の
スペクトル包絡を表すフィルタのインパルス応答とした
が、フィルタの係数としてもよい。
このような構成のときはフィルタ係数からインパルス応
答に変換する必要がある。係数としては具体的には、線
形予測係数、にパラメータ、対数断面積比、ケプストラ
ム、メルケプストラムなど周知の係数を用いることがで
きる。
また、実施例では、スペクトルパラメータとして線形予
測係数を符号化し、その分析法としてLPG分析を用い
たが、スペクトルパラメータとしては他の周知なパラメ
ータ、例えばLSP、LPCケプストラム、ケプストラ
ム、改良ケプストラム、一般化ケプスドラム、メルケプ
ストラムなどを用いることもできる。また各パラメータ
に最適な分析法を用いることができる。
また、演算量を低減するために、影響信号の計算を省略
することもできる。これによって、駆動信号復元回路2
831合成フィルタ281.減算器190は不要となり
演算量低減が可能となるが、音質は低下する。
なお、デジタル信号処理の分野でよく知られているよう
に、自己相関関数は周波数軸上でパワスペクトルに、相
互相関関数はクロスパワスペクトルに対応しているので
、これらから計算することもできる。これらの計算法に
ついては、Oppenheim氏らによる“Digit
al Signal Processing   (P
rentice−Hall、 1975) (文献9)
と題した刊行物を参照できる。
〔発明の効果] 以上述べたように、本発明によれば、1ピッチ区間の音
源信号(代表区間)を、振幅2位相を与える少数のパル
スと音源信号の特性を表すコードブックとを用いて表し
ており、さらにこのような音源信号を用いてスペクトル
パラメータを求め直しているので、4.8kb/s程度
のビットレートでは従来方式に比べ音源信号の近似度が
高く良好な合成音声を得ることができるという大きな効
果がある。
【図面の簡単な説明】
第1図は第1の発明による音声符号化方式の一実施例を
説明するための音声符号化装置のブロック図、 第2図は第2の発明による音声符号化方式の一実施例を
説明するための音声符号化装置のブロック図、 第3図及び第4図は本発明の詳細な説明するための図で
ある。 110  ・・・・・バッファメモリ 130  ・・・・・ピッチ計算回路 140  ・・・・・スペクトルパラメータ計算回路1
50  ・・・・・ピッチ符号化回路160  ・・・
・・パラメータ符号化回路170  ・・・・・インパ
ルス応答計算回路178  ・・・・・パラメータ修正
回路175、350.720  ・・・コードブック1
80  ・・・・・自己相関関数計算回路205  ・
・・・・ピッチ分割回路 210 ・・・・・相互相関関数計算回路220 ・・
・・・音源信号計算回路 225 ・・・・・振幅・位相補正計算回路230 ・
・・・・符号器 260  ・・・・・マルチプレクサ 281、360.730  ・・・合成フィルタ283
 ・・・・・駆動信号復元回路

Claims (2)

    【特許請求の範囲】
  1. (1)入力した離散的な音声信号から、スペクトル包絡
    を表すスペクトルパラメータとピッチを表すピッチパラ
    メータとを予め定められた時間長のフレーム毎に求め、
    前記フレームの音声信号を前記ピッチパラメータから求
    めたピッチ周期に応じたピッチ区間毎に分割し、前記ピ
    ッチ区間の内の1つのピッチ区間の音源信号をパルスと
    前記音源信号のスペクトル包絡特性を表すコードブック
    とで表し、前記パルスと前記コードブックにより得られ
    る復元音源信号と前記スペクトルパラメータにより得ら
    れる合成信号と前記音声信号との誤差を小さくするよう
    に前記パルスの振幅と位相を求め、前記コードブックか
    ら一つのコードワードを選択すると共に、前記復元音源
    信号をもとに前記スペクトルパラメータを修正し、前記
    ピッチパラメータと前記スペクトルパラメータと前記パ
    ルスの振幅、位相と前記コードワードを表す情報とを出
    力する音声符号化方式。
  2. (2)入力した離散的な音声信号から、スペクトル包絡
    を表すスペクトルパラメータとピッチを表すピッチパラ
    メータとを予め定められた時間長のフレーム毎に求め、
    前記ピッチパラメータから求めたピッチ周期に応じたピ
    ッチ区間毎に前記フレームの音声信号を分割し、前記ピ
    ッチ区間の内の1つのピッチ区間の音源信号をパルスと
    前記音源信号のスペクトル包絡特性を表すコードブック
    とで表し、さらに前記ピッチ区間以外の他のピッチ区間
    では前記パルスの振幅、位相を補正する補正係数を求め
    、前記パルスと前記補正係数と前記コードブックにより
    得られる復元音源信号と前記スペクトルパラメータとか
    ら求めた合成音声と前記音声信号との誤差を小さくする
    ように前記パルスの振幅と位相を求め前記コードブック
    から一つのコードワードを選択すると共に、前記復元音
    源信号をもとに前記スペクトルパラメータを修正し、前
    記ピッチパラメータと前記スペクトルパラメータと前記
    パルスの振幅、位相と、前記補正係数と、前記コードワ
    ードを表す情報とを出力する音声符号化方式。
JP1103410A 1989-04-25 1989-04-25 音声符号化方式 Expired - Lifetime JP2946525B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1103410A JP2946525B2 (ja) 1989-04-25 1989-04-25 音声符号化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1103410A JP2946525B2 (ja) 1989-04-25 1989-04-25 音声符号化方式

Publications (2)

Publication Number Publication Date
JPH02282800A true JPH02282800A (ja) 1990-11-20
JP2946525B2 JP2946525B2 (ja) 1999-09-06

Family

ID=14353283

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1103410A Expired - Lifetime JP2946525B2 (ja) 1989-04-25 1989-04-25 音声符号化方式

Country Status (1)

Country Link
JP (1) JP2946525B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999021174A1 (en) * 1997-10-22 1999-04-29 Matsushita Electric Industrial Co., Ltd. Sound encoder and sound decoder
CN100367347C (zh) * 1997-02-13 2008-02-06 松下电器产业株式会社 话音信号编码器和话音信号解码器
KR100955126B1 (ko) * 1997-10-22 2010-04-28 파나소닉 주식회사 벡터 양자화 장치
CN114203166A (zh) * 2021-12-10 2022-03-18 零犀(北京)科技有限公司 基于人机对话的训练数据的生成方法、装置和设备

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100367347C (zh) * 1997-02-13 2008-02-06 松下电器产业株式会社 话音信号编码器和话音信号解码器
US7499854B2 (en) 1997-10-22 2009-03-03 Panasonic Corporation Speech coder and speech decoder
US7546239B2 (en) 1997-10-22 2009-06-09 Panasonic Corporation Speech coder and speech decoder
CN100349208C (zh) * 1997-10-22 2007-11-14 松下电器产业株式会社 扩散矢量生成方法及扩散矢量生成装置
US6415254B1 (en) 1997-10-22 2002-07-02 Matsushita Electric Industrial Co., Ltd. Sound encoder and sound decoder
US7373295B2 (en) 1997-10-22 2008-05-13 Matsushita Electric Industrial Co., Ltd. Speech coder and speech decoder
WO1999021174A1 (en) * 1997-10-22 1999-04-29 Matsushita Electric Industrial Co., Ltd. Sound encoder and sound decoder
US7533016B2 (en) 1997-10-22 2009-05-12 Panasonic Corporation Speech coder and speech decoder
US7024356B2 (en) 1997-10-22 2006-04-04 Matsushita Electric Industrial Co., Ltd. Speech coder and speech decoder
KR100955126B1 (ko) * 1997-10-22 2010-04-28 파나소닉 주식회사 벡터 양자화 장치
US7925501B2 (en) 1997-10-22 2011-04-12 Panasonic Corporation Speech coder using an orthogonal search and an orthogonal search method
US8332214B2 (en) 1997-10-22 2012-12-11 Panasonic Corporation Speech coder and speech decoder
US8352253B2 (en) 1997-10-22 2013-01-08 Panasonic Corporation Speech coder and speech decoder
CN114203166A (zh) * 2021-12-10 2022-03-18 零犀(北京)科技有限公司 基于人机对话的训练数据的生成方法、装置和设备
CN114203166B (zh) * 2021-12-10 2023-03-31 零犀(北京)科技有限公司 基于人机对话的训练数据的生成方法、装置和设备

Also Published As

Publication number Publication date
JP2946525B2 (ja) 1999-09-06

Similar Documents

Publication Publication Date Title
JP2940005B2 (ja) 音声符号化装置
KR100304682B1 (ko) 음성 코더용 고속 여기 코딩
JP4008607B2 (ja) 音声符号化/復号化方法
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JP2970407B2 (ja) 音声の励振信号符号化装置
JP3531780B2 (ja) 音声符号化方法および復号化方法
JP3095133B2 (ja) 音響信号符号化方法
JP3308764B2 (ja) 音声符号化装置
JPH02282800A (ja) 音声符号化方式
JPH0854898A (ja) 音声符号化装置
JP3303580B2 (ja) 音声符号化装置
JP2956068B2 (ja) 音声符号化復号化方式
JP3003531B2 (ja) 音声符号化装置
JPS6238500A (ja) 高能率音声符号化方式とその装置
JP2943983B1 (ja) 音響信号の符号化方法、復号方法、そのプログラム記録媒体、およびこれに用いる符号帳
JPH0258100A (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JP3252285B2 (ja) 音声帯域信号符号化方法
JP2000298500A (ja) 音声符号化方法
JP3192051B2 (ja) 音声符号化装置
JP2947788B1 (ja) 音声および音響信号の高速な符号化方法および装置および記録媒体
JP2508002B2 (ja) 音声符号化方法とその装置
JP2000029499A (ja) 音声符号化装置ならびに音声符号化復号化装置
JPH04301900A (ja) 音声符号化装置
JP2658438B2 (ja) 音声符号化方法とその装置
JPS63127299A (ja) 音声信号符号化・復号化方式およびその装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070702

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080702

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090702

Year of fee payment: 10

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090702

Year of fee payment: 10