JP3011038B2 - 音声情報圧縮方法及び装置 - Google Patents
音声情報圧縮方法及び装置Info
- Publication number
- JP3011038B2 JP3011038B2 JP6329557A JP32955794A JP3011038B2 JP 3011038 B2 JP3011038 B2 JP 3011038B2 JP 6329557 A JP6329557 A JP 6329557A JP 32955794 A JP32955794 A JP 32955794A JP 3011038 B2 JP3011038 B2 JP 3011038B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- waveform
- exponential function
- fourier transform
- slope
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
品質の合成音声を得るための音声情報圧縮方法及び装置
に関する。
信側で合成音声を得るためのシステムとして、従来、特
開平4−116600号に開示された音声情報圧縮装置
が知られている。この装置は、音声情報を高速フーリエ
変換(FFT)し、その実数部及び虚数部の各周波数成
分の自乗和を逆フーリエ変換(IFFT)することによ
り零位相化基本波形データを求め、更にこの波形を正規
化した波形の一部分のみを伝送するものである。この装
置では、零位相化基本波形が、その中心で左右対称とな
っていることから、片方の波形を伝送することによって
伝送情報量を半減することができる。また、合成部で
は、零位相化基本波形データを重ね合わせることにより
合成音声を形成することから、その中心部のデータが合
成音声を形成する主要部となる。このため、零位相化基
本波形の中心から正方向のデータのうち、中心から連続
した一部のデータのみを量子化対象とすればよい。
区間毎に線形予測して生じた残差波形のインパルス応答
波形を余弦級数によって近似して、その係数パラメータ
を伝送することによって伝送情報量を圧縮するようにし
た装置も知られている(特開平3−245196号)。
た従来の音声圧縮装置のうち前者の装置では、量子化対
象が零位相化波形データの一部であるとはいえ、連続し
た特定部分の波形データを伝送しなくてはならないた
め、情報量の圧縮にも限度がある。また、後者の装置で
は、伝送波形を余弦級数の係数パラメータに代表させる
ことにより、ある程度の情報圧縮効果は見込まれるもの
の、伝送すべき係数パラメータとしては、ある程度の個
数が必要であるため、やはり十分な情報量の圧縮は難し
い。
れたもので、情報量を大幅に圧縮することができ、音質
も改善することができる音声情報圧縮方法及び装置を提
供することを目的とする。
圧縮装置は、音声情報をフーリエ変換して前記音声情報
のスペクトルを求めるフーリエ変換手段と、このフーリ
エ変換手段で求められた音声情報のスペクトルからパワ
ースペクトルを求めるパワースペクトル算出手段と、こ
のパワースペクトル算出手段で求められたパワースペク
トルを逆フーリエ変換して自己相関波形を求める逆フー
リエ変換手段と、この逆フーリエ変換手段で求められた
自己相関波形を正規化して正規化係数と正規化自己相関
波形とを求める正規化手段と、減衰特性を持つ指数関数
波形を発生する指数関数発生手段と、この指数関数発生
手段で発生された指数関数波形と前記正規化手段で求め
られた正規化自己相関波形との誤差情報を求める誤差情
報算出手段と、この誤差情報算出手段で求められた誤差
情報と前記正規化手段で求められた正規化係数とを圧縮
音声情報として出力する出力手段とを備えたことを特徴
とする。
差情報算出手段で求められた誤差情報を評価する誤差評
価手段を更に備え、前記指数関数発生手段は、前記誤差
情報評価手段での評価結果に基づいて決定された指数関
数波形の傾きを出力し、前記出力手段は、前記誤差情
報、前記正規化係数及び前記指数関数波形の傾きを圧縮
音声情報として出力するものであることを特徴とする。
ば、前記正規化自己相関波形の傾きを算出する第1の傾
き算出手段と、前記指数関数発生手段で生成された指数
関数波形の傾きを算出する第2の傾き算出手段と、これ
ら第1及び第2の傾き算出手段でそれぞれ算出された傾
きの差を求める傾き差算出手段とを更に備え、前記指数
関数発生手段は、前記傾き差算出手段で求められた傾き
の差に基づいて次に発生させる指数関数波形の傾きを修
正するものであり、前記出力手段は、前記誤差情報、前
記正規化係数及び前記傾きの差を前記圧縮音声情報とし
て出力するものであることを特徴とする。
することにより求められる自己相関波形の包絡は、減衰
特性を持つ指数関数によって近似させることができる。
この発明は、この点に着目してなされたもので、音声情
報をフーリエ変換して求められたスペクトルからパワー
スペクトルを求め、更にこれを逆フーリエ変換及び正規
化して正規化自己相関波形を求め、この正規化自己相関
波形を減衰特性を持つ指数関数によって近似したもので
ある。減衰特性を持つ指数関数は、一般に、下記数1に
よって表される。
圧縮側及び音声合成側の双方で定めておき、その指数関
数波形と正規化自己相関波形との誤差情報を求めれば、
この誤差情報と正規化係数とによって音声情報を合成す
ることができる。この発明では、自己相関波形の基本的
な形状を正規化係数のみによって表現しているため、情
報量を大幅に圧縮することができる。また、この場合、
正規化自己相関波形と指数関数波形とが近似しているの
で、誤差情報は振幅値の極めて小さいものとなる。そし
て、この誤差情報を例えばベクトル量子化すれば、正規
化係数と共に、少ない情報量で入力音声を表現すること
ができ、音質も向上する。
評価して、誤差情報が最も少なくなるような傾きαを持
った指数関数波形を生成し、この指数関数波形と正規化
自己相関波形との誤差情報を例えば量子化して、正規化
係数及び傾きαと共に伝送するようにすれば、更に正確
な合成波形を得ることができる。そして、この場合で
も、自己相関波形を特定する情報としては、正規化係数
と傾きαだけであるから、大幅な情報圧縮が可能であ
る。
のものではなく、正規化自己相関波形の傾きと、生成さ
れた指数関数波形の傾きとの差を、前述した正規化係数
及び誤差情報と共に合成側に供給するようにしても同様
に正確な合成波形を得ることができる。この場合、求め
られた傾きの差に基づいて、指数関数波形の傾きを適宜
修正するバックワード予測を行うことにより、傾きの差
を0に近づけることができ、更に情報量を圧縮すること
ができる。
説明する。図1は、この発明の一実施例に係る音声情報
圧縮装置の構成を示すブロック図、図2は、このブロッ
クにおける各部の情報を説明するための図である。図1
において、対象となる入力音声情報は、音声そのものの
情報の他、音声情報からピッチや反射係数等を抽出され
た残差成分の音声情報でも良い。この場合には、ピッチ
や反射係数等も伝送又は記録の対象となることはいうま
でもない。このような入力音声情報は、一定区間毎に切
り出され、必要に応じてハミング窓等によって区間両端
の急激な振幅変化を抑制されたのち、フーリエ変換部1
に入力され、高速フーリエ変換される。これにより、図
2(a),(b)に示すような音声情報のスペクトルが
求められる。このスペクトルは、パワースペクトラム計
算部2に供給され、ここで実数部と虚数部の自乗和の平
方根が求められる。これにより、図2(c)のようなパ
ワースペクトルが算出される。パワースペクトルと自己
相関関数とは、フーリエ変換の関係で1対1に結び合わ
されている。この関係をWiener-Khintchine の定理とい
う。従って、このパワースペクトルを逆フーリエ変換部
3に供給し、ここで逆高速フーリエ変換すると、時間0
を中心として徐々に減衰する自己相関波形が求められ
る。この自己相関波形を、正規化部4において、最大振
幅値で正規化することにより、図2(d)に示すような
正規化自己相関波形が求められる。
つ指数関数f(t)=exp(−αt)[但し、α>
1:以下、f(x)をexp関数と呼ぶ]で近似するこ
とができるので、exp関数発生部5から図2(d)に
示すようなexp関数を発生させ、減算器6で正規化自
己相関波形からexp関数を減算することで、図2
(e)に示すような、残差信号(以下、exp残差と呼
ぶ)を求める。このexp残差は、ベクトル量子化部7
で、例えばコードブックによりベクトル量子化され、イ
ンデックスIDXとして、マルチプレクサ8に供給され
る。また、マルチプレクサ8には、正規化部4で求めら
れた正規化係数も与えられており、これらの情報が多重
化及び符号化されて、音声圧縮情報として伝送又は記録
されることになる。
声圧縮情報から音声を合成する音声合成装置のブロック
図である。音声圧縮情報は、デマルチプレクサ11で復
号及び逆多重化され、exp残差のインデックスIDX
と正規化係数とに分離される。exp残差のインデック
スIDXは、ベクトル逆量子化部12にて、音声情報圧
縮装置のベクトル量子化部7と同じコードブックにて、
コードベクトルに変換される。exp関数発生部13か
らは、音声情報圧縮装置のexp関数発生部5と同一の
exp関数が生成される。このexp関数とexp誤差
のコードベクトルとが加算器14で加算され、正規化自
己相関波形が再生される。この正規化自己相関波形は、
乗算器15において、正規化係数によって元の振幅値に
戻される。これにより自己相関波形を再生することがで
きる。この自己相関波形を、フーリエ変換部16で高速
フーリエ変換し、平方根算出部17で平方根に変換し、
逆フーリエ変換部18で高速逆フーリエ変換したのち、
畳み込み部19で畳み込み演算することにより、元の信
号を再生することができる。
情報が、正規化係数とexp残差のインデックスIDX
のみであり、極めて効率良い情報圧縮が可能である。ま
た、exp残差は、正規化自己相関波形から基本的なe
xp関数を引き算した残りの信号であるから、ダイナミ
ックレンジの小さい信号となる。この実施例で生成する
exp関数は、多数の音声情報から求められた代表的な
傾きαを持つ関数を用いれば良い。
声情報圧縮装置を示すブロック図である。この実施例で
は、求められたexp残差を、誤差評価部21で評価し
て、exp残差が最も少なくなる、又はあるしきい値以
下になるexp関数をexp関数発生部5で決定し、こ
の決定されたexp関数と正規化自己相関波形との誤差
をexp残差としてベクトル量子化したものである。こ
の実施例では、決定されたexp関数の傾きαについて
も、量子化部22で量子化して伝送又は記録する必要が
あるが、exp誤差の振幅は、先の実施例よりも小さく
なり、音声合成の精度は向上する。また、exp関数に
ついても、傾きαの情報のみで一意的に決定できるの
で、情報量の大幅な増加はない。
声情報装置のブロック図である。この実施例では、正規
化部4で求められた正規化自己相関関数の傾きを微分器
31で求めると共に、exp関数発生部5から出力され
るexp関数の傾き(予測傾き)を微分器32で求め、
両傾きの差を減算器33で求めた後、この傾きの差を量
子化部34にて量子化して伝送又は記録するようにした
ものである。また、この実施例では、傾きの差の量子化
結果を逆量子化部35で逆量子化し、微分器32で求め
られたexp関数の傾きに加算して、exp関数発生部
5から発生されるexp関数の傾きを修正するというバ
ックワード予測を行うようにしている。
れた傾きと実際の傾きとの差の情報を伝送又は記録する
ようにしており、傾きの差は、常に0に近づくように制
御されるので、第2の実施例よりも更に伝送情報量は少
なくなる。
クトル量子化して伝送又は記録する例について述べた
が、量子化ステップを可変する適応量子化を用いるよう
にしてもよい。また、exp残差は、高域成分が多く、
低域成分が殆どない信号であると考えられるので、ex
p残差を変換符号化し、高域にビットを多く割り当てる
ようにすれば符号化効率を更に向上させることができ
る。この場合でも、exp残差の量子化は、ベクトル量
子化のみならず適応量子化を用いることができる。
音声情報をフーリエ変換して求められたスペクトルから
パワースペクトルを求め、更にこれを逆フーリエ変換及
び正規化して正規化自己相関波形を求め、この自己相関
波形を減衰特性を持つ指数関数によって近似したので、
自己相関波形の基本的な形状を正規化係数のみ、又は正
規化係数と必要な傾き等の情報のみによって表現するこ
とができ、情報量を大幅に圧縮することができると共
に、音質を向上させることができる。
のブロック図である。
る。
合成装置のブロック図である。
置のブロック図である。
縮装置のブロック図である。
算部、3,18…逆フーリエ変換部、4…正規化部、
5,13…exp関数発生部、6,33…減算器、7…
ベクトル量子化部、8…マルチプレクサ、11…デマル
チプレクサ、12…ベクトル逆量子化部、14,36…
加算器、15…乗算器、17…平方根算出部、19…畳
み込み部、21…誤差評価部、22,34…量子化部、
31,32…微分器、35…逆量子化部。
Claims (4)
- 【請求項1】 音声情報をフーリエ変換して前記音声情
報のスペクトルを求めるフーリエ変換手段と、 このフーリエ変換手段で求められた音声情報のスペクト
ルからパワースペクトルを求めるパワースペクトル算出
手段と、 このパワースペクトル算出手段で求められたパワースペ
クトルを逆フーリエ変換して自己相関波形を求める逆フ
ーリエ変換手段と、 この逆フーリエ変換手段で求められた自己相関波形を正
規化して正規化係数と正規化自己相関波形とを求める正
規化手段と、 減衰特性を持つ指数関数波形を発生する指数関数発生手
段と、 この指数関数発生手段で発生された指数関数波形と前記
正規化手段で求められた正規化自己相関波形との誤差情
報を求める誤差情報算出手段と、 この誤差情報算出手段で求められた誤差情報と前記正規
化手段で求められた正規化係数とを圧縮音声情報として
出力する出力手段とを備えたことを特徴とする音声情報
圧縮装置。 - 【請求項2】 前記誤差情報算出手段で求められた誤差
情報を評価する誤差評価手段を更に備え、 前記指数関数発生手段は、前記誤差情報評価手段での評
価結果に基づいて決定された指数関数波形の傾きを出力
し、 前記出力手段は、前記誤差情報、前記正規化係数及び前
記指数関数波形の傾きを圧縮音声情報として出力するも
のであることを特徴とする請求項1記載の音声情報圧縮
装置。 - 【請求項3】 前記正規化自己相関波形の傾きを算出す
る第1の傾き算出手段と、 前記指数関数発生手段で生成された指数関数波形の傾き
を算出する第2の傾き算出手段と、 これら第1及び第2の傾き算出手段でそれぞれ算出され
た傾きの差を求める傾き差算出手段とを更に備え、 前記指数関数発生手段は、前記傾き差算出手段で求めら
れた傾きの差に基づいて次に発生させる指数関数波形の
傾きを修正するものであり、 前記出力手段は、前記誤差情報、前記正規化係数及び前
記傾きの差を前記圧縮音声情報として出力するものであ
ることを特徴とする請求項1記載の音声情報圧縮装置。 - 【請求項4】 音声情報をフーリエ変換して前記音声情
報のパワースペクトルを求め、 このパワースペクトルを逆フーリエ変換して自己相関波
形を求め、 前記自己相関波形を正規化して正規化係数と正規化自己
相関波形とを求めると共に、減衰特性を持つ指数関数波
形を発生させ、 前記指数関数波形と前記正規化自己相関波形との誤差情
報を求め、 この誤差情報と前記正規化係数とを圧縮音声情報として
出力するようにしたことを特徴とする音声情報圧縮方
法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6329557A JP3011038B2 (ja) | 1994-12-02 | 1994-12-02 | 音声情報圧縮方法及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6329557A JP3011038B2 (ja) | 1994-12-02 | 1994-12-02 | 音声情報圧縮方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08161000A JPH08161000A (ja) | 1996-06-21 |
JP3011038B2 true JP3011038B2 (ja) | 2000-02-21 |
Family
ID=18222694
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6329557A Expired - Fee Related JP3011038B2 (ja) | 1994-12-02 | 1994-12-02 | 音声情報圧縮方法及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3011038B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6802046B2 (en) * | 2002-05-01 | 2004-10-05 | Agilent Technologies, Inc. | Time domain measurement systems and methods |
DE102007017254B4 (de) * | 2006-11-16 | 2009-06-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung zum Kodieren und Dekodieren |
JP5474713B2 (ja) * | 2010-09-06 | 2014-04-16 | Kddi株式会社 | 音声合成装置、音声合成方法および音声合成プログラム |
JP6875680B2 (ja) | 2017-04-10 | 2021-05-26 | 浜松ホトニクス株式会社 | 量子シミュレータおよび量子シミュレーション方法 |
-
1994
- 1994-12-02 JP JP6329557A patent/JP3011038B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH08161000A (ja) | 1996-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7194407B2 (en) | Audio coding method and apparatus | |
EP0673014B1 (en) | Acoustic signal transform coding method and decoding method | |
JP4865010B2 (ja) | 第1成分と第2成分を含む信号を処理する装置と方法 | |
US7996233B2 (en) | Acoustic coding of an enhancement frame having a shorter time length than a base frame | |
US7337118B2 (en) | Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components | |
JP4504414B2 (ja) | 冗長性低減方法 | |
US8417515B2 (en) | Encoding device, decoding device, and method thereof | |
US6345246B1 (en) | Apparatus and method for efficiently coding plural channels of an acoustic signal at low bit rates | |
JP3446216B2 (ja) | 音声信号処理方法 | |
JP3153933B2 (ja) | データ符号化装置及び方法並びにデータ復号化装置及び方法 | |
US20040162720A1 (en) | Audio data encoding apparatus and method | |
PL207861B1 (pl) | Sposób wytwarzania kodowanych sygnałów akustycznych w telekomunikacji | |
JP2002372996A (ja) | 音響信号符号化方法及び装置、音響信号復号化方法及び装置、並びに記録媒体 | |
US7930173B2 (en) | Signal processing method, signal processing apparatus and recording medium | |
JP3186007B2 (ja) | 変換符号化方法、復号化方法 | |
JPH06337699A (ja) | ピッチ・エポック同期線形予測符号化ボコーダおよび方法 | |
KR0137472B1 (ko) | 오디오 신호 코딩 방법 | |
JP3519859B2 (ja) | 符号器及び復号器 | |
JP3344944B2 (ja) | オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法 | |
JP3011038B2 (ja) | 音声情報圧縮方法及び装置 | |
JP3336619B2 (ja) | 信号処理装置 | |
JP3255047B2 (ja) | 符号化装置および方法 | |
JP3089692B2 (ja) | ディジタルデータの高能率符号化方法 | |
WO2003056546A1 (en) | Signal coding apparatus, signal coding method, and program | |
JP3186013B2 (ja) | 音響信号変換符号化方法及びその復号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313532 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081210 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081210 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091210 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101210 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101210 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111210 Year of fee payment: 12 |
|
LAPS | Cancellation because of no payment of annual fees |