JPH11212598A - 音声符号化装置 - Google Patents
音声符号化装置Info
- Publication number
- JPH11212598A JPH11212598A JP10022795A JP2279598A JPH11212598A JP H11212598 A JPH11212598 A JP H11212598A JP 10022795 A JP10022795 A JP 10022795A JP 2279598 A JP2279598 A JP 2279598A JP H11212598 A JPH11212598 A JP H11212598A
- Authority
- JP
- Japan
- Prior art keywords
- noise
- speech
- vector
- coefficient
- filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
備選択を行うことにより、演算量を削減した音声符号化
方式を実現する。 【解決手段】 入力音声1を一定サンプル数ごとに線形
予測分析2し、合成フィルタ係数4を求め、そのフィル
タ4の励振源としてピッチ周期の成分ベクトルをもつ適
応符号帳9と雑音成分ベクトルをもつ雑音符号帳10等
を備え、合成後の波形が入力音声の波形に対し歪みが最
小となるように励振ベクトルを決定する。この励振ベク
トルを決定する際に、入力音声信号より抽出した雑音源
を離散コサイン変換係数(DCT係数)に変換14し、
その係数列と予め求めておいた雑音成分ベクトルのDC
T係数列15を比較して予備選択を行う。
Description
より詳細には、2次残差信号をDCT変換して予備選択
することにより雑音符号帳の検索の演算量を減らすよう
にしたものである。
音声通信システムが実用に向け開発されているが、この
ような音声通信システムでは、通信回線を介して送受信
される信号量を最小限にするため音声信号を圧縮、伸張
して情報量を少なくしている。つまり、一方の端末より
入力される音声入力を圧縮し、この圧縮された信号を通
信回線を介して相手側に送信し、一方、相手側より通信
回線を介して受信した信号を伸張し、この伸張した音声
信号を出力するようにしたものがある。
ELP方式がある。このCELP方式を採用した音声処
理装置では、送信側の音声信号圧縮手段として、音声信
号を1フレーム毎に短期線形予測して、この短期線形予
測により予測された信号と入力音声信号との差を複数の
サブフレームに分割し、これらサブフレームに対し、コ
ードブックを用意しておき、入力される音声信号の各サ
ブフレームに対し最も類似する代表ベクトルをコードブ
ックから検索し、この検索された代表ベクトルの符号コ
ードを圧縮信号として出力し、一方、受信側の音声信号
伸張手段として、上述したと同様なコードブックを用意
しておき、通信回線を介して受けとった符号コードから
該当する代表ベクトルを伸張信号として選択し、音声信
号の各サブフレームを再現するようになっている。
コードブック検索は、音声信号のフレーム全長に亘って
歪みが最小になるように、各サブフレームを2つのコー
ドブックに対して行うようにしている。つまり、音声を
合成する励振源は、ピット周期成分と雑音成分からなっ
ているが、これらピッチ周期成分と雑音成分に対応する
適応符号帳と雑音符号帳という2つのコードブックを用
い、これら2つのコードブックに対して各サブフレーム
単位で最小誤差評価により検索を行うようにしている。
ドブックに貯えられた各励振源符号ベクトルを線形予測
合成フィルタに通すことにより合成音声を生成し、原音
声と比較し、最も原音声に近いものを選択することによ
って行われる。しかし、このフイルタ演算には、多くの
演算を必要とするため、前記コードブックに貯えられた
すべての励振源符号ベクトルをフィルタを通して比較を
行うことは多大な計算を必要とし、汎用のプロセッサで
リアルタイムの処理を実現することは大変困難である。
たもので、特に、上述のごとき2つのコードブックのう
ちの雑音符号帳の予備選択を行うことにより、演算量を
削減する音声符号化方式を実現するものである。
を一定サンプル数ごとに線形予測分析し、合成フィルタ
係数を求め、そのフィルタの励振源としてピッチ周期の
成分ベクトルをもつ適応符号帳と雑音成分ベクトルをも
つ雑音符号帳等を備え、合成後の波形が入力音声の波形
に対し歪みが最小となるように励振ベクトルを決定する
符号化方式搭載の音声符号化装置において、励振ベクト
ルを決定する際に、入力音声信号より抽出した雑音源を
離散コサイン変換係数(以下、DCT係数)列に変換
し、その係数列と予め求めておいた雑音成分ベクトルの
DCT係数列を比較することにより予備選択を行うこと
を特徴としたものである。
て、雑音成分ベクトルをDCT係数の強度最大の位置を
利用することを特徴としたものである。
て、雑音符号帳の雑音符号ベクトルの並びをDCT係数
の強度最大の位置の順番にならべたことを特徴としたも
のである。
トルをもつ適応符号帳と、雑音成分ベクトルをもつ雑音
符号帳とがフィルタの励振源として用いられ、そのフィ
ルタにより合成された音声の波形と入力音声の波形との
歪みが最小となるように励振ベクトルを決定し、音声の
信号系列を少ない情報量でディジタル符号化する高能率
音声符号化法に関するものである。
した例を説明するための図で、図1において、1は入力
音声で、この入力音声1は複数のフレームに分割して入
力される。この入力音声1は、各フレーム単位で取り込
まれ線形予測分析部2、聴覚重み付きフィルタ3に与え
られる。線形予測分析部2は、音声信号の現時点でのサ
ブフレームと現時点に隣接する過去の複数のサブフレー
ムとの間の線形予測を行うもので、この予測分析結果を
合成フィルタ4、聴覚重み付きフィルタ5および聴覚重
み付きフィルタ3に与えられる。そして、合成フィルタ
4からの出力を聴覚重み付きフィルタ5(聴覚重み付け
した予測音声)を介して減算器7に与え、この減算器7
で、聴覚重み付きフィルタ3からの出力(聴覚重み付け
した入力音声)との減算出力を算出する。
この距離計算・最適音源選択部8は、減算器7からの出
力を取り込み、適応符号帳9および雑音符号帳10の2
つのコードブックを選択する。そして、これら適応符号
帳9および雑音符号帳10より最適なピッチ周期成分α
A(i)と雑音成分βC(i)を検索し、これらの結果
を加算器11を介して最適な音源、つまり、励振源E
(i)として合成フィルタ4に与えるようにしている。
2に示すフローチャートに従った制御が実行される。ま
ず、ステップS1で入力音声1の最初のフレームを取り
込む。この場合の1フレームは、複数のサブフレームか
らなっている。そして、ステップS2で線形予測分析部
2により取り込んだ1フレームについて、隣接する過去
のフレームから線形予測を行い、この分析結果を踏まえ
て次のステップS3の適応符号帳検索に進む。ステップ
S3の適応符号帳検索では、ステップS1で予測した音
声との差信号の1番目のサブフレームについて、適応符
号帳9を検索して距離の近い代表ベクトルをピッチ周期
成分として生成する。
たベクトルを入力した合成フィルタ4、聴覚重み付きフ
ィルタ5の出力に、入力音声の聴覚重み付きフィルタの
出力を減算した二次残差信号を抽出し、ステップS5で
は、二次残差信号を入力した逆聴覚重み付きフィルタ1
2、逆合成フィルタ13の出力をDCT変換14する。
このDCT変換列の特徴と、前もって雑音符号帳のDC
T変換列の特徴を抽出し特徴別に分けているDCT変換
列特徴テーブル15を用いて雑音符号帳の中からいくつ
かの雑音成分ベクトルを選択する。たとえば、DCT変
換列の結果が図3のようになった場合、DCT変換列特
徴テーブルを、図4のような、4つの場合分けを行って
いれば、このパターンは、グループ1に近いため雑音符
号帳10の内、グループ1に属するベクトルのみをステ
ップS7で検索して距離の近いベクトルを見つける。こ
れにより演算量は、1/4に減少することになる。
明すれば、DCT変換した係数列のJ番目の値が最大値
をもつとする。この場合、雑音符号帳が図5のように並
べてあるとすれば、検索は、j−m/2からj+m/2
までの雑音成分ベクトルの検索をして距離の近いベクト
ルを見つける。この場合は、雑音符号帳の探索の演算量
がm/N(雑音符号帳のベクトル数N)に減ることにな
り、さらに、DCT変換列特徴テーブルが必要なくな
る。
ば、2次残差信号をDCT変換し、予備選択することに
より、雑音符号帳の検索の演算量を減らすことができ
る。
図である。
ある。
る。
である。
図である。
付きフィルタ、4…合成フィルタ、7…減算器、8…距
離計算・最適音源選択部、9…適応符号帳、10…雑音
符号帳、11…加算器、12…逆聴覚重み付きフィル
タ、13…逆合成フィルタ、14…DCT変換、15…
DCT変換列特徴テーブル。
Claims (3)
- 【請求項1】 音声を一定サンプル数ごとに線形予測分
析し、合成フィルタ係数を求め、該フィルタの励振源と
してピッチ周期の成分ベクトルをもつ適応符号帳と雑音
成分ベクトルをもつ雑音符号帳等を備え、合成後の波形
が入力音声の波形に対し歪みが最小となるように励振ベ
クトルを決定する符号化方式搭載の音声符号化装置にお
いて、前記励振ベクトルを決定する際に、入力音声信号
より抽出した雑音源を離散コサイン変換係数(以下、D
CT係数)列に変換し、その係数列と予め求めておいた
雑音成分ベクトルのDCT係数列を比較することにより
予備選択を行うことを特徴とする音声符号化装置。 - 【請求項2】 請求項1記載の音声符号化装置におい
て、雑音成分ベクトルをDCT係数の強度最大の位置を
利用することを特徴とする音声符号化装置。 - 【請求項3】 請求項1記載の音声符号化装置におい
て、雑音符号帳の雑音符号ベクトルの並びをDCT係数
の強度最大の位置の順番にならべたことを特徴とする音
声符号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP02279598A JP3714786B2 (ja) | 1998-01-20 | 1998-01-20 | 音声符号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP02279598A JP3714786B2 (ja) | 1998-01-20 | 1998-01-20 | 音声符号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11212598A true JPH11212598A (ja) | 1999-08-06 |
JP3714786B2 JP3714786B2 (ja) | 2005-11-09 |
Family
ID=12092624
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP02279598A Expired - Fee Related JP3714786B2 (ja) | 1998-01-20 | 1998-01-20 | 音声符号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3714786B2 (ja) |
-
1998
- 1998-01-20 JP JP02279598A patent/JP3714786B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP3714786B2 (ja) | 2005-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2160749C (en) | Speech coding apparatus, speech decoding apparatus, speech coding and decoding method and a phase amplitude characteristic extracting apparatus for carrying out the method | |
KR100304682B1 (ko) | 음성 코더용 고속 여기 코딩 | |
JP3094908B2 (ja) | 音声符号化装置 | |
AU653969B2 (en) | A method of, system for, coding analogue signals | |
JPH0990995A (ja) | 音声符号化装置 | |
WO2002071394A1 (en) | Sound encoding apparatus and method, and sound decoding apparatus and method | |
JPH0341500A (ja) | 低遅延低ビツトレート音声コーダ | |
JPH09319398A (ja) | 信号符号化装置 | |
JPH10240299A (ja) | 音声符号化及び復号装置 | |
JP3531780B2 (ja) | 音声符号化方法および復号化方法 | |
US5943644A (en) | Speech compression coding with discrete cosine transformation of stochastic elements | |
JP3714786B2 (ja) | 音声符号化装置 | |
JPH06282298A (ja) | 音声の符号化方法 | |
JPH0830299A (ja) | 音声符号化装置 | |
JP3249144B2 (ja) | 音声符号化装置 | |
JP3192051B2 (ja) | 音声符号化装置 | |
JP2001142499A (ja) | 音声符号化装置ならびに音声復号化装置 | |
JP3194930B2 (ja) | 音声符号化装置 | |
JP3252285B2 (ja) | 音声帯域信号符号化方法 | |
JP3256215B2 (ja) | 音声符号化装置 | |
JPH0990997A (ja) | 音声符号化装置、音声復号化装置、音声符号化復号化方法および複合ディジタルフィルタ | |
JP3335650B2 (ja) | 音声符号化方式 | |
JP2808841B2 (ja) | 音声符号化方式 | |
JPH07134600A (ja) | 音声符号化装置及び音声復号化装置 | |
JP3715417B2 (ja) | 音声圧縮符号化装置,音声圧縮符号化方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050401 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050607 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050701 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050726 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050804 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050823 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050823 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080902 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090902 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090902 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100902 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110902 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120902 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130902 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |