JP3714786B2 - 音声符号化装置 - Google Patents

音声符号化装置 Download PDF

Info

Publication number
JP3714786B2
JP3714786B2 JP02279598A JP2279598A JP3714786B2 JP 3714786 B2 JP3714786 B2 JP 3714786B2 JP 02279598 A JP02279598 A JP 02279598A JP 2279598 A JP2279598 A JP 2279598A JP 3714786 B2 JP3714786 B2 JP 3714786B2
Authority
JP
Japan
Prior art keywords
speech
noise
vector
codebook
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP02279598A
Other languages
English (en)
Other versions
JPH11212598A (ja
Inventor
政仲 相良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP02279598A priority Critical patent/JP3714786B2/ja
Publication of JPH11212598A publication Critical patent/JPH11212598A/ja
Application granted granted Critical
Publication of JP3714786B2 publication Critical patent/JP3714786B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、音声符号化装置、より詳細には、2次残差信号をDCT変換して予備選択することにより雑音符号帳の検索の演算量を減らすようにしたものである。
【0002】
【従来の技術】
最近、通信回線を介して音声信号を送る音声通信システムが実用に向け開発されているが、このような音声通信システムでは、通信回線を介して送受信される信号量を最小限にするため音声信号を圧縮、伸張して情報量を少なくしている。つまり、一方の端末より入力される音声入力を圧縮し、この圧縮された信号を通信回線を介して相手側に送信し、一方、相手側より通信回線を介して受信した信号を伸張し、この伸張した音声信号を出力するようにしたものがある。
【0003】
このような圧縮、伸張方式の1つとしてCELP方式がある。このCELP方式を採用した音声処理装置では、送信側の音声信号圧縮手段として、音声信号を1フレーム毎に短期線形予測して、この短期線形予測により予測された信号と入力音声信号との差を複数のサブフレームに分割し、これらサブフレームに対し、コードブックを用意しておき、入力される音声信号の各サブフレームに対し最も類似する代表ベクトルをコードブックから検索し、この検索された代表ベクトルの符号コードを圧縮信号として出力し、一方、受信側の音声信号伸張手段として、上述したと同様なコードブックを用意しておき、通信回線を介して受けとった符号コードから該当する代表ベクトルを伸張信号として選択し、音声信号の各サブフレームを再現するようになっている。
【0004】
ところで、このようなCELP方式によるコードブック検索は、音声信号のフレーム全長に亘って歪みが最小になるように、各サブフレームを2つのコードブックに対して行うようにしている。つまり、音声を合成する励振源は、ピット周期成分と雑音成分からなっているが、これらピッチ周期成分と雑音成分に対応する適応符号帳と雑音符号帳という2つのコードブックを用い、これら2つのコードブックに対して各サブフレーム単位で最小誤差評価により検索を行うようにしている。
【0005】
【発明が解決しようとする課題】
最小誤差評価は、コードブックに貯えられた各励振源符号ベクトルを線形予測合成フィルタに通すことにより合成音声を生成し、原音声と比較し、最も原音声に近いものを選択することによって行われる。しかし、このフイルタ演算には、多くの演算を必要とするため、前記コードブックに貯えられたすべての励振源符号ベクトルをフィルタを通して比較を行うことは多大な計算を必要とし、汎用のプロセッサでリアルタイムの処理を実現することは大変困難である。
【0006】
本発明は、上述のごとき実情に鑑みなされたもので、特に、上述のごとき2つのコードブックのうちの雑音符号帳の予備選択を行うことにより、演算量を削減する音声符号化方式を実現するものである。
【0007】
【課題を解決するための手段】
請求項1の発明は、音声を一定サンプル数ごとに線形予測分析し、合成フィルタ係数を求め、該フィルタの励振源としてピッチ周期の成分ベクトルをもつ適応符号帳と雑音成分ベクトルをもつ雑音符号帳等を備え、合成後の波形が入力音声の波形に対し歪みが最小となるように励振ベクトルを決定する符号化方式搭載の音声符号化装置において、前記励振ベクトルを決定する際に、入力音声信号より抽出した雑音源を離散コサイン変換係数(以下、DCT係数)列に変換し、その係数列と予め求めておいた雑音成分ベクトルのDCT係数列との距離を求め、該距離が近い雑音成分ベクトルを選択することにより予備選択を行うことを特徴としたものである。
【0010】
【発明の実施の形態】
本発明は、ピッチ周期の成分ベクトルをもつ適応符号帳と、雑音成分ベクトルをもつ雑音符号帳とがフィルタの励振源として用いられ、そのフィルタにより合成された音声の波形と入力音声の波形との歪みが最小となるように励振ベクトルを決定し、音声の信号系列を少ない情報量でディジタル符号化する高能率音声符号化法に関するものである。
【0011】
図1は、本発明のCELP符号化部に適用した例を説明するための図で、図1において、1は入力音声で、この入力音声1は複数のフレームに分割して入力される。この入力音声1は、各フレーム単位で取り込まれ線形予測分析部2、聴覚重み付きフィルタ3に与えられる。線形予測分析部2は、音声信号の現時点でのサブフレームと現時点に隣接する過去の複数のサブフレームとの間の線形予測を行うもので、この予測分析結果を合成フィルタ4、聴覚重み付きフィルタ5および聴覚重み付きフィルタ3に与えられる。そして、合成フィルタ4からの出力を聴覚重み付きフィルタ5(聴覚重み付けした予測音声)を介して減算器7に与え、この減算器7で、聴覚重み付きフィルタ3からの出力(聴覚重み付けした入力音声)との減算出力を算出する。
【0012】
一方、8は距離計算・最適音源選択部で、この距離計算・最適音源選択部8は、減算器7からの出力を取り込み、適応符号帳9および雑音符号帳10の2つのコードブックを選択する。そして、これら適応符号帳9および雑音符号帳10より最適なピッチ周期成分αA(i)と雑音成分βC(i)を検索し、これらの結果を加算器11を介して最適な音源、つまり、励振源E(i)として合成フィルタ4に与えるようにしている。
【0013】
而して、このような符号化部に対して、図2に示すフローチャートに従った制御が実行される。まず、ステップS1で入力音声1の最初のフレームを取り込む。この場合の1フレームは、複数のサブフレームからなっている。そして、ステップS2で線形予測分析部2により取り込んだ1フレームについて、隣接する過去のフレームから線形予測を行い、この分析結果を踏まえて次のステップS3の適応符号帳検索に進む。ステップS3の適応符号帳検索では、ステップS1で予測した音声との差信号の1番目のサブフレームについて、適応符号帳9を検索して距離の近い代表ベクトルをピッチ周期成分として生成する。
【0014】
ステップS4では、適応符号帳より検索したベクトルを入力した合成フィルタ4、聴覚重み付きフィルタ5の出力に、入力音声の聴覚重み付きフィルタの出力を減算した二次残差信号を抽出し、ステップS5では、二次残差信号を入力した逆聴覚重み付きフィルタ12、逆合成フィルタ13の出力をDCT変換14する。このDCT変換列の特徴と、前もって雑音符号帳のDCT変換列の特徴を抽出し特徴別に分けているDCT変換列特徴テーブル15を用いて雑音符号帳の中からいくつかの雑音成分ベクトルを選択する。たとえば、DCT変換列の結果が図3のようになった場合、DCT変換列特徴テーブルを、図4のような、4つの場合分けを行っていれば、このパターンは、グループ1に近いため雑音符号帳10の内、グループ1に属するベクトルのみをステップS7で検索して距離の近いベクトルを見つける。これにより演算量は、1/4に減少することになる。
【0015】
をとって説明すれば、DCT変換した係数列のJ番目のDCT係数の値が最大値をもつとする。この場合、雑音符号帳が図5のように並べてあるとすれば、検索は、j−m/2からj+m/2までの雑音成分ベクトルの検索をして距離の近いベクトルを見つける。この場合は、雑音符号帳の探索の演算量がm/N(雑音符号帳のベクトル数N)に減ることになり、さらに、DCT変換列特徴テーブルが必要なくなる。
【0016】
【発明の効果】
以上に説明したように、本発明によれば、2次残差信号をDCT変換し、予備選択することにより、雑音符号帳の検索の演算量を減らすことができる。
【図面の簡単な説明】
【図1】 本発明の一実施例を説明するためのブロック図である。
【図2】 本発明の処理の流れを示すフローチャートである。
【図3】 2次残差信号のDCT変換列を示す図である。
【図4】 DCT変換特徴テーブルのグループを示す図である。
【図5】 雑音符号帳のテーブルのDCT変換列を示す図である。
【符号の説明】
1…入力信号、2…線形予測分析部、3,5…聴覚重み付きフィルタ、4…合成フィルタ、7…減算器、8…距離計算・最適音源選択部、9…適応符号帳、10…雑音符号帳、11…加算器、12…逆聴覚重み付きフィルタ、13…逆合成フィルタ、14…DCT変換、15…DCT変換列特徴テーブル。

Claims (1)

  1. 音声を一定サンプル数ごとに線形予測分析し、合成フィルタ係数を求め、該フィルタの励振源としてピッチ周期の成分ベクトルをもつ適応符号帳と雑音成分ベクトルをもつ雑音符号帳等を備え、合成後の波形が入力音声の波形に対し歪みが最小となるように励振ベクトルを決定する符号化方式搭載の音声符号化装置において、前記励振ベクトルを決定する際に、入力音声信号より抽出した雑音源を離散コサイン変換係数(以下、DCT係数)列に変換し、その係数列と予め求めておいた雑音成分ベクトルのDCT係数列との距離を求め、該距離が近い雑音成分ベクトルを選択することにより予備選択を行うことを特徴とする音声符号化装置。
JP02279598A 1998-01-20 1998-01-20 音声符号化装置 Expired - Fee Related JP3714786B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02279598A JP3714786B2 (ja) 1998-01-20 1998-01-20 音声符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02279598A JP3714786B2 (ja) 1998-01-20 1998-01-20 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH11212598A JPH11212598A (ja) 1999-08-06
JP3714786B2 true JP3714786B2 (ja) 2005-11-09

Family

ID=12092624

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02279598A Expired - Fee Related JP3714786B2 (ja) 1998-01-20 1998-01-20 音声符号化装置

Country Status (1)

Country Link
JP (1) JP3714786B2 (ja)

Also Published As

Publication number Publication date
JPH11212598A (ja) 1999-08-06

Similar Documents

Publication Publication Date Title
US6721700B1 (en) Audio coding method and apparatus
KR100304682B1 (ko) 음성 코더용 고속 여기 코딩
JPH08123494A (ja) 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置
AU653969B2 (en) A method of, system for, coding analogue signals
US5926785A (en) Speech encoding method and apparatus including a codebook storing a plurality of code vectors for encoding a speech signal
JPH09152896A (ja) 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置
US6269332B1 (en) Method of encoding a speech signal
JPH0341500A (ja) 低遅延低ビツトレート音声コーダ
WO2002071394A1 (en) Sound encoding apparatus and method, and sound decoding apparatus and method
JPH10240299A (ja) 音声符号化及び復号装置
JP2891193B2 (ja) 広帯域音声スペクトル係数量子化装置
JP3714786B2 (ja) 音声符号化装置
US5943644A (en) Speech compression coding with discrete cosine transformation of stochastic elements
JP3249144B2 (ja) 音声符号化装置
JPH08129400A (ja) 音声符号化方式
JP3192051B2 (ja) 音声符号化装置
JPH0990997A (ja) 音声符号化装置、音声復号化装置、音声符号化復号化方法および複合ディジタルフィルタ
JPH1069297A (ja) 音声符号化装置
JP3010655B2 (ja) 圧縮符号化装置及び方法、並びに復号装置及び方法
JPH11305798A (ja) 音声圧縮符号化装置
JPH0786952A (ja) 音声の予測符号化方法
JP3335650B2 (ja) 音声符号化方式
JPH0844398A (ja) 音声符号化装置
JP3715417B2 (ja) 音声圧縮符号化装置,音声圧縮符号化方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH11352999A (ja) 音声圧縮符号化装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050401

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050701

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050726

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050804

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050823

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050823

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080902

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090902

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090902

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100902

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110902

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120902

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130902

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees