JPH11212598A - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JPH11212598A
JPH11212598A JP10022795A JP2279598A JPH11212598A JP H11212598 A JPH11212598 A JP H11212598A JP 10022795 A JP10022795 A JP 10022795A JP 2279598 A JP2279598 A JP 2279598A JP H11212598 A JPH11212598 A JP H11212598A
Authority
JP
Japan
Prior art keywords
noise
speech
vector
coefficient
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10022795A
Other languages
English (en)
Other versions
JP3714786B2 (ja
Inventor
Masanaka Sagara
政仲 相良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP02279598A priority Critical patent/JP3714786B2/ja
Publication of JPH11212598A publication Critical patent/JPH11212598A/ja
Application granted granted Critical
Publication of JP3714786B2 publication Critical patent/JP3714786B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 2つのコードブックのうちの雑音符号帳の予
備選択を行うことにより、演算量を削減した音声符号化
方式を実現する。 【解決手段】 入力音声1を一定サンプル数ごとに線形
予測分析2し、合成フィルタ係数4を求め、そのフィル
タ4の励振源としてピッチ周期の成分ベクトルをもつ適
応符号帳9と雑音成分ベクトルをもつ雑音符号帳10等
を備え、合成後の波形が入力音声の波形に対し歪みが最
小となるように励振ベクトルを決定する。この励振ベク
トルを決定する際に、入力音声信号より抽出した雑音源
を離散コサイン変換係数(DCT係数)に変換14し、
その係数列と予め求めておいた雑音成分ベクトルのDC
T係数列15を比較して予備選択を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声符号化装置、
より詳細には、2次残差信号をDCT変換して予備選択
することにより雑音符号帳の検索の演算量を減らすよう
にしたものである。
【0002】
【従来の技術】最近、通信回線を介して音声信号を送る
音声通信システムが実用に向け開発されているが、この
ような音声通信システムでは、通信回線を介して送受信
される信号量を最小限にするため音声信号を圧縮、伸張
して情報量を少なくしている。つまり、一方の端末より
入力される音声入力を圧縮し、この圧縮された信号を通
信回線を介して相手側に送信し、一方、相手側より通信
回線を介して受信した信号を伸張し、この伸張した音声
信号を出力するようにしたものがある。
【0003】このような圧縮、伸張方式の1つとしてC
ELP方式がある。このCELP方式を採用した音声処
理装置では、送信側の音声信号圧縮手段として、音声信
号を1フレーム毎に短期線形予測して、この短期線形予
測により予測された信号と入力音声信号との差を複数の
サブフレームに分割し、これらサブフレームに対し、コ
ードブックを用意しておき、入力される音声信号の各サ
ブフレームに対し最も類似する代表ベクトルをコードブ
ックから検索し、この検索された代表ベクトルの符号コ
ードを圧縮信号として出力し、一方、受信側の音声信号
伸張手段として、上述したと同様なコードブックを用意
しておき、通信回線を介して受けとった符号コードから
該当する代表ベクトルを伸張信号として選択し、音声信
号の各サブフレームを再現するようになっている。
【0004】ところで、このようなCELP方式による
コードブック検索は、音声信号のフレーム全長に亘って
歪みが最小になるように、各サブフレームを2つのコー
ドブックに対して行うようにしている。つまり、音声を
合成する励振源は、ピット周期成分と雑音成分からなっ
ているが、これらピッチ周期成分と雑音成分に対応する
適応符号帳と雑音符号帳という2つのコードブックを用
い、これら2つのコードブックに対して各サブフレーム
単位で最小誤差評価により検索を行うようにしている。
【0005】
【発明が解決しようとする課題】最小誤差評価は、コー
ドブックに貯えられた各励振源符号ベクトルを線形予測
合成フィルタに通すことにより合成音声を生成し、原音
声と比較し、最も原音声に近いものを選択することによ
って行われる。しかし、このフイルタ演算には、多くの
演算を必要とするため、前記コードブックに貯えられた
すべての励振源符号ベクトルをフィルタを通して比較を
行うことは多大な計算を必要とし、汎用のプロセッサで
リアルタイムの処理を実現することは大変困難である。
【0006】本発明は、上述のごとき実情に鑑みなされ
たもので、特に、上述のごとき2つのコードブックのう
ちの雑音符号帳の予備選択を行うことにより、演算量を
削減する音声符号化方式を実現するものである。
【0007】
【課題を解決するための手段】請求項1の発明は、音声
を一定サンプル数ごとに線形予測分析し、合成フィルタ
係数を求め、そのフィルタの励振源としてピッチ周期の
成分ベクトルをもつ適応符号帳と雑音成分ベクトルをも
つ雑音符号帳等を備え、合成後の波形が入力音声の波形
に対し歪みが最小となるように励振ベクトルを決定する
符号化方式搭載の音声符号化装置において、励振ベクト
ルを決定する際に、入力音声信号より抽出した雑音源を
離散コサイン変換係数(以下、DCT係数)列に変換
し、その係数列と予め求めておいた雑音成分ベクトルの
DCT係数列を比較することにより予備選択を行うこと
を特徴としたものである。
【0008】請求項2の発明は、請求項1の発明におい
て、雑音成分ベクトルをDCT係数の強度最大の位置を
利用することを特徴としたものである。
【0009】請求項3の発明は、請求項1の発明におい
て、雑音符号帳の雑音符号ベクトルの並びをDCT係数
の強度最大の位置の順番にならべたことを特徴としたも
のである。
【0010】
【発明の実施の形態】本発明は、ピッチ周期の成分ベク
トルをもつ適応符号帳と、雑音成分ベクトルをもつ雑音
符号帳とがフィルタの励振源として用いられ、そのフィ
ルタにより合成された音声の波形と入力音声の波形との
歪みが最小となるように励振ベクトルを決定し、音声の
信号系列を少ない情報量でディジタル符号化する高能率
音声符号化法に関するものである。
【0011】図1は、本発明のCELP符号化部に適用
した例を説明するための図で、図1において、1は入力
音声で、この入力音声1は複数のフレームに分割して入
力される。この入力音声1は、各フレーム単位で取り込
まれ線形予測分析部2、聴覚重み付きフィルタ3に与え
られる。線形予測分析部2は、音声信号の現時点でのサ
ブフレームと現時点に隣接する過去の複数のサブフレー
ムとの間の線形予測を行うもので、この予測分析結果を
合成フィルタ4、聴覚重み付きフィルタ5および聴覚重
み付きフィルタ3に与えられる。そして、合成フィルタ
4からの出力を聴覚重み付きフィルタ5(聴覚重み付け
した予測音声)を介して減算器7に与え、この減算器7
で、聴覚重み付きフィルタ3からの出力(聴覚重み付け
した入力音声)との減算出力を算出する。
【0012】一方、8は距離計算・最適音源選択部で、
この距離計算・最適音源選択部8は、減算器7からの出
力を取り込み、適応符号帳9および雑音符号帳10の2
つのコードブックを選択する。そして、これら適応符号
帳9および雑音符号帳10より最適なピッチ周期成分α
A(i)と雑音成分βC(i)を検索し、これらの結果
を加算器11を介して最適な音源、つまり、励振源E
(i)として合成フィルタ4に与えるようにしている。
【0013】而して、このような符号化部に対して、図
2に示すフローチャートに従った制御が実行される。ま
ず、ステップS1で入力音声1の最初のフレームを取り
込む。この場合の1フレームは、複数のサブフレームか
らなっている。そして、ステップS2で線形予測分析部
2により取り込んだ1フレームについて、隣接する過去
のフレームから線形予測を行い、この分析結果を踏まえ
て次のステップS3の適応符号帳検索に進む。ステップ
S3の適応符号帳検索では、ステップS1で予測した音
声との差信号の1番目のサブフレームについて、適応符
号帳9を検索して距離の近い代表ベクトルをピッチ周期
成分として生成する。
【0014】ステップS4では、適応符号帳より検索し
たベクトルを入力した合成フィルタ4、聴覚重み付きフ
ィルタ5の出力に、入力音声の聴覚重み付きフィルタの
出力を減算した二次残差信号を抽出し、ステップS5で
は、二次残差信号を入力した逆聴覚重み付きフィルタ1
2、逆合成フィルタ13の出力をDCT変換14する。
このDCT変換列の特徴と、前もって雑音符号帳のDC
T変換列の特徴を抽出し特徴別に分けているDCT変換
列特徴テーブル15を用いて雑音符号帳の中からいくつ
かの雑音成分ベクトルを選択する。たとえば、DCT変
換列の結果が図3のようになった場合、DCT変換列特
徴テーブルを、図4のような、4つの場合分けを行って
いれば、このパターンは、グループ1に近いため雑音符
号帳10の内、グループ1に属するベクトルのみをステ
ップS7で検索して距離の近いベクトルを見つける。こ
れにより演算量は、1/4に減少することになる。
【0015】請求項2と請求項3の場合の例をとって説
明すれば、DCT変換した係数列のJ番目の値が最大値
をもつとする。この場合、雑音符号帳が図5のように並
べてあるとすれば、検索は、j−m/2からj+m/2
までの雑音成分ベクトルの検索をして距離の近いベクト
ルを見つける。この場合は、雑音符号帳の探索の演算量
がm/N(雑音符号帳のベクトル数N)に減ることにな
り、さらに、DCT変換列特徴テーブルが必要なくな
る。
【0016】
【発明の効果】以上に説明したように、本発明によれ
ば、2次残差信号をDCT変換し、予備選択することに
より、雑音符号帳の検索の演算量を減らすことができ
る。
【図面の簡単な説明】
【図1】 本発明の一実施例を説明するためのブロック
図である。
【図2】 本発明の処理の流れを示すフローチャートで
ある。
【図3】 2次残差信号のDCT変換列を示す図であ
る。
【図4】 DCT変換特徴テーブルのグループを示す図
である。
【図5】 雑音符号帳のテーブルのDCT変換列を示す
図である。
【符号の説明】
1…入力信号、2…線形予測分析部、3,5…聴覚重み
付きフィルタ、4…合成フィルタ、7…減算器、8…距
離計算・最適音源選択部、9…適応符号帳、10…雑音
符号帳、11…加算器、12…逆聴覚重み付きフィル
タ、13…逆合成フィルタ、14…DCT変換、15…
DCT変換列特徴テーブル。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 音声を一定サンプル数ごとに線形予測分
    析し、合成フィルタ係数を求め、該フィルタの励振源と
    してピッチ周期の成分ベクトルをもつ適応符号帳と雑音
    成分ベクトルをもつ雑音符号帳等を備え、合成後の波形
    が入力音声の波形に対し歪みが最小となるように励振ベ
    クトルを決定する符号化方式搭載の音声符号化装置にお
    いて、前記励振ベクトルを決定する際に、入力音声信号
    より抽出した雑音源を離散コサイン変換係数(以下、D
    CT係数)列に変換し、その係数列と予め求めておいた
    雑音成分ベクトルのDCT係数列を比較することにより
    予備選択を行うことを特徴とする音声符号化装置。
  2. 【請求項2】 請求項1記載の音声符号化装置におい
    て、雑音成分ベクトルをDCT係数の強度最大の位置を
    利用することを特徴とする音声符号化装置。
  3. 【請求項3】 請求項1記載の音声符号化装置におい
    て、雑音符号帳の雑音符号ベクトルの並びをDCT係数
    の強度最大の位置の順番にならべたことを特徴とする音
    声符号化装置。
JP02279598A 1998-01-20 1998-01-20 音声符号化装置 Expired - Fee Related JP3714786B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02279598A JP3714786B2 (ja) 1998-01-20 1998-01-20 音声符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02279598A JP3714786B2 (ja) 1998-01-20 1998-01-20 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH11212598A true JPH11212598A (ja) 1999-08-06
JP3714786B2 JP3714786B2 (ja) 2005-11-09

Family

ID=12092624

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02279598A Expired - Fee Related JP3714786B2 (ja) 1998-01-20 1998-01-20 音声符号化装置

Country Status (1)

Country Link
JP (1) JP3714786B2 (ja)

Also Published As

Publication number Publication date
JP3714786B2 (ja) 2005-11-09

Similar Documents

Publication Publication Date Title
CA2160749C (en) Speech coding apparatus, speech decoding apparatus, speech coding and decoding method and a phase amplitude characteristic extracting apparatus for carrying out the method
KR100304682B1 (ko) 음성 코더용 고속 여기 코딩
JP3094908B2 (ja) 音声符号化装置
AU653969B2 (en) A method of, system for, coding analogue signals
JPH0990995A (ja) 音声符号化装置
WO2002071394A1 (en) Sound encoding apparatus and method, and sound decoding apparatus and method
JPH0341500A (ja) 低遅延低ビツトレート音声コーダ
JPH09319398A (ja) 信号符号化装置
JPH10240299A (ja) 音声符号化及び復号装置
JP3531780B2 (ja) 音声符号化方法および復号化方法
US5943644A (en) Speech compression coding with discrete cosine transformation of stochastic elements
JP3714786B2 (ja) 音声符号化装置
JPH06282298A (ja) 音声の符号化方法
JPH0830299A (ja) 音声符号化装置
JP3249144B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP3194930B2 (ja) 音声符号化装置
JP3252285B2 (ja) 音声帯域信号符号化方法
JP3256215B2 (ja) 音声符号化装置
JPH0990997A (ja) 音声符号化装置、音声復号化装置、音声符号化復号化方法および複合ディジタルフィルタ
JP3335650B2 (ja) 音声符号化方式
JP2808841B2 (ja) 音声符号化方式
JPH07134600A (ja) 音声符号化装置及び音声復号化装置
JP3715417B2 (ja) 音声圧縮符号化装置,音声圧縮符号化方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050401

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050701

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050726

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050804

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050823

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050823

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080902

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090902

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090902

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100902

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110902

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120902

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130902

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees