JP3146511B2 - 音声符号化方式 - Google Patents

音声符号化方式

Info

Publication number
JP3146511B2
JP3146511B2 JP10326191A JP10326191A JP3146511B2 JP 3146511 B2 JP3146511 B2 JP 3146511B2 JP 10326191 A JP10326191 A JP 10326191A JP 10326191 A JP10326191 A JP 10326191A JP 3146511 B2 JP3146511 B2 JP 3146511B2
Authority
JP
Japan
Prior art keywords
delay
signal
sound source
output
codebook
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP10326191A
Other languages
English (en)
Other versions
JPH04270397A (ja
Inventor
慶一 舟木
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP10326191A priority Critical patent/JP3146511B2/ja
Publication of JPH04270397A publication Critical patent/JPH04270397A/ja
Application granted granted Critical
Publication of JP3146511B2 publication Critical patent/JP3146511B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声信号を低いビット
レート、特に8〜4kb/s程度で高品質に符号化する
ための音声符号化方式に関する。
【0002】
【従来の技術】音声信号を8〜4kb/s程度の低いビ
ットレートで符号化する方式としては、例えば、M.S
chroeder and B.S.Atal氏による
“Code−excited linear pred
iction:High quality speec
h at low bit rates”と題した論文
(Proc.ICASSP,pp.937−940,1
985年)(文献1)等に記載されているCELP(C
ode Excited LPC Coding)が知
られている。この方法では、送信側ではフレーム毎(例
えば20ms)に音声信号から音声信号のスペクトル特
性を表すスペクトルパラメータを抽出し、フレームをさ
らに小区間のサブフレームに分割し、サブフレーム毎に
過去の音源信号から長区間相関(ピッチ相関)を表すピ
ッチパラメータを抽出し、ピッチパラメータによりサブ
フレームの音声信号を長期予測する。長期予測して求め
られた残差信号に対して、予め用意された種類の雑音信
号からなるコードブックから選択した信号により合成し
た信号と、残差信号と誤差電力を最小化するように一種
類の雑音信号を選択すると共に、最適なゲインを計算す
る。そして選択された雑音信号の種類を表すインデクス
とゲイン、ならびに、スペクトルパラメータとピッチパ
ラメータを伝送する。受信側の説明は省略する。
【0003】また、長期予測の方法としては、例えば、
W.Kleijn“Anefficient stoc
hastically excited linear
predictive coding algorit
hm for highquality low bi
t rate transmissionof spe
ech”と題した論文(Speech Communi
cation,7,pp.305−316,1988
年)(文献2)等に記載のように、過去の音源を1サン
プルずつずらして、重み付け2乗誤差を最小にする過去
の音源のずらし値(整数遅延)とずらした音源に対応す
る音源のゲインを求める方法が知られている。しかしな
がら、適応コードブックだけでは音声の周期性を完全に
記述できないために、CELP系の符号化方式の場合、
再生信号に雑音感が残ってしまう。この問題点を解決す
るために、合成フィルタの入力となる、適応コードブッ
クと音源コードブックの和に適応コードブックの遅延で
規定される適応コムフィルタを掛ける手法が知られてい
る。具体的な方法は例えば、S.Wang氏らによる
“Improved excitation for
phonetically−segmented VX
C speech coding below 4kb
/s”と題した論文(Proc.Globecom,p
p.946−950,1990年)(文献3)等を参照
できる。この手法により、遅延が音声信号のピッチ周期
と一致し正しくもとまったときは、雑音感が減少し、音
質が向上する。
【0004】
【発明が解決しようとする課題】しかし、適応コムフィ
ルタリングは、遅延が正しくもとまらないと、かえって
音質は劣化してしまうという問題点があった。
【0005】本発明の目的は、上述した問題点を解決
し、なめらな遅延と高調波成分が付加された適応コード
ブックの音源により、8〜4kb/sにおいて音質の良
好な音声符号化方式を提供することにある。
【0006】
【課題を解決するための手段】第1の発明における音声
符号化方式は、音声信号を蓄積する手段と、音声信号の
有声性判定を行う手段と、音声信号をサブフレームに分
割する手段と、音声信号を分析する手段と、音声信号に
対して聴覚上の重み付けを加える手段と、有声と判定さ
れたフレームのみ適応コードブックの出力にその遅延で
規定されるコムフィルタリングを行う手段と、コムフィ
ルタの出力を用いて最適な遅延を決定する手段と、重み
付け信号から最適遅延に相当する適応コードブックの出
力を減算する手段と、音源コードブックから最適な音源
を抽出する手段とを有することを特徴とする。
【0007】第2の発明における音声符号化方式は、音
声信号を蓄積する手段と、音声信号の有声性判定を行う
手段と、音声信号をサブフレームに分割する手段と、音
声信号を分析する手段と、音声信号に対して聴覚上の重
み付けを加える手段と、有声と判定されたフレームのみ
適応コードブックの出力にその遅延で規定されるコムフ
ィルタリングを行う手段と、コムフィルタの出力を用い
て最適な遅延を決定する手段と、最適な遅延に相当する
コムフィルタの出力を重み付け信号から減算する手段
と、音源コードブックから最適音源を抽出する手段とを
有することを特徴とする。
【0008】
【作用】第1の発明においては、評価尺度を従来の重み
付け2乗距離ではなく、適応コードブックの出力にその
遅延で規定されるコムフィルタをかけ、高調波成分の強
調を行い、コムフィルタの出力と重み付け信号の2乗距
離を評価尺度にし、これを最小化する遅延を最適な遅延
として決定する。コムフィルタを掛けることにより調波
成分を強調するだけでなく、雑音成分を抑圧することに
なるため、より正確な遅延を推定できる。
【0009】第2の発明においては、評価尺度にコムフ
ィルタを加えることにより、より正確な遅延を推定でき
るとともに、適応コードブックの出力として、コムフィ
ルタの出力を用いることにより、CELP系の符号化方
式の問題点であった雑音感を低減することができる。
【0010】
【実施例】図1は第1の発明の実施例であり、図2は第
2の発明の実施例である。
【0011】最初に各モジュールの動作説明をする。
【0012】バッファ装置105は、音声信号を記憶し
ておく装置である。
【0013】有声判定器110は、そのフレームの音声
が有声か否かの判定を行う装置である。
【0014】サブフレーム分割器120は、バッファに
蓄積された音声信号をいくつかのサブフレームに分割す
る装置である。
【0015】LPC分析器200は、フレーム毎に音声
のスペクトルパラメータであるLPC係数を抽出する装
置である。
【0016】以上のバッファ装置105,音声判定器1
10,サブフレーム分割器120,LPC分析器200
は既存のものを用いる。
【0017】LPC係数量子化器210は、LPC係数
を量子化する装置であり、いかなる方法を用いても構わ
ない。
【0018】重み付けフィルタ130は、サブフレーム
に分割された音声信号に対して周知の聴感重み付けを行
う。
【0019】影響信号減算器140は、重み付けされた
合成フィルタを初期状態を1サブフレーム前の重み付け
合成信号の最後の状態とし零励振することにより計算さ
れた影響信号を重み付けされた信号より減算する。
【0020】適応コードブック器150は、過去の音源
を遅延させた音源を生成する。遅延は整数でも小数でも
よいが、小数の方が音質がより良好となる。小数の場
合、過去の音源をポリフェーズフィルタリングにより小
数化する。ポリフェーズフィルタリングの詳細は、例え
ば、P.Kroon“Pitch predictor
s with high temporal reso
lution”と題した論文(Proc.ICASS
P,pp.661−664,1990年)(文献4)等
を参照できる。
【0021】コムフィルタ160は、適応コードブック
器150で生成された過去の音源の遅延音源をその遅延
に応じたコムフィルタリングを行う。コムフィルタの形
としては、IIR型,FIR型いずれでも構わない。具
体的な方法は前記文献3等を参照できる。
【0022】重み付けフィルタ170は、分析により得
られたLPC係数を周知の聴感重み付けしたフィルタ係
数による合成を行う。
【0023】遅延決定器180は、コムフィルタリング
された過去の遅延ありの音源と重み付け信号を2乗距離
が最小になる遅延を決定する回路である。
【0024】音源コードブック探索器190で音源コー
ドブックの探索を行う。この場合、音源コードブックは
雑音コードブックでもLBG法等のVQアルゴリズムに
より学習された学習コードブックでも何でも構わない。
前者は前記文献1を参照できる。また、後者は特願平2
−42955号明細書(文献5)や、特願平2−429
56号明細書(文献6)等を参照できる。220はマル
チプレクサである。
【0025】まず、図1の実施例の動作を説明する。
【0026】信号線100から音声信号を入力しバッフ
ァ105で音声信号を記憶しておき、記憶された信号を
用いて有声判定器110で母音の判別を行う。LPC分
析器200でLPC分析し、スペクトルパラメータであ
るLPC係数を算出する。算出されたLPC係数はLP
C係数量子化器210で量子化されマルチプレクサに送
られるとともに、再度LPC係数に復号化され以下の処
理に用いられる。記憶された音声信号をサブフレーム分
割器120で分割し、各サブフレーム毎の信号に対し
て、以下の処理を行う。まず、重み付けフィルタ130
で音声信号に聴感重み付けを施し、影響信号減算器14
0では影響信号を算出し、重み付け信号から差し引く。
適応コードブック器150で過去の音源を遅延させた音
源信号を生成し、有声判定器110で有声と判定された
フレームでは、コムフィルタ160でその遅延値に応じ
たコムフィルタリングを行う。有声でないと判定された
場合、コムフィルタリングは行わない。次に、コムフィ
ルタ160の出力を入力とし、重み付け合成を行う。重
み付け合成信号と重み付け信号の2乗距離が最小になる
遅延を遅延決定器180で決定する。最適な遅延が決定
された後、最適な遅延に対応する適応コードブックの出
力を入力とし、重み付け合成を行い、重み付け信号から
適応コードブックによる重み付け合成信号を減算する。
減算された信号に対して、音源コードブック探索器19
0で音源コードブックの探索を行う。マルチプレクサ2
20は、LPC係数量子化器210,適応コードブック
遅延決定器180,音源コードブック探索器190の出
力符号系列を組み合わせて出力する。これらの処理を各
サブフレーム毎に行う。
【0027】次に、図2の実施例の動作を説明する。
【0028】第1の発明では、コムフィルタ160の出
力は遅延の決定のみに用いられていたが、第2の発明で
は、コムフィルタ160の出力を適応コードブックの出
力として用いるところのみが異なっている。ここでは、
その点のみを説明する。遅延決定器180で遅延の決定
がされた後、コムフィルタ160の出力を適応コードブ
ックの出力として用い、合成フィルタ170でそれを入
力として重み付け合成を行った後、重み付け信号から減
算し、音源コードブック探索器190で音源コードブッ
クを探索する。
【0029】以上で本発明による実施例の説明を終え
る。
【0030】本実施例の構成以外にも種々の変形が可能
である。
【0031】適応コードブックの遅延の計算では、演算
量を低減するために、入力の重み付け信号等を用いて相
関演算により遅延の候補を複数種類求め、各候補に対し
て、近傍数サンプルの範囲で最適な小数遅延を決定する
構成をとることもできる。
【0032】また、適応コードブック,音源コードブッ
クをサブフレームでは一意に決定せずに、誤差電力の小
さい順に複数種類の候補を求め、これをフレーム全体で
累積し、フレーム全体での累積誤差電力を最小化する適
応コードブック,音源コードブックの組合せを選択する
ようにしてもよい。
【0033】
【発明の効果】以上述べたように、本発明によれば、音
声の有声区間で適応コードブックに適応コムフィルタを
使用することにより、スムーズな遅延を得ることができ
ると共に適応コードブックの遅延が誤ったときでも雑音
感の少ない良好な再生音声が得られるという大きな効果
がある。
【図面の簡単な説明】
【図1】第1の本発明の実施例を示す構成図である。
【図2】第2の発明の実施例を示す構成図である。
【符号の説明】
100 音声入力ポート 105 バッファ装置 110 有声判定器 120 サブフレーム分割器 130 重み付けフィルタ 140 影響信号減算器 150 適応コードブック器 160 コムフィルタ 170 重み付け合成フィルタ 180 遅延決定器 190 音源コードブック探索器 200 LPC分析器 210 LPC係数量子化器 220 マルチプレクサ
フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 19/08 G10L 19/04

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】音声信号を蓄積する手段と、音声信号の有
    声性判定を行う手段と、音声信号をサブフレームに分割
    する手段と、音声信号を分析する手段と、音声信号に対
    して聴覚上の重み付けを加える手段と、有声と判定され
    たフレームのみ適応コードブックの出力にその遅延で規
    定されるコムフィルタリングを行う手段と、コムフィル
    タの出力を用いて最適な遅延を決定する手段と、重み付
    け信号から最適遅延に相当する適応コードブックの出力
    を減算する手段と、音源コードブックから最適な音源を
    抽出する手段とを有することを特徴とする音声符号化方
    式。
  2. 【請求項2】音声信号を蓄積する手段と、音声信号の有
    声性判定を行う手段と、音声信号をサブフレームに分割
    する手段と、音声信号を分析する手段と、音声信号に対
    して聴覚上の重み付けを加える手段と、有声と判定され
    たフレームのみ適応コードブックの出力にその遅延で規
    定されるコムフィルタリングを行う手段と、コムフィル
    タの出力を用いて最適な遅延を決定する手段と、最適な
    遅延に相当するコムフィルタの出力を重み付け信号から
    減算する手段と、音源コードブックから最適音源を抽出
    する手段とを有することを特徴とする音声符号化方式。
JP10326191A 1991-02-26 1991-02-26 音声符号化方式 Expired - Fee Related JP3146511B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10326191A JP3146511B2 (ja) 1991-02-26 1991-02-26 音声符号化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10326191A JP3146511B2 (ja) 1991-02-26 1991-02-26 音声符号化方式

Publications (2)

Publication Number Publication Date
JPH04270397A JPH04270397A (ja) 1992-09-25
JP3146511B2 true JP3146511B2 (ja) 2001-03-19

Family

ID=14349497

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10326191A Expired - Fee Related JP3146511B2 (ja) 1991-02-26 1991-02-26 音声符号化方式

Country Status (1)

Country Link
JP (1) JP3146511B2 (ja)

Also Published As

Publication number Publication date
JPH04270397A (ja) 1992-09-25

Similar Documents

Publication Publication Date Title
JP3254687B2 (ja) 音声符号化方式
US4969192A (en) Vector adaptive predictive coder for speech and audio
JPH08328591A (ja) 短期知覚重み付けフィルタを使用する合成分析音声コーダに雑音マスキングレベルを適応する方法
US20060074643A1 (en) Apparatus and method of encoding/decoding voice for selecting quantization/dequantization using characteristics of synthesized voice
JPH0990995A (ja) 音声符号化装置
US5884251A (en) Voice coding and decoding method and device therefor
JP3180786B2 (ja) 音声符号化方法及び音声符号化装置
KR20010073069A (ko) 음성코딩을 위한 적응성 표준
JP3087591B2 (ja) 音声符号化装置
JP3095133B2 (ja) 音響信号符号化方法
JP3146511B2 (ja) 音声符号化方式
KR100550003B1 (ko) 상호부호화기에서 개회로 피치 추정 방법 및 그 장치
JPH0830299A (ja) 音声符号化装置
JP3153075B2 (ja) 音声符号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3024467B2 (ja) 音声符号化装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP2853170B2 (ja) 音声符号化復号化方式
JPH06130994A (ja) 音声符号化方法
JP3192051B2 (ja) 音声符号化装置
JPH09179593A (ja) 音声符号化装置
JPH0473700A (ja) 音声符号化方法
JP3332132B2 (ja) 音声符号化方法および装置
JP3265645B2 (ja) 音声符号化装置
JPH06222796A (ja) 音声符号化方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080112

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090112

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100112

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees