JPH05165498A - 音声符号化方法 - Google Patents

音声符号化方法

Info

Publication number
JPH05165498A
JPH05165498A JP3335008A JP33500891A JPH05165498A JP H05165498 A JPH05165498 A JP H05165498A JP 3335008 A JP3335008 A JP 3335008A JP 33500891 A JP33500891 A JP 33500891A JP H05165498 A JPH05165498 A JP H05165498A
Authority
JP
Japan
Prior art keywords
vocal tract
parameter
quantized
frame
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3335008A
Other languages
English (en)
Other versions
JP3107620B2 (ja
Inventor
Hiroshi Katsuragawa
浩 桂川
Kenichiro Hosoda
賢一郎 細田
Hiromi Aoyanagi
弘美 青柳
Yoshihiro Ariyama
義博 有山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP03335008A priority Critical patent/JP3107620B2/ja
Publication of JPH05165498A publication Critical patent/JPH05165498A/ja
Application granted granted Critical
Publication of JP3107620B2 publication Critical patent/JP3107620B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 低ビットレートでの符号化品質を向上させ
る。 【構成】 フレーム単位での分析(101)して得た声
道パラメータを前段の量子化器102でベクトル量子化
する。それをサブフレーム単位で補間(103)し、分
析して得た声道パラメータと補間パラメータとの誤差
を、後段の量子化器104で量子化する。フレーム単位
で更新する声道パラメータの主コードと、サブフレーム
単位で更新する声道パラメータ誤差の補正コードとを、
声道パラメータコードとして出力する。後段の量子化に
おけるダイナミックレンジが小さくなり、ビットレート
を圧縮することができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、音声信号の圧縮符号
化方法に関するものである。
【0002】
【従来の技術】8kビット/秒以下の圧縮率での、音声
信号の高能率符号化方法は、Atal等による或いは次
の文献1で開示されている、コード励振線形予測符号化
方式が有効な手法である。これは音声信号を声道のパラ
メータと、励振源のパラメータによって表現するもので
ある。なお、文献1では、励振源のパラメータが統計コ
ードブックと適応コードブックの2つによってベクトル
量子化される点が特徴となっている。
【0003】文献1:N.S.Jayant & J.H.Chen,“Speech
Coding with Time-Varying Bit Allocations to Excit
ation and LPC parameters",Proc,ICASSP-89,(1989) 声道パラメータは、通常、多段ベクトル量子化され、或
いはベクトル・スカラ併用で多段量子化され、次の文献
2には、2段ベクトル量子化による、量子化計算量の削
減について開示されている。
【0004】文献2:「2段ベクトル量子化による破裂
音の認識」電子通信情報学会技術研究報告、SP90−
6(1990年5月25日)。
【0005】
【発明が解決しようとする課題】他方、コード励振線形
予測符号化方式では、ビットレート圧縮のために、声道
パラメータは特定の時間長さのフレームに対して1回し
か送らず、声道のパラメータを、フレームをさらに分割
したサブフレームに対して用いるときは、補間して用い
ている。
【0006】ビットレートが8kビット/秒程度のとき
には、フレーム長は20m秒程度の長さのものを用いる
ことができた。ここで音声信号は、その声道の状態につ
いて考えると、およそ20m秒程度は同じ統計的性質を
保ち続けると考えられるので、8kビット/秒程度の圧
縮符号化については、単に補間するだけでも特に品質劣
化は生じない。
【0007】しかし、ビットレートを4kビット/秒程
度にまでさらに圧縮するときには、フレーム長を30m
秒から40m秒程度に、すなわち、音声の定常な区間の
長さよりも長く設定せざるを得ない。
【0008】そのため、声道パラメータの時間分解能が
不十分となり、この声道パラメータを単に補間するだけ
では、声道の情報の正確な表現が不可能になってしまっ
て、例えば、子音が欠落してしまうなど、合成音声の品
質が劣化してしまうという問題が生じていた。
【0009】従って、本発明は、ビットレートの更なる
圧縮のために、フレーム長は長いままであって、しか
も、声道の状態の変化を十分正確に表現することができ
るような、音声の符号化方法を提供することを目的とし
ている。
【0010】
【課題を解決するための手段】本発明はコード励振線形
予測符号化方法に関する。この方法では、声道パラメー
タ及び励振源パラメータを指定するコードが符号出力と
なる。
【0011】本発明では、フレーム単位で、声道パラメ
ータを1段ベクトル量子化もしくは複数段ベクトル量子
化して、フレーム単位での声道パラメータである量子化
声道主パラメータを決定する。
【0012】また、前フレームと現フレームとの量子化
声道主パラメータによるサブフレーム単位での補間によ
って、サブフレーム単位で量子化声道補間パラメータを
作成し、入力音声信号の声道パラメータとの差を計算し
てサブフレーム単位で声道パラメータ誤差を求める。
【0013】そして、サブフレーム単位で、声道パラメ
ータ誤差をベクトル量子化もしくはスカラ量子化して、
量子化声道補正パラメータを決定する。
【0014】フレーム単位での量子化声道主パラメータ
を指定するコードとサブフレーム単位での量子化声道補
正パラメータを指定するコードとを声道パラメータの出
力コードとする。
【0015】
【作用】全体としては、声道パラメータを複数段量子化
して声道パラメータコードを決定する。この明細書で
は、前段の量子化(ベクトル量子化)に関するものを量
子化声道主パラメータとし、後段の量子化(ベクトル又
はスカラ量子化)のものを量子化声道補正パラメータと
して区別しているけれども、ベクトルの計算量が削減で
きるなどの複数段量子化の利点は維持される。
【0016】本発明においては、前段と後段の間におい
て、サブフレーム単位での補間処理を行う。すなわち、
現フレームの声道パラメータ(量子化声道主パラメー
タ)と、サブフレーム単位での補間処理した声道パラメ
ータ(量子化声道補間パラメータ)との、声道パラメー
タ誤差を求め、その誤差を量子化して、サブフレーム単
位での声道パラメータ(量子化声道補正パラメータ)と
そのコードとを決定する。
【0017】このように、補間処理を中間に持ってきた
ため、後段の量子化におけるダイナミックレンジ(声道
パラメータのベクトル空間)が小さくなり、サブフレー
ム単位の情報を付加しても、ビットレートの圧縮とな
る。
【0018】フレームに対応した情報である量子化声道
主パラメータのコードと、サブフレームに対応した情報
である量子化声道補正パラメータのコードとを、フレー
ム毎の声道パラメータのコードとして出力する。
【0019】
【実施例】図1は、本発明を適用した符号化器を示すブ
ロック図であり、101は声道分析器、102は声道パ
ラメータ量子化器、103は補間器、104はパラメー
タ誤差量子化器、105は適応コードブック、106は
統計コードブック、107は合成フィルタ、108は誤
差計算器、109は最小誤差選択器、110は多重化
器、111は減算器、112は加算器、113は加算
器、114は減算器である。次に、図1に沿って、動作
を説明する。
【0020】A/D変換された入力音声信号系列は、特
定のフレーム長単位で入力され、声道分析器101で声
道分析され、声道パラメータが求められる。
【0021】入力音声信号の声道パラメータは声道パラ
メータ量子化器102で量子化され、その量子化声道主
パラメータのコード(声道パラメータ主コード)は、各
フレームで1回、多重化器110に送られる。
【0022】また、量子化声道主パラメータは補間器1
03で、フレームをさらに分割したサブフレーム単位に
補間されて声道補間パラメータにして、用いられる。
【0023】現サブフレームで用いられる声道パラメー
タは量子化、および補間による誤差を含んでいる。
【0024】そこで、現サブフレームにおける声道分析
の結果得られた、誤差を含まない声道パラメータとの差
から、その誤差を求め、それを声道補正パラメータ量子
化器104で量子化し、声道補正パラメータを求め、そ
のコード(声道パラメータ補正コード)は、各サブフレ
ームで1回、多重化器110に送られる。
【0025】図2は、量子化器102、104、及び補
間器103の動作説明図であり、1フレームを4サブフ
レームで構成した例で示している。
【0026】図2において、両端の○印はフレーム単位
の量子化声道主パラメータを示し、X印はサブフレーム
単位の量子化声道補間パラメータを示し、△印は加算器
112の出力に対応するものである。
【0027】X印と△印との差が、減算器111とパラ
メータ誤差量子化104とによって作成した声道補正パ
ラメータを示している。
【0028】図1において、適応コードブック105か
らの適応励振ベクトルと、統計コードブック106から
の統計励振ベクトルを加算器113で加算して励振信号
ベクトルを構成し、その励振信号ベクトルから、加算器
112の出力の声道パラメータ(補正された声道パラメ
ータ)を用いた合成フィルタ117で合成音声信号を合
成し、誤差計算器108で入力音声信号との誤差を求め
る。
【0029】多重化器110は以上の装置で得られた、
声道パラメータコード、声道補正パラメータコード、適
応励振コード、および統計励振コードを多重化し、トー
タルコードとして通信回線に送信する。
【0030】図3に、図1の符号化に対応した復号器の
ブロック図を示す。
【0031】図3において、多重分離器201は通信回
線から受け取ったトータルコードを、声道パラメータ主
コード、声道パラメータ補正コード、適応励振コード、
および統計励振コードに分離し、復号器の各装置に送
る。
【0032】声道パラメータ主コードは声道パラメータ
逆量子化器202で逆量子化され、声道主パラメータと
なる。さらに、声道主パラメータは補間器203で各サ
ブフレーム単位に補間される。
【0033】次に、声道補正パラメータ逆量子化器20
4で、声道パラメータ補正コードを逆量子化して声道補
正パラメータを求め、加算器208で声道主パラメータ
を補正する。
【0034】また、適応コードブック205からの、適
応励振コードに対応する最適な適応励振ベクトルと、統
計コードブック206からの、統計励振コードに対応す
る最適な統計励振ベクトルとから、励振信号ベクトルを
構成し、補正された声道パラメータを用いた合成フィル
タ207で再生音声出力を合成する。
【0035】
【発明の効果】本発明によって、声道のパラメータをフ
レーム単位ではなく、サブフレームの単位で更新するこ
とが可能となり、その結果、低ビットで、音声信号の声
道の性質の時間的な変化に十分追随できるようなコード
化方法が構成できる。
【図面の簡単な説明】
【図1】本発明を適用した音声符号化器を示すブロック
図、
【図2】図1における補間および補正動作の説明図、
【図3】図1に対応した復号化器のブロック図、
【符号の説明】
101 声道分析器 102 声道パラメータ量子化器 103 補間器 104 パラメータ誤差量子化器 105 適応コードブック 106 統計コードブック 107 合成フィルタ 108 誤差計算器 109 最小誤差選択器 110 多重化器 111 減算器 112 加算器 113 加算器 114 減算器
フロントページの続き (72)発明者 有山 義博 東京都港区虎ノ門1丁目7番12号 沖電気 工業株式会社内

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 入力音声信号をフレーム単位で線形予測
    分析して声道パラメータを得、前記入力音声信号と合成
    音声信号との誤差を評価することによって励振源パラメ
    ータを得、前記声道パラメータ及び前記励振源パラメー
    タをそれぞれ量子化し且つそれらパラメータを指定する
    コードを決定し、それらのコードによって音声信号を表
    現する音声符号化方法において、 フレーム単位で、前記声道パラメータをベクトル量子化
    して、量子化声道主パラメータを決定し、 前フレームと現フレームとの前記量子化声道主パラメー
    タによるサブフレーム単位での補間によって、サブフレ
    ーム単位で量子化声道補間パラメータを作成し、 前記入力音声の前記声道パラメータとサブフレーム単位
    での前記量子化声道補間パラメータとの差を計算して、
    サブフレーム単位で声道パラメータ誤差を求め、 サブフレーム単位で、前記声道パラメータ誤差を量子化
    して、量子化声道補正パラメータを決定し、 フレーム単位での前記量子化声道主パラメータを指定す
    る声道パラメータ主コードとサブフレーム単位での前記
    量子化声道補正パラメータを指定する声道パラメータ補
    正コードとを声道パラメータの前記コードとすることを
    特徴とした音声符号化方法。
JP03335008A 1991-12-18 1991-12-18 音声符号化方法 Expired - Lifetime JP3107620B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03335008A JP3107620B2 (ja) 1991-12-18 1991-12-18 音声符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03335008A JP3107620B2 (ja) 1991-12-18 1991-12-18 音声符号化方法

Publications (2)

Publication Number Publication Date
JPH05165498A true JPH05165498A (ja) 1993-07-02
JP3107620B2 JP3107620B2 (ja) 2000-11-13

Family

ID=18283708

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03335008A Expired - Lifetime JP3107620B2 (ja) 1991-12-18 1991-12-18 音声符号化方法

Country Status (1)

Country Link
JP (1) JP3107620B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0786954A (ja) * 1993-09-13 1995-03-31 Nec Corp ベクトル量子化装置
KR20130135268A (ko) * 2010-12-29 2013-12-10 브리티쉬 텔리커뮤니케이션즈 파블릭 리미티드 캄퍼니 비디오 부호화 방법 및 장치

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0786954A (ja) * 1993-09-13 1995-03-31 Nec Corp ベクトル量子化装置
KR20130135268A (ko) * 2010-12-29 2013-12-10 브리티쉬 텔리커뮤니케이션즈 파블릭 리미티드 캄퍼니 비디오 부호화 방법 및 장치

Also Published As

Publication number Publication date
JP3107620B2 (ja) 2000-11-13

Similar Documents

Publication Publication Date Title
US7184953B2 (en) Transcoding method and system between CELP-based speech codes with externally provided status
EP0409239B1 (en) Speech coding/decoding method
FI113571B (fi) Puheenkoodaus
US20090248404A1 (en) Lost frame compensating method, audio encoding apparatus and audio decoding apparatus
JPH10187196A (ja) 低ビットレートピッチ遅れコーダ
KR102171293B1 (ko) 음성 부호화 장치, 음성 부호화 방법, 음성 부호화 프로그램, 음성 복호 장치, 음성 복호 방법 및 음성 복호 프로그램
JP2007537494A (ja) 遠隔通信のためのマルチレート音声コーダにおける音声レート変換の方法及び装置
JPH02155313A (ja) 符号化方法
EP1096476B1 (en) Speech signal decoding
US8055499B2 (en) Transmitter and receiver for speech coding and decoding by using additional bit allocation method
JP3628268B2 (ja) 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
JP2005515486A (ja) Celpによる音声符号間のトランスコーディング・スキーム
EP1020848A2 (en) Method for transmitting auxiliary information in a vocoder stream
KR100416363B1 (ko) 선형 예측 분석 대 합성 엔코딩 방법 및 엔코더
JP3050978B2 (ja) 音声符号化方法
JP3107620B2 (ja) 音声符号化方法
JP3283152B2 (ja) 音声パラメータ量子化装置およびベクトル量子化装置
JP2968109B2 (ja) コード励振線形予測符号化器及び復号化器
KR20120032444A (ko) 적응 코드북 업데이트를 이용한 오디오 신호 디코딩 방법 및 장치
JP3047761B2 (ja) 音声符号化装置
JP2700974B2 (ja) 音声符号化法
JP3700310B2 (ja) ベクトル量子化装置及びベクトル量子化方法
KR100389898B1 (ko) 음성부호화에 있어서 선스펙트럼쌍 계수의 양자화 방법
JP2775533B2 (ja) 音声の長期予測装置
JPH05173595A (ja) コード励振線形予測符号化方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000822

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070908

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080908

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080908

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090908

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090908

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100908

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110908

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110908

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120908

Year of fee payment: 12

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120908

Year of fee payment: 12