JPH05165498A - 音声符号化方法 - Google Patents
音声符号化方法Info
- Publication number
- JPH05165498A JPH05165498A JP3335008A JP33500891A JPH05165498A JP H05165498 A JPH05165498 A JP H05165498A JP 3335008 A JP3335008 A JP 3335008A JP 33500891 A JP33500891 A JP 33500891A JP H05165498 A JPH05165498 A JP H05165498A
- Authority
- JP
- Japan
- Prior art keywords
- vocal tract
- parameter
- quantized
- frame
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
る。 【構成】 フレーム単位での分析(101)して得た声
道パラメータを前段の量子化器102でベクトル量子化
する。それをサブフレーム単位で補間(103)し、分
析して得た声道パラメータと補間パラメータとの誤差
を、後段の量子化器104で量子化する。フレーム単位
で更新する声道パラメータの主コードと、サブフレーム
単位で更新する声道パラメータ誤差の補正コードとを、
声道パラメータコードとして出力する。後段の量子化に
おけるダイナミックレンジが小さくなり、ビットレート
を圧縮することができる。
Description
化方法に関するものである。
信号の高能率符号化方法は、Atal等による或いは次
の文献1で開示されている、コード励振線形予測符号化
方式が有効な手法である。これは音声信号を声道のパラ
メータと、励振源のパラメータによって表現するもので
ある。なお、文献1では、励振源のパラメータが統計コ
ードブックと適応コードブックの2つによってベクトル
量子化される点が特徴となっている。
Coding with Time-Varying Bit Allocations to Excit
ation and LPC parameters",Proc,ICASSP-89,(1989) 声道パラメータは、通常、多段ベクトル量子化され、或
いはベクトル・スカラ併用で多段量子化され、次の文献
2には、2段ベクトル量子化による、量子化計算量の削
減について開示されている。
音の認識」電子通信情報学会技術研究報告、SP90−
6(1990年5月25日)。
予測符号化方式では、ビットレート圧縮のために、声道
パラメータは特定の時間長さのフレームに対して1回し
か送らず、声道のパラメータを、フレームをさらに分割
したサブフレームに対して用いるときは、補間して用い
ている。
には、フレーム長は20m秒程度の長さのものを用いる
ことができた。ここで音声信号は、その声道の状態につ
いて考えると、およそ20m秒程度は同じ統計的性質を
保ち続けると考えられるので、8kビット/秒程度の圧
縮符号化については、単に補間するだけでも特に品質劣
化は生じない。
度にまでさらに圧縮するときには、フレーム長を30m
秒から40m秒程度に、すなわち、音声の定常な区間の
長さよりも長く設定せざるを得ない。
不十分となり、この声道パラメータを単に補間するだけ
では、声道の情報の正確な表現が不可能になってしまっ
て、例えば、子音が欠落してしまうなど、合成音声の品
質が劣化してしまうという問題が生じていた。
圧縮のために、フレーム長は長いままであって、しか
も、声道の状態の変化を十分正確に表現することができ
るような、音声の符号化方法を提供することを目的とし
ている。
予測符号化方法に関する。この方法では、声道パラメー
タ及び励振源パラメータを指定するコードが符号出力と
なる。
ータを1段ベクトル量子化もしくは複数段ベクトル量子
化して、フレーム単位での声道パラメータである量子化
声道主パラメータを決定する。
声道主パラメータによるサブフレーム単位での補間によ
って、サブフレーム単位で量子化声道補間パラメータを
作成し、入力音声信号の声道パラメータとの差を計算し
てサブフレーム単位で声道パラメータ誤差を求める。
ータ誤差をベクトル量子化もしくはスカラ量子化して、
量子化声道補正パラメータを決定する。
を指定するコードとサブフレーム単位での量子化声道補
正パラメータを指定するコードとを声道パラメータの出
力コードとする。
して声道パラメータコードを決定する。この明細書で
は、前段の量子化(ベクトル量子化)に関するものを量
子化声道主パラメータとし、後段の量子化(ベクトル又
はスカラ量子化)のものを量子化声道補正パラメータと
して区別しているけれども、ベクトルの計算量が削減で
きるなどの複数段量子化の利点は維持される。
て、サブフレーム単位での補間処理を行う。すなわち、
現フレームの声道パラメータ(量子化声道主パラメー
タ)と、サブフレーム単位での補間処理した声道パラメ
ータ(量子化声道補間パラメータ)との、声道パラメー
タ誤差を求め、その誤差を量子化して、サブフレーム単
位での声道パラメータ(量子化声道補正パラメータ)と
そのコードとを決定する。
ため、後段の量子化におけるダイナミックレンジ(声道
パラメータのベクトル空間)が小さくなり、サブフレー
ム単位の情報を付加しても、ビットレートの圧縮とな
る。
主パラメータのコードと、サブフレームに対応した情報
である量子化声道補正パラメータのコードとを、フレー
ム毎の声道パラメータのコードとして出力する。
ロック図であり、101は声道分析器、102は声道パ
ラメータ量子化器、103は補間器、104はパラメー
タ誤差量子化器、105は適応コードブック、106は
統計コードブック、107は合成フィルタ、108は誤
差計算器、109は最小誤差選択器、110は多重化
器、111は減算器、112は加算器、113は加算
器、114は減算器である。次に、図1に沿って、動作
を説明する。
定のフレーム長単位で入力され、声道分析器101で声
道分析され、声道パラメータが求められる。
メータ量子化器102で量子化され、その量子化声道主
パラメータのコード(声道パラメータ主コード)は、各
フレームで1回、多重化器110に送られる。
03で、フレームをさらに分割したサブフレーム単位に
補間されて声道補間パラメータにして、用いられる。
タは量子化、および補間による誤差を含んでいる。
の結果得られた、誤差を含まない声道パラメータとの差
から、その誤差を求め、それを声道補正パラメータ量子
化器104で量子化し、声道補正パラメータを求め、そ
のコード(声道パラメータ補正コード)は、各サブフレ
ームで1回、多重化器110に送られる。
間器103の動作説明図であり、1フレームを4サブフ
レームで構成した例で示している。
の量子化声道主パラメータを示し、X印はサブフレーム
単位の量子化声道補間パラメータを示し、△印は加算器
112の出力に対応するものである。
メータ誤差量子化104とによって作成した声道補正パ
ラメータを示している。
らの適応励振ベクトルと、統計コードブック106から
の統計励振ベクトルを加算器113で加算して励振信号
ベクトルを構成し、その励振信号ベクトルから、加算器
112の出力の声道パラメータ(補正された声道パラメ
ータ)を用いた合成フィルタ117で合成音声信号を合
成し、誤差計算器108で入力音声信号との誤差を求め
る。
声道パラメータコード、声道補正パラメータコード、適
応励振コード、および統計励振コードを多重化し、トー
タルコードとして通信回線に送信する。
ブロック図を示す。
線から受け取ったトータルコードを、声道パラメータ主
コード、声道パラメータ補正コード、適応励振コード、
および統計励振コードに分離し、復号器の各装置に送
る。
逆量子化器202で逆量子化され、声道主パラメータと
なる。さらに、声道主パラメータは補間器203で各サ
ブフレーム単位に補間される。
4で、声道パラメータ補正コードを逆量子化して声道補
正パラメータを求め、加算器208で声道主パラメータ
を補正する。
応励振コードに対応する最適な適応励振ベクトルと、統
計コードブック206からの、統計励振コードに対応す
る最適な統計励振ベクトルとから、励振信号ベクトルを
構成し、補正された声道パラメータを用いた合成フィル
タ207で再生音声出力を合成する。
レーム単位ではなく、サブフレームの単位で更新するこ
とが可能となり、その結果、低ビットで、音声信号の声
道の性質の時間的な変化に十分追随できるようなコード
化方法が構成できる。
図、
Claims (1)
- 【請求項1】 入力音声信号をフレーム単位で線形予測
分析して声道パラメータを得、前記入力音声信号と合成
音声信号との誤差を評価することによって励振源パラメ
ータを得、前記声道パラメータ及び前記励振源パラメー
タをそれぞれ量子化し且つそれらパラメータを指定する
コードを決定し、それらのコードによって音声信号を表
現する音声符号化方法において、 フレーム単位で、前記声道パラメータをベクトル量子化
して、量子化声道主パラメータを決定し、 前フレームと現フレームとの前記量子化声道主パラメー
タによるサブフレーム単位での補間によって、サブフレ
ーム単位で量子化声道補間パラメータを作成し、 前記入力音声の前記声道パラメータとサブフレーム単位
での前記量子化声道補間パラメータとの差を計算して、
サブフレーム単位で声道パラメータ誤差を求め、 サブフレーム単位で、前記声道パラメータ誤差を量子化
して、量子化声道補正パラメータを決定し、 フレーム単位での前記量子化声道主パラメータを指定す
る声道パラメータ主コードとサブフレーム単位での前記
量子化声道補正パラメータを指定する声道パラメータ補
正コードとを声道パラメータの前記コードとすることを
特徴とした音声符号化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP03335008A JP3107620B2 (ja) | 1991-12-18 | 1991-12-18 | 音声符号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP03335008A JP3107620B2 (ja) | 1991-12-18 | 1991-12-18 | 音声符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH05165498A true JPH05165498A (ja) | 1993-07-02 |
JP3107620B2 JP3107620B2 (ja) | 2000-11-13 |
Family
ID=18283708
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP03335008A Expired - Lifetime JP3107620B2 (ja) | 1991-12-18 | 1991-12-18 | 音声符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3107620B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0786954A (ja) * | 1993-09-13 | 1995-03-31 | Nec Corp | ベクトル量子化装置 |
KR20130135268A (ko) * | 2010-12-29 | 2013-12-10 | 브리티쉬 텔리커뮤니케이션즈 파블릭 리미티드 캄퍼니 | 비디오 부호화 방법 및 장치 |
-
1991
- 1991-12-18 JP JP03335008A patent/JP3107620B2/ja not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0786954A (ja) * | 1993-09-13 | 1995-03-31 | Nec Corp | ベクトル量子化装置 |
KR20130135268A (ko) * | 2010-12-29 | 2013-12-10 | 브리티쉬 텔리커뮤니케이션즈 파블릭 리미티드 캄퍼니 | 비디오 부호화 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
JP3107620B2 (ja) | 2000-11-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7184953B2 (en) | Transcoding method and system between CELP-based speech codes with externally provided status | |
EP0409239B1 (en) | Speech coding/decoding method | |
FI113571B (fi) | Puheenkoodaus | |
US20090248404A1 (en) | Lost frame compensating method, audio encoding apparatus and audio decoding apparatus | |
JPH10187196A (ja) | 低ビットレートピッチ遅れコーダ | |
KR102171293B1 (ko) | 음성 부호화 장치, 음성 부호화 방법, 음성 부호화 프로그램, 음성 복호 장치, 음성 복호 방법 및 음성 복호 프로그램 | |
JP2007537494A (ja) | 遠隔通信のためのマルチレート音声コーダにおける音声レート変換の方法及び装置 | |
JPH02155313A (ja) | 符号化方法 | |
EP1096476B1 (en) | Speech signal decoding | |
US8055499B2 (en) | Transmitter and receiver for speech coding and decoding by using additional bit allocation method | |
JP3628268B2 (ja) | 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体 | |
JP2005515486A (ja) | Celpによる音声符号間のトランスコーディング・スキーム | |
EP1020848A2 (en) | Method for transmitting auxiliary information in a vocoder stream | |
KR100416363B1 (ko) | 선형 예측 분석 대 합성 엔코딩 방법 및 엔코더 | |
JP3050978B2 (ja) | 音声符号化方法 | |
JP3107620B2 (ja) | 音声符号化方法 | |
JP3283152B2 (ja) | 音声パラメータ量子化装置およびベクトル量子化装置 | |
JP2968109B2 (ja) | コード励振線形予測符号化器及び復号化器 | |
KR20120032444A (ko) | 적응 코드북 업데이트를 이용한 오디오 신호 디코딩 방법 및 장치 | |
JP3047761B2 (ja) | 音声符号化装置 | |
JP2700974B2 (ja) | 音声符号化法 | |
JP3700310B2 (ja) | ベクトル量子化装置及びベクトル量子化方法 | |
KR100389898B1 (ko) | 음성부호화에 있어서 선스펙트럼쌍 계수의 양자화 방법 | |
JP2775533B2 (ja) | 音声の長期予測装置 | |
JPH05173595A (ja) | コード励振線形予測符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20000822 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070908 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080908 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080908 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090908 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090908 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100908 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110908 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110908 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120908 Year of fee payment: 12 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120908 Year of fee payment: 12 |