JPH07239699A - 音声符号化方法およびこの方法を用いた音声符号化装置 - Google Patents

音声符号化方法およびこの方法を用いた音声符号化装置

Info

Publication number
JPH07239699A
JPH07239699A JP6029284A JP2928494A JPH07239699A JP H07239699 A JPH07239699 A JP H07239699A JP 6029284 A JP6029284 A JP 6029284A JP 2928494 A JP2928494 A JP 2928494A JP H07239699 A JPH07239699 A JP H07239699A
Authority
JP
Japan
Prior art keywords
long
term prediction
error
speech
lag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6029284A
Other languages
English (en)
Inventor
Hidetoshi Sekine
英敏 関根
Puriitei Rao
ラオ・プリーティ
Yoshiaki Asakawa
吉章 淺川
Tetsuya Nakagawa
哲也 中川
卓 ▲高▼島
Taku Takashima
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP6029284A priority Critical patent/JPH07239699A/ja
Publication of JPH07239699A publication Critical patent/JPH07239699A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 (修正有) 【目的】 低ビットレートでも高品質な合成音声を得る
ことのできる、音声符号化方法を提供する。 【構成】 合成フィルタの係数は過去の符号化音声か
ら、合成フィルタ係数計算部10で求める。入力音声を
音声分類部2で有声音と無声音に分類し、有声音では長
期予測ラグ符号化部3で長期予測ラグの差分量子化によ
り、複数の量子化レベルをもつ長期予測ラグ符号帳3
2、33から量子化した差分量を選択し、ラグの量子化
結果に従い、長期予測フィルタ符号化部5で長期予測フ
ィルタの形状の選択と係数を量子化を行う。無声音では
長期予測を行なわない。励起ベクトル選択部5で励起ベ
クトルを選択し、後ろ向き利得適応部7で長期予測ベク
トルと励起ベクトルにかける利得を後ろ向きに予測す
る。伝送符号作成部9は長期予測ラグと長期予測フィル
タ、励起ベクトルの各選択結果a、b、cから復号部へ
伝送する符号を作成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、中ビットレートから低
ビットレートで、高音質な合成音声を得られる音声符号
化方法に関する。
【0002】
【従来の技術】比較的良好な合成音声を得られる音声符
号化方法として、64kbps 対数PCM(pulse code modulati
on)符号化方式や32kbps ADPCM (Adaptive differential
PCM)の波形符号化方式がCCITTによりそれぞれG.711、
G.721として勧告されている。しかしこれらの方法では
高音質な合成音声が得られる一方、高いビットレートが
必要であった。
【0003】近年低ビットレートにおいても比較的良好
な音声品質を得られる方法として符号駆動線形予測符号
化(CELP:Code excited linear prediction)方式(例え
ば、M.R.Schroeder and B.S.Atal:Code-ecited linear
prediction (CELP), IEEE Proc. ICASSP 85 (1985.3))
が提案されており、4.8kbps程度で実用的な音声品質を
実現している。また、CELP方式の改良方式も多数提案さ
れており、例えばベクトル和駆動線形予測符号化(VSEL
P)方式(例えば、I.A.Gerson and M.A.Jasiuk:Vector s
um excited linear prediction (VSELP) speech coding
at 8kbps, IEEE Proc. ICASSP 90 (1990.4))は、処理
量やメモリ容量、ビット誤り耐性の点で優れており、日
本とアメリカのディジタル自動車電話用符号化標準方式
に採用されている。現在では、一層の通信効率の向上の
ため、より低ビットレート化したCELP方式の改良方式が
提案されている。
【0004】一方、これらCELP方式では符号化の過程で
用いる合成フィルタの係数を、符号化フレームから前向
きに予測するため、符号化フレームを長くする必要があ
り、一般に40msから60ms程度の大きな符号化遅延が発生
する。この符号化遅延は、音声符号化を用いるアプリケ
ーションによっては大きな問題となる。この問題を解決
するため、低ビットレートで、符号化遅延が少ない高音
質な符号化音声が得られる音声符号化方法として、16kb
ps LD-CELP(Low delay CELP)方式がCCITTによりG.728と
して勧告された。LD-CELP方式は、合成フィルタの係数
と駆動音源利得のそれぞれを後ろ向き適応により予測す
ることによって、符号化フレーム長を短くし、符号化遅
延が2ms以下ながら、比較的良好な音声品質が得られ
る。
【0005】しかし、最近では低遅延の符号化方式にお
いても、より一層の低ビットレート化が求められてお
り、その一つとして8kbps LD-CELP方式がH.ChenとM.S.R
auchwerkによって提案されている(B.S.Atal et al, Ed
s.: Speech and Audio Codingfor Wireless and Networ
k Applications, Kluwer Academic Publishers (199
3))。この方式は16kbps LD-CELP方式に対し、符号化フ
レームの延長、音声分類、長期予測を追加することによ
って、低遅延ながら8kbps VSELP方式と同等の音声品質
を得ている。
【0006】
【発明が解決しようとする課題】一般的なCELP方式やLD
-CELP方式において、通信効率の向上のため、低ビット
レート化が進められているが、低ビットレート化に伴う
符号化音声の品質劣化が問題になっている。比較的ビッ
トレートが高い場合には、1サンプルあたりの伝送情報
量が大きいため、符号化フレームを短くしても各フレー
ムで再現できる波形のバリエーションが多い。しかし、
低ビットレート化すると各フレームで再現できる波形の
バリエーションが減少するため、符号化音声が劣化して
しまう。さらに符号化は、各符号化フレーム内の平均的
な波形を近似しているため、符号化フレームを長くする
ことにより、フレーム内の波形の変動が増え、平均的波
形との誤差が増加してしまう。そこで符号化フレームを
延長すると共に、各フレームの波形に含まれる冗長な情
報を取り除き、重要な情報だけを符号化することにより
符号化音声の品質を保つ方法が一般的である。しかし、
符号化フレームを延長したことによる、隣接フレーム間
やフレーム内での波形の変動、中でもピッチの変動が大
きな問題であり、低ビットレート化に伴う周期成分の再
現性の低下がもっとも大きな劣化要因と考えられてい
る。例えば、16kbps LD-CELP方式では、合成フィルタを
高次数化して、周期成分の近似を行っている。符号化フ
レーム長が短く、隣接フレーム間やフレーム内でのピッ
チや波形の変動が小さいため、合成フィルタの周波数特
性がある程度各符号化フレームの特長を近似できるから
である。これに対し、8kbps程度の LD-CELP方式では、
高次数の合成フィルタによる周期成分の再現は余り適当
ではない。符号化フレームが長くなるため、合成フィル
タの周波数特性が平均化され、再現すべき周期成分を正
しく近似できなくなる。そこで、合成フィルタの次数を
下げると共に、入力音声の有声音/無声音への分類と、
有声音部でのピッチ予測が一般的に用いられる。しか
し、一様なピッチ予測を行っている場合が多く、定常的
部や過渡部、立ち上がり部など有声音部に含まれる多様
な波形に対応した周期成分の近似が精度良く行えず、音
質の劣化が生じる。よって音声品質の向上を図るために
は、有声音部の多様な波形に対応した周期成分の近似精
度の向上が必要である。
【0007】
【課題を解決するための手段】本発明の目的は、音声符
号化方法において、通信効率を向上させつつ、符号化音
声の品質劣化を防ぐ事である。本発明では、符号化部に
入力された音声は、フレームに分割される。まず、現フ
レームで用いる合成フィルタの係数を求める。
【0008】最初に入力音声をフレーム毎に音響的に分
類し、各分類に適した符号化方法を選択する。
【0009】次に、入力音声の周期性を近似する長期予
測を行う。長期予測は、長期予測ラグと長期予測フィル
タの形状と係数の選択により行う。
【0010】長期予測ラグ選択部では、過去の符号化波
形から作成した適応符号帳と長期予測ラグ符号帳を用い
て、各長期予測ラグに対応した長期予測ベクトルを作成
し、各長期予測ベクトルに合成フィルタを施した後、入
力音声との誤差を計算する。この誤差に基づき、長期予
測ベクトルと長期予測ラグの候補を選択する。
【0011】ただし音響分類の結果から長期予測が不適
当と分類されたフレームでは、長期予測を行わない。
【0012】次に、現フレームで選択された長期予測ラ
グと、以前のフレームの長期予測ラグと比較し、長期予
測ラグの連続性を求め、連続性の度合いに従い長期予測
ラグの選択以降の符号化方法の選択を行う。
【0013】長期予測フィルタ選択部では、長期予測ラ
グの連続性の度合いに従い、量子化に用いる長期予測フ
ィルタの形状と係数の量子化法を変える。長期予測ラグ
の連続性の度合いに対応した量子化テーブルから読み出
した長期予測フィルタを、合成フィルタ処理後の長期予
測ベクトルに施し、入力音声との誤差を計算して、最適
な長期予測フィルタを選択する。
【0014】励起ベクトル選択部では、励起ベクトル符
号帳から励起ベクトルを読み出し、合成フィルタを施し
て入力音声との誤差を計算し、最適な励起ベクトルを選
択する。
【0015】利得符号化部では、入力音声と符号化後の
波形の誤差が小さくなるよう、選択された長期予測ベク
トルと励起ベクトルに掛け合わせる利得を求める。
【0016】伝送符号作成部では、各選択部で選択され
た結果を全伝送ビットの中に割り当て、伝送ビットを作
成する。また、全伝送ビットから各符号化方法に必要な
ビットを差し引いたビットに符号化方法の識別に必要な
情報を割当てる。
【0017】復号部では、まず伝送符号復号部が、符号
化部から送られてきた伝送符号を処理し、符号化部で用
いられた符号化方法を判断したのち、長期予測ラグと長
期予測フィルタと励起ベクトル、それぞれの情報に復号
する。
【0018】長期予測ベクトル復号部で、符号化部と同
様の方法で求めた適応符号帳と長期予測ラグ情報から長
期予測ベクトルを復号する。ここで現フレームと前フレ
ームの長期予測ラグ情報を比較し、連続性を求め、長期
予測フィルタ復号部以降の復号方法を決定する。ただし
符号化部で長期予測が行われなかったフレームでは、復
号部でも長期予測を行わない。
【0019】長期予測フィルタ復号部では、長期予測ラ
グの連続性から長期予測フィルタの形状と係数を読みだ
す符号帳を決定し、長期予測フィルタを復号する。復号
された長期予測フィルタを長期予測ベクトルに施す。
【0020】励起ベクトル復号部では、励起ベクトル情
報に従い、励起ベクトル符号帳から励起ベクトルを読み
出し、復号する。
【0021】利得復号部では、長期予測ベクトルと励起
ベクトルに掛け合わせる利得を復号する。
【0022】利得を掛け合わせられた長期予測ベクトル
と励起ベクトルは、合成フィルタを施され、復号音声を
得る。
【0023】以上の処理の中で、長期予測ラグ選択部で
は、長期予測ラグの連続性を検出し、長期予測フィルタ
の選択以降の符号化方法を決定する。ここで、長期予測
ラグの選択法としては、現フレームと前フレームの長期
予測ラグの差分を量子化する差分量子化を用いる。長期
予測ラグの差分値を、複数の異なる量子化ステップを有
する符号帳を用いて量子化する。また選択された長期予
測ベクトルと入力音声との誤差が、予め定めた条件を満
たさない場合は、その長期予測ラグを選択候補から除外
する処理も行う。またこの誤差による選択候補の絞り込
みにより、選択候補が0となった場合でも選択結果を復
号部へ送る処理も行う。
【0024】長期予測フィルタ選択部では、長期予測ラ
グの連続性に従い、長期予測フィルタの形状を変更させ
る。異なるフィルタ形状と係数の情報を格納している複
数の符号帳の中から、選択された形状を持っている符号
帳を選択の対象とする。
【0025】伝送符号作成部では、異なる符号化方式に
よって符号化された情報を、それぞれの符号化方式に必
要なビット数を割り当て、残りのビットで符号化方法の
特定を行う情報を伝送する。
【0026】復号部では伝送符号に従い、符号化部の各
選択部に対応した処理を行い、符号化部で得られる符号
化音声の品質を維持する。
【0027】
【作用】長期予測ラグ選択部では、量子化ステップの異
なる長期予測ラグ符号帳と適応符号帳を用いて、長期予
測ラグの候補を選択する。ここで長期予測ラグの連続性
を求めることにより、現フレームの入力音声の性質を推
定し、適当な符号化方法を選択し、周期性の近似誤差を
向上させると共に符号化音声の品質を向上させる。長期
予測ラグの量子化を差分量子化で行う場合、入力音声の
性質によっては長期予測ラグの値がかなり変動すること
があり、一様な量子化ステップでは最適な長期予測ラグ
の変化に対応できないこともありうる。よって周期性の
度合いなど入力音声の性質を考慮した量子化ステップを
複数設定することにより、長期予測ラグの多様性に対応
する。また、選択された量子化後の差分値により長期予
測ラグの連続性を判断することができる。また、量子化
の過程で長期予測の結果を判断し、長期予測利得の低い
ものは候補から除外することにより、選択に費やされる
余計な処理量を削減しつつ、最適な候補を選択すること
ができる。また、全ての候補が除外された場合は長期予
測が不適当と判断し、予測利得の低い長期予測による悪
影響を除き、音質が劣化するのを防ぐ。しかしこの場合
でも量子化値を復号部へ伝送することにより、長期予測
ラグの追従性を向上させることが出来る。
【0028】長期予測フィルタ選択部では、長期予測ラ
グ選択部で計算された長期予測ラグの連続性の度合いに
従い、量子化する長期予測フィルタの形状と係数の量子
化方法を変化させる。例えば長期予測ラグの連続性が高
い場合には、比較的次数の多い長期予測フィルタによっ
て、長期予測ラグの連続性が低い場合には、比較的次数
の少ない長期予測フィルタによって長期予測を行ない、
それぞれの入力音声の性質に合わせた効率的な長期予測
の精度向上が可能となる。
【0029】伝送符号作成部では、全伝送ビットの中
に、各符号化方法に必要な伝送ビットを割当て、選択結
果を伝送する。そして伝送ビットのうち、各符号化に必
要なビット数を差し引いた残りのビットで、各符号化方
法の識別に必要な情報を伝送する。これにより情報伝送
に必要なビット数が異なる符号化方法を組み合わせるこ
とができ、効率的な符号化が可能になる。
【0030】
【実施例】以下、図面を用いて本発明の一実施例を説明
する。本発明をLD-CELP方式に適用した音声符号化部の
ブロック図を図1に、音声復号部のブロック図を図2に
それぞれ示す。まず、信号の流れに沿って処理の概要を
説明する。
【0031】符号化部では、所定の標本化周波数(通常
8kHz)でA/D変換されたディジタル音声信号1が
入力される。
【0032】まず、合成フィルタ係数計算部10によっ
て過去の符号化後の音声波形から現フレームの符号化に
用いる合成フィルタ8の係数を求める。
【0033】音声分類部2では、入力音声をフレーム毎
に有声音部/無声音部に分類し、分類結果を長期予測ラ
グ符号化部3へ送る。分類結果は長期予測ラグなどの符
号化方法の選択に用いられる。フレーム長は、例えば4m
s(32サンプル)程度である。
【0034】長期予測ラグ符号化部3は、長期予測ラグ
選択部31と、適応符号帳作成部34と、複数の長期予
測ラグ符号帳32、33から構成される。まず適応符号
帳作成部43で、過去の符号化後の音声波形に対して合
成フィルタ8の逆フィルタを施し、得られた残差波形を
適応符号帳とする。長期予測ラグ選択部31では、異な
る量子化ステップをもつ長期予測ラグ符号帳32と33
から長期予測ラグを読み出し、長期予測ラグと適応符号
帳から長期予測ベクトルを作成し、長期予測ベクトルに
合成フィルタを施した後、入力音声との誤差を計算す
る。誤差計算を、長期予測ラグ符号帳に含まれる長期予
測ラグ全てについて行い、誤差が小さいものを選択す
る。音声分類部2で無声音と分類されたフレームは、長
期予測ラグの選択を行わない。
【0035】次に長期予測フィルタ符号化部4で、長期
予測フィルタの選択が行われる。長期予測フィルタ符号
化部4は、長期予測フィルタ選択部41と、長期予測フ
ィルタ符号帳選択部42と、複数の長期予測フィルタ符
号帳43、44から構成される。長期予測フィルタ符号
帳選択部5では、長期予測ラグ選択部の選択結果aから
長期予測ラグの連続性、つまり周期性の連続性を検出
し、長期予測フィルタ符号帳43と44の中から長期予
測フィルタの符号化に用いる符号帳を選択し、長期予測
フィルタ選択部41へ送る。長期予測ラグの選択が行わ
れなかったフレームは、長期予測フィルタの選択を行わ
ずに、励起ベクトル選択部5へ送られる。長期予測フィ
ルタ選択部41では、長期予測フィルタ符号帳選択部4
2が選択した符号帳から、長期予測フィルタ情報を読み
出し、長期予測ラグ符号化部3で作成した長期予測ベク
トルの合成フィルタ処理後の波形に長期予測フィルタを
施し、入力音声との誤差を計算する。選択された長期予
測フィルタ符号帳に含まれる長期予測フィルタ情報全て
について誤差を計算し、誤差の小さくなる長期予測フィ
ルタ情報を選択する。
【0036】励起ベクトル選択部5では、励起ベクトル
符号帳6に含まれる励起ベクトルに合成フィルタを施し
たものと入力音声の誤差を計算し、誤差が小さくなる励
起ベクトルを選択する。
【0037】後ろ向き利得適応部7では、対数化した過
去の利得から後ろ向きに現フレームの適応ベクトルと励
起ベクトルの利得を予測し、求める。そして適応ベクト
ルと励起ベクトルに求めた利得を乗し、合成フィルタ8
へ出力する。
【0038】伝送符号作成部16では、長期予測ラグ符
号化部3、長期予測フィルタ符号化部4、励起ベクトル
選択部5の選択結果a、b、cに基づいて、復号部へ送
る伝送符号を作成する。
【0039】復号部では、最初に受信符号復号部109
で伝送符号から長期予測ラグ情報dと、長期予測フィル
タ情報eと、励起ベクトル情報fを復号し、各復号部へ
送る。
【0040】合成フィルタ係数計算部110は、過去に
復号された音声波形から現フレームで用いる合成フィル
タ8の係数を計算する。
【0041】長期予測ベクトル復号部103では、受信
符号復号部109から送られた長期予測ラグ情報dと、
適応符号帳作成部134で得られた適応符号帳から長期
予測ベクトルを復号する。適応符号帳作成部134は、
過去の復号音声に合成フィルタ8の逆フィルタを施し、
得られた残差波形を適応符号帳とする。長期予測ラグ復
号部131は、受信符号復号部から送られた長期予測ラ
グ情報に従い、複数の長期予測ラグ符号帳132、13
3から長期予測ラグを読みだし、長期予測ベクトルの復
号に用いる。
【0042】長期予測フィルタ復号部104は、長期予
測ベクトル復号部103で、復号された長期予測ベクト
ルに施す長期予測フィルタを復号する。長期予測フィル
タ符号帳選択部142は、長期予測ラグ情報dと過去の
フレームの長期予測ラグ情報をもとに長期予測フィルタ
符号帳143、144を選択し、長期予測フィルタ作成
部141へ送る。長期予測フィルタ作成部141では、
長期予測フィルタ情報eに従い、長期予測フィルタ符号
帳選択部142で選択された長期予測フィルタ符号帳か
ら長期予測フィルタを作成し、長期予測ベクトルに施
す。長期予測フィルタを施された長期予測ベクトルは、
後ろ向き利得適応部107へ送られる。
【0043】励起ベクトル復号部105は、励起ベクト
ル情報fに従い、励起ベクトル符号帳106から励起ベ
クトルを復号し、後ろ向き利得適応器107へ送る。
【0044】後ろ向き利得適応器107は、対数化され
た過去の利得から、長期予測ベクトルと励起ベクトルに
掛け合わせる利得を予測する。
【0045】利得を掛け合わされた長期予測ベクトルと
励起ベクトルは、合成フィルタ108を施され、復号音
声となる。得られた復号音声は次フレームの合成フィル
タの係数の計算にも用いられる。
【0046】以上、本実施例の概要を説明したので、次
に主要部の詳細な機能について説明する。
【0047】合成フィルタ係数計算部10は、16kbps L
D-CELP方式と同様、過去の符号化後の音声波形から後ろ
向きに現フレームの符号化に用いる合成フィルタ8の係
数を求める。一般的なCELP方式では、合成フィルタの係
数は符号化するフレームの波形を用いて前向きに予測す
ることから、符号化フレーム内にある程度の情報が含ま
れていなければならず、フレーム長を長くする必要があ
った。LD-CELP方式では、合成フィルタの係数を過去の
符号化後の波形から求めるために、フレーム長を短くす
ることができ、符号化遅延を短く抑えることができる。
またLD-CELP方式では、復号部でも復号後の波形から合
成フィルタの係数を求めることが出来るため、伝送する
必要がなく、伝送情報量を削減できる。合成フィルタの
次数は、例えば12次程度である。実際に合成フィルタの
係数を求める際には、音声データに半ハミング窓等の分
析窓を掛けて重み付けを行い、係数の推定精度を向上さ
せる。
【0048】音声分類部2は入力された音声を分析し、
求めた音響的パラメータ等から、入力音声を分類する。
用いられるパラメータとしては、自己相関係数、振幅パ
ワーの変化量、零交差数などを用いる。本実施例では、
入力音声を有声音と無声音に分類する。分類結果は長期
予測ラグ符号化部3に送られ、長期予測を行うか、行わ
ないが判断される。長期予測の有無の決定の方法として
は、長期予測を全てのフレームで行い、選択された候補
の長期予測利得が低い場合には長期予測を行わない方法
も考えられるが、本実施例では音響分類によって長期予
測誤差が大きくなると予想されたフレームでは長期予測
の選択を行わず、長期予測に要する処理量を削減してい
る。
【0049】長期予測ラグ選択部31は音声分類部2に
よって有声音と判断されたフレームに対し、長期予測を
行う。長期予測ではまず過去の符号化後の音声に合成逆
フィルタを施した残差波形を適応符号帳とする。次に現
時点からある遅延つまり長期予測ラグ分さかのぼった波
形を適応符号帳から切り出し、切り出した波形(長期予
測ベクトル)に合成フィルタを施す。合成フィルタ通過
後の波形と入力音声との波形の誤差から、適当な長期予
測ベクトルと長期予測ラグを選択する。つまり過去の符
号化波形から、現フレームの入力音声に似た部分を探
し、近似することによって周期性を再現する。ここで、
選択された長期予測ラグを以前のフレームの長期予測ラ
グと比較し、その連続性を判断する。長期予測ラグの連
続性を求めることにより、入力音声の周期性の度合いを
求めることができる。長期予測ラグの連続性が高い場合
には、周期性の高い定常的な部分と見なすことができ
る。連続性が低い場合には、過渡部など周期性の低い部
分であると見なすことができる。それぞれの周期性の度
合いに応じ、以降の符号化方法を選択する。
【0050】長期予測ラグの量子化方法として差分量子
化を用いる場合には、選択された長期予測ラグの差分量
によりその連続性は容易に評価することができる。長期
予測ラグの差分量子化法は、現フレームと直前フレーム
の長期予測ラグの差を量子化する方法で、LD-CELP方式
など比較的フレーム長が短く、隣接フレーム間での長期
予測ラグの変化量が比較的少ない場合に有効な方法であ
り、割り当てビットに対し有効な符号化が行える。ここ
で、複数種類の量子化ステップを有する長期予測ラグ符
号帳を差分量子化に用いることにより、長期予測ラグの
変化に対する追従性を向上させることができる。音声分
類部2では、定常部のほかに、立ち上がり部などの非定
常部も有声音と分類される。定常部では、隣接フレーム
間の長期予測ラグの変化量は小さいのに対し、非定常部
等では隣接フレーム間の長期予測ラグの差分量は定常部
よりも大きくなる。これら変化量の異なる差分を所定の
ビット数で表現できる一様な量子化ステップで量子化し
ようとした場合、定常部あるいは非定常部どちらかの部
分での長期予測ラグの変化への追従性が低下する。そこ
で複数の量子化ステップを用意することにより、定常部
では細かい量子化ステップ、非定常部では粗い量子化ス
テップの様に、それぞれの性質に応じ適当な量子化ステ
ップが選択されるようになる。異なる複数種類の量子化
ステップを有する長期予測ラグ符号帳の例を図3に示
す。細かい部分では分解能が1サンプルで、−7から+
7までの範囲を量子化する。粗い部分では分解能が10
サンプルで、−40から+40までの範囲を量子化す
る。このような、量子化ステップの多様化により、長期
予測ラグの連続性の評価が正確に行えるようになり、以
後の符号化の精度も向上させることができる。
【0051】また、より一層の符号化音声の品質向上を
目的として、励起ベクトルと組み合わせたディレドデシ
ジョンを行うため、長期予測ラグ選択部31では複数の
長期予測ラグ候補を選択する。ここで用いるディレイド
デシジョンは、複数の長期予測ラグ候補それぞれに対
し、励起ベクトルを選択し、長期予測と励起ベクトルの
選択結果を組み合わせた誤差が最小となる組み合わせを
選択する方法である。まず長期予測ラグ選択部31で2
つの長期予測ラグ候補を選択する。それぞれのラグ候補
に対し、2つの励起ベクトルの候補を選択し、4つの組
み合わせの中から誤差が最小となるものを選択する。こ
れにより、単純な逐次最適化よりも最適な符号化を行う
ことが可能となる。
【0052】また、複数候補の選択の過程でより効果的
な選択を行うため、長期予測誤差による長期予測ラグの
候補の絞り込みを行う。長期予測誤差は、長期予測ベク
トルを合成フィルタに通した波形と入力音声の誤差で、
長期予測による近似精度を表す。選択された複数の長期
予測ラグによる長期予測誤差を比較し、最小の長期予測
誤差との差が予め決めた閾値より大きな長期予測誤差を
取る長期予測ラグの候補は、以後の符号化の候補から除
外する。長期予測誤差の差が大きな場合には、励起ベク
トルを含めた組み合わせの選択において、長期予測誤差
の大きな候補を含む組み合わせが選択されることがほと
んど無いからである。この処理により、符号化に要する
余分な演算量を削減することができる。
【0053】また上記の処理のほかに、長期予測誤差の
大きな部分での劣化を防ぐため、長期予測誤差が大きな
フレームでは長期予測を停止する。立ち上がり部などは
周期性は低いが、振幅が大きく、有声音と判断されるこ
とがあり、この部分で長期予測を行うと、予測誤差の大
きな波形で近似するため、符号化音声の品質は劣化して
しまう。そこで、長期予測ラグに対する長期予測誤差
が、全ての候補において予め決めた閾値より大きな場合
は、有声音ではあるが周期性がかなり低い部分と判断し
(準有声音部と呼ぶ)、長期予測による悪影響が出るの
避けるため、長期予測ベクトルを符号化に使用しないこ
ととした。しかし準有声音部では長期予測ラグが一般的
に大きく変化するため、差分量子化を使用した場合、長
期予測ラグの情報を伝送しないと、次フレームでの変化
量がより大きくなり、長期予測ラグの変化に対する追従
性が低下することがある。そこで、準有声音部では長期
予測ベクトルは用いないものの、長期予測ラグを量子化
し、伝送することによって、ラグの追従性を向上させ
た。また同様の理由から、無声音部では予め決めた値を
ラグの値とし、ラグの追従性を向上させた。
【0054】長期予測フィルタ符号帳選択部5では、長
期予測ラグ選択部3で選択された量子化ステップに従
い、量子化する長期予測フィルタの形状と係数の量子化
法を選択する。たとえば細かい量子化ステップが選択さ
れた場合には、周期性が高いと判断し、3タップの長期
予測フィルタの係数をベクトル量子化する。粗い量子化
ステップが選択された場合には、周期性が低いと判断
し、1タップの長期フィルタの係数をスカラ量子化す
る。3タップの長期予測フィルタは、次式の伝達関数で
表されるフィルタを用いる。ここで、Lは長期予測ラ
グ、p(i)は長期予測フィルタの係数出ある。このフィル
タは長期予測ラグ分さかのぼった点とその前後1ポイン
ト、計3ポイントにそれぞれ重みを掛けて足しあわせ、
周期成分の比較的強い強調を行うことが出来る。
【0055】
【数1】
【0056】1タップの長期予測フィルタは、次式の伝
達関数で表されるフィルタを用いる。Lは長期予測ラ
グ、pは長期予測フィルタの係数である。このフィルタ
は、周期成分の強調の度合いが3タップのフィルタより
も弱い。
【0057】
【数2】
【0058】なお無声音部と準有声音部では長期予測ベ
クトルを符号化に用いないので、当然長期予測フィルタ
による予測は行わない。
【0059】長期予測フィルタ符号化部4では、長期予
測ラグ符号化部3で選択された長期予測ラグと長期予測
ベクトルが用いられる。長期予測フィルタ符号帳選択部
42で選択された長期予測フィルタ符号帳に含まれる長
期予測フィルタ情報を読み出し、合成フィルタと長期予
測フィルタを長期予測ベクトルに施して、入力音声との
誤差を求め、誤差が最小となる長期予測フィルタを選択
する。
【0060】励起ベクトル選択部5では、入力音声と長
期予測ベクトルの誤差波形を近似する。合成フィルタと
長期予測フィルタを施された長期予測ベクトルと入力音
声の誤差波形と、合成フィルタを施した励起ベクトルの
誤差を、励起ベクトル符号帳に含まれる歴ベクトルすべ
てに対し計算し、誤差の小さくなる励起ベクトルを選択
する。本実施例では励起ベクトル符号帳を1種類しか用
いていないが、複数の励起ベクトル符号帳を音声分類器
の分類結果あるいは符号化の途中経過にしたがって切り
換える方法も考えられる。これは、高ビットレートの符
号化方式では、励起ベクトルで近似する波形は、周期成
分が比較的精度良く近似できるため、有声音部でも雑音
に近い波形になるが、低ビットレート化した符号化方法
では、周期成分の近似精度が低下し、励起ベクトルで近
似する波形に周期成分が残ってしまう。よって励起ベク
トルで近似する波形は、無声音では比較的非定常な波
形、有声音部では比較的定常的な波形であることが多
く、入力音声の性質それぞれに適した励起ベクトル符号
帳を用意することによって符号化音声の品質が向上す
る。
【0061】以上、長期予測と励起ベクトル選択の個々
のブロックの処理内容を詳述したので、処理の流れを流
れ図を用いて整理する。図3は励起ベクトル符号帳を2
種類用いた場合の各符号化方法における処理の流れ図で
ある。入力音声は音響分類(231)により、有声音と
無声音に分類される。無声音と分類された場合には、長
期予測は行わず、無声音用の励起ベクトル(237)を
選択する。有声音と分類された場合には、まず長期予測
を行う。最初に長期予測ラグの選択(232)を行い、
選択された長期予測ラグの候補数により長期予測フィル
タの選択の有無を選択する(233)。長期予測ラグの
候補数が0の場合は長期予測フィルタの選択を行わず、
有声音用の励起ベクトルの選択(238)を行う。長期
予測ラグの候補数が1以上の場合は、各候補の量子化ス
テップにより長期予測フィルタの形状と係数の量子化方
法を選択する(234)。量子化ステップが粗い場合に
は、1タップの長期予測フィルタの選択を行い(23
5)、量子化ステップが細かい場合には3タップの長期
予測フィルタの選択を行う(236)。次に有声音用の
励起ベクトルの選択を行う(238)。ここでは長期予
測ラグの候補数に関わらず、有声音と分類された場合に
は有声音用の励起ベクトルの選択を行う。長期予測ラ
グ、長期予測フィルタ、励起ベクトルの選択結果は伝送
符号に変換される(239)。
【0062】無声音部では長期予測を全く行わないの
で、有声音部で長期予測の結果を伝送するのに用いられ
ているビットを励起ベクトルに割り当てることもでき
る。実際には、励起情報ベクトル符号帳は、ベクトルの
形状と利得情報から構成されている。ここでは励起ベク
トル符号帳に対し、有声音部では11ビット、無声音部
では12ビットを割り当てているが、このうちベクトル
形状にどちらも7ビット、利得にそれぞれ4ビットと5
ビットを割り当てている。これは入力音声の振幅の多様
性に対応すると共に、励起ベクトルの選択に要する処理
量を削減する目的もある。全ビットを波形形状のみに割
り当てた場合、選択に要する処理量は指数関数的に増加
し、実際に通信等に用いることは不可能になる。まず波
形形状による選択を行った後、利得を選択することによ
り、処理量を抑えることができる。また利得の量子化も
行うことにより、後で行う利得の後ろ向き適応による予
測の精度を向上させる働きもある。
【0063】また励起ベクトル選択部では、有声音部で
長期予測ベクトルとの組み合わせによるディレイドデシ
ジョンを行うため、長期予測ベクトルの候補それぞれに
対し最適励起ベクトルの選択を行う。最終的には長期予
測ベクトルと励起ベクトルの組み合わせのうち、入力音
声との誤差が最小となる組み合わせを選択する。これに
より処理量を余り増加させることなく、単純な逐次最適
化よりも符号化音声の品質を向上させることができる。
【0064】後ろ向き利得適応部7では、合成フィルタ
を駆動する長期予測ベクトルと励起ベクトルに掛け合わ
せる利得を求める。利得は、対数化した過去の利得から
後ろ向き適応によって求められる。よって利得の情報は
合成フィルタと同様、復号部へ送る必要なく、伝送情報
量の削減が可能となる。
【0065】伝送符号作成部9では、長期予測ラグ、長
期予測フィルタ、励起ベクトルの各選択結果から、復号
部へ伝送するビット列を生成する。ビット列の例を図5
に示す。符号化の結果、入力音声は無声音、周期性の低
い有声音、周期性の高い有声音、準有声音の4つに分け
られる。ここでは、各分類で用いられる符号化方法に必
要なビットを全伝送ビットから除いたビットによって、
各符号化方法を識別する。例えば本実施例では、無声音
はビット25から32、周期性の低い有声音はビット24から
26、準有声音はビット27から32が決まったパターンにな
ることによって各符号化方法を識別する。これにより、
情報の伝送に必要なビット数が異なる符号化方法を組み
合わせることができ、特定のビットだけが符号化の種類
を表す場合よりもビット割当の自由度が増加し、効率的
な情報伝送が可能となる。またこの例では無声音を表す
ビット列では、25と26ビットが共に1であり、もし復号
部で受信したビット列がそれ以外のパターンになった場
合には、伝送路上で誤りが発生したことが検出でき、誤
り耐性を向上させる制御が容易に行える利点もある。
【0066】次に復号部の説明の詳細な説明を行う。
【0067】受信符号復号部109では、受信符号から
長期予測ラグ情報d、長期予測フィルタ情報e、励起ベ
クトル情報fを復号する。符号化部から送られてくる符
号は、用いられた符号化方法の種類が特定のビットだけ
で表されているのではなく、複数のビットの特定パター
ンにより表されているので、受信符号復号部は特定パタ
ーンの抽出と符号化方法の特定を行った後、それぞれの
情報を復号する。
【0068】長期予測ベクトル復号部103では、送ら
れてきた長期予測ラグ情報と前フレームの長期予測ラグ
の値から現フレームの長期予測ラグを求める。もし長期
予測を行わない符号化方法が符号化側で選択されていた
場合には、符号化側と同様、長期予測を復号似は用いな
いものの、長期予測ラグを予め決めておいた値に設定す
る。求めた長期予測ラグと適応符号帳から長期予測ベク
トルを計算する。ここで適応コードブックは符号化部と
同様、過去の復号波形に合成フィルタの逆フィルタを施
して求める。
【0069】以上説明したように、本発明の実施例で
は、音声符号化方式の低ビットレート化に伴う周期成分
の近似精度を向上させることができ、符号化音声の品質
の向上が図れる。
【0070】図6に本発明の音声符号化方法を無線通信
装置に用いた例を示す。
【0071】送信機300では、マイクなどの音声入力
装置301から入力された音声は、A/D変換部302
によりディジタルデータに変換される。変換されたディ
ジタルデータは音声符号化部303により伝送符号に変
換される。音声符号化部303には、長期予測部331
と符号化方法選択部332が含まれ、符号化方法選択部
332は長期予測部331の予測結果から周期性の連続
性を検出し、複数の符号化方法の中から選択する。音声
符号化部303で符号化された伝送符号は、無線部30
4に送られ、アンテナ305から受信機に向け電波30
6として送信される。
【0072】受信機400では、送信機から送られてき
た電波401をアンテナ402で受信し、無線部で伝送
符号まで復号される。復号された伝送符号は音声復号部
404で音声波形に復号される。音声復号部には、長期
予測情報復号部441と復号方法選択部442が含ま
れ、長期予測情報復号部441が伝送符号から長期予測
情報を復号し、復号方法選択部442が復号された長期
予測情報と前フレームの長期予測情報から長期予測情報
の連続性を検出し、復号方法の選択を行う。復号された
音声波形は、D/A変換部405によりアナログ波形に
変換され、スピーカ等の出力装置408から出力され
る。
【0073】
【発明の効果】本発明によれば、CELP符号化方式を低ビ
ットレート化したときに問題となる周期成分の再現性が
改善される。また長期予測において、誤差による候補の
削減や長期予測の停止等により、処理量を抑えつつ、高
品質な符号化音声が得られる。また、情報の伝送に必要
なビット数が異なる符号化方法を組み合わせることがで
き、各音声に適した符号化音声を選択することにより、
効率的な符号化が可能となる。
【図面の簡単な説明】
【図1】本発明の第1の実施例の符号化部のブロック
図。
【図2】本発明の第1の実施例の復号部のブロック図。
【図3】複数の量子化ステップを有する長期予測ラグ符
号帳を用いた符号化方法。
【図4】各符号化方法におけるビット割り当ての説明
図。
【図5】各符号化方法における処理の流れ図。
【図6】本発明の音声符号化方法を用いた無線通信装
置。
【符号の説明】
1…入力音声、2…音声分類部、3…長期予測ラグ符号
化部、31…長期予測ラグ選択部、32…長期予測ラグ
符号帳1、33…長期予測ラグ符号帳2、34…適応符
号帳作成部、4…長期予測フィルタ符号化部、41…長
期予測フィルタ選択部、42…長期予測フィルタ符号帳
選択部、43…長期予測フィルタ符号帳1、44…長期
予測フィルタ符号帳2、5…励起ベクトル選択部、6…
励起ベクトル符号帳、7…後ろ向き利得適応部、8…合
成フィルタ、9…伝送符号作成部、10…合成フィルタ
係数計算部、a…長期予測ラグ選択結果、b…長期予測
フィルタ選択結果、c…励起ベクトル選択結果、103
…長期予測ベクトル復号部、131…長期予測ラグ復号
部、132…長期予測ラグ符号帳1、133…長期予測
ラグ符号帳2、134…適応符号帳作成部、104…長
期予測フィルタ復号部、141…長期予測フィルタ生成
部、142…長期予測フィルタ符号帳選択部、143…
長期予測フィルタ符号帳1、144…長期予測フィルタ
符号帳2、105…励起ベクトル復号部、106…励起
ベクトル符号帳、107…後ろ向き利得適応部、108
…合成フィルタ、109…受信符号復号部、110…合
成フィルタ係数計算部、d…長期予測ラグ情報、e…長
期予測フィルタ情報、f…励起ベクトル情報、231…
音響分類部、232…長期予測ラグ選択部、233…ラ
グ候補数判断部、234…長期予測ラグ量子化ステップ
選択部、235…1tap長期予測フィルタ符号化部、23
6…3tap長期予測フィルタ符号化部、237…無声音用
励起ベクトル選択部、238…有声音用励起ベクトル、
239…伝送送付号作成部、300…送信機、301…
音声入力装置、302…A/D変換部、303…音声符
号化部、331…長期予測部、332…符号化方法選択
部、304…無線部、305…送信アンテナ、306…
送信電波、401…受信電波、402…受信アンテナ、
403…無線部、404…音声復号部、441…長期予
測情報復号部、442…復号方法選択部、405…D/
A変換部、406…音声出力装置。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 中川 哲也 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 ▲高▼島 卓 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】入力音声信号をあらかじめ定めた時間長に
    分割した音声フレームに対して、合成フィルタの係数を
    決定する手段と、過去の符号化結果と長期予測情報に基
    づいた、前記合成フィルタ通過後の長期予測ベクトルの
    候補と、前記音声フレームとの誤差を算出する手段と、
    前記誤差に応じ適当な長期予測情報の候補を選択する手
    段と、前記合成フィルタ通過後の予めテーブルに格納さ
    れた励起ベクトルの複数の候補と、前記音声フレームと
    の誤差を算出する手段と、前記誤差に応じ適当な励起ベ
    クトルの候補を選択する手段と、前記誤差を最小とする
    よう前記励起ベクトルの候補に掛け合わされる利得を算
    出する手段を備える音声符号化方法において、 前記長期予測情報の一つとして長期予測ラグを用い、前
    記長期予測において、現音声フレームで選択された長期
    予測ラグと、現音声フレームより以前の音声フレームで
    選択された長期予測ラグとの連続性の度合いに従い、複
    数の符号化方法の中から、現フレームの符号化方法を選
    択することを特徴とする音声符号化方法。
  2. 【請求項2】前記長期予測において、長期予測ラグの量
    子化に、現音声フレームの長期予測ラグと、直前音声フ
    レームの長期予測ラグとの差分を量子化する方法を用
    い、前記長期予測ラグの差分は、複数の異なる量子化ス
    テップあるいは異なる量子化範囲を有する符号帳を用い
    て量子化され、前記長期予測において選択された量子化
    ステップあるいは量子化範囲により前記長期予測ラグの
    連続性の度合いを求めることを特徴とする請求項1に記
    載の音声符号化方法。
  3. 【請求項3】前記長期予測において、前記長期予測情報
    の一つとして長期予測フィルタを用い、前記長期予測フ
    ィルタとして異なるフィルタ形状と複数のフィルタ係数
    の量子化方法を持ち、前記長期予測フィルタの形状と係
    数の量子化は前記長期予測ラグの量子化後に行い、前記
    長期予測フィルタの形状と係数の量子化方法の選択を前
    記長期予測ラグの差分として選択された量子化ステップ
    の種類に従って行うことを特徴とする請求項1、2に記
    載の音声符号化方法。
  4. 【請求項4】入力音声信号をあらかじめ定めた時間長に
    分割した音声フレームに対して、合成フィルタの係数を
    決定する手段と、過去の符号化結果と長期予測情報に基
    づいた、前記合成フィルタ通過後の長期予測ベクトルの
    候補と、前記音声フレームとの誤差を算出する手段と、
    前記誤差に応じ適当な長期予測情報の候補を選択する手
    段と、前記合成フィルタ通過後の予めテーブルに格納さ
    れた励起ベクトルの複数の候補と、前記音声フレームと
    の誤差を算出する手段と、前記誤差に応じ適当な励起ベ
    クトルの候補を選択する手段と、前記誤差を最小とする
    よう前記励起ベクトルの候補に掛け合わされる利得を算
    出する手段を備える音声符号化方法において、 前記長期予測において、前記長期予測情報の候補を複数
    選択し、前記長期予測情報の候補に対する合成フィルタ
    通過後の長期予測ベクトルと、前記入力音声との長期予
    測誤差を計算し、前記長期予測誤差のうち最小の長期予
    測誤差とそれぞれの候補に対する長期予測誤差の差を予
    め定めた条件と比較し、前記条件を満たさない候補は前
    記長期予測の候補から除外することを特徴とする音声符
    号化方法。
  5. 【請求項5】前記長期予測において、前記長期予測情報
    の候補に対する合成フィルタ通過後の長期予測ベクトル
    と、前記入力音声との長期予測誤差を予め定められた条
    件と比較し、全ての候補が前記条件を満たさない場合に
    は、前記長期予測ベクトルを前記音声フレームの符号化
    処理には用いないことを特徴とする請求項4に記載の音
    声符号化方法。
  6. 【請求項6】入力音声信号をあらかじめ定めた時間長に
    分割した音声フレームに対して、合成フィルタの係数を
    決定する手段と、過去の符号化結果と長期予測情報に基
    づいた、前記合成フィルタ通過後の長期予測ベクトルの
    候補と、前記音声フレームとの誤差を算出する手段と、
    前記誤差に応じ適当な長期予測情報の候補を選択する手
    段と、前記合成フィルタ通過後の予めテーブルに格納さ
    れた励起ベクトルの複数の候補と、前記音声フレームと
    の誤差を算出する手段と、前記誤差に応じ適当な励起ベ
    クトルの候補を選択する手段と、前記誤差を最小とする
    よう前記励起ベクトルの候補に掛け合わされる利得を算
    出する手段を備える音声符号化方法において、 前記長期予測において、前記長期予測情報の一つとして
    前記長期予測ラグを用い、前記音声フレームの符号化処
    理の過程で前記長期予測ラグの選択を行った場合には、
    前記長期予測ベクトルを前記音声フレームの符号化に使
    用しない場合でも、前記長期予測ラグを伝送情報の中に
    含めることを特徴とする音声符号化方法。
  7. 【請求項7】入力音声信号をあらかじめ定めた時間長に
    分割した音声フレームに対して、合成フィルタの係数を
    決定する手段と、過去の符号化結果と長期予測情報に基
    づいた、前記合成フィルタ通過後の長期予測ベクトルの
    候補と、前記音声フレームとの誤差を算出する手段と、
    前記誤差に応じ適当な長期予測情報の候補を選択する手
    段と、前記合成フィルタ通過後の予めテーブルに格納さ
    れた励起ベクトルの複数の候補と、前記音声フレームと
    の誤差を算出する手段と、前記誤差に応じ適当な励起ベ
    クトルの候補を選択する手段と、前記誤差を最小とする
    よう前記励起ベクトルの候補に掛け合わされる利得を算
    出する手段を備える音声符号化方法において、 前記音声フレームの入力音声の分析による分類結果と、
    符号化処理の途中での符号化結果に基づき、複数の符号
    化方法の中から選択された前記音声フレームの符号化方
    法の識別に必要な情報を、予め定めた数の全伝送ビット
    から前記符号化方法に必要なビットを差し引いたビット
    により、伝送することを特徴とする音声符号化方法。
  8. 【請求項8】入力音声信号をあらかじめ定めた時間長に
    分割した音声フレームに対して、合成フィルタの係数決
    定部と、過去の符号化結果と長期予測情報に基づいた、
    前記合成フィルタ通過後の長期予測ベクトルの候補と、
    前記音声フレームとの誤差算出部と、前記誤差に基づく
    長期予測情報候補選択部と、前記合成フィルタ通過後の
    予めテーブルに格納された励起ベクトルの複数の候補
    と、前記音声フレームとの誤差算出部と、前記誤差に基
    づく励起ベクトル候補選択部と、前記誤差を最小とする
    よう前記励起ベクトルの候補に掛け合わされる利得算出
    部を具備する音声符号化装置において、 前記長期予測情報の一つとして長期予測ラグを用い、前
    記長期予測において、現音声フレームで選択された長期
    予測ラグと、現音声フレームより以前の音声フレームで
    選択された長期予測ラグとの連続性の度合いに従い、複
    数の符号化方法の中から、現フレームの符号化方法を選
    択する符号化方法選択部を具備することを特徴とする音
    声符号化装置。
  9. 【請求項9】入力音声信号をあらかじめ定めた時間長に
    分割した音声フレームに対して、合成フィルタの係数決
    定部と、過去の符号化結果と長期予測情報に基づいた、
    前記合成フィルタ通過後の長期予測ベクトルの候補と、
    前記音声フレームとの誤差算出部と、前記誤差に基づく
    長期予測情報候補選択部と、前記合成フィルタ通過後の
    予めテーブルに格納された励起ベクトルの複数の候補
    と、前記音声フレームとの誤差算出部と、前記誤差に基
    づく励起ベクトル候補選択部と、前記誤差を最小とする
    よう前記励起ベクトルの候補に掛け合わされる利得算出
    部を具備する音声符号化装置において、 前記長期予測情報候補選択部は、前記長期予測情報の候
    補を複数選択し、前記長期予測情報の候補に対する合成
    フィルタ通過後の長期予測ベクトルと、前記入力音声と
    の長期予測誤差を計算し、前記長期予測誤差のうち最小
    の長期予測誤差とそれぞれの候補に対する長期予測誤差
    の差を予め定めた条件と比較し、前記条件を満たさない
    候補は前記長期予測の候補から除外することを特徴とす
    る音声符号化装置。
  10. 【請求項10】入力音声信号をあらかじめ定めた時間長
    に分割した音声フレームに対して、合成フィルタの係数
    決定部と、過去の符号化結果と長期予測情報に基づい
    た、前記合成フィルタ通過後の長期予測ベクトルの候補
    と、前記音声フレームとの誤差算出部と、前記誤差に基
    づく長期予測情報候補選択部と、前記合成フィルタ通過
    後の予めテーブルに格納された励起ベクトルの複数の候
    補と、前記音声フレームとの誤差算出部と、前記誤差に
    基づく励起ベクトル候補選択部と、前記誤差を最小とす
    るよう前記励起ベクトルの候補に掛け合わされる利得算
    出部を具備する音声符号化装置において、 前記長期予測情報選択部において、前記長期予測情報の
    一つとして前記長期予測ラグを用い、前記音声フレーム
    の符号化処理の過程で前記長期予測ラグの選択を行った
    場合には、前記長期予測ベクトルを前記音声フレームの
    符号化に使用しない場合でも、前記長期予測ラグを伝送
    情報の中に含めることを特徴とする音声符号化装置。
  11. 【請求項11】入力音声信号をあらかじめ定めた時間長
    に分割した音声フレームに対して、合成フィルタの係数
    決定部と、過去の符号化結果と長期予測情報に基づい
    た、前記合成フィルタ通過後の長期予測ベクトルの候補
    と、前記音声フレームとの誤差算出部と、前記誤差に基
    づく長期予測情報候補選択部と、前記合成フィルタ通過
    後の予めテーブルに格納された励起ベクトルの複数の候
    補と、前記音声フレームとの誤差算出部と、前記誤差に
    基づく励起ベクトル候補選択部と、前記誤差を最小とす
    るよう前記励起ベクトルの候補に掛け合わされる利得算
    出部を具備する音声符号化装置において、 前記音声フレームの入力音声の分析による分類結果と、
    符号化処理の途中での符号化結果に基づき、複数の符号
    化方法の中から選択された前期音声フレームの符号化方
    法の識別に必要な情報を、予め定めた数の全伝送ビット
    から前記符号化方法に必要なビットを差し引いたビット
    により表すような伝送符号を作成する伝送符号作成部を
    具備することを特徴とする音声符号化装置。
JP6029284A 1994-02-28 1994-02-28 音声符号化方法およびこの方法を用いた音声符号化装置 Pending JPH07239699A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6029284A JPH07239699A (ja) 1994-02-28 1994-02-28 音声符号化方法およびこの方法を用いた音声符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6029284A JPH07239699A (ja) 1994-02-28 1994-02-28 音声符号化方法およびこの方法を用いた音声符号化装置

Publications (1)

Publication Number Publication Date
JPH07239699A true JPH07239699A (ja) 1995-09-12

Family

ID=12271961

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6029284A Pending JPH07239699A (ja) 1994-02-28 1994-02-28 音声符号化方法およびこの方法を用いた音声符号化装置

Country Status (1)

Country Link
JP (1) JPH07239699A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001003115A1 (fr) * 1999-06-30 2001-01-11 Matsushita Electric Industrial Co., Ltd. Decodeur audio et procede de compensation d'erreur de codage
JP2013232013A (ja) * 2008-12-31 2013-11-14 Huawei Technologies Co Ltd 信号を符号化する方法および信号を復号する方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001003115A1 (fr) * 1999-06-30 2001-01-11 Matsushita Electric Industrial Co., Ltd. Decodeur audio et procede de compensation d'erreur de codage
US7171354B1 (en) 1999-06-30 2007-01-30 Matsushita Electric Industrial Co., Ltd. Audio decoder and coding error compensating method
US7499853B2 (en) 1999-06-30 2009-03-03 Panasonic Corporation Speech decoder and code error compensation method
JP2013232013A (ja) * 2008-12-31 2013-11-14 Huawei Technologies Co Ltd 信号を符号化する方法および信号を復号する方法
US8712763B2 (en) 2008-12-31 2014-04-29 Huawei Technologies Co., Ltd Method for encoding signal, and method for decoding signal

Similar Documents

Publication Publication Date Title
US6202046B1 (en) Background noise/speech classification method
EP1276832B1 (en) Frame erasure compensation method in a variable rate speech coder
US7289953B2 (en) Apparatus and method for speech coding
EP0718822A2 (en) A low rate multi-mode CELP CODEC that uses backward prediction
US6330532B1 (en) Method and apparatus for maintaining a target bit rate in a speech coder
JPH10187197A (ja) 音声符号化方法及び該方法を実施する装置
EP1212749B1 (en) Method and apparatus for interleaving line spectral information quantization methods in a speech coder
US7016832B2 (en) Voiced/unvoiced information estimation system and method therefor
EP1617416B1 (en) Method and apparatus for subsampling phase spectrum information
KR100756570B1 (ko) 음성 코더의 프레임 프로토타입들 사이의 선형 위상시프트들을 계산하기 위해 주파수 대역들을 식별하는 방법및 장치
Vaseghi Finite state CELP for variable rate speech coding
JPH07239699A (ja) 音声符号化方法およびこの方法を用いた音声符号化装置
JPH0519795A (ja) 音声の励振信号符号化・復号化方法
JPH0519796A (ja) 音声の励振信号符号化・復号化方法
JPH09152897A (ja) 音声符号化装置および音声符号化方法
JPH0844398A (ja) 音声符号化装置
Oshikiri et al. A 2.4‐kbps variable‐bit‐rate ADP‐CELP speech coder
CA2514249C (en) A speech coding system using a dispersed-pulse codebook
JP3270146B2 (ja) 音声符号化装置
JPH05273999A (ja) 音声符号化方法
KR100389898B1 (ko) 음성부호화에 있어서 선스펙트럼쌍 계수의 양자화 방법
JPH05289698A (ja) 音声符号化法