JP3231807B2 - 音声符号器 - Google Patents
音声符号器Info
- Publication number
- JP3231807B2 JP3231807B2 JP16228891A JP16228891A JP3231807B2 JP 3231807 B2 JP3231807 B2 JP 3231807B2 JP 16228891 A JP16228891 A JP 16228891A JP 16228891 A JP16228891 A JP 16228891A JP 3231807 B2 JP3231807 B2 JP 3231807B2
- Authority
- JP
- Japan
- Prior art keywords
- spectral
- frame
- speech
- residual energy
- spectral parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
らに詳しくは、音声波形とともに用いる信号符号化に関
する。
することによりスペクトル効率を改善させることは一般
化している。このような処理において重要な問題は、信
号帯域を狭くし、しかも許容できる音声品質を維持する
ことである。送信または保存に必要な音声信号情報量を
低減するため、ビット・レートの低いエンコーダが利用
されている。特に、線形予測(linear prediction:以
下「LPC」という。)エンコーダが多くの低ビット・
レート音声符号化の用途で利用されている。
は、音声サンプルは15msないし30msのフレーム
にまとめられる。各フレームは、さらにN個のサブフレ
ームに分割され、ここでN>1である。音声サンプルの
フレームは、符号によりパラメータ化される。一般に、
音声スペクトル情報は、フレーム・レートで符号化され
送信されるが、他の音声情報は各サブフレーム毎に符号
化し送信することができる。音声品質は、補間を用い
て、フレーム・レートではなくサブフレーム・レートで
スペクトル・パラメータを更新することにより改善でき
ることが知られている。概して、この処理により、より
滑らかな響きの再生音声が得られるが、音声スペクトル
が急激に変化するところで、音声領域のスペクトルを悪
化させるという欠点がある。従って、改善された音声符
号器が必要となる。
提供することである。故に、スペクトル・パラメータの
ソフト補間判定を用いる改善された音声符号器が提供さ
れる。
声サンプルのフレームに対応するスペクトル ・ パラメー
タを送信する音声符号器(115)が提供される。この
音声符号器は、(a)送信された少なくとも2つのスペ
クトル ・ パラメータの間で補間を利用してスペクトル ・ パ
ラメータの第1組を生成し(301)、(b)現在のフ
レームのスペクトル ・ パラメータを利用して補間を行わ
ずにスペクトル ・ パラメータの第2組を生成し(31
1)、(c)スペクトル ・ パラメータの第1組または第
2組の一方を選択し、いずれの組を選択したかを示す情
報(第1図:i)を送信し、その選択された組のスペク
トル・パラメータを、送信されるスペクトル・パラメー
タのフレーム・レートより頻繁に更新し、入力音声サン
プルのフレームを表現する。2組のうちいずれを選択す
るかについての基準は、現在のフレーム・サンプルをど
ちらがよりよく表しているかに基づいて定められる。
パラメータ・ベクトルの各セットに相当するフレーム残
留エネルギを計算し、ついで残留エネルギの低いセット
を選択することである。
方法は、スペクトル・パラメータがLPC係数を表す場
合、対応するオール・ゼロLPCフィルタにより各サブ
フレームのサンプルをろ波することである。その結果得
られた残留シーケンスにおけるエネルギは、前フレーム
の残留サンプルの2乗した値を加算することによって計
算される。フレームの残留エネルギを計算するその他の
方法もあることを理解されたい。
トルのセットの方が残留エネルギが低いとエンコーダが
判定した場合、遠端のデコーダに対して、現在のフレー
ムでスペクトル・パラメータを補間するよう指示する。
タ・ベクトルのセットの方が残留エネルギが低いとエン
コーダが判定した場合、遠端のデコーダに対して、現在
のフレームで非補間スペクトル・パラメータを利用する
よう指示する。
タを利用すべきか(補間値か、または非補間値か)を、
従来の方法、例えば、特殊信号ビットを符号化し送出す
る方法によって遠端部に知らせる。
メータのソフト補間判定を用いる音声エンコーダの第1
実施例100を示すブロック図である。
A/D変換器105に入力され、このA/D変換器10
5が生成したデジタル・サンプル107をエンコーダ1
15に与える。エンコーダ115は、デジタル・サンプ
ルを入力音声フレームに分割する。次に、各入力音声フ
レームは、構成要素109として表される1組のデジタ
ル・フレーム・コードに変換される。次に、エンコーダ
は、この1組のフレーム・コード109をビット・レー
トの低いチャンネル101を介してレシーバ117に送
出する。このエンコーダ115は、例えば、LPC型の
ものでもよい。
09は、その後デコーダ117によって受信され、この
デコーダ117はこれをデジタル・サンプル119に変
換する。次に、デジタル・サンプル119は、D/A変
換器121に入力され、このD/A変換器121はこの
デジタル・サンプルをアナログ音声信号123に最終的
に変換する。デコーダ117は、例えば、LPC型のも
のでもよい。
は、A C として表される現在のフレームに対応するスペ
クトル・パラメータ、およびA L として表される直前の
フレームに対応するスペクトル・パラメータに対して常
にアクセスすることが出来ることを理解されたい。スペ
クトル・パラメータの更新レートはN回/フレームであ
ると仮定され、ここでN>1であり、Nはフレームあた
りのサブフレームの個数である。
きN個のスペクトル・パラメータ・ベクトルのセットを
判定するため、エンコーダ115は2組N個のスペクト
ル・パラメータ・ベクトルを生成する。第1組A I は、
現在のフレームのスペクトル・パラメータ・ベクトルA
C と直前のフレームのスペクトル・パラメータ・ベクト
ルA L とを用いてスペクトル・パラメータを補間するこ
とにより生成される。第2組A 0 は、非補間スペクトル
・パラメータを用いるが、ここでA C またはA L のいずれ
か一方が所定のサブフレームで利用される。
に分解される。入力音声サンプルのN個のサブフレーム
は、フィルタにより反転ろ波されるが、ここでこのフィ
ルタの係数は、A I 中の補間スペクトル・パラメータ・
ベクトルに相当するサブフレーム・レートで更新され
る。次に、入力音声サンプルのN個のサブフレームは、
同様に反転ろ波されるが、ただし今回はN個のスペクト
ル・パラメータ・ベクトルのセットが選ばれ、用いられ
る。
ト補間ビットが、スペクトル・パラメータ符号と共に、
チャンネル101を介して送信される。このビットは、
デコーダ117に対して、現在のフレームで用いるのは
補間スペクトル・パラメータ・セットか非補間スペクト
ル・パラメータ・セットのいずれかを指示するために用
いられる。
ートである。所定のフレームにおいて、この処理はステ
ップ201からスタートし、ついで現在のフレーム・サ
ンプルを取り出し(ステップ203)、現在のスペクト
ル・パラメータ・ベクトルAC を取り出し(ステップ2
05)、そして直前のスペクトル・パラメータ・ベクト
ルAL を取り出す(ステップ207)。
209および219へは、直列的または並列的に進むこ
とができる。ここでは、並列的に進むものとして表され
ているが、これは、他の要素が全て同等であれば、並列
的に進むことによって時間遅延を最小限に抑える傾向に
あるためである。
メータに対応する残留エネルギを計算する。この計算
は、従来のアルゴリズムを用いて実行することができ
る。1つの適切なアルゴリズムを図3に示す。ステップ
209を実行することにより得られた値は、記号Eiと
して表される。
シーケンスを計算する1つの方法は、AI からの対応す
るスペクトル・ベクトルに基づくフィルタにより、N個
のサブフレーム・サンプルをろ波し、ステップ305に
おいて、フレーム全体にわたって、生成された残留シー
ケンス・サンプルの2乗を加算することである。
ラメータの残留エネルギを計算する。この計算は、従来
のアルゴリズムを用いて実行できる。1つの適切なアル
ゴリズムを図4に示す。生成された値は記号Eoとして
表される。次に処理はステップ213に進む。ここで、
Ei>Eoであるかどうかを判定する。
定は「YES」となる。その結果記号iで表される特殊
信号ビットが論理ゼロに設定される(ステップ21
5)。ステップ216において、A 0 がA E にコピーさ
れ、これが現在のフレームを分析するために用いられる
N個のスペクトル・パラメータ・ベクトルのセットとな
る。次に処理はステップ221に進み、ここで、指示ビ
ットiがデコーダ117に送出され、現在のフレームで
非補間スペクトル・パラメータ・ベクトルを用いるよう
指示する。
3の判定は「NO」となる。その結果、指示ビットiは
論理的1に設定される(ステップ217)。ステップ2
18において、A I がA E にコピーされ、これが現在のフ
レームを分析するために用いられるN個のスペクトル・
パラメータ・ベクトルのセットとなる。次にステップ2
21に進み、ここで指示ビットiがデコーダ117に送
出され、現在のフレームで補間スペクトル・パラメータ
を用いるよう指示する。そして処理は戻る(ステップ2
23)。
iを計算する(ステップ209)のに適したアルゴリズ
ムを示すフローチャートである。この場合において、現
在のフレーム・サンプルのスペクトル・パラメータ・ベ
クトルACおよび直前のスペクトル・パラメータ・ベク
トルALは、ステップ203,205,207で得られ
たものである。
て補間スペクトル・パラメータのセットを生成する。 AI(i,n)=AL(i)+n/N[AC(i)−AL(i)] i=1,NP n=1,N ただし、 AI=N個の補間スペクトル・パラメータ・ベクトルのセット; AL=直前のフレームのスペクトル・パラメータ・ベクトル; AC=現在のフレームのスペクトル・パラメータ・ベクトル; NP=スペクトル・パラメータ・ベクトルのディメンジョン;および N=フレーム当たりのサブフレームの個数 である。次に、ステップ303に進み、ここではAIに
基づき現在のフレーム・サンプルに対応する残留サンプ
ルを生成する。具体的には、フレーム残留サンプルを計
算する1つの方法は、AIからの対応するスペクトル・
ベクトルに基づくフィルタにより各N個のサブフレーム
・サンプルをろ波することである。次にステップ305
に進み、ここで残留エネルギは、フレーム全体にわたっ
て、残留サンプルの2乗を加算することによって計算さ
れる。ただし、残留エネルギを計算する他の方法もある
ことを理解されたい。そして、処理は図2で説明したス
テップ213に続く。
E0を計算する(ステップ219)のに適したアルゴリ
ズムを示すフローチャートである。この場合において、
現在のフレーム・サンプル,現在のスペクトル・パラメ
ータ・ベクトルACおよび直前のスペクトル・パラメー
タ・ベクトルALは、ステップ203,205および2
07で得られたものである。
て非補間スペクトル・パラメータのセットを生成する。 A0(i,n)=AL(i),n<N/2の場合 i=1,NP A0(i,n)=AL(i),n≧N/2の場合 i=1,NP n=1,N ただし、 A0=N個の補間スペクトル・パラメータ・ベクトルのセット; AL=直前のフレームのスペクトル・パラメータ・ベクトル; AC=現在のフレームのスペクトル・パラメータ・ベクトル; NP=スペクトル・パラメータ・ベクトルのディメンジョン;および N=フレーム当たりのサブフレームの個数 である。次に、ステップ313に進み、ここではステッ
プ303と同様に、A0に基づいて、現在のフレーム・
サンプルに対応する残留シーケンスを生成する。次に、
ステップ315に進み、ここでは、ステップ305と同
様に、残留エネルギE0を計算する。ただし、残留エネ
ルギを計算する他の方法もあることを理解されたい。そ
して、処理は図2で説明したステップ213に続く。
タのソフト補間判定を用いる音声エンコーダの1つの長
所は、補間することの利点を維持しながら、しかもスペ
クトル遷移をより正確に表すことができることである。
その結果、特にスペクトル・パラメータが頻繁に送信さ
れない場合には、より高品位な再生音声が得られる。
のソフト補間判定を用いる音声エンコーダのさまざまな
実施例を説明してきたが、本発明の範囲は添付のクレー
ムにより定義されるものとする。
フト補間判定を用いる音声エンコーダおよびデコーダの
第1実施例を示すブロック図である。
Claims (5)
- 【請求項1】 入力音声サンプルのフレームに対応する
スペクトル・パラメータを送信する音声符号器(11
5)であって、当該音声符号器は: (a)送信された少なくとも2つのスペクトル・パラメ
ータの間で補間を利用してスペクトル・パラメータの第
1組を生成し(301); (b)現在のフレームのスペクトル・パラメータを利用
して補間を行わずにスペクトル・パラメータの第2組を
生成し(311); (c)スペクトル・パラメータの前記第1組または第2
組の一方を選択し、いずれの組を選択したかを示す情報
(第1図:i)を送信し、その選択された組のスペクト
ル・パラメータを、送信されるスペクトル・パラメータ
のフレーム・レートより頻繁に更新し、入力音声サンプ
ルのフレームを表現することを特徴とする音声符号器。 - 【請求項2】 前記音声符号器が、スペクトル・パラメ
ータの前記第1組に基づいて残留エネルギを計算し(2
09)、スペクトル・パラメータの前記第2組に基づい
て残留エネルギを計算することを更なる特徴とする請求
項1記載の音声符号器。 - 【請求項3】 スペクトル・パラメータの前記第1組ま
たは第2組の内最少の残留エネルギを与えるものが選択
されることを特徴とする請求項2記載の音声符号器。 - 【請求項4】 前記音声符号器が線形予測符号(LP
C)型アルゴリズムを使用することを特徴とする請求項
3記載の音声符号器。 - 【請求項5】 入力音声サンプルのフレームに対応する
スペクトル・パラメータを送信する音声符号器(11
5)であって、当該音声符号器は: (a)現在のフレームの送信されたスペクトル・パラメ
ータ・ベクトルに基づいて、N個のスペクトル・パラメー
タ・ベクトルを少なくとも2組生成し(301,31
1); (b)N個のスペクトル・パラメータ・ベクトルの各組に
ついて、現在のフレーム・サンプルに対する残留エネル
ギを計算し(209,219); (c)最少の残留エネルギを与えるN個のスペクトル・
パラメータ・ベクトルの組を選択し、その選択された組
のN個のスペクトル・パラメータ・ベクトルを、送信さ
れるスペクトル・パラメータのフレーム・レートよりN
倍頻繁に更新することを特徴とする音声符号器。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US53482090A | 1990-06-07 | 1990-06-07 | |
US534820 | 1990-06-07 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04232999A JPH04232999A (ja) | 1992-08-21 |
JP3231807B2 true JP3231807B2 (ja) | 2001-11-26 |
Family
ID=24131661
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP16228891A Expired - Lifetime JP3231807B2 (ja) | 1990-06-07 | 1991-06-07 | 音声符号器 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3231807B2 (ja) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62102300A (ja) * | 1985-10-30 | 1987-05-12 | 日本電気株式会社 | 音声合成器 |
JPH0291697A (ja) * | 1988-09-28 | 1990-03-30 | Nec Corp | 音声符号化復号化方式とその装置 |
-
1991
- 1991-06-07 JP JP16228891A patent/JP3231807B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH04232999A (ja) | 1992-08-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2746033B2 (ja) | 音声復号化装置 | |
US6704702B2 (en) | Speech encoding method, apparatus and program | |
JPH0430200A (ja) | 音声復号化方法 | |
JPH0481374B2 (ja) | ||
JPH01155400A (ja) | 音声符号化方式 | |
JP2007504503A (ja) | 低ビットレートオーディオ符号化 | |
JP2616549B2 (ja) | 音声復号装置 | |
JPH07129195A (ja) | 音声復号化装置 | |
US5265219A (en) | Speech encoder using a soft interpolation decision for spectral parameters | |
JP3231807B2 (ja) | 音声符号器 | |
JP2658816B2 (ja) | 音声のピッチ符号化装置 | |
JP3219467B2 (ja) | 音声復号化方法 | |
JPH0954600A (ja) | 音声符号化通信装置 | |
JP3095340B2 (ja) | 音声復号化装置 | |
JP3071388B2 (ja) | 可変レート音声符号化方式 | |
JPH021661A (ja) | パケット補間方式 | |
JP3249144B2 (ja) | 音声符号化装置 | |
JP3662597B2 (ja) | 一般化された合成による分析音声符号化方法と装置 | |
EP1688918A1 (en) | Speech decoding | |
JP3089967B2 (ja) | 音声符号化装置 | |
JP2001142499A (ja) | 音声符号化装置ならびに音声復号化装置 | |
JP2853824B2 (ja) | 音声のパラメータ情報符号化法 | |
JP2001265390A (ja) | 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法 | |
JP2003029799A (ja) | 音声復号化方法 | |
JP3576805B2 (ja) | 音声符号化方法及びシステム並びに音声復号化方法及びシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070914 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080914 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080914 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090914 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090914 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100914 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110914 Year of fee payment: 10 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110914 Year of fee payment: 10 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110914 Year of fee payment: 10 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |