JP3231807B2 - 音声符号器 - Google Patents

音声符号器

Info

Publication number
JP3231807B2
JP3231807B2 JP16228891A JP16228891A JP3231807B2 JP 3231807 B2 JP3231807 B2 JP 3231807B2 JP 16228891 A JP16228891 A JP 16228891A JP 16228891 A JP16228891 A JP 16228891A JP 3231807 B2 JP3231807 B2 JP 3231807B2
Authority
JP
Japan
Prior art keywords
spectral
frame
speech
residual energy
spectral parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP16228891A
Other languages
English (en)
Other versions
JPH04232999A (ja
Inventor
アイラ・アラン・ガ−ソン
マ−ク・アント−ニ・ジャシュック
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Motorola Solutions Inc
Original Assignee
Motorola Solutions Inc
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Solutions Inc, Motorola Inc filed Critical Motorola Solutions Inc
Publication of JPH04232999A publication Critical patent/JPH04232999A/ja
Application granted granted Critical
Publication of JP3231807B2 publication Critical patent/JP3231807B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、信号符号化に関し、さ
らに詳しくは、音声波形とともに用いる信号符号化に関
する。
【0002】
【従来の技術】人間の音声信号を処理して、帯域を狭く
することによりスペクトル効率を改善させることは一般
化している。このような処理において重要な問題は、信
号帯域を狭くし、しかも許容できる音声品質を維持する
ことである。送信または保存に必要な音声信号情報量を
低減するため、ビット・レートの低いエンコーダが利用
されている。特に、線形予測(linear prediction:以
下「LPC」という。)エンコーダが多くの低ビット・
レート音声符号化用途で利用されている。
【0003】
【発明が解決しようとする課題】典型的な音声符号器で
は、音声サンプルは15msないし30msのフレーム
にまとめられる。各フレームは、さらにN個のサブフレ
ームに分割され、ここでN>1である。音声サンプルの
フレームは、符号によりパラメータ化される。一般に、
音声スペクトル情報は、フレーム・レートで符号化され
送信されるが、他の音声情報は各サブフレーム毎に符号
化し送信することができる。音声品質は、補間を用い
て、フレーム・レートではなくサブフレーム・レートで
スペクトル・パラメータを更新することにより改善でき
ることが知られている。概して、この処理により、より
滑らかな響きの再生音声が得られるが、音声スペクトル
が急激に変化するところで、音声領域のスペクトルを悪
化させるという欠点がある。従って、改善された音声符
号器が必要となる。
【0004】本発明の目的は、改善された音声符号器を
提供することである。故に、スペクトル・パラメータの
ソフト補間判定を用いる改善された音声符号器が提供さ
れる。
【0005】
【課題を解決するための手段】本発明によれば、入力音
声サンプルのフレームに対応するスペクトル パラメー
タを送信する音声符号器(115)が提供される。この
音声符号器は、(a)送信された少なくとも2つのスペ
クトル パラメータの間で補間を利用してスペクトル
ラメータの第1組を生成し(301)、(b)現在のフ
レームのスペクトル パラメータを利用して補間を行わ
ずにスペクトル パラメータの第2組を生成し(31
1)、(c)スペクトル パラメータの第1組または第
2組の一方を選択し、いずれの組を選択したかを示す情
報(第1図:i)を送信し、その選択された組のスペク
トル・パラメータを、送信されるスペクトル・パラメー
タのフレーム・レートより頻繁に更新し、入力音声サン
プルのフレームを表現する。2組のうちいずれを選択す
るかについての基準は、現在のフレーム・サンプルをど
ちらがよりよく表しているかに基づいて定められる。
【0006】つまり、この基準は、N個のスペクトル・
パラメータ・ベクトルの各セットに相当するフレーム残
留エネルギを計算し、ついで残留エネルギの低いセット
を選択することである。
【0007】フレームの残留エネルギを計算する1つの
方法は、スペクトル・パラメータがLPC係数を表す場
合、対応するオール・ゼロLPCフィルタにより各サブ
フレームのサンプルをろ波することである。その結果得
られた残留シーケンスにおけるエネルギは、前フレーム
の残留サンプルの2乗した値を加算することによって計
算される。フレームの残留エネルギを計算するその他の
方法もあること理解されたい
【0008】N個の補間スペクトル・パラメータ・ベク
トルのセットの方が残留エネルギが低いとエンコーダが
判定した場合、遠端のデコーダに対して、現在のフレー
ムでスペクトル・パラメータを補間するよう指示する。
【0009】また、N個の非補間スペクトル・パラメー
タ・ベクトルのセットの方が残留エネルギが低いとエン
コーダが判定した場合、遠端のデコーダに対して、現在
のフレームで非補間スペクトル・パラメータを利用する
よう指示する。
【0010】エンコーダは、どのスペクトル・パラメー
タを利用すべきか(補間値か、または非補間値か)を、
従来の方法、例えば、特殊信号ビットを符号化し送出す
る方法によって遠端部に知らせる。
【0011】
【実施例】図1は、本発明に従った、スペクトル・パラ
メータのソフト補間判定を用いる音声エンコーダの第1
実施例100を示すブロック図である。
【0012】図示のように、アナログ音声信号103が
A/D変換器105に入力され、このA/D変換器10
5が生成したデジタル・サンプル107をエンコーダ1
15に与える。エンコーダ115は、デジタル・サンプ
ルを入力音声フレームに分割する。次に、各入力音声フ
レームは、構成要素109として表される1組のデジタ
ル・フレーム・コードに変換される。次に、エンコーダ
は、この1組のフレーム・コード109をビット・レー
トの低いチャンネル101を介してレシーバ117に送
出する。このエンコーダ115は、例えば、LPC型の
ものでもよい。
【0013】この送出された1組のフレーム・コード1
09は、その後デコーダ117によって受信され、この
デコーダ117はこれをデジタル・サンプル119に変
換する。次に、デジタル・サンプル119は、D/A変
換器121に入力され、このD/A変換器121はこの
デジタル・サンプルをアナログ音声信号123に最終的
に変換する。デコーダ117は、例えば、LPC型のも
のでもよい。
【0014】エンコーダ115およびデコーダ117
は、 C として表される現在のフレームに対応するスペ
クトル・パラメータ、および L として表される直前の
フレームに対応するスペクトル・パラメータに対して常
にアクセスすることが出来ること理解されたい。スペ
クトル・パラメータの更新レートはN回/フレームであ
ると仮定され、ここでN>1であり、Nはフレームあた
りのサブフレームの個数である。
【0015】現在のフレームのサブフレームに用いるべ
きN個のスペクトル・パラメータ・ベクトルのセットを
判定するため、エンコーダ115は2組N個のスペクト
ル・パラメータ・ベクトルを生成する。第1組 I は、
現在のフレームのスペクトル・パラメータ・ベクトル
C と直前のフレームのスペクトル・パラメータ・ベクト
L とを用いてスペクトル・パラメータを補間するこ
とにより生成される。第2組 0 は、非補間スペクトル
・パラメータを用いるが、ここで C または L のいずれ
か一方が所定のサブフレームで利用される。
【0016】入力音声フレームは、N個のサブフレーム
に分解される。入力音声サンプルのN個のサブフレーム
は、フィルタにより反転ろ波されるが、ここでこのフィ
ルタの係数は、 I 中の補間スペクトル・パラメータ・
ベクトルに相当するサブフレーム・レートで更新され
る。次に、入力音声サンプルのN個のサブフレームは、
同様に反転ろ波されるが、ただし今回はN個のスペクト
ル・パラメータ・ベクトルのセットが選ばれ、用いられ
る。
【0017】特殊信号、例えば、記号iで表されるソフ
ト補間ビットが、スペクトル・パラメータ符号と共に、
チャンネル101を介して送信される。このビットは、
デコーダ117に対して、現在のフレームで用いるのは
補間スペクトル・パラメータ・セットか非補間スペクト
ル・パラメータ・セットのいずれかを指示するために用
いられる。
【0018】図2は、前記処理のための第1フローチャ
ートである。所定のフレームにおいて、この処理はステ
ップ201からスタートし、ついで現在のフレーム・サ
ンプルを取り出し(ステップ203)、現在のスペクト
ル・パラメータ・ベクトルAC を取り出し(ステップ2
05)、そして直前のスペクトル・パラメータ・ベクト
ルAL を取り出す(ステップ207)。
【0019】次の2つのステップ、すなわち、ステップ
209および219へは、直列的または並列的に進むこ
とができる。ここでは、並列的に進むものとして表され
ているが、これは、他の要素が全て同等であれば、並列
的に進むことによって時間遅延を最小限に抑える傾向に
あるためである。
【0020】次に、ステップ209において、補間パラ
メータに対応する残留エネルギを計算する。この計算
は、従来のアルゴリズムを用いて実行することができ
る。1つの適切なアルゴリズムを図3に示す。ステップ
209を実行することにより得られた値は、記号Eiと
して表される。
【0021】具体的には、ステップ303において残留
シーケンスを計算する1つの方法は、AI からの対応す
るスペクトル・ベクトルに基づくフィルタにより、N個
のサブフレーム・サンプルをろ波し、ステップ305に
おいて、フレーム全体にわたって、生成された残留シー
ケンス・サンプルの2乗を加算することである。
【0022】また、ステップ219において、非補間パ
ラメータの残留エネルギを計算する。この計算は、従来
のアルゴリズムを用いて実行できる。1つの適切なアル
ゴリズムを図4に示す。生成された値は記号Eoとして
表される。次に処理はステップ213に進む。ここで、
Ei>Eoであるかどうかを判定する。
【0023】Ei>E0の場合、このステップ213の判
定は「YES」となる。その結果記号iで表される特殊
信号ビットが論理ゼロに設定される(ステップ21
5)。ステップ216において、 0 E にコピーさ
れ、これが現在のフレームを分析するために用いられる
N個のスペクトル・パラメータ・ベクトルのセットとな
る。次に処理はステップ221に進み、ここで、指示ビ
ットiがデコーダ117に送出され、現在のフレームで
非補間スペクトル・パラメータ・ベクトルを用いるよう
指示する。
【0024】それ以外のEi≦E0の場合、ステップ21
3の判定は「NO」となる。その結果、指示ビットiは
論理的1に設定される(ステップ217)。ステップ2
18において、 I E にコピーされ、これが現在のフ
レームを分析するために用いられるN個のスペクトル・
パラメータ・ベクトルのセットとなる。次にステップ2
21に進み、ここで指示ビットiがデコーダ117に送
出され、現在のフレームで補間スペクトル・パラメータ
を用いるよう指示する。そして処理は戻る(ステップ2
23)。
【0025】図3は、補間パラメータの残留エネルギE
iを計算する(ステップ209)のに適したアルゴリズ
ムを示すフローチャートである。この場合において、
在のフレーム・サンプルのスペクトル・パラメータ・ベ
クトルACおよび直前のスペクトル・パラメータ・ベク
トルALは、ステップ203,205,207で得られ
たものである。
【0026】図3のステップ301では、次のようにし
補間スペクトル・パラメータのセットを生成する。 AI(i,n)=AL(i)+n/N[AC(i)−AL(i)] i=1,NP n=1,N ただし、 AI=N個の補間スペクトル・パラメータ・ベクトルのセット; AL=直前のフレームのスペクトル・パラメータ・ベクトル; AC=現在のフレームのスペクトル・パラメータ・ベクトル; NP=スペクトル・パラメータ・ベクトルのディメンジョン;および N=フレーム当たりのサブフレームの個数 である。次に、ステップ303に進み、ここではAIに
基づき現在のフレーム・サンプルに対応する残留サンプ
ルを生成する。具体的には、フレーム残留サンプルを計
算する1つの方法は、AIからの対応するスペクトル・
ベクトルに基づくフィルタにより各N個のサブフレーム
・サンプルをろ波することである。次にステップ305
に進み、ここで残留エネルギは、フレーム全体にわたっ
て、残留サンプルの2乗を加算することによって計算さ
れる。ただし、残留エネルギを計算する他の方法もある
ことを理解されたい。そして、処理は図2で説明したス
テップ213に続く。
【0027】図4は、非補間パラメータの残留エネルギ
E0を計算する(ステップ219)のに適したアルゴリ
ズムを示すフローチャートである。この場合において、
現在のフレーム・サンプル,現在のスペクトル・パラメ
ータ・ベクトルACおよび直前のスペクトル・パラメー
タ・ベクトルALは、ステップ203,205および2
07で得られたものである。
【0028】図4のステップ311では、次のようにし
非補間スペクトル・パラメータのセットを生成する。 A0(i,n)=AL(i),n<N/2の場合 i=1,NP A0(i,n)=AL(i),n≧N/2の場合 i=1,NP n=1,N ただし、 A0=N個の補間スペクトル・パラメータ・ベクトルのセット; AL=直前のフレームのスペクトル・パラメータ・ベクトル; AC=現在のフレームのスペクトル・パラメータ・ベクトル; NP=スペクトル・パラメータ・ベクトルのディメンジョン;および N=フレーム当たりのサブフレームの個数 である。次に、ステップ313に進み、ここではステッ
プ303と同様に、A0に基づいて、現在のフレーム・
サンプルに対応する残留シーケンスを生成する。次に、
ステップ315に進み、ここでは、ステップ305と同
様に、残留エネルギE0を計算する。ただし、残留エネ
ルギを計算する他の方法もあることを理解されたい。そ
して、処理は図2で説明したステップ213に続く。
【0029】
【発明の効果】本発明に従った、スペクトル・パラメー
タのソフト補間判定を用いる音声エンコーダの1つの長
所は、補間することの利点を維持しながら、しかもスペ
クトル遷移をより正確に表すことができることである。
その結果、特にスペクトル・パラメータが頻繁に送信さ
れない場合には、より高品位な再生音声が得られる。
【0030】本発明に従った、スペクトル・パラメータ
のソフト補間判定を用いる音声エンコーダのさまざまな
実施例を説明してきたが、本発明の範囲は添付のクレー
ムにより定義されるものとする。
【図面の簡単な説明】
【図1】本発明に従った、スペクトル・パラメータのソ
フト補間判定を用いる音声エンコーダおよびデコーダの
第1実施例を示すブロック図である。
【図2】第1実施例の第1フローチャートである。
【図3】第1実施例の別のフローチャートである。
【図4】第1実施例の別のフローチャートである。
【符号の説明】
101 低ビット・レート・チャンネル 103 アナログ音声信号 105 A/D変換器 107 デジタル・サンプル 109 フレーム・コード 115 エンコーダ 117 デコーダ 119 デジタル・サンプル 121 D/A変換器 123 アナログ音声信号
───────────────────────────────────────────────────── フロントページの続き (72)発明者 マ−ク・アント−ニ・ジャシュック アメリカ合衆国イリノイ州シカゴ、ノ− ス・ヒアワーサ6611 (56)参考文献 特開 昭62−102300(JP,A) 特開 平2−91697(JP,A) 特開 平2−153399(JP,A) 特開 昭60−262200(JP,A) 特開 昭57−80000(JP,A) 特開 昭62−9400(JP,A) 特開 昭63−127299(JP,A)

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力音声サンプルのフレームに対応する
    スペクトル・パラメータを送信する音声符号器(11
    5)であって、当該音声符号器は: (a)送信された少なくとも2つのスペクトル・パラメ
    ータの間で補間を利用してスペクトル・パラメータの第
    1組を生成し(301); (b)現在のフレームのスペクトル・パラメータを利用
    して補間を行わずにスペクトル・パラメータの第2組を
    生成し(311); (c)スペクトル・パラメータの前記第1組または第2
    組の一方を選択し、いずれの組を選択したかを示す情報
    (第1図:i)を送信し、その選択された組のスペクト
    ル・パラメータを、送信されるスペクトル・パラメータ
    のフレーム・レートより頻繁に更新し、入力音声サンプ
    ルのフレームを表現することを特徴とする音声符号器。
  2. 【請求項2】 前記音声符号器が、スペクトル・パラメ
    ータの前記第1組に基づいて残留エネルギを計算し(2
    09)、スペクトル・パラメータの前記第2組に基づい
    て残留エネルギを計算することを更なる特徴とする請求
    項1記載の音声符号器。
  3. 【請求項3】 スペクトル・パラメータの前記第1組ま
    たは第2組の内最少の残留エネルギを与えるものが選択
    されることを特徴とする請求項2記載の音声符号器。
  4. 【請求項4】 前記音声符号器が線形予測符号(LP
    C)型アルゴリズムを使用することを特徴とする請求項
    3記載の音声符号器。
  5. 【請求項5】 入力音声サンプルのフレームに対応する
    スペクトル・パラメータを送信する音声符号器(11
    5)であって、当該音声符号器は: (a)現在のフレームの送信されたスペクトル・パラメ
    ータ・ベクトルに基づいて、N個のスペクトル・パラメー
    タ・ベクトルを少なくとも2組生成し(301,31
    1); (b)N個のスペクトル・パラメータ・ベクトルの各組に
    ついて、現在のフレーム・サンプルに対する残留エネル
    ギを計算し(209,219); (c)最少の残留エネルギを与えるN個のスペクトル・
    パラメータ・ベクトルの組を選択し、その選択された組
    のN個のスペクトル・パラメータ・ベクトルを、送信さ
    れるスペクトル・パラメータのフレーム・レートよりN
    倍頻繁に更新することを特徴とする音声符号器。
JP16228891A 1990-06-07 1991-06-07 音声符号器 Expired - Lifetime JP3231807B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US53482090A 1990-06-07 1990-06-07
US534820 1990-06-07

Publications (2)

Publication Number Publication Date
JPH04232999A JPH04232999A (ja) 1992-08-21
JP3231807B2 true JP3231807B2 (ja) 2001-11-26

Family

ID=24131661

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16228891A Expired - Lifetime JP3231807B2 (ja) 1990-06-07 1991-06-07 音声符号器

Country Status (1)

Country Link
JP (1) JP3231807B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62102300A (ja) * 1985-10-30 1987-05-12 日本電気株式会社 音声合成器
JPH0291697A (ja) * 1988-09-28 1990-03-30 Nec Corp 音声符号化復号化方式とその装置

Also Published As

Publication number Publication date
JPH04232999A (ja) 1992-08-21

Similar Documents

Publication Publication Date Title
JP2746033B2 (ja) 音声復号化装置
US6704702B2 (en) Speech encoding method, apparatus and program
JPH0430200A (ja) 音声復号化方法
JPH0481374B2 (ja)
JPH01155400A (ja) 音声符号化方式
JP2007504503A (ja) 低ビットレートオーディオ符号化
JP2616549B2 (ja) 音声復号装置
JPH07129195A (ja) 音声復号化装置
US5265219A (en) Speech encoder using a soft interpolation decision for spectral parameters
JP3231807B2 (ja) 音声符号器
JP2658816B2 (ja) 音声のピッチ符号化装置
JP3219467B2 (ja) 音声復号化方法
JPH0954600A (ja) 音声符号化通信装置
JP3095340B2 (ja) 音声復号化装置
JP3071388B2 (ja) 可変レート音声符号化方式
JPH021661A (ja) パケット補間方式
JP3249144B2 (ja) 音声符号化装置
JP3662597B2 (ja) 一般化された合成による分析音声符号化方法と装置
EP1688918A1 (en) Speech decoding
JP3089967B2 (ja) 音声符号化装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP2853824B2 (ja) 音声のパラメータ情報符号化法
JP2001265390A (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JP2003029799A (ja) 音声復号化方法
JP3576805B2 (ja) 音声符号化方法及びシステム並びに音声復号化方法及びシステム

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070914

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080914

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080914

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090914

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090914

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100914

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110914

Year of fee payment: 10

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110914

Year of fee payment: 10

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110914

Year of fee payment: 10

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350