JP2003504655A

JP2003504655A - 音声コーディングシステムにおける双方向ピッチエンハンスメント

Info

Publication number: JP2003504655A
Application number: JP2001508443A
Authority: JP
Inventors: ヤンガオ，
Original assignee: Conexant Systems LLC
Current assignee: Conexant Systems LLC
Priority date: 1999-07-02
Filing date: 2000-06-30
Publication date: 2003-02-04
Anticipated expiration: 2020-06-30
Also published as: CN1360716A; WO2001003125B1; WO2001003125A1; EP1194925B1; DE60014904D1; JP2011048387A; TW473703B; DE60014904T2; JP4629937B2; US6704701B1; EP1194925A1; CN1186766C

Abstract

(57)【要約】音声コーディングシステムのための双方向ピッチエンハンスメントシステム。音声データアプリケーションが、固有の帯域幅制限を有する領域で動作しつづけると、典型的な音声コーディングシステムにおいて再生される音声データの知覚品質は、大きく低下する。本発明は、再生される音声において高い知覚品質を維持するために、順方向ピッチエンハンスメントおよび逆方向ピッチエンハンスメントを用いる。所望ならば、逆方向ピッチエンハンスメントは、順方向ピッチエンハンスメント自身を用いて生成される。この場合、逆方向ピッチエンハンスメントは、以前に生成された順方向ピッチエンハンスメントの鏡像である。あるいは、本発明の１実施形態において、逆方向ピッチエンハンスメントは、順方向ピッチエンハンスメントと独立して生成される。

Description

【発明の詳細な説明】

【０００１】（関連出願の相互参照）本出願は、１９９９年７月２日に出願された「Ｂｉ−Ｄｉｒｅｃｔｉｏｎａｌ
ＰｉｔｃｈＥｎｈａｎｃｅｍｅｎｔＩｎＳｐｅｅｃｈＣｏｄｉｎｇ
Ｓｙｓｔｅｍｓ」と称する米国仮特許出願第６０／１４２，０９２号（アトーニ
ードケット第９７ＲＳＳ３８０Ｐ）、および１９９９年８月２日に出願された「
Ｂｉ−ＤｉｒｅｃｔｉｏｎａｌＰｉｔｃｈＥｎｈａｎｃｅｍｅｎｔＩｎ
ＳｐｅｅｃｈＣｏｄｉｎｇＳｙｓｔｅｍｓ」と称する米国仮特許出願第０９
／３６５，４４４号（アトーニードケット第９７ＲＳＳ３８０）の優先権を主張
する。

【０００２】（背景）（１．技術分野）本発明は、概して、音声コーディングに関し、より詳細には、再生された音声
の知覚品質を向上するために、ピッチエンハンスメントを用いる低ビットレート
音声コーディングシステムに関する。

【０００３】（２．関連技術の説明）従来の音声コーディングシステムは、典型的には、符号励起線型予測音声コー
ディングシステムにおいて順方向ピッチエンハンスメントのみを用いる。これは
、大部分は、比較的大きな帯域幅が利用できる従来の音声コードのサブフレーム
のサイズが、順方向ピッチエンハンスメント単独で十分な知覚品質を提供するこ
とができることに起因する。しかしながら、音声コーディングシステムで用いら
れる種々の通信媒体内のより低ビットレートに対しては、合成後に再生された音
声の知覚品質は、高い知覚品質を維持できないでいる。

【０００４】これらの低いビットレートで動作する従来の音声コーディングシステムでは、
ピッチ予測時に発生されるピッチ遅延は、通常、サブフレーム全体のサイズに比
べてはるかに短い。すなわち、このピッチ遅延は、サブフレーム全体のうち比較
的小さい部分を含む。この特徴は、女性および子供のようなより高い（より短い
）ピッチを有するスピーカの場合にさらに助長する。従来の励起コードブック構
造は、低ビットレートで動作する際に、十分高い知覚品質を提供しない。これは
主には、音声信号の周期性が十分に確立されていないか、またはコードブックか
ら抽出された励起ベクトルが、高い知覚品質を有する合成音声信号を生成するに
は不十分であることに起因する。

【０００５】音声コーディングシステムのサブフレームサイズがさらに大きくなるにつれて
、ますます低くなるビットレートを有する通信システムに関連して一般的である
ように、ピッチエンハンスメントが順方向のみに実行されるという事実によって
、知覚品質を著しく低下させることになる。これは、いくつかある他の理由のう
ちとりわけ、多くのパルスがないことに起因した大量のデッドスペースがサブフ
レーム内に存在するという事実による。より高いビットレートで動作し、従って
より短いサブフレームを有する従来の音声コーディングシステムにおいて、この
影響は、典型的には、人間の耳によって音声として知覚されない。このより低い
知覚品質の影響は、比較的低い利用可能なビットレートを有する音声コーディン
グを扱うほぼすべての音声コーディングシステムで認識されている。

【０００６】従来および伝統的なシステムのさらなる制限および不利益は、このようなシス
テムと、図面を参照して本出願の残りの部分に記載される本発明との比較によっ
て、当業者に明らかとなる。

【０００７】（発明の要旨）本発明の種々の局面は、順方向ピッチエンハンスメントおよび逆方向ピッチエ
ンハンスメントを用いる音声コーディングシステムにおいて見出され得る。本発
明の特定の実施形態において、順方向ピッチエンハンスメントおよび逆方向ピッ
チエンハンスメントは、音声コーディングシステム全体のうち１つの部分におい
て実行される。例えば、エンコーダおよびデコーダを含む音声コーデックを有す
る音声コーディングシステムにおいて、順方向ピッチエンハンスメントおよび逆
方向ピッチエンハンスメントは、音声コーデックのエンコーダおよびデコーダの
両方において実行される。あるいは、本発明の他の実施形態では、順方向ピッチ
エンハンスメントおよび逆方向ピッチエンハンスメントは、音声コーデックのデ
コーダでのみ実行される。特定のアプリケーションによって決定されるように、
順方向ピッチエンハンスメントおよび逆方向ピッチエンハンスメントは分散型の
様式で実行される。各ピッチエンハンスメントは、音声コーデックのエンコーダ
およびデコーダの各々の少なくとも一部分において実行される。

【０００８】本発明の特定の実施形態において、逆方向ピッチエンハンスメントは、順方向
ピッチエンハンスメント自身を用いて生成される。逆方向ピッチエンハンスメン
トは、以前に生成された順方向ピッチエンハンスメントの鏡像であり、逆方向ピ
ッチエンハンスメントは、順方向ピッチエンハンスメントに依存して生成される
。あるいは、本発明の別の実施形態では、逆方向ピッチエンハンスメントは、順
方向ピッチエンハンスメントと独立して生成される。すなわち逆方向ピッチエン
ハンスメントは、以前に生成された順方向ピッチエンハンスメントと関係なく生
成される。

【０００９】本発明に従って構築される音声コーディングシステムは、適切には、利用可能
な帯域幅が制限された、または利用可能な帯域幅を制約した通信媒体を用いて動
作する音声コーディングシステムに適合される。本発明の範囲および意図を逸脱
することなく、本発明において任意の通信媒体が用いられ得る。このような通信
媒体の例には、無線通信媒体、ワイヤに基づく電話通信媒体、光ファイバ通信媒
体およびイーサネット（登録商標）が含まれるが、これらに限定されない。

【００１０】本発明の他の局面、利点および新規な特徴は、添付の図面とともに本発明の以
下の詳細な説明を解釈する際に、以下の詳細な説明から理解される。

【００１１】（図面の詳細な説明）図１は、本発明によって構築される音声ピッチエンハンスメントシステム１１
０の１実施形態１００を示すシステム図である。音声ピッチエンハンスメントシ
ステム１１０は、とりわけ、ピッチエンハンスメント処理回路構成要素１１２、
音声コーディング回路構成要素１１４、順方向ピッチエンハンスメント回路構成
要素１１６、逆方向ピッチエンハンスメント回路構成要素１１８および音声処理
回路構成要素１１９を含む。音声ピッチエンハンスメントシステム１１０は、非
強化（ｎｏｎ-ｅｎｈａｎｃｅｄ）音声データまたは励起信号１２０に対して動
作し、ピッチ強化（ｅｎｈａｎｃｅｄ）音声データ１３０を生成する。ピッチ強
化音声データまたは励起信号１３０は、音声サブフレームに関して順方向および
逆方向の両方において実行されるピッチ予測およびピッチエンハンスメントを有
する音声データを含む。音声ピッチエンハンスメントシステム１１０は、本発明
の特定の実施形態においては、励起信号に対してのみ動作し、音声ピッチエンハ
ンスメントシステム１１０は、本発明の別の実施形態においては、音声データに
対してのみ動作する。

【００１２】本発明の特定の実施形態において、音声ピッチエンハンスメントシステム１１
０は、逆方向ピッチエンハンスメント回路構成要素１１８を用いて逆方向ピッチ
予測を生成するために独立して動作する。あるいは、順方向ピッチエンハンスメ
ント回路構成要素１１６および逆方向ピッチエンハンスメント回路構成要素１１
８は、音声コーディングシステムのピッチエンハンスメント全体を生成するため
に協働して動作する。本発明の他の実施形態では、ピッチエンハンスメント処理
回路構成要素１１２を用いて、順方向ピッチエンハンスメント回路構成要素１１
６および逆方向ピッチエンハンスメント回路構成要素１１８をモニタリングする
監視制御動作が実行される。音声処理回路構成要素１１９は、音声データに対し
て動作し、音声データの操作を実行するための、音声処理分野の当業者に公知で
ある音声処理回路構成要素を含むが、これに限定されない。音声コーディング回
路構成要素１１４も同様に、音声コーディング分野の当業者に公知である回路構
成要素を含むが、これに限定されない。当業者に公知のこのような音声コーディ
ングは、他の音声コーディング方法のうちとりわけ、符号励起線型予測、代数符
号励起線型予測およびパルス状励起を含む。

【００１３】図２は、本発明による音声ピッチエンハンスメントを用いる分散型音声コーデ
ック２００の１実施形態を示すシステム図である。分散型音声コーデック２００
の音声エンコーダ２２０は、ピッチエンハンスメントコーディング２２１を実行
する。ピッチエンハンスメントコーディング２２１は、逆方向パルスピッチ予測
回路構成要素２２２および順方向パルスピッチ予測回路構成要素２２３を用いて
実行される。本発明の別の実施形態において説明されるように、ピッチエンハン
スメントコーディング２２１は、音声サブフレーム内で、順方向および逆方向の
両方においてピッチ予測およびピッチエンハンスメントを生成する。分散型音声
コーデック２００の音声エンコーダ２２０はまた、音声サブフレーム内で、符号
コーディング２２６および位置コーディング２２７の両方を含む音声信号のメイ
ンパルスコーディング２２５を実行する。音声処理回路構成要素２２９はまた、
音声データに対して動作し、音声データの操作を実行するための音声処理分野の
当業者に公知の方法を用いた音声処理を助けるために、分散型音声コーデック２
００の音声エンコーダ２２０内で用いられる。さらに、音声処理回路構成要素２
２９は、本発明の特定の実施形態において、逆方向パルスピッチ予測回路構成要
素２２２および順方向パルスピッチ予測回路構成要素２２３を協働して動作する
。音声データが処理された後、分散型音声コーデック２００の音声エンコーダ２
２０によって少なくともある程度の音声データが、通信リンク２１０を介して分
散型音声コーデック２００の音声デコーダ２３０へと伝送される。通信リンク２
１０は、無線通信媒体、ワイヤに基づく電話通信媒体、光ファイバ通信媒体およ
びイーサネット（登録商標）を含む音声データを伝送可能な任意の通信媒体であ
るが、これらに限定されない。音声データを伝送可能な任意の通信媒体は、本発
明の範囲および意図から逸脱することなく通信リンク２１０に含まれる。分散型
音声コーデック２００の音声デコーダ２３０は、とりわけ、音声再生回路構成要
素２３２、予測補償回路構成要素２３４および音声処理回路構成要素２３６を含
む。

【００１４】本発明の特定の実施形態において、音声処理回路構成要素２２９および音声処
理回路構成要素２３６は、分散型音声コーデック２００の全体の中で、音声デー
タに対して協働して動作する。あるいは、音声処理回路構成要素２２９および音
声処理回路構成要素２３６は、音声データに対して独立して動作し、各音声処理
回路構成要素が音声エンコーダ２２０および音声デコーダ２３０のそれぞれにお
いて音声処理機能を実行する。音声処理回路構成要素２２９および音声処理回路
構成要素２３６は、音声データに対して動作し、音声データの操作を実行するた
めに、音声処理の分野の当業者に公知の音声処理回路構成要素を含むが、これに
限定されない。メインパルスコーディング回路構成要素２２５も、同様に、音声
コーディングの分野の当業者に公知の回路構成要素を含むが、これに限定されな
い。このようなメインパルスコーディング回路構成要素２２５の例では、当業者
に公知の回路構成要素、他のメインパルスコーディング方法の中でもとりわけ、
本発明の他の実施形態において上述されるような、符号励起線型予測、代数符号
励起線型予測およびパルス状予測が含まれる。

【００１５】図３は、本発明による音声ピッチエンハンスメントを用いる分散型音声コーデ
ック３００の別の実施形態を示すシステム図である。分散型音声コーデック３０
０の音声エンコーダ３２０は、音声サブフレーム内で、符号コーディング３２６
および位置コーディング３２７の両方を含む音声信号のメインパルスコーディン
グ３２５を実行する。音声処理回路構成要素３２９はまた、音声処理の分野の当
業者に公知の方法を用いた音声処理を助けるために、分散型音声コーデック３０
０の音声エンコーダ３２０内で利用され、それにより音声データに対して動作し
、音声データの操作を実行する。音声データが処理された後、分散型音声コーデ
ック３００の音声エンコーダ３２０によって少なくともある程度の音声データが
、通信リンク３１０を介して分散型音声コーデック３００の音声デコーダ３３０
へと伝送される。通信リンク３１０は、無線通信媒体、ワイヤに基づく電話通信
媒体、光ファイバ通信媒体およびイーサネット（登録商標）を含む音声データを
伝送可能な任意の通信媒体であるが、これらに限定されない。音声データを伝送
可能な任意の通信媒体は、本発明の範囲および意図から逸脱することなく通信リ
ンク３１０に含まれる。分散型音声コーデック３００の音声デコーダ３３０は、
ピッチエンハンスメントコーディング３２１を実行する。ピッチエンハンスメン
トコーディング３２１は、逆方向パルスピッチ予測回路構成要素３２２および順
方向パルスピッチ予測回路構成要素３２３の両方を用いて実行される。本発明の
種々の実施形態において上述されるように、ピッチエンハンスメントコーディン
グ３２１は、音声サブフレーム内で、順方向および逆方向の両方においてピッチ
予測およびピッチエンハンスメントを生成する。音声処理回路構成要素３３６は
また、音声処理の分野の当業者に公知の方法を用いた音声処理を助けるために、
分散型音声コーデック３００の音声デコーダ３３０内で利用され、それにより音
声データに対して動作し、音声データの操作を実行する。さらに、音声処理回路
構成要素３３９は、本発明の特定の実施形態において、逆方向パルスピッチ予測
回路構成要素３２２および順方向パルスピッチ予測回路構成要素３２３を協働し
て動作する。

【００１６】本発明の特定の実施形態において、音声処理回路構成要素３２９および音声処
理回路構成要素３３６は、分散型音声コーデック３００の全体の中で、音声デー
タに対して協働して動作する。あるいは、音声処理回路構成要素３２９および音
声処理回路構成要素３３６は音声データに対して独立して動作する。各音声処理
回路構成要素は、音声エンコーダ３２０および音声デコーダ３３０のそれぞれに
おいて音声処理機能を実行する。音声処理回路構成要素３２９および音声処理回
路構成要素３３６は、音声データに対して動作し、音声データの操作を実行する
ために、音声処理の分野の当業者に公知の音声処理回路構成要素を含むが、これ
に限定されない。メインパルスコーディング回路構成要素３２５も同様に、音声
コーディングの分野の当業者に公知の回路構成要素を含むが、これに限定されな
い。このようなメインパルスコーディング回路構成要素３２５の例では、当業者
に公知の回路構成要素、他のメインパルスコーディング方法の中でもとりわけ、
本発明の他の実施形態において上述されるような、符号励起線型予測、代数符号
励起線型予測およびパルス状予測が含まれる。

【００１７】図４は、本発明による音声ピッチエンハンスメントを用いる集積音声コーデッ
ク４２０の別の実施形態４００を示すシステム図である。集積音声コーデック４
２０は、とりわけ、低ビットレート通信リンク４１０を介して音声デコーダ４２
４と通信する音声エンコーダ４２２を含む。低ビットレート通信リンク４１０は
、無線通信媒体、ワイヤに基づく電話通信媒体、光ファイバ通信媒体およびイー
サネット（登録商標）を含む音声データを伝送可能な任意の通信媒体であるが、
これらに限定されない。音声データを伝送可能な任意の通信媒体は、本発明の範
囲および意図から逸脱することなく低ビットレート通信リンク４１０に含まれる
。ピッチエンハンスメントコーディング４２１が、集積音声コーディング４２０
内で実行される。ピッチエンハンスメントコーディング４２１は、とりわけ、逆
方向パルスピッチ予測回路構成要素４２２および順方向パルスピッチ予測回路構
成要素４２３を用いて実行される。本発明の種々の実施形態において上述される
ように、逆方向パルスピッチ予測回路構成要素４２２および順方向パルスピッチ
予測回路構成要素４２３は、本発明の特定の実施形態では協働して動作し、本発
明の別の実施形態では独立して動作する。

【００１８】実施形態４００に示されるように、逆方向パルスピッチ予測回路構成要素４２
２および順方向パルスピッチ予測回路構成要素４２３が、集積音声コーデック４
２０の全体の中に含まれる。所望ならば、本発明の特定の実施形態では、逆方向
パルスピッチ予測回路構成要素４２２および順方向パルスピッチ予測回路構成要
素４２３の両方が、音声エンコーダ４２２および音声デコーダ４２４のそれぞれ
に含まれる。あるいは、本発明の他の実施形態では、逆方向パルスピッチ予測回
路構成要素４２２または順方向パルスピッチ予測回路構成要素４２３のいずれか
一方が、音声エンコーダ４２２および音声デコーダ４２４のいずれか一方のみに
含まれる。任意の（ａｔｈａｎｄ）特定のアプリケーションに応じて、ユーザ
は、逆方向パルスピッチ予測回路構成要素４２２および順方向パルスピッチ予測
回路構成要素４２３を音声エンコーダ４２２および音声デコーダ４２４のうちい
ずれか一方、あるいは両方に配置するように選択し得る。本発明における種々の
実施形態は、本発明の範囲および意図から逸脱することなく、様々な量の逆方向
パルスピッチ予測回路構成要素４２２および順方向パルスピッチ予測回路構成要
素４２３を音声エンコーダ４２２および音声デコーダ４２４に配置することを想
定している。例えば、本発明の特定の実施形態では、逆方向パルスピッチ予測回
路構成要素４２２の所定の部分が、音声エンコーダ４２２に配置され、一方逆方
向パルスピッチ予測回路構成要素４２２の残りの部分が、音声デコーダ４２４に
配置される。同様に、本発明の特定の実施形態では、順方向パルスピッチ予測回
路構成要素４２３の所定の部分が、音声エンコーダ４２２に配置され、一方順方
向パルスピッチ予測回路構成要素４２３の残りの部分が、音声デコーダ４２４に
配置される。

【００１９】図５は、本発明によって実行される順方向ピッチエンハンスメントおよび逆方
向ピッチエンハンスメントを示す音声サブフレーム５１０を示すコーディング図
５００である。メインパルスＭ₀５２０は、符号励起線型予測、代数符号励起線
型予測、合成音声コーディングによる分析およびパルス状励起を含む音声処理の
分野の当業者に公知の任意の方法（但し、これらに限定されない）を用いて、音
声サブフレーム５１０内で生成される。本発明の種々の実施形態で用いられる上
述の方法を含む音声処理の種々の方法を用いて、順方向予測パルスＭ₁５３０、
順方向予測パルスＭ₂５４０および順方向予測パルスＭ₃５５０はすべて、音声サ
ブフレーム５１０内で生成されて配置される。上述のように、本発明の特定の実
施形態において、順方向予測パルスＭ₁５３０、順方向予測パルスＭ₂５４０およ
び順方向予測パルスＭ₃５５０の生成は、種々の処理回路構成要素を用いて実行
される。さらに、逆方向予測パルスＭ_-1５６０および逆方向予測パルスＭ_-2５７
０もまた本発明に従って生成される。

【００２０】本発明の特定の実施形態において、逆方向予測パルスＭ_-1５６０および逆方向
予測パルスＭ_-2５７０は、順方向予測パルスＭ₁５３０、順方向予測パルスＭ₂５
４０および順方向予測パルスＭ₃５５０を用いて生成される。あるいは、本発明
の他の実施形態では、逆方向予測パルスＭ_-1５６０および逆方向予測パルスＭ_-2 ５７０は、順方向予測パルスＭ₁５３０、順方向予測パルスＭ₂５４０および順方
向予測パルスＭ₃５５０と独立して生成される。逆方向予測パルスＭ_-1５６０お
よび逆方向予測パルスＭ_-2５７０の独立して生成する例は、ソフトウェア内にお
けるインプリメンテーションであり、この場合、音声サブフレーム５１０の時間
スケールは、ソフトウェア内で逆にされる。メインパルスＭ₀５２０は、同様に
して用いて、順方向予測パルスＭ₁５３０、順方向予測パルスＭ₂５４０および順
方向予測パルスＭ₃５５０と、逆方向予測パルスＭ_-1５６０および逆方向予測パ
ルスＭ_-2５７０との両方を生成する。つまり、この処理は、典型的な順方向にお
いて１回実行されて、音声サブフレーム５１０がソフトウェハ内で逆にされた後
に、この処理は、非典型的な逆方向で再度実行される。ただし、同じ数学的方法
を用いる。すなわち、データは、音声サブフレーム５１０に関して逆にされるだ
けである。

【００２１】図６は、本発明による順方向音声ピッチエンハンスメントを用いて、逆方向音
声ピッチエンハンスメントを生成する、本発明の実施形態６００を示す機能的ブ
ロック図を示す。ブロック６１０において、音声信号が処理される。ブロック６
２０において、音声データのメインパルスがコード化される。別のプロセスのブ
ロック６５５において、音声データ情報が通信リンクを介して伝送される。別の
プロセスのブロック６５５は、コード化された音声データが伝送された後に順方
向ピッチエンハンスメントおよび逆方向ピッチエンハンスメントを実行して、音
声を再生する、本発明の実施形態で用いられる。ブロック６３０において、順方
向ピッチエンハンスメントが実行され、ブロック６４０において、逆方向ピッチ
エンハンスメントが実行される。本発明の特定の実施形態において、ブロック６
４０の逆方向ピッチエンハンスメントは、ブロック６３０で生成される順方向ピ
ッチエンハンスメントの鏡像である。他の実施形態では、ブロック６４０の逆方
向ピッチエンハンスメントは、ブロック６３０で生成される順方向ピッチエンハ
ンスメントの鏡像ではない。別のプロセスのブロック６５０において、音声デー
タ情報が通信リンクを介して伝送される。別のプロセスのブロック６５０は、コ
ード化された音声データが伝送される前に、順方向ピッチエンハンスメントおよ
び逆方向ピッチエンハンスメントを実行して音声を再生する、本発明の実施形態
において用いられる。ブロック６６０において、音声信号が再構築される／合成
される。

【００２２】本発明の特定の実施形態において、ブロック６４０で実行される逆方向ピッチ
エンハンスメントは、単に、ブロック６５０で実行さる順方向ピッチエンハンス
メントの冗長にすぎない。すなわち、ブロック６４０の逆方向ピッチエンハンス
メントが、ブロック６３０で生成される順方向ピッチエンハンスメントの鏡像で
ある。例えば、順方向ピッチエンハンスメントがブロック６５０で実行された後
に、得られたピッチエンハンスメントは、音声処理の分野の当業者に公知の任意
の方法を用いて、ブロック６４０で実行される逆方向ピッチエンハンスメントを
生成するために、音声サブフレーム内で単にコピーされて、逆にされる。そうす
ることによって音声信号を合成し、再生する。

【００２３】図７は、本発明による順方向音声ピッチエンハンスメントと独立して逆方向音
声ピッチエンハンスメントを実行する、本発明の実施形態７００を示す機能的ブ
ロック図を示す。ブロック７１０において、音声信号が処理される。ブロック７
２０において、音声データのメインパルスがコード化される。別のプロセスのブ
ロック７５５において、音声データ情報が通信リンクを介して伝送される。別の
プロセスのブロック７５５は、コード化された音声データが伝送された後に順方
向ピッチエンハンスメントおよび逆方向ピッチエンハンスメントを実行して、音
声を再生する、本発明の実施形態で用いられる。ブロック７３０において、順方
向ピッチエンハンスメントが実行され、ブロック７４０において、逆方向ピッチ
エンハンスメントが実行される。ブロック７４０の逆方向ピッチエンハンスメン
トは、音声データが逆にされた後で実行され、ブロック７４０の逆方向ピッチエ
ンハンスメントは、ブロック７３０で実行される順方向ピッチエンハンスメント
に独立して実行される。この特定の実施形態は、音声データの全体的に新しいセ
ットが処理されているかのように、音声データが逆にされて、ブロック７４０の
逆方向ピッチエンハンスメントが生成されるという点で、実施形態６００に示さ
れるものとは異なる。逆に、実施形態６００では、得られるピッチエンハンスメ
ント自身を用いるが、逆方向に広げられる。実施形態７００の特定の実施形態に
おいて、この実施形態は、あたかも２つのセットの音声データ（１つのデータセ
ットは、ブロック７３０において順方向におけるピッチ予測を生成するために処
理され、もう一方のデータセットは、ブロック７４０において逆方向におけるピ
ッチ予測を生成するために処理される）が各サブフレームについて処理されてい
るかのうようであるが、それらはともに、音声データの同じサブフレームについ
て動作している。別のプロセスのブロック７５０において、音声データ情報は通
信リンクを介して伝送される。別のプロセスのブロック７５０は、コード化され
た音声データが伝送される前に、ブロック７３０の順方向ピッチエンハンスメン
トおよびブロック７４０の逆方向ピッチエンハンスメントを実行して音声を再生
する、本発明の実施形態において用いられる。ブロック７６０において、音声信
号が再構築される／合成される。

【００２４】本発明の上記詳細な説明およびそれに関連する図面を鑑みて、他の改変例およ
び変更例が、当業者には明らかである。また、このような他の改変例および変更
例が、本発明の意図および範囲から逸脱することなく為され得ることも理解すべ
きである。

【図面の簡単な説明】

【図１】図１は、本発明によって構築される音声ピッチエンハンスメントシステムの１
実施形態を示すシステム図である。

【図２】図２は、本発明による音声ピッチエンハンスメントを用いる分散型音声コーデ
ックの１実施形態を示すシステム図である。

【図３】図３は、本発明による音声ピッチエンハンスメントを用いる分散型音声コーデ
ックの別の実施形態を示すシステム図である。

【図４】図４は、本発明による音声ピッチエンハンスメントを用いる集積音声コーデッ
クの別の実施形態を示すシステム図である。

【図５】図５は、本発明によるピッチエンハンスメントを実行するための、順方向予測
パルスおよび逆方向予測パルスを示す音声サブフレームを示す図である。

【図６】図６は、本発明による順方向音声ピッチエンハンスメントを用いて、逆方向音
声ピッチエンハンスメントを生成する、本発明の実施形態を示す機能的ブロック
図を示す。

【図７】図７は、本発明による順方向音声ピッチエンハンスメントと独立して逆方向音
声ピッチエンハンスメントを実行する、本発明の実施形態を示す機能的ブロック
図を示す。

【手続補正書】特許協力条約第３４条補正の翻訳文提出書

【提出日】平成１３年６月２２日（２００１．６．２２）

【手続補正１】

【補正対象書類名】明細書

【補正対象項目名】０００９

【補正方法】変更

【補正の内容】

【０００９】本発明に従って構築される音声コーディングシステムは、適切には、利用可能
な帯域幅が制限された、または利用可能な帯域幅を制約した通信媒体を用いて動
作する音声コーディングシステムに適合される。本発明の範囲を逸脱することな
く、本発明において任意の通信媒体が用いられ得る。このような通信媒体の例に
は、無線通信媒体、ワイヤに基づく電話通信媒体、光ファイバ通信媒体およびイ
ーサネット（登録商標）が含まれるが、これらに限定されない。

【手続補正２】

【補正対象書類名】明細書

【補正対象項目名】００２４

【補正方法】変更

【補正の内容】

【００２４】本発明の上記詳細な説明およびそれに関連する図面を鑑みて、他の改変例およ
び変更例が、当業者には明らかである。また、このような他の改変例および変更
例が、本発明の範囲から逸脱することなく為され得ることも理解すべきである。

───────────────────────────────────────────────────── フロントページの続き (81)指定国ＥＰ(ＡＴ，ＢＥ，ＣＨ，ＣＹ，ＤＥ，ＤＫ，ＥＳ，ＦＩ，ＦＲ，ＧＢ，ＧＲ，ＩＥ，ＩＴ，ＬＵ，ＭＣ，ＮＬ，ＰＴ，ＳＥ)，ＣＮ，ＪＰ，ＫＲ (72)発明者ガオ，ヤンアメリカ合衆国カリフォルニア 92692，ミッションビエジ，サントリニロード 26586 Ｆターム(参考） 5D045 CA10 CC10 DA11

Claims

【特許請求の範囲】

【請求項１】ピッチエンハンスメントを実行するＣＥＬＰコーデックであ
って、エンコーダと、該エンコーダに接続された通信リンクと、該通信リンクに接続されたデコーダと、該エンコーダおよび該デコーダのうち少なくとも１つに接続された固定コード
ブックと、該固定コードブックに基づいて順方向予測パルスを生成するように構成された
順方向ピッチエンハンスメント回路と、該固定コードブックに基づいて逆方向予測パルスを生成するように構成された
逆方向ピッチエンハンスメント回路とを備える、ＣＥＬＰコーデック。
【請求項２】前記デコーダは逆方向ピッチエンハンスメント回路を含む、
請求項１に記載のＣＥＬＰコーデック。
【請求項３】前記逆方向ピッチエンハンスメント回路は、前記エンコーダ
および前記デコーダに分散される、請求項１に記載のＣＥＬＰコーデック。
【請求項４】前記順方向ピッチエンハンスメント回路および前記逆方向ピ
ッチエンハンスメント回路は、協働して動作するように構成される、請求項１に
記載のＣＥＬＰコーデック。
【請求項５】前記順方向ピッチエンハンスメント回路および前記逆方向ピ
ッチエンハンスメント回路は、独立して動作するように構成される、請求項１に
記載のＣＥＬＰコーデック。
【請求項６】前記逆方向ピッチエンハンスメント回路は、音声サブフレー
ムについて動作するように構成され、該逆方向ピッチエンハンスメント回路は、該音声サブフレーム内に少なくとも
１つの逆方向予測パルスを配置するように構成される、請求項１に記載のＣＥＬ
Ｐコーデック。
【請求項７】ＣＥＬＰピッチエンハンスメントシステムであって、固定コードブックと、該固定コードブックに基づいて順方向予測パルスを生成するように構成された
順方向ピッチエンハンスメント回路と、該固定コードブックに接続され、該固定コードブックに基づいて逆方向予測パ
ルスを独立して生成するように構成された逆方向ピッチエンハンスメント回路と
、該逆方向ピッチエンハンスメント回路に接続され、音声データを操作するよう
に構成された音声処理回路とを備える、ＣＥＬＰピッチエンハンスメントシステム。
【請求項８】前記逆方向ピッチエンハンスメント回路に接続され、前記固
定コードブックに基づいて順方向予測パルスを生成するように構成された順方向
ピッチエンハンスメント回路をさらに備える、請求項７に記載のＣＥＬＰピッチ
エンハンスメントシステム。
【請求項９】前記順方向ピッチエンハンスメント回路および前記逆方向ピ
ッチエンハンスメント回路は、協働して動作するように構成される、請求項８に
記載のＣＥＬＰピッチエンハンスメントシステム。
【請求項１０】前記順方向ピッチエンハンスメント回路および前記逆方向
ピッチエンハンスメント回路は、独立して動作するように構成される、請求項８
に記載のＣＥＬＰピッチエンハンスメントシステム。
【請求項１１】エンコーダおよびデコーダを含む音声コーデックをさらに
備え、該エンコーダおよび該デコーダのうち少なくとも１つは、前記逆方向ピッ
チエンハンスメント回路を含む、請求項７に記載のＣＥＬＰピッチエンハンスメ
ントシステム。
【請求項１２】エンコーダおよびデコーダを含む音声コーデックをさらに
備え、前記逆方向ピッチエンハンスメント回路は、該エンコーダおよび該デコー
ダに分散される、請求項７に記載のＣＥＬＰピッチエンハンスメントシステム。
【請求項１３】エンコーダと、デコーダと、該エンコーダおよび該デコー
ダに接続された通信リンクとを含む音声コーデックをさらに備え、前記逆方向ピッチエンハンスメント回路は、該エンコーダおよび該デコーダに
分散され、励起信号は第１の部分および第２の部分を含み、該第２の部分の知覚品質は、該逆方向ピッチエンハンスメント回路を用いるよ
うに構成された該エンコーダによって改善され、該励起信号の該第１の部分および該第２の部分は、該通信リンクを介して該エ
ンコーダから該デコーダに伝送され、該第２の部分のエンハンスメントは、該エンコーダおよび該デコーダによって
協働して実行される、請求項７に記載のＣＥＬＰピッチエンハンスメントシステ
ム。
【請求項１４】前記音声ピッチエンハンスメントシステムは、符号励起線
型予測を用いる、請求項７に記載のＣＥＬＰピッチエンハンスメントシステム。
【請求項１５】前記逆方向ピッチエンハンスメント回路は、音声サブフレ
ームについて動作し、該逆方向ピッチエンハンスメント回路は、該音声サブフレ
ーム内に少なくとも１つの逆方向予測パルスを配置するように構成される、請求
項７に記載のＣＥＬＰピッチエンハンスメントシステム。
【請求項１６】ＣＥＬＰピッチエンハンスメントを実行する方法であって
、固定コードブックに基づいて順方向予測パルスを生成する工程と、該固定コードブックに基づいて逆方向予測パルスを生成する工程とを包含する、方法。
【請求項１７】前記順方向予測パルスおよび前記逆方向予測パルスは、独
立して、または協働して生成される、請求項１６に記載の方法。
【請求項１８】前記逆方向予測パルスを生成する動作は、前記順方向予測
パルスに基づく、請求項１６に記載の方法。
【請求項１９】少なくとも１つの音声データおよび励起信号について、順
方向ピッチエンハンスメントを実行する工程と、音声コーデックを用いて該少な
くとも１つの音声データおよび該励起信号について逆方向ピッチエンハンスメン
トを実行する工程とをさらに包含する、請求項１６に記載の方法。
【請求項２０】符号励起線型予測を実行する工程をさらに包含する、請求
項１６に記載の方法。