JP3542610B2

JP3542610B2 - オーディオ信号処理装置およびオーディオ情報データ・フレーム処理方法

Info

Publication number: JP3542610B2
Application number: JP50516299A
Authority: JP
Inventors: マーメルステイン・ポール; ラビポウル・ラフィ; ナバロ・ウイリアム; カバーデイル・ポール
Original assignee: Nortel Networks Ltd
Current assignee: Nortel Networks Ltd
Priority date: 1997-06-26
Filing date: 1997-11-05
Publication date: 2004-07-14
Anticipated expiration: 2017-11-05
Also published as: CA2256329A1; CN1179324C; EP0920693A1; DE69735097T2; WO1999000791A1; JP2001500344A; US5995923A; CN1228867A; EP0920693B1; DE69735097D1

Description

発明の分野
本発明はワイヤレスの可能性もある通信環境の中で、ディジタル化されたオーディオ信号を送信する方法と装置に関する。具体的には、信号が通信ネットワークの１つの終端から他の終端に送信されている時、ディジタル信号処理技術を用いて圧縮またはエンコードされたオーディオ信号の質を改良する方法および装置に関する。
背景技術
近年、通信産業では種々のディジタル・ボコーダが急増して、異なった有線およびワイヤレス通信システムの帯域幅需要を満たしてきた。「ボコーダ」という名前は、その応用が主にオーディオ信号のコード化とデコード化を目的としたものであるという事実に由来する。ボコーダは通常、移動電話および通信ネットワークの基地局に統合されている。ボコーダはディジタル化されたオーディオ信号の通話を圧縮、逆変換する。典型的には、オーディオ信号は多くの量子化技術のうち１つを使ってディジタル化されている。これらの技術の例として、パルス振幅変調（PAM）、パルス符号変調（PCM）、デルタ変調などがある。ここではボコーダの入力フォーマットとしてPCMを例に説明する。ボコーダはエンコーダ段階を含み、ディジタル化したオーディオを入力として受信し、圧縮信号として出力し、圧縮率は8:1などである。逆変換に関しては、ボコーダはデコーダ段階を含み、圧縮された通話信号を受信しPCMサンプルなどのディジタル化信号として出力する。
通話を圧縮する主な利点は、伝送に使える限られたチャネル帯域幅の中で使う帯域幅が少ないということである。主な欠点は通話の質が低下することである。
最新の低ビット・レート・ボコーダは、線形予測モデルに基づき、通話信号を一連の線形予測係数、残差信号および種々の他のパラメータに分ける。一般的には、これらの成分から高品質の通話が再構成できる。しかし通話に多数のボコーダが介在する場合、質が低下する。
ネットワークの多様化とネットワーク・ユーザの増加に伴い、２つのボコーダがタンデムに設置され、単一の接続で機能を果たす例が増えている。このような場合、第１のエンコーダを使って第１の移動ユーザの通話を圧縮する。圧縮された通話はその地域の移動通信を受け持つ基地局に送信され、伸長される（PCMフォーマット・サンプルに変換される）。その結果生成されたPCMサンプルは、電話ネットワークのディジタル幹線を通じて第２の移動端末を受け持つ基地局に到着し、そこでは第２のエンコーダが入力信号を圧縮し、第２の移動端末に送信する。第２の移動端末における通話デコーダは、受信された圧縮通話データを伸長し、第１の移動端末から送られた元の通信信号に合成する。このような例としては、北アメリカ時分割多元接続方式システムに従って動作するワイヤレス端末から、ヨーロッパの移動体通信標準移動電話（GSM）への呼などがある。
これまでにボコーダ・タンデム化の条件を低減する試みとして、「バイパス」と呼ばれる方法が提唱されている。この方法の基本的な考え方は、ボコーダとバイパス機能を含むディジタル信号プロセッサを提供し、このバイパス機能は入力信号がボコーダと互換性のあるフォーマットの場合に実行されるというものである。実際の使用においては、第１の移動端末から発信されたRF信号を受信する第１の基地局のディジタル信号プロセッサは、信号送信と制御によって、呼が送られる移動端末に関する第２の基地局に同じディジタル信号プロセッサが存在するかどうかを決定する。第１の基地局に関するディジタル信号プロセッサは、圧縮された通話信号をPCMサンプルに変換する代わりにバイパス機能を実行し、圧縮された通話を搬送ネットワークに出力する。圧縮された通話信号が第２の基地局に関するディジタル信号プロセッサに到着すると、ローカル・ボコーダをバイパスするようにルーティングされる。信号の伸長は第２の移動端末だけで行われる。「バイパス」方法については、1995年12月13日付けの国際出願番号PCT95CA704に詳述されている。
しかし、この解決法はボコーダが同一である場合だけ有効である。ネットワークの急速な拡大に伴い、ボコーダも多様化している。従って、バイパス解決法は、タンデム型ボコーダを踏む接続の一部でしか有益でない。
このように通信業界の中では、互換性のないタンデム型ボコーダを含む接続の間において、音質を改良できる装置が望まれている。
発明の概要
本発明の目的は、オーディオ信号を処理し、通信ネットワーク内の２つのボコーダ間で信号が交換される時起きる信号の劣化を低減する装置を提供することにある。
本発明の他の目的は、通信ネットワーク内で１つのボコーダから他のボコーダに信号が送信される時、オーディオ信号の劣化を低減する方法を提供することにある。
本発明の一見地によれば、本発明は、入力と出力から構成され、前記の入力に印加された第１フォーマットの圧縮オーディオ・データのフレームに応じて上記の出力において第２フォーマットの圧縮オーディオ・データのフレームを生成し、第１フォーマットのフレームは係数セグメントと励起セグメントを有し、第２フォーマットのフレームは係数セグメントと励起セグメントを有するオーディオ信号処理装置において、
ａ）第１フォーマットの圧縮オーディオ・データのフレームの係数セグメントを前記入力に受信し、第２フォーマットの圧縮オーディオ・データのフレームの係数セグメントを前記出力から送出する第１の処理手段と、
ｂ）前記入力に接続され、第１フォーマットの圧縮オーディオ・データのデータ・フレームから第２フォーマットの圧縮オーディオ・データのデータ・フレームの励起セグメントを生成する第２の処理手段とを備えるように構成される。
好ましくは、本発明は、一組のトランスコーダが提供され、圧縮オーディオ信号を１つのフォーマットから他のフォーマットに変換する。各トランスコーダは擬似デコーダを備え、入力される圧縮オーディオ信号を共通のフォーマットに変換し、その後電話会社のネットワークを通じて第２のトランスコーダに送出する。離れたトランスコーダにある擬似エンコーダは共通フォーマットの信号を処理し、それを第１のトランスコーダに供給された元の圧縮オーディオ信号とは異なるフォーマットの圧縮オーディオ信号に変換する。全二重動作を行うため、各トランスコーダは共通フォーマットの信号を生成する擬似デコーダ、および共通フォーマットの信号を圧縮オーディオ信号に変換する擬似エンコーダを備える。
このシステムは、特に電話ネットワークに種々の非同一のボコーダが提供されている場合に利点がある。ボコーダ間で通話信号を交換するためには、ボコーダが同じでも異なっていても、ローカル・ボコーダが生成した圧縮オーディオ信号を共通フォーマットに変換し、離れたボコーダの擬似エンコーダが処理できるようにすれば十分である。共通フォーマットは圧縮オーディオ信号の中間的な表現として定義でき、これはローカル・ボコーダの擬似デコーダが送信する重要なパラメータ情報を離れたボコーダの擬似エンコーダに直接運ぶ。このようなパラメータ情報には、係数セグメントと送信されている通話信号の励起セグメントを記述するパラメータとが含まれる。共通フォーマット表現の重要な要素の１つとして、オーディオ信号の基本的なフレーム構造が所定の呼の間お互いにリンクされたネットワークにあるボコーダの１つがエンコードしたままの形で保持されているということがある。具体的には、共通フォーマット・フレームは係数セグメントと励起セグメントから成り立ち、その詳細は以下に記述する。しかしながら、オーディオ信号を低減してPCMサンプルまたは共通フォーマット構造と同等の表現にしようとする試みはされていない。圧縮された信号をPCMに変換してからPCMサンプルを圧縮された形にすると、信号の品質が大幅に低下するので、これはできるだけ避けるべきである。本出願の発明者は、共通フォーマット構成を設計し、ボコーダがエンコードしたオーディオ信号の基本的な構造を保持することによって、質の低下が大幅に緩和されることを発見した。
この明細書では、「係数セグメント」という用語は人間のオーディオ系のモデルのフィルタ機能を一義的に形成する一連の係数を示している。また、係数が間接的に抽出される情報フォーマットのタイプも示している。既存のボコーダではいくつかの異なるタイプの係数が既知であり、その中には反射係数、反射係数のアークサイン、線スペクトル・ペアおよびログ領域比などがある。通常、これらの異なるタイプの係数は数学的変換で関係づけられ、異なる特性を有し、異なるアプリケーションに適応する。このように「係数セグメント」という用語は、これらのタイプの係数を包含するものである。
「励起セグメント」は、オーディオ信号を完全に表現するために、係数セグメントと結合するに必要な情報と定義できる。また、「励起セグメント」は、励起を間接的に抽出できるタイプの情報フォーマットをも示す。励起セグメントは、信号を合成してPCMサンプル表現のような非圧縮形の信号を得る時に、係数セグメントを補足する。このような励起セグメントは通話信号の周期性を記述するパラメータ情報、擬似デコーダが計算した励起信号、離れたボコーダに関する擬似エンコーダ内で同期フレーミングを確実にする通話フレーミング制御情報、ピッチ遅れ、およびゲインと相対ゲインなどを含む。係数セグメントと励起セグメントは、電話会社のネットワークを通じて送信される信号中でさまざまに表現することができる。１つの例として、通信されるパラメータの値を表すビットシーケンスとして情報を送信する方法がある。また、それ自体では共通フォーマット信号のパラメータを運ぶのではなく、データベースまたはコードブック中のエントリだけを構成するインデックス・リストを送信し、擬似エンコーダがこのデータベースを調べ、受信された種々のインデックスに基づいて関連する情報を抽出し、共通フォーマット信号を構成するという方法もある。
「第１フォーマット」、「第２フォーマット」または「第３フォーマット」などの表現は、共通フォーマット表現または所定のボコーダのフォーマットで圧縮された形のオーディオ信号を記述するために使われている場合、一般的には、基本構造を共有し、すなわち係数セグメントと励起セグメントに分割されているが、互換性がない信号を示す。このように、第１フォーマットで信号を変換することができるボコーダは、一般的に、第１フォーマット以外の任意のフォーマットで表現された信号を処理することはできない。
本発明の好ましい実施の形態においては、圧縮された形のオーディオ信号を共通フォーマットに変換するプロセスは２つのステップで実行される。最初のステップでは、圧縮オーディオ信号データフレームの係数セグメントを処理して共通フォーマットの係数セグメントを生成する。一般的に、あるタイプの係数を他のタイプの係数に変換するプロセスは、既知の数学的アルゴリズムによって実行される。擬似デコーダに関するボコーダの種類によって、この変換は、圧縮オーディオ信号データ・フレームから係数を共通フォーマット・データ・フレームの係数を構成する新しい値に再量子化することによって実行される。次のステップでは、フレーム・エネルギ、ゲイン値、遅れ値およびコードブック情報（通常はボコーダのデコーダ部分である）を処理することによって共通フォーマット・データ・フレームの励起セグメントを得、励起信号を量子化して、共通フォーマット・データ・フレームを形成する。
擬似エンコーダを使って共通フォーマット・データ・フレームから圧縮オーディオ信号に変換するプロセスは、上記と同様な方法で実行される。まず共通フォーマット・データ・フレームの係数セグメントを処理し、圧縮オーディオ信号データ・フレームの係数セグメントを生成する。圧縮オーディオ信号データ・フレームの励起セグメントは共通フォーマット励起セグメントをその共通フォーマットから得られた係数を有するフィルタに通過させ通話信号を合成することによって得られる。この信号は通常、ボコーダのエンコーダ部分に印加される。
オーディオ信号を合成して分析を実行することなしに、他のフォーマットのデータ・フレームからあるフォーマットの励起セグメントを得るもう１つの方法として、原データ・フレームの励起セグメント中で使用可能なデータから励起セグメントだけを計算する方法がある。この方法と上記の方法のどちらを選択するかは、使用するアプリケーションや必要な変換のタイプによって異なる。具体的には、一定のフォーマットの圧縮オーディオ信号は、各フレームのセグメントを独立に再計算することによって簡単に共通フレームに変換できる。しかしながら、合成による分析手法を使って励起セグメントを得る方が現実的な場合もある。
さらに、本発明は、（ａ）第１の入力と第１の出力を含み、前記第１のトランスコーダは前記の入力に印加された第１フォーマットの圧縮オーディオ・データのフレームに応じて前記の出力において第２フォーマットの圧縮オーディオ・データのフレームを生成し、第１フォーマットのフレームは係数セグメントと励起セグメントを有し、第２フォーマットのフレームは係数セグメントと励起セグメントを有する第１のトランスコーダと、（ｂ）第２の入力と第２の出力を含み、前記第１の入力は前記第１の出力にリンクされ第２フォーマットの圧縮オーディオ・データのフレームを受信し、前記第２のトランスコーダは前記第２の入力に印加された第２フォーマットの圧縮オーディオ・データのフレームに応じて前記第２の出力において第３フォーマットの圧縮オーディオ・データのフレームを生成し、第３フォーマットのフレームは係数セグメントと励起セグメントを有する第２のトランスコーダとを備えるように構成される。
さらに、本発明は、ディジタル化されおよび圧縮された形でオーディオ情報を表わすデータ・フレームを処理し、そのデータ・フレームは係数セグメントと励起セグメントを含み、そのデータ・フレームは第１フォーマットである方法において、
ａ）第１フォーマットのデータ・フレームの係数セグメントを処理して第２フォーマットのデータ・フレームの係数セグメントを生成し、
ｂ）第１フォーマットのデータ・フレームを処理して第２フォーマットのデータ・フレームの励起セグメントを生成し、
ｃ）第２フォーマットのデータ・フレームの係数セグメントとステップａおよびｂで生成された第２フォーマットのデータ・フレームの励起セグメントを結合し、それぞれ第１フォーマットのデータ・フレームに含まれるオーディオ情報を表す第２フォーマットのデータ・フレームを生成するステップからなるように構成される。
さらに、本発明は、ディジタル化されおよび圧縮された形でオーディオ情報を表わすデータ・フレームを送信し、そのデータ・フレームは係数セグメントと励起セグメントを含み、そのデータ・フレームは第１フォーマットである方法において、
ａ）第１のサイトにおいて第１フォーマットのデータ・フレームを処理して第２フォーマットのデータ・フレームを生成し、第２フォーマットのデータ・フレームは係数セグメントと励起セグメントを含み、
ｂ）第２フォーマットのデータ・フレームを前記第１のサイトから離れた第２のサイトに送信し、
ｃ）前記第２のサイトにおいて第２フォーマットのデータ・フレームを処理して第３フォーマットのデータ・フレームを生成し、第２フォーマットのデータ・フレームは係数セグメントと励起セグメントを含むステップからなるように構成される。
さらに、本発明は、互換性のないボコーダ間でオーディオ信号を送信する方法において、
ａ）第１のボコーダから第１フォーマットのデータ・フレームを受信し、このデータ・フレームは係数セグメントと励起セグメントを含み、
ｂ）第１フォーマットのデータ・フレームを中間フォーマットのデータ・フレームに変換するステップは、さらに、
ｉ）第１フォーマットのデータ・フレームの係数セグメントを処理して中間フォーマットのデータ・フレームの係数セグメントを生成し、
ii）第１フォーマットのデータ・フレームを処理して中間フォーマットのデータ・フレームの励起セグメントを生成し、
iii）中間フォーマットのデータ・フレームの係数セグメントと中間フォーマットのデータ・フレームの励起セグメントを結合して、第１フォーマットのデータ・フレームに含まれるオーディオ情報を表す中間フォーマットのデータ・フレームを生成するサブ・ステップを含み、
ｃ）中間フォーマットのデータ・フレームを第３フォーマットのデータ・フレームに変換するステップは、さらに、
ｉ）中間フォーマットのデータ・フレームの係数セグメントを処理して第３フォーマットのデータ・フレームの係数セグメントを生成し、
ii）中間フォーマットのデータ・フレームを処理して第３フォーマットのデータ・フレームの励起セグメントを生成し、
iii）第３フォーマットのデータ・フレームの係数セグメントと第３フォーマットのデータ・フレームの励起セグメントを結合して第１フォーマットおよび中間フォーマットのデータ・フレームに含まれるオーディオ情報を表す第３フォーマットのデータ・フレームを生成するサブ・ステップを含み、
ｄ）第３フォーマットのデータ・フレームを第２のボコーダに送信するステップからなるように構成される。
さらに、本発明は、コンピュータにオーディオ信号を処理するよう命令するプログラム要素を含み、前記のコンピュータは入力および出力から構成され、前記のプログラム要素は前記のコンピュータを前記の入力に印加された第１フォーマットの圧縮オーディオ・データのフレームに応答させ、前記の出力において第２フォーマットの圧縮オーディオ・データのフレームを生成し、第１フォーマットのフレームは係数セグメントと励起セグメントを有し、第２フォーマットのフレームは係数セグメントと励起セグメントを有し、前記のプログラム要素は前記のコンピュータ機能ブロックを実行する機械式可読保存メディアにおいて、
ａ）前記の入力に接続され、第１フォーマットの圧縮オーディオ・データのフレームの係数セグメントを受信し、前記の出力において第２フォーマットの圧縮オーディオ・データのフレームの係数セグメントを送信する第１の処理手段と、
ｂ）前記の入力に接続され、第１フォーマットの圧縮オーディオ・データのデータ・フレームから第２フォーマットの圧縮オーディオ・データのデータ・フレームの励起セグメントを生成する第２の処理手段を含むように構成される。
さらに、本発明は、第１フォーマットの圧縮オーディオ信号のフレームを第２フォーマットの圧縮オーディオ信号のフレームに変換し、その第１フォーマットのフレームは係数セグメントと励起セグメントを有し、第２フォーマットのフレームは係数セグメントと励起セグメントを有するボコーダ間インタフェース・ノードにおいて、
ａ）第１の入力と第１の出力を含み、前記の入力に印加された第１フォーマットの圧縮オーディオ・データのフレームに応じて前記の出力において中間フォーマットの圧縮オーディオ・データのフレームを生成し、前記の中間フォーマットのフレームは係数セグメントおよび励起セグメントを有する第１のトランスコーダと、
ｂ）第２の入力と第２の出力を含み、前記第２の入力は前記第１の出力にリンクして中間フォーマットの圧縮オーディオ・データを受信し、前記第２の入力に印加された中間フォーマットの圧縮オーディオ・データのフレームに応じて前記第２の出力において第２フォーマットの圧縮オーディオ・データのフレームを生成する第２のトランスコーダとを含むように構成される。
【図面の簡単な説明】
図１は、従来のCELPボコーダのエンコーダ段階を表すブロック図である。
図２は、従来のCELPボコーダのデコーダ段階を表すブロック図である。
図３は、ワイヤレス移動端末と固定（有線）端末の間の通信リンクを表す概念図である。
図3bは、本発明の実施の形態の２台のトランスコーダを含む２台のワイヤレス移動端末間の通信リンクを表す概念図である。
図3cは、本発明の実施の形態のクロス・トランスコーディング・ノードを含む２台のワイヤレス移動端末間の通信リンクを表す概念図である。
図４は、本発明に従って構成され、信号をPCMタイプのディジタル化技術へ伸長することなく、共通フォーマットを介してあるフォーマットから他のフォーマットへ圧縮通話信号を翻訳するシステムを表わすブロック図である。
図５は、図４に示されたシステムを詳細に表したブロック図である。
図６は、図５のシステムの変換例であるクロス・トランスコード・ノードのブロック図である。
図7aは、IS54フォーマットのデータ・フレームを表す図である。
図7bは、図５または図６に描かれたトランスコーダが生成する共通フォーマットのデータ・フレームを表す図である。
図7cは、IS641フォーマットのデータ・フレームを表す図である。
図８は、IS54フォーマットの圧縮通話フォーマットを共通フォーマットに変換する動作を表すフローチャートである。
図９は、共通フォーマットのデータ・フレームを圧縮通話フォーマットIS641に変換する動作を表すフローチャートである。
図10は、図５に描かれたタイプの擬似エンコーダの機能を実行する装置を表すブロック図である。
図11は、図10に表された装置を示す機能ブロック図である。
図12は、図10に表された装置の変形例を示す機能ブロック図である。
発明の実施の形態
以下は、ワイヤレス電気通信で現在使われている線形予測符号化（LPC）ボコーダ技術の説明である。一つのアプリケーションとして、移動端末と固定基地局間で信号のワイヤレス送信がある。また、他のアプリケーションとして、有線ネットワークの他の部分で異なるボコーダが使われている場合のインターネット通信ネットワーク上の通話の送信がある。
チャネル帯域幅が貴重である通信応用においては、送信チャネルに使われる帯域幅はできる限り小さくすることが重要である。一般的にはユーザのオーディオ信号を送信前に量子化し圧縮する方法がよく使われる。
典型的には、オーディオ信号はまず多くの量子化技術の１つを使ってディジタル化される。これらの技術の例としては、パルス振幅変調（PAM）、パルス符号変調（PCM）、およびデルタ変調などがあるが、PCMがもっとも一般的である。基本的にPCMでは、アナログ信号のサンプルが指定されたレートでとられ（一般的には8kHz）、離散値に量子化されディジタル・フォーマットで表現される。
その後エンコード段階とデコード段階を含むコーデックを使い、ディジタル信号を発信原ポイントで圧縮し、受信ポイントで伸長し、送信チャネルの使用を最適化する。特にオーディオ信号用に使われるコーデックは、ダビングされた「ボコーダ」に使われる（オーディオコーダの場合）。通話信号の必要な特性だけをエンコードするため、必要なビットより少なく送信し、しかも通話の品質を大幅に落とさずに原波形を再生できる。必要なビット数が少ないので、低いビット・レート送信が達成される。
現在ほとんどの低ビット・レート・ボコーダは線形予測符号化（LPC）シリーズであり、関連する通話の特徴を時間ドメイン内の波形から抽出する。ボコーダは、エンコーダとデコーダという２つの主な構成要素から構成される。エンコーダ部分はディジタル化された通話信号を処理して圧縮し、一方、デコーダ部分は圧縮された通話をディジタルオーディオ信号に伸長する。
LPCタイプのボコーダは過去のｐサンプルのオーディオ（S_n-k）の加重合計を使って現在のサンプル（S_n）を予測する。数字ｐはモデルの次数を決定する。次数が高ければ通話の品質はよくなる。典型的なモデルの次数の範囲は10から15である。通話サンプルの等式は次の通りである。

この式で
a_kは最後のS_n-kサンプルの寄与を決定する係数である。
e_nは現在のサンプルのエラー信号である。
s_nとe_nのｚ変換を使って予測フィルタを定義すると、次の式が得られる。

この式で

フィルタ

だけが極を有し、従って全極フィルタと呼ばれる。
図１はCELPボコーダの一般的なモデルのエンコーダ部分を表すブロック図である。この図から分かるようにエンコーダ部分のオーディオ領域分析ブロック100への入力はPCMサンプルであり、その出力はLPCフィルタ係数セグメントと、予測エラー信号（残差とも呼ばれる）を表すいくつかのパラメータからなる励起セグメントを構成する。この出力は電気通信チャネルに送られる。
係数セグメント内のLPCフィルタ係数の数は、モデルの次数ｐによって決定される。励起セグメント・パラメータとしては、励起の性質（オーディオまたは非オーディオ）、ピッチ周期（オーディオ励起の場合）、ゲイン係数、エネルギ、ピッチ予測ゲインなどがある。コード励起線形予測ボコーダは現在、電話でもっともよく使われているタイプのボコーダである。CELPは、励起パラメータを送る代わりに、適応的および確率的コードブックの中で一連のベクトルを指すインデックス情報を送る。すなわち、各通話信号に対して、エンコーダはコードブックを通じて、LPC合成フィルタへの励起として使われた時に知覚的にそのオーディオに一番よくマッチするものを検索する。
この情報を含む通話フレームは、Ｔ秒ごとに再計算される。Ｔの共通の値は20msである。１つの20ms圧縮通話フレームは8kHzで取られた160PCMサンプルを表す。
図２は、CELPボコーダの一般的なモデルのデコーダ部分を表すブロック図である。圧縮された通話フレームは電気通信チャネル210から受信され、LPC合成フィルタ220に送られる。LPC合成フィルタ220はLPCフィルタ係数セグメントと励起セグメントを使って、PCMサンプル・フォームの出力通話信号を通常生成する。
ボコーダを強化するために補完とよばれる技術が使われる。これは20msの通話フレームを5msのサブフレームに分割し、これらの予測係数を補完する。この技術は、生成された通話信号内で望ましくない「ポップ」や「クリック」ノイズが出ないようにするために役立つ。これらのノイズは通常、予測係数内で１つの信号フレームが他の信号フレームに急速に変化する結果として発生するものである。各信号フレームは４つのサブフレームに分割され、便宜上、それぞれサブフレーム（１）、サブフレーム（２）、サブフレーム（３）、サブフレーム（４）と呼ぶことにする。第１のサブフレーム、つまりサブフレーム（１）上で通話信号を生成するために使う予測係数は、以前のフレームの予測係数と、現在のフレームの係数の組み合わせであり、組み合わせの比率は75％/25％である。サブフレーム（２）については、この比率は50％/50％、サブフレーム（３）では25％/75％、最後のサブフレーム（４）では０％/100％に変化する。つまり、最後のサブフレームでは現在のフレームからの係数だけが使われる。
図3a、3b、3cはワイヤレス・リンクを含んだ電話通信を示し、CELPボコーダ技術を実現するための概念図である。
図3aは、ワイヤレス移動端末300と固定（有線）端末330の間の通信リンクを表した概念図である。通話は移動端末300にあるボコーダによって圧縮（エンコード）され、ワイヤレス・リンク（RFチャネル）を介して基地局310に送られ、そこで第２のボコーダのデコードによってPCMサンプルにデコードされる。その後、信号は電話通信会社ネットワーク315のディジタル中継線の中にある種々のスイッチを通って中央局320に送られ、その中央局320は物理的に固定端末330に接続されている。中央局ではディジタル信号はアナログ・フォーマットに変換され、端末330に送られる。そのようなシナリオでは、通話の圧縮と伸長は１度ずつである。
図3bは本発明の実施の形態の２つのワイヤレス移動端末340と380をつないだ通信リンクの概念図であり、２つのトランスコーダを含む。通話は移動端末A340にあるボコーダによって圧縮（エンコード）され、ワイヤレス・リンク（RFチャネルＡ）を介して基地局A350に送られ、そこで第２のボコーダのデコーダによってPCMサンプルにデコードされる。PCMサンプルはその後電気通信会社のネットワーク360を介して第２の移動端末の基地局B370に送られ、そこで第２の基地局ボコーダによって２回目の圧縮（エンコード）が行われる。
圧縮された信号はワイヤレスリンク（RFチャネルＢ）を介して移動端末380に送られ、第２の移動端末のボコーダで２回目のデコードが行われる。その後、移動端末380でオーディオ通話が可能となる。図3bは、２つのトランスコーダ392と394を含む本発明の実施の形態を表し、詳細は以下に説明する。
図3cは、２つのワイヤレス移動端末間の通信リンクを表す概念図であり、本発明の実施の形態のクロス・トランスコード・ノード390を含む。クロス・トランスコード・ノードを詳細は以下に説明する。
ボコーダのこの構成はいわゆるタンデム・ボコードの例である。他のタンデム・ボコードの例として、他にワイヤレス移動端末が固定ワイヤレス端末と通信し、任意のタイプのワイヤレス端末が、ボコーダを使って通話を圧縮する中央のボイスメールシステムからのメッセージを検索し、その後データを保存する場合がある。このような場合、通話は１回以上ボコーダの圧縮および伸長アルゴリズムにかけられる。ボコーダがこのような方法でタンデム化されていると、通話の質は通常劣化する。
低ビット・レートのコーデック（ボコーダ）のタンデム接続によって生じた通話信号の劣化を補償するために、「バイパス」と呼ばれる方法が開発され、この方法では、基地局350と370中でボコーダが２重のデコード／エンコードをしないようにする。この方法の基本的な考え方は、基地局A350が、信号と制御を通じて移動端末B380中のボコーダが移動端末A340中のボコーダと同じであることを知ってボコーダをバイパスするので、信号データ・フレームが変更なしに直接ディジタル・トランク360に送られる。同様に、基地局370は圧縮通話データ・フレームを受信することを知っているので、コーディングを行わないで単に信号を移動端末B380に送信する。このバイパス方法は、本明細書の前半で言及された国際出願に詳しく説明されている。
しかしながら、この解決法はボコーダが同じ時のみ有効である。ネットワークの急速な拡大に伴い、ボコーダの多様性も増大している。したがって、バイパス方法はタンデム・ボコーダを含む接続の一部でしか使用できない。
本発明は、呼の間、ボコーダがタンデムに接続されている時に起きる信号の劣化を低減する方法とシステムを提供する。このシステムは、接続の間に圧縮された通話データ・フレームを中間の共通表現に変換するメカニズムとプロトコルを特徴としており、２つの移動端末の間または、移動端末と固定ワイヤレス端末の間の通信のどちらにも適用できる。
図４は、本発明に従って設計されたシステムを表わすブロック図で、信号をPCMタイプのディジタル信号に伸長することなく、圧縮された通話信号を、共通のフォーマットを介してあるフォーマットから他のフォーマットに翻訳する。
図５は本発明に従った方法を実行する特定の実施の形態を示し、同じ機能ブロックを有する２つのトランスコーダを有するモジュラ・クロス・トランスコーディング・システム510を示すブロック図である。トランスコーダは通信パスの終端にインストールされた分離されたデバイスであり、信号変換機能を提供する。これらの信号変換機能は、そのネットワークがどの通信基準を使っているかによって異なる。典型的な応用では、各トランスコーダはネットワーク中の基地局に関連している。このようにしてトランスコーダが生成した信号は電話ネットワーク上で第２のトランスコーダに送られ、そこで処理される。この詳細は後で説明する。どちらのトランスコーダも同じ機能ブロックを有する。簡単に説明するために、ここでは１つのトランスコーダだけ説明するが、もう１つの装置についても説明は同じである。
トランスコーダ510は、シグナリングおよび制御ブロック520、エンコーディング・ブロック530、デコーディング・ブロック540を含む。シグナリングおよび制御ブロック520の主な機能は、PCMビット・スチール（バンド内信号）または中央のデータベースからの直接通信を通じて、リンクの他の終端のエンティティと通信する（または通信を試みる）ことであり、以下のどれかを決定する。
ａ）接続が同じLPCタイプのボコーダ上で終端する。
ｂ）接続が異なるLPCタイプのボコーダ上で終端する。
ｃ）接続が上記のａ）またはｂ）以外のエンティティ上で終端する（すなわち、他のタプルのボコーダ、新しいタイプのLPCボコーダ、有線端末など）。
デコーディング・ブロック540はデコーダ542、擬似デコーダ544およびバイパス部546から構成される。デコーディング・ブロック540は、シグナリングおよび制御ブロック520の制御のもとに、次のうちどれか１つのタスクを実行する。
ａ）接続が同じLPCタイプのボコーダで終了する場合、圧縮通話信号を移動端末Ａから、圧縮通話データを圧縮通話データを通過させるバイパス部546を通じて、トランスコーダ550のバイパス部586に送信して、移動端末Ｂに送る。
ｂ）トランスコーディング・モジュールが用できる異なるLPCタイプのボコーダ上で接続が終端される時、擬似デコーダ544を用いて圧縮通信データを移動端末Ａから共通フォーマット信号に変換し、トランスコーダ550の擬似エンコーダ584に送信する。
ｃ）接続が上記のａ）またはｂ）でカバーされないエンティティで終端される場合（すなわち、他のシリーズのボコーダ、新しいタイプのLPCボコーダ、有線端末など）、通話デコーダ542を用いて移動端末Ａから圧縮通話データをPCMサンプルに変換し、トランスコーダ550のエンコーダ582または中央局590に送信する。
エンコーディング・ブロック530は、エンコーダ532、擬似エンコーダ534、およびバイパス部536から構成される。シグナリングおよび制御ブロック520の制御の元に、エンコーディング・ブロック530は以下のタスクのうちどれか１つを実行する。
ａ）接続源が同じLPCタイプのボコーダを有している場合、トランスコーダ550のバイパス部576から受信された通話信号をバイパス部536に送り、バイパス部536は圧縮されたデータを再フォーマットした後通過させ、トランスコーダ510が接続されている移動端末Ａに送信する。
ｂ）接続源が異なるLPCタイプのボコーダを有しトランスコーディング・モジュールが使用できる場合、擬似エンコーダ534を起動して、トランスコーダ550の擬似デコーダ部574から受信された共通フォーマットの信号を圧縮通話データに圧縮し、その信号を移動端末Ａに送出する。
ｃ）接続が上記のａ）またはｂ）でカバーされないエンティティで終わる場合（すなわち他のシリーズのボコーダ、新しいタイプのボコーダ、有線端末など）、通話エンコーダ532を用いてトランスコーダ550のデコーダ572または中央局590から受信されたPCMフォーマット・サンプルを圧縮通話データに変換し、圧縮された通話データを移動端末Ａに送出する。
トランスコーダ510中のシグナリングおよび制御ブロック520はトランスコーダ550に向けてメッセージを送信し、トランスコーダ550からメッセージを受信し、トランスコーダ550から受信された、またはトランスコーダ550に向けて送られたデータに従ってトランスコーダの動作を正しく調整する。２つのトランスコーダ間の通信は、これらの間に確率された通信チャネルを通じて実行される。通信チャネルはバンド内の場合もバンド外の場合もある。
PCM送信の間、ビット・スチール・プロセスが使われる。このプロセスでは、ある通話サンプルからのあるビットを使ってシグナリング情報を送信する。信号ビットの位置とビット抽出レートはビット置き換えの知覚的な効果を低減するために選択され、どちらかの移動端末での可聴信号はあまり影響を受けない。受信トランスコーダは通話サンプル内の信号ビットの位置を知っているので、メッセージをデコードすることができる。
トランスコーダ510と550の間のハンドシェーク手順には、１つのトランスコーダが相手のトランスコーダを識別できる異なるメッセージの交換を含む。従って、すべての装置は最良の通話品質を生成できるモードに設定することができる。ハンドシェーク手順は以下のメッセージの交換を含む。
ａ）シグナリングおよび制御ブロック520のトランスミッタは、トランスコーダ510が生成するPCM通話信号内に識別子を埋め込む。この識別子を使うと任意の遠隔エンコーダが、発信源のトランスコーダ、つまりトランスコーダ510に接続されたボコーダのタイプを正しく決めることができる。この識別は動作を探しているデータベースが実行でき、その詳細は以下の通りである。
ｂ）シグナリングおよび制御ブロック560はトランスコーダ550が受信したデータ・フレームを試験し、任意の帯域幅内のシグナリング情報を抽出する。これはデータ・フレーム内の所定の位置でビット値を測定することによって実行される。メッセージがトランスコーダ識別子であった場合、データベース（図中には示されていない）に問い合わせ、メッセージを生成したトランスコーダに接続されたボコーダのタイプを決定する。メッセージの内容によって以下の可能性がある。
１）エンコーディング・ブロック530および580、およびデコーディング・ブロック540および570に対するデフォルト・モードは、エンコーダ532および582、デコーダ542および572がアクティブで、一方、擬似エンコーダ534および584、擬似デコーダ544および574、およびバイパス部536,546,576、586に対する残りの機能モジュールが非アクティブである。これは、トランスコーダ510（または550）がネットワーク内の相手のトランスコーダの存在を認識していない場合、トランスコーダは通常のボコーダとして機能する、すなわち移動端末Ａから受信された圧縮通話データを輸送ネットワークに入力されるPCMサンプルに変換することを意味する。同様に、トランスコーダは、輸送ネットワークからのPCMサンプルを受信し、これらのサンプルをこのトランスコーダがサービスする移動端末のボコーダと互換性のある圧縮フォーマットに変換することを期待する。
２）シグナリングおよび制御ブロック510が遠隔トランスコーダの存在を識別した場合、トランスコーダの識別子はローカル・データベースの中で確認され、メッセージを送るトランスコーダのタイプを決定する。ここで、もし
ｉ）トランスコーダが同じであった場合、すなわち遠隔トランスコーダに接続されたボコーダが同じフレーム・フォーマット、またはトランスコーダ510にリンクされたボコーダの標準に従って動作している場合、シグナリングおよび制御ブロック520によってデコーディング・ブロックがバイパス段階546を実行できるようになり、一方、デコーダ542および擬似デコーダ544は無効になる。このように、遠隔トランスコーダから受信された圧縮通話データは、デコーディングされないで移動端末Ａに送られる。この動作モードは、ボコーダ・タンデム化が行われないので、可能な限り最高の音質を達成する方法の１つである。シグナリングおよび制御ブロック520はまたエンコーディング・ブロック530を切り換え、どのバイパス536がアクティブであるかを伝える。一方、エンコーダ532および擬似エンコーダ534は非アクティブである。このように、移動端末Ａから受信された圧縮通話データはデコーディングされることなくトランスコーダ510を通過する。エンコーディング・ブロック530をバイパス・モードに切り換える決定は、遠隔トランスコーダ550のシグナリングおよび制御ブロック560がトランスコーダ510の識別子を受信し、デコーディング・ブロック570およびエンコーディング・ブロック580をバイパス・モードに設定したという仮定に基づいている。この場合、全二重伝送接続が圧縮通話信号を交換するトランスコーダ間で確立される。
ii）トランスコーダが異なる場合、つまり遠隔トランスコーダが「移動端末Ｂに関連したボコーダが異なるLPCタイプである」と示した場合、シグナリングおよび制御ブロック520はデコーディング・ブロック540に擬似デコーダ544をアクティブにさせ、一方、デコーダ542およびバイパス546を非アクティブにする。この動作モードでは、シグナリングおよび制御ブロック520は、擬似デコーダ544を移動局Ａに関するボコーダのフォーマットに変換する共通フォーマットにエンコードされた通話信号を受信することを期待する。また、シグナリングおよび制御ブロック520は、擬似エンコーダ534がアクティブでエンコーダ532およびバイパス536が非アクティブであるモードにエンコーディング・ブロック530を切り換える。このように、トランスコーダ510が生成したデータは、擬似エンコーダ584は移動端末Ｂに関するボコーダのフォーマットでエンコードされた共通フォーマットである。
本発明の他の実施の形態は、図６に示されるようなクロス・トランスコード・ノードである。説明の簡単化のために、クロス・トランスコード・ノードのうち半分だけが示される。クロス・トランスコード・ノードのもう半分は同じであり、反対方向の通信を行う。クロス・トランスコード・ノード600は、異なる通話コーデックス間の中央インタフェースとして機能する。本質的に、トランスコード・ノード600は、前の実施の形態で説明されたように互いに別ではなく、物理的に互いに接続された２つのトランスコードペアとみることができる。各トランスコーダに対する他のシグナリングおよび制御ブロックを使う代わりに、単一の信号および制御段階610が使用される。クロス・トランスコード・ノード600は、デコーディング・ブロック620、エンコーディング・ブロック630およびスイッチ640も含む。
シグナリングおよび制御ブロック610の主な機能はリンクの他終端のエンティティと通信し（または通信しようと試み）、以下の事項を決定する。
ａ）接続が同じLPCタイプのボコーダ上で終端しているか。
ｂ）接続がトランス・コーディングモジュールが使用される異なるLPCタイプボコーダ上で終端しているか。
ｃ）接続が上記のａ）またはｂ）（すなわち、他のシリーズのボコーダ、新しいタイプのLPCボコーダ、有線端末など）でカバーされないエンティティ上で終端しているか。
タイミングおよび同期化情報を使ってデコーディング・ブロック620およびエンコーディング・ブロック630を制御する。制御情報を使ってスイッチ640の正確な位置を選択し、正しい信号を通じてルーティングする。
デコーディング・ブロック620はデコーダ622、擬似デコーダ624およびバイパス部626から構成される。エンコーディング・ブロック630はバイパス部632、擬似エンコーダ634およびエンコーダ636から構成される。
２つのボコーダを相互接続する場合、クロス・トランスコーディング・ノードは次のように機能する。シグナリングおよび制御ブロック610の制御の元に、デコーディング・ブロック620は以下のタスクのうち１つを実行する。
ａ）接続が同じLPCタイプのボコーダ上で終端している場合、圧縮通話信号をバイパス部262に送り、バイパス部262はバイパス部632を介して通話データを、再フォーマットした後に通過させ、同じLPCタイプのボコーダに送信する。
ｂ）接続がトランスコーディング・モジュールが使える異なるLPCタイプのボコーダ上で終端している場合、擬似デコーダ624を用いて圧縮通話データを共通フォーマット信号に変換し、信号を擬似エンコーダ634に送り、共通フォーマットを圧縮信号に再変換し、最後に圧縮通話信号を異なるLPCタイプのボコーダに送信する。
ｃ）接続が上記のａ）またはｂ）（すなわち他のシリーズのボコーダ、新しいタイプのLPCボコーダ、有線端末など）をカバーしないエンティティで終端している場合、通話デコーダ622を用いて、圧縮通話データをPCMサンプルに変換し、信号をエンコーダ636に送ってPCMサンプルを圧縮通話信号に再変換し、最後に圧縮通話信号を終端エンティティに送る。
有線端末に接続されている場合、クロス・トランスコーディング・ノードは次のように機能する。PCM信号は入ってくるとスイッチ640に送られ、シグナリングおよび制御ブロック610はスイッチを選択して信号をエンコーダ636に送出し、そこで信号は圧縮通話に変換され、最後に圧縮通話が外部ボコーダに送られる。有線端末が通信の受信終端上にあり、圧縮通話信号が入力されると、信号はデコーダ622に送られ、そこでPCMフォーマットに変換され、その後シグナリングおよび制御ブロックはスイッチを選択して信号を有線端末に送出する。
次に、擬似エンコーダ装置が圧縮信号から共通フォーマット信号への変換、および共通フォーマットから圧縮信号への逆変換を実行する方法に関する特定の例を説明する。特に、通話信号が移動端末（MT）A340からMTB 380に送られる時に、通話信号が変換される場合を考える。この例ではMTAは、IS54ワイヤレス電話通信標準内のベクトル合計強化線形予測（VSELP）を使っている。図7aはIS54のフレーム・フォーマットを説明している。信号は図7bのように共通フォーマットに変換され、受信終端ではMTBはIS641標準内の強化フル・レート・コーダ（EFRC）を使っている。図7cはIS641用のフレーム・フォーマットを説明している。
図3bおよび図５において、この例の変換では、通話信号はMTA340にあるVSELPボコーダによってIS54標準に圧縮（エンコード）され、ワイヤレス・リンク（RFチャネルＡ）を介して基地局A350に送られ、そこでトランスコーダ510内の擬似デコーダ544によって共通フォーマットに変換される（図５に示す）。共通フォーマット・データ・フレームは、その後、電気通信会社ネットワーク360を介してトランスコーダ550に送られ、そこで擬似エンコーダ584によってIS641標準の圧縮通話に変換される。圧縮信号はワイヤレス・リンク（RFチャネルＢ）を介してMT380に送られ、ここで第２のMTのEFRCボコーダによってデコードされる。その後、MT380において通話が使用できる。
擬似デコーダ544は図7aに示されるようにIS54フォーマットで通話のデータ・フレームを受信し、それを下記および図８のフローチャートで説明するように変換する。擬似デコーダ544は自己の量子化器を使って20msデータ・フレームのLPC反射係数を表す10次元ベクトルを再計算する。その後10次元ベクトルを使って、４つのサブフレームについて４セットの補完LPC係数ベクトルを決定する。補完の方法は、前記の方法と同じである。共通フォーマット・データ・フレームのこの部分は準備ができており、擬似デコーダ544はそれを保存して後から検索する。擬似デコーダ544はその後圧縮フォーマットから４つの遅延値（ピッチ遅延）を読む。擬似デコーダ544はこれらを保存し、後で共通フォーマットに補完する。擬似デコーダ544は、その後、サブフレーム用のコードブック情報、ゲイン係数、ピッチ遅延、およびフレーム用のフレーム・エネルギを使い、共通フォーマット用の合成励起信号（４回40サンプル）を生成する。最後に、励起信号と保存されたLPCフィルタ係数、ピッチ遅延を連結することによって共通フォーマット・データ・フレームが構成される。このデータ・フレームは次の基地局の擬似エンコーダ584に送られる。図7bでは、エネルギおよびピッチ予測ゲイン情報用の共通フォーマット・フレーム内の情報ビットを保持する。この情報はこの例では計算されていない。
図９に示されるように、擬似エンコーダ584は共通のフォーマット通話データ・フレームを受信し、IS641圧縮通話フォーマットに変換して、MTBにおけるEFRCが正しくデコードする必要がある。擬似エンコーダ584は４つのサブフレームについてLPC係数を読み出し、最初の３つのサブフレームの係数を捨てて、第４のサブフレームの係数だけを維持する。これはフレーム全体について計算されたLPC反射係数である。この例では、MTBにおけるEFRCボコーダはIS−641補完スキーマにしたがって最初の３つのサブフレーム・ベクトルを補完するため、変換用の最初の３つのベクトルは必要とされない。しかしながら、他のタイプのボコーダが使われている場合は、４つのベクトルすべてを変換用に使うこともある。この時点で擬似エンコーダ584は自己の量子化器を使って４番目のサブフレームのLPC反射係数を再量子化する。擬似エンコーダが10個のLPC反射係数をその量子化器に送る前に、まずこれらをLP（線形予測）係数に変換し、その後線形スペクトル・ペア（LSP）係数に変換し、最後に線形スペクトル周波数（LSFベクトル）に変換する必要がある。LSFベクトルは、その後量子化され、量子化されたLSPベクトルに変換される。この量子化されたLSFベクトルはIS641フォーマットの一部であり、そのまま保存される。次に、擬似エンコーダ584は量子化LSPベクトルを量子化LP係数に変換し、LP係数を最初の３つのサブフレームに対して補完する。このLP係数ベクトルのセットは次のステップで使われる。
擬似エンコーダ584は共通フォーマットの励起信号を使い、４つの40サンプル・サブフレームをそれぞれ合成フィルタに送り、量子化され補完されたLP係数をタップ係数として使って通話信号を再生する。擬似エンコーダ584は通話信号からピッチ遅れ（この方法は通常のEFRCエンコーダと同じである）、ゲイン値および励起値（MTBコードブックの代数コード）を、前に計算された10個のLSP係数を使って計算する。最後にIS641圧縮通話フォーマット・フレームは量子化されたピッチ遅れ、ゲイン値、励起値、および保存されたLSPベクトルを使って組み立てられる。この通話データ・フレームはMTB内のEFRCデコーダに送られ、通常のように通話信号に変換される。
共通フォーマットからのピッチ遅れ情報はこの例では使われないが、他の変換では使う場合もある。その代わりに、ピッチ遅れ情報は生成された通話信号から既知のアルゴリズムを使って計算される。
すなわち、擬似デコーダ534は入力される圧縮通話信号を係数部分と励起部分を有する共通フォーマットに変換する。その後、擬似エンコーダはこの共通フォーマットを使って圧縮通話を再生するが、そのフォーマットは擬似デコーダ544に入力される圧縮通話とは異なる。詳しく言えば、擬似エンコーダ584は、共通フォーマット信号の係数部分から、擬似エンコーダ584が出力する圧縮通話信号の係数を構成する。共通フォーマット信号に基づいて通話信号が再生され、任意の励起を抽出するために使われ、また圧縮通話信号に対して計算された係数に関する他の情報が通話情報を表わすために使われる。
トランスコーダ510の擬似エンコーダと擬似デコーダは、相互作用するボコーダのタイプに従って設計される。共通要素は、各擬似デコーダが圧縮通話信号を受信し、順次擬似エンコーダによって他の圧縮通話信号フォーマットに変換される共通フォーマット信号を生成する。この機能を使うとシステムは非常にフレキシブルになり、新しいボコーダが導入された時に特にフレキシブルになる。これによって、新しいボコーダ信号フォーマットと共通フォーマットの間で互いに変換を行う擬似エンコーダと擬似デコーダをよりよく設計できる。システムが使う共通フォーマットは同じなので、既存のトランスコーダを変更する必要はない。
構造の点からみると、図10で説明した装置を使って擬似エンコーダ584の機能を実行することができる。擬似エンコーダ584の動作は図９を使って上述されている。この装置は入力信号ライン910、信号出力ライン912、プロセッサ914およびメモリ916から構成されている。メモリ916はプロセッサ914の動作用の命令を保存し、またこれらの命令を実行するためにプロセッサ914が使うデータを保存する。バス918はメモリ916およびプロセッサ914の間で情報を交換するために供給する。
メモリ916に保存されているメモリを使うと、装置は図11に表示される機能ブロック図に従って動作する。この装置には係数セグメント・コンバータが含まれ、図９において説明されているように、既知の数学的操作を使って係数セグメントを共通フォーマット・フレームから圧縮オーディオ信号フレーム、この例ではIS641フレーム・フォーマットの係数セグメントに変換する。また、この装置は合成フィルタを含み、この合成フィルタは、係数セグメント・コンバータから４つのサブフレームに対する量子化LPC係数を受信する。合成フィルタは、また共通フォーマット・フレームの励起セグメントから励起信号を受信し、オーディオ信号を構成する。その後、この信号は合成−分析プロセスに入力され、IS641フレーム・フォーマットに対する励起セグメントを生成する。この時、係数セグメント・コンバータが出力した量子化LSPベクトルをタップ係数として使う。
図12は図５に表された擬似デコーダ544のブロック図である。この装置は２つの主な機能ブロック、すなわちIS54フォーマットのデータ・フレームから係数セグメントを受信し、これを共通フォーマット・データ・フレームの係数セグメントに変換する係数セグメント・コンバータを有する。さらに、この装置は、IS54データ・フォーマットからの励起セグメントの要素を使って、それを共通フォーマット・データ・フレームの励起セグメントに変換する励起セグメント・コンバータを有する。この設計では、圧縮オーディオ信号のデータ・フレームのすべてのセグメントを使って共通フォーマットのデータ・フレームを構成するように設計されている。
特定の用途のトランスコーダを設計する時、擬似エンコーダと擬似デコーダは、図11および12で示された装置の１つを使って構成することができる。どちらのシステムを選択するかは実行される特定のフォーマット翻訳によって異なる。圧縮オーディオ信号のフォーマット（データ・フレーム源または宛先データ・フレームのどちらか）が、データ・フレーム源からの係数セグメントと励起セグメントが独立して処理され宛先データ・フレームへの翻訳に影響を与えるときには、図12に描かれた装置が動作に最も適している。他方、オーディオ信号の再構成がさらに適切な場合、図11に描かれた装置を使うことができる。
エンコーダの構成と各トランスコーダのバイパス段階は、当業者が現在知っているシステムに従って構成できる。具体的には、エンコーダおよびデコーダは図１および２のブロック図に従ってそれぞれ構成することができ、一方バイパス機構は上記の国際出願の開示に従って設計することができる。
本発明の内容から離れることなく、種々の変更、応用が可能であるので、上記の実施の形態は限定要因ではない。本発明の範囲は以下の請求項によって定義される。

Claims

入力と出力から構成され、前記の入力に印加された第１フォーマットの圧縮オーディオ・データのフレームに応じて上記の出力において第２フォーマットの圧縮オーディオ・データのフレームを生成し、第１フォーマットのフレームは係数セグメントと励起セグメントを有し、第２フォーマットのフレームは係数セグメントと励起セグメントを有するオーディオ信号処理装置において、
ａ）第１フォーマットの圧縮オーディオ・データのフレームの係数セグメントを前記入力に受信し、第２フォーマットの圧縮オーディオ・データのフレームの係数セグメントを前記出力に生成する第１の処理手段と、
ｂ）前記入力に接続され、第１フォーマットの圧縮オーディオ・データのデータ・フレームから第２フォーマットの圧縮オーディオ・データのデータ・フレームの励起セグメントを生成する第２の処理手段とを備え、
ここで、前記第１の処理手段は、第１フォーマットの圧縮オーディオ・データのデータ・フレーム内で励起セグメントをほとんど使うことなく、第２フォーマットの圧縮オーディオ・データのフレームの係数セグメントを生成することを特徴とするオーディオ信号処理装置。
請求項１記載の装置において、
前記第１の処理手段は、量子化器を含むことを特徴とするオーディオ信号処理装置。
請求項１記載の装置において、
前記第２の処理手段は、量子化器を含むことを特徴とするオーディオ信号処理装置。
請求項１記載の装置において、
前記第２の処理手段は、第１フォーマットの圧縮オーディオ・データのデータ・フレームの係数セグメントをほとんど使うことなく、第２フォーマットの圧縮オーディオ・データのデータ・フレームの励起セグメントを計算することを特徴とするオーディオ信号処理装置。
請求項１記載の装置において、
前記第２の処理手段はフィルタを含むことを特徴とするオーディオ信号処理装置。
請求項５記載の装置において、
前記フィルタは、
再構成されたオーディオ信号を受信する第１の入力と、第２フォーマットの圧縮オーディオ・データのデータ・フレームの係数セグメントを受信する第２の入力とを含むことを特徴とするオーディオ信号処理装置。
請求項１記載の装置において、
第１フォーマットはIS54であることを特徴とするオーディオ信号処理装置。
請求項１記載の装置において、
第１フォーマットはIS641であることを特徴とするオーディオ信号処理装置。
ａ）第１の入力と第１の出力を含み、前記第１のトランスコーダは前記の入力に印加された第１フォーマットの圧縮オーディオ・データのフレームに応じて前記の出力において中間フォーマットの圧縮オーディオ・データのフレームを生成し、第１フォーマットのフレームは係数セグメントと励起セグメントを有し、中間フォーマットのフレームは係数セグメントと励起セグメントを有する第１のトランスコーダと、
ｂ）第２の入力と第２の出力を含み、前記第１の入力は前記第１の出力にリンクされ中間フォーマットの圧縮オーディオ・データのフレームを受信し、前記第２の入力に印加された中間フォーマットの圧縮オーディオ・データのフレームに応じて前記第２の出力において第２フォーマットの圧縮オーディオ・データのフレームを生成し、第２フォーマットのフレームは係数セグメントと励起セグメントを有する第２のトランスコーダとを備えたことを特徴とする非互換性ボーダ間圧縮オーディオ情報データ・フレーム通信装置。
請求項９記載の装置において、
前記第１のトランスコーダは、
ａ）前記第１の入力に接続され、第１フォーマットの圧縮オーディオ・データのフレームの係数セグメントを受信し、前記第１の出力において中間フォーマットの圧縮オーディオ・データのフレームの係数セグメントを生成する第１の処理手段と、
ｂ）前記入力に接続され、第１フォーマットの圧縮オーディオ・データのデータ・フレームから中間フォーマットの圧縮オーディオ・データのデータ・フレームの励起セグメントを生成する第２の処理手段とを生成することを特徴とする圧縮オーディオ情報データ・フレーム送信装置。
請求項10記載の装置において、
前記第１の処理手段が第１フォーマットの圧縮オーディオ・データのデータ・フレームの励起セグメントをほとんど使用することなく、中間フォーマットの圧縮オーディオ・データのフレームの係数セグメントを生成することを特徴とする圧縮オーディオ情報データ・フレーム送信装置。
請求項11記載の装置において、
前記第１の処理手段は量子化器を含むことを特徴とする圧縮オーディオ情報データ・フレーム送信装置。
請求項11記載の装置において、
前記第２の処理手段は量子化器を含むことを特徴とする圧縮オーディオ情報データ・フレーム送信装置。
請求項11記載の装置において、
前記第２の処理手段は第１フォーマットの圧縮オーディオ・データのデータ・フレームの係数セグメントをほとんど使用することなく、中間フォーマットの圧縮オーディオ・データのデータ・フレームの励起セグメントを計算することを特徴とする圧縮オーディオ情報データ・フレーム送信装置。
請求項11記載の装置において、
前記第２の処理手段はフィルタを含むことを特徴とする圧縮オーディオ情報データ・フレーム送信装置。
請求項15記載の装置において、
前記のフィルタは、再構成されたオーディオ信号を受信する第１の入力と、中間フォーマットの圧縮オーディオ・データのデータ・フレームの係数セグメントを受信する第２の入力を含むことを特徴とする圧縮オーディオ情報データ・フレーム送信装置。
請求項９記載の装置において、
前記第２のトランスコーダは、
ａ）前記第２の入力に接続され、中間フォーマットの圧縮オーディオ・データのフレームの係数セグメントを受信し、前記第２の出力において第３フォーマットの圧縮オーディオ・データのフレームの係数セグメントを生成する第３の処理手段と、
ｂ）前記第２の入力に接続され、中間フォーマットの圧縮圧縮オーディオ・データのデータ・フレームから、第２フォーマットの圧縮オーディオ・データのデータ・フレームの励起セグメントを生成する第４の処理手段を含むことを特徴とする圧縮オーディオ情報データ・フレーム送信装置。
請求項17記載の装置において、
前記の第３の処理手段は、中間フォーマットの圧縮オーディオ・データのデータ・フレームの励起セグメントをほとんど使用することなく、中間フォーマットの圧縮オーディオ・データのフレームの係数セグメントを生成することを特徴とする圧縮オーディオ情報データ・フレーム送信装置。
請求項18記載の装置において、
前記の第３の処理手段は量子化器を含むことを特徴とする圧縮オーディオ情報データ・フレーム送信装置。
請求項18記載の装置において、
前記の第４の処理手段は量子化器を含むことを特徴とする圧縮オーディオ情報データ・フレーム送信装置。
請求項17記載の装置において、
前記の第４の処理手段は、中間フォーマットの圧縮オーディオ・データのデータ・フレームの係数セグメントをほとんど使用することなく、第２フォーマットの圧縮オーディオ・データのデータ・フレームの励起セグメントを計算することを特徴とする圧縮オーディオ情報データ・フレーム送信装置。
請求項17記載の装置において、
前記の第４の処理手段は、フィルタを含むことを特徴とする圧縮オーディオ情報データ・フレーム送信装置。
請求項22記載の装置において、
前記フィルタは、再構成されたオーディオ信号を受信する入力と、第２フォーマットの圧縮オーディオ・データのデータ・フレームの係数セグメントを受信する入力を含むことを特徴とする圧縮オーディオ情報データ・フレーム送信装置。
ディジタル化さおよび圧縮された形でオーディオ情報を表わすデータ・フレームを処理し、そのデータ・フレームは係数セグメントと励起セグメントを含み、そのデータ・フレームは第１フォーマットである方法において、
ａ）第１フォーマットのデータ・フレームの係数セグメントを処理して第２フォーマットのデータ・フレームの係数セグメントを生成し、
ｂ）第１フォーマットのデータ・フレームを処理して第２フォーマットのデータ・フレームの励起セグメントを生成し、
ｃ）第２フォーマットのデータ・フレームの係数セグメントとステップａおよびｂで生成された第２フォーマットのデータ・フレームの励起セグメントを結合し、それぞれ第１フォーマットのデータ・フレームに含まれるオーディオ情報を表す第２フォーマットのデータ・フレームを生成するステップからなり、
ここで、前記第２フォーマットのデータ・フレームの励起セグメントを生成するステップｂは、
ｉ）データ・フレームの励起セグメントに含まれる情報上で少なくとも部分的にオーディオ信号を合成し、
ii）ステップｉで合成されたオーディオ信号を分析し、第２フォーマットのデータ・フレームの励起セグメントの少なくとも一部分を生成するステップからなることを特徴とするオーディオ情報データ・フレーム処理方法。
請求項24記載の方法において、
フィルタを通して請求項24のステップａにおいて合成されたオーディオ信号を通過させ、前記のフィルタに前記の第２フォーマットのデータ・フレームの係数セグメントのタップ係数として供給するステップからなることを特徴とするオーディオ情報データ・フレーム処理方法。
請求項24記載の方法において、
第２フォーマットのデータ・フレームの励起セグメントの生成は、第１フォーマットのデータの励起セグメントの変換によってのみ得られることを特徴とするオーディオ情報データ・フレーム処理方法。
請求項24記載の方法において、
第２フォーマットのデータ・フレームの係数セグメントの生成は、第１フォーマットのデータ・フレームの係数セグメントの変換によってのみ得られることを特徴とするオーディオ情報データ・フレーム処理方法。
ディジタル化されおよび圧縮された形でオーディオ情報を表わすデータ・フレームを送信し、そのデータ・フレームは係数セグメントと励起セグメントを含み、そのデータ・フレームは第１フォーマットである方法において、
ａ）第１のサイトにおいて第１フォーマットのデータ・フレームを処理して中間フォーマットのデータ・フレームを生成し、中間フォーマットのデータ・フレームは係数セグメントと励起セグメントを含み、
ｂ）中間フォーマットのデータ・フレームを前記第１のサイトから離れた第２のサイトに送信し、
ｃ）前記第２のサイトにおいて中間フォーマットのデータ・フレームを処理して第２フォーマットのデータ・フレームを生成し、前記第２フォーマットのデータ・フレームは係数セグメントと励起セグメントを含むステップからなることを特徴とする非互換性ボコーダ間オーディオ情報データ・フレーム送信方法。
請求項28記載の方法において、
ａ）前記第１のサイトにおいて第１フォーマットのデータ・フレームの係数セグメントを処理して中間フォーマットのデータ・フレームの係数セグメントを生成し、
ｂ）前記第１のサイトにおいて第１フォーマットのデータ・フレームを処理して中間フォーマットのデータ・フレームの励起セグメントを生成し、
ｃ）中間フォーマットのデータ・フレームの係数セグメントと、ステップａおよびｂで生成された中間フォーマットのデータ・フレームの励起セグメントを結合し、それぞれ、第１フォーマットのデータ・フレームに含まれるオーディオ情報を表す中間フォーマットのデータ・フレームを生成するステップからなることを特徴とするオーディオ情報データ・フレーム送信方法。
請求項29記載の方法において、
ａ）前記第２のサイトにおいて中間フォーマットのデータ・フレームの係数セグメントを処理して第２フォーマットのデータ・フレームの係数セグメントを生成し、
ｂ）前記第２のサイトにおいて中間フォーマットのデータ・フレームを処理して第２フォーマットのデータ・フレームの励起セグメントを生成し、
ｃ）第２フォーマットのデータ・フレームの係数セグメントとステップａおよびｂにおいて生成された第２フォーマットのデータ・フレームの励起セグメントとを結合し、それぞれ、第１フォーマットおよび中間フォーマットのデータ・フレームに含まれるオーディオ情報を表す第２フォーマットのデータ・フレームを生成するステップからなることを特徴とするオーディオ情報データ・フレーム送信方法。
互換性のないボコーダ間でオーディオ信号を送信する方法において、
ａ）第１のボコーダから第１フォーマットのデータ・フレームを受信し、そのデータ・フレームは係数セグメントと励起セグメントを含み、
ｂ）第１フォーマットのデータ・フレームを中間フォーマットのデータ・フレームに変換するステップは、さらに、次の
ｉ）第１フォーマットのデータ・フレームの係数セグメントを処理して中間フォーマットのデータ・フレームの係数セグメントを生成し、
ii）第１フォーマットのデータ・フレームを処理して中間フォーマットのデータ・フレームの励起セグメントを生成し、
iii）中間フォーマットのデータ・フレームの係数セグメントと中間フォーマットのデータ・フレームの励起セグメントとを結合して、第１フォーマットのデータ・フレームに含まれるオーディオ情報を表す中間フォーマットのデータ・フレームを生成するサブ・ステップを含み、
ｃ）中間フォーマットのデータ・フレームを第３フォーマットのデータ・フレームに変換するステップは、さらに、
ｉ）中間フォーマットのデータ・フレームの係数セグメントを処理して第３フォーマットのデータ・フレームの係数セグメントを生成し、
ii）中間フォーマットのデータ・フレームを処理して第３フォーマットのデータ・フレームの励起セグメントを生成し、
iii）第３フォーマットのデータ・フレームの係数セグメントと第３フォーマットのデータ・フレームの励起セグメントとを結合して、第１フォーマットおよび中間フォーマットのデータ・フレームに含まれるオーディオ情報を表す第３フォーマットのデータ・フレームを生成するサブ・ステップを含み、
ｄ）第３フォーマットのデータ・フレームを第２のボコーダに送信するステップからなることを特徴とする非互換性ボコーダ間オーディオ信号送信方法。
コンピュータにオーディオ信号を処理するよう命令するプログラム要素を含み、前記のコンピュータは入力および出力から構成され、前記のプログラム要素は前記のコンピュータを前記の入力に印加された第１フォーマットの圧縮オーディオ・データのフレームに応答させ、前記の出力において第２フォーマットの圧縮オーディオ・データのフレームを生成し、第１フォーマットのフレームは係数セグメントと励起セグメントを有し、第２フォーマットのフレームは係数セグメントと励起セグメントを有し、前記のプログラム要素は前記のコンピュータ機能ブロックを実行する機械式可読保存メディアにおいて、
ａ）前記の入力に接続され、第１フォーマットの圧縮オーディオ・データのフレームの係数セグメントを受信し、前記の出力において第２フォーマットの圧縮オーディオ・データのフレームの係数セグメントを送信する第１の処理手段と、
ｂ）前記の入力に接続され、第１フォーマットの圧縮オーディオ・データのデータ・フレームから、第２フォーマットの圧縮オーディオ・データのデータ・フレームの励起セグメントを生成する第２の処理手段を含むことを特徴とする機械式可読保存メディア。
第１フォーマットの圧縮オーディオ信号のフレームを第２フォーマットの圧縮オーディオ信号のフレームに変換し、その第１フォーマットのフレームは係数セグメントと励起セグメントを有し、第２フォーマットのフレームは係数セグメントと励起セグメントを有するボコーダ間インタフェース・ノードにおいて、
ａ）第１の入力と第１の出力を含み、前記の入力に印加された第１フォーマットの圧縮オーディオ・データのフレームに応じて前記の出力において中間フォーマットの圧縮オーディオ・データのフレームを生成し、前記の中間フォーマットのフレームは係数セグメントおよび励起セグメントを有する第１のトランスコーダと、
ｂ）第２の入力と第２の出力を含み、前記第２の入力は前記第１の出力にリンクして中間フォーマットの圧縮オーディオ・データを受信し、前記第２の入力に印加された中間フォーマットの圧縮オーディオ・データのフレームに応じて前記第２の出力において第２フォーマットの圧縮オーディオ・データのフレームを生成する第２のトランスコーダとを含むことを特徴とするボコーダ間インタフェース・ノード。