JP3542610B2 - オーディオ信号処理装置およびオーディオ情報データ・フレーム処理方法 - Google Patents
オーディオ信号処理装置およびオーディオ情報データ・フレーム処理方法 Download PDFInfo
- Publication number
- JP3542610B2 JP3542610B2 JP50516299A JP50516299A JP3542610B2 JP 3542610 B2 JP3542610 B2 JP 3542610B2 JP 50516299 A JP50516299 A JP 50516299A JP 50516299 A JP50516299 A JP 50516299A JP 3542610 B2 JP3542610 B2 JP 3542610B2
- Authority
- JP
- Japan
- Prior art keywords
- format
- frame
- data
- data frame
- segment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012545 processing Methods 0.000 title claims description 59
- 230000005236 sound signal Effects 0.000 title claims description 59
- 238000003672 processing method Methods 0.000 title claims 2
- 230000005284 excitation Effects 0.000 claims description 103
- 238000000034 method Methods 0.000 claims description 58
- 238000004891 communication Methods 0.000 claims description 27
- 230000008569 process Effects 0.000 claims description 15
- 230000005540 biological transmission Effects 0.000 claims description 11
- 230000004044 response Effects 0.000 claims description 7
- 230000006835 compression Effects 0.000 claims description 4
- 238000007906 compression Methods 0.000 claims description 4
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 25
- 230000011664 signaling Effects 0.000 description 23
- 239000013598 vector Substances 0.000 description 16
- 230000006870 function Effects 0.000 description 14
- 238000006243 chemical reaction Methods 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 230000015556 catabolic process Effects 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000009432 framing Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000008054 signal transmission Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W88/00—Devices specially adapted for wireless communication networks, e.g. terminals, base stations or access point devices
- H04W88/18—Service support devices; Network management devices
- H04W88/181—Transcoding devices; Rate adaptation devices
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Telephonic Communication Services (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
本発明はワイヤレスの可能性もある通信環境の中で、ディジタル化されたオーディオ信号を送信する方法と装置に関する。具体的には、信号が通信ネットワークの1つの終端から他の終端に送信されている時、ディジタル信号処理技術を用いて圧縮またはエンコードされたオーディオ信号の質を改良する方法および装置に関する。
背景技術
近年、通信産業では種々のディジタル・ボコーダが急増して、異なった有線およびワイヤレス通信システムの帯域幅需要を満たしてきた。「ボコーダ」という名前は、その応用が主にオーディオ信号のコード化とデコード化を目的としたものであるという事実に由来する。ボコーダは通常、移動電話および通信ネットワークの基地局に統合されている。ボコーダはディジタル化されたオーディオ信号の通話を圧縮、逆変換する。典型的には、オーディオ信号は多くの量子化技術のうち1つを使ってディジタル化されている。これらの技術の例として、パルス振幅変調(PAM)、パルス符号変調(PCM)、デルタ変調などがある。ここではボコーダの入力フォーマットとしてPCMを例に説明する。ボコーダはエンコーダ段階を含み、ディジタル化したオーディオを入力として受信し、圧縮信号として出力し、圧縮率は8:1などである。逆変換に関しては、ボコーダはデコーダ段階を含み、圧縮された通話信号を受信しPCMサンプルなどのディジタル化信号として出力する。
通話を圧縮する主な利点は、伝送に使える限られたチャネル帯域幅の中で使う帯域幅が少ないということである。主な欠点は通話の質が低下することである。
最新の低ビット・レート・ボコーダは、線形予測モデルに基づき、通話信号を一連の線形予測係数、残差信号および種々の他のパラメータに分ける。一般的には、これらの成分から高品質の通話が再構成できる。しかし通話に多数のボコーダが介在する場合、質が低下する。
ネットワークの多様化とネットワーク・ユーザの増加に伴い、2つのボコーダがタンデムに設置され、単一の接続で機能を果たす例が増えている。このような場合、第1のエンコーダを使って第1の移動ユーザの通話を圧縮する。圧縮された通話はその地域の移動通信を受け持つ基地局に送信され、伸長される(PCMフォーマット・サンプルに変換される)。その結果生成されたPCMサンプルは、電話ネットワークのディジタル幹線を通じて第2の移動端末を受け持つ基地局に到着し、そこでは第2のエンコーダが入力信号を圧縮し、第2の移動端末に送信する。第2の移動端末における通話デコーダは、受信された圧縮通話データを伸長し、第1の移動端末から送られた元の通信信号に合成する。このような例としては、北アメリカ時分割多元接続方式システムに従って動作するワイヤレス端末から、ヨーロッパの移動体通信標準移動電話(GSM)への呼などがある。
これまでにボコーダ・タンデム化の条件を低減する試みとして、「バイパス」と呼ばれる方法が提唱されている。この方法の基本的な考え方は、ボコーダとバイパス機能を含むディジタル信号プロセッサを提供し、このバイパス機能は入力信号がボコーダと互換性のあるフォーマットの場合に実行されるというものである。実際の使用においては、第1の移動端末から発信されたRF信号を受信する第1の基地局のディジタル信号プロセッサは、信号送信と制御によって、呼が送られる移動端末に関する第2の基地局に同じディジタル信号プロセッサが存在するかどうかを決定する。第1の基地局に関するディジタル信号プロセッサは、圧縮された通話信号をPCMサンプルに変換する代わりにバイパス機能を実行し、圧縮された通話を搬送ネットワークに出力する。圧縮された通話信号が第2の基地局に関するディジタル信号プロセッサに到着すると、ローカル・ボコーダをバイパスするようにルーティングされる。信号の伸長は第2の移動端末だけで行われる。「バイパス」方法については、1995年12月13日付けの国際出願番号PCT95CA704に詳述されている。
しかし、この解決法はボコーダが同一である場合だけ有効である。ネットワークの急速な拡大に伴い、ボコーダも多様化している。従って、バイパス解決法は、タンデム型ボコーダを踏む接続の一部でしか有益でない。
このように通信業界の中では、互換性のないタンデム型ボコーダを含む接続の間において、音質を改良できる装置が望まれている。
発明の概要
本発明の目的は、オーディオ信号を処理し、通信ネットワーク内の2つのボコーダ間で信号が交換される時起きる信号の劣化を低減する装置を提供することにある。
本発明の他の目的は、通信ネットワーク内で1つのボコーダから他のボコーダに信号が送信される時、オーディオ信号の劣化を低減する方法を提供することにある。
本発明の一見地によれば、本発明は、入力と出力から構成され、前記の入力に印加された第1フォーマットの圧縮オーディオ・データのフレームに応じて上記の出力において第2フォーマットの圧縮オーディオ・データのフレームを生成し、第1フォーマットのフレームは係数セグメントと励起セグメントを有し、第2フォーマットのフレームは係数セグメントと励起セグメントを有するオーディオ信号処理装置において、
a) 第1フォーマットの圧縮オーディオ・データのフレームの係数セグメントを前記入力に受信し、第2フォーマットの圧縮オーディオ・データのフレームの係数セグメントを前記出力から送出する第1の処理手段と、
b) 前記入力に接続され、第1フォーマットの圧縮オーディオ・データのデータ・フレームから第2フォーマットの圧縮オーディオ・データのデータ・フレームの励起セグメントを生成する第2の処理手段とを備えるように構成される。
好ましくは、本発明は、一組のトランスコーダが提供され、圧縮オーディオ信号を1つのフォーマットから他のフォーマットに変換する。各トランスコーダは擬似デコーダを備え、入力される圧縮オーディオ信号を共通のフォーマットに変換し、その後電話会社のネットワークを通じて第2のトランスコーダに送出する。離れたトランスコーダにある擬似エンコーダは共通フォーマットの信号を処理し、それを第1のトランスコーダに供給された元の圧縮オーディオ信号とは異なるフォーマットの圧縮オーディオ信号に変換する。全二重動作を行うため、各トランスコーダは共通フォーマットの信号を生成する擬似デコーダ、および共通フォーマットの信号を圧縮オーディオ信号に変換する擬似エンコーダを備える。
このシステムは、特に電話ネットワークに種々の非同一のボコーダが提供されている場合に利点がある。ボコーダ間で通話信号を交換するためには、ボコーダが同じでも異なっていても、ローカル・ボコーダが生成した圧縮オーディオ信号を共通フォーマットに変換し、離れたボコーダの擬似エンコーダが処理できるようにすれば十分である。共通フォーマットは圧縮オーディオ信号の中間的な表現として定義でき、これはローカル・ボコーダの擬似デコーダが送信する重要なパラメータ情報を離れたボコーダの擬似エンコーダに直接運ぶ。このようなパラメータ情報には、係数セグメントと送信されている通話信号の励起セグメントを記述するパラメータとが含まれる。共通フォーマット表現の重要な要素の1つとして、オーディオ信号の基本的なフレーム構造が所定の呼の間お互いにリンクされたネットワークにあるボコーダの1つがエンコードしたままの形で保持されているということがある。具体的には、共通フォーマット・フレームは係数セグメントと励起セグメントから成り立ち、その詳細は以下に記述する。しかしながら、オーディオ信号を低減してPCMサンプルまたは共通フォーマット構造と同等の表現にしようとする試みはされていない。圧縮された信号をPCMに変換してからPCMサンプルを圧縮された形にすると、信号の品質が大幅に低下するので、これはできるだけ避けるべきである。本出願の発明者は、共通フォーマット構成を設計し、ボコーダがエンコードしたオーディオ信号の基本的な構造を保持することによって、質の低下が大幅に緩和されることを発見した。
この明細書では、「係数セグメント」という用語は人間のオーディオ系のモデルのフィルタ機能を一義的に形成する一連の係数を示している。また、係数が間接的に抽出される情報フォーマットのタイプも示している。既存のボコーダではいくつかの異なるタイプの係数が既知であり、その中には反射係数、反射係数のアークサイン、線スペクトル・ペアおよびログ領域比などがある。通常、これらの異なるタイプの係数は数学的変換で関係づけられ、異なる特性を有し、異なるアプリケーションに適応する。このように「係数セグメント」という用語は、これらのタイプの係数を包含するものである。
「励起セグメント」は、オーディオ信号を完全に表現するために、係数セグメントと結合するに必要な情報と定義できる。また、「励起セグメント」は、励起を間接的に抽出できるタイプの情報フォーマットをも示す。励起セグメントは、信号を合成してPCMサンプル表現のような非圧縮形の信号を得る時に、係数セグメントを補足する。このような励起セグメントは通話信号の周期性を記述するパラメータ情報、擬似デコーダが計算した励起信号、離れたボコーダに関する擬似エンコーダ内で同期フレーミングを確実にする通話フレーミング制御情報、ピッチ遅れ、およびゲインと相対ゲインなどを含む。係数セグメントと励起セグメントは、電話会社のネットワークを通じて送信される信号中でさまざまに表現することができる。1つの例として、通信されるパラメータの値を表すビットシーケンスとして情報を送信する方法がある。また、それ自体では共通フォーマット信号のパラメータを運ぶのではなく、データベースまたはコードブック中のエントリだけを構成するインデックス・リストを送信し、擬似エンコーダがこのデータベースを調べ、受信された種々のインデックスに基づいて関連する情報を抽出し、共通フォーマット信号を構成するという方法もある。
「第1フォーマット」、「第2フォーマット」または「第3フォーマット」などの表現は、共通フォーマット表現または所定のボコーダのフォーマットで圧縮された形のオーディオ信号を記述するために使われている場合、一般的には、基本構造を共有し、すなわち係数セグメントと励起セグメントに分割されているが、互換性がない信号を示す。このように、第1フォーマットで信号を変換することができるボコーダは、一般的に、第1フォーマット以外の任意のフォーマットで表現された信号を処理することはできない。
本発明の好ましい実施の形態においては、圧縮された形のオーディオ信号を共通フォーマットに変換するプロセスは2つのステップで実行される。最初のステップでは、圧縮オーディオ信号データフレームの係数セグメントを処理して共通フォーマットの係数セグメントを生成する。一般的に、あるタイプの係数を他のタイプの係数に変換するプロセスは、既知の数学的アルゴリズムによって実行される。擬似デコーダに関するボコーダの種類によって、この変換は、圧縮オーディオ信号データ・フレームから係数を共通フォーマット・データ・フレームの係数を構成する新しい値に再量子化することによって実行される。次のステップでは、フレーム・エネルギ、ゲイン値、遅れ値およびコードブック情報(通常はボコーダのデコーダ部分である)を処理することによって共通フォーマット・データ・フレームの励起セグメントを得、励起信号を量子化して、共通フォーマット・データ・フレームを形成する。
擬似エンコーダを使って共通フォーマット・データ・フレームから圧縮オーディオ信号に変換するプロセスは、上記と同様な方法で実行される。まず共通フォーマット・データ・フレームの係数セグメントを処理し、圧縮オーディオ信号データ・フレームの係数セグメントを生成する。圧縮オーディオ信号データ・フレームの励起セグメントは共通フォーマット励起セグメントをその共通フォーマットから得られた係数を有するフィルタに通過させ通話信号を合成することによって得られる。この信号は通常、ボコーダのエンコーダ部分に印加される。
オーディオ信号を合成して分析を実行することなしに、他のフォーマットのデータ・フレームからあるフォーマットの励起セグメントを得るもう1つの方法として、原データ・フレームの励起セグメント中で使用可能なデータから励起セグメントだけを計算する方法がある。この方法と上記の方法のどちらを選択するかは、使用するアプリケーションや必要な変換のタイプによって異なる。具体的には、一定のフォーマットの圧縮オーディオ信号は、各フレームのセグメントを独立に再計算することによって簡単に共通フレームに変換できる。しかしながら、合成による分析手法を使って励起セグメントを得る方が現実的な場合もある。
さらに、本発明は、(a)第1の入力と第1の出力を含み、前記第1のトランスコーダは前記の入力に印加された第1フォーマットの圧縮オーディオ・データのフレームに応じて前記の出力において第2フォーマットの圧縮オーディオ・データのフレームを生成し、第1フォーマットのフレームは係数セグメントと励起セグメントを有し、第2フォーマットのフレームは係数セグメントと励起セグメントを有する第1のトランスコーダと、(b)第2の入力と第2の出力を含み、前記第1の入力は前記第1の出力にリンクされ第2フォーマットの圧縮オーディオ・データのフレームを受信し、前記第2のトランスコーダは前記第2の入力に印加された第2フォーマットの圧縮オーディオ・データのフレームに応じて前記第2の出力において第3フォーマットの圧縮オーディオ・データのフレームを生成し、第3フォーマットのフレームは係数セグメントと励起セグメントを有する第2のトランスコーダとを備えるように構成される。
さらに、本発明は、ディジタル化されおよび圧縮された形でオーディオ情報を表わすデータ・フレームを処理し、そのデータ・フレームは係数セグメントと励起セグメントを含み、そのデータ・フレームは第1フォーマットである方法において、
a) 第1フォーマットのデータ・フレームの係数セグメントを処理して第2フォーマットのデータ・フレームの係数セグメントを生成し、
b) 第1フォーマットのデータ・フレームを処理して第2フォーマットのデータ・フレームの励起セグメントを生成し、
c) 第2フォーマットのデータ・フレームの係数セグメントとステップaおよびbで生成された第2フォーマットのデータ・フレームの励起セグメントを結合し、それぞれ第1フォーマットのデータ・フレームに含まれるオーディオ情報を表す第2フォーマットのデータ・フレームを生成するステップからなるように構成される。
さらに、本発明は、ディジタル化されおよび圧縮された形でオーディオ情報を表わすデータ・フレームを送信し、そのデータ・フレームは係数セグメントと励起セグメントを含み、そのデータ・フレームは第1フォーマットである方法において、
a) 第1のサイトにおいて第1フォーマットのデータ・フレームを処理して第2フォーマットのデータ・フレームを生成し、第2フォーマットのデータ・フレームは係数セグメントと励起セグメントを含み、
b) 第2フォーマットのデータ・フレームを前記第1のサイトから離れた第2のサイトに送信し、
c) 前記第2のサイトにおいて第2フォーマットのデータ・フレームを処理して第3フォーマットのデータ・フレームを生成し、第2フォーマットのデータ・フレームは係数セグメントと励起セグメントを含むステップからなるように構成される。
さらに、本発明は、互換性のないボコーダ間でオーディオ信号を送信する方法において、
a) 第1のボコーダから第1フォーマットのデータ・フレームを受信し、このデータ・フレームは係数セグメントと励起セグメントを含み、
b) 第1フォーマットのデータ・フレームを中間フォーマットのデータ・フレームに変換するステップは、さらに、
i) 第1フォーマットのデータ・フレームの係数セグメントを処理して中間フォーマットのデータ・フレームの係数セグメントを生成し、
ii) 第1フォーマットのデータ・フレームを処理して中間フォーマットのデータ・フレームの励起セグメントを生成し、
iii) 中間フォーマットのデータ・フレームの係数セグメントと中間フォーマットのデータ・フレームの励起セグメントを結合して、第1フォーマットのデータ・フレームに含まれるオーディオ情報を表す中間フォーマットのデータ・フレームを生成するサブ・ステップを含み、
c) 中間フォーマットのデータ・フレームを第3フォーマットのデータ・フレームに変換するステップは、さらに、
i) 中間フォーマットのデータ・フレームの係数セグメントを処理して第3フォーマットのデータ・フレームの係数セグメントを生成し、
ii) 中間フォーマットのデータ・フレームを処理して第3フォーマットのデータ・フレームの励起セグメントを生成し、
iii) 第3フォーマットのデータ・フレームの係数セグメントと第3フォーマットのデータ・フレームの励起セグメントを結合して第1フォーマットおよび中間フォーマットのデータ・フレームに含まれるオーディオ情報を表す第3フォーマットのデータ・フレームを生成するサブ・ステップを含み、
d) 第3フォーマットのデータ・フレームを第2のボコーダに送信するステップからなるように構成される。
さらに、本発明は、コンピュータにオーディオ信号を処理するよう命令するプログラム要素を含み、前記のコンピュータは入力および出力から構成され、前記のプログラム要素は前記のコンピュータを前記の入力に印加された第1フォーマットの圧縮オーディオ・データのフレームに応答させ、前記の出力において第2フォーマットの圧縮オーディオ・データのフレームを生成し、第1フォーマットのフレームは係数セグメントと励起セグメントを有し、第2フォーマットのフレームは係数セグメントと励起セグメントを有し、前記のプログラム要素は前記のコンピュータ機能ブロックを実行する機械式可読保存メディアにおいて、
a) 前記の入力に接続され、第1フォーマットの圧縮オーディオ・データのフレームの係数セグメントを受信し、前記の出力において第2フォーマットの圧縮オーディオ・データのフレームの係数セグメントを送信する第1の処理手段と、
b) 前記の入力に接続され、第1フォーマットの圧縮オーディオ・データのデータ・フレームから第2フォーマットの圧縮オーディオ・データのデータ・フレームの励起セグメントを生成する第2の処理手段を含むように構成される。
さらに、本発明は、第1フォーマットの圧縮オーディオ信号のフレームを第2フォーマットの圧縮オーディオ信号のフレームに変換し、その第1フォーマットのフレームは係数セグメントと励起セグメントを有し、第2フォーマットのフレームは係数セグメントと励起セグメントを有するボコーダ間インタフェース・ノードにおいて、
a) 第1の入力と第1の出力を含み、前記の入力に印加された第1フォーマットの圧縮オーディオ・データのフレームに応じて前記の出力において中間フォーマットの圧縮オーディオ・データのフレームを生成し、前記の中間フォーマットのフレームは係数セグメントおよび励起セグメントを有する第1のトランスコーダと、
b) 第2の入力と第2の出力を含み、前記第2の入力は前記第1の出力にリンクして中間フォーマットの圧縮オーディオ・データを受信し、前記第2の入力に印加された中間フォーマットの圧縮オーディオ・データのフレームに応じて前記第2の出力において第2フォーマットの圧縮オーディオ・データのフレームを生成する第2のトランスコーダとを含むように構成される。
【図面の簡単な説明】
図1は、従来のCELPボコーダのエンコーダ段階を表すブロック図である。
図2は、従来のCELPボコーダのデコーダ段階を表すブロック図である。
図3は、ワイヤレス移動端末と固定(有線)端末の間の通信リンクを表す概念図である。
図3bは、本発明の実施の形態の2台のトランスコーダを含む2台のワイヤレス移動端末間の通信リンクを表す概念図である。
図3cは、本発明の実施の形態のクロス・トランスコーディング・ノードを含む2台のワイヤレス移動端末間の通信リンクを表す概念図である。
図4は、本発明に従って構成され、信号をPCMタイプのディジタル化技術へ伸長することなく、共通フォーマットを介してあるフォーマットから他のフォーマットへ圧縮通話信号を翻訳するシステムを表わすブロック図である。
図5は、図4に示されたシステムを詳細に表したブロック図である。
図6は、図5のシステムの変換例であるクロス・トランスコード・ノードのブロック図である。
図7aは、IS54フォーマットのデータ・フレームを表す図である。
図7bは、図5または図6に描かれたトランスコーダが生成する共通フォーマットのデータ・フレームを表す図である。
図7cは、IS641フォーマットのデータ・フレームを表す図である。
図8は、IS54フォーマットの圧縮通話フォーマットを共通フォーマットに変換する動作を表すフローチャートである。
図9は、共通フォーマットのデータ・フレームを圧縮通話フォーマットIS641に変換する動作を表すフローチャートである。
図10は、図5に描かれたタイプの擬似エンコーダの機能を実行する装置を表すブロック図である。
図11は、図10に表された装置を示す機能ブロック図である。
図12は、図10に表された装置の変形例を示す機能ブロック図である。
発明の実施の形態
以下は、ワイヤレス電気通信で現在使われている線形予測符号化(LPC)ボコーダ技術の説明である。一つのアプリケーションとして、移動端末と固定基地局間で信号のワイヤレス送信がある。また、他のアプリケーションとして、有線ネットワークの他の部分で異なるボコーダが使われている場合のインターネット通信ネットワーク上の通話の送信がある。
チャネル帯域幅が貴重である通信応用においては、送信チャネルに使われる帯域幅はできる限り小さくすることが重要である。一般的にはユーザのオーディオ信号を送信前に量子化し圧縮する方法がよく使われる。
典型的には、オーディオ信号はまず多くの量子化技術の1つを使ってディジタル化される。これらの技術の例としては、パルス振幅変調(PAM)、パルス符号変調(PCM)、およびデルタ変調などがあるが、PCMがもっとも一般的である。基本的にPCMでは、アナログ信号のサンプルが指定されたレートでとられ(一般的には8kHz)、離散値に量子化されディジタル・フォーマットで表現される。
その後エンコード段階とデコード段階を含むコーデックを使い、ディジタル信号を発信原ポイントで圧縮し、受信ポイントで伸長し、送信チャネルの使用を最適化する。特にオーディオ信号用に使われるコーデックは、ダビングされた「ボコーダ」に使われる(オーディオコーダの場合)。通話信号の必要な特性だけをエンコードするため、必要なビットより少なく送信し、しかも通話の品質を大幅に落とさずに原波形を再生できる。必要なビット数が少ないので、低いビット・レート送信が達成される。
現在ほとんどの低ビット・レート・ボコーダは線形予測符号化(LPC)シリーズであり、関連する通話の特徴を時間ドメイン内の波形から抽出する。ボコーダは、エンコーダとデコーダという2つの主な構成要素から構成される。エンコーダ部分はディジタル化された通話信号を処理して圧縮し、一方、デコーダ部分は圧縮された通話をディジタルオーディオ信号に伸長する。
LPCタイプのボコーダは過去のpサンプルのオーディオ(Sn-k)の加重合計を使って現在のサンプル(Sn)を予測する。数字pはモデルの次数を決定する。次数が高ければ通話の品質はよくなる。典型的なモデルの次数の範囲は10から15である。通話サンプルの等式は次の通りである。
この式で
akは最後のSn-kサンプルの寄与を決定する係数である。
enは現在のサンプルのエラー信号である。
snとenのz変換を使って予測フィルタを定義すると、次の式が得られる。
この式で
フィルタ
だけが極を有し、従って全極フィルタと呼ばれる。
図1はCELPボコーダの一般的なモデルのエンコーダ部分を表すブロック図である。この図から分かるようにエンコーダ部分のオーディオ領域分析ブロック100への入力はPCMサンプルであり、その出力はLPCフィルタ係数セグメントと、予測エラー信号(残差とも呼ばれる)を表すいくつかのパラメータからなる励起セグメントを構成する。この出力は電気通信チャネルに送られる。
係数セグメント内のLPCフィルタ係数の数は、モデルの次数pによって決定される。励起セグメント・パラメータとしては、励起の性質(オーディオまたは非オーディオ)、ピッチ周期(オーディオ励起の場合)、ゲイン係数、エネルギ、ピッチ予測ゲインなどがある。コード励起線形予測ボコーダは現在、電話でもっともよく使われているタイプのボコーダである。CELPは、励起パラメータを送る代わりに、適応的および確率的コードブックの中で一連のベクトルを指すインデックス情報を送る。すなわち、各通話信号に対して、エンコーダはコードブックを通じて、LPC合成フィルタへの励起として使われた時に知覚的にそのオーディオに一番よくマッチするものを検索する。
この情報を含む通話フレームは、T秒ごとに再計算される。Tの共通の値は20msである。1つの20ms圧縮通話フレームは8kHzで取られた160PCMサンプルを表す。
図2は、CELPボコーダの一般的なモデルのデコーダ部分を表すブロック図である。圧縮された通話フレームは電気通信チャネル210から受信され、LPC合成フィルタ220に送られる。LPC合成フィルタ220はLPCフィルタ係数セグメントと励起セグメントを使って、PCMサンプル・フォームの出力通話信号を通常生成する。
ボコーダを強化するために補完とよばれる技術が使われる。これは20msの通話フレームを5msのサブフレームに分割し、これらの予測係数を補完する。この技術は、生成された通話信号内で望ましくない「ポップ」や「クリック」ノイズが出ないようにするために役立つ。これらのノイズは通常、予測係数内で1つの信号フレームが他の信号フレームに急速に変化する結果として発生するものである。各信号フレームは4つのサブフレームに分割され、便宜上、それぞれサブフレーム(1)、サブフレーム(2)、サブフレーム(3)、サブフレーム(4)と呼ぶことにする。第1のサブフレーム、つまりサブフレーム(1)上で通話信号を生成するために使う予測係数は、以前のフレームの予測係数と、現在のフレームの係数の組み合わせであり、組み合わせの比率は75%/25%である。サブフレーム(2)については、この比率は50%/50%、サブフレーム(3)では25%/75%、最後のサブフレーム(4)では0%/100%に変化する。つまり、最後のサブフレームでは現在のフレームからの係数だけが使われる。
図3a、3b、3cはワイヤレス・リンクを含んだ電話通信を示し、CELPボコーダ技術を実現するための概念図である。
図3aは、ワイヤレス移動端末300と固定(有線)端末330の間の通信リンクを表した概念図である。通話は移動端末300にあるボコーダによって圧縮(エンコード)され、ワイヤレス・リンク(RFチャネル)を介して基地局310に送られ、そこで第2のボコーダのデコードによってPCMサンプルにデコードされる。その後、信号は電話通信会社ネットワーク315のディジタル中継線の中にある種々のスイッチを通って中央局320に送られ、その中央局320は物理的に固定端末330に接続されている。中央局ではディジタル信号はアナログ・フォーマットに変換され、端末330に送られる。そのようなシナリオでは、通話の圧縮と伸長は1度ずつである。
図3bは本発明の実施の形態の2つのワイヤレス移動端末340と380をつないだ通信リンクの概念図であり、2つのトランスコーダを含む。通話は移動端末A340にあるボコーダによって圧縮(エンコード)され、ワイヤレス・リンク(RFチャネルA)を介して基地局A350に送られ、そこで第2のボコーダのデコーダによってPCMサンプルにデコードされる。PCMサンプルはその後電気通信会社のネットワーク360を介して第2の移動端末の基地局B370に送られ、そこで第2の基地局ボコーダによって2回目の圧縮(エンコード)が行われる。
圧縮された信号はワイヤレスリンク(RFチャネルB)を介して移動端末380に送られ、第2の移動端末のボコーダで2回目のデコードが行われる。その後、移動端末380でオーディオ通話が可能となる。図3bは、2つのトランスコーダ392と394を含む本発明の実施の形態を表し、詳細は以下に説明する。
図3cは、2つのワイヤレス移動端末間の通信リンクを表す概念図であり、本発明の実施の形態のクロス・トランスコード・ノード390を含む。クロス・トランスコード・ノードを詳細は以下に説明する。
ボコーダのこの構成はいわゆるタンデム・ボコードの例である。他のタンデム・ボコードの例として、他にワイヤレス移動端末が固定ワイヤレス端末と通信し、任意のタイプのワイヤレス端末が、ボコーダを使って通話を圧縮する中央のボイスメールシステムからのメッセージを検索し、その後データを保存する場合がある。このような場合、通話は1回以上ボコーダの圧縮および伸長アルゴリズムにかけられる。ボコーダがこのような方法でタンデム化されていると、通話の質は通常劣化する。
低ビット・レートのコーデック(ボコーダ)のタンデム接続によって生じた通話信号の劣化を補償するために、「バイパス」と呼ばれる方法が開発され、この方法では、基地局350と370中でボコーダが2重のデコード/エンコードをしないようにする。この方法の基本的な考え方は、基地局A350が、信号と制御を通じて移動端末B380中のボコーダが移動端末A340中のボコーダと同じであることを知ってボコーダをバイパスするので、信号データ・フレームが変更なしに直接ディジタル・トランク360に送られる。同様に、基地局370は圧縮通話データ・フレームを受信することを知っているので、コーディングを行わないで単に信号を移動端末B380に送信する。このバイパス方法は、本明細書の前半で言及された国際出願に詳しく説明されている。
しかしながら、この解決法はボコーダが同じ時のみ有効である。ネットワークの急速な拡大に伴い、ボコーダの多様性も増大している。したがって、バイパス方法はタンデム・ボコーダを含む接続の一部でしか使用できない。
本発明は、呼の間、ボコーダがタンデムに接続されている時に起きる信号の劣化を低減する方法とシステムを提供する。このシステムは、接続の間に圧縮された通話データ・フレームを中間の共通表現に変換するメカニズムとプロトコルを特徴としており、2つの移動端末の間または、移動端末と固定ワイヤレス端末の間の通信のどちらにも適用できる。
図4は、本発明に従って設計されたシステムを表わすブロック図で、信号をPCMタイプのディジタル信号に伸長することなく、圧縮された通話信号を、共通のフォーマットを介してあるフォーマットから他のフォーマットに翻訳する。
図5は本発明に従った方法を実行する特定の実施の形態を示し、同じ機能ブロックを有する2つのトランスコーダを有するモジュラ・クロス・トランスコーディング・システム510を示すブロック図である。トランスコーダは通信パスの終端にインストールされた分離されたデバイスであり、信号変換機能を提供する。これらの信号変換機能は、そのネットワークがどの通信基準を使っているかによって異なる。典型的な応用では、各トランスコーダはネットワーク中の基地局に関連している。このようにしてトランスコーダが生成した信号は電話ネットワーク上で第2のトランスコーダに送られ、そこで処理される。この詳細は後で説明する。どちらのトランスコーダも同じ機能ブロックを有する。簡単に説明するために、ここでは1つのトランスコーダだけ説明するが、もう1つの装置についても説明は同じである。
トランスコーダ510は、シグナリングおよび制御ブロック520、エンコーディング・ブロック530、デコーディング・ブロック540を含む。シグナリングおよび制御ブロック520の主な機能は、PCMビット・スチール(バンド内信号)または中央のデータベースからの直接通信を通じて、リンクの他の終端のエンティティと通信する(または通信を試みる)ことであり、以下のどれかを決定する。
a) 接続が同じLPCタイプのボコーダ上で終端する。
b) 接続が異なるLPCタイプのボコーダ上で終端する。
c) 接続が上記のa)またはb)以外のエンティティ上で終端する(すなわち、他のタプルのボコーダ、新しいタイプのLPCボコーダ、有線端末など)。
デコーディング・ブロック540はデコーダ542、擬似デコーダ544およびバイパス部546から構成される。デコーディング・ブロック540は、シグナリングおよび制御ブロック520の制御のもとに、次のうちどれか1つのタスクを実行する。
a) 接続が同じLPCタイプのボコーダで終了する場合、圧縮通話信号を移動端末Aから、圧縮通話データを圧縮通話データを通過させるバイパス部546を通じて、トランスコーダ550のバイパス部586に送信して、移動端末Bに送る。
b) トランスコーディング・モジュールが用できる異なるLPCタイプのボコーダ上で接続が終端される時、擬似デコーダ544を用いて圧縮通信データを移動端末Aから共通フォーマット信号に変換し、トランスコーダ550の擬似エンコーダ584に送信する。
c) 接続が上記のa)またはb)でカバーされないエンティティで終端される場合(すなわち、他のシリーズのボコーダ、新しいタイプのLPCボコーダ、有線端末など)、通話デコーダ542を用いて移動端末Aから圧縮通話データをPCMサンプルに変換し、トランスコーダ550のエンコーダ582または中央局590に送信する。
エンコーディング・ブロック530は、エンコーダ532、擬似エンコーダ534、およびバイパス部536から構成される。シグナリングおよび制御ブロック520の制御の元に、エンコーディング・ブロック530は以下のタスクのうちどれか1つを実行する。
a) 接続源が同じLPCタイプのボコーダを有している場合、トランスコーダ550のバイパス部576から受信された通話信号をバイパス部536に送り、バイパス部536は圧縮されたデータを再フォーマットした後通過させ、トランスコーダ510が接続されている移動端末Aに送信する。
b) 接続源が異なるLPCタイプのボコーダを有しトランスコーディング・モジュールが使用できる場合、擬似エンコーダ534を起動して、トランスコーダ550の擬似デコーダ部574から受信された共通フォーマットの信号を圧縮通話データに圧縮し、その信号を移動端末Aに送出する。
c) 接続が上記のa)またはb)でカバーされないエンティティで終わる場合(すなわち他のシリーズのボコーダ、新しいタイプのボコーダ、有線端末など)、通話エンコーダ532を用いてトランスコーダ550のデコーダ572または中央局590から受信されたPCMフォーマット・サンプルを圧縮通話データに変換し、圧縮された通話データを移動端末Aに送出する。
トランスコーダ510中のシグナリングおよび制御ブロック520はトランスコーダ550に向けてメッセージを送信し、トランスコーダ550からメッセージを受信し、トランスコーダ550から受信された、またはトランスコーダ550に向けて送られたデータに従ってトランスコーダの動作を正しく調整する。2つのトランスコーダ間の通信は、これらの間に確率された通信チャネルを通じて実行される。通信チャネルはバンド内の場合もバンド外の場合もある。
PCM送信の間、ビット・スチール・プロセスが使われる。このプロセスでは、ある通話サンプルからのあるビットを使ってシグナリング情報を送信する。信号ビットの位置とビット抽出レートはビット置き換えの知覚的な効果を低減するために選択され、どちらかの移動端末での可聴信号はあまり影響を受けない。受信トランスコーダは通話サンプル内の信号ビットの位置を知っているので、メッセージをデコードすることができる。
トランスコーダ510と550の間のハンドシェーク手順には、1つのトランスコーダが相手のトランスコーダを識別できる異なるメッセージの交換を含む。従って、すべての装置は最良の通話品質を生成できるモードに設定することができる。ハンドシェーク手順は以下のメッセージの交換を含む。
a) シグナリングおよび制御ブロック520のトランスミッタは、トランスコーダ510が生成するPCM通話信号内に識別子を埋め込む。この識別子を使うと任意の遠隔エンコーダが、発信源のトランスコーダ、つまりトランスコーダ510に接続されたボコーダのタイプを正しく決めることができる。この識別は動作を探しているデータベースが実行でき、その詳細は以下の通りである。
b) シグナリングおよび制御ブロック560はトランスコーダ550が受信したデータ・フレームを試験し、任意の帯域幅内のシグナリング情報を抽出する。これはデータ・フレーム内の所定の位置でビット値を測定することによって実行される。メッセージがトランスコーダ識別子であった場合、データベース(図中には示されていない)に問い合わせ、メッセージを生成したトランスコーダに接続されたボコーダのタイプを決定する。メッセージの内容によって以下の可能性がある。
1) エンコーディング・ブロック530および580、およびデコーディング・ブロック540および570に対するデフォルト・モードは、エンコーダ532および582、デコーダ542および572がアクティブで、一方、擬似エンコーダ534および584、擬似デコーダ544および574、およびバイパス部536,546,576、586に対する残りの機能モジュールが非アクティブである。これは、トランスコーダ510(または550)がネットワーク内の相手のトランスコーダの存在を認識していない場合、トランスコーダは通常のボコーダとして機能する、すなわち移動端末Aから受信された圧縮通話データを輸送ネットワークに入力されるPCMサンプルに変換することを意味する。同様に、トランスコーダは、輸送ネットワークからのPCMサンプルを受信し、これらのサンプルをこのトランスコーダがサービスする移動端末のボコーダと互換性のある圧縮フォーマットに変換することを期待する。
2) シグナリングおよび制御ブロック510が遠隔トランスコーダの存在を識別した場合、トランスコーダの識別子はローカル・データベースの中で確認され、メッセージを送るトランスコーダのタイプを決定する。ここで、もし
i) トランスコーダが同じであった場合、すなわち遠隔トランスコーダに接続されたボコーダが同じフレーム・フォーマット、またはトランスコーダ510にリンクされたボコーダの標準に従って動作している場合、シグナリングおよび制御ブロック520によってデコーディング・ブロックがバイパス段階546を実行できるようになり、一方、デコーダ542および擬似デコーダ544は無効になる。このように、遠隔トランスコーダから受信された圧縮通話データは、デコーディングされないで移動端末Aに送られる。この動作モードは、ボコーダ・タンデム化が行われないので、可能な限り最高の音質を達成する方法の1つである。シグナリングおよび制御ブロック520はまたエンコーディング・ブロック530を切り換え、どのバイパス536がアクティブであるかを伝える。一方、エンコーダ532および擬似エンコーダ534は非アクティブである。このように、移動端末Aから受信された圧縮通話データはデコーディングされることなくトランスコーダ510を通過する。エンコーディング・ブロック530をバイパス・モードに切り換える決定は、遠隔トランスコーダ550のシグナリングおよび制御ブロック560がトランスコーダ510の識別子を受信し、デコーディング・ブロック570およびエンコーディング・ブロック580をバイパス・モードに設定したという仮定に基づいている。この場合、全二重伝送接続が圧縮通話信号を交換するトランスコーダ間で確立される。
ii) トランスコーダが異なる場合、つまり遠隔トランスコーダが「移動端末Bに関連したボコーダが異なるLPCタイプである」と示した場合、シグナリングおよび制御ブロック520はデコーディング・ブロック540に擬似デコーダ544をアクティブにさせ、一方、デコーダ542およびバイパス546を非アクティブにする。この動作モードでは、シグナリングおよび制御ブロック520は、擬似デコーダ544を移動局Aに関するボコーダのフォーマットに変換する共通フォーマットにエンコードされた通話信号を受信することを期待する。また、シグナリングおよび制御ブロック520は、擬似エンコーダ534がアクティブでエンコーダ532およびバイパス536が非アクティブであるモードにエンコーディング・ブロック530を切り換える。このように、トランスコーダ510が生成したデータは、擬似エンコーダ584は移動端末Bに関するボコーダのフォーマットでエンコードされた共通フォーマットである。
本発明の他の実施の形態は、図6に示されるようなクロス・トランスコード・ノードである。説明の簡単化のために、クロス・トランスコード・ノードのうち半分だけが示される。クロス・トランスコード・ノードのもう半分は同じであり、反対方向の通信を行う。クロス・トランスコード・ノード600は、異なる通話コーデックス間の中央インタフェースとして機能する。本質的に、トランスコード・ノード600は、前の実施の形態で説明されたように互いに別ではなく、物理的に互いに接続された2つのトランスコードペアとみることができる。各トランスコーダに対する他のシグナリングおよび制御ブロックを使う代わりに、単一の信号および制御段階610が使用される。クロス・トランスコード・ノード600は、デコーディング・ブロック620、エンコーディング・ブロック630およびスイッチ640も含む。
シグナリングおよび制御ブロック610の主な機能はリンクの他終端のエンティティと通信し(または通信しようと試み)、以下の事項を決定する。
a) 接続が同じLPCタイプのボコーダ上で終端しているか。
b) 接続がトランス・コーディングモジュールが使用される異なるLPCタイプボコーダ上で終端しているか。
c) 接続が上記のa)またはb)(すなわち、他のシリーズのボコーダ、新しいタイプのLPCボコーダ、有線端末など)でカバーされないエンティティ上で終端しているか。
タイミングおよび同期化情報を使ってデコーディング・ブロック620およびエンコーディング・ブロック630を制御する。制御情報を使ってスイッチ640の正確な位置を選択し、正しい信号を通じてルーティングする。
デコーディング・ブロック620はデコーダ622、擬似デコーダ624およびバイパス部626から構成される。エンコーディング・ブロック630はバイパス部632、擬似エンコーダ634およびエンコーダ636から構成される。
2つのボコーダを相互接続する場合、クロス・トランスコーディング・ノードは次のように機能する。シグナリングおよび制御ブロック610の制御の元に、デコーディング・ブロック620は以下のタスクのうち1つを実行する。
a) 接続が同じLPCタイプのボコーダ上で終端している場合、圧縮通話信号をバイパス部262に送り、バイパス部262はバイパス部632を介して通話データを、再フォーマットした後に通過させ、同じLPCタイプのボコーダに送信する。
b) 接続がトランスコーディング・モジュールが使える異なるLPCタイプのボコーダ上で終端している場合、擬似デコーダ624を用いて圧縮通話データを共通フォーマット信号に変換し、信号を擬似エンコーダ634に送り、共通フォーマットを圧縮信号に再変換し、最後に圧縮通話信号を異なるLPCタイプのボコーダに送信する。
c) 接続が上記のa)またはb)(すなわち他のシリーズのボコーダ、新しいタイプのLPCボコーダ、有線端末など)をカバーしないエンティティで終端している場合、通話デコーダ622を用いて、圧縮通話データをPCMサンプルに変換し、信号をエンコーダ636に送ってPCMサンプルを圧縮通話信号に再変換し、最後に圧縮通話信号を終端エンティティに送る。
有線端末に接続されている場合、クロス・トランスコーディング・ノードは次のように機能する。PCM信号は入ってくるとスイッチ640に送られ、シグナリングおよび制御ブロック610はスイッチを選択して信号をエンコーダ636に送出し、そこで信号は圧縮通話に変換され、最後に圧縮通話が外部ボコーダに送られる。有線端末が通信の受信終端上にあり、圧縮通話信号が入力されると、信号はデコーダ622に送られ、そこでPCMフォーマットに変換され、その後シグナリングおよび制御ブロックはスイッチを選択して信号を有線端末に送出する。
次に、擬似エンコーダ装置が圧縮信号から共通フォーマット信号への変換、および共通フォーマットから圧縮信号への逆変換を実行する方法に関する特定の例を説明する。特に、通話信号が移動端末(MT)A340からMTB 380に送られる時に、通話信号が変換される場合を考える。この例ではMTAは、IS54ワイヤレス電話通信標準内のベクトル合計強化線形予測(VSELP)を使っている。図7aはIS54のフレーム・フォーマットを説明している。信号は図7bのように共通フォーマットに変換され、受信終端ではMTBはIS641標準内の強化フル・レート・コーダ(EFRC)を使っている。図7cはIS641用のフレーム・フォーマットを説明している。
図3bおよび図5において、この例の変換では、通話信号はMTA340にあるVSELPボコーダによってIS54標準に圧縮(エンコード)され、ワイヤレス・リンク(RFチャネルA)を介して基地局A350に送られ、そこでトランスコーダ510内の擬似デコーダ544によって共通フォーマットに変換される(図5に示す)。共通フォーマット・データ・フレームは、その後、電気通信会社ネットワーク360を介してトランスコーダ550に送られ、そこで擬似エンコーダ584によってIS641標準の圧縮通話に変換される。圧縮信号はワイヤレス・リンク(RFチャネルB)を介してMT380に送られ、ここで第2のMTのEFRCボコーダによってデコードされる。その後、MT380において通話が使用できる。
擬似デコーダ544は図7aに示されるようにIS54フォーマットで通話のデータ・フレームを受信し、それを下記および図8のフローチャートで説明するように変換する。擬似デコーダ544は自己の量子化器を使って20msデータ・フレームのLPC反射係数を表す10次元ベクトルを再計算する。その後10次元ベクトルを使って、4つのサブフレームについて4セットの補完LPC係数ベクトルを決定する。補完の方法は、前記の方法と同じである。共通フォーマット・データ・フレームのこの部分は準備ができており、擬似デコーダ544はそれを保存して後から検索する。擬似デコーダ544はその後圧縮フォーマットから4つの遅延値(ピッチ遅延)を読む。擬似デコーダ544はこれらを保存し、後で共通フォーマットに補完する。擬似デコーダ544は、その後、サブフレーム用のコードブック情報、ゲイン係数、ピッチ遅延、およびフレーム用のフレーム・エネルギを使い、共通フォーマット用の合成励起信号(4回40サンプル)を生成する。最後に、励起信号と保存されたLPCフィルタ係数、ピッチ遅延を連結することによって共通フォーマット・データ・フレームが構成される。このデータ・フレームは次の基地局の擬似エンコーダ584に送られる。図7bでは、エネルギおよびピッチ予測ゲイン情報用の共通フォーマット・フレーム内の情報ビットを保持する。この情報はこの例では計算されていない。
図9に示されるように、擬似エンコーダ584は共通のフォーマット通話データ・フレームを受信し、IS641圧縮通話フォーマットに変換して、MTBにおけるEFRCが正しくデコードする必要がある。擬似エンコーダ584は4つのサブフレームについてLPC係数を読み出し、最初の3つのサブフレームの係数を捨てて、第4のサブフレームの係数だけを維持する。これはフレーム全体について計算されたLPC反射係数である。この例では、MTBにおけるEFRCボコーダはIS−641補完スキーマにしたがって最初の3つのサブフレーム・ベクトルを補完するため、変換用の最初の3つのベクトルは必要とされない。しかしながら、他のタイプのボコーダが使われている場合は、4つのベクトルすべてを変換用に使うこともある。この時点で擬似エンコーダ584は自己の量子化器を使って4番目のサブフレームのLPC反射係数を再量子化する。擬似エンコーダが10個のLPC反射係数をその量子化器に送る前に、まずこれらをLP(線形予測)係数に変換し、その後線形スペクトル・ペア(LSP)係数に変換し、最後に線形スペクトル周波数(LSFベクトル)に変換する必要がある。LSFベクトルは、その後量子化され、量子化されたLSPベクトルに変換される。この量子化されたLSFベクトルはIS641フォーマットの一部であり、そのまま保存される。次に、擬似エンコーダ584は量子化LSPベクトルを量子化LP係数に変換し、LP係数を最初の3つのサブフレームに対して補完する。このLP係数ベクトルのセットは次のステップで使われる。
擬似エンコーダ584は共通フォーマットの励起信号を使い、4つの40サンプル・サブフレームをそれぞれ合成フィルタに送り、量子化され補完されたLP係数をタップ係数として使って通話信号を再生する。擬似エンコーダ584は通話信号からピッチ遅れ(この方法は通常のEFRCエンコーダと同じである)、ゲイン値および励起値(MTBコードブックの代数コード)を、前に計算された10個のLSP係数を使って計算する。最後にIS641圧縮通話フォーマット・フレームは量子化されたピッチ遅れ、ゲイン値、励起値、および保存されたLSPベクトルを使って組み立てられる。この通話データ・フレームはMTB内のEFRCデコーダに送られ、通常のように通話信号に変換される。
共通フォーマットからのピッチ遅れ情報はこの例では使われないが、他の変換では使う場合もある。その代わりに、ピッチ遅れ情報は生成された通話信号から既知のアルゴリズムを使って計算される。
すなわち、擬似デコーダ534は入力される圧縮通話信号を係数部分と励起部分を有する共通フォーマットに変換する。その後、擬似エンコーダはこの共通フォーマットを使って圧縮通話を再生するが、そのフォーマットは擬似デコーダ544に入力される圧縮通話とは異なる。詳しく言えば、擬似エンコーダ584は、共通フォーマット信号の係数部分から、擬似エンコーダ584が出力する圧縮通話信号の係数を構成する。共通フォーマット信号に基づいて通話信号が再生され、任意の励起を抽出するために使われ、また圧縮通話信号に対して計算された係数に関する他の情報が通話情報を表わすために使われる。
トランスコーダ510の擬似エンコーダと擬似デコーダは、相互作用するボコーダのタイプに従って設計される。共通要素は、各擬似デコーダが圧縮通話信号を受信し、順次擬似エンコーダによって他の圧縮通話信号フォーマットに変換される共通フォーマット信号を生成する。この機能を使うとシステムは非常にフレキシブルになり、新しいボコーダが導入された時に特にフレキシブルになる。これによって、新しいボコーダ信号フォーマットと共通フォーマットの間で互いに変換を行う擬似エンコーダと擬似デコーダをよりよく設計できる。システムが使う共通フォーマットは同じなので、既存のトランスコーダを変更する必要はない。
構造の点からみると、図10で説明した装置を使って擬似エンコーダ584の機能を実行することができる。擬似エンコーダ584の動作は図9を使って上述されている。この装置は入力信号ライン910、信号出力ライン912、プロセッサ914およびメモリ916から構成されている。メモリ916はプロセッサ914の動作用の命令を保存し、またこれらの命令を実行するためにプロセッサ914が使うデータを保存する。バス918はメモリ916およびプロセッサ914の間で情報を交換するために供給する。
メモリ916に保存されているメモリを使うと、装置は図11に表示される機能ブロック図に従って動作する。この装置には係数セグメント・コンバータが含まれ、図9において説明されているように、既知の数学的操作を使って係数セグメントを共通フォーマット・フレームから圧縮オーディオ信号フレーム、この例ではIS641フレーム・フォーマットの係数セグメントに変換する。また、この装置は合成フィルタを含み、この合成フィルタは、係数セグメント・コンバータから4つのサブフレームに対する量子化LPC係数を受信する。合成フィルタは、また共通フォーマット・フレームの励起セグメントから励起信号を受信し、オーディオ信号を構成する。その後、この信号は合成−分析プロセスに入力され、IS641フレーム・フォーマットに対する励起セグメントを生成する。この時、係数セグメント・コンバータが出力した量子化LSPベクトルをタップ係数として使う。
図12は図5に表された擬似デコーダ544のブロック図である。この装置は2つの主な機能ブロック、すなわちIS54フォーマットのデータ・フレームから係数セグメントを受信し、これを共通フォーマット・データ・フレームの係数セグメントに変換する係数セグメント・コンバータを有する。さらに、この装置は、IS54データ・フォーマットからの励起セグメントの要素を使って、それを共通フォーマット・データ・フレームの励起セグメントに変換する励起セグメント・コンバータを有する。この設計では、圧縮オーディオ信号のデータ・フレームのすべてのセグメントを使って共通フォーマットのデータ・フレームを構成するように設計されている。
特定の用途のトランスコーダを設計する時、擬似エンコーダと擬似デコーダは、図11および12で示された装置の1つを使って構成することができる。どちらのシステムを選択するかは実行される特定のフォーマット翻訳によって異なる。圧縮オーディオ信号のフォーマット(データ・フレーム源または宛先データ・フレームのどちらか)が、データ・フレーム源からの係数セグメントと励起セグメントが独立して処理され宛先データ・フレームへの翻訳に影響を与えるときには、図12に描かれた装置が動作に最も適している。他方、オーディオ信号の再構成がさらに適切な場合、図11に描かれた装置を使うことができる。
エンコーダの構成と各トランスコーダのバイパス段階は、当業者が現在知っているシステムに従って構成できる。具体的には、エンコーダおよびデコーダは図1および2のブロック図に従ってそれぞれ構成することができ、一方バイパス機構は上記の国際出願の開示に従って設計することができる。
本発明の内容から離れることなく、種々の変更、応用が可能であるので、上記の実施の形態は限定要因ではない。本発明の範囲は以下の請求項によって定義される。
Claims (33)
- 入力と出力から構成され、前記の入力に印加された第1フォーマットの圧縮オーディオ・データのフレームに応じて上記の出力において第2フォーマットの圧縮オーディオ・データのフレームを生成し、第1フォーマットのフレームは係数セグメントと励起セグメントを有し、第2フォーマットのフレームは係数セグメントと励起セグメントを有するオーディオ信号処理装置において、
a) 第1フォーマットの圧縮オーディオ・データのフレームの係数セグメントを前記入力に受信し、第2フォーマットの圧縮オーディオ・データのフレームの係数セグメントを前記出力に生成する第1の処理手段と、
b) 前記入力に接続され、第1フォーマットの圧縮オーディオ・データのデータ・フレームから第2フォーマットの圧縮オーディオ・データのデータ・フレームの励起セグメントを生成する第2の処理手段とを備え、
ここで、前記第1の処理手段は、第1フォーマットの圧縮オーディオ・データのデータ・フレーム内で励起セグメントをほとんど使うことなく、第2フォーマットの圧縮オーディオ・データのフレームの係数セグメントを生成することを特徴とするオーディオ信号処理装置。 - 請求項1記載の装置において、
前記第1の処理手段は、量子化器を含むことを特徴とするオーディオ信号処理装置。 - 請求項1記載の装置において、
前記第2の処理手段は、量子化器を含むことを特徴とするオーディオ信号処理装置。 - 請求項1記載の装置において、
前記第2の処理手段は、第1フォーマットの圧縮オーディオ・データのデータ・フレームの係数セグメントをほとんど使うことなく、第2フォーマットの圧縮オーディオ・データのデータ・フレームの励起セグメントを計算することを特徴とするオーディオ信号処理装置。 - 請求項1記載の装置において、
前記第2の処理手段はフィルタを含むことを特徴とするオーディオ信号処理装置。 - 請求項5記載の装置において、
前記フィルタは、
再構成されたオーディオ信号を受信する第1の入力と、第2フォーマットの圧縮オーディオ・データのデータ・フレームの係数セグメントを受信する第2の入力とを含むことを特徴とするオーディオ信号処理装置。 - 請求項1記載の装置において、
第1フォーマットはIS54であることを特徴とするオーディオ信号処理装置。 - 請求項1記載の装置において、
第1フォーマットはIS641であることを特徴とするオーディオ信号処理装置。 - a) 第1の入力と第1の出力を含み、前記第1のトランスコーダは前記の入力に印加された第1フォーマットの圧縮オーディオ・データのフレームに応じて前記の出力において中間フォーマットの圧縮オーディオ・データのフレームを生成し、第1フォーマットのフレームは係数セグメントと励起セグメントを有し、中間フォーマットのフレームは係数セグメントと励起セグメントを有する第1のトランスコーダと、
b) 第2の入力と第2の出力を含み、前記第1の入力は前記第1の出力にリンクされ中間フォーマットの圧縮オーディオ・データのフレームを受信し、前記第2の入力に印加された中間フォーマットの圧縮オーディオ・データのフレームに応じて前記第2の出力において第2フォーマットの圧縮オーディオ・データのフレームを生成し、第2フォーマットのフレームは係数セグメントと励起セグメントを有する第2のトランスコーダとを備えたことを特徴とする非互換性ボーダ間圧縮オーディオ情報データ・フレーム通信装置。 - 請求項9記載の装置において、
前記第1のトランスコーダは、
a) 前記第1の入力に接続され、第1フォーマットの圧縮オーディオ・データのフレームの係数セグメントを受信し、前記第1の出力において中間フォーマットの圧縮オーディオ・データのフレームの係数セグメントを生成する第1の処理手段と、
b) 前記入力に接続され、第1フォーマットの圧縮オーディオ・データのデータ・フレームから中間フォーマットの圧縮オーディオ・データのデータ・フレームの励起セグメントを生成する第2の処理手段とを生成することを特徴とする圧縮オーディオ情報データ・フレーム送信装置。 - 請求項10記載の装置において、
前記第1の処理手段が第1フォーマットの圧縮オーディオ・データのデータ・フレームの励起セグメントをほとんど使用することなく、中間フォーマットの圧縮オーディオ・データのフレームの係数セグメントを生成することを特徴とする圧縮オーディオ情報データ・フレーム送信装置。 - 請求項11記載の装置において、
前記第1の処理手段は量子化器を含むことを特徴とする圧縮オーディオ情報データ・フレーム送信装置。 - 請求項11記載の装置において、
前記第2の処理手段は量子化器を含むことを特徴とする圧縮オーディオ情報データ・フレーム送信装置。 - 請求項11記載の装置において、
前記第2の処理手段は第1フォーマットの圧縮オーディオ・データのデータ・フレームの係数セグメントをほとんど使用することなく、中間フォーマットの圧縮オーディオ・データのデータ・フレームの励起セグメントを計算することを特徴とする圧縮オーディオ情報データ・フレーム送信装置。 - 請求項11記載の装置において、
前記第2の処理手段はフィルタを含むことを特徴とする圧縮オーディオ情報データ・フレーム送信装置。 - 請求項15記載の装置において、
前記のフィルタは、再構成されたオーディオ信号を受信する第1の入力と、中間フォーマットの圧縮オーディオ・データのデータ・フレームの係数セグメントを受信する第2の入力を含むことを特徴とする圧縮オーディオ情報データ・フレーム送信装置。 - 請求項9記載の装置において、
前記第2のトランスコーダは、
a) 前記第2の入力に接続され、中間フォーマットの圧縮オーディオ・データのフレームの係数セグメントを受信し、前記第2の出力において第3フォーマットの圧縮オーディオ・データのフレームの係数セグメントを生成する第3の処理手段と、
b) 前記第2の入力に接続され、中間フォーマットの圧縮圧縮オーディオ・データのデータ・フレームから、第2フォーマットの圧縮オーディオ・データのデータ・フレームの励起セグメントを生成する第4の処理手段を含むことを特徴とする圧縮オーディオ情報データ・フレーム送信装置。 - 請求項17記載の装置において、
前記の第3の処理手段は、中間フォーマットの圧縮オーディオ・データのデータ・フレームの励起セグメントをほとんど使用することなく、中間フォーマットの圧縮オーディオ・データのフレームの係数セグメントを生成することを特徴とする圧縮オーディオ情報データ・フレーム送信装置。 - 請求項18記載の装置において、
前記の第3の処理手段は量子化器を含むことを特徴とする圧縮オーディオ情報データ・フレーム送信装置。 - 請求項18記載の装置において、
前記の第4の処理手段は量子化器を含むことを特徴とする圧縮オーディオ情報データ・フレーム送信装置。 - 請求項17記載の装置において、
前記の第4の処理手段は、中間フォーマットの圧縮オーディオ・データのデータ・フレームの係数セグメントをほとんど使用することなく、第2フォーマットの圧縮オーディオ・データのデータ・フレームの励起セグメントを計算することを特徴とする圧縮オーディオ情報データ・フレーム送信装置。 - 請求項17記載の装置において、
前記の第4の処理手段は、フィルタを含むことを特徴とする圧縮オーディオ情報データ・フレーム送信装置。 - 請求項22記載の装置において、
前記フィルタは、再構成されたオーディオ信号を受信する入力と、第2フォーマットの圧縮オーディオ・データのデータ・フレームの係数セグメントを受信する入力を含むことを特徴とする圧縮オーディオ情報データ・フレーム送信装置。 - ディジタル化さおよび圧縮された形でオーディオ情報を表わすデータ・フレームを処理し、そのデータ・フレームは係数セグメントと励起セグメントを含み、そのデータ・フレームは第1フォーマットである方法において、
a) 第1フォーマットのデータ・フレームの係数セグメントを処理して第2フォーマットのデータ・フレームの係数セグメントを生成し、
b) 第1フォーマットのデータ・フレームを処理して第2フォーマットのデータ・フレームの励起セグメントを生成し、
c) 第2フォーマットのデータ・フレームの係数セグメントとステップaおよびbで生成された第2フォーマットのデータ・フレームの励起セグメントを結合し、それぞれ第1フォーマットのデータ・フレームに含まれるオーディオ情報を表す第2フォーマットのデータ・フレームを生成するステップからなり、
ここで、前記第2フォーマットのデータ・フレームの励起セグメントを生成するステップbは、
i) データ・フレームの励起セグメントに含まれる情報上で少なくとも部分的にオーディオ信号を合成し、
ii) ステップiで合成されたオーディオ信号を分析し、第2フォーマットのデータ・フレームの励起セグメントの少なくとも一部分を生成するステップからなることを特徴とするオーディオ情報データ・フレーム処理方法。 - 請求項24記載の方法において、
フィルタを通して請求項24のステップaにおいて合成されたオーディオ信号を通過させ、前記のフィルタに前記の第2フォーマットのデータ・フレームの係数セグメントのタップ係数として供給するステップからなることを特徴とするオーディオ情報データ・フレーム処理方法。 - 請求項24記載の方法において、
第2フォーマットのデータ・フレームの励起セグメントの生成は、第1フォーマットのデータの励起セグメントの変換によってのみ得られることを特徴とするオーディオ情報データ・フレーム処理方法。 - 請求項24記載の方法において、
第2フォーマットのデータ・フレームの係数セグメントの生成は、第1フォーマットのデータ・フレームの係数セグメントの変換によってのみ得られることを特徴とするオーディオ情報データ・フレーム処理方法。 - ディジタル化されおよび圧縮された形でオーディオ情報を表わすデータ・フレームを送信し、そのデータ・フレームは係数セグメントと励起セグメントを含み、そのデータ・フレームは第1フォーマットである方法において、
a) 第1のサイトにおいて第1フォーマットのデータ・フレームを処理して中間フォーマットのデータ・フレームを生成し、中間フォーマットのデータ・フレームは係数セグメントと励起セグメントを含み、
b) 中間フォーマットのデータ・フレームを前記第1のサイトから離れた第2のサイトに送信し、
c) 前記第2のサイトにおいて中間フォーマットのデータ・フレームを処理して第2フォーマットのデータ・フレームを生成し、前記第2フォーマットのデータ・フレームは係数セグメントと励起セグメントを含むステップからなることを特徴とする非互換性ボコーダ間オーディオ情報データ・フレーム送信方法。 - 請求項28記載の方法において、
a) 前記第1のサイトにおいて第1フォーマットのデータ・フレームの係数セグメントを処理して中間フォーマットのデータ・フレームの係数セグメントを生成し、
b) 前記第1のサイトにおいて第1フォーマットのデータ・フレームを処理して中間フォーマットのデータ・フレームの励起セグメントを生成し、
c) 中間フォーマットのデータ・フレームの係数セグメントと、ステップaおよびbで生成された中間フォーマットのデータ・フレームの励起セグメントを結合し、それぞれ、第1フォーマットのデータ・フレームに含まれるオーディオ情報を表す中間フォーマットのデータ・フレームを生成するステップからなることを特徴とするオーディオ情報データ・フレーム送信方法。 - 請求項29記載の方法において、
a) 前記第2のサイトにおいて中間フォーマットのデータ・フレームの係数セグメントを処理して第2フォーマットのデータ・フレームの係数セグメントを生成し、
b) 前記第2のサイトにおいて中間フォーマットのデータ・フレームを処理して第2フォーマットのデータ・フレームの励起セグメントを生成し、
c) 第2フォーマットのデータ・フレームの係数セグメントとステップaおよびbにおいて生成された第2フォーマットのデータ・フレームの励起セグメントとを結合し、それぞれ、第1フォーマットおよび中間フォーマットのデータ・フレームに含まれるオーディオ情報を表す第2フォーマットのデータ・フレームを生成するステップからなることを特徴とするオーディオ情報データ・フレーム送信方法。 - 互換性のないボコーダ間でオーディオ信号を送信する方法において、
a) 第1のボコーダから第1フォーマットのデータ・フレームを受信し、そのデータ・フレームは係数セグメントと励起セグメントを含み、
b) 第1フォーマットのデータ・フレームを中間フォーマットのデータ・フレームに変換するステップは、さらに、次の
i) 第1フォーマットのデータ・フレームの係数セグメントを処理して中間フォーマットのデータ・フレームの係数セグメントを生成し、
ii) 第1フォーマットのデータ・フレームを処理して中間フォーマットのデータ・フレームの励起セグメントを生成し、
iii) 中間フォーマットのデータ・フレームの係数セグメントと中間フォーマットのデータ・フレームの励起セグメントとを結合して、第1フォーマットのデータ・フレームに含まれるオーディオ情報を表す中間フォーマットのデータ・フレームを生成するサブ・ステップを含み、
c) 中間フォーマットのデータ・フレームを第3フォーマットのデータ・フレームに変換するステップは、さらに、
i) 中間フォーマットのデータ・フレームの係数セグメントを処理して第3フォーマットのデータ・フレームの係数セグメントを生成し、
ii) 中間フォーマットのデータ・フレームを処理して第3フォーマットのデータ・フレームの励起セグメントを生成し、
iii) 第3フォーマットのデータ・フレームの係数セグメントと第3フォーマットのデータ・フレームの励起セグメントとを結合して、第1フォーマットおよび中間フォーマットのデータ・フレームに含まれるオーディオ情報を表す第3フォーマットのデータ・フレームを生成するサブ・ステップを含み、
d) 第3フォーマットのデータ・フレームを第2のボコーダに送信するステップからなることを特徴とする非互換性ボコーダ間オーディオ信号送信方法。 - コンピュータにオーディオ信号を処理するよう命令するプログラム要素を含み、前記のコンピュータは入力および出力から構成され、前記のプログラム要素は前記のコンピュータを前記の入力に印加された第1フォーマットの圧縮オーディオ・データのフレームに応答させ、前記の出力において第2フォーマットの圧縮オーディオ・データのフレームを生成し、第1フォーマットのフレームは係数セグメントと励起セグメントを有し、第2フォーマットのフレームは係数セグメントと励起セグメントを有し、前記のプログラム要素は前記のコンピュータ機能ブロックを実行する機械式可読保存メディアにおいて、
a) 前記の入力に接続され、第1フォーマットの圧縮オーディオ・データのフレームの係数セグメントを受信し、前記の出力において第2フォーマットの圧縮オーディオ・データのフレームの係数セグメントを送信する第1の処理手段と、
b) 前記の入力に接続され、第1フォーマットの圧縮オーディオ・データのデータ・フレームから、第2フォーマットの圧縮オーディオ・データのデータ・フレームの励起セグメントを生成する第2の処理手段を含むことを特徴とする機械式可読保存メディア。 - 第1フォーマットの圧縮オーディオ信号のフレームを第2フォーマットの圧縮オーディオ信号のフレームに変換し、その第1フォーマットのフレームは係数セグメントと励起セグメントを有し、第2フォーマットのフレームは係数セグメントと励起セグメントを有するボコーダ間インタフェース・ノードにおいて、
a) 第1の入力と第1の出力を含み、前記の入力に印加された第1フォーマットの圧縮オーディオ・データのフレームに応じて前記の出力において中間フォーマットの圧縮オーディオ・データのフレームを生成し、前記の中間フォーマットのフレームは係数セグメントおよび励起セグメントを有する第1のトランスコーダと、
b) 第2の入力と第2の出力を含み、前記第2の入力は前記第1の出力にリンクして中間フォーマットの圧縮オーディオ・データを受信し、前記第2の入力に印加された中間フォーマットの圧縮オーディオ・データのフレームに応じて前記第2の出力において第2フォーマットの圧縮オーディオ・データのフレームを生成する第2のトランスコーダとを含むことを特徴とするボコーダ間インタフェース・ノード。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/883,353 US5995923A (en) | 1997-06-26 | 1997-06-26 | Method and apparatus for improving the voice quality of tandemed vocoders |
US08/883,353 | 1997-06-26 | ||
PCT/CA1997/000835 WO1999000791A1 (en) | 1997-06-26 | 1997-11-05 | Method and apparatus for improving the voice quality of tandemed vocoders |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001500344A JP2001500344A (ja) | 2001-01-09 |
JP3542610B2 true JP3542610B2 (ja) | 2004-07-14 |
Family
ID=25382431
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP50516299A Expired - Fee Related JP3542610B2 (ja) | 1997-06-26 | 1997-11-05 | オーディオ信号処理装置およびオーディオ情報データ・フレーム処理方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US5995923A (ja) |
EP (1) | EP0920693B1 (ja) |
JP (1) | JP3542610B2 (ja) |
CN (1) | CN1179324C (ja) |
CA (1) | CA2256329A1 (ja) |
DE (1) | DE69735097T2 (ja) |
WO (1) | WO1999000791A1 (ja) |
Families Citing this family (82)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5768308A (en) * | 1994-12-19 | 1998-06-16 | Northern Telecom Limited | System for TDMA mobile-to-mobile VSELP codec bypass |
FR2762464B1 (fr) * | 1997-04-16 | 1999-06-25 | France Telecom | Procede et dispositif de codage d'un signal audiofrequence par analyse lpc "avant" et "arriere" |
KR100237569B1 (ko) * | 1997-08-30 | 2000-01-15 | 서평원 | 보코더 가용효율 향상을 위한 음성/데이타 동시서비스 방법 |
DE19756191A1 (de) * | 1997-12-17 | 1999-06-24 | Ericsson Telefon Ab L M | Verfahren, Vermittlungseinrichtung und Telekommunikationssystem zum Ausführen von Datenkommunikationen zwischen Teilnehmerstationen |
US6272358B1 (en) * | 1998-06-04 | 2001-08-07 | Lucent Technologies Inc. | Vocoder by-pass for digital mobile-to-mobile calls |
US6249758B1 (en) * | 1998-06-30 | 2001-06-19 | Nortel Networks Limited | Apparatus and method for coding speech signals by making use of voice/unvoiced characteristics of the speech signals |
FI107109B (fi) * | 1998-10-21 | 2001-05-31 | Nokia Networks Oy | Digitaalinen tietoliikennejärjestelmä |
US6691084B2 (en) | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
US6260009B1 (en) * | 1999-02-12 | 2001-07-10 | Qualcomm Incorporated | CELP-based to CELP-based vocoder packet translation |
US6463414B1 (en) | 1999-04-12 | 2002-10-08 | Conexant Systems, Inc. | Conference bridge processing of speech in a packet network environment |
US6959274B1 (en) | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
US7486628B1 (en) * | 1999-12-21 | 2009-02-03 | Nortel Networks Limited | Wireless network communications |
US7006787B1 (en) * | 2000-02-14 | 2006-02-28 | Lucent Technologies Inc. | Mobile to mobile digital wireless connection having enhanced voice quality |
GB0003954D0 (en) * | 2000-02-18 | 2000-04-12 | Radioscape Ltd | Method of and apparatus for converting a signal between data compression formats |
DE60143327D1 (de) * | 2000-08-09 | 2010-12-02 | Sony Corp | Sprachdatenverarbeitungsvorrichtung und -verarbeitungsverfahren |
US7283961B2 (en) * | 2000-08-09 | 2007-10-16 | Sony Corporation | High-quality speech synthesis device and method by classification and prediction processing of synthesized sound |
KR100659197B1 (ko) * | 2000-09-05 | 2006-12-21 | 유티스타콤코리아 유한회사 | 통합 인터넷 프로토콜 망에서의 보코딩 방법 |
JP2002202799A (ja) * | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
US8374218B2 (en) | 2000-12-05 | 2013-02-12 | Google Inc. | Combining signals with a shuffled-hadamard function |
US8385470B2 (en) * | 2000-12-05 | 2013-02-26 | Google Inc. | Coding a signal with a shuffled-Hadamard function |
US20030028643A1 (en) * | 2001-03-13 | 2003-02-06 | Dilithium Networks, Inc. | Method and apparatus for transcoding video and speech signals |
US20030195745A1 (en) * | 2001-04-02 | 2003-10-16 | Zinser, Richard L. | LPC-to-MELP transcoder |
US20030028386A1 (en) * | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
US6718183B1 (en) * | 2001-06-05 | 2004-04-06 | Bellsouth Intellectual Property Corporation | System and method for reducing data quality degradation due to encoding/decoding |
US20030013465A1 (en) * | 2001-07-11 | 2003-01-16 | Choong Philip T. | System and method for pseudo-tunneling voice transmissions |
KR100434275B1 (ko) * | 2001-07-23 | 2004-06-05 | 엘지전자 주식회사 | 패킷 변환 장치 및 그를 이용한 패킷 변환 방법 |
KR100460109B1 (ko) * | 2001-09-19 | 2004-12-03 | 엘지전자 주식회사 | 음성패킷 변환을 위한 lsp 파라미터 변환장치 및 방법 |
JP4108317B2 (ja) * | 2001-11-13 | 2008-06-25 | 日本電気株式会社 | 符号変換方法及び装置とプログラム並びに記憶媒体 |
US7453921B1 (en) * | 2001-12-11 | 2008-11-18 | Google Inc. | LPC filter for removing periodic and quasi-periodic interference from spread spectrum signals |
US6829579B2 (en) | 2002-01-08 | 2004-12-07 | Dilithium Networks, Inc. | Transcoding method and system between CELP-based speech codes |
JP2005515486A (ja) | 2002-01-08 | 2005-05-26 | ディリチウム ネットワークス ピーティーワイ リミテッド | Celpによる音声符号間のトランスコーディング・スキーム |
EP1483759B1 (en) * | 2002-03-12 | 2006-09-06 | Nokia Corporation | Scalable audio coding |
KR20040104508A (ko) * | 2002-03-12 | 2004-12-10 | 딜리시움 네트웍스 피티와이 리미티드 | 오디오 변환부호화기에서 적응 코드북 피치 지연 연산을위한 방법 |
WO2003098598A1 (en) * | 2002-05-13 | 2003-11-27 | Conexant Systems, Inc. | Transcoding of speech in a packet network environment |
JP4304360B2 (ja) * | 2002-05-22 | 2009-07-29 | 日本電気株式会社 | 音声符号化復号方式間の符号変換方法および装置とその記憶媒体 |
JP2004151123A (ja) * | 2002-10-23 | 2004-05-27 | Nec Corp | 符号変換方法、符号変換装置、プログラム及びその記憶媒体 |
US7363218B2 (en) * | 2002-10-25 | 2008-04-22 | Dilithium Networks Pty. Ltd. | Method and apparatus for fast CELP parameter mapping |
US7808920B2 (en) * | 2002-10-28 | 2010-10-05 | Qualcomm Incorporated | Tandem-free vocoder operations between non-compatible communication systems |
US7023880B2 (en) * | 2002-10-28 | 2006-04-04 | Qualcomm Incorporated | Re-formatting variable-rate vocoder frames for inter-system transmissions |
US7203226B1 (en) * | 2002-11-14 | 2007-04-10 | Nortel Networks Limited | Methods and apparatus for data communication |
US7352833B2 (en) * | 2002-11-18 | 2008-04-01 | Google Inc. | Method and system for temporal autocorrelation filtering |
KR100499047B1 (ko) * | 2002-11-25 | 2005-07-04 | 한국전자통신연구원 | 서로 다른 대역폭을 갖는 켈프 방식 코덱들 간의 상호부호화 장치 및 그 방법 |
US8254372B2 (en) | 2003-02-21 | 2012-08-28 | Genband Us Llc | Data communication apparatus and method |
DE602004025688D1 (de) * | 2003-04-22 | 2010-04-08 | Nec Corp | Codeumsetzungsverfahren und einrichtung, programm und aufzeichnungsmedium |
KR100689365B1 (ko) * | 2003-07-10 | 2007-03-02 | 삼성전자주식회사 | 이동통신시스템에서 신호 및 부가 데이터 다중화 전송 방법 및 시스템 |
US8059663B1 (en) | 2003-07-10 | 2011-11-15 | Sprint Spectrum L.P. | Gateway-based system and method for tandem free operation |
KR100554164B1 (ko) * | 2003-07-11 | 2006-02-22 | 학교법인연세대학교 | 서로 다른 celp 방식의 음성 코덱 간의 상호부호화장치 및 그 방법 |
US7586868B2 (en) * | 2003-07-14 | 2009-09-08 | Motorola, Inc | Method and apparatus for controlling distributed transcoders |
US20050091047A1 (en) * | 2003-10-27 | 2005-04-28 | Gibbs Jonathan A. | Method and apparatus for network communication |
WO2005089055A2 (en) | 2004-03-19 | 2005-09-29 | Nortel Networks Limited | Communicating processing capabilites along a communications path |
US8027265B2 (en) | 2004-03-19 | 2011-09-27 | Genband Us Llc | Providing a capability list of a predefined format in a communications network |
US7240141B2 (en) * | 2004-04-09 | 2007-07-03 | Broadcom Corporation | Programmable inter-virtual channel and intra-virtual channel instructions issuing rules for an I/O bus of a system-on-a-chip processor |
US7089011B1 (en) | 2004-05-11 | 2006-08-08 | Sprint Spectrum L.P. | Method and system for selective call routing for transcoder free operation |
US7328027B1 (en) * | 2004-05-11 | 2008-02-05 | Sprint Spectrum L.P. | Method for vocoder selection based on loads in coverage areas of a wireless wide area network |
US20050258983A1 (en) * | 2004-05-11 | 2005-11-24 | Dilithium Holdings Pty Ltd. (An Australian Corporation) | Method and apparatus for voice trans-rating in multi-rate voice coders for telecommunications |
KR100647290B1 (ko) * | 2004-09-22 | 2006-11-23 | 삼성전자주식회사 | 합성된 음성의 특성을 이용하여 양자화/역양자화를선택하는 음성 부호화/복호화 장치 및 그 방법 |
GB2418818B (en) * | 2004-10-01 | 2007-05-02 | Siemens Ag | A method and an arrangement to provide a common platform for tencoder and decoder of various CELP codecs |
KR100900438B1 (ko) * | 2006-04-25 | 2009-06-01 | 삼성전자주식회사 | 음성 패킷 복구 장치 및 방법 |
US8169983B2 (en) * | 2006-08-07 | 2012-05-01 | Pine Valley Investments, Inc. | Transcoder architecture for land mobile radio systems |
EP2108193B1 (en) | 2006-12-28 | 2018-08-15 | Genband US LLC | Methods, systems, and computer program products for silence insertion descriptor (sid) conversion |
US8107438B1 (en) | 2008-06-18 | 2012-01-31 | Sprint Spectrum L.P. | Method for initiating handoff of a wireless access terminal based on the reverse activity bit |
JP2010008489A (ja) * | 2008-06-24 | 2010-01-14 | Oki Semiconductor Co Ltd | オーディオフォーマット変換回路及びオーディオデータ処理装置 |
KR101915425B1 (ko) * | 2008-09-18 | 2018-11-05 | 톰슨 라이센싱 | 비디오 영상 프루닝 방법 및 장치 |
CN101740030B (zh) * | 2008-11-04 | 2012-07-18 | 北京中星微电子有限公司 | 语音信号的发送及接收方法、及其装置 |
US8254930B1 (en) | 2009-02-18 | 2012-08-28 | Sprint Spectrum L.P. | Method and system for changing a media session codec before handoff in a wireless network |
US9374306B1 (en) | 2009-03-04 | 2016-06-21 | Sprint Spectrum L.P. | Using packet-transport metrics for setting DRCLocks |
US9467938B1 (en) | 2009-04-29 | 2016-10-11 | Sprint Spectrum L.P. | Using DRCLocks for conducting call admission control |
US8310929B1 (en) | 2009-06-04 | 2012-11-13 | Sprint Spectrum L.P. | Method and system for controlling data rates based on backhaul capacity |
US8923390B2 (en) * | 2009-06-19 | 2014-12-30 | The Hong Kong University Of Science And Technology | Scalar quantization using bit-stealing for video processing |
US8245088B1 (en) | 2009-06-30 | 2012-08-14 | Sprint Spectrum L.P. | Implementing quality of service (QoS) by using hybrid ARQ (HARQ) response for triggering the EV-DO reverse activity bit (RAB) |
US8204000B1 (en) | 2009-07-23 | 2012-06-19 | Sprint Spectrum L.P. | Achieving quality of service (QoS) by using the reverse activity bit (RAB) in creation of neighbor lists for selected access terminals |
US8908541B2 (en) | 2009-08-04 | 2014-12-09 | Genband Us Llc | Methods, systems, and computer readable media for intelligent optimization of digital signal processor (DSP) resource utilization in a media gateway |
US8953800B2 (en) * | 2009-12-14 | 2015-02-10 | Avaya Inc. | Method for transporting low-bit rate information |
US8521520B2 (en) * | 2010-02-03 | 2013-08-27 | General Electric Company | Handoffs between different voice encoder systems |
JP5424936B2 (ja) * | 2010-02-24 | 2014-02-26 | パナソニック株式会社 | 通信端末及び通信方法 |
US8363564B1 (en) | 2010-03-25 | 2013-01-29 | Sprint Spectrum L.P. | EVDO coverage modification based on backhaul capacity |
US8515434B1 (en) | 2010-04-08 | 2013-08-20 | Sprint Spectrum L.P. | Methods and devices for limiting access to femtocell radio access networks |
CN101887727B (zh) * | 2010-04-30 | 2012-04-18 | 重庆大学 | 从help编码到melp编码的语音编码数据转换系统及方法 |
US20120196614A1 (en) * | 2011-02-02 | 2012-08-02 | Vonage Network Llc. | Method and system for unified management of communication events |
CN105531758B (zh) | 2014-07-17 | 2019-10-01 | 微软技术许可有限责任公司 | 使用外国单词语法的语音识别 |
JP6341078B2 (ja) * | 2014-12-09 | 2018-06-13 | 富士通株式会社 | サーバ装置、プログラム及び情報処理方法 |
US20170126898A1 (en) * | 2015-04-24 | 2017-05-04 | Motorola Solutions, Inc. | Transmission of data with voice-encoded data units on a wireless communications channel using variable rate bit stealing |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2949505A (en) * | 1957-08-14 | 1960-08-16 | Bell Telephone Labor Inc | Reduced bandwith transmission system |
US3973081A (en) * | 1975-09-12 | 1976-08-03 | Trw Inc. | Feedback residue compression for digital speech systems |
DE3335419A1 (de) * | 1983-09-29 | 1985-04-18 | Siemens AG, 1000 Berlin und 8000 München | Umsetzer zur schnittstellenanpassung zwischen lpc-und kanalvocodern fuer die uebertragung digitalisierter sprachsignale ueber digitale schmalband-kommunikationssysteme |
US5694519A (en) * | 1992-02-18 | 1997-12-02 | Lucent Technologies, Inc. | Tunable post-filter for tandem coders |
JP2779886B2 (ja) * | 1992-10-05 | 1998-07-23 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
FR2700087B1 (fr) * | 1992-12-30 | 1995-02-10 | Alcatel Radiotelephone | Procédé de positionnement adaptatif d'un codeur/décodeur de parole au sein d'une infrastructure de communication. |
JPH09506983A (ja) * | 1993-12-16 | 1997-07-08 | ボイス コンプレッション テクノロジーズ インク. | 音声圧縮方法及び装置 |
US5602961A (en) * | 1994-05-31 | 1997-02-11 | Alaris, Inc. | Method and apparatus for speech compression using multi-mode code excited linear predictive coding |
US5768308A (en) * | 1994-12-19 | 1998-06-16 | Northern Telecom Limited | System for TDMA mobile-to-mobile VSELP codec bypass |
US5771452A (en) * | 1995-10-25 | 1998-06-23 | Northern Telecom Limited | System and method for providing cellular communication services using a transcoder |
-
1997
- 1997-06-26 US US08/883,353 patent/US5995923A/en not_active Expired - Lifetime
- 1997-11-05 DE DE69735097T patent/DE69735097T2/de not_active Expired - Fee Related
- 1997-11-05 WO PCT/CA1997/000835 patent/WO1999000791A1/en active IP Right Grant
- 1997-11-05 CN CNB971974527A patent/CN1179324C/zh not_active Expired - Lifetime
- 1997-11-05 EP EP97911986A patent/EP0920693B1/en not_active Expired - Lifetime
- 1997-11-05 JP JP50516299A patent/JP3542610B2/ja not_active Expired - Fee Related
- 1997-11-05 CA CA002256329A patent/CA2256329A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
DE69735097D1 (de) | 2006-04-06 |
CN1228867A (zh) | 1999-09-15 |
EP0920693B1 (en) | 2006-01-11 |
CA2256329A1 (en) | 1999-01-07 |
US5995923A (en) | 1999-11-30 |
WO1999000791A1 (en) | 1999-01-07 |
JP2001500344A (ja) | 2001-01-09 |
DE69735097T2 (de) | 2006-07-20 |
CN1179324C (zh) | 2004-12-08 |
EP0920693A1 (en) | 1999-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3542610B2 (ja) | オーディオ信号処理装置およびオーディオ情報データ・フレーム処理方法 | |
KR100919868B1 (ko) | 패킷 손실 보상 | |
KR100923891B1 (ko) | 음성 비활동 동안에 보이스 송신 시스템들 사이에상호운용성을 제공하는 방법 및 장치 | |
KR100837451B1 (ko) | 향상된 품질의 음성 변환부호화를 위한 방법 및 장치 | |
KR101303145B1 (ko) | 계층적 오디오 신호를 코딩하기 위한 시스템, 오디오 신호를 코딩하는 방법, 컴퓨터-판독가능한 매체 및 계층적 오디오 디코더 | |
US7343282B2 (en) | Method for transcoding audio signals, transcoder, network element, wireless communications network and communications system | |
EP1299879B1 (en) | Encoding and decoding of a digital signal | |
JP2006099124A (ja) | デジタル無線チャネル上の自動音声/話者認識 | |
KR20070038041A (ko) | 전기 통신을 위한 멀티-레이트 음성 부호화기에 있어서음성 트랜스-레이팅을 위한 방법 및 장치 | |
KR100434275B1 (ko) | 패킷 변환 장치 및 그를 이용한 패킷 변환 방법 | |
JPH08146997A (ja) | 符号変換装置および符号変換システム | |
US7684978B2 (en) | Apparatus and method for transcoding between CELP type codecs having different bandwidths | |
JPH1097295A (ja) | 音響信号符号化方法及び復号化方法 | |
EP1020848A2 (en) | Method for transmitting auxiliary information in a vocoder stream | |
Harada et al. | Emerging ITU-T standard G. 711.0—lossless compression of G. 711 pulse code modulation | |
US7715365B2 (en) | Vocoder and communication method using the same | |
US20050091047A1 (en) | Method and apparatus for network communication | |
Choudhary et al. | Study and performance of amr codecs for gsm | |
Bhatt | Implementation and overall performance evaluation of CELP based GSM AMR NB coder over ABE | |
EP1387351B1 (en) | Speech encoding device and method having TFO (Tandem Free Operation) function | |
JPH0588697A (ja) | 欠落音声補間方式 | |
Gajjar et al. | A Novel Approach for Artificial Bandwidth Extension of Speech Signal & its Analytical Evaluation of Performance | |
JPH05276049A (ja) | 音声符号化方法及びその装置 | |
JPH0969000A (ja) | 音声パラメータ量子化装置 | |
Chauhan et al. | A New Technique for Artificial Bandwidth Extension of Speech Signal and its Performance Analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20031215 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040113 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20040219 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040309 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040401 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |