JP2002533963A - 符号化通信信号の性能改良のための符号化された改良特性 - Google Patents

符号化通信信号の性能改良のための符号化された改良特性

Info

Publication number
JP2002533963A
JP2002533963A JP2000590163A JP2000590163A JP2002533963A JP 2002533963 A JP2002533963 A JP 2002533963A JP 2000590163 A JP2000590163 A JP 2000590163A JP 2000590163 A JP2000590163 A JP 2000590163A JP 2002533963 A JP2002533963 A JP 2002533963A
Authority
JP
Japan
Prior art keywords
signal
information
encoded
creating
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000590163A
Other languages
English (en)
Inventor
ロアール ハーゲン,
バスティアン クレイジン,
Original Assignee
テレフォンアクチーボラゲット エル エム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフォンアクチーボラゲット エル エム エリクソン(パブル) filed Critical テレフォンアクチーボラゲット エル エム エリクソン(パブル)
Publication of JP2002533963A publication Critical patent/JP2002533963A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Dc Digital Transmission (AREA)

Abstract

(57)【要約】 通信システムの送信機において、入力信号に対してターゲット信号(30)とターゲット信号と一致するはずの1時符号化信号(121)を作成する。同様に1時符号化信号がターゲット信号とどれだけ近いかを示す符号化改良情報(36)を作成する。受信機では、1時符号化信号を再生紙(133)、符号化された改良情報を復号し(37)、複合化された改良情報を再生された1時符号化信号に適用することによって改良再生信号(135)を作成(39)する。

Description

【発明の詳細な説明】
【0001】発明の属する技術分野 本発明は広くは電気通信システムにおける信号符号化に関し、より具体的には
、符号化された通信信号の改良に関するものである。
【0002】発明の技術背景 音声信号の低ビットレートでの高品質符号化は、移動体電話、安全電話及び音
声記憶のような通信システムでは極めて重要な技術である。最近、移動体電話で
は、再生した音声信号の品質改良と、送信に要するビットレートの柔軟性を導入
することが流れになっている。品質改良の傾向は、一方では、移動体電話におい
て通常の電話ネットワークと同じ品質を求めるユーザの期待を反映したものであ
る。特に、この点に関連して、バックグラウンド信号と音楽とが重要である。ビ
ットレートに柔軟性を持たせる流れは、他方、接続要求を拒絶することのないネ
ットワーク容量の確保と、個別の料金で異なるレベルのサービスを提供すること
を希望するサービス提供者の要求を反映したものである。音声信号を再生する能
力を維持しながら(正確性は低くても)、与えられたビットストリームからビッ
トを削減する能力は、極めて有効なビットレート柔軟性の1つである。
【0003】 現在の音声符号化技術では、音声信号品質の改良とビットレートの柔軟性の要
求を同時に満足することはできない。これが困難である原因は、移動体通信にお
いて共通に使用されている線形予測合成に基づく解析(LPAS)手法に直接起
因するものである。現在、LPAS符号化器は、5ないし20kb/sの範囲で
は、他の技術に基づくものに比較して優れた品質を提供する。したがって、LP
AS技術は、GSM、D−AMPSやPDCのようなほとんどすべてのデジタル
電話標準の基本となっている。しかし、声に関する性能は優れているが、現在の
LPASに基づく音声符号化は音楽と背景ノイズ信号に関しては品質が不十分で
ある。さらに、ビットストリームからビットを削減することに関しては効率の低
いアルゴリズムを使用せざるをえない。
【0004】 LPAS符号化手法は声の記述に対して最適化されているために、声以外の音
に対しては同一の性能を確保することができない。したがって、短時間のパワー
スペクトル形状は、オールポールモデルを使用した(ほとんど常に10のポール
を使用する)スペクトルの包絡線の倍数と、調和関数とノイズ状の特性を有する
2つの成分の組み合わせで表されるいわゆる詳細スペクトル構造によって表され
る。実際、このモデルは多くの音楽や背景ノイズ信号に関しては不十分であると
考えられている。モデルが不十分なために、周期的な信号の調和構造によっては
表すことができないスペクトルの谷(ゼロ)とピークの記述能力が不適切であり
、おそらくパラメータの推定誤差の時間変化によって生じる、いわゆる「スワー
リング」を生じる。
【0005】 LPASアルゴリズムのビットレートに柔軟性を付与しようとする2つの主な
方法は重大な欠点を有している。第1の方法は、異なるビットレートを使用して
いる複数の符号化器を組み合わせて特定の時間では特定の符号化器を使用する(
この第1の方法の例としては、TIA IS−95と最近のIS−127標準が
ある)。この種の符号化器は「マルチレート符号化器」と呼ばれる。この方法の
欠点は、信号再生のために、選択された符号化器のビットストリームがすべて受
信機の側に受信されることが必要なことである。したがって、ビットストリーム
が送信機を離れた後は、これを変更することはできない。
【0006】 第2の方法は、埋め込み符号化であり、符号化器は2つ以上のビットストリー
ムから構成される復号ビットストリームを作成する:これは、信号の基本的な記
述を有する第1のビットストリームと、基本的な信号記述を改良するための情報
を含む1つ以上の追加のビットストリームである。LPAS設定では、第2の方
法はLPAS符号化器の励起信号を、第1の励起と1つ以上の追加の励起信号に
分解することで励起信号を改良する。しかし、符号化器と復号化器の同期を維持
するために(LPAS技法では基本的である)、いずれのレートにおいても、長
期予測値(ほとんどすべてのLPAS技法で使用されている)は第1の励起信号
を取り扱うことができるだけである。長期予測値は、LPAS技法において極め
て大きな符号化ゲインを占めているので、このことは追加の励起信号による効果
を大幅に制限することになる。したがって、この埋め込みLPAS符号化アルゴ
リズムは、大幅に劣化した符号化効率と引き換えにビットレートの柔軟性を改良
するものである。
【0007】 5ないし20kb/sの範囲の固定されたビットレートを有する符号化器では
、よく知られたLPAS技法が極めて広く使用されている。この符号化技法の全
貌は、例えば、P. KroonとEd. F. Deprettereによる、「4.8から16kbi
t/sのレートの高品質スピーチ符号化のための1種の合成による解析予測符号
化器(A class of analysis-by-synthesis predictive coders for high quality
speech coding at rates between 4.8 and 16 kbit/s)」IEEEジャーナル、
選択領域通信、6:353−363、1988年、A. Gershoによる、「スピー
チと音声圧縮の進歩(Advances in speech and audio compression)」IEEEプ
ロシーディングス、82:900−918、1994年、W. B. KleijnとK. K.
Paliwal編による「スピーチの符号化と合成」中の、P. KroonおよびW. B. Kleij
nによる「線形予測に基づく合成による解析符号化(Linear-prediction based an
alysis-by-synthesis coding)」79−119、Elsevier Science Publishers,
アムステルダム、1995年に記載されている。
【0008】 LPAS技法では、適応合成フィルタを励起信号で刺激することでスピーチ信
号を再生する。オールポール構造を有する適応合成フィルタは、いわゆる線形予
測(LP)係数によって規定され、これがサブフレーム毎に適応される(典型的
な場合は、サブフレームは2から5msである)。LP係数は元の信号からフレ
ーム(10から25ms)毎に1回予測され、各サブフレームに対するその値は
補間によって算出される。LP係数に関する情報は通常フレーム毎に1回送信さ
れる。励起信号は2つの成分の合計である:適応コードブック成分(この目的に
関しては長期予測値と同じである)と、固定コードブック成分である。
【0009】 適応コードブック成分は、当該サブフレームのために、合成フィルタによるフ
ィルタ処理後にもとの音声信号と最も近い信号を再生することができた過去の励
起信号のセグメントを選択することで決定される。固定コードブック成分は、励
起ベクトルを含むコードブックデータのうちで、適応コードブック成分が決まっ
た状態で元の信号に最も近い再生信号を得ることができるものである。上記のプ
ロセスに加えて、適応及び固定コードブック成分は、量子化されたスケールファ
クタによって大きさが決められる。
【0010】 LPAS技法の上述の記載は現在のほとんどすべての符号化器に当てはまるも
のである。このような符号化器の例としては、8kb/sITU G.729(
R. Salami, C. Laflamme, J. P. Adoul and D. Massalouxによる、「パーソナル
通信システムのための高品質8kb/sスピーチコーデック(A toll quality 8k
b/s speech codec for the personal communications systems (PCS))、IEE
E技術論文集、43(3):808−816、1994年;および、R. Salami
他による、「提案されたITU−T 8kb/sスピーチ符号化標準の説明(Des
cription of the proposed ITU-T 8kb/s speech coding standard)」IEEEス
ピーチ符号化ワークショップ、3−4ページ、アナポリス、MD、1995年)
と、GSM改良フルレート(GSMEFR)12.2kb/s符号化器(ヨーロ
ッパ電気通信標準学会(ETSI)による「改良フルレート(EFR)スピーチ
トランスコーディング(GSM06.60)、ETSI技術標準300 726
、1996年)がある。これらの符号化器はいずれもスピーチ信号に関しては良
好に作動する。しかし、音楽信号に関しては、いずれの符号化器も明瞭に聞き取
ることのできる障害音を生じ、この点はレートに低い符号化器のほうが一層顕著
である。これらの符号化器の場合にはいずれも、受信機が再生を行うためには全
ビットストリームを受信することが必須である。
【0011】 16kb/sITU G.728符号化器は、LPパラメータを過去の再生信
号から計算するので、これを送信する必要がない点において、上述の技法とは異
なっている。この技法は一般に後方LP適応と呼ばれている。固定コードブック
のみを使用する。(10次の線形予測を使用する)他の符号化器と違って、50
次の線形予測を行う。予測の次数が高いので、G.729やGSMEFR符号化
器よりもスピーチ以外の音声に対して性能がよい。しかし、後方適応構造に起因
して、符号化器はG.729やGSMEFR符号化器よりもチャネル誤差に敏感
で、移動体通信環境では魅力に乏しい。さらに、G.728受信機で再生を行う
には、全ビットストリームを取得する必要がある。
【0012】 TIAのIS−127は、移動体電話を対象としたマルチレート符号化標準で
ある。この標準ではビットレートの柔軟性が増大しているが、この標準では送信
機と受信機との間でビットストリームを変更することができない。したがって、
ビットレートに関する決定は送信機が行わなければならない。符号化手法は上述
の技法とは若干異なっているが(D. NahumiとW. B. Kelijnによる「改良8kb
/sRCELP符号化器(An improved 8 kb/s RCELP coder)」、IEEEスピ
ーチ符号化ワークショップ論文集、39−40ページ、アナポリス、MD,19
95年と、W. B. Kleijn, P. KroonとD. Nahumiによる「RCELPスピーチ符
号化アルゴリズム(The RCELP speech coding algorithm)」、ヨーロッパ電気通
信学会誌、4(5):573−582,1994年を参照されたい)、この相違
はスピーチ以外の音声の品質に大きな影響を与えるものではない。
【0013】 現在の方法が有する上述のような制約のために、送信機と受信機との間でビッ
トストリームの変更を許容する現実的な符号化器の設計はほとんど存在しない。
この種の方法の例は、R. Drogo de IacovoとD. Serenoによる「デジタル移動体
無線通信のための6.55kbit/sによるCELP符号化(CELP coding at
6.55 kbit/s for digital mobile radio communications)」、IEEEグローバ
ル電気通信会議論文集、405.6ページ、1990年; S. ZhangとG. Lockh
artによる、「通常のパルス励起(RPE)線形予測符号化のための埋め込み手
法(Embedded scheme for regular pulse excited (RPE) linear predictive cod
ing)」、IEEE音声スピーチ信号処理に関するインターロガトリー会議、37
−40ページ、デトロイト、1995年; A. Le Guyader, C. LamblinとE. Bo
ursicautによる、「ワイドバンドスピーチ符号化のための埋め込み代数CELP
/VSELP符号化器(Embedded algebraic CELP/VSELP coders for wideband s
peech coding)」、スピーチ通信、16(4):219−328,1995年;
B. Tang, A. Shen, A. AlwanおよびG. Pottieによる、「認識に基づく埋め込
みサブバンドスピーチ符号化器(A Perceptually-based embedded subband speec
h coder)」、IEEEスピーチと音声処理論文集、5(2):131−140,
1997年がある。これらの例ではいずれも、適応コードブックが排除されてい
るという理由または適応コードブックが第1の励起信号についてのみ作用すると
いう理由によって、固定レートの符号化器よりも符号化効率が悪い。この方法で
使用されるLPAS符号化器の比較的低い効率が、埋め込み符号化に関する比較
的新しいサブバンド符号化によって示されている(B. Tang, A. Shen, A. Alwan
とG. Pottieによる「認識に基づく埋め込みサブバンドスピーチ符号化器(A Perc
eptually-based embedded subband speech coder)」、IEEEスピーチと音声
処理論文集、5(2):131−140,1997年を参照)。サブバンド符号
化器も固定レートで作動しないが、埋め込み符号化システムが必要な場合には競
争力のある性能を有する。
【0014】 16kb/sのレートでは、音声信号符号化器は音楽の符号化を対象としたも
のになる傾向がある。上述のLPAS準拠符号化器とは違って、これらのレート
の高い符号化器は一般的に8kb/sよりも高いサンプリングレートを使用する
。これらの符号化器の大部分は、周知のサブバンドと変換符号化原理に基づくも
のである。線形予測と変換符号化を使用するハイブリッドマルチレート(16、
24と32kb/s)符号化器の最新の例は、J. H. Chenによる、「ITU−T
の新しいワイドバンドスピーチ符号化標準の候補となる符号化器(A candidate c
oder for the ITU-T's new wideband speech coding standard)」、アコーステ
ィックスピーチ信号処理に関するインターロガトリー会議論文集、1359−1
362ページ、アトランタ、1997年に記載されている。レートの高い変換と
サブバンド手法の例は、K. Gosse, F. Moreau de Saint-Martin, X. Durot, P.
DuhamelとJ. B. Raultによる、「(Subband audio coding with sysnthesis filt
ers minimizing a perceptual distortion)」、IEEEアコースティックスピ
ーチ信号処理に関するIEEE国際会議論文集、347−350ページ、ミュン
ヘン、1997; M. Purat とP. Nollによる、「周波数が変化する変調ラップ
変換に基づく動的ウェーブレットパケット分解を用いた音声符号化(Audio codin
g with dynamic wavelet packet decomposition based on frequency-varying m
ojulated lapped transforms)」、アコースティックスピーチ信号処理に関する
IEEEインターロガトリー会議論文集、1021−1024ページ、アトラン
タ、1996年; J. PrincenとJ. Johnstonによる「信号適応フィルタバンク
を使用した音声符号化(Audio coding using signal adaptive filterbanks)」、
アコースティックスピーチ信号処理に関するIEEEインターロガトリー会議論
文集、3071−3074ページ、デトロイト、1995年; N. S. Jayant,
J. JohnstonとR. Safranekによる、「人の認識モデルに基づく信号圧縮(Signal
compression based on models of human perception)」、IEEE論文集、81
(10):1385−1421、1993年。特に30kb/s以上のレートで
は、この手順は音楽に対して良好な特性を有し、背景ノイズに関しても良好であ
ることが期待される。低いレートに対しては、トーンまたはワイドバンドノイズ
の問題がある。残念ながら、この高いビットレートは、ほとんどの移動体電話で
使用するレートとしては高すぎる。
【0015】 移動体電話通信に一般に使用されているレート(8から16kb/s)に関し
ては、変換とサブバンド符号化アルゴリズムの性能は、LPAS準拠符号化以下
にまで低下する。長期間フィードバックが無いために、これらの高いレートのア
ルゴリズムはLPAS符号化技法よりも通常の技術を用いた埋め込み符号化によ
り適しており、このことが、B. Tang, A. Shen, A. AlwanとG. Pottieによる、
「認識に基づく埋め込みサブバンドスピーチ符号化器(A Perceptually-based em
bedded subband speech coder)」、IEEEスピーチと音声処理論文集、5(2
):131−140,1997年に記載されている。
【0016】 これまでの議論により2つの問題があることがわかる、第1の問題は、16k
b/sより低いレートで作動するスピーチ符号化器の性能が、特に音楽のような
スピーチ以外の音声に対して低いことである。第2の問題は、送信機と受信機の
間でビットレートを下げることができる効率的な符号化器(移動体電話に適用可
能なレートにおいて)を製作することが困難なことである。
【0017】 第1の問題は、LPAS技法が有する制限に起因するものである。LPAS技
法は、スピーチ信号に対して設計されたものであり、現在の形はスピーチ以外の
信号に対しては十分な性能を有しない。ITU B.728符号化器が(後方L
P適用を使用するので)スピーチ以外の信号に対してより良好な性能を有するが
、チャネル誤差に対して敏感で、移動体電話に適用するには魅力に欠ける。レー
トの高い符号化器(サブバンドと変換符号化器)は、スピーチ以外の音声に対し
てこのような問題を有しないが、これらのビットレートは移動体電話に使用する
には高すぎる。
【0018】 第2の問題は、LPAS符号化において第1と追加のビットストリームを作成
する方法に起因するものである。従来の方法では、励起信号は第1と追加の励起
信号に分解される。この方法によって、LPAS符号化器の長期フィードバック
メカニズムが、埋め込みのない符号化システムに比較して非効率になる。結果的
に、埋め込み符号化をLPAS符号化システムで使用した例はほとんどない。
【0019】 本発明は、適応イコライゼーションオペレータのような改良情報の推定を可能
にし、これによって(第1の符号化アルゴリズムによって符号化され再生される
)音声信号が元の信号により近いものになる。イコライゼージョンオペレータは
線形または非線形フィルタ処理、あるいはブロックごとの近似によって信号を変
更する。本発明は又、ある程度の符号化誤差を許容しつつ、第1の符号アルゴリ
ズムによるビットストリームから分離可能なビットストリームを使用して、適応
イコライゼーションオペレータの符号化を可能にするものである。本発明はさら
に、システムの受信機による適応イコライゼーションオペレータの復号と、受信
機における復号された適応イコライゼーションオペレータを第1の符号化アルゴ
リズムによって符号化されて再生された音声信号に対して利用することを可能に
するものである。
【0020】 適応イコライゼーションオペレータはポストフィルタと(V. RamamoorthyとN. S. Jayantによる「適応ポストフィルタ処理によるADPCMスピーチの改良(E
nhancement of ADPCM speech by adaptive postfiltering)」、AT&Tベル研
究所技法、1465−1475ページ、1984年; J. H. ChenとA. Gersho
による、「符号化されたスピーチの品質改良のための適応ポストフィルタ処理(A
daptive postfiltering for quality enhancement of coded speech)」、IEE
Eスピーチ音声処理に関する論文集、3(1):59−71,1995年を参照
されたい)、判断基準が最適化されており、オペレータに関する情報が送信され
る点において異なっている。イコライゼーションオペレータは、従来の埋め込み
符号化の改良方法に比較すると、イコライゼーションオペレータは信号に修正を
加えない点において異なっている。その代わり、イコライゼーションオペレータ
は典型的な場合には、適応フィルタによるフィルタ処理によって実現されるか、
短時間のスペクトルに伝達関数をかける。したがって、信号の修正は加算的性質
ではなく積算的性質を有する。
【0021】 本発明によれば、信号波形をモデル化するために行う第1の符号化器による第
1の符号化/復号化処理に起因する変形を修正することができる。適応イコライ
ザオペレータの構造は、一般的に、第1の符号化器の構造の欠点(例えば、LP
AS符号化器によってスピーチ以外の音声をモデル化することの不適切性)を補
うために決められる。これは上述の第1の問題を解決するものである。
【0022】 本発明はビットレートの柔軟性を拡大するものである。1つの実施例に拠れば
、信号の再生のためには第1の符号化器に対応するビットストリームだけが必要
である。適応イコライゼーションオペレータに対応する追加のビットストリーム
は、送信機と受信機のいずれかで破棄することができる。再生された信号は、追
加のビットストリームが復号化器に到達すれば常に改良される。別の実施例では
、適応イコライゼーションオペレータに対応するビットストリームは受信機に必
要であり、破棄することはできない。
【0023】発明の詳細な説明 図1に示す例は従来の通信システムの一般的なブロック図である。図1におい
て、入力信号は送信機において符号化処理11を受ける。送信機からの符号化さ
れた情報は受信器の通信チャネル12を通過し、次に13において、符号化され
た情報から入力信号を表す再生信号が再生される。しかし、上述のように、図1
に示したような従来のシステムの多くにおいて、例えば、移動体電話に適用され
ているスピーチ符号化システムはすべての状況において良好な性能を示すわけで
はない。例えば、LPASシステムでスピーチ以外の信号を処理する場合は、再
生信号は入力信号の許容可能な再現になっていない。
【0024】 図2において本発明は、図1に示した再生信号に適用して図2に示す改良再生
信号を作成するエンハンサ機能(エンハンサ21)を提供する。図2に示したエ
ンハンサからの改良再生信号出力は、図1に示した再生信号よりも入力信号に近
い信号を表すのが典型的である。
【0025】 図3は図2に示したエンハンサ機能がどのように符号化イコライゼーション処
理として実現されるかについて一例を示すものである。図3において、133に
おける信号は、図1と2における再生信号に対応し、イコライゼーションオペレ
ータ(またはイコライザ)39は図2にエンハンサに対応し、135における信
号が図2における改良再生信号に相当する。図3に示した伝送媒体31は図1に
おけるチャネル12に相当する。
【0026】 イコライゼーション推定器33とイコライゼーション符号化器35は送信機に
設けられており、イコライゼーション復号化器37とイコライゼーションオペレ
ータ39は受信機に設けられている。第1の符号化信号121は送信器の従来型
の符号化処理によって32の地点で作成される。第1の符号化信号は入力信号の
符号化された表現である。第1の符号化器32はターゲット信号30をも作成す
る。第1の符号化信号121はターゲット信号30に可能な限り近いことが目標
である。第1の符号化信号121とターゲット信号30はイコライゼーション推
定器33に入力される。推定器33の出力は次に符号化器35に与えられる。
【0027】 第1の符号化器32から出力されたビットストリーム38は受信器の再生処理
において13の位置で第1の符号化信号を133で再生するために使用する情報
を有する。符号化器35から出力されたビットストリーム36は従来の組み合わ
せ処理を使用してビットストリーム38と組み合わせられて(図3A参照)、伝
送媒体31を通過する復号ビットストリームとなる。復号ビットストリームは受
信機によって受信され、通常の分離処理(図3B参照)構成信号に分解される。
第1の符号化信号を再生するための情報を含むビットストリームは再生器13に
入力されて、イコライゼーション情報を含むビットストリームが復号化器37に
入力される。
【0028】 ビットストリーム36と38は、図3では線で示すように、別々の伝送媒体3
1を通って送信されても良い。
【0029】 復号化器37の出力はイコライゼーションオペレータ39に、再生器13から
の再生信号133と共に入力される。イコライゼーションオペレータ39は改良
再生信号135を出力する。
【0030】 イコライゼーション推定器33はターゲット信号30に対して再生信号133
よりももっと近い改良再生信号135を作成するためにはどのイコライゼーショ
ンオペレーションを実行すべきかを決定する。推定器33は次に、ターゲット信
号30と改良再生信号135との相対類似度が最大になるようなイコライゼーシ
ョン推定値を出力する。推定器33からの34におけるイコライゼーション推定
出力と、その結果得られた符号化器35からの出力は伝達媒体31を通過して3
7で復号化される。復号化器37からの再生されたイコライゼーション推定出力
はイコライゼーションオペレータ39が再生信号133を改良するために使用し
て、改良再生信号135が得られる。
【0031】 イコライゼーション機能についてより詳細に記載する。すべての信号はここで
は8000Hzのサンプリングレートでサンプリングしたものと仮定する。本発
明の1つの実現形態によれば、ターゲット信号と第1の符号化信号は、それぞれ
の信号ブロックが対応する信号に応じた複数のサンプルを有する、信号ブロック
のシーケンスとして処理される。ブロックサイズはフレームの長さ、サブフレー
ムの長さ、あるいはそれらの間の所望の長さである。信号ブロックはターゲット
と第1の符号化信号に対して同期しており、ターゲットと第1の符号化信号の対
応するブロックは「ブロック化された信号の組」と称する。信号ブロックは、時
間に従って最初から最後まで対応する信号ブロックを単にその位置に置くことに
よってどんな信号でも正確に再生することができるように選択される。上述のブ
ロック処理技術は関連技術分野では良く知られた技術である。イコライゼーショ
ン推定(図3の33を参照)、推定値の符号化と復号化(図3の35と37を参
照)、改良(例えばイコライゼーション)処理(図2の21と図3の39参照)
は、ブロック化された1つの組毎に個別に実行されるのが好ましい。
【0032】 上述のブロック処理は、ブロック化の悪影響のために適当でない場合がある。
このような場合には、信号は、例えば、長さがLのサンプル(たとえば256個
)でブロック化の悪影響を排除するために長さL/2(つまり128)だけ重複
させた、周知のハンウインドウのような従来のウインドウ技術によって処理する
ことができる。
【0033】 図4に示した実施例は、フーリエ変換を使用して周波数領域で表現された後の
ブロック化された信号の概念を示すものである。B(n)はターゲット信号の離
散複素スペクトルであり、BR(n)は(離散実)再生信号の離散複素スペクト
ルである。この例でのイコライゼーション操作とは再生信号BR(n)に離散符
号化スペクトルT(n)を掛けることである。従って、改良再生信号BE(n)
は以下のように表現される。
【数1】 BE(n)が時間領域での実信号に対応するためには、T(n)の実部と虚部は
対称性を有している必要がある。BR(n)、n=0、・・・、N−1、が消滅
しない一般的な状況では、T(n)の最適な表現(元の信号B(n)の正確な再
現)は、上記の式でBE(n)=B(n)とおいて得られ、その式をT(n)に
ついて解くと以下のようになる。
【数2】
【0034】 目的は、BE(n)とB(n)との間の類似度を最大にする符号化されたT(
n)の表現を見つけることである。判断基準は人の知覚に基礎を置くのが望まし
い。この符号化された表現のフォーマットの選択は、第1の符号化信号を作成す
るために使用された第1の符号化器に依存する。
【0035】 ここで記載したイコライゼーションオペレータの実機を、第1の符号化器とし
てLPAS符号化手法を試用するものについて実現した。知覚に関する実験によ
って、この場合には、TOPT(n)の位相スペクトルを変化させてもイコライ
ゼーション性能にあまり影響が無いことがわかった。したがって、説明する実施
例では、TOPT(n)の振幅スペクトルだけを使用する。
【0036】 逆パワースペクトル|TOPT(n)|−2の逆離散フーリエ変換によって、
自己相関シーケンスが得られ、それに基づいて、当業者に周知の、例えばレビン
ソン−ダービンアルゴリズムのような技術を用いて予測係数を求めることができ
る。予測係数は絶対値の離散値が|H(n)|であるオールポールフィルタに相
当する。逆パワースペクトル|H(n)|−2は、|TOPT(n)|の近似
値を与える。フィルタH(n)は、例えば、20次のフィルタであっても良い。
|T(n)|を近似するために|H(n)|を使用することの利点は、例えば、
ブロック信号B(n)とBR(n)に80サンプル使用されているとすれば、|
T(n)|は40の値で定義されるのに対して、|H(n)|は、H(n)で表
される20次のオールポールフィルタに対応する20の値(つまり予想係数)で
定義されるに過ぎないことを了解すれば理解されるはずである。
【0037】 終局的には、逆パワースペクトル|HOPT(n)|−2で求めることができ
るオールポールフィルタ|H(n)|は、スペクトルの谷を作成するのに有効で
、したがって音楽信号を符号化するときに有効である。目的が背景ノイズに対す
る性能の向上であれば、スペクトルのピークがより重要である。この場合には、
自己相関シーケンスを作成するためにパワースペクトル|TOPT(n)|
使用し、終局的には、所望のオールポールフィルタを作成する。
【0038】 図5は、図3に示した推定器33の1例を示すものである。ターゲット信号ブ
ロックと第1の符号化信号ブロックは56で1組としてフーリエ変換され(別の
周波数領域への変換を使用しても良い)信号B(n)とBR(n)を作成し、こ
れらがディバイダ51とシンプリファイア53を有するディバイダ50に入力さ
れる。B(n)はBR(n)によって分割器51によって割り算されてT(n)
が得られ、シンプリファイア53によって位相情報は破棄され、振幅情報|T(
n)|だけが符号化器35に供給される。
【0039】 符号化器は|T(n)|を受け取って|H(n)|を作成する。図6は、図3
に示した符号化器35の一例を示す。図6の符号化器の例は、入力として|T(
n)|を受け、出力が係数発生器67に与えられる自己相関関数(ACF)作成
器61と、その出力が周波数変換器63に与えられる係数作成器67と、その出
力が量子化器65に与えられる周波数変換器63を具備する。
【0040】 図7は図6に示した符号化器の動作の例を示すものである。71において、自
己相関関数作成器61が|T(n)|から上述の方法によって自己相関関数AC
Fを求める。73では、上述の方法で係数作成器67が自己相関関数ACFから
|H(n)|を求める。75では、周波数変換器63が|H(n)|に対して、
認識に関する周波数領域への適切な周波数変換(例えば周知のバークまたはER
Bスケール)を適用する。その結果得られた周波数変換された|H(n)|の係
数は、量子化器によって量子化され、量子化された係数に相当するビットストリ
ームが量子化器から36の地点で出力される(図3と図6を参照)。量子化方法
は多くのものを使用することができ、これには多段およびスプリットベクトル量
子化や単純スケール量子化が含まれる。
【0041】 図8は、図3に示したイコライゼーションオペレータ39の例を示す。133
で再生された信号は、81でフーリエ変換され(図5に示した56の位置での変
換に適当であればこれ以外の周波数領域への変換を使用することもできる)、B
R(n)が作成される。復号化器37は82において符号化された|H(n)|
(例えばビットストリーム)を伝送媒体31から受け取り、周知の複合化技術を
使用して出力として|H(n)|を作成する。積算器83は入力として|H(n
)|とBR(n)を受け、|H(n)|にBR(n)をかけてBE(n)を得る
。この信号を次に逆フーリエ変換して85(81で用いた変換と対をなすこれ以
外の周波数領域の逆変換を使用することもできる)、135で時間領域での改良
再生信号を得る。
【0042】 受信機において|H(n)|のフィルタ係数が正しく得られなければ、積算器
83は自動的に|H(n)|=1、n=0、・・・、N−1とおく。これは、イ
コライゼーションオペレータが、再生信号BR(n)に単に1を掛けることによ
って積算器83を「透明」にすることを意味する。したがって、図3Aと3Bに
示した復号ビットストリームを使用した場合、|H(n)|情報を有するビット
ストリーム(図3における36)を必要なら破棄してビットレートを下げても、
第1の符号化信号を再生する受信機の能力は影響を受けない。
【0043】 図9は、図4に示した伝達関数T(n)のマルチステップによる実施を示した
ものである。図9では、T(n)はQ+1個のステージ、つまり、T(n)、
(n)、・・・、T(n)を有する。
【0044】 図10は、図6に示した符号化器において、図9に示した多段伝達関数を実現
する例を示したものである。図10の100において、インデックスカウンタq
を0に設定し、Qを図9に示した伝達関数の最終ステップを表すものとする。1
01では、|T(n)|を図5に示したシンプリファイア53から受け取った
所望の全体的な|T(n)|と等しいとおく。102では、上述の方法によって
|T(n)|から自己相関関数ACFを求める。103では、|H(n)|
の予想係数が、上述の方法によってACFから計算される。105では、|H (n)|を周波数変換して上述のように量子化する。107では、段階インデッ
クスqが定数Qと等しければ、符号化操作は完了する。さもなければ、108に
おいて、|Tq+1(n)|を|T(n)|/|H(n)|と等しいとおく
。その後、106で段階インデックスを1つ増分し、102で|T(n)|か
ら自己相関関数ACFを得て、q=0からq=Qに対する|H(n)|が得ら
れるまで上述の手順を繰り返す。図10に示す符号化操作を完了した後、T(n
)を以下の関係を用いて近似する。
【数3】 それぞれの|T(n)|に対して、図10に示した符号化器の処理によって対
応する|H(n)|が得られることに注意されたい。したがって、上述の結果
は所望の|T(n)|の近似値を与えるものである。
【0045】 図11は、図8に示したイコライゼーションオペレータに図9に示した多段伝
達関数を取り込んだ変形例を示すものである。イコライゼーション復号化器37
の出力が積作成器111に入力される。積作成器111は、復号化器37から前
の結果であるステージ係数|H(n)|を受け取り、積を計算し、その積を積
算器83に渡して再生された信号BR(n)と掛け算させる。受信機が前の積で
あるすべてのステージの係数を受信することができなければ、積作成器111は
受信できなかった係数をすべて1として受信した係数はそのまま受信した値を維
持して積を計算する。図9に示した複数の段階は、送信機で個別に符号化して、
ビットレートを節約するためにどの段階、どのグループまたはすべての段階を破
棄しても良いように埋め込まれて送信される。
【0046】 図12は電気通信システム(例えばセルラー携帯電話内部の送信機)の送信機
に含まれるスピーチ符号化器の例を示すものであり、図3と5に示したイコライ
ゼーション推定器33が含まれる。図12に示した実施例は、適応コードブック
と代数コードブックを有する、従来のACELP(代数符号励起線形予測)符号
化処理を含む。1時符号化信号121は加算回路120の出力部で得られて、適
応コードブックにフィードバックされ(従来のように)、ターゲット信号30と
共にイコライゼーション推定器に入力される。ターゲット信号は、音声信号12
5を発生させる励起信号を表し、音声信号を、合成フィルタ122の逆特性を有
する逆合成フィルタ123に入力することによって得られる。図1と3に示した
入力信号に対応する音声信号125は、例えば、声、音楽及び背景ノイズの内の
1つ以上を含むものである。量子化推定器33は第1の符号化信号とターゲット
信号に応答してイコライゼーション推定値|T(n)|を作成する。イコライゼ
ーション推定値は第1の符号化された信号121がターゲット信号30にどの程
度よく一致するか、したがって、第1の符号化信号が音声信号125をどの程度
よく表現しているかを示す情報からなる。図12に示した従来の検索方法部12
4は、当該技術分野においては周知の方法で上述のビットストリーム38のため
の情報(当該情報から受信機の側で1時符号化信号を再生する)を作成する。検
索方法部124は、従来の方法に従ってコードブックとそれに対応するアンプを
制御する。
【0047】 図13に示した例は、図3、8、と11に示したイコライゼーションオペレー
タを具備する通信システムの受信機(例えば、セルラー電話機の受信機)に備え
られたスピーチ復号化器を例示するものである。図13に示した例は、適応コー
ドブックと代数コード部とを具備する従来のACELP複合化方法を使用する。
1時符号化信号121の再生133(図3参照)は加算回路131の出力部で得
られ、イコライゼーションオペレータ39に入力される。イコライゼーションオ
ペレータは又イコライゼーション復号化器37から|H(n)|を受け取る。こ
れらの入力応答して、イコライゼーションオペレータは135において図2と3
に示す改良再生信号を作成し、これが従来型の合成フィルタ122に入力される
。(伝送媒体331から受信された)ビットストリーム38に含まれる情報は、
従来方法にしたがって、多重化と複合化(図示しない)を経て、コードブックと
そのアンプに対して従来方法の制御を可能にする。
【0048】 図13に示す適応コードブックにフィードバックされる133における再生信
号(ACELP励起信号)はイコライゼーションオペレータでは改良されていな
いが、イコライゼーションオペレータからの改良された信号135を適応コード
ブックにフィードバックさせることができる(図13の破線を参照)。これを行
う方法の1つは、ブロック長をサブフレームの長さと同じに設定して、送信機が
サブフレーム毎のイコライゼーションオペレータを推定するようにすることであ
る。別のアプローチは、復号化器37においてイコライゼーションオペレータが
サブフレームに対して補間を行い、送信機が使用したブロック長にかかわらず、
受信機がサブフレームの長さのブロックを有効に処理できるようにすることであ
る。改良信号135が適応コードブックにフィードバックされれば、|H(n)
|の情報を有するビットストリームは、133で再生信号を作成するために使用
するので、ビットレートを下げるために破棄することはできない。
【0049】 図13に示す改良信号135が適応コードブックにフィードバックされるなら
、イコライゼーションオペレータ39を送信機のスピーチ符号化器のフィードバ
ックループに挿入する必要がある。例えば、イコライゼーションオペレータ39
は図12Aに示したように、図12のフィードバックフープに挿入することがで
きる。
【0050】 上述の適応符号化イコライザオペレータは、第1の符号化器によって符号化さ
れた信号に対して、改良された信号が何らかの判断基準に基づいてターゲット信
号により近いものになるように、線形または非線形フィルタ処理または丸め処理
を行う。この構造には多くの利点がある。符号化されたイコライザが積算的な性
質を持っているので、同じビットレートであれば、第1の符号化器で符号化され
た信号に対して加算的な修正に比較してダイナミックレンジがはるかに大きな修
正を行うことができる。人の聴覚は非常に広いダイナミックレンジを有するので
、このことは音声信号を符号化する際は特に有利な点となる。
【0051】 符号化されたイコライゼーションオペレーションの伝達関数は振幅と位相スペ
クトルに分解することができる。位相スペクトルは基本的に時間−周波数平面に
おける事象の時間ずれを表すものである。伝達関数の最適な位相スペクトルを位
相ゼロのスペクトル(あるいは、小さくかつゆっくりと変化するその他のスペク
トル)に変換することによっても性能はほとんど低下しないことが実験的に確認
された。したがって、符号化しなければならないのは振幅スペクトルだけである
。このことは、第1の信号に別の信号を足し合わせることで修正を行うシステム
とは好対照を成す。加算された信号の符号化は、時間−周波数平面における事象
のわずかな時間的なずれに関しても人の聴覚は敏感に感じ取ってしまうことに基
づかなければならない。
【0052】 符号化されたイコライザオペレータをLPAS符号化と組み合わせると、LP
AS技法の本質的な欠点を克服することができる。つまり、符号化されたイコラ
イザオペレータはスペクトルの谷を正確に表現することができる。さらに、調和
構造に含まれる非調和ピークを正確にモデル化することも可能である。
【0053】 符号化されたイコライゼーション方法は第1の符号化器の欠点を補償して符号
化モデルの問題に焦点を当てて性能を向上させることも可能である。CELPに
関連しては、変換領域の符号かイコライゼーションを使用して、時間領域のCE
LPモデルでは十分に符号化することができない非スピーチ信号(音楽と背景ノ
イズ)に対する性能を顕著に改良することができる。新しい符号化モデルの結果
、スピーチに対する性能も向上する。
【0054】 符号化されたイコライザオペレータは、従来の加算的な方法に対して、本質的
に積算的な特徴を有する。このことは、例えば、振幅と位相情報を分離して独立
に符号化することができることを意味している。通常は、位相情報は破棄するこ
とができるが、従来の方法ではこれは不可能である。
【0055】 符号化されたイコライザオペレータは埋め込みモードで容易に作動することが
できる。例えば、チャネル誤差やビットレートを下げる必要から、ビットを少な
くすることができ、その結果符号化されたイコライザオペレータは透明性を有し
、第1の符号化器によっても十分に良い復号信号を得ることができる。
【0056】 当該分野の技術者には、図2ないし13に示した実施例を、例えば、適切にプ
ログラムされたデジタル信号プロセッサやその他のプロセッサによって実施する
ことができ、また例えば、そのような適切にプログラムされたプロセッサとそれ
に接続された別の外部回路を併用することで実施できることは自明である。
【0057】 本発明の実施例について詳細に上述したが、これらは本発明の範囲を制限する
ものではなく、種々の実施形態によって実現可能である。
【図面の簡単な説明】
【図1】 従来のスピーチ符号化システムを部分的に示すものである。
【図2】 本発明に基づく改良機能を模式的に示すものである。
【図3】 図2に示した改良機能の例を含むLPASスピーチ符号化システ
ムを模式的に示すものである。図3Aと図3Bは、図3の特性を詳細に示すもの
である。
【図4】 図2に示した改良機能をフーリエ変換領域で示したものである。
【図5】 図3に示したイコライゼーションオペレーション推定器の実施例
を示すものである。
【図6】 図3に示したイコライゼーション符号化器をより詳細に示すもの
である。
【図7】 図6に示した符号化器の機能的な作用を示したものである。
【図8】 図3に示したイコライゼーションオペレータの実施例を示したも
のである。
【図9】 図4に示した伝達関数のマルチステップ実現を示すものである。
【図10】 図9に示したマルチステップ伝達関数を実現した図6に示す符
号化器の動作を示すものである。
【図11】 図9に示したマルチステップ伝達関数を実現するために図8に
示した修正イコライゼーションオペレータを示すものである。
【図12】 図3と5に示したイコライゼーション推定器を有する本発明に
基づく符号励起線形予測(CELP)符号化器を示すものである。図12Aは、
図12に示した符号化器の別の実施例を示すものである。
【図13】 図3,8と11に示したイコライゼーションオペレータを有す
る本発明に基づくCELP復号化器を示すものである。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,SD,SL,SZ,TZ,UG,ZW ),EA(AM,AZ,BY,KG,KZ,MD,RU, TJ,TM),AE,AL,AM,AT,AU,AZ, BA,BB,BG,BR,BY,CA,CH,CN,C R,CU,CZ,DE,DK,DM,EE,ES,FI ,GB,GD,GE,GH,GM,HR,HU,ID, IL,IN,IS,JP,KE,KG,KP,KR,K Z,LC,LK,LR,LS,LT,LU,LV,MA ,MD,MG,MK,MN,MW,MX,NO,NZ, PL,PT,RO,RU,SD,SE,SG,SI,S K,SL,TJ,TM,TR,TT,TZ,UA,UG ,UZ,VN,YU,ZA,ZW Fターム(参考) 5D045 AB24 DA02 5J064 AA01 BA16 BB03 BC02 BC12 BC18 BD02

Claims (52)

    【特許請求の範囲】
  1. 【請求項1】 入力信号を符号化して伝送媒体上を送信するために符号化情
    報を作成する送信機であって、 入力信号を受けるための入力部と、入力信号に応答してターゲット信号を出力
    する第1の出力部と、入力信号に応答してターゲット信号と一致することを目的
    とした第1の符号化信号を出力するための第2の出力部と、当該第1の符号化信
    号を再生するための符号化情報を出力するための第3の出力部とを有する第1の
    符号化器と、 前記第1の符号化器と接続されて前記第1の符号化信号と前記ターゲット信号
    を受け取るための入力部を有し、前記第1の符号化信号と前記ターゲット信号と
    に応答して前記第1の符号化信号がどの程度ターゲット信号と一致しているかを
    示す改良情報を出力する出力部とを有する改良推定器と、 前記改良推定器と接続されて前記改良情報を受け取る入力部と、当該改良情報
    の符号化された表現を出力するための出力部とを有する符号化器と、 前記第1の符号化器と接続されて伝送媒体に対して、前記第1の符号化信号を
    再生するための前記符号化された情報を出力するための出力部を有し、当該出力
    部は同時に前記符号化器に接続されて符号化された表現の前記改良情報を伝送媒
    体に出力する送信機。
  2. 【請求項2】 セルラー電話機に設けられた請求項1に記載の送信機。
  3. 【請求項3】 前記入力信号は音声信号であり、前記第1の符号化器は線形
    予測符号化処理を行う請求項1に記載の送信機。
  4. 【請求項4】 前記推定器は前記ターゲット信号と前記第1の符号化信号と
    の周波数領域への変換を行う周波数領域変換器を具備する請求項1に記載の送信
    機。
  5. 【請求項5】 前記推定器は、前記変換器と接続されて変換された信号の内
    の1つを他の変換された信号で割り算して、所望の伝達関数に関する情報を含む
    、前記改良情報を作成する割り算機を具備する請求項4に記載の送信機。
  6. 【請求項6】 前記符号化器は前記割り算器と接続され、前記所望の伝達関
    数に応じて当該伝達関数を近似する近似関数を作成する請求項5に記載の送信機
  7. 【請求項7】 前記符号化器は、前記所望の伝達関数に関する情報を受けて
    それに基づいて自己相関関数を作成する自己相関関数作成器を具備する請求項6
    に記載の送信機。
  8. 【請求項8】 前記近似関数はフィルタ関数であり、符号化器は前記自己相
    関関数作成器と接続されて自己相関関数に基づいて当該近似関数を規定するフィ
    ルタ係数を作成する係数作成器を具備する請求項7に記載の送信機。
  9. 【請求項9】 前記符号化器は前記係数作成器と接続されて前記フィルタ係
    数を周波数変換して周波数変換された近似関数を作成する請求項8に記載の送信
    機。
  10. 【請求項10】 前記符号化器は前記周波数変換器に接続されて、周波数変
    換された近似関数のフィルタ係数を量子化する量子化器を具備する請求項9に記
    載の送信機。
  11. 【請求項11】 前記符号化器が前記近似関数を、集合的に前記近似関数を
    規定する一連の近似ステージとして定式化する請求項6に記載の送信機。
  12. 【請求項12】 前記所望の伝達関数に関する情報は、所望の伝達関数の振
    幅情報のみを含む請求項5に記載の送信機。
  13. 【請求項13】 さらに、前記第1の符号化器と接続されて前記第1の符号
    化信号に関する符号化された情報を受け取り、前記符号化器と接続されて符号化
    された表現の前記改良情報を受け取る入力部と合成器を具備し、当該合成機は前
    記第1の符号化された信号に関する符号化された情報に対応する第1の部分と、
    符号化された前記改良情報に相当する追加の部分とを出力する、前記送信機の出
    力部に接続された出力部を具備する請求項1に記載の送信機。
  14. 【請求項14】 伝送媒体から符号化された情報を受けて復号する受信機で
    あって、 当該符号化された情報の一部を受信する入力部と、当該符号化された情報に応
    じてターゲット信号に一致することを目的とした再生信号を出力する出力部とを
    有する再生器と、 前記符号化された情報の部分を受信する入力部と、当該符号化された情報に応
    じて、前記再生信号がどの程度よくターゲット信号に一致するかを示す改良情報
    を出力する出力部とを有する復号化器と、 前記再生器と前記復号化器に接続されて前記再生信号と前記改良情報とを受け
    取り、当該再生信号と当該改良情報とに応じて、前記再生信号よりもターゲット
    信号によりよく一致する改良再生信号を作成して出力する出力部とを有する受信
    機。
  15. 【請求項15】 前記エンハンサは前記再生信号がエンハンサを改良されず
    に通過することができるように選択的に作動する請求項14に記載の受信機。
  16. 【請求項16】 前記エンハンサは前記再生器に接続されて、前記再生信号
    の周波数領域の変換を作成する周波数領域変換器を具備する請求項14に記載の
    受信機。
  17. 【請求項17】 前記エンハンサは、前記変換器と前記符号化器に接続され
    て、変換された再生信号に改良情報を掛ける積算機を具備する請求項16に記載
    の受信機。
  18. 【請求項18】 前記改良情報はフィルタを規定するフィルタ係数を含む請
    求項17に記載の受信機。
  19. 【請求項19】 前記エンハンサは、前記積算器に接続された周波数領域逆
    変換器を具備して前記積算器の出力信号の周波数領域逆変換を行う請求項17に
    記載の受信機。
  20. 【請求項20】 前記改良情報は複数のフィルタステージを有するマルチス
    テージフィルタを記載し、前記エンハンサは前記復号化器に接続されて改良情報
    に基づいて、当該マルチステージフィルタの対応するステージを規定するフィル
    タ各段の伝達関数を作成し、マルチステージフィルタを規定する全体フィルタ伝
    達関数に相当する積の作成器を具備し、当該作成器の出力部は前記積算器に接続
    されて積算機に全体フィルタ伝達関数を供給する、請求項17に記載の受信機。
  21. 【請求項21】 前記積作成器はその積から任意のフィルタステージ伝達関
    数を除外することができる請求項20に記載の受信機。
  22. 【請求項22】 前記受信機はセルラー電話機に設けられている請求項14
    に記載の受信機。
  23. 【請求項23】 前記ターゲット信号は音声信号の表現であり、前記再生器
    は線形予測符号化処理を行う請求項14に記載の受信機。
  24. 【請求項24】 伝送媒体を介して送信するための符号化された情報を作成
    するための入力信号符号化方法であって、 入力信号に応じてターゲット信号を作成し、 入力信号に応じて、ターゲット信号に一致することを目標とした第1の符号化
    信号を作成し、 入力信号に基づいて、第1の符号化信号が再生される符号化情報を作成し、第1
    の符号化信号とターゲット信号に基づいて、第1の符号化信号がどの程度ターゲ
    ット信号に一致するかを示す改良情報を作成し、 符号化された改良情報と第1の符号化信号を再生すべき符号化情報とを伝送媒
    体に対して出力する方法。
  25. 【請求項25】 前記出力過程はセルラー電話機において送信機を操作する
    過程を含む請求項24に記載の方法。
  26. 【請求項26】 前記入力信号は音声信号であり、前記第1の符号化信号を
    作成する過程は線形予測符号化処理を行うものである請求項24に記載の方法。
  27. 【請求項27】 前記改良情報を作成する過程は、ターゲット信号と第1の
    符号化信号のそれぞれ対応する周波数領域変換を行うことを含む請求項24に記
    載の方法。
  28. 【請求項28】 前記改良情報の作成過程は、変換された信号の内の1つを
    変換された別の信号で割って、所望の伝達関数に関する情報を作成することを含
    む請求項27に記載の方法。
  29. 【請求項29】 前記符号化された表現を作成する過程は、所望の伝達関数
    を近似する近似関数を作成することを含む請求項28に記載の方法。
  30. 【請求項30】 前記近似関数の作成過程は、前記所望の伝達関数に関する
    情報から自己相関関数を作成することを含む請求項29に記載の方法。
  31. 【請求項31】 前記近似関数はフィルタ関数であり、前記近似関数を作成
    する過程は、当該自己相関関数に基づいて近似関数を規定するフィルタ係数を作
    成することを含む請求項30に記載の方法。
  32. 【請求項32】 前記近似関数を作成する過程は、前記フィルタ係数に対し
    て周波数変換を行って周波数変換された近似関数を作成する請求項31に記載の
    方法。
  33. 【請求項33】 前記近似関数を作成する過程は、周波数変換された近似関
    数のフィルタ係数を量子化することを含む請求項32に記載の方法。
  34. 【請求項34】 前記近似関数を作成するステップは、所望の伝達関数の振
    幅情報のみを用いて近似関数を作成する請求項29に記載の方法。
  35. 【請求項35】 前記近似関数を作成する過程は、近似関数を、集合的に近
    似関数を規定する一連の連続した近似ステージによって定式化することを含む請
    求項29に記載の方法。
  36. 【請求項36】 前記出力過程は、第1の符号化信号が再生されるべき符号
    化信号に対応する第1の部分と、改良情報の符号化された表現に対応する追加の
    部分とを有する複合信号を作成することを含む請求項24に記載の方法。
  37. 【請求項37】 伝送媒体から受信した符号化情報を復号する方法であって
    、 符号化された情報からターゲット信号に一致することを目標にした再生信号を
    再生し、 符号化された情報から再生信号がどの程度よくターゲット信号に一致するかを
    示す改良情報を取得し、 再生信号と改良情報とに基づいて、再生信号以上にターゲット信号に一致する
    改良再生信号を作成することを含む方法。
  38. 【請求項38】 さらに、前記改良再生信号の作成過程を選択的に実行する
    請求項37に記載の方法。
  39. 【請求項39】 前記改良再生信号の作成過程は、再生信号の周波数領域変
    換を作成することを含む請求項37に記載の方法。
  40. 【請求項40】 前記改良再生信号の作成過程は、変換された再生信号に改
    良情報を掛けることを含む請求項39に記載の方法。
  41. 【請求項41】 前記改良情報はフィルタを規定するフィルタ係数を含む請
    求項40に記載の方法。
  42. 【請求項42】 前記改良再生信号の作成過程は、前記積算過程で得られた
    積の周波数領域変換を作成することを含む請求項40に記載の方法。
  43. 【請求項43】 前記改良情報は、複数のステージを有するマルチステージ
    フィルタを記述し、前記改良再生信号作成はマルチステージフィルタの対応する
    ステージを規定し、その積がマルチステージフィルタを規定する全体フィルタ伝
    達関数に相当する、フィルタステージ伝達関数の積を求める過程を有する請求項
    40に記載の方法。
  44. 【請求項44】 前記積を求める過程は、積からどのフィルタステージの伝
    達関数をも選択的に除外することが可能である請求項43に記載の方法。
  45. 【請求項45】 前記伝送媒体はセルラー電話ネットワークの通信チャネル
    である請求項37に記載の方法。
  46. 【請求項46】 前記ターゲット信号は音声信号を表現したものであり、前
    記再生過程は線形予測符号化処理を含むものである請求項37に記載の方法。
  47. 【請求項47】 前記周波数領域変換器はフーリエ変換を行うためのフーリ
    エ変換器を含む請求項4に記載の送信機。
  48. 【請求項48】 前記周波数領域変換器はフーリエ変換を行うためのフーリ
    エ変換器を含む請求項16に記載の受信機。
  49. 【請求項49】 前記周波数領域逆変換器はフーリエ逆変換を行うためのフ
    ーリエ逆変換器を含む請求項19に記載の受信機。
  50. 【請求項50】 前記周波数領域変換を行う過程はフーリエ変換を行うこと
    を含む請求項27に記載の方法。
  51. 【請求項51】 前記周波数領域の変換を行う過程は、フーリエ変換を行う
    ことを含む請求項39に記載の方法。
  52. 【請求項52】 前記周波数領域の逆変換を行う過程は、フーリエ逆変換を
    行うことを含む請求項42に記載の方法。
JP2000590163A 1998-12-18 1999-12-07 符号化通信信号の性能改良のための符号化された改良特性 Pending JP2002533963A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/216,339 US6182030B1 (en) 1998-12-18 1998-12-18 Enhanced coding to improve coded communication signals
US09/216,339 1998-12-18
PCT/SE1999/002289 WO2000038178A1 (en) 1998-12-18 1999-12-07 Coded enhancement feature for improved performance in coding communication signals

Publications (1)

Publication Number Publication Date
JP2002533963A true JP2002533963A (ja) 2002-10-08

Family

ID=22806660

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000590163A Pending JP2002533963A (ja) 1998-12-18 1999-12-07 符号化通信信号の性能改良のための符号化された改良特性

Country Status (8)

Country Link
US (1) US6182030B1 (ja)
EP (1) EP1141946B1 (ja)
JP (1) JP2002533963A (ja)
CN (1) CN1334952A (ja)
AT (1) ATE263998T1 (ja)
AU (1) AU3088200A (ja)
DE (1) DE69916321T2 (ja)
WO (1) WO2000038178A1 (ja)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW439368B (en) * 1998-05-14 2001-06-07 Koninkl Philips Electronics Nv Transmission system using an improved signal encoder and decoder
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
US6581032B1 (en) * 1999-09-22 2003-06-17 Conexant Systems, Inc. Bitstream protocol for transmission of encoded voice signals
EP1199812A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Perceptually improved encoding of acoustic signals
EP1199711A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Encoding of audio signal using bandwidth expansion
US7606703B2 (en) * 2000-11-15 2009-10-20 Texas Instruments Incorporated Layered celp system and method with varying perceptual filter or short-term postfilter strengths
KR100885055B1 (ko) * 2001-02-19 2009-02-23 코닌클리케 필립스 일렉트로닉스 엔.브이. 주신호의 비트스트림에 보조신호를 삽입하는 방법
US7272555B2 (en) * 2001-09-13 2007-09-18 Industrial Technology Research Institute Fine granularity scalability speech coding for multi-pulses CELP-based algorithm
CA2392640A1 (en) * 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
US7672838B1 (en) * 2003-12-01 2010-03-02 The Trustees Of Columbia University In The City Of New York Systems and methods for speech recognition using frequency domain linear prediction polynomials to form temporal and spectral envelopes from frequency domain representations of signals
US6980933B2 (en) * 2004-01-27 2005-12-27 Dolby Laboratories Licensing Corporation Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients
WO2006009075A1 (ja) * 2004-07-20 2006-01-26 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
US20070160154A1 (en) * 2005-03-28 2007-07-12 Sukkar Rafid A Method and apparatus for injecting comfort noise in a communications signal
US20060217972A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for modifying an encoded signal
US7490036B2 (en) 2005-10-20 2009-02-10 Motorola, Inc. Adaptive equalizer for a coded speech signal
US7590523B2 (en) * 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
US8515767B2 (en) 2007-11-04 2013-08-20 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs
DE102008037156A1 (de) * 2008-08-08 2010-02-18 Audi Ag Verfahren und eine Vorrichtung zur Reinigung eines Abgasstroms einer magerlauffähigen Brennkraftmaschine
EP2246845A1 (en) * 2009-04-21 2010-11-03 Siemens Medical Instruments Pte. Ltd. Method and acoustic signal processing device for estimating linear predictive coding coefficients
WO2010138309A1 (en) 2009-05-26 2010-12-02 Dolby Laboratories Licensing Corporation Audio signal dynamic equalization processing control
WO2010138311A1 (en) 2009-05-26 2010-12-02 Dolby Laboratories Licensing Corporation Equalization profiles for dynamic equalization of audio data
US8565811B2 (en) * 2009-08-04 2013-10-22 Microsoft Corporation Software-defined radio using multi-core processor
US9753884B2 (en) * 2009-09-30 2017-09-05 Microsoft Technology Licensing, Llc Radio-control board for software-defined radio platform
US8627189B2 (en) * 2009-12-03 2014-01-07 Microsoft Corporation High performance digital signal processing in software radios
US20110136439A1 (en) * 2009-12-04 2011-06-09 Microsoft Corporation Analyzing Wireless Technologies Based On Software-Defined Radio
DE102010006573B4 (de) * 2010-02-02 2012-03-15 Rohde & Schwarz Gmbh & Co. Kg IQ-Datenkompression für Breitbandanwendungen
JP5276047B2 (ja) * 2010-04-30 2013-08-28 株式会社エヌ・ティ・ティ・ドコモ 移動端末装置
KR101823188B1 (ko) 2011-05-04 2018-01-29 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 기지국을 위한 스펙트럼 할당 기법
CN103917466B (zh) 2011-09-14 2019-01-04 布鲁克斯自动化公司 装载工位
US8989286B2 (en) 2011-11-10 2015-03-24 Microsoft Corporation Mapping a transmission stream in a virtual baseband to a physical baseband with equalization
US9438652B2 (en) * 2013-04-15 2016-09-06 Opentv, Inc. Tiered content streaming

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4720861A (en) * 1985-12-24 1988-01-19 Itt Defense Communications A Division Of Itt Corporation Digital speech coding circuit
US5206884A (en) 1990-10-25 1993-04-27 Comsat Transform domain quantization technique for adaptive predictive coding
IT1241358B (it) 1990-12-20 1994-01-10 Sip Sistema di codifica del segnale vocale con sottocodice annidato
EP0520068B1 (en) * 1991-01-08 1996-05-15 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
ES2225321T3 (es) 1991-06-11 2005-03-16 Qualcomm Incorporated Aparaato y procedimiento para el enmascaramiento de errores en tramas de datos.
US5495555A (en) 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
US5327520A (en) 1992-06-04 1994-07-05 At&T Bell Laboratories Method of use of voice message coder/decoder
DE69526926T2 (de) 1994-02-01 2003-01-02 Qualcomm Inc Lineare vorhersage durch impulsanregung
US5574825A (en) * 1994-03-14 1996-11-12 Lucent Technologies Inc. Linear prediction coefficient generation during frame erasure or packet loss
US5684920A (en) 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
JPH08272395A (ja) 1995-03-31 1996-10-18 Nec Corp 音声符号化装置
JP3970327B2 (ja) * 1996-02-15 2007-09-05 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴイ 複雑さが軽減された信号送信システム

Also Published As

Publication number Publication date
AU3088200A (en) 2000-07-12
ATE263998T1 (de) 2004-04-15
DE69916321T2 (de) 2005-03-17
EP1141946B1 (en) 2004-04-07
EP1141946A1 (en) 2001-10-10
DE69916321D1 (de) 2004-05-13
US6182030B1 (en) 2001-01-30
CN1334952A (zh) 2002-02-06
WO2000038178A1 (en) 2000-06-29

Similar Documents

Publication Publication Date Title
JP2002533963A (ja) 符号化通信信号の性能改良のための符号化された改良特性
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
JP3653826B2 (ja) 音声復号化方法及び装置
JP3566652B2 (ja) 広帯域信号の効率的な符号化のための聴覚重み付け装置および方法
KR101303145B1 (ko) 계층적 오디오 신호를 코딩하기 위한 시스템, 오디오 신호를 코딩하는 방법, 컴퓨터-판독가능한 매체 및 계층적 오디오 디코더
US5778335A (en) Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
JP4132109B2 (ja) 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置
JP4550289B2 (ja) Celp符号変換
US7693710B2 (en) Method and device for efficient frame erasure concealment in linear predictive based speech codecs
KR101295729B1 (ko) 비트 레이트­규모 가변적 및 대역폭­규모 가변적 오디오디코딩에서 비트 레이트 스위칭 방법
JP3234609B2 (ja) 32Kb/sワイドバンド音声の低遅延コード励起線型予測符号化
EP1262956A2 (en) Signal encoding method and apparatus
JP4121578B2 (ja) 音声分析方法、音声符号化方法および装置
JP4176349B2 (ja) マルチモードの音声符号器
JP4040126B2 (ja) 音声復号化方法および装置
EP1328923B1 (en) Perceptually improved encoding of acoustic signals
JP2002527778A (ja) スピーチコーダパラメータの量子化方法
JP2002509294A (ja) 暗騒音条件下における音声符号化の方法
JP4826580B2 (ja) 音声信号の再生方法及び装置
Herre et al. Perceptual audio coding of speech signals
GB2352949A (en) Speech coder for communications unit
Seereddy Speech coding using multipulse excitation
JPH09269798A (ja) 音声符号化方法および音声復号化方法
AU2757602A (en) Multimode speech encoder