JP2003508806A - 改善されたエンコーダ及びデコーダを備える伝送システム - Google Patents

改善されたエンコーダ及びデコーダを備える伝送システム

Info

Publication number
JP2003508806A
JP2003508806A JP2001520406A JP2001520406A JP2003508806A JP 2003508806 A JP2003508806 A JP 2003508806A JP 2001520406 A JP2001520406 A JP 2001520406A JP 2001520406 A JP2001520406 A JP 2001520406A JP 2003508806 A JP2003508806 A JP 2003508806A
Authority
JP
Japan
Prior art keywords
signal
audio
segment
deriving
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001520406A
Other languages
English (en)
Inventor
アルノルダス ダブリュ ジェイ オーメン
ブリンカー アルベルタス シー デン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Electronics NV filed Critical Philips Electronics NV
Publication of JP2003508806A publication Critical patent/JP2003508806A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B14/00Transmission systems not characterised by the medium used for transmission

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 正弦オーディオエンコーダにおいて、周波数スペクトルの異なる部分を解析するために異なる時間軸を使用することは既知である。従来のエンコーダにおいては、入力信号を多数の副バンドに分割するために副バンドフィルタ処理が使用されている。入力信号を副バンドに分割することにより、2つのバンドの境界における信号成分が両副バンドの信号において表現される結果となることが起こり得る。この信号成分の二重の表現は、これら成分の符号化の際の幾つかの問題につながり得る。本発明によれば、信号成分が多重の表現を有するのを防止する防止手段(46、48、58、68;88、92、96)を使用することが提案される。

Description

【発明の詳細な説明】
【0001】
【技術分野】
本発明は、オーディオエンコーダを備える送信器を有する伝送システムに係り
、上記オーディオエンコーダがオーディオ信号を表す入力信号から少なくとも第
1信号セグメントと第2信号セグメントとを導出するセグメント化手段を有し、
上記第1信号セグメントが上記第2信号セグメントより長く、上記オーディオエ
ンコーダが上記第1及び第2信号セグメントから符号化されたオーディオ信号を
導出する手段を有し、前記送信器が伝送媒体を介して受信器に上記の符号化され
たオーディオ信号を送信する送信手段を有し、上記受信器が上記伝送媒体から上
記の符号化されたオーディオ信号を受信する受信手段を有すると共に、該符号化
されたオーディオ信号から復号されたオーディオ信号を導出するオーディオデコ
ーダを更に有するような伝送システムに関する。
【0002】 また、本発明は、送信器、エンコーダ、符号化方法、符号化方法を実行するコ
ンピュータプログラムを担持する有形媒体、及び符号化方法を実行するコンピュ
ータプログラムを伝送する信号にも関する。
【0003】
【背景技術】
請求項1の前置部に記載されたような伝送システムは、米国特許第5,886,276
号から既知である。
【0004】 斯様な伝送システム及びオーディオエンコーダは、オーディオ信号を限られた
伝送容量しか有さない伝送媒体を介して伝送しなければならない又は限られた記
憶容量しか有さない記憶媒体に記憶しなければならないような用途で使用される
。斯様な用途の例としては、インターネット上でのオーディオ信号の伝送、移動
電話から基地局への又はその逆のオーディオ信号の伝送、及びCD−ROM、固
体メモリ又はハードディスク装置へのオーディオ信号の記憶がある。
【0005】 限られたビットレートにおいて良好なオーディオ品質を達成するために、異な
る動作原理のオーディオエンコーダが試されてきた。これらの動作方法のうちの
1つにおいては、伝送されるべきオーディオ信号が、通常10ないし20msの
固定長を有するような複数のセグメントに分割される。これらセグメントの各々
において、オーディオ信号は、振幅、周波数及び多分位相により規定されるシヌ
ソイドであり得るような複数の信号成分により表される。
【0006】 送信器は上記信号成分の振幅及び周波数の表現を受信器に送信する。該送信器
により行われる動作は、チャンネル符号化、インターリーブ及び変調を含むこと
ができる。
【0007】 受信手段は、伝送チャンネルから上記オーディオ信号を表す信号を受信すると
共に、復調、逆インターリーブ及びチャンネル復号のような動作を実行する。デ
コーダは、上記受信手段から上記オーディオ信号の表現を受け取り、前記符号化
された信号により表された複数のシヌソイドを発生すると共にこれらを出力信号
に合成することにより、上記表現から再生オーディオ信号を導出する。
【0008】 これらのオーディオエンコーダの問題は、上記信号セグメントに対する適切な
長さ(時間単位での)を選択することにある。信号セグメントが長いと、信号成
分の決定に関する良好な周波数分解能を得ることは可能となるが、限られた時間
分解能の結果として、前エコー(pre-echo)と呼ばれる現象が起こり得る。前エ
コーは、オーディオ信号の急激なアタックのような事象(イベント)が、斯かる
イベントの実際の発生の前に既に聞こえる場合に発生する。信号セグメントが短
い場合は前エコーに関する問題は発生しないが、低周波数を伴う信号成分の決定
に対する周波数分解能が劇的に低下する。
【0009】 これを改善するために、上記米国特許においては、入力信号が副バンドフィル
タにより多数の副バンドに分割され、これら副バンドの各々に対して異なる長さ
の信号セグメントが選択される。これら信号セグメントの長さは、対応する副バ
ンドの周波数範囲に逆比例するように選択される。
【0010】 この方法の問題点は、副バンドの遷移バンド付近に位置する信号成分に対する
符号化品質が他の信号成分に対するものより低い点にある。
【0011】
【発明の開示】
本発明の目的は、前記前置部に記載したような伝送システムであって、上記問
題が解決されるような伝送システムを提供することにある。
【0012】 上記目的を達成するため、本発明による伝送システムは、前記符号化手段が、
符号化されたオーディオ信号に単一信号成分の多重表現が発生するのを防止する
防止手段を有することを特徴とする。
【0013】 本発明は、従来のシステムにおいては、副バンドフィルタの遷移バンドにおけ
る周波数が入力信号における同一の信号成分の多重表現につながってしまうとい
う認識に基づくものである。これらの多重表現は、送信されるべき信号成分を決
定するために音響心理学的モデルが使用されるような場合には好ましくない。更
に、符号化された信号において2度表現されている信号成分を再構築するのは困
難である。また、多重表現は、信号成分の多重表現がない場合に存在するよりも
大きなビットレートにつながってしまう。
【0014】 単一信号成分のこれら多重表現を防止又は抑圧するために上記防止手段を使用
することにより、関連する問題も除去されることになる。
【0015】 本発明の一実施例においては、上記防止手段は前記第1信号セグメントを表す
符号化されたオーディオ信号の一部から合成オーディオ信号を導出する合成手段
と、前記入力信号を表す信号から上記合成オーディオ信号を減算することにより
前記第2信号セグメントを導出する減算手段とを有する。オーディオ信号を表す
信号から第1信号セグメントを表す合成オーディオ信号を減算して第2信号セグ
メントを得ることにより、第1信号セグメントから決定された信号成分が、上記
オーディオ信号を表す信号から削除されるようになる。結果として、これらの信
号成分は第2信号セグメントにおいては存在しないか又は強く減衰される。この
ようにして、前記単一信号成分の多重表現が防止される。
【0016】 本発明の他の実施例においては、前記セグメント化手段が前記入力信号から他
の信号セグメントを導出するように構成され、該他の信号セグメントは前記第1
信号セグメントより長く、前記オーディオエンコーダは前記符号化されたオーデ
ィオ信号を上記他の信号セグメントにも基づいて導出するように構成され、前記
オーディオエンコーダが更に、上記他の信号セグメントを表す前記符号化された
オーディオ信号の一部から他の合成信号を導出する合成手段と、前記入力信号を
表す信号から上記他の合成オーディオ信号を減算することにより前記第1信号セ
グメントを導出する減算手段とを有している。実験は、セグメント内の周期の数
が大き過ぎることもなく小さ過ぎることもないので、少なくとも3つの異なる長
さを持つ連続するセグメントを使用するのが有利であることを示している。
【0017】 本発明の更に他の実施例においては、前記オーディオエンコーダが、フィルタ
処理された信号を前記入力信号から導出するフィルタを有すると共に、該フィル
タ処理された信号から前記第1信号セグメントを導出するように構成される。入
力信号をフィルタ処理することにより、上記入力信号から幾つかの信号成分を除
去して、残りの信号成分の決定を一層信頼性のあるものにすることが可能である
。第1信号セグメントに最早存在しない信号成分は、第2(又は他の)信号セグ
メントに存在し、そこで決定される。結果として、出力信号の一層完全な表現が
得られる。
【0018】 本発明の更に他の実施例は、前記符号化手段が、音響心理学的スケールで振幅
を表すように構成されていることを特徴とする。振幅を表すために音響心理学的
スケールを使用する結果、伝送チャンネルが一層効率的に使用される。何故なら
、所与のダイナミックレンジを持つ信号を表すのに、より少ないシンボルしか必
要とされないからである。斯様な音響心理学的スケールは、例えば対数スケール
とすることができる。
【0019】
【発明を実施するための最良の形態】
以下、本発明を、図面を参照して説明する。
【0020】 図1による伝送システムにおいては、送信されるべきオーディオ信号は送信器
2の入力端に供給される。送信器2においては、上記入力信号はオーディオエン
コーダ4に供給される。該オーディオエンコーダ4において、上記入力信号は減
算器12の第1入力端と、解析ユニット8の入力端とに供給される。解析ユニッ
ト8は、その入力信号に存在する正弦信号成分の振幅、位相及び周波数を決定す
る。
【0021】 上記正弦信号成分の振幅、位相及び周波数を表す出力信号を帯びる該解析ユニ
ット8の出力端は、合成器10の入力端とマルチプレクサ16の入力端とに接続
されている。上記合成器は、解析ユニット8から入力された振幅、位相及び周波
数に基づいて、複数のシヌソイドからなる合成オーディオ信号を発生する。
【0022】 上記合成オーディオ信号を伝送する上記合成器10の出力は、減算器12の第
2入力端に供給される。該減算器12は、合成器10により発生された上記合成
オーディオ信号を前記入力信号から減算する。
【0023】 減算器12の出力信号は、ノイズ解析器14に供給される。このノイズ解析器
14は、その入力におけるノイズ信号のスペクトルを決定する。該ノイズスペク
トルの表現情報はマルチプレクサ16に供給される。マルチプレクサ16は、解
析ユニット8及びノイズ解析器14からの各信号を組み合わせて、複合信号(co
mbined signal)にする。
【0024】 マルチプレクサ16は、好ましくは、解析ユニット8により決定されたどの信
号成分が知覚的に関連するかを決定するために音響心理学的モデルを使用するも
のとする。知覚的に関連のある信号成分のみが送信される。知覚的に関連のある
信号成分を決定する音響心理学的モデルは、周波数ドメインのエンコーダでは普
通に使用されており、従って当業者には既知である。
【0025】 マルチプレクサ16の出力信号は当該オーディオエンコーダ4の出力信号を構
成している。オーディオエンコーダ4の出力端は送信ユニット6の入力端に接続
され、該送信ユニットは伝送媒体3を介して受信器24に送信するのに適した信
号を発生する。送信ユニット6は、チャンネル符号化、インターリーブ及び変調
のような動作を行う。
【0026】 伝送媒体3からの信号は、受信器24における受信ユニット18に供給される
。受信ユニット18は、復調、逆インターリーブ及びチャンネル復号のような動
作を行う。
【0027】 受信ユニット18の出力端は、オーディオデコーダ22の入力端に接続されて
いる。該オーディオデコーダ22において、上記受信ユニットからの信号はデマ
ルチプレクサ20に供給され、該デマルチプレクサは解析ユニット8により決定
された正弦信号成分を表す第1信号及び解析器14により決定されたノイズスペ
クトルを表す第2信号を出力する。
【0028】 上記第1信号はシヌソイド合成器26に供給され、該合成器は上記第1信号か
ら合成信号を導出する。合成器26は、エンコーダ4に使用される合成器10と
同様のものである。上記第2信号はノイズ合成器28に供給され、該合成器は該
第2信号により規定されるスペクトルを持つようなノイズ信号を発生する。これ
は、受信されたスペクトルにIFFTを実行することによりなされ、そこではラ
ンダムな位相がスペクトル成分に割り当てられる。シヌソイド合成器26及びノ
イズ合成器28の出力信号は加算器30により加算され、前記入力オーディオ信
号の複製が得られる。
【0029】 図2の解析ユニット(解析器)8においては、入力信号はセグメント化ユニッ
ト42とローパスフィルタ30の入力端とに供給される。セグメント化ユニット
42は上記入力信号から360サンプルを有するセグメントを選択する。上記入
力信号の44.1kHzなるサンプルレートの場合、これは8.16msなる解析周
期(期間)に相当する。
【0030】 ローパスフィルタ30の出力端はデシメータ32の入力端に接続され、該デシ
メータは上記サンプルレートを3なる係数で低減する。ローパスフィルタ30は
偽信号防止を行うもので、500Hzなる遮断周波数を有する。この遮断周波数は
、偽信号防止に必要とされるものよりもかなり低いが、対応する解析窓内の小さ
な周期数を持つ信号のみが殆ど減衰されずに通過するように設計されている。
【0031】 デシメータ32の出力端はセグメント化ユニット40の入力端とローパスフィ
ルタ34の入力端とに接続されている。セグメント化ユニット40は、デシメー
タ32の出力から360サンプルを有するセグメントを選択する。14.7kHzな
る(低下された)サンプルレートの場合、これは24.5msなる解析周期に相
当する。
【0032】 ローパスフィルタ34は、165Hzなる遮断周波数を有する。該ローパスフィ
ルタ34の出力端はデシメータ36の入力端に接続され、該デシメータはサンプ
ルレートを再び3なる係数により低減する。デシメータ36の出力端はセグメン
ト化ユニット38の入力端に接続され、該ユニットは256サンプルを有するセ
グメントを選択する。(2倍低減された)4.9kHzなるサンプルレートの場合、
これは52.2msなる解析周期に相当する。
【0033】 セグメント化ユニット38の出力はスペクトル推定ユニット44に供給され、
該ユニットは、ピーク収集(peak picking)及びそれに続くフーリエドメインで
の詳細検索によりスペクトル成分を決定する。正弦成分を推定する幾つかの方法
が、オーディオ符号化の技術分野における当業者により良く知られている。
【0034】 スペクトル推定ユニット44の出力端は、周波数選択器50の入力端に接続さ
れている。この周波数選択器は、良好に規定された範囲内の周波数成分のみを選
択する。本例においては、選択器50は133Hzなる最大周波数を持つ周波数成
分のみを選択する。より高い周波数を持つスペクトル成分は単に廃棄される。補
正器52は、選択された信号成分の振幅及び位相値を補正する。この補正は、フ
ィルタ34により導入された振幅及び位相の歪みを補償するために必要とされる
。このフィルタの伝達関数は既知であるので、必要とされる補正係数は容易に決
定することができる。
【0035】 補正器52の出力は合成器54に供給され、該合成器は補正器52の出力信号
に基づいて合成音声信号を発生する。該合成器54により供給される合成音声信
号のサンプルレートは、デシメータ32の出力におけるサンプルレートに相当す
る。合成器54により供給された合成オーディオ信号は、減算器46により、セ
グメント化ユニット40の出力信号から減算される。合成器54と減算器46と
の組合せは、本発明による防止手段の一部である。従って、推定ユニット44に
より決定され選択ユニット50により選択された信号成分は、セグメント化手段
40の出力信号から実質的に除去される。
【0036】 減算器46の出力信号はスペクトル推定ユニット55に受け渡され、このユニ
ットは該出力信号におけるスペクトル成分を決定する。次いで、選択ユニット5
6が400Hzより低い周波数を持つ信号成分のみを選択する。
【0037】 補正器52及び選択器56の出力端はコンバイナ(combiner)58の入力端に
接続されている。コンバイナ58は、異なる持続期間を持つ信号セグメントから
導出される周波数推定を組み合わせる。より精細な時間軸(短いセグメント)に
おいては、より粗い時間軸におけるのと略同一の周波数を見つけることができる
から、対応する信号成分は単一の信号成分により表すことができる。本例におい
ては、この組合せは、周波数が10−3rad未満しか違わない場合になされる。
コンバイナ58も、上記防止手段の一部である。
【0038】 コンバイナ58の出力は、フィルタ30の振幅及び位相の歪みを補正するため
に補正器62に受け渡される。補正器62の出力信号は合成器60の入力端に供
給され、該合成器は識別された信号成分に基づいて合成オーディオ信号を発生す
る。合成器60により発生された合成オーディオ信号は、減算器48により、セ
グメント化ユニット42の出力信号から減算される。合成器60と減算器48と
の組合せは、本発明による防止手段の一部である。減算器48の出力信号はスペ
クトル推定ユニット64に受け渡され、該ユニットは、その入力信号における信
号成分を決定する。これら信号成分は補正器62の出力信号と一緒にコンバイナ
68に渡され、該コンバイナは入力信号内で見つかる全てのシヌソイドの表現を
決定する。推定器44により決定されるべきシヌソイドの最大数は5に等しくな
るように選定され、推定器44及び55により一緒に決定されるべきシヌソイド
の最大数は10であり、推定器44、55及び64により決定されるべきシヌソ
イドの合計数は60に等しくなるように決定されている。
【0039】 セグメント化ユニット38、40及び42の出力信号は、異なる長さを有して
いるから、上記解析も異なる時間軸に対して実行される。単一信号成分の多重表
現を抑圧又は防止する防止手段は、ここでは、合成器54及び60、減算器46
及び48、並びにコンバイナ58及び68である。しかしながら、上記合成器と
減算器との組合せのみが防止手段に使用されるか、又はコンバイナのみが防止手
段に使用されることも考えられる。
【0040】 図3の図には、解析器8で使用される信号セグメントが表示されている。グラ
フ70、71及び72は、時点Tにおける関係する信号セグメントを示してい
る。
【0041】 グラフ70は時点Tにおいてセグメント化ユニット42の出力端に得られる
セグメントを示している。このセグメントはN=360のサンプルを有している
。グラフ71は時点Tにおいてセグメント化ユニット40の出力端に得られる
セグメントを示している。このセグメントもN=360のサンプルを有している
【0042】 グラフ72は時点Tにおいてセグメント化ユニット38の出力端に得られる
セグメントを示している。この場合、該セグメントはM=256のサンプルを有
している。これらグラフから、当該解析においては異なる持続期間の信号セグメ
ントが使用されることが明らかである。
【0043】 グラフ73、74及び75は後続の解析時点Tにおける信号セグメントを示
している。全てのセグメントが最短のセグメントの持続期間にわたり右にシフト
されていることが分かる。これは、完全な解析が周期Tで行われるからである。
グラフ76、77及び78は、TよりT遅い、時点Tにおける信号セグメン
トを示している。
【0044】 図4のノイズ解析器14においては、入力信号はセグメント化手段80、82
及び84の入力端に供給される。セグメント化手段80は上記入力信号から10
24サンプルのセグメントを導出するように構成されている。また、セグメント
化手段82は上記入力信号から512サンプルのセグメントを導出するように構
成され、セグメント化手段84は上記入力信号から256サンプルのセグメント
を導出するように構成されている。
【0045】 セグメント化手段80の出力端は、低周波数範囲に関する周波数スペクトルを
決定するためにFFTプロセッサ86の入力端に接続されている。該FFTプロ
セッサ86は1024点のFFTを実行するように構成されている。セグメント
化手段82の出力端は、FFTプロセッサ90の入力端に接続されている。この
FFTプロセッサ90は512点のFFTを実行する。セグメント化手段84の
出力端はFFTプロセッサ94の入力端に接続されている。該FFTプロセッサ
94は256点のFFTを実行する。
【0046】 図1のマルチプレクサ16において音響心理学的モデルを適用するために、ノ
イズスペクトルを、ERBビン(bin)当たりのノイズ電力として表すことが望
ましい。そのようにするために、FFTプロセッサ86、90及び94により決
定されたFFTビンの値は、ERB変換器88、92及び96により18、7及
び18のERBビンに各々変換される。全てのERBビンは異なる周波数範囲を
カバーするので、ERB変換器88、92及び96は信号成分の多重表現を防止
する抑圧手段を構成する。FFTプロセッサ86、90及び94が完全なFFT
を実行せずに、該FFTに対応するERBビンを決定するのに必要な周波数ビン
のみを決定する部分FFTのみを実行することも考えられることが分かる。その
場合、上記抑圧手段はFFTプロセッサ86、90及び94も含む。
【0047】 ERB変換器88、92及び96は、各ERBビンに対する値を、当該ERB
により規定される範囲内にあるFFTビン内の電力を加算することにより導出す
る。上記ERB変換器により実行されるべき変換は:
【数1】 によりマトリクスの形で書くことができる。(1)式において、Y(n)は各ER
Bビンにおける電力であり、ここでnは当該ERBビンのランク数を表す。Pは
、要素としてFFTビンの電力を含むベクトルであり:
【数2】 として定義することができる。(2)式において、|X(k)|はk番目のFF
Tビンにおける電力である。また、Lは当該FFTに含まれる点の数である。ベ
クトルW(n)はERBビンとFFTビンとの重なりを表す。fがERBビンの
下限を表し、fが該ERBビンの上側周波数を表すとすると、ベクトル要素W
(n,k)は下記のように書くことができる:
【数3】 (3)式において、bはFFTビンのサイズであり、f/Lに等しい。全ての
ERBビンを得るためにnに対して異なる値をとると:
【数4】 に従う行列の乗算が得られる。ERBビンにおける電力は、マルチプレクサ16
において使用される音響心理学的モデルにより使用するために、ノイズ解析器1
4の追加の出力端に渡される。
【0048】 ノイズ合成器28は、ERBビンからFFTビンを得るために、Wの逆変換W
〜を必要とする。この逆数W〜は、Wが決定されたのと同様の方法により得るこ
とができる。この逆数W〜は:
【数5】 により算出することができる。43のERB電力値が適合手段98に受け渡され
、該手段は三次多項式の上記43個のERB電力値への適合を実行する。従って
、推定された電力は時間的に整列される(これらは、異なる解析セグメントサイ
ズで推定される)。この適合処理の結果、43の係数から4つの係数へデータが
減少する。該適合を実施する前に、ERBビンにおける振幅は、対数目盛り又は
その近似のような音響心理学的目盛り上の値に変換される。
【0049】 合成器28においては、上記43個のERB電力値が上記4つの係数により規
定される三次多項式により算出される。該合成は、丁度前記解析においてなされ
たように、異なるグループのERB電力に対して異なる時間軸で行われる。
【0050】 以上、本発明を好ましい実施例を参照して説明したが、これらは限定するため
の例ではないと理解されたい。このように、当業者にとっては請求項に記載され
た本発明の範囲から逸脱すること無しに種々の変形例が明らかとなるであろう。
【0051】 一例として、上記実施例においては重なり合っていないが、連続する信号セグ
メントが部分的に重なり合うことも可能である。更に、上記実施例に開示された
別々の防止手段は必ずしも組合せで存在する必要はなく、別々に使用されてもよ
い。
【0052】 シヌソイドオーディオエンコーダにおいて、周波数スペクトルの異なる部分を
解析するために異なる時間軸を使用することは既知である。従来のエンコーダに
おいては、入力信号を多数の副バンドに分割するために副バンドフィルタ処理が
使用される。
【0053】 入力信号を副バンドに分割することにより、2つの副バンドの境界における信
号成分が、両副バンド信号における表現になることが起こり得る。この信号成分
の二重の表現が、これら成分を符号化する際の幾つかの問題につながる。本発明
によれば、信号成分が多重の表現を有するのを防止するための防止手段(46、
48、58、68;88、92、96)を使用することが提案される。
【図面の簡単な説明】
【図1】 図1は、本発明を使用することができる伝送システムを示す。
【図2】 図2は、図1の伝送システムに使用されるべき本発明によるシヌソイド用の解
析ユニット8を示す。
【図3】 図3は、図2の解析ユニット8で使用される信号セグメントを示す。
【図4】 図4は、図1の伝送システムにおいて使用されるべき本発明によるノイズ解析
器14を示す。
【符号の説明】
2…送信器 3…伝送媒体 4…オーディオエンコーダ 6…送信ユニット 8…解析ユニット 10…合成器 12…減算器 14…ノイズ解析器 16…マルチプレクサ 18…受信ユニット 20…デマルチプレクサ 22…オーディオデコーダ 24…受信器 26…合成器 28…ノイズ合成器 30、34…ローパスフィルタ 32、36…デシメータ 38、40、42…セグメント化ユニット 44、55、64…スペクトル推定ユニット 46、48…減算器 54、60…合成器 58、68…コンバイナ 88、92、96…ERB変換器
───────────────────────────────────────────────────── フロントページの続き (72)発明者 オーメン アルノルダス ダブリュ ジェ イ オランダ国 5656 アーアー アインドー フェン プロフ ホルストラーン 6 (72)発明者 デン ブリンカー アルベルタス シー オランダ国 5656 アーアー アインドー フェン プロフ ホルストラーン 6 Fターム(参考) 5D045 DA11 5K041 AA01 CC01 DD01 FF01 HH12

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 オーディオエンコーダを持つ送信器を有し、前記オーディオ
    エンコーダはオーディオ信号を表す入力信号から少なくとも第1信号セグメント
    と第2信号セグメントとを導出するセグメント化手段を有し、前記第1信号セグ
    メントは前記第2信号セグメントより長く、前記オーディオエンコーダは符号化
    されたオーディオ信号を前記第1及び第2信号セグメントから導出する符号化手
    段を有し、前記送信器は前記符号化されたオーディオ信号を伝送媒体を介して受
    信器に送信する送信手段を有し、前記受信器は前記伝送媒体から前記符号化され
    たオーディオ信号を受信する受信手段を有すると共に、復号されたオーディオ信
    号を前記符号化されたオーディオ信号から導出するオーディオデコーダを更に有
    するような伝送システムであって、 前記符号化手段が、前記符号化されたオーディオ信号に単一信号成分の多重表現
    が発生するのを防止する防止手段を有することを特徴とする伝送システム。
  2. 【請求項2】 請求項1に記載の伝送システムにおいて、前記防止手段は、
    前記第1信号セグメントを表す前記符号化されたオーディオ信号の一部から合成
    オーディオ信号を導出する合成手段と、前記入力信号を表す信号から前記合成オ
    ーディオ信号を減算することにより前記第2信号セグメントを導出する減算手段
    とを有することを特徴とする伝送システム。
  3. 【請求項3】 請求項2に記載の伝送システムにおいて、前記セグメント化
    手段は前記入力信号から他の信号セグメントを導出するように構成され、前記他
    の信号セグメントは前記第1信号セグメントより長く、前記オーディオエンコー
    ダは前記符号化されたオーディオ信号を前記他の信号セグメントにも基づいて導
    出するように構成され、前記防止手段が、前記他の信号セグメントを表す前記符
    号化されたオーディオ信号の一部から他の合成信号を導出する他の合成手段と、
    前記入力信号を表す信号から前記他の合成オーディオ信号を減算することにより
    前記第1信号セグメントを導出する他の減算手段とを有していることを特徴とす
    る伝送システム。
  4. 【請求項4】 請求項1に記載の伝送システムにおいて、前記オーディオエ
    ンコーダはフィルタ処理された信号を前記入力信号から導出するフィルタを有す
    ると共に、該フィルタ処理された信号から前記第1信号セグメントを導出するよ
    うに構成されていることを特徴とする伝送システム。
  5. 【請求項5】 請求項4に記載の伝送システムにおいて、前記フィルタが、
    前記第1信号セグメントを低下されたサンプルレートで得るデシメート手段を有
    していることを特徴とする伝送システム。
  6. 【請求項6】 請求項1に記載の伝送システムにおいて、前記符号化手段が
    、音響心理学的スケールで振幅を表すように構成されていることを特徴とする伝
    送システム。
  7. 【請求項7】 オーディオエンコーダを有するような送信器であって、該オ
    ーディオエンコーダはオーディオ信号を表す入力信号から少なくとも第1信号セ
    グメントと第2信号セグメントとを導出するセグメント化手段を有し、前記第1
    信号セグメントは前記第2信号セグメントより長く、前記オーディオエンコーダ
    は符号化されたオーディオ信号を前記第1及び第2信号セグメントから導出する
    符号化手段を有し、前記送信器は前記符号化されたオーディオ信号を送信する送
    信手段を有し、前記符号化手段が、前記符号化されたオーディオ信号に単一信号
    成分の多重表現が発生するのを防止する防止手段を有することを特徴とする送信
    器。
  8. 【請求項8】 請求項7に記載の送信器において、前記防止手段は、前記第
    1信号セグメントを表す前記符号化されたオーディオ信号の一部から合成オーデ
    ィオ信号を導出する合成手段と、前記入力信号を表す信号から前記合成オーディ
    オ信号を減算することにより前記第2信号セグメントを導出する減算手段とを有
    することを特徴とする送信器。
  9. 【請求項9】 オーディオ信号を表す入力信号から少なくとも第1信号セグ
    メントと第2信号セグメントとを導出するセグメント化手段を有するオーディオ
    エンコーダであって、前記第1信号セグメントは前記第2信号セグメントより長
    く、前記オーディオエンコーダは符号化されたオーディオ信号を前記第1及び第
    2信号セグメントから導出する符号化手段を有し、該符号化手段が、前記符号化
    されたオーディオ信号に単一信号成分の多重表現が発生するのを防止する防止手
    段を有することを特徴とするオーディオエンコーダ。
  10. 【請求項10】 請求項9に記載のオーディオエンコーダにおいて、前記防
    止手段は、前記第1信号セグメントを表す前記符号化されたオーディオ信号の一
    部から合成オーディオ信号を導出する合成手段と、前記入力信号を表す信号から
    前記合成オーディオ信号を減算することにより前記第2信号セグメントを導出す
    る減算手段とを有することを特徴とするオーディオエンコーダ。
  11. 【請求項11】 オーディオ信号を表す入力信号から少なくとも第1信号セ
    グメントと第2信号セグメントとを導出するステップを有し、前記第1信号セグ
    メントは前記第2信号セグメントより長く、且つ、符号化されたオーディオ信号
    を前記第1及び第2信号セグメントから導出するステップを有するようなオーデ
    ィオ符号化方法であって、該方法が、前記符号化されたオーディオ信号に単一信
    号成分の多重表現が発生するのを防止するステップを有することを特徴とするオ
    ーディオ符号化方法。
  12. 【請求項12】 請求項11に記載の方法において、該方法が、前記第1信
    号セグメントを表す前記符号化されたオーディオ信号の一部から合成オーディオ
    信号を導出するステップと、前記入力信号を表す信号から前記合成オーディオ信
    号を減算することにより前記第2信号セグメントを導出するステップとを有する
    ことを特徴とするオーディオ符号化方法。
  13. 【請求項13】 プロセッサが請求項11に記載の方法を実行するのを可能
    にするようなコンピュータプログラム。
  14. 【請求項14】 請求項13に記載のコンピュータプログラムを有する有形
    媒体。
  15. 【請求項15】 請求項13に記載のコンピュータプログラムを伝送する信
    号。
JP2001520406A 1999-08-27 2000-08-24 改善されたエンコーダ及びデコーダを備える伝送システム Withdrawn JP2003508806A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP99202785.4 1999-08-27
EP99202785 1999-08-27
PCT/EP2000/008273 WO2001016941A1 (en) 1999-08-27 2000-08-24 Transmission system with improved encoder and decoder

Publications (1)

Publication Number Publication Date
JP2003508806A true JP2003508806A (ja) 2003-03-04

Family

ID=8240580

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001520406A Withdrawn JP2003508806A (ja) 1999-08-27 2000-08-24 改善されたエンコーダ及びデコーダを備える伝送システム

Country Status (8)

Country Link
US (1) US6654723B1 (ja)
EP (1) EP1125282B1 (ja)
JP (1) JP2003508806A (ja)
KR (1) KR100727276B1 (ja)
CN (1) CN1145929C (ja)
DE (1) DE60022732T2 (ja)
ES (1) ES2248112T3 (ja)
WO (1) WO2001016941A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7930170B2 (en) * 2001-01-11 2011-04-19 Sasken Communication Technologies Limited Computationally efficient audio coder
JP4622164B2 (ja) * 2001-06-15 2011-02-02 ソニー株式会社 音響信号符号化方法及び装置
US8331445B2 (en) * 2004-06-01 2012-12-11 Qualcomm Incorporated Method, apparatus, and system for enhancing robustness of predictive video codecs using a side-channel based on distributed source coding techniques

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08223049A (ja) * 1995-02-14 1996-08-30 Sony Corp 信号符号化方法及び装置、信号復号化方法及び装置、情報記録媒体並びに情報伝送方法
US6091768A (en) * 1996-02-21 2000-07-18 Bru; Bernard Device for decoding signals of the MPEG2 type
US5974376A (en) * 1996-10-10 1999-10-26 Ericsson, Inc. Method for transmitting multiresolution audio signals in a radio frequency communication system as determined upon request by the code-rate selector
US5886276A (en) * 1997-01-16 1999-03-23 The Board Of Trustees Of The Leland Stanford Junior University System and method for multiresolution scalable audio signal encoding
KR100261254B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
JP3134817B2 (ja) * 1997-07-11 2001-02-13 日本電気株式会社 音声符号化復号装置
KR100311173B1 (ko) * 1998-02-26 2001-12-17 김영환 동영상데이타및음성데이타송수신장치
US6460153B1 (en) * 1999-03-26 2002-10-01 Microsoft Corp. Apparatus and method for unequal error protection in multiple-description coding using overcomplete expansions

Also Published As

Publication number Publication date
KR20010089371A (ko) 2001-10-06
DE60022732D1 (de) 2005-10-27
KR100727276B1 (ko) 2007-06-13
CN1145929C (zh) 2004-04-14
WO2001016941A1 (en) 2001-03-08
ES2248112T3 (es) 2006-03-16
US6654723B1 (en) 2003-11-25
CN1335979A (zh) 2002-02-13
DE60022732T2 (de) 2006-06-14
EP1125282A1 (en) 2001-08-22
EP1125282B1 (en) 2005-09-21

Similar Documents

Publication Publication Date Title
US10269362B2 (en) Methods, apparatus and systems for determining reconstructed audio signal
KR970007663B1 (ko) 신호 양자화 장치 및 방법
KR100209870B1 (ko) 오디오 신호의 순서화된 타임 시퀸스 처리 방법 및 오디오 신호 전송 방법
KR970007661B1 (ko) 스테레오포닉 오디오 신호의 입력세트 코딩방법
EP0564089B1 (en) A method and appartus for the perceptual coding of audio signals
EP0940015B1 (en) Source coding enhancement using spectral-band replication
FI84538C (fi) Foerfarande foer transmission av digitaliska audiosignaler.
JP4063670B2 (ja) 広帯域信号伝送システム
US5699484A (en) Method and apparatus for applying linear prediction to critical band subbands of split-band perceptual coding systems
US20040153313A1 (en) Method for enlarging the band width of a narrow-band filtered voice signal, especially a voice signal emitted by a telecommunication appliance
US5687281A (en) Bark amplitude component coder for a sampled analog signal and decoder for the coded signal
USRE40280E1 (en) Rate loop processor for perceptual encoder/decoder
US5588089A (en) Bark amplitude component coder for a sampled analog signal and decoder for the coded signal
JP2003508806A (ja) 改善されたエンコーダ及びデコーダを備える伝送システム
KR100335696B1 (ko) 통신시스템용장치및통신시스템사용방법
CA2053133C (en) Method for coding and decoding a sampled analog signal having a repetitive nature and a device for coding and decoding by said method
EP2355094B1 (en) Sub-band processing complexity reduction
JPH07225597A (ja) 音響信号符号化、復号化方法及び装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20071106