JP2703405B2 - ポリフォニックコーディング - Google Patents

ポリフォニックコーディング

Info

Publication number
JP2703405B2
JP2703405B2 JP2508936A JP50893690A JP2703405B2 JP 2703405 B2 JP2703405 B2 JP 2703405B2 JP 2508936 A JP2508936 A JP 2508936A JP 50893690 A JP50893690 A JP 50893690A JP 2703405 B2 JP2703405 B2 JP 2703405B2
Authority
JP
Japan
Prior art keywords
channel
signal
filter
sum
difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2508936A
Other languages
English (en)
Other versions
JPH04506141A (ja
Inventor
ホルト、クリストファー・エリス
ムンデイ、エドワード
チーザム、バリー・マイケル・ジョージ
Original Assignee
ブリテイッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=10658483&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2703405(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by ブリテイッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー filed Critical ブリテイッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー
Publication of JPH04506141A publication Critical patent/JPH04506141A/ja
Application granted granted Critical
Publication of JP2703405B2 publication Critical patent/JP2703405B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • H04H20/88Stereophonic broadcast systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Macromolecular Compounds Obtained By Forming Nitrogen-Containing Linkages In General (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Treatments For Attaching Organic Compounds To Fibrous Goods (AREA)
  • Polymers With Sulfur, Phosphorus Or Metals In The Main Chain (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Separation Using Semi-Permeable Membranes (AREA)
  • Stereophonic System (AREA)

Description

【発明の詳細な説明】 本発明は、特にスピーチ信号をコーディングするため
のポリフォニックコーディング技術に関する。
ポリフォニック特にステレオフォニック音がモノフォ
ニック音よりも感覚的にアピールすることは良く知られ
ている。例えば会議室内のようないくつかの音源が別の
室に送信される場合、ポリフォニック音は元の音フィー
ルドの空間的な再構成を可能にし、各音源のイメージは
元の会議室におけるその位置に対応した識別可能な点で
知覚される。これは、各参加者が彼の音声の音および会
議室内の彼の知覚された位置の両方によって識別される
ため、聴覚会議論議中の混乱および誤認を防止すること
ができる。
必然的にポリフォニック伝送にはモノフォニック伝送
に比較して伝送容量の向上が要求される。2つの独立し
たチャンネルを伝送し、したがって要求された伝送容量
を二倍にする通常の方法は多数の適用において許容でき
ない高い費用を課し、場合によっては固定された伝送容
量を有する既存のチャンネルを使用する必要があるため
不可能である。
ステレオフォニック(すなわち2チャンネルポリフォ
ニック)システムにおいて、異なる位置における2つの
マイクロフォン(以降左および右マイクロフォンと呼ば
れる)は室内で発生された(例えば人または人の発声に
よって)音を採取するために使用される。マイクロフォ
ンによって採取された信号は一般に異なっている。各マ
イクロフォン信号(以降、それぞれラプラス変換X
L(s)によるXL(t)、およびラプラス変換XR(s)
によるXR(t)と呼ばれる)は各音響伝達関数によって
処理された音源信号の重複であると考えられる。これら
の伝達関数は音源とマイクロフォンとの間の距離によっ
て、また室の音響特性によって強く影響される。例えば
室内のある固定点で発声する単一の人のような単一音源
の場合、音源と左および右のマイクロフォンとの間の距
離は異なる遅延を生じさせ、異なる程度の減衰も生じ
る。会議室のような大部分の実際の環境において、各マ
イクロフォンに達する信号は共振および反共振のために
時間拡散する周波数依存性着色およびディスクリートな
エコーを直接生成するだけでなく多数の反射された通路
(例えば壁または天井から)を介して進む。
上記から理論的には、1つのマイクロホンからの信号
は一般的に例えばインターチャンネル伝達関数H:すなわ
ちXR(s)=H(s)XL(s)を構成することによって
他方のものからのそれに関連され、ここでsは複素周波
数パラメータである。この表示は、音信号が音源からマ
イクロホンに進んだときのそれに対する室音響の影響の
直線性および時間不変性の仮定に基づいている。しかし
ながら、Hの性質に関する情報がないときにこのことは
2つの信号間の相関を仮定するにすぎない。しかしなが
ら、このような仮定は単一音源の少なくとも特別の場合
において固有に感度が良く、したがってステレオ信号を
表すために必要なビット率を減少する1つの方法は、伝
送および受信後の再導入の前に、一方のものに対する他
方のものの冗長性を減少しなければならない。
一般に、H(s)は特有ではなく、信号および時間依
存性であることができる。しかしながら、音源信号がホ
ワイトであり相関されていない場合、すなわちそれらの
自己相関関数がt=0除いてゼロで、相互相関関数が全
てのtに対してゼロであるとき、急速に変化している音
源信号の性質ではなく、室音響並びにマイクロホンおよ
び音源の位置のような急速な変化に支配されない要因に
H(s)は依存する。
物理的な形態でこのようなシステムを実現するため
に、因果性および安定性の基本的問題が克服されなけれ
ばならない。ここで左のマイクロホンに達する前にdL
および右のマイクロホンに達する前にdR秒だけ遅延され
る単一の音源信号を検討する(その点は一般的な意味を
有するけれども)。音源が例えば左のマイクロホンに近
い場合、dLはdRより小さい。チャンネル間伝達関数H
(s)は、右チャンネルXR(t)を生成するように2つ
の遅延間の差dR−dLだけXL(s)を遅延しなければなら
ない。dR−dLは正であるため、H(s)はXL(s)から
XRを得るための関数となる。信号源が左よりも右のマイ
クロホンに近くに移動された場合、dR−dLは負になり、
H(s)はXL(s)からXRを得るための関数となり得な
い。後者の場合を換言すると、右チャンネルと左チャン
ネルとの間に因果関係がなくなり、所定の事象が最初に
右チャンネルにおいて発生するためその逆が生じ、右チ
ャンネルは左チャンネルから予測されることができな
い。したがって、1つの固定されたチャンネルが常に送
信され、他方がそれから再構成される簡単なシステムが
直接的な意味で実現不可能であることが認められるであ
ろう。
本発明の第1の観点によると、 異なる音源から少なくとも2つの入力チャンネルを受
信する手段と、 このような信号の和を表す和チャンネルを生成し、そ
の間の差を表す少なくとも1つの差チャンネルを生成す
る手段と、 複数のオーダー予測フィルタに適用された場合、フィ
ルタ処理された和チャンネルから差チャンネルを予測す
ることを可能にする複数のパラメータ係数を周期的に発
生する手段と、 前記和チャンネルを表すデータおよび前記差チャンネ
ルの再構成を可能にするデータを出力する手段とを具備
しているポリフォニック信号コーディング装置が提供さ
れる。
第1の実施例において、差信号再構成データはフィル
タ係数である。第2の実施例において、差信号と和信号
との間の差を表す残留分信号はこのようにフィルタ処理
されたときに送信機において形成され、これは差信号再
構成データとして送信される。この実施例において、予
測される残留分信号はバックワードアダプテーション技
術が予測フィルタ係数を得るためにデコーダで使用され
ることを可能にするように効果的にエンコードされる。
残留分も和チャンネルからの差チャンネルの予測の不正
確さを正すためにデコーダで予測フィルタの出力に付加
されるエラー信号として使用される。この“残留分の
み”の実施例はまた例えば左チャンネルが右チャンネル
から予測された(和および差信号を形成せすに)場合
に、高品質のポリフォニック再構成を提供するように適
切な方法が因果関係を保証するために取られるならば有
効である。第3の実施例において、両者が送信される。
フィルタ係数を発生する手段は適応フィルタであるこ
とが好ましく、格子フィルタであることが有効である。
このタイプのフィルタはまた非和および差ポリフォニッ
クシステムにおいて利点を提供する。
好ましい実施例において、少なくとも1つの入力信号
路にに種々の遅延手段が設けられ、適切なオーダーの原
因予測フィルタが使用されることができるように和およ
び差信号を形成する前に2つの信号を時間整列するよう
に制御される。
本発明のこの観点はいくつかの重要な利点を提供す
る: (i)“和信号”はモノフォニックエンコーディングと
完全に適合可能であり、知覚不可能な遅延の導入以外の
ポリフォニックコーディングによって影響されない。し
たがってステレオが失われた場合、モノフォニック採取
が利用できる。
(ii)和信号は修正せずに通常の低ビット率コーディン
グ技術(例えば、LPC)によって送信されてもよい。
(iii)差信号に対するエンコーディング技術は上記の
3つの実施例において適用および利用可能な送信容量に
適合させるように変化されることができる。残留分信号
および予測係数のタイプはまた種々の異なる方法で選択
され、一方さらに基本的なエンコーディング原理に一致
することができる。
(iv)全体的に、装置はモノフォニック送信と比較して
ビット率要求における適度な増加によりポリフォニック
信号をエンコードする。
(v)コーディングはデジタル方式であり、したがって
装置の特性は予測可能であり、エージングの影響または
部品のドリフトに影響されず、容易に大量生産される。
音源信号がホワイトでない(もちろん全てのスピーチ
または音楽信号を含む)場合、H(s)の近似値を計算
する方法が“プレホワイトニングフィルタ”の考えを利
用して本発明の第2の観点において提案される。
本発明の第2の観点によると、 少なくとも2つの入力チャンネルを受信する手段と、 各フィルタ処理されたチャンネルを生成するためにこ
のチャンネルの最初のものの反転スペクトルに近似する
フィルタを備えた各入力チャンネルをフィルタ処理し、
それによって第1のフィルタ処理されたチャンネルがス
ペクトル的にホワイトニング処理される手段と、 前記フィルタ処理されたチャンネルを受信し、それぞ
れフィルタ処理されたチャンネル(第1のものではな
い)に対するパラメータデータを周期的に発生し、第1
のものからの各入力チャンネルの予測を可能にする手段
と、 第1のチャンネルを表すデータおよびこのパラメータ
データを表すデータを出力する手段とを備えているポリ
フォニック信号コーディング装置が提供される。
上記のような本発明のこの観点は、既存の技術と適合
可能なデジタルシステムの利点を提供し、要求されたチ
ャンネル間伝達関数のモデリングの処理(エンコーダに
おける)を簡単にする。
本発明によると、このようなエンコーディングおよび
デコーディング装置を含むシステムのような広く対応し
たデコーディング装置もまた特に聴覚的な会議の適用に
おいて提供される。本発明の別の観点はここでは請求の
範囲に記載されている。
この明細書中の“予測”および“予測装置”という言
葉は、過去のデータからの将来のデータの予測だけでな
く、別のチャンネルの過去および現在のデータからの現
在のデータの評価も含んでいる。
以下、添付図面を参照して例示だけにより本発明を説
明する。
図1は本発明の第1の観点によるエンコーダを全体的
に示す。
図2は対応したデコーダを全体的に示す。
図3aは本発明の好ましい実施例によるエンコーダを示
す。
図3bは対応したデコーダを示す。
図4aおよび図4bはそれぞれ本発明の第2の観点による
対応したエンコーダおよびデコーダを示す。
図5aおよび図5bは本発明の第2の観点による対応した
エンコーダおよびデコーダを示す。
図6は本発明のさらに別の実施例によるエンコーダの
一部分を示す。
示された実施例は、表示を容易にするために2つのチ
ャンネル(ステレオ)に限定されているが、本発明は任
意の数のチャンネルに対して一般化されてもよい。
2つのチャンネル信号間の冗長なものを取除く(或は
一方から他方を予測する)1つの可能な方法は、ゆっく
り変化しているパラメータが標準的な技術(例えば、ブ
ロック相互相関解析または連続格子適応等)によって計
算される適応予測フィルタを2つのチャンネル間に接続
することである。聴覚会議環境において、2つの信号は
室内の音源から生じ、各音源と各マイクロホンとの間の
音響伝達関数は典型的に弱い極(室の共振から)および
強いゼロ(吸収および破壊的な妨害のため)によって特
徴付けられる。したがって、全てのゼロフィルタは音源
とマイクロホンと間の音響伝達関数に適した近似値を生
成することができ、このようなフィルタはまた音源が右
のマイクロホンに近い場合、例えばXR(t)から左のマ
イクロホン信号XL(t)を予測するために使用されるこ
とができる。しかしながら、音源が右のマイクロホンか
ら離れるように移動され左の近く位置された場合、要求
されたフィルタの性質は因果関係を保証するために遅延
が導入された場合であっても効果的に逆にされる。フィ
ルタは弱いゼロおよび強い極を有する伝達関係をモデル
化しなければならず、全てゼロのフィルタに対して困難
なタスクである。別のタイプのフィルタは一般に本質的
に安定していない。これの純粋な影響は、音源が一方の
マイクロホンから他方にシフトしたときに再構成された
チャンネルにおいて等しくない低下を生じさせることで
ある。これはさらに一方のチャンネル(例えば右)から
の他方(例えば左)の簡単な予測を実行し難くする。
本発明の第1の観点によるシステムにおいて、さらに
良好な結果が“和信号”XS(t)=XL(t)+XR(t)
を形成し、差信号XD=XL(t)−XR(t)、或は全てゼ
ロの適応デジタルフィルタを使用して単にXL(t)また
はXR(t)のいずれかを予測することによって得られ
る。
実際に、XR(t)およびXL(t)(またはXS(t)お
よびXD(t))はデジタル信号XR[n]およびXL[n]
(またはXS[n]およびXD[n])としてサンプルされ
たデータ形態で処理され、H(s)ではなくz変換伝達
関数H(z)を使用することがさらに便利である。
図1を参照すると、本質的な形態において本発明は例
えば左および右のマイクロホンから1対のスピーチ信号
を受信する1対の入力1a,1bを含む。入力における信号X
R(t)およびXL(t)はデジタル形態である。これに
関して、例えば帯域制限によって信号を予備処理するこ
とが便利である。その後、各信号は加算器2および減算
器3に供給され、加算器の出力は和信号XS(t)=X
R(t)+XL(t)であり、減算器3の出力は差信号XD
=XR(t)−XL(t)、すなわちXD=H(s)XS(s)
である。和および差信号は、和信号により駆動されたと
きに差信号を近似する多段予備フィルタの係数を生じさ
せるフィルタ誘導段4に供給される。近似的な差信号と
実際の差信号との間の差である予測される残留分信号は
また通常生成される(もっとも、これは必ずしも必要で
はない)。和信号は送信または蓄積のために差信号の再
構成を可能にする別のデータと共にエンコードされる
(好ましくはLPCまたはサブバンドコーディングを使用
して)。フィルタ係数は送信されるか、或はその代りに
(以下に論じられるように)残留分信号が送信され、差
チャンネルは技術的に知られたバックワード適応処理を
使用する受信機でフィルタパラメータを得ることによっ
て再構成されるか、もしくは両者が送信されてもよい。
フィルタパラメータを直接計算する(LPC解析技術を
使用して)ことが可能であるが、誘導段4を設ける1つ
の簡単で効果的な方法は入力として合計チャンネルを受
信し、予測される残留分を減少するように差チャンネル
をモデリングする適応フィルタ(例えば適応トランスバ
ーサルフィルタ)を使用することである。フィルタ適応
のこのような一般的な技術は技術的に良く知られてい
る。
この構造による最初の実験は、残留分の平均2乗値を
最小にするアルゴリズムによる係数更新と共に構成の容
易なトランスバーサルFIRフィルタを使用している。フ
ィルタ係数は、室の音響(およびしたがってチャンネル
間伝達関数)が比較的安定しているため、ゆっくりとし
か変化しない。
図2を参照すると、対応した受信機において和信号XS
(t)は差チャンネル用のフィルタパラメータまたは残
留分信号のいずれか或は両者と共に受信され、コーダで
導出されたパラメータに対応した適応フィルタ5は、受
信されたパラメータまたはバックワード適応によって受
信された残留分信号から導出されたパラメータのいずれ
かにより構成された場合、入力として和信号を受信し、
出力として再構成された差信号を生成する。和および差
信号は共に加算器6および減算器7に供給され、それら
は出力ノード8aおよび8bにおいて出力として再構成され
た左および右チャンネルをそれぞれ生成する。
高品質の和信号が送信されるため、エンコーダは完全
にモノコンパーチブルである。したがってステレオ情報
の損失の場合、モノフォニックバックアップが利用可能
である。
上述のように、伝達関数HLおよびHRの一つの成分は信
号源と各マイクロホンとの間の直接的な距離に関連した
遅延成分であり、対応した遅延差dが存在する。したが
って、dだけ遅延されたときに一方のチャンネルと他方
のものとの間に強い相互相関が存在する。
しかしながら、この方法は著しい処理パワーを必要と
する。
ソナー研究に関する論文に見られる遅延評価の別の方
法は適応フィルタを使用することである。左チャンネル
入力はフィルタ長の半分だけ遅延され、係数は平均2乗
エラーまたは出力を最小にするためにLMSアルゴリズム
を使用して更新される。トランスバーサルフィルタ係数
は論理的に要求される相互相関係数になる。これは、相
互相関係数の最大値(最大フィルタ係数の位置での)が
フィルタの集束する前のある時間得られるこの遅延評価
装置の特性に対して導出されなければフィルタ係数の不
要な競争と考えられる。この方法は空間的な情報も入力
チャンネルの相対振幅から利用できるためさらに改良さ
れる。これは集束を速めるためにフィルタ係数に加重関
数を適用するために利用されることができる。
図3aを参照すると、本発明の好ましい実施例において
計算されるべきフィルタの複合性および長さは遅延計算
段9においてdの要求される値を計算する(上記の方法
の1つを使用することが好ましい)ことによって減少さ
れ、例えば遅延計算機9によって制御される1対の可変
遅延装置10a,10b(1つが固定および1つが可変の遅延
装置を使用することもできる)を使用してdだけ一方ま
たは他方を遅延することによってチャンネルを時間整列
させる。時間整列されたチャンネルにおけるスピーチ情
報の主部分により、和および差信号が形成される。
図3bを参照すると、遅延長dは差チャンネル、並びに
それに続く左および右チャンネルを再構成した後、チャ
ンネルの一方または他方における対応した可変長遅延段
11a,11bがチャンネル間遅延を保存することができるよ
うにデコーダに送信されることが好ましい。
したがって、示された構造において“和”信号は遅延
dのためにXL(t)+XR(t)の本当の和ではなく、そ
れはXL(t)+XR(t−d)である。したがって、加算
器2および減算器3の下流に遅延装置10a,10b(および
可能に遅延計算器)を配置することが好ましい。これは
実用の目的に対して必要なフィルタ長を減少する同じ利
点を提供する。
実際に、遅延は一般に典型的に1.6msまで知覚不可能
である。その代りとして、因果関係を保証するように十
分に長い固定された遅延が使用され、はしたがって遅延
パラメータをエンコードする必要性を取除いてもよい。
上記のように本発明の第1の実施例において、フィル
タパラメータだけが差信号データとして送信される。1
つの係数当り16ビットにより、これは5120ビット/秒の
送信容量が差チャンネルに必要とされる(プラス遅延パ
ラメータのための8ビット)ことを意味する。これは和
チャンネル(既存のモノフォニックエンコーディング技
術によって効率的に送信された)に48kビット/秒を割
当てる使用された標準方式の64kビット/秒の送信シス
テムの容量の範囲であり、他の“オーバーヘッド”デー
タに16kビット/秒を供給する。実施例のそれはこのモ
ードは良好な信号対雑音比を提供し、ステレオイメージ
が存在するが、予測フィルタを適合するために使用され
たアルゴリズムの精度にかなり依存している。不正確さ
は、会話がある話し手から他者に前者からある距離で伝
達される特に会議の間にステレオイメージをずらす傾向
がある。
図4aを参照すると、本発明の第2の実施例において残
留分信号だけが差信号データとして送信される。和信号
は例えばサブバンドコーディングを使用してエンコード
される(12a)。それはデコーダにおけるものと等しい
信号を適応フィルタ4へ入力として供給するために局部
的にデコードされる(13a)。残留分差チャンネルはま
た残留分コーダ12bによってエンコードされ(帯域制限
を含むことが可能)、対応した局部デコーダ13bは最小
にされた信号を適応フィルタ4に供給する。これがもた
らす利点はパラメータを発生するときの不正確さが残り
のもののチャンネルのダイナミックレンジにおける増加
およびSNRにおける対応した減少を発生させることであ
るが、ステレオイメージにおいて損失はない。
図4bを参照すると、デコーダにおいて解析フィルタパ
ラメータはコーダにおける適応フィルタ4のバックワー
ド適応レプリカフィルタ5を使用することによって送信
された残留分から回復される。デコーダ13c,13dは局部
デコーダ13a,13bと同一であり、したがってフィルタ5
は同じ入力を受信し、したがってエンコーダフィルタ4
のものと同じパラメータを生成する。
別の実施例において(示されていない)、最初の2kHz
における重要なステレオ情報が損なわれずに保存され、
高周波数における相対振幅情報がフィルタパラメータに
よってかなり保持されているため、フィルタパラメータ
および残留分信号の両者はサイド情報として送信され、
残留分だけの実施例に関する多くの問題を克服する。
上記の残留分だけおよびハイブリッド(すなわち残留
分プラスパラメータ)の実施例の両者は示されているよ
うに和チャンネルから差チャンネルを予測するために使
用されることが好ましい。しかしながら、ステレオイメ
ージを保持する(SNRにおける減少によるものでも)同
じ利点は、入力チャンネルが和および差ではなく左およ
び右である場合、因果関係の問題がある方法(例えば、
一方または他方の通路において比較的長い固定遅延を挿
入することによって)で克服されることが認められる。
したがって本発明の技術的範囲はこれをも含んでいる。
上記のパラメータだけの実施例は和および差チャンネ
ル間の冗長を取除くために単一の適応フィルタ4を使用
する。係数がある率で送信されない場合には、人間が小
声で話しているように聞こえる奇妙な“ウィスパリン
グ”効果が試験中に発見された。この率は、音響環境に
おける変化を示すために必要なものよりかなり上であっ
た。これは室音響伝達関数をモデリングすることに加え
て適応フィルタがまたスピーチのLPC解析を実行しよう
としたためであった。
これは、室音響成分を原理的に残す急速に変化するス
ピーチ成分を減少するように図5に示されているような
適応フィルタへの入力信号のスペクトルをホワイトニン
グする本発明の第2の観点において解決される。
本発明の第2の観点において、音響伝達関数をモデル
化する適応フィルタ4は前のものと同じであってもよい
(例えば、オーダー10の格子フィルタ)。和チャンネル
はホワイトニングフィルタ14a(格子または簡単なトラ
ンスバーサル構造であってもよい)を通過させられる。
マスターホワイトニングフィルタ14aは和チャンネル
を受信し、それ自身の出力を最小にすることによって和
信号(または少なくともそのスピーチ成分)に近似した
スペクトル反転フィルタを誘導するように調節する。し
たがって、フィルタ14aの出力は実質的にホワイトであ
る。マスターフィルタ14aによって導出されたパラメー
タは、差信号を受信してフィルタ処理するように接続さ
れたスレイブホワイトニングフィルタ14bに与えられ
る。したがって、スレイブホワイトニングフィルタ14b
の出力は和信号の反転したものによってフィルタ処理さ
れた差信号であり、これは実質的に共通信号成分を除去
し、2つの間の相関を減少し、主として室の音響応答を
構成するフィルタ14bの出力を残す。したがって、それ
は残留分のダイナミックレンジを著しく減少させる。
適応フィルタ4の誘導された係数が室音響のモデルパ
ラメータであるように、室音響の結果としてそれらの間
のスペクトル差に影響を与えずに和チャンネルをホワイ
トにし、また差チャンネルを部分的にホワイトにする。
1実施例では係数だけが送信され、デコーダは図2の
ものである(他のフィルタは不要)。この実施例におい
てもちろん残りのもののエンコーダ12bおよびデコーダ1
3bは取除かれる。
適応フィルタは一般にスピーチにおけるピッチ情報の
ような長期間情報をフィルタ処理するほど長くはなく、
和チャンネルは完全に“ホワイト”ではない。しかしな
がら、長期間予測装置(LPCコーディングとして知られ
ている)がフィルタ14aおよび14bにおいて付加的に使用
された場合、フィルタ4は原理的に差チャンネルだけを
フィルタ処理し、したがって室音響の反転したものをモ
デル化するように接続されることができる。
本発明のこの第2の観点は残留分のダイナミックレン
ジを減少するため、上記の残留分だけの送信とこのホワ
イトニングスキムを使用することは有効である。この場
合デコーダにおけるバックワード適応の前にホワイトニ
ングフィルタの反転したものを使用して残留分をフィル
タ処理するか、或はホワイトニングフィルタを使用して
和チャンネルをフィルタ処理することが必要である。い
ずれかのフィルタは送信された和チャンネル情報から導
出されることができる。
図5bを参照すると、残留分だけの送信において適応ホ
ワイトニングフィルタ24a(エンコーダにおけるフィル
タ14aと同一)は(デコードされた)和チャンネルを受
信し、その出力をホワイト化するように適応する。スレ
イブフィルタ24b(エンコーダ14bのフィルタと同一)は
24aの係数を受信する。入力としてホワイトにされた和
チャンネルを使用し、(デコードされた)残留分からバ
ックワード適応によって適応することによって、適応フ
ィルタ5は(デコードされた)残留分に付加されたフィ
ルタ処理された信号を再生し、その和は差チャンネルを
生成するようにスレイブフィルタ24bによってフィルタ
処理される。その後、和および差チャンネルは元の左お
よび右チャンネルを生成するように処理される(6,7は
示されていない)。
別の実施例(示されていない)において、残留分およ
び係数の両者が送信される。
本発明のこのプレホワイトニングの観点は和および差
チャンネルを使用する本発明の好ましい実施例に関連し
て示されているが、それはまた2つのチャンネルが
“左”および“右”チャンネルである場合に適用可能で
ある。
典型的な聴覚会議適用に対して、残留分は8kHzの帯域
幅を有し、約16kビット/秒の予備チャンネル容量を使
用して量子化され送信されなければならない。ホワイト
化された残留分は原理的に平均2乗値では小さいが、し
かし残留分が通過する複製プレホワイトニングフィルタ
14bが和チャンネルをホワイト化するために誘導された
係数を有しており、左チャンネルをホワイト化すること
を必要としないため、最適にホワイト化されていない。
典型的に、フィルタ処理された信号のダイナミックレン
ジはフィルタ処理されない差チャンネルに対して12dBだ
け減少される。この残留分量子化に対する1つの方法は
残留分信号の帯域幅を減少することである。これは低速
へのダウンサンプリングを可能にし、その結果1サンプ
ル当りのビットを増加させる。ステレオ信号におけるほ
とんどの空間情報は0乃至2kHzの帯域内に含まれてお
り、したがって8kHzから2kHzを越える値までの残留分の
帯域幅を減少することは知覚されたステレオイメージに
それ程影響を与えないことが良く知られている。この結
果は、減少された帯域残留分が標準的な技術を使用して
コード化されたサブバンドである場合に4kHzに残留分の
帯域幅を減少すること(および和チャンネルのものと同
一であるように上位の4kHzを取ること)が良好な品質の
ステレオフォニックスピーチを生成することを示してい
る。
種々の適応フィルタ4(および適用可能な場合に12)
による実験は標準的なトランスバーサルFIRフィルタが
ゆっくり集束することを示した。速い動作は格子構造を
使用することによって得ることができ、係数更新は図7
に示されたようなバーグの方法に基づいた傾斜アルゴリ
ズムを使用する。
構造は主入力のプリズムをプレホワイト化するために
格子フィルタ14aを使用する。その後、デコリレートさ
れた後方の残留分の出力が第2の入力の入力スペクトル
をモデル化することを試みる簡単な直接結合器への入力
として使用される。モデリング処理は簡単なトランスバ
ーサルFIRフィルタによるものと同じであるが、格子フ
ィルタの効果は最適なLMS残留解の方向にエラーベクト
ルを向けることである。これは集束の速度を著しく速く
する。オーダー20の格子フィルタは実際に有効であるこ
とが認められている。
格子フィルタ構造は上記のように特に有効であるが、
和および差信号を形成する代わりに(適切に遅延され
た)左チャンネルが右チャンネルから予測されるシステ
ムにおいて使用されることもできる。
記載された実施例はステレオフォニックシステムを示
すが、本発明は例えばクアドロフォニックシステムによ
り1つの和信号および3つの差信号を形成し、上記のよ
うに和信号からそれぞれを予測することによって構成さ
れることが理解されるであろう。
本発明は例えば通信会議用の低いビット率の送信シス
テムに適用されたものとして示されているが、例えばこ
のような記録キャリアに適したフォーマットにデータを
構成するフォーマッティング手段を設けることによりコ
ンパクトディスク等の良く知られたデジタル記録キャリ
ア上に音楽デジタル蓄積する場合にも有効である。
関連したほとんどの信号処理またはその全てが単一の
適切にプログラムされたデジタル信号処理(dsp)チッ
プパッケージにおいて実現されることが都合がよい。2
つのチャンネルパッケージはまた市販されている。適応
フィルタ、LPC解析および交差相関を実行するソフトウ
ェアは良く知られている。
フロントページの続き (72)発明者 ムンデイ、エドワード イギリス国、アイピー4・3ピーエー、 サフォーク、イプスウイッチ、ハンバ ー・ドゥーシー・レーン 143 (72)発明者 チーザム、バリー・マイケル・ジョージ イギリス国、エル19・9ビーキュー、リ バプール、サウス・モスレイ・ヒル・ロ ード 99

Claims (8)

    (57)【特許請求の範囲】
  1. 【請求項1】第1および少なくとも1つの第2のチャン
    ネルを受信する手段と、 各フィルタ処理されたチャンネルを生成し、第1のフィ
    ルタ処理されたチャンネルを実質的にスペクトル的にホ
    ワイトするために、第1のチャンネルの反転スペクトル
    を近似するフィルタに応じて第1および第2のチャンネ
    ルをフィルタ処理する手段と、 各フィルタ処理されたチャンネルを受信するように接続
    され、複数のオーダーの予測フィルタに供給された場合
    に、フィルタ処理された第1のチャンネルから第2のチ
    ャンネルの予測を可能にする複数のフィルタ係数を周期
    的に発生する手段と、 前記第1のチャンネルを表わすデータおよび前記第2の
    チャンネルの再構成を可能にするデータを出力する手段
    とを具備しているポリフォニック信号コーディング装
    置。
  2. 【請求項2】フィルタ係数発生手段は、第1のチャンネ
    ルを受信し、第1のチャンネルから予測された第2のチ
    ャンネルを生成するように接続された適応フィルタと、
    前記予測された第2のチャンネルと実際の第2のチャン
    ネルとの間の差を表す残留分信号を生成する手段とを具
    備し、前記第2のチャンネル再構成データが前記残留分
    信号を表すデータを含んでいる請求項1記載の装置。
  3. 【請求項3】第2のチャンネル再構成データは前記フィ
    ルタ係数を含んでいる請求項1または2記載の装置。
  4. 【請求項4】適応フィルタは前記残留分信号によっての
    み制御され、前記第2のチャンネル再構成データは前記
    残留分信号から構成されている請求項2記載の装置。
  5. 【請求項5】前記フィルタ処理手段は、ホワイトにされ
    た出力を生成するために第1のチャンネルをフィルタ処
    理するように構成された適応マスターフィルタと、前記
    第2のチャンネルをフィルタ処理するように構成された
    スレイブフィルタとを具備し、スレイブフィルタはフィ
    ルタ処理手段の適応フィルタに等しい応答を有するよう
    に構成されている請求項1乃至4のいずれか1項記載の
    装置。
  6. 【請求項6】入力信号を受信する入力手段と、 第1のチャンネルが入力信号の和を表す和チャンネルで
    あり、第2のチャンネルが入力信号の間の差を表してい
    るチャンネルである前記チャンネルを入力信号から生成
    する手段とを具備する請求項1乃至5のいずれか1項記
    載の装置。
  7. 【請求項7】入力手段は、少なくとも1つの入力信号を
    遅延する可変遅延手段と、フィルタ係数発生手段の上流
    の相関を増加するように信号に与えられる差遅延を制御
    する手段とを含み、出力手段は、前記差遅延を表すデー
    タも出力するように構成されている請求項6記載の装
    置。
  8. 【請求項8】入力信号の和を表す和信号を入力信号から
    生成し、 入力信号の間の差を表す少なくとも1つの差信号を入力
    信号から生成し、 各フィルタ処理された信号を生成し、フィルタ処理され
    た和信号を実質的にスペクトル的にホワイトするため
    に、和信号の反転スペクトルを近似するフィルタに応じ
    て和信号および差信号をフィルタ処理し、 前記フィルタ処理された和信号および差信号を解析し、
    多段予測フィルタに与えられた場合にフィルタ処理され
    た和信号から差信号の予測を可能にする複数の係数をそ
    れから発生し、 コード化された出力は、前記フィルタ処理された和信号
    と前記フィルタ処理された和信号から前記差信号の再構
    成を可能にするデータとを含んでいるポリフォニック信
    号をコード化する方法。
JP2508936A 1989-06-15 1990-06-15 ポリフォニックコーディング Expired - Lifetime JP2703405B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB898913758A GB8913758D0 (en) 1989-06-15 1989-06-15 Polyphonic coding
GB8913758.2 1989-06-15

Publications (2)

Publication Number Publication Date
JPH04506141A JPH04506141A (ja) 1992-10-22
JP2703405B2 true JP2703405B2 (ja) 1998-01-26

Family

ID=10658483

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2508936A Expired - Lifetime JP2703405B2 (ja) 1989-06-15 1990-06-15 ポリフォニックコーディング

Country Status (13)

Country Link
EP (1) EP0478615B2 (ja)
JP (1) JP2703405B2 (ja)
AT (1) ATE121900T1 (ja)
AU (1) AU640667B2 (ja)
CA (1) CA2058984C (ja)
DE (1) DE69018989T3 (ja)
DK (1) DK0478615T3 (ja)
ES (1) ES2071823T3 (ja)
FI (1) FI915873A0 (ja)
GB (1) GB8913758D0 (ja)
HK (1) HK137196A (ja)
NO (1) NO180030C (ja)
WO (1) WO1990016136A1 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG49883A1 (en) * 1991-01-08 1998-06-15 Dolby Lab Licensing Corp Encoder/decoder for multidimensional sound fields
US5274740A (en) * 1991-01-08 1993-12-28 Dolby Laboratories Licensing Corporation Decoder for variable number of channel presentation of multidimensional sound fields
DE4136825C1 (ja) * 1991-11-08 1993-03-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De
US5278909A (en) * 1992-06-08 1994-01-11 International Business Machines Corporation System and method for stereo digital audio compression with co-channel steering
EP0608937B1 (en) * 1993-01-27 2000-04-12 Koninklijke Philips Electronics N.V. Audio signal processing arrangement for deriving a centre channel signal and also an audio visual reproduction system comprising such a processing arrangement
DE4320990B4 (de) * 1993-06-05 2004-04-29 Robert Bosch Gmbh Verfahren zur Redundanzreduktion
US5488665A (en) * 1993-11-23 1996-01-30 At&T Corp. Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels
DE19526366A1 (de) 1995-07-20 1997-01-23 Bosch Gmbh Robert Verfahren zur Redundanzreduktion bei der Codierung von mehrkanaligen Signalen und Vorrichtung zur Dekodierung von redundanzreduzierten, mehrkanaligen Signalen
GB2303516A (en) * 1995-07-20 1997-02-19 Plessey Telecomm Teleconferencing
US6016473A (en) * 1998-04-07 2000-01-18 Dolby; Ray M. Low bit-rate spatial coding method and system
DE19829284C2 (de) * 1998-05-15 2000-03-16 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verarbeiten eines zeitlichen Stereosignals und Verfahren und Vorrichtung zum Decodieren eines unter Verwendung einer Prädiktion über der Frequenz codierten Audiobitstroms
SE519552C2 (sv) 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
SE519985C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
SE519976C2 (sv) 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
SE519981C2 (sv) 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
FR2821475B1 (fr) * 2001-02-23 2003-05-09 France Telecom Procede et dispositif de reconstruction spectrale de signaux a plusieurs voies, notamment de signaux stereophoniques
US7835918B2 (en) * 2004-11-04 2010-11-16 Koninklijke Philips Electronics N.V. Encoding and decoding a set of signals
CN103716748A (zh) * 2007-03-01 2014-04-09 杰里·马哈布比 音频空间化及环境模拟
CN101981616A (zh) * 2008-04-04 2011-02-23 松下电器产业株式会社 立体声信号变换装置、立体声信号逆变换装置及其方法
US8811621B2 (en) 2008-05-23 2014-08-19 Koninklijke Philips N.V. Parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
KR101437896B1 (ko) 2010-04-09 2014-09-16 돌비 인터네셔널 에이비 Mdct-기반의 복소수 예측 스테레오 코딩
AU2011240239B2 (en) 2010-04-13 2014-06-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction
UA107771C2 (en) 2011-09-29 2015-02-10 Dolby Int Ab Prediction-based fm stereo radio noise reduction
US9380387B2 (en) 2014-08-01 2016-06-28 Klipsch Group, Inc. Phase independent surround speaker

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU546069B2 (en) * 1981-09-07 1985-08-15 Kahn, Leonard Richard Am stereo distortion correction
JPH0761043B2 (ja) * 1986-04-10 1995-06-28 株式会社東芝 ステレオ音声伝送蓄積方式
GB8628046D0 (en) * 1986-11-24 1986-12-31 British Telecomm Transmission system

Also Published As

Publication number Publication date
CA2058984A1 (en) 1990-12-16
EP0478615B2 (en) 1998-04-15
ATE121900T1 (de) 1995-05-15
NO914947L (no) 1992-02-13
DE69018989T2 (de) 1995-09-07
WO1990016136A1 (en) 1990-12-27
NO180030B (no) 1996-10-21
EP0478615A1 (en) 1992-04-08
FI915873A0 (fi) 1991-12-13
DK0478615T3 (da) 1995-07-17
HK137196A (en) 1996-08-02
AU5837990A (en) 1991-01-08
DE69018989D1 (de) 1995-06-01
DE69018989T3 (de) 1998-11-19
NO180030C (no) 1997-01-29
JPH04506141A (ja) 1992-10-22
AU640667B2 (en) 1993-09-02
NO914947D0 (no) 1991-12-13
EP0478615B1 (en) 1995-04-26
ES2071823T3 (es) 1995-07-01
CA2058984C (en) 1998-12-01
GB8913758D0 (en) 1989-08-02

Similar Documents

Publication Publication Date Title
JP2703405B2 (ja) ポリフォニックコーディング
US5434948A (en) Polyphonic coding
US5701346A (en) Method of coding a plurality of audio signals
US8873764B2 (en) Acoustic echo suppression unit and conferencing front-end
JP5277508B2 (ja) マルチ・チャンネル音響信号をエンコードするための装置および方法
KR101183857B1 (ko) 다중 채널 오디오 신호를 인코딩/디코딩하기 위한 방법 및 장치
KR101178114B1 (ko) 복수의 입력 데이터 스트림을 믹싱하기 위한 장치
KR20010015588A (ko) 오디오신호를 코딩하기 위한 방법 및 장치와 비트스트림을디코딩하기 위한 방법 및 장치
KR100633213B1 (ko) 불가청 정보를 포함함으로써 적응형 필터 성능을개선시키는 방법 및 장치
JPH09204200A (ja) 会議システム
CN106782592B (zh) 一种用于消除网络声音传输的回音和啸叫的系统和方法
US7024008B2 (en) Acoustic quality enhancement via feedback and equalization for mobile multimedia systems
JPH07505732A (ja) 背景音を符号化/復号する方法および装置
JPH0761043B2 (ja) ステレオ音声伝送蓄積方式
EP1521241A1 (en) Transmission of speech coding parameters with echo cancellation
EP1944761A1 (en) Disturbance reduction in digital signal processing
Minami et al. Stereophonic adpcm voice coding method
JP4323520B2 (ja) ポリフォニック信号の制約付きフィルタ符号化
JPH02202300A (ja) ステレオ音声伝送システム
Schuler Audio Coding
Yu et al. Low-complexity binaural decoding using time/frequency domain HRTF equalization
JPS6014539A (ja) 多チヤンネル信号符号化方法
JPH07123028A (ja) 音声会議装置
Perez-Meana et al. Signal Processing Techniques for Audio and Speech Applications
JPH05316002A (ja) ステレオ音声符号化方式