JP4431568B2 - 音声符号化 - Google Patents

音声符号化 Download PDF

Info

Publication number
JP4431568B2
JP4431568B2 JP2006502569A JP2006502569A JP4431568B2 JP 4431568 B2 JP4431568 B2 JP 4431568B2 JP 2006502569 A JP2006502569 A JP 2006502569A JP 2006502569 A JP2006502569 A JP 2006502569A JP 4431568 B2 JP4431568 B2 JP 4431568B2
Authority
JP
Japan
Prior art keywords
signal
encoded
shift
audio
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2006502569A
Other languages
English (en)
Other versions
JP2006518482A (ja
Inventor
イェー ブレーバールト,ディルク
ウェー イェー オーメン,アルノルデュス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=32865026&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP4431568(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2006518482A publication Critical patent/JP2006518482A/ja
Application granted granted Critical
Publication of JP4431568B2 publication Critical patent/JP4431568B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Cereal-Derived Products (AREA)
  • Stereophonic System (AREA)

Description

本発明は、音声符号化に関する。
音声信号の変数記述は、特に音声符号化の分野において、近年関心を得ている。音声信号を表わす伝送(量子化)変数は、知覚的に等しい信号を受信側で再合成できる伝送を、ほんのわずかに必要とすることが示されている。MPEG-LII、MP3及びAAC(MPEG-2アドバンスト・オーディオ・コーディング)のような音声符号化の考えに基づく従来の波形で、ステレオ信号は、二つのモノラル音声信号を一つのビットストリームに符号化することによって符号化される。これは夫々のチャネルを明らかに符号化するが、単一のチャネルを符号化することを必要とする二つのデータを要求することを犠牲にする。
多くの場合において、二つのチャネルによって搬送される内容は、主にモノラルである。故に、中央/側面ステレオ符号化及び強度符号化のような技術を用いてチャネル間の相関及び無関係を利用することによって、ビットレートの節約が成されうる。本発明に関連する符号化方法は、チャネルの一つを完全に符号化し、他のチャネルが完全に符号化されたチャネルから導き出されうるような変数記述を符号化する。故に、復号器において、通常単一の音声信号は、二つの異なる出力チャネルを得るように変更されなければならない。特に、第二のチャネルを記述するために使用されている変数はチャネル間の時間差(ITD)、チャネル間の位相差(IPD)及びチャネル間のレベル差(ILD)を有しても良い。
EP-A-1107232では、符号化された信号が、左チャネル又は右チャネルのうちの一つ、及び、他の入力信号が再生されることを可能にする変数情報から導かれる情報を有する、ステレオ信号の符号化方法について述べられている。
上記を参照して表わされるような変数表現において、ITDは、入力チャネル間の位相又は時間における差を表わす。故に、復号器は、符号化されたチャネルの内容を取得し、ITDによって与えられた位相差を作り出すことによって、符号化されていないチャネルを発生することができる。この処理は、特定の自由度を組み込み。例えば、一つのチャネル(即ち、符号化されていないチャネル)のみが、所定の位相差で変更されても良い。あるいは、符号化された出力チャネルは、負の所定の位相差で変更されうる。第三の例として、一つは、所定の半分の位相差を一つのチャネルに、且つ、負の所定の半分の位相差を他のチャネルに適用することができた。位相差のみが決められているので、両チャネルの位相シフトでの補正(分配)は不変ではない。これは復号化された音声の空間特性に関する問題ではないが、可聴式の人為的な影響をもたらしうる。これら人為的影響は、全体の位相シフトが任意であるので生じる。如何なる符号化時間フレームにおいても、出力チャネルの一つ又は両方に関する位相変更は、前のフレームの位相変更に対応しうる。本出願は、復号器において正確な全体の位相シフトを正確に予測することが非常に困難であることを発見し、前のフレームの位相変更によって位相変更を制限するような方法を前で述べている。これは、うまく作用する問題解決法であるが、問題の原因を取り除くものではない。
上述されるように、所定の位相又は時間のシフトが、復号レベルで二つの出力チャネル上で分けられるであろう方法を決定することは、非常に困難であることが示されている。以下の例は、この困難を更に明らかに説明する。復号器においてと仮定すると、モノラル信号成分は単一の正弦波から成る。更に、この正弦波のITD変数は、時間に渡って(即ち、分析フレームに渡って)線形に増加する。この例において、我々はIPDに注目し、IPDがまさにITDの線形変換であることに留意する。IPDは、間隔[-π:π]で単に定義される。図1は、時間関数としてのIPDを示す。
第一の見解において、これは非常に理論的な例のように見えるが、このようなIPDの挙動は、しばしば音声録音で起こる(例えば、左右のチャネルでのトーン周波数が数ヘルツだけ異なる場合)。復号器の基本的な仕事は、単一の入力信号から二つの出力信号を生成することである。これら出力信号は、IPD変数を満たさなければならない。これは、単一の入力信号を二つの出力信号にコピーし、出力信号の位相を個々に変更することによって実行されうる。チャネル間のIPDの対称な分配を仮定すると、これは左の出力チャネルが+IPD/2だけ変更され、一方で右の出力チャネルは-IPD/2だけ位相回転されることを示す。しかし、このアプローチは、時間tで生じる位相急転によって引き起こされた、明らかに聞こえる人為的影響をもたらす。これは、図2を参照して理解されうる。図2は、ある時刻t-、即ち位相急転の発生直前、及びt+、即ち位相急転の直後で、左右のチャネルに存在する位相変化を示す。モノラル入力信号に関する位相変化は、複雑なベクトルとして示されている(即ち、出力及び入力の信号間の角度は、夫々の出力チャネルの位相変化を表現する)。
時間tでの位相急転の直前及び直後の出力信号間に、大きな位相不一致があることがわかる。即ち、夫々の出力チャネルはほぼπradだけ回転される。出力の連続したフレームが重複加算によって結合される場合、位相急転の直前及び直後の出力信号の重複部分はお互いに打ち消し合う。これは、出力でクリック様の人為的影響をもたらす。これら人為的影響は、IPD変数が2πの期間で周期的であるので生じる。しかし、IPDがチャネル間で分けられる場合、夫々の個々の信号の位相変化は、2πより小さい期間で周期的になる(IPDが左右対称に分けられる場合、位相変化はπの周期で周期的になる)。従って、夫々のチャネルでの位相変化の実際の期間は、チャネル間のIPDの分配方法に依存する。しかし、それが2π以下の場合には、復号器での重複加算の問題が生じる。
上記の例は夫々単純な場合であるが、我々は、複雑な信号(同じ位相変更周波数帯域内での更なる周波数成分、及び、時間に渡るIPD変数の更に複雑な挙動を有する)に関して、出力チャネル間の正確なIPD分配を求めることが非常に困難であることを見つけている。
符号器において、チャネル間でIPDを分配する方法を特定する情報が利用可能である。故に、本発明の目的は、符号化された信号のサイズを著しく増大させずに、符号化された信号でのこの情報を保つことである。
この目的を達成するために、本発明は、この明細書の独立した請求項で記載されている符号器及び関連するものを提供する。
チャネル間の時間差(ITD)又は位相差(IPD)は、二つの入力チャネル間の夫々の時間シフトに基づく。他方で、全体の時間シフト(OTD)又は位相シフト(OPD)は、完全に符号化されたモノラル出力と入力信号の一つとの間の最良に一致した遅延(又は位相)によって決められる。故に、符号器でOTD(OPD)を分析し、その値を変数ビットストリームに加えることは都合が良い。
この時間差符号化の利点は、OTD(OPD)が、聴覚システムが全体の位相変化に対して比較的鈍感であるので(両耳性の聴覚システムはITD変化に対して非常に敏感であるが)、非常に少ないビットのみで符号化される必要があることである。
上記で扱われている問題に対して、OPDは図3で示されるような挙動を有する。
ここで、OPDは、時間に渡って左チャネルの位相変化を基本的に記述する。一方で、右チャネルの位相変化はOPD(t)-IPD(t)によって与えられる。両変数(OPD及びIPD)は2πの期間で周期的であるから、結果として生じる、独立した出力チャネルの位相変化も2πの期間で周期的となる。従って、結果として生じる、時間に渡る両出力チャネルの位相変化は、入力信号に存在しなかった位相の不連続を示さない。
この例において注目すべきは、OPDは左チャネルの位相変化を表わす一方で、それに続いて右チャネルはIPDを用いて左チャネルから導き出されることである。これら変数の他の線形結合は、原則的には変換に使用されうる。自明な例では、OPDで右チャネルの位相変化を表わし、OPD及びIPDを用いて左チャネルの位相変化を導き出す。本発明の重大な成果は、一組の時間変化する合成フィルタを能率的に表わすことであり、出力チャネル間の位相差は一つの(高価な)変数で表わされ、位相差の補正値は他の(ずっと安価な)変数で表わされる。
本発明の実施例を、例によって、且つ、添付の図を参照して、詳細に記述する。
本発明の実施例での空間変数発生段階は、三つの信号をその入力として取る。これら信号の最初の二つは、L及びRと表わされ、ステレオ方式の組の左右のチャネルに相当する。チャネルの夫々は、この技術分野では従来方式であるように、例えば、フィルタ・バンク又は周波数変換を用いて、複数の時間―周波数タイルに分けられる。符号器への更なる入力は、他の信号L、Rの合計であるモノラル信号Sである。この信号Sは、他の信号L及びRのモノラル結合であり、他の入力信号と同じ時間―周波数分離を有する。符号器の出力は、ビットストリームを復号する際に復号器によって使用される空間変数と共に、モノラル音声信号Sを含むビットストリームである。
次に、符号器は、LとRの入力信号間の時間的ずれを決めることによって、通信チャネル間の時間差(ITD)を計算する。この時間的ずれは、入力信号L(t,f)及びR(t,f)の対応する時間/周波数タイル間の相互相関関数での最大に相当する。即ち、以下の式
ITD=arg(max(ρ(L,R)))
の通りである。ここで、ρ(L,R)は、入力信号L(t,f)とR(t,f)との間の相互相関関数を表わす。
全体の時間シフト(OTD)は、二つの異なった方法で、即ち、総和信号Sと左の入力信号Lとの間の時間差として、又は総和信号Sと右の入力信号Rとの間の時間差として定義される。更に強い(即ち、更に高いエネルギー)入力信号に関してOTDを測定することが好都合である。即ち、
|L|>|R|の場合、
OTD=arg(max(ρ(L,S)))
又は、OTD=arg(max(ρ(R,S)))
が成り立つ。
OTD値は、その後、量子化され、ビットストリームに加えられうる。約π/8ラジアンの量子化誤差が許容されることが知られている。これは、ITD値に許容される誤差と比較して、相対的に大きな量子化誤差である。従って、空間変数のビットストリームは、ILD、ITD、OTD、及び幾つか又は全ての周波数帯に対する相関値を含む。ここで留意すべきは、ITD値が伝送されるそれら周波数帯に対してのみ、OTDが必要であることである。
復号器は、ITD、OTD及びILDに基づく出力チャネルの必要な位相変化を決定し、結果として、左チャネル及び右チャネルの時間シフト(TSL及びTSR)を生じる。即ち、以下の通りである。
ILD>0(即ち、|L|>|R|)の場合、
TSL=OTD
TSR=OTD−ITD
又は、
TSL=OTD+ITD
TSR=OTD
完全な音声符号器は、一般的に、入力として二つのアナログの時間変化する音声周波数信号を取り、これら信号をデジタル化し、モノラルの総和信号を発生し、次に、符号化されたモノラル信号及び空間変数を有する出力ビットストリームを発生することが理解される。(あるいは、入力は二つのすでにデジタル化された信号から導き出されても良い。)当業者は、下記の大半が既知の技術で容易に実施可能であると分かるであろう。
一般的に、符号器10は、入ってくる夫々の信号(L,R)をサブバンド信号16(望ましくは、周波数で増大するバンド幅を有する)に分ける夫々の変換モジュール20を有する。好ましい実施例において、モジュール20は、時間/周波数スライシングを実行するために、変換動作によって後に続かれる時間窓関数を使用する。しかし、時間連続方法もまた使用されうる(例えば、フィルタ・バンク)。
総和信号12の決定及び変数14の抽出に対する次のステップは、分析モジュール18内で実行され、
対応するサブバンド信号16のレベル差(ILD)を検出し、
対応するサブバンド信号16の時間差(ITD又はIPD)を検出し、
ILD又はITDによって明らかにされ得ない波形の類似性又は非類似性の度合いを表わす。
ILDは、例えば所定の周波数帯域に対する特定の時間での信号のレベル差によって決められる。ILDを決定する一つの方法は、両方の入力チャネルの対応する周波数帯域のrms値を測定し、これらのrms値の比率(望ましくは、dBで表わされる)を計算することである。
ITDは、両方のチャネルの波形間の最良の一致を与える時間又は位相の整列によって決められる。ITDを得る一つの方法は、二つの対応するサブバンド間の相互相関関数を計算し、最大を求めることである。相互相関関数でのこの最大に対応する遅延が、ITD値として使用されうる。
第二の方法は、左右のサブバンドの分析信号を計算し(即ち、位相及び包絡値を計算すること)、チャネル間の位相差をIPD値として使用することである。ここで、複雑なフィルタバンク(例えば、FFT)が使用され、特定のビン(周波数領域)を見ることによって、位相関数が時間に渡って導き出されうる。左右両チャネルに対してこれを行うことによって、位相差IPD(相互相関にある二つのフィルタをかけられた信号よりむしろ)が見積もられうる。
相関は、対応するサブバンド信号間の最良の一致を与えるILD及びITDを最初に検出し、続いて、ITD及び/又はILDに対する補償後の波形の類似性を測定することによって得られる。従って、この枠組みにおいて、相関は、ILD及び/又はITDに帰属されうる対応するサブバンド信号の類似性又は非類似性として定義される。この変数に対する適切な指標は、コヒーレンスである。これは、一連の遅延間の相互相関関数の最大値である。しかし、他の指標、例えば、対応するサブバンドの総和信号と比較される(望ましくは、ILD及び/又はITDに対しても比較される)ILD及び/又はITDの補償後の差分信号の夫々のエネルギーも使用されうる。この差分信号は、基本的には(最大)相関の線形変換である。
変数の変換に関する重要な問題は、変数表示の正確さ(即ち、量子化誤差のサイズ)であり、必要な変換能力及び音声品質に直接的に関わる。この段落では、空間変数の量子化に関する幾つかの問題について検討する。基本的な考えは、空間的合図の所謂最小弁別値(JND)での量子化誤差を基にすることである。更に述べると、量子化誤差は、変数で変化する人間の聴覚システムの感度によって決められる。変数で変化する感度が変数自体の値に強く依存することはよく知られるので、以下の方法は離散的な量子化ステップを決定するために適用される。
ILDで変化する感度がILD自体に依存することは、音響心理学の研究から知られる。ILDがdBで表わされる場合、0dBの基準からの約1dBの偏差を検出することが可能である。一方で、約3dBの変化は、基準レベル差が20dBである場合に必要とされる。従って、量子化誤差は、左右のチャネルの信号が更に大きなレベル差を有する場合、更に大きくなりうる。例えば、これは、チャネル間のレベルを最初に測定することによって適用されうる。この測定は、得られたレベル差の非線形(圧縮)変換、及びそれに続く線形量子化処理によって、あるいは、非線形分配を有する有効なILD値に関する参照テーブルの使用によって後に続かれる。好ましい実施例において、ILD(単位dB)は、以下の集合I、
I=[-19 -16 -13 -10 -8 -6 -4 -2 0 2 4 6 8 10 13 16 19]
の範囲外の最接近値に量子化される。
人間の対象のITDで変化する感度は、一定の位相閾値を有することを特徴とする。これは、遅延時間に関して、ITDの量子化ステップが周波数で減少するはずであることを意味する。あるいは、ITDが位相差の形で表わされる場合、量子化ステップは周波数から独立である。これを実施する一つの方法は、量子化ステップとして一定の位相差を取り、夫々の周波数帯域に対する対応する時間遅延を決定することである。このITD値は、その時、量子化ステップとして使用される。好ましい実施例において、ITD量子化ステップは、0.1ラジアン(rad)の夫々のサブバンドでの一定の位相差によって決定される。従って、夫々のサブバンドに関して、サブバンドの中間周波数の0.1radに対応する時間差が、量子化ステップとして使用される。
他の方法は、周波数に依存しない量子化の考えに従う位相差を伝送することである。特定の周波数を越えると、人間の聴覚システムは、微細構造の波形でITDに対して感度が良くないことも知られる。この現象は、特定の周波数(一般的に2kHz)までのITD変数の伝送によってのみ活用されうる。
ビットストリーム減少に関する第三の方法は、同じサブバンドのILD及び/又は相関変数に依存するITD量子化ステップを組み込むことである。大きなILDに対して、ITDは、更に不正確に符号化される。更に、相関が非常に低い場合、ITDで変化する人間の感度が下がることが知られる。従って、更に大きなITD量子化誤差は、相関が小さい場合に適用されても良い。この考えの極端な例は、相関が特定の閾値以下である場合、全くITDを伝送しないことである。
相関の量子化誤差は、(1)相関値自体、更に場合によっては(2)ILDに依存する。+1に近い相関値は、高い精度(即ち、小さい量子化ステップ)で符号化され、一方で、0に近い相関値は、低い精度(大きな量子化ステップ)で符号化される。好ましい実施例において、一連の非線形に分配された相関値は、以下の集合R、
R=[1 0.95 0.9 0.82 0.75 0.6 0.3 0]
の最接近値に量子化され、これは相関値毎に他に3ビットを要する。
現在のサブバンドの(量子化された)ILDの絶対値が19dBである場合、ITD値及び相関値はこのサブバンドに対して伝送されない。特定のサブバンドの(量子化された)相関値が零である場合、ITD値はそのサブバンドに対して伝送されない。
この方法で、夫々のフレームは、空間変数を伝送するために最大233ビットを必要とする。1024個のサンプルの更新フレーム長さ及び44.1kHzのサンプリングレートで、伝送の最大ビットレートは、10.25kbit/s(233×44100/1024=10.034kbit/s)以下である。(注目すべきは、エントロピー符号化又は微分符号化を用いると、このビットレートが更に低減されうることである。)
第二の可能性は、同じサブバンドの測定されたILDに依存する相関に対して、量子化ステップを使用することである。即ち、大きなILD(即ち、一つのチャネルはエネルギーに関して支配的である)に対して、相関での量子化誤差は大きくなる。この原理の極端な例は、特定のサブバンドに対して、そのサブバンドに対するILDの絶対値が特定の閾値を超える場合、相関値を全く伝送しないことである。
図4を参照して、更に詳細には、モジュール20で、左右の入力信号が様々な時間フレームに分けられ(44.1kHzのサンプリングレートで2048個のサンプル)、平方根ハニング窓で分けられる。その後、FFTが計算される。負のFFT周波数は切り捨てられ、結果として得られるFFTは、FFTビンのグループ又はサブバンド16に再分割される。サブバンドgで結合されるFFTビンの数は、周波数に依存する。即ち、更に高い周波数で、更に多くのビンが、更に低い周波数で結合される。本実施において、約1.8ERBに対応するFFTビンが集められ、結果として完全な可聴周波数範囲に相当する20個のサブバンドを生じる。夫々の後続のサブバンド(最も低い周波数での始まる)のFFTビンS[g]の結果として得られる数は、
S=[4 4 4 5 6 8 9 12 13 17 21 25 30 38 45 55 68 82 100 477]
である。
従って、最初の三つのサブバンドは4FFTビンを有し、第四のサブバンドは5FFTビンを有し、以下同様となる。夫々のサブバンドに関して、分析モジュール18は、対応するILD、ITD、及び相関(r)を計算する。ITD及び相関は、他のグループに属する全てのFFTビンを設定することによって単純に零に計算され、左右のチャネルから結果として生じる(帯域制限された)FFTを増加し、後に逆FFT変換が続く。結果として生じる相互相関関数は、-64から+63のサンプル間の通信チャネル間の遅延において最高点を読み取られる。最高点に対応する内部の遅延は、ITD値として使用され、この最高点での相互相関関数の値は、このサブバンドの内耳相関として使用される。最後に、ILDは、夫々のサブバンドに対する左右のチャネルの出力比を取ることによって、単純に計算される。
分析器18は総和信号発生器17を有する。総和信号発生器は、入力信号の平均である総和信号を発生する。(他の実施例において、例えば、位相補償を含めて、付加的な処理が総和信号の発生で実行されても良い。必要ならば、総和信号は、(1)負の周波数での複雑な結合の挿入、(2)逆FFT、(3)窓関数、及び(4)重複加算によって時間領域に変換されうる。)
上述のように、時間及び/又は周波数領域での総和信号12の表現を考えると、信号は幾つかの従来方法で、ビットストリーム50のモノラル層40で符号化されうる。例えば、MP3符号器は、ビットストリームのモノラル層40を発生するために使用されうる。このような符号器が入力信号での急速な変化を検出する時、それは、その一部分の入力信号を符号化する際の時間及び/又は周波数の局在性を改善するように、特定の時間期間に対して用いる窓長さを変化しうる。窓切り替えフラグは、その時、後に信号を合成する復号器にこの切り替えを指示するために、ビットストリームに埋め込まれる。
しかし、好ましい実施例において、WO01/69593-a1で記述されている方式の正弦波符号器30は、モノラル層40を発生するために使用される。符号器30は、過渡符号器11、正弦波符号器13及び雑音符号器15を有する。過渡符号器は、この実施例に含まれる任意の機能である。
信号12が過渡符号器11に入る時、夫々の更新間隔に関して、符号器は、分析窓の中で過渡的な信号成分及びその位置(サンプル精度に対して)がある場合に測定する。過渡的な信号成分の位置が決められると、符号器11は、過渡的な信号成分(の主な部分)を抽出しようとする。それは、例えば、多くの(少数の)正弦波成分を用いることによって望ましくは測定された開始位置で始まる信号区分に対する形状関数に整合し、形状関数の下の内容を決定する。この情報は、過渡符号CTに含まれる。
過渡成分より小さい総和信号12は、正弦波符号器13に供給され、(決定的な)正弦波成分を決定するように分析される。要するに、正弦波符号器は、一つのフレーム区分から次まで結合される正弦波成分のトラックとして入力信号を符号化する。トラックは、所定の区分での正弦波開始、即ち起源に対して、開始周波数、開始振幅及び開始位相によって最初に表わされる。その後、トラックは、トラックが終わる区分(消滅)まで(断続的に)、周波数差分、振幅差分、更に場合によっては位相差によって、後の区分で表わされる。この情報は、正弦波符号CSに含まれる。
過渡及び正弦波の両成分より小さい信号は、主に雑音から成るとみなされ。好ましい実施例の雑音分析器15は、この雑音の雑音符号CN表現を発生する。一般的に、例えば、WO01/89086-A1で見られるように、雑音のスペクトラムは、等価長方形帯域幅(ERB、イクイバレント・リクタングラー・バンドワイドス)スケールに従って、組み合わされたAR(自己回帰)MA(移動平均)フィルタ変数(pi、qi)を有する雑音符号器によってモデル化される。復号器において、フィルタ変数は、主にフィルタである雑音合成器に入力され、雑音のスペクラムを近似する周波数応答を有する。合成器は、ARMAフィルタ変数(pi、qi)を有するホワイトノイズ信号をフィルタに通すことによって再構成された雑音を発生し、続いて、元の総和信号の推定値を発生するために、再構成された雑音を合成された過渡及び正弦波信号に加える。
マルチプレクサ41は、長さ16msの重なり時間区分を表わし、8ms毎に更新される図6のフレーム42に分割されるモノラル音声信号を発生する。夫々のフレームは、夫々の符号CN、CS及びCNを有する。復号器において、連続するフレームの符号は、モノラル総和信号の合成の際に、それらの重なり領域で混合される。本実施例において、夫々のフレームは一つの過渡的な符号CTまでを単に有すれば良いことが想定され、このような過渡信号の一例は数表示44によって示される。
更に、分析器18は、空間変数層発生器19を有する。この構成要素は、上述のように、夫々の空間変数フレームに対して、空間変数の量子化を実行する。一般的に、発生器19は、夫々の空間層チャネル14をフレーム46に分ける。このフレームは、図6のように、長さ64msの重なり時間区分を表わし、32ms毎に更新される。夫々のフレームはILD、ITD、OTD及び相関値(r)を有する。復号器において、連続するフレームの値は、信号を合成する際の如何なる所定の時間に対しても空間層変数を決定するために、それらの重なり領域で混合される。
好ましい実施例において、モノラル層40での過渡符号器11によって(又は、総和信号12で対応する分析器モジュールによって)検出される過渡位置は、空間変数層14での非均一な時間区分が必要とされるかどうかを決定するように、発生器19によって使用される。符号器がモノラル層を発生するためにMP3符号器を使用している場合、モノラルストリームにおける窓切り替えフラグの存在は、過渡位置の推定値として発生器によって使用される。
最後に、モノラル40及び空間表現14の層が発生するとすぐに、それらはマルチプレクサ43によってビットストリーム50に書き込まれる。この音声ストリーム50は、例えば、データバス、アンテナシステム、記憶媒体等に供給される。
図5を参照すると、上述されている符号器を組みわせて使用される復号器60は、入ってくる音声ストリーム50をモノラル層40’、更にこの場合は単一の空間表現層14’に分けるデマルチプレクサ62を有する。モノラル層40’は、符号器に対応する従来型の合成器64によって読み込まれる。符号器は、元の総和信号12’の時間領域の推定値を供給するための層を発生する。
次に、デマルチプレクサ62によって抽出された空間変数14’は、左右の出力信号を発生するために、後処理モジュール66によって総和信号12’に適用される。好ましい実施例の後処理装置はまた、この信号での過渡位置を決めるモノラル層14’の情報を読み込み、それらを適切に処理する。これは、当然のことながら、このような過渡が信号で符号化されるような場合だけである。(あるいは、合成器64はこのような命令を後処理装置に供給しうるが、これは、別な方式の従来型の合成器64の多少の変更を必要とする。)
後処理装置66において、上述された総和信号12’の周波数領域表現は、処理に利用可能であることが推測される。この表現は、合成器64によって発生した時間領域波形の窓関数及びFFT動作によって得られても良い。次に、総和信号は、左右の出力信号経路にコピーされる。その後、左右の信号間の相関は、非相関器69’で変更され、69”は変数rを使用する。
その後、夫々の段階70’、70”において、左信号の夫々のサブバンドは値TSLによって遅らされ、右信号は、サブバンドに対応するビットストリームから抽出されるOTD及びITDの値から与えられる(量子化される)TSRによって遅らされる。TSL及びTSRは、上記で与えられた公式によって計算される。最後に、左右のサブバンドは、夫々の段階71’、71”でのそのサブバンドに対するILDによって見積もられる。次に、夫々の変換段階72’、72”は、以下のステップ、(1)負の周波数での複雑な結合の挿入、(2)逆FFT、(3)窓関数、及び(4)重複加算を実行することによって、出力信号を時間領域に変換する。
上述の符号化の考えの代わりとして、位相差が符号化されうるような方法が他にも多数ある。例えば、変数は、ITD及び特定の分配基調、例えばxを有しても良い。次に、左チャネルの位相変化は、x*ITDとして符号化される一方で、右チャネルの位相変化は、(1-x)*ITDとして符号化される。明らかに、他の多数の符号化の考えが、本発明の実施例を実施するために使用されうる。
本発明は、専用のハードウェア、DSP(デジタル信号処理装置)でのソフトウェアの実行、又は汎用コンピュータにおいて実施されうることが分かる。本発明は、本発明による符号化方法を実行するためのコンピュータプログラムを有するCD-ROM又はDVD-ROMのような具体的な媒体で具現化される。本発明はまた、インターネットのようなデータネットワーク上で伝送される信号、又は放送サービスによって伝送される信号として実施されうる。本発明は、インターネット・ダウンロード、インターネット・ラジオ、ソリッドステート・オーディオ(SSA)、例えばMP3PRO、CT-aacPlusのような帯域幅拡張の考え、及びほとんどの音声符号化の考えの分野において特定の用途を有する。
時間に渡って線形に増加するIPDの効果を図解する。 IPD変数での(t-,left panel)位相急転直前、及び(t+,right panel)位相急転直後の入力チャネルに関して、出力チャネルL及びRの位相変化を図解する。 IPDが線形に増加している場合のOPD変数を図解する。 本発明を具現化する符号器のハードウェアブロック図を示す。 本発明を具現化する復号器のハードウェアブロック図を示す。 モノラル信号の夫々のサブフレーム及び多重チャネル層の対応するフレームにおいて符号化された過渡位置を示す。

Claims (16)

  1. 少なくとも二つの音声入力チャネルからモノラル信号を発生し、
    該モノラル信号、及び、夫々の入力チャネルに夫々対応する二つの音声出力信号の再生を可能にする一連の変数を有する符号化された信号を発生する、音声信号の符号化方法であって、
    該変数は全体シフトの指示を有し、これは、符号化されたモノラル出力信号と入力信号の一つとの間の遅延の量であることを特徴とする方法。
  2. 伝送に関して、該全体シフト及び通信チャネル間の位相差又は時間差の一次結合が使用されることを特徴とする、請求項1記載の方法。
  3. 前記全体シフトは、全体の時間シフトであることを特徴とする、請求項1記載の方法。
  4. 前記全体シフトは、全体の位相シフトであることを特徴とする、請求項1記載の方法。
  5. 前記全体シフトは、前記完全に符号化されたモノラル出力信号と前記入力信号の一つとの間の最も良く整合している遅延(又は位相)によって決められることを特徴とする、請求項1記載の方法。
  6. 該最も良く整合している遅延は、前記入力信号の対応する時間/周波数タイル間の相互相関での最大に対応することを特徴とする、請求項5記載の方法。
  7. 前記全体シフトは、更に大きな振幅の前記入力信号に関して計算されることを特徴とする、請求項1記載の方法。
  8. 前記位相差は、前記全体シフトよりも少ない量子化誤差で符号化されることを特徴とする、請求項1記載の方法。
  9. 少なくとも二つの音声入力チャネルからモノラル信号を発生する手段と、
    該モノラル信号、及び、夫々の入力チャネルに夫々対応する二つの音声出力信号の再生を可能にする変数を有する、符号化された信号を発生する手段とを有する音声信号を符号化する符号器であって、
    該変数は全体シフトの指示を有し、これは、符号化されたモノラル出力信号と入力信号の一つとの間の遅延の量であることを特徴とする符号器。
  10. 音声信号を受信する入力と、
    符号化された音声信号を得るために、音声信号を符号化する請求項9による符号器と、
    該符号化された音声信号を供給する出力とを有する、音声信号供給装置。
  11. 少なくとも二つの音声入力チャネルから伝送されるモノラル信号と、
    該モノラル信号、及び、夫々の入力チャネルに夫々対応する二つの音声出力の再生を可能にする変数を有する符号化された信号とを有する符号化された音声信号であって、
    該変数は全体シフトの指示を有し、これは、符号化されたモノラル出力信号と入力信号との間の遅延の量であることを特徴とする音声信号。
  12. 伝送に関して、該全体シフト及び通信チャネル間の位相差又は時間差の一次結合が使用されることを特徴とする、請求項11記載の符号化された音声信号。
  13. 符号化されたモノラル信号及び空間変数を有する符号化された音声信号の復号し、入力信号からモノラル信号及び一連の空間変数を得る方法であって、
    該符号化された信号は、符号化されたモノラル出力信号と該入力信号の一つとの間の遅延の量である全体シフトを表わす変数を有し、
    該変数によって指定される間隔によって、時間及び位相での出力音声信号の補正値のステレオ方式の組を更に発生することを特徴とする方法。
  14. 符号化されたモノラル信号及び空間変数を有する符号化された音声信号を復号し、入力信号からモノラル信号及び一連の空間変数を得る手段を有する復号器であって、
    該符号化された信号は、符号化されたモノラル出力信号と前記符号器への該入力信号の一つとの間の遅延の量である全体シフトを表わす変数を有し、
    該変数によって指定された間隔によって、時間及び移送での出力音声信号の補正値のステレオ方式の組を発生する手段を更に有することを特徴とする復号器。
  15. 該全体シフトは、該全体シフト及び通信チャネル間の位相差又は時間差の一次結合から得られ、伝送に対して使用されることを特徴とする請求項14記載の復号器。
  16. 符号化された音声信号を受信する入力と、
    多重チャネルの出力信号を得るために、該符号化された音声信号を復号する請求項14記載の復号器と、
    多重チャネルの出力信号を供給又は再生する出力とを有する、復号化された音声信号を供給する装置。
JP2006502569A 2003-02-11 2004-02-09 音声符号化 Expired - Lifetime JP4431568B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03100278 2003-02-11
PCT/IB2004/050085 WO2004072956A1 (en) 2003-02-11 2004-02-09 Audio coding

Publications (2)

Publication Number Publication Date
JP2006518482A JP2006518482A (ja) 2006-08-10
JP4431568B2 true JP4431568B2 (ja) 2010-03-17

Family

ID=32865026

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006502569A Expired - Lifetime JP4431568B2 (ja) 2003-02-11 2004-02-09 音声符号化

Country Status (9)

Country Link
US (2) US7181019B2 (ja)
EP (1) EP1595247B1 (ja)
JP (1) JP4431568B2 (ja)
KR (1) KR101049751B1 (ja)
CN (1) CN1748247B (ja)
AT (1) ATE339759T1 (ja)
DE (1) DE602004002390T2 (ja)
ES (1) ES2273216T3 (ja)
WO (1) WO2004072956A1 (ja)

Families Citing this family (102)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7644003B2 (en) 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
EP1523863A1 (en) * 2002-07-16 2005-04-20 Koninklijke Philips Electronics N.V. Audio coding
FR2852779B1 (fr) * 2003-03-20 2008-08-01 Procede pour traiter un signal electrique de son
RU2374703C2 (ru) * 2003-10-30 2009-11-27 Конинклейке Филипс Электроникс Н.В. Кодирование или декодирование аудиосигнала
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
EP1735778A1 (en) * 2004-04-05 2006-12-27 Koninklijke Philips Electronics N.V. Stereo coding and decoding methods and apparatuses thereof
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
EP1769491B1 (en) * 2004-07-14 2009-09-30 Koninklijke Philips Electronics N.V. Audio channel conversion
DE102004042819A1 (de) 2004-09-03 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals
JP4892184B2 (ja) 2004-10-14 2012-03-07 パナソニック株式会社 音響信号符号化装置及び音響信号復号装置
US7720230B2 (en) * 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402650D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
EP1817767B1 (en) * 2004-11-30 2015-11-11 Agere Systems Inc. Parametric coding of spatial audio with object-based side information
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
JP5017121B2 (ja) * 2004-11-30 2012-09-05 アギア システムズ インコーポレーテッド 外部的に供給されるダウンミックスとの空間オーディオのパラメトリック・コーディングの同期化
KR100682904B1 (ko) 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
EP1818911B1 (en) * 2004-12-27 2012-02-08 Panasonic Corporation Sound coding device and sound coding method
US7797162B2 (en) * 2004-12-28 2010-09-14 Panasonic Corporation Audio encoding device and audio encoding method
US7903824B2 (en) 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
CN101147191B (zh) * 2005-03-25 2011-07-13 松下电器产业株式会社 语音编码装置和语音编码方法
ATE378675T1 (de) 2005-04-19 2007-11-15 Coding Tech Ab Energieabhängige quantisierung für effiziente kodierung räumlicher audioparameter
US8170883B2 (en) 2005-05-26 2012-05-01 Lg Electronics Inc. Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal
EP1908057B1 (en) 2005-06-30 2012-06-20 LG Electronics Inc. Method and apparatus for decoding an audio signal
CA2613731C (en) 2005-06-30 2012-09-18 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8494667B2 (en) 2005-06-30 2013-07-23 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
CN101213592B (zh) * 2005-07-06 2011-10-19 皇家飞利浦电子股份有限公司 用于参量多声道解码的设备和方法
US7830921B2 (en) 2005-07-11 2010-11-09 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
JP4568363B2 (ja) 2005-08-30 2010-10-27 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
ATE455348T1 (de) 2005-08-30 2010-01-15 Lg Electronics Inc Vorrichtung und verfahren zur dekodierung eines audiosignals
US7788107B2 (en) 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
JP4859925B2 (ja) 2005-08-30 2012-01-25 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
EP1912206B1 (en) * 2005-08-31 2013-01-09 Panasonic Corporation Stereo encoding device, stereo decoding device, and stereo encoding method
WO2007031905A1 (en) * 2005-09-13 2007-03-22 Koninklijke Philips Electronics N.V. Method of and device for generating and processing parameters representing hrtfs
US20080255857A1 (en) 2005-09-14 2008-10-16 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
EP1764780A1 (en) * 2005-09-16 2007-03-21 Deutsche Thomson-Brandt Gmbh Blind watermarking of audio signals by using phase modifications
US7974713B2 (en) 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
US7653533B2 (en) 2005-10-24 2010-01-26 Lg Electronics Inc. Removing time delays in signal paths
DE602007004451D1 (de) 2006-02-21 2010-03-11 Koninkl Philips Electronics Nv Audiokodierung und audiodekodierung
EP2067138B1 (en) * 2006-09-18 2011-02-23 Koninklijke Philips Electronics N.V. Encoding and decoding of audio objects
JPWO2008090970A1 (ja) * 2007-01-26 2010-05-20 パナソニック株式会社 ステレオ符号化装置、ステレオ復号装置、およびこれらの方法
KR101080421B1 (ko) * 2007-03-16 2011-11-04 삼성전자주식회사 정현파 오디오 코딩 방법 및 장치
JPWO2008132826A1 (ja) * 2007-04-20 2010-07-22 パナソニック株式会社 ステレオ音声符号化装置およびステレオ音声符号化方法
KR101425355B1 (ko) * 2007-09-05 2014-08-06 삼성전자주식회사 파라메트릭 오디오 부호화 및 복호화 장치와 그 방법
CN101802907B (zh) 2007-09-19 2013-11-13 爱立信电话股份有限公司 多信道音频的联合增强
GB2453117B (en) * 2007-09-25 2012-05-23 Motorola Mobility Inc Apparatus and method for encoding a multi channel audio signal
EP2139142B1 (en) 2007-09-28 2013-03-27 LG Electronic Inc. Apparatus for transmitting and receiving a signal and method for transmitting and receiving a signal
WO2009051421A2 (en) * 2007-10-18 2009-04-23 Lg Electronics Inc. Method and system for transmitting and receiving signals
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
CN101149925B (zh) * 2007-11-06 2011-02-16 武汉大学 一种用于参数立体声编码的空间参数选取方法
EP2195988B1 (en) * 2007-11-14 2012-01-25 LG Electronics Inc. Method and system for transmitting and receiving signals
WO2009066959A1 (en) 2007-11-21 2009-05-28 Lg Electronics Inc. A method and an apparatus for processing a signal
US9275648B2 (en) * 2007-12-18 2016-03-01 Lg Electronics Inc. Method and apparatus for processing audio signal using spectral data of audio signal
KR101444102B1 (ko) 2008-02-20 2014-09-26 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
US8060042B2 (en) * 2008-05-23 2011-11-15 Lg Electronics Inc. Method and an apparatus for processing an audio signal
US8355921B2 (en) 2008-06-13 2013-01-15 Nokia Corporation Method, apparatus and computer program product for providing improved audio processing
US8644526B2 (en) * 2008-06-27 2014-02-04 Panasonic Corporation Audio signal decoding device and balance adjustment method for audio signal decoding device
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
WO2010017833A1 (en) * 2008-08-11 2010-02-18 Nokia Corporation Multichannel audio coder and decoder
WO2010042024A1 (en) 2008-10-10 2010-04-15 Telefonaktiebolaget Lm Ericsson (Publ) Energy conservative multi-channel audio coding
US8504378B2 (en) * 2009-01-22 2013-08-06 Panasonic Corporation Stereo acoustic signal encoding apparatus, stereo acoustic signal decoding apparatus, and methods for the same
JP5340378B2 (ja) * 2009-02-26 2013-11-13 パナソニック株式会社 チャネル信号生成装置、音響信号符号化装置、音響信号復号装置、音響信号符号化方法及び音響信号復号方法
US8666752B2 (en) 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
CN101521013B (zh) * 2009-04-08 2011-08-17 武汉大学 空间音频参数双向帧间预测编解码装置
CN101533641B (zh) 2009-04-20 2011-07-20 华为技术有限公司 对多声道信号的声道延迟参数进行修正的方法和装置
ES2400661T3 (es) * 2009-06-29 2013-04-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificación y decodificación de extensión de ancho de banda
US8250431B2 (en) * 2009-07-30 2012-08-21 Lsi Corporation Systems and methods for phase dependent data detection in iterative decoding
KR20110022252A (ko) * 2009-08-27 2011-03-07 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
TWI433137B (zh) 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
WO2011029984A1 (en) * 2009-09-11 2011-03-17 Nokia Corporation Method, apparatus and computer program product for audio coding
WO2011039668A1 (en) 2009-09-29 2011-04-07 Koninklijke Philips Electronics N.V. Apparatus for mixing a digital audio
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
CN102157152B (zh) 2010-02-12 2014-04-30 华为技术有限公司 立体声编码的方法、装置
CN102157150B (zh) 2010-02-12 2012-08-08 华为技术有限公司 立体声解码方法及装置
US10158958B2 (en) 2010-03-23 2018-12-18 Dolby Laboratories Licensing Corporation Techniques for localized perceptual audio
CN116471533A (zh) * 2010-03-23 2023-07-21 杜比实验室特许公司 音频再现方法和声音再现系统
BR112013004362B1 (pt) * 2010-08-25 2020-12-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. aparelho para a geração de um sinal descorrelacionado utilizando informação de fase transmitida
CN103262158B (zh) * 2010-09-28 2015-07-29 华为技术有限公司 对解码的多声道音频信号或立体声信号进行后处理的装置和方法
KR101930907B1 (ko) * 2011-05-30 2019-03-12 삼성전자주식회사 오디오 신호 처리 방법, 그에 따른 오디오 장치, 및 그에 따른 전자기기
CN104050969A (zh) 2013-03-14 2014-09-17 杜比实验室特许公司 空间舒适噪声
WO2015038578A2 (en) 2013-09-12 2015-03-19 Dolby Laboratories Licensing Corporation System aspects of an audio codec
KR101841380B1 (ko) * 2014-01-13 2018-03-22 노키아 테크놀로지스 오와이 다중-채널 오디오 신호 분류기
KR101500972B1 (ko) * 2014-03-05 2015-03-12 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
FR3048808A1 (fr) * 2016-03-10 2017-09-15 Orange Codage et decodage optimise d'informations de spatialisation pour le codage et le decodage parametrique d'un signal audio multicanal
CN107358960B (zh) * 2016-05-10 2021-10-26 华为技术有限公司 多声道信号的编码方法和编码器
CN107358961B (zh) * 2016-05-10 2021-09-17 华为技术有限公司 多声道信号的编码方法和编码器
CN107742521B (zh) 2016-08-10 2021-08-13 华为技术有限公司 多声道信号的编码方法和编码器
US10366695B2 (en) * 2017-01-19 2019-07-30 Qualcomm Incorporated Inter-channel phase difference parameter modification
CN108694955B (zh) 2017-04-12 2020-11-17 华为技术有限公司 多声道信号的编解码方法和编解码器
CN108877815B (zh) * 2017-05-16 2021-02-23 华为技术有限公司 一种立体声信号处理方法及装置
EP3483886A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
US10993061B2 (en) * 2019-01-11 2021-04-27 Boomcloud 360, Inc. Soundstage-conserving audio channel summation

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1186396B (it) * 1985-11-26 1987-11-26 Sgs Microelettronica Spa Sistema per la creazione di un effetto pseudostereo nella riproduzione di suone monofonico
DE4209544A1 (de) * 1992-03-24 1993-09-30 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale
JP2004507904A (ja) * 1997-09-05 2004-03-11 レキシコン 5−2−5マトリックス・エンコーダおよびデコーダ・システム
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
US6973184B1 (en) * 2000-07-11 2005-12-06 Cisco Technology, Inc. System and method for stereo conferencing over low-bandwidth links
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications

Also Published As

Publication number Publication date
US20070127729A1 (en) 2007-06-07
WO2004072956A1 (en) 2004-08-26
CN1748247A (zh) 2006-03-15
US20060147048A1 (en) 2006-07-06
CN1748247B (zh) 2011-06-15
EP1595247B1 (en) 2006-09-13
DE602004002390D1 (de) 2006-10-26
US8831759B2 (en) 2014-09-09
KR20050095896A (ko) 2005-10-04
ES2273216T3 (es) 2007-05-01
JP2006518482A (ja) 2006-08-10
KR101049751B1 (ko) 2011-07-19
DE602004002390T2 (de) 2007-09-06
EP1595247A1 (en) 2005-11-16
US7181019B2 (en) 2007-02-20
ATE339759T1 (de) 2006-10-15

Similar Documents

Publication Publication Date Title
JP4431568B2 (ja) 音声符号化
US7542896B2 (en) Audio coding/decoding with spatial parameters and non-uniform segmentation for transients
JP5498525B2 (ja) 空間的オーディオのパラメータ表示
RU2388068C2 (ru) Временное и пространственное генерирование многоканальных аудиосигналов
KR101613975B1 (ko) 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치
KR101102401B1 (ko) 오브젝트 기반 오디오 신호의 부호화 및 복호화 방법과 그 장치
JP5400059B2 (ja) オーディオ信号処理方法及び装置
CN101421779B (zh) 用于产生环境信号的设备和方法
KR20170033328A (ko) 수직 위상 보정을 사용하여 오디오 신호를 처리하기 위한 오디오 프로세서 및 방법
JPWO2006022190A1 (ja) オーディオエンコーダ
CN101971249A (zh) 用于计算音频信号的指纹、用于同步、以及用于表征测试音频信号的装置和方法
MX2014010098A (es) Control de coherencia de fase para señales armonicas en codecs de audio perceptual.
KR100891668B1 (ko) 믹스 신호 처리 방법 및 장치
You et al. Spatial localization evaluation model for parametric stereo audio
KR100891670B1 (ko) 신호 처리 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091215

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091221

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121225

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4431568

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131225

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term