JP5418930B2 - 音声復号化方法および音声復号化器 - Google Patents

音声復号化方法および音声復号化器 Download PDF

Info

Publication number
JP5418930B2
JP5418930B2 JP2012510106A JP2012510106A JP5418930B2 JP 5418930 B2 JP5418930 B2 JP 5418930B2 JP 2012510106 A JP2012510106 A JP 2012510106A JP 2012510106 A JP2012510106 A JP 2012510106A JP 5418930 B2 JP5418930 B2 JP 5418930B2
Authority
JP
Japan
Prior art keywords
frequency domain
domain signal
decoded
channel frequency
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012510106A
Other languages
English (en)
Other versions
JP2012527001A (ja
Inventor
▲キ▼ ▲張▼
立斌 ▲張▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2012527001A publication Critical patent/JP2012527001A/ja
Application granted granted Critical
Publication of JP5418930B2 publication Critical patent/JP5418930B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • H04H20/88Stereophonic broadcast systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • H04H20/95Arrangements characterised by the broadcast information itself characterised by a specific format, e.g. an encoded audio stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H40/00Arrangements specially adapted for receiving broadcast information
    • H04H40/18Arrangements characterised by circuits or components specially adapted for receiving
    • H04H40/27Arrangements characterised by circuits or components specially adapted for receiving specially adapted for broadcast systems covered by groups H04H20/53 - H04H20/95
    • H04H40/36Arrangements characterised by circuits or components specially adapted for receiving specially adapted for broadcast systems covered by groups H04H20/53 - H04H20/95 specially adapted for stereophonic broadcast receiving

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、マルチチャネル音声(audio)符号化および復号化技術の分野に関し、特に音声復号化方法および音声復号化器に関する。
本願は、2009年5月14日に中国特許庁に出願された、発明の名称を“AUDIO DECODING METHOD AND AUDIO DECODER”とする中国特許出願第200910137565.3号の優先権を主張し、その全体を引用してここに組み込む。
現在、電話会議およびゲームのような様々なシナリオでマルチチャネル音声信号が広く使用されている。したがって、マルチチャネル音声信号の符号化および復号化がますます注目されている。Moving Pictures Experts Group II(MPEG-II)、Moving Picture Experts Group Audio Layer III(MP3)、およびAdvanced Audio Coding(AAC)のような波形符号化方式の従来の符号化器は、マルチチャネル信号を符号化する際に各チャネルを独立に符号化する。この方法は、マルチチャネル信号をうまく復元することができるが、必要な帯域幅および符号化速度が、モノラル信号が必要とする帯域幅および符号化速度の数倍大きい。
現在、普及しているステレオ符号化技術またはマルチチャネル符号化技術はパラメトリックステレオ符号化であり、聴覚体験が元の信号の聴覚体験とまったく同じであるマルチチャネル信号を、帯域幅をほとんど使用せずに復元することができる。基本的な方法では、符号化側で、マルチチャネル信号をダウンミックスしてモノラル信号を形成し、モノラル信号を独立に符号化し、チャネル同士の間でチャネルパラメータを同時に抽出し、これらのパラメータを符号化し、復号化側で、まずダウンミックスされたモノラル信号を復号化し、次にチャネル同士の間でチャネルパラメータを復号化し、最後にチャネルパラメータとダウンミックスされたモノラル信号を一緒に使用して各マルチチャネル信号を形成する。PS(Parametric Stereo)のような典型的なパラメトリックステレオ符号化技術が広く使用されている。
パラメトリックステレオ符号化では、通常チャネル同士の相互関係を表すのに使用されるチャネルパラメータは、チャネル間時間差(ITD:Inter-channel Time Difference)、チャネル間レベル差(ILD:Inter-channel Level Difference)、およびチャネル間相互相関(ICC:Inter-Channel Coherence)である。これらのパラメータは、音源の方向および位置のようなステレオ音響画像情報を示すことができる。これらのパラメータおよび符号化側でマルチチャネル信号から取得されたダウンミックスされた信号を符号化して送信することによって、復号化側で、小さな占有帯域幅および低い符号化速度でステレオ信号をうまく復元することができる。
来技術は次の欠点を有する。従来のパラメトリックステレオ符号化および復号化方法を使用することによって、符号化側の処理された信号と復号化側の処理された信号が矛盾する問題が生じ、符号化信号と復号化信号が矛盾すると、復号化によって取得される信号の品質が低下する。
本発明の実施態様は、符号化側の処理された信号と復号化側の処理された信号との矛盾をなくすことを可能にし、かつ復号化されたステレオ信号の品質を向上させる音声復号化方法および音声復号化器を提供する。
本発明の実施態様は、以下の技術的解決手段を含む。
音声復号化方法であって、
復号化されるビットストリームがモノラル符号化レイヤおよび第1のステレオ拡張レイヤのビットストリームであると判定する段階と、
モノラル符号化レイヤのビットストリームを復号化して復号化されたモノラル周波数領域信号を取得する段階と、
エネルギー調整後の復号化されたモノラル周波数領域信号を利用することによって、左チャネル周波数領域信号および右チャネル周波数領域信号を第1のサブバンド領域に復元する段階と、
エネルギー調整が行われていない復号化されたモノラル周波数領域信号を利用することによって、左チャネル周波数領域信号および右チャネル周波数領域信号を第2のサブバンド領域に復元する段階と、
を含む方法。
判定ユニットと、処理ユニットと、第1の復元ユニットと、を含む音声復号化器。
判定ユニットは、復号化されるビットストリームがモノラル符号化レイヤおよび第1のステレオ拡張レイヤのビットストリームであるかどうかを判定するように構成される。復号化されるビットストリームがモノラル符号化レイヤおよび第1のステレオ拡張レイヤのビットストリームである場合、第1の復元ユニットが起動される。
処理ユニットは、モノラル符号化レイヤを復号化して復号化されたモノラル周波数領域信号を取得するように構成される。
第1の復元ユニットは、エネルギー調整後の復号化されたモノラル周波数領域信号を利用することによって、左チャネル周波数領域信号および右チャネル周波数領域信号を第1のサブバンド領域に復元し、かつエネルギー調整が行われていない復号化されたモノラル周波数領域信号を利用することによって、左チャネル周波数領域信号および右チャネル周波数領域信号を第2のサブバンド領域に復元するように構成され、エネルギー調整が行われていない復号化されたモノラル周波数領域信号は、処理ユニットが復号化を行うことによって取得される。
本発明の実施形態によれば、復号化プロセスにおいてモノラル信号が復元されるときに使用されるモノラル信号の種類が、復号化されるビットストリームのステータスに応じて判定される。復号化されるビットストリームがモノラル符号化レイヤおよび第1のステレオ拡張レイヤのビットストリームであると判定された場合、エネルギー調整後の復号化されたモノラル周波数領域信号を使用して、左チャネル周波数領域信号および右チャネル周波数領域信号が第1のサブバンド領域に復元され、エネルギー調整が行われていない復号化されたモノラル周波数領域信号を利用して、左チャネル周波数領域信号および右チャネル周波数領域信号が第2のサブバンド領域に復元される。復号化されるビットストリームは、モノラル符号化レイヤおよび第1のステレオ拡張レイヤのビットストリームだけであり、第2のサブバンド領域内の残差のパラメータを含まない。したがって、エネルギー調整が行われていない復号化されたモノラル周波数領域信号を使用して、左チャネル周波数領域信号および右チャネル周波数領域信号が第2のサブバンド領域に復元される。このように、符号化側の信号と復号化側の信号が矛盾せず、復号化されたステレオ信号の品質が向上する。
パラメトリックステレオ音声符号化方法のフローチャートである。 本発明の一実施形態による音声復号化方法のフローチャートである。 本発明の一実施形態によるもう1つの音声復号化方法のフローチャートである。 本発明の一実施形態による音声復号化器1の概略構成図である。 本発明の一実施形態による音声復号化器2の概略構成図である。
本発明者には、従来の音声復号化方法を使用することによって復元されたステレオ信号の品質が、2つの因子、すなわち、復元されたモノラル信号の品質および抽出されたステレオパラメータの精度に応じて決まることが分かった。復号化側で復元されたモノラル信号の品質は、最終的に出力される復元されたステレオ信号の品質において非常に重要な役割を果たす。したがって、復号化側で復元されるモノラル信号の品質をできるだけ高くする必要があり、それに基づいて、高品質ステレオ信号を復元することができる。
本発明の一実施形態は、符号化側の処理された信号と復号化側の処理された信号との矛盾をなくすことを可能にし、したがって、復号化されたステレオ信号の品質を向上させることのできる音声復号化方法を提供する。本発明の実施形態は対応する音声復号化器も提供する。
当業者が本発明の各実施形態をよりよく理解して実施することができるように、以下に、パラメトリックステレオ符号化において符号化側で実行される動作について詳細に説明する。図1は、パラメトリックステレオ音声符号化方法のフローチャートである。具体的なステップは以下のとおりである。
S11:元の左チャネル信号および右チャネル信号に応じてチャネルパラメータITDを抽出し、ITDパラメータに応じて左チャネル信号および右チャネル信号にチャネル遅延調整を施し、調整された左チャネル信号および右チャネル信号に対してダウンミキシングを実行してモノラル信号(混合信号、すなわち、M信号とも呼ばれる)およびサイド信号(S信号)を取得する。
[0〜7kHz]周波数帯域内のM信号およびS信号の周波数領域信号はそれぞれ、M{m(0), m(1), …, m(N-1)}およびS{s(0), s(1), …, s(N-1)}である。[0〜7kHz]周波数帯域内の左チャネルおよび右チャネルの周波数領域信号は、式(1)に従ってL{l(0), l(1), …, l(N-1)}およびR{r(0), r(1), …, r(N-1)}として取得される。
l(i)=m(i)+s(i)
r(i)=m(i)-s(i) … (1)
S12:左チャネルおよび右チャネルの周波数領域信号を8つのサブバンドに分割し、各サブバンドに応じて左チャネルパラメータILDおよび右チャネルパラメータILD、すなわちW[band][l]、W[band][r]を抽出し、各パラメータを量子化し符号化して量子化されたチャネルパラメータILD、すなわちWq[band][l]、Wq[band][r]を取得する。ここで、band∈(0, 1, 2, 3, 4, 5, 6, 7)であり、lは左チャネルパラメータILDを示し、rは右チャネルパラメータILDを示す。
S13:M信号を符号化し、ローカル復号化を実行してローカルに復号化された周波数領域信号M1{m1(0), m1(1), …, m1(N-1)}を取得する。
S14:S13で取得されたM1周波数領域信号を左チャネルおよび右チャネルと同じ8つのサブバンドに分割し、式(2)に従ってサブバンド5、6、および7のエネルギー補償パラメータecomp[band]を算出し、エネルギー補償パラメータを量子化し符号化して、量子化されたエネルギー補償パラメータecompq[band]を取得する。
式(2)では、
および
はそれぞれ、現在のサブバンド内に存在する元の左チャネルエネルギー、元の右チャネルエネルギー、およびローカルに復号化されたモノラルエネルギーを示し、[startband, endband]は、現在のサブバンド周波数点の開始位置および終了位置を示す。
S15:ローカルに復号化された周波数領域信号M1に周波数スペクトルピーク値分析を施し、周波数スペクトル分析結果MASK{mask(0), mask(1), …, mask(N-1)}を取得する。ここで、mask(i)∈{0, 1}である。位置iにおけるM1の周波数スペクトル信号m1がピーク値である場合、mask(i)=1であり、位置iにおけるM1の周波数スペクトル信号m1がピーク値ではない場合、mask(i)=0である。
S16:最適なエネルギー調整係数multiplierを選択し、式(3)に従って、復号化された周波数領域信号M1にエネルギー調整を実行して、エネルギー調整後の周波数領域信号M2{m2(0), m2(1), …, m2(N-1)}を取得し、エネルギー調整係数multiplierを量子化し符号化する。
S17:エネルギー調整後の周波数領域信号M2、左チャネル周波数領域信号および右チャネル周波数領域信号LおよびR、ならびに左チャネルおよび右チャネルの量子化されたチャネルパラメータILD Wqを利用することによって、式(4)に従って左チャネル残差信号resleft{eleft(0), eleft(1), …, eleft(N-1)および右チャネル残差信号resright{eright(0), eright(1), …, eright(N-1)}を算出する。
eleft(i)=l(i)-Wq[band][l]×m2(i)
eright(i)=r(i)-Wq[band][r]×m2(i), i∈[startband, endband], band=0, 1, 2, 3, …, 7 …(4)
S18:左チャネル残差および右チャネル残差にKarhunen-Loeve(K-L)変換を施し、変換カーネルHを量子化して符号化し、変換後に取得された残差一次成分EU{eu(0), eu(1), …, eu(N-1)}および残差二次成分ED{ed(0), ed(1), …, ed(N-1)}に階層量子化および符号化ならびに多重量子化および符号化を施す。
S19:重要さに応じて、符号化側で抽出された様々な符号化情報に階層ビットストリームカプセル化を施し、符号化ビットストリームを送信する。
M信号に関する符号化情報が最も重要であり、まずモノラル符号化レイヤとしてカプセル化され、チャネルパラメータILDおよびITD、エネルギー調整係数、エネルギー補償パラメータ、K-L変換カーネル、およびサブバンド0〜4における残差一次成分の第1の量子化および符号化の結果が、第1のステレオ拡張レイヤとしてカプセル化され、他の情報も重要さに応じて階層的にカプセル化される。
ビットストリーム送信用のネットワーク環境は常に変化している。ネットワークリソースが不十分である場合、復号化側ではすべての符号化情報を受信できるわけではない。たとえば、モノラル符号化レイヤおよび第1のステレオ拡張レイヤのビットストリームのみが受信され、他のレイヤのビットストリームは受信されない。
従来技術を研究し実施する過程で、本発明者には、モノラル符号化レイヤおよび第1のステレオ拡張レイヤのビットストリームのみが復号化側で受信された場合、すなわち、復号化されるビットストリームにモノラル符号化レイヤおよび第1のステレオ拡張レイヤのビットストリームしか含まれていない場合、従来技術において復号化側で実行されるエネルギー補償が、エネルギー調整後の復号化されたモノラル周波数領域信号に基づく補償であり、一方、S14において符号化側でサブバンド5、6、および7のエネルギー補償パラメータを抽出することが、エネルギー調整が施されていない復号化されたモノラル周波数領域信号に基づく抽出であることが分かった。したがって、符号化側の処理された信号と復号化側の処理された信号が矛盾し、符号化側の信号と復号化側の信号の矛盾によって、復号後の信号出力の品質が低下する。
しかし、本発明の実施形態によれば、復号化プロセスで使用される復号化されたモノラル周波数領域信号の種類は、復号化側で復号化されるビットストリームのステータスに応じて判定される。復号化側でモノラル符号化レイヤおよび第1のステレオ拡張レイヤのビットストリームのみが受信された場合、エネルギー調整が施されていない復号化されたモノラル周波数領域信号を使用してサブバンド5、6、および7のステレオ信号が復元され、一方、エネルギー調整後の復号化されたモノラル周波数領域信号を使用してサブバンド0〜4のステレオ信号が復元される。
図2は、本発明の一実施形態による音声復号化方法のフローチャートであり、この方法は、
S21:復号化されるビットストリームがモノラル符号化レイヤおよび第1のステレオ拡張レイヤのビットストリームであると判定する段階と、
S22:モノラル符号化レイヤのビットストリームを復号化して、復号化されたモノラル周波数領域信号を取得する段階と、
S23:エネルギー調整後の復号化されたモノラル周波数領域信号を利用することによって左チャネル周波数領域信号および右チャネル周波数領域信号を第1のサブバンド領域に復元する段階と、
S24:エネルギー調整が施されていない復号化されたモノラル周波数領域信号を利用することによって左チャネル周波数領域信号および右チャネル周波数領域信号を第2のサブバンド領域に復元する段階とを含む。
本発明の実施形態で提供される音声復号化方法では、復号化プロセスにおいてモノラル信号が復元されるときに使用されるモノラル信号の種類が、受信されたビットストリームのステータスに応じて判定される。受信されたビットストリームがモノラル符号化レイヤおよび第1のステレオ拡張レイヤのビットストリームであると判定された後、エネルギー調整後の復号化されたモノラル周波数領域信号を使用して左チャネル周波数領域信号および右チャネル周波数領域信号が第1のサブバンド領域に復元され、エネルギー調整が施されていない復号化されたモノラル周波数領域信号を使用して左チャネル周波数領域信号および右チャネル周波数領域信号が第2のサブバンド領域に復元される。復号化されるビットストリームには、モノラル周波数領域信号および第1のステレオ拡張レイヤのビットストリームしか含まれず、第2のサブバンド領域内の残差のパラメータは復号化側では受信されず、したがって、エネルギー調整が施されていない復号化されたモノラル周波数領域信号を使用して左チャネル周波数領域信号および右チャネル周波数領域信号が第2のサブバンド領域に復元される。このようにして、符号化側の処理された信号と復号化側の処理された信号は矛盾せず、したがって、復号化されたステレオ信号の品質を向上させることができる。
図3は、本発明の他の実施形態による他の音声復号化方法のフローチャートである。以下に、具体的なステップによって、モノラル符号化レイヤおよび第1のステレオ拡張レイヤのビットストリームのみが復号化側で受信された場合に本発明の実施形態によって復号化側で使用される復号化方法について以下詳しく説明する。
S31:受信されたビットストリームに含まれているのがモノラル符号化レイヤおよび第1のステレオ拡張レイヤのビットストリームのみであるかどうかを判定する。受信されたビットストリームに含まれているのがモノラル符号化レイヤおよび第1のステレオ拡張レイヤのビットストリームのみである場合、ステップS23が実行される。
S32:符号化側で使用される音声/ボイス符号化器に対応する任意の音声/ボイス復号化器を使用して、受信されたモノラル符号化レイヤのビットストリームを復号化し、復号化されたモノラル周波数領域信号M1{m1(0), m1(1), …, m1(N-1)}、すなわちS13で符号化側で取得される信号を取得し、第1のステレオ拡張レイヤのビットストリームから各パラメータに対応する符号語を読み取り、各パラメータを復号化して、チャネルパラメータILDのWq[band][l]、Wq[band][r]、チャネルパラメータITD、エネルギー調整係数multiplier、量子化エネルギー補償パラメータecompq[band]、K-L変換カーネルH、およびサブバンド0〜4における残差一次成分の第1の量子化結果EUq1{euq1(0), euq1(1), …, euq1(end4), 0, 0, …, 0}を取得する。
S33:復号化されたモノラル周波数領域信号M1に周波数スペクトルピーク値分析を施し、すなわち、周波数領域における周波数スペクトル最大値を探索し、周波数スペクトル分析結果MASK{mask(0), mask(1), …, mask(N-1)}を取得する。この場合、mask(i)∈{0,1}である。位置iにおけるM1の周波数スペクトル信号m1(i)がピーク値、すなわち最大値である場合、mask(i)=1であり、位置iにおけるM1の周波数スペクトル信号m1(i)がピーク値ではない場合、mask(i)=0である。
S34:復号化および周波数スペクトル分析結果によって取得されたエネルギー調整係数multiplierに応じて式(5)を利用することによって、復号化されたモノラル周波数領域信号にエネルギー調整を施す。
このようにして、エネルギー調整後の復号化されたモノラル周波数領域信号M2{m2(0), m2(1), …, m2(N-1)}が取得される。
S35:K-L変換カーネルHおよびサブバンド0〜4における残差一次成分の第1の量子化結果EUq1{euq1(0), euq1(1), …, euq1(end4), 0, 0, …, 0}を利用することによって、式(6)に従って逆K-L変換を実行し、サブバンド0〜4における左チャネルおよび右チャネルの第1の量子化残差信号、すなわちresleftq1{eleftq1(0), eleftq1(1), …, eleftq1(end4), 0, 0, …, 0}およびresrightq1{erightq1(0), erightq1(1), …, erightq1(end4), 0, 0, …, 0}を取得する。
S36:エネルギー調整後の復号化されたモノラル周波数領域信号M2を利用することによって式(7)に従って左チャネル周波数領域信号および右チャネル周波数領域信号をサブバンド0〜4に復元し、エネルギー調整が施されていない復号化されたモノラル周波数領域信号M1を利用することによって式(8)に従って左チャネル周波数領域信号および右チャネル周波数領域信号をサブバンド5、6、および7に復元する。
l'(i)=eleftq1(i)+Wq[band][l]×m2(i)
r'(i)=erightq1(i)+Wq[band][r]×m2(i), i∈[startband, endband], band=0, 1, 2, 3, 4 …(7)
l'(i)=eleftq1(i)+Wq[band][l]×m1(i)
r'(i)=erightq1(i)+Wq[band][r]×m1(i), i∈[startband, endband], band=5, 6, 7 …(8)
サブバンド0〜4内の左チャネル残差信号および右チャネル残差信号を含む第1のステレオ拡張レイヤのビットストリームは復号化側で受信され、したがって、サブバンド0〜4のステレオ信号が復元されるときに、エネルギー調整後の復号化されたモノラル周波数領域信号M2を使用して左チャネル周波数領域信号および右チャネル周波数領域信号が復元される。復号化側は、モノラル符号化レイヤおよび第1のステレオ拡張レイヤのビットストリームを除いて他のいかなる拡張レイヤのビットストリームも受信せず、したがって、サブバンド5、6、および7における左チャネル残差信号および右チャネル残差信号を取得することはできない。さらに、S14において符号化側で、サブバンド5、6、および7のエネルギー補償パラメータが式(2)に従って抽出され、エネルギー補償パラメータが、復号化されたモノラル周波数領域信号M1に基づくパラメータであり、したがって、サブバンド5、6、および7のステレオ信号がこのステップで復元されるときに、エネルギー調整が施されていない復号化されたモノラル周波数領域信号M1が復元に使用され、一方、サブバンド0〜4のステレオ信号が復元されるときに、エネルギー調整後の復号化されたモノラル周波数領域信号M2が復元に使用され、したがって、符号化側の信号と復号化側の信号が矛盾しなくなることがS14から分かる。
S37:式(9)に従って、復元された左チャネル周波数領域信号および右チャネル周波数領域信号のサブバンド5、6、および7にエネルギー補償調整を施す。
S38:左チャネル周波数領域信号および右チャネル周波数領域信号を処理して最終的な左チャネル出力信号および右チャネル出力信号を取得する。
上記のパラメトリックステレオ音声符号化プロセスでは、周波数領域信号が8つのサブバンドに分割され、一次成分パラメータのサブバンド0〜4が第1のステレオ拡張レイヤでカプセル化され、残差に関する他のパラメータが他のステレオ拡張レイヤでカプセル化される。ここでは、サブバンド0〜4が第1のサブバンド領域と呼ばれ、サブバンド5〜7が第2のサブバンドと呼ばれることに留意されたい。特定の実装例では、パラメトリックステレオ音声符号化プロセスにおいて周波数領域信号を8つ以外の複数のサブバンドに分割してよいことも理解できよう。周波数領域信号が8つのサブバンドに分割される場合でも、8つのサブバンドを上記とは異なる2つのサブバンド領域に分割してもよい。たとえば、一次成分パラメータのサブバンド0〜3を第1のステレオ拡張レイヤでカプセル化し、残差に関する他のパラメータを他のステレオ拡張レイヤでカプセル化し、したがって、この場合、サブバンド0〜3を第1のサブバンド領域と呼び、サブバンド4〜7を第2のサブバンド領域と呼ぶ。このため、復号化されるビットストリームにモノラル符号化レイヤおよび第1のステレオ拡張レイヤのビットストリームしか含まれない場合、本発明によれば、エネルギー調整後の復号化されたモノラル周波数領域信号を使用して、復号化側で左チャネル周波数領域信号および右チャネル周波数領域信号がサブバンド0〜3(第1のサブバンド領域)に復元され、エネルギー調整が施されていない復号化されたモノラル周波数領域信号を使用して左チャネル周波数領域信号および右チャネル周波数領域信号がサブバンド4〜7(第2のサブバンド領域)に復元される。
実施形態から、復号化プロセスでモノラル信号が復元されるときに使用されるモノラル信号の種類が、受信されたビットストリームのステータスに応じて判定されることが分かる。受信されたビットストリームがモノラル符号化レイヤおよび第1のステレオ拡張レイヤのビットストリームであると判定されると、エネルギー調整後の復号化されたモノラル周波数領域信号を使用して左チャネル周波数領域信号および右チャネル周波数領域信号が第1のサブバンド領域に復元され、エネルギー調整が施されていない復号化されたモノラル周波数領域信号を使用して左チャネル周波数領域信号および右チャネル周波数領域信号が第2のサブバンド領域に復元される。復号化されるビットストリームには、モノラル周波数領域信号および第1のステレオ拡張レイヤのビットストリームしか含まれず、第2のサブバンド領域内の残差のパラメータは復号化側では受信されず、したがって、エネルギー調整が施されていない復号化されたモノラル周波数領域信号を使用して左チャネル周波数領域信号および右チャネル周波数領域信号が第2のサブバンド領域に復元される。このようにして、符号化側の処理された信号と復号化側の処理された信号は矛盾せず、したがって、復号化されたステレオ信号の品質を向上させることができる。
復号化側が、モノラル符号化レイヤおよび第1のステレオ拡張レイヤのビットストリームに加えて、他のステレオ拡張レイヤのビットストリームも受信した(たとえば、モノラル符号化レイヤおよびすべてのステレオ拡張レイヤのすべてのビットストリームが受信された)場合、復号化プロセスは前述のプロセスとは異なる。違いは、すべてのサブバンド領域内の残差信号を復号化によって取得できることである。したがって、エネルギー調整後の復号化されたモノラル周波数領域信号を使用して左チャネル周波数領域信号および右チャネル周波数領域信号(第1および第2のサブバンド領域内のステレオ信号を含む)が復元される。また、すべてのサブバンド領域内の完全な残差信号を取得することができ、したがって、第1または第2のサブバンド内の左チャネル周波数領域信号および右チャネル周波数領域信号にエネルギー補償を施す必要はなくなる。このように、符号化側の処理された信号と復号化側の処理された信号が矛盾しなくなる。
本発明の実施形態による音声復号化方法について上記に詳しく説明した。これに応じて、以下に、前述の音声復号化方法を使用する復号化器について説明する。
図4は、本発明の実施形態による音声復号化器1の概略構造図であり、音声復号化器1は、判定ユニット41と、処理ユニット42と、第1の復元ユニット43とを含む。
判定ユニット41は、復号化されるビットストリームがモノラル符号化レイヤおよび第1のステレオ拡張レイヤのビットストリームであるかどうかを判定するように構成されている。復号化されるビットストリームがモノラル符号化レイヤおよび第1のステレオ拡張レイヤのビットストリームである場合、第1の復元ユニット43が起動される。
処理ユニット42は、モノラル符号化レイヤを復号化して復号化されたモノラル周波数領域信号を取得するように構成されている。
第1の復元ユニット43は、エネルギー調整後の復号化されたモノラル周波数領域信号を利用することによって左チャネル周波数領域信号および右チャネル周波数領域信号を第1のサブバンド領域に復元し、エネルギー調整が施されていない復号化されたモノラル周波数領域信号を利用することによって左チャネル周波数領域信号および右チャネル周波数領域信号を第2のサブバンド領域に復元するように構成されており、この場合、エネルギー調整が施されていない復号化されたモノラル周波数領域信号は、処理ユニット42が復号化を行うことによって取得される。
処理ユニット42は、第1のステレオ拡張レイヤのビットストリームを復号化してエネルギー調整係数を取得し、復号化されたモノラル周波数領域信号に周波数スペクトルピーク値分析を施して周波数スペクトル分析結果を取得し、周波数スペクトル分析結果およびエネルギー調整係数に従って、復号化されたモノラル周波数領域信号にエネルギー調整を施すようにさらに構成されている。
パラメトリックステレオ音声符号化プロセスにおいて、周波数領域信号が8つのサブバンドに分割される場合、一次成分パラメータのサブバンド0〜4が第1のステレオ拡張レイヤでカプセル化され、残差に関する他のパラメータが他のステレオ拡張レイヤでカプセル化され、第1の復元ユニット43は特に、エネルギー調整後の復号化されたモノラル周波数領域信号を使用して左チャネル周波数領域信号および右チャネル周波数領域信号をサブバンド0〜4に復元し、エネルギー調整が施されていない復号化されたモノラル周波数領域信号を使用して左チャネル周波数領域信号および右チャネル周波数領域信号をサブバンド5、6、および7に復元するように構成され、この場合、エネルギー調整が施されていない復号化されたモノラル周波数領域信号は、処理ユニット42が復号化を行うことによって取得される。
処理ユニット42はさらに、第1の復元ユニット43が復元された左チャネル周波数領域信号および右チャネル周波数領域信号を取得した後、復元された左チャネル周波数領域信号および右チャネル周波数領域信号のサブバンド5、6、および7にエネルギー補償調整を施すように構成されている。
この実施形態で導入された音声復号化器は、モノラル符号化レイヤおよび第1のステレオ拡張レイヤのビットストリームのみが受信されたと判定した後、エネルギー調整後の復号化されたモノラル周波数領域信号を使用して左チャネル周波数領域信号および右チャネル周波数領域信号を第1のサブバンド領域に復元し、エネルギー調整が施されていない復号化されたモノラル周波数領域信号を使用して左チャネル周波数領域信号および右チャネル周波数領域信号を第2のサブバンド領域に復元することが分かる。モノラル符号化レイヤおよび第1のステレオ拡張レイヤのビットストリームのみが受信され、そのため、第2のサブバンド領域内の残差信号のパラメータは受信されない。したがって、エネルギー調整が施されていない復号化されたモノラル周波数領域信号を使用して左チャネル周波数領域信号および右チャネル周波数領域信号が第2のサブバンド領域に復元される。このように、符号化側の処理された信号と復号化側の処理された信号が矛盾しなくなり、したがって、復号化されたステレオ信号の品質を向上させることができる。
は、本発明の一実施形態による音声復号化器2の概略構造図である。音声復号化器2は、音声復号化器1とは異なり、第2の復元ユニット51をさらに含んでいる。
第2の復元ユニット51は、判定ユニット41の判定結果が、復号化されるビットストリームに、モノラル符号化レイヤおよび第1のステレオ拡張レイヤのビットストリームに加えて、他のステレオ拡張レイヤのビットストリームも含まれることを示すときに、エネルギー調整後の復号化されたモノラル周波数領域信号を使用して左チャネル周波数領域信号および右チャネル周波数領域信号をすべてのサブバンド領域に復元するように構成されている。
特定の実装例では、第1の復元ユニット43と第2の復元ユニット51を一体化して1つの復元ユニットとして使用できることが理解されよう。
当業者には、前述の実施形態による方法の各ステップのすべてまたは一部を、関連するハードウェアに命令を下すプログラムによって実施できることが理解されよう。このプログラムは、コンピュータ読み取り可能な記憶媒体に記憶することができる。記憶媒体は、読み取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、磁気ディスク、または光学ディスクであってよい。
本発明の実施形態で提供される音声処理方法および音声復号化器について上記に詳しく説明した。本発明の原理および実装例について特定の例によって説明した。前述の実施形態に関する説明は単に、本発明の方法および中心的な概念を理解するのを助けるのに使用されている。一方、当業者は、本発明の概念に応じた特定の実装例および用途範囲に関して本発明に様々な変形および修正を施すことができる。したがって、本明細書は、本発明に対する限定として解釈されるべきではない。
1 音声復号化器
41 判定ユニット
42 処理ユニット
43 第1の復元ユニット
51 第2の復元ユニット

Claims (8)

  1. 復号化されるビットストリームがモノラル符号化レイヤおよび第1のステレオ拡張レイヤのビットストリームであるかどうか判定する段階であって、前記第1のステレオ拡張レイヤのビットストリームが第1のサブバンドのみに関する左および右チャネル残差情報と、エネルギー調整係数と、チャネルパラメータILDと、量子化エネルギー補償パラメータとを含む段階と、
    前記復号化されるビットストリームが前記モノラル符号化レイヤおよび前記第1のステレオ拡張レイヤのビットストリームである場合、前記モノラル符号化レイヤのビットストリームを復号化して復号化されたモノラル周波数領域信号を取得する段階と、
    前記復号化されたモノラル周波数領域信号にエネルギー調整を行う段階であって、
    前記第1のステレオ拡張レイヤのビットストリームを復号化して、前記エネルギー調整係数を取得する段階と、
    前記復号化されたモノラル周波数領域信号に周波数スペクトルのピーク値の分析を行って、周波数スペクトルの分析結果を取得する段階と、
    前記周波数スペクトルの分析結果と前記エネルギー調整係数に従って、前記復号化されたモノラル周波数領域信号にエネルギー調整を行う段階と
    を含む段階と、
    エネルギー調整後の復号化されたモノラル周波数領域信号と、前記第1のステレオ拡張レイヤのビットストリームに含まれる前記第1のサブバンドに関する前記左および右チャネル残差情報と、前記チャネルパラメータILDとを利用することによって、左チャネル周波数領域信号および右チャネル周波数領域信号を第1のサブバンド領域に復元する段階と、
    エネルギー調整が行われていない復号化されたモノラル周波数領域信号と、前記チャネルパラメータILDとを利用することによって、左チャネル周波数領域信号および右チャネル周波数領域信号を第2のサブバンド領域に復元する段階と、
    前記左チャネル周波数領域信号および右チャネル周波数領域信号を第2のサブバンド領域に復元する段階の後で、前記量子化エネルギー補償パラメータに従って、前記復元された左チャネル周波数領域信号および右チャネル周波数領域信号の前記第2のサブバンド領域にエネルギー補償調整を行う段階と
    を有する音声復号化方法。
  2. 前記エネルギー調整後の復号化されたモノラル周波数領域信号を利用することによって、左チャネル周波数領域信号および右チャネル周波数領域信号を第1のサブバンド領域に復元する段階、および、前記エネルギー調整が行われていない復号化されたモノラル周波数領域信号を利用することによって、左チャネル周波数領域信号および右チャネル周波数領域信号を第2のサブバンド領域に復元する段階は、
    前記エネルギー調整後の復号化されたモノラル周波数領域信号を使用して左チャネル周波数領域信号および右チャネル周波数領域信号をサブバンド0から4に復元する段階と、前記エネルギー調整が行われていない復号化されたモノラル周波数領域信号を使用して左チャネル周波数領域信号および右チャネル周波数領域信号をサブバンド5、6、および7に復元する段階と、を有する請求項1に記載の方法。
  3. 前記第1のサブバンド領域がサブバンド0から4であり、前記第2のサブバンド領域がサブバンド5、6、および7である請求項1に記載の方法。
  4. 判定ユニットと、処理ユニットと、第1の復元ユニットとを備える音声復号化器であって、
    前記判定ユニットは、復号化されるビットストリームがモノラル符号化レイヤおよび第1のステレオ拡張レイヤのビットストリームであるかどうかを判定するように構成され、前記第1のステレオ拡張レイヤのビットストリームが第1のサブバンドのみに関する左および右チャネル残差情報と、エネルギー調整係数と、チャネルパラメータILDと、量子化エネルギー補償パラメータとを含み、前記復号化されるビットストリームが前記モノラル符号化レイヤおよび第1のステレオ拡張レイヤのビットストリームである場合、前記第1の復元ユニットが起動され、
    前記処理ユニットは、前記モノラル符号化レイヤのビットストリームを復号化して復号化されたモノラル周波数領域信号を取得し、前記第1のステレオ拡張レイヤのビットストリームを復号化して、前記エネルギー調整係数を取得し、前記復号化されたモノラル周波数領域信号に周波数スペクトルのピーク値の分析を行って、周波数スペクトルの分析結果を取得し、前記周波数スペクトルの分析結果と前記エネルギー調整係数に従って、前記復号化されたモノラル周波数領域信号にエネルギー調整を行うように構成され、
    前記第1の復元ユニットは、エネルギー調整後の復号化されたモノラル周波数領域信号と、前記第1のステレオ拡張レイヤのビットストリームに含まれる前記第1のサブバンドに関する前記左および右チャネル残差情報と、前記チャネルパラメータILDとを利用することによって、左チャネル周波数領域信号および右チャネル周波数領域信号を第1のサブバンド領域に復元し、エネルギー調整が行われていない復号化されたモノラル周波数領域信号と、前記チャネルパラメータILDとを利用することによって、左チャネル周波数領域信号および右チャネル周波数領域信号を第2のサブバンド領域に復元するように構成され、前記エネルギー調整が行われていない復号化されたモノラル周波数領域信号は、前記処理ユニットによる復号化によって取得され
    前記処理ユニットはさらに、前記第1の復元ユニットが前記復元された左チャネル周波数領域信号および右チャネル周波数領域信号を取得した後で、前記量子化エネルギー補償パラメータに従って、前記復元された左チャネル周波数領域信号および右チャネル周波数領域信号の前記第2のサブバンド領域にエネルギー補償調整を行うように構成される音声復号化器。
  5. 前記第1の復元ユニットは、前記エネルギー調整後の復号化されたモノラル周波数領域信号を利用することによって、左チャネル周波数領域信号および右チャネル周波数領域信号をサブバンド0から4に復元し、前記エネルギー調整が行われていない復号化されたモノラル周波数領域信号を利用することによって、左チャネル周波数領域信号および右チャネル周波数領域信号をサブバンド5、6、および7に復元するように構成され、前記エネルギー調整が行われていない復号化されたモノラル周波数領域信号は、前記処理ユニットによる復号化によって取得される請求項に記載の音声復号化器。
  6. 前記処理ユニットはさらに、前記第1の復元ユニットが前記復元された左チャネル周波数領域信号および右チャネル周波数領域信号を取得した後で、前記復元された左チャネル周波数領域信号および右チャネル周波数領域信号のサブバンド5、6、および7にエネルギー補償調整を行うように構成される請求項に記載の音声復号化器。
  7. 第2の復元ユニットをさらに備え、
    前記第2の復元ユニットは、前記復号化されるビットストリームが、前記モノラル符号化レイヤおよび第1のステレオ拡張レイヤのビットストリームに加えて、他のステレオ拡張レイヤのビットストリームを含むことを前記判定ユニットの判定結果が示すとき、前記エネルギー調整後の復号化されたモノラル周波数領域信号を使用して左チャネル周波数領域信号および右チャネル周波数領域信号をすべてのサブバンド領域に復元するように構成され、
    前記他のステレオ拡張レイヤのビットストリームは、前記第1のサブバンド領域以外のサブバンド領域に関する左および右チャネル残差情報を含む請求項に記載の音声復号化器。
  8. コンピュータプロセッサによって実行されるとき、前記コンピュータプロセッサに請求項1からのいずれか一項に記載の方法を実行させるコンピュータプログラムコードを有するコンピュータ読み取り可能な記憶媒体。
JP2012510106A 2009-05-14 2010-05-14 音声復号化方法および音声復号化器 Expired - Fee Related JP5418930B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN2009101375653A CN101556799B (zh) 2009-05-14 2009-05-14 一种音频解码方法和音频解码器
CN200910137565.3 2009-05-14
PCT/CN2010/072781 WO2010130225A1 (zh) 2009-05-14 2010-05-14 一种音频解码方法和音频解码器

Publications (2)

Publication Number Publication Date
JP2012527001A JP2012527001A (ja) 2012-11-01
JP5418930B2 true JP5418930B2 (ja) 2014-02-19

Family

ID=41174887

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012510106A Expired - Fee Related JP5418930B2 (ja) 2009-05-14 2010-05-14 音声復号化方法および音声復号化器

Country Status (6)

Country Link
US (1) US8620673B2 (ja)
EP (1) EP2431971B1 (ja)
JP (1) JP5418930B2 (ja)
KR (1) KR101343898B1 (ja)
CN (1) CN101556799B (ja)
WO (1) WO2010130225A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2395504B1 (en) * 2009-02-13 2013-09-18 Huawei Technologies Co., Ltd. Stereo encoding method and apparatus
JP5949270B2 (ja) * 2012-07-24 2016-07-06 富士通株式会社 オーディオ復号装置、オーディオ復号方法、オーディオ復号用コンピュータプログラム
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
CN103413553B (zh) * 2013-08-20 2016-03-09 腾讯科技(深圳)有限公司 音频编码方法、音频解码方法、编码端、解码端和系统
US9984693B2 (en) * 2014-10-10 2018-05-29 Qualcomm Incorporated Signaling channels for scalable coding of higher order ambisonic audio data
US10140996B2 (en) 2014-10-10 2018-11-27 Qualcomm Incorporated Signaling layers for scalable coding of higher order ambisonic audio data
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
CN106205626B (zh) * 2015-05-06 2019-09-24 南京青衿信息科技有限公司 一种针对被舍弃的子空间分量的补偿编解码装置及方法
CN107358961B (zh) * 2016-05-10 2021-09-17 华为技术有限公司 多声道信号的编码方法和编码器
CN107358960B (zh) * 2016-05-10 2021-10-26 华为技术有限公司 多声道信号的编码方法和编码器
CN109478406B (zh) * 2016-06-30 2023-06-27 杜塞尔多夫华为技术有限公司 一种用于对多声道音频信号进行编解码的装置及方法
KR102387162B1 (ko) 2016-09-28 2022-04-14 후아웨이 테크놀러지 컴퍼니 리미티드 다중 채널 오디오 신호 처리 방법, 장치 및 시스템
US10586546B2 (en) 2018-04-26 2020-03-10 Qualcomm Incorporated Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding
US10573331B2 (en) * 2018-05-01 2020-02-25 Qualcomm Incorporated Cooperative pyramid vector quantizers for scalable audio coding
EP3588495A1 (en) 2018-06-22 2020-01-01 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Multichannel audio coding
CN112270934B (zh) * 2020-09-29 2023-03-28 天津联声软件开发有限公司 一种nvoc低速窄带声码器的语音数据处理方法
CN115691515A (zh) * 2022-07-12 2023-02-03 南京拓灵智能科技有限公司 一种音频编解码方法及装置
CN115116232B (zh) * 2022-08-29 2022-12-09 深圳市微纳感知计算技术有限公司 汽车鸣笛的声纹比较方法、装置、设备及存储介质

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01118199A (ja) 1988-04-28 1989-05-10 Kawai Musical Instr Mfg Co Ltd 電子楽器の電源投入時処理方式
JPH06289900A (ja) 1993-04-01 1994-10-18 Mitsubishi Electric Corp オーディオ符号化装置
KR0174084B1 (ko) * 1995-09-25 1999-04-01 이준 Mpeg-2 다채널 오디오 복호화기의 역변환기
US6138051A (en) * 1996-01-23 2000-10-24 Sarnoff Corporation Method and apparatus for evaluating an audio decoder
JPH1118199A (ja) * 1997-06-26 1999-01-22 Nippon Columbia Co Ltd 音響処理装置
US6175631B1 (en) * 1999-07-09 2001-01-16 Stephen A. Davis Method and apparatus for decorrelating audio signals
FR2824432B1 (fr) * 2001-05-07 2005-04-08 France Telecom Procede d'extraction de parametres d'un signal audio, et codeur mettant en oeuvre un tel procede
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
ES2268340T3 (es) 2002-04-22 2007-03-16 Koninklijke Philips Electronics N.V. Representacion de audio parametrico de multiples canales.
TWI288915B (en) 2002-06-17 2007-10-21 Dolby Lab Licensing Corp Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
RU2374703C2 (ru) * 2003-10-30 2009-11-27 Конинклейке Филипс Электроникс Н.В. Кодирование или декодирование аудиосигнала
JPWO2005081229A1 (ja) * 2004-02-25 2007-10-25 松下電器産業株式会社 オーディオエンコーダ及びオーディオデコーダ
ATE527654T1 (de) * 2004-03-01 2011-10-15 Dolby Lab Licensing Corp Mehrkanal-audiodecodierung
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
WO2007078254A2 (en) * 2006-01-05 2007-07-12 Telefonaktiebolaget Lm Ericsson (Publ) Personalized decoding of multi-channel surround sound
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
EP2048658B1 (en) * 2006-08-04 2013-10-09 Panasonic Corporation Stereo audio encoding device, stereo audio decoding device, and method thereof
JP2008164823A (ja) * 2006-12-27 2008-07-17 Toshiba Corp オーディオデータ処理装置
JP5363488B2 (ja) * 2007-09-19 2013-12-11 テレフオンアクチーボラゲット エル エム エリクソン(パブル) マルチチャネル・オーディオのジョイント強化
US8352249B2 (en) * 2007-11-01 2013-01-08 Panasonic Corporation Encoding device, decoding device, and method thereof
EP2215629A1 (en) * 2007-11-27 2010-08-11 Nokia Corporation Multichannel audio coding
CN101727906B (zh) 2008-10-29 2012-02-01 华为技术有限公司 高频带信号的编解码方法及装置

Also Published As

Publication number Publication date
US20120095769A1 (en) 2012-04-19
US8620673B2 (en) 2013-12-31
KR20120016115A (ko) 2012-02-22
CN101556799A (zh) 2009-10-14
JP2012527001A (ja) 2012-11-01
EP2431971A4 (en) 2012-03-21
EP2431971A1 (en) 2012-03-21
EP2431971B1 (en) 2019-01-09
KR101343898B1 (ko) 2013-12-20
WO2010130225A1 (zh) 2010-11-18
CN101556799B (zh) 2013-08-28

Similar Documents

Publication Publication Date Title
JP5418930B2 (ja) 音声復号化方法および音声復号化器
JP5292498B2 (ja) 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形
CA2705968C (en) A method and an apparatus for processing a signal
US7573912B2 (en) Near-transparent or transparent multi-channel encoder/decoder scheme
RU2439718C1 (ru) Способ и устройство для обработки звукового сигнала
JP6457625B2 (ja) 独立したノイズ充填を用いた強化された信号を生成するための装置および方法
CN109074812B (zh) 用于具有全局ild和改进的中/侧决策的mdct m/s立体声的装置和方法
TW201514972A (zh) 使用聯合編碼殘餘信號之音訊編碼器、音訊解碼器、方法及電腦程式
WO2024051955A1 (en) Decoder and decoding method for discontinuous transmission of parametrically coded independent streams with metadata

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130405

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130416

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130708

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130730

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130920

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131022

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131107

R150 Certificate of patent or registration of utility model

Ref document number: 5418930

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees