JP6874151B2 - マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ - Google Patents

マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ Download PDF

Info

Publication number
JP6874151B2
JP6874151B2 JP2019555975A JP2019555975A JP6874151B2 JP 6874151 B2 JP6874151 B2 JP 6874151B2 JP 2019555975 A JP2019555975 A JP 2019555975A JP 2019555975 A JP2019555975 A JP 2019555975A JP 6874151 B2 JP6874151 B2 JP 6874151B2
Authority
JP
Japan
Prior art keywords
channel signal
energy
signal
reverberation gain
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019555975A
Other languages
English (en)
Other versions
JP2020516955A (ja
Inventor
▲澤▼新 ▲劉▼
▲澤▼新 ▲劉▼
磊 苗
磊 苗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2020516955A publication Critical patent/JP2020516955A/ja
Priority to JP2021072013A priority Critical patent/JP7106711B2/ja
Application granted granted Critical
Publication of JP6874151B2 publication Critical patent/JP6874151B2/ja
Priority to JP2022111786A priority patent/JP7379602B2/ja
Priority to JP2023186595A priority patent/JP2024012444A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/08Arrangements for producing a reverberation or echo sound
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3059Digital compression and data reduction techniques where the original information is represented by a subset or similar information, e.g. lossy compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/60General implementation details not specific to a particular type of compression
    • H03M7/6047Power optimization with respect to the encoder, decoder, storage or transmission

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)
  • Apparatus For Radiation Diagnosis (AREA)

Description

本出願は、その全体が参照により本明細書に組み込まれる、2017年4月12日に中国特許庁に出願され、「MULTI−CHANNEL SIGNAL ENCODING METHOD,MULTI−CHANNEL SIGNAL DECODING METHOD,ENCODER,AND DECODER」と題する、中国特許出願第201710236773.3号の優先権を主張する。
本出願は、音声符号化分野に関し、より詳細には、マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダに関する。
生活の質が向上するにつれて、人々は高品質の音声に対する要求を高めている。モノラル音声と比較して、ステレオ音声は音源ごとに方向感覚および分布感覚を実現し、改善された明瞭度、了解度、および現場の音声感覚を実現する。したがって、ステレオ音声は非常に人気がある。
ステレオ処理技術は、主に、ミッド/サイド(Mid/Sid、MS)符号化、インテンシティステレオ(Intensity Stereo、IS)符号化、およびパラメトリックステレオ(Parametric Stereo、PS)符号化を含む。
従来技術では、マルチチャネル信号を符号化するためにPS符号化が使用されるとき、エンコーダ側は、チャネル信号の各サブバンドに対応する残響ゲインパラメータを計算し、チャネル信号の各サブバンドに対応する残響ゲインパラメータを符号化する必要があり、その結果、デコーダ側は、チャネル信号の各サブバンドに対応する残響ゲインパラメータに基づいて、チャネル信号の各サブバンドに対して残響処理を実行することができる。しかしながら、チャネル信号の各サブバンドに対応する残響ゲインパラメータを符号化するために、比較的大量のビットが占有される必要があり、場合によっては、チャネル信号の各サブバンドに対して残響処理を実行すると、聴覚効果が低下する。
本出願は、符号化効率を改善するために、マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダを提供する。
第1の態様によれば、マルチチャネル信号符号化方法が提供され、方法は、マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号、ならびに第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータを決定するステップと、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定するステップと、パラメータ指示情報を生成するステップであって、パラメータ指示情報が、ターゲット残響ゲインパラメータに対応するサブバンドを示すために使用される、ステップと、ビットストリームを生成するために、ターゲット残響ゲインパラメータ、パラメータ指示情報、およびダウンミックス信号を符号化するステップとを含む。
本出願では、第1のチャネル信号および第2のチャネル信号が符号化されているとき、第1のチャネル信号および第2のチャネル信号のいくつかのサブバンドのみに対応する残響ゲインパラメータが符号化されてよい。第1のチャネル信号および第2のチャネル信号のすべてのサブバンドに対応する残響ゲインパラメータが符号化される必要がある従来技術の方式と比較して、ビットオーバーヘッドをある程度低減することができ、符号化効率を改善することができる。具体的には、いくつかのサブバンドに対応する残響ゲインパラメータが符号化される場合、別のパラメータを符号化するか、またはダウンミックス信号により多くのビットを割り当てるために、大量の節約されたビットを使用することができ、それにより、全体的な符号化性能が改善される。
第1の態様を参照して、第1の態様のいくつかの実装形態では、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定するステップは、第1のチャネル信号のエネルギーおよび第2のチャネル信号のエネルギー、第1のチャネル信号と第2のチャネル信号との間のチャネル間コヒーレンスIC、ダウンミックス信号のエネルギー、ならびに第1のチャネル信号と第2のチャネル信号との間のチャネル間レベル差ILDのうちの少なくとも1つに基づいて、ターゲット残響ゲインパラメータを決定するステップを含む。
第1のチャネル信号と第2のチャネル信号との間のコヒーレンスは、チャネル信号のエネルギーまたはダウンミックス信号のエネルギー、IC、ILDなどに基づいて決定することができ、符号化される必要があるターゲット残響ゲインパラメータは、第1のチャネル信号と第2のチャネル信号との間のコヒーレンスに基づいて、第1のチャネル信号および第2のチャネル信号のすべてのサブバンドに対応する残響ゲインパラメータから適切に決定することができる。したがって、チャネル信号の品質を考慮してビットをある程度節約することができ、符号化効率を改善することができる。具体的には、第1のチャネル信号と第2のチャネル信号との間のコヒーレンスが比較的低いとき、第1のチャネル信号および第2のチャネル信号の低周波部分のサブバンドに対応する残響ゲインパラメータのみが符号化されてよい。第1のチャネル信号と第2のチャネル信号との間のコヒーレンスが比較的高いとき、第1のチャネル信号および第2のチャネル信号の低周波部分のサブバンドに対応する残響ゲインパラメータに加えて、第1のチャネル信号および第2のチャネル信号の高周波部分のサブバンドに対応する残響ゲインパラメータも符号化されてよい。
第1の態様を参照して、第1の態様のいくつかの実装形態では、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定するステップは、第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間のコヒーレンス、および第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間のコヒーレンスのうちの少なくとも1つに基づいて、ターゲット残響ゲインパラメータを決定するステップを含む。
第1のチャネル信号のエネルギー、第2のチャネル信号のエネルギー、およびダウンミックス信号のエネルギーの値は、正規化処理の後に取得される値であってよい。
第1のチャネル信号と第2のチャネル信号の両方とダウンミックス信号との間のコヒーレンスは、チャネル信号のエネルギーを使用して都合よく測定することができる、すなわち、符号化される必要があるターゲット残響ゲインパラメータは、チャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の差を比較することによって都合よく決定することができる。具体的には、チャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の差が比較的大きいとき、チャネル信号とダウンミックス信号との間のコヒーレンスは比較的低いと考えられてよく、この場合、チャネル信号の低周波部分のサブバンドに対応する残響ゲインパラメータのみが符号化されてよい。
第1の態様を参照して、第1の態様のいくつかの実装形態では、第1のチャネル信号および第2のチャネル信号の各々は複数の周波数ビンを含み、第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間のコヒーレンス、および第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間のコヒーレンスのうちの少なくとも1つに基づいて、ターゲット残響ゲインパラメータを決定するステップは、第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の第1の差分値を決定するステップであって、第1の差分値が、複数の周波数ビンにおける第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、ステップと、第1の差分値が第1のしきい値よりも大きいとき、第1の周波数帯域のサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータであると決定するステップであって、第1の周波数帯域が、第1のチャネル信号および第2のチャネル信号の各々のすべての周波数帯域の一部である、ステップとを含む。
第1の態様を参照して、第1の態様のいくつかの実装形態では、第1のチャネル信号および第2のチャネル信号の各々は複数の周波数ビンを含み、第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間のコヒーレンス、および第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間のコヒーレンスのうちの少なくとも1つに基づいて、ターゲット残響ゲインパラメータを決定するステップは、第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の第2の差分値を決定するステップであって、第2の差分値が、複数の周波数ビンにおける第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、ステップと、第2の差分値が第2のしきい値よりも大きいとき、第1の周波数帯域のサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータであると決定するステップであって、第1の周波数帯域が、第1のチャネル信号および第2のチャネル信号の各々のすべての周波数帯域の一部である、ステップとを含む。
第1の態様を参照して、第1の態様のいくつかの実装形態では、第1のチャネル信号および第2のチャネル信号の各々は複数の周波数ビンを含み、第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間のコヒーレンス、および第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間のコヒーレンスのうちの少なくとも1つに基づいて、ターゲット残響ゲインパラメータを決定するステップは、第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の第1の差分値を決定するステップであって、第1の差分値が、複数の周波数ビンにおける第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、ステップと、第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の第2の差分値を決定するステップであって、第2の差分値が、複数の周波数ビンにおける第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、ステップと、第1の差分値が第1のしきい値よりも大きく、第2の差分値が第2のしきい値よりも大きいとき、第1の周波数帯域のサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータであると決定するステップであって、第1の周波数帯域が、第1のチャネル信号および第2のチャネル信号の各々のすべての周波数帯域の一部である、ステップとを含む。
複数の周波数ビンにおける第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の差分値、および複数の周波数ビンにおける第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の差分値は、正規化処理の後に取得される値であってよい。
第1のチャネル信号または第2のチャネル信号とダウンミックス信号との間のコヒーレンスが比較的高いとき、第1のチャネル信号および第2のチャネル信号は、互いに比較的類似する2つのチャネル信号であると考えられてよい(2つのチャネル信号が比較的類似するとき、2つのチャネル信号を混合することによって取得される混合信号は、混合前の2つのチャネル信号に比較的類似する)。第1のチャネル信号または第2のチャネル信号とダウンミックス信号との間のコヒーレンスが比較的低いとき、第1のチャネル信号および第2のチャネル信号は、互いに比較的異なる2つのチャネル信号であると考えられてよい。
第1のチャネル信号とダウンミックス信号との間のコヒーレンスが一例として使用される。第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の第1の差分値を使用することにより、第1のチャネル信号とダウンミックス信号との間のコヒーレンスが測定されてよい。第1の差分値が比較的大きいとき、第1のチャネル信号とダウンミックス信号との間のコヒーレンスは比較的低いと考えられてよい。第1の差分値が比較的小さいとき、第1のチャネル信号とダウンミックス信号との間のコヒーレンスは比較的高いと考えられてよい。
第1のチャネル信号のエネルギーと第2のチャネル信号のエネルギーの両方とダウンミックス信号のエネルギーとの間の差は、ターゲット残響ゲインパラメータをさらに決定するために、複数の周波数ビンにおける第1のチャネル信号のエネルギーと第2のチャネル信号のエネルギーの両方とダウンミックス信号のエネルギーとの間の差分値を比較することにより、都合よく決定することができる。したがって、すべての周波数帯域内で第1のチャネル信号のエネルギーと第2のチャネル信号のエネルギーを比較する必要はない。
第1のチャネル信号のエネルギーおよび/または第2のチャネル信号のエネルギーがダウンミックス信号のエネルギーと比較的異なるとき、第1のチャネル信号および第2のチャネル信号のいくつかの周波数帯域のサブバンドに対応する残響ゲインパラメータを符号化すると、ビットをある程度節約するだけでなく、符号化性能を改善することもできる。しかしながら、従来技術では、第1のチャネル信号および第2のチャネル信号のすべての周波数帯域のサブバンドに対応する残響ゲインパラメータが符号化される。この場合、第1のチャネル信号と第2のチャネル信号との間の差が比較的大きいので、すべての周波数帯域のサブバンドに対応する残響ゲインパラメータがまだ符号化されている場合、残響処理は、すべての周波数帯域の残響ゲインパラメータに基づいて実行され、最終的に復元された第1のチャネル信号および第2のチャネル信号は、元の信号と比較して比較的大きい歪みを有する。
第1の態様を参照して、第1の態様のいくつかの実装形態では、第1の周波数帯域の周波数は、第1のチャネル信号および第2のチャネル信号における第1の周波数帯域とは異なる別の周波数帯域の周波数よりも小さい。
第1の周波数帯域は低周波帯域であってもよいことを理解されたい。
第1のチャネル信号と第2のチャネル信号との間の差が比較的大きいとき、2つのチャネル信号間の差は、通常、高周波部分では比較的大きいが、2つのチャネル信号間の差は低周波部分では比較的小さい。しかしながら、低周波部分におけるチャネル信号は、人間の聴覚体験により大きい影響を及ぼす。したがって、第1のチャネル信号と第2のチャネル信号との間の差が比較的大きいとき、低周波部分のサブバンドに対応する残響ゲインパラメータのみが符号化されてよい。このようにして、符号化されるビットを節約することができるだけでなく、聴覚体験も保証することができる。
第1の態様を参照して、第1の態様のいくつかの実装形態では、方法は、
第1の差分値が第1のしきい値以下であり、第2の差分値が第2のしきい値以下であるとき、第1のチャネル信号および第2のチャネル信号のすべてのサブバンドに対応する残響ゲインパラメータをターゲット残響ゲインパラメータとして決定するステップ
をさらに含む。
第1の態様を参照して、第1の態様のいくつかの実装形態では、第1の差分値が第1のしきい値以下であるか、または第2の差分値が第2のしきい値以下であるとき、第1のチャネル信号および第2のチャネル信号のすべてのサブバンドに対応する残響ゲインパラメータが、ターゲット残響ゲインパラメータとして決定される。
第1のチャネル信号のエネルギーと第2のチャネル信号のエネルギーの両方とダウンミックス信号のエネルギーとの間の差が比較的大きいとき、符号化中のビットオーバーヘッドを削減し、残響処理中に生じる信号の歪みを可能な限り回避するために、いくつかのサブバンドに対応する残響ゲインパラメータのみが符号化されてよい。
しかしながら、第1のチャネル信号のエネルギーと第2のチャネル信号のエネルギーの両方とダウンミックス信号のエネルギーとの間の差が比較的小さいとき、チャネル信号に対する残響処理によって生じる信号の歪みは非常に小さい。より良い聴覚効果を得るために、すべてのサブバンドに対応する残響ゲインパラメータが符号化されてよい。
第1の態様を参照して、第1の態様のいくつかの実装形態では、複数の周波数ビンは、第1のチャネル信号および第2のチャネル信号の各々の第2の周波数帯域内にあり、第2の周波数帯域の周波数は、第1のチャネル信号および第2のチャネル信号における第2の周波数帯域とは異なる別の周波数帯域の周波数よりも大きい。
第1のチャネル信号のエネルギーと第2のチャネル信号のエネルギーの両方とダウンミックス信号のエネルギーとの間の差は、高周波部分の複数の周波数ビンにおける第1のチャネル信号のエネルギーと第2のチャネル信号のエネルギーの両方とダウンミックス信号のエネルギーとの間の差分値を比較することにより、都合よく決定することができる。
第1の態様を参照して、第1の態様のいくつかの実装形態では、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定するステップは、ダウンミックス信号のN個のサブバンドのエネルギーを決定するステップと、N個のサブバンドからM個のサブバンドを決定するステップであって、M個のサブバンドの中の任意のサブバンドのエネルギーが、M個のサブバンドを除くN個のサブバンド内のN−M個のサブバンドの中の任意のサブバンドのエネルギーよりも大きく、MとNの両方が0より大きい整数であり、MがNより小さい、ステップと、M個のサブバンドのエネルギーとN−M個のサブバンドのエネルギーとの間の大小関係に基づいて、ターゲット残響ゲインパラメータを決定するステップとを含む。
ダウンミックス信号が広帯域信号であるとき、N個のサブバンドはダウンミックス信号のすべてのサブバンドであってよく、ダウンミックス信号が超広帯域信号であるとき、N個のサブバンドは広帯域部分にあるダウンミックス信号のサブバンドであってよいことを理解されたい。
第1のチャネル信号と第2のチャネル信号との間のコヒーレンスは、ダウンミックス信号の異なるサブバンドのエネルギーに基づいて決定することができ、さらに、符号化される必要があるターゲット残響ゲインパラメータは、第1のチャネル信号と第2のチャネル信号との間のコヒーレンスに基づいて決定される。
ダウンミックス信号は、広帯域信号または超広帯域信号であってよい。ダウンミックス信号が広帯域信号であるとき、N個のサブバンドはダウンミックス信号のすべてのサブバンドであってよく、ダウンミックス信号が超広帯域信号であるとき、N個のサブバンドは広帯域部分にあるダウンミックス信号のサブバンドであってよい。
加えて、代替として、M個のサブバンドはダウンミックス信号の各サブバンドの振幅に基づいて決定されてよい、すなわち、ダウンミックス信号のM個のサブバンドの中の任意のサブバンドの振幅は、ダウンミックス信号のN−M個のサブバンドの中の任意のサブバンドの振幅よりも大きい。Mの値は事前設定されてよい。
第1の態様を参照して、第1の態様のいくつかの実装形態では、ダウンミックス信号のM個のサブバンドのエネルギーとダウンミックス信号のN−M個のサブバンドのエネルギーとの間の大小関係に基づいて、ターゲット残響ゲインパラメータを決定するステップは、M個のサブバンドのエネルギーの平均値がN−M個のサブバンドのエネルギーの平均値のK倍よりも大きいとき、第1のチャネル信号および第2のチャネル信号の第1の周波数帯域のサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータであると決定するステップであって、Kが0より大きい実数である、ステップを含む。
第1の態様を参照して、第1の態様のいくつかの実装形態では、ダウンミックス信号のM個のサブバンドのエネルギーとダウンミックス信号のN−M個のサブバンドのエネルギーとの間の大小関係に基づいて、ターゲット残響ゲインパラメータを決定するステップは、M個のサブバンドのエネルギーの合計がN−M個のサブバンドのエネルギーの合計のL倍よりも大きいとき、第1のチャネル信号および第2のチャネル信号の第1の周波数帯域のサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータであると決定するステップであって、Lが0より大きい実数である、ステップを含む。
KとLは異なる値をもっていてもよいことを理解されたい。
ダウンミックス信号のM個のサブバンドのエネルギーとダウンミックス信号のN−M個のサブバンドのエネルギーは、M個のサブバンドのエネルギーの平均値をN−M個のサブバンドのエネルギーの平均値と比較することによって比較されてよい。計算の複雑さをさらに低減するために、M個のサブバンドのエネルギーの合計とN−M個のサブバンドのエネルギーの合計が直接比較されてもよい。このようにして、計算プロセスがある程度簡略化され、効率が改善される。
比較的大きいエネルギーを有するM個のサブバンドのエネルギーと比較的小さいエネルギーを有する別のサブバンドのエネルギーとの間の差が比較的大きいとき、第1のチャネル信号と第2のチャネル信号との間の差は比較的大きいと考えられてよい。この場合、第1のチャネル信号および第2のチャネル信号におけるいくつかの周波数帯域のサブバンドに対応する残響ゲインパラメータは、符号化される必要があるターゲット残響ゲインパラメータとして決定されてよい。具体的には、第1の周波数帯域は、第1のチャネル信号および第2のチャネル信号の低周波部分に位置する周波数帯域であってよい。
第1の態様を参照して、第1の態様のいくつかの実装形態では、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定するステップは、ダウンミックス信号のN個のサブバンドのエネルギーを決定するステップと、N個のサブバンドからM個のサブバンドを決定するステップであって、M個のサブバンドの中の任意のサブバンドのエネルギーが、M個のサブバンドを除くN個のサブバンド内のN−M個のサブバンドの中の任意のサブバンドのエネルギーよりも大きい、ステップと、M個のサブバンドの中の第1のサブバンドのインデックス値がプリセットインデックス値よりも小さいとき、第1の周波数帯域のサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータであると決定するステップであって、第1のサブバンド内の任意の周波数ビンの周波数が、第1のサブバンドを除くM個のサブバンドの中の別のサブバンド内の任意の周波数ビンの周波数よりも大きく、第1の周波数帯域が第1のチャネル信号および第2のチャネル信号の各々のすべての周波数帯域の一部である、ステップとを含む。
比較的大きいエネルギーを有するM個のサブバンド内の最大周波数のサブバンドのインデックス値がプリセットインデックス値よりも小さいとき、ダウンミックス信号のM個のサブバンドのエネルギー分布は不均一である、すなわち、第1のチャネル信号と第2のチャネル信号との間のコヒーレンスは比較的小さいと考えられてよい。この場合、いくつかの周波数帯域のサブバンドに対応する残響ゲインパラメータのみが符号化される必要がある。
第1の態様を参照して、第1の態様のいくつかの実装形態では、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定するステップは、ダウンミックス信号のN個のサブバンドのエネルギーを決定するステップと、N個のサブバンドのエネルギーに基づいてN個のサブバンドからJ個のターゲットサブバンドを決定するステップであって、J個のターゲットサブバンドの中の任意のサブバンドのエネルギーが、J個のターゲットサブバンドとは異なる別のサブバンドのエネルギーよりも大きく、NとJの両方が0より大きい整数であり、JがNより小さい、ステップと、J個のターゲットサブバンドに対応する残響ゲインパラメータをターゲット残響ゲインパラメータとして決定するステップとを含む。
ダウンミックス信号の各サブバンドのエネルギーに基づいて、すべてのサブバンドから所定の数のサブバンドが直接選択され、所定の数のサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータとして決定され、その結果、符号化される必要がある残響ゲインパラメータをより柔軟に選択することができる。
第1の態様を参照して、第1の態様のいくつかの実装形態では、ダウンミックス信号のエネルギーは、第1のチャネル信号のエネルギーおよび第2のチャネル信号のエネルギーに基づいて決定される。
ダウンミックス信号のエネルギーは、第1のチャネル信号のエネルギーおよび第2のチャネル信号のエネルギーに基づいて推定または推論され、計算量をある程度削減することができる。
第2の態様によれば、マルチチャネル信号復号方法が提供され、方法は、ビットストリームを受信するステップと、ビットストリームに基づいて、マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号、ならびにパラメータ指示情報を取得するステップであって、パラメータ指示情報が、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内の符号化されたターゲット残響ゲインパラメータを示すために使用される、ステップと、パラメータ指示情報に従って、ビットストリームからターゲット残響ゲインパラメータを取得するステップと、ダウンミックス信号およびターゲット残響ゲインパラメータに基づいて、第1のチャネル信号および第2のチャネル信号を決定するステップとを含む。
本出願では、エンコーダによって符号化されたターゲット残響ゲインパラメータは、パラメータ指示情報を使用して決定することができ、次いで、ターゲット残響ゲインパラメータに基づいて、第1のチャネル信号および第2のチャネル信号の対応するサブバンドに対して残響処理が実行される。
第3の態様によれば、マルチチャネル信号符号化方法が提供され、方法は、マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号、ならびに第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータを決定するステップと、ダウンミックス信号のN個のサブバンドのエネルギーに基づいて、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定するステップであって、Nが0より大きい整数である、ステップと、ダウンミックス信号およびターゲット残響ゲインパラメータを符号化するステップとを含む。
本出願では、ダウンミックス信号の各サブバンドのエネルギーに基づいて、すべてのサブバンドから特定の数のサブバンドが直接選択され、その結果、符号化される必要がある残響ゲインパラメータをより柔軟に選択することができる。加えて、固定周波数帯域のサブバンドに対応する残響ゲインパラメータをターゲット残響ゲインパラメータとして決定する方式と比較して、周波数領域内で隣接していない可能性があるいくつかのサブバンドに対応する残響ゲインパラメータをターゲット残響ゲインパラメータとして直接選択することができる。
第3の態様を参照して、第3の態様のいくつかの実装形態では、ダウンミックス信号のN個のサブバンドのエネルギーに基づいて、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定するステップは、N個のサブバンドのエネルギーに基づいてN個のサブバンドからJ個のターゲットサブバンドを決定するステップであって、J個のターゲットサブバンドの中の任意のサブバンドのエネルギーが、J個のターゲットサブバンドとは異なる別のサブバンドのエネルギーよりも大きく、NとJの両方が0より大きい整数であり、JがNより小さい、ステップと、J個のターゲットサブバンドに対応する残響ゲインパラメータをターゲット残響ゲインパラメータとして決定するステップとを含む。
本出願では、ダウンミックス信号の各サブバンドのエネルギーに基づいて、すべてのサブバンドから所定の数のサブバンドが直接選択され、所定の数のサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータとして決定され、その結果、符号化される必要がある残響ゲインパラメータをより柔軟に選択することができる。
第4の態様によれば、マルチチャネル信号復号方法が提供され、方法は、ビットストリームを受信するステップと、ビットストリームに基づいて、マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号を決定するステップと、ダウンミックス信号のN個のサブバンドのエネルギーに基づいて、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内の符号化されたターゲット残響ゲインパラメータを決定するステップであって、Nが0より大きい整数である、ステップと、ビットストリームに基づいてターゲット残響ゲインパラメータを決定するステップと、ダウンミックス信号およびターゲット残響ゲインパラメータに基づいて、第1のチャネル信号および第2のチャネル信号を決定するステップとを含む。
本出願では、デコーダ側は、ダウンミックス信号の複数のサブバンドのエネルギーに基づいて、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内の符号化されたターゲット残響ゲインパラメータを直接決定することができ、その結果、符号化されたターゲット残響ゲインパラメータを示す指示情報を送信するためにデコーダ側によって占有されるビットが削減され、シグナリングオーバーヘッドをある程度削減することができる。
第4の態様を参照して、第4の態様のいくつかの実装形態では、ダウンミックス信号のN個のサブバンドのエネルギーに基づいて、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内の符号化されたターゲット残響ゲインパラメータを決定するステップは、N個のサブバンドのエネルギーに基づいてN個のサブバンドからJ個のターゲットサブバンドを決定するステップであって、J個のターゲットサブバンドの中の任意のサブバンドのエネルギーが、J個のターゲットサブバンドとは異なる別のサブバンドのエネルギーよりも大きく、NとJの両方が0より大きい整数であり、JがNより小さい、ステップと、J個のターゲットサブバンドに対応する残響ゲインパラメータをターゲット残響ゲインパラメータとして決定するステップとを含む。
第5の態様によれば、エンコーダが提供され、エンコーダは、第1の態様または第1の態様の様々な実装形態における方法を実行するように構成されたモジュールまたはユニットを含む。
第6の態様によれば、デコーダが提供され、デコーダは、第2の態様または第2の態様の様々な実装形態における方法を実行するように構成されたモジュールまたはユニットを含む。
第7の態様によれば、エンコーダが提供され、エンコーダは、第3の態様または第3の態様の様々な実装形態における方法を実行するように構成されたモジュールまたはユニットを含む。
第8の態様によれば、デコーダが提供され、デコーダは、第4の態様または第4の態様の様々な実装形態における方法を実行するように構成されたモジュールまたはユニットを含む。
第9の態様によれば、メモリおよびプロセッサを含むエンコーダが提供され、メモリはプログラムを記憶するように構成され、プロセッサはプログラムを実行するように構成され、プログラムが実行されると、プロセッサは第1の態様または第1の態様の様々な実装形態における方法を実行する。
第10の態様によれば、メモリおよびプロセッサを含むデコーダが提供され、メモリはプログラムを記憶するように構成され、プロセッサはプログラムを実行するように構成され、プログラムが実行されると、プロセッサは第2の態様または第2の態様の様々な実装形態における方法を実行する。
第11の態様によれば、メモリおよびプロセッサを含むエンコーダが提供され、メモリはプログラムを記憶するように構成され、プロセッサはプログラムを実行するように構成され、プログラムが実行されると、プロセッサは第3の態様または第3の態様の様々な実装形態における方法を実行する。
第12の態様によれば、メモリおよびプロセッサを含むデコーダが提供され、メモリはプログラムを記憶するように構成され、プロセッサはプログラムを実行するように構成され、プログラムが実行されると、プロセッサは第4の態様または第4の態様の様々な実装形態における方法を実行する。
第13の態様によれば、コンピュータ可読媒体が提供され、コンピュータ可読媒体は、デバイスによって実行されるべきプログラムコードを記憶し、プログラムコードは、第1の態様または第1の態様の様々な実装形態における方法を実行するために使用される命令を含む。
第14の態様によれば、コンピュータ可読媒体が提供され、コンピュータ可読媒体は、デバイスによって実行されるべきプログラムコードを記憶し、プログラムコードは、第2の態様または第2の態様の様々な実装形態における方法を実行するために使用される命令を含む。
第15の態様によれば、コンピュータ可読媒体が提供され、コンピュータ可読媒体は、デバイスによって実行されるべきプログラムコードを記憶し、プログラムコードは、第3の態様または第3の態様の様々な実装形態における方法を実行するために使用される命令を含む。
第16の態様によれば、コンピュータ可読媒体が提供され、コンピュータ可読媒体は、デバイスによって実行されるべきプログラムコードを記憶し、プログラムコードは、第4の態様または第4の態様の様々な実装形態における方法を実行するために使用される命令を含む。
従来技術において、左チャネル信号および右チャネル信号を符号化する概略フローチャートである。 従来技術において、左チャネル信号および右チャネル信号を復号する概略フローチャートである。 本出願の一実施形態による、マルチチャネル信号符号化方法の概略フローチャートである。 本出願の一実施形態による、マルチチャネル信号復号方法の概略フローチャートである。 本出願の一実施形態による、マルチチャネル信号符号化方法の概略フローチャートである。 本出願の一実施形態による、マルチチャネル信号復号方法の概略フローチャートである。 本出願の一実施形態による、マルチチャネル信号符号化方法の概略フローチャートである。 本出願の一実施形態による、マルチチャネル信号復号方法の概略フローチャートである。 本出願の一実施形態による、マルチチャネル信号符号化方法の概略フローチャートである。 本出願の一実施形態による、マルチチャネル信号復号方法の概略フローチャートである。 本出願の一実施形態による、エンコーダの概略ブロック図である。 本出願の一実施形態による、デコーダの概略ブロック図である。 本出願の一実施形態による、エンコーダの概略ブロック図である。 本出願の一実施形態による、デコーダの概略ブロック図である。 本出願の一実施形態による、エンコーダの概略ブロック図である。 本出願の一実施形態による、デコーダの概略ブロック図である。 本出願の一実施形態による、エンコーダの概略ブロック図である。 本出願の一実施形態による、デコーダの概略ブロック図である。
以下で、添付図面を参照して本出願の技術的解決策を記載する。本出願の実施形態におけるマルチチャネル信号符号化方法およびマルチチャネル信号復号方法をより良く理解するために、以下では、まず、図1および図2を参照して、従来技術におけるマルチチャネル信号符号化方法およびマルチチャネル信号復号方法を簡単に記載する。
図1は、従来技術において、左チャネル信号および右チャネル信号を符号化するプロセスを示す。図1に示された符号化プロセスは、具体的に以下のステップを含む。
110.(図ではLによって表されている)左チャネル信号および(図ではRによって表されている)右チャネル信号に対して、空間パラメータ分析およびダウンミキシング処理を実行する。
具体的には、ステップ110は、具体的に、左チャネル信号および右チャネル信号に対して空間パラメータ分析を実行して、左チャネル信号の空間パラメータおよび右チャネル信号の空間パラメータを取得することと、左チャネル信号および右チャネル信号に対してダウンミキシング処理を実行して、ダウンミックス信号を取得すること(ダウンミキシング処理の後に取得されるダウンミックス信号はモノラル音声信号であり、音声信号の元の2つのチャネルはダウンミキシング処理によって音声信号の1つのチャネルに結合される)とを含む。
(空間検知パラメータと呼ばれる場合もある)空間パラメータには、チャネル間コヒーレンス(Inter−channel Coherent、IC)、チャネル間レベル差(Inter−channel Level Difference、ILD)、チャネル間時間差(Inter−channel Time Difference、ITD)、チャネル間位相差(Inter−channel Phase Difference、IPD)などが含まれる。
ICは、チャネル間のクロスコヒーレンスまたはコヒーレンスを記述する。このパラメータは、音場範囲の検知を決定し、音声信号の空間検知および音の安定性を改善することができる。ILDは、ステレオソースの水平方向の角度を区別し、チャネル間の強度差を記述するために使用され、このパラメータは、スペクトル全体の周波数成分に影響を及ぼす。ITDおよびIPDは、音源の水平方向を表す空間パラメータであり、チャネル間の時間差および位相差を記述する。これらのパラメータは、主に、2kHz未満の周波数成分に影響を及ぼす。2チャネル信号の場合、ITDはステレオの左チャネル信号と右チャネル信号との間の時間遅延を表すことができ、IPDは時間整合後のステレオの左チャネル信号と右チャネル信号の波形類似性を表すことができる。ILD、ITD、およびIPDは、人間の耳による音源位置の検知を決定し、音源位置を効果的に決定し、ステレオ信号の復元における重要な役割を果たすことができる。
120.ダウンミックス信号を符号化してビットストリームを取得する。
130.空間パラメータを符号化してビットストリームを取得する。
140.ダウンミックス信号を符号化することによって取得されたビットストリームと、空間パラメータを符号化することによって取得されたビットストリームを多重化してビットストリームを取得する。
符号化によって取得されたビットストリームは、記憶されるか、またはデコーダ側デバイスに送信されてよい。
図2は、従来技術において、左チャネル信号および右チャネル信号を復号するプロセスを示す。図2に示された復号プロセスは、具体的に以下のステップを含む。
210.ビットストリームを逆多重化して、ダウンミックス信号を符号化することによって取得されたビットストリーム、および空間パラメータを符号化することによって取得されたビットストリームを別々に取得する。
逆多重化されたビットストリームに基づいて、ダウンミックス信号および空間パラメータが復号によって取得される。
ステップ210では、デコーダ側はダウンミックス信号および空間パラメータを別々に復号することができる。
空間パラメータは、左チャネル信号および右チャネル信号のICを示すために使用される。
220.デコヒーレンス信号を取得する。
さらに、左チャネル信号および右チャネル信号は、復号されたダウンミックス信号および現在フレームのデコヒーレンス信号に基づいて取得される。
230.空間パラメータ、左チャネル信号、および右チャネル信号に基づいて、最終的に出力される(それぞれ、図2ではL’およびR’によって表される)左チャネル信号および右チャネル信号を取得する。
ステップ230の(それぞれ、図2ではL’およびR’によって表される)左チャネル信号および右チャネル信号は、復号によって取得され、エンコーダ側で符号化された左チャネル信号および右チャネル信号と比較して、ある程度歪められる可能性があることを理解されたい。
具体的には、ダウンミックス信号はフィルタリングされる場合があり、次いで、フィルタリングされたダウンミックス信号を修正してデコヒーレンス信号を取得するために、チャネル間コヒーレンスパラメータが使用される。
デコヒーレンス信号を生成する目的は、デコーダ側で最終的に生成されるステレオ信号の残響感を改善し、ステレオ信号の音場幅を広げ、その結果、出力音声信号が聴覚の観点からよりメロウでフルになることである。残響感は、本質的に、元の音声信号を異なるように反射および屈折させ、次いで、反射および屈折した音声信号を元の音声信号に重ね合わせて人間の耳に入ることなどの遅延の効果である。
従来技術では、マルチチャネル信号が符号化されるとき、マルチチャネル信号は、通常、複数のサブバンドに分割され、各サブバンドに対応するICが決定され、各サブバンドに対応するICがその後符号化される。しかしながら、各サブバンドに対応するICを符号化すると、符号化中に占有されるビットの数が確実に増加する。場合によっては、たとえば、複数のチャネル信号間のコヒーレンスが比較的低いとき、複数のチャネル信号の高周波部分は比較的異なる。この場合、複数のチャネル信号の高周波部分に対応するICがまだ符号化されており、デコーダ側が、複数のチャネル信号の高周波部分に対応するICに基づいて、複数のチャネル信号の高周波部分に対して残響処理を実行する場合、複数の復元されたチャネル信号は大きく歪められる。
したがって、本出願の一実施形態は、ビットを効果的に使用するために、マルチチャネル信号内のいくつかのサブバンドの残響ゲインパラメータを符号化のために適応的に選択できるように、マルチチャネル信号符号化方法を提供する。以下で、添付図面を参照して、本出願のこの実施形態におけるマルチチャネル信号符号化方法を詳細に記載する。
図3は、本出願の一実施形態による、マルチチャネル信号符号化方法の概略フローチャートである。図3の方法は、エンコーダ側デバイスまたはエンコーダによって実行されてよい。図3の方法は以下のステップを含む。
310.マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号、ならびに第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータを決定する。
マルチチャネル信号は複数のチャネル信号であってよい。加えて、ステップ310の前に、方法は、マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号を取得するステップを含んでよい。
本出願のこの実施形態は、ダウンミックス信号を決定するプロセスと、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータを決定するプロセスとの間の順番に制限を設定しない。プロセスは、同時または順番に実行されてよい。
具体的には、ダウンミックス信号は、第1のチャネル信号および第2のチャネル信号に対してダウンミキシング処理を実行することによって取得されてよい。第1のチャネル信号および第2のチャネル信号の空間パラメータは、第1のチャネル信号および第2のチャネル信号に対して空間パラメータ分析を実行することによって取得される。空間パラメータには、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ、ならびにIC、ILD、ITD、およびIPDなどの他の空間パラメータが含まれる。
第1のチャネル信号および第2のチャネル信号は同じ空間パラメータに対応し、具体的には、第1のチャネル信号および第2のチャネル信号は同じ初期残響ゲインパラメータにも対応することを理解されたい。すなわち、第1のチャネル信号の空間パラメータと第2のチャネル信号の空間パラメータは同じであり、第1のチャネル信号の初期残響ゲインパラメータと第2のチャネル信号の初期残響ゲインパラメータは同じである。
さらに、第1のチャネル信号および第2のチャネル信号の各々が10個のサブバンドを含み、各サブバンドが1つの残響ゲインパラメータに対応すると仮定すると、第1のチャネル信号および第2のチャネル信号の、インデックス値が同じサブバンドに対応する残響ゲインパラメータは同じである。
加えて、第1のチャネル信号、第2のチャネル信号、およびダウンミックス信号は、正規化処理の後に取得されるチャネル信号であってもよい。
320.第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定する。
330.パラメータ指示情報を生成し、パラメータ指示情報はターゲット残響ゲインパラメータに対応するサブバンドを示すために使用される。
パラメータ指示情報は、フラグビットを使用することにより、ターゲット残響ゲインパラメータに対応するサブバンドを示すことができる。たとえば、第1のチャネル信号および第2のチャネル信号の各々は10個のサブバンドを含み(サブバンドのインデックス番号は0〜9である)、パラメータ指示情報は10個のフラグビットを含み、10個のフラグビットは、第1のチャネル信号および第2のチャネル信号の各々の10個のサブバンドに連続的に対応する。サブバンドに対応するフラグビットが1であるとき、サブバンドに対応する残響ゲインパラメータは、符号化される必要があるターゲット残響ゲインパラメータである。しかしながら、サブバンドに対応するフラグビットが0である場合、サブバンドに対応する残響ゲインパラメータは、ターゲット残響ゲインパラメータではない。このようにして、符号化を実行するとき、エンコーダ側は、フラグビットが1であるサブバンドに対応する残響ゲインパラメータのみを符号化する。
あるいは、パラメータ表示情報は1つのフラグビットを含むだけでよく、フラグビットは1または0である。フラグビットが1であるとき、それは、選択されたターゲットサブバンドの残響ゲインパラメータが符号化されるべきことを示す。フラグビットが0であるとき、それは、すべてのサブバンドの残響ゲインパラメータが符号化されるべきことを示す。
具体的には、第1のチャネル信号および第2のチャネル信号のすべてのサブバンドのインデックス番号は0〜9であり、インデックス番号が0〜5であるサブバンドがターゲットサブバンドである。この場合、パラメータ指示情報のフラグビットが1であるとき、インデックス番号が0〜5であるサブバンドの残響ゲインパラメータが符号化されるべきである。パラメータ指示情報のフラグビットが0であるとき、インデックス番号が0〜9であるサブバンドの残響ゲインパラメータが符号化されるべきである。
340.ビットストリームを生成するために、ターゲット残響ゲインパラメータ、パラメータ指示情報、およびダウンミックス信号を符号化する。
本出願では、第1のチャネル信号および第2のチャネル信号が符号化されているとき、第1のチャネル信号および第2のチャネル信号のいくつかのサブバンドのみに対応する残響ゲインパラメータが符号化されてよい。第1のチャネル信号および第2のチャネル信号のすべてのサブバンドに対応する残響ゲインパラメータが符号化される必要がある従来技術の方式と比較して、ビットオーバーヘッドをある程度低減することができ、符号化効率を改善することができる。
具体的には、いくつかのサブバンドに対応する残響ゲインパラメータが符号化される場合、別のパラメータを符号化するか、またはダウンミックス信号により多くのビットを割り当てるために、大量の節約されたビットを使用することができ、それにより、全体的な符号化性能が改善される。
たとえば、第1のチャネル信号および第2のチャネル信号の低周波部分のサブバンドに対応する残響ゲインパラメータは、符号化される必要があるターゲット残響ゲインパラメータとして選択されてよく、第1のチャネル信号および第2のチャネル信号の高周波部分のサブバンドに対応する残響ゲインパラメータは符号化されるべきでない。
場合によっては、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータが生成されているとき、第1のチャネル信号および第2のチャネル信号のすべてのサブバンドに対応する残響ゲインパラメータが生成されてよい、すなわち、第1のチャネル信号および第2のチャネル信号のすべての残響ゲインパラメータが生成され、次いで、符号化中にすべての残響ゲインパラメータ内のターゲット残響ゲインパラメータのみが符号化される。
あるいは、符号化効率をさらに改善するために、第1のチャネル信号および第2のチャネル信号に対して空間パラメータ分析が実行されると、ターゲット残響ゲインパラメータのみが生成されてよく、符号化されるべきでない残りの残響ゲインパラメータは生成されない。具体的には、ターゲット残響ゲインパラメータが第1のチャネル信号および第2のチャネル信号のターゲットサブバンドに対応する場合、第1のチャネル信号および第2のチャネル信号に対して空間パラメータ分析が実行されると、第1のチャネル信号および第2のチャネル信号のターゲットサブバンドに対応する残響ゲインパラメータのみが決定されてよく、第1のチャネル信号および第2のチャネル信号の別のサブバンドに対応する残響ゲインパラメータは決定される必要がない。このようにして、符号化効率をさらに改善することができる。
場合によっては、一実施形態では、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定するステップは、第1のチャネル信号のエネルギーおよび第2のチャネル信号のエネルギー、第1のチャネル信号と第2のチャネル信号との間のIC、ダウンミックス信号の異なるサブバンドのエネルギーの大きさ、ならびに第1のチャネル信号と第2のチャネル信号との間のILDのうちの少なくとも1つに基づいて、ターゲット残響ゲインパラメータを決定するステップを含む。
具体的には、第1のチャネル信号と第2のチャネル信号との間のコヒーレンスは、第1のチャネル信号のエネルギーおよび第2のチャネル信号のエネルギーまたはダウンミックス信号のエネルギー、第1のチャネル信号と第2のチャネル信号との間のチャネル間コヒーレンス、ならびに第1のチャネル信号と第2のチャネル信号との間のチャネル間レベル差に基づいて決定することができる加えて、符号化される必要があるターゲット残響ゲインパラメータは、第1のチャネル信号および第2のチャネル信号のすべてのサブバンドに対応する残響ゲインパラメータから、第1のチャネル信号と第2のチャネル信号との間のコヒーレンスに基づいて適切に決定され、その結果、ビットをある程度節約することができ、符号化効率を改善することができる。
たとえば、第1のチャネル信号と第2のチャネル信号との間のコヒーレンスが比較的低いとき、第1のチャネル信号および第2のチャネル信号の低周波部分のサブバンドに対応する残響ゲインパラメータのみが符号化されてよい。第1のチャネル信号と第2のチャネル信号との間のコヒーレンスが比較的高いとき、第1のチャネル信号および第2のチャネル信号の低周波部分のサブバンドに対応する残響ゲインパラメータに加えて、第1のチャネル信号および第2のチャネル信号の高周波部分のサブバンドに対応する残響ゲインパラメータも符号化されてよい。すなわち、第1のチャネル信号と第2のチャネル信号との間のコヒーレンスが比較的高いとき、第1のチャネル信号および第2のチャネル信号のすべてのサブバンドに対応する残響ゲインパラメータが符号化されてよい。
第1のチャネル信号と第2のチャネル信号との間のICに基づいてターゲット残響ゲインパラメータが決定されると、第1のチャネル信号と第2のチャネル信号との間のIC値のサイズが決定されてよく、IC値のサイズに基づいて第1のチャネル信号と第2のチャネル信号との間のコヒーレンスが決定される。たとえば、第1のチャネル信号と第2のチャネル信号との間のIC値が比較的小さいとき(この場合、第1のチャネル信号と第2のチャネル信号との間のコヒーレンスは比較的低いと考えられてよい)、第1のチャネル信号および第2のチャネル信号の低周波部分のサブバンドに対応する残響ゲインパラメータが、ターゲット残響ゲインパラメータとして決定されてよい。第1のチャネル信号と第2のチャネル信号との間のIC値が比較的大きいとき(この場合、第1のチャネル信号と第2のチャネル信号との間のコヒーレンスは比較的高いと考えられてよい)、第1のチャネル信号および第2のチャネル信号の低周波部分のサブバンドおよび高周波部分のサブバンド(すなわち、第1のチャネル信号および第2のチャネル信号のすべての周波数帯域のサブバンド)に対応する残響ゲインパラメータが、ターゲット残響ゲインパラメータとして決定されてよい。
場合によっては、一実施形態では、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定するステップは、第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間のコヒーレンス、および第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間のコヒーレンスのうちの少なくとも1つに基づいて、ターゲット残響ゲインパラメータを決定するステップを含む。
すなわち、ターゲット残響ゲインパラメータが決定されているとき、ターゲット残響ゲインパラメータは、第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間のコヒーレンス、もしくは第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間のコヒーレンスに基づいて別々に決定されてよく、またはターゲット残響ゲインパラメータは、第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間のコヒーレンス、および第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間のコヒーレンスに基づいて一緒に決定されてよい。
具体的には、いくつかの実施形態では、第1のチャネル信号および第2のチャネル信号の各々は複数の周波数ビンを含み、第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間のコヒーレンス、および第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間のコヒーレンスのうちの少なくとも1つに基づいて、ターゲット残響ゲインパラメータを決定するステップは、第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の第1の差分値を決定するステップであって、第1の差分値が、複数の周波数ビンにおける第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、ステップと、第1の差分値が第1のしきい値よりも大きいとき、第1の周波数帯域のサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータであると決定するステップであって、第1の周波数帯域が、第1のチャネル信号および第2のチャネル信号の各々のすべての周波数帯域の一部である、ステップとを含む。
他の実施形態では、第1のチャネル信号および第2のチャネル信号の各々は複数の周波数ビンを含み、第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間のコヒーレンス、および第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間のコヒーレンスのうちの少なくとも1つに基づいて、ターゲット残響ゲインパラメータを決定するステップは、第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の第2の差分値を決定するステップであって、第2の差分値が、複数の周波数ビンにおける第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、ステップと、第2の差分値が第2のしきい値よりも大きいとき、第1の周波数帯域のサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータであると決定するステップであって、第1の周波数帯域が、第1のチャネル信号および第2のチャネル信号の各々のすべての周波数帯域の一部である、ステップとを含む。
他の実施形態では、第1のチャネル信号および第2のチャネル信号の各々は複数の周波数ビンを含み、第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間のコヒーレンス、および第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間のコヒーレンスのうちの少なくとも1つに基づいて、ターゲット残響ゲインパラメータを決定するステップは、第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の第1の差分値を決定するステップであって、第1の差分値が、複数の周波数ビンにおける第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、ステップと、第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の第2の差分値を決定するステップであって、第2の差分値が、複数の周波数ビンにおける第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、ステップと、第1の差分値が第1のしきい値よりも大きく、第2の差分値が第2のしきい値よりも大きいとき、第1の周波数帯域のサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータであると決定するステップであって、第1の周波数帯域が、第1のチャネル信号および第2のチャネル信号の各々のすべての周波数帯域の一部である、ステップとを含む。
複数の周波数ビンにおける第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の差分値、および複数の周波数ビンにおける第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の差分値は、正規化処理の後に取得される値であってよい。
第1のしきい値および第2のしきい値は事前設定されてよい。加えて、第1のしきい値および第2のしきい値は、同じであっても異なっていてもよい。
第1のチャネル信号と第2のチャネル信号の両方とダウンミックス信号との間のコヒーレンスは、チャネル信号のエネルギーに基づいて都合よく測定することができる、すなわち、符号化される必要があるターゲット残響ゲインパラメータは、チャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の差を比較することによって都合よく決定することができる。
たとえば、第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の差が比較的大きいとき、第1のチャネル信号とダウンミックス信号との間のコヒーレンスは比較的低いと考えられてよく、この場合、第1のチャネル信号の低周波部分のサブバンドに対応する残響ゲインパラメータのみが符号化されてよい。
第1のチャネル信号または第2のチャネル信号とダウンミックス信号との間のコヒーレンスが比較的高いとき、第1のチャネル信号および第2のチャネル信号は、互いに比較的類似する2つのチャネル信号であると考えられてよい(2つのチャネル信号が比較的類似するとき、2つのチャネル信号を混合することによって取得される混合信号は、混合前の2つのチャネル信号に比較的類似する)。第1のチャネル信号または第2のチャネル信号とダウンミックス信号との間のコヒーレンスが比較的低いとき、第1のチャネル信号および第2のチャネル信号は、互いに比較的異なる2つのチャネル信号であると考えられてよい。
第1のチャネル信号とダウンミックス信号との間のコヒーレンスが一例として使用される。第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の第1の差分値を使用することにより、第1のチャネル信号とダウンミックス信号との間のコヒーレンスが測定されてよい。第1の差分値が比較的大きいとき、第1のチャネル信号とダウンミックス信号との間のコヒーレンスは比較的低いと考えられてよい。第1の差分値が比較的小さいとき、第1のチャネル信号とダウンミックス信号との間のコヒーレンスは比較的高いと考えられてよい。
第1の差分値および第2の差分値のうちの少なくとも1つが対応するしきい値を超えるとき、第1のチャネル信号と第2のチャネル信号との間のコヒーレンスは比較的低いと考えられてよい。この場合、第1のチャネル信号および第2のチャネル信号のいくつかの周波数帯域のサブバンドに対応する残響ゲインパラメータが符号化され、それにより、ビットをある程度節約するだけでなく、符号化性能を改善することもできる。しかしながら、この場合、従来技術では、第1のチャネル信号および第2のチャネル信号のすべての周波数帯域のサブバンドに対応する残響ゲインパラメータが、依然として符号化される。この場合、第1のチャネル信号と第2のチャネル信号との間の差が比較的大きいので、すべての周波数帯域のサブバンドに対応する残響ゲインパラメータがまだ符号化されている場合、残響処理は、すべての周波数帯域の残響ゲインパラメータに基づいて実行され、最終的に復元された第1のチャネル信号および第2のチャネル信号は、元の信号と比較して比較的大きい歪みを有する。
確かに、あるいは、第1の差分値と第2の差分値の両方が対応するしきい値よりも大きいときのみ、第1のチャネル信号および第2のチャネル信号の第1の周波数帯域のサブバンドに対応する残響ゲインパラメータをターゲット残響ゲインパラメータとして決定することができる。
第1の周波数帯域の周波数は、第1のチャネル信号および第2のチャネル信号における第1の周波数帯域とは異なる別の周波数帯域の周波数よりも小さくてよい。具体的には、第1の周波数帯域は、第1のチャネル信号および第2のチャネル信号における最も低い周波数を有する周波数帯域であってよい。すなわち、第1のチャネル信号および第2のチャネル信号における最も低い周波数帯域のサブバンドに対応する残響ゲインパラメータが、ターゲット残響ゲインパラメータとして決定されてよい。
あるいは、第1の周波数帯域は、第1のチャネル信号および第2のチャネル信号における中間周波数値の周波数帯域であってよい(第1のチャネル信号および第2のチャネル信号のすべての周波数帯域の一部の周波数は、第1の周波数帯域の周波数よりも大きく、すべての周波数帯域の別の部分の周波数は、第1の周波数帯域の周波数よりも小さい)、すなわち、第1のチャネル信号および第2のチャネル信号の中間周波数値のサブバンドに対応する残響ゲインパラメータが、ターゲット残響ゲインパラメータとして決定されてよい。
場合によっては、複数の周波数ビンは、第1のチャネル信号および第2のチャネル信号の各々の第2の周波数帯域内にあり、第2の周波数帯域の周波数は、第1のチャネル信号および第2のチャネル信号における第2の周波数帯域とは異なる別の周波数帯域の周波数よりも大きい。
すなわち、複数の周波数ビンは、比較的高い周波数を有する第2の周波数帯域内に位置する。したがって、第1のチャネル信号のエネルギーと第2のチャネル信号のエネルギーの両方とダウンミックス信号のエネルギーとの間の差分値は、高周波部分にある複数の周波数ビンにおける第1のチャネル信号のエネルギーと第2のチャネル信号のエネルギーの両方とダウンミックス信号のエネルギーとの間の差を比較することにより、都合よく決定することができる。したがって、周波数帯域全体における第1のチャネル信号のエネルギーと第2のチャネル信号のエネルギーの両方とダウンミックス信号のエネルギーとの間の差を比較する必要がなく、それにより、計算プロセスが簡略化される。
第1のチャネル信号のエネルギーと第2のチャネル信号のエネルギーの両方とダウンミックス信号のエネルギーとの間の差分値は、複数の周波数ビンにおける第1のチャネル信号のエネルギーと第2のチャネル信号のエネルギーの両方とダウンミックス信号のエネルギーとの間の差を比較することにより、都合よく決定することができる。さらに、ターゲット残響ゲインパラメータは、第1のチャネル信号のエネルギーと第2のチャネル信号のエネルギーの両方とダウンミックス信号のエネルギーとの間の差分値に基づいて決定され、すべての周波数帯域における第1のチャネル信号のエネルギーと第2のチャネル信号のエネルギーの両方とダウンミックス信号のエネルギーとの間の差を比較する必要がない。
場合によっては、一実施形態では、図3の方法は、第1の差分値が第1のしきい値以下であり、第2の差分値が第2のしきい値以下であるとき、第1のチャネル信号および第2のチャネル信号のすべてのサブバンドに対応する残響ゲインパラメータをターゲット残響ゲインパラメータとして決定するステップをさらに含む。
第1の差分値が第1のしきい値以下であり、第2の差分値が第2のしきい値以下であるとき、第1のチャネル信号のエネルギーと第2のチャネル信号のエネルギーの両方とダウンミックス信号のエネルギーとの間の差は比較的小さい。この場合、第1のチャネル信号と第2のチャネル信号との間のコヒーレンスは比較的大きいと考えられてよい。出力チャネル信号の残響感を改善するために、すべてのサブバンドに対応する残響ゲインパラメータが符号化されてよい。
第1のチャネル信号のエネルギーと第2のチャネル信号のエネルギーの両方とダウンミックス信号のエネルギーとの間の差が比較的大きいとき、符号化中のビットオーバーヘッドを削減し、残響処理中に生じる信号の歪みを可能な限り回避するために、いくつかのサブバンドに対応する残響ゲインパラメータのみが符号化されてよい。第1のチャネル信号のエネルギーと第2のチャネル信号のエネルギーの両方とダウンミックス信号のエネルギーとの間の差が比較的小さいとき、チャネル信号に対する残響処理によって生じる信号の歪みは非常に小さい。より良い聴覚効果を得るために、すべてのサブバンドに対応する残響ゲインパラメータが符号化されてよい。
具体的には、第1のチャネル信号が左チャネル信号であり、第2のチャネル信号が右チャネル信号であるとき、第1の差分値および第2の差分値は、以下の式に基づいて計算されてよい。

Figure 0006874151
Figure 0006874151
diff_l_hは第1の差分値であり、diff_r_hは第2の差分値であり、左チャネル信号および右チャネル信号の各々の周波数帯域は高周波部分および低周波部分を含み、M1は高周波部分の開始周波数ビンであり、M2は高周波部分の終了周波数ビンであり、mag_l[k]はM1とM2との間のインデックスkを有する周波数ビンでの左チャネル信号のエネルギーまたは振幅値であり、mag_r[k]はM1とM2との間のインデックスkを有する周波数ビンでの右チャネル信号のエネルギーまたは振幅値であり、mag_dmx[k]はM1とM2との間のインデックスkを有する周波数ビンでのダウンミックス信号のエネルギーまたは振幅値であり、mag_dmx[k]は、ダウンミックス信号自体を使用して計算されてもよく、左チャネル信号および右チャネル信号のエネルギーまたは振幅値に基づいて計算されてもよい。
式(1)および(2)に基づいて第1の差分値および第2の差分値が計算された後、第1の差分値および第2の差分値に対してフレーム間平滑化処理がさらに実行されてよく(第1の差分値、第2の差分値、および前のフレームで計算された差分値に対して平滑化処理が実行されてよく)、次いで、平滑化処理によって取得された第1の差分値と第2の差分値の両方とプリセットしきい値との間の関係を使用することにより、ターゲット残響ゲインパラメータが決定される。
場合によっては、一実施形態では、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定するステップは、ダウンミックス信号のN個のサブバンドのエネルギーを決定するステップと、N個のサブバンドからM個のサブバンドを決定するステップであって、M個のサブバンドの中の任意のサブバンドのエネルギーが、M個のサブバンドを除くN個のサブバンド内のN−M個のサブバンドの中の任意のサブバンドのエネルギーよりも大きく、MとNの両方が0より大きい整数であり、MがNより小さい、ステップと、M個のサブバンドのエネルギーとN−M個のサブバンドのエネルギーとの間の大小関係に基づいて、ターゲット残響ゲインパラメータを決定するステップとを含む。
第1のチャネル信号と第2のチャネル信号との間のコヒーレンスは、ダウンミックス信号の異なるサブバンドのエネルギーに基づいて決定することができ、さらに、符号化される必要があるターゲット残響ゲインパラメータは、第1のチャネル信号と第2のチャネル信号との間のコヒーレンスに基づいて決定される。
具体的には、ダウンミックス信号のM個のサブバンドのエネルギーとダウンミックス信号のN−M個のサブバンドのエネルギーとの間の大小関係に基づいて、ターゲット残響ゲインパラメータを決定するステップは、M個のサブバンドのエネルギーの合計がN−M個のサブバンドのエネルギーの合計のK倍よりも大きいとき、第1のチャネル信号および第2のチャネル信号の第1の周波数帯域のサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータであると決定するステップであって、Kが0より大きい実数である、ステップを含む。
ダウンミックス信号のM個のサブバンドのエネルギーとダウンミックス信号のN−M個のサブバンドのエネルギーとの間の大小関係に基づいて、ターゲット残響ゲインパラメータを決定するステップは、M個のサブバンドのエネルギーの平均値がN−M個のサブバンドのエネルギーの平均値のL倍よりも大きいとき、第1のチャネル信号および第2のチャネル信号の第1の周波数帯域のサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータであると決定するステップであって、Lが0より大きい実数である、ステップを含む。
KとLは異なる値をもっていてもよいことを理解されたい。より具体的には、MがN−Mより大きいとき、KはLより小さくてもよく、MがN−Mより小さいとき、KはLより大きくてもよい。
ダウンミックス信号のN個のサブバンドのエネルギーとダウンミックス信号のN−M個のサブバンドのエネルギーは、ダウンミックス信号のM個のサブバンドのエネルギーの平均値をダウンミックス信号のN−M個のサブバンドのエネルギーの平均値と比較することによって比較されてよい。計算の複雑さをさらに低減するために、ダウンミックス信号のM個のサブバンドのエネルギーの合計とダウンミックス信号のN−M個のサブバンドのエネルギーの合計が直接比較されてもよい。このようにして、計算プロセスがある程度簡略化され、効率が改善される。
ダウンミックス信号の、比較的大きいエネルギーを有するM個のサブバンドのエネルギーと比較的小さいエネルギーを有する別のサブバンドのエネルギーとの間の差が比較的大きいとき、第1のチャネル信号と第2のチャネル信号との間の差は比較的大きいと考えられてよい。この場合、第1のチャネル信号および第2のチャネル信号におけるいくつかの周波数帯域のサブバンドに対応する残響ゲインパラメータは、符号化される必要があるターゲット残響ゲインパラメータとして決定されてよい。具体的には、第1の周波数帯域は、第1のチャネル信号および第2のチャネル信号の低周波部分にある周波数帯域であってもよく、第1のチャネル信号および第2のチャネル信号の中間周波数部分にある周波数帯域であってもよい。
場合によっては、一実施形態では、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定するステップは、ダウンミックス信号のN個のサブバンドのエネルギーを決定するステップと、N個のサブバンドからM個のサブバンドを決定するステップであって、M個のサブバンドの中の任意のサブバンドのエネルギーが、M個のサブバンドを除くN個のサブバンド内のN−M個のサブバンドの中の任意のサブバンドのエネルギーよりも大きい、ステップと、M個のサブバンドの中の第1のサブバンドのインデックス値がプリセットインデックス値よりも小さいとき、第1のチャネル信号および第2のチャネル信号の第1の周波数帯域のサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータであると決定するステップであって、第1のサブバンドの任意の周波数ビンの周波数が、第1のサブバンドを除くM個のサブバンドの中の別のサブバンドの任意の周波数ビンの周波数よりも大きく、第1の周波数帯域が第1のチャネル信号および第2のチャネル信号の各々のすべての周波数帯域の一部である、ステップとを含む。
比較的大きいエネルギーを有するM個のサブバンド内の最大周波数のサブバンドのインデックス値がプリセットインデックス値よりも小さいとき、ダウンミックス信号のM個のサブバンドのエネルギー分布は不均一である、すなわち、第1のチャネル信号と第2のチャネル信号との間のコヒーレンスは比較的小さいと考えられてよい。この場合、いくつかの周波数帯域のサブバンドに対応する残響ゲインパラメータのみが符号化される必要がある。
ダウンミックス信号は、広帯域信号または超広帯域信号であってよい。ダウンミックス信号が広帯域信号であるとき、N個のサブバンドはダウンミックス信号のすべてのサブバンドであってよく、ダウンミックス信号が超広帯域信号であるとき、N個のサブバンドは広帯域部分にあるダウンミックス信号のサブバンドであってよい。
M個のサブバンドは、ダウンミックス信号の各サブバンドのエネルギーの大きさに加えて、ダウンミックス信号の各サブバンドの振幅に基づいて、N個のサブバンドから決定されてよい。具体的には、M個のサブバンドは、M個のサブバンドの中の任意のサブバンドの振幅がN−M個のサブバンドの中の任意のサブバンドの振幅よりも大きいように、ダウンミックス信号の各サブバンドの振幅に基づいて決定されてよい。
Mの値は、符号化の前に事前設定された値であってよい。たとえば、ダウンミックス信号は合計10個のサブバンドを含む。この場合、最大のエネルギーまたは振幅を有する4つのサブバンドが選択され得る。ダウンミックス信号の4つのサブバンドの(エネルギーまたは振幅値の合計であってもよく、エネルギーまたは振幅値の平均値であってもよい)エネルギーまたは振幅値が、ダウンミックス信号の残りの6つのサブバンドのエネルギーまたは振幅値の所定の倍数よりも大きいとき、第1のチャネル信号および第2のチャネル信号の第1の周波数帯域に対応する残響ゲインパラメータがターゲット残響ゲインパラメータであると決定される。
本出願のこの実施形態では、以下の条件のうちの少なくとも1つに基づいて、ターゲット残響ゲインパラメータが決定されてよいことを理解されたい。以下の条件のうちの少なくとも1つが有効であるとき、いくつかの残響ゲインパラメータがターゲット残響ゲインパラメータとして決定されてよい。
条件1:第1のチャネル信号のエネルギーおよび/または第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の1つまたは複数の差分値が、1つまたは複数のプリセットしきい値よりも大きい。
条件2:ダウンミックス信号のM個のサブバンドのエネルギーが、ダウンミックス信号のN−M個のサブバンドのエネルギーの所定の倍数よりも大きい。
条件3:M個のサブバンドの中の第1のサブバンドのインデックス値が、プリセットインデックス値よりも大きい。
第1のサブバンドにおける任意のスペクトル係数の周波数は、第1のサブバンドを除くM個のサブバンドの中の別のサブバンドの任意のスペクトル係数の周波数よりも大きい。
場合によっては、一実施形態では、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定するステップは、ダウンミックス信号のN個のサブバンドのエネルギーを決定するステップと、N個のサブバンドのエネルギーに基づいてN個のサブバンドからJ個のターゲットサブバンドを決定するステップであって、J個のターゲットサブバンドの中の任意のサブバンドのエネルギーが、J個のターゲットサブバンドとは異なる別のサブバンドのエネルギーよりも大きく、NとJの両方が0より大きい整数であり、JがNより小さい、ステップと、J個のターゲットサブバンドに対応する残響ゲインパラメータをターゲット残響ゲインパラメータとして決定するステップとを含む。Jは、事前設定された所定の数であってよい。
ダウンミックス信号の各サブバンドのエネルギーに基づいて、すべてのサブバンドから所定の数のサブバンドが直接選択され、所定の数のサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータとして決定され、その結果、符号化される必要がある残響ゲインパラメータをより柔軟に選択することができる。
固定周波数帯域のサブバンドに対応する残響ゲインパラメータをターゲット残響ゲインパラメータとして決定する方式と比較して、周波数領域内で隣接していない可能性があるいくつかのサブバンドに対応する残響ゲインパラメータをターゲット残響ゲインパラメータとして直接かつ柔軟に選択することができる。
場合によっては、一実施形態では、ダウンミックス信号のエネルギーは、第1のチャネル信号のエネルギーおよび第2のチャネル信号のエネルギーに基づいて決定される。ダウンミックス信号のエネルギーは、ダウンミックス信号自体に基づいて計算されてもよく、第1のチャネル信号のエネルギーおよび第2のチャネル信号のエネルギーを使用して推定または推論されてもよい。第1のチャネル信号のエネルギーおよび第2のチャネル信号のエネルギーを使用してダウンミックス信号のエネルギーが決定されると、計算プロセスをある程度簡略化することができる。
図4は、本出願の一実施形態による、マルチチャネル信号復号方法の概略フローチャートである。図4の方法は、デコーダ側デバイスまたはデコーダによって実行されてよい。図4の復号方法は、図3の符号化方法に対応する。図4の復号方法は、図3の符号化方法において第1のチャネル信号および第2のチャネル信号を符号化することによって取得されたビットストリームを復号するために使用されてよい。図4の方法は以下のステップを含む。
410.ビットストリームを受信する。
420.ビットストリームに基づいて、マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号、ならびにパラメータ指示情報を取得し、パラメータ指示情報は、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内の符号化されたターゲット残響ゲインパラメータを示すために使用される。
パラメータ指示情報は、フラグビットを使用することにより、ターゲット残響ゲインパラメータに対応するサブバンドを示すことができる。たとえば、第1のチャネル信号および第2のチャネル信号の各々は10個のサブバンド(インデックス番号が0〜9であるサブバンド)を含み、パラメータ指示情報は10個のフラグビットを含み、10個のフラグビットは、マルチチャネル信号の各々の10個のサブバンドに連続的に対応する。サブバンドに対応するフラグビットが1であるとき、サブバンドに対応する残響ゲインパラメータは、符号化される必要があるターゲット残響ゲインパラメータである。サブバンドに対応するフラグビットが0である場合、サブバンドに対応する残響ゲインパラメータは、ターゲット残響ゲインパラメータではない。具体的には、インデックス番号が0〜5であるサブバンドに対応するフラグビットが1であり、インデックス番号が6〜9であるサブバンドに対応するフラグビットが0である場合、デコーダ側は、復号中にインデックス番号が1〜5であるサブバンドに対応する残響ゲインパラメータのみを復号する。
430.パラメータ指示情報に従って、ビットストリームからターゲット残響ゲインパラメータを取得する。
440.ダウンミックス信号およびターゲット残響ゲインパラメータに基づいて、第1のチャネル信号および第2のチャネル信号を決定する。
本出願では、エンコーダによって符号化されたターゲット残響ゲインパラメータは、パラメータ指示情報を使用して決定することができ、次いで、ターゲット残響ゲインパラメータに基づいて、第1のチャネル信号および第2のチャネル信号の対応するサブバンドに対して残響処理が実行される。
ターゲット残響ゲインパラメータに基づいて第1のチャネル信号および第2のチャネル信号に対して残響処理が実行される前に、デコーダ側は、デコヒーレンス信号をさらに取得し、ターゲット残響ゲインパラメータを使用してデコヒーレンス信号を補正することを理解されたい。次いで、補正されたデコヒーレンス信号を使用することにより、第1のチャネル信号および第2のチャネル信号に対して残響処理がさらに実行されてよい。第1のチャネル信号および第2のチャネル信号の各々が10個のサブバンド(インデックス番号が0〜9であるサブバンド)を含み、インデックス番号が0〜5であるサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータである場合、デコーダ側は、インデックス番号が0〜5であるサブバンドに対応する残響ゲインパラメータのみを取得し、インデックス番号が6〜10であるサブバンドに対応する残響ゲインパラメータを取得しない。したがって、デコーダ側は、第1のチャネル信号および第2のチャネル信号のインデックス番号が0〜5であるサブバンドに対してのみ残響処理を実行し、第1のチャネル信号および第2のチャネル信号のインデックス番号が6〜10であるサブバンドには残響処理を実行しない。
第1のチャネル信号および第2のチャネル信号が左チャネル信号および右チャネル信号を含むとき、ダウンミックス信号およびターゲット残響ゲインパラメータに基づいて、第1のチャネル信号および第2のチャネル信号を決定するステップは、現在フレームの前のフレームのダウンミックス信号およびターゲット残響ゲインパラメータに基づいて、デコヒーレンス信号を決定するステップと、現在フレームのデコヒーレンス信号およびダウンミックス信号に基づいて、左チャネル信号および右チャネル信号を決定するステップとを含む。
たとえば、第1のチャネル信号および第2のチャネル信号は、左チャネル信号および右チャネル信号を含む。現在フレームのダウンミックス信号はdmxであり、現在フレームの前のフレームのダウンミックス信号はdmx_predであり、ターゲットダウンミックスゲインパラメータはgainである。次いで、dmx_predおよびgainに基づいて、まずデコヒーレンス信号tmpが取得される。次いで、現在フレームのダウンミックス信号およびデコヒーレンス信号に基づいて、左チャネル信号L=dmx+tmpおよび右チャネル信号R=dmx−tmpが取得される。
図5および図6を参照して、以下で、左チャネル信号および右チャネル信号の一例を使用することにより、本出願の実施形態におけるマルチチャネル信号の符号化方法および復号方法のプロセス全体を詳細に記載する。
図5は、本出願の一実施形態による、マルチチャネル信号符号化方法の概略フローチャートである。図5では、マルチチャネル信号は左チャネル信号および右チャネル信号を含み、左チャネル信号および右チャネル信号を符号化するプロセスは、具体的に以下のステップを含む。
510.左チャネル信号の空間パラメータおよび右チャネル信号の空間パラメータを計算する。
空間パラメータには、左チャネル信号および右チャネル信号のサブバンドに対応する残響ゲインパラメータ、ならびに(IC、ILD、ITD、およびIPDなどの)他の空間パラメータが含まれる。
520.(図ではLによって表される)左チャネル信号および(図ではRによって表される)右チャネル信号に対してダウンミキシング処理を実行して、ダウンミックス信号を取得する。
530.左チャネル信号および右チャネル信号のサブバンドに対応する残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを適応的に選択する。
540.ターゲット残響ゲインパラメータおよびダウンミックス信号を別々に量子化して、ビットストリームを取得する。
図6は、本出願の一実施形態による、マルチチャネル信号復号方法の概略フローチャートである。図6では、マルチチャネル信号は左チャネル信号および右チャネル信号を含む。図5の符号化によって生成されたビットストリームは、図6で復号されてよい。図6の復号プロセスは、具体的に以下のステップを含む。
610.左チャネル信号および右チャネル信号のビットストリームを取得する。
620.ビットストリームを復号してダウンミックス信号を取得する。
630.ビットストリーム内のフラグ情報を取得し、フラグ情報のフラグビットに基づいて、復号される必要があるターゲット残響ゲインパラメータを決定する。
640.左チャネル信号および右チャネル信号、ならびに(IC、ILD、ITD、およびIPDなどの)他の空間パラメータの中の、残響処理のための、サブバンドに対応する残響ゲインパラメータを復号する。
640.復号によって取得された空間パラメータに対して後続の処理(たとえば、平滑化フィルタリング)を実行する。
650.復号によって取得されたダウンミックス信号および残響ゲインパラメータに基づいてアップミキシング処理を実行して、左チャネル信号および右チャネル信号を取得する。
左チャネル信号および右チャネル信号を取得するためにアップミキシング処理が実行された後、コヒーレンス信号に基づいて、左チャネル信号および右チャネル信号に対して残響処理が別々に実行されてよい。
図6に示された方法では、復号によって取得されたターゲット残響ゲインパラメータに基づいて、左チャネル信号および右チャネル信号に対して残響処理が実行され、ターゲット残響ゲインパラメータに基づいて、左チャネル信号および右チャネル信号のいくつかのサブバンドに対して残響処理が実行されてよく、それにより、残響処理の後に取得されるチャネル信号の品質が保証される。
図7は、本出願の一実施形態による、マルチチャネル信号符号化方法の概略フローチャートである。図7の方法は、エンコーダ側デバイスまたはエンコーダによって実行されてよい。図7の方法は以下のステップを含む。
710.マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号、ならびに第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータを決定する。
本出願は、ダウンミックス信号を生成するプロセスと、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータを生成するプロセスとの間の順番に制限を設定しない。プロセスは、同時または順番に実行されてよい。
具体的には、ダウンミックス信号は、第1のチャネル信号および第2のチャネル信号に対してダウンミキシング処理を実行することによって取得されてよい。第1のチャネル信号および第2のチャネル信号の空間パラメータを取得するために、第1のチャネル信号および第2のチャネル信号に対して空間パラメータ分析が実行される。空間パラメータには、第1のチャネル信号および第2のチャネル信号の各サブバンドに対応する残響ゲインパラメータ、ならびに第1のチャネル信号と第2のチャネル信号との間のIC、ILD、ITD、IPDなどが含まれる。
720.ダウンミックス信号のN個のサブバンドのエネルギーに基づいて、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定し、Nは0より大きい整数である。
ダウンミックス信号の複数のサブバンドのエネルギーは、ダウンミックス信号自体に基づいて計算されてよく、またはダウンミックス信号のエネルギーは、第1のチャネル信号のエネルギーおよび第2のチャネル信号のエネルギーを使用して推定もしくは推論されてよい。第1のチャネル信号のエネルギーおよび第2のチャネル信号のエネルギーを使用してダウンミックス信号のエネルギーが決定されると、計算プロセスをある程度簡略化することができる。
具体的には、ダウンミックス信号のN個のサブバンドのエネルギーに基づいて、N個のサブバンドからJ個のターゲットサブバンドが決定されてよい。J個のターゲットサブバンドの中の任意のサブバンドのエネルギーは、J個のターゲットサブバンドとは異なる別のサブバンドのエネルギーよりも大きく、NとJの両方は0より大きい整数であり、JはNより小さい。J個のターゲットサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータとして決定される。
ダウンミックス信号の各サブバンドのエネルギーに基づいて、すべてのサブバンドから所定の数のサブバンドが直接選択され、所定の数のサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータとして決定され、その結果、符号化される必要がある残響ゲインパラメータをより柔軟に選択することができる。
730.ダウンミックス信号およびターゲット残響ゲインパラメータを符号化する。
加えて、ダウンミックス信号は、広帯域信号または超広帯域信号であってよい。ダウンミックス信号が広帯域信号であるとき、複数のサブバンドはダウンミックス信号のすべてのサブバンドであってよく、ダウンミックス信号が超広帯域信号であるとき、複数のサブバンドは広帯域部分にあるダウンミックス信号のサブバンドであってよい。
本出願では、ダウンミックス信号の各サブバンドのエネルギーに基づいて、すべてのサブバンドから特定の数のサブバンドが直接選択され、その結果、符号化される必要がある残響ゲインパラメータをより柔軟に選択することができる。加えて、固定周波数帯域のサブバンドに対応する残響ゲインパラメータをターゲット残響ゲインパラメータとして決定する方式と比較して、周波数領域内で隣接していない可能性があるいくつかのサブバンドに対応する残響ゲインパラメータをターゲット残響ゲインパラメータとして直接選択することができる。
図8は、本出願の一実施形態による、マルチチャネル信号復号方法の概略フローチャートである。図8の方法は、デコーダ側デバイスまたはデコーダによって実行されてよい。図8の復号方法は、図7の符号化方法に対応する。図8の復号方法は、図7の符号化方法において第1のチャネル信号および第2のチャネル信号を符号化することによって取得されたビットストリームを復号するために使用されてよい。図8の方法は以下のステップを含む。
810.ビットストリームを受信する。
820.ビットストリームに基づいて、マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号を取得する。
具体的には、まず第1のチャネル信号および第2のチャネル信号のビットストリームが逆多重化され、次いで、ダウンミックス信号を取得するために、ダウンミックス信号に対応するビットストリームが復号されてよい。
830.ダウンミックス信号のN個のサブバンドのエネルギーに基づいて、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内の符号化されたターゲット残響ゲインパラメータを決定し、Nは0より大きい整数である。
具体的には、N個のサブバンドのエネルギーに基づいて、N個のサブバンドからJ個のターゲットサブバンドが決定されてよい。J個のターゲットサブバンドの中の任意のサブバンドのエネルギーは、J個のターゲットサブバンドとは異なる別のサブバンドのエネルギーよりも大きく、NとJの両方は0より大きい整数であり、JはNより小さい。J個のターゲットサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータとして決定される。
エンコーダ側とデコーダ側の両方が、ダウンミックス信号の複数のサブバンドのエネルギーに基づく同じ規則に従って、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内の符号化されたターゲット残響ゲインパラメータを決定できることを理解されたい。このようにして、エンコーダ側はビットストリーム内の符号化された残響ゲインパラメータを示す必要がなくてもよく、デコーダ側は同じ規則を使用して符号化された残響ゲインパラメータを決定することができる。
たとえば、エンコーダ側は、ダウンミックス信号の複数のサブバンドのエネルギーに基づいて、インデックス番号が0〜5であるサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータであると決定し、エンコーダ側は、インデックス番号が0〜5であるサブバンドに対応する残響ゲインパラメータを量子化し、量子化された残響ゲインパラメータをビットストリームに書き込み、デコーダ側にビットストリームを送信する。ビットストリームを受信した後、デコーダ側は、同様にダウンミックス信号の複数のサブバンドのエネルギーに基づいて、インデックス番号が0〜5であるサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータであると決定し、次いでデコーダ側は、インデックス番号が0〜5であるサブバンドに対応する残響ゲインパラメータを復号する。
840.ビットストリームに基づいてターゲット残響ゲインパラメータを決定する。
ターゲット残響ゲインパラメータに加えて、IC、ILD、ITD、およびIPDなどのエンコーダ側で符号化された他の空間パラメータがビットストリームから取得されてよい。
850.ダウンミックス信号およびターゲット残響ゲインパラメータに基づいて、第1のチャネル信号および第2のチャネル信号を決定する。
本出願では、デコーダ側は、ダウンミックス信号の複数のサブバンドのエネルギーに基づいて、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内の符号化されたターゲット残響ゲインパラメータを直接決定することができ、その結果、符号化されたターゲット残響ゲインパラメータを示す指示情報を送信するためにデコーダ側によって占有されるビットが削減され、シグナリングオーバーヘッドをある程度削減することができる。
具体的には、ターゲット残響ゲインパラメータに基づいて、第1のチャネル信号および第2のチャネル信号に対して残響処理が実行される前に、デコーダ側は、デコヒーレンス信号をさらに取得し、ターゲット残響ゲインパラメータを使用してデコヒーレンス信号を補正する(デコヒーレンス信号はダウンミックス信号を遅延させることによって取得されてよい)。次いで、補正されたデコヒーレンス信号を使用することにより、第1のチャネル信号および第2のチャネル信号に対して残響処理がさらに実行されてよい。第1のチャネル信号および第2のチャネル信号の各々が10個のサブバンドを含み、インデックス番号が1、3、5、および7であるサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータである場合、デコーダ側は、インデックス番号が1、3、5、および7であるサブバンドに対応する残響ゲインパラメータのみを取得し、インデックス番号が2、4、6、8、9、および10であるサブバンドに対応する残響ゲインパラメータを取得しない。したがって、デコーダ側は、第1のチャネル信号および第2のチャネル信号のインデックス番号が1、3、5、および7であるサブバンドに対してのみ残響処理を実行し、第1のチャネル信号および第2のチャネル信号のインデックス番号が2、4、6、8、9、および10であるサブバンドには残響処理を実行しない。
第1のチャネル信号および第2のチャネル信号が左チャネル信号および右チャネル信号を含むとき、ダウンミックス信号およびターゲット残響ゲインパラメータに基づいて、第1のチャネル信号および第2のチャネル信号を決定するステップは、現在フレームの前のフレームのダウンミックス信号およびターゲット残響ゲインパラメータに基づいて、デコヒーレンス信号を決定するステップと、現在フレームのデコヒーレンス信号およびダウンミックス信号に基づいて、左チャネル信号および右チャネル信号を決定するステップとを含む。
図9および図10を参照して、以下で、左チャネル信号および右チャネル信号の一例を使用することにより、本出願の実施形態におけるマルチチャネル信号の符号化方法および復号方法のプロセス全体を詳細に記載する。
図9は、本出願の一実施形態による、マルチチャネル信号符号化方法の概略フローチャートである。図9では、マルチチャネル信号は左チャネル信号および右チャネル信号を含み、左チャネル信号および右チャネル信号を符号化するプロセスは、具体的に以下のステップを含む。
910.左チャネル信号の空間パラメータおよび右チャネル信号の空間パラメータを計算する。
空間パラメータには、左チャネル信号および右チャネル信号のサブバンドに対応する残響ゲインパラメータ、ならびに(IC、ILD、ITD、およびIPDなどの)他の空間パラメータが含まれる。
920.(図ではLによって表される)左チャネル信号および(図ではRによって表される)右チャネル信号に対してダウンミキシング処理を実行して、ダウンミックス信号を取得する。
930.ダウンミックス信号の異なるサブバンドのエネルギーを決定する。
ダウンミックス信号のエネルギーは、ダウンミックス信号自体に基づいて計算されてもよく、左チャネル信号のエネルギーおよび右チャネル信号のエネルギーに基づいて推定または推論されてもよい。
940.ダウンミックス信号の異なるサブバンドのエネルギーに基づいて、左チャネル信号および右チャネル信号のサブバンドに対応する残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを適応的に選択する。
950.ターゲット残響ゲインパラメータおよびダウンミックス信号を量子化して、ビットストリームを取得する。
図10は、本出願の一実施形態による、マルチチャネル信号復号方法の概略フローチャートである。図10では、マルチチャネル信号は左チャネル信号および右チャネル信号を含む。図9の符号化によって生成されたビットストリームは、図10で復号されてよい。図10の復号プロセスは、具体的に以下のステップを含む。
1010.左チャネル信号および右チャネル信号のビットストリームを取得する。
1020.ビットストリームを復号してダウンミックス信号を取得する。
1030.ダウンミックス信号の異なるサブバンドのエネルギーを決定する。
ダウンミックス信号のエネルギーは、ダウンミックス信号自体に基づいて計算されてもよく、左チャネル信号のエネルギーおよび右チャネル信号のエネルギーに基づいて推定または推論されてもよい。
1040.ダウンミックス信号の異なるサブバンドのエネルギーに基づいて、残響処理のために、左チャネル信号および右チャネル信号のサブバンドを適応的に選択する。
1050.左チャネル信号および右チャネル信号の、残響処理用のための、選択されたサブバンドに対応する残響ゲインパラメータ、ならびに(IC、ILD、ITD、およびIPDなどの)他の空間パラメータを復号する。
1060.左チャネル信号および右チャネル信号を取得するために、復号によって取得されたダウンミックス信号および残響ゲインパラメータに基づいてアップミキシング処理を実行する(残響ゲインパラメータはエンコーダ側によって調整された残響ゲインパラメータである)。
左チャネル信号および右チャネル信号を取得するためにアップミキシング処理が実行された後、コヒーレンス信号に基づいて、左チャネル信号および右チャネル信号に対して残響処理が別々に実行されてよい。
図10に示された方法では、復号によって取得されたターゲット残響ゲインパラメータに基づいて、左チャネル信号および右チャネル信号に対して残響処理が実行され、ターゲット残響ゲインパラメータに基づいて、左チャネル信号および右チャネル信号のいくつかのサブバンドに対して残響処理が実行されてよく、それにより、残響処理の後に取得されるチャネル信号の品質が保証される。
上記は、図3〜図10を参照して、本出願の実施形態におけるマルチチャネル信号符号化方法およびマルチチャネル信号復号方法を詳細に記載した。以下で、図11〜図18を参照して、本出願の実施形態におけるエンコーダおよびデコーダを記載する。図11〜図18のエンコーダおよびデコーダは、本出願の実施形態における符号化方法および復号方法においてエンコーダおよびデコーダによって実行されるステップを実装できることを理解されたい。簡潔にするために、下記で繰返しの説明は適切に省略される。
図11は、本出願の一実施形態による、エンコーダの概略ブロック図である。図11のエンコーダ1100は、
マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号、ならびに第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータを決定するように構成された処理ユニット1110であって、
処理ユニット1110が、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定するようにさらに構成され、
処理ユニット1110が、パラメータ指示情報を生成するようにさらに構成され、パラメータ指示情報が、ターゲット残響ゲインパラメータに対応するサブバンドを示すために使用される、処理ユニット1110と、
ビットストリームを生成するために、ターゲット残響ゲインパラメータ、パラメータ指示情報、およびダウンミックス信号を符号化するように構成された符号化ユニット1120と
を含む。
本出願では、第1のチャネル信号および第2のチャネル信号が符号化されているとき、第1のチャネル信号および第2のチャネル信号のいくつかのサブバンドのみに対応する残響ゲインパラメータが符号化されてよい。第1のチャネル信号および第2のチャネル信号のすべてのサブバンドに対応する残響ゲインパラメータが符号化される必要がある従来技術の方式と比較して、ビットオーバーヘッドをある程度低減することができ、符号化効率を改善することができる。具体的には、いくつかのサブバンドに対応する残響ゲインパラメータが符号化される場合、別のパラメータを符号化するか、またはダウンミックス信号により多くのビットを割り当てるために、大量の節約されたビットを使用することができ、それにより、全体的な符号化性能が改善される。
エンコーダ1100は、図3のマルチチャネル信号符号化方法に対応することができ、エンコーダ1100は、図3のマルチチャネル信号符号化方法を実行することができる。
場合によっては、一実施形態では、処理ユニット1110は、具体的に、第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間のコヒーレンス、および第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間のコヒーレンスのうちの少なくとも1つに基づいて、ターゲット残響ゲインパラメータを決定するように構成される。
場合によっては、一実施形態では、第1のチャネル信号および第2のチャネル信号の各々は複数の周波数ビンを含み、処理ユニット1110は、具体的に、第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の第1の差分値を決定することであって、第1の差分値が、複数の周波数ビンにおける第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、決定することと、第1の差分値が第1のしきい値よりも大きいとき、第1の周波数帯域のサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータであると決定することであって、第1の周波数帯域が、第1のチャネル信号および第2のチャネル信号の各々のすべての周波数帯域の一部である、決定することとを行うように構成される。
場合によっては、一実施形態では、第1のチャネル信号および第2のチャネル信号の各々は複数の周波数ビンを含み、処理ユニット1110は、具体的に、第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の第2の差分値を決定することであって、第2の差分値が、複数の周波数ビンにおける第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、決定することと、第2の差分値が第2のしきい値よりも大きいとき、第1の周波数帯域のサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータであると決定することであって、第1の周波数帯域が、第1のチャネル信号および第2のチャネル信号の各々のすべての周波数帯域の一部である、決定することとを行うように構成される。
場合によっては、一実施形態では、第1のチャネル信号および第2のチャネル信号の各々は複数の周波数ビンを含み、処理ユニット1110は、具体的に、第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の第1の差分値を決定することであって、第1の差分値が、複数の周波数ビンにおける第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、決定することと、第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の第2の差分値を決定することであって、第2の差分値が、複数の周波数ビンにおける第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、決定することと、第1の差分値が第1のしきい値よりも大きく、第2の差分値が第2のしきい値よりも大きいとき、第1の周波数帯域のサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータであると決定することであって、第1の周波数帯域が、第1のチャネル信号および第2のチャネル信号の各々のすべての周波数帯域の一部である、決定することとを行うように構成される。
場合によっては、一実施形態では、第1の周波数帯域の周波数は、第1のチャネル信号および第2のチャネル信号における第1の周波数帯域とは異なる別の周波数帯域の周波数よりも小さい。
場合によっては、一実施形態では、複数の周波数ビンは、第1のチャネル信号および第2のチャネル信号の各々の第2の周波数帯域内にあり、第2の周波数帯域の周波数は、第1のチャネル信号および第2のチャネル信号における第2の周波数帯域とは異なる別の周波数帯域の周波数よりも大きい。
場合によっては、一実施形態では、処理ユニット1110は、具体的に、ダウンミックス信号のN個のサブバンドのエネルギーを決定することと、N個のサブバンドからM個のサブバンドを決定することであって、M個のサブバンドの中の任意のサブバンドのエネルギーが、M個のサブバンドを除くN個のサブバンド内のN−M個のサブバンドの中の任意のサブバンドのエネルギーよりも大きく、MとNの両方が0より大きい整数であり、MがNより小さい、決定することと、ダウンミックス信号のM個のサブバンドのエネルギーとダウンミックス信号のN−M個のサブバンドのエネルギーとの間の大小関係に基づいて、ターゲット残響ゲインパラメータを決定することとを行うように構成される。
場合によっては、一実施形態では、処理ユニット1110は、具体的に、M個のサブバンドのエネルギーの合計がN−M個のサブバンドのエネルギーの合計のL倍よりも大きいとき、第1のチャネル信号および第2のチャネル信号の第1の周波数帯域のサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータであると決定することであって、第1の周波数帯域が第1のチャネル信号および第2のチャネル信号の各々のすべての周波数帯域の一部であり、Lが0より大きい実数である、決定することとを行うように構成される。
場合によっては、一実施形態では、処理ユニット1110は、具体的に、ダウンミックス信号のN個のサブバンドのエネルギーを決定することと、N個のサブバンドからM個のサブバンドを決定することであって、M個のサブバンドの中の任意のサブバンドのエネルギーが、M個のサブバンドを除くN個のサブバンド内のN−M個のサブバンドの中の任意のサブバンドのエネルギーよりも大きい、決定することと、M個のサブバンドの中の第1のサブバンドのインデックス値がプリセットインデックス値よりも小さいとき、第1のチャネル信号および第2のチャネル信号の第1の周波数帯域のサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータであると決定することであって、第1のサブバンド内の任意の周波数ビンの周波数が、第1のサブバンドを除くM個のサブバンドの中の別のサブバンド内の任意の周波数ビンの周波数よりも大きく、第1の周波数帯域が第1のチャネル信号および第2のチャネル信号の各々のすべての周波数帯域の一部である、決定することとを行うように構成される。
場合によっては、一実施形態では、処理ユニット1110は、具体的に、N個のサブバンドからJ個のターゲットサブバンドを決定することであって、J個のターゲットサブバンドの中の任意のサブバンドのエネルギーが、J個のターゲットサブバンドとは異なる別のサブバンドのエネルギーよりも大きく、NとJの両方が0より大きい整数であり、JがNより小さい、決定することと、J個のターゲットサブバンドに対応する残響ゲインパラメータをターゲット残響ゲインパラメータとして決定することとを行うように構成される。
場合によっては、一実施形態では、ダウンミックス信号のエネルギーは、第1のチャネル信号のエネルギーおよび第2のチャネル信号のエネルギーに基づいて決定される。
図12は、本出願の一実施形態による、デコーダの概略ブロック図である。図12のデコーダ1200は、
ビットストリームを受信するように構成された取得ユニット1210であって、
取得ユニット1210が、ビットストリームに基づいて、マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号、ならびにパラメータ指示情報を取得するようにさらに構成され、パラメータ指示情報が、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内の符号化されたターゲット残響ゲインパラメータを示すために使用され、
取得ユニット1210が、パラメータ指示情報に従って、ビットストリームからターゲット残響ゲインパラメータを取得するようにさらに構成される、取得ユニット1210と、
ダウンミックス信号およびターゲット残響ゲインパラメータに基づいて、第1のチャネル信号および第2のチャネル信号を決定するように構成された処理ユニット1220と
を含む。
本出願では、エンコーダによって符号化されたターゲット残響ゲインパラメータは、パラメータ指示情報を使用して決定することができ、次いで、ターゲット残響ゲインパラメータに基づいて、第1のチャネル信号および第2のチャネル信号の対応するサブバンドに対して残響処理が実行される。
デコーダ1200は、図4のマルチチャネル信号復号方法に対応することができ、デコーダ1200は、図4のマルチチャネル信号復号方法を実行することができる。
図13は、本出願の一実施形態による、エンコーダの概略ブロック図である。図13のエンコーダ1300は、
マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号、ならびに第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータを決定するように構成された処理ユニット1310であって、
処理ユニット1310が、ダウンミックス信号のN個のサブバンドのエネルギーに基づいて、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定するようにさらに構成され、Nが0より大きい整数である、処理ユニット1310と、
ダウンミックス信号およびターゲット残響ゲインパラメータを符号化するように構成された符号化ユニット1320と
を含む。
本出願では、ダウンミックス信号の各サブバンドのエネルギーに基づいて、すべてのサブバンドから特定の数のサブバンドが直接選択され、その結果、符号化される必要がある残響ゲインパラメータをより柔軟に選択することができる。
エンコーダ1300は、図7のマルチチャネル信号符号化方法に対応することができ、エンコーダ1300は、図7のマルチチャネル信号符号化方法を実行することができる。
場合によっては、一実施形態では、処理ユニット1310は、具体的に、N個のサブバンドからJ個のターゲットサブバンドを決定することであって、J個のターゲットサブバンドの中の任意のサブバンドのエネルギーが、J個のターゲットサブバンドとは異なる別のサブバンドのエネルギーよりも大きく、NとJの両方が0より大きい整数であり、JがNより小さい、決定することと、J個のターゲットサブバンドに対応する残響ゲインパラメータをターゲット残響ゲインパラメータとして決定することとを行うように構成される。
図14は、本出願の一実施形態による、デコーダの概略ブロック図である。図14のデコーダ1400は、
ビットストリームを受信するように構成された第1の取得ユニット1410と、
ビットストリームに基づいて、マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号を決定するように構成された第1の処理ユニット1420と、
ダウンミックス信号のN個のサブバンドのエネルギーに基づいて、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内の符号化されたターゲット残響ゲインパラメータを決定するように構成された第2の処理ユニット1430であって、Nが0より大きい整数である、第2の処理ユニット1430と、
ビットストリームに基づいてターゲット残響ゲインパラメータを決定するように構成された第3の処理ユニット1440と、
ダウンミックス信号およびターゲット残響ゲインパラメータに基づいて、第1のチャネル信号および第2のチャネル信号を決定するように構成された第4の処理ユニット1450と
を含む。
本出願では、デコーダ側は、ダウンミックス信号の複数のサブバンドのエネルギーに基づいて、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内の符号化されたターゲット残響ゲインパラメータを直接決定することができ、その結果、符号化されたターゲット残響ゲインパラメータを示す指示情報を送信するためにデコーダ側によって占有されるビットが削減され、シグナリングオーバーヘッドをある程度削減することができる。
デコーダ1400は、図8のマルチチャネル信号復号方法に対応することができ、デコーダ1400は、図8のマルチチャネル信号復号方法を実行することができる。
場合によっては、一実施形態では、第1の処理ユニット1420は、具体的に、N個のサブバンドのエネルギーに基づいてN個のサブバンドからJ個のターゲットサブバンドを決定することであって、J個のターゲットサブバンドの中の任意のサブバンドのエネルギーが、J個のターゲットサブバンドとは異なる別のサブバンドのエネルギーよりも大きく、NとJの両方が0より大きい整数であり、JがNより小さい、決定することと、J個のターゲットサブバンドに対応する残響ゲインパラメータをターゲット残響ゲインパラメータとして決定することとを行うように構成される。
図15は、本出願の一実施形態による、エンコーダの概略ブロック図である。図15のエンコーダ1500は、
プログラムを記憶するように構成されたメモリ1510と、
プログラムを実行するように構成されたプロセッサ1520であって、プログラムが実行されると、プロセッサ1520が、マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号、ならびに第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータを決定することと、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定することと、パラメータ指示情報を生成することであって、パラメータ指示情報が、ターゲット残響ゲインパラメータに対応するサブバンドを示すために使用される、生成することと、ビットストリームを生成するために、ターゲット残響ゲインパラメータ、パラメータ指示情報、およびダウンミックス信号を符号化することとを行うように構成される、プロセッサ1520と
を含む。
本出願では、第1のチャネル信号および第2のチャネル信号が符号化されているとき、第1のチャネル信号および第2のチャネル信号のいくつかのサブバンドのみに対応する残響ゲインパラメータが符号化されてよい。第1のチャネル信号および第2のチャネル信号のすべてのサブバンドに対応する残響ゲインパラメータが符号化される必要がある従来技術の方式と比較して、ビットオーバーヘッドをある程度低減することができ、符号化効率を改善することができる。具体的には、いくつかのサブバンドに対応する残響ゲインパラメータが符号化される場合、別のパラメータを符号化するか、またはダウンミックス信号により多くのビットを割り当てるために、大量の節約されたビットを使用することができ、それにより、全体的な符号化性能が改善される。
エンコーダ1500は、図3のマルチチャネル信号符号化方法に対応することができ、エンコーダ1500は、図3のマルチチャネル信号符号化方法を実行することができる。
場合によっては、一実施形態では、プロセッサ1520は、具体的に、第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間のコヒーレンス、および第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間のコヒーレンスのうちの少なくとも1つに基づいて、ターゲット残響ゲインパラメータを決定するように構成される。
場合によっては、一実施形態では、第1のチャネル信号および第2のチャネル信号の各々は複数の周波数ビンを含み、プロセッサ1520は、具体的に、第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の第1の差分値を決定することであって、第1の差分値が、複数の周波数ビンにおける第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、決定することと、第1の差分値が第1のしきい値よりも大きいとき、第1の周波数帯域のサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータであると決定することであって、第1の周波数帯域が、第1のチャネル信号および第2のチャネル信号の各々のすべての周波数帯域の一部である、決定することとを行うように構成される。
場合によっては、一実施形態では、第1のチャネル信号および第2のチャネル信号の各々は複数の周波数ビンを含み、プロセッサ1520は、具体的に、第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の第2の差分値を決定することであって、第2の差分値が、複数の周波数ビンにおける第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、決定することと、第2の差分値が第2のしきい値よりも大きいとき、第1の周波数帯域のサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータであると決定することであって、第1の周波数帯域が、第1のチャネル信号および第2のチャネル信号の各々のすべての周波数帯域の一部である、決定することとを行うように構成される。
場合によっては、一実施形態では、第1のチャネル信号および第2のチャネル信号の各々は複数の周波数ビンを含み、プロセッサ1520は、具体的に、第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の第1の差分値を決定することであって、第1の差分値が、複数の周波数ビンにおける第1のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、決定することと、第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の第2の差分値を決定することであって、第2の差分値が、複数の周波数ビンにおける第2のチャネル信号のエネルギーとダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、決定することと、第1の差分値が第1のしきい値よりも大きく、第2の差分値が第2のしきい値よりも大きいとき、第1の周波数帯域のサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータであると決定することであって、第1の周波数帯域が、第1のチャネル信号および第2のチャネル信号の各々のすべての周波数帯域の一部である、決定することとを行うように構成される。
場合によっては、一実施形態では、第1の周波数帯域の周波数は、第1のチャネル信号および第2のチャネル信号における第1の周波数帯域とは異なる別の周波数帯域の周波数よりも小さい。
場合によっては、一実施形態では、複数の周波数ビンは、第1のチャネル信号および第2のチャネル信号の各々の第2の周波数帯域内にあり、第2の周波数帯域の周波数は、第1のチャネル信号および第2のチャネル信号における第2の周波数帯域とは異なる別の周波数帯域の周波数よりも大きい。
場合によっては、一実施形態では、プロセッサ1520は、具体的に、ダウンミックス信号のN個のサブバンドのエネルギーを決定することと、N個のサブバンドからM個のサブバンドを決定することであって、M個のサブバンドの中の任意のサブバンドのエネルギーが、M個のサブバンドを除くN個のサブバンド内のN−M個のサブバンドの中の任意のサブバンドのエネルギーよりも大きく、MとNの両方が0より大きい整数であり、MがNより小さい、決定することと、M個のサブバンドのエネルギーとN−M個のサブバンドのエネルギーとの間の大小関係に基づいて、ターゲット残響ゲインパラメータを決定することとを行うように構成される。
場合によっては、一実施形態では、プロセッサ1520は、具体的に、M個のサブバンドのエネルギーの合計がN−M個のサブバンドのエネルギーの合計のL倍よりも大きいとき、第1のチャネル信号および第2のチャネル信号の第1の周波数帯域のサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータであると決定することであって、第1の周波数帯域が第1のチャネル信号および第2のチャネル信号の各々のすべての周波数帯域の一部であり、Lが0より大きい実数である、決定することとを行うように構成される。
場合によっては、一実施形態では、プロセッサ1520は、具体的に、ダウンミックス信号のN個のサブバンドのエネルギーを決定することと、N個のサブバンドからM個のサブバンドを決定することであって、M個のサブバンドの中の任意のサブバンドのエネルギーが、M個のサブバンドを除くN個のサブバンド内のN−M個のサブバンドの中の任意のサブバンドのエネルギーよりも大きい、決定することと、M個のサブバンドの中の第1のサブバンドのインデックス値がプリセットインデックス値よりも小さいとき、第1のチャネル信号および第2のチャネル信号の第1の周波数帯域のサブバンドに対応する残響ゲインパラメータがターゲット残響ゲインパラメータであると決定することであって、第1のサブバンド内の任意の周波数ビンの周波数が、第1のサブバンドを除くM個のサブバンドの中の別のサブバンド内の任意の周波数ビンの周波数よりも大きく、第1の周波数帯域が第1のチャネル信号および第2のチャネル信号の各々のすべての周波数帯域の一部である、決定することとを行うように構成される。
場合によっては、一実施形態では、プロセッサ1520は、具体的に、ダウンミックス信号のN個のサブバンドのエネルギーを決定することと、N個のサブバンドのエネルギーに基づいてN個のサブバンドからJ個のターゲットサブバンドを決定することであって、J個のターゲットサブバンドの中の任意のサブバンドのエネルギーが、J個のターゲットサブバンドとは異なる別のサブバンドのエネルギーよりも大きく、NとJの両方が0より大きい整数であり、JがNより小さい、決定することと、J個のターゲットサブバンドに対応する残響ゲインパラメータをターゲット残響ゲインパラメータとして決定することとを行うように構成される。
場合によっては、一実施形態では、ダウンミックス信号のエネルギーは、第1のチャネル信号のエネルギーおよび第2のチャネル信号のエネルギーに基づいて決定される。
図16は、本出願の一実施形態による、デコーダの概略ブロック図である。図16のデコーダ1600は、
プログラムを記憶するように構成されたメモリ1610と、
プログラムを実行するように構成されたプロセッサ1620であって、プログラムが実行されると、プロセッサ1620が、ビットストリームを受信することと、ビットストリームに基づいて、マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号、ならびにパラメータ指示情報を取得することであって、パラメータ指示情報が、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内の符号化されたターゲット残響ゲインパラメータを示すために使用される、取得することと、パラメータ指示情報に従って、ビットストリームからターゲット残響ゲインパラメータを取得することと、ダウンミックス信号およびターゲット残響ゲインパラメータに基づいて、第1のチャネル信号および第2のチャネル信号を決定することとを行うように構成される、プロセッサ1620と
を含む。
本出願では、エンコーダによって符号化されたターゲット残響ゲインパラメータは、パラメータ指示情報を使用して決定することができ、次いで、ターゲット残響ゲインパラメータに基づいて、第1のチャネル信号および第2のチャネル信号の対応するサブバンドに対して残響処理が実行される。
デコーダ1600は、図4のマルチチャネル信号復号方法に対応することができ、デコーダ1600は、図4のマルチチャネル信号復号方法を実行することができる。
図17は、本出願の一実施形態による、エンコーダの概略ブロック図である。図17のエンコーダ1700は、
プログラムを記憶するように構成されたメモリ1710と、
プログラムを実行するように構成されたプロセッサ1720であって、プログラムが実行されると、プロセッサ1720が、マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号、ならびに第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータを決定することと、ダウンミックス信号のN個のサブバンドのエネルギーに基づいて、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定することであって、Nが0より大きい整数である、決定することと、ダウンミックス信号およびターゲット残響ゲインパラメータを符号化することとを行うように構成される、プロセッサ1720と
を含む。
本出願では、ダウンミックス信号の各サブバンドのエネルギーに基づいて、すべてのサブバンドから特定の数のサブバンドが直接選択され、その結果、符号化される必要がある残響ゲインパラメータをより柔軟に選択することができる。
エンコーダ1700は、図7のマルチチャネル信号符号化方法に対応することができ、エンコーダ1700は、図7のマルチチャネル信号符号化方法を実行することができる。
場合によっては、一実施形態では、プロセッサ1720は、具体的に、N個のサブバンドのエネルギーに基づいてN個のサブバンドからJ個のターゲットサブバンドを決定することであって、J個のターゲットサブバンドの中の任意のサブバンドのエネルギーが、J個のターゲットサブバンドとは異なる別のサブバンドのエネルギーよりも大きく、NとJの両方が0より大きい整数であり、JがNより小さい、決定することと、J個のターゲットサブバンドに対応する残響ゲインパラメータをターゲット残響ゲインパラメータとして決定することとを行うように構成される。
図18は、本出願の一実施形態による、デコーダの概略ブロック図である。図18のデコーダ1800は、
プログラムを記憶するように構成されたメモリ1810と、
プログラムを実行するように構成されたプロセッサ1820であって、プログラムが実行されると、プロセッサ1820が、ビットストリームを受信することと、ビットストリームに基づいて、マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号を決定することと、ダウンミックス信号のN個のサブバンドのエネルギーに基づいて、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内の符号化されたターゲット残響ゲインパラメータを決定することであって、Nが0より大きい整数である、決定することと、ビットストリームに基づいてターゲット残響ゲインパラメータを決定することと、ダウンミックス信号およびターゲット残響ゲインパラメータに基づいて、第1のチャネル信号および第2のチャネル信号を決定することとを行うように構成される、プロセッサ1820と
を含む。
本出願では、デコーダ側は、ダウンミックス信号の複数のサブバンドのエネルギーに基づいて、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内の符号化されたターゲット残響ゲインパラメータを直接決定することができ、その結果、符号化されたターゲット残響ゲインパラメータを示す指示情報を送信するためにデコーダ側によって占有されるビットが削減され、シグナリングオーバーヘッドをある程度削減することができる。
デコーダ1800は、図8のマルチチャネル信号復号方法に対応することができ、デコーダ1800は、図8のマルチチャネル信号復号方法を実行することができる。
場合によっては、一実施形態では、プロセッサ1820は、具体的に、N個のサブバンドのエネルギーに基づいてN個のサブバンドからJ個のターゲットサブバンドを決定することであって、J個のターゲットサブバンドの中の任意のサブバンドのエネルギーが、J個のターゲットサブバンドとは異なる別のサブバンドのエネルギーよりも大きく、NとJの両方が0より大きい整数であり、JがNより小さい、決定することと、J個のターゲットサブバンドに対応する残響ゲインパラメータをターゲット残響ゲインパラメータとして決定することとを行うように構成される。
本明細書に開示された実施形態に記載された例と組み合わせて、ユニットおよびアルゴリズムステップは、電子ハードウェア、またはコンピュータソフトウェアと電子ハードウェアの組合せによって実装されてもよいことを当業者なら認識されよう。機能がハードウェアによって実行されるか、またはソフトウェアによって実行されるかは、技術的解決策の特定の用途および設計制約に依存する。当業者は、様々な方法を使用して、特定の用途ごとに記載された機能を実装することができるが、その実装形態が本出願の範囲を超えると考えられるべきではない。
便利で簡潔な説明のために、上記のシステム、装置、およびユニットの詳細な動作プロセスについては、上記の方法実施形態における対応するプロセスを参照されたく、本明細書では詳細は再び記載されないことを当業者なら明確に理解されよう。
本出願において提供されたいくつかの実施形態では、開示されたシステム、装置、および方法は他の方式で実装されてもよいことを理解されたい。たとえば、記載された装置実施形態は一例にすぎない。たとえば、ユニット分割は論理的な機能分割にすぎず、実際の実装形態では他の分割であってもよい。たとえば、複数のユニットまたは構成要素は組み合わされるか、もしくは別のシステムに統合されてもよく、または、いくつかの機能は無視されるか、もしくは実行されなくてもよい。加えて、表示または説明された相互結合または直接結合または通信接続は、いくつかのインターフェースを使用することによって実装されてもよい。装置間またはユニット間の間接結合または通信接続は、電気、機械、または他の形態で実装されてもよい。
別々の部分として記載されたユニットは、物理的に分かれていてもいなくてもよく、ユニットとして表示された部分は、物理ユニットであってもそうでなくてもよく、1つの場所に配置されてもよく、または複数のネットワークユニット上に分散されてもよい。ユニットの一部またはすべては、実施形態の解決策の目的を達成するために、実際の要件に基づいて選択されてもよい。
加えて、本出願の実施形態における機能ユニットは1つの処理ユニットに統合されてもよく、またはユニットの各々は物理的に単独で存在してもよく、または2つ以上のユニットが1つのユニットに統合される。
機能がソフトウェア機能ユニットの形態で実装され、独立した製品として販売または使用されるとき、機能はコンピュータ可読記憶媒体に記憶されてもよい。そのような理解に基づいて、本出願の技術的解決策は本質的に、または従来技術に寄与する部分は、または技術的解決策の一部は、ソフトウェア製品の形態で実装されてもよい。コンピュータソフトウェア製品は、記憶媒体に記憶され、本出願の実施形態に記載された方法のステップのうちのすべてまたはいくつかを実行するように、(パーソナルコンピュータ、サーバ、ネットワークデバイスなどであってよい)コンピュータデバイスに命令するためのいくつかの命令を含む。前述の記憶媒体には、USBフラッシュドライブ、リムーバブルハードディスク、読取り専用メモリ(Read−Only Memory、ROM)、ランダムアクセスメモリ(Random Access Memory、RAM)、磁気ディスク、または光ディスクなどの、プログラムコードを記憶することができる任意の媒体が含まれる。
上記の説明は、本出願の特定の実装形態にすぎず、本出願の保護範囲を限定するものではない。本出願に開示された技術的範囲内で当業者が容易に考え付くいかなる変形または置換も、本出願の保護範囲内に入るべきである。したがって、本出願の保護範囲は、特許請求の範囲の保護範囲に従うべきである。
1100 エンコーダ
1110 処理ユニット
1120 符号化ユニット
1200 デコーダ
1210 取得ユニット
1220 処理ユニット
1300 エンコーダ
1310 処理ユニット
1320 符号化ユニット
1400 デコーダ
1410 第1の取得ユニット
1420 第1の処理ユニット
1430 第2の処理ユニット
1440 第3の処理ユニット
1450 第4の処理ユニット
1500 エンコーダ
1510 メモリ
1520 プロセッサ
1600 デコーダ
1610 メモリ
1620 プロセッサ
1700 エンコーダ
1710 メモリ
1720 プロセッサ
1800 デコーダ
1810 メモリ
1820 プロセッサ

Claims (16)

  1. マルチチャネル信号符号化方法であって、
    マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号、ならびに前記第1のチャネル信号および前記第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータを決定するステップと、
    前記第1のチャネル信号および前記第2のチャネル信号の前記異なるサブバンドに対応する前記残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定するステップと、
    パラメータ指示情報を生成するステップであって、前記パラメータ指示情報が、前記ターゲット残響ゲインパラメータに対応するサブバンドを示すために使用される、ステップと、
    ビットストリームを生成するために、前記ターゲット残響ゲインパラメータ、前記パラメータ指示情報、および前記ダウンミックス信号を符号化するステップと
    を備え、
    前記第1のチャネル信号および前記第2のチャネル信号の前記異なるサブバンドに対応する前記残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定する前記ステップが、
    前記第1のチャネル信号のエネルギーと前記ダウンミックス信号のエネルギーとの間のコヒーレンス、および前記第2のチャネル信号のエネルギーと前記ダウンミックス信号の前記エネルギーとの間のコヒーレンスのうちの少なくとも1つに基づいて、前記ターゲット残響ゲインパラメータを決定するステップ
    を備える、
    マルチチャネル信号符号化方法。
  2. 前記第1のチャネル信号および前記第2のチャネル信号の各々が複数の周波数ビンを備え、
    前記第1のチャネル信号のエネルギーと前記ダウンミックス信号のエネルギーとの間のコヒーレンス、および前記第2のチャネル信号のエネルギーと前記ダウンミックス信号の前記エネルギーとの間のコヒーレンスのうちの少なくとも1つに基づいて、前記ターゲット残響ゲインパラメータを決定する前記ステップが、
    前記第1のチャネル信号の前記エネルギーと前記ダウンミックス信号の前記エネルギーとの間の第1の差分値を決定するステップであって、前記第1の差分値が、前記複数の周波数ビンにおける前記第1のチャネル信号のエネルギーと前記ダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、ステップと、
    前記第1の差分値が第1のしきい値よりも大きいとき、第1の周波数帯域のサブバンドに対応する残響ゲインパラメータが前記ターゲット残響ゲインパラメータであると決定するステップであって、前記第1の周波数帯域が、前記第1のチャネル信号および前記第2のチャネル信号の各々のすべての周波数帯域の一部である、ステップと
    を備える、請求項1に記載の方法。
  3. 前記第1のチャネル信号および前記第2のチャネル信号の各々が複数の周波数ビンを備え、
    前記第1のチャネル信号のエネルギーと前記ダウンミックス信号のエネルギーとの間のコヒーレンス、および前記第2のチャネル信号のエネルギーと前記ダウンミックス信号の前記エネルギーとの間のコヒーレンスのうちの少なくとも1つに基づいて、前記ターゲット残響ゲインパラメータを決定する前記ステップが、
    前記第2のチャネル信号の前記エネルギーと前記ダウンミックス信号の前記エネルギーとの間の第2の差分値を決定するステップであって、前記第2の差分値が、前記複数の周波数ビンにおける前記第2のチャネル信号のエネルギーと前記ダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、ステップと、
    前記第2の差分値が第2のしきい値よりも大きいとき、第1の周波数帯域のサブバンドに対応する残響ゲインパラメータが前記ターゲット残響ゲインパラメータであると決定するステップであって、前記第1の周波数帯域が、前記第1のチャネル信号および前記第2のチャネル信号の各々のすべての周波数帯域の一部である、ステップと
    を備える、請求項1に記載の方法。
  4. 前記第1のチャネル信号および前記第2のチャネル信号の各々が複数の周波数ビンを備え、
    前記第1のチャネル信号のエネルギーと前記ダウンミックス信号のエネルギーとの間のコヒーレンス、および前記第2のチャネル信号のエネルギーと前記ダウンミックス信号の前記エネルギーとの間のコヒーレンスのうちの少なくとも1つに基づいて、前記ターゲット残響ゲインパラメータを決定する前記ステップが、
    前記第1のチャネル信号の前記エネルギーと前記ダウンミックス信号の前記エネルギーとの間の第1の差分値を決定するステップであって、前記第1の差分値が、前記複数の周波数ビンにおける前記第1のチャネル信号のエネルギーと前記ダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、ステップと、
    前記第2のチャネル信号の前記エネルギーと前記ダウンミックス信号の前記エネルギーとの間の第2の差分値を決定するステップであって、前記第2の差分値が、前記複数の周波数ビンにおける前記第2のチャネル信号のエネルギーと前記ダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、ステップと、
    前記第1の差分値が第1のしきい値よりも大きく、前記第2の差分値が第2のしきい値よりも大きいとき、第1の周波数帯域のサブバンドに対応する残響ゲインパラメータが前記ターゲット残響ゲインパラメータであると決定するステップであって、前記第1の周波数帯域が、前記第1のチャネル信号および前記第2のチャネル信号の各々のすべての周波数帯域の一部である、ステップと
    を備える、請求項1に記載の方法。
  5. 前記第1の周波数帯域の周波数が、前記第1のチャネル信号および前記第2のチャネル信号における前記第1の周波数帯域とは異なる別の周波数帯域の周波数よりも小さい、請求項2から4のいずれか一項に記載の方法。
  6. 前記複数の周波数ビンが、前記第1のチャネル信号および前記第2のチャネル信号の各々の第2の周波数帯域内にあり、前記第2の周波数帯域の周波数が、前記第1のチャネル信号および前記第2のチャネル信号における前記第2の周波数帯域とは異なる別の周波数帯域の周波数よりも大きい、請求項2から5のいずれか一項に記載の方法。
  7. 前記ダウンミックス信号の前記エネルギーが、前記第1のチャネル信号の前記エネルギーおよび前記第2のチャネル信号の前記エネルギーに基づいて決定される、請求項1から6のいずれか一項に記載の方法。
  8. マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号、ならびに前記第1のチャネル信号および前記第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータを決定するように構成された処理ユニットであって、
    前記処理ユニットが、前記第1のチャネル信号および前記第2のチャネル信号の前記異なるサブバンドに対応する前記残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定するようにさらに構成され、
    前記処理ユニットが、パラメータ指示情報を生成するようにさらに構成され、前記パラメータ指示情報が、前記ターゲット残響ゲインパラメータに対応するサブバンドを示すために使用される、処理ユニットと、
    ビットストリームを生成するために、前記ターゲット残響ゲインパラメータ、前記パラメータ指示情報、および前記ダウンミックス信号を符号化するように構成された符号化ユニットと
    を備え、
    前記処理ユニットが、
    前記第1のチャネル信号のエネルギーと前記ダウンミックス信号のエネルギーとの間のコヒーレンス、および前記第2のチャネル信号のエネルギーと前記ダウンミックス信号の前記エネルギーとの間のコヒーレンスのうちの少なくとも1つに基づいて、前記ターゲット残響ゲインパラメータを決定する
    ように構成される、
    エンコーダ。
  9. 前記第1のチャネル信号および前記第2のチャネル信号の各々が複数の周波数ビンを備え、前記処理ユニットが、更に、
    前記第1のチャネル信号の前記エネルギーと前記ダウンミックス信号の前記エネルギーとの間の第1の差分値を決定することであって、前記第1の差分値が、前記複数の周波数ビンにおける前記第1のチャネル信号のエネルギーと前記ダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、決定することと、
    前記第1の差分値が第1のしきい値よりも大きいとき、第1の周波数帯域のサブバンドに対応する残響ゲインパラメータが前記ターゲット残響ゲインパラメータであると決定することであって、前記第1の周波数帯域が、前記第1のチャネル信号および前記第2のチャネル信号の各々のすべての周波数帯域の一部である、決定することと
    を行うように構成される、請求項8に記載のエンコーダ。
  10. 前記第1のチャネル信号および前記第2のチャネル信号の各々が複数の周波数ビンを備え、前記処理ユニットが、更に、
    前記第2のチャネル信号の前記エネルギーと前記ダウンミックス信号の前記エネルギーとの間の第2の差分値を決定することであって、前記第2の差分値が、前記複数の周波数ビンにおける前記第2のチャネル信号のエネルギーと前記ダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、決定することと、
    前記第2の差分値が第2のしきい値よりも大きいとき、第1の周波数帯域のサブバンドに対応する残響ゲインパラメータが前記ターゲット残響ゲインパラメータであると決定することであって、前記第1の周波数帯域が、前記第1のチャネル信号および前記第2のチャネル信号の各々のすべての周波数帯域の一部である、決定することと
    を行うように構成される、請求項8に記載のエンコーダ。
  11. 前記第1のチャネル信号および前記第2のチャネル信号の各々が複数の周波数ビンを備え、前記処理ユニットが、更に、
    前記第1のチャネル信号の前記エネルギーと前記ダウンミックス信号の前記エネルギーとの間の第1の差分値を決定することであって、前記第1の差分値が、前記複数の周波数ビンにおける前記第1のチャネル信号のエネルギーと前記ダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、決定することと、
    前記第2のチャネル信号の前記エネルギーと前記ダウンミックス信号の前記エネルギーとの間の第2の差分値を決定することであって、前記第2の差分値が、前記複数の周波数ビンにおける前記第2のチャネル信号のエネルギーと前記ダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、決定することと、
    前記第1の差分値が前記第1のしきい値よりも大きく、前記第2の差分値が第2のしきい値よりも大きいとき、第1の周波数帯域のサブバンドに対応する残響ゲインパラメータが前記ターゲット残響ゲインパラメータであると決定することであって、前記第1の周波数帯域が、前記第1のチャネル信号および前記第2のチャネル信号の各々のすべての周波数帯域の一部である、決定することと
    を行うように構成される、請求項8に記載のエンコーダ。
  12. 前記第1の周波数帯域の周波数が、前記第1のチャネル信号および前記第2のチャネル信号における前記第1の周波数帯域とは異なる別の周波数帯域の周波数よりも小さい、請求項9から11のいずれか一項に記載のエンコーダ。
  13. 前記複数の周波数ビンが、前記第1のチャネル信号および前記第2のチャネル信号の各々の第2の周波数帯域内にあり、前記第2の周波数帯域の周波数が、前記第1のチャネル信号および前記第2のチャネル信号における前記第2の周波数帯域とは異なる別の周波数帯域の周波数よりも大きい、請求項9から12のいずれか一項に記載のエンコーダ。
  14. 前記ダウンミックス信号の前記エネルギーが、前記第1のチャネル信号の前記エネルギーおよび前記第2のチャネル信号の前記エネルギーに基づいて決定される、請求項8から13のいずれか一項に記載のエンコーダ。
  15. プログラムが記録されたコンピュータ可読記憶媒体であって、前記プログラムが前記コンピュータに請求項1から7のいずれかに記載の方法を実行させる、コンピュータ可読記憶媒体。
  16. コンピュータに請求項1から7のいずれかに記載の方法を実行させるように構成された、媒体に格納されたコンピュータプログラム。
JP2019555975A 2017-04-12 2018-03-01 マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ Active JP6874151B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2021072013A JP7106711B2 (ja) 2017-04-12 2021-04-21 マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ
JP2022111786A JP7379602B2 (ja) 2017-04-12 2022-07-12 マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ
JP2023186595A JP2024012444A (ja) 2017-04-12 2023-10-31 マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201710236773.3 2017-04-12
CN201710236773.3A CN108694955B (zh) 2017-04-12 2017-04-12 多声道信号的编解码方法和编解码器
PCT/CN2018/077790 WO2018188424A1 (zh) 2017-04-12 2018-03-01 多声道信号的编解码方法和编解码器

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2021072013A Division JP7106711B2 (ja) 2017-04-12 2021-04-21 マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ

Publications (2)

Publication Number Publication Date
JP2020516955A JP2020516955A (ja) 2020-06-11
JP6874151B2 true JP6874151B2 (ja) 2021-05-19

Family

ID=63792975

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2019555975A Active JP6874151B2 (ja) 2017-04-12 2018-03-01 マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ
JP2021072013A Active JP7106711B2 (ja) 2017-04-12 2021-04-21 マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ
JP2022111786A Active JP7379602B2 (ja) 2017-04-12 2022-07-12 マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ
JP2023186595A Pending JP2024012444A (ja) 2017-04-12 2023-10-31 マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ

Family Applications After (3)

Application Number Title Priority Date Filing Date
JP2021072013A Active JP7106711B2 (ja) 2017-04-12 2021-04-21 マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ
JP2022111786A Active JP7379602B2 (ja) 2017-04-12 2022-07-12 マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ
JP2023186595A Pending JP2024012444A (ja) 2017-04-12 2023-10-31 マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ

Country Status (7)

Country Link
US (4) US10827297B2 (ja)
EP (2) EP3605847B1 (ja)
JP (4) JP6874151B2 (ja)
KR (4) KR20240042158A (ja)
CN (2) CN108694955B (ja)
BR (1) BR112019021361A2 (ja)
WO (1) WO2018188424A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108694955B (zh) * 2017-04-12 2020-11-17 华为技术有限公司 多声道信号的编解码方法和编解码器
GB201718341D0 (en) 2017-11-06 2017-12-20 Nokia Technologies Oy Determination of targeted spatial audio parameters and associated spatial audio playback
GB2572650A (en) 2018-04-06 2019-10-09 Nokia Technologies Oy Spatial audio parameters and associated spatial audio playback
GB2574239A (en) 2018-05-31 2019-12-04 Nokia Technologies Oy Signalling of spatial audio parameters
CN111988726A (zh) * 2019-05-06 2020-11-24 深圳市三诺数字科技有限公司 一种立体声合成单声道的方法和系统
CN111654745B (zh) * 2020-06-08 2022-10-14 海信视像科技股份有限公司 多声道的信号处理方法及显示设备
EP4243015A4 (en) 2021-01-27 2024-04-17 Samsung Electronics Co., Ltd. AUDIO PROCESSING APPARATUS AND METHOD
CN113132881B (zh) * 2021-04-16 2022-07-19 深圳木芯科技有限公司 基于多麦克风自适应控制佩戴者声音放大程度的方法
JPWO2023008276A1 (ja) 2021-07-26 2023-02-02
CN114258568A (zh) * 2021-11-26 2022-03-29 北京小米移动软件有限公司 一种立体声音频信号处理方法、装置、编码设备、解码设备及存储介质
GB2616280A (en) * 2022-03-02 2023-09-06 Nokia Technologies Oy Spatial rendering of reverberation

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5731767A (en) * 1994-02-04 1998-03-24 Sony Corporation Information encoding method and apparatus, information decoding method and apparatus, information recording medium, and information transmission method
US5960390A (en) 1995-10-05 1999-09-28 Sony Corporation Coding method for using multi channel audio signals
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
KR101049751B1 (ko) 2003-02-11 2011-07-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
EP1768107B1 (en) * 2004-07-02 2016-03-09 Panasonic Intellectual Property Corporation of America Audio signal decoding device
CN101010724B (zh) * 2004-08-27 2011-05-25 松下电器产业株式会社 音频编码器
SE0402650D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
KR20060109297A (ko) * 2005-04-14 2006-10-19 엘지전자 주식회사 오디오 신호의 인코딩/디코딩 방법 및 장치
JP5053849B2 (ja) * 2005-09-01 2012-10-24 パナソニック株式会社 マルチチャンネル音響信号処理装置およびマルチチャンネル音響信号処理方法
US8019614B2 (en) 2005-09-02 2011-09-13 Panasonic Corporation Energy shaping apparatus and energy shaping method
FR2897212A1 (fr) * 2006-02-09 2007-08-10 France Telecom Procede de codage d'un signal audio source, dispositif de codage, procede de decodage, signal, support de donnees, produits programme d'ordinateur correspondants
KR20070088958A (ko) * 2006-02-27 2007-08-30 한국전자통신연구원 다채널 오디오 신호 시각화 방법과 공간큐를 이용한음상정보 변환 방법 및 그 장치
EP3712888B1 (en) 2007-03-30 2024-05-08 Electronics and Telecommunications Research Institute Apparatus and method for coding and decoding multi object audio signal with multi channel
CN101350197B (zh) * 2007-07-16 2011-05-11 华为技术有限公司 立体声音频编/解码方法及编/解码器
CN100571043C (zh) * 2007-11-06 2009-12-16 武汉大学 一种空间参数立体声编解码方法及其装置
KR101444102B1 (ko) * 2008-02-20 2014-09-26 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
KR101108060B1 (ko) 2008-09-25 2012-01-25 엘지전자 주식회사 신호 처리 방법 및 이의 장치
WO2010036059A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
JP5524237B2 (ja) * 2008-12-19 2014-06-18 ドルビー インターナショナル アーベー 空間キューパラメータを用いてマルチチャンネルオーディオ信号に反響を適用する方法と装置
WO2011080916A1 (ja) * 2009-12-28 2011-07-07 パナソニック株式会社 音声符号化装置および音声符号化方法
JP5299327B2 (ja) 2010-03-17 2013-09-25 ソニー株式会社 音声処理装置、音声処理方法、およびプログラム
PL2671222T3 (pl) * 2011-02-02 2016-08-31 Ericsson Telefon Ab L M Określanie międzykanałowej różnicy czasu wielokanałowego sygnału audio
JP5737077B2 (ja) * 2011-08-30 2015-06-17 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
KR101842258B1 (ko) 2011-09-14 2018-03-27 삼성전자주식회사 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치
EP2717262A1 (en) * 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding
CN108806706B (zh) 2013-01-15 2022-11-15 韩国电子通信研究院 处理信道信号的编码/解码装置及方法
US8804971B1 (en) * 2013-04-30 2014-08-12 Dolby International Ab Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio
EP2973551B1 (en) 2013-05-24 2017-05-03 Dolby International AB Reconstruction of audio scenes from a downmix
EP2840811A1 (en) * 2013-07-22 2015-02-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for processing an audio signal; signal processing unit, binaural renderer, audio encoder and audio decoder
US10049683B2 (en) 2013-10-21 2018-08-14 Dolby International Ab Audio encoder and decoder
WO2015099429A1 (ko) * 2013-12-23 2015-07-02 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법, 이를 위한 파라메터화 장치 및 오디오 신호 처리 장치
JP2017058696A (ja) * 2016-12-09 2017-03-23 ホアウェイ・テクノロジーズ・カンパニー・リミテッド インターチャネル差分推定方法及び空間オーディオ符号化装置
CN108665902B (zh) * 2017-03-31 2020-12-01 华为技术有限公司 多声道信号的编解码方法和编解码器
CN108694955B (zh) 2017-04-12 2020-11-17 华为技术有限公司 多声道信号的编解码方法和编解码器

Also Published As

Publication number Publication date
EP3605847B1 (en) 2024-06-19
US20220046376A1 (en) 2022-02-10
US10827297B2 (en) 2020-11-03
JP2021121853A (ja) 2021-08-26
US20200045494A1 (en) 2020-02-06
KR20210094143A (ko) 2021-07-28
EP3605847A1 (en) 2020-02-05
JP2024012444A (ja) 2024-01-30
US20210014632A1 (en) 2021-01-14
JP2020516955A (ja) 2020-06-11
US20240056764A1 (en) 2024-02-15
EP4365894A3 (en) 2024-07-17
JP7379602B2 (ja) 2023-11-14
KR20220106858A (ko) 2022-07-29
EP4365894A2 (en) 2024-05-08
US11178505B2 (en) 2021-11-16
KR20190134752A (ko) 2019-12-04
BR112019021361A2 (pt) 2020-05-05
KR102281822B1 (ko) 2021-07-26
CN108694955A (zh) 2018-10-23
EP3605847A4 (en) 2020-03-25
CN108694955B (zh) 2020-11-17
KR20240042158A (ko) 2024-04-01
JP7106711B2 (ja) 2022-07-26
JP2022160440A (ja) 2022-10-19
WO2018188424A1 (zh) 2018-10-18
KR102424184B1 (ko) 2022-07-25
CN110495105A (zh) 2019-11-22
CN110495105B (zh) 2021-03-30
US11832087B2 (en) 2023-11-28

Similar Documents

Publication Publication Date Title
JP6874151B2 (ja) マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ
JP7035154B2 (ja) マルチチャネル信号符号化方法、マルチチャネル信号復号化方法、符号器、及び復号器
KR20200035306A (ko) 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191121

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201019

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210114

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210322

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210421

R150 Certificate of patent or registration of utility model

Ref document number: 6874151

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250