JP6874151B2 - マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ - Google Patents
マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ Download PDFInfo
- Publication number
- JP6874151B2 JP6874151B2 JP2019555975A JP2019555975A JP6874151B2 JP 6874151 B2 JP6874151 B2 JP 6874151B2 JP 2019555975 A JP2019555975 A JP 2019555975A JP 2019555975 A JP2019555975 A JP 2019555975A JP 6874151 B2 JP6874151 B2 JP 6874151B2
- Authority
- JP
- Japan
- Prior art keywords
- channel signal
- energy
- signal
- reverberation gain
- channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 150
- 238000012545 processing Methods 0.000 claims description 72
- 238000004590 computer program Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 16
- 230000005236 sound signal Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 230000011664 signaling Effects 0.000 description 4
- 208000029523 Interstitial Lung disease Diseases 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000009499 grossing Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 208000024875 Infantile dystonia-parkinsonism Diseases 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000030808 detection of mechanical stimulus involved in sensory perception of sound Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 208000001543 infantile parkinsonism-dystonia Diseases 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K15/00—Acoustics not otherwise provided for
- G10K15/08—Arrangements for producing a reverberation or echo sound
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3059—Digital compression and data reduction techniques where the original information is represented by a subset or similar information, e.g. lossy compression
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/305—Electronic adaptation of stereophonic audio signals to reverberation of the listening space
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/60—General implementation details not specific to a particular type of compression
- H03M7/6047—Power optimization with respect to the encoder, decoder, storage or transmission
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Magnetic Resonance Imaging Apparatus (AREA)
- Apparatus For Radiation Diagnosis (AREA)
Description
第1の差分値が第1のしきい値以下であり、第2の差分値が第2のしきい値以下であるとき、第1のチャネル信号および第2のチャネル信号のすべてのサブバンドに対応する残響ゲインパラメータをターゲット残響ゲインパラメータとして決定するステップ
をさらに含む。
マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号、ならびに第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータを決定するように構成された処理ユニット1110であって、
処理ユニット1110が、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定するようにさらに構成され、
処理ユニット1110が、パラメータ指示情報を生成するようにさらに構成され、パラメータ指示情報が、ターゲット残響ゲインパラメータに対応するサブバンドを示すために使用される、処理ユニット1110と、
ビットストリームを生成するために、ターゲット残響ゲインパラメータ、パラメータ指示情報、およびダウンミックス信号を符号化するように構成された符号化ユニット1120と
を含む。
ビットストリームを受信するように構成された取得ユニット1210であって、
取得ユニット1210が、ビットストリームに基づいて、マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号、ならびにパラメータ指示情報を取得するようにさらに構成され、パラメータ指示情報が、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内の符号化されたターゲット残響ゲインパラメータを示すために使用され、
取得ユニット1210が、パラメータ指示情報に従って、ビットストリームからターゲット残響ゲインパラメータを取得するようにさらに構成される、取得ユニット1210と、
ダウンミックス信号およびターゲット残響ゲインパラメータに基づいて、第1のチャネル信号および第2のチャネル信号を決定するように構成された処理ユニット1220と
を含む。
マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号、ならびに第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータを決定するように構成された処理ユニット1310であって、
処理ユニット1310が、ダウンミックス信号のN個のサブバンドのエネルギーに基づいて、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定するようにさらに構成され、Nが0より大きい整数である、処理ユニット1310と、
ダウンミックス信号およびターゲット残響ゲインパラメータを符号化するように構成された符号化ユニット1320と
を含む。
ビットストリームを受信するように構成された第1の取得ユニット1410と、
ビットストリームに基づいて、マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号を決定するように構成された第1の処理ユニット1420と、
ダウンミックス信号のN個のサブバンドのエネルギーに基づいて、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内の符号化されたターゲット残響ゲインパラメータを決定するように構成された第2の処理ユニット1430であって、Nが0より大きい整数である、第2の処理ユニット1430と、
ビットストリームに基づいてターゲット残響ゲインパラメータを決定するように構成された第3の処理ユニット1440と、
ダウンミックス信号およびターゲット残響ゲインパラメータに基づいて、第1のチャネル信号および第2のチャネル信号を決定するように構成された第4の処理ユニット1450と
を含む。
プログラムを記憶するように構成されたメモリ1510と、
プログラムを実行するように構成されたプロセッサ1520であって、プログラムが実行されると、プロセッサ1520が、マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号、ならびに第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータを決定することと、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定することと、パラメータ指示情報を生成することであって、パラメータ指示情報が、ターゲット残響ゲインパラメータに対応するサブバンドを示すために使用される、生成することと、ビットストリームを生成するために、ターゲット残響ゲインパラメータ、パラメータ指示情報、およびダウンミックス信号を符号化することとを行うように構成される、プロセッサ1520と
を含む。
プログラムを記憶するように構成されたメモリ1610と、
プログラムを実行するように構成されたプロセッサ1620であって、プログラムが実行されると、プロセッサ1620が、ビットストリームを受信することと、ビットストリームに基づいて、マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号、ならびにパラメータ指示情報を取得することであって、パラメータ指示情報が、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内の符号化されたターゲット残響ゲインパラメータを示すために使用される、取得することと、パラメータ指示情報に従って、ビットストリームからターゲット残響ゲインパラメータを取得することと、ダウンミックス信号およびターゲット残響ゲインパラメータに基づいて、第1のチャネル信号および第2のチャネル信号を決定することとを行うように構成される、プロセッサ1620と
を含む。
プログラムを記憶するように構成されたメモリ1710と、
プログラムを実行するように構成されたプロセッサ1720であって、プログラムが実行されると、プロセッサ1720が、マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号、ならびに第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータを決定することと、ダウンミックス信号のN個のサブバンドのエネルギーに基づいて、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定することであって、Nが0より大きい整数である、決定することと、ダウンミックス信号およびターゲット残響ゲインパラメータを符号化することとを行うように構成される、プロセッサ1720と
を含む。
プログラムを記憶するように構成されたメモリ1810と、
プログラムを実行するように構成されたプロセッサ1820であって、プログラムが実行されると、プロセッサ1820が、ビットストリームを受信することと、ビットストリームに基づいて、マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号を決定することと、ダウンミックス信号のN個のサブバンドのエネルギーに基づいて、第1のチャネル信号および第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータ内の符号化されたターゲット残響ゲインパラメータを決定することであって、Nが0より大きい整数である、決定することと、ビットストリームに基づいてターゲット残響ゲインパラメータを決定することと、ダウンミックス信号およびターゲット残響ゲインパラメータに基づいて、第1のチャネル信号および第2のチャネル信号を決定することとを行うように構成される、プロセッサ1820と
を含む。
1110 処理ユニット
1120 符号化ユニット
1200 デコーダ
1210 取得ユニット
1220 処理ユニット
1300 エンコーダ
1310 処理ユニット
1320 符号化ユニット
1400 デコーダ
1410 第1の取得ユニット
1420 第1の処理ユニット
1430 第2の処理ユニット
1440 第3の処理ユニット
1450 第4の処理ユニット
1500 エンコーダ
1510 メモリ
1520 プロセッサ
1600 デコーダ
1610 メモリ
1620 プロセッサ
1700 エンコーダ
1710 メモリ
1720 プロセッサ
1800 デコーダ
1810 メモリ
1820 プロセッサ
Claims (16)
- マルチチャネル信号符号化方法であって、
マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号、ならびに前記第1のチャネル信号および前記第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータを決定するステップと、
前記第1のチャネル信号および前記第2のチャネル信号の前記異なるサブバンドに対応する前記残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定するステップと、
パラメータ指示情報を生成するステップであって、前記パラメータ指示情報が、前記ターゲット残響ゲインパラメータに対応するサブバンドを示すために使用される、ステップと、
ビットストリームを生成するために、前記ターゲット残響ゲインパラメータ、前記パラメータ指示情報、および前記ダウンミックス信号を符号化するステップと
を備え、
前記第1のチャネル信号および前記第2のチャネル信号の前記異なるサブバンドに対応する前記残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定する前記ステップが、
前記第1のチャネル信号のエネルギーと前記ダウンミックス信号のエネルギーとの間のコヒーレンス、および前記第2のチャネル信号のエネルギーと前記ダウンミックス信号の前記エネルギーとの間のコヒーレンスのうちの少なくとも1つに基づいて、前記ターゲット残響ゲインパラメータを決定するステップ
を備える、
マルチチャネル信号符号化方法。 - 前記第1のチャネル信号および前記第2のチャネル信号の各々が複数の周波数ビンを備え、
前記第1のチャネル信号のエネルギーと前記ダウンミックス信号のエネルギーとの間のコヒーレンス、および前記第2のチャネル信号のエネルギーと前記ダウンミックス信号の前記エネルギーとの間のコヒーレンスのうちの少なくとも1つに基づいて、前記ターゲット残響ゲインパラメータを決定する前記ステップが、
前記第1のチャネル信号の前記エネルギーと前記ダウンミックス信号の前記エネルギーとの間の第1の差分値を決定するステップであって、前記第1の差分値が、前記複数の周波数ビンにおける前記第1のチャネル信号のエネルギーと前記ダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、ステップと、
前記第1の差分値が第1のしきい値よりも大きいとき、第1の周波数帯域のサブバンドに対応する残響ゲインパラメータが前記ターゲット残響ゲインパラメータであると決定するステップであって、前記第1の周波数帯域が、前記第1のチャネル信号および前記第2のチャネル信号の各々のすべての周波数帯域の一部である、ステップと
を備える、請求項1に記載の方法。 - 前記第1のチャネル信号および前記第2のチャネル信号の各々が複数の周波数ビンを備え、
前記第1のチャネル信号のエネルギーと前記ダウンミックス信号のエネルギーとの間のコヒーレンス、および前記第2のチャネル信号のエネルギーと前記ダウンミックス信号の前記エネルギーとの間のコヒーレンスのうちの少なくとも1つに基づいて、前記ターゲット残響ゲインパラメータを決定する前記ステップが、
前記第2のチャネル信号の前記エネルギーと前記ダウンミックス信号の前記エネルギーとの間の第2の差分値を決定するステップであって、前記第2の差分値が、前記複数の周波数ビンにおける前記第2のチャネル信号のエネルギーと前記ダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、ステップと、
前記第2の差分値が第2のしきい値よりも大きいとき、第1の周波数帯域のサブバンドに対応する残響ゲインパラメータが前記ターゲット残響ゲインパラメータであると決定するステップであって、前記第1の周波数帯域が、前記第1のチャネル信号および前記第2のチャネル信号の各々のすべての周波数帯域の一部である、ステップと
を備える、請求項1に記載の方法。 - 前記第1のチャネル信号および前記第2のチャネル信号の各々が複数の周波数ビンを備え、
前記第1のチャネル信号のエネルギーと前記ダウンミックス信号のエネルギーとの間のコヒーレンス、および前記第2のチャネル信号のエネルギーと前記ダウンミックス信号の前記エネルギーとの間のコヒーレンスのうちの少なくとも1つに基づいて、前記ターゲット残響ゲインパラメータを決定する前記ステップが、
前記第1のチャネル信号の前記エネルギーと前記ダウンミックス信号の前記エネルギーとの間の第1の差分値を決定するステップであって、前記第1の差分値が、前記複数の周波数ビンにおける前記第1のチャネル信号のエネルギーと前記ダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、ステップと、
前記第2のチャネル信号の前記エネルギーと前記ダウンミックス信号の前記エネルギーとの間の第2の差分値を決定するステップであって、前記第2の差分値が、前記複数の周波数ビンにおける前記第2のチャネル信号のエネルギーと前記ダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、ステップと、
前記第1の差分値が第1のしきい値よりも大きく、前記第2の差分値が第2のしきい値よりも大きいとき、第1の周波数帯域のサブバンドに対応する残響ゲインパラメータが前記ターゲット残響ゲインパラメータであると決定するステップであって、前記第1の周波数帯域が、前記第1のチャネル信号および前記第2のチャネル信号の各々のすべての周波数帯域の一部である、ステップと
を備える、請求項1に記載の方法。 - 前記第1の周波数帯域の周波数が、前記第1のチャネル信号および前記第2のチャネル信号における前記第1の周波数帯域とは異なる別の周波数帯域の周波数よりも小さい、請求項2から4のいずれか一項に記載の方法。
- 前記複数の周波数ビンが、前記第1のチャネル信号および前記第2のチャネル信号の各々の第2の周波数帯域内にあり、前記第2の周波数帯域の周波数が、前記第1のチャネル信号および前記第2のチャネル信号における前記第2の周波数帯域とは異なる別の周波数帯域の周波数よりも大きい、請求項2から5のいずれか一項に記載の方法。
- 前記ダウンミックス信号の前記エネルギーが、前記第1のチャネル信号の前記エネルギーおよび前記第2のチャネル信号の前記エネルギーに基づいて決定される、請求項1から6のいずれか一項に記載の方法。
- マルチチャネル信号内の第1のチャネル信号および第2のチャネル信号のダウンミックス信号、ならびに前記第1のチャネル信号および前記第2のチャネル信号の異なるサブバンドに対応する残響ゲインパラメータを決定するように構成された処理ユニットであって、
前記処理ユニットが、前記第1のチャネル信号および前記第2のチャネル信号の前記異なるサブバンドに対応する前記残響ゲインパラメータ内で符号化される必要があるターゲット残響ゲインパラメータを決定するようにさらに構成され、
前記処理ユニットが、パラメータ指示情報を生成するようにさらに構成され、前記パラメータ指示情報が、前記ターゲット残響ゲインパラメータに対応するサブバンドを示すために使用される、処理ユニットと、
ビットストリームを生成するために、前記ターゲット残響ゲインパラメータ、前記パラメータ指示情報、および前記ダウンミックス信号を符号化するように構成された符号化ユニットと
を備え、
前記処理ユニットが、
前記第1のチャネル信号のエネルギーと前記ダウンミックス信号のエネルギーとの間のコヒーレンス、および前記第2のチャネル信号のエネルギーと前記ダウンミックス信号の前記エネルギーとの間のコヒーレンスのうちの少なくとも1つに基づいて、前記ターゲット残響ゲインパラメータを決定する
ように構成される、
エンコーダ。 - 前記第1のチャネル信号および前記第2のチャネル信号の各々が複数の周波数ビンを備え、前記処理ユニットが、更に、
前記第1のチャネル信号の前記エネルギーと前記ダウンミックス信号の前記エネルギーとの間の第1の差分値を決定することであって、前記第1の差分値が、前記複数の周波数ビンにおける前記第1のチャネル信号のエネルギーと前記ダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、決定することと、
前記第1の差分値が第1のしきい値よりも大きいとき、第1の周波数帯域のサブバンドに対応する残響ゲインパラメータが前記ターゲット残響ゲインパラメータであると決定することであって、前記第1の周波数帯域が、前記第1のチャネル信号および前記第2のチャネル信号の各々のすべての周波数帯域の一部である、決定することと
を行うように構成される、請求項8に記載のエンコーダ。 - 前記第1のチャネル信号および前記第2のチャネル信号の各々が複数の周波数ビンを備え、前記処理ユニットが、更に、
前記第2のチャネル信号の前記エネルギーと前記ダウンミックス信号の前記エネルギーとの間の第2の差分値を決定することであって、前記第2の差分値が、前記複数の周波数ビンにおける前記第2のチャネル信号のエネルギーと前記ダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、決定することと、
前記第2の差分値が第2のしきい値よりも大きいとき、第1の周波数帯域のサブバンドに対応する残響ゲインパラメータが前記ターゲット残響ゲインパラメータであると決定することであって、前記第1の周波数帯域が、前記第1のチャネル信号および前記第2のチャネル信号の各々のすべての周波数帯域の一部である、決定することと
を行うように構成される、請求項8に記載のエンコーダ。 - 前記第1のチャネル信号および前記第2のチャネル信号の各々が複数の周波数ビンを備え、前記処理ユニットが、更に、
前記第1のチャネル信号の前記エネルギーと前記ダウンミックス信号の前記エネルギーとの間の第1の差分値を決定することであって、前記第1の差分値が、前記複数の周波数ビンにおける前記第1のチャネル信号のエネルギーと前記ダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、決定することと、
前記第2のチャネル信号の前記エネルギーと前記ダウンミックス信号の前記エネルギーとの間の第2の差分値を決定することであって、前記第2の差分値が、前記複数の周波数ビンにおける前記第2のチャネル信号のエネルギーと前記ダウンミックス信号のエネルギーとの間の差分値の絶対値の合計を示すために使用される、決定することと、
前記第1の差分値が前記第1のしきい値よりも大きく、前記第2の差分値が第2のしきい値よりも大きいとき、第1の周波数帯域のサブバンドに対応する残響ゲインパラメータが前記ターゲット残響ゲインパラメータであると決定することであって、前記第1の周波数帯域が、前記第1のチャネル信号および前記第2のチャネル信号の各々のすべての周波数帯域の一部である、決定することと
を行うように構成される、請求項8に記載のエンコーダ。 - 前記第1の周波数帯域の周波数が、前記第1のチャネル信号および前記第2のチャネル信号における前記第1の周波数帯域とは異なる別の周波数帯域の周波数よりも小さい、請求項9から11のいずれか一項に記載のエンコーダ。
- 前記複数の周波数ビンが、前記第1のチャネル信号および前記第2のチャネル信号の各々の第2の周波数帯域内にあり、前記第2の周波数帯域の周波数が、前記第1のチャネル信号および前記第2のチャネル信号における前記第2の周波数帯域とは異なる別の周波数帯域の周波数よりも大きい、請求項9から12のいずれか一項に記載のエンコーダ。
- 前記ダウンミックス信号の前記エネルギーが、前記第1のチャネル信号の前記エネルギーおよび前記第2のチャネル信号の前記エネルギーに基づいて決定される、請求項8から13のいずれか一項に記載のエンコーダ。
- プログラムが記録されたコンピュータ可読記憶媒体であって、前記プログラムが前記コンピュータに請求項1から7のいずれかに記載の方法を実行させる、コンピュータ可読記憶媒体。
- コンピュータに請求項1から7のいずれかに記載の方法を実行させるように構成された、媒体に格納されたコンピュータプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021072013A JP7106711B2 (ja) | 2017-04-12 | 2021-04-21 | マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ |
JP2022111786A JP7379602B2 (ja) | 2017-04-12 | 2022-07-12 | マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ |
JP2023186595A JP2024012444A (ja) | 2017-04-12 | 2023-10-31 | マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710236773.3 | 2017-04-12 | ||
CN201710236773.3A CN108694955B (zh) | 2017-04-12 | 2017-04-12 | 多声道信号的编解码方法和编解码器 |
PCT/CN2018/077790 WO2018188424A1 (zh) | 2017-04-12 | 2018-03-01 | 多声道信号的编解码方法和编解码器 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021072013A Division JP7106711B2 (ja) | 2017-04-12 | 2021-04-21 | マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020516955A JP2020516955A (ja) | 2020-06-11 |
JP6874151B2 true JP6874151B2 (ja) | 2021-05-19 |
Family
ID=63792975
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019555975A Active JP6874151B2 (ja) | 2017-04-12 | 2018-03-01 | マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ |
JP2021072013A Active JP7106711B2 (ja) | 2017-04-12 | 2021-04-21 | マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ |
JP2022111786A Active JP7379602B2 (ja) | 2017-04-12 | 2022-07-12 | マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ |
JP2023186595A Pending JP2024012444A (ja) | 2017-04-12 | 2023-10-31 | マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021072013A Active JP7106711B2 (ja) | 2017-04-12 | 2021-04-21 | マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ |
JP2022111786A Active JP7379602B2 (ja) | 2017-04-12 | 2022-07-12 | マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ |
JP2023186595A Pending JP2024012444A (ja) | 2017-04-12 | 2023-10-31 | マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ |
Country Status (7)
Country | Link |
---|---|
US (4) | US10827297B2 (ja) |
EP (2) | EP3605847B1 (ja) |
JP (4) | JP6874151B2 (ja) |
KR (4) | KR20240042158A (ja) |
CN (2) | CN108694955B (ja) |
BR (1) | BR112019021361A2 (ja) |
WO (1) | WO2018188424A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108694955B (zh) * | 2017-04-12 | 2020-11-17 | 华为技术有限公司 | 多声道信号的编解码方法和编解码器 |
GB201718341D0 (en) | 2017-11-06 | 2017-12-20 | Nokia Technologies Oy | Determination of targeted spatial audio parameters and associated spatial audio playback |
GB2572650A (en) | 2018-04-06 | 2019-10-09 | Nokia Technologies Oy | Spatial audio parameters and associated spatial audio playback |
GB2574239A (en) | 2018-05-31 | 2019-12-04 | Nokia Technologies Oy | Signalling of spatial audio parameters |
CN111988726A (zh) * | 2019-05-06 | 2020-11-24 | 深圳市三诺数字科技有限公司 | 一种立体声合成单声道的方法和系统 |
CN111654745B (zh) * | 2020-06-08 | 2022-10-14 | 海信视像科技股份有限公司 | 多声道的信号处理方法及显示设备 |
EP4243015A4 (en) | 2021-01-27 | 2024-04-17 | Samsung Electronics Co., Ltd. | AUDIO PROCESSING APPARATUS AND METHOD |
CN113132881B (zh) * | 2021-04-16 | 2022-07-19 | 深圳木芯科技有限公司 | 基于多麦克风自适应控制佩戴者声音放大程度的方法 |
JPWO2023008276A1 (ja) | 2021-07-26 | 2023-02-02 | ||
CN114258568A (zh) * | 2021-11-26 | 2022-03-29 | 北京小米移动软件有限公司 | 一种立体声音频信号处理方法、装置、编码设备、解码设备及存储介质 |
GB2616280A (en) * | 2022-03-02 | 2023-09-06 | Nokia Technologies Oy | Spatial rendering of reverberation |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5731767A (en) * | 1994-02-04 | 1998-03-24 | Sony Corporation | Information encoding method and apparatus, information decoding method and apparatus, information recording medium, and information transmission method |
US5960390A (en) | 1995-10-05 | 1999-09-28 | Sony Corporation | Coding method for using multi channel audio signals |
US7292901B2 (en) | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
KR101049751B1 (ko) | 2003-02-11 | 2011-07-19 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코딩 |
EP1768107B1 (en) * | 2004-07-02 | 2016-03-09 | Panasonic Intellectual Property Corporation of America | Audio signal decoding device |
CN101010724B (zh) * | 2004-08-27 | 2011-05-25 | 松下电器产业株式会社 | 音频编码器 |
SE0402650D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Improved parametric stereo compatible coding of spatial audio |
KR20060109297A (ko) * | 2005-04-14 | 2006-10-19 | 엘지전자 주식회사 | 오디오 신호의 인코딩/디코딩 방법 및 장치 |
JP5053849B2 (ja) * | 2005-09-01 | 2012-10-24 | パナソニック株式会社 | マルチチャンネル音響信号処理装置およびマルチチャンネル音響信号処理方法 |
US8019614B2 (en) | 2005-09-02 | 2011-09-13 | Panasonic Corporation | Energy shaping apparatus and energy shaping method |
FR2897212A1 (fr) * | 2006-02-09 | 2007-08-10 | France Telecom | Procede de codage d'un signal audio source, dispositif de codage, procede de decodage, signal, support de donnees, produits programme d'ordinateur correspondants |
KR20070088958A (ko) * | 2006-02-27 | 2007-08-30 | 한국전자통신연구원 | 다채널 오디오 신호 시각화 방법과 공간큐를 이용한음상정보 변환 방법 및 그 장치 |
EP3712888B1 (en) | 2007-03-30 | 2024-05-08 | Electronics and Telecommunications Research Institute | Apparatus and method for coding and decoding multi object audio signal with multi channel |
CN101350197B (zh) * | 2007-07-16 | 2011-05-11 | 华为技术有限公司 | 立体声音频编/解码方法及编/解码器 |
CN100571043C (zh) * | 2007-11-06 | 2009-12-16 | 武汉大学 | 一种空间参数立体声编解码方法及其装置 |
KR101444102B1 (ko) * | 2008-02-20 | 2014-09-26 | 삼성전자주식회사 | 스테레오 오디오의 부호화, 복호화 방법 및 장치 |
KR101108060B1 (ko) | 2008-09-25 | 2012-01-25 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치 |
WO2010036059A2 (en) * | 2008-09-25 | 2010-04-01 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
JP5524237B2 (ja) * | 2008-12-19 | 2014-06-18 | ドルビー インターナショナル アーベー | 空間キューパラメータを用いてマルチチャンネルオーディオ信号に反響を適用する方法と装置 |
WO2011080916A1 (ja) * | 2009-12-28 | 2011-07-07 | パナソニック株式会社 | 音声符号化装置および音声符号化方法 |
JP5299327B2 (ja) | 2010-03-17 | 2013-09-25 | ソニー株式会社 | 音声処理装置、音声処理方法、およびプログラム |
PL2671222T3 (pl) * | 2011-02-02 | 2016-08-31 | Ericsson Telefon Ab L M | Określanie międzykanałowej różnicy czasu wielokanałowego sygnału audio |
JP5737077B2 (ja) * | 2011-08-30 | 2015-06-17 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
KR101842258B1 (ko) | 2011-09-14 | 2018-03-27 | 삼성전자주식회사 | 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치 |
EP2717262A1 (en) * | 2012-10-05 | 2014-04-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding |
CN108806706B (zh) | 2013-01-15 | 2022-11-15 | 韩国电子通信研究院 | 处理信道信号的编码/解码装置及方法 |
US8804971B1 (en) * | 2013-04-30 | 2014-08-12 | Dolby International Ab | Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio |
EP2973551B1 (en) | 2013-05-24 | 2017-05-03 | Dolby International AB | Reconstruction of audio scenes from a downmix |
EP2840811A1 (en) * | 2013-07-22 | 2015-02-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for processing an audio signal; signal processing unit, binaural renderer, audio encoder and audio decoder |
US10049683B2 (en) | 2013-10-21 | 2018-08-14 | Dolby International Ab | Audio encoder and decoder |
WO2015099429A1 (ko) * | 2013-12-23 | 2015-07-02 | 주식회사 윌러스표준기술연구소 | 오디오 신호 처리 방법, 이를 위한 파라메터화 장치 및 오디오 신호 처리 장치 |
JP2017058696A (ja) * | 2016-12-09 | 2017-03-23 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | インターチャネル差分推定方法及び空間オーディオ符号化装置 |
CN108665902B (zh) * | 2017-03-31 | 2020-12-01 | 华为技术有限公司 | 多声道信号的编解码方法和编解码器 |
CN108694955B (zh) | 2017-04-12 | 2020-11-17 | 华为技术有限公司 | 多声道信号的编解码方法和编解码器 |
-
2017
- 2017-04-12 CN CN201710236773.3A patent/CN108694955B/zh active Active
-
2018
- 2018-03-01 WO PCT/CN2018/077790 patent/WO2018188424A1/zh unknown
- 2018-03-01 BR BR112019021361A patent/BR112019021361A2/pt unknown
- 2018-03-01 JP JP2019555975A patent/JP6874151B2/ja active Active
- 2018-03-01 KR KR1020247009036A patent/KR20240042158A/ko unknown
- 2018-03-01 KR KR1020217022990A patent/KR102424184B1/ko active IP Right Grant
- 2018-03-01 KR KR1020227025038A patent/KR20220106858A/ko active Application Filing
- 2018-03-01 EP EP18784927.8A patent/EP3605847B1/en active Active
- 2018-03-01 KR KR1020197032917A patent/KR102281822B1/ko active IP Right Grant
- 2018-03-01 CN CN201880024082.XA patent/CN110495105B/zh active Active
- 2018-03-01 EP EP23218410.1A patent/EP4365894A3/en active Pending
-
2019
- 2019-10-14 US US16/601,104 patent/US10827297B2/en active Active
-
2020
- 2020-09-25 US US17/033,026 patent/US11178505B2/en active Active
-
2021
- 2021-04-21 JP JP2021072013A patent/JP7106711B2/ja active Active
- 2021-10-18 US US17/504,080 patent/US11832087B2/en active Active
-
2022
- 2022-07-12 JP JP2022111786A patent/JP7379602B2/ja active Active
-
2023
- 2023-10-24 US US18/493,319 patent/US20240056764A1/en active Pending
- 2023-10-31 JP JP2023186595A patent/JP2024012444A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
EP3605847B1 (en) | 2024-06-19 |
US20220046376A1 (en) | 2022-02-10 |
US10827297B2 (en) | 2020-11-03 |
JP2021121853A (ja) | 2021-08-26 |
US20200045494A1 (en) | 2020-02-06 |
KR20210094143A (ko) | 2021-07-28 |
EP3605847A1 (en) | 2020-02-05 |
JP2024012444A (ja) | 2024-01-30 |
US20210014632A1 (en) | 2021-01-14 |
JP2020516955A (ja) | 2020-06-11 |
US20240056764A1 (en) | 2024-02-15 |
EP4365894A3 (en) | 2024-07-17 |
JP7379602B2 (ja) | 2023-11-14 |
KR20220106858A (ko) | 2022-07-29 |
EP4365894A2 (en) | 2024-05-08 |
US11178505B2 (en) | 2021-11-16 |
KR20190134752A (ko) | 2019-12-04 |
BR112019021361A2 (pt) | 2020-05-05 |
KR102281822B1 (ko) | 2021-07-26 |
CN108694955A (zh) | 2018-10-23 |
EP3605847A4 (en) | 2020-03-25 |
CN108694955B (zh) | 2020-11-17 |
KR20240042158A (ko) | 2024-04-01 |
JP7106711B2 (ja) | 2022-07-26 |
JP2022160440A (ja) | 2022-10-19 |
WO2018188424A1 (zh) | 2018-10-18 |
KR102424184B1 (ko) | 2022-07-25 |
CN110495105A (zh) | 2019-11-22 |
CN110495105B (zh) | 2021-03-30 |
US11832087B2 (en) | 2023-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6874151B2 (ja) | マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ | |
JP7035154B2 (ja) | マルチチャネル信号符号化方法、マルチチャネル信号復号化方法、符号器、及び復号器 | |
KR20200035306A (ko) | 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191121 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191121 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201019 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210114 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210322 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210421 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6874151 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |