JP2022137052A - マルチチャネル信号の符号化方法およびエンコーダ - Google Patents
マルチチャネル信号の符号化方法およびエンコーダ Download PDFInfo
- Publication number
- JP2022137052A JP2022137052A JP2022096616A JP2022096616A JP2022137052A JP 2022137052 A JP2022137052 A JP 2022137052A JP 2022096616 A JP2022096616 A JP 2022096616A JP 2022096616 A JP2022096616 A JP 2022096616A JP 2022137052 A JP2022137052 A JP 2022137052A
- Authority
- JP
- Japan
- Prior art keywords
- current frame
- channel
- parameter
- signal
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 101
- 230000003595 spectral effect Effects 0.000 claims description 36
- 230000008859 change Effects 0.000 claims description 13
- 238000001228 spectrum Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 description 19
- 238000004364 calculation method Methods 0.000 description 13
- 230000005236 sound signal Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 6
- 238000003672 processing method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 238000005314 correlation function Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 241000473391 Archosargus rhomboidalis Species 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
現フレームのマルチチャネル信号を取得するステップと、
現フレームの初期マルチチャネルパラメータを決定するステップと、
現フレームの初期マルチチャネルパラメータと現フレームの前のK個のフレームのマルチチャネルパラメータとに基づいて差分パラメータを決定するステップであって、差分パラメータは現フレームの初期マルチチャネルパラメータと前のK個のフレームのマルチチャネルパラメータとの間の差を表すために使用され、Kは1以上の整数である、ステップと、
現フレームの差分パラメータおよび特性パラメータに基づいて現フレームのマルチチャネルパラメータを決定するステップと、
現フレームのマルチチャネルパラメータに基づいてマルチチャネル信号を符号化するステップと
を含む。
差分パラメータが第1の事前設定条件を満たす場合、現フレームの特性パラメータに基づいて現フレームのマルチチャネルパラメータを決定するステップ
を含む。
現フレームの相関パラメータに基づいて現フレームのマルチチャネルパラメータを決定するステップであって、相関パラメータは、現フレームと現フレームの前のフレームとの間の相関度を表すために使用される、ステップ
を含む。
現フレームのマルチチャネル信号内のターゲットチャネル信号と前のフレームのマルチチャネル信号内のターゲットチャネル信号とに基づいて相関パラメータを決定するステップ
をさらに含む。
現フレームのマルチチャネル信号内のターゲットチャネル信号の周波数領域パラメータと前のフレームのマルチチャネル信号内のターゲットチャネル信号の周波数領域パラメータとに基づいて相関パラメータを決定するステップであって、周波数領域パラメータは、ターゲットチャネル信号の周波数領域振幅値および周波数領域係数のうちの少なくとも一方である、ステップ
を含む。
現フレームのピッチ周期と前のフレームのピッチ周期とに基づいて相関パラメータを決定するステップ
をさらに含む。
特性パラメータが第2の事前設定条件を満たす場合、現フレームの前のT個のフレームのマルチチャネルパラメータに基づいて現フレームのマルチチャネルパラメータを決定するステップであって、Tは1以上の整数である、ステップ
を含む。
前のT個のフレームのマルチチャネルパラメータを現フレームのマルチチャネルパラメータとして決定するステップであって、Tは1に等しい、ステップ
を含む。
前のT個のフレームのマルチチャネルパラメータの変化傾向に基づいて現フレームのマルチチャネルパラメータを決定するステップであって、Tは2以上である、ステップ
を含む。
現フレームのマルチチャネル信号を取得するように構成された取得ユニットと、
現フレームの初期マルチチャネルパラメータを決定するように構成された第1の決定ユニットと、
現フレームの初期マルチチャネルパラメータと現フレームの前のK個のフレームのマルチチャネルパラメータとに基づいて差分パラメータを決定するように構成された第2の決定ユニットであって、差分パラメータは現フレームの初期マルチチャネルパラメータと前のK個のフレームのマルチチャネルパラメータとの間の差を表すために使用され、Kは1以上の整数である、第2の決定ユニットと、
現フレームの差分パラメータと特性パラメータとに基づいて現フレームのマルチチャネルパラメータを決定するように構成された第3の決定ユニットと、
現フレームのマルチチャネルパラメータに基づいてマルチチャネル信号を符号化するように構成された符号化ユニットと
を含む。
現フレームのマルチチャネル信号内のターゲットチャネル信号と前のフレームのマルチチャネル信号内のターゲットチャネル信号とに基づいて相関パラメータを決定するように構成された第4の決定ユニット
をさらに含む。
現フレームのピッチ周期と前のフレームのピッチ周期とに基づいて相関パラメータを決定するように構成された第5の決定ユニット
をさらに含む。
ITD[i]=ITD[i-1]+delta、ここで
delta=ITD[i-1]-ITD[i-2]であり、ITD[i-1]は現フレームの前のフレームのITD値を表し、ITD[i-2]は現フレームの前のフレームの前のフレームのITD値を表す。
相関パラメータは第2の閾値よりも大きく、第2の閾値の値の範囲は、例えば0.6~0.95であり得、例えば、第2の閾値は0.85であり得る;
ピーク対平均比パラメータは第3の閾値よりも大きく、第3の閾値の値の範囲は、例えば0.4~0.8であり得、例えば、第3の閾値は0.6であり得る;
相関パラメータは第4の閾値より大きく、サブバンド内の相関値は第5の閾値より大きく、第4の閾値の値の範囲は0.6~0.85であり得、例えば第4の閾値は0.7であり得;第5の閾値の値の範囲は、0.8~0.95であり得、例えば、第5の閾値は、0.9であり得る;
ピーク対平均比パラメータは第6の閾値よりも大きく、サブバンド内のピーク対平均比は第7の閾値よりも大きく、第6の閾値の値の範囲は0.4~0.75であり得、例えば、第6の閾値は0.55であり得、第7の閾値の値の範囲は、0.6~0.9であり得、例えば、第7の閾値は0.7であり得る。
前のフレームのITD値と現フレームの初期ITD値との積が0である;
前のフレームのITD値と現フレームの初期ITD値との積が負である;または
前のフレームのITD値と現フレームの初期ITD値との間の差の絶対値が、目標値の半分よりも大きく、目標値は、その絶対値が前のフレームのITD値と現フレームの初期ITD値とのうちでより大きい方のITD値である。
サブバンドの正規化相互相関値の平均値が第1の閾値より大きい;
サブバンドのピーク対平均比の平均値が第2の閾値より大きい;
サブバンドの正規化相互相関値の平均値が第3の閾値よりも大きく、サブバンドの正規化相互相関値が第4の閾値よりも大きい;または
サブバンドのピーク対平均比の平均値が第5の閾値より大きく、サブバンドのピーク対平均比が第6の閾値より大きい。
ITD[i]=ITD[i-1]+delta、ここで
delta=ITD[i-1]-ITD[i-2]であり、ITD[i-1]は現フレームの前のフレームのITD値を表し、ITD[i-2]は現フレームの前のフレームの前のフレームのITD値を表す。
現フレームのマルチチャネル信号を取得するように構成された取得ユニット810と、
現フレームの初期マルチチャネルパラメータを決定するように構成された第1の決定ユニット820と、
現フレームの初期マルチチャネルパラメータと現フレームの前のK個のフレームのマルチチャネルパラメータとに基づいて差分パラメータを決定するように構成された第2の決定ユニット830であって、差分パラメータは現フレームの初期マルチチャネルパラメータと前のK個のフレームのマルチチャネルパラメータとの間の差を表すために使用され、Kは1以上の整数である、第2の決定ユニット830と、
現フレームの差分パラメータと特性パラメータとに基づいて現フレームのマルチチャネルパラメータを決定するように構成された第3の決定ユニット840と、
現フレームのマルチチャネルパラメータに基づいてマルチチャネル信号を符号化するように構成された符号化ユニット850と
含む。
現フレームのマルチチャネル信号内のターゲットチャネル信号と前のフレームのマルチチャネル信号内のターゲットチャネル信号とに基づいて相関パラメータを決定するように構成された第4の決定ユニット
をさらに含む。
現フレームのピッチ周期と前のフレームのピッチ周期とに基づいて相関パラメータを決定するように構成された第5の決定ユニット
をさらに含む。
プログラムを格納するように構成されたメモリ910と
プログラムを実行するように構成されたプロセッサ920と
を含む。プログラムが実行されると、プロセッサ920は、現フレームのマルチチャネル信号を取得し;現フレームの初期マルチチャネルパラメータを決定し;現フレームの初期マルチチャネルパラメータと現フレームの前のK個のフレームのマルチチャネルパラメータとに基づいて差分パラメータを決定し、差分パラメータは現フレームの初期マルチチャネルパラメータと前のK個のフレームのマルチチャネルパラメータとの間の差を表すために使用され、Kは1以上の整数であり;現フレームの差分パラメータおよび特性パラメータに基づいて現フレームのマルチチャネルパラメータを決定し;現フレームのマルチチャネルパラメータに基づいてマルチチャネル信号を符号化する、ように構成される。
810 取得ユニット
820 第1の決定ユニット
830 第2の決定ユニット
840 第3の決定ユニット
850 符号化ユニット
900 エンコーダ
910 メモリ
920 プロセッサ
Claims (28)
- マルチチャネル信号符号化方法であって、
現フレームのマルチチャネル信号を取得するステップと、
前記現フレームの初期マルチチャネルパラメータを決定するステップと、
前記現フレームの前記初期マルチチャネルパラメータと前記現フレームの前のK個のフレームのマルチチャネルパラメータとに基づいて差分パラメータを決定するステップであって、前記差分パラメータが前記現フレームの前記初期マルチチャネルパラメータと前記前のK個のフレームの前記マルチチャネルパラメータとの間の差を表すために使用され、Kが1以上の整数である、ステップと、
前記現フレームの前記差分パラメータおよび特性パラメータに基づいて前記現フレームのマルチチャネルパラメータを決定するステップと、
前記現フレームの前記マルチチャネルパラメータに基づいて前記マルチチャネル信号を符号化するステップと
を含む、方法。 - 前記現フレームの前記差分パラメータおよび特性パラメータに基づいて前記現フレームのマルチチャネルパラメータを決定する前記ステップが、
前記差分パラメータが第1の事前設定条件を満たす場合、前記現フレームの前記特性パラメータに基づいて前記現フレームの前記マルチチャネルパラメータを決定するステップ
を含む、請求項1に記載の方法。 - 前記差分パラメータが、前記現フレームの前記初期マルチチャネルパラメータと前記現フレームの前のフレームのマルチチャネルパラメータとの間の差の絶対値であり、前記第1の事前設定条件は、前記差分パラメータが予め設定された第1の閾値より大きいということである、請求項2に記載の方法。
- 前記差分パラメータが、前記現フレームの前記初期マルチチャネルパラメータと前記現フレームの前のフレームのマルチチャネルパラメータとの積であり、前記第1の事前設定条件は前記差分パラメータが0以下であることである、請求項2に記載の方法。
- 前記現フレームの前記特性パラメータに基づいて前記現フレームの前記マルチチャネルパラメータを決定する前記ステップが、
前記現フレームの相関パラメータに基づいて前記現フレームの前記マルチチャネルパラメータを決定するステップであって、前記相関パラメータが、前記現フレームと前記現フレームの前記前のフレームとの間の相関度を表すために使用される、ステップ
を含む、請求項2から4のいずれか一項に記載の方法。 - 前記方法が、
前記現フレームの前記マルチチャネル信号内のターゲットチャネル信号と前記前のフレームのマルチチャネル信号内のターゲットチャネル信号とに基づいて前記相関パラメータを決定するステップ
をさらに含む、請求項5に記載の方法。 - 前記現フレームの前記マルチチャネル信号内のターゲットチャネル信号と前記前のフレームのマルチチャネル信号内のターゲットチャネル信号とに基づいて前記相関パラメータを決定する前記ステップが、
前記現フレームの前記マルチチャネル信号内の前記ターゲットチャネル信号の周波数領域パラメータと前記前のフレームの前記マルチチャネル信号内の前記ターゲットチャネル信号の周波数領域パラメータとに基づいて前記相関パラメータを決定するステップであって、前記周波数領域パラメータが、前記ターゲットチャネル信号の周波数領域振幅値および周波数領域係数のうちの少なくとも一方である、ステップ
を含む、請求項6に記載の方法。 - 前記方法が、
前記現フレームのピッチ周期と前記前のフレームのピッチ周期とに基づいて前記相関パラメータを決定するステップ
をさらに含む、請求項5に記載の方法。 - 前記現フレームの前記特性パラメータに基づいて前記現フレームの前記マルチチャネルパラメータを決定する前記ステップが、
前記特性パラメータが第2の事前設定条件を満たす場合、前記現フレームの前のT個のフレームのマルチチャネルパラメータに基づいて前記現フレームの前記マルチチャネルパラメータを決定するステップであって、Tが1以上の整数である、ステップ
を含む、請求項2から8のいずれか一項に記載の方法。 - 前記現フレームの前のT個のフレームのマルチチャネルパラメータに基づいて前記現フレームの前記マルチチャネルパラメータを決定する前記ステップが、
前記前のT個のフレームの前記マルチチャネルパラメータを前記現フレームの前記マルチチャネルパラメータとして決定するステップであって、Tが1に等しい、ステップ
を含む、請求項9に記載の方法。 - 前記現フレームの前のT個のフレームのマルチチャネルパラメータに基づいて前記現フレームの前記マルチチャネルパラメータを決定する前記ステップが、
前記前のT個のフレームの前記マルチチャネルパラメータの変化傾向に基づいて前記現フレームの前記マルチチャネルパラメータを決定するステップであって、Tが2以上である、ステップ
を含む、請求項9に記載の方法。 - 前記現フレームの前記特性パラメータが、前記現フレームの前記相関パラメータおよびピーク対平均比パラメータのうちの少なくとも一方を含み、前記相関パラメータが前記現フレームと前記現フレームの前記前のフレームとの間の前記相関度を表すために使用され、前記ピーク対平均比パラメータが、前記現フレームの前記マルチチャネル信号における少なくとも1つのチャネルの信号のピーク対平均比を表すために使用され、前記第2の事前設定条件は、前記特性パラメータが予め設定された閾値より大きいことである、請求項9から11のいずれか一項に記載の方法。
- 前記現フレームの前記初期マルチチャネルパラメータが、前記現フレームの初期チャネル間コヒーレンスIC値、前記現フレームの初期チャネル時間差ITD値、前記現フレームの初期チャネル間位相差IPD値、前記現フレームの初期全体位相差OPD値、および前記現フレームの初期チャネル間レベル差ILD値、のうちの少なくとも1つを含む、請求項1から12のいずれか一項に記載の方法。
- 前記現フレームの前記特性パラメータが、前記現フレームのパラメータ、すなわち、前記相関パラメータ、前記ピーク対平均比パラメータ、信号対雑音比パラメータ、およびスペクトル傾斜パラメータ、のうちの少なくとも1つを含み、前記相関パラメータが、前記現フレームと前記前のフレームとの間の前記相関度を表すために使用され、前記ピーク対平均比パラメータが、前記現フレームの前記マルチチャネル信号における前記少なくとも1つのチャネルの前記信号の前記ピーク対平均比を表すために使用され、前記信号対雑音比パラメータが、前記現フレームの前記マルチチャネル信号における少なくとも1つのチャネルの信号の信号対雑音比を表すために使用され、前記スペクトル傾斜パラメータが、前記現フレームの前記マルチチャネル信号における少なくとも1つのチャネルの信号のスペクトル傾斜度を表すために使用される、請求項1から13のいずれか一項に記載の方法。
- 現フレームのマルチチャネル信号を取得するように構成された取得ユニットと、
前記現フレームの初期マルチチャネルパラメータを決定するように構成された第1の決定ユニットと、
前記現フレームの前記初期マルチチャネルパラメータと前記現フレームの前のK個のフレームのマルチチャネルパラメータとに基づいて差分パラメータを決定するように構成された第2の決定ユニットであって、前記差分パラメータが前記現フレームの前記初期マルチチャネルパラメータと前記前のK個のフレームの前記マルチチャネルパラメータとの間の差を表すために使用され、Kが1以上の整数である、第2の決定ユニットと、
前記現フレームの前記差分パラメータと特性パラメータとに基づいて前記現フレームのマルチチャネルパラメータを決定するように構成された第3の決定ユニットと、
前記現フレームの前記マルチチャネルパラメータに基づいて前記マルチチャネル信号を符号化するように構成された符号化ユニットと
を備える、エンコーダ。 - 前記第3の決定ユニットは、前記差分パラメータが第1の事前設定条件を満たす場合、前記現フレームの前記特性パラメータに基づいて前記現フレームの前記マルチチャネルパラメータを決定するように特に構成される、請求項15に記載のエンコーダ。
- 前記差分パラメータが、前記現フレームの前記初期マルチチャネルパラメータと前記現フレームの前のフレームのマルチチャネルパラメータとの間の差の絶対値であり、前記第1の事前設定条件は、前記差分パラメータが予め設定された第1の閾値より大きいということである、請求項16に記載のエンコーダ。
- 前記差分パラメータが、前記現フレームの前記初期マルチチャネルパラメータと前記現フレームの前のフレームのマルチチャネルパラメータとの積であり、前記第1の事前設定条件は前記差分パラメータが0以下であることである、請求項16に記載のエンコーダ。
- 前記第3の決定ユニットが、前記現フレームの相関パラメータに基づいて前記現フレームの前記マルチチャネルパラメータを決定するように特に構成され、前記相関パラメータが前記現フレームと前記現フレームの前記前のフレームとの間の相関度を表すために使用される、請求項16から18のいずれか一項に記載のエンコーダ。
- 前記エンコーダが、
前記現フレームの前記マルチチャネル信号内のターゲットチャネル信号と前記前のフレームのマルチチャネル信号内のターゲットチャネル信号とに基づいて前記相関パラメータを決定するように構成された第4の決定ユニット
をさらに備える、請求項19に記載のエンコーダ。 - 前記第4の決定ユニットが、前記現フレームの前記マルチチャネル信号内の前記ターゲットチャネル信号の周波数領域パラメータと、前記前のフレームの前記マルチチャネル信号内の前記ターゲットチャネル信号の周波数領域パラメータとに基づいて前記相関パラメータを決定するように特に構成され、前記周波数領域パラメータが、前記ターゲットチャネル信号の周波数領域振幅値および周波数領域係数のうちの少なくとも一方である、請求項20に記載のエンコーダ。
- 前記エンコーダが、
前記現フレームのピッチ周期と前記前のフレームのピッチ周期とに基づいて前記相関パラメータを決定するように構成された第5の決定ユニット
をさらに備える、請求項19に記載のエンコーダ。 - 前記第3の決定ユニットは、前記特性パラメータが第2の事前設定条件を満たす場合、前記現フレームの前のT個のフレームのマルチチャネルパラメータに基づいて前記現フレームの前記マルチチャネルパラメータを決定するように特に構成され、Tが1以上の整数である、請求項16から22のいずれか一項に記載のエンコーダ。
- 前記第3の決定ユニットが、前記前のT個のフレームの前記マルチチャネルパラメータを前記現フレームの前記マルチチャネルパラメータとして決定するように特に構成され、Tが1に等しい、請求項23に記載のエンコーダ。
- 前記第3の決定ユニットが、前記前のT個のフレームの前記マルチチャネルパラメータの変化傾向に基づいて前記現フレームの前記マルチチャネルパラメータを決定するように特に構成され、Tが2以上である、請求項23に記載のエンコーダ。
- 前記特性パラメータが、前記現フレームの前記相関パラメータおよびピーク対平均比パラメータのうちの少なくとも一方を含み、前記相関パラメータが前記現フレームと前記現フレームの前記前のフレームとの間の前記相関度を表すために使用され、前記ピーク対平均比パラメータが、前記現フレームの前記マルチチャネル信号における少なくとも1つのチャネルの信号のピーク対平均比を表すために使用され、前記第2の事前設定条件は、前記特性パラメータが予め設定された閾値より大きいことである、請求項23から25のいずれか一項に記載のエンコーダ。
- 前記現フレームの前記初期マルチチャネルパラメータが、前記現フレームの初期チャネル間コヒーレンスIC値、前記現フレームの初期チャネル時間差ITD値、前記現フレームの初期チャネル間位相差IPD値、前記現フレームの初期全体位相差OPD値、および前記現フレームの初期チャネル間レベル差ILD値、のうちの少なくとも1つを含む、請求項15から26のいずれか一項に記載のエンコーダ。
- 前記現フレームの前記特性パラメータが、前記現フレームのパラメータ、すなわち、前記相関パラメータ、前記ピーク対平均比パラメータ、信号対雑音比パラメータ、およびスペクトル傾斜パラメータ、のうちの少なくとも1つを含み、前記相関パラメータが、前記現フレームと前記前のフレームとの間の前記相関度を表すために使用され、前記ピーク対平均比パラメータが、前記現フレームの前記マルチチャネル信号における前記少なくとも1つのチャネルの前記信号の前記ピーク対平均比を表すために使用され、前記信号対雑音比パラメータが、前記現フレームの前記マルチチャネル信号における少なくとも1つのチャネルの信号の信号対雑音比を表すために使用され、前記スペクトル傾斜パラメータが、前記現フレームの前記マルチチャネル信号における少なくとも1つのチャネルの信号のスペクトル傾斜度を表すために使用される、請求項15から27のいずれか一項に記載のエンコーダ。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2024024588A JP2024063059A (ja) | 2016-08-10 | 2024-02-21 | マルチチャネル信号の符号化方法およびエンコーダ |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610652506.XA CN107731238B (zh) | 2016-08-10 | 2016-08-10 | 多声道信号的编码方法和编码器 |
CN201610652506.X | 2016-08-10 | ||
JP2020158348A JP7091411B2 (ja) | 2016-08-10 | 2020-09-23 | マルチチャネル信号の符号化方法およびエンコーダ |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020158348A Division JP7091411B2 (ja) | 2016-08-10 | 2020-09-23 | マルチチャネル信号の符号化方法およびエンコーダ |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024024588A Division JP2024063059A (ja) | 2016-08-10 | 2024-02-21 | マルチチャネル信号の符号化方法およびエンコーダ |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022137052A true JP2022137052A (ja) | 2022-09-21 |
JP7443423B2 JP7443423B2 (ja) | 2024-03-05 |
Family
ID=61161463
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019507137A Active JP6768924B2 (ja) | 2016-08-10 | 2017-02-22 | マルチチャネル信号の符号化方法およびエンコーダ |
JP2020158348A Active JP7091411B2 (ja) | 2016-08-10 | 2020-09-23 | マルチチャネル信号の符号化方法およびエンコーダ |
JP2022096616A Active JP7443423B2 (ja) | 2016-08-10 | 2022-06-15 | マルチチャネル信号の符号化方法およびエンコーダ |
JP2024024588A Pending JP2024063059A (ja) | 2016-08-10 | 2024-02-21 | マルチチャネル信号の符号化方法およびエンコーダ |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019507137A Active JP6768924B2 (ja) | 2016-08-10 | 2017-02-22 | マルチチャネル信号の符号化方法およびエンコーダ |
JP2020158348A Active JP7091411B2 (ja) | 2016-08-10 | 2020-09-23 | マルチチャネル信号の符号化方法およびエンコーダ |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024024588A Pending JP2024063059A (ja) | 2016-08-10 | 2024-02-21 | マルチチャネル信号の符号化方法およびエンコーダ |
Country Status (11)
Country | Link |
---|---|
US (3) | US11133014B2 (ja) |
EP (2) | EP3493203B1 (ja) |
JP (4) | JP6768924B2 (ja) |
KR (3) | KR102367538B1 (ja) |
CN (1) | CN107731238B (ja) |
AU (3) | AU2017310759B2 (ja) |
BR (1) | BR112019002656A2 (ja) |
CA (1) | CA3033225C (ja) |
ES (1) | ES2928335T3 (ja) |
RU (1) | RU2705427C1 (ja) |
WO (1) | WO2018028170A1 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR112016025203B1 (pt) | 2014-06-02 | 2022-09-06 | Cala Health, Inc | Sistema transcutâneo para tratar um paciente que sofre de tremor |
EP4342516A2 (en) | 2015-06-10 | 2024-03-27 | Cala Health, Inc. | Systems and methods for peripheral nerve stimulation to treat tremor with detachable therapy and monitoring units |
US10603482B2 (en) | 2015-09-23 | 2020-03-31 | Cala Health, Inc. | Systems and methods for peripheral nerve stimulation in the finger or hand to treat hand tremors |
US11344722B2 (en) | 2016-01-21 | 2022-05-31 | Cala Health, Inc. | Systems, methods and devices for peripheral neuromodulation for treating diseases related to overactive bladder |
CN107731238B (zh) | 2016-08-10 | 2021-07-16 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
CA3058786A1 (en) | 2017-04-03 | 2018-10-11 | Cala Health, Inc. | Systems, methods and devices for peripheral neuromodulation for treating diseases related to overactive bladder |
CN108877815B (zh) | 2017-05-16 | 2021-02-23 | 华为技术有限公司 | 一种立体声信号处理方法及装置 |
US11857778B2 (en) | 2018-01-17 | 2024-01-02 | Cala Health, Inc. | Systems and methods for treating inflammatory bowel disease through peripheral nerve stimulation |
CN110556118B (zh) | 2018-05-31 | 2022-05-10 | 华为技术有限公司 | 立体声信号的编码方法和装置 |
CN110556116B (zh) | 2018-05-31 | 2021-10-22 | 华为技术有限公司 | 计算下混信号和残差信号的方法和装置 |
CN109243471B (zh) * | 2018-09-26 | 2022-09-23 | 杭州联汇科技股份有限公司 | 一种快速编码广播用数字音频的方法 |
WO2020069219A1 (en) | 2018-09-26 | 2020-04-02 | Cala Health, Inc. | Predictive therapy neurostimulation systems |
CN112233682A (zh) * | 2019-06-29 | 2021-01-15 | 华为技术有限公司 | 一种立体声编码方法、立体声解码方法和装置 |
US11890468B1 (en) | 2019-10-03 | 2024-02-06 | Cala Health, Inc. | Neurostimulation systems with event pattern detection and classification |
CN114365509B (zh) * | 2021-12-03 | 2024-03-01 | 北京小米移动软件有限公司 | 一种立体声音频信号处理方法及设备/存储介质/装置 |
CN115691515A (zh) * | 2022-07-12 | 2023-02-03 | 南京拓灵智能科技有限公司 | 一种音频编解码方法及装置 |
Family Cites Families (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6168568B1 (en) * | 1996-10-04 | 2001-01-02 | Karmel Medical Acoustic Technologies Ltd. | Phonopneumograph system |
EP1796083B1 (en) * | 2000-04-24 | 2009-01-07 | Qualcomm Incorporated | Method and apparatus for predictively quantizing voiced speech |
KR101021079B1 (ko) * | 2002-04-22 | 2011-03-14 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 파라메트릭 다채널 오디오 표현 |
JP4322207B2 (ja) * | 2002-07-12 | 2009-08-26 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ符号化方法 |
KR101079066B1 (ko) * | 2004-03-01 | 2011-11-02 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 멀티채널 오디오 코딩 |
US8843378B2 (en) | 2004-06-30 | 2014-09-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-channel synthesizer and method for generating a multi-channel output signal |
SE0402650D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Improved parametric stereo compatible coding of spatial audio |
RU2393550C2 (ru) * | 2005-06-30 | 2010-06-27 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Устройство и способ кодирования и декодирования звукового сигнала |
RU2473062C2 (ru) * | 2005-08-30 | 2013-01-20 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ кодирования и декодирования аудиосигнала и устройство для его осуществления |
WO2007052612A1 (ja) * | 2005-10-31 | 2007-05-10 | Matsushita Electric Industrial Co., Ltd. | ステレオ符号化装置およびステレオ信号予測方法 |
US7839948B2 (en) * | 2005-12-02 | 2010-11-23 | Qualcomm Incorporated | Time slicing techniques for variable data rate encoding |
WO2008032787A1 (fr) * | 2006-09-13 | 2008-03-20 | Nippon Telegraph And Telephone Corporation | ProcÉDÉ de dÉtection de sensations, dispositif de dÉtection de sensations, programme de dÉtection de sensations contenant le procÉDÉ, et support d'enregistrement contenant le programme |
KR101505831B1 (ko) * | 2007-10-30 | 2015-03-26 | 삼성전자주식회사 | 멀티 채널 신호의 부호화/복호화 방법 및 장치 |
CN101188878B (zh) * | 2007-12-05 | 2010-06-02 | 武汉大学 | 立体声音频信号的空间参数量化及熵编码方法和所用系统 |
US8239210B2 (en) * | 2007-12-19 | 2012-08-07 | Dts, Inc. | Lossless multi-channel audio codec |
ES2401487T3 (es) * | 2008-07-11 | 2013-04-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y procedimiento para la codificación/decodificación de una señal de audio utilizando un esquema de conmutación de generación de señal ajena |
EP2169665B1 (en) * | 2008-09-25 | 2018-05-02 | LG Electronics Inc. | A method and an apparatus for processing a signal |
US8666752B2 (en) * | 2009-03-18 | 2014-03-04 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding multi-channel signal |
CN102307323B (zh) * | 2009-04-20 | 2013-12-18 | 华为技术有限公司 | 对多声道信号的声道延迟参数进行修正的方法 |
CN101582262B (zh) * | 2009-06-16 | 2011-12-28 | 武汉大学 | 一种空间音频参数帧间预测编解码方法 |
CN102025892A (zh) * | 2009-09-16 | 2011-04-20 | 索尼株式会社 | 镜头转换检测方法及装置 |
EP2478520A4 (en) * | 2009-09-17 | 2013-08-28 | Univ Yonsei Iacf | METHOD AND APPARATUS FOR PROCESSING AUDIO SIGNAL |
CN102667919B (zh) * | 2009-09-29 | 2014-09-10 | 弗兰霍菲尔运输应用研究公司 | 音频信号解码器和编码器、提供上混和下混信号表示型态的方法 |
JP5719372B2 (ja) * | 2009-10-20 | 2015-05-20 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | アップミックス信号表現を生成する装置及び方法、ビットストリームを生成する装置及び方法、並びにコンピュータプログラム |
CN102157151B (zh) * | 2010-02-11 | 2012-10-03 | 华为技术有限公司 | 一种多声道信号编码方法、解码方法、装置和系统 |
ES2656815T3 (es) * | 2010-03-29 | 2018-02-28 | Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung | Procesador de audio espacial y procedimiento para proporcionar parámetros espaciales en base a una señal de entrada acústica |
US9112591B2 (en) * | 2010-04-16 | 2015-08-18 | Samsung Electronics Co., Ltd. | Apparatus for encoding/decoding multichannel signal and method thereof |
US8305099B2 (en) | 2010-08-31 | 2012-11-06 | Nxp B.V. | High speed full duplex test interface |
CN103026406B (zh) * | 2010-09-28 | 2014-10-08 | 华为技术有限公司 | 用于对已解码多通道音频信号或已解码立体声信号进行后处理的装置和方法 |
CN103180899B (zh) * | 2010-11-17 | 2015-07-22 | 松下电器(美国)知识产权公司 | 立体声信号的编码装置、解码装置、编码方法及解码方法 |
US9424852B2 (en) * | 2011-02-02 | 2016-08-23 | Telefonaktiebolaget Lm Ericsson (Publ) | Determining the inter-channel time difference of a multi-channel audio signal |
WO2012158333A1 (en) * | 2011-05-19 | 2012-11-22 | Dolby Laboratories Licensing Corporation | Forensic detection of parametric audio coding schemes |
CN102800317B (zh) * | 2011-05-25 | 2014-09-17 | 华为技术有限公司 | 信号分类方法及设备、编解码方法及设备 |
KR101580240B1 (ko) | 2012-02-17 | 2016-01-04 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 다채널 오디오 신호를 인코딩하는 파라메트릭 인코더 |
EP2834813B1 (en) * | 2012-04-05 | 2015-09-30 | Huawei Technologies Co., Ltd. | Multi-channel audio encoder and method for encoding a multi-channel audio signal |
CN104380376B (zh) * | 2012-06-14 | 2017-03-15 | 杜比国际公司 | 解码系统、重构方法和设备、编码系统、方法和设备及音频发布系统 |
US20140086416A1 (en) * | 2012-07-15 | 2014-03-27 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients |
EP2875510A4 (en) | 2012-07-19 | 2016-04-13 | Nokia Technologies Oy | STEREO AUDIO SIGNAL ENCODER |
KR20140017338A (ko) * | 2012-07-31 | 2014-02-11 | 인텔렉추얼디스커버리 주식회사 | 오디오 신호 처리 장치 및 방법 |
EP3933836A1 (en) | 2012-11-13 | 2022-01-05 | Samsung Electronics Co., Ltd. | Method and apparatus for determining encoding mode, method and apparatus for encoding audio signals, and method and apparatus for decoding audio signals |
WO2014108738A1 (en) * | 2013-01-08 | 2014-07-17 | Nokia Corporation | Audio signal multi-channel parameter encoder |
CN110379434B (zh) * | 2013-02-21 | 2023-07-04 | 杜比国际公司 | 用于参数化多声道编码的方法 |
EP2989631A4 (en) * | 2013-04-26 | 2016-12-21 | Nokia Technologies Oy | AUDIO SIGNAL ENCODER |
US9412385B2 (en) * | 2013-05-28 | 2016-08-09 | Qualcomm Incorporated | Performing spatial masking with respect to spherical harmonic coefficients |
KR20160015280A (ko) * | 2013-05-28 | 2016-02-12 | 노키아 테크놀로지스 오와이 | 오디오 신호 인코더 |
CN104282309A (zh) * | 2013-07-05 | 2015-01-14 | 杜比实验室特许公司 | 丢包掩蔽装置和方法以及音频处理系统 |
EP2838086A1 (en) * | 2013-07-22 | 2015-02-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment |
EP2830052A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension |
CN104681029B (zh) * | 2013-11-29 | 2018-06-05 | 华为技术有限公司 | 立体声相位参数的编码方法及装置 |
US9595269B2 (en) * | 2015-01-19 | 2017-03-14 | Qualcomm Incorporated | Scaling for gain shape circuitry |
EP3067886A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
JP6721977B2 (ja) * | 2015-12-15 | 2020-07-15 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法 |
CN115148215A (zh) * | 2016-01-22 | 2022-10-04 | 弗劳恩霍夫应用研究促进协会 | 使用频谱域重新取样来编码或解码音频多通道信号的装置及方法 |
US9978381B2 (en) * | 2016-02-12 | 2018-05-22 | Qualcomm Incorporated | Encoding of multiple audio signals |
CN107731238B (zh) | 2016-08-10 | 2021-07-16 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
-
2016
- 2016-08-10 CN CN201610652506.XA patent/CN107731238B/zh active Active
-
2017
- 2017-02-22 JP JP2019507137A patent/JP6768924B2/ja active Active
- 2017-02-22 WO PCT/CN2017/074419 patent/WO2018028170A1/zh unknown
- 2017-02-22 ES ES17838306T patent/ES2928335T3/es active Active
- 2017-02-22 EP EP17838306.3A patent/EP3493203B1/en active Active
- 2017-02-22 AU AU2017310759A patent/AU2017310759B2/en active Active
- 2017-02-22 KR KR1020217001206A patent/KR102367538B1/ko active IP Right Grant
- 2017-02-22 BR BR112019002656A patent/BR112019002656A2/pt active Search and Examination
- 2017-02-22 KR KR1020197005937A patent/KR102205596B1/ko active IP Right Grant
- 2017-02-22 CA CA3033225A patent/CA3033225C/en active Active
- 2017-02-22 KR KR1020227005726A patent/KR102486604B1/ko active IP Right Grant
- 2017-02-22 RU RU2019106315A patent/RU2705427C1/ru active
- 2017-02-22 EP EP22179454.8A patent/EP4120252A1/en active Pending
-
2019
- 2019-02-11 US US16/272,397 patent/US11133014B2/en active Active
-
2020
- 2020-09-23 JP JP2020158348A patent/JP7091411B2/ja active Active
- 2020-11-12 AU AU2020267256A patent/AU2020267256B2/en active Active
-
2021
- 2021-08-20 US US17/408,116 patent/US11935548B2/en active Active
-
2022
- 2022-06-15 JP JP2022096616A patent/JP7443423B2/ja active Active
- 2022-08-17 AU AU2022218507A patent/AU2022218507B2/en active Active
-
2024
- 2024-01-23 US US18/419,794 patent/US20240161756A1/en active Pending
- 2024-02-21 JP JP2024024588A patent/JP2024063059A/ja active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7443423B2 (ja) | マルチチャネル信号の符号化方法およびエンコーダ | |
JP7273080B2 (ja) | マルチチャネル信号を符号化する方法及びエンコーダ | |
JP2015517121A (ja) | インターチャネル差分推定方法及び空間オーディオ符号化装置 | |
WO2017206794A1 (zh) | 一种声道间相位差参数的提取方法及装置 | |
JP2017058696A (ja) | インターチャネル差分推定方法及び空間オーディオ符号化装置 | |
CN107358960B (zh) | 多声道信号的编码方法和编码器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220714 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220714 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230731 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230807 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231106 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240122 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240221 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7443423 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |