JP6335301B2 - ステレオ位相パラメータを符号化する方法及び装置 - Google Patents
ステレオ位相パラメータを符号化する方法及び装置 Download PDFInfo
- Publication number
- JP6335301B2 JP6335301B2 JP2016534977A JP2016534977A JP6335301B2 JP 6335301 B2 JP6335301 B2 JP 6335301B2 JP 2016534977 A JP2016534977 A JP 2016534977A JP 2016534977 A JP2016534977 A JP 2016534977A JP 6335301 B2 JP6335301 B2 JP 6335301B2
- Authority
- JP
- Japan
- Prior art keywords
- value
- current frame
- parameter
- stereo phase
- itd
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 82
- 238000009499 grossing Methods 0.000 claims description 76
- 101100438378 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) fac-1 gene Proteins 0.000 claims description 34
- 101100326803 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) fac-2 gene Proteins 0.000 claims description 28
- 238000004364 calculation method Methods 0.000 claims description 10
- 230000000694 effects Effects 0.000 description 13
- 238000013139 quantization Methods 0.000 description 12
- 238000005259 measurement Methods 0.000 description 10
- 230000005236 sound signal Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 210000005069 ears Anatomy 0.000 description 3
- 238000011084 recovery Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Stereophonic System (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
現在のフレームの大域ステレオ位相パラメータを取得するステップと、
現在のフレームの大域ステレオ位相パラメータの値を決定するステップと、
現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値を調整するステップと、
現在のフレームの大域ステレオ位相パラメータの調整された値を符号化するステップと、
を含む。
現在のフレームのサブバンドのチャネル間時間差を取得するステップと、
現在のフレームのサブバンドのチャネル間時間差に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値を計算するステップと、
現在のフレームの大域ステレオ位相パラメータの値の決定結果と、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するステップと、
を含む。
現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値にフレーム間平滑化処理を実行し、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値を取得するステップ、
を含み、
現在のフレームの大域ステレオ位相パラメータの値の決定結果と、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するステップは、具体的には、
現在のフレームの大域ステレオ位相パラメータの値の決定結果と、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するステップ、
を含む。
現在のフレームの大域ステレオ位相パラメータの値の決定結果と、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するステップは、
現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0でないことである場合、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_ITDパラメータの値の調製するステップ、
を含む。
以下の式
に従って、現在のフレームのG_ITDパラメータの値の絶対値を調整するステップであり、
はG_ITDパラメータの値の調整された絶対値、
はG_ITDパラメータの値の絶対値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac1及びfac2は平滑化因子であり、fac1>0、fac2>0、fac1+fac2=1である。
現在のフレームの大域ステレオ位相パラメータの値の決定結果と、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するステップは、
現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であることである場合、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_IPDパラメータの値を調整するステップ、
を含む。
以下の式
に従って、G_IPDパラメータの値の絶対値を調整するステップを含み、
はG_IPDパラメータの値の調整された絶対値、
はG_IPDパラメータの値の絶対値、fac3及びfac4は平滑化因子であり、fac3>0、fac4>0、fac3+fac4=1であり、
現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値を、現在のフレームのG_IPDパラメータの絶対値として用い、現在のフレームの前のフレームのG_IPDパラメータのシンボルを、現在のフレームのG_IPDパラメータのシンボルとして用いるステップ、
を含む。
以下の式
ITD_sm(k)=fac5×ITD_sm(k-1)+fac6×ITD
に従って、フレーム間平滑化処理を実行するステップを含み、
ITD_sm(k)は現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、ITD_sm(k-1)は現在のフレームの前のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac5及びfac6は平滑化因子であり、fac5>0、fac6>6、fac5+fac6=1である。
現在のフレームの大域ステレオ位相パラメータを取得するように構成される取得ユニットと、
取得ユニットによって取得された現在のフレームの大域ステレオ位相パラメータの値を決定するように構成される決定ユニットと、
決定ユニットによって決定された現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値を調整するように構成される調整ユニットと、
調整ユニットによって調整された現在のフレームの大域ステレオ位相パラメータの値を符号化するように構成される符号化ユニットと、
を備える。
現在のフレームのサブバンドのチャネル間時間差を取得するように構成される取得モジュールと、
取得モジュールによって取得された現在のフレームのサブバンドのチャネル間時間差に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値を計算するように構成される計算モジュールと、
現在のフレームの大域ステレオ位相パラメータの値の決定結果と、計算モジュールによって計算された現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するように構成される調整モジュールと、
を有する。
計算モジュールによって計算された現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値に、フレーム間平滑化処理を実行するように構成される処理モジュール、
を有し、
取得モジュールは更に、処理モジュールによって平滑化された現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値を取得するように構成され、
調整モジュールは更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果と、取得モジュールによって取得された現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するように構成される。
取得ユニットによって取得される大域ステレオ位相パラメータはグループ遅延G_ITDパラメータを含み、
調整モジュールは更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0でないことである場合、取得モジュールによって取得された現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_ITDパラメータの値を調整するように構成される。
調整モジュールは更に、以下の式
調整モジュールによる調整時の平滑化因子は、fac1=0.5を満たす。
取得ユニットによって取得される大域ステレオ位相パラメータは、グループ遅延G_ITDパラメータ及びグループ位相G_IPDパラメータを含み、
調整モジュールは更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であることである場合、取得モジュールによって取得された現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_IPDパラメータの値を調整するように構成される。
調整モジュールは更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であり、現在のフレームのG_IPDパラメータの値が0でないことである場合、以下の式
調整モジュールによる調整時の平滑化因子は、fac3=0.75を満たす。
現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0である場合、処理モジュールによって平滑化された現在のフレームのサブバンドのチャネル間位相差の絶対値の平均値を、現在のフレームのG_IPDパラメータの絶対値として用い、現在のフレームの前のフレームのG_IPDパラメータのシンボルを、現在のフレームのG_IPDパラメータのシンボルとして用いるように構成される構成モジュール、
を有する。
処理モジュールは更に、以下の式
ITD_sm(k)=fac5×ITD_sm(k-1)+fac6×ITD
に従って、フレーム間平滑化処理を実行するように構成され、
ITD_sm(k)は現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、ITD_sm(k-1)は現在のフレームの前のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac5及びfac6は平滑化因子であり、fac5>0、fac6>6、fac5+fac6=1である。
処理モジュールによる平滑化処理時の平滑化因子は、fac5=0.9844を満たす。
ITD_sm(k)=fac5×ITD_sm(k-1)+fac6×ITD
に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値にフレーム間平滑化処理を実行し、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値を取得してよい。ITD_sm(k)は現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、ITD_sm(k-1)は現在のフレームの前のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac5及びfac6は平滑化因子であり、fac5>0、fac6>6、fac5+fac6=1である。
ITD_sm(k)=fac5×ITD_sm(k-1)+fac6×ITD
に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値にフレーム間平滑化処理を実行し、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値を取得してよい。ITD_sm(k)は現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、ITD_sm(k-1)は現在のフレームの前のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac5及びfac6は平滑化因子であり、fac5>0、fac6>6、fac5+fac6=1である。
ITD_sm(k)=fac5×ITD_sm(k-1)+fac6×ITD
に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値にフレーム間平滑化処理を実行し、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値を取得してよい。ITD_sm(k)は現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、ITD_sm(k-1)は現在のフレームの前のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac5及びfac6は平滑化因子であり、fac5>0、fac6>6、fac5+fac6=1である。
ITD_sm(k)=fac5×ITD_sm(k-1)+fac6×ITD
に従って、フレーム間平滑化処理を実行するように構成される。ITD_sm(k)は現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、ITD_sm(k-1)は現在のフレームの前のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac5及びfac6は平滑化因子であり、fac5>0、fac6>6、fac5+fac6=1である。
ITD_sm(k)=fac5×ITD_sm(k-1)+fac6×ITD
に従って、フレーム間平滑化処理を実行するように構成される。ITD_sm(k)は現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、ITD_sm(k-1)は現在のフレームの前のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac5及びfac6は平滑化因子であり、fac5>0、fac6>6、fac5+fac6=1である。
Claims (19)
- ステレオ位相パラメータを符号化する方法であって、
現在のフレームの大域ステレオ位相パラメータを取得するステップと、
前記現在のフレームの前記大域ステレオ位相パラメータの値を決定するステップと、
前記現在のフレームの前記大域ステレオ位相パラメータの前記値の決定結果に従って、前記現在のフレームの前記大域ステレオ位相パラメータの前記値を調整するステップと、
前記現在のフレームの前記大域ステレオ位相パラメータの調整された値を符号化するステップと、
を含み、
前記現在のフレームの前記大域ステレオ位相パラメータの前記値の決定結果に従って、前記現在のフレームの前記大域ステレオ位相パラメータの前記値を調整する前記ステップは、
前記現在のフレームのサブバンドのチャネル間時間差を取得するステップと、
前記現在のフレームの前記サブバンドの前記チャネル間時間差に従って、前記現在のフレームの前記サブバンドの前記チャネル間時間差の絶対値の平均値を計算するステップと、
前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果と、前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平均値とに従って、前記現在のフレームの前記大域ステレオ位相パラメータの前記値を調整するステップと、
を含み、
前記現在のフレームがデータストリームの第1のデータフレームでない場合、前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果と、前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平均値とに従って、前記現在のフレームの前記大域ステレオ位相パラメータの前記値を調整する前記ステップの前に、当該方法は更に、
前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平均値にフレーム間平滑化処理を実行し、前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の平滑化された平均値を取得するステップ、
を含み、
前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果と、前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平均値とに従って、前記現在のフレームの前記大域ステレオ位相パラメータの前記値を調整する前記ステップは、
前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果と、前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値とに従って、前記現在のフレームの前記大域ステレオ位相パラメータの前記値を調整するステップ、
を含み、
前記大域ステレオ位相パラメータはグループ遅延G_ITDパラメータを含み、
前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果と、前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値とに従って、前記現在のフレームの前記大域ステレオ位相パラメータの前記値を調整する前記ステップは、
前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果が、前記現在のフレームの前記G_ITDパラメータの値が0でないことである場合、前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値に従って、前記現在のフレームの前記G_ITDパラメータの前記値を調整するステップ、
を含む、ステレオ位相パラメータを符号化する方法。 - 前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値に従って、前記現在のフレームの前記G_ITDパラメータの前記値を調整する前記ステップは、
以下の式
請求項1に係るステレオ位相パラメータを符号化する方法。 - fac1=0.5である、
請求項2に係るステレオ位相パラメータを符号化する方法。 - 前記大域ステレオ位相パラメータは、前記グループ遅延(G_ITD)パラメータ及びグループ位相(G_IPD)パラメータを含み、
前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果と、前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値とに従って、前記現在のフレームの前記大域ステレオ位相パラメータの前記値を調整する前記ステップは、
前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果が、前記G_ITDパラメータの前記値が0であることである場合、前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値に従って、前記現在のフレームの前記G_IPDパラメータの値を調整するステップ、
を含む、請求項1乃至3のいずれか一項に記載のステレオ位相パラメータを符号化する方法。 - 前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果が、前記現在のフレームの前記G_ITDパラメータの前記値が0であり、且つ前記現在のフレームの前記G_IPDパラメータの前記値が0でないことである場合、前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値に従って、前記現在のフレームの前記G_IPDパラメータの値を調整する前記ステップは、
以下の式
請求項4に係る、ステレオ位相パラメータを符号化する方法。 - fac3=0.75である、
請求項5に係るステレオ位相パラメータを符号化する方法。 - 前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果が、前記現在のフレームの前記G_ITDパラメータの前記値が0であり、且つ前記現在のフレームの前記G_IPDパラメータの前記値が0であることである場合、前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値に従って、前記現在のフレームの前記G_IPDパラメータの値を調整する前記ステップは、
前記現在のフレームの前記サブバンドのチャネル間位相差の絶対値の平滑化された平均値を、前記現在のフレームの前記G_IPDパラメータの値の絶対値として用い、前記現在のフレームの前のフレームのG_IPDパラメータのシンボルを、前記現在のフレームの前記G_IPDパラメータのシンボルとして用いるステップ、
を含む、請求項4に係るステレオ位相パラメータを符号化する方法。 - 前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平均値にフレーム間平滑化処理を実行し、前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の平滑化された平均値を取得する前記ステップは、
以下の式
ITD_sm(k)=fac5×ITD_sm(k-1)+fac6×ITD
に従って、フレーム間平滑化処理を実行するステップを含み、
ITD_sm(k)は前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値、ITD_sm(k-1)は前記現在のフレームの前のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac5及びfac6は平滑化因子であり、fac5>0、fac6>6、fac5+fac6=1である、
請求項1乃至7のいずれか一項に記載のステレオ位相パラメータを符号化する方法。 - fac5=0.9844である、
請求項8に係るステレオ位相パラメータを符号化する方法。 - 現在のフレームの大域ステレオ位相パラメータを取得するように構成される取得ユニットと、
前記取得ユニットによって取得された前記現在のフレームの前記大域ステレオ位相パラメータの値を決定するように構成される決定ユニットと、
前記決定ユニットによって決定された前記現在のフレームの前記大域ステレオ位相パラメータの前記値の決定結果に従って、前記現在のフレームの前記大域ステレオ位相パラメータの前記値を調整するように構成される調整ユニットと、
前記調整ユニットによって調整された前記現在のフレームの前記大域ステレオ位相パラメータの値を符号化するように構成される符号化ユニットと、
を備える、ステレオ位相パラメータを符号化する装置であって、
前記調整ユニットは、
前記現在のフレームのサブバンドのチャネル間時間差を取得するように構成される取得モジュールと、
前記取得モジュールによって取得された前記現在のフレームの前記サブバンドの前記チャネル間時間差に従って、前記現在のフレームの前記サブバンドの前記チャネル間時間差の絶対値の平均値を計算するように構成される計算モジュールと、
前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果と、前記計算モジュールによって計算された前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平均値とに従って、前記現在のフレームの前記大域ステレオ位相パラメータの前記値を調整するように構成される調整モジュールと、
を有し、
前記調整ユニットは更に、
前記計算モジュールによって計算された前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平均値に、フレーム間平滑化処理を実行するように構成される処理モジュール、
を有し、
前記取得モジュールは更に、前記処理モジュールによって平滑化された前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の平均値を取得するように構成され、
前記調整モジュールは更に、前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果と、前記取得モジュールによって取得された前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値とに従っ
て、前記現在のフレームの前記大域ステレオ位相パラメータの前記値を調整するように構成され、
前記取得ユニットによって取得される前記大域ステレオ位相パラメータは、グループ遅延(G_ITD)パラメータを含み、
前記調整モジュールは更に、前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果が、前記G_ITDパラメータの値が0でないことである場合、前記取得モジュールによって取得された前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値に従って、前記現在のフレームの前記G_ITDパラメータの前記値を調整するように構成される、
ステレオ位相パラメータを符号化する装置。 - fac1=0.5である、
請求項11に係る、ステレオ位相パラメータを符号化する装置。 - 前記取得ユニットによって取得される前記大域ステレオ位相パラメータは、前記グループ遅延(G_ITD)パラメータ及びグループ位相(G_IPD)パラメータを含み、
前記調整モジュールは更に、前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果が、前記G_ITDパラメータの前記値が0であることである場合、前記取得モジュールによって取得された前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値に従って、前記現在のフレームの前記G_IPDパラメータの値を調整するように構成される、
請求項10乃至12のいずれか一項に記載の、ステレオ位相パラメータを符号化する装置。 - 前記調整モジュールは更に、前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果が、前記G_ITDパラメータの前記値が0であり、且つ前記現在のフレームの前記G_IPDパラメータの前記値が0でない場合、以下の式
請求項13に係る、ステレオ位相パラメータを符号化する装置。 - fac3=0.75である、
請求項14に係る、ステレオ位相パラメータを符号化する装置。 - 前記調整ユニットは更に、
前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果が、前記G_ITDパラメータの前記値が0であり、且つ前記現在のフレームの前記G_IPDパラメータの前記値が0であることである場合、前記処理モジュールによって平滑化された前記現在のフレームの前記サブバンドのチャネル間位相差の絶対値の平均値を、前記現在のフレームの前記G_IPDパラメータの値の絶対値として用い、前記現在のフレームの前のフレームのG_IPDパラメータのシンボルを前記現在のフレームの前記G_IPDパラメータのシンボルとして用いるように構成される構成モジュール、
を有する、請求項13に係るステレオ位相パラメータを符号化する装置。 - 前記処理モジュールは更に、以下の式
ITD_sm(k)=fac5×ITD_sm(k-1)+fac6×ITD
に従って、フレーム間平滑化処理を実行するように構成され、
ITD_sm(k)は前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値、ITD_sm(k-1)は前記現在のフレームの前のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac5及びfac6は平滑化因子であり、fac5>0、fac6>6、fac5+fac6=1である、
請求項10乃至16のいずれか一項に記載のステレオ位相パラメータを符号化する装置。 - fac5=0.9844である、
請求項17に係るステレオ位相パラメータを符号化する装置。 - 請求項1乃至9のいずれか一項に記載の方法をコンピューターに実行させるプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310632664.5A CN104681029B (zh) | 2013-11-29 | 2013-11-29 | 立体声相位参数的编码方法及装置 |
CN201310632664.5 | 2013-11-29 | ||
PCT/CN2014/074673 WO2015078123A1 (zh) | 2013-11-29 | 2014-04-02 | 立体声相位参数的编码方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017503190A JP2017503190A (ja) | 2017-01-26 |
JP6335301B2 true JP6335301B2 (ja) | 2018-05-30 |
Family
ID=53198276
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016534977A Active JP6335301B2 (ja) | 2013-11-29 | 2014-04-02 | ステレオ位相パラメータを符号化する方法及び装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US10008211B2 (ja) |
EP (1) | EP3057095B1 (ja) |
JP (1) | JP6335301B2 (ja) |
KR (1) | KR101798559B1 (ja) |
CN (1) | CN104681029B (ja) |
WO (1) | WO2015078123A1 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107358961B (zh) * | 2016-05-10 | 2021-09-17 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
CN107358960B (zh) * | 2016-05-10 | 2021-10-26 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
CN107452387B (zh) | 2016-05-31 | 2019-11-12 | 华为技术有限公司 | 一种声道间相位差参数的提取方法及装置 |
US10217467B2 (en) | 2016-06-20 | 2019-02-26 | Qualcomm Incorporated | Encoding and decoding of interchannel phase differences between audio signals |
CN107731238B (zh) | 2016-08-10 | 2021-07-16 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
US10366695B2 (en) | 2017-01-19 | 2019-07-30 | Qualcomm Incorporated | Inter-channel phase difference parameter modification |
US10217468B2 (en) * | 2017-01-19 | 2019-02-26 | Qualcomm Incorporated | Coding of multiple audio signals |
CN108877815B (zh) * | 2017-05-16 | 2021-02-23 | 华为技术有限公司 | 一种立体声信号处理方法及装置 |
CN109215668B (zh) * | 2017-06-30 | 2021-01-05 | 华为技术有限公司 | 一种声道间相位差参数的编码方法及装置 |
CN109300480B (zh) * | 2017-07-25 | 2020-10-16 | 华为技术有限公司 | 立体声信号的编解码方法和编解码装置 |
CN117133297A (zh) | 2017-08-10 | 2023-11-28 | 华为技术有限公司 | 时域立体声参数的编码方法和相关产品 |
EP4383254A1 (en) * | 2022-12-07 | 2024-06-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder comprising an inter-channel phase difference calculator device and method for operating such encoder |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE0004187D0 (sv) * | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
US7006636B2 (en) * | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
US8135136B2 (en) * | 2004-09-06 | 2012-03-13 | Koninklijke Philips Electronics N.V. | Audio signal enhancement |
CN101221763B (zh) * | 2007-01-09 | 2011-08-24 | 昆山杰得微电子有限公司 | 针对子带编码音频的三维声场合成方法 |
US8385556B1 (en) * | 2007-08-17 | 2013-02-26 | Dts, Inc. | Parametric stereo conversion system and method |
GB2453117B (en) | 2007-09-25 | 2012-05-23 | Motorola Mobility Inc | Apparatus and method for encoding a multi channel audio signal |
KR101444102B1 (ko) * | 2008-02-20 | 2014-09-26 | 삼성전자주식회사 | 스테레오 오디오의 부호화, 복호화 방법 및 장치 |
US8258849B2 (en) | 2008-09-25 | 2012-09-04 | Lg Electronics Inc. | Method and an apparatus for processing a signal |
KR101108061B1 (ko) | 2008-09-25 | 2012-01-25 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치 |
CN102292769B (zh) * | 2009-02-13 | 2012-12-19 | 华为技术有限公司 | 一种立体声编码方法和装置 |
EP2402941B1 (en) * | 2009-02-26 | 2015-04-15 | Panasonic Intellectual Property Corporation of America | Channel signal generation apparatus |
MX2011006248A (es) * | 2009-04-08 | 2011-07-20 | Fraunhofer Ges Forschung | Aparato, metodo y programa de computacion para mezclar en forma ascendente una señal de audio con mezcla descendente utilizando una suavizacion de valor de fase. |
US9584235B2 (en) * | 2009-12-16 | 2017-02-28 | Nokia Technologies Oy | Multi-channel audio processing |
CN102157152B (zh) * | 2010-02-12 | 2014-04-30 | 华为技术有限公司 | 立体声编码的方法、装置 |
EP2702776B1 (en) * | 2012-02-17 | 2015-09-23 | Huawei Technologies Co., Ltd. | Parametric encoder for encoding a multi-channel audio signal |
EP2834813B1 (en) * | 2012-04-05 | 2015-09-30 | Huawei Technologies Co., Ltd. | Multi-channel audio encoder and method for encoding a multi-channel audio signal |
-
2013
- 2013-11-29 CN CN201310632664.5A patent/CN104681029B/zh active Active
-
2014
- 2014-04-02 EP EP14866259.6A patent/EP3057095B1/en active Active
- 2014-04-02 JP JP2016534977A patent/JP6335301B2/ja active Active
- 2014-04-02 WO PCT/CN2014/074673 patent/WO2015078123A1/zh active Application Filing
- 2014-04-02 KR KR1020167014661A patent/KR101798559B1/ko active IP Right Grant
-
2016
- 2016-05-13 US US15/154,655 patent/US10008211B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP3057095A4 (en) | 2016-11-23 |
EP3057095B1 (en) | 2019-11-20 |
EP3057095A1 (en) | 2016-08-17 |
CN104681029B (zh) | 2018-06-05 |
KR101798559B1 (ko) | 2017-12-12 |
KR20160077201A (ko) | 2016-07-01 |
WO2015078123A1 (zh) | 2015-06-04 |
JP2017503190A (ja) | 2017-01-26 |
US10008211B2 (en) | 2018-06-26 |
US20160254002A1 (en) | 2016-09-01 |
CN104681029A (zh) | 2015-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6335301B2 (ja) | ステレオ位相パラメータを符号化する方法及び装置 | |
KR102367538B1 (ko) | 다중 채널 신호 인코딩 방법 및 인코더 | |
KR101168645B1 (ko) | 과도 신호 부호화 방법 및 장치, 과도 신호 복호화 방법 및 장치, 및 과도 신호 처리 시스템 | |
US11217257B2 (en) | Method for encoding multi-channel signal and encoder | |
RU2020103799A (ru) | Способ и устройство кодирования параметра межканальной разности фаз | |
CN107358961B (zh) | 多声道信号的编码方法和编码器 | |
CN107358960B (zh) | 多声道信号的编码方法和编码器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170725 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171024 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180403 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180427 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6335301 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |