JP6335301B2 - ステレオ位相パラメータを符号化する方法及び装置 - Google Patents

ステレオ位相パラメータを符号化する方法及び装置 Download PDF

Info

Publication number
JP6335301B2
JP6335301B2 JP2016534977A JP2016534977A JP6335301B2 JP 6335301 B2 JP6335301 B2 JP 6335301B2 JP 2016534977 A JP2016534977 A JP 2016534977A JP 2016534977 A JP2016534977 A JP 2016534977A JP 6335301 B2 JP6335301 B2 JP 6335301B2
Authority
JP
Japan
Prior art keywords
value
current frame
parameter
stereo phase
itd
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016534977A
Other languages
English (en)
Other versions
JP2017503190A (ja
Inventor
▲興▼涛 ▲張▼
▲興▼涛 ▲張▼
磊 苗
磊 苗
文▲海▼ ▲呉▼
文▲海▼ ▲呉▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2017503190A publication Critical patent/JP2017503190A/ja
Application granted granted Critical
Publication of JP6335301B2 publication Critical patent/JP6335301B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Stereophonic System (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、情報技術分野に関し、特に、ステレオ位相パラメータを符号化する方法及び装置に関する。
人々の物質面での生活水準がますます改善されるにつれて、オーディオ効果に対する要求がますます高まっている。モノラルオーディオと比較すると、ステレオオーディオには様々な音源について方向感覚と分布感覚があり、オーディオ情報の鮮明さを改善することができる。その結果、ステレオオーディオは、人々のオーディオ効果への要求をより良好に満たすことができる。
現在は、ステレオオーディオ信号が取得されるとき、Global(大域)パラメータが抽出され、Globalパラメータに従ってステレオ位相情報が回復される。Globalパラメータは、G_ITD(Global Inter-Channel Time Difference、グループ遅延)及びG_IPD(Global Inter-Channel Phase Difference、グループ位相)を含む。
しかしながら、Globalパラメータを抽出することによりステレオ位相情報が直接的に回復される場合、抽出されるG_ITD及びG_IPDの精度は比較的低く、G_ITD及びG_IPDに従って元のステレオ位相情報を回復することができない。よって、ステレオオーディオ情報の効果が比較的乏しくなってしまう。
本発明の実施形態は、ステレオオーディオ情報の効果を改善することのできる、ステレオ位相パラメータを符号化する方法及び装置を提供する。
本発明の実施形態において採用される技術的解決策は以下のとおりである。
第1の態様によれば、本発明の実施形態は、ステレオ位相パラメータを符号化する方法を提供する。本方法は、
現在のフレームの大域ステレオ位相パラメータを取得するステップと、
現在のフレームの大域ステレオ位相パラメータの値を決定するステップと、
現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値を調整するステップと、
現在のフレームの大域ステレオ位相パラメータの調整された値を符号化するステップと、
を含む。
第1の態様の第1の実施方式では、現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値を調整するステップは、具体的には、
現在のフレームのサブバンドのチャネル間時間差を取得するステップと、
現在のフレームのサブバンドのチャネル間時間差に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値を計算するステップと、
現在のフレームの大域ステレオ位相パラメータの値の決定結果と、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するステップと、
を含む。
第1の態様又は第1の態様の第1の実施方式に関して、第1の態様の第2の実施方式では、現在のフレームがデータストリームの第1のデータフレームでない場合、現在のフレームの大域ステレオ位相パラメータの値の決定結果と、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するステップの前に、本方法は更に、
現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値にフレーム間平滑化処理を実行し、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値を取得するステップ、
を含み、
現在のフレームの大域ステレオ位相パラメータの値の決定結果と、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するステップは、具体的には、
現在のフレームの大域ステレオ位相パラメータの値の決定結果と、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するステップ、
を含む。
第1の態様、第1の態様の第1の実施方式又は第1の態様の第2の実施方式に関して、第1の態様の第3の実施方式では、大域ステレオ位相パラメータはグループ遅延G_ITDパラメータを含み、
現在のフレームの大域ステレオ位相パラメータの値の決定結果と、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するステップは、
現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0でないことである場合、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_ITDパラメータの値の調製するステップ、
を含む。
第1の態様、第1の態様の第1の実施方式、第1の態様の第2の実施方式又は第1の態様の第3の実施方式に関して、第1の態様の第4の実施方式では、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_ITDパラメータの値の調製するステップは、具体的には、
以下の式
Figure 0006335301

に従って、現在のフレームのG_ITDパラメータの値の絶対値を調整するステップであり、
Figure 0006335301

はG_ITDパラメータの値の調整された絶対値、
Figure 0006335301

はG_ITDパラメータの値の絶対値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac1及びfac2は平滑化因子であり、fac1>0、fac2>0、fac1+fac2=1である。
第1の態様、第1の態様の第1の実施方式、第1の態様の第2の実施方式、第1の態様の第3の実施方式又は第1の態様の第4の実施方式に関して、第1の態様の第5の実施方式では、fac1=0.5である。
第1の態様、第1の態様の第1の実施方式、第1の態様の第2の実施方式、第1の態様の第3の実施方式、第1の態様の第4の実施方式又は第1の態様の第5の実施方式に関して、第1の態様の第6の実施方式では、大域ステレオ位相パラメータは、グループ遅延G_ITDパラメータ及びグループ位相G_IPDパラメータを含み、
現在のフレームの大域ステレオ位相パラメータの値の決定結果と、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するステップは、
現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であることである場合、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_IPDパラメータの値を調整するステップ、
を含む。
第1の態様、第1の態様の第1の実施方式、第1の態様の第2の実施方式、第1の態様の第3の実施方式、第1の態様の第4の実施方式、第1の態様の第5の実施方式又は第1の態様の第6の実施方式に関して、第1の態様の第7の実施方式では、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0でないことである場合、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_IPDパラメータの値を調整するステップは、具体的には、
以下の式
Figure 0006335301

に従って、G_IPDパラメータの値の絶対値を調整するステップを含み、
Figure 0006335301

はG_IPDパラメータの値の調整された絶対値、
Figure 0006335301

はG_IPDパラメータの値の絶対値、fac3及びfac4は平滑化因子であり、fac3>0、fac4>0、fac3+fac4=1であり、
Figure 0006335301
であり、FFT_LENは変換長さ、Kは周波数ビン値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、IPD_smは現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値である。
第1の態様、第1の態様の第1の実施方式、第1の態様の第2の実施方式、第1の態様の第3の実施方式、第1の態様の第4の実施方式、第1の態様の第5の実施方式、第1の態様の第6の実施方式又は第1の態様の第7の実施方式に関して、第1の態様の第8の実施方式では、fac3=0.75である。
第1の態様、第1の態様の第1の実施方式、第1の態様の第2の実施方式、第1の態様の第3の実施方式、第1の態様の第4の実施方式、第1の態様の第5の実施方式、第1の態様の第6の実施方式、第1の態様の第7の実施方式又は第1の態様の第8の実施方式に関して、第1の態様の第9の実施方式では、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0である場合、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_IPDパラメータの値を調整するステップは、具体的には、
現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値を、現在のフレームのG_IPDパラメータの絶対値として用い、現在のフレームの前のフレームのG_IPDパラメータのシンボルを、現在のフレームのG_IPDパラメータのシンボルとして用いるステップ、
を含む。
第1の態様、第1の態様の第1の実施方式、第1の態様の第2の実施方式、第1の態様の第3の実施方式、第1の態様の第4の実施方式、第1の態様の第5の実施方式、第1の態様の第6の実施方式、第1の態様の第7の実施方式、第1の態様の第8の実施方式又は第1の態様の第9の実施方式に関して、第1の態様の第10の実施方式では、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値にフレーム間平滑化処理を実行し、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値を取得するステップは、
以下の式
ITD_sm(k)=fac5×ITD_sm(k-1)+fac6×ITD
に従って、フレーム間平滑化処理を実行するステップを含み、
ITD_sm(k)は現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、ITD_sm(k-1)は現在のフレームの前のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac5及びfac6は平滑化因子であり、fac5>0、fac6>6、fac5+fac6=1である。
第1の態様、第1の態様の第1の実施方式、第1の態様の第2の実施方式、第1の態様の第3の実施方式、第1の態様の第4の実施方式、第1の態様の第5の実施方式、第1の態様の第6の実施方式、第1の態様の第7の実施方式、第1の態様の第8の実施方式、第1の態様の第9の実施方式又は第1の態様の第10の実施方式に関して、第1の態様の第11の実施方式では、fac5=0.9844である。
の態様によれば、本発明の実施形態は、ステレオ位相パラメータを符号化する装置を提供する。本装置は、
現在のフレームの大域ステレオ位相パラメータを取得するように構成される取得ユニットと、
取得ユニットによって取得された現在のフレームの大域ステレオ位相パラメータの値を決定するように構成される決定ユニットと、
決定ユニットによって決定された現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値を調整するように構成される調整ユニットと、
調整ユニットによって調整された現在のフレームの大域ステレオ位相パラメータの値を符号化するように構成される符号化ユニットと、
を備える。
第2の態様の第1の実施方式では、調整ユニットは、
現在のフレームのサブバンドのチャネル間時間差を取得するように構成される取得モジュールと、
取得モジュールによって取得された現在のフレームのサブバンドのチャネル間時間差に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値を計算するように構成される計算モジュールと、
現在のフレームの大域ステレオ位相パラメータの値の決定結果と、計算モジュールによって計算された現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するように構成される調整モジュールと、
を有する。
第2の態様又は第2の態様の第1の実施方式に関して、第2の態様の第2の実施方式では、調整ユニットは更に、
計算モジュールによって計算された現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値に、フレーム間平滑化処理を実行するように構成される処理モジュール、
を有し、
取得モジュールは更に、処理モジュールによって平滑化された現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値を取得するように構成され、
調整モジュールは更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果と、取得モジュールによって取得された現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するように構成される。
第2の態様、第2の態様の第1の実施方式又は第2の態様の第2の実施方式に関して、第2の態様の第3の実施方式では、
取得ユニットによって取得される大域ステレオ位相パラメータはグループ遅延G_ITDパラメータを含み、
調整モジュールは更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0でないことである場合、取得モジュールによって取得された現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_ITDパラメータの値を調整するように構成される。
第2の態様、第2の態様の第1の実施方式、第2の態様の第2の実施方式又は第2の態様の第3の実施方式に関して、第2の態様の第4の実施方式では、
調整モジュールは更に、以下の式
Figure 0006335301
に従って、現在のフレームのG_ITDパラメータの値の絶対値を調整するように構成され、
Figure 0006335301
はG_ITDパラメータの値の調整された絶対値、
Figure 0006335301
はG_ITDパラメータの値の絶対値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac1及びfac2は平滑化因子であり、fac1>0、fac2>0、fac1+fac2=1である。
第2の態様、第2の態様の第1の実施方式、第2の態様の第2の実施方式、第2の態様の第3の実施方式又は第2の態様の第4の実施方式に関して、第2の態様の第5の実施方式では、
調整モジュールによる調整時の平滑化因子は、fac1=0.5を満たす。
第2の態様、第2の態様の第1の実施方式、第2の態様の第2の実施方式、第2の態様の第3の実施方式、第2の態様の第4の実施方式又は第2の態様の第5の実施方式に関して、第2の態様の第6の実施方式では、
取得ユニットによって取得される大域ステレオ位相パラメータは、グループ遅延G_ITDパラメータ及びグループ位相G_IPDパラメータを含み、
調整モジュールは更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であることである場合、取得モジュールによって取得された現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_IPDパラメータの値を調整するように構成される。
第2の態様、第2の態様の第1の実施方式、第2の態様の第2の実施方式、第2の態様の第3の実施方式、第2の態様の第4の実施方式、第2の態様の第5の実施方式又は第2の態様の第6の実施方式に関して、第2の態様の第7の実施方式では、
調整モジュールは更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であり、現在のフレームのG_IPDパラメータの値が0でないことである場合、以下の式
Figure 0006335301
に従って、G_IPDパラメータの値の絶対値を調整するように構成され、
Figure 0006335301
はG_IPDパラメータの値の調整された絶対値、
Figure 0006335301
はG_IPDパラメータの値の絶対値、fac3及びfac4は平滑化因子であり、fac3>0、fac4>0、fac3+fac4=1であり、
Figure 0006335301
であり、FFT_LENは変換長さ、Kは周波数ビン値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、IPD_smは現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値である。
第2の態様、第2の態様の第1の実施方式、第2の態様の第2の実施方式、第2の態様の第3の実施方式、第2の態様の第4の実施方式、第2の態様の第5の実施方式、第2の態様の第6の実施方式又は第2の態様の第7の実施方式に関して、第2の態様の第8の実施方式では、
調整モジュールによる調整時の平滑化因子は、fac3=0.75を満たす。
第2の態様、第2の態様の第1の実施方式、第2の態様の第2の実施方式、第2の態様の第3の実施方式、第2の態様の第4の実施方式、第2の態様の第5の実施方式、第2の態様の第6の実施方式、第2の態様の第7の実施方式又は第2の態様の第8の実施方式に関して、第2の態様の第9の実施方式では、調整ユニットは更に、
現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0である場合、処理モジュールによって平滑化された現在のフレームのサブバンドのチャネル間位相差の絶対値の平均値を、現在のフレームのG_IPDパラメータの絶対値として用い、現在のフレームの前のフレームのG_IPDパラメータのシンボルを、現在のフレームのG_IPDパラメータのシンボルとして用いるように構成される構成モジュール、
を有する。
第2の態様、第2の態様の第1の実施方式、第2の態様の第2の実施方式、第2の態様の第3の実施方式、第2の態様の第4の実施方式、第2の態様の第5の実施方式、第2の態様の第6の実施方式、第2の態様の第7の実施方式、第2の態様の第8の実施方式又は第2の態様の第9の実施方式に関して、第2の態様の第10の実施方式では、
処理モジュールは更に、以下の式
ITD_sm(k)=fac5×ITD_sm(k-1)+fac6×ITD
に従って、フレーム間平滑化処理を実行するように構成され、
ITD_sm(k)は現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、ITD_sm(k-1)は現在のフレームの前のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac5及びfac6は平滑化因子であり、fac5>0、fac6>6、fac5+fac6=1である。
第2の態様、第2の態様の第1の実施方式、第2の態様の第2の実施方式、第2の態様の第3の実施方式、第2の態様の第4の実施方式、第2の態様の第5の実施方式、第2の態様の第6の実施方式、第2の態様の第7の実施方式、第2の態様の第8の実施方式、第2の態様の第9の実施方式又は第2の態様の第10の実施方式に関して、第2の態様の第11の実施方式では、
処理モジュールによる平滑化処理時の平滑化因子は、fac5=0.9844を満たす。
本発明の実施形態において提供されるステレオ位相パラメータを符号化する方法及び装置によれば、最初に、現在のフレームの大域ステレオ位相パラメータが取得される。それから、現在のフレームの大域ステレオ位相パラメータの値が決定され、現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値が調整される。最後に、現在のフレームの大域ステレオ位相パラメータの調整された値が符号化される。Globalパラメータを抽出することによりステレオ位相情報が直接的に回復される既存の技術と比較すると、本発明の実施形態では、調整されたGlobalパラメータを用いてステレオ位相情報が回復される。よって、ステレオ位相情報の精度を改善することができ、その結果、ステレオオーディオ情報の効果が改善される。
本発明の実施形態の技術的解決策をより明確に説明するために、以下、実施形態又は従来技術の説明に必要な添付の図面を簡単に紹介する。当然ながら、添付の図面は、以下の説明において、本発明の一部の実施形態を示すに過ぎない。当業者であれば、これら添付の図面から創意工夫なく他の図面を更に導出できるであろう。
本発明の実施形態に係る、ステレオ位相パラメータを符号化する方法のフローチャートである。 本発明の実施形態に係る、別のステレオ位相パラメータを符号化する方法のフローチャートである。 本発明の実施形態に係る、更に別のステレオ位相パラメータを符号化する方法のフローチャートである。 本発明の実施形態に係る、更に別のステレオ位相パラメータを符号化する方法のフローチャートである。 本発明の実施形態に係る、ステレオ位相パラメータを符号化する装置の概略構造図である。 本発明の実施形態に係る、サーバーの概略構造図である。 本発明の実施形態に係る、別のステレオ位相パラメータを符号化する装置の概略構造図である。 本発明の実施形態に係る、別のサーバーの概略構造図である。
以下、本発明の実施形態において添付の図面を参照して、本発明の実施形態の技術的解決策を明確且つ完全に説明する。当然ながら、説明される実施形態は本発明の実施形態の一部に過ぎず、全部ではない。当業者が本発明の実施形態に基づいて創意工夫なく得た他の実施形態は全て、本発明の保護範囲に包含されるものとする。
本発明の技術的解決策をより明確にするために、以下、添付の図面及び実施形態を参照して本発明を詳述する。
本発明の実施形態は、ステレオ位相パラメータを符号化する方法を提供する。図1に示されるように、本方法は以下の要素を含む。
101.サーバーが、現在のフレームの大域ステレオ位相パラメータを取得する。
大域ステレオ位相パラメータは、グループ遅延G_ITD及びグループ位相G_IPDを含む。本発明の本実施形態では、グループ遅延G_ITDは、サンプルの測定単位において、ステレオの左右のオーディオチャネル間の時間遅延を表す。グループ位相G_IPDは、値が(−π、π]の範囲をとるラジアンの測定単位において、ステレオの左右のオーディオチャネル間の時間整合後の波形類似性を表す。
102.サーバーが、現在のフレームの大域ステレオ位相パラメータの値を決定する。
現在のフレームの大域ステレオ位相パラメータの値の決定結果は、現在のフレームのG_ITDパラメータの値が0でないことと、現在のフレームのG_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0でないことと、現在のフレームのG_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0であることと、を含む。
103.サーバーが、現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値を調整する。
本発明の本実施形態では、現在のフレームの抽出された大域ステレオ位相パラメータG_ITD及びG_IPDの精度が低い場合、サーバーは、ステレオ位相パラメータに従って元のステレオ位相情報を回復することができず、したがって、ステレオオーディオ信号を回復することができない。本発明の本実施形態では、サーバーがG_ITD又はG_IPDを調整するので、元のステレオ位相パラメータと大きく異なるG_ITD及びG_IPDに従ってステレオ位相情報が回復されることを回避することができる。したがって、ステレオオーディオ情報の効果を改善することができる。
104.サーバーが、現在のフレームの大域ステレオ位相パラメータの調整された値を符号化する。
サーバーは、5bit(ビット)量子化・符号化の方式で、現在のフレームの大域ステレオ位相パラメータの調整された値を符号化してよい。第1のビットはステレオ位相パラメータのフラグビットflagであり、第2のビット〜第5のビットは、現在のフレームの大域ステレオ位相パラメータの調整された値に符号化処理が実行された後に得られる値である。具体的には、flag=1のとき、サーバーは現在のフレームのG_ITDの量子化値を送信し、flag=0のとき、サーバーは現在のフレームのG_IPDの量子化値を送信する。
本発明の本実施形態において提供されるステレオ位相パラメータを符号化する方法によれば、最初に、現在のフレームの大域ステレオ位相パラメータが取得される。それから、現在のフレームの大域ステレオ位相パラメータの値が決定され、現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値が調整される。最後に、現在のフレームの大域ステレオ位相パラメータの調整された値が符号化される。Globalパラメータを抽出することによりステレオ位相情報が直接的に回復される既存の技術と比較すると、本発明の本実施形態では、調整されたGlobalパラメータを用いてステレオ位相情報が回復される。よって、ステレオ位相情報の精度を改善することができ、その結果、ステレオオーディオ情報の効果が改善される。
本発明の実施形態は、別のステレオ位相パラメータを符号化する方法を提供する。図2に示されるように、本方法は以下の要素を含む。
201.サーバーが、現在のフレームの大域ステレオ位相パラメータを取得する。
大域ステレオ位相パラメータは、グループ遅延G_ITD及びグループ位相G_IPDを含む。本発明の本実施形態では、グループ遅延G_ITDは、サンプルの測定単位において、ステレオの左右のオーディオチャネル間の時間遅延を表す。グループ位相G_IPDは、値が(−π、π]の範囲をとるラジアンの測定単位において、ステレオの左右のオーディオチャネル間の時間整合後の波形類似性を表す。
202.サーバーが、現在のフレームの大域ステレオ位相パラメータの値を決定する。
現在のフレームの大域ステレオ位相パラメータの値の決定結果は、現在のフレームのG_ITDパラメータの値が0でないことと、現在のフレームのG_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0でないことと、現在のフレームのG_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0であることと、を含む。
203.サーバーが、現在のフレームのサブバンドのチャネル間時間差を取得する。
現在のフレームのサブバンドは、サーバーにより事前に分割されてよい。例えば、サーバーは周波数バンドを12個のサブバンドに分割してよく、各サブバンドは対応するチャネル間時間差を有する。
本発明の本実施形態では、チャネル間時間差は、音がそれぞれ左右の耳に到達する時間の差を表すのに用いられる。ITDが0より大きい値であるとき、音が左耳に到達する時間は音が右耳に到達する時間より早い。ITDが0より小さい値であるとき、音が左耳に到達する時間は音が右耳に到達する時間より遅い。ITDが0に等しいとき、音が左耳に到達する時間は音が右耳に到達する時間と同じである。本発明の本実施形態では、ITDはサンプルを用いて表されてよい。例えば、ms(millisecond、ミリ秒)の測定単位において、ITDの時間間隔は(−5ms、5ms)である。サーバーが16kHzバンド幅でサンプリングを実行した後、サンプルの測定単位において、対応するサンプル間隔は(−80、80)である。
204.サーバーが、現在のフレームのサブバンドのチャネル間時間差に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値を計算する。
本発明の本実施形態では、サーバーは、以下の式
Figure 0006335301
に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値を計算してよい。ITDはサブバンドの絶対値の平均値、ITD(b)はb番目のサブバンドのチャネル間時間差であり、bは1以上L以下の整数、Lはサブバンドの総数である。
205.サーバーが、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値にフレーム間平滑化処理を実行し、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値を取得する。
具体的には、ステップ205では、サーバーは、以下の式
ITD_sm(k)=fac5×ITD_sm(k-1)+fac6×ITD
に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値にフレーム間平滑化処理を実行し、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値を取得してよい。ITD_sm(k)は現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、ITD_sm(k-1)は現在のフレームの前のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac5及びfac6は平滑化因子であり、fac5>0、fac6>6、fac5+fac6=1である。
本発明の本実施形態では、平滑化因子fac5の値はfac5=0.9844であってよく、対応する平滑化因子fac6はfac6=1−0.9844=0.0156であってよい。
本発明の本実施形態では、サーバーは、現在のフレームの隣接するデータフレーム間で平滑化処理を実行してよい。よって、現在のフレームの隣接するデータフレームに対応するステレオ位相情報が急変した場合にステレオオーディオ信号が急変するという状況を回避することができ、ステレオオーディオの効果を更に改善することができる。
現在のフレームの大域ステレオ位相パラメータの値の決定結果が、現在のフレームのG_ITDパラメータの値が0でないことである場合、ステップ206aが実行される。すなわち、サーバーが、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_ITDパラメータの値を調整する。
具体的には、ステップ206aでは、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、現在のフレームのG_ITDパラメータの値が0でないことである場合、サーバーは、以下の式
Figure 0006335301
に従って、現在のフレームのG_ITDパラメータの値の絶対値を調整してよい。ここで、
Figure 0006335301
はG_ITDパラメータの値の調整された絶対値、
Figure 0006335301
はG_ITDパラメータの値の絶対値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac1及びfac2は平滑化因子であり、fac1>0、fac2>0、fac1+fac2=1である。
本発明の本実施形態では、平滑化因子fac1の値はfac1=0.5であってよく、対応する平滑化因子fac2はfac2=1−0.5=0.5であってよい。
現在のフレームの大域ステレオ位相パラメータの値の決定結果が、現在のフレームのG_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0でない場合、ステップ206bが実行される。すなわち、サーバーが、以下の式
Figure 0006335301
に従って、G_IPDパラメータの値の絶対値を調整する。ここで、
Figure 0006335301
はG_IPDパラメータの値の調整された絶対値、
Figure 0006335301
はG_IPDパラメータの値の絶対値、fac3及びfac4は平滑化因子であり、fac3>0、fac4>0、fac3+fac4=1であり、
Figure 0006335301
であり、FFT_LENは変換長さ、Kは周波数ビン値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、IPD_smは現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値である。
本発明の本実施形態では、平滑化因子fac3の値はfac3=0.75であってよく、対応する平滑化因子fac4はfac4=1−0.75=0.25であってよい。
現在のフレームの大域ステレオ位相パラメータの値の決定結果が、現在のフレームのG_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0であることである場合、ステップ206cが実行される。すなわち、サーバーが、現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値を、現在のフレームのG_IPDパラメータの絶対値として用い、現在のフレームの前のフレームのG_IPDパラメータのシンボルを、現在のフレームのG_IPDパラメータのシンボルとして用いる。
本発明の本実施形態では、サーバーは、以下の式
Figure 0006335301
に従って、現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値を計算してよい。FFT_LENは変換長さ、Kは周波数ビン値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、IPD_smは現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値である。
207.サーバーが、現在のフレームの大域ステレオ位相パラメータの調整された値を符号化する。
サーバーは、5bit(ビット)量子化・符号化の方式で、現在のフレームの大域ステレオ位相パラメータの調整された値を符号化してよい。第1のビットはステレオ位相パラメータのフラグビットflagであり、第2のビット〜第5のビットは、現在のフレームの大域ステレオ位相パラメータの調整された値に符号化処理が実行された後に得られる値である。具体的には、flag=1のとき、サーバーは現在のフレームのG_ITDの量子化値を送信し、flag=0のとき、サーバーは現在のフレームのG_IPDの量子化値を送信する。
本発明の本実施形態において提供されるステレオ位相パラメータを符号化する方法によれば、最初に、現在のフレームの大域ステレオ位相パラメータが取得される。それから、現在のフレームの大域ステレオ位相パラメータの値が決定され、現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値が調整される。最後に、現在のフレームの大域ステレオ位相パラメータの調整された値が符号化される。Globalパラメータを抽出することによりステレオ位相情報が直接的に回復される既存の技術と比較すると、本発明の本実施形態では、調整されたGlobalパラメータを用いてステレオ位相情報が回復される。よって、ステレオ位相情報の精度を改善することができ、その結果、ステレオオーディオ情報の効果が改善される。
本発明の実施形態は、更に別のステレオ位相パラメータを符号化する方法を提供する。現在のフレームのG_ITDパラメータ及びG_IPDパラメータの値が両方とも0である場合の調整に適用可能である。図3に示されるように、本方法は以下の要素を含む。
301.サーバーが、現在のフレームの大域ステレオ位相パラメータを取得する。
大域ステレオ位相パラメータは、グループ遅延G_ITD及びグループ位相G_IPDを含む。本発明の本実施形態では、グループ遅延G_ITDは、サンプルの測定単位において、ステレオの左右のオーディオチャネル間の時間遅延を表す。グループ位相G_IPDは、値が(−π、π]の範囲をとるラジアンの測定単位において、ステレオの左右のオーディオチャネル間の時間整合後の波形類似性を表す。
302.サーバーが、現在のフレームの大域ステレオ位相パラメータの値を決定する。
現在のフレームの大域ステレオ位相パラメータの値の決定結果は、現在のフレームのG_ITDパラメータの値が0でないことと、現在のフレームのG_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0でないことと、現在のフレームのG_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0であることと、を含む。
303.サーバーが、現在のフレームのサブバンドのチャネル間時間差を取得する。
現在のフレームのサブバンドは、サーバーにより事前に分割されてよい。例えば、サーバーは周波数バンドを12個のサブバンドに分割してよく、各サブバンドは対応するチャネル間時間差を有する。
本発明の本実施形態では、チャネル間時間差は、音がそれぞれ左右の耳に到達する時間の差を表すのに用いられる。ITDが0より大きい値であるとき、音が左耳に到達する時間は音が右耳に到達する時間より早い。ITDが0より小さい値であるとき、音が左耳に到達する時間は音が右耳に到達する時間より遅い。ITDが0に等しいとき、音が左耳に到達する時間は音が右耳に到達する時間と同じである。本発明の本実施形態では、ITDはサンプルを用いて表されてよい。例えば、ms(millisecond、ミリ秒)の測定単位において、ITDの時間間隔は(−5ms、5ms)である。サーバーが16kHzバンド幅でサンプリングを実行した後、サンプルの測定単位において、対応するサンプル間隔は(−80、80)である。
304.サーバーが、現在のフレームのサブバンドのチャネル間時間差に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値を計算する。
本発明の本実施形態では、サーバーは、以下の式
Figure 0006335301
に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値を計算してよい。ITDはサブバンドの絶対値の平均値、ITD(b)はb番目のサブバンドのチャネル間時間差であり、bは1以上L以下の整数、Lはサブバンドの総数である。
305.サーバーが、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値にフレーム間平滑化処理を実行し、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値を取得する。
具体的には、ステップ305では、サーバーが、以下の式
ITD_sm(k)=fac5×ITD_sm(k-1)+fac6×ITD
に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値にフレーム間平滑化処理を実行し、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値を取得してよい。ITD_sm(k)は現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、ITD_sm(k-1)は現在のフレームの前のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac5及びfac6は平滑化因子であり、fac5>0、fac6>6、fac5+fac6=1である。
本発明の本実施形態では、平滑化因子fac5の値はfac5=0.9844であってよく、対応する平滑化因子fac6はfac6=1−0.9844=0.0156であってよい。
本発明の本実施形態では、サーバーは、現在のフレームの隣接するデータフレーム間で平滑化処理を実行してよい。よって、現在のフレームの隣接するデータフレームに対応するステレオ位相情報が急変した場合にステレオオーディオ信号が急変するという状況を回避することができ、ステレオオーディオの効果を更に改善することができる。
306.現在のフレームの大域ステレオ位相パラメータの値の決定結果が、現在のフレームのG_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0であることである場合、サーバーが、現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値を、現在のフレームのG_IPDパラメータの絶対値として用い、現在のフレームの前のフレームのG_IPDパラメータのシンボルを、現在のフレームのG_IPDパラメータのシンボルとして用いる。
本発明の本実施形態では、サーバーは、以下の式
Figure 0006335301
に従って、現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値を計算してよい。FFT_LENは変換長さ、Kは周波数ビン値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、IPD_smは現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値である。
307.サーバーが、現在のフレームの大域ステレオ位相パラメータの調整された値を符号化する。
サーバーは、5bit(ビット)量子化・符号化の方式で、現在のフレームの大域ステレオ位相パラメータの調整された値を符号化してよい。第1のビットはステレオ位相パラメータのフラグビットflagであり、第2のビット〜第5のビットは、現在のフレームの大域ステレオ位相パラメータの調整された値に符号化処理が実行された後に得られる値である。具体的には、flag=1のとき、サーバーは現在のフレームのG_ITDの量子化値を送信し、flag=0のとき、サーバーは現在のフレームのG_IPDの量子化値を送信する。
本発明の本実施形態において提供されるステレオ位相パラメータを符号化する方法によれば、最初に、現在のフレームの大域ステレオ位相パラメータが取得される。それから、現在のフレームの大域ステレオ位相パラメータの値が決定され、現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値が調整される。最後に、現在のフレームの大域ステレオ位相パラメータの調整された値が符号化される。Globalパラメータを抽出することによりステレオ位相情報が直接的に回復される既存の技術と比較すると、本発明の本実施形態では、調整されたGlobalパラメータを用いてステレオ位相情報が回復される。よって、ステレオ位相情報の精度を改善することができ、その結果、ステレオオーディオ情報の効果が改善される。
本発明の実施形態は、更に別のステレオ位相パラメータを符号化する方法を提供する。本方法は、現在のフレームのG_ITDパラメータの値と現在のフレームのG_IPDパラメータの値のいずれかが0である場合の調整に適用可能である。図4に示されるように、本方法は以下の要素を含む。
401.サーバーが、現在のフレームの大域ステレオ位相パラメータを取得する。
大域ステレオ位相パラメータは、グループ遅延G_ITD及びグループ位相G_IPDを含む。本発明の本実施形態では、グループ遅延G_ITDは、サンプルの測定単位において、ステレオの左右のオーディオチャネル間の時間遅延を表す。グループ位相G_IPDは、値が(−π、π]の範囲をとるラジアンの測定単位において、ステレオの左右のオーディオチャネル間の時間整合後の波形類似性を表す。
402.サーバーが、現在のフレームの大域ステレオ位相パラメータの値を決定する。
現在のフレームの大域ステレオ位相パラメータの値の決定結果は、現在のフレームのG_ITDパラメータの値が0でないことと、現在のフレームのG_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0でないことと、現在のフレームのG_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0であることと、を含む。
403.サーバーが、現在のフレームのサブバンドのチャネル間時間差を取得する。
現在のフレームのサブバンドは、サーバーにより事前に分割されてよい。例えば、サーバーは周波数バンドを12個のサブバンドに分割してよく、各サブバンドは対応するチャネル間時間差を有する。
本発明の本実施形態では、チャネル間時間差は、音がそれぞれ左右の耳に到達する時間の差を表すのに用いられる。ITDが0より大きい値であるとき、音が左耳に到達する時間は音が右耳に到達する時間より早い。ITDが0より小さい値であるとき、音が左耳に到達する時間は音が右耳に到達する時間より遅い。ITDが0に等しいとき、音が左耳に到達する時間は音が右耳に到達する時間と同じである。本発明の本実施形態では、ITDはサンプルを用いて表されてよい。例えば、ms(millisecond、ミリ秒)の測定単位において、ITDの時間間隔は(−5ms、5ms)である。サーバーが16kHzバンド幅でサンプリングを実行した後、サンプルの測定単位において、対応するサンプル間隔は(−80、80)である。
404.サーバーが、現在のフレームのサブバンドのチャネル間時間差に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値を計算する。
本発明の本実施形態では、サーバーは、以下の式
Figure 0006335301
に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値を計算してよい。ITDはサブバンドの絶対値の平均値、ITD(b)はb番目のサブバンドのチャネル間時間差であり、bは1以上L以下の整数、Lはサブバンドの総数である。
405.サーバーが、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値にフレーム間平滑化処理を実行し、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値を取得する。
具体的には、ステップ405では、サーバーが、以下の式
ITD_sm(k)=fac5×ITD_sm(k-1)+fac6×ITD
に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値にフレーム間平滑化処理を実行し、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値を取得してよい。ITD_sm(k)は現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、ITD_sm(k-1)は現在のフレームの前のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac5及びfac6は平滑化因子であり、fac5>0、fac6>6、fac5+fac6=1である。
本発明の本実施形態では、平滑化因子fac5の値はfac5=0.9844であってよく、対応する平滑化因子fac6はfac6=1−0.9844=0.0156であってよい。
本発明の本実施形態では、サーバーは、現在のフレームの隣接するデータフレーム間で平滑化処理を実行してよい、現在のフレームの隣接するデータフレームに対応するステレオ位相情報が急変した場合にステレオオーディオ信号が急変するという状況を回避することができ、ステレオオーディオの効果を更に改善することができる。
現在のフレームの大域ステレオ位相パラメータの値の決定結果が、現在のフレームのG_ITDパラメータの値が0でないことである場合、ステップ406aが実行される。すなわち、サーバーが、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_ITDパラメータの値を調整する。
具体的には、ステップ406aでは、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、現在のフレームのG_ITDパラメータの値が0でないことであった場合、サーバーが、以下の式
Figure 0006335301
に従って、現在のフレームのG_ITDパラメータの値の絶対値を調整してよい。ここで、
Figure 0006335301
はG_ITDパラメータの値の調整された絶対値、
Figure 0006335301
はG_ITDパラメータの値の絶対値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac1及びfac2は平滑化因子であり、fac1>0、fac2>0、fac1+fac2=1である。
本発明の本実施形態では、平滑化因子fac1の値はfac1=0.5であってよく、対応する平滑化因子fac2はfac2=1−0.5=0.5であってよい。
現在のフレームの大域ステレオ位相パラメータの値の決定結果が、現在のフレームのG_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0でないことである場合、ステップ406bが実行される。すなわち、サーバーが、以下の式
Figure 0006335301
に従って、G_IPDパラメータの値の絶対値を調整する。ここで、
Figure 0006335301
はG_IPDパラメータの値の調整された絶対値、
Figure 0006335301
はG_IPDパラメータの値の絶対値、fac3及びfac4は平滑化因子であり、fac3>0、fac4>0、fac3+fac4=1であり、
Figure 0006335301
であり、FFT_LENは変換長さ、Kは周波数ビン値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、IPD_smは現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値である。
本発明の本実施形態では、平滑化因子の値fac3はfac3=0.75であってよく、対応する平滑化因子fac4はfac4=1−0.75=0.25であってよい。
407.サーバーが、現在のフレームの大域ステレオ位相パラメータの調整された値を符号化する。
サーバーは、5bit(ビット)量子化・符号化の方式で、現在のフレームの大域ステレオ位相パラメータの調整された値を符号化してよい。第1のビットはステレオ位相パラメータのフラグビットflagであり、第2のビット〜第5のビットは、現在のフレームの大域ステレオ位相パラメータの調整された値に符号化処理が実行された後に得られる値である。具体的には、flag=1のとき、サーバーは現在のフレームのG_ITDの量子化値を送信し、flag=0のとき、サーバーは現在のフレームのG_IPDの量子化値を送信する。
本発明の本実施形態において提供されるステレオ位相パラメータを符号化する方法によれば、最初に、現在のフレームの大域ステレオ位相パラメータが取得される。それから、現在のフレームの大域ステレオ位相パラメータの値が決定され、現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値が調整される。最後に、現在のフレームの大域ステレオ位相パラメータの調整された値が符号化される。Globalパラメータを抽出することによりステレオ位相情報が直接的に回復される既存の技術と比較すると、本発明の本実施形態では、調整されたGlobalパラメータを用いてステレオ位相情報が回復される。よって、ステレオ位相情報の精度を改善することができ、その結果、ステレオオーディオ情報の効果が改善される。
本発明の実施形態は、ステレオ位相パラメータを符号化する装置を提供する。図5に示されるように、装置の実体はサーバーであってよい。装置は、取得ユニット51、決定ユニット52、調整ユニット53及び符号化ユニット54を備える。
取得ユニット51は、現在のフレームの大域ステレオ位相パラメータを取得するように構成される。
決定ユニット52は、取得ユニット51によって取得された現在のフレームの大域ステレオ位相パラメータの値を決定するように構成される。
調整ユニット53は、決定ユニット52によって決定された現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値を調整するように構成される。
符号化ユニット54は、調整ユニット53によって調整された現在のフレームの大域ステレオ位相パラメータの値を符号化するように構成される。
更に、ステレオ位相パラメータを符号化する装置の実体はサーバーであってよい。図6に示されるように、サーバーは、プロセッサ61、入力装置62、出力装置63及びメモリ64を備えてよい。入力装置62、出力装置63及びメモリ64は、プロセッサ61に接続される。
プロセッサ61は、現在のフレームの大域ステレオ位相パラメータを取得するように構成される。
プロセッサ61は更に、現在のフレームの大域ステレオ位相パラメータの値を決定するように構成される。
プロセッサ61は更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値を調整するように構成される。
プロセッサ61は更に、現在のフレームの大域ステレオ位相パラメータの調整された値を符号化するように構成される。
なお、本発明の本実施形態において提供されるステレオ位相パラメータを調整する装置の機能ユニットの対応するその他の説明については、図1の対応する説明を参照することができ、ここでは詳細の説明を省略する。
本発明の実施形態は、別のステレオ位相パラメータを符号化する装置を提供する。図7に示されるように、装置の実体はサーバーであってよい。装置は、取得ユニット71、決定ユニット72、調整ユニット73及び符号化ユニット74を備える。
取得ユニット71は、現在のフレームの大域ステレオ位相パラメータを取得するように構成される。
決定ユニット72は、取得ユニット71によって取得された現在のフレームの大域ステレオ位相パラメータの値を決定するように構成される。
調整ユニット73は、決定ユニット72によって決定された現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値を調整するように構成される。
符号化ユニット74は、調整ユニット73による調整によって得られた現在のフレームの大域ステレオ位相パラメータの値を符号化するように構成される。
調整ユニット73は、取得モジュール7301、計算ユニット7302及び調整モジュール7303を有する。
取得モジュール7301は、現在のフレームのサブバンドのチャネル間時間差を取得するように構成される。
計算モジュール7302は、取得モジュール7301によって取得された現在のフレームのサブバンドのチャネル間時間差に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値を計算するように構成される。
調整モジュール7303は、現在のフレームの大域ステレオ位相パラメータの値の決定結果と、計算モジュール7302によって計算された現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するように構成される。
調整ユニット73は更に処理モジュール7304を有する。
処理モジュール7304は、計算モジュール7302によって計算された現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値に、フレーム間平滑化処理を実行するように構成される。
取得モジュール7301は更に、処理モジュール7304によって平滑化された現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値を取得するように構成される。
調整モジュール7303は更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果と、取得モジュール7301によって取得された現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するように構成される。
取得ユニット71によって取得される大域ステレオ位相パラメータは、グループ遅延G_ITDパラメータを含む。
調整モジュール7303は更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0でないことである場合、取得モジュール7301によって取得された現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_ITDパラメータの値を調整するように構成される。
調整モジュール7303は更に、以下の式
Figure 0006335301
に従って、現在のフレームのG_ITDパラメータの値の絶対値を調整するように構成される。ここで、
Figure 0006335301
はG_ITDパラメータの値の調整された絶対値、
Figure 0006335301
はG_ITDパラメータの値の絶対値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac1及びfac2は平滑化因子であり、fac1>0、fac2>0、fac1+fac2=1である。
調整モジュール7303による調整時の平滑化因子は、fac1=0.5を満たす。
取得ユニット71によって取得される大域ステレオ位相パラメータは、グループ遅延G_ITDパラメータ及びグループ位相G_IPDパラメータを含む。
調整モジュール7303は更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であることである場合、取得モジュール7301によって取得された現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_IPDパラメータの値を調整するように構成される。
調整モジュール7303は更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0でないことである場合、以下の式
Figure 0006335301
に従って、G_IPDパラメータの値の絶対値を調整するように構成される。ここで、
Figure 0006335301
はG_IPDパラメータの値の調整された絶対値、
Figure 0006335301
はG_IPDパラメータの値の絶対値、fac3及びfac4は平滑化因子であり、fac3>0、fac4>0、fac3+fac4=1であり、
Figure 0006335301
であり、FFT_LENは変換長さ、Kは周波数ビン値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、IPD_smは現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値である。
調整モジュール7303による調整時の平滑化因子は、fac3=0.75を満たす。
調整ユニット73は更に構成モジュール7305を有する。
構成モジュール7305は、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0であることである場合、処理モジュール7304によって平滑化された現在のフレームのサブバンドのチャネル間位相差の絶対値の平均値を、現在のフレームのG_IPDパラメータの絶対値として用い、現在のフレームの前のフレームのG_IPDパラメータのシンボルを、現在のフレームのG_IPDパラメータのシンボルとして用いるように構成される。
処理モジュール7304は更に、以下の式
ITD_sm(k)=fac5×ITD_sm(k-1)+fac6×ITD
に従って、フレーム間平滑化処理を実行するように構成される。ITD_sm(k)は現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、ITD_sm(k-1)は現在のフレームの前のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac5及びfac6は平滑化因子であり、fac5>0、fac6>6、fac5+fac6=1である。
処理モジュール7304による平滑化処理時の平滑化因子は、fac5=0.9844を満たす。
更に、ステレオ位相パラメータを符号化する装置の実体はサーバーであってよい。図8に示されるように、サーバーは、プロセッサ81、入力装置82、出力装置83及びメモリ84を備えてよい。入力装置82、出力装置83及びメモリ84は、プロセッサ81に接続される。
プロセッサ81は、現在のフレームの大域ステレオ位相パラメータを取得するように構成される。
プロセッサ81は更に、現在のフレームの大域ステレオ位相パラメータの値を決定するように構成される。
プロセッサ81は更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果に従って、現在のフレームの大域ステレオ位相パラメータの値を調整するように構成される。
プロセッサ81は更に、現在のフレームの大域ステレオ位相パラメータの調整された値を符号化するように構成される。
プロセッサ81は更に、現在のフレームのサブバンドのチャネル間時間差を取得するように構成される。
プロセッサ81は更に、現在のフレームのサブバンドのチャネル間時間差に従って、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値を計算するように構成される。
プロセッサ81は更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果と、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するように構成される。
プロセッサ81は更に、現在のフレームのサブバンドのチャネル間時間差の絶対値の平均値にフレーム間平滑化処理を実行するように構成される。
プロセッサ81は更に、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値を取得するように構成される。
プロセッサ81は更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果と、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値とに従って、現在のフレームの大域ステレオ位相パラメータの値を調整するように構成される。
プロセッサ81によって取得される大域ステレオ位相パラメータは、グループ遅延G_ITDパラメータを含む。
プロセッサ81は更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0でないことである場合、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_ITDパラメータの値を調整するように構成される。
プロセッサ81は更に、以下の式
Figure 0006335301
に従って、現在のフレームのG_ITDパラメータの値の絶対値を調整するように構成される。ここで、
Figure 0006335301
はG_ITDパラメータの値の調整された絶対値、
Figure 0006335301
はG_ITDパラメータの値の絶対値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac1及びfac2は平滑化因子であり、fac1>0、fac2>0、fac1+fac2=1である。
プロセッサ81による調整時の平滑化因子は、fac1=0.5を満たす。
プロセッサ81によって取得される大域ステレオ位相パラメータは、グループ遅延G_ITDパラメータ及びグループ位相G_IPDパラメータを含む。
プロセッサ81は更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であることである場合、現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値に従って、現在のフレームのG_IPDパラメータの値を調整するように構成される。
プロセッサ81は更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0でないことである場合、以下の式
Figure 0006335301
に従って、G_IPDパラメータの値の絶対値を調整するように構成される。ここで、
Figure 0006335301
はG_IPDパラメータの値の調整された絶対値、
Figure 0006335301
はG_IPDパラメータの値の絶対値、fac3及びfac4は平滑化因子であり、fac3>0、fac4>0、fac3+fac4=1であり、
Figure 0006335301
であり、FFT_LENは変換長さ、Kは周波数ビン値、ITD_smは現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、IPD_smは現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値である。
プロセッサ81による調整時の平滑化因子は、fac3=0.75を満たす。
プロセッサ81は更に、現在のフレームの大域ステレオ位相パラメータの値の決定結果が、G_ITDパラメータの値が0であり、且つ現在のフレームのG_IPDパラメータの値が0であることである場合、現在のフレームのサブバンドのチャネル間位相差の絶対値の平滑化された平均値を、現在のフレームのG_IPDパラメータの絶対値として用い、現在のフレームの前のフレームのG_IPDパラメータのシンボルを、現在のフレームのG_IPDパラメータのシンボルとして用いるように構成される。
プロセッサ81は更に、以下の式
ITD_sm(k)=fac5×ITD_sm(k-1)+fac6×ITD
に従って、フレーム間平滑化処理を実行するように構成される。ITD_sm(k)は現在のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、ITD_sm(k-1)は現在のフレームの前のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac5及びfac6は平滑化因子であり、fac5>0、fac6>6、fac5+fac6=1である。
プロセッサ81による平滑化処理時の平滑化因子は、fac5=0.9844を満たす。なお、本発明の本実施形態において提供されるステレオ位相パラメータを調整する装置の機能ユニットの対応するその他の説明については、図2の対応する説明を参照することができ、ここでは詳細の説明を省略する。
本発明の実施形態において提供されるステレオ位相パラメータを符号化する装置は、上記に提供される方法実施形態を実現することができる。機能実現の詳細については方法実施形態の説明を参照することができ、ここでは詳細の説明を省略する。本発明の実施形態において提供されるステレオ位相パラメータを符号化する方法及び装置は、ステレオ位相情報の回復に適用可能であるが、それに限定されない。
当業者であれば、実施形態における方法のプロセスの全部又は一部が、関連ハードウェアに命令を与えるコンピュータープログラムによって実現されてよいことが理解できるであろう。プログラムはコンピューター可読記憶媒体に格納されてよい。プログラムが実行されると、実施形態における方法のプロセスが実行される。上述の記憶媒体は、磁気ディスク、光学ディスク、リードオンリーメモリ(Read-Only Memory、ROM)又はランダムアクセスメモリ(Random Access Memory、RAM)を含んでよい。
上述の説明は本発明の具体的な実施方式に過ぎず、本発明の保護範囲を限定する意図はない。当業者が本発明に開示の技術的範囲内で容易に想到し得る変形又は置換は、いかなるものであっても本発明の保護範囲に包含されるものとする。したがって、本発明の保護範囲は、特許請求の範囲の保護範囲に従うものとする。

Claims (19)

  1. ステレオ位相パラメータを符号化する方法であって、
    現在のフレームの大域ステレオ位相パラメータを取得するステップと、
    前記現在のフレームの前記大域ステレオ位相パラメータの値を決定するステップと、
    前記現在のフレームの前記大域ステレオ位相パラメータの前記値の決定結果に従って、前記現在のフレームの前記大域ステレオ位相パラメータの前記値を調整するステップと、
    前記現在のフレームの前記大域ステレオ位相パラメータの調整された値を符号化するステップと、
    を含み、
    前記現在のフレームの前記大域ステレオ位相パラメータの前記値の決定結果に従って、前記現在のフレームの前記大域ステレオ位相パラメータの前記値を調整する前記ステップは、
    前記現在のフレームのサブバンドのチャネル間時間差を取得するステップと、
    前記現在のフレームの前記サブバンドの前記チャネル間時間差に従って、前記現在のフレームの前記サブバンドの前記チャネル間時間差の絶対値の平均値を計算するステップと、
    前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果と、前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平均値とに従って、前記現在のフレームの前記大域ステレオ位相パラメータの前記値を調整するステップと、
    を含み、
    前記現在のフレームがデータストリームの第1のデータフレームでない場合、前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果と、前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平均値とに従って、前記現在のフレームの前記大域ステレオ位相パラメータの前記値を調整する前記ステップの前に、当該方法は更に、
    前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平均値にフレーム間平滑化処理を実行し、前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の平滑化された平均値を取得するステップ、
    を含み、
    前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果と、前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平均値とに従って、前記現在のフレームの前記大域ステレオ位相パラメータの前記値を調整する前記ステップは、
    前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果と、前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値とに従って、前記現在のフレームの前記大域ステレオ位相パラメータの前記値を調整するステップ、
    を含み、
    前記大域ステレオ位相パラメータはグループ遅延G_ITDパラメータを含み、
    前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果と、前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値とに従って、前記現在のフレームの前記大域ステレオ位相パラメータの前記値を調整する前記ステップは、
    前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果が、前記現在のフレームの前記G_ITDパラメータの値が0でないことである場合、前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値に従って、前記現在のフレームの前記G_ITDパラメータの前記値を調整するステップ、
    を含む、ステレオ位相パラメータを符号化する方法。
  2. 前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値に従って、前記現在のフレームの前記G_ITDパラメータの前記値を調整する前記ステップは、
    以下の式
    Figure 0006335301
    に従って、前記現在のフレームの前記G_ITDパラメータの前記値の絶対値を調整するステップを含み、
    Figure 0006335301
    は前記G_ITDパラメータの前記値の調整された絶対値、
    Figure 0006335301
    は前記G_ITDパラメータの前記値の前記絶対値、ITD_smは前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値、fac1及びfac2は平滑化因子であり、fac1>0、fac2>0、fac1+fac2=1である、
    請求項に係るステレオ位相パラメータを符号化する方法。
  3. fac1=0.5である、
    請求項に係るステレオ位相パラメータを符号化する方法。
  4. 前記大域ステレオ位相パラメータは、前記グループ遅延(G_ITD)パラメータ及びグループ位相(G_IPD)パラメータを含み、
    前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果と、前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値とに従って、前記現在のフレームの前記大域ステレオ位相パラメータの前記値を調整する前記ステップは、
    前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果が、前記G_ITDパラメータの前記値が0であることである場合、前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値に従って、前記現在のフレームの前記G_IPDパラメータの値を調整するステップ、
    を含む、請求項1乃至3のいずれか一項に記載のステレオ位相パラメータを符号化する方法。
  5. 前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果が、前記現在のフレームの前記G_ITDパラメータの前記値が0であり、且つ前記現在のフレームの前記G_IPDパラメータの前記値が0でないことである場合、前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値に従って、前記現在のフレームの前記G_IPDパラメータの値を調整する前記ステップは、
    以下の式
    Figure 0006335301
    に従って、前記G_IPDパラメータの前記値の絶対値を調整するステップを含み、
    Figure 0006335301
    は前記G_IPDパラメータの前記値の調整された絶対値、
    Figure 0006335301
    は前記G_IPDパラメータの前記値の前記絶対値、fac3及びfac4は平滑化因子であり、fac3>0、fac4>0、fac3+fac4=1であり、
    Figure 0006335301
    であり、FFT_LENは変換長さ、Kは周波数ビン値、ITD_smは前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値、IPD_smは前記現在のフレームの前記サブバンドのチャネル間位相差の絶対値の平滑化された平均値である、
    請求項に係る、ステレオ位相パラメータを符号化する方法。
  6. fac3=0.75である、
    請求項に係るステレオ位相パラメータを符号化する方法。
  7. 前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果が、前記現在のフレームの前記G_ITDパラメータの前記値が0であり、且つ前記現在のフレームの前記G_IPDパラメータの前記値が0であることである場合、前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値に従って、前記現在のフレームの前記G_IPDパラメータの値を調整する前記ステップは、
    前記現在のフレームの前記サブバンドのチャネル間位相差の絶対値の平滑化された平均値を、前記現在のフレームの前記G_IPDパラメータの値の絶対値として用い、前記現在のフレームの前のフレームのG_IPDパラメータのシンボルを、前記現在のフレームの前記G_IPDパラメータのシンボルとして用いるステップ、
    を含む、請求項に係るステレオ位相パラメータを符号化する方法。
  8. 前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平均値にフレーム間平滑化処理を実行し、前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の平滑化された平均値を取得する前記ステップは、
    以下の式
    ITD_sm(k)=fac5×ITD_sm(k-1)+fac6×ITD
    に従って、フレーム間平滑化処理を実行するステップを含み、
    ITD_sm(k)は前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値、ITD_sm(k-1)は前記現在のフレームの前のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac5及びfac6は平滑化因子であり、fac5>0、fac6>6、fac5+fac6=1である、
    請求項1乃至7のいずれか一項に記載のステレオ位相パラメータを符号化する方法。
  9. fac5=0.9844である、
    請求項に係るステレオ位相パラメータを符号化する方法。
  10. 現在のフレームの大域ステレオ位相パラメータを取得するように構成される取得ユニットと、
    前記取得ユニットによって取得された前記現在のフレームの前記大域ステレオ位相パラメータの値を決定するように構成される決定ユニットと、
    前記決定ユニットによって決定された前記現在のフレームの前記大域ステレオ位相パラメータの前記値の決定結果に従って、前記現在のフレームの前記大域ステレオ位相パラメータの前記値を調整するように構成される調整ユニットと、
    前記調整ユニットによって調整された前記現在のフレームの前記大域ステレオ位相パラメータの値を符号化するように構成される符号化ユニットと、
    を備える、ステレオ位相パラメータを符号化する装置であって、
    前記調整ユニットは、
    前記現在のフレームのサブバンドのチャネル間時間差を取得するように構成される取得モジュールと、
    前記取得モジュールによって取得された前記現在のフレームの前記サブバンドの前記チャネル間時間差に従って、前記現在のフレームの前記サブバンドの前記チャネル間時間差の絶対値の平均値を計算するように構成される計算モジュールと、
    前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果と、前記計算モジュールによって計算された前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平均値とに従って、前記現在のフレームの前記大域ステレオ位相パラメータの前記値を調整するように構成される調整モジュールと、
    を有し、
    前記調整ユニットは更に、
    前記計算モジュールによって計算された前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平均値に、フレーム間平滑化処理を実行するように構成される処理モジュール、
    を有し、
    前記取得モジュールは更に、前記処理モジュールによって平滑化された前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の平均値を取得するように構成され、
    前記調整モジュールは更に、前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果と、前記取得モジュールによって取得された前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値とに従っ
    て、前記現在のフレームの前記大域ステレオ位相パラメータの前記値を調整するように構成され、
    前記取得ユニットによって取得される前記大域ステレオ位相パラメータは、グループ遅延(G_ITD)パラメータを含み、
    前記調整モジュールは更に、前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果が、前記G_ITDパラメータの値が0でないことである場合、前記取得モジュールによって取得された前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値に従って、前記現在のフレームの前記G_ITDパラメータの前記値を調整するように構成される、
    ステレオ位相パラメータを符号化する装置
  11. 前記調整モジュールは更に、以下の式
    Figure 0006335301
    に従って、前記現在のフレームの前記G_ITDパラメータの前記値の絶対値を調整するように構成され、
    Figure 0006335301
    は前記G_ITDパラメータの前記値の調整された絶対値、
    Figure 0006335301
    は前記G_ITDパラメータの前記値の前記絶対値、ITD_smは前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値、fac1及びfac2は平滑化因子であり、fac1>0、fac2>0、fac1+fac2=1である、
    請求項10に係る、ステレオ位相パラメータを符号化する装置。
  12. fac1=0.5である、
    請求項11に係る、ステレオ位相パラメータを符号化する装置。
  13. 前記取得ユニットによって取得される前記大域ステレオ位相パラメータは、前記グループ遅延(G_ITD)パラメータ及びグループ位相(G_IPD)パラメータを含み、
    前記調整モジュールは更に、前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果が、前記G_ITDパラメータの前記値が0であることである場合、前記取得モジュールによって取得された前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値に従って、前記現在のフレームの前記G_IPDパラメータの値を調整するように構成される、
    請求項10乃至12のいずれか一項に記載の、ステレオ位相パラメータを符号化する装置。
  14. 前記調整モジュールは更に、前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果が、前記G_ITDパラメータの前記値が0であり、且つ前記現在のフレームの前記G_IPDパラメータの前記値が0でない場合、以下の式
    Figure 0006335301
    に従って、前記G_IPDパラメータの前記値の絶対値を調整するように構成され、
    Figure 0006335301
    は前記G_IPDパラメータの前記値の調整された絶対値、
    Figure 0006335301
    は前記G_IPDパラメータの前記値の前記絶対値、fac3及びfac4は平滑化因子であり、fac3>0、fac4>0、fac3+fac4=1であり、
    Figure 0006335301
    であり、FFT_LENは変換長さ、Kは周波数ビン値、ITD_smは前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値、IPD_smは前記現在のフレームの前記サブバンドのチャネル間位相差の絶対値の平滑化された平均値である、
    請求項13に係る、ステレオ位相パラメータを符号化する装置。
  15. fac3=0.75である、
    請求項14に係る、ステレオ位相パラメータを符号化する装置。
  16. 前記調整ユニットは更に、
    前記現在のフレームの前記大域ステレオ位相パラメータの前記値の前記決定結果が、前記G_ITDパラメータの前記値が0であり、且つ前記現在のフレームの前記G_IPDパラメータの前記値が0であることである場合、前記処理モジュールによって平滑化された前記現在のフレームの前記サブバンドのチャネル間位相差の絶対値の平均値を、前記現在のフレームの前記G_IPDパラメータの値の絶対値として用い、前記現在のフレームの前のフレームのG_IPDパラメータのシンボルを前記現在のフレームの前記G_IPDパラメータのシンボルとして用いるように構成される構成モジュール、
    を有する、請求項13に係るステレオ位相パラメータを符号化する装置。
  17. 前記処理モジュールは更に、以下の式
    ITD_sm(k)=fac5×ITD_sm(k-1)+fac6×ITD
    に従って、フレーム間平滑化処理を実行するように構成され、
    ITD_sm(k)は前記現在のフレームの前記サブバンドの前記チャネル間時間差の前記絶対値の前記平滑化された平均値、ITD_sm(k-1)は前記現在のフレームの前のフレームのサブバンドのチャネル間時間差の絶対値の平滑化された平均値、fac5及びfac6は平滑化因子であり、fac5>0、fac6>6、fac5+fac6=1である、
    請求項10乃至16のいずれか一項に記載のステレオ位相パラメータを符号化する装置。
  18. fac5=0.9844である、
    請求項17に係るステレオ位相パラメータを符号化する装置。
  19. 請求項1乃至のいずれか一項に記載の方法をコンピューターに実行させるプログラム。
JP2016534977A 2013-11-29 2014-04-02 ステレオ位相パラメータを符号化する方法及び装置 Active JP6335301B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201310632664.5A CN104681029B (zh) 2013-11-29 2013-11-29 立体声相位参数的编码方法及装置
CN201310632664.5 2013-11-29
PCT/CN2014/074673 WO2015078123A1 (zh) 2013-11-29 2014-04-02 立体声相位参数的编码方法及装置

Publications (2)

Publication Number Publication Date
JP2017503190A JP2017503190A (ja) 2017-01-26
JP6335301B2 true JP6335301B2 (ja) 2018-05-30

Family

ID=53198276

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016534977A Active JP6335301B2 (ja) 2013-11-29 2014-04-02 ステレオ位相パラメータを符号化する方法及び装置

Country Status (6)

Country Link
US (1) US10008211B2 (ja)
EP (1) EP3057095B1 (ja)
JP (1) JP6335301B2 (ja)
KR (1) KR101798559B1 (ja)
CN (1) CN104681029B (ja)
WO (1) WO2015078123A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107358961B (zh) * 2016-05-10 2021-09-17 华为技术有限公司 多声道信号的编码方法和编码器
CN107358960B (zh) * 2016-05-10 2021-10-26 华为技术有限公司 多声道信号的编码方法和编码器
CN107452387B (zh) 2016-05-31 2019-11-12 华为技术有限公司 一种声道间相位差参数的提取方法及装置
US10217467B2 (en) 2016-06-20 2019-02-26 Qualcomm Incorporated Encoding and decoding of interchannel phase differences between audio signals
CN107731238B (zh) 2016-08-10 2021-07-16 华为技术有限公司 多声道信号的编码方法和编码器
US10366695B2 (en) 2017-01-19 2019-07-30 Qualcomm Incorporated Inter-channel phase difference parameter modification
US10217468B2 (en) * 2017-01-19 2019-02-26 Qualcomm Incorporated Coding of multiple audio signals
CN108877815B (zh) * 2017-05-16 2021-02-23 华为技术有限公司 一种立体声信号处理方法及装置
CN109215668B (zh) * 2017-06-30 2021-01-05 华为技术有限公司 一种声道间相位差参数的编码方法及装置
CN109300480B (zh) * 2017-07-25 2020-10-16 华为技术有限公司 立体声信号的编解码方法和编解码装置
CN117133297A (zh) 2017-08-10 2023-11-28 华为技术有限公司 时域立体声参数的编码方法和相关产品
EP4383254A1 (en) * 2022-12-07 2024-06-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder comprising an inter-channel phase difference calculator device and method for operating such encoder

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US8135136B2 (en) * 2004-09-06 2012-03-13 Koninklijke Philips Electronics N.V. Audio signal enhancement
CN101221763B (zh) * 2007-01-09 2011-08-24 昆山杰得微电子有限公司 针对子带编码音频的三维声场合成方法
US8385556B1 (en) * 2007-08-17 2013-02-26 Dts, Inc. Parametric stereo conversion system and method
GB2453117B (en) 2007-09-25 2012-05-23 Motorola Mobility Inc Apparatus and method for encoding a multi channel audio signal
KR101444102B1 (ko) * 2008-02-20 2014-09-26 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
US8258849B2 (en) 2008-09-25 2012-09-04 Lg Electronics Inc. Method and an apparatus for processing a signal
KR101108061B1 (ko) 2008-09-25 2012-01-25 엘지전자 주식회사 신호 처리 방법 및 이의 장치
CN102292769B (zh) * 2009-02-13 2012-12-19 华为技术有限公司 一种立体声编码方法和装置
EP2402941B1 (en) * 2009-02-26 2015-04-15 Panasonic Intellectual Property Corporation of America Channel signal generation apparatus
MX2011006248A (es) * 2009-04-08 2011-07-20 Fraunhofer Ges Forschung Aparato, metodo y programa de computacion para mezclar en forma ascendente una señal de audio con mezcla descendente utilizando una suavizacion de valor de fase.
US9584235B2 (en) * 2009-12-16 2017-02-28 Nokia Technologies Oy Multi-channel audio processing
CN102157152B (zh) * 2010-02-12 2014-04-30 华为技术有限公司 立体声编码的方法、装置
EP2702776B1 (en) * 2012-02-17 2015-09-23 Huawei Technologies Co., Ltd. Parametric encoder for encoding a multi-channel audio signal
EP2834813B1 (en) * 2012-04-05 2015-09-30 Huawei Technologies Co., Ltd. Multi-channel audio encoder and method for encoding a multi-channel audio signal

Also Published As

Publication number Publication date
EP3057095A4 (en) 2016-11-23
EP3057095B1 (en) 2019-11-20
EP3057095A1 (en) 2016-08-17
CN104681029B (zh) 2018-06-05
KR101798559B1 (ko) 2017-12-12
KR20160077201A (ko) 2016-07-01
WO2015078123A1 (zh) 2015-06-04
JP2017503190A (ja) 2017-01-26
US10008211B2 (en) 2018-06-26
US20160254002A1 (en) 2016-09-01
CN104681029A (zh) 2015-06-03

Similar Documents

Publication Publication Date Title
JP6335301B2 (ja) ステレオ位相パラメータを符号化する方法及び装置
KR102367538B1 (ko) 다중 채널 신호 인코딩 방법 및 인코더
KR101168645B1 (ko) 과도 신호 부호화 방법 및 장치, 과도 신호 복호화 방법 및 장치, 및 과도 신호 처리 시스템
US11217257B2 (en) Method for encoding multi-channel signal and encoder
RU2020103799A (ru) Способ и устройство кодирования параметра межканальной разности фаз
CN107358961B (zh) 多声道信号的编码方法和编码器
CN107358960B (zh) 多声道信号的编码方法和编码器

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170725

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171024

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180403

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180427

R150 Certificate of patent or registration of utility model

Ref document number: 6335301

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250