JP2016522451A - チャネル間レベル差処理方法及び装置 - Google Patents

チャネル間レベル差処理方法及び装置 Download PDF

Info

Publication number
JP2016522451A
JP2016522451A JP2016520245A JP2016520245A JP2016522451A JP 2016522451 A JP2016522451 A JP 2016522451A JP 2016520245 A JP2016520245 A JP 2016520245A JP 2016520245 A JP2016520245 A JP 2016520245A JP 2016522451 A JP2016522451 A JP 2016522451A
Authority
JP
Japan
Prior art keywords
subband
subframe
icld
frame
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016520245A
Other languages
English (en)
Other versions
JP6106336B2 (ja
Inventor
▲興▼涛 ▲張▼
▲興▼涛 ▲張▼
磊 苗
磊 苗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2016522451A publication Critical patent/JP2016522451A/ja
Application granted granted Critical
Publication of JP6106336B2 publication Critical patent/JP6106336B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

チャネル間レベル差処理方法及び装置が開示され、ステレオオーディオ技術の分野に関し、チャネル間レベル差処理に適用可能であり、信号が速く変わるケース又はパケット損失のケースにおいて復号化されたステレオオーディオの品質を保証可能であり、ステレオオーディオ信号の低ビットレート送信を実現する。ステレオオーディオ信号が受信され、ステレオオーディオ信号がフレーム単位で解析され、ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのICLDを取得し(101)、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の和が計算され(102)、何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるとき、何れかのフレームの各サブバンドの重み付けされたICLD値が第1の重み付け方式で計算されるか(103)、又はそうでない場合、何れかのフレームの各サブバンドの重み付けされたICLD値が第1の重み付け方式で計算される(104)。

Description

本出願は、参照することによりその全体でここに援用される、2013年7月16日に中国専利局に出願された“チャネル間レベル差処理方法及び装置”という名称の中国特許出願第201310298100.2号に対する優先権を主張する。
本発明は、ステレオオーディオ技術の分野に関し、特にチャネル間レベル差処理方法及び装置に関する。
生活の質の向上は、高品質のオーディオに対する個人の需要の増大を導く。モノラルオーディオと比較して、ステレオオーディオは、情報の明確性及び理解度を向上させることが可能であり、従って、人々の間で普及している。
ステレオオーディオが従来技術において処理されるとき、入力ステレオオーディオ信号がまず解析され、ステレオオーディオ信号を搬送するフレームにおける各サブバンドのチャネル間レベル差(Inter−Channel Level Difference,ICLD)値が取得され、それから、取得されたICLD値が前のフレームの取得されたICLD値と比較される。ICLD値と前のフレームの取得されたICLD値との差が大きいとき、フレームにより搬送されたステレオオーディオ信号はTransientであるか、又は、そうでない場合、フレームにより搬送されるステレオオーディオ信号はNormalである。Transientについて、2つのフレームが送信のため使用され、すなわち、奇数のサブバンドのICLDと偶数のサブバンドのICLDとは別々に送信される。Normalについて、4つのフレームが送信のため使用され、すなわち、各フレームはサブバンドの1/4のICLDを送信する。ビット数における一致を保証するため、refinement処理が更にNormalに対して実行される。
しかしながら、ステレオオーディオが従来技術を利用することによって処理されるとき、ステレオオーディオを搬送するフレームは比較的長いため、ステレオオーディオの10msが処理されるとき、Normalが4つのフレームを使用することによって処理される場合、それはICLDが40ms(4*10ms)毎に更新されることと等しく、信号が速く変わる場合、又はパケット損失の場合において復号化されたステレオオーディオの品質を保証することができず、さらに、ICLDがフレーム単位で送信される場合、ステレオオーディオ信号の低ビットレート送信は実現できない。
本発明の実施例は、信号が速く変わるケース、又はパケット損失のケースにおいて復号化されたステレオオーディオの品質を保証し、ステレオオーディオ信号の低ビットレート送信を実現可能なチャネル間レベル差処理方法及び装置を提供する。
第1の態様によると、本発明の実施例は、チャネル間レベル差処理方法であって、
ステレオオーディオ信号を受信し、前記ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのチャネル間レベル差ICLDを取得するため、前記ステレオオーディオ信号をフレーム単位で解析するステップであって、各フレームは少なくとも2つのサブフレームを有する、解析するステップと、
前記ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドの取得されたICLDに従って、前記ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の和を計算するステップと、
前記何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるとき、第1の重み付け方式で前記何れかのフレームの各サブバンドの重み付けされたICLD値を計算するステップ、又は、
前記何れかのフレームの何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であるとき、第2の重み付け方式で前記何れかのフレームの各サブバンドの重み付けされたICLD値を計算するステップと、
を有する方法を提供する。
第1の可能な実現方式では、第1の態様を参照して、前記第1の重み付け方式で前記何れかのフレームの各サブバンドの重み付けされたICLD値を計算するステップは、
前記何れかのフレームに含まれるサブフレームの数に従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算するステップであって、iは前記何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは前記何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bは前記i番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12である、計算するステップと、
前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び前記第1の重み付け係数に従って、前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するステップと、
を有する。
第2の可能な実現方式では、第1の態様の第1の可能な実現方式を参照して、前記何れかのフレームに含まれるサブフレームの数に従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算するステップは、
fac(i,b)=1/Lに従って前記i番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算するステップを有し、fac(i,b)は前記i番目のサブフレームのb番目のサブバンドの第1の重み付け係数を表す。
第3の可能な実現方式では、第1の態様の第2の可能な実現方式を参照して、前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び前記第1の重み付け係数に従って、前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するステップは、
Figure 2016522451
に従って前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するステップを有し、level(b)は前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、level(i,b)は前記i番目のサブフレームのb番目のサブバンドのICLDを表す。
第4の可能な実現方式では、第1の態様を参照して、前記第2の重み付け方式で前記何れかのフレームの各サブバンドの重み付けされたICLD値を計算するステップは、
前記ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の計算された和に従って、又は前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するステップであって、iは前記何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは前記何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bはi番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12である、計算するステップと、
前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び前記第2の重み付け係数に従って、前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するステップと、
を有する。
第5の可能な実現方式では、第1の態様の第4の可能な実現方式を参照して、前記ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の計算された和に従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するステップは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するステップを有し、fac(i,b)は前記i番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、sum(i)は前記i番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、sum(j)はj番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、jは前記何れかのフレームに含まれる何れかのサブフレームであり、0<j≦Lである。
第6の可能な実現方式では、第1の態様の第5の可能な実現方式を参照して、前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するステップは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するステップを有し、level(i,b)は前記i番目のサブフレームのb番目のサブバンドのICLDを表し、level(j,b)は前記j番目のサブフレームのb番目のサブバンドのICLDを表す。
第7の可能な実現方式では、第1の態様の第6の可能な実現方式を参照して、前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するステップは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するステップを有し、Mは隣接するサブバンドの数を表し、lは隣接するサブバンドのインデックス番号と現在のサブバンドのインデックス番号との間の差を表す。
第8の可能な実現方式では、第1の態様の第4の可能な実現方式、第5の可能な実現方式、第6の可能な実現方式又は第7の可能な実現方式を参照して、前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び前記第2の重み付け係数に従って、前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するステップは、
Figure 2016522451
に従って前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するステップを有し、level(b)は前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、fac(i,b)は前記i番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、level(i,b)は前記i番目のサブフレームのb番目のサブバンドのICLDを表す。
第2の態様によると、本発明の実施例は、チャネル間レベル差処理装置であって、
ステレオオーディオ信号を受信するよう構成される受信ユニットと、
前記ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのチャネル間レベル差ICLDを取得するため、前記受信ユニットにより受信されたステレオオーディオ情報に従って前記ステレオオーディオ信号をフレーム単位で解析するよう構成される解析ユニットであって、各フレームは少なくとも2つのサブフレームを有する、解析ユニットと、
前記ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのものであって、前記解析ユニットによる解析によって取得されたICLDに従って、前記ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の和を計算するよう構成される計算ユニットと、
前記何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるとき、第1の重み付け方式で前記何れかのフレームの各サブバンドの重み付けされたICLD値を計算するよう構成される第1の重み付け処理ユニットと、
前記何れかのフレームの何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が前記所定の閾値以上であるとき、第2の重み付け方式で前記何れかのフレームの各サブバンドの重み付けされたICLD値を計算するよう構成される第2の重み付け処理ユニットと、
を有する装置を提供する。
第1の可能な実現方式では、第2の態様を参照して、前記第1の重み付け処理ユニットは、
前記何れかのフレームに含まれるサブフレームの数に従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算するよう構成される第1の計算モジュールであって、iは前記何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは前記何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bは前記i番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12である、第1の計算モジュールと、
前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び前記第1の重み付け係数に従って、前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成される第2の計算モジュールと、
を有する。
第2の可能な実現方式では、第2の態様の第1の可能な実現方式を参照して、前記第1の計算モジュールは、
fac(i,b)=1/Lに従って前記i番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算するよう構成され、fac(i,b)は前記i番目のサブフレームのb番目のサブバンドの第1の重み付け係数を表す。
第3の可能な実現方式では、第2の態様の第2の可能な実現方式を参照して、前記第2の計算モジュールは、
Figure 2016522451
に従って前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成され、level(b)は前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、level(I,b)は前記i番目のサブフレームのb番目のサブバンドのICLDを表す。
第4の可能な実現方式では、第2の態様を参照して、前記第2の重み付け処理ユニットは、
前記ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の計算された和に従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成される第3の計算モジュールであって、iは前記何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは前記何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bはi番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12である、第3の計算モジュール、又は、前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成される第4の計算モジュールと、
前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び前記第2の重み付け係数に従って、前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成される第5の計算モジュールと、
を有する。
第5の可能な実現方式では、第2の態様の第4の可能な実現方式を参照して、前記第3の計算モジュールは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成され、fac(i,b)は前記i番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、sum(i)は前記i番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、sum(j)はj番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、jは前記何れかのフレームに含まれる何れかのサブフレームであり、0<j≦Lである。
第6の可能な実現方式では、第2の態様の第5の可能な実現方式を参照して、前記第4の計算モジュールは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成され、level(i,b)は前記i番目のサブフレームのb番目のサブバンドのICLDを表し、level(j,b)は前記j番目のサブフレームのb番目のサブバンドのICLDを表す。
第7の可能な実現方式では、第2の態様の第6の可能な実現方式を参照して、前記第4の計算モジュールは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成され、Mは隣接するサブバンドの数を表し、lは隣接するサブバンドのインデックス番号と現在のサブバンドのインデックス番号との間の差を表す。
第8の可能な実現方式では、第2の態様の第4の可能な実現方式、第5の可能な実現方式、第6の可能な実現方式又は第7の可能な実現方式を参照して、前記第5の計算モジュールは、
Figure 2016522451
に従って前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成され、level(b)は前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、fac(i,b)は前記i番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、level(i,b)は前記i番目のサブフレームのb番目のサブバンドのICLDを表す。
本発明の本実施例により提供されるチャネル間レベル差処理方法によると、ステレオオーディオ信号が受信され、ステレオオーディオ信号がフレーム単位で解析され、ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのチャネル間レベル差ICLDを取得し、ここで、各フレームは少なくとも2つのサブフレームを有し、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の和が、ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドの取得されたICLDに従って計算され、何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるとき、何れかのフレームの各サブバンドの重み付けされたICLD値が第1の重み付け方式で計算され、又は何れかのフレームの何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であるとき、何れかのフレームの各サブバンドの重み付けされたICLD値が第2の重み付け方式で計算される。従来技術では、ステレオオーディオを搬送するフレームは比較的長いため、ステレオオーディオの10msが処理されるとき、Normalが4つのフレームを使用することによって処理される場合、それは、ICLDが40ms(4*10ms)毎に更新されることに等しく、信号が速く変わるケース又はパケット損失のケースにおいて復号化されたステレオオーディオの品質を保証できず、さらに、ICLDがフレーム単位で送信される場合、ステレオオーディオ信号の低ビットレート送信は実現できない。従来技術のものと比較して、本発明では、重み付け処理は、サブフレームの間の関連性に基づき何れかのサブフレームのICLDに対して実行され、これにより、本発明の本実施例により提供される方法を利用することによって取得される実験データから、復号化されたステレオオーディオの品質は、信号が速く変わるケース又はパケット損失のケースにおいて保証され、ステレオオーディオ信号の低ビットレート送信が実現されることが理解できる。
本発明の実施例又は従来技術における技術的方策をより明確に説明するため、以下において、実施例又は従来技術を説明するのに必要な添付図面が簡単に紹介される。明らかに、以下の説明における添付図面は本発明の単なるいくつかの実施例を示し、当業者は、創作的な努力なく、これらの添付図面から他の図面を依然として導出してもよい。
図1は、本発明の実施例によるチャネル間レベル差処理方法のフローチャートである。 図2は、本発明の他の実施例によるチャネル間レベル差処理方法のフローチャートである。 図3は、本発明の他の実施例によるチャネル間レベル差処理方法のフローチャートである。 図4は、本発明の他の実施例による他のチャネル間レベル差処理方法のフローチャートである。 図5は、本発明の実施例によるチャネル間レベル差処理装置のブロック図である。 図6は、本発明の実施例による他のチャネル間レベル差処理装置のブロック図である。 図7は、本発明の他の実施例による他のチャネル間レベル差処理装置のブロック図である。
以下は、本発明の実施例における添付図面を参照して、本発明の実施例における技術的方策を明確且つ完全に説明する。明らかに、説明される実施例は、本発明の実施例の全てでなく単なる一部である。創作的な努力なく本発明の実施例に基づき当業者により取得される他の全ての実施例は、本発明の保護範囲内に属する。
本発明の実施例は、チャネル間レベル差処理方法を提供し、ここで、当該方法はステレオオーディオを処理するエンコーダに適用される。図1に示されるように、当該方法は以下を有する。
ステップ101:ステレオオーディオ信号を受信し、ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのチャネル間レベル差ICLDを取得するため、ステレオオーディオ信号をフレーム単位で解析し、ここで、各フレームは少なくとも2つのサブフレームを有する。
ステレオオーディオ信号は、多数のフレームによって構成されてもよい。本ステップでは、各フレームは更に複数のサブフレームに分割されてもよく、各サブフレームは複数のサブバンドに分割されてもよい。実際の適用では、各フレームは等しい数のサブフレームを有し、各フレームは少なくとも2つのサブフレームを有してもよいことが留意されるべきである。例えば、1つのフレームは2つのサブフレームを有するか、又は、1つのフレームは4つのサブフレームを有するか、又は、1つのフレームは6つのサブフレームを有する。各サブフレームは少なくとも12個のサブバンドを有する。
ICLDは、ステレオオーディオソースの水平方向の角度を区別するのに利用され、オーディオチャネル間の強度差を記述し、当該パラメータは周波数スペクトル全体の周波数コンポーネントに影響を与える。さらに、任意的には、ICLDは2つの入力オーディオチャネル信号の間の電力比である。例えば、b番目のサブバンドのICLD値は、
Figure 2016522451
であり、ここで、X(p)及びX(p)はそれぞれ、左のオーディオチャネルの周波数領域係数及び右のオーディオチャネルの周波数領域係数であり、Pは周波数ビン値であり、level(b)の計算範囲はAb−1≦p<Aであり、ここで、Ab−1及びAは異なる周波数に対応する周波数ビン値を表し、bはi番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12である。人間の耳の聴覚特性を近似的にシミュレートするため、同じ周波数分解能を有する周波数スペクトル係数が、臨界帯域理論に従ってK個の重複しないサブバンドに分割されてもよいことをKが示すことに留意すべきである。
ステップ102:ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドの取得されたICLDに従って、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の和を計算する。
任意的には、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の和は、
Figure 2016522451
に従って計算され、ここで、iは何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは何れかのフレームに含まれるサブフレームの数であり、L≧2である。
ステップ103:何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるとき、第1の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算する。
任意的には、当該所定の閾値は経験的に取得された閾値である。
|sum(i)−sum(j)|<THであるとき、2つのサブフレームの一方のICLDは、2つのサブフレームの他方のICLDに近いと判断され、何れかのフレームの各サブバンドの重み付けされたICLD値が第1の重み付け方式で計算され、ここで、sum(i)及びsum(j)はそれぞれ、i番目のサブフレームのICLDの絶対値の和及びj番目のそれを表し、jは何れかのフレームに含まれる何れかのサブフレームを表し、0<j≦Lであり、Lは何れかのフレームに含まれるサブフレームの数であり、L≧2である。
任意的には、当該ステップは、何れかのフレームに含まれるサブフレームの数に従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算し、
何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第1の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを含む。
さらに、任意的には、何れかのフレームに含まれるサブフレームの数に従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算することは、
fac(i,b)=1/Lに従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算することを有し、ここで、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を表す。
さらに、任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第1の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することは、
Figure 2016522451
に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有し、ここで、level(b)は何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表す。
ステップ104:何れかのフレームの何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であるとき、第2の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算する。
当該ステップでは、|sum(i)−sum(j)|≧THであるとき、何れか2つのサブフレームの一方のICLDが何れか2つのサブフレームの他方のICLDと大きく異なると判断され、何れかのサブフレームの各サブバンドの重み付けされたICLD値が第2の重み付け方式で計算される。何れかのフレームに含まれる何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であるということは、全ての差の絶対値が所定の閾値以上であるか、又は、一部の差の絶対値が所定の閾値未満であって、且つ、その他の差の絶対値が所定の閾値以上である、として解釈できることに留意すべきである。
任意的には、当該ステップは、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の計算された和に従って、又は何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算し、ここで、iは何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bはi番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であり、
何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを含む。
さらに、任意的には、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の計算された和に従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算し、ここで、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、sum(i)はi番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、sum(j)はj番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、jは何れかのフレームに含まれる何れかのサブフレームであり、0<j≦Lである。
さらに、任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算し、ここで、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表し、level(j,b)はj番目のサブフレームのb番目のサブバンドのICLDを表す。
さらに、任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算し、ここで、Mは隣接するサブバンドの数を表し、lは隣接するサブバンドのインデックス番号と現在のサブバンドのインデックス番号との間の差を表す。1つのサブフレームが、サブバンド1、サブバンド2、...、サブバンドKなどのK個のサブバンドに分割されてもよく、ここでの1、2、...、Kはサブバンドのインデックス番号であることが留意されるべきである。
Figure 2016522451
は切り捨てを表し、
Figure 2016522451
は切り上げを表すことに留意すべきである。
さらに、任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するステップは、
Figure 2016522451
に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有し、ここで、level(b)は何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表す。
さらに、任意的には、当該ステップの後に、量子化処理が取得された重み付けされたICLD値に対して実行される。任意的には、ここでの量子化処理は、所定のコードブックと重み付けされたICLD値との間の比較に従って、所定のコードブック内にあって、重み付けされたICLD値に最も近い値を取得することである。例えば、重み付けされたICLD値が1.4であり、所定のコードブックが0や2などの値を有し、このため、量子化処理が重み付けされたICLD値に対して実行された後に取得される値は2である。
さらに、任意的には、復号化されたステレオオーディオの品質が保証される前提で送信されるビットを減らすため、量子化処理が実行されるとき、現在の重み付けされたICLD値と前の重み付けされたICLD値との間の差が計算されてもよく、計算された差に対して量子化処理が実行される。例えば、1つのサブフレームは15個のサブバンドに分割され、量子化処理は、第1のサブバンドの重み付けされたICLD値に対して直接実行され、量子化処理が第2のサブバンドの重み付けされたICLD値に対して実行されるとき、第2のサブバンドの重み付けされたICLD値と第1のサブバンドの重み付けされたICLD値との間の差がまず計算され、それから、第2のサブバンドの重み付けされたICLD値の量子化結果を取得するため、量子化処理が計算された差に対して実行される。その他のサブバンドの重み付けされたICLD値の量子化結果は、第2のサブバンドの重み付けされたICLD値の量子化結果を計算するための方法に従って順次計算されてもよい。
本発明の本実施例により提供されるチャネル間レベル差処理方法によると、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の和が、ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドの取得されたICLDに従って計算され、何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるとき、何れかのフレームの各サブバンドの重み付けされたICLD値が第1の重み付け方式で計算され、又は何れかのフレームの何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であるとき、何れかのフレームの各サブバンドの重み付けされたICLD値が第2の重み付け方式で計算される。従来技術では、ステレオオーディオを搬送するフレームは比較的長いため、ステレオオーディオの10msが処理されるとき、Normalが4つのフレームを使用することによって処理される場合、それは、ICLDが40ms(4*10ms)毎に更新されることに等しく、信号が速く変わるケース又はパケット損失のケースにおいて復号化されたステレオオーディオの品質を保証できず、さらに、ICLDがフレーム単位で送信される場合、ステレオオーディオ信号の低ビットレート送信は実現できない。従来技術のものと比較して、本発明では、重み付け処理は、サブフレームの間の関連性に基づき何れかのフレームのサブフレームのICLDに対して実行され、これにより、復号化されたステレオオーディオの品質は、信号が速く変わるケース又はパケット損失のケースにおいて保証され、ステレオオーディオ信号の低ビットレート送信が実現される。
本発明の実施例は、チャネル間レベル差処理方法を提供する。本実施例では、1つのフレームが2つのサブフレームを有することが詳細な説明のために利用され、ここで、例えば、1つのフレームは第1のサブフレームと第2のサブフレームとを有する。図2に示されるように、当該方法は以下を有する。
ステップ201:ステレオオーディオ信号を受信し、ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのチャネル間レベル差ICLDを取得するため、ステレオオーディオ信号をフレーム単位で解析する。
本実施例では、各フレームは2つのサブフレームを有する。すなわち、ステレオオーディオ信号が受信され、ステレオオーディオ信号がフレーム単位で解析され、これにより、ステレオオーディオ信号の各フレームの第1のサブフレーム及び第2のサブフレームの各サブバンドのチャネル間レベル差ICLDが取得されてもよい。
任意的には、各フレームの各サブフレームの各サブバンドのICLDを取得するためフレーム単位でステレオオーディオ信号を解析する具体的な処理方式について、図1のステップ101における説明が参照され、詳細はここでは繰り返して説明されない。
ステップ202:ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドの取得されたICLDに従って、ステレオオーディオ信号の何れかのフレームの第1のサブフレームのチャネル間レベル差ICLDの絶対値の和と、ステレオオーディオ信号の何れかのフレームの第2のサブフレームのものとを計算する。
任意的には、ステレオオーディオ信号の何れかのフレームの第1のサブフレームのICLDの絶対値の和は、
Figure 2016522451
に従って計算され、ここで、bは第1のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12である。
任意的には、sum(2)は、sum(1)を計算するための方法に従って計算され、ここでは詳細には再説明されない。
ステップ203:第1のサブフレームのICLDの絶対値の和と第2のサブフレームのICLDの絶対値の和との間の差の絶対値が所定の閾値未満であるか判断する。
任意的には、第1のサブフレームのICLDの絶対値の和と第2のサブフレームのICLDの絶対値の和との間の差の絶対値が所定の閾値未満であるか否かは、|sum(1)−sum(2)|<THに従って判断され、ここで、THは所定の閾値であり、所定の閾値は経験的に設定されてもよい。
ステップ204:第1のサブフレームのICLDの絶対値の和と第2のサブフレームのICLDの絶対値の和との間の差の絶対値が所定の閾値未満であるとき、第1の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算する。
|sum(1)−sum(2)|<THであるとき、それは、第1のサブフレームのICLDが第2のサブフレームのICLDに近いことを示し、何れかのフレームの各サブバンドの重み付けされたICLD値は、第1の重み付け方式で計算されてもよい。
任意的には、当該ステップは、何れかのフレームに含まれるサブフレームの数に従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算し、ここで、iは何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bはi番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であり、
何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第1の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有する。
さらに、任意的には、何れかのフレームに含まれるサブフレームの数に従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算することは、
fac(i,b)=1/Lに従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算することを有し、ここで、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であり、iは何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは何れかのフレームに含まれるサブフレームの数であり、L≧2である。
当該ステップでは、Lは2であり、何れかのフレームの第1又は第2のサブフレームの第1の重み付け係数は、fac(i,b)=1/L=0.5である。
さらに、任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第1の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することは、
Figure 2016522451
に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有し、ここで、level(b)は何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であり、iは何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表す。
当該ステップでは、L=2であり、何れかのフレームの重み付けされたICLD値は、
Figure 2016522451
である。
ステップ205:何れかのフレームの何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であるとき、第2の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算する。
|sum(1)−sum(2)|≧THであるとき、それは、第1のサブフレームのICLDが第2のサブフレームのICLDと大きく異なることを示し、何れかのフレームの各サブバンドの重み付けされたICLD値が、第2の重み付け方式で計算されてもよい。
任意的には、以下の3つの方式が、第2の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算するのに利用されてもよい。方式1は、フレーム全体に対して重み付け処理を実行することであり、方式2は、現在のサブバンドに基づきサブバンド単位で重み付け処理を実行することであり、方式3は、M個の隣接するサブバンドに基づきサブバンド単位で重み付け処理を実行することである。
任意的には、方式1が重み付け処理を実行するのに利用されるとき、当該ステップは、
ステレオオーディオ信号の何れかのフレームの第1又は第2のサブフレームのICLDの絶対値の計算された和に従って、第1又は第2のサブフレームのb番目のサブバンドの第2の重み付け係数を計算し、
何れかのフレームに含まれる第1又は第2のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有する。
任意的には、ステレオオーディオ信号の何れかのフレームの第1又は第2のサブフレームのICLDの絶対値の計算された和に従って、第1又は第2のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することを有し、ここで、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、sum(i)はi番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、sum(j)はj番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、jは何れかのフレームに含まれる何れかのサブフレームであり、0<j≦Lである。
具体的には、当該ステップにおいて、i=1又は2であり、
Figure 2016522451
である。
さらに、任意的には、何れかのフレームに含まれる第1又は第2のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することは、
Figure 2016522451
に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有し、ここで、level(b)は何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表す。
具体的には、当該ステップでは、何れかのフレームのb番目のサブバンドの重み付けされたICLD値は、
Figure 2016522451
である。
任意的には、方式2が重み付け処理を実行するため利用されるとき、当該ステップは、
ステレオオーディオ信号の何れかのフレームに含まれる第1又は第2のサブフレームのb番目のサブバンドの計算されたICLDに従って、第1又は第2のサブフレームのb番目のサブバンドの第2の重み付け係数を計算し、
何れかのフレームに含まれる第1又は第2のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有する。
さらに、任意的には、ステレオオーディオ信号の何れかのフレームの第1又は第2のサブフレームのb番目のサブバンドの計算されたICLDに従って、第1又は第2のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することを有し、ここで、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表し、level(j,b)はj番目のサブフレームのb番目のサブバンドのICLDを表す。
具体的には、当該ステップでは、i=1又は2であり、
Figure 2016522451
である。
任意的には、何れかのフレームに含まれる第1又は第2のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することは、
Figure 2016522451
に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有し、ここで、level(b)は何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であり、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表す。
具体的には、当該ステップでは、L=2であり、何れかのフレームのb番目のサブバンドの重み付けされたICLD値は、
Figure 2016522451
である。
任意的には、方式3が重み付け処理を実行するため利用されるとき、当該ステップは、
ステレオオーディオ信号の何れかのフレームに含まれる第1又は第2のサブフレームのb番目のサブバンドの計算されたICLDに従って、第1又は第2のサブフレームのb番目のサブバンドの第2の重み付け係数を計算し、
何れかのフレームに含まれる第1又は第2のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有する。
さらに、任意的には、ステレオオーディオ信号の何れかのフレームに含まれる第1又は第2のサブフレームのb番目のサブバンドの計算されたICLDに従って、第1又は第2のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することは、
Figure 2016522451
に従って第1又は第2のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することを有し、ここで、Mは何れかのフレームの何れかのサブフレームの隣接するサブバンドの数を表し、lは隣接するサブバンドのインデックス番号と現在のサブバンドのインデックス番号との間の差を表す。1つのサブフレームが、サブバンド1、サブバンド2、...、サブバンドKなどのK個のサブバンドに分割されてもよく、ここでの1、2、...、Kはサブバンドのインデックス番号であることが留意されるべきである。
具体的には、当該ステップでは、2つの隣接するサブバンドのICLDに基づき取得される重み付け係数は、
Figure 2016522451
である。
当該ステップでは、3つの隣接するサブバンドのICLDに基づき取得される重み付け係数は、
Figure 2016522451
である。
4つ又は5つなどの他の数の隣接するサブバンドのICLDに基づく重み付け係数が計算される必要があるとき、M個のサブバンドのICLDに基づく重み付け係数のための上記の一般的な計算式を参照することによって計算が実行されてもよいことが留意されるべきであり、特定の具体例を利用することによってここでは詳細には再説明されない。
任意的には、何れかのフレームに含まれる第1又は第2のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って第1又は第2のサブフレームのb番目のサブバンドの重み付けされたICLD値を計算することは、方式2で何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するための方法と同じであり、ここで、L=2であり、すなわち、何れかのフレームのb番目のサブバンドの重み付けされたICLD値は、
Figure 2016522451
である。
ステップ206:取得された重み付けされたICLD値に対して量子化処理を実行する。
任意的には、ここでの量子化処理は、所定のコードブックと重み付けされたICLD値との間の比較に従って、所定のコードブック内にあって、重み付けされたICLD値に最も近い値を取得することである。例えば、重み付けされたICLD値は1.4であり、所定のコードブックは0や2などの値を有し、これにより、量子化処理が重み付けされたICLD値に対して実行された後に取得される値は2である。
さらに、任意的には、復号化されたステレオオーディオの品質が保証されるという前提で送信されるビットを減らすため、量子化処理が実行されるとき、現在の重み付けされたICLD値と前の重み付けされたICLD値との間の差が計算されてもよく、量子化処理は計算された差に対して実行される。例えば、1つのサブフレームは15個のサブバンドに分割され、量子化処理は第1のサブバンドの重み付けされたICLD値に対して直接実行され、第2のサブバンドの重み付けされたICLD値に対して量子化処理が実行されるとき、第2のサブバンドの重み付けされたICLD値と第1のサブバンドの重み付けされたICLD値との差がまず計算され、それから、第2のサブバンドの重み付けされたICLD値の量子化結果を取得するため、量子化処理が計算された差に対して実行される。その他のサブバンドの重み付けされたICLD値の量子化結果は、第2のサブバンドの重み付けされたICLD値の量子化結果を計算するための方法に従って順次計算されてもよい。
1つのフレームが4つのサブフレームを有することが、詳細な説明のため以下で利用され、図3に示されるように、当該方法は以下を有する。
ステップ301:ステレオオーディオ信号を受信し、ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのチャネル間レベル差ICLDを取得するため、ステレオオーディオ信号をフレーム単位で解析する。
任意的には、各フレームは4つのサブフレームを有する。任意的には、各フレームの各サブフレームの各サブバンドのICLDを取得するためフレーム単位でステレオオーディオ信号を解析する具体的な処理方式について、図1のステップ101における説明が参照され、詳細はここでは繰り返して説明されない。
ステップ302:ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドの取得されたICLDに従って、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の和を計算する。
任意的には、ステレオオーディオ信号の何れかのフレームの第1のサブフレームのICLDの絶対値の和は、
Figure 2016522451
に従って計算され、ここで、bは第1のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であり、iは何れかのフレームに含まれる何れかのサブフレームを表し、本実施例では、0<i≦4である。
ステップ303:何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるか判断する。
任意的には、何れかのフレームのi番目のサブフレームのICLDの絶対値の和とj番目のサブフレームのものとの間の差の絶対値が所定の閾値未満であるか否かは、|sum(i)−sum(j)|<THに従って判断され、ここで、THは所定の閾値であり、所定の閾値は経験的に設定されてもよい。
ステップ304:何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるとき、第1の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算する。
|sum(i)−sum(j)|<THであるとき、それは、i番目のサブフレームのICLDがj番目のサブフレームのICLDに近いことを示し、何れかのフレームの各サブバンドの重み付けされたICLD値は、第1の重み付け方式で計算されてもよい。
任意的には、当該ステップは、
何れかのフレームに含まれるサブフレームの数に従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算し、ここで、iは何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bはi番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であり、
何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第1の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有する。
さらに、任意的には、何れかのフレームに含まれるサブフレームの数に従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算することは、
fac(i,b)=1/Lに従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算することを有し、ここで、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であり、iは何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは何れかのフレームに含まれるサブフレームの数であり、L≧2である。
当該ステップでは、L=4であり、第1の重み付け係数は、fac(i,b)=1/L=0.25である。
さらに、任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第1の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することは、
Figure 2016522451
に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有し、ここで、level(b)は何れか2つのサブフレームのb番目のサブバンドの重み付けされたICLD値を表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であり、iは何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表す。
当該ステップでは、何れかのフレームのb番目のサブバンドの重み付けされたICLD値は、
Figure 2016522451
である。
ステップ305:何れかのフレームの何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であるとき、第2の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算する。
|sum(i)−sum(j)|≧THであるとき、それは、i番目のサブフレームのICLDがj番目のサブフレームのICLDと大きく異なることを示し、何れかのフレームの各サブバンドの重み付けされたICLD値が、第2の重み付け方式で計算されてもよい。何れかのフレームに含まれる何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であるということは、全ての差の絶対値が所定の閾値以上であるか、又は、一部の差の絶対値が所定の閾値未満であって、且つその他の差の絶対値が所定の閾値以上である、として解釈可能であることが留意されるべきである。例えば、|sum(1)−sum(2)|≧TH、|sum(1)−sum(3)|≧TH、|sum(1)−sum(4)|≧TH、|sum(2)−sum(3)|≧TH、|sum(2)−sum(3)|≧TH、及び|sum(3)−sum(4)|≧TH、又は、|sum(1)−sum(2)|≧TH、|sum(1)−sum(3)|≧TH、|sum(1)−sum(4)|<TH、|sum(2)−sum(3)|<TH、|sum(2)−sum(3)|<TH、及び|sum(3)−sum(4)|<THであるとき、何れかのフレームの何れかのサブバンドの重み付けされたICLD値が、第2の重み付け方式で計算されてもよいことが留意されるべきである。
任意的には、以下の3つの方式が、第2の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算するのに利用されてもよい。方式1は、フレーム全体に対して重み付け処理を実行することであり、方式2は、現在のサブバンドに基づきサブバンド単位で重み付け処理を実行することであり、方式3は、M個の隣接するサブバンドに基づきサブバンド単位で重み付け処理を実行することである。
任意的には、方式1が重み付け処理を実行するのに利用されるとき、当該ステップは、
ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の計算された和に従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算し、ここで、iは何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bはi番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であり、
何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有する。
任意的には、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の計算された和に従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することを有し、ここで、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、sum(i)はi番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、sum(j)はj番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、jは何れかのフレームに含まれる何れかのサブフレームであり、0<j≦Lである。
さらに、任意的には、当該ステップでは、L=4であり、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数は、
Figure 2016522451
に従って計算される。
さらに、任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することは、
Figure 2016522451
に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有し、ここで、level(b)は何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表す。
さらに、任意的には、当該ステップでは、L=4であり、何れかのフレームのb番目のサブバンドの重み付けされたICLD値は、
Figure 2016522451
に従って計算される。
任意的には、方式2が重み付け処理を実行するため利用されるとき、当該ステップは、
何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算し、
何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有する。
さらに、任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することを有し、ここで、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表し、level(j,b)はj番目のサブフレームのb番目のサブバンドのICLDを表す。
さらに、任意的には、当該ステップでは、L=4であり、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数は、
Figure 2016522451
に従って計算される。
任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することは、
Figure 2016522451
に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有し、ここで、level(b)は何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であり、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、0<i≦Lであり、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表す。
さらに、任意的には、当該ステップでは、何れかのフレームのb番目のサブバンドの重み付けされたICLD値は、
Figure 2016522451
に従って計算される。
任意的には、方式3が重み付け処理を実行するため利用されるとき、当該ステップは、
何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算し、
何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有する。
さらに、任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することを有し、ここで、Mは何れかのフレームの何れかのサブフレームの隣接するサブバンドの数を表し、lは隣接するサブバンドのインデックス番号と現在のサブバンドのインデックス番号との間の差を表す。1つのサブフレームが、サブバンド1、サブバンド2、...、サブバンドKなどのK個のサブバンドに分割されてもよく、ここでの1、2、...、Kはサブバンドのインデックス番号であることが留意されるべきである。
さらに、任意的には、当該ステップでは、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数は、2つの隣接するサブバンドのICLDに基づき、
Figure 2016522451
に従って計算される。
さらに、任意的には、当該ステップでは、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数は、3つの隣接するサブバンドのICLDに基づき、
Figure 2016522451
に従って計算される。
4つ又は5つなどの他の数の隣接するサブバンドのICLDに基づく重み付け係数が計算される必要があるとき、M個のサブバンドのICLDに基づく重み付け係数のための上記の一般的な計算式を参照することによって計算が実行されてもよいことが留意されるべきであり、特定の具体例を利用することによってここでは詳細には再説明されない。何れかのフレームのb番目のサブバンドの重み付けされたICLD値は、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って計算される。
任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することは、方式2で何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するための方法と同じであり、すなわち、何れかのフレームのb番目のサブバンドの重み付けされたICLD値は、
Figure 2016522451
である。
ステップ306:取得された重み付けされたICLD値に対して量子化処理を実行する。
任意的には、ここでの量子化処理は、所定のコードブックと重み付けされたICLD値との間の比較に従って、所定のコードブック内にあって、重み付けされたICLD値に最も近い値を取得することである。例えば、重み付けされたICLD値は1.4であり、所定のコードブックは0や2などの値を有し、これにより、量子化処理が重み付けされたICLD値に対して実行された後に取得される値は2である。
さらに、任意的には、復号化されたステレオオーディオの品質が保証されるという前提で送信されるビットを減らすため、量子化処理が実行されるとき、現在の重み付けされたICLD値と前の重み付けされたICLD値との間の差が計算されてもよく、量子化処理が計算された差に対して実行される。例えば、1つのサブフレームは15個のサブバンドに分割され、量子化処理は第1のサブバンドの重み付けされたICLD値に対して直接実行され、第2のサブバンドの重み付けされたICLD値に対して量子化処理が実行されるとき、第2のサブバンドの重み付けされたICLD値と第1のサブバンドの重み付けされたICLD値との差がまず計算され、それから、第2のサブバンドの重み付けされたICLD値の量子化結果を取得するため、量子化処理が計算された差に対して実行される。その他のサブバンドの重み付けされたICLD値の量子化結果は、第2のサブバンドの重み付けされたICLD値の量子化結果を計算するための方法に従って順次計算されてもよい。
ステレオオーディオ信号の1つのフレームが2つのサブフレームに分割されるとき、1つのサブフレームは12個のサブバンドに分割され、ステレオオーディオ信号の送信中にはパケット損失は起きず、従来技術において取得されるセグメンタル信号対雑音比(segmental signal−to−noise ratio,SSNR)は3.63dBであるが、本発明の本実施例により提供される方法が利用された後、取得されるSSNRは3.73dBであることが留意されるべきである。より大きなSSNR値は、符号化及び復号化処理後のオーディオが元のオーディオ、すなわち、より良好な効果により近いことを意味することが留意されるべきである。従って、従来技術と比較して、本発明の本実施例により提供される方法は、0.1dBより大きくSSNRを増加させる。パケット損失がステレオオーディオ信号送信処理において起きるとき、従来技術において取得されるSSNRは3.59dBであるが、本発明の本実施例により提供される方法が利用された後、取得されるSSNRは、パケット損失が起こらないケースにおいて取得されるテスト結果に近いテスト結果である3.72dBである。
本発明の本実施例により提供されるチャネル間レベル差処理方法によると、サブフレーム間の関連性に基づき、重み付け処理が何れかのサブフレームのICLDに対して実行され、量子化処理が重み付けされたICLD値に対して実行され、これにより、符号化されたビットレートが効果的に低減可能であり、信号が速く変わるケース及びパケット損失のケースにおいて、復号化されたステレオオーディオの品質が保証でき、これにより、期待される効果を実現する。
本発明の実施例は、チャネル間レベル差処理方法を提供する。図4に示されるように、ステレオオーディオデコーダにおいて、量子化処理後の入力ステレオオーディオビットストリームが受信され、K(K≧12)個のサブバンドのICLDを取得するため、ビットストリームが解析され、復号化されたステレオオーディオ信号を取得するため、各現在のサブフレームの各サブバンドのICLDとして、順次、各サブバンドのICLD値が対応して利用される。
例えば、受信したビットストリームが解析された後、サブバンド1の取得されたICLDはAであり、サブバンド2の取得されたICLDはBであり、サブバンド3の取得されたICLDはCであるなどである。現在のフレームはL個のサブフレームに分割され、各サブフレームのサブバンド1のICLDはAであり、各サブフレームのサブバンド2のICLDはBであり、各サブフレームのサブバンド3のICLDはCであるなどである。
本発明の本実施例により提供されるチャネル間レベル差処理方法によると、量子化処理後の受信したステレオオーディオビットストリームが復号化された後、比較的高い品質のステレオオーディオが取得されてもよく、ステレオオーディオ信号の低ビットレート送信が実現される。
本発明の実施例は、チャネル間レベル差処理装置を提供し、ここで、当該装置は、ステレオオーディオを処理するエンコーダであってもよい。図5に示されるように、当該装置は、受信ユニット501、解析ユニット502、計算ユニット503、第1の重み付け処理ユニット504及び第2の重み付け処理ユニット505を有する。
受信ユニット501は、ステレオオーディオ信号を受信するよう構成される。
解析ユニット502は、ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのチャネル間レベル差ICLDを取得するため、受信ユニット501により受信されたステレオオーディオ情報に従ってステレオオーディオ信号をフレーム単位で解析するよう構成され、ここで、各フレームは少なくとも2つのサブフレームを有する。
ステレオオーディオ信号は多数のフレームにより構成されてもよい。当該ステップでは、各フレームは更に複数のサブフレームに分割されてもよく、各サブフレームは複数のサブバンドに分割されてもよい。実際の適用では、各フレームは等しい数のサブフレームを有し、各フレームは少なくとも2つのサブフレームを有してもよいことが留意されるべきである。例えば、1つのフレームは2つのサブフレームを有し、又は、1つのフレームは4つのサブフレームを有し、又は、1つのフレームは6つのサブフレームを有する。各サブフレームは少なくとも12個のサブバンドを有する。
ICLDは、ステレオオーディオソースの水平方向の角度を区別するのに利用され、オーディオチャネル間の強度差を記述し、当該パラメータは周波数スペクトル全体の周波数コンポーネントに影響を与える。
計算ユニット503は、ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのものであって、解析ユニット502による解析によって取得されたICLDに従って、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の和を計算するよう構成される。
第1の重み付け処理ユニット504は、何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるとき、第1の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算するよう構成される。
第2の重み付け処理ユニット505は、何れかのフレームの何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であるとき、第2の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算するよう構成される。何れかのフレームに含まれる何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であることは、全ての差の絶対値が所定の閾値以上であるか、又は、一部の差の絶対値が所定の閾値未満であり、且つその他の差の絶対値が所定の閾値以上である、として解釈できることが留意されるべきである。
さらに、任意的には、計算ユニット503がステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのものであって、解析ユニットによる解析によって取得されるICLDに従って、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の和を計算した後であって、第1の重み付け処理ユニット504が、何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるとき、第1の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算する前か、又は、第2の重み付け処理ユニット505が、何れかのフレームの何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であるとき、第2の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算する前に、何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるかまず判断されてもよい。
さらに、任意的には、図6に示されるように、第1の重み付け処理ユニット504は、第1の計算モジュール5041及び第2の計算モジュール5042を有する。
第1の計算モジュール5041は、何れかのフレームに含まれるサブフレームの数に従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算するよう構成され、ここで、iは何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bはi番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12である。
第1の計算モジュール5041は、
fac(i,b)=1/Lに従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算するよう構成され、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を表す。
第2の計算モジュール5042は、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第1の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成される。
第2の計算モジュール5042は、
Figure 2016522451
に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成され、ここで、level(b)は何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表す。
さらに、任意的には、第2の重み付け処理ユニット505は、第3の計算モジュール5051、第4の計算モジュール5052及び第5の計算モジュール5053を有する。
第3の計算モジュール5051は、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の計算された和に従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成され、ここで、iは何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bはi番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であるか、又は、第4の計算モジュール5052は、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成される。
第5の計算モジュール5053は、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成される。
さらに、任意的には、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数が、フレーム全体に対して重み付け処理を実行する方式で計算されるとき、第3の計算モジュール5051は、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成され、ここで、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、sum(i)はi番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、sum(j)はj番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、jは何れかのフレームに含まれる何れかのサブフレームであり、0<j≦Lである。
さらに、任意的には、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数が、現在のサブバンドのICLDに基づき重み付け処理をサブバンド単位で実行する方式で計算されるとき、第4の計算モジュール5052は、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成され、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表し、level(j,b)はj番目のサブフレームのb番目のサブバンドのICLDを表す。
さらに、任意的には、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数が、M個の隣接するサブバンドのICLDに基づき重み付け処理をサブバンド単位で実行する方式で計算されるとき、第4の計算モジュール5052は、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成され、ここで、Mは隣接するサブバンドの数を表し、lは隣接するサブバンドのインデックス番号と現在のサブバンドのインデックス番号との間の差を表す。1つのサブフレームは、サブバンド1、サブバンド2、...、サブバンドKなどのK個のサブバンドに分割されてもよく、ここでの1、2、...、Kはサブバンドのインデックス番号であることが留意されるべきである。
さらに、任意的には、第5の計算モジュール5053は、
Figure 2016522451
に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成され、ここで、level(b)は何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表す。
図5又は図6に示される装置では、各モジュールの特定の実現処理やモジュール間の情報交換などのコンテンツは、本発明の方法の実施例と同一の発明概念に基づき、方法の実施例が参照されてもよいことが留意されるべきであり、ここでは詳細には再説明されない。
ステレオオーディオ信号の1つのフレームが2つのサブフレームに分割され、1つのサブフレームが12個のサブバンドに分割され、ステレオオーディオ信号送信処理中にパケット損失が起こらないとき、従来技術において取得されるセグメンタル信号対雑音比(segmental signal−to−noise ratio,SSNR)は3.63dBであるが、本発明の本実施例により提供される方法が利用された後、取得されるSSNRは3.73dBであることが留意されるべきである。より大きなSSNR値は、符号化及び復号化処理後のオーディオが元のオーディオ、すなわち、より良好な効果により近いことを意味することが留意されるべきである。従って、従来技術と比較して、本発明の本実施例により提供される方法は、0.1dBより大きくSSNRを増加する。パケット損失がステレオオーディオ信号送信処理において起こるとき、従来技術において取得されるSSNRは3.59dBであるが、本発明の本実施例により提供される方法が利用された後、取得されるSSNRは、パケット損失が起こらないケースにおいて取得されるテスト結果に近いテスト結果である3.72dBである。
本発明の本実施例により提供されるチャネル間レベル差処理装置によると、サブフレーム間の関連性に基づき、何れかのサブフレームのICLDに対して重み付け処理が実行され、量子化処理が重み付けされたICLD値に対して実行され、このため、符号化されたビットレートが効果的に低減可能であり、信号が速く変わるケース及びパケット損失のケースにおいて復号化されたステレオオーディオの品質が保証でき、これにより、期待された効果を実現する。
本発明の実施例は、チャネル間レベル差処理装置を提供し、ここで、当該装置は、ステレオオーディオを処理するエンコーダであってもよい。図7に示されるように、当該装置は、受信機701、メモリ702及びプロセッサ703を有する。
受信機701は、ステレオオーディオ信号を受信するよう構成される。
メモリ702は、プログラムを含む情報を記憶するよう構成される。
プロセッサ703は、受信機701及びメモリ702に接続され、プログラムの実行を制御するよう構成され、当該プログラムは、具体的には、ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのチャネル間レベル差ICLDを取得するため、受信されたステレオオーディオ情報に従ってステレオオーディオ信号をフレーム単位で解析し、ここで、各フレームは少なくとも2つのサブフレームを有し、ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのものであって、解析ユニットによる解析によって取得されたICLDに従って、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の和を計算し、何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるとき、第1の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算するか、又は、何れかのフレームの何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であるとき、第2の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算することを有する。
何れかのフレームの何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であることは、全て差の絶対値が所定の閾値以上であるか、又は、一部の差の絶対値が所定の閾値未満であり、且つその他の差の絶対値が所定の閾値以上である、として解釈できることが留意されるべきである。
任意的には、ステレオオーディオ信号は多数のフレームにより構成されてもよい。当該ステップでは、各フレームは複数のサブフレームに分割されてもよく、各サブフレームは複数のサブバンドに分割されてもよい。実際の適用では、各フレームは等しい数のサブフレームを有し、各フレームは少なくとも2つのサブフレームを有してもよいことが留意されるべきである。例えば、1つのフレームは2つのサブフレームを有するか、又は、1つのフレームは4つのサブフレームを有するか、又は、1つのフレームは6つのサブフレームを有する。各サブフレームは少なくとも12個のサブバンドを有する。
ICLDは、ステレオオーディオソースの水平方向の角度を区別するのに利用され、オーディオチャネル間の強度差を記述し、当該パラメータは周波数スペクトル全体の周波数コンポーネントに影響を与える。
さらに、任意的には、プロセッサ703は更に、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の和を計算した後であって、何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるとき、第1の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値が計算される前か、又は、何れかのフレームの何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であるとき、第2の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値が計算される前に、何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるかまず判断するよう構成されてもよい。
さらに、任意的には、第1の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算するとき、プロセッサ703は、何れかのフレームに含まれるサブフレームの数に従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算し、ここで、iは何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bはi番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であり、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第1の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成される。
さらに、任意的には、何れかのフレームに含まれるサブフレームの数に従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算するとき、プロセッサ703は、具体的には、fac(i,b)=1/Lに従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算するよう構成され、ここで、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を表す。
さらに、任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第1の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するとき、プロセッサ703は、具体的には、
Figure 2016522451
に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成され、ここで、level(b)は何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表す。
さらに、任意的には、第2の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算するとき、プロセッサ703は、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の計算された和に従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成され、ここで、iは何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bはi番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であるか、又は、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算し、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成される。
さらに、任意的には、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の計算された和に従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するとき、プロセッサ703は、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成され、ここで、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、sum(i)はi番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、sum(j)はj番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、jは何れかのフレームに含まれる何れかのサブフレームであり、0<j≦Lである。
さらに、任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するとき、プロセッサ703は、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成され、ここで、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表し、level(j,b)はj番目のサブフレームのb番目のサブバンドのICLDを表す。
さらに、任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するとき、プロセッサ703は、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成され、ここで、Mは隣接するサブバンドの数を表し、lは隣接するサブバンドのインデックス番号と現在のサブバンドのインデックス番号との間の差を表す。1つのサブフレームは、サブバンド1、サブバンド2、...、サブバンドKなどのK個のサブバンドに分割されてもよく、ここでの1、2、...、Kはサブバンドのインデックス番号であることが留意されるべきである。
さらに、任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するとき、プロセッサ703は、
Figure 2016522451
に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成され、ここで、level(b)は何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表す。
図7に示される装置では、各モジュールの特定の実現処理やモジュール間の情報交換などのコンテンツは、本発明の方法の実施例と同一の発明概念に基づき、方法の実施例が参照されてもよいことが留意されるべきであり、ここでは詳細には再説明されない。
ステレオオーディオ信号の1つのフレームが2つのサブフレームに分割され、1つのサブフレームが12個のサブバンドに分割され、ステレオオーディオ信号送信処理中にパケット損失が起こらないとき、従来技術において取得されるセグメンタル信号対雑音比(segmental signal−to−noise ratio,SSNR)は3.63dBであるが、本発明の本実施例により提供される方法が利用された後、取得されるSSNRは3.73dBであることが留意されるべきである。より大きなSSNR値は、符号化及び復号化処理後のオーディオが元のオーディオ、すなわち、より良好な効果により近いことを意味することが留意されるべきである。従って、従来技術と比較して、本発明の本実施例により提供される方法は、0.1dBより大きくSSNRを増加する。パケット損失がステレオオーディオ信号送信処理において起こるとき、従来技術において取得されるSSNRは3.59dBであるが、本発明の本実施例により提供される方法が利用された後、取得されるSSNRは、パケット損失が起こらないケースにおいて取得されるテスト結果に近いテスト結果である3.72dBである。
本発明の本実施例により提供されるチャネル間レベル差処理装置によると、サブフレーム間の関連性に基づき、何れかのサブフレームのICLDに対して重み付け処理が実行され、量子化処理が重み付けされたICLD値に対して実行され、このため、符号化されたビットレートが効果的に低減可能であり、信号が速く変わるケース及びパケット損失のケースにおいて復号化されたステレオオーディオの品質が保証でき、これにより、期待された効果を実現する。
説明された装置の実施例は単なる一例であることが留意されるべきである。別々のパーツとして説明されるユニットは物理的に分離してもよいし、又はしていなくてもよく、ユニットとして表示されるパーツは物理的ユニットであってもよいし、又はなくてもよく、1つの位置に配置されてもよいし、又は複数のネットワークユニットに分散されてもよい。モジュールの一部又は全ては実施例の方策の課題を達成するため、実際の要求に従って選択されてもよい。当業者は、創作的な努力なく本発明の実施例を理解及び実現してもよい。
上記の実現方式の説明に基づき、当業者は、本発明が必要な通常用いられるハードウェアに加えてソフトウェアによって、又は専用の集積回路、専用のCPU、専用のメモリ、専用のコンポーネントなどを含む専用のハードウェアによって実現されてもよいことを明確に理解してもよい。大部分の状況において、前者が好適な実現方式である。このような理解に基づき、従来技術に実質的又は部分的に貢献する本発明の技術的方策は、ソフトウェアプロダクトの形態で実現されてもよい。ソフトウェアプロダクトは、コンピュータのフロッピーディスク、USBフラッシュドライブ、着脱可能なハードディスク、読み出し専用メモリ(ROM,Read−Only Memory)、ランダム・アクセス・メモリ(RAM,Random Access Memory)、磁気ディスク、又は光ディスクなどの可読記憶媒体に記憶され、本発明の実施例において説明された方法を実行するようコンピュータ装置(パーソナルコンピュータ、サーバ、ネットワーク装置などであってもよい)に命令するための複数の命令を有する。
本明細書における実施例は全て、段階的方式で説明され、実施例における同一又は同様のパーツについて、これらの実施例を参照し、各実施例は他の実施例との差に着目している。特に、装置及びシステムの実施例は方法の実施例と基本的に類似し、従って、簡単に説明され、関連するパーツについて、方法の実施例における部分的説明を参照されたい。
上記の説明は、本発明の単なる特定の実現方式であり、本発明の保護範囲を限定することを意図していない。本発明において開示される技術的範囲内で当業者に容易に想起される何れかの変形又は置換は、本発明の保護範囲内に属する。従って、本発明の保護範囲は請求項の保護範囲に従う。
本出願は、参照することによりその全体でここに援用される、2013年7月16日に中国専利局に出願された“チャネル間レベル差処理方法及び装置”という名称の中国特許出願第201310298100.2号に対する優先権を主張する。
本発明は、ステレオオーディオ技術の分野に関し、特にチャネル間レベル差処理方法及び装置に関する。
生活の質の向上は、高品質のオーディオに対する個人の需要の増大を導く。モノラルオーディオと比較して、ステレオオーディオは、情報の明確性及び理解度を向上させることが可能であり、従って、人々の間で普及している。
ステレオオーディオが従来技術において処理されるとき、入力ステレオオーディオ信号がまず解析され、ステレオオーディオ信号を搬送するフレームにおける各サブバンドのチャネル間レベル差(Inter−Channel Level Difference,ICLD)値が取得され、それから、取得されたICLD値が前のフレームの取得されたICLD値と比較される。ICLD値と前のフレームの取得されたICLD値との差が大きいとき、フレームにより搬送されたステレオオーディオ信号はTransientであるか、又は、そうでない場合、フレームにより搬送されるステレオオーディオ信号はNormalである。Transientについて、2つのフレームが送信のため使用され、すなわち、奇数のサブバンドのICLDと偶数のサブバンドのICLDとは別々に送信される。Normalについて、4つのフレームが送信のため使用され、すなわち、各フレームはサブバンドの1/4のICLDを送信する。ビット数における一致を保証するため、refinement処理が更にNormalに対して実行される。
しかしながら、ステレオオーディオが従来技術を利用することによって処理されるとき、ステレオオーディオを搬送するフレームは比較的長いため、ステレオオーディオの10msが処理されるとき、Normalが4つのフレームを使用することによって処理される場合、それはICLDが40ms(4*10ms)毎に更新されることと等しく、信号が速く変わる場合、又はパケット損失の場合において復号化されたステレオオーディオの品質を保証することができず、さらに、ICLDがフレーム単位で送信される場合、ステレオオーディオ信号の低ビットレート送信は実現できない。
本発明の実施例は、信号が速く変わるケース、又はパケット損失のケースにおいて復号化されたステレオオーディオの品質を保証し、ステレオオーディオ信号の低ビットレート送信を実現可能なチャネル間レベル差処理方法及び装置を提供する。
第1の態様によると、本発明の実施例は、チャネル間レベル差処理方法であって、
ステレオオーディオ信号を受信し、前記ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのチャネル間レベル差ICLDを取得するため、前記ステレオオーディオ信号をフレーム単位で解析するステップであって、各フレームは少なくとも2つのサブフレームを有する、解析するステップと、
前記ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドの取得されたICLDに従って、前記ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の和を計算するステップと、
前記何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるとき、第1の重み付け方式で前記何れかのフレームの各サブバンドの重み付けされたICLD値を計算するステップ、又は、
前記何れかのフレームの何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であるとき、第2の重み付け方式で前記何れかのフレームの各サブバンドの重み付けされたICLD値を計算するステップと、
を有する方法を提供する。
第1の可能な実現方式では、第1の態様を参照して、前記第1の重み付け方式で前記何れかのフレームの各サブバンドの重み付けされたICLD値を計算するステップは、
前記何れかのフレームに含まれるサブフレームの数に従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算するステップであって、iは前記何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは前記何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bは前記i番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12である、計算するステップと、
前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び前記第1の重み付け係数に従って、前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するステップと、
を有する。
第2の可能な実現方式では、第1の態様の第1の可能な実現方式を参照して、前記何れかのフレームに含まれるサブフレームの数に従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算するステップは、
fac(i,b)=1/Lに従って前記i番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算するステップを有し、fac(i,b)は前記i番目のサブフレームのb番目のサブバンドの第1の重み付け係数を表す。
第3の可能な実現方式では、第1の態様の第2の可能な実現方式を参照して、前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び前記第1の重み付け係数に従って、前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するステップは、
Figure 2016522451
に従って前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するステップを有し、level(b)は前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、level(i,b)は前記i番目のサブフレームのb番目のサブバンドのICLDを表す。
第4の可能な実現方式では、第1の態様を参照して、前記第2の重み付け方式で前記何れかのフレームの各サブバンドの重み付けされたICLD値を計算するステップは、
前記ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の計算された和に従って、又は前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するステップであって、iは前記何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは前記何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bはi番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12である、計算するステップと、
前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び前記第2の重み付け係数に従って、前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するステップと、
を有する。
第5の可能な実現方式では、第1の態様の第4の可能な実現方式を参照して、前記ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の計算された和に従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するステップは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するステップを有し、fac(i,b)は前記i番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、sum(i)は前記i番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、sum(j)はj番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、jは前記何れかのフレームに含まれる何れかのサブフレームであり、0<j≦Lである。
第6の可能な実現方式では、第1の態様の第の可能な実現方式を参照して、前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するステップは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するステップを有し、level(i,b)は前記i番目のサブフレームのb番目のサブバンドのICLDを表し、level(j,b)は前記j番目のサブフレームのb番目のサブバンドのICLDを表す。
第7の可能な実現方式では、第1の態様の第6の可能な実現方式を参照して、前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するステップは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するステップを有し、Mは隣接するサブバンドの数を表し、lは隣接するサブバンドのインデックス番号と現在のサブバンドのインデックス番号との間の差を表す。
第8の可能な実現方式では、第1の態様の第4の可能な実現方式、第5の可能な実現方式、第6の可能な実現方式又は第7の可能な実現方式を参照して、前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び前記第2の重み付け係数に従って、前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するステップは、
Figure 2016522451
に従って前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するステップを有し、level(b)は前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、fac(i,b)は前記i番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、level(i,b)は前記i番目のサブフレームのb番目のサブバンドのICLDを表す。
第2の態様によると、本発明の実施例は、チャネル間レベル差処理装置であって、
ステレオオーディオ信号を受信するよう構成される受信ユニットと、
前記ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのチャネル間レベル差ICLDを取得するため、前記受信ユニットにより受信されたステレオオーディオ信号に従って前記ステレオオーディオ信号をフレーム単位で解析するよう構成される解析ユニットであって、各フレームは少なくとも2つのサブフレームを有する、解析ユニットと、
前記ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのものであって、前記解析ユニットによる解析によって取得されたICLDに従って、前記ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の和を計算するよう構成される計算ユニットと、
前記何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるとき、第1の重み付け方式で前記何れかのフレームの各サブバンドの重み付けされたICLD値を計算するよう構成される第1の重み付け処理ユニットと、
前記何れかのフレームの何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が前記所定の閾値以上であるとき、第2の重み付け方式で前記何れかのフレームの各サブバンドの重み付けされたICLD値を計算するよう構成される第2の重み付け処理ユニットと、
を有する装置を提供する。
第1の可能な実現方式では、第2の態様を参照して、前記第1の重み付け処理ユニットは、
前記何れかのフレームに含まれるサブフレームの数に従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算するよう構成される第1の計算モジュールであって、iは前記何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは前記何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bは前記i番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12である、第1の計算モジュールと、
前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び前記第1の重み付け係数に従って、前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成される第2の計算モジュールと、
を有する。
第2の可能な実現方式では、第2の態様の第1の可能な実現方式を参照して、前記第1の計算モジュールは、
fac(i,b)=1/Lに従って前記i番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算するよう構成され、fac(i,b)は前記i番目のサブフレームのb番目のサブバンドの第1の重み付け係数を表す。
第3の可能な実現方式では、第2の態様の第2の可能な実現方式を参照して、前記第2の計算モジュールは、
Figure 2016522451
に従って前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成され、level(b)は前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、level(,b)は前記i番目のサブフレームのb番目のサブバンドのICLDを表す。
第4の可能な実現方式では、第2の態様を参照して、前記第2の重み付け処理ユニットは、
前記ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の計算された和に従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成される第3の計算モジュールであって、iは前記何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは前記何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bはi番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12である、第3の計算モジュール、又は、前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成される第4の計算モジュールと、
前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び前記第2の重み付け係数に従って、前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成される第5の計算モジュールと、
を有する。
第5の可能な実現方式では、第2の態様の第4の可能な実現方式を参照して、前記第3の計算モジュールは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成され、fac(i,b)は前記i番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、sum(i)は前記i番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、sum(j)はj番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、jは前記何れかのフレームに含まれる何れかのサブフレームであり、0<j≦Lである。
第6の可能な実現方式では、第2の態様の第の可能な実現方式を参照して、前記第4の計算モジュールは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成され、level(i,b)は前記i番目のサブフレームのb番目のサブバンドのICLDを表し、level(j,b)は前記j番目のサブフレームのb番目のサブバンドのICLDを表す。
第7の可能な実現方式では、第2の態様の第6の可能な実現方式を参照して、前記第4の計算モジュールは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成され、Mは隣接するサブバンドの数を表し、lは隣接するサブバンドのインデックス番号と現在のサブバンドのインデックス番号との間の差を表す。
第8の可能な実現方式では、第2の態様の第4の可能な実現方式、第5の可能な実現方式、第6の可能な実現方式又は第7の可能な実現方式を参照して、前記第5の計算モジュールは、
Figure 2016522451
に従って前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成され、level(b)は前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、fac(i,b)は前記i番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、level(i,b)は前記i番目のサブフレームのb番目のサブバンドのICLDを表す。
本発明の本実施例により提供されるチャネル間レベル差処理方法によると、ステレオオーディオ信号が受信され、ステレオオーディオ信号がフレーム単位で解析され、ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのチャネル間レベル差ICLDを取得し、ここで、各フレームは少なくとも2つのサブフレームを有し、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の和が、ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドの取得されたICLDに従って計算され、何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるとき、何れかのフレームの各サブバンドの重み付けされたICLD値が第1の重み付け方式で計算され、又は何れかのフレームの何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であるとき、何れかのフレームの各サブバンドの重み付けされたICLD値が第2の重み付け方式で計算される。従来技術では、ステレオオーディオを搬送するフレームは比較的長いため、ステレオオーディオの10msが処理されるとき、Normalが4つのフレームを使用することによって処理される場合、それは、ICLDが40ms(4*10ms)毎に更新されることに等しく、信号が速く変わるケース又はパケット損失のケースにおいて復号化されたステレオオーディオの品質を保証できず、さらに、ICLDがフレーム単位で送信される場合、ステレオオーディオ信号の低ビットレート送信は実現できない。従来技術のものと比較して、本発明では、重み付け処理は、サブフレームの間の関連性に基づき何れかのサブフレームのICLDに対して実行され、これにより、本発明の本実施例により提供される方法を利用することによって取得される実験データから、復号化されたステレオオーディオの品質は、信号が速く変わるケース又はパケット損失のケースにおいて保証され、ステレオオーディオ信号の低ビットレート送信が実現されることが理解できる。
本発明の実施例又は従来技術における技術的方策をより明確に説明するため、以下において、実施例又は従来技術を説明するのに必要な添付図面が簡単に紹介される。明らかに、以下の説明における添付図面は本発明の単なるいくつかの実施例を示し、当業者は、創作的な努力なく、これらの添付図面から他の図面を依然として導出してもよい。
図1は、本発明の実施例によるチャネル間レベル差処理方法のフローチャートである。 図2は、本発明の他の実施例によるチャネル間レベル差処理方法のフローチャートである。 図3は、本発明の他の実施例によるチャネル間レベル差処理方法のフローチャートである。 図4は、本発明の他の実施例による他のチャネル間レベル差処理方法のフローチャートである。 図5は、本発明の実施例によるチャネル間レベル差処理装置のブロック図である。 図6は、本発明の実施例による他のチャネル間レベル差処理装置のブロック図である。 図7は、本発明の他の実施例による他のチャネル間レベル差処理装置のブロック図である。
以下は、本発明の実施例における添付図面を参照して、本発明の実施例における技術的方策を明確且つ完全に説明する。明らかに、説明される実施例は、本発明の実施例の全てでなく単なる一部である。創作的な努力なく本発明の実施例に基づき当業者により取得される他の全ての実施例は、本発明の保護範囲内に属する。
本発明の実施例は、チャネル間レベル差処理方法を提供し、ここで、当該方法はステレオオーディオを処理するエンコーダに適用される。図1に示されるように、当該方法は以下を有する。
ステップ101:ステレオオーディオ信号を受信し、ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのチャネル間レベル差ICLDを取得するため、ステレオオーディオ信号をフレーム単位で解析し、ここで、各フレームは少なくとも2つのサブフレームを有する。
ステレオオーディオ信号は、多数のフレームによって構成されてもよい。本ステップでは、各フレームは更に複数のサブフレームに分割されてもよく、各サブフレームは複数のサブバンドに分割されてもよい。実際の適用では、各フレームは等しい数のサブフレームを有し、各フレームは少なくとも2つのサブフレームを有してもよいことが留意されるべきである。例えば、1つのフレームは2つのサブフレームを有するか、又は、1つのフレームは4つのサブフレームを有するか、又は、1つのフレームは6つのサブフレームを有する。各サブフレームは少なくとも12個のサブバンドを有する。
ICLDは、ステレオオーディオソースの水平方向の角度を区別するのに利用され、オーディオチャネル間の強度差を記述し、当該パラメータは周波数スペクトル全体の周波数コンポーネントに影響を与える。さらに、任意的には、ICLDは2つの入力オーディオチャネル信号の間の電力比である。例えば、b番目のサブバンドのICLD値は、
Figure 2016522451
であり、ここで、X(p)及びX(p)はそれぞれ、左のオーディオチャネルの周波数領域係数及び右のオーディオチャネルの周波数領域係数であり、Pは周波数ビン値であり、level(b)の計算範囲はAb−1≦p<Aであり、ここで、Ab−1及びAは異なる周波数に対応する周波数ビン値を表し、bはi番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12である。人間の耳の聴覚特性を近似的にシミュレートするため、同じ周波数分解能を有する周波数スペクトル係数が、臨界帯域理論に従ってK個の重複しないサブバンドに分割されてもよいことをKが示すことに留意すべきである。
ステップ102:ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドの取得されたICLDに従って、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の和を計算する。
任意的には、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の和は、
Figure 2016522451
に従って計算され、ここで、iは何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは何れかのフレームに含まれるサブフレームの数であり、L≧2である。
ステップ103:何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるとき、第1の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算する。
任意的には、当該所定の閾値は経験的に取得された閾値である。
|sum(i)−sum(j)|<THであるとき、2つのサブフレームの一方のICLDは、2つのサブフレームの他方のICLDに近いと判断され、何れかのフレームの各サブバンドの重み付けされたICLD値が第1の重み付け方式で計算され、ここで、sum(i)及びsum(j)はそれぞれ、i番目のサブフレームのICLDの絶対値の和及びj番目のそれを表し、jは何れかのフレームに含まれる何れかのサブフレームを表し、0<j≦Lであり、Lは何れかのフレームに含まれるサブフレームの数であり、L≧2である。
任意的には、当該ステップは、何れかのフレームに含まれるサブフレームの数に従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算し、
何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第1の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを含む。
さらに、任意的には、何れかのフレームに含まれるサブフレームの数に従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算することは、
fac(i,b)=1/Lに従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算することを有し、ここで、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を表す。
さらに、任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第1の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することは、
Figure 2016522451
に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有し、ここで、level(b)は何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表す。
ステップ104:何れかのフレームの何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であるとき、第2の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算する。
当該ステップでは、|sum(i)−sum(j)|≧THであるとき、何れか2つのサブフレームの一方のICLDが何れか2つのサブフレームの他方のICLDと大きく異なると判断され、何れかのフレームの各サブバンドの重み付けされたICLD値が第2の重み付け方式で計算される。何れかのフレームに含まれる何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であるということは、全ての差の絶対値が所定の閾値以上であるか、又は、一部の差の絶対値が所定の閾値未満であって、且つ、その他の差の絶対値が所定の閾値以上である、として解釈できることに留意すべきである。
任意的には、当該ステップは、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の計算された和に従って、又は何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算し、ここで、iは何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bはi番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であり、
何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを含む。
さらに、任意的には、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の計算された和に従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算し、ここで、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、sum(i)はi番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、sum(j)はj番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、jは何れかのフレームに含まれる何れかのサブフレームであり、0<j≦Lである。
さらに、任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算し、ここで、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表し、level(j,b)はj番目のサブフレームのb番目のサブバンドのICLDを表す。
さらに、任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算し、ここで、Mは隣接するサブバンドの数を表し、lは隣接するサブバンドのインデックス番号と現在のサブバンドのインデックス番号との間の差を表す。1つのサブフレームが、サブバンド1、サブバンド2、...、サブバンドKなどのK個のサブバンドに分割されてもよく、ここでの1、2、...、Kはサブバンドのインデックス番号であることが留意されるべきである。
Figure 2016522451
は切り捨てを表し、
Figure 2016522451
は切り上げを表すことに留意すべきである。
さらに、任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するステップは、
Figure 2016522451
に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有し、ここで、level(b)は何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表す。
さらに、任意的には、当該ステップの後に、量子化処理が取得された重み付けされたICLD値に対して実行される。任意的には、ここでの量子化処理は、所定のコードブックと重み付けされたICLD値との間の比較に従って、所定のコードブック内にあって、重み付けされたICLD値に最も近い値を取得することである。例えば、重み付けされたICLD値が1.4であり、所定のコードブックが0や2などの値を有し、このため、量子化処理が重み付けされたICLD値に対して実行された後に取得される値は2である。
さらに、任意的には、復号化されたステレオオーディオの品質が保証される前提で送信されるビットを減らすため、量子化処理が実行されるとき、現在の重み付けされたICLD値と前の重み付けされたICLD値との間の差が計算されてもよく、計算された差に対して量子化処理が実行される。例えば、1つのサブフレームは15個のサブバンドに分割され、量子化処理は、第1のサブバンドの重み付けされたICLD値に対して直接実行され、量子化処理が第2のサブバンドの重み付けされたICLD値に対して実行されるとき、第2のサブバンドの重み付けされたICLD値と第1のサブバンドの重み付けされたICLD値との間の差がまず計算され、それから、第2のサブバンドの重み付けされたICLD値の量子化結果を取得するため、量子化処理が計算された差に対して実行される。その他のサブバンドの重み付けされたICLD値の量子化結果は、第2のサブバンドの重み付けされたICLD値の量子化結果を計算するための方法に従って順次計算されてもよい。
本発明の本実施例により提供されるチャネル間レベル差処理方法によると、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の和が、ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドの取得されたICLDに従って計算され、何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるとき、何れかのフレームの各サブバンドの重み付けされたICLD値が第1の重み付け方式で計算され、又は何れかのフレームの何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であるとき、何れかのフレームの各サブバンドの重み付けされたICLD値が第2の重み付け方式で計算される。従来技術では、ステレオオーディオを搬送するフレームは比較的長いため、ステレオオーディオの10msが処理されるとき、Normalが4つのフレームを使用することによって処理される場合、それは、ICLDが40ms(4*10ms)毎に更新されることに等しく、信号が速く変わるケース又はパケット損失のケースにおいて復号化されたステレオオーディオの品質を保証できず、さらに、ICLDがフレーム単位で送信される場合、ステレオオーディオ信号の低ビットレート送信は実現できない。従来技術のものと比較して、本発明では、重み付け処理は、サブフレームの間の関連性に基づき何れかのフレームのサブフレームのICLDに対して実行され、これにより、復号化されたステレオオーディオの品質は、信号が速く変わるケース又はパケット損失のケースにおいて保証され、ステレオオーディオ信号の低ビットレート送信が実現される。
本発明の実施例は、チャネル間レベル差処理方法を提供する。本実施例では、1つのフレームが2つのサブフレームを有することが詳細な説明のために利用され、ここで、例えば、1つのフレームは第1のサブフレームと第2のサブフレームとを有する。図2に示されるように、当該方法は以下を有する。
ステップ201:ステレオオーディオ信号を受信し、ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのチャネル間レベル差ICLDを取得するため、ステレオオーディオ信号をフレーム単位で解析する。
本実施例では、各フレームは2つのサブフレームを有する。すなわち、ステレオオーディオ信号が受信され、ステレオオーディオ信号がフレーム単位で解析され、これにより、ステレオオーディオ信号の各フレームの第1のサブフレーム及び第2のサブフレームの各サブバンドのチャネル間レベル差ICLDが取得されてもよい。
任意的には、各フレームの各サブフレームの各サブバンドのICLDを取得するためフレーム単位でステレオオーディオ信号を解析する具体的な処理方式について、図1のステップ101における説明が参照され、詳細はここでは繰り返して説明されない。
ステップ202:ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドの取得されたICLDに従って、ステレオオーディオ信号の何れかのフレームの第1のサブフレームのチャネル間レベル差ICLDの絶対値の和と、ステレオオーディオ信号の何れかのフレームの第2のサブフレームのものとを計算する。
任意的には、ステレオオーディオ信号の何れかのフレームの第1のサブフレームのICLDの絶対値の和は、
Figure 2016522451
に従って計算され、ここで、bは第1のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12である。
任意的には、sum(2)は、sum(1)を計算するための方法に従って計算され、ここでは詳細には再説明されない。
ステップ203:第1のサブフレームのICLDの絶対値の和と第2のサブフレームのICLDの絶対値の和との間の差の絶対値が所定の閾値未満であるか判断する。
任意的には、第1のサブフレームのICLDの絶対値の和と第2のサブフレームのICLDの絶対値の和との間の差の絶対値が所定の閾値未満であるか否かは、|sum(1)−sum(2)|<THに従って判断され、ここで、THは所定の閾値であり、所定の閾値は経験的に設定されてもよい。
ステップ204:第1のサブフレームのICLDの絶対値の和と第2のサブフレームのICLDの絶対値の和との間の差の絶対値が所定の閾値未満であるとき、第1の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算する。
|sum(1)−sum(2)|<THであるとき、それは、第1のサブフレームのICLDが第2のサブフレームのICLDに近いことを示し、何れかのフレームの各サブバンドの重み付けされたICLD値は、第1の重み付け方式で計算されてもよい。
任意的には、当該ステップは、何れかのフレームに含まれるサブフレームの数に従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算し、ここで、iは何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bはi番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であり、
何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第1の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有する。
さらに、任意的には、何れかのフレームに含まれるサブフレームの数に従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算することは、
fac(i,b)=1/Lに従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算することを有し、ここで、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であり、iは何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは何れかのフレームに含まれるサブフレームの数であり、L≧2である。
当該ステップでは、Lは2であり、何れかのフレームの第1又は第2のサブフレームの第1の重み付け係数は、fac(i,b)=1/L=0.5である。
さらに、任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第1の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することは、
Figure 2016522451
に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有し、ここで、level(b)は何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であり、iは何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表す。
当該ステップでは、L=2であり、何れかのフレームの重み付けされたICLD値は、
Figure 2016522451
である。
ステップ205:何れかのフレームの何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であるとき、第2の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算する。
|sum(1)−sum(2)|≧THであるとき、それは、第1のサブフレームのICLDが第2のサブフレームのICLDと大きく異なることを示し、何れかのフレームの各サブバンドの重み付けされたICLD値が、第2の重み付け方式で計算されてもよい。
任意的には、以下の3つの方式が、第2の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算するのに利用されてもよい。方式1は、フレーム全体に対して重み付け処理を実行することであり、方式2は、現在のサブバンドに基づきサブバンド単位で重み付け処理を実行することであり、方式3は、M個の隣接するサブバンドに基づきサブバンド単位で重み付け処理を実行することである。
任意的には、方式1が重み付け処理を実行するのに利用されるとき、当該ステップは、
ステレオオーディオ信号の何れかのフレームの第1又は第2のサブフレームのICLDの絶対値の計算された和に従って、第1又は第2のサブフレームのb番目のサブバンドの第2の重み付け係数を計算し、
何れかのフレームに含まれる第1又は第2のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有する。
任意的には、ステレオオーディオ信号の何れかのフレームの第1又は第2のサブフレームのICLDの絶対値の計算された和に従って、第1又は第2のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することを有し、ここで、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、sum(i)はi番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、sum(j)はj番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、jは何れかのフレームに含まれる何れかのサブフレームであり、0<j≦Lである。
具体的には、当該ステップにおいて、i=1又は2であり、
Figure 2016522451
である。
さらに、任意的には、何れかのフレームに含まれる第1又は第2のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することは、
Figure 2016522451
に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有し、ここで、level(b)は何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表す。
具体的には、当該ステップでは、何れかのフレームのb番目のサブバンドの重み付けされたICLD値は、
Figure 2016522451
である。
任意的には、方式2が重み付け処理を実行するため利用されるとき、当該ステップは、
ステレオオーディオ信号の何れかのフレームに含まれる第1又は第2のサブフレームのb番目のサブバンドの計算されたICLDに従って、第1又は第2のサブフレームのb番目のサブバンドの第2の重み付け係数を計算し、
何れかのフレームに含まれる第1又は第2のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有する。
さらに、任意的には、ステレオオーディオ信号の何れかのフレームの第1又は第2のサブフレームのb番目のサブバンドの計算されたICLDに従って、第1又は第2のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することを有し、ここで、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表し、level(j,b)はj番目のサブフレームのb番目のサブバンドのICLDを表す。
具体的には、当該ステップでは、i=1又は2であり、
Figure 2016522451
である。
任意的には、何れかのフレームに含まれる第1又は第2のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することは、
Figure 2016522451
に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有し、ここで、level(b)は何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であり、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表す。
具体的には、当該ステップでは、L=2であり、何れかのフレームのb番目のサブバンドの重み付けされたICLD値は、
Figure 2016522451
である。
任意的には、方式3が重み付け処理を実行するため利用されるとき、当該ステップは、
ステレオオーディオ信号の何れかのフレームに含まれる第1又は第2のサブフレームのb番目のサブバンドの計算されたICLDに従って、第1又は第2のサブフレームのb番目のサブバンドの第2の重み付け係数を計算し、
何れかのフレームに含まれる第1又は第2のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有する。
さらに、任意的には、ステレオオーディオ信号の何れかのフレームに含まれる第1又は第2のサブフレームのb番目のサブバンドの計算されたICLDに従って、第1又は第2のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することは、
Figure 2016522451
に従って第1又は第2のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することを有し、ここで、Mは何れかのフレームの何れかのサブフレームの隣接するサブバンドの数を表し、lは隣接するサブバンドのインデックス番号と現在のサブバンドのインデックス番号との間の差を表す。1つのサブフレームが、サブバンド1、サブバンド2、...、サブバンドKなどのK個のサブバンドに分割されてもよく、ここでの1、2、...、Kはサブバンドのインデックス番号であることが留意されるべきである。
具体的には、当該ステップでは、2つの隣接するサブバンドのICLDに基づき取得される重み付け係数は、
Figure 2016522451
である。
当該ステップでは、3つの隣接するサブバンドのICLDに基づき取得される重み付け係数は、
Figure 2016522451
である。
4つ又は5つなどの他の数の隣接するサブバンドのICLDに基づく重み付け係数が計算される必要があるとき、M個のサブバンドのICLDに基づく重み付け係数のための上記の一般的な計算式を参照することによって計算が実行されてもよいことが留意されるべきであり、特定の具体例を利用することによってここでは詳細には再説明されない。
任意的には、何れかのフレームに含まれる第1又は第2のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って第1又は第2のサブフレームのb番目のサブバンドの重み付けされたICLD値を計算することは、方式2で何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するための方法と同じであり、ここで、L=2であり、すなわち、何れかのフレームのb番目のサブバンドの重み付けされたICLD値は、
Figure 2016522451
である。
ステップ206:取得された重み付けされたICLD値に対して量子化処理を実行する。
任意的には、ここでの量子化処理は、所定のコードブックと重み付けされたICLD値との間の比較に従って、所定のコードブック内にあって、重み付けされたICLD値に最も近い値を取得することである。例えば、重み付けされたICLD値は1.4であり、所定のコードブックは0や2などの値を有し、これにより、量子化処理が重み付けされたICLD値に対して実行された後に取得される値は2である。
さらに、任意的には、復号化されたステレオオーディオの品質が保証されるという前提で送信されるビットを減らすため、量子化処理が実行されるとき、現在の重み付けされたICLD値と前の重み付けされたICLD値との間の差が計算されてもよく、量子化処理は計算された差に対して実行される。例えば、1つのサブフレームは15個のサブバンドに分割され、量子化処理は第1のサブバンドの重み付けされたICLD値に対して直接実行され、第2のサブバンドの重み付けされたICLD値に対して量子化処理が実行されるとき、第2のサブバンドの重み付けされたICLD値と第1のサブバンドの重み付けされたICLD値との差がまず計算され、それから、第2のサブバンドの重み付けされたICLD値の量子化結果を取得するため、量子化処理が計算された差に対して実行される。その他のサブバンドの重み付けされたICLD値の量子化結果は、第2のサブバンドの重み付けされたICLD値の量子化結果を計算するための方法に従って順次計算されてもよい。
1つのフレームが4つのサブフレームを有することが、詳細な説明のため以下で利用され、図3に示されるように、当該方法は以下を有する。
ステップ301:ステレオオーディオ信号を受信し、ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのチャネル間レベル差ICLDを取得するため、ステレオオーディオ信号をフレーム単位で解析する。
任意的には、各フレームは4つのサブフレームを有する。任意的には、各フレームの各サブフレームの各サブバンドのICLDを取得するためフレーム単位でステレオオーディオ信号を解析する具体的な処理方式について、図1のステップ101における説明が参照され、詳細はここでは繰り返して説明されない。
ステップ302:ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドの取得されたICLDに従って、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の和を計算する。
任意的には、ステレオオーディオ信号の何れかのフレームの第1のサブフレームのICLDの絶対値の和は、
Figure 2016522451
に従って計算され、ここで、bは第1のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であり、iは何れかのフレームに含まれる何れかのサブフレームを表し、本実施例では、0<i≦4である。
ステップ303:何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるか判断する。
任意的には、何れかのフレームのi番目のサブフレームのICLDの絶対値の和とj番目のサブフレームのものとの間の差の絶対値が所定の閾値未満であるか否かは、|sum(i)−sum(j)|<THに従って判断され、ここで、THは所定の閾値であり、所定の閾値は経験的に設定されてもよい。
ステップ304:何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるとき、第1の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算する。
|sum(i)−sum(j)|<THであるとき、それは、i番目のサブフレームのICLDがj番目のサブフレームのICLDに近いことを示し、何れかのフレームの各サブバンドの重み付けされたICLD値は、第1の重み付け方式で計算されてもよい。
任意的には、当該ステップは、
何れかのフレームに含まれるサブフレームの数に従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算し、ここで、iは何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bはi番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であり、
何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第1の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有する。
さらに、任意的には、何れかのフレームに含まれるサブフレームの数に従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算することは、
fac(i,b)=1/Lに従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算することを有し、ここで、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であり、iは何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは何れかのフレームに含まれるサブフレームの数であり、L≧2である。
当該ステップでは、L=4であり、第1の重み付け係数は、fac(i,b)=1/L=0.25である。
さらに、任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第1の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することは、
Figure 2016522451
に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有し、ここで、level(b)は何れか2つのサブフレームのb番目のサブバンドの重み付けされたICLD値を表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であり、iは何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表す。
当該ステップでは、何れかのフレームのb番目のサブバンドの重み付けされたICLD値は、
Figure 2016522451
である。
ステップ305:何れかのフレームの何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であるとき、第2の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算する。
|sum(i)−sum(j)|≧THであるとき、それは、i番目のサブフレームのICLDがj番目のサブフレームのICLDと大きく異なることを示し、何れかのフレームの各サブバンドの重み付けされたICLD値が、第2の重み付け方式で計算されてもよい。何れかのフレームに含まれる何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であるということは、全ての差の絶対値が所定の閾値以上であるか、又は、一部の差の絶対値が所定の閾値未満であって、且つその他の差の絶対値が所定の閾値以上である、として解釈可能であることが留意されるべきである。例えば、|sum(1)−sum(2)|≧TH、|sum(1)−sum(3)|≧TH、|sum(1)−sum(4)|≧TH、|sum(2)−sum(3)|≧TH、|sum(2)−sum(3)|≧TH、及び|sum(3)−sum(4)|≧TH、又は、|sum(1)−sum(2)|≧TH、|sum(1)−sum(3)|≧TH、|sum(1)−sum(4)|<TH、|sum(2)−sum(3)|<TH、|sum(2)−sum(3)|<TH、及び|sum(3)−sum(4)|<THであるとき、何れかのフレームの何れかのサブバンドの重み付けされたICLD値が、第2の重み付け方式で計算されてもよいことが留意されるべきである。
任意的には、以下の3つの方式が、第2の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算するのに利用されてもよい。方式1は、フレーム全体に対して重み付け処理を実行することであり、方式2は、現在のサブバンドに基づきサブバンド単位で重み付け処理を実行することであり、方式3は、M個の隣接するサブバンドに基づきサブバンド単位で重み付け処理を実行することである。
任意的には、方式1が重み付け処理を実行するのに利用されるとき、当該ステップは、
ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の計算された和に従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算し、ここで、iは何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bはi番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であり、
何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有する。
任意的には、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の計算された和に従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することを有し、ここで、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、sum(i)はi番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、sum(j)はj番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、jは何れかのフレームに含まれる何れかのサブフレームであり、0<j≦Lである。
さらに、任意的には、当該ステップでは、L=4であり、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数は、
Figure 2016522451
に従って計算される。
さらに、任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することは、
Figure 2016522451
に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有し、ここで、level(b)は何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表す。
さらに、任意的には、当該ステップでは、L=4であり、何れかのフレームのb番目のサブバンドの重み付けされたICLD値は、
Figure 2016522451
に従って計算される。
任意的には、方式2が重み付け処理を実行するため利用されるとき、当該ステップは、
何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算し、
何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有する。
さらに、任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することを有し、ここで、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表し、level(j,b)はj番目のサブフレームのb番目のサブバンドのICLDを表す。
さらに、任意的には、当該ステップでは、L=4であり、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数は、
Figure 2016522451
に従って計算される。
任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することは、
Figure 2016522451
に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有し、ここで、level(b)は何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であり、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、0<i≦Lであり、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表す。
さらに、任意的には、当該ステップでは、何れかのフレームのb番目のサブバンドの重み付けされたICLD値は、
Figure 2016522451
に従って計算される。
任意的には、方式3が重み付け処理を実行するため利用されるとき、当該ステップは、
何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算し、
何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することを有する。
さらに、任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することは、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算することを有し、ここで、Mは何れかのフレームの何れかのサブフレームの隣接するサブバンドの数を表し、lは隣接するサブバンドのインデックス番号と現在のサブバンドのインデックス番号との間の差を表す。1つのサブフレームが、サブバンド1、サブバンド2、...、サブバンドKなどのK個のサブバンドに分割されてもよく、ここでの1、2、...、Kはサブバンドのインデックス番号であることが留意されるべきである。
さらに、任意的には、当該ステップでは、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数は、2つの隣接するサブバンドのICLDに基づき、
Figure 2016522451
に従って計算される。
さらに、任意的には、当該ステップでは、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数は、3つの隣接するサブバンドのICLDに基づき、
Figure 2016522451
に従って計算される。
4つ又は5つなどの他の数の隣接するサブバンドのICLDに基づく重み付け係数が計算される必要があるとき、M個のサブバンドのICLDに基づく重み付け係数のための上記の一般的な計算式を参照することによって計算が実行されてもよいことが留意されるべきであり、特定の具体例を利用することによってここでは詳細には再説明されない。何れかのフレームのb番目のサブバンドの重み付けされたICLD値は、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って計算される。
任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算することは、方式2で何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するための方法と同じであり、すなわち、何れかのフレームのb番目のサブバンドの重み付けされたCLD値は、
Figure 2016522451
である。
ステップ306:取得された重み付けされたICLD値に対して量子化処理を実行する。
任意的には、ここでの量子化処理は、所定のコードブックと重み付けされたICLD値との間の比較に従って、所定のコードブック内にあって、重み付けされたICLD値に最も近い値を取得することである。例えば、重み付けされたICLD値は1.4であり、所定のコードブックは0や2などの値を有し、これにより、量子化処理が重み付けされたICLD値に対して実行された後に取得される値は2である。
さらに、任意的には、復号化されたステレオオーディオの品質が保証されるという前提で送信されるビットを減らすため、量子化処理が実行されるとき、現在の重み付けされたICLD値と前の重み付けされたICLD値との間の差が計算されてもよく、量子化処理が計算された差に対して実行される。例えば、1つのサブフレームは15個のサブバンドに分割され、量子化処理は第1のサブバンドの重み付けされたICLD値に対して直接実行され、第2のサブバンドの重み付けされたICLD値に対して量子化処理が実行されるとき、第2のサブバンドの重み付けされたICLD値と第1のサブバンドの重み付けされたICLD値との差がまず計算され、それから、第2のサブバンドの重み付けされたICLD値の量子化結果を取得するため、量子化処理が計算された差に対して実行される。その他のサブバンドの重み付けされたICLD値の量子化結果は、第2のサブバンドの重み付けされたICLD値の量子化結果を計算するための方法に従って順次計算されてもよい。
ステレオオーディオ信号の1つのフレームが2つのサブフレームに分割されるとき、1つのサブフレームは12個のサブバンドに分割され、ステレオオーディオ信号の送信中にはパケット損失は起きず、従来技術において取得されるセグメンタル信号対雑音比(segmental signal−to−noise ratio,SSNR)は3.63dBであるが、本発明の本実施例により提供される方法が利用された後、取得されるSSNRは3.73dBであることが留意されるべきである。より大きなSSNR値は、符号化及び復号化処理後のオーディオが元のオーディオ、すなわち、より良好な効果により近いことを意味することが留意されるべきである。従って、従来技術と比較して、本発明の本実施例により提供される方法は、0.1dBより大きくSSNRを増加させる。パケット損失がステレオオーディオ信号送信処理において起きるとき、従来技術において取得されるSSNRは3.59dBであるが、本発明の本実施例により提供される方法が利用された後、取得されるSSNRは、パケット損失が起こらないケースにおいて取得されるテスト結果に近いテスト結果である3.72dBである。
本発明の本実施例により提供されるチャネル間レベル差処理方法によると、サブフレーム間の関連性に基づき、重み付け処理が何れかのサブフレームのICLDに対して実行され、量子化処理が重み付けされたICLD値に対して実行され、これにより、符号化されたビットレートが効果的に低減可能であり、信号が速く変わるケース及びパケット損失のケースにおいて、復号化されたステレオオーディオの品質が保証でき、これにより、期待される効果を実現する。
本発明の実施例は、チャネル間レベル差処理方法を提供する。図4に示されるように、ステレオオーディオデコーダにおいて、量子化処理後の入力ステレオオーディオビットストリームが受信され、K(K≧12)個のサブバンドのICLDを取得するため、ビットストリームが解析され、復号化されたステレオオーディオ信号を取得するため、各現在のサブフレームの各サブバンドのICLDとして、順次、各サブバンドのICLD値が対応して利用される。
例えば、受信したビットストリームが解析された後、サブバンド1の取得されたICLDはAであり、サブバンド2の取得されたICLDはBであり、サブバンド3の取得されたICLDはCであるなどである。現在のフレームはL個のサブフレームに分割され、各サブフレームのサブバンド1のICLDはAであり、各サブフレームのサブバンド2のICLDはBであり、各サブフレームのサブバンド3のICLDはCであるなどである。
本発明の本実施例により提供されるチャネル間レベル差処理方法によると、量子化処理後の受信したステレオオーディオビットストリームが復号化された後、比較的高い品質のステレオオーディオが取得されてもよく、ステレオオーディオ信号の低ビットレート送信が実現される。
本発明の実施例は、チャネル間レベル差処理装置を提供し、ここで、当該装置は、ステレオオーディオを処理するエンコーダであってもよい。図5に示されるように、当該装置は、受信ユニット501、解析ユニット502、計算ユニット503、第1の重み付け処理ユニット504及び第2の重み付け処理ユニット505を有する。
受信ユニット501は、ステレオオーディオ信号を受信するよう構成される。
解析ユニット502は、ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのチャネル間レベル差ICLDを取得するため、受信ユニット501により受信されたステレオオーディオ信号に従ってステレオオーディオ信号をフレーム単位で解析するよう構成され、ここで、各フレームは少なくとも2つのサブフレームを有する。
ステレオオーディオ信号は多数のフレームにより構成されてもよい。当該実施例では、各フレームは更に複数のサブフレームに分割されてもよく、各サブフレームは複数のサブバンドに分割されてもよい。実際の適用では、各フレームは等しい数のサブフレームを有し、各フレームは少なくとも2つのサブフレームを有してもよいことが留意されるべきである。例えば、1つのフレームは2つのサブフレームを有し、又は、1つのフレームは4つのサブフレームを有し、又は、1つのフレームは6つのサブフレームを有する。各サブフレームは少なくとも12個のサブバンドを有する。
ICLDは、ステレオオーディオソースの水平方向の角度を区別するのに利用され、オーディオチャネル間の強度差を記述し、当該パラメータは周波数スペクトル全体の周波数コンポーネントに影響を与える。
計算ユニット503は、ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのものであって、解析ユニット502による解析によって取得されたICLDに従って、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の和を計算するよう構成される。
第1の重み付け処理ユニット504は、何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるとき、第1の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算するよう構成される。
第2の重み付け処理ユニット505は、何れかのフレームの何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であるとき、第2の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算するよう構成される。何れかのフレームに含まれる何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であることは、全ての差の絶対値が所定の閾値以上であるか、又は、一部の差の絶対値が所定の閾値未満であり、且つその他の差の絶対値が所定の閾値以上である、として解釈できることが留意されるべきである。
さらに、任意的には、計算ユニット503がステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのものであって、解析ユニットによる解析によって取得されるICLDに従って、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の和を計算した後であって、第1の重み付け処理ユニット504が、何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるとき、第1の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算する前か、又は、第2の重み付け処理ユニット505が、何れかのフレームの何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であるとき、第2の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算する前に、何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるかまず判断されてもよい。
さらに、任意的には、図6に示されるように、第1の重み付け処理ユニット504は、第1の計算モジュール5041及び第2の計算モジュール5042を有する。
第1の計算モジュール5041は、何れかのフレームに含まれるサブフレームの数に従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算するよう構成され、ここで、iは何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bはi番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12である。
第1の計算モジュール5041は、
fac(i,b)=1/Lに従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算するよう構成され、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を表す。
第2の計算モジュール5042は、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第1の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成される。
第2の計算モジュール5042は、
Figure 2016522451
に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成され、ここで、level(b)は何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表す。
さらに、任意的には、第2の重み付け処理ユニット505は、第3の計算モジュール5051、第4の計算モジュール5052及び第5の計算モジュール5053を有する。
第3の計算モジュール5051は、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の計算された和に従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成され、ここで、iは何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bはi番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であるか、又は、第4の計算モジュール5052は、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成される。
第5の計算モジュール5053は、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成される。
さらに、任意的には、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数が、フレーム全体に対して重み付け処理を実行する方式で計算されるとき、第3の計算モジュール5051は、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成され、ここで、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、sum(i)はi番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、sum(j)はj番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、jは何れかのフレームに含まれる何れかのサブフレームであり、0<j≦Lである。
さらに、任意的には、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数が、現在のサブバンドのICLDに基づき重み付け処理をサブバンド単位で実行する方式で計算されるとき、第4の計算モジュール5052は、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成され、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表し、level(j,b)はj番目のサブフレームのb番目のサブバンドのICLDを表す。
さらに、任意的には、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数が、M個の隣接するサブバンドのICLDに基づき重み付け処理をサブバンド単位で実行する方式で計算されるとき、第4の計算モジュール5052は、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成され、ここで、Mは隣接するサブバンドの数を表し、lは隣接するサブバンドのインデックス番号と現在のサブバンドのインデックス番号との間の差を表す。1つのサブフレームは、サブバンド1、サブバンド2、...、サブバンドKなどのK個のサブバンドに分割されてもよく、ここでの1、2、...、Kはサブバンドのインデックス番号であることが留意されるべきである。
さらに、任意的には、第5の計算モジュール5053は、
Figure 2016522451
に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成され、ここで、level(b)は何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表す。
図5又は図6に示される装置では、各モジュールの特定の実現処理やモジュール間の情報交換などのコンテンツは、本発明の方法の実施例と同一の発明概念に基づき、方法の実施例が参照されてもよいことが留意されるべきであり、ここでは詳細には再説明されない。
ステレオオーディオ信号の1つのフレームが2つのサブフレームに分割され、1つのサブフレームが12個のサブバンドに分割され、ステレオオーディオ信号送信処理中にパケット損失が起こらないとき、従来技術において取得されるセグメンタル信号対雑音比(segmental signal−to−noise ratio,SSNR)は3.63dBであるが、本発明の本実施例により提供される装置が利用された後、取得されるSSNRは3.73dBであることが留意されるべきである。より大きなSSNR値は、符号化及び復号化処理後のオーディオが元のオーディオ、すなわち、より良好な効果により近いことを意味することが留意されるべきである。従って、従来技術と比較して、本発明の本実施例により提供される装置は、0.1dBより大きくSSNRを増加する。パケット損失がステレオオーディオ信号送信処理において起こるとき、従来技術において取得されるSSNRは3.59dBであるが、本発明の本実施例により提供される装置が利用された後、取得されるSSNRは、パケット損失が起こらないケースにおいて取得されるテスト結果に近いテスト結果である3.72dBである。
本発明の本実施例により提供されるチャネル間レベル差処理装置によると、サブフレーム間の関連性に基づき、何れかのサブフレームのICLDに対して重み付け処理が実行され、量子化処理が重み付けされたICLD値に対して実行され、このため、符号化されたビットレートが効果的に低減可能であり、信号が速く変わるケース及びパケット損失のケースにおいて復号化されたステレオオーディオの品質が保証でき、これにより、期待された効果を実現する。
本発明の実施例は、チャネル間レベル差処理装置を提供し、ここで、当該装置は、ステレオオーディオを処理するエンコーダであってもよい。図7に示されるように、当該装置は、受信機701、メモリ702及びプロセッサ703を有する。
受信機701は、ステレオオーディオ信号を受信するよう構成される。
メモリ702は、プログラムを含む情報を記憶するよう構成される。
プロセッサ703は、受信機701及びメモリ702に接続され、プログラムの実行を制御するよう構成され、当該プログラムは、具体的には、ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのチャネル間レベル差ICLDを取得するため、受信されたステレオオーディオ信号に従ってステレオオーディオ信号をフレーム単位で解析し、ここで、各フレームは少なくとも2つのサブフレームを有し、ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのものであって、解析ユニットによる解析によって取得されたICLDに従って、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の和を計算し、何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるとき、第1の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算するか、又は、何れかのフレームの何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であるとき、第2の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算することを有する。
何れかのフレームの何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であることは、全て差の絶対値が所定の閾値以上であるか、又は、一部の差の絶対値が所定の閾値未満であり、且つその他の差の絶対値が所定の閾値以上である、として解釈できることが留意されるべきである。
任意的には、ステレオオーディオ信号は多数のフレームにより構成されてもよい。当該実施例では、各フレームは複数のサブフレームに分割されてもよく、各サブフレームは複数のサブバンドに分割されてもよい。実際の適用では、各フレームは等しい数のサブフレームを有し、各フレームは少なくとも2つのサブフレームを有してもよいことが留意されるべきである。例えば、1つのフレームは2つのサブフレームを有するか、又は、1つのフレームは4つのサブフレームを有するか、又は、1つのフレームは6つのサブフレームを有する。各サブフレームは少なくとも12個のサブバンドを有する。
ICLDは、ステレオオーディオソースの水平方向の角度を区別するのに利用され、オーディオチャネル間の強度差を記述し、当該パラメータは周波数スペクトル全体の周波数コンポーネントに影響を与える。
さらに、任意的には、プロセッサ703は更に、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の和を計算した後であって、何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるとき、第1の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値が計算される前か、又は、何れかのフレームの何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であるとき、第2の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値が計算される前に、何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるかまず判断するよう構成されてもよい。
さらに、任意的には、第1の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算するとき、プロセッサ703は、何れかのフレームに含まれるサブフレームの数に従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算し、ここで、iは何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bはi番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であり、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第1の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成される。
さらに、任意的には、何れかのフレームに含まれるサブフレームの数に従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算するとき、プロセッサ703は、具体的には、fac(i,b)=1/Lに従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算するよう構成され、ここで、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を表す。
さらに、任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第1の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するとき、プロセッサ703は、具体的には、
Figure 2016522451
に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成され、ここで、level(b)は何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表す。
さらに、任意的には、第2の重み付け方式で何れかのフレームの各サブバンドの重み付けされたICLD値を計算するとき、プロセッサ703は、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の計算された和に従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成され、ここで、iは何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bはi番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12であるか、又は、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算し、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成される。
さらに、任意的には、ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の計算された和に従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するとき、プロセッサ703は、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成され、ここで、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、sum(i)はi番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、sum(j)はj番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、jは何れかのフレームに含まれる何れかのサブフレームであり、0<j≦Lである。
さらに、任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するとき、プロセッサ703は、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成され、ここで、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表し、level(j,b)はj番目のサブフレームのb番目のサブバンドのICLDを表す。
さらに、任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するとき、プロセッサ703は、
Figure 2016522451
に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成され、ここで、Mは隣接するサブバンドの数を表し、lは隣接するサブバンドのインデックス番号と現在のサブバンドのインデックス番号との間の差を表す。1つのサブフレームは、サブバンド1、サブバンド2、...、サブバンドKなどのK個のサブバンドに分割されてもよく、ここでの1、2、...、Kはサブバンドのインデックス番号であることが留意されるべきである。
さらに、任意的には、何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び第2の重み付け係数に従って、何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するとき、プロセッサ703は、
Figure 2016522451
に従って何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成され、ここで、level(b)は何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、fac(i,b)はi番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、level(i,b)はi番目のサブフレームのb番目のサブバンドのICLDを表す。
図7に示される装置では、各モジュールの特定の実現処理やモジュール間の情報交換などのコンテンツは、本発明の方法の実施例と同一の発明概念に基づき、方法の実施例が参照されてもよいことが留意されるべきであり、ここでは詳細には再説明されない。
ステレオオーディオ信号の1つのフレームが2つのサブフレームに分割され、1つのサブフレームが12個のサブバンドに分割され、ステレオオーディオ信号送信処理中にパケット損失が起こらないとき、従来技術において取得されるセグメンタル信号対雑音比(segmental signal−to−noise ratio,SSNR)は3.63dBであるが、本発明の本実施例により提供される装置が利用された後、取得されるSSNRは3.73dBであることが留意されるべきである。より大きなSSNR値は、符号化及び復号化処理後のオーディオが元のオーディオ、すなわち、より良好な効果により近いことを意味することが留意されるべきである。従って、従来技術と比較して、本発明の本実施例により提供される装置は、0.1dBより大きくSSNRを増加する。パケット損失がステレオオーディオ信号送信処理において起こるとき、従来技術において取得されるSSNRは3.59dBであるが、本発明の本実施例により提供される装置が利用された後、取得されるSSNRは、パケット損失が起こらないケースにおいて取得されるテスト結果に近いテスト結果である3.72dBである。
本発明の本実施例により提供されるチャネル間レベル差処理装置によると、サブフレーム間の関連性に基づき、何れかのサブフレームのICLDに対して重み付け処理が実行され、量子化処理が重み付けされたICLD値に対して実行され、このため、符号化されたビットレートが効果的に低減可能であり、信号が速く変わるケース及びパケット損失のケースにおいて復号化されたステレオオーディオの品質が保証でき、これにより、期待された効果を実現する。
説明された装置の実施例は単なる一例であることが留意されるべきである。別々のパーツとして説明されるユニットは物理的に分離してもよいし、又はしていなくてもよく、ユニットとして表示されるパーツは物理的ユニットであってもよいし、又はなくてもよく、1つの位置に配置されてもよいし、又は複数のネットワークユニットに分散されてもよい。モジュールの一部又は全ては実施例の方策の課題を達成するため、実際の要求に従って選択されてもよい。当業者は、創作的な努力なく本発明の実施例を理解及び実現してもよい。
上記の実現方式の説明に基づき、当業者は、本発明が必要な通常用いられるハードウェアに加えてソフトウェアによって、又は専用の集積回路、専用のCPU、専用のメモリ、専用のコンポーネントなどを含む専用のハードウェアによって実現されてもよいことを明確に理解してもよい。大部分の状況において、前者が好適な実現方式である。このような理解に基づき、従来技術に実質的又は部分的に貢献する本発明の技術的方策は、ソフトウェアプロダクトの形態で実現されてもよい。ソフトウェアプロダクトは、コンピュータのフロッピーディスク、USBフラッシュドライブ、着脱可能なハードディスク、読み出し専用メモリ(ROM,Read−Only Memory)、ランダム・アクセス・メモリ(RAM,Random Access Memory)、磁気ディスク、又は光ディスクなどの可読記憶媒体に記憶され、本発明の実施例において説明された方法を実行するようコンピュータ装置(パーソナルコンピュータ、サーバ、ネットワーク装置などであってもよい)に命令するための複数の命令を有する。
本明細書における実施例は全て、段階的方式で説明され、実施例における同一又は同様のパーツについて、これらの実施例を参照し、各実施例は他の実施例との差に着目している。特に、装置及びシステムの実施例は方法の実施例と基本的に類似し、従って、簡単に説明され、関連するパーツについて、方法の実施例における部分的説明を参照されたい。
上記の説明は、本発明の単なる特定の実現方式であり、本発明の保護範囲を限定することを意図していない。本発明において開示される技術的範囲内で当業者に容易に想起される何れかの変形又は置換は、本発明の保護範囲内に属する。従って、本発明の保護範囲は請求項の保護範囲に従う。

Claims (18)

  1. チャネル間レベル差処理方法であって、
    ステレオオーディオ信号を受信し、前記ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのチャネル間レベル差ICLDを取得するため、前記ステレオオーディオ信号をフレーム単位で解析するステップであって、各フレームは少なくとも2つのサブフレームを有する、解析するステップと、
    前記ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドの取得されたICLDに従って、前記ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の和を計算するステップと、
    前記何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるとき、第1の重み付け方式で前記何れかのフレームの各サブバンドの重み付けされたICLD値を計算するステップ、又は、
    前記何れかのフレームの何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値以上であるとき、第2の重み付け方式で前記何れかのフレームの各サブバンドの重み付けされたICLD値を計算するステップと、
    を有する方法。
  2. 前記第1の重み付け方式で前記何れかのフレームの各サブバンドの重み付けされたICLD値を計算するステップは、
    前記何れかのフレームに含まれるサブフレームの数に従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算するステップであって、iは前記何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは前記何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bは前記i番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12である、計算するステップと、
    前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び前記第1の重み付け係数に従って、前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するステップと、
    を有する、請求項1記載の方法。
  3. 前記何れかのフレームに含まれるサブフレームの数に従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算するステップは、
    fac(i,b)=1/Lに従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算するステップを有し、fac(i,b)は前記i番目のサブフレームのb番目のサブバンドの第1の重み付け係数を表す、請求項2記載の方法。
  4. 前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び前記第1の重み付け係数に従って、前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するステップは、
    Figure 2016522451
    に従って前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するステップを有し、level(b)は前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、level(i,b)は前記i番目のサブフレームのb番目のサブバンドのICLDを表す、請求項3記載の方法。
  5. 前記第2の重み付け方式で前記何れかのフレームの各サブバンドの重み付けされたICLD値を計算するステップは、
    前記ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の計算された和に従って、又は前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するステップであって、iは前記何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは前記何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bはi番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12である、計算するステップと、
    前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び前記第2の重み付け係数に従って、前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するステップと、
    を有する、請求項1記載の方法。
  6. 前記ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の計算された和に従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するステップは、
    Figure 2016522451
    に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するステップを有し、fac(i,b)は前記i番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、sum(i)は前記i番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、sum(j)はj番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、jは前記何れかのフレームに含まれる何れかのサブフレームであり、0<j≦Lである、請求項5記載の方法。
  7. 前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するステップは、
    Figure 2016522451
    に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するステップを有し、level(i,b)は前記i番目のサブフレームのb番目のサブバンドのICLDを表し、level(j,b)は前記j番目のサブフレームのb番目のサブバンドのICLDを表す、請求項6記載の方法。
  8. 前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するステップは、
    Figure 2016522451
    に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するステップを有し、Mは隣接するサブバンドの数を表し、lは隣接するサブバンドのインデックス番号と現在のサブバンドのインデックス番号との間の差を表す、請求項7記載の方法。
  9. 前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び前記第2の重み付け係数に従って、前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するステップは、
    Figure 2016522451
    に従って前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するステップを有し、level(b)は前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、fac(i,b)は前記i番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、level(i,b)は前記i番目のサブフレームのb番目のサブバンドのICLDを表す、請求項5乃至8何れか一項記載の方法。
  10. チャネル間レベル差処理装置であって、
    ステレオオーディオ信号を受信するよう構成される受信ユニットと、
    前記ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのチャネル間レベル差ICLDを取得するため、前記受信ユニットにより受信されたステレオオーディオ情報に従って前記ステレオオーディオ信号をフレーム単位で解析するよう構成される解析ユニットであって、各フレームは少なくとも2つのサブフレームを有する、解析ユニットと、
    前記ステレオオーディオ信号の各フレームの各サブフレームの各サブバンドのものであって、前記解析ユニットによる解析によって取得されたICLDに従って、前記ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の和を計算するよう構成される計算ユニットと、
    前記何れかのフレームの各2つのサブフレームのICLDの絶対値の和の間の差の絶対値が所定の閾値未満であるとき、第1の重み付け方式で前記何れかのフレームの各サブバンドの重み付けされたICLD値を計算するよう構成される第1の重み付け処理ユニットと、
    前記何れかのフレームの何れか2つのサブフレームのICLDの絶対値の和の間の差の絶対値が前記所定の閾値以上であるとき、第2の重み付け方式で前記何れかのフレームの各サブバンドの重み付けされたICLD値を計算するよう構成される第2の重み付け処理ユニットと、
    を有する装置。
  11. 前記第1の重み付け処理ユニットは、
    前記何れかのフレームに含まれるサブフレームの数に従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算するよう構成される第1の計算モジュールであって、iは前記何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは前記何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bは前記i番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12である、第1の計算モジュールと、
    前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び前記第1の重み付け係数に従って、前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成される第2の計算モジュールと、
    を有する、請求項10記載の装置。
  12. 前記第1の計算モジュールは、
    fac(i,b)=1/Lに従ってi番目のサブフレームのb番目のサブバンドの第1の重み付け係数を計算するよう構成され、fac(i,b)は前記i番目のサブフレームのb番目のサブバンドの第1の重み付け係数を表す、請求項11記載の装置。
  13. 前記第2の計算モジュールは、
    Figure 2016522451
    に従って前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成され、level(b)は前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、level(i,b)は前記i番目のサブフレームのb番目のサブバンドのICLDを表す、請求項12記載の装置。
  14. 前記第2の重み付け処理ユニットは、
    前記ステレオオーディオ信号の何れかのフレームの各サブフレームのICLDの絶対値の計算された和に従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成される第3の計算モジュールであって、iは前記何れかのフレームに含まれる何れかのサブフレームを表し、0<i≦Lであり、Lは前記何れかのフレームに含まれるサブフレームの数であり、L≧2であり、bはi番目のサブフレームの何れかのサブバンドを表し、0<b≦Kであり、Kは何れかのサブフレームに含まれるサブバンドの数を表し、K≧12である、第3の計算モジュール、又は、前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLDに従って、i番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成される第4の計算モジュールと、
    前記何れかのフレームのi番目のサブフレームのb番目のサブバンドのICLD及び前記第2の重み付け係数に従って、前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成される第5の計算モジュールと、
    を有する、請求項10記載の装置。
  15. 前記第3の計算モジュールは、
    Figure 2016522451
    に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成され、fac(i,b)は前記i番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、sum(i)は前記i番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、sum(j)はj番目のサブフレームの全てのサブバンドのICLDの絶対値の和を表し、jは前記何れかのフレームに含まれる何れかのサブフレームであり、0<j≦Lである、請求項10記載の装置。
  16. 前記第4の計算モジュールは、
    Figure 2016522451
    に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成され、level(i,b)は前記i番目のサブフレームのb番目のサブバンドのICLDを表し、level(j,b)は前記j番目のサブフレームのb番目のサブバンドのICLDを表す、請求項15記載の装置。
  17. 前記第4の計算モジュールは、
    Figure 2016522451
    に従ってi番目のサブフレームのb番目のサブバンドの第2の重み付け係数を計算するよう構成され、Mは隣接するサブバンドの数を表し、lは隣接するサブバンドのインデックス番号と現在のサブバンドのインデックス番号との間の差を表す、請求項16記載の装置。
  18. 前記第5の計算モジュールは、
    Figure 2016522451
    に従って前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を計算するよう構成され、level(b)は前記何れかのフレームのb番目のサブバンドの重み付けされたICLD値を表し、fac(i,b)は前記i番目のサブフレームのb番目のサブバンドの第2の重み付け係数であり、level(i,b)は前記i番目のサブフレームのb番目のサブバンドのICLDを表す、請求項14乃至17何れか一項記載の装置。
JP2016520245A 2013-07-16 2014-01-04 チャネル間レベル差処理方法及び装置 Expired - Fee Related JP6106336B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201310298100.2A CN104299615B (zh) 2013-07-16 2013-07-16 一种声道间电平差处理方法及装置
CN201310298100.2 2013-07-16
PCT/CN2014/070131 WO2015007075A1 (zh) 2013-07-16 2014-01-04 一种声道间电平差处理方法及装置

Publications (2)

Publication Number Publication Date
JP2016522451A true JP2016522451A (ja) 2016-07-28
JP6106336B2 JP6106336B2 (ja) 2017-03-29

Family

ID=52319314

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016520245A Expired - Fee Related JP6106336B2 (ja) 2013-07-16 2014-01-04 チャネル間レベル差処理方法及び装置

Country Status (7)

Country Link
US (1) US10002615B2 (ja)
EP (1) EP2977984B1 (ja)
JP (1) JP6106336B2 (ja)
KR (1) KR101730362B1 (ja)
CN (1) CN104299615B (ja)
BR (1) BR112015030201A2 (ja)
WO (1) WO2015007075A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10109284B2 (en) * 2016-02-12 2018-10-23 Qualcomm Incorporated Inter-channel encoding and decoding of multiple high-band audio signals
GB201909715D0 (en) 2019-07-05 2019-08-21 Nokia Technologies Oy Stereo audio

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013524267A (ja) * 2010-03-29 2013-06-17 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 空間オーディオプロセッサおよび音響入力信号に基づいて空間パラメータを提供する方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102027535A (zh) * 2008-04-11 2011-04-20 诺基亚公司 信号处理
ATE538469T1 (de) * 2008-07-01 2012-01-15 Nokia Corp Vorrichtung und verfahren zum justieren von räumlichen hinweisinformationen eines mehrkanaligen audiosignals
EP2353160A1 (en) * 2008-10-03 2011-08-10 Nokia Corporation An apparatus
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
EP2323130A1 (en) * 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
CN102157151B (zh) * 2010-02-11 2012-10-03 华为技术有限公司 一种多声道信号编码方法、解码方法、装置和系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013524267A (ja) * 2010-03-29 2013-06-17 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 空間オーディオプロセッサおよび音響入力信号に基づいて空間パラメータを提供する方法

Also Published As

Publication number Publication date
BR112015030201A2 (pt) 2017-07-25
EP2977984A4 (en) 2016-06-29
KR101730362B1 (ko) 2017-04-26
CN104299615B (zh) 2017-11-17
US20160055856A1 (en) 2016-02-25
US10002615B2 (en) 2018-06-19
KR20150140802A (ko) 2015-12-16
EP2977984A1 (en) 2016-01-27
EP2977984B1 (en) 2018-12-12
JP6106336B2 (ja) 2017-03-29
WO2015007075A1 (zh) 2015-01-22
CN104299615A (zh) 2015-01-21

Similar Documents

Publication Publication Date Title
EP2898506B1 (en) Layered approach to spatial audio coding
EP3039675B1 (en) Parametric speech enhancement
CN110495105B (zh) 多声道信号的编解码方法和编解码器
US11238875B2 (en) Encoding and decoding methods, and encoding and decoding apparatuses for stereo signal
US20240161755A1 (en) Inter-Channel Phase Difference Parameter Extraction Method and Apparatus
JP6487569B2 (ja) チャネル間時間差パラメータを決定するための方法および装置
CN110462733B (zh) 多声道信号的编解码方法和编解码器
JP6106336B2 (ja) チャネル間レベル差処理方法及び装置
RU2769789C2 (ru) Способ и устройство кодирования параметра межканальной разности фаз
US20170365265A1 (en) Method and Apparatus for Determining Inter-Channel Time Difference Parameter
WO2020008112A1 (en) Energy-ratio signalling and synthesis
US20230215444A1 (en) Encoding of multi-channel audo signals comprising downmixing of a primary and two or more scaled non-primary input channels
TW201926318A (zh) 音訊編解碼方法、音頻編解碼裝置及電腦可讀存儲介質
EP3800638A1 (en) Method and apparatus for determining weighting coefficient during stereo signal coding process
US20240196156A1 (en) Binarual rendering
Arbel et al. On HRTF Notch Frequency Prediction using Anthropometric Features and Neural Networks
WO2024097485A1 (en) Low bitrate scene-based audio coding
KR20220076480A (ko) 다중채널 오디오 신호에 적용될 보정의 결정, 관련 코딩 및 디코딩
JP2017143325A (ja) 収音装置、収音方法、プログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170126

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170303

R150 Certificate of patent or registration of utility model

Ref document number: 6106336

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees