JP6351770B2 - オーディオ信号中でビットを割り当てる方法及び装置 - Google Patents

オーディオ信号中でビットを割り当てる方法及び装置 Download PDF

Info

Publication number
JP6351770B2
JP6351770B2 JP2017021030A JP2017021030A JP6351770B2 JP 6351770 B2 JP6351770 B2 JP 6351770B2 JP 2017021030 A JP2017021030 A JP 2017021030A JP 2017021030 A JP2017021030 A JP 2017021030A JP 6351770 B2 JP6351770 B2 JP 6351770B2
Authority
JP
Japan
Prior art keywords
group
subbands
bits
subband
assigned
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017021030A
Other languages
English (en)
Other versions
JP2017107224A (ja
Inventor
峰岩 ▲齊▼
峰岩 ▲齊▼
磊 苗
磊 苗
▲澤▼新 ▲劉▼
▲澤▼新 ▲劉▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2017107224A publication Critical patent/JP2017107224A/ja
Application granted granted Critical
Publication of JP6351770B2 publication Critical patent/JP6351770B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本願は、2012年7月13日に中国特許庁に出願され、「オーディオ信号中でビットを割り当てる方法及び装置」と題し、その全体が参照により本願に組み込まれている中国特許出願第201210243316.4号に対する優先権を主張する。
本発明の実施形態は、オーディオ技術の分野に関し、特に、オーディオ信号中でビットを割り当てる方法及び装置に関する。
現在の通信伝送においてオーディオ品質はますます重要視されている。そのため、スピーチ品質を保証しながら、符号化(コーディング)中及び復号化(デコーディング)中に可能な限り音楽品質を改善することが要求される。音楽信号は、非常に豊富な情報を含むため、従来のスピーチのためのCELP(Code Excited Linear Prediction、符号励振線形予測)コーディングモードは使用できない。一般的に、音楽信号のコーディング品質を向上させるために、変換コーディング法を使用して、周波数ドメインにおける音楽信号を処理する。しかし、限定された数のコーディングビットを効果的に使用することにより、情報を効率的にエンコードする方法が、音声符号化(オーディオコーディング)の現在の主な研究テーマとなっている。
現在のオーディオコーディング技術では、一般的に、時間ドメイン信号を周波数ドメイン信号に変換するために、FFT(Fast Fourier Transform、高速フーリエ変換)又はMDCT(Modified Discrete Cosine Transform、修正離散コサイン変換)が使用され、その後、周波数ドメイン信号がエンコードされる。変換コーディング中に、複数の周波数ドメイン係数が異なる複数のバンドに割り当てられ、各バンドに対して正規化されたエネルギーが計算され、各バンド中の係数のエネルギーは正規化される。その後、ビット割り当てが実行される。そして最後に、各バンドに割り当てられる複数のビットに従って、複数のバンド内係数を量子化する。ここでビット割り当ては非常に重要なステップである。ビット割り当ては、スペクトル係数を量子化するプロセスにおいて、オーディオ信号であり且つスペクトルのサブバンドの特徴にしたがって、スペクトル係数をサブバンドに量子化するのに使用されるビットを割り当てること、すなわち、オーディオ信号に対して利用可能なコーディングリソースをサブバンドに割り当てることを指し、ここで、コーディングリソースは一般的にビットにより表される。
具体的には、現在のビット割り当てプロセスは、以下を含む:スペクトル信号にバンドを割り当てること、例えば、臨界バンドの理論に従って、低周波数から高周波数に徐々に帯域幅を増加すること;スペクトルにバンドを割り当てること、各サブバンドに対する正規化されたエネルギーノルムを計算すること、及びサブバンド正規化ファクターwnormを得るために、正規化されたエネルギーを量子化すること;サブバンド正規化ファクターwnormの値の降順でサブバンドを配列すること;及びビット割り当てを実行すること、例えば、サブバンド正規化ファクターwnormの値に従って、反復的な方法で、ビットの数を各サブバンドに割り当てること。反復的な方法でビットを割り当てることは、以下の複数のステップにさらに分割されてもよい:ステップ1:ビットの数及び各バンドの反復ファクターfacを初期化する。ステップ2:最大のサブバンド正規化ファクターwnormに対応するバンドを探す。ステップ3:バンドに割り当てられたビットの数に帯域幅の値を加算し、そしてサブバンド正規化ファクターwnormの値から反復ファクターfacを減算する。ステップ4:ビット割り当てが完了するまでステップ2及びステップ3を反復する。先行技術では、各割り当ての間のビットの最小のユニットは、帯域幅の値であり、そして量子化の間に必要とされるビットの最小数は、帯域幅の値より少ないことが知られている。結果として、ビットの整数の数のこの割り当ては、低ビットレートのケースでは比較的効率が悪く、そして多くのバンドにビットを割り当てることができない一方で、余分なビットは別のバンドに割り当てられる。サイクリック及び反復法でビットが全てのバンドに割り当てられるため、異なる帯域幅を持つ複数のサブバンドは、同じサイクリック及び反復パラメータを有し、そのため、割り当て結果は非常にランダムであり且つ量子化は比較的離散的であり且つ以前のフレーム及び後続するフレームは非連続的である。
低ビットレートのケースでは、ビット割り当てが性能に非常に影響を与えることが知られている。ビット割り当ての間に、ビットは、通常、各サブバンドの正規化されたエネルギーの値に従って、全てのバンドに割り当てられる。そして不十分なビットレートのケースでは、この割り当ては非常にランダムで且つ比較的離散的であり、そして時間ドメインにおける非連続的な量子化の現象を生み出す。
本発明の実施形態は、オーディオ信号中でビットを割り当てる方法及び装置を提供し、これは、低ビットレート又は中ビットレートのケースにおいて、割り当てがランダム且つ離散的であり、そして量子化が時間ドメインにおいて不連続であるという、既存のビット割り当て方法により引き起こされる問題を解決し得る。
1つの態様によると、以下を含むオーディオ信号中でビットを割り当てる方法が提供される:オーディオ信号の周波数バンドを複数のサブバンドに分割し且つ各サブバンドのサブバンド正規化ファクターを量子化するステップと、複数のサブバンドを複数のグループにグループ化し、複数のグループのうちの1つのグループは、1以上のサブバンドを含むステップと、各グループのグループパラメータを取得するステップであって、グループパラメータは、対応するグループのオーディオ信号の信号特性及びエネルギー属性を表すために使用されるステップと、各グループのグループパラメータに従って、少なくとも1つのグループにコーディングビットを割り当てるステップであって、少なくとも1つのグループに割り当てられたコーディングビットの合計は、オーディオ信号のコーディングビットの数であるステップと、少なくとも1つのグループに割り当てられたコーディングビットを、少なくとも1つのグループの各グループ中の各サブバンドのサブバンド正規化ファクターに従って、少なくとも1つのグループの各グループ中の各サブバンドに割り当てるステップとを含む。
別の態様によると、以下を備える、オーディオ信号中でビットを割り当てる装置が提供される:オーディオ信号の周波数バンドを複数のサブバンドに分割し且つ各サブバンドのサブバンド正規化ファクターを量子化するように構成されているサブバンド量子化ユニットと、複数のサブバンドを複数のグループにグループ化し、複数のグループのうちの1つのグループは、1以上のサブバンドを含み、且つ各グループのグループパラメータを取得するように構成され、グループパラメータは、対応するグループのオーディオ信号の信号特性及びエネルギー属性を表すために使用されるグループ化ユニットと、各グループのグループパラメータに従って、少なくとも1つのグループにコーディングビットを割り当てるように構成されている第1の割り当てユニットであって、少なくとも1つのグループに割り当てられたコーディングビットの合計は、オーディオ信号のコーディングビットの数である、第1の割り当てユニットと、少なくとも1つのグループに割り当てられたビットを、少なくとも1つのグループの各グループ中の各サブバンドのサブバンド正規化ファクターに従って、少なくとも1つのグループの各グループ中の各サブバンドに割り当てるように構成されている第2の割り当てユニットとを備える。
低ビットレート又は中ビットレートのケースでは、本発明の実施形態は、グループ化手段により、以前のフレーム及び後続するフレームの比較的安定した割り当てを確保し、且つ全体的な割り当てにより引き起こされる部分的な不連続の影響を減少させ得る。
本発明の実施形態における技術的な解決策をさらに明確に説明するために、以下では、実施形態又は先行技術を説明するのに必要な添付図面を簡単に紹介する。明らかに、以下の説明中の添付図面は、単に、本発明のいくつかの実施形態を示すものであり、当業者は、創造的な努力をすることなく、これらの添付図面から他の図面をさらに導出できる。
図1は、本発明の実施形態に係る、オーディオ信号中でビットを割り当てる方法のフローチャートである。
図2は、本発明の実施形態に係る、オーディオ信号中でビットを割り当てる装置の概略的な構造図である。
図3は、本発明の別の実施形態に係る、オーディオ信号中でビットを割り当てる装置の概略的な構造図である。
以下では、本発明の実施形態における添付図を参照して、本発明の実施形態における技術的な解決策を明確かつ完全に説明する。明らかに、説明する実施形態は、本発明の実施形態の全てというよりむしろ、その一部である。本発明の実施形態に基づいて、創造的な努力をすることなく当業者により得られる他の全ての実施形態は、本発明の保護範囲内に属さなければならない。
コーディング及びデコーディングによる技術的な解決策は、様々な電子機器に、例えば、モバイルフォン、ワイヤレス装置、パーソナルデータアシスタント(PDA)、ハンドヘルドコンピュータ又はポータブルコンピュータ、GPSレシーバ/ナビゲータ、カメラ、オーディオ/ビデオプレーヤー、カムコーダ、ビデオレコーダならびにモニタリングデバイスに、広く適用される。通常、このタイプの電子デバイスは、オーディオコーダ又はオーディオデコーダを含み、ここで、オーディオコーダ又はオーディオデコーダは、デジタル回路又はチップにより、例えばデジタル信号プロセッサ(DSP)により、直接実現されてもよく、或いはソフトウェアコードでプロセスを実行するためにプロセッサを駆動するソフトウェアコードにより、実現されてもよい。
例として、オーディオコーディングによる技術的な解決策では、オーディオ時間ドメイン信号は、周波数ドメイン信号に最初に変換され、その後、符号化のために、コーディングビットがオーディオ周波数ドメイン信号に割り当てられる。符号化された信号は、通信システムによりデコーダに送信され、デコーダは符号化された信号を復号化して回復する。
本発明では、ビット割り当ては、グループ化の理論及び信号特性に従って実行される。バンドは最初にグループ化され、グループのエネルギーは各グループの特性に従って重み付けされ、ビット割り当ては、重み付けされたエネルギーに従って各グループごとに実行され、ビットは、各グループ内の信号特性に従って各バンドに割り当てられる。ビットは最初にグループ全体に割り当てられるため、不連続な割り当ての現象が回避され、それにより、異なる信号のコーディング品質が改善される。加えて、ビットがグループ内で割り当てられるときに信号特性が考慮され、それにより、限られた数のビットが、知覚に影響する重要なオーディオバンドに割り当てられ得る。
図1は、本発明の実施形態に係る、オーディオ信号中でビットを割り当てる方法のフローチャートである。
101.オーディオ信号の周波数バンドを複数のサブバンドに分割し、そして各サブバンドのサブバンド正規化ファクターを量子化する。
例として、以下の説明では、MDCT変換が使用される。MDCT変換は、周波数ドメイン係数を得るために入力オーディオ信号上で最初に実行される。ここでのMDCT変換は、ウィンドウ加算、時間ドメインエイリアシング及び離散DCT変換のようなプロセスを含んでもよい。
例えば、サインウィンドウが入力時間ドメイン信号x(n)に追加される:
Figure 0006351770
ここで、n=0,...,2L−1であり、Lは信号のフレーム長を表し、(1)
そして得られたウィンドウ加算された信号は以下の通りになる:
Figure 0006351770
その後、時間ドメインエイリアシング演算が実行される:
Figure 0006351770
L/2及びJL/2は、それぞれL/2の次数による対角行列を表し、それぞれ以下の通りである:
Figure 0006351770
時間ドメインエイリアシング信号上で離散DCT変換が実行され、そして最終的に周波数ドメインMDCT係数が得られる:
Figure 0006351770
その後、周波数ドメイン包絡線がMDCT係数から抽出され、且つ量子化される。バンド全体は、異なる周波数ドメイン分解能を持ついくつかのサブバンドに分割され、且つ各サブバンドの正規化ファクターが抽出され、且つサブバンド正規化ファクターは量子化される。
例えば、32kHzでサンプリングされたオーディオ信号にとって、その対応する周波数バンドは16kHzの帯域幅であり、そしてフレーム長が20ms(640サンプリングポイント)である場合に、バンドは、以下の44のサブバンドに分割されてもよい:
8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,
16,16,16,16,16,16,16,16,
24,24,24,24,24,24,24,24,24,24,24,24,
32,32,32,32,32,32,32,32。
複数のサブバンドは、最初に複数のグループにグループ化され、そしてその後、複数のサブバンドはさらに各グループ内でグループ化され、そして各サブバンドの正規化ファクターは以下のように規定されてもよい:
Figure 0006351770
ここで、Lは、サブバンド中の係数の数を表し、sは、サブバンドの開始点を表し、eは、サブバンドの終了点を表し、Pは、サブバンドの合計数を表す。
正規化ファクターが得られた後に、正規化ファクターは対数ドメインで量子化され、量子化されたサブバンド正規化ファクターwnormが得られてもよい。
102.全サブバンドを複数のグループにグループ化し、そして各グループのグループパラメータを取得し、ここで、グループパラメータは対応するグループのオーディオ信号の信号特性及びエネルギー属性を表すのに使用され、そして複数のグループのうちの1つのグループは1以上のサブバンドを含む。
加えて、類似する特徴及びエネルギーを持つサブバンドは、1つのグループにグループ化されてもよい。例えば、同じ帯域幅を持つ複数のサブバンドは、1つのグループにグループ化されてもよい。好ましくは、同じ帯域幅を持つ隣接するサブバンドは、1つのグループにグループ化される。例えば、全サブバンドが4つのグループにグループ化されてもよい。その後、低ビットレートのケースでは、最初の2つのグループのみ又は最初の3つのグループのみが使用され、そして残りのグループに対してビット割り当ては実行されない。
代替的に、サブバンドは、サブバンドの正規化エネルギーノルム間の関係に従ってグループ化されてもよい。すなわち、近似する複数のサブバンド正規化ファクターwnormを持つ複数のサブバンドは1つのグループにグループ化される。例えば、以下の方法を使用して、サブバンドのサブバンド正規化ファクターが近似するか否かを判断してもよい:サブバンドのサブバンド正規化ファクターwnorm[i](i=1,...,P−1、ここで、Pはサブバンドの総数である)と予め定められた閾値Kとを比較する。wnorm[i]が予め定められた閾値Kより大きい場合に、サブバンド数iが記録され、そして最終的に、予め定められた閾値Kより大きいサブバンド正規化ファクターwnorm[i]を持つ複数のサブバンドが1つのグループにグループ化され、そして残りの複数のサブバンドは別のグループにグループ化される。より多くのグループを得るために、異なる要件に従って、予め定められた複数の閾値が設定されてもよい、ということを理解すべきである。
選択的に、近似する複数のサブバンド正規化ファクターを持つ隣接する複数のサブバンドもまた1つのグループにグループ化されてもよい。例えば、以下の方法を使用して、隣接する複数のサブバンドの複数のサブバンド正規化ファクターが近似するか否かを判断してもよい:隣接する複数のサブバンドの複数のサブバンド正規化ファクター間の差であるwnorm_diff[i]が最初に計算され、ここで、wnorm_diff[i]=abs(wnorm[i]−wnorm[i−1])かつi=1,...,P−1である。Pはサブバンドの総数である。wnorm_diff[i]が予め定められた閾値K’より小さい場合に、wnorm_diff[i]は、隣接するサブバンドのサブバンド正規化ファクターが近似していることを示し、これにより1つのグループにグループ化され得る隣接するサブバンド数を決定する。
サブバンドのグループ化が完了すると、各グループのエネルギー属性を表すために、各グループのグループパラメータが取得されてもよい。一般に、グループパラメータは、以下のうちの1以上を含んでもよい:グループ内の複数のサブバンド正規化ファクターの合計group_wnorm、及びグループ内の複数のサブバンド正規化ファクターのピーク対平均比group_sharp。
特に、グループ内の複数のサブバンド正規化ファクターの合計であるgroup_sharpは、グループ内の全てのバンドのサブバンド正規化ファクターの合計であり、すなわち、
Figure 0006351770
である。ここで、Sは、グループi中の開始サブバンドを表し、そしてEは、グループi中の終了サブバンドを表す。
代替的に、グループ内の複数のサブバンド正規化ファクターのピーク対平均比であるgroup_sharpは、グループ内の複数のサブバンド正規化ファクターのピーク値の、グループ内の複数のサブバンド正規化ファクターの平均値に対する比である。
すなわち、
Figure 0006351770
であり、ここで、group_peak[i]は、グループi中のグループ内サブバンド正規化ファクターのピーク値を表し、そしてgroup_avg[i]は、グループi中のグループ内サブバンド正規化ファクターの平均値を表す。
代替的に、グループ内の複数のサブバンド正規化ファクターのピーク値であるgroup_peakは、グループ中の全サブバンドのサブバンド正規化ファクターの最大値であり、すなわち、group_peak[i]=Max(wnorm[S],....,wnorm[E])であり、ここで、wnorm[S]は、グループi中の開始サブバンドのサブバンド正規化ファクターを表し、そしてwnorm[E]は、グループi中の終了サブバンドのサブバンド正規化ファクターを表す。
代替的に、グループ内の複数のサブバンド正規化ファクターの平均値であるgroup_avgは、グループ中の全サブバンドのサブバンド正規化ファクターの平均値であり、すなわち、
Figure 0006351770
であり、ここで、wnorm[i]は、グループiのグループ内サブバンド正規化ファクターの合計を表し、Sは、グループi中の開始サブバンドを表し、そしてEは、グループi中の終了サブバンドを表す。
103.各グループのグループパラメータに従って、少なくとも1つのグループにコーディングビットを割り当て、ここで、少なくとも1つのグループに割り当てられるコーディングビットの合計は、オーディオ信号中のコーディングビットの数である。
先述のグループパラメータは、各グループのエネルギー属性を表すことから、グループパラメータに従って、オーディオ信号のビットを各グループに割り当てることができる。このように、不十分なビットレートのケースでは、グループ化の原則が使用され、且つ各グループのエネルギー属性が考慮され、それにより、オーディオ信号についてのビット割り当ては、さらに集中的になり、そしてフレーム間のビット割り当てはさらに連続的になる。グループパラメータは、先に列挙したものに限定されず、そしてグループのエネルギー属性を表し得る別のパラメータであってもよいことを理解すべきである。1つの実施形態では、不十分なビットレートのケースでは、ビットは、いくつかのグループにのみ割り当てられる。例えば、グループ内の複数のサブバンド正規化ファクターの合計が0であるグループに関して、ビットは何ら割り当てられない。別の例として、ビットの数が非常に少ないときに、何らビットを割り当てられないグループもある。すなわち、先述のグループパラメータが得られることに基づき、コーディングビットは、各グループのグループ内の複数のサブバンド正規化ファクターの合計に従って、少なくとも1つのグループに割り当てられてもよく、ここで、少なくとも1つのグループに割り当てられるコーディングビットの合計は、オーディオ信号のコーディングビットの数である。
さらに、複数のグループパラメータはまた、オーディオ信号のビットの各グループに対する割り当ての結果を最適化するように調整されてもよい。例えば、異なる複数の割り当て要件に従って、異なる複数のグループに関する複数のグループパラメータに異なる複数の重みが割り振られ、それにより、限られた数のビットが適切なグループに割り当てられる。その後、ビットはさらにこのグループ内で割り当てられ、それにより、ビット割り当てはもはや離散的ではなくなり、これは、オーディオ信号の符号化を円滑にする。
以下で、実現方法の例を説明する。例えば、各グループのグループ内の複数のサブバンド正規化ファクターの合計group_wnorm及び各グループのグループ内の複数のサブバンド正規化ファクターのピーク対平均比group_sharpが取得された後で、グループ内の複数のサブバンド正規化ファクターのピーク対平均比group_sharpに従って、グループ内の複数のサブバンド正規化ファクターの合計group_wnormが重み付けされて、グループ内の複数のサブバンド正規化ファクターの重み付けされた合計group_wnorm_wが得られてもよい。
具体的には、第1のグループのグループ内の複数のサブバンド正規化ファクターのピーク対平均比group_sharp[i]は、第2のグループのグループ内の複数のサブバンド正規化ファクターのピーク対平均比group_sharp[i−1]と比較される。第1のグループのグループ内の複数のサブバンド正規化ファクターのピーク対平均比と、第2のグループのグループ内の複数のサブバンド正規化ファクターのピーク対平均比との間の比較が、第1の閾値より大きい場合に、第1のグループのグループ内の複数のサブバンド正規化ファクターの合計は、第1の重み付けファクターに従って調整され、第2のグループのグループ内の複数のサブバンド正規化ファクターの合計は、第2の重み付けファクターに従って調整され、逆もまた同様である。すなわち、第2のグループのグループ内の複数のサブバンド正規化ファクターのピーク対平均比と、第1のグループのグループ内の複数のサブバンド正規化ファクターのピーク対平均比との間の比較が、第2の閾値より大きい場合に、第2のグループのグループ内の複数のサブバンド正規化ファクターの合計は、第1の重み付けファクターに従って調整され、そして第1のグループのグループ内の複数のサブバンド正規化ファクターの合計は、第2の重み付けファクターに従って調整される。
例えば、group_sharp[i]−group_sharp[i−1]>aである場合に、group_wnorm_w[i]=b x group_wnorm[i]であり、又はgroup_sharp[i−1]−group_sharp[i]>cである場合に、group_wnorm[i−1]=b x group_wnorm[iー1]であり、ここで、グループ数i=1,...,P−1であり、Pはサブバンドの総数であり、bは重みであり、aは第1の閾値であり、そしてcは第2の閾値である。a、b及びcは、ビット割り当て要件に従って選択されてもよいことを理解すべきである。
ここでは、簡潔な重み付け方法のみを例示的に説明している。当業者は、異なる重み付けファクターを使用することによりサブバンドの重みを調整するための、別の重み付け方法を容易に使用できるであろう。例えば、より多くの信号ビットを割り当てる必要があるサブバンドの重みは増やされてもよく、そして信号ビットを割り当てる必要のない、又はわずかな信号ビットのみを割り当てる必要があるサブバンドの重みは減らされてもよい。
その後、オーディオ信号のビットは、グループ内サブバンド正規化ファクターの重み付けされた合計に従って、各グループに割り当てられる。例えば、グループに対するビットの数は、グループ内サブバンド正規化ファクターの合計group_wnorm[i]の、全サブバンドのサブバンド正規化ファクターの合計sum_wnormに対する比に従って決定され、オーディオ信号のビットは、グループに対する決定されたビット数に従って、グループに割り当てられる。各グループのビットの総数group_bitsは、以下の式を使用することにより決定される:group_bits[i]=sum_bits x group_wnorm[i]/sum_wnorm。ここで、sum_bitsは、割り当てられる必要のあるオーディオ信号のビットの総数を表し、sum_wnormは、全サブバンドのサブバンド正規化ファクターの合計を表す。
ビットがグループに割り当てられた後に、各グループに割り当てられた複数のコーディングビットは、グループ中の複数のサブバンドにさらに割り当てられてもよい。
104.少なくとも1つのグループに割り当てられた複数のコーディングビットを、少なくとも1つのグループの各グループ中の各サブバンドのサブバンド正規化ファクターに従って、少なくとも1つのグループの各グループ中の各サブバンドに割り当てる。
既存の反復及びサイクリック割り当て方法は、各グループ中のサブバンドにビットを割り当てるのに使用されてもよいことを理解すべきである。しかし、反復及びサイクリック割り当て方法は、各グループ中のビット割り当て結果が非常にランダムであり、且つ以前のフレーム及び後続するフレームが不連続であることを依然として引き起こす。そのため、オーディオ信号のビットであり、且つグループに割り当てられるビットは、異なるオーディオ信号の信号特性、すなわち、異なる信号タイプを参照して、且つグループ中の複数のサブバンド正規化ファクターに従って、グループ中の複数のサブバンドに割り当てられてもよい。
加えて、本発明の本実施形態において、不十分なビットレートのケースでは、限られた数のビットがグループ中の全サブバンドに割り当てられる場合に、ビット割り当て効果が影響を受ける。そのため、グループ中でビットが割り当てられることがあるサブバンドの数band_numが最初に決定されてもよい。その後、オーディオ信号のビットであり、且つグループに割り当てられるビットが、オーディオ信号のタイプ及びグループ中のサブバンド正規化ファクターに従って、グループ中でビットが割り当てられるサブバンドに割り当てられ、ここで、グループ中でビットが割り当てられるサブバンドの数は、サブバンドの数band_numに等しい。
各グループ中でビットが最初に割り当てられるサブバンドの数は、グループに対するビットの数及び第3の閾値に従って決定されてもよく、ここで、第3の閾値は、正規化されたスペクトル係数を量子化するために使用されるビットの最小数を表す。例えば、13ビットがグループに割り当てられ、かつ第3の閾値が7ビットである場合に、グループ中でビットが最初に割り当てられるサブバンドの数は2である。その後、グループ中でビットが割り当てられるサブバンドの数band_numは、グループ中でビットが最初に割り当てられるサブバンドの数及びグループ中のサブバンドの総数に従って決定される。
例えば、グループ中でビットが最初に割り当てられるサブバンドの数が、グループ中のサブバンドの総数とスケールファクターkとの積より大きい場合に、band_numの値は、グループ中のサブバンドの総数であることが決定され、グループ中でビットが最初に割り当てられるサブバンドの数が、グループ中のサブバンドの総数と、スケールファクターkとの積より小さい場合に、band_numの値は、グループ中でビットが最初に割り当てられるサブバンドの数である。ここでのスケールファクターkは、実験的ファクターであり、0.75又は別の数値であってもよい。グループ中でビットが割り当てられるサブバンドの数band_numを、グループ中でビットが割り当てられるサブバンドの数及びグループ中のサブバンドの総数のうちの少ない方のサブバンド数とすることで、プロセスが簡潔にされてもよい。
その後、ビットは、グループ中のオーディオ信号のタイプに従って、且つグループ中のサブバンド正規化ファクターを参照して、band_num個のサブバンドに割り当てられ、ここで、band_numは、グループ中でビットが割り当てられるサブバンドの数である。グループ中のオーディオ信号のタイプは、グループのグループ内の複数のサブバンド正規化ファクターのピーク対平均比group_sharpに従って決定されてもよい。グループ内の複数のサブバンド正規化ファクターのピーク対平均比group_sharpに従って、オーディオ信号が正規(normal)信号であることが決定された場合に、既存の反復及びサイクリック割り当て方法を使用して、グループに対するビット割り当てが実行されてもよい。そしてグループのオーディオ信号が高調波(harmonic)信号であると決定された場合に、既存の反復及びサイクリック割り当て方法を使用して、グループに対するビット割り当てが実行されてもよく、或いは以下の方法a又は方法bを使用してビット割り当てが実行されてもよい。
方法a:
ステップ1:グループ中の全サブバンドの複数のサブバンド正規化ファクターを降順で配列し、そして最初のN個のサブバンドを選択する。ここで、Nはグループ中でビットが割り当てられるサブバンドの数band_numである。
ステップ2:N個のサブバンドのビット数を1に初期化し、そして周期動作の数jを0に初期化する。
ステップ3:N個のサブバンド中の0より大きいサブバンド正規化ファクターを持つサブバンドのサブバンド正規化ファクターの総数band_wnormを決定する。
ステップ4:N個のサブバンド中の0より大きいサブバンド正規化ファクターを持つサブバンドに対して、ビット数を割り当てる。
ステップ5:N個のサブバンドの最後のサブバンドに割り当てられるビットの数が固定の閾値facより小さいか否かを決定し、そしてN個のサブバンドの最後のサブバンドに割り当てられるビットの数が固定の閾値facより小さい場合に、サブバンドに割り当てられるビットの数を0に設定する。
ステップ6:周期動作の数jに1を加える。
ステップ3〜ステップ6は、周期動作の数jがNに等しくなるまで繰り返される。
ステップ7:グループ中の全サブバンドのオリジナルの配列順を回復する、すなわち、各サブバンドのサブバンド正規化ファクターが量子化される前の全サブバンドの配列順を回復する。
方法b:
ステップ1:グループ中の全サブバンドのサブバンド正規化ファクターを降順で配列し、そして最初のN個のサブバンドを選択する。ここで、Nはグループ中でビットが割り当てられるサブバンドの数band_numである。
ステップ2:N個のサブバンドのビットの数を1に初期化し、周期動作の数jを0に初期化し、且つ割り当てられるビットの数bit_sumを0に初期化する。
ステップ3:N個のサブバンド中の0より大きいサブバンド正規化ファクターを持つサブバンドのサブバンド正規化ファクターの総数band_wnormを決定する。
ステップ4:N個のサブバンド中の0より大きいサブバンド正規化ファクターを持つサブバンドに対して、ビット数を割り当てる。
ステップ5:N個のサブバンドに割り当てられるビットの数が固定の閾値facより小さいか否かを決定し、そしてN個のサブバンドに割り当てられるビットの数が固定の閾値facより小さい場合に、N個のサブバンドに割り当てられるビットの数を0に設定する。
ステップ6:全N個のサブバンドに割り当てられるビットの総数temp_sumを計算する。
ステップ7:反復の数jに1を加える。
ステップ8:temp_sumがbit_sumに等しいか否かを決定する。temp_sumがbit_sumに等しい場合に、ステップ10を実行する。グループ中でビットが最初に割り当てられるサブバンドの数が、グループ中のサブバンドの総数と、スケールファクターkとの積より大きい場合には、続けてステップ9を実行する。
ステップ9:bit_sumを更新し、且つtemp_sumの値をbit_sumに割り振る。
ステップ3〜ステップ9は、周期動作の数jがNに等しくなるまで繰り返される。
ステップ10:グループ中の全サブバンドのオリジナルの配列順を回復する。
グループ中でビット割り当てを実行するために、先の方法a又は方法bの他に、別の方法も使用されてもよいことを理解すべきである。加えて、方法a及び方法bはまた、band_numを決定する方法、すなわち、異なるオーディオ信号特性を参照して、グループ中で割り当てを実行することと組み合わされてもよい。例えば、グループ中でビットが最初に割り当てられるサブバンドの数が、グループ中のサブバンドの総数とスケールファクターkとの積より大きい場合に、方法aが使用され、グループ中でビットが最初に割り当てられるサブバンドの数が、グループ中のサブバンドの総数と、スケールファクターkとの積より小さい又は等しい場合に、方法bが使用される。
結論として、グループ中のサブバンドにビットを割り当てるプロセスは、以下の通りである:最も大きなサブバンド正規化ファクターを持つ最初のN個のサブバンドが、グループ中の全サブバンドから選択され、且つ割り当てに対するターゲットサブバンドとして使用され、ここで、Nはグループ中でビットが割り当てられるサブバンドの数band_numであり、その後、ビットの数は、N個のサブバンドのサブバンド正規化ファクターに従って、N個のサブバンドに順番に割り当てられ、そして最後に、グループ中の全サブバンドがオリジナルの配列順に回復される。
異なるオーディオ信号の信号特性に従って、信号が聞こえ得る又は知覚され得るバンドにビットを効果的に割り当てることができる。例えば、強い高調波を持つバンドに対して、ビットは高調波を持つ全バンドに割り当てられる必要があり、そして比較的均等なスペクトルエネルギーを持つ信号に対して、ビットは均等に割り当てられる必要がある。
先のグループ化の方法を参照して、グループはさらにセグメント化されてもよく、すなわち、グループ中のサブバンドは複数のサブグループにさらにグループ化されてもよく、そして各サブグループのサブグループパラメータが取得され、そしてその後、グループに割り当てられたビットは、各サブグループのサブグループパラメータに従って各サブグループに割り当てられる。最後に、オーディオ信号のビットであり、且つ各サブグループに割り当てられたビットは、サブバンド正規化ファクターに従って、各サブグループ中の各サブバンドに割り当てられる。1つの可能性として、各グループ中に1つのバンドのみになるまで、サブバンドは連続的にグループ化される。
本発明の本実施形態におけるグループ化の方法を使用することにより、以前のフレーム及び後続するフレームの比較的安定した割り当てが確保され、異なる重点を持つビット割り当ては、信号特性に従ってグループ内で実行され、それにより、割り当てられるビットは全て、重要なスペクトル情報の量子化に使用され、これにより、オーディオ信号のコーディング品質が改善される。
上述のことから、本発明の本実施形態に従うオーディオ信号中でビットを割り当てる方法は、グループ化手段により、以前のフレーム及び後続するフレームの比較的安定した割り当てを確保し、且つ全体的な割り当てにより引き起こされる部分的な不連続の影響を減少させる、ということを知ることができる。加えて、異なる閾値パラメータが、各グループ中のビット割り当てに対して設定されてもよく、それにより、ビットはさらに適切に割り当てられる。スペクトル信号特性に従って、グループ内で、異なる重点を持つビット割り当てが実行される。例えば、比較的集中したスペクトルを持つ擬似高調波信号に対して、ビットは、高エネルギーを持つサブバンドに主に割り当てられ、さらに多くのビットが高調波間サブバンドに割り当てられる必要はなくなる。そして比較的平坦なスペクトルを持つ信号に対して、サブバンド間の平坦さは、ビット割り当ての間、可能な限り保証される。これは、割り当てられるビットが全て、重要なスペクトル情報を量子化するために使用されることを保証する。
図2を参照して、以下で、本発明の実施形態に係る、オーディオ信号中でビットを割り当てる装置の概略的な構造を説明する。
図2では、オーディオ信号中でビットを割り当てる装置20は、サブバンド量子化ユニット21、グループ化ユニット22、第1の割り当てユニット23及び第2の割り当てユニット24を備える。
サブバンド量子化ユニット21は、オーディオ信号の周波数バンドを複数のサブバンドに分割し、且つ各サブバンドのサブバンド正規化ファクターを量子化するように構成される。
グループ化ユニット22は、複数のサブバンドを複数のグループにグループ化し、各グループのグループパラメータを取得するように構成され、ここで、複数のグループのうちの1つのグループは、1以上のサブバンドを含み、そしてグループパラメータは対応するグループのオーディオ信号の信号特性及びエネルギー属性を表すのに使用される。
第1の割り当てユニット23は、各グループのグループパラメータに従って、少なくとも1つのグループにコーディングビットを割り当てるように構成され、ここで、少なくとも1つのグループに割り当てられるコーディングビットの合計は、オーディオ信号中のコーディングビットの数である。
選択的に、グループ化ユニット22は、同じ帯域幅を持つサブバンドを1つのグループにグループ化するように構成されてもよく、それにより、複数のサブバンドが複数のグループにグループ化される。代替的に、グループ化ユニット22は、近似する複数のサブバンド正規化ファクターを持つ複数のサブバンドを1つのグループにグループ化するように構成されてもよく、それにより、複数のサブバンドが複数のグループにグループ化される。一般に、各グループ中のサブバンドは隣接していてもよい。
選択的に、グループ化ユニット22は、各グループのグループ内の複数のサブバンド正規化ファクターの合計及び各グループのグループ内の複数のサブバンド正規化ファクターのピーク対平均比を取得するように構成され、ここで、グループ内サブバンド正規化ファクターの合計は、グループ中の全サブバンドのサブバンド正規化ファクターの合計であり、そしてグループ内サブバンド正規化ファクターのピーク対平均比は、グループ内サブバンド正規化ファクターの平均値に対するグループ内サブバンド正規化ファクターのピーク値の比であり、ここで、グループ内サブバンド正規化ファクターのピーク値は、グループ中の全サブバンドのサブバンド正規化ファクターの最大値であり、そしてグループ内サブバンド正規化ファクターの平均値は、グループ中の全サブバンドのサブバンド正規化ファクターの平均値である。
さらに、グループ化ユニット22は、各グループのグループ内の複数のサブバンド正規化ファクターの重み付けされた合計を得るために、各グループのグループ内の複数のサブバンド正規化ファクターのピーク対平均比に従って、各グループのグループ内の複数のサブバンド正規化ファクターの合計を重み付けするようにさらに構成される。
選択的に、グループ化ユニット22は、第1のグループのグループ内サブバンド正規化ファクターのピーク対平均比と第2のグループのグループ内サブバンド正規化ファクターのピーク対平均比とを比較するように構成され、そして第1のグループのグループ内サブバンド正規化ファクターのピーク対平均比と、第2のグループのグループ内サブバンド正規化ファクターのピーク対平均比との間の比較が、第1の閾値より大きい場合に、第1のグループのグループ内サブバンド正規化ファクターの合計は、第1の重み付けファクターに従って調整され、第2のグループのグループ内サブバンド正規化ファクターの合計は、第2の重み付けファクターに従って調整される。
選択的に、第1の割り当てユニット23は、各グループのグループ内の複数のサブバンド正規化ファクターの合計に従って、少なくとも1つのグループにコーディングビットを割り当てるように構成され、ここで、少なくとも1つのグループに割り当てられるコーディングビットの合計は、オーディオ信号のコーディングビットの数である。代替的に、第1の割り当てユニット23は、グループ内サブバンド正規化ファクターの重み付けされた合計に従って、少なくとも1つのグループにコーディングビットを割り当てるように構成され、ここで、少なくとも1つのグループに割り当てられるコーディングビットの合計は、オーディオ信号のコーディングビットの数である。代替的に、第1の割り当てユニット23は、グループのグループ内サブバンド正規化ファクターの重み付けされた合計の、グループ中の全サブバンドのサブバンド正規化ファクターの合計に対する比に従って、グループに対するビットの数を決定し、且つグループのビット数に従って、オーディオ信号のコーディングビットをグループに割り当てるように、構成されてもよい。
第2の割り当てユニット24は、少なくとも1つのグループに割り当てられたコーディングビットを、少なくとも1つのグループの各グループ中の各サブバンドのサブバンド正規化ファクターに従って、少なくとも1つのグループの各グループ中の各サブバンドに割り当てるように構成される。
さらに、第2の割り当てモジュール24は、決定モジュール241及び割り当てモジュール242を含んでもよい。決定モジュール241は、グループ中でビットが割り当てられるサブバンドの数band_numを決定するように構成され、割り当てモジュール242は、グループ中のサブバンド正規化ファクターに従って、オーディオ信号のビットであり、且つグループ中でビットが割り当てられるサブバンドに割り当てられるビット、を割り当てるように構成され、ここで、グループ中でビットが割り当てられるサブバンドの数は、グループ中でビットが割り当てられるサブバンドの数band_numに等しい。
選択的に、決定モジュール241は、グループに対するビットの数及び第3の閾値に従って、グループ中でビットが最初に割り当てられるサブバンドの数を決定し、ここで、第3の閾値は、正規化されたスペクトル係数を量子化するために使用されるビットの最小数を表し、且つグループ中でビットが最初に割り当てられるサブバンドの数とグループ中のサブバンドの総数との間のより小さい値が、グループ中でビットが割り当てられるサブバンドの数band_numであることを決定するように構成されてもよい。
代替的に、決定モジュール241は、グループに対するビットの数及び第3の閾値に従って、グループ中でビットが最初に割り当てられるサブバンドの数を決定し、ここで、第3の閾値は、正規化されたスペクトル係数を量子化するために使用されるビットの最小数を表し、スケールファクターkは、グループ中のサブバンドの総数を調整するために使用され;グループ中でビットが割り当てられるサブバンドの数を、グループ中のサブバンドの総数とスケールファクターkとの積と比較し;グループ中でビットが割り当てられるサブバンドの数が、グループ中のサブバンドの総数とスケールファクターkとの積より小さい場合に、グループ中でビットが割り当てられるサブバンドの数が、最初にビットが割り当てられるサブバンドの数であることを決定し;グループ中でビットが最初に割り当てられるサブバンドの数が、グループ中のサブバンドの総数とスケールファクターkとの積より大きい場合に、グループ中でビットが割り当てられるサブバンドの数が、グループ中のサブバンドの総数であることを決定するように構成されてもよい。
選択的に、割り当てモジュール242は、グループ中の全サブバンドから、割り当てに対するターゲットサブバンドとして最も大きなサブバンド正規化ファクターを持つ最初のN個のサブバンドを選択し、ここで、Nはグループ中でビットが割り当てられるサブバンドの数であり;N個のサブバンドのサブバンド正規化ファクターに従って、N個のサブバンドに順番にビットの数を割り当て;且つグループ中の全サブバンドのオリジナルの配列順を回復するように構成されてもよい。
例えば、割り当てモジュール242は、具体的には、以下のステップを実行する:
ステップ1:グループ中の全サブバンドのサブバンド正規化ファクターを降順で配列し、そして最初のN個のサブバンドを選択する。ここで、Nはグループ中でビットが割り当てられるサブバンドの数band_numである。
ステップ2:N個のサブバンドのビットの数を1に初期化し、周期動作の数jを0に初期化する。
ステップ3:N個のサブバンド中の0より大きいサブバンド正規化ファクターを持つサブバンドのサブバンド正規化ファクターの総数band_wnormを決定する。
ステップ4:N個のサブバンド中の0より大きいサブバンド正規化ファクターを持つサブバンドにビットの数を割り当てる。
ステップ5:N個のサブバンドの最後のサブバンドに割り当てられるビットの数が固定の閾値facより小さいか否かを決定し、N個のサブバンドの最後のサブバンドに割り当てられるビットの数が固定の閾値facより小さい場合に、サブバンドに割り当てられるビットの数を0に設定する。
ステップ6:周期動作の数jに1を加える。
ステップ3〜ステップ6は、周期動作の数jがNに等しくなるまで繰り返される。
ステップ7:グループ中の全サブバンドのオリジナルの配列順を回復する。
選択的に、割り当てモジュール242は、以下の具体的な複数のステップを実行するように構成されてもよい:
ステップ1:グループ中の全サブバンドのサブバンド正規化ファクターを降順で配列し、そして最初のN個のサブバンドを選択する。ここで、Nはグループ中でビットが割り当てられるサブバンドの数band_numである。
ステップ2:N個のサブバンドのビットの数を1に初期化し、周期動作の数jを0に初期化し、そして割り当てられるビットの数bit_sumを0に初期化する。
ステップ3:N個のサブバンド中の0より大きいサブバンド正規化ファクターを持つ複数のサブバンドの複数のサブバンド正規化ファクターの総数band_wnormを決定する。
ステップ4:N個のサブバンド中の0より大きいサブバンド正規化ファクターを持つサブバンドにビット数を割り当てる。
ステップ5:N個のサブバンドに割り当てられるビットの数が固定の閾値facより小さいか否かを決定し、N個のサブバンドに割り当てられるビットの数が固定の閾値facより小さい場合に、N個のサブバンドに割り当てられるビットの数を0に設定する。
ステップ6:全N個のサブバンドに割り当てられるビットの総数temp_sumを計算する。
ステップ7:周期動作の数jに1を加える。
ステップ8:temp_sumがbit_sumに等しいか否かを決定する。temp_sumがbit_sumに等しい場合に、ステップ10を実行する。グループ中でビットが最初に割り当てられるサブバンドの数が、グループ中のサブバンドの総数と、スケールファクターkとの積より大きい場合に、続けてステップ9を実行する。
ステップ9:bit_sumを更新し、temp_sumの値をbit_sumに割り振る。
ステップ3〜ステップ9は、周期動作の数jがNに等しくなるまで繰り返される。
ステップ10:グループ中の全サブバンドのオリジナルの配列順を回復する。
加えて、図2に示す本発明の本実施形態に従ってオーディオ信号中でビットを割り当てる装置において、第1の割り当てユニット23は、グループ中のサブバンドを複数のサブグループにさらにグループ化し、且つ各サブグループのサブグループパラメータを取得し;そしてその後、第1の割り当てユニット23は、各サブグループのサブグループパラメータに従って、グループに割り当てられたビットを各サブグループに割り当てる。その後、第2の割り当てユニット24は、オーディオ信号のビットであり、且つ各サブグループに割り当てられたビットを、サブバンド正規化ファクターに従って、各サブグループ中の各サブバンドに割り当てるように構成される。
上記のことから、本発明の本実施形態に従ってオーディオ信号中でビットを割り当てる装置が、グループ化手段により、以前のフレーム及び後続するフレームの比較的安定した割り当てを保証し、全体的な割り当てにより引き起こされる部分的な不連続の影響を減少させることを知ることができる。加えて、異なる閾値パラメータが、各グループ中のビット割り当てに対して設定されてもよく、それにより、ビットはさらに適切に割り当てられる。スペクトル信号特性に従って、グループ内で、異なる重点を持つビット割り当てが実行される。例えば、比較的集中したスペクトルを持つ擬似高調波信号に対して、ビットは、高エネルギーを持つサブバンドに主に割り当てられ、さらに多くのビットが高調波間サブバンドに割り当てられる必要はなくなる。そして比較的平坦なスペクトルを持つ信号に対して、サブバンド間の平坦さは、ビット割り当ての間、可能な限り保証される。これは、割り当てられるビットが全て、重要なスペクトル情報を量子化するために使用されることを保証する。
当業者は、本明細書中で開示する実施形態で説明した例と組み合わせて、ユニット及びアルゴリズムステップが、電子ハードウェアにより、又はコンピュータソフトウェア及び電子ハードウェアの組み合わせにより、実施されてもよいことに気付くかもしれない。ハードウェア又はソフトウェアにより機能が実施されるか否かは、技術的な解決策の特定の適用及び設計の制約条件に依存する。当業者は、各特定の適用に対して説明した機能を実施するために異なる方法を使用してもよいが、当該実施が本発明の範囲を超えると見なすべきではない。
便宜上、及び簡単な説明のために、上述のシステム、装置及びユニットの詳細な作動プロセスに関して、上述の方法の実施形態における対応するプロセスが参照されてもよく、そして詳細はここで再度説明されないことが当業者により明確に理解されてもよい。
本適用で提供される複数の実施形態では、開示したシステム、装置及び方法が他の方法で実現されてもよいことを理解すべきである。例えば、説明した装置の実施形態は単に例である。例えば、ユニットの分割は、単に機能の分割であり、実際の実装においては他の分割であってもよい。例えば、複数のユニット又はコンポーネントは、組み合わされてもよく、又は別のシステムに一体化されてもよく、或いはいくつかの特徴は無視されてもよく、又は実行されなくてもよい。加えて、表示した又は議論した相互結合或いは離散結合又は通信接続は、いくつかのインターフェースを通して実現されてもよい。装置又はユニット間の間接的な結合又は通信接続は、電子的、機械的又は他の形態で実現されてもよい。
別個のパーツとして説明したユニットは、物理的に分離されていてもよく、又は分離されていなくてもよく、ユニットとして表示されるパーツは、物理的なユニットであってもよく、又はそうでなくてもよく、1つのポジションに配置されてもよく、又は複数のネットワークユニットに分散されてもよい。ユニットの一部又は全ては、本発明の解決策の目的を達成するために実際の必要性に従って選択されてもよい。
加えて、本発明の実施形態における機能ユニットは、1つの処理ユニットに一体化されてもよく、又はユニットのそれぞれが物理的に単独で存在してもよく、又は2以上のユニットが1つのユニットに一体化される。
ソフトウェア機能ユニットの形態で機能が実現され、個別の製品として販売又は使用される場合に、機能はコンピュータ読取可能記憶媒体に記憶されてもよい。このような理解に基づいて、本質的に、本発明の技術的な解決策は、又は先行技術に寄与する部分は、又は技術的な解決策の一部は、ソフトウェア製品の形態で実現されてもよい。ソフトウェア製品は記憶媒体に記憶され、コンピュータデバイス(パーソナルコンピュータ、サーバ又はネットワークデバイスであってもよい)に、本発明の実施形態で説明した方法のステップの全て又は一部を実行するように命令するための複数の命令を含む。先述の記憶媒体は、以下を含む:USBフラッシュドライブ、リムーバブルハードディスク、リードオンリーメモリ(ROM、Read−Only Memory)、ランダムアクセスメモリ(RAM、Random Access Memory)、磁気ディスク又は光ディスクのような、プログラムコードを記憶できる任意の媒体。
図3は、本発明の実施形態に係る、オーディオ信号中でビットを割り当てる装置30の別の実施形態の概略的なブロック図である。装置30は、プロセッサ31、メモリ32、入力デバイス33、出力デバイス34、及びこれらに類するものを含み、これらは、バスの手段により互いに通信する。プロセッサ31は、メモリ32中に記憶されたプログラムを呼び出し、オーディオ信号中でビットを割り当てる方法の先述の実施形態の全ステップを実行できる。
プロセッサ31は、メモリ32中に記憶された本発明の実施形態のプログラムを実行し、バスの手段により、別の装置との双方向通信を実現するように構成されている。
メモリ32は、RAM及びROM、或いは任意の固定記憶媒体又は移動可能な記憶媒体を含んでもよく、本発明の実施形態を実行し得るプログラム又は本発明の実施形態において処理されることがあるデータを記憶するように構成されている。
メモリ32及びプロセッサ31は、本発明の実施形態が適用される物理モジュールに一体化されてもよく、ここで、本発明の実施形態を実現するプログラムは、物理モジュールに記憶され、物理モジュール上で実行される。
入力デバイス33は、キーボード及びマウスのような、任意の適切なデバイスを含んでもよく、ユーザからの入力又は別のデバイスからの入力を受信し、そして受信した入力をプロセッサ31に送るように構成されている。
出力デバイス34は、オーディオ信号に関するビットの割り当ての結果を出力するように構成されており、これは、ディスプレイ、プリンタ又はこれらに類するものであってもよい。
先述の説明は、単に、本発明の特定の実現方法であり、本発明の保護範囲を制限するように意図されていない。本発明に開示した技術的な範囲内にある、当業者により容易に考案されるいかなる変更又は置換も、本発明の保護範囲内に属さなければならない。従って、本発明の保護範囲は、複数の特許請求項の保護範囲に従わなければならない。 以下の付記をする。
(付記1) オーディオ信号中でビットを割り当てる方法であって、
オーディオ信号の周波数バンドを複数のサブバンドに分割し、且つ各サブバンドのサブバンド正規化ファクターを量子化するステップと、
前記複数のサブバンドを複数のグループにグループ化し、前記複数のグループのうちの1つのグループは、1以上のサブバンドを含み、且つ各グループのグループパラメータを取得するステップであって、前記グループパラメータは、前記対応するグループのオーディオ信号の信号特性及びエネルギー属性を表すために使用される、ステップと、
前記各グループのグループパラメータに従って、少なくとも1つのグループにコーディングビットを割り当てるステップであって、前記少なくとも1つのグループに割り当てられるコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である、ステップと、
前記少なくとも1つのグループに割り当てられたコーディングビットを、前記少なくとも1つのグループの各グループ中の各サブバンドのサブバンド正規化ファクターに従って、前記少なくとも1つのグループの各グループ中の各サブバンドに割り当てるステップと
を含む、方法。
(付記2) 前記各グループのグループパラメータを取得するステップは、
各グループのグループ内サブバンド正規化ファクターの合計及び各グループのグループ内サブバンド正規化ファクターのピーク対平均比を取得するステップを含み、
前記グループ内サブバンド正規化ファクターの合計は、前記グループ中の全サブバンドのサブバンド正規化ファクターの合計であり、且つ前記グループ内サブバンド正規化ファクターのピーク対平均比は、前記グループ内サブバンド正規化ファクターの平均値に対する前記グループ内サブバンド正規化ファクターのピーク値の比であり、前記グループ内サブバンド正規化ファクターのピーク値は、前記グループ中の全サブバンドのサブバンド正規化ファクターの最大値であり、且つ前記グループ内サブバンド正規化ファクターの平均値は、前記グループ中の全サブバンドのサブバンド正規化ファクターの平均値であり、且つ
前記少なくとも1つのグループに割り当てられたコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である、前記各グループのグループパラメータに従って、少なくとも1つのグループにコーディングビットを割り当てるステップは、
前記各グループのグループ内サブバンド正規化ファクターの合計に従って、前記少なくとも1つのグループにコーディングビットを割り当てるステップを含み、
前記少なくとも1つのグループに割り当てられたコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である、付記1に記載の方法。
(付記3) 前記各グループのグループパラメータを取得するステップは、
各グループのグループ内サブバンド正規化ファクターの合計及び各グループのグループ内サブバンド正規化ファクターのピーク対平均比を取得するステップであって、前記グループ内サブバンド正規化ファクターの合計は、前記グループ中の全サブバンドのサブバンド正規化ファクターの合計であり、且つ前記グループ内サブバンド正規化ファクターのピーク対平均比は、前記グループ内サブバンド正規化ファクターの平均値に対する前記グループ内サブバンド正規化ファクターのピーク値の比であり、前記グループ内サブバンド正規化ファクターのピーク値は、前記グループ中の全サブバンドのサブバンド正規化ファクターの最大値であり、且つ前記グループ内サブバンド正規化ファクターの平均値は、前記グループ中の全サブバンドのサブバンド正規化ファクターの平均値である、ステップと、
各グループのグループ内サブバンド正規化ファクターの重み付けされた合計を得るために、前記各グループのグループ内サブバンド正規化ファクターのピーク対平均比に従って、前記各グループのグループ内サブバンド正規化ファクターの合計を重み付けするステップと
を含み、
前記少なくとも1つのグループに割り当てられたコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である、前記各グループのグループパラメータに従って、少なくとも1つのグループにコーディングビットを割り当てるステップは、
前記各グループのグループ内サブバンド正規化ファクターの重み付けされた合計に従って、前記少なくとも1つのグループにコーディングビットを割り当てるステップを含み、
前記少なくとも1つのグループに割り当てられたコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である、付記1に記載の方法。
(付記4) 前記各グループのグループ内サブバンド正規化ファクターのピーク対平均比に従って、前記各グループのグループ内サブバンド正規化ファクターの合計を重み付けするステップは、
第1のグループのグループ内サブバンド正規化ファクターのピーク対平均比と第2のグループのグループ内サブバンド正規化ファクターのピーク対平均比とを比較するステップと、
前記第1のグループのグループ内サブバンド正規化ファクターのピーク対平均比と、前記第2のグループのグループ内サブバンド正規化ファクターのピーク対平均比との間の比較が、第1の閾値より大きい場合に、第1の重み付けファクターに従って前記第1のグループのグループ内サブバンド正規化ファクターの合計を調整するステップと、第2の重み付けファクターに従って第2のグループのグループ内サブバンド正規化ファクターの合計を調整するステップと
を含む、付記3に記載の方法。
(付記5) 前記少なくとも1つのグループに割り当てられたコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である、前記各グループのグループ内サブバンド正規化ファクターの重み付けされた合計に従って、少なくとも1つのグループにコーディングビットを割り当てるステップは、
前記グループ中の全サブバンドのサブバンド正規化ファクターの合計に対する、前記各グループのグループ内サブバンド正規化ファクターの重み付けされた合計の比に従って、前記グループに対するビットの数を決定するステップと、前記グループに対するビットの数に従って、前記グループに前記オーディオ信号のビットを割り当てるステップとを含む、付記3又は4のいずれか一項に記載の方法。
(付記6) 前記少なくとも1つのグループの各グループ中の各サブバンドのサブバンド正規化ファクターに従って、前記少なくとも1つのグループの各グループ中の各サブバンドに前記少なくとも1つのグループに割り当てられたコーディングビットを割り当てるステップは、
前記グループ中でビットが割り当てられるサブバンドの数を決定するステップと、
前記グループ中のサブバンド正規化ファクターに従って、前記オーディオ信号のコーディングビットであり、且つ前記グループに割り当てられたコーディングビットを、前記グループ中でビットが割り当てられるサブバンドに割り当てるステップと
を含み、
前記グループ中でビットが割り当てられるサブバンドの数は、前記グループ中でビットが割り当てられるサブバンドの数に等しい、付記1から5のいずれか一項に記載の方法。
(付記7) 前記グループ中でビットが割り当てられるサブバンドの数を決定するステップは、
前記グループに対するビットの数及び第3の閾値に従って、前記グループ中でビットが最初に割り当てられるサブバンドの数を決定するステップであって、前記第3の閾値は、正規化されたスペクトル係数を量子化するために使用されるビットの最小数を表す、ステップと、
前記グループ中でビットが最初に割り当てられるサブバンドの数と前記グループ中のサブバンドの総数とに従って、前記グループ中でビットが割り当てられるサブバンドの数を決定するステップと
を含む、付記6に記載の方法。
(付記8) 前記グループ中でビットが最初に割り当てられるサブバンドの数と前記グループ中のサブバンドの総数とに従って、前記グループ中でビットが割り当てられるサブバンドの数を決定するステップは、
前記グループ中でビットが最初に割り当てられるサブバンドの数と前記グループ中のサブバンドの総数との間のより小さい値が、前記グループ中でビットが割り当てられるサブバンドの数であることを決定するステップを含む、付記7に記載の方法。
(付記9) 前記グループ中でビットが最初に割り当てられるサブバンドの数と前記グループ中のサブバンドの総数とに従って、前記グループ中でビットが割り当てられるサブバンドの数を決定するステップは、
前記グループ中でビットが最初に割り当てられるサブバンドの数を、前記グループ中のサブバンドの総数とスケールファクターkとの積と比較するステップであって、前記スケールファクターkは、前記グループ中のサブバンドの総数を調整するために使用される、ステップと、
前記グループ中でビットが最初に割り当てられるサブバンドの数が、前記グループ中のサブバンドの総数と前記スケールファクターkとの積より小さい場合に、前記グループ中でビットが割り当てられるサブバンドの数は、グループ中でビットが最初に割り当てられるサブバンドの数であることを決定し、前記グループ中でビットが最初に割り当てられるサブバンドの数が、前記グループ中のサブバンドの総数と前記スケールファクターkとの積より大きい場合に、前記グループ中でビットが割り当てられるサブバンドの数は、前記グループ中のサブバンドの総数であることを決定するステップと
を含む、付記7に記載の方法。
(付記10) 前記グループ中のサブバンド正規化ファクターに従って、前記オーディオ信号であり、及び前記グループに割り当てられたコーディングビットを、前記グループ中でビットが割り当てられるサブバンドに割り当てるステップは、
最も大きなサブバンド正規化ファクターを持つ最初のN個のサブバンドを、割り当てに対するターゲットサブバンドとして、前記グループ中の全サブバンドから選択するステップであって、前記Nはグループ中でビットが割り当てられるサブバンドの数である、ステップと、
前記N個のサブバンドのサブバンド正規化ファクターに従って、前記N個のサブバンドにビットの数を順番に割り当てるステップと
を含む、付記6から9のいずれか一項に記載の方法。
(付記11) 前記少なくとも1つのグループに割り当てられるコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である、前記各グループのグループパラメータに従って、少なくとも1つのグループにコーディングを割り当てるステップは、
前記グループ中のサブバンドを複数のサブグループに分割し、且つ各サブグループのサブグループパラメータを取得するステップと、
前記各サブグループのサブグループパラメータに従って、前記グループに割り当てられたビットを各サブグループに割り当てるステップと
を含み、
前記少なくとも1つのグループに割り当てられたコーディングビットを、前記少なくとも1つのグループの各グループ中の各サブバンドのサブバンド正規化ファクターに従って、前記少なくとも1つのグループの各グループ中の各サブバンドに割り当てるステップは、
前記サブバンド正規化ファクターに従って、前記オーディオ信号であり、且つ前記各サブグループに割り当てられたビットを、前記各サブグループ中の各サブバンドに割り当てるステップを含む、付記1に記載の方法。
(付記12) 前記複数のサブバンドを複数のグループにグループ化するステップは、
同じ帯域幅を持つサブバンドを1つのグループにグループ化し、それにより、前記複数のサブバンドを複数のグループにグループ化するステップ、又は
近似サブバンド正規化ファクターを持つサブバンドを1つのグループにグループ化し、それにより、前記複数のサブバンドを複数のグループにグループ化するステップ
を含む、付記1から11のいずれか一項に記載の方法。
(付記13) 前記複数のグループの各グループ中のサブバンドは隣接している、付記12に記載の方法。
(付記14) オーディオ信号中でビットを割り当てる装置であって、
オーディオ信号の周波数バンドを複数のサブバンドに分割し、各サブバンドのサブバンド正規化ファクターを量子化するように構成されているサブバンド量子化ユニットと、
前記複数のサブバンドを複数のグループにグループ化し、各グループのグループパラメータを取得するように構成されているグループ化ユニットであって、前記複数のグループのうちの1つのグループは、1以上のサブバンドを含み、前記グループパラメータは、前記対応するグループのオーディオ信号の信号特性及びエネルギー属性を表すために使用される、グループ化ユニットと、
前記各グループのグループパラメータに従って、少なくとも1つのグループにコーディングビットを割り当てるように構成されている第1の割り当てユニットであって、前記少なくとも1つのグループに割り当てられたコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である、第1の割り当てユニットと、
前記少なくとも1つのグループに割り当てられたコーディングビットを、前記少なくとも1つのグループの各グループ中の各サブバンドのサブバンド正規化ファクターに従って、前記少なくとも1つのグループの各グループ中の各サブバンドに割り当てるように構成されている第2の割り当てユニットと
を備える、装置。
(付記15) 前記グループ化ユニットは、
各グループのグループ内サブバンド正規化ファクターの合計及び各グループのグループ内サブバンド正規化ファクターのピーク対平均比を取得するように構成され、
前記グループ内サブバンド正規化ファクターの合計は、前記グループ中の全サブバンドのサブバンド正規化ファクターの合計であり、前記グループ内サブバンド正規化ファクターのピーク対平均比は、前記グループ内サブバンド正規化ファクターの平均値に対する前記グループ内サブバンド正規化ファクターのピーク値の比であり、前記グループ内サブバンド正規化ファクターのピーク値は、前記グループ中の全サブバンドのサブバンド正規化ファクターの最大値であり、前記グループ内サブバンド正規化ファクターの平均値は、前記グループ中の全サブバンドのサブバンド正規化ファクターの平均値であり、
前記第1の割り当てユニットは、
前記各グループのグループ内サブバンド正規化ファクターの合計に従って、前記少なくとも1つのグループにコーディングビットを割り当てるように構成され、
前記少なくとも1つのグループに割り当てられたコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である、付記14に記載の装置。
(付記16) 前記グループ化ユニットは、
各グループのグループ内サブバンド正規化ファクターの合計及び各グループのグループ内サブバンド正規化ファクターのピーク対平均比を取得するように構成され、前記グループ内サブバンド正規化ファクターの合計は、前記グループ中の全サブバンドのサブバンド正規化ファクターの合計であり、前記グループ内サブバンド正規化ファクターのピーク対平均比は、前記グループ内サブバンド正規化ファクターの平均値に対する前記グループ内サブバンド正規化ファクターのピーク値の比であり、前記グループ内サブバンド正規化ファクターのピーク値は、前記グループ中の全サブバンドのサブバンド正規化ファクターの最大値であり、前記グループ内サブバンド正規化ファクターの平均値は、前記グループ中の全サブバンドのサブバンド正規化ファクターの平均値であり、
各グループのグループ内サブバンド正規化ファクターの重み付けされた合計を得るために、前記各グループのグループ内サブバンド正規化ファクターのピーク対平均比に従って、前記各グループのグループ内サブバンド正規化ファクターの合計を重み付けするように構成され、
前記第1の割り当てユニットは、
前記各グループのグループ内サブバンド正規化ファクターの重み付けされた合計に従って、前記少なくとも1つのグループにコーディングビットを割り当てるように構成され、
前記少なくとも1つのグループに割り当てられたコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である付記14に記載の装置。
(付記17) 前記グループ化ユニットは、
第1のグループのグループ内サブバンド正規化ファクターのピーク対平均比と第2のグループのグループ内サブバンド正規化ファクターのピーク対平均比とを比較するように特に構成されるとともに、
前記第1のグループのグループ内サブバンド正規化ファクターのピーク対平均比と、前記第2のグループのグループ内サブバンド正規化ファクターのピーク対平均比との間の比較が、第1の閾値より大きい場合に、第1の重み付けファクターに従って、前記第1のグループのグループ内サブバンド正規化ファクターの合計を調整し、第2の重み付けファクターに従って、前記第2のグループのグループ内サブバンド正規化ファクターの合計を調整するように特に構成されている付記16に記載の装置。
(付記18) 前記第1の割り当てユニットは、
前記各グループのグループ内サブバンド正規化ファクターの重み付けされた合計の、前記グループ中の全サブバンドのサブバンド正規化ファクターの合計に対する比に従って、前記各グループに対するビットの数を決定するように特に構成されるとともに、前記グループのビット数に従って、オーディオ信号のビットをグループに割り当てるように、特に構成されている付記17に記載の装置。
(付記19) 前記第2の割り当てユニットは、
前記グループ中でビットが割り当てられるサブバンドの数を決定するように構成されている決定モジュールと、
前記グループ中のサブバンド正規化ファクターに従って、前記オーディオ信号であり、及びグループ中でビットが割り当てられるサブバンドに割り当てられるコーディングビットを割り当てるように構成されている割り当てモジュールと
を含み、
前記グループ中でビットが割り当てられるサブバンドの数は、前記グループ中でビットが割り当てられるサブバンドの数に等しい付記14から18のいずれか一項に記載の装置。
(付記20) 前記決定モジュールは、
前記グループに対するビットの数及び第3の閾値に従って、グループ中でビットが最初に割り当てられるサブバンドの数を決定するように特に構成され、前記第3の閾値は、正規化されたスペクトル係数を量子化するために使用されるビットの最小数を表し、
グループ中でビットが最初に割り当てられるサブバンドの数とグループ中のサブバンドの総数との間のより小さい値が、グループ中でビットが割り当てられるサブバンドの数であることを決定するように特に構成される、
付記19に記載の装置。
(付記21) 前記決定モジュールは、
前記グループに対するビットの数及び第3の閾値に従って、グループ中でビットが最初に割り当てられるサブバンドの数を決定するように構成され、前記第3の閾値は、正規化されたスペクトル係数を量子化するために使用されるビットの最小数を表し、
前記グループ中でビットが割り当てられるサブバンドの数を、前記グループ中のサブバンドの総数とスケールファクターkとの積と比較するように特に構成され、前記スケールファクターkは、グループ中のサブバンドの総数を調整するために使用され、
前記グループ中でビットが最初に割り当てられるサブバンドの数が、前記グループ中のサブバンドの総数とスケールファクターkとの積より小さい場合に、前記グループ中でビットが割り当てられるサブバンドの数が、前記ビットが最初に割り当てられるサブバンドの数であることを決定し、前記グループ中でビットが最初に割り当てられるサブバンドの数が、グループ中のサブバンドの総数とスケールファクターkとの積より大きい場合に、前記グループ中でビットが割り当てられるサブバンドの数が、グループ中のサブバンドの総数であることを決定するように特に構成される、
付記19に記載の装置。
(付記22) 前記割り当てモジュールは、グループ中の全サブバンドから、割り当てに対するターゲットサブバンドとして最も大きなサブバンド正規化ファクターを持つ最初のN個のサブバンドを選択するように特に構成され、Nはグループ中でビットが割り当てられるサブバンドの数であり、
N個のサブバンドのサブバンド正規化ファクターに従って、N個のサブバンドに順番にビットの数を割り当てるように特に構成される、
付記19から21のいずれか一項に記載の装置。
(付記23) 前記第1の割り当てユニットは、
前記グループ中のサブバンドを複数のサブグループにグループ化するように特に構成され、
各サブグループのサブグループパラメータを取得するように特に構成されるとともに、
前記各サブグループのサブグループパラメータに従って、前記グループに割り当てられたビットを各サブグループに割り当てるように特に構成され、
前記第2の割り当てユニットは、
前記サブバンド正規化ファクターに従って、前記オーディオ信号であり、及び前記各サブグループに割り当てられたビットを、前記各サブグループ中の各サブバンドに割り当てるように特に構成されている、付記14に記載の装置。
(付記24) 前記グループ化ユニットは、
同じ帯域幅を持つサブバンドを1つのグループにグループ化し、それにより、前記複数のサブバンドを複数のグループにグループ化するように特に構成され、又は
近似サブバンド正規化ファクターを持つサブバンドを1つのグループにグループ化し、それにより、前記複数のサブバンドを複数のグループにグループ化するように特に構成されている、付記14から23のいずれか一項に記載の方法。
(付記25) 前記複数のグループの各グループ中のサブバンドは隣接している、付記24に記載の装置。

Claims (10)

  1. オーディオ信号中でビットを割り当てる方法であって、
    オーディオ信号の周波数バンドを複数のサブバンドに分割するステップと、
    前記複数のサブバンドの各サブバンドのサブバンド正規化ファクターを量子化するステップと、
    前記複数のサブバンドを複数のグループにグループ化するステップであって、前記複数のグループのうちの1つのグループは、1以上のサブバンドを含む、ステップと、
    前記複数のグループの一グループのグループパラメータを取得するステップであって、前記グループパラメータは、前記一グループのサブバンド正規化ファクターの平均値である、ステップと、
    前記一グループのグループパラメータに従って、前記複数のグループの少なくとも1つのグループにコーディングビットを割り当てるステップであって、前記少なくとも1つのグループの各グループに割り当てられるコーディングビットの数の合計は、前記オーディオ信号のコーディングビットの数であり、前記コーディングビットの少なくとも1つは前記一グループに割り当てられる、ステップと、
    前記コーディングビットの少なくとも1つを、前記一グループ中の各サブバンドのサブバンド正規化ファクターに従って、前記一グループ中の少なくとも1つのサブバンドに割り当てるステップと
    を含む、方法。
  2. サブバンド正規化ファクターの平均値は、前記一グループ中のすべてのサブバンドのサブバンド正規化ファクターの平均値である、請求項1に記載の方法。
  3. コーディングビットを、前記一グループのグループパラメータによって、前記複数のグループの少なくとも1つのグループに割り当てるステップは、
    前記一グループ中のサブバンドを複数のサブグループに分割し、且つ各サブグループのサブグループパラメータを取得するステップと、
    前記各サブグループのサブグループパラメータに従って、前記一グループに割り当てられたビットを各サブグループに割り当てるステップと
    を含み、
    前記コーディングビットの少なくとも1つを、前記一グループ中の各サブバンドのサブバンド正規化ファクターにより、前記一グループ中の少なくとも1つのサブバンドに割り当てるステップは、
    前記サブバンド正規化ファクターに従って、前記オーディオ信号であり、且つ前記各サブグループに割り当てられたビットを、前記各サブグループ中の各サブバンドに割り当てるステップを含む、請求項1に記載の方法。
  4. 前記複数のサブバンドを複数のグループにグループ化するステップは、
    同じ帯域幅を持つサブバンドを1つのグループにグループ化し、それにより、前記複数のサブバンドを複数のグループにグループ化するステップ、又は
    近似サブバンド正規化ファクターを持つサブバンドを1つのグループにグループ化し、それにより、前記複数のサブバンドを複数のグループにグループ化するステップ
    を含む、請求項1から3のいずれか一項に記載の方法。
  5. 前記複数のグループの各グループ中のサブバンドは隣接している、請求項1から4のいずれか一項に記載の方法。
  6. オーディオ信号中でビットを割り当てる装置であって、
    オーディオ信号の周波数バンドを複数のサブバンドに分割し、前記複数のサブバンドの各サブバンドのサブバンド正規化ファクターを量子化するように構成されているサブバンド量子化ユニットと、
    前記複数のサブバンドを複数のグループにグループ化し、前記複数のグループの一グループのグループパラメータを取得するように構成されているグループ化ユニットであって、前記複数のグループのうちの1つのグループは、1以上のサブバンドを含み、前記グループパラメータは、前記一グループのサブバンド正規化ファクターの平均値である、グループ化ユニットと、
    前記一グループのグループパラメータに従って、前記複数のグループの少なくとも1つのグループにコーディングビットを割り当てるように構成されている第1の割り当てユニットであって、前記少なくとも1つのグループに割り当てられたコーディングビットの数の合計は、前記オーディオ信号のコーディングビットの数に対応し、前記コーディングビットの少なくとも1つは前記一グループに割り当てられる、第1の割り当てユニットと、
    前記コーディングビットの少なくとも1つを、前記一グループ中の各サブバンドのサブバンド正規化ファクターに従って、前記一グループ中の少なくとも1つのサブバンドに割り当てるように構成されている第2の割り当てユニットと
    を備える、装置。
  7. グループ内サブバンド正規化ファクターの平均値は、前記一グループ中のすべてのサブバンドのサブバンド正規化ファクターの平均値である、請求項6に記載の装置。
  8. 前記第1の割り当てユニットは、
    前記一グループ中のサブバンドを複数のサブグループにグループ化し、
    各サブグループのサブグループパラメータを取得するように構成され、
    各サブグループのサブグループパラメータに従って、前記一グループに割り当てられたビットを各サブグループに割り当てるように構成され、
    前記第2の割り当てユニットは、
    前記サブバンド正規化ファクターに従って、前記オーディオ信号であり、及び前記各サブグループに割り当てられたビットを、前記各サブグループ中の各サブバンドに割り当てるように構成されている、請求項6に記載の装置。
  9. 前記グループ化ユニットは、
    同じ帯域幅を持つサブバンドを1つのグループにグループ化し、それにより、前記複数のサブバンドを複数のグループにグループ化するように構成され、又は
    近似サブバンド正規化ファクターを持つサブバンドを1つのグループにグループ化し、それにより、前記複数のサブバンドを複数のグループにグループ化するように特に構成されている、請求項6から8のいずれか一項に記載の装置。
  10. 前記複数のグループの各グループ中のサブバンドは隣接している、請求項6から9の何れか一項に記載の装置。
JP2017021030A 2012-07-13 2017-02-08 オーディオ信号中でビットを割り当てる方法及び装置 Active JP6351770B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201210243316.4A CN103544957B (zh) 2012-07-13 2012-07-13 音频信号的比特分配的方法和装置
CN201210243316.4 2012-07-13

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2015520801A Division JP6092383B2 (ja) 2012-07-13 2013-05-29 オーディオ信号中でビットを割り当てる方法及び装置

Publications (2)

Publication Number Publication Date
JP2017107224A JP2017107224A (ja) 2017-06-15
JP6351770B2 true JP6351770B2 (ja) 2018-07-04

Family

ID=49915373

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2015520801A Active JP6092383B2 (ja) 2012-07-13 2013-05-29 オーディオ信号中でビットを割り当てる方法及び装置
JP2017021030A Active JP6351770B2 (ja) 2012-07-13 2017-02-08 オーディオ信号中でビットを割り当てる方法及び装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2015520801A Active JP6092383B2 (ja) 2012-07-13 2013-05-29 オーディオ信号中でビットを割り当てる方法及び装置

Country Status (6)

Country Link
US (1) US9424850B2 (ja)
EP (1) EP2863388B1 (ja)
JP (2) JP6092383B2 (ja)
KR (2) KR101736705B1 (ja)
CN (2) CN106941004B (ja)
WO (1) WO2014008786A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3117432B1 (en) * 2014-03-14 2019-05-08 Telefonaktiebolaget LM Ericsson (publ) Audio coding method and apparatus
CN106409300B (zh) * 2014-03-19 2019-12-24 华为技术有限公司 用于信号处理的方法和装置
CN106409303B (zh) 2014-04-29 2019-09-20 华为技术有限公司 处理信号的方法及设备
CN105632505B (zh) * 2014-11-28 2019-12-20 北京天籁传音数字技术有限公司 主成分分析pca映射模型的编解码方法及装置
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
US11133891B2 (en) 2018-06-29 2021-09-28 Khalifa University of Science and Technology Systems and methods for self-synchronized communications
US10951596B2 (en) * 2018-07-27 2021-03-16 Khalifa University of Science and Technology Method for secure device-to-device communication using multilayered cyphers
US11355139B2 (en) * 2020-09-22 2022-06-07 International Business Machines Corporation Real-time vs non-real time audio streaming

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3270212D1 (en) * 1982-04-30 1986-05-07 Ibm Digital coding method and device for carrying out the method
GB8421498D0 (en) * 1984-08-24 1984-09-26 British Telecomm Frequency domain speech coding
US5752225A (en) * 1989-01-27 1998-05-12 Dolby Laboratories Licensing Corporation Method and apparatus for split-band encoding and split-band decoding of audio information using adaptive bit allocation to adjacent subbands
EP0717392B1 (en) * 1994-05-25 2001-08-16 Sony Corporation Encoding method, decoding method, encoding-decoding method, encoder, decoder, and encoder-decoder
JP3521596B2 (ja) * 1996-01-30 2004-04-19 ソニー株式会社 信号符号化方法
JP3491425B2 (ja) * 1996-01-30 2004-01-26 ソニー株式会社 信号符号化方法
DE69924922T2 (de) * 1998-06-15 2006-12-21 Matsushita Electric Industrial Co., Ltd., Kadoma Audiokodierungsmethode und Audiokodierungsvorrichtung
JP3466507B2 (ja) * 1998-06-15 2003-11-10 松下電器産業株式会社 音声符号化方式、音声符号化装置、及びデータ記録媒体
JP4287545B2 (ja) * 1999-07-26 2009-07-01 パナソニック株式会社 サブバンド符号化方式
JP4242516B2 (ja) * 1999-07-26 2009-03-25 パナソニック株式会社 サブバンド符号化方式
JP2001094433A (ja) * 1999-09-17 2001-04-06 Matsushita Electric Ind Co Ltd サブバンド符号化・復号方法
JP2002091498A (ja) * 2000-09-19 2002-03-27 Victor Co Of Japan Ltd オーディオ信号符号化装置
WO2002052732A1 (en) * 2000-12-22 2002-07-04 Sony Corporation Encoder and decoder
PL1706866T3 (pl) * 2004-01-20 2008-10-31 Dolby Laboratories Licensing Corp Kodowanie dźwięku w oparciu o grupowanie bloków
US7725313B2 (en) * 2004-09-13 2010-05-25 Ittiam Systems (P) Ltd. Method, system and apparatus for allocating bits in perceptual audio coders
KR100754389B1 (ko) * 2005-09-29 2007-08-31 삼성전자주식회사 음성 및 오디오 신호 부호화 장치 및 방법
EP1852849A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt Gmbh Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
WO2008009175A1 (fr) * 2006-07-14 2008-01-24 Anyka (Guangzhou) Software Technologiy Co., Ltd. Rocédé et un système de codage et décodage audio canal à rétrocompatibilité d'après la règle d'entropie maximale
CN101101755B (zh) * 2007-07-06 2011-04-27 北京中星微电子有限公司 一种音频编码的比特分配及量化方法及音频编码装置
GB2454190A (en) 2007-10-30 2009-05-06 Cambridge Silicon Radio Ltd Minimising a cost function in encoding data using spectral partitioning
CN101499279B (zh) * 2009-03-06 2011-11-02 武汉大学 空间参数逐级精细的比特分配方法及其装置
US8207875B2 (en) 2009-10-28 2012-06-26 Motorola Mobility, Inc. Encoder that optimizes bit allocation for information sub-parts
US8386266B2 (en) * 2010-07-01 2013-02-26 Polycom, Inc. Full-band scalable audio codec
CN102081926B (zh) * 2009-11-27 2013-06-05 中兴通讯股份有限公司 格型矢量量化音频编解码方法和系统
US8831932B2 (en) 2010-07-01 2014-09-09 Polycom, Inc. Scalable audio in a multi-point environment
US9536534B2 (en) * 2011-04-20 2017-01-03 Panasonic Intellectual Property Corporation Of America Speech/audio encoding apparatus, speech/audio decoding apparatus, and methods thereof
CN102208188B (zh) 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备

Also Published As

Publication number Publication date
CN106941004B (zh) 2021-05-18
WO2014008786A1 (zh) 2014-01-16
US9424850B2 (en) 2016-08-23
JP2017107224A (ja) 2017-06-15
JP2015524574A (ja) 2015-08-24
KR101736705B1 (ko) 2017-05-16
EP2863388B1 (en) 2018-09-12
JP6092383B2 (ja) 2017-03-08
CN103544957A (zh) 2014-01-29
CN106941004A (zh) 2017-07-11
CN103544957B (zh) 2017-04-12
EP2863388A1 (en) 2015-04-22
KR101661868B1 (ko) 2016-09-30
EP2863388A4 (en) 2015-08-12
KR20160114192A (ko) 2016-10-04
KR20150032737A (ko) 2015-03-27
US20150162011A1 (en) 2015-06-11

Similar Documents

Publication Publication Date Title
JP6351770B2 (ja) オーディオ信号中でビットを割り当てる方法及び装置
JP6702593B2 (ja) 音声信号の符号化と復号化の方法および装置
JP6726785B2 (ja) ビット割り当て装置
JP6351783B2 (ja) オーディオ信号のビットを割り当てる方法及び装置
RU2702265C1 (ru) Способ и устройство обработки сигналов
US10789964B2 (en) Dynamic bit allocation methods and devices for audio signal

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180508

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180605

R150 Certificate of patent or registration of utility model

Ref document number: 6351770

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250