JP2017107224A - オーディオ信号中でビットを割り当てる方法及び装置 - Google Patents
オーディオ信号中でビットを割り当てる方法及び装置 Download PDFInfo
- Publication number
- JP2017107224A JP2017107224A JP2017021030A JP2017021030A JP2017107224A JP 2017107224 A JP2017107224 A JP 2017107224A JP 2017021030 A JP2017021030 A JP 2017021030A JP 2017021030 A JP2017021030 A JP 2017021030A JP 2017107224 A JP2017107224 A JP 2017107224A
- Authority
- JP
- Japan
- Prior art keywords
- group
- subbands
- bits
- subband
- assigned
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 90
- 238000000034 method Methods 0.000 title claims abstract description 71
- 238000010606 normalization Methods 0.000 claims abstract description 224
- 238000013139 quantization Methods 0.000 claims description 9
- 230000003595 spectral effect Effects 0.000 description 15
- 230000000737 periodic effect Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 9
- 125000004122 cyclic group Chemical group 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 5
- 230000006854 communication Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000007175 bidirectional communication Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
そして得られたウィンドウ加算された信号は以下の通りになる:
8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,
16,16,16,16,16,16,16,16,
24,24,24,24,24,24,24,24,24,24,24,24,
32,32,32,32,32,32,32,32。
すなわち、
(付記1) オーディオ信号中でビットを割り当てる方法であって、
オーディオ信号の周波数バンドを複数のサブバンドに分割し、且つ各サブバンドのサブバンド正規化ファクターを量子化するステップと、
前記複数のサブバンドを複数のグループにグループ化し、前記複数のグループのうちの1つのグループは、1以上のサブバンドを含み、且つ各グループのグループパラメータを取得するステップであって、前記グループパラメータは、前記対応するグループのオーディオ信号の信号特性及びエネルギー属性を表すために使用される、ステップと、
前記各グループのグループパラメータに従って、少なくとも1つのグループにコーディングビットを割り当てるステップであって、前記少なくとも1つのグループに割り当てられるコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である、ステップと、
前記少なくとも1つのグループに割り当てられたコーディングビットを、前記少なくとも1つのグループの各グループ中の各サブバンドのサブバンド正規化ファクターに従って、前記少なくとも1つのグループの各グループ中の各サブバンドに割り当てるステップと
を含む、方法。
(付記2) 前記各グループのグループパラメータを取得するステップは、
各グループのグループ内サブバンド正規化ファクターの合計及び各グループのグループ内サブバンド正規化ファクターのピーク対平均比を取得するステップを含み、
前記グループ内サブバンド正規化ファクターの合計は、前記グループ中の全サブバンドのサブバンド正規化ファクターの合計であり、且つ前記グループ内サブバンド正規化ファクターのピーク対平均比は、前記グループ内サブバンド正規化ファクターの平均値に対する前記グループ内サブバンド正規化ファクターのピーク値の比であり、前記グループ内サブバンド正規化ファクターのピーク値は、前記グループ中の全サブバンドのサブバンド正規化ファクターの最大値であり、且つ前記グループ内サブバンド正規化ファクターの平均値は、前記グループ中の全サブバンドのサブバンド正規化ファクターの平均値であり、且つ
前記少なくとも1つのグループに割り当てられたコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である、前記各グループのグループパラメータに従って、少なくとも1つのグループにコーディングビットを割り当てるステップは、
前記各グループのグループ内サブバンド正規化ファクターの合計に従って、前記少なくとも1つのグループにコーディングビットを割り当てるステップを含み、
前記少なくとも1つのグループに割り当てられたコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である、付記1に記載の方法。
(付記3) 前記各グループのグループパラメータを取得するステップは、
各グループのグループ内サブバンド正規化ファクターの合計及び各グループのグループ内サブバンド正規化ファクターのピーク対平均比を取得するステップであって、前記グループ内サブバンド正規化ファクターの合計は、前記グループ中の全サブバンドのサブバンド正規化ファクターの合計であり、且つ前記グループ内サブバンド正規化ファクターのピーク対平均比は、前記グループ内サブバンド正規化ファクターの平均値に対する前記グループ内サブバンド正規化ファクターのピーク値の比であり、前記グループ内サブバンド正規化ファクターのピーク値は、前記グループ中の全サブバンドのサブバンド正規化ファクターの最大値であり、且つ前記グループ内サブバンド正規化ファクターの平均値は、前記グループ中の全サブバンドのサブバンド正規化ファクターの平均値である、ステップと、
各グループのグループ内サブバンド正規化ファクターの重み付けされた合計を得るために、前記各グループのグループ内サブバンド正規化ファクターのピーク対平均比に従って、前記各グループのグループ内サブバンド正規化ファクターの合計を重み付けするステップと
を含み、
前記少なくとも1つのグループに割り当てられたコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である、前記各グループのグループパラメータに従って、少なくとも1つのグループにコーディングビットを割り当てるステップは、
前記各グループのグループ内サブバンド正規化ファクターの重み付けされた合計に従って、前記少なくとも1つのグループにコーディングビットを割り当てるステップを含み、
前記少なくとも1つのグループに割り当てられたコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である、付記1に記載の方法。
(付記4) 前記各グループのグループ内サブバンド正規化ファクターのピーク対平均比に従って、前記各グループのグループ内サブバンド正規化ファクターの合計を重み付けするステップは、
第1のグループのグループ内サブバンド正規化ファクターのピーク対平均比と第2のグループのグループ内サブバンド正規化ファクターのピーク対平均比とを比較するステップと、
前記第1のグループのグループ内サブバンド正規化ファクターのピーク対平均比と、前記第2のグループのグループ内サブバンド正規化ファクターのピーク対平均比との間の比較が、第1の閾値より大きい場合に、第1の重み付けファクターに従って前記第1のグループのグループ内サブバンド正規化ファクターの合計を調整するステップと、第2の重み付けファクターに従って第2のグループのグループ内サブバンド正規化ファクターの合計を調整するステップと
を含む、付記3に記載の方法。
(付記5) 前記少なくとも1つのグループに割り当てられたコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である、前記各グループのグループ内サブバンド正規化ファクターの重み付けされた合計に従って、少なくとも1つのグループにコーディングビットを割り当てるステップは、
前記グループ中の全サブバンドのサブバンド正規化ファクターの合計に対する、前記各グループのグループ内サブバンド正規化ファクターの重み付けされた合計の比に従って、前記グループに対するビットの数を決定するステップと、前記グループに対するビットの数に従って、前記グループに前記オーディオ信号のビットを割り当てるステップとを含む、付記3又は4のいずれか一項に記載の方法。
(付記6) 前記少なくとも1つのグループの各グループ中の各サブバンドのサブバンド正規化ファクターに従って、前記少なくとも1つのグループの各グループ中の各サブバンドに前記少なくとも1つのグループに割り当てられたコーディングビットを割り当てるステップは、
前記グループ中でビットが割り当てられるサブバンドの数を決定するステップと、
前記グループ中のサブバンド正規化ファクターに従って、前記オーディオ信号のコーディングビットであり、且つ前記グループに割り当てられたコーディングビットを、前記グループ中でビットが割り当てられるサブバンドに割り当てるステップと
を含み、
前記グループ中でビットが割り当てられるサブバンドの数は、前記グループ中でビットが割り当てられるサブバンドの数に等しい、付記1から5のいずれか一項に記載の方法。
(付記7) 前記グループ中でビットが割り当てられるサブバンドの数を決定するステップは、
前記グループに対するビットの数及び第3の閾値に従って、前記グループ中でビットが最初に割り当てられるサブバンドの数を決定するステップであって、前記第3の閾値は、正規化されたスペクトル係数を量子化するために使用されるビットの最小数を表す、ステップと、
前記グループ中でビットが最初に割り当てられるサブバンドの数と前記グループ中のサブバンドの総数とに従って、前記グループ中でビットが割り当てられるサブバンドの数を決定するステップと
を含む、付記6に記載の方法。
(付記8) 前記グループ中でビットが最初に割り当てられるサブバンドの数と前記グループ中のサブバンドの総数とに従って、前記グループ中でビットが割り当てられるサブバンドの数を決定するステップは、
前記グループ中でビットが最初に割り当てられるサブバンドの数と前記グループ中のサブバンドの総数との間のより小さい値が、前記グループ中でビットが割り当てられるサブバンドの数であることを決定するステップを含む、付記7に記載の方法。
(付記9) 前記グループ中でビットが最初に割り当てられるサブバンドの数と前記グループ中のサブバンドの総数とに従って、前記グループ中でビットが割り当てられるサブバンドの数を決定するステップは、
前記グループ中でビットが最初に割り当てられるサブバンドの数を、前記グループ中のサブバンドの総数とスケールファクターkとの積と比較するステップであって、前記スケールファクターkは、前記グループ中のサブバンドの総数を調整するために使用される、ステップと、
前記グループ中でビットが最初に割り当てられるサブバンドの数が、前記グループ中のサブバンドの総数と前記スケールファクターkとの積より小さい場合に、前記グループ中でビットが割り当てられるサブバンドの数は、グループ中でビットが最初に割り当てられるサブバンドの数であることを決定し、前記グループ中でビットが最初に割り当てられるサブバンドの数が、前記グループ中のサブバンドの総数と前記スケールファクターkとの積より大きい場合に、前記グループ中でビットが割り当てられるサブバンドの数は、前記グループ中のサブバンドの総数であることを決定するステップと
を含む、付記7に記載の方法。
(付記10) 前記グループ中のサブバンド正規化ファクターに従って、前記オーディオ信号であり、及び前記グループに割り当てられたコーディングビットを、前記グループ中でビットが割り当てられるサブバンドに割り当てるステップは、
最も大きなサブバンド正規化ファクターを持つ最初のN個のサブバンドを、割り当てに対するターゲットサブバンドとして、前記グループ中の全サブバンドから選択するステップであって、前記Nはグループ中でビットが割り当てられるサブバンドの数である、ステップと、
前記N個のサブバンドのサブバンド正規化ファクターに従って、前記N個のサブバンドにビットの数を順番に割り当てるステップと
を含む、付記6から9のいずれか一項に記載の方法。
(付記11) 前記少なくとも1つのグループに割り当てられるコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である、前記各グループのグループパラメータに従って、少なくとも1つのグループにコーディングを割り当てるステップは、
前記グループ中のサブバンドを複数のサブグループに分割し、且つ各サブグループのサブグループパラメータを取得するステップと、
前記各サブグループのサブグループパラメータに従って、前記グループに割り当てられたビットを各サブグループに割り当てるステップと
を含み、
前記少なくとも1つのグループに割り当てられたコーディングビットを、前記少なくとも1つのグループの各グループ中の各サブバンドのサブバンド正規化ファクターに従って、前記少なくとも1つのグループの各グループ中の各サブバンドに割り当てるステップは、
前記サブバンド正規化ファクターに従って、前記オーディオ信号であり、且つ前記各サブグループに割り当てられたビットを、前記各サブグループ中の各サブバンドに割り当てるステップを含む、付記1に記載の方法。
(付記12) 前記複数のサブバンドを複数のグループにグループ化するステップは、
同じ帯域幅を持つサブバンドを1つのグループにグループ化し、それにより、前記複数のサブバンドを複数のグループにグループ化するステップ、又は
近似サブバンド正規化ファクターを持つサブバンドを1つのグループにグループ化し、それにより、前記複数のサブバンドを複数のグループにグループ化するステップ
を含む、付記1から11のいずれか一項に記載の方法。
(付記13) 前記複数のグループの各グループ中のサブバンドは隣接している、付記12に記載の方法。
(付記14) オーディオ信号中でビットを割り当てる装置であって、
オーディオ信号の周波数バンドを複数のサブバンドに分割し、各サブバンドのサブバンド正規化ファクターを量子化するように構成されているサブバンド量子化ユニットと、
前記複数のサブバンドを複数のグループにグループ化し、各グループのグループパラメータを取得するように構成されているグループ化ユニットであって、前記複数のグループのうちの1つのグループは、1以上のサブバンドを含み、前記グループパラメータは、前記対応するグループのオーディオ信号の信号特性及びエネルギー属性を表すために使用される、グループ化ユニットと、
前記各グループのグループパラメータに従って、少なくとも1つのグループにコーディングビットを割り当てるように構成されている第1の割り当てユニットであって、前記少なくとも1つのグループに割り当てられたコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である、第1の割り当てユニットと、
前記少なくとも1つのグループに割り当てられたコーディングビットを、前記少なくとも1つのグループの各グループ中の各サブバンドのサブバンド正規化ファクターに従って、前記少なくとも1つのグループの各グループ中の各サブバンドに割り当てるように構成されている第2の割り当てユニットと
を備える、装置。
(付記15) 前記グループ化ユニットは、
各グループのグループ内サブバンド正規化ファクターの合計及び各グループのグループ内サブバンド正規化ファクターのピーク対平均比を取得するように構成され、
前記グループ内サブバンド正規化ファクターの合計は、前記グループ中の全サブバンドのサブバンド正規化ファクターの合計であり、前記グループ内サブバンド正規化ファクターのピーク対平均比は、前記グループ内サブバンド正規化ファクターの平均値に対する前記グループ内サブバンド正規化ファクターのピーク値の比であり、前記グループ内サブバンド正規化ファクターのピーク値は、前記グループ中の全サブバンドのサブバンド正規化ファクターの最大値であり、前記グループ内サブバンド正規化ファクターの平均値は、前記グループ中の全サブバンドのサブバンド正規化ファクターの平均値であり、
前記第1の割り当てユニットは、
前記各グループのグループ内サブバンド正規化ファクターの合計に従って、前記少なくとも1つのグループにコーディングビットを割り当てるように構成され、
前記少なくとも1つのグループに割り当てられたコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である、付記14に記載の装置。
(付記16) 前記グループ化ユニットは、
各グループのグループ内サブバンド正規化ファクターの合計及び各グループのグループ内サブバンド正規化ファクターのピーク対平均比を取得するように構成され、前記グループ内サブバンド正規化ファクターの合計は、前記グループ中の全サブバンドのサブバンド正規化ファクターの合計であり、前記グループ内サブバンド正規化ファクターのピーク対平均比は、前記グループ内サブバンド正規化ファクターの平均値に対する前記グループ内サブバンド正規化ファクターのピーク値の比であり、前記グループ内サブバンド正規化ファクターのピーク値は、前記グループ中の全サブバンドのサブバンド正規化ファクターの最大値であり、前記グループ内サブバンド正規化ファクターの平均値は、前記グループ中の全サブバンドのサブバンド正規化ファクターの平均値であり、
各グループのグループ内サブバンド正規化ファクターの重み付けされた合計を得るために、前記各グループのグループ内サブバンド正規化ファクターのピーク対平均比に従って、前記各グループのグループ内サブバンド正規化ファクターの合計を重み付けするように構成され、
前記第1の割り当てユニットは、
前記各グループのグループ内サブバンド正規化ファクターの重み付けされた合計に従って、前記少なくとも1つのグループにコーディングビットを割り当てるように構成され、
前記少なくとも1つのグループに割り当てられたコーディングビットの合計は、前記オーディオ信号のコーディングビットの数である付記14に記載の装置。
(付記17) 前記グループ化ユニットは、
第1のグループのグループ内サブバンド正規化ファクターのピーク対平均比と第2のグループのグループ内サブバンド正規化ファクターのピーク対平均比とを比較するように特に構成されるとともに、
前記第1のグループのグループ内サブバンド正規化ファクターのピーク対平均比と、前記第2のグループのグループ内サブバンド正規化ファクターのピーク対平均比との間の比較が、第1の閾値より大きい場合に、第1の重み付けファクターに従って、前記第1のグループのグループ内サブバンド正規化ファクターの合計を調整し、第2の重み付けファクターに従って、前記第2のグループのグループ内サブバンド正規化ファクターの合計を調整するように特に構成されている付記16に記載の装置。
(付記18) 前記第1の割り当てユニットは、
前記各グループのグループ内サブバンド正規化ファクターの重み付けされた合計の、前記グループ中の全サブバンドのサブバンド正規化ファクターの合計に対する比に従って、前記各グループに対するビットの数を決定するように特に構成されるとともに、前記グループのビット数に従って、オーディオ信号のビットをグループに割り当てるように、特に構成されている付記17に記載の装置。
(付記19) 前記第2の割り当てユニットは、
前記グループ中でビットが割り当てられるサブバンドの数を決定するように構成されている決定モジュールと、
前記グループ中のサブバンド正規化ファクターに従って、前記オーディオ信号であり、及びグループ中でビットが割り当てられるサブバンドに割り当てられるコーディングビットを割り当てるように構成されている割り当てモジュールと
を含み、
前記グループ中でビットが割り当てられるサブバンドの数は、前記グループ中でビットが割り当てられるサブバンドの数に等しい付記14から18のいずれか一項に記載の装置。
(付記20) 前記決定モジュールは、
前記グループに対するビットの数及び第3の閾値に従って、グループ中でビットが最初に割り当てられるサブバンドの数を決定するように特に構成され、前記第3の閾値は、正規化されたスペクトル係数を量子化するために使用されるビットの最小数を表し、
グループ中でビットが最初に割り当てられるサブバンドの数とグループ中のサブバンドの総数との間のより小さい値が、グループ中でビットが割り当てられるサブバンドの数であることを決定するように特に構成される、
付記19に記載の装置。
(付記21) 前記決定モジュールは、
前記グループに対するビットの数及び第3の閾値に従って、グループ中でビットが最初に割り当てられるサブバンドの数を決定するように構成され、前記第3の閾値は、正規化されたスペクトル係数を量子化するために使用されるビットの最小数を表し、
前記グループ中でビットが割り当てられるサブバンドの数を、前記グループ中のサブバンドの総数とスケールファクターkとの積と比較するように特に構成され、前記スケールファクターkは、グループ中のサブバンドの総数を調整するために使用され、
前記グループ中でビットが最初に割り当てられるサブバンドの数が、前記グループ中のサブバンドの総数とスケールファクターkとの積より小さい場合に、前記グループ中でビットが割り当てられるサブバンドの数が、前記ビットが最初に割り当てられるサブバンドの数であることを決定し、前記グループ中でビットが最初に割り当てられるサブバンドの数が、グループ中のサブバンドの総数とスケールファクターkとの積より大きい場合に、前記グループ中でビットが割り当てられるサブバンドの数が、グループ中のサブバンドの総数であることを決定するように特に構成される、
付記19に記載の装置。
(付記22) 前記割り当てモジュールは、グループ中の全サブバンドから、割り当てに対するターゲットサブバンドとして最も大きなサブバンド正規化ファクターを持つ最初のN個のサブバンドを選択するように特に構成され、Nはグループ中でビットが割り当てられるサブバンドの数であり、
N個のサブバンドのサブバンド正規化ファクターに従って、N個のサブバンドに順番にビットの数を割り当てるように特に構成される、
付記19から21のいずれか一項に記載の装置。
(付記23) 前記第1の割り当てユニットは、
前記グループ中のサブバンドを複数のサブグループにグループ化するように特に構成され、
各サブグループのサブグループパラメータを取得するように特に構成されるとともに、
前記各サブグループのサブグループパラメータに従って、前記グループに割り当てられたビットを各サブグループに割り当てるように特に構成され、
前記第2の割り当てユニットは、
前記サブバンド正規化ファクターに従って、前記オーディオ信号であり、及び前記各サブグループに割り当てられたビットを、前記各サブグループ中の各サブバンドに割り当てるように特に構成されている、付記14に記載の装置。
(付記24) 前記グループ化ユニットは、
同じ帯域幅を持つサブバンドを1つのグループにグループ化し、それにより、前記複数のサブバンドを複数のグループにグループ化するように特に構成され、又は
近似サブバンド正規化ファクターを持つサブバンドを1つのグループにグループ化し、それにより、前記複数のサブバンドを複数のグループにグループ化するように特に構成されている、付記14から23のいずれか一項に記載の方法。
(付記25) 前記複数のグループの各グループ中のサブバンドは隣接している、付記24に記載の装置。
Claims (10)
- オーディオ信号中でビットを割り当てる方法であって、
オーディオ信号の周波数バンドを複数のサブバンドに分割するステップと、
前記複数のサブバンドの各サブバンドのサブバンド正規化ファクターを量子化するステップと、
前記複数のサブバンドを複数のグループにグループ化するステップであって、前記複数のグループのうちの1つのグループは、1以上のサブバンドを含む、ステップと、
前記複数のグループの一グループのグループパラメータを取得するステップであって、前記グループパラメータは、前記一グループのサブバンド正規化ファクターの平均値である、ステップと、
前記一グループのグループパラメータに従って、前記複数のグループの少なくとも1つのグループにコーディングビットを割り当てるステップであって、前記少なくとも1つのグループの各グループに割り当てられるコーディングビットの数の合計は、前記オーディオ信号のコーディングビットの数であり、前記コーディングビットの少なくとも1つは前記一グループに割り当てられる、ステップと、
前記コーディングビットの少なくとも1つを、前記一グループ中の各サブバンドのサブバンド正規化ファクターに従って、前記一グループ中の少なくとも1つのサブバンドに割り当てるステップと
を含む、方法。 - サブバンド正規化ファクターの平均値は、前記一グループ中のすべてのサブバンドのサブバンド正規化ファクターの平均値である、請求項1に記載の方法。
- コーディングビットを、前記一グループのグループパラメータによって、前記複数のグループの少なくとも1つのグループに割り当てるステップは、
前記一グループ中のサブバンドを複数のサブグループに分割し、且つ各サブグループのサブグループパラメータを取得するステップと、
前記各サブグループのサブグループパラメータに従って、前記一グループに割り当てられたビットを各サブグループに割り当てるステップと
を含み、
前記コーディングビットの少なくとも1つを、前記一グループ中の各サブバンドのサブバンド正規化ファクターにより、前記一グループ中の少なくとも1つのサブバンドに割り当てるステップは、
前記サブバンド正規化ファクターに従って、前記オーディオ信号であり、且つ前記各サブグループに割り当てられたビットを、前記各サブグループ中の各サブバンドに割り当てるステップを含む、請求項1に記載の方法。 - 前記複数のサブバンドを複数のグループにグループ化するステップは、
同じ帯域幅を持つサブバンドを1つのグループにグループ化し、それにより、前記複数のサブバンドを複数のグループにグループ化するステップ、又は
近似サブバンド正規化ファクターを持つサブバンドを1つのグループにグループ化し、それにより、前記複数のサブバンドを複数のグループにグループ化するステップ
を含む、請求項1から3のいずれか一項に記載の方法。 - 前記複数のグループの各グループ中のサブバンドは隣接している、請求項1から4のいずれか一項に記載の方法。
- オーディオ信号中でビットを割り当てる装置であって、
オーディオ信号の周波数バンドを複数のサブバンドに分割し、前記複数のサブバンドの各サブバンドのサブバンド正規化ファクターを量子化するように構成されているサブバンド量子化ユニットと、
前記複数のサブバンドを複数のグループにグループ化し、前記複数のグループの一グループのグループパラメータを取得するように構成されているグループ化ユニットであって、前記複数のグループのうちの1つのグループは、1以上のサブバンドを含み、前記グループパラメータは、前記一グループのサブバンド正規化ファクターの平均値である、グループ化ユニットと、
前記一グループのグループパラメータに従って、前記複数のグループの少なくとも1つのグループにコーディングビットを割り当てるように構成されている第1の割り当てユニットであって、前記少なくとも1つのグループに割り当てられたコーディングビットの数の合計は、前記オーディオ信号のコーディングビットの数に対応し、前記コーディングビットの少なくとも1つは前記一グループに割り当てられる、第1の割り当てユニットと、
前記コーディングビットの少なくとも1つを、前記一グループ中の各サブバンドのサブバンド正規化ファクターに従って、前記一グループ中の少なくとも1つのサブバンドに割り当てるように構成されている第2の割り当てユニットと
を備える、装置。 - グループ内サブバンド正規化ファクターの平均値は、前記一グループ中のすべてのサブバンドのサブバンド正規化ファクターの平均値である、請求項6に記載の装置。
- 前記第1の割り当てユニットは、
前記一グループ中のサブバンドを複数のサブグループにグループ化し、
各サブグループのサブグループパラメータを取得するように構成され、
各サブグループのサブグループパラメータに従って、前記一グループに割り当てられたビットを各サブグループに割り当てるように構成され、
前記第2の割り当てユニットは、
前記サブバンド正規化ファクターに従って、前記オーディオ信号であり、及び前記各サブグループに割り当てられたビットを、前記各サブグループ中の各サブバンドに割り当てるように構成されている、請求項6に記載の装置。 - 前記グループ化ユニットは、
同じ帯域幅を持つサブバンドを1つのグループにグループ化し、それにより、前記複数のサブバンドを複数のグループにグループ化するように構成され、又は
近似サブバンド正規化ファクターを持つサブバンドを1つのグループにグループ化し、それにより、前記複数のサブバンドを複数のグループにグループ化するように特に構成されている、請求項6から8のいずれか一項に記載の装置。 - 前記複数のグループの各グループ中のサブバンドは隣接している、請求項6から9の何れか一項に記載の装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210243316.4A CN103544957B (zh) | 2012-07-13 | 2012-07-13 | 音频信号的比特分配的方法和装置 |
CN201210243316.4 | 2012-07-13 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015520801A Division JP6092383B2 (ja) | 2012-07-13 | 2013-05-29 | オーディオ信号中でビットを割り当てる方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017107224A true JP2017107224A (ja) | 2017-06-15 |
JP6351770B2 JP6351770B2 (ja) | 2018-07-04 |
Family
ID=49915373
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015520801A Active JP6092383B2 (ja) | 2012-07-13 | 2013-05-29 | オーディオ信号中でビットを割り当てる方法及び装置 |
JP2017021030A Active JP6351770B2 (ja) | 2012-07-13 | 2017-02-08 | オーディオ信号中でビットを割り当てる方法及び装置 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015520801A Active JP6092383B2 (ja) | 2012-07-13 | 2013-05-29 | オーディオ信号中でビットを割り当てる方法及び装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9424850B2 (ja) |
EP (1) | EP2863388B1 (ja) |
JP (2) | JP6092383B2 (ja) |
KR (2) | KR101661868B1 (ja) |
CN (2) | CN103544957B (ja) |
WO (1) | WO2014008786A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9741349B2 (en) | 2014-03-14 | 2017-08-22 | Telefonaktiebolaget L M Ericsson (Publ) | Audio coding method and apparatus |
CN106409300B (zh) * | 2014-03-19 | 2019-12-24 | 华为技术有限公司 | 用于信号处理的方法和装置 |
CN106409303B (zh) * | 2014-04-29 | 2019-09-20 | 华为技术有限公司 | 处理信号的方法及设备 |
CN105632505B (zh) * | 2014-11-28 | 2019-12-20 | 北京天籁传音数字技术有限公司 | 主成分分析pca映射模型的编解码方法及装置 |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
US11133891B2 (en) | 2018-06-29 | 2021-09-28 | Khalifa University of Science and Technology | Systems and methods for self-synchronized communications |
US10951596B2 (en) * | 2018-07-27 | 2021-03-16 | Khalifa University of Science and Technology | Method for secure device-to-device communication using multilayered cyphers |
US12072206B2 (en) * | 2020-07-29 | 2024-08-27 | Honeywell International Inc. | Systems and methods for displaying terminal area procedure charts |
US11355139B2 (en) | 2020-09-22 | 2022-06-07 | International Business Machines Corporation | Real-time vs non-real time audio streaming |
CN114822564A (zh) * | 2021-01-21 | 2022-07-29 | 华为技术有限公司 | 音频对象的比特分配方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09214348A (ja) * | 1996-01-30 | 1997-08-15 | Sony Corp | 信号符号化方法 |
JP2000078018A (ja) * | 1998-06-15 | 2000-03-14 | Matsushita Electric Ind Co Ltd | 音声符号化方式、音声符号化装置、及びデ―タ記録媒体 |
JP2012032803A (ja) * | 2010-07-01 | 2012-02-16 | Polycom Inc | フルバンド拡張可能なオーディオコーデック |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3270212D1 (en) * | 1982-04-30 | 1986-05-07 | Ibm | Digital coding method and device for carrying out the method |
GB8421498D0 (en) * | 1984-08-24 | 1984-09-26 | British Telecomm | Frequency domain speech coding |
US5752225A (en) * | 1989-01-27 | 1998-05-12 | Dolby Laboratories Licensing Corporation | Method and apparatus for split-band encoding and split-band decoding of audio information using adaptive bit allocation to adjacent subbands |
WO1995032499A1 (fr) * | 1994-05-25 | 1995-11-30 | Sony Corporation | Procede de codage, procede de decodage, procede de codage-decodage, codeur, decodeur et codeur-decodeur |
JP3521596B2 (ja) * | 1996-01-30 | 2004-04-19 | ソニー株式会社 | 信号符号化方法 |
EP0966109B1 (en) * | 1998-06-15 | 2005-04-27 | Matsushita Electric Industrial Co., Ltd. | Audio coding method and audio coding apparatus |
JP4242516B2 (ja) * | 1999-07-26 | 2009-03-25 | パナソニック株式会社 | サブバンド符号化方式 |
JP4287545B2 (ja) * | 1999-07-26 | 2009-07-01 | パナソニック株式会社 | サブバンド符号化方式 |
JP2001094433A (ja) * | 1999-09-17 | 2001-04-06 | Matsushita Electric Ind Co Ltd | サブバンド符号化・復号方法 |
JP2002091498A (ja) * | 2000-09-19 | 2002-03-27 | Victor Co Of Japan Ltd | オーディオ信号符号化装置 |
US7016502B2 (en) * | 2000-12-22 | 2006-03-21 | Sony Corporation | Encoder and decoder |
JP5069909B2 (ja) * | 2004-01-20 | 2012-11-07 | ドルビー ラボラトリーズ ライセンシング コーポレイション | ブロック系列化に基づくオーディオコーディング |
US7725313B2 (en) * | 2004-09-13 | 2010-05-25 | Ittiam Systems (P) Ltd. | Method, system and apparatus for allocating bits in perceptual audio coders |
KR100754389B1 (ko) * | 2005-09-29 | 2007-08-31 | 삼성전자주식회사 | 음성 및 오디오 신호 부호화 장치 및 방법 |
EP1852849A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream |
US20090313029A1 (en) * | 2006-07-14 | 2009-12-17 | Anyka (Guangzhou) Software Technologiy Co., Ltd. | Method And System For Backward Compatible Multi Channel Audio Encoding and Decoding with the Maximum Entropy |
CN101101755B (zh) * | 2007-07-06 | 2011-04-27 | 北京中星微电子有限公司 | 一种音频编码的比特分配及量化方法及音频编码装置 |
GB2454190A (en) * | 2007-10-30 | 2009-05-06 | Cambridge Silicon Radio Ltd | Minimising a cost function in encoding data using spectral partitioning |
CN101499279B (zh) * | 2009-03-06 | 2011-11-02 | 武汉大学 | 空间参数逐级精细的比特分配方法及其装置 |
US8207875B2 (en) | 2009-10-28 | 2012-06-26 | Motorola Mobility, Inc. | Encoder that optimizes bit allocation for information sub-parts |
CN102081926B (zh) * | 2009-11-27 | 2013-06-05 | 中兴通讯股份有限公司 | 格型矢量量化音频编解码方法和系统 |
CN102741831B (zh) | 2010-11-12 | 2015-10-07 | 宝利通公司 | 多点环境中的可伸缩音频 |
US9536534B2 (en) * | 2011-04-20 | 2017-01-03 | Panasonic Intellectual Property Corporation Of America | Speech/audio encoding apparatus, speech/audio decoding apparatus, and methods thereof |
CN102208188B (zh) | 2011-07-13 | 2013-04-17 | 华为技术有限公司 | 音频信号编解码方法和设备 |
-
2012
- 2012-07-13 CN CN201210243316.4A patent/CN103544957B/zh active Active
- 2012-07-13 CN CN201710079399.0A patent/CN106941004B/zh active Active
-
2013
- 2013-05-29 JP JP2015520801A patent/JP6092383B2/ja active Active
- 2013-05-29 KR KR1020157003447A patent/KR101661868B1/ko active IP Right Grant
- 2013-05-29 EP EP13816528.7A patent/EP2863388B1/en active Active
- 2013-05-29 WO PCT/CN2013/076393 patent/WO2014008786A1/zh active Application Filing
- 2013-05-29 KR KR1020167026037A patent/KR101736705B1/ko active IP Right Grant
-
2015
- 2015-01-13 US US14/595,672 patent/US9424850B2/en active Active
-
2017
- 2017-02-08 JP JP2017021030A patent/JP6351770B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09214348A (ja) * | 1996-01-30 | 1997-08-15 | Sony Corp | 信号符号化方法 |
JP2000078018A (ja) * | 1998-06-15 | 2000-03-14 | Matsushita Electric Ind Co Ltd | 音声符号化方式、音声符号化装置、及びデ―タ記録媒体 |
JP2012032803A (ja) * | 2010-07-01 | 2012-02-16 | Polycom Inc | フルバンド拡張可能なオーディオコーデック |
Also Published As
Publication number | Publication date |
---|---|
JP2015524574A (ja) | 2015-08-24 |
US9424850B2 (en) | 2016-08-23 |
EP2863388A1 (en) | 2015-04-22 |
CN106941004B (zh) | 2021-05-18 |
EP2863388A4 (en) | 2015-08-12 |
EP2863388B1 (en) | 2018-09-12 |
KR101736705B1 (ko) | 2017-05-16 |
JP6351770B2 (ja) | 2018-07-04 |
CN103544957A (zh) | 2014-01-29 |
CN103544957B (zh) | 2017-04-12 |
US20150162011A1 (en) | 2015-06-11 |
KR101661868B1 (ko) | 2016-09-30 |
KR20160114192A (ko) | 2016-10-04 |
KR20150032737A (ko) | 2015-03-27 |
CN106941004A (zh) | 2017-07-11 |
WO2014008786A1 (zh) | 2014-01-16 |
JP6092383B2 (ja) | 2017-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6351770B2 (ja) | オーディオ信号中でビットを割り当てる方法及び装置 | |
JP6702593B2 (ja) | 音声信号の符号化と復号化の方法および装置 | |
JP6726785B2 (ja) | ビット割り当て装置 | |
JP6351783B2 (ja) | オーディオ信号のビットを割り当てる方法及び装置 | |
RU2702265C1 (ru) | Способ и устройство обработки сигналов | |
US10789964B2 (en) | Dynamic bit allocation methods and devices for audio signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180508 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180605 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6351770 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |