JP6598947B2 - オーディオ/ビデオサンプルベクトルのピラミッドベクトル量子化インデクシング及びデインデクシングの方法及び装置 - Google Patents
オーディオ/ビデオサンプルベクトルのピラミッドベクトル量子化インデクシング及びデインデクシングの方法及び装置 Download PDFInfo
- Publication number
- JP6598947B2 JP6598947B2 JP2018153568A JP2018153568A JP6598947B2 JP 6598947 B2 JP6598947 B2 JP 6598947B2 JP 2018153568 A JP2018153568 A JP 2018153568A JP 2018153568 A JP2018153568 A JP 2018153568A JP 6598947 B2 JP6598947 B2 JP 6598947B2
- Authority
- JP
- Japan
- Prior art keywords
- index
- integer
- vector
- output vector
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000013598 vector Substances 0.000 title claims description 410
- 238000000034 method Methods 0.000 title claims description 150
- 238000013139 quantization Methods 0.000 title claims description 57
- 238000004590 computer program Methods 0.000 claims description 29
- 238000004891 communication Methods 0.000 claims description 13
- 239000011159 matrix material Substances 0.000 claims description 4
- 230000004044 response Effects 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 2
- 230000001186 cumulative effect Effects 0.000 description 58
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Chemical compound CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 36
- 238000012545 processing Methods 0.000 description 24
- 230000008569 process Effects 0.000 description 23
- 230000002829 reductive effect Effects 0.000 description 23
- 230000000875 corresponding effect Effects 0.000 description 21
- 238000004364 calculation method Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 19
- 230000006870 function Effects 0.000 description 14
- 230000015572 biosynthetic process Effects 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 11
- 230000003247 decreasing effect Effects 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 10
- 230000008901 benefit Effects 0.000 description 9
- 238000000354 decomposition reaction Methods 0.000 description 9
- 238000011156 evaluation Methods 0.000 description 9
- 238000000605 extraction Methods 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000005192 partition Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 5
- 238000009795 derivation Methods 0.000 description 5
- 238000000638 solvent extraction Methods 0.000 description 5
- 238000010606 normalization Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 230000010267 cellular communication Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000008672 reprogramming Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3082—Vector coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/94—Vector quantisation
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
「列挙のための系統的分類は、ピラミッド中のベクトルの数に関する係数公式を通して実行され、これは、すべてのピラミッド列挙技術に共通する概念である。」
「ピラミッドコードブックP(l,k)のベクトルの数はN(l,k)と示される。これは、ceil(log2(N(l,k)))ビットである2値符号語インデックス長に関連する。N(l,k)は、1つのベクトルの整数値がkの絶対和を有することができる方法の数lとみなすことができる。」
Hung他は、PVQインデクシング/列挙方式の1対の変形に関してPVQ符号語のビット誤り頑健性を研究したが、実際のハードウェア実現形態に関してPVQ列挙の実現の効率を向上し且つ十分に複雑度を低下させることに研究の主眼を置かなかった。PVQインデクシングのCELT及びIETF/OPUS−AudioのPVQ実現形態は、32ビット符号なし整数に基づくハードウェアに対して、可能な限り列挙の複雑度を低下させること(符号化及び復号化の双方)に焦点を絞ったが、PVQがビット誤りを起こしやすいことを無視していた。また、1999年に、Ashleyは、サイズ計算及びオフセット計算に使用される二項式組み合わせ関数の複雑度の低い確定的近似の使用によって製品コードPVQ列挙を実現するために複雑度を低下させる方法を提案し、Ashley他は、この技術を階乗パルス符号化(FPC)と呼び、この方式は、ITU−G.718音声コーデック規格で採用されている。
を提供する。次に、ノルム係数は、元のオーディオ/ビデオサンプルの再構成サンプル3である最終出力ベクトル
を形成するために使用される。
M(n,k)=1+U(n,k)+U(n,k)+M(n-1,k)=1+2*U(n,k)+M(n-1,k)
M(n,k)-M(n-1,k)=1+2*U(n,k)
M(n,k)-M(n-1,k)=M(n-1,k-1)+M(n,k-1)
1+2*U(n,k)=M(n-1,k-1)+M(n,k-1)-M(n-1,k-1)+M(n-1,k-1)
1+2*U(n,k)=1+2*U(n,k-1)+2*M(n-1,k-1)
U(n,k)=U(n,k-1)+M(n-1,k-1)
M(n-1,k-1)=U(n,k)-U(n,k-1)
この結果、
M(n-1,k)=[U(n,k+1)-U(n,k)]
となる。再帰の定義から、次のことがわかる。
M(n,k)=1+2*U(n,k)+[U(n,k+1)-U(n,k)]=1+U(n,k)+U(n,k+1)
そこで、MPVQサイズを再帰的に次のように判定できる。
NMPVQ(n,k)=M(n,k)=1+U(n,k)+U(n,k+1)
採用されるMPVQ再帰公式の導出に関しては、更に付録Bを参照。
NMPVQ(n,k)=1+2*U(n,k)+NMPVQ(n-1,k)
a)NPVQ(n,k)=2*NMPVQ(n,k)、
(効率のよいインデクシングのために再帰的に適用される)
b)U(n,k)=1+U(n,k-1)+U(n-1,k-1)+U(n-1,k)、
初期条件はU(0,*)=0、U(*,0)=0、U(1,*)=0、U(*,1)=0及びU(a,b)=U(b,a)であり、効率を得るために更にU(2,k)=k-1及びU(n,2)=n-1及びU(3,k)=K*(k-1)及びU(n,3)=n(n-1)を使用できる。
c)NMPVQ(n,k)=1+U(n,k)+U(n,k+1)、
(最終MPVQサイズ計算)
d)NMPVQ(n,k)=1+floor((A(n,k))/2)+U(n,k+1)、
(代替最終サイズ計算)
e)NMPVQ(n,k)-NMPVQ(n-1,k)=1+2*U(n,k)=A(n,k)、
(反復振幅インデックス追加判定に使用可能である)
f)A(n,k)=A(n,k-1)+A(n-1,k-1)+A(n-1,k)、
(例えば、CELT/OPUS−audioでも使用されるこの再帰は、複雑度の低い振幅インデクシングオフセット更新にも使用できる)
g)PVQオフセット=U(n,k=0..K+1)を反復更新するか、又は好ましくはA(n,k=0...K)及びU(n,K+1)を反復更新する。A(n,k)再帰はU(n,k)再帰よりわずかに速く、最終要素U(n,K+1)はA(n,K+1)より低いダイナミックレンジを有する。
この特定の再帰は従来の技術でも利用されているが、PVQインデクシング処理の効率は劣る。ステップ397で、A(n,k)は返送される。ステップ356で、Uオフセットのみが使用されるべきか否かが決定される。Uオフセットのみが使用されるべきである場合、ステップ358で、U(n,k)が次のように計算される。
ステップ398で、U(n,k)は返送される。ステップ360で、AオフセットとUオフセットの組み合わせが使用されるべきである。ステップ362において、k=0...(k_max)に関する再帰は、
A(n,k)=A(n-1,k)+A(n-1,k-1)+A(n,k-1)
に従って実行される。この特定の再帰は従来の技術でも利用されているが、PVQインデクシング処理の効率は劣る。最高ダイナミクスオフセット(k_max+1)に関して、ステップ364で再帰が実行される。特定の一実施形態において、
U(n,k_max+1)=1+U(n-1,k_max)+U(n-1,k_max+1)+U(n,k_max)
に従って純粋U再帰が使用される。別の特定の実施形態では、
U(n,k_max+1)=1+(A(n-1,k_max)>>1)+(A(n,k_max)>>)+U(n-1,k_max+1)
に従って混合A/U再帰が使用される。式中、(y>>1)はy=floor(y/2)を意味する。ステップ399において、A(n,k)及びU(n,k_max+1)は返送される。
A(n,k)=A(n+1,k)-A(n,k-1)-A(n+1,k-1)
この特定の再帰は従来の技術でも利用されているが、PVQインデクシング処理の効率は劣る。ステップ617でA(n,k)が返送される。ステップ606で、Uオフセットのみが使用されるべきであるか否かが決定される。Uオフセットのみが使用されるべきである場合に、ステップ608で、U(n,k)は次のように計算される。
U(n,k)=U(n+1,k)-U(n,k-1)-U(n+1,k-1)-1
ステップ618でU(n,k)は返送される。ステップ610で、AオフセットとUオフセットの組み合わせが使用されるべきである。ステップ612で、k=0...(k_max-1)に関する再帰は、
A(n,k)=A(n+1,k)-A(n,k-1)-A(n+1,k-1)
に従って実行される。この特定の再帰は従来の技術でも利用されているが、PVQインデクシング処理の効率は劣る。k_max=K+1である場合の最高ダイナミクスオフセットk_maxに関して、ステップ614で再帰が実行される。特定の一実施形態では、純粋なU再帰は、
U(n,k_max)=U(n+1,k_max)-U(n,k_max-1)-U(n+1,k_max-1)-1
に従って使用される。別の特定の実施形態では、
U(n,k_max)=U(n+1,k_max)-(A(n,k_max-1)>>1)-(A(n+1,k_max-1)>>1)-1
に従って混合A/U再帰が使用され、式中、(y>>1)は、y=floor(y/2)を意味する。ステップ619で、A(n,k)及びU(n,k_max)が返送される。
A(n,k)=(NPVQ(n,k-1)+NPVQ(n-1,k-1))/2
であることがわかっている。言い換えれば、数Aは、PVQサイズマトリクスN(n,k)の行nの要素と先行する行n-1の要素との加重和である。
U(n,k)=U(n,k-1)+U(n-1,k-1)+U(n-1,k)+1
これは、以前に採用されていた従来の技術のOPUS/CELTのオフセットA(n,k)と次のように関連していることがわかる。
A(n,k)=2*U(n,k)+1
U(n,k)の整数レンジダイナミクスは常にA(n,k)レンジの少なくとも2分の1である。これは、例えば32ビット語の中で高速インデクシングのために1ビット余分に利用可能にできることを意味する。また、U(2,k)及びU(3,k)をA(2,k)及びA(3,k)の場合より速く、対称的にU(2,k)=k-1,U(3,k)=k*(k-1)及びU(a,b)=U(b,a)として直接計算できる。
A(n,k)=A(n,k-1)+A(n-1,k-1)+A(n-1,k)
である。これは3つの追加の項を有するため、4つの項が追加される新たなU(n,k)再帰と比較して、特に高いn又は高いkに関しては計算がわずかに速くなる。
A(n,k)=A(n,k-2)+((2*n-1)*A(n,k-1)-A(n,k-2)) /(k-1)
U(n,k)=(A(n,k)-1)/2,
を使用して、新たな好適な低ダイナミックレンジ混合再帰公式
U(n,k)=U(n,k-2)+(n*A(n,k-1)-NMPVQ(n,k-2))/(k-1)
を取得でき、式中、NMPVQ(n,k)=1+U(n,k)+U(n,k+1)、(MPVQ(n,k)サイズ)である。
U(n,k)=A(n,k-2)>>1+(n*A(n,k-1)-(1+A(n,k-1)>>1+A(n,k-2)>>1))/(k-1)
を取得し、式中、「>>」は2による整数除算であり、多くのハードウェアにおいて低コストの右シフトである。
log2(NPVQ(N=128,k=12))=67.2ビット、
log2(NMPVQ(N=128,k=12+1))=71.5ビット
67.2<71<71.5であり、すなわち、N=128にわたり最適無制限PVQを使用すると、12の単位パルスが可能であり、その結果、パルス密度は12/128となる。
2*log2(NPVQ(43,4))+log2(NPVQ(42,4))+2*5=63.25+2*5=73.25ビット
となり、73.25はビット予定71を超える。パルスの数を1減少させて11にしようと試みることにより、次の式が取得される。
2*log2(NPVQ(43,4))+log2(NPVQ(42,3))+2*5=58.84+2*5=68.84<71
この結果得られるパルス密度は11/128となる。
log2(NPVQ(64,6))+2*log2(NPVQ(32,3))+2*5=53.34+2*5=73.34ビット
となり、73.25はビット予定71を超える。パルスの数を1減少させて11にしようと試みることにより、次の式が取得される。
2*log2(NPVQ(32,3))+log2(NPVQ(64,5))+2*5=58.92+2*5=68.9<71
この結果得られるパルス密度は11/128となる。
2*log2(2*NMPVQ(64,6))+5=2*32.51+5=70.02ビット<71
式中、
2*NMPVQ(64,6)=NPVQ(64,6)=32.51>B
この結果得られるパルス密度は12/128となる。言い換えれば、次元N=128のベクトルに割り当てられる71ビットが与えられた場合、以前の32ビット符号語方式は11パルスしか提供できないが、新規な33ビット符号語方式は12個のパルスを提供できる。
VQ ベクトル量子化器/量子化
PVQ ピラミッドVQ
PVQ(n,k) 次元n及び単位パルスの数kを有するPVQ構造、PVQ(n,k)はkと等しいL1ノルムを有するピラミッド構造である。
MPVQ 先行符号モジュールPVQ
MPVQ(n,k) 次元n及び単位パルスの数kを有するMPVQ構造、MPVQ(n,k)構造はスライスされたPVQ(n,k)ピラミッド構造であり、MPVQ(n,k)のL1ノルムはkである。
NPVQ(N,K) PVQ(次元N、単位パルスの数K)のサイズ
NMPVQ(N,K) MPVQ(次元N,単位パルスの数K)のサイズ
SIMD 単一命令多重データ(DSP命令カテゴリ)
DSP デジタルシグナルプロセッサ
HW ハードウェア
SW ソフトウェア
N、dim 次元
n、l 現在次元
k、K PVQ(n,k)及びMPVQ(n,k)の単位パルスの数
KMAX 最大K値
B 効率のよい動作のための目標ハードウェアシステムにおけるビット限界、今日のプロセッサでは通常(16)、32又は64ビット
R サンプルごとのビット数又は係数ごとのビット数
X 目標ベクトル
r、vec 形状ベクトル(残存ベクトルと呼ばれる場合もある)
G 目標ベクトルをスケーリングするための利得(スカラ又はベクトル)
RAM ランダムアクセスメモリ
OPS 毎秒演算回数
MOPS 100万命令毎秒
P-ROM プログラムROM
ROM 読み取り専用メモリ(通常、事前記憶データ)
LSB 最下位ビット
MSB 最上位ビット
LP 線形予測
本付録には、従来の技術の状態を確認するために、IETF/OPUS audio PVQの章からの関連事項の抜粋が含まれる。改善され、最適化されたOPUS−Audio PVQインデクシング/デインデクシングアルゴリズムは、RFC6716のテキスト説明では説明されないが、付属のIETF/OPUS−Audio RFC6716 PVQ−デインデクシングではc−コードファイル(cwrs.c)として提供されるいくつかの最適化を含む。
「PVQ復号化
PVQベクトルの復号化はdecode_pulses()(cwrs.c)で実現される。固有符号語インデックスは、均一に分散する0とV(N,K)−1との間の整数値として復号化され、V(N,K)は、N個のサンプル中のK個のパルスの可能な組み合わせの数である。次に、インデックスは、[PVQ]で指定されるのと同一の方法でベクトルに変換される。インデクシングはV(N,K)の計算に基づく([PVQ]ではN(L,K)と示される)。
1.p=(V(N-j-1,k)+N(N-j,k))/2とする。
2.i<pである場合、sgn=1とし、そうでない場合には、sgn=-1とし且つi=i-pと設定する。
3.k0=k及びp=p-V(N-j-1,k)と設定する。
4.p>iである場合、k=k-1及びp=p-V(N-j-1,k)と設定する。
5.X[j]=sgn*(k0-k)及びi=i-pと設定する。
「分割復号化
PVQ符号ベクトルを復号化する場合に多精度計算の必要を回避するために、コードブックに許容される最大サイズは32ビットである。これより大型のコードブックが必要とされる場合、ベクトルは、サイズN/2の2つのサブベクトルに分割される。現在の割り当てから導出される精度を有する量子化利得ベクトルは、分割の各側の相対利得を表すためにエントロピー符号化され、復号化処理全体は再帰的に適用される。LM+1回の分割という限界まで、多数の分割レベルが適用されてもよい。ステレオオーディオの合同符号化には同一の再帰メカニズムが適用される。」
「球形ベクトル量子化
CELTは、ピッチ予測器により予測されなかった各帯域のスペクトルの詳細を量子化するためにピラミッドベクトル量子化器(PVQ)[PVQ]を使用する。PVQコードブックは、N個のサンプルから成るベクトル中のK個の符号付きパルスのすべての和から構成され、同一の位置の2つのパルスは同一の符号を有することが要求される。従って、コードブックは、sum(abs(y(j)))=Kを満たすN個の次元のすべての整数符号ベクトルyを含む。
最良の符号ベクトルyの探索は、alg_quant()(vq.c)により実行される。探索のためのいくつかの可能な方式があり、それらの方式では、品質と複雑度とのトレードオフが図られる。基準実現形態で使用される方法は、正規化スペクトルXをK-1個のパルスのコードブックピラミッドに投影することにより初期符号語y1を計算する。
y0=truncate_towards_zero((K-1)*X/sum(abs(X)))
N、K及び入力データに応じて、初期符号語y0は、0〜K-1個の非零値を含んでもよい。最後のパルスを除き、すべての残存パルスは、yとXとの正規化相関を最小限にする貪欲探索によって繰り返し発見される。
T
J=-X*y/||y||
以上説明した探索は、品質と計算コストとの適切なトレードオフであると考えられる。しかし、PVQコードブックを探索する他の方法も可能であり、実現に際しては、他のどのような探索方法を使用してもよい。celt/vq.cのalg_quant()を参照。」
「PVQインデクシング
符号化すべきベクトルXは、0≦i<V(N,K)となるように次のようにインデックスiに変換される。次に、(N-1)以下、0以上のjに対して、次のことを実行する。
1.k>0である場合、i=i+(V(N-j-1,k-1)+V(N-j,k-1))/2と設定する。
2.k=k+abs(X[j])と設定する。
3.X[j]<0である場合、i=i+(V(N-j-1,k)+V(N-j,k))/2と設定する。
MPVQ関連再帰式の導出
フィシャーの公式を使用するU(n,k)とM(n,k)=NMPVQ(n,k)とのサイズ関係の導出:
k個の単位パルスを有する次元nのPVQベクトルの数であるNPVQ(n,k)の短縮表記としてN(n,k)を使用する。
N(n,k)=N(n-1,k)+N(n-1,k-1)+N(n-1,k) (1)
である。
M(n,k)=N(n,k)/2と定義する。 (2)
M(n,k)は、NMPVQ(n,k)を表す短縮表記として以下のように使用される。
U(n,k)をsum(j=1,j=k-1,M(n-1,j)と定義する。 (3)
「k」の初期位置値を有するベクトルを除き且つ「0」の初期位置値を有するベクトルを除く残存先行+(正)符号を有するベクトルの数。
M(n,k)=1+2*U(n,k)+M(n-1,k); (4)
k=KMAXの場合に1、新たな/次の先行符号を有するベクトルの数に関して可能なただ1つのそのような先行ベクトル2*U(n,k)(新たな/次の先行符号が正又は負であるために「2」)(「(U(n,k)」ベクトルは初期正振幅[KMAX-1,KMAX-2...1]を有し、先行0値を有する残存ベクトルに関してM(n-1,k)
(M(n,k)=NMPVQ(n,k)と同等)
NMPVQ(n,k)=1+2*U(n,k)+NMPVQ(n-1,k); (4b)
M(n,k)-M(n-1,k)=1+2*U(n,k)=A(n,k) (5)
(1)、(2)、(5)を組み合わせると、
M(n-1,k)=U(n,k+1)-U(n,k) (6)
(4)、(6)を組み合わせると、
M(n,k)=1+U(n,k)+U(n,k+1) (7)
ここで、U(n,k)及びU(n,k+1)の双方が<M(n,k)(5)であるように、(7)をサイズ計算に使用でき、差(5)(A(n,k))は、振幅オフセット反復に依然として使用でき、A(n,KMAX+1)のようにA(n,KMAX)までのオフセットにのみ使用される場合に、M(n,KMAX)を超えてもよく、従って、精度が限定されたハードウェアで数値の問題を引き起こしうる。
U(n,k)=(A(n,k)-1)/2 (式(5)から)
CELT/OPUS−Audioで使用されるPVQ差行A(n,k)に関する一般式
は次の通りである。
A(n,k)=A(n,k-2)+((2*n-1)*A(n,k-1)-A(n,k-2))/(k-1) (8)
(5)、(8)を組み合わせると、
U(n,k)=((2*n-1)*(U(n,k-1)+(k-2)*U(n,k-2)+n-1)/(k-1) (9)
あるいは、混合再帰を可能にすると、
U(n,k)=(A(n,k-2)-1)/2+((2*n-1)*A(n,k-1)-A(n,k-2))/(2*(k-1)) (10)
(8及び9、10)の分子のダイナミックレンジが高いため、特に精度が限定された演算システム(例えば、32ビットシステム)においては、この直接関数を評価する場合に特別な注意を払わなければならない。
U(n,k)=floor(A(n,k-2)/2)+(n*A(n,k-1)-(floor(A(n,k-1)/2)+floor(A(n,k-2)/2+1)))/(k-1) (11)
又はU(n,k)=U(n,k-2)+(n*A(n,k-1)-NMPVQ(n,k-2))/(k-1) (11b)
フィッシャーの関係(1)から、N(n,k)=N(n-1,k)+N(n-1,k-1)+N(n-1,k)。
初期条件
U(0,*)=0、U(1,*)=0、及びU(a,b)=U(b,a)
の場合、
U(n,k+1)=1+U(n-1,k)+U(n-1,k+1)+U(n,k) (12)
初期条件
A(0,0)=1、A(0,1+)=0、A(1,*)=1、及びA(a,b)=A(b,a)
の場合、
A(n,k+1)=A(n-1,k)+A(n-1,k+1)+A(n,k) (13)
A(n,k)に関して先行ベクトル行n-1,k=0:KMAXから行n,k=0:KMAXを反復計算するために(13)を使用でき、また、U(n,k)に関して先行ベクトル行n-1,k=0:KMAX+1から行n,k=0:KMAX+1を反復計算するために(12)を使用できる。
U(n,k+1)=1+A(n-1,k)>>1+U(n-1,k+1)+A(n,k)>>1 (14)
を取得し、式中、「>>」は2による整数除算(右シフト)であり、A(大きなn,k+1)は飽和してもよいので、所定のダイナミックレンジ、例えば(最後の(k+1)オフセット列に関して32ビット)の中にとどまるために式14が使用される。
ベクトル半径関係、列挙の副次的結果及びベクトル長再帰関係
1998年に、Hung、Tsern、Mengは、サイズがN(l,k)=NPVQ(l,k)であるPVQ(1==n,k)ピラミッドに関していくつかの関連する追加の関係を更に要約している。以下に示すベクトル半径再帰関係「(43)」は、行l=nに関する基本行専用サイズ関係である。
ベクトル半径再帰(43)
列挙公式の副次的結果(44)
Claims (25)
- オーディオ/ビデオ信号のサンプルのピラミッドベクトル量子化デインデクシングのための方法であって、前記方法は、
入力ビットストリームから、第1の符号語としての先行符号及び第2の符号語としての入力インデックスを受信するステップ(452)であって、
前記先行符号及び前記入力インデックスはオーディオ/ビデオ信号のサンプルを表し、
前記先行符号は、前記オーディオ/ビデオ信号のサンプルを表す生成されるべき整数出力ベクトルにおける、終端非零係数の符号であり、
前記整数出力ベクトルは、複数の整数値係数を有し、
前記終端非零係数は、前記整数出力ベクトルにおける最初の非零係数である、ステップと、
変形ピラミッドベクトル量子化列挙解除方式を用いて、前記入力インデックスを前記整数出力ベクトルにデインデクシングするステップ(454)であって、
前記入力インデックスは、前記終端非零係数の前記符号を無視する列挙方式により生成される、ステップと、
変形整数出力ベクトルを生成するために、受信された前記先行符号に従って、前記整数出力ベクトルにおける前記終端非零係数に符号を割り当てるステップ(456)と、
前記変形整数出力ベクトルを出力するステップ(458)と、
を有することを特徴とする方法。 - デインデクシングする前記ステップ(454)は、反復列挙解除手順により実行され、
前記反復列挙解除手順は、残存インデックスが前記入力インデックスと等しくなるように設定される初期化ステップと、前記整数出力ベクトルの1つの現在の係数を考慮するために選択する反復ステップの繰り返しとを含み、
前記反復ステップは、順に、
前記整数出力ベクトルの中の前記現在の係数の位置及び残存インデックスに適合しているオフセットパラメータを発見することと、
前記オフセットパラメータに応じて前記残存インデックスを減少させることと、
前記整数出力ベクトルの前記現在の係数の振幅を前記オフセットパラメータと関連する振幅と等しくなるように設定することと、
を含み、
前記繰り返しは、少なくとも前記残存インデックスがゼロに等しくなるまで、前記現在の係数として順次選択される前記整数出力ベクトルの係数を用いて継続される、
ことを特徴とする請求項1に記載の方法。 - 前記残存インデックスにおける最下位ビットに応じて、前記整数出力ベクトルにおける次の非零係数の符号が推論される、
ことを特徴とする請求項2に記載の方法。 - 前記残存インデックスの前記減少は、nが前記整数出力ベクトルの次元でありkが単位パルスの数である場合の第1のオフセットパラメータU(n,k)に少なくとも部分的に基づき、前記第1のオフセットパラメータU(n,k)は、先行する0を持たず、先行値kを持たず、先行する正の値を有し且つ正の次の先行符号を有した、次元n及びkのL1ノルムの整数ベクトルの数として定められる、
ことを特徴とする請求項2又は3に記載の方法。 - 前記第1のオフセットパラメータU(n,k)は、再帰的に、
U(n,k)=1+U(n,k-1)+U(n-1,k-1)+U(n-1,k)
と定められる、
ことを特徴とする請求項4に記載の方法。 - 前記残存インデックスの前記減少は、nが前記整数出力ベクトルの次元でありkが単位パルスの数である場合の第2のオフセットパラメータA(n,k)に少なくとも部分的に基づき、前記第2のオフセットパラメータA(n,k)は、正の先行値を有するとともに先行する0を持たない、次元n及びkのL1ノルムの整数ベクトルの数として定められる、
ことを特徴とする請求項2から5のいずれか1項に記載の方法。 - 前記第2のオフセットパラメータA(n,k)は、再帰的に、
A(n,k)=A(n,k-1)+A(n-1,k-1)+A(n-1,k)
と定められる、
ことを特徴とする請求項6に記載の方法。 - 前記残存インデックスの前記減少は、nが前記整数出力ベクトルの次元でありkが単位パルスの数である場合の、第1のオフセットパラメータU(n,k)と、第2のオフセットパラメータA(n,k)との両方に基づき、前記第1のオフセットパラメータU(n,k)は、先行する0を持たず、先行値kを持たず、先行する正の値を有し且つ正の次の先行符号を有した、次元n及びkのL1ノルムの整数ベクトルの数として定められ、前記第2のオフセットパラメータA(n,k)は、正の先行値を有するとともに先行する0を持たない、次元n及びkのL1ノルムの整数ベクトルの数として定められる、
ことを特徴とする請求項2から7のいずれか1項に記載の方法。 - 最後の列(k=K+1)に対するUの行専用再帰が、
U(n,k)=A(n,k-2)>>1+(n*A(n,k-1)-(1+A(n,k-1)>>1+A(n,k-2)>>1))/(k-1)
に従って実行される、
ことを特徴とする請求項8に記載の方法。 - オーディオ/ビデオ信号のサンプルへのピラミッドベクトル量子化によるデインデクシングを行うように構成された復号器(60)であって、
前記復号器(60)は、入力ビットストリーム(2')から、第1の符号語としての先行符号(15')及び第2の符号語としての入力インデックス(25')を受信するように構成され、
前記先行符号(15')及び前記入力インデックス(25')はオーディオ/ビデオ信号のサンプルを表し、
前記先行符号(15')は、前記オーディオ/ビデオ信号のサンプルを表す生成されるべき整数出力ベクトル(6')における、終端非零係数の符号であり、
前記整数出力ベクトルは、複数の整数値係数を有し、
前記終端非零係数は、前記整数出力ベクトルにおける最初の非零係数であり、
前記復号器(60)は、変形ピラミッドベクトル量子化列挙解除方式を用いて、前記入力インデックス(25')を前記整数出力ベクトル(6')にデインデクシングするように構成され、
前記入力インデックスは、前記終端非零係数の前記符号を無視する列挙方式により生成され、
前記復号器(60)は、変形整数出力ベクトルを生成するために、受信された前記先行符号(15')に従って、前記終端非零係数に符号を割り当てるように構成され、
前記復号器(60)は、前記変形整数出力ベクトルを出力するように構成される、
ことを特徴とする復号器。 - 前記復号器(60)は、プロセッサ(850)及びメモリ(860)を有し、前記メモリ(860)は、前記プロセッサ(850)により実行可能な命令を含み、それにより、前記プロセッサ(850)は、前記先行符号を無視する前記変形ピラミッドベクトル量子化列挙解除方式を用いて前記入力インデックス(25')を前記整数出力ベクトル(6')にデインデクシングし、受信された前記先行符号(15')に従って、前記終端非零係数の符号を割り当てるように動作可能である、
ことを特徴とする請求項10に記載の復号器。 - 前記復号器(60)は、入力ビットストリーム(2')から、オーディオ/ビデオ信号のサンプルを表す先行符号(15')及び入力インデックス(25')を受信し、前記変形整数出力ベクトルを出力するように構成される通信回路(854、856、858)を有する、
ことを特徴とする請求項10又は11に記載の復号器。 - 前記復号器(60)は、反復列挙解除手順により前記デインデクシングを実行するように構成され、
前記反復列挙解除手順は、残存インデックスが前記入力インデックス(25')と等しくなるように設定される初期化ステップと、前記整数出力ベクトルの1つの現在の係数を考慮するために選択する反復ステップの繰り返しとを含み、
前記反復ステップは、順に、
前記整数出力ベクトルの中の前記現在の係数の位置及び残存インデックスに適合しているオフセットパラメータを発見することと、
前記オフセットパラメータに応じて前記残存インデックスを減少させることと、
前記整数出力ベクトルの前記現在の係数の振幅を前記オフセットパラメータと関連する振幅と等しくなるように設定することと、
を含み、
前記繰り返しは、少なくとも前記残存インデックスがゼロに等しくなるまで、前記現在の係数として順次選択される前記整数出力ベクトルの係数を用いて継続される、
ことを特徴とする請求項10から12のいずれか1項に記載の復号器。 - 前記残存インデックスにおける最下位ビットに応じて、前記整数出力ベクトルにおける次の非零係数の符号が推論される、
ことを特徴とする請求項13に記載の復号器。 - 前記残存インデックスの前記減少は、nが前記整数出力ベクトルの次元でありkが単位パルスの数である場合の第1のオフセットパラメータU(n,k)に少なくとも部分的に基づき、前記第1のオフセットパラメータU(n,k)は、先行する0を持たず、先行値kを持たず、先行する正の値を有し且つ正の次の先行符号を有した、次元n及びkのL1ノルムの整数ベクトルの数として定められる、
ことを特徴とする請求項13又は14に記載の復号器。 - 前記第1のオフセットパラメータU(n,k)は、再帰的に、
U(n,k)=1+U(n,k-1)+U(n-1,k-1)+U(n-1,k)
と定められる、
ことを特徴とする請求項15に記載の復号器。 - 前記残存インデックスの前記減少は、nが前記整数出力ベクトルの次元でありkが単位パルスの数である場合の第2のオフセットパラメータA(n,k)に少なくとも部分的に基づき、前記第2のオフセットパラメータA(n,k)は、正の先行値を有するとともに先行する0を持たない、次元n及びkのL1ノルムの整数ベクトルの数として定められる、
ことを特徴とする請求項13から16のいずれか1項に記載の復号器。 - 前記第2のオフセットパラメータA(n,k)は、再帰的に、
A(n,k)=A(n,k-1)+A(n-1,k-1)+A(n-1,k)
と定められる、
ことを特徴とする請求項17に記載の復号器。 - 前記残存インデックスの前記減少は、nが前記整数出力ベクトルの次元でありkが単位パルスの数である場合の第1のオフセットパラメータU(n,k)と、nが前記整数出力ベクトルの次元でありkが単位パルスの数である場合の第2のオフセットパラメータA(n,k)との両方に基づき、前記第1のオフセットパラメータU(n,k)は、先行する0を持たず、先行値kを持たず、先行する正の値を有し且つ正の次の先行符号を有した、次元n及びkのL1ノルムの整数ベクトルの数として定められ、前記第2のオフセットパラメータA(n,k)は、正の先行値を有するとともに先行する0を持たない、次元n及びkのL1ノルムの整数ベクトルの数として定められる、
ことを特徴とする請求項13から18のいずれか1項に記載の復号器。 - 最後の行列の列(k=K+1)に対するUの行再帰が、
U(n,k)=A(n,k-2)>>1+(n*A(n,k-1)-(1+A(n,k-1)>>1+A(n,k-2)>>1))/(k-1)
に従って実行される、
ことを特徴とする請求項19に記載の復号器。 - コンピュータプログラム(870、872、874、876)であって、
少なくとも1つのプロセッサ(850)により実行されるときに、前記少なくとも1つのプロセッサ(850)に、入力ビットストリーム(2')から、第1の符号語としての先行符号(15')及び第2の符号語としての入力インデックス(25')を受信させ、ここで、前記先行符号及び前記入力インデックスはオーディオ/ビデオ信号のサンプルを表し、前記先行符号(15')は、前記オーディオ/ビデオ信号のサンプルを表す生成されるべき整数出力ベクトル(6')における、終端非零係数の符号であり、前記整数出力ベクトルは、複数の整数値係数を有し、前記終端非零係数は、前記整数出力ベクトルにおける最初の非零係数であり、変形ピラミッドベクトル量子化列挙解除方式を用いて、前記入力インデックス(25')を前記整数出力ベクトル(6')にデインデクシングさせ、ここで、前記入力インデックスは前記終端非零係数の前記符号を無視する列挙方式により生成され、変形整数出力ベクトルを生成するために、受信された前記先行符号(15')に従って、前記終端非零係数に符号を割り当てさせ、前記変形整数出力ベクトルを出力させる命令を含む、
ことを特徴とするコンピュータプログラム。 - 請求項21に記載のコンピュータプログラムを記憶したコンピュータ可読記憶媒体。
- オーディオ/ビデオ信号のサンプルへのピラミッドベクトル量子化デインデクシングのための復号器(60)であって、
入力ビットストリーム(2')から、第1の符号語としての先行符号(15')及び第2の符号語としての入力インデックス(25')を受信するための受信器(880)と、
ここで、前記先行符号及び前記入力インデックスはオーディオ/ビデオ信号のサンプルを表し、
前記先行符号(15')は、前記オーディオ/ビデオ信号のサンプルを表す生成されるべき整数出力ベクトル(6')における、終端非零係数の符号であり、
前記整数出力ベクトルは、複数の整数値係数を有し、
前記終端非零係数は、前記整数出力ベクトル(6')における最初の非零係数であり、
変形ピラミッドベクトル量子化列挙解除方式を用いて、前記入力インデックスを前記整数出力ベクトル(6')にデインデクシングするためのデインデクシングモジュール(882)と、
ここで、前記入力インデックスは、前記終端非零係数の前記符号を無視する列挙方式により生成され、
変形整数出力ベクトルを生成するために、受信された前記先行符号(15')に従って、前記整数出力ベクトル(6')における前記終端非零係数に符号を割り当てるための割り当てモジュール(884)と、
前記変形整数出力ベクトルを出力するための出力モジュール(886)と、
を有することを特徴とする復号器。 - 請求項10から20のいずれか1項又は請求項23に記載の復号器を有することを特徴とするネットワークノード。
- 請求項10から20のいずれか1項又は請求項23に記載の復号器を有することを特徴とするユーザ端末。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019181619A JP6909265B2 (ja) | 2014-02-27 | 2019-10-01 | オーディオ/ビデオサンプルベクトルのピラミッドベクトル量子化インデクシング及びデインデクシングの方法及び装置 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201461945403P | 2014-02-27 | 2014-02-27 | |
US61/945,403 | 2014-02-27 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016544453A Division JP6389525B2 (ja) | 2014-02-27 | 2015-02-26 | オーディオ/ビデオサンプルベクトルのピラミッドベクトル量子化インデクシング及びデインデクシングの方法及び装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019181619A Division JP6909265B2 (ja) | 2014-02-27 | 2019-10-01 | オーディオ/ビデオサンプルベクトルのピラミッドベクトル量子化インデクシング及びデインデクシングの方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019035962A JP2019035962A (ja) | 2019-03-07 |
JP6598947B2 true JP6598947B2 (ja) | 2019-10-30 |
Family
ID=52774513
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016544453A Active JP6389525B2 (ja) | 2014-02-27 | 2015-02-26 | オーディオ/ビデオサンプルベクトルのピラミッドベクトル量子化インデクシング及びデインデクシングの方法及び装置 |
JP2018153568A Active JP6598947B2 (ja) | 2014-02-27 | 2018-08-17 | オーディオ/ビデオサンプルベクトルのピラミッドベクトル量子化インデクシング及びデインデクシングの方法及び装置 |
JP2019181619A Active JP6909265B2 (ja) | 2014-02-27 | 2019-10-01 | オーディオ/ビデオサンプルベクトルのピラミッドベクトル量子化インデクシング及びデインデクシングの方法及び装置 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016544453A Active JP6389525B2 (ja) | 2014-02-27 | 2015-02-26 | オーディオ/ビデオサンプルベクトルのピラミッドベクトル量子化インデクシング及びデインデクシングの方法及び装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019181619A Active JP6909265B2 (ja) | 2014-02-27 | 2019-10-01 | オーディオ/ビデオサンプルベクトルのピラミッドベクトル量子化インデクシング及びデインデクシングの方法及び装置 |
Country Status (12)
Country | Link |
---|---|
US (5) | US9774854B2 (ja) |
EP (2) | EP3111560B1 (ja) |
JP (3) | JP6389525B2 (ja) |
KR (4) | KR102202260B1 (ja) |
CN (3) | CN109905718B (ja) |
CA (1) | CA2940382C (ja) |
DK (1) | DK3111560T3 (ja) |
ES (1) | ES2880779T3 (ja) |
PL (1) | PL3111560T3 (ja) |
PT (1) | PT3111560T (ja) |
TW (3) | TWI683547B (ja) |
WO (1) | WO2015130210A1 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10045014B2 (en) * | 2013-07-15 | 2018-08-07 | Mediatek Singapore Pte. Ltd. | Method of disparity derived depth coding in 3D video coding |
PL3111560T3 (pl) * | 2014-02-27 | 2021-12-06 | Telefonaktiebolaget Lm Ericsson (Publ) | Sposób i urządzenie do indeksowania i deindeksowania wektorów próbek audio/wideo piramidowej kwantyzacji wektorowej |
RU2665898C2 (ru) | 2014-07-28 | 2018-09-04 | Телефонактиеболагет Лм Эрикссон (Пабл) | Поиск формы пирамидального векторного квантователя |
US10366698B2 (en) | 2016-08-30 | 2019-07-30 | Dts, Inc. | Variable length coding of indices and bit scheduling in a pyramid vector quantizer |
EP3555885B1 (en) * | 2016-12-16 | 2020-06-24 | Telefonaktiebolaget LM Ericsson (PUBL) | Method and encoder for handling envelope representation coefficients |
US9959247B1 (en) | 2017-02-17 | 2018-05-01 | Google Llc | Permuting in a matrix-vector processor |
US10586546B2 (en) | 2018-04-26 | 2020-03-10 | Qualcomm Incorporated | Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding |
US10573331B2 (en) * | 2018-05-01 | 2020-02-25 | Qualcomm Incorporated | Cooperative pyramid vector quantizers for scalable audio coding |
CN108833927B (zh) * | 2018-05-03 | 2019-08-16 | 北京大学深圳研究生院 | 一种基于删除量化矩阵中0元素的点云属性压缩方法 |
US10734006B2 (en) * | 2018-06-01 | 2020-08-04 | Qualcomm Incorporated | Audio coding based on audio pattern recognition |
CN109003615B (zh) * | 2018-08-27 | 2020-12-25 | 合肥工业大学 | 语音流嵌入信息方法及装置、语音流解码信息方法及装置 |
US10727868B2 (en) * | 2018-12-03 | 2020-07-28 | Samsung Electronics Co., Ltd. | Apparatus and method for offset optimization for low-density parity-check (LDPC) code |
US20200402523A1 (en) * | 2019-06-24 | 2020-12-24 | Qualcomm Incorporated | Psychoacoustic audio coding of ambisonic audio data |
KR102532567B1 (ko) * | 2020-12-31 | 2023-05-16 | 세메스 주식회사 | 기판형 센서, 및 약액의 탄착점 및 타력 측정 방법 |
CN118097918A (zh) * | 2024-04-17 | 2024-05-28 | 深圳富华消防电力安全技术有限公司 | 一种用于消防火灾智能监测报警方法及系统 |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
JP3246715B2 (ja) * | 1996-07-01 | 2002-01-15 | 松下電器産業株式会社 | オーディオ信号圧縮方法,およびオーディオ信号圧縮装置 |
NO307240B1 (no) * | 1997-07-28 | 2000-02-28 | Fast Search & Transfer As | Fremgangsmate ved kompresjonskoding |
US6006179A (en) | 1997-10-28 | 1999-12-21 | America Online, Inc. | Audio codec using adaptive sparse vector quantization with subband vector classification |
EP1080464B1 (de) * | 1998-05-29 | 2003-01-29 | Siemens Aktiengesellschaft | Verfahren und anordnung zur sprachcodierung |
US6463407B2 (en) * | 1998-11-13 | 2002-10-08 | Qualcomm Inc. | Low bit-rate coding of unvoiced segments of speech |
US6882685B2 (en) * | 2001-09-18 | 2005-04-19 | Microsoft Corporation | Block transform and quantization for image and video coding |
EP1296524A1 (en) * | 2001-09-20 | 2003-03-26 | STMicroelectronics S.r.l. | Process and apparatus for the compression of digital video signals, a system and a computer program product therefor |
KR100487719B1 (ko) | 2003-03-05 | 2005-05-04 | 한국전자통신연구원 | 광대역 음성 부호화를 위한 엘에스에프 계수 벡터 양자화기 |
US8238424B2 (en) * | 2007-02-09 | 2012-08-07 | Microsoft Corporation | Complexity-based adaptive preprocessing for multiple-pass video compression |
TWI388218B (zh) * | 2007-10-30 | 2013-03-01 | Nippon Telegraph & Telephone | 影像編碼方法與解碼方法、其程式及記錄有程式的記錄媒體 |
WO2010031131A1 (en) * | 2008-09-18 | 2010-03-25 | Commonwealth Scientific And Industrial Research Organisation | Vector quantization in wireless communication |
CN102081926B (zh) * | 2009-11-27 | 2013-06-05 | 中兴通讯股份有限公司 | 格型矢量量化音频编解码方法和系统 |
CN102081927B (zh) * | 2009-11-27 | 2012-07-18 | 中兴通讯股份有限公司 | 一种可分层音频编码、解码方法及系统 |
CN102158692B (zh) * | 2010-02-11 | 2013-02-13 | 华为技术有限公司 | 编码方法、解码方法、编码器和解码器 |
JPWO2011158657A1 (ja) * | 2010-06-17 | 2013-08-19 | シャープ株式会社 | 画像フィルタ装置、復号装置、符号化装置、および、データ構造 |
WO2012005210A1 (ja) * | 2010-07-05 | 2012-01-12 | 日本電信電話株式会社 | 符号化方法、復号方法、装置、プログラムおよび記録媒体 |
US8879634B2 (en) * | 2010-08-13 | 2014-11-04 | Qualcomm Incorporated | Coding blocks of data using one-to-one codes |
WO2012026741A2 (ko) * | 2010-08-24 | 2012-03-01 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
CN102081936B (zh) * | 2011-02-23 | 2012-06-06 | 凌阳科技股份有限公司 | 资料还原方法与装置 |
US8838442B2 (en) * | 2011-03-07 | 2014-09-16 | Xiph.org Foundation | Method and system for two-step spreading for tonal artifact avoidance in audio coding |
WO2012122299A1 (en) * | 2011-03-07 | 2012-09-13 | Xiph. Org. | Bit allocation and partitioning in gain-shape vector quantization for audio coding |
US8694474B2 (en) * | 2011-07-06 | 2014-04-08 | Microsoft Corporation | Block entropy encoding for word compression |
US9591304B2 (en) * | 2011-11-08 | 2017-03-07 | Tektronix, Inc. | Evaluation of perceptual visual quality |
US9560386B2 (en) * | 2013-02-21 | 2017-01-31 | Mozilla Corporation | Pyramid vector quantization for video coding |
JP6313981B2 (ja) * | 2014-01-22 | 2018-04-18 | 株式会社デンソーテン | レーダ装置、車両制御システム、および、信号処理方法 |
PL3111560T3 (pl) * | 2014-02-27 | 2021-12-06 | Telefonaktiebolaget Lm Ericsson (Publ) | Sposób i urządzenie do indeksowania i deindeksowania wektorów próbek audio/wideo piramidowej kwantyzacji wektorowej |
US9747910B2 (en) * | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
US20160093308A1 (en) * | 2014-09-26 | 2016-03-31 | Qualcomm Incorporated | Predictive vector quantization techniques in a higher order ambisonics (hoa) framework |
US10366698B2 (en) * | 2016-08-30 | 2019-07-30 | Dts, Inc. | Variable length coding of indices and bit scheduling in a pyramid vector quantizer |
-
2015
- 2015-02-26 PL PL15713034T patent/PL3111560T3/pl unknown
- 2015-02-26 ES ES15713034T patent/ES2880779T3/es active Active
- 2015-02-26 KR KR1020207019133A patent/KR102202260B1/ko active IP Right Grant
- 2015-02-26 KR KR1020217000213A patent/KR102280943B1/ko active IP Right Grant
- 2015-02-26 KR KR1020167025059A patent/KR101790463B1/ko active IP Right Grant
- 2015-02-26 EP EP15713034.5A patent/EP3111560B1/en active Active
- 2015-02-26 DK DK15713034.5T patent/DK3111560T3/da active
- 2015-02-26 KR KR1020177028833A patent/KR102132522B1/ko active IP Right Grant
- 2015-02-26 CN CN201910206562.4A patent/CN109905718B/zh active Active
- 2015-02-26 CN CN201580007694.4A patent/CN105993178B/zh active Active
- 2015-02-26 EP EP21175532.7A patent/EP3917016B1/en active Active
- 2015-02-26 PT PT157130345T patent/PT3111560T/pt unknown
- 2015-02-26 CA CA2940382A patent/CA2940382C/en active Active
- 2015-02-26 CN CN201910206563.9A patent/CN110033779B/zh active Active
- 2015-02-26 JP JP2016544453A patent/JP6389525B2/ja active Active
- 2015-02-26 WO PCT/SE2015/050216 patent/WO2015130210A1/en active Application Filing
- 2015-02-26 US US14/434,058 patent/US9774854B2/en active Active
- 2015-03-02 TW TW106109124A patent/TWI683547B/zh active
- 2015-03-02 TW TW109106451A patent/TWI768295B/zh active
- 2015-03-02 TW TW104106553A patent/TWI587640B/zh active
-
2017
- 2017-06-01 US US15/610,708 patent/US10158854B2/en active Active
-
2018
- 2018-08-17 JP JP2018153568A patent/JP6598947B2/ja active Active
- 2018-10-25 US US16/170,346 patent/US10404984B2/en active Active
-
2019
- 2019-07-16 US US16/512,587 patent/US10715807B2/en active Active
- 2019-10-01 JP JP2019181619A patent/JP6909265B2/ja active Active
-
2020
- 2020-06-03 US US16/891,764 patent/US10841584B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6598947B2 (ja) | オーディオ/ビデオサンプルベクトルのピラミッドベクトル量子化インデクシング及びデインデクシングの方法及び装置 | |
ES2718049T3 (es) | Búsqueda de forma de cuantificador de vector en pirámide | |
JP2019124947A (ja) | スペクトルピーク位置の符号化及び復号化 | |
KR102615901B1 (ko) | 디지털 오디오 신호에서의 차분 데이터 | |
KR102296153B1 (ko) | 전용 산술 인코딩 명령 | |
US20240137045A1 (en) | Noniterative entropy coding | |
BR112019008054B1 (pt) | Métodos para tratar coeficientes de representação de envelope de entrada e coeficientes residuais de representação de envelope, codificador, e, decodificador |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180906 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180906 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190902 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191001 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6598947 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |