JP6962445B2 - 符号化装置、符号化方法、プログラム、および記録媒体 - Google Patents
符号化装置、符号化方法、プログラム、および記録媒体 Download PDFInfo
- Publication number
- JP6962445B2 JP6962445B2 JP2020503413A JP2020503413A JP6962445B2 JP 6962445 B2 JP6962445 B2 JP 6962445B2 JP 2020503413 A JP2020503413 A JP 2020503413A JP 2020503413 A JP2020503413 A JP 2020503413A JP 6962445 B2 JP6962445 B2 JP 6962445B2
- Authority
- JP
- Japan
- Prior art keywords
- integer
- series
- quantization
- bit allocation
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 52
- 238000013139 quantization Methods 0.000 claims description 279
- 238000001228 spectrum Methods 0.000 claims description 214
- 238000006243 chemical reaction Methods 0.000 claims description 127
- 230000003595 spectral effect Effects 0.000 claims description 37
- 230000010354 integration Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 description 36
- 230000005236 sound signal Effects 0.000 description 23
- 238000010586 diagram Methods 0.000 description 12
- 238000000926 separation method Methods 0.000 description 9
- 230000009466 transformation Effects 0.000 description 9
- 238000007906 compression Methods 0.000 description 7
- 230000006835 compression Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000005538 encapsulation Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
この発明の第一実施形態のシステムは、符号化装置および復号装置を含む。符号化装置は、所定の時間長のフレーム単位で入力された時間領域の音信号を符号化して符号を得て出力する。符号化装置が出力する符号は復号装置へ入力される。復号装置は入力された符号を復号してフレーム単位の時間領域の音信号を出力する。符号化装置に入力される音信号は、例えば、音声や音楽などの音をマイクロホンで収音し、AD変換して得られた音声信号又は音響信号である。また、復号装置が出力した音信号は、例えば、DA変換され、スピーカで再生されることで、受聴可能とされる。
図3及び図4を参照して、第一実施形態の符号化装置の処理手続きを説明する。図3に例示するように、第一実施形態の符号化装置100は、周波数領域変換部10、量子化幅取得部11、量子化部12、整数変換部13、ビット割当部14、整数符号化部15、及び多重化部16を含む。第一実施形態の符号化装置100が図4に示す各ステップの処理を実行することにより第一実施形態の符号化方法が実現される。符号化装置100に入力された時間領域の音信号は周波数領域変換部10へ入力される。符号化装置100は、各部で所定の時間長のフレーム単位での処理を行う。
周波数領域変換部10には、符号化装置100に入力された時間領域の音信号が入力される。周波数領域変換部10は、所定の時間長のフレーム単位で、入力された時間領域の音信号を例えば修正離散コサイン変換(MDCT)などで周波数領域のN点の周波数スペクトル系列X0,X1,…,XN-1に変換して出力する(ステップS10)。Nは正の整数であり、例えば予め定めた値でありN=32などである。また、Xに下付きで付してある添え字は周波数の低いスペクトルから順に振られている番号である。周波数領域への変換方法として、MDCTではない様々な公知の変換方法等(例えば、離散フーリエ変換、短時間フーリエ変換等)を用いてもよい。
量子化幅取得部11には、周波数領域変換部10が出力した周波数スペクトル系列X0,X1,…,XN-1が入力される。量子化幅取得部11は、入力された周波数スペクトル系列X0,X1,…,XN-1を割り算するための値である量子化幅sと当該量子化幅sに対応する量子化幅符号CQとを出力する(ステップS11)。量子化幅取得部11は、従来的な方法で、例えば、予め用意してある量子化幅の候補の中で、入力された周波数スペクトル系列X0,X1,…,XN-1のエネルギーや振幅の最大値に比例するような値に最も近い量子化幅をそのフレームでの量子化幅sとして決定することなどで量子化幅sを得て、得られた量子化幅sを量子化部12へ出力する。
量子化部12には、周波数領域変換部10が出力した周波数スペクトル系列X0,X1,…,XN-1、及び量子化幅取得部11が出力した量子化幅sが入力される。量子化部12は、入力された周波数スペクトル系列X0,X1,…,XN-1の各周波数スペクトル値を量子化幅sで割り算した結果の整数部分の値による系列である量子化スペクトル系列^X0,^X1,…,^XN-1を得て整数変換部13へ出力する(ステップS12)。
整数変換部13には、量子化部12が出力した量子化スペクトル系列^X0,^X1,…,^XN-1が入力される。整数変換部13は、pを2以上の整数とし、また、N'をpとN'の積がNとなる正の整数として、入力された量子化スペクトル系列^X0,^X1,…,^XN-1から所定の規則に従ってp個の整数値による整数組をN'組得て、それぞれの整数組について全単射な変換により1つの整数値である統合量子化スペクトルを得て、得たN'個の整数値(すなわち、統合量子化スペクトル)による系列である統合量子化スペクトル系列^Y0,^Y1,…,^YN'-1をビット割当部14、及び整数符号化部15に出力する(ステップS13)。
ビット割当部14には、整数変換部13が出力した統合量子化スペクトル系列^Y0,^Y1,…,^YN'-1が入力される。ビット割当部14は、例えば、統合量子化スペクトル系列^Y0,^Y1,…,^YN'-1の各統合量子化スペクトルに対応するビット割当値B0,B1,…,BN'-1によるビット割当系列B0,B1,…,BN'-1と当該ビット割当系列に対応するビット割当符号Cbとを得て、得られたビット割当系列B0,B1,…,BN'-1を整数符号化部15へ、ビット割当符号Cbを多重化部16へ、それぞれ出力する(ステップS14)。
整数符号化部15には、整数変換部13が出力した統合量子化スペクトル系列^Y0,^Y1,…,^YN'-1、及びビット割当部14が出力したビット割当系列B0,B1,…,BN'-1が入力される。整数符号化部15は、統合量子化スペクトル系列^Y0,^Y1,…,^YN'-1の各値を、それに対応するビット割当系列B0,B1,…,BN'-1の各ビット割当値のビット数の符号を得るように符号化して、統合量子化スペクトル系列^Y0,^Y1,…,^YN'-1の各値に対応する符号CX0,CX1,…,CXN'-1を得て、得た符号CX0,CX1,…,CXN'-1全てを合せたものである信号符号CXを多重化部16へ出力する(ステップS15)。
多重化部16は、量子化幅取得部11が出力した量子化幅符号CQと、ビット割当部14が出力したビット割当符号Cbと、整数符号化部15が出力した信号符号CXと、を受け取り、これらの符号全てを含む出力符号、例えば量子化幅符号CQとビット割当符号Cbと信号符号CXを繋ぎ合わせて得た出力符号、を出力する(ステップS16)。
図5及び図6を参照して、第一実施形態の復号装置の処理手続きを説明する。図5に例示するように、第一実施形態の復号装置200は、多重分離部20、ビット割当復号部21、整数復号部22、整数逆変換部23、逆量子化部24、時間領域変換部25を含む。第一実施形態の復号装置200が図6に示す各ステップの処理を実行することにより、第一実施形態の復号方法が実現される。復号装置200には符号化装置100が出力した符号が入力される。すなわち、復号装置200には符号化装置100が出力した出力符号が入力符号として入力される。復号装置200に入力された入力符号は多重分離部20へ入力される。復号装置200は、各部で所定の時間長のフレーム単位での処理を行う。
多重分離部20には、復号装置200に入力された入力符号が入力される。多重分離部20は、入力符号をフレーム毎に受け取り、入力符号を分離して、入力符号に含まれるビット割当符号Cbをビット割当復号部21へ、入力符号に含まれる量子化幅符号CQを逆量子化部24へ、入力符号に含まれる信号符号CXを整数復号部22へ、それぞれ出力する(ステップS20)。
ビット割当復号部21内の図示しない記憶部には、予め、対応する符号化装置100のビット割当部14の図示しない記憶部に記憶されているのと同じN'個の整数で構成される対数スペクトル包絡系列LC0,LC1,…,LCN'-1の複数個の候補について、各候補の対数スペクトル包絡系列LC0,LC1,…,LCN'-1と、各系列に対応する符号と、による組を記憶しておく。すなわち、ビット割当復号部21内の図示しない記憶部には、対数スペクトル包絡系列LC0,LC1,…,LCN'-1の候補と、当該対数スペクトル包絡系列LC0,LC1,…,LC N'-1の候補を特定可能な符号と、による組が複数組予め記憶されている。ビット割当復号部21には、多重分離部20が出力したビット割当符号Cbが入力される。ビット割当復号部21は、入力されたビット割当符号Cbに対応する対数スペクトル包絡系列LC0,LC1,…,LCN'-1の候補を記憶部から得て、得られた対数スペクトル包絡系列LC0,LC1,…,LCN'-1の候補をビット割当系列B0,B1,…,BN'-1として得て、得られたビット割当系列B0,B1,…,BN'-1を整数復号部22に出力する(ステップS21)。すなわち、ビット割当復号部21は、当該記憶部に予め記憶された複数個の組のうち、符号がビット割当符号Cbに対応する組を選択し、当該選択した組の対数スペクトル包絡系列の候補をビット割当系列B0,B1,…,BN'-1として得て、得られたビット割当系列B0,B1,…,BN'-1を整数復号部22に出力する。
整数復号部22には、多重分離部20が出力した信号符号CX、及びビット割当復号部21が出力したビット割当系列B0,B1,…,BN'-1が入力される。整数復号部22は、信号符号CXをビット割当系列B0,B1,…,BN'-1の各ビット割当値が示すビット数の符号CX0,CX1,…,CXN'-1に分けて、符号CX0,CX1,…,CXN'-1それぞれを復号して復号統合量子化スペクトル系列^Y0,^Y1,…,^YN'-1を得て、得た復号統合量子化スペクトル系列^Y0,^Y1,…,^YN'-1を整数逆変換部23へ出力する(ステップS22)。
整数逆変換部23には、整数復号部22が出力した復号統合量子化スペクトル系列^Y0,^Y1,…,^YN'-1が入力される。整数逆変換部23は、入力された復号統合量子化スペクトル系列^Y0,^Y1,…,^YN'-1に含まれる整数値それぞれについて第一実施形態の符号化装置100の整数変換部13が行った変換と逆の変換を行ってp個の整数値による整数組をN'組得て、得たN'組の整数組から第一実施形態の符号化装置100の整数変換部13が行った規則に対応する規則に従って復号量子化スペクトル系列^X0,^X1,…,^XN-1を得て出力する(ステップS23)。
逆量子化部24には、多重分離部20が出力した量子化幅符号CQと、整数逆変換部23が出力した復号量子化スペクトル系列^X0,^X1,…,^XN-1と、が入力される。逆量子化部24は、入力された量子化幅符号CQを復号して量子化幅sを得る。また、逆量子化部24は、入力された復号量子化スペクトル系列^X0,^X1,…,^XN-1の各復号量子化スペクトル値と、復号により得た量子化幅sとを掛け合わせて得た値の系列である復号周波数スペクトル系列XD0,XD1,…,XDN-1を得て時間領域変換部25に出力する(ステップS24)。
時間領域変換部25には、逆量子化部24が出力した復号周波数スペクトル系列XD0,XD1,…,XDN-1が入力される。時間領域変換部25は、フレーム毎に、復号周波数スペクトル系列XD0,XD1,…,XDN-1を、符号化装置100の周波数領域変換部10が行った周波数領域への変換方法に対応する時間領域への変換方法、例えば逆MDCT、を用いて時間領域の信号に変換してフレーム単位の音信号(復号音信号)を得て出力する(ステップS25)。
第一実施形態の符号化装置100では、周波数スペクトル系列X0,X1,…,XN-1を量子化する前に得られた量子化幅sを用いて量子化(割り算)を行ってから整数変換を行うことにより得た統合量子化スペクトル系列を整数符号化部15で符号化して信号符号CXを得ていた。第一実施形態の符号化装置100では、整数符号化部15が各統合量子化スペクトル値^Ykを二進数で表した符号を得ることから、統合量子化スペクトル値^Ykによっては得た符号のビット数がビット割当値Bk、すなわち、想定していた上限ビット数、を超えてしまう場合がある。その場合、対応する復号装置200では正しく復号できなくなってしまうことから、符号化装置で量子化幅を大きくして量子化、及び符号化をしなおすことにより整数符号化部が得る符号のビット数を少なくしてビット割当値Bkを超えないようにすることが可能であるが、量子化幅が大きすぎると量子化が粗くなりすぎ、復号信号の精度の低下につながる。つまり符号化装置は、整数符号化部が得る符号のビット数がビット割当値を超えない中で最小の量子化幅を用いるのがよい。そこで第一実施形態の変形例の符号化装置101は、各フレームにおいて反復的に量子化、整数変換、及び符号化を行い、その都度量子化幅を調節して更新することで最適な量子化幅を得る。
変形例の量子化幅取得部11は、第一実施形態の量子化幅取得部11と同様に量子化幅sを得て、得られた量子化幅sを量子化部12、及び量子化幅更新部17へ出力する。この量子化幅sが量子化部12の処理で用いられる量子化幅の初期値となる(ステップS11)。
変形例の量子化部12は、周波数領域変換部10が出力した周波数スペクトル系列X0,X1,…,XN-1、及び量子化幅取得部11或いは量子化幅更新部17が出力した量子化幅sを用いて、第一実施形態の量子化部12と同様に、入力された周波数スペクトル系列X0,X1,…,XN-1の各周波数スペクトル値を量子化幅sで割り算した結果の整数部分の値による系列である量子化スペクトル系列^X0,^X1,…,^XN-1を得て整数変換部13へ出力する(ステップS12)。ここで、量子化部12が各フレームでの初回に実行される際に用いられる量子化幅sは、量子化幅取得部11が得た量子化幅s、すなわち量子化幅の初期値である。また、量子化部12が2回目以降に実行される際に用いられる量子化幅sは、量子化幅更新部17が得た量子化幅s、すなわち量子化幅の更新値である。
変形例のビット割当部14は、まず、第一実施形態のビット割当部14と同じ処理により、入力された統合量子化スペクトル系列^Y0,^Y1,…,^YN'-1の各統合量子化スペクトルに対応するビット割当系列B0,B1,…,BN'-1と当該ビット割当系列に対応するビット割当符号Cbとを得る(ステップS14−1)。
量子化幅更新部17は、ビット割当部14が出力した最大不足ビット数Bを受け取り、Bが正の場合、つまり統合量子化スペクトル系列^Y0,^Y1,…,^YN'-1に割り当てるべきビット数が不足している場合には量子化幅sの値を大きな値に更新し、Bが負の場合、つまり統合量子化スペクトル系列^Y0,^Y1,…,^YN'-1に割り当てるべきビット数が余っている場合には量子化幅sの値を小さな値に更新し、さらに、量子化幅の更新回数をインクリメントし、更新後の量子化幅sの値(量子化幅sの更新値)を量子化部12へ出力する(ステップS17−1)。
上記第一実施形態の変形例の符号化装置101によれば、量子化幅更新部17において、整数符号化部15において統合量子化スペクトル系列^Y0,^Y1,…,^YN'-1をビット割当部14にて定めたビット数で表現できる量子化幅の中での最小の値を反復的に求め、量子化幅の値を決定することで、量子化歪みの小さい符号化を行うことができる。しかしこの場合には、量子化部12、ビット割当部14、及び整数変換部13の処理を複数回行う必要があり、演算量が多く必要となる可能性がある。量子化部12、ビット割当部14、及び整数変換部13の処理を複数回行う必要があるのは、量子化部12が周波数スペクトル系列X0,X1,…,XN-1を量子化してみなければ、その量子化後の整数値の系列である量子化スペクトル系列^X0,^X1,…,^XN-1を変換した統合量子化スペクトル系列^Y0,^Y1,…,^YN'-1を得られないことに起因する。そこで第二実施形態の符号化装置は、量子化前に、整数符号化部に入力され得る統合量子化スペクトル系列^Y0,^Y1,…,^YN'-1の形状、つまり統合量子化スペクトル系列の大まかな大小関係を推定する符号化対象推定部を用いて、ビット割当部によるビット割り当てと同時に量子化幅取得部で量子化幅を決定することにより、ビット割当部、整数変換部の処理を複数回行う必要なく適切な量子化幅の値を決定する。
図9及び図10を参照して、第二実施形態の符号化装置の処理手続きを説明する。図9に例示するように、第二実施形態の符号化装置102は、周波数領域変換部10、符号化対象推定部18、量子化幅取得部11、量子化部12、整数変換部13、ビット割当部14、整数符号化部15、及び多重化部16を含む。図9の第二実施形態の符号化装置102が図3の第一実施形態の符号化装置100と異なるのは、符号化対象推定部18を備え、周波数領域変換部10が周波数スペクトル系列を符号化対象推定部18にも出力し、ビット割当部14が符号化対象推定部18の出力を入力とした動作をし、量子化幅取得部11が符号化対象推定部18、及びビット割当部14の出力を入力とした動作をするところである。第二実施形態の符号化装置102のその他の構成、すなわち、量子化部12、整数変換部13、整数符号化部15の動作は第一実施形態の符号化装置100のものと同様である。以下、第一実施形態の符号化装置100と異なる点についてのみ説明する。
第二実施形態の周波数領域変換部10は、第一実施形態の符号化装置100の周波数領域変換部10と同じ動作をするが、出力先のみが異なる。周波数領域変換部10は、フレーム単位で、符号化装置102に入力された時間領域の音信号を周波数領域のN点の周波数スペクトル系列X0,X1,…,XN-1に変換して量子化部12、及び符号化対象推定部18へ出力する(ステップS10)。第一実施形態と同様に、Nは予め定めた正の数pとN'の積で表されているものとする。
符号化対象推定部18には、周波数領域変換部10が出力した周波数スペクトル系列X0,X1,…,XN-1が入力される。符号化対象推定部18は、入力された周波数スペクトル系列X0,X1,…,XN-1から整数変換部13と同じ規則に従ってp個の整数値による整数組をN'組得て、それぞれの整数組について整数変換部13が行う全単射な変換と同じ変換またはその変換前後の値の大小関係を近似する変換により1つの整数値である推定統合スペクトルを得て、得たN'個の整数値(すなわち、推定統合スペクトル)による系列である推定統合スペクトル系列~Y0,~Y1,…,~YN'-1をビット割当部14、及び量子化幅取得部11に出力する(ステップS18)。整数変換部13が行うのと同じ変換を行う場合には、例えば、それぞれの整数組について代数的に表現可能な全単射な変換により1つの整数値を得る方法として、整数変換部13と同じ式(1)と式(2)による変換や、式(2)から式(4)による変換を、例えば用いる。また、式(1)や式(4)はその第一項、つまり入力をp乗している項の値が支配的であり、量子化幅の取得に際しては、統合量子化スペクトル系列^Y0,^Y1,…,^YN'-1の形状、つまり、量子化スペクトル系列^X0,^X1,…,^XN-1を整数変換して得られる統合量子化スペクトル系列^Y0,^Y1,…,^YN'-1における統合量子化スペクトルの値の大小関係が求められることが重要であることから、整数変換部13が式(1)と式(2)による変換を行う場合には、符号化対象推定部18での変換は、全単射ではないが、整数変換部13が行う変換の変換前後の値の大小関係を近似する変換として、式(1)に代えて式(1)の右辺を第一項のみとした式を用いてもよい。同様に、整数変換部13が式(2)から式(4)による変換を行う場合には、符号化対象推定部18での変換は、整数変換部13が行う変換の変換前後の値の大小関係を近似する変換として、式(4)に代えて式(4)の右辺を第一項のみとした式を用いてもよい。
第二実施形態のビット割当部14には、符号化対象推定部18が出力した推定統合スペクトル系列~Y0,~Y1,…,~YN'-1が入力される。ビット割当部14は例えば、推定統合スペクトル系列~Y0,~Y1,…,~YN'-1の各推定統合スペクトルに対応するビット割当値B0,B1,…,BN'-1による系列であるビット割当系列B0,B1,…,BN'-1と当該ビット割当系列に対応するビット割当符号Cbとを得て、得られたビット割当系列B0,B1,…,BN'-1を整数符号化部15と量子化幅取得部11へ、ビット割当符号Cbを多重化部16へ、それぞれ出力する(ステップS14)。
第二実施形態の量子化幅取得部11には、符号化対象推定部18が出力した推定統合スペクトル系列~Y0,~Y1,…,~YN'-1と、ビット割当部14が出力したビット割当系列B0,B1,…,BN'-1と、が入力される。量子化幅取得部11は、推定統合スペクトル系列~Y0,~Y1,…,~YN'-1とビット割当系列B0,B1,…,BN'-1から量子化幅sと量子化幅sに対応する符号である量子化幅符号CQを得、得た量子化幅sを量子化部12へ、量子化幅符号CQを多重化部16へそれぞれ出力する(ステップS11)。
第二実施形態の多重化部16は、量子化幅取得部11が出力した量子化幅符号CQ、及びビット割当部14が出力したビット割当符号Cbと、整数符号化部15が出力した信号符号CXとを受け取り、これらの符号全てを含む出力符号(例えば全ての符号を繋ぎ合わせて得た出力符号)を、出力する(ステップS16)。
上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
Claims (8)
- 所定時間区間のフレーム毎に周波数スペクトル系列を符号化する符号化装置であって、
上記周波数スペクトル系列の各周波数スペクトル値を量子化幅sで除算して整数値による系列である量子化スペクトル系列を得る量子化部と、
上記量子化スペクトル系列に含まれる量子化スペクトルを所定の規則に従って複数個(p個)ずつ纏めてN'組の整数値による組を得て、上記N'組の整数値による組のそれぞれについて、全単射な変換により、1つの整数値(以下、「変換後整数」という)を得ることにより、N'個の統合量子化スペクトルによる統合量子化スペクトル系列を得る整数変換部と、
上記統合量子化スペクトル系列に含まれるN'個の統合量子化スペクトルそれぞれを、ビット割当系列に含まれるN'個のビット割当値で符号化して、整数符号を得る整数符号化部と、
を含み、
上記周波数スペクトル系列から、上記整数変換部による変換と同一の変換、または、上記整数変換部による変換の変換前後の値の大小関係を近似する変換、により、N'個の推定統合スペクトルによる推定統合スペクトル系列を得る符号化対象推定部と、
上記推定統合スペクトル系列から、上記ビット割当系列と、上記ビット割当系列に対応するビット割当符号と、を得るビット割当部と、
上記推定統合スペクトル系列と上記ビット割当系列とから、上記量子化幅sを得る量子化幅取得部と、
をさらに含む符号化装置。 - 請求項1に記載の符号化装置であって、
上記ビット割当部は、
複数個のビット割当系列の候補のうちの、ビット割当系列の各ビット割当値を指数とした2のべき乗の系列の形状が上記推定統合スペクトル系列の形状に最も近い候補を上記ビット割当系列として得るものであり、
上記量子化幅取得部は、
上記推定統合スペクトル系列の各推定統合スペクトル値を、上記ビット割当系列のうちの対応するビット割当値を指数とした2のべき乗の値で、除算して除算結果の系列を得て、上記除算結果の系列の各値の振幅のうちの最大値のp乗根以上かつ該p乗根の近傍の値を量子化幅sとして決定するものである、
符号化装置。 - 請求項1又は2に記載の符号化装置であって、
上記整数変換部は、Mを上記整数値による組に含まれる整数値の個数とし、x1,x2,…,xMを上記整数値による組に含まれる整数値とし、x'iを上記整数値xiについての次式を満たす非負整数値とし、
- 所定時間区間のフレーム毎に周波数スペクトル系列を符号化する符号化方法であって、
量子化部が、上記周波数スペクトル系列の各周波数スペクトル値を量子化幅sで除算して整数値による系列である量子化スペクトル系列を得る量子化ステップと、
整数変換部が、上記量子化スペクトル系列に含まれる量子化スペクトルを所定の規則に従って複数個(p個)ずつ纏めてN'組の整数値による組を得て、上記N'組の整数値による組のそれぞれについて、全単射な変換により、1つの整数値(以下、「変換後整数」という)を得ることにより、N'個の統合量子化スペクトルによる統合量子化スペクトル系列を得る整数変換ステップと、
整数符号化部が、上記統合量子化スペクトル系列に含まれるN'個の統合量子化スペクトルそれぞれを、ビット割当系列に含まれるN'個のビット割当値で符号化して、整数符号を得る整数符号化ステップと、
を含み、
符号化対象推定部が、上記周波数スペクトル系列から、上記整数変換ステップによる変換と同一の変換、または、上記整数変換ステップによる変換の変換前後の値の大小関係を近似する変換、により、N'個の推定統合スペクトルによる推定統合スペクトル系列を得る符号化対象推定ステップと、
ビット割当部が、上記推定統合スペクトル系列から、上記ビット割当系列と、上記ビット割当系列に対応するビット割当符号と、を得るビット割当ステップと、
量子化幅取得部が、上記推定統合スペクトル系列と上記ビット割当系列とから、上記量子化幅sを得る量子化幅取得ステップと、
をさらに含む符号化方法。 - 請求項4に記載の符号化方法であって、
上記ビット割当ステップは、
複数個のビット割当系列の候補のうちの、ビット割当系列の各ビット割当値を指数とした2のべき乗の系列の形状が上記推定統合スペクトル系列の形状に最も近い候補を上記ビット割当系列として得、
上記量子化幅取得ステップは、
上記推定統合スペクトル系列の各推定統合スペクトル値を、上記ビット割当系列のうちの対応するビット割当値を指数とした2のべき乗の値で、除算して除算結果の系列を得て、上記除算結果の系列の各値の振幅のうちの最大値のp乗根以上かつ該p乗根の近傍の値を量子化幅sとして決定する、
符号化方法。 - 請求項4又は5に記載の符号化方法であって、
上記整数変換ステップは、Mを上記整数値による組に含まれる整数値の個数とし、x1,x2,…,xMを上記整数値による組に含まれる整数値とし、x'iを上記整数値xiについての次式を満たす非負整数値とし、
- 請求項4から6の何れかに記載の符号化方法の各ステップをコンピュータに実行させるためのプログラム。
- 請求項4から6の何れかに記載の符号化方法の各ステップをコンピュータに実行させるためのプログラムが記録されたコンピュータ読み取り可能な記録媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018037313 | 2018-03-02 | ||
JP2018037313 | 2018-03-02 | ||
PCT/JP2019/005947 WO2019167706A1 (ja) | 2018-03-02 | 2019-02-19 | 符号化装置、符号化方法、プログラム、および記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019167706A1 JPWO2019167706A1 (ja) | 2021-02-04 |
JP6962445B2 true JP6962445B2 (ja) | 2021-11-05 |
Family
ID=67806178
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020503413A Active JP6962445B2 (ja) | 2018-03-02 | 2019-02-19 | 符号化装置、符号化方法、プログラム、および記録媒体 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11621010B2 (ja) |
EP (1) | EP3761313B1 (ja) |
JP (1) | JP6962445B2 (ja) |
WO (1) | WO2019167706A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110771045B (zh) * | 2017-06-22 | 2024-03-29 | 日本电信电话株式会社 | 编码装置、解码装置、编码方法、解码方法、以及记录介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2450265T3 (es) * | 2006-11-14 | 2014-03-24 | Nippon Telegraph & Telephone Corporation | Método de codificación y método de decodificación de señal de imagen, método de codificación y método de decodificación de fuente de información, dispositivos para ellos, sus programas, y medio de memoria con programa registrado |
US8386271B2 (en) * | 2008-03-25 | 2013-02-26 | Microsoft Corporation | Lossless and near lossless scalable audio codec |
TWI488176B (zh) * | 2011-02-14 | 2015-06-11 | Fraunhofer Ges Forschung | 音訊信號音軌脈衝位置之編碼與解碼技術 |
EP2696343B1 (en) * | 2011-04-05 | 2016-12-21 | Nippon Telegraph And Telephone Corporation | Encoding an acoustic signal |
JP2013174689A (ja) * | 2012-02-24 | 2013-09-05 | Sony Corp | オーディオ符号化装置、オーディオ符号化方法、およびプログラム |
-
2019
- 2019-02-19 JP JP2020503413A patent/JP6962445B2/ja active Active
- 2019-02-19 EP EP19761258.3A patent/EP3761313B1/en active Active
- 2019-02-19 WO PCT/JP2019/005947 patent/WO2019167706A1/ja active Application Filing
- 2019-02-19 US US16/971,977 patent/US11621010B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP3761313B1 (en) | 2023-01-18 |
EP3761313A1 (en) | 2021-01-06 |
US11621010B2 (en) | 2023-04-04 |
US20200402524A1 (en) | 2020-12-24 |
JPWO2019167706A1 (ja) | 2021-02-04 |
EP3761313A4 (en) | 2021-11-24 |
CN111788628A (zh) | 2020-10-16 |
WO2019167706A1 (ja) | 2019-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107316646B (zh) | 编码方法、编码装置以及记录介质 | |
US8606567B2 (en) | Signal encoding apparatus, signal decoding apparatus, signal processing system, signal encoding process method, signal decoding process method, and program | |
JP6509973B2 (ja) | 符号化方法、符号化装置、プログラム、および記録媒体 | |
CA2803272A1 (en) | Encoding method, decoding method, device, program, and recording medium | |
JP5694751B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 | |
US10325609B2 (en) | Coding and decoding a sound signal by adapting coefficients transformable to linear predictive coefficients and/or adapting a code book | |
JP6962445B2 (ja) | 符号化装置、符号化方法、プログラム、および記録媒体 | |
JP6411509B2 (ja) | 符号化方法、装置、プログラム及び記録媒体 | |
RU2633097C2 (ru) | Способы и устройства кодирования и декодирования сигнала | |
CA2792545A1 (en) | Coding method, decoding method, apparatus, program and recording medium | |
JP4359949B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP4734859B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
CN111788628B (zh) | 声音信号的编码装置、声音信号的编码方法以及记录介质 | |
JP6780108B2 (ja) | 符号化装置、復号装置、平滑化装置、逆平滑化装置、それらの方法、およびプログラム | |
JP2005265865A (ja) | オーディオ符号化のためのビット割り当て方法及び装置 | |
JP5840101B2 (ja) | 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 | |
US11501782B2 (en) | Encoder, decoder, encoding method, decoding method, program, and recording medium | |
EP4099573B1 (en) | Encoder, decoder, encoding method, decoding method and program | |
JP4626261B2 (ja) | 音声符号化装置及び音声符号化方法 | |
JP5786044B2 (ja) | 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 | |
WO2013146895A1 (ja) | 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200825 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200825 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210914 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210927 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6962445 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |