JP6032509B2 - 復号装置、復号方法、およびプログラム - Google Patents

復号装置、復号方法、およびプログラム Download PDF

Info

Publication number
JP6032509B2
JP6032509B2 JP2015225889A JP2015225889A JP6032509B2 JP 6032509 B2 JP6032509 B2 JP 6032509B2 JP 2015225889 A JP2015225889 A JP 2015225889A JP 2015225889 A JP2015225889 A JP 2015225889A JP 6032509 B2 JP6032509 B2 JP 6032509B2
Authority
JP
Japan
Prior art keywords
unit
value
codebook
quantization
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015225889A
Other languages
English (en)
Other versions
JP2016054523A (ja
Inventor
鈴木 志朗
志朗 鈴木
松村 祐樹
祐樹 松村
戸栗 康裕
康裕 戸栗
前田 祐児
祐児 前田
松本 淳
淳 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JP2016054523A publication Critical patent/JP2016054523A/ja
Application granted granted Critical
Publication of JP6032509B2 publication Critical patent/JP6032509B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/4031Fixed length to variable length coding
    • H03M7/4037Prefix coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本技術は、復号装置、復号方法、およびプログラムに関し、特に、ハフマン符号化と多次元符号化を組み合わせた符号化を行う場合に、符号化対象の所定の量子化値の出現確率を0に制限することにより、符号化効率を向上させることができるようにした復号装置、復号方法、およびプログラムに関する。
音響や画像のデジタルデータを圧縮・伸長するために、様々な符号化・復号化装置が考案・実用化されている。音響の圧縮方式の規格としては、例えばMP3(Moving Picture Experts Group Audio Layer-3)があり、画像の圧縮方式の規格としては、例えばJPEG(Joint Photographic Experts Group)がある。
また、符号化の代表的な手法としては、ハフマン符号化がある。ハフマン符号化では、例えば符号化対象の各量子化値の出現確率を学習し、出現確率が0ではない各量子化値に対して出現確率に応じた符号長の可変長符号を割り当てることにより作成された符号帳を用いて符号化が行われる。
このとき、出現確率の高い量子化値ほど短い符号長の可変長符号を割り当て、出現確率の低い量子化値ほど長い符号長の可変長符号を割り当てることにより、全ての量子化値に固定長符号を割り当てる場合に比べて、符号化効率を高めることができる。
また、量子化値を多次元化することで符号化効率を高めることもできる。例えば、デジタルデータが-1,0,+1の3値に量子化される場合、量子化値を固定長で符号化する際にかかるビット数は2ビットである。従って、4つの量子化値を個々に符号化する場合には、符号化にかかるビット数は、8(=2×4)ビットとなる。これに対して、4つの量子化値を多次元化してまとめて符号化する場合には、符号化単位の量子化値のパターン数は81(=34)となり、符号化にかかるビット数は7ビットで済む。
さらに、ハフマン符号化と多次元符号化を組み合わせることで、より効率的な符号化を実現できることが知られている。しかしながら、多次元符号化の次元数が大きくなるほど符号帳のサイズは大きくなる。
また、ハフマン符号化と多次元符号化を組み合わせた符号化において、符号化単位の量子化値が全て0である場合の符号化を工夫することにより、さらに符号化効率を向上させる方法も考案されている(例えば、特許文献1参照)。
特開2001−82878号公報
しかしながら、ハフマン符号化と多次元符号化を組み合わせた符号化において、符号化対象の所定の量子化値の出現確率を0に制限することにより、符号化効率を向上させることは考えられていなかった。
本技術は、このような状況に鑑みてなされたものであり、ハフマン符号化と多次元符号化を組み合わせた符号化を行う場合に、符号化対象の所定の量子化値の出現確率を0に制限することにより、符号化効率を向上させることができるようにするものである。
本技術の一側面の復号装置は、所定の量子化値の出現確率が0に制限された、符号化対象の信号に対応する学習用の信号の、前記所定の量子化値以外の複数の量子化値のそれぞれに対して、出現確率が低いほど長い符号長の可変長符号が割り当てられた符号帳である制限符号帳に基づいて符号化された、前記所定の量子化値の出現確率が0に制限された前記信号の量子化値、または、前記所定の量子化値の出現確率が制限されていない前記学習用の信号の複数の量子化値のそれぞれに対して、出現確率が低いほど長い符号長の可変長符号が割り当てられた符号帳である制限なし符号帳に基づいて符号化された、前記所定の量子化値の出現確率が制限されていない前記信号の量子化値と、前記符号化の際に前記制限が行われたかどうかを示す制限情報とを受け取る受け取り部と、前記制限情報が、前記制限が行われたことを示す場合、前記受け取り部により受け取られた前記所定の量子化値の出現確率が0に制限された前記信号の量子化値を、前記制限符号帳に基づいて復号し、前記制限情報が、前記制限が行われていないことを示す場合、前記受け取り部により受け取られた前記所定の量子化値の出現確率が0に制限されていない前記信号の量子化値を、前記制限なし符号帳に基づいて復号する復号部とを備える復号装置である。
本技術の一側面の復号方法およびプログラムは、本技術の一側面の復号装置に対応する。
本技術の一側面においては、所定の量子化値の出現確率が0に制限された、符号化対象の信号に対応する学習用の信号の、前記所定の量子化値以外の複数の量子化値のそれぞれに対して、出現確率が低いほど長い符号長の可変長符号が割り当てられた符号帳である制限符号帳に基づいて符号化された、前記所定の量子化値の出現確率が0に制限された前記信号の量子化値、または、前記所定の量子化値の出現確率が制限されていない前記学習用の信号の複数の量子化値のそれぞれに対して、出現確率が低いほど長い符号長の可変長符号が割り当てられた符号帳である制限なし符号帳に基づいて符号化された、前記所定の量子化値の出現確率が制限されていない前記信号の量子化値と、前記符号化の際に前記制限が行われたかどうかを示す制限情報とが受け取られ、前記制限情報が、前記制限が行われたことを示す場合、受け取られた前記所定の量子化値の出現確率が0に制限された前記信号の量子化値が、前記制限符号帳に基づいて復号され、前記制限情報が、前記制限が行われていないことを示す場合、受け取られた前記所定の量子化値の出現確率が0に制限されていない前記信号の量子化値が、前記制限なし符号帳に基づいて復号される。
本技術の一側面の復号装置は、独立した装置であっても良いし、1つの装置を構成している内部ブロックであっても良い。
本技術の一側面によれば、ハフマン符号化と多次元符号化を組み合わせた符号化を行う場合に、符号化対象の所定の量子化値の出現確率を0に制限することにより、符号化効率を向上させた符号を復号することができる。
本技術の前提となる符号化装置の第1の構成例を示すブロック図である。 本技術の前提となる復号装置の第1の構成例を示すブロック図である。 本技術の前提となる学習装置の第1の構成例を示すブロック図である。 量子化値Q'(量子化値Q)として取り得る値の例を示す図である。 符号帳CBにおいて割り当てられる可変長符号の例を示す図である。 図3の学習装置の作成処理を説明するフローチャートである。 本技術の前提となる符号化装置の第2の構成例を示すブロック図である。 本技術の前提となる復号装置の第2の構成例を示すブロック図である。 本技術の前提となる学習装置の第2の構成例を示すブロック図である。 符号帳CB1において割り当てられる可変長符号の例を示す図である。 符号帳CB2において割り当てられる可変長符号の例を示す図である。 本技術を適用した符号化装置の一実施の形態の構成例を示すブロック図である。 量子化値Q3として取り得る値の例を示す図である。 符号帳CB3において割り当てられる可変長符号の例を示す図である。 図12の符号化装置の符号化処理を説明するフローチャートである。 図1や図7の符号化装置において符号化される量子化値に対応する正規化スペクトルを示す図である。 図12の符号化装置において符号化される量子化値に対応する正規化スペクトルを示す図である。 本技術を適用した復号装置の一実施の形態の構成例を示すブロック図である。 図18の復号装置の復号処理を説明するフローチャートである。 符号帳CBと符号帳CB3を学習する学習装置の構成例を示すブロック図である。 図20の学習装置の作成処理を説明するフローチャートである。 コンピュータのハードウェアの構成例を示すブロック図である。
<本技術の前提>
[本技術の前提となる符号化装置の第1の構成例]
図1は、本技術の前提となる符号化装置の第1の構成例を示すブロック図である。
図1の符号化装置10は、スペクトル変換部11、正規化部12、量子化部13、符号化部14、出力部15、および符号帳記憶部16により構成される。符号化装置10は、入力された音響の時間信号Tに対して、ハフマン符号化と多次元符号化を組み合わせた符号化を行う。
具体的には、符号化装置10のスペクトル変換部11は、外部から入力された時間信号Tに対して時間周波数変換を行い、時間信号TをスペクトルSに変換する。スペクトル変換部11は、スペクトルSを正規化部12に供給する。
正規化部12は、スペクトル変換部11から供給されるスペクトルSから、所定の帯域ごとに、そのスペクトルSのエンベロープを示す正規化係数Fを決定し、出力部15に供給する。また、正規化部12は、正規化係数Fを用いてスペクトルSを所定の帯域ごとに正規化し、その結果得られる正規化スペクトルNSを量子化部13に供給する。
量子化部13は、量子化精度として量子化ビット数を表す量子化情報Wに基づいて、正規化部12から供給される正規化スペクトルNSを量子化し、その結果得られる量子化値Qを符号化部14に供給する。このとき、量子化部13は、符号化部14から量子化値Qに対応してフィードバックされるビット数Nを取得し、そのビット数Nが所定値になるように量子化情報Wを調整する。量子化部13は、調整後の量子化情報Wを出力部15に供給する。
符号化部14は、量子化部13から供給される量子化値Qを可変長符号化する。具体的には、符号化部14は、量子化値Qを符号帳記憶部16に供給することにより、符号帳記憶部16から量子化値Qに対応する可変長符号Hを取得し、符号化結果とする。
また、符号化部14は、ビット数Nとして、可変長符号Hのビット数NH、量子化情報Wのビット数NW、および正規化係数Fのビット数NFを加算した値を計算し、量子化部13に供給する。これにより、量子化部13は、そのビット数Nが符号列Bのビット数として決められた値NQ以下となるように量子化情報Wを調整する。符号化部14は、ビット数Nが値NQ以下となったとき、量子化値Qに対応する可変長符号Hを符号化結果として出力部15に供給する。
出力部15は、正規化部12からの正規化係数F、量子化部13からの量子化情報W、および符号化部14からの可変長符号Hを多重化し、その結果得られる符号列Bを出力する。
符号帳記憶部16は、後述する学習装置により学習された、量子化値Qとして取り得る値と可変長符号とを対応付けた符号帳CBを記憶する。符号帳記憶部16は、符号化部14から量子化値Qが供給されると、符号帳CBにおいて、その量子化値Qに対応付けられている可変長符号Hを読み出し、符号化部14に供給する。
[本技術の前提となる復号装置の第1の構成例]
図2は、図1の符号化装置10から出力される符号列Bを復号する復号装置の構成例を示すブロック図である。
図2の復号装置30は、受け取り部31、復号部32、逆量子化部33、逆正規化部34、逆スペクトル変換部35、および符号帳記憶部36により構成される。
復号装置30の受け取り部31は、図1の符号化装置10から出力された符号列Bを受け取る。受け取り部31は、その符号列Bを、可変長符号H、量子化情報W、および正規化係数Fに分解する。受け取り部31は、可変長符号Hを復号部32に供給し、量子化情報Wを逆量子化部33に供給し、正規化係数Fを逆正規化部34に供給する。
復号部32は、受け取り部31から供給される可変長符号Hを復号する。具体的には、復号部32は、可変長符号Hを符号帳記憶部36に供給することにより、可変長符号Hに対応する量子化値Qを取得し、復号結果とする。復号部32は、復号結果である量子化値Qを逆量子化部33に供給する。
逆量子化部33は、復号部32から供給される量子化値Qを、受け取り部31から供給される量子化情報Wに基づいて逆量子化し、正規化スペクトルNSを得る。逆量子化部33は、正規化スペクトルNSを逆正規化部34に供給する。
逆正規化部34は、受け取り部31から供給される正規化係数Fを用いて、逆量子化部33から供給される正規化スペクトルNSを所定の帯域ごとに逆正規化し、その結果得られる周波数スペクトルSを逆スペクトル変換部35に供給する。
逆スペクトル変換部35は、逆正規化部34から供給される周波数スペクトルSを周波数時間変換し、その結果得られる時間信号Tを出力する。
符号帳記憶部36は、符号帳記憶部16に記憶されている符号帳CBと同一の符号帳CBを記憶する。符号帳記憶部36は、復号部32から可変長符号Hが供給されると、符号帳CBにおいて、その可変長符号Hに対応付けられている量子化値Qを読み出し、復号部32に供給する。
なお、復号装置30における正規化スペクトルNS、周波数スペクトルS、時間信号Tは、量子化に伴う誤差を含むため、符号化装置10における正規化スペクトルNS、周波数スペクトルS、時間信号Tと完全には一致しない。
[本技術の前提となる学習装置の第1の構成例]
図3は、図1の符号帳記憶部16と図2の符号帳記憶部36に記憶される符号帳CBを学習する学習装置の構成例を示すブロック図である。
図3の学習装置50は、スペクトル変換部51、正規化部52、量子化部53、符号化部54、出現確率計算部55、およびハフマン符号生成部56により構成される。
学習装置50のスペクトル変換部51には、図1の符号化装置10に符号化対象として入力される時間信号Tに対応する学習用の時間信号T'が入力される。スペクトル変換部51は、図1のスペクトル変換部11と同様に、学習用の時間信号T'に対して時間周波数変換を行い、時間信号T'をスペクトルS’に変換する。スペクトル変換部51は、スペクトルS’を正規化部52に供給する。
正規化部52は、正規化部12と同様に、スペクトル変換部51から供給されるスペクトルS'から、所定の帯域ごとに、そのスペクトルS'の正規化係数F’を決定する。また、正規化部12は、所定の帯域ごとに、正規化係数F’を用いてスペクトルS'を正規化し、その結果得られる正規化スペクトルNS'を量子化部53に供給する。
量子化部53は、量子化部13と同様に、量子化情報W’に基づいて、正規化部52から供給される正規化スペクトルNS'を量子化し、その結果得られる量子化値Q'を符号化部54に供給する。このとき、量子化部53は、量子化部13と同様に、符号化部54から量子化値Q'に対応してフィードバックされるビット数N'を取得し、そのビット数N'が所定値になるように量子化情報W'を調整する。量子化部53は、最終的な量子化値Q'を出現確率計算部55に供給する。
符号化部54は、量子化部53から供給される量子化値Q'を固定長符号化する。符号化部54は、ビット数N'として、固定長符号のビット数NH’、量子化情報W'のビット数NW’、および正規化係数F’のビット数NF’を加算した値を計算し、量子化部53に供給する。これにより、量子化部53は、そのビット数N'が、設定された符号列のビットレートに対応する値以下となるように量子化情報W'を調整する。この符号列のビットレートは、MP3,AAC(Advanced Audio Coding),ATRAC(Adaptive Transform Acoustic Coding)等の符号化方式に対応する符号帳CBを作成する場合、十分な音質が確保可能な128kbps程度である。
出現確率計算部55は、量子化部53から供給される量子化値Q'に基づいて、量子化値Q'(量子化値Q)として取り得る値をエントリとして、エントリごとの出現回数をカウントする。出現確率計算部55は、全時間信号T'におけるエントリごとの出現回数を、各エントリの出現確率Pとして、ハフマン符号生成部56に供給する。
ハフマン符号生成部56は、出現確率計算部55から供給される各エントリの出現確率Pに基づいて、各エントリである量子化値に対して、出現確率Pが低いほど長い符号長の可変長符号を割り当てる。ハフマン符号生成部56は、各量子化値と、その量子化値に割り当てられた可変長符号を対応付けた符号帳CBを作成する。この符号帳CBが、符号帳記憶部16と符号帳記憶部36に記憶される。
[符号帳CBの説明]
図4は、量子化値Q'(量子化値Q)として取り得る値の例を示す図である。
図4の例では、符号化の次元が2次元であり、符号化対象とする2本のスペクトルの各量子化値Q'(量子化値Q)を、それぞれ、A,Bという。また、図4の例では、量子化値A,Bの取り得る値は、それぞれ、-1,0,+1の3値である。
この場合、量子化値(A,B)のとり得る組み合わせは、(1,1),(1,-1),(1,0),(-1,1),(-1,-1),(-1,0),(0,1),(0,-1),(0,0)である。即ち、エントリは、図4に示した(1)乃至(9)の9(=32)個である。
図5は、符号帳CBにおいて、図4のエントリ(1)乃至(9)のそれぞれに割り当てられる可変長符号の例を示す図である。
なお、図5の例では、エントリ(1)、エントリ(2)、エントリ(3)、エントリ(4)、エントリ(5)、エントリ(6)、エントリ(7)、エントリ(8)、エントリ(9)の順に、出現確率が高いものとする。
この場合、例えば、図5に示すように、エントリ(1)の量子化値には、2ビットの符号「01」が割り当てられ、エントリ(2)の量子化値には、2ビットの符号「10」が割り当てられる。また、エントリ(3)の量子化値には、3ビットの符号「001」が割り当てられ、エントリ(4)の量子化値には、3ビットの符号「110」が割り当てられる。
さらに、エントリ(5)の量子化値には、4ビットの符号「0000」が割り当てられ、エントリ(6)の量子化値には、4ビットの符号「0001」が割り当てられ、エントリ(7)の量子化値には、4ビットの符号「1110」が割り当てられる。また、エントリ(8)の量子化値には、5ビットの符号「11110」が割り当てられ、エントリ(9)の量子化値には、5ビットの符号「11111」が割り当てられる。
以上のように、図5の符号帳CBでは、出現確率が最も低い量子化値には5ビットの符号が割り当てられるが、出現確率が最も高い量子化値には2ビットの符号が割り当てられる。これに対して、量子化値Q'(量子化値Q)が2次元固定長符号化される場合、固定長符号のビット数は、常に、9パターンを表現可能な4ビットとなる。従って、図5の符号帳CBに基づいて可変長符号化が行われる場合、固定長符号化が行われる場合に比べて、符号化効率を向上させることができる。
[学習装置の処理の説明]
図6は、図3の学習装置50の作成処理を説明するフローチャートである。
図6のステップS11において、学習装置50は、符号化に関する設定を行う。具体的には、例えば、学習装置50の符号化部54は、符号化モードを固定長符号化モードに設定する。また、量子化部53は、符号列のビットレートを、所定値(例えば128kbps)に設定する。
ステップS12において、学習装置50のスペクトル変換部51は、外部から入力された学習用の時間信号T'に対して時間周波数変換を行い、時間信号T'をスペクトルS’に変換する。スペクトル変換部51は、スペクトルS’を正規化部52に供給する。
ステップS13において、正規化部52は、所定の帯域ごとに、スペクトル変換部51から供給されるスペクトルS'から、そのスペクトルS'の正規化係数Fを決定し、正規化係数Fを用いてスペクトルS'を正規化する。正規化部52は、その結果得られる正規化スペクトルNS'を量子化部53に供給する。
ステップS14において、量子化部53は、量子化情報W’に基づいて、正規化部52から供給される正規化スペクトルNS'を量子化し、その結果得られる量子化値Q'を符号化部54に供給する。
ステップS15において、符号化部54は、量子化部53から供給される量子化値Q'を固定長符号化する。符号化部54は、ビット数N'として、固定長符号のビット数NH’、量子化情報W'のビット数NW’、および正規化係数F’のビット数NF’を加算した値を計算し、量子化部53に供給する。
ステップS16において、量子化部53は、ビット数N'が、設定された符号列のビットレートに対応する値以下であるかどうかを判定する。ステップS16でビット数N'が、設定された符号列のビットレートに対応する値以下ではないと判定された場合、量子化部53は、量子化情報W’を変更する。そして、処理はステップS14に戻り、ビット数N'が、設定された符号列のビットレートに対応する値以下となるまで、ステップS14乃至S16の処理が繰り返される。
一方、ステップS16で、ビット数N’が、設定された符号列のビットレートに対応する値以下であると判定された場合、量子化部53は、量子化値Q'を出現確率計算部55に供給する。
そして、ステップS17において、出現確率計算部55は、量子化部53から供給される量子化値Q'に基づいて、量子化値Q'(量子化値Q)として取り得る値をエントリとして、エントリごとの出現回数をカウントする。
ステップS18において、学習装置50は、全時間信号T'についてエントリごとの出現回数をカウントしたかどうかを判定する。ステップS18でまだ全時間信号T'についてエントリごとの出現回数をカウントしていないと判定された場合、処理はステップS12に戻り、ステップS12乃至S18の処理が繰り返される。
一方、ステップS18で全時間信号T'についてエントリごとの出現回数をカウントしたと判定された場合、出現確率計算部55は、全時間信号T'についてのエントリごとの出現回数を、各エントリの出現確率Pとして、ハフマン符号生成部56に供給する。
そして、ステップS19において、ハフマン符号生成部56は、出現確率計算部55から供給される各エントリの出現確率Pに基づいて、各エントリである量子化値に対して、出現確率Pが低いほど長い符号長の可変長符号を割り当てる。
ステップS20において、ハフマン符号生成部56は、各量子化値と、その量子化値に割り当てられた可変長符号を対応付けた符号帳CBを作成する。この符号帳CBが、符号帳記憶部16と符号帳記憶部36に記憶される。
学習装置50は、学習用の時間信号T'として、多くの音響の時間信号を用いることにより、より正確な出現確率を学習することができる。その結果、より適した符号帳を作成することができる。
[本技術の前提となる符号化装置の第2の構成例]
図7は、本技術の前提となる符号化装置の第2の構成例を示すブロック図である。
図7に示す構成のうち、図1の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図7の符号化装置70の構成は、符号化部14、出力部15、符号帳記憶部16の代わりに、符号化部71、出力部72、符号帳記憶部73および符号帳記憶部74が設けられている点が図1の構成と異なる。符号化装置70は、2種類の符号帳を選択的に用いて符号化を行う。
具体的には、符号化装置70の符号化部71は、量子化部13から供給される量子化値Qを符号化する。より詳細には、符号化部71は、量子化値Qを符号帳記憶部73に供給することにより、符号帳記憶部73から量子化値Qに対応する可変長符号H1を取得する。また、符号化部71は、量子化値Qを符号帳記憶部74に供給することにより、符号帳記憶部74から量子化値Qに対応する可変長符号H2を取得する。
符号化部71は、可変長符号H1と可変長符号H2のうちのビット数の少ない方を、符号化結果とする。符号化部71は、図1の符号化部14と同様に、符号化結果のビット数等に基づいて、ビット数Nを量子化部13に供給する。符号化部71は、ビット数Nが値NQ以下となったとき、量子化値Qに対応する符号化結果である可変長符号H1または可変長符号H2を、出力部72に供給する。また、符号化部71は、符号化結果として選択された可変長符号H1または可変長符号H2に対応する符号帳を、符号化に用いた符号帳として示す符号帳情報Cを出力部72に供給する。
出力部72は、正規化部12からの正規化係数F、量子化部13からの量子化情報W、および符号化部71からの可変長符号H1または可変長符号H2と符号帳情報Cを多重化し、その結果得られる符号列B'を出力する。
符号帳記憶部73は、後述する学習装置により所定の学習用の時間信号を用いて学習された、量子化値Qとして取り得る値と可変長符号とを対応付けた符号帳CB1を記憶する。符号帳記憶部73は、符号化部71から量子化値Qが供給されると、符号帳CB1において、その量子化値Qに対応付けられている可変長符号H1を読み出し、符号化部71に供給する。
符号帳記憶部74は、後述する学習装置により、符号帳CB1の作成に用いられた学習用の時間信号とは異なる学習用の時間信号を用いて学習された、量子化値Qとして取り得る値と可変長符号とを対応付けた符号帳CB2を記憶する。符号帳記憶部74は、符号化部71から量子化値Qが供給されると、符号帳CB2において、その量子化値Qに対応付けられている可変長符号H2を読み出し、符号化部71に供給する。
[本技術の前提となる復号装置の第2の構成例]
図8は、図7の符号化装置70から出力される符号列B'を復号する復号装置の構成例を示すブロック図である。
図8に示す構成のうち、図2の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図8の復号装置90の構成は、受け取り部31、復号部32、符号帳記憶部36の代わりに、受け取り部91、復号部92、符号帳記憶部93および符号帳記憶部94が設けられている点が図2の構成と異なる。
復号装置90の受け取り部91は、図7の符号化装置70から出力された符号列B'を受け取る。受け取り部91は、その符号列B’を、可変長符号H1またはH2、符号帳情報C、量子化情報W、および正規化係数Fに分解する。受け取り部91は、可変長符号H1またはH2と符号帳情報Cを復号部92に供給し、量子化情報Wを逆量子化部33に供給し、正規化係数Fを逆正規化部34に供給する。
復号部92は、受け取り部91から供給される符号帳情報Cに基づいて、受け取り部91から供給される可変長符号H1またはH2を復号する。具体的には、復号部92は、符号帳情報Cが示す符号帳CB1を記憶する符号帳記憶部93または符号帳CB2を記憶する符号帳記憶部94を選択する。復号部92は、選択された符号帳記憶部93に可変長符号H1を供給することにより可変長符号H1に対応する量子化値Qを取得するか、または、選択された符号帳記憶部94に可変長符号H2を供給することにより可変長符号H2に対応する量子化値Qを取得する。復号部92は、取得された量子化値Qを復号結果として逆量子化部33に供給する。
符号帳記憶部93は、図7の符号帳記憶部73に記憶されている符号帳CB1と同一の符号帳CB1を記憶する。符号帳記憶部93は、復号部92から可変長符号H1が供給されると、符号帳CB1において、その可変長符号H1に対応付けられている量子化値Qを読み出し、復号部92に供給する。
符号帳記憶部94は、符号帳記憶部74に記憶されている符号帳CB2と同一の符号帳CB2を記憶する。符号帳記憶部94は、復号部92から可変長符号H2が供給されると、符号帳CB2において、その可変長符号H2に対応付けられている量子化値Qを読み出し、復号部92に供給する。
なお、復号装置90における正規化スペクトルNS、周波数スペクトルS、時間信号Tは、量子化に伴う誤差を含むため、符号化装置70における正規化スペクトルNS、周波数スペクトルS、時間信号Tと完全には一致しない。
[本技術の前提となる学習装置の第2の構成例]
図9は、図7の符号帳記憶部73および図8の符号帳記憶部93に記憶される符号帳CB1、並びに符号帳記憶部74および符号帳記憶部94に記憶される符号帳CB2を学習する学習装置の構成例を示すブロック図である。
図9の学習装置110は、スペクトル変換部111、正規化部112、量子化部113、符号化部114、出現確率計算部115、およびハフマン符号生成部116により構成される。学習装置110には、図7の符号化装置70に符号化対象として入力される時間信号Tに対応する2種類の学習用の時間信号T1’とT2’が入力される。時間信号T1’と時間信号T2’は、例えば、各エントリの出現確率の分布が異なる時間信号である。
学習装置110のスペクトル変換部111、正規化部112、量子化部113、符号化部114、出現確率計算部115、およびハフマン符号生成部116は、処理の対象が時間信号T'ではなく、時間信号T1’とT2’である点を除いて、図3のスペクトル変換部51、正規化部52、量子化部53、符号化部54、出現確率計算部55、ハフマン符号生成部56の処理と同様である。
具体的には、スペクトル変換部111において、時間信号T1'と時間信号T2'がスペクトルS1’とS2'に変換され、正規化部112において、正規化スペクトルNS1'とNS2'が生成され、量子化部113において、量子化値Q1'とQ2’が生成される。そして、符号化部114において、量子化値Q1'とQ2’が固定長符号化され、量子化部113において、量子化情報W1'と量子化情報W2'が調整される。
出現確率計算部115は、量子化値Q1’に基づいて量子化値Q'(量子化値Q)として取り得る値をエントリとして、エントリごとの出現回数をカウントする。そして、出現確率計算部115は、全時間信号T1'におけるエントリごとの出現回数を、各エントリの出現確率P1'として、ハフマン符号生成部116に供給する。
また、出現確率計算部115は、量子化値Q2’についても同様に、エントリごとの出現回数をカウントし、全時間信号T2'におけるエントリごとの出現回数を、各エントリの出現確率P2'として、ハフマン符号生成部116に供給する。
ハフマン符号生成部116は、出現確率計算部115から供給される各エントリの出現確率P1’に基づいて、各エントリである量子化値に対して、出現確率P1'が低いほど長い符号長の可変長符号を割り当て、符号帳CB1を作成する。この符号帳CB1が、図7の符号帳記憶部73と図8の符号帳記憶部93に記憶される。
また、ハフマン符号生成部116は、出現確率計算部115から供給される各エントリの出現確率P2’についても同様に、各エントリである量子化値に対して、出現確率P2'が低いほど長い符号長の可変長符号を割り当て、符号帳CB2を作成する。この符号帳CB2が、図7の符号帳記憶部74と図8の符号帳記憶部94に記憶される。
なお、学習装置110は、時間信号T1'に対する処理と時間信号T2'に対する処理を並列に行ってもよいし、時間的にずらして行ってもよい。
[符号帳CB1と符号帳CB2の説明]
図10は、符号帳CB1において、図4のエントリ(1)乃至(9)のそれぞれに割り当てられる可変長符号の例を示す図であり、図11は、符号帳CB2において、図4のエントリ(1)乃至(9)のそれぞれに割り当てられる可変長符号の例を示す図である。
なお、図10の例では、エントリ(1)乃至エントリ(8)の出現確率が略同一であり、エントリ(9)の出現確率が他のエントリの出現確率に比べて低いものとする。
この場合、例えば、図10に示すように、エントリ(1)乃至エントリ(7)の量子化値には、それぞれ、3ビットの符号「000」、「001」、「010」、「011」、「100」、「101」、「110」が割り当てられる。また、エントリ(8)の量子化値には、4ビットの符号「1110」が割り当てられ、エントリ(9)の量子化値には、4ビットの符号「1110」が割り当てられる。
このように、図10の符号帳CB1では、出現確率が最も低い量子化値を含む2つの量子化値には4ビットの符号が割り当てられるが、出現確率が最も高い量子化値には3ビットの符号が割り当てられる。従って、図10の符号帳CB1に基づいて可変長符号化が行われる場合、常に符号のビット数が4ビットとなる固定長符号化が行われる場合に比べて、符号化効率を向上させることができる。
また、図11の例では、エントリ(1)、エントリ(2)、エントリ(3)、エントリ(4)の順に、出現確率が高く、エントリ(5)乃至エントリ(9)の出現確率は略同一であり、エントリ(4)に比べてかなり低いものとする。
この場合、例えば、図11に示すように、エントリ(1)の量子化値には、1ビットの符号「0」が割り当てられ、エントリ(2)の量子化値には、2ビットの符号「10」が割り当てられる。また、エントリ(3)の量子化値には、3ビットの符号「110」が割り当てられ、エントリ(4)の量子化値には、4ビットの符号「1110」が割り当てられる。
さらに、エントリ(5)の量子化値には、6ビットの符号「111100」が割り当てられ、エントリ(6)の量子化値には、6ビットの符号「111101」が割り当てられ、エントリ(7)の量子化値には、6ビットの符号「111110」が割り当てられる。また、エントリ(8)の量子化値には、7ビットの符号「1111110」が割り当てられ、エントリ(9)の量子化値には、7ビットの符号「1111111」が割り当てられる。
このように、図11の符号帳CB2では、出現確率が最も低い量子化値の2つには7ビットの符号長の符号が割り当てられるが、出現確率が最も高い量子化値には1ビットの符号長の符号が割り当てられる。従って、符号帳CB2に基づいて可変長符号化が行われる場合、常に符号のビット数が4ビットとなる固定長符号化が行われる場合に比べて、確率的には符号化効率を向上させることができる。
図10と図11に示すように、各エントリの出現確率の分布によって、各エントリに適した符号長が異なる。従って、学習装置110は、各エントリの出現確率の分布が異なる時間信号T1'とT2'を用いて、別々に符号帳CB1とCB2を作成することにより、時間信号T1'とT2'により適した符号帳を提供することができる。その結果、符号化装置70では、時間信号Tに対応する時間信号T1'またはT2'により適した符号帳を選択的に用いて、時間信号Tを符号化することができるので、符号化効率を向上させることができる。
符号帳の数は2個に限定されないが、無限個の符号帳を作成することはできないため、その数は、符号化効率と実用性を考慮して決定される。
<一実施の形態>
[符号化装置の一実施の形態の構成例]
図12は、本技術を適用した符号化装置の一実施の形態の構成例を示すブロック図である。
図12に示す構成のうち、図1の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図12の符号化装置130の構成は、符号化部14、出力部15の代わりに、符号化部132、出力部133が設けられている点、および、制限部131と符号帳記憶部134が新たに設けられている点が図1の構成と異なる。符号化装置130は、符号列B''のビットレートが所定値より小さい場合、所定の量子化値の出現確率を0に制限して符号化を行う。
具体的には、符号化装置130の制限部131は、符号列B''のビットレートが所定値より小さい場合、正規化部12により得られる所定の帯域ごとの正規化スペクトルNSのうちの、重要ではない帯域の正規化スペクトルNSの所定の量子化値の出現確率を0に制限する。
より詳細には、制限部131は、所定の帯域ごとの正規化スペクトルNS(スペクトル群)のレベルの最大値に基づいて、その最大値が所定値より小さい場合、その帯域は重要ではないと判定する。一方、その最大値が所定値以上である場合、制限部131は、その帯域は重要であると判定する。
そして、制限部131は、重要ではない帯域の正規化スペクトルNSのレベルを、符号化の次元数ごとに1本以上の割合で保持し、残りを0にする。即ち、重要ではない帯域の正規化スペクトルNSを、符号化の次元数ごとに1本以上の割合で有効にし、残りを無効にする。なお、有効にする正規化スペクトルは、例えば、符号化の次元数ごとの正規化スペクトルのうちの、レベルが高い方から順に1以上の正規化スペクトルである。制限部131は、出現確率の制限後の正規化スペクトルNS3を量子化部13に供給する。
一方、制限部131は、符号列B''のビットレートが所定値以上である場合、正規化部12より得られる所定の帯域ごとの正規化スペクトルNSをそのまま量子化部13に供給する。また、制限部131は、出現確率の制限が行われたかどうかを示す制限情報CIを符号化部132と出力部133に供給する。
符号化部132は、量子化部13から供給される正規化スペクトルNSの量子化値Qまたは正規化スペクトルNS3の量子化値Q3を符号化する。具体的には、符号化部71は、制限部131から供給される制限情報CIが出現確率の制限が行われていないことを示す場合、量子化値Qを符号帳記憶部16に供給することにより、符号帳記憶部16から量子化値Qに対応する可変長符号Hを取得する。また、符号化部132は、制限情報CIが出現確率の制限が行われたことを示す場合、量子化値Q3を符号帳記憶部134に供給することにより、符号帳記憶部134から量子化値Q3に対応する可変長符号H3を取得する。
符号化部132は、図1の符号化部14と同様に、可変長符号Hのビット数等に基づいてビット数Nを量子化部13に供給するか、または、可変長符号H3のビット数等に基づいてビット数N3を量子化部13に供給する。符号化部132は、ビット数Nが値NQ以下となったとき可変長符号Hを出力部133に供給し、ビット数N3が値NQ以下となったとき可変長符号H3を出力部133に供給する。
出力部133は、正規化部12からの正規化係数F、量子化部13からの正規化スペクトルNSの量子化情報Wまたは正規化スペクトルNS3の量子化情報W3、制限部131からの制限情報CI、および符号化部132からの可変長符号Hまたは可変長符号H3を多重化し、その結果得られる符号列B''を出力する。
符号帳記憶部134は、後述する学習装置により所定の学習用の時間信号の所定の量子化値の出現確率を0に制限して学習された、量子化値Q3として取り得る値と可変長符号とを対応付けた符号帳CB3(制限符号帳)を記憶する。符号帳記憶部134は、符号化部132から量子化値Q3が供給されると、符号帳CB3において、その量子化値Q3に対応付けられている可変長符号H3を読み出し、符号化部132に供給する。
[符号帳CB3の説明]
図13は、量子化値Q3として取り得る値の例を示す図である。
図13の例では、図4の場合と同様に符号化の次元が2次元であり、符号化対象とする2本のスペクトルの各量子化値Q3を、それぞれ、A,Bという。また、図13の例では、図4の場合と同様に、量子化値A,Bの取り得る値は、それぞれ、-1,0,+1の3値である。
この場合、制限部131が、量子化値A,Bに対応する正規化スペクトルのいずれか一方のレベルを保持し、他方のレベルを0にすると、量子化値A,Bは、少なくとも一方が必ず0となる。従って、量子化値(A,B)のとり得る組み合わせは、(1,0),(-1,0),(0,1),(0,-1),(0,0)となり、(1,1),(1,-1),(-1,1),(-1,-1)の出現確率は0に制限される。即ち、量子化値AとBのエントリは、エントリ(5)乃至(9)の5個となる。
なお、符号化装置130は、量子化値(A,B)の組み合わせが(0,0)である場合に符号化を行わないようにすることもできる。この場合、量子化値AとBのエントリは、エントリ(5)乃至(8)の4個となる。
図14は、符号帳CB3において、図13のエントリ(5)乃至(9)のそれぞれに割り当てられる可変長符号の例を示す図である。
なお、図14の例では、エントリ(5)乃至(8)の出現確率が略同一であり、エントリ(9)の出現確率が、他の出現確率より低いものとする。
この場合、例えば、図14に示すように、エントリ(5)乃至(7)の量子化値には、それぞれ、2ビットの符号「00」、「01」、「10」が割り当てられ、エントリ(8)の量子化値には、3ビットの符号「110」が割り当てられる。また、エントリ(9)の量子化値には、3ビットの符号「111」が割り当てられる。
以上のように、図14の符号帳CB3では、出現確率が最も低い量子化値を含む2つの量子化値には3ビットの符号が割り当てられるが、出現確率が最も高い量子化値には2ビットの符号が割り当てられる。これに対して、量子化値Q3が2次元固定長符号化される場合、固定長符号のビット数は、常に、5パターンを表現可能な3ビットとなる。従って、図14の符号長CB3に基づいて可変長符号化が行われる場合、固定長符号化が行われる場合に比べて、符号化効率を向上させることができる。
また、図14の符号帳では、図10の符号帳に比べてエントリ数が少ないので、各量子化値に割り当てられる可変長符号の符号長は、図10の符号帳に比べて短くなる。具体的には、図14の符号帳では、出現確率が最も低い量子化値を含む2つの量子化値に割り当てられた符号長は3ビットであるが、図10の符号帳では4ビットである。また、図14の符号帳では、出現確率が最も高い量子化値に割り当てられた符号長は2ビットであるが、図10の符号帳では3ビットである。従って、制限部131により出現確率が制限されると、符号化効率は向上する。
[符号化装置の処理の説明]
図15は、図12の符号化装置130の符号化処理を説明するフローチャートである。
図15のステップS31において、符号化装置130のスペクトル変換部11は、外部から入力された時間信号Tに対して時間周波数変換を行い、時間信号TをスペクトルSに変換する。スペクトル変換部11は、スペクトルSを正規化部12に供給する。
ステップS32において、正規化部12は、所定の帯域ごとに、スペクトル変換部11から供給されるスペクトルSから、そのスペクトルSの正規化係数Fを決定し、その正規化係数Fを用いてスペクトルSを正規化する。そして、正規化部12は、その結果得られる正規化スペクトルNSを制限部131に供給し、正規化係数Fを出力部133に供給する。
ステップS33において、制限部131は、予め設定された符号列B''のビットレートが所定値より小さいかどうかを判定する。ステップS33で符号列B''のビットレートが所定値より小さいと判定された場合、ステップS34において、制限部131は、出現確率の制限が行われたことを示す制限情報CIを出力部133に供給する。
ステップS35において、制限部131は、正規化部12から供給される所定の帯域ごとの正規化スペクトルNSのうちの、重要ではない帯域の正規化スペクトルNSの所定の量子化値の出現確率を0に制限する。そして、制限部131は、出現確率の制限後の正規化スペクトルNS3を量子化部13に供給する。
ステップS36において、量子化部13は、量子化情報W3に基づいて、制限部131から供給される正規化スペクトルNS3を量子化し、その結果得られる量子化値Q3を符号化部132に供給する。このとき、量子化部13は、符号化部132から量子化値Q3に対応してフィードバックされるビット数N3を取得し、そのビット数N3が所定値になるように量子化情報W3を調整する。量子化部13は、調整後の量子化情報W3を出力部133に供給する。
ステップS37において、符号化部132は、符号帳記憶部134に記憶されている符号帳CB3に基づいて、量子化部13から供給される量子化値Q3を符号化する。そして、符号化部132は、その結果得られる可変長符号H3のビット数等に基づいてビット数N3を量子化部13に供給し、ビット数N3が値NQ以下となったとき可変長符号H3を出力部133に供給する。
一方、ステップS33で符号列B''のビットレートが所定値より小さくはないと判定された場合、即ち符号列B''のビットレートが所定値以上である場合、処理はステップS38に進む。ステップS38において、制限部131は、出現確率の制限が行われていないことを示す制限情報CIを出力部133に供給する。また、制限部131は、正規化部12から供給される所定の帯域ごとの正規化スペクトルNSをそのまま量子化部13に供給する。
ステップS39において、量子化部13は、量子化情報Wに基づいて、制限部131から供給される正規化スペクトルNSを量子化し、その結果得られる量子化値Qを符号化部132に供給する。このとき、量子化部13は、符号化部132から量子化値Qに対応してフィードバックされるビット数Nを取得し、そのビット数Nが所定値になるように量子化情報Wを調整する。量子化部13は、調整後の量子化情報Wを出力部133に供給する。
ステップS40において、符号化部132は、符号帳記憶部16に記憶されている符号帳CBに基づいて、量子化部13から供給される量子化値Qを符号化する。そして、符号化部132は、その結果得られる可変長符号Hのビット数等に基づいてビット数Nを量子化部13に供給し、ビット数Nが値NQ以下となったとき可変長符号Hを出力部133に供給する。
ステップS41において、出力部133は、正規化部12からの正規化係数F、量子化部13からの量子化情報Wまたは量子化情報W3、制限部131からの制限情報CI、および符号化部14からの可変長符号Hまたは可変長符号H3を多重化する。出力部133は、その結果得られる符号列B''を出力する。
[本技術の効果の説明]
図16は、図1の符号化装置10や図7の符号化装置70において符号化される量子化値に対応する正規化スペクトルを示す図であり、図17は、図12の符号化装置130において符号化される量子化値に対応する正規化スペクトルを示す図である。
なお、図16と図17では、符号列のビットレートが、所定値(例えば、128kbps)より小さい16kbps,64kbps,32kbpsなどであるものとする。また、図16と図17のグラフでは、横軸が、正規化スペクトルのスペクトル番号を表し、縦軸は正規化スペクトルとノイズフロアの所定の帯域ごとの最大レベルであるゲインを表している。
図16のAや図16のCに示すように、図1の符号化装置10や図7の符号化装置70では、全帯域におけるゲインが比較的小さい場合、所定の帯域分の正規化スペクトルの量子化値が可変長符号化される。
しかしながら、図16のBに示すように、所定の帯域におけるゲインが比較的大きい場合、符号列のビットレート不足により、可変長符号化される量子化値に対応する帯域が削減され、量子化精度の悪化によりノイズフロアのレベルが大きくなる。
また、図16のAや図16のCの状態と、図16のBの状態が交互に発生すると、可変長符号化される量子化値に対応する帯域が変動し、視聴者は極めて違和感のあるノイズを感じる。
これに対して、図17の符号化装置130では、図17のA乃至図17のCに示すように、正規化スペクトルに対応する各帯域について重要であるかどうかが判定され、重要ではない帯域の正規化スペクトルに対してのみ量子化値の出現確率の制限が行われる。
これにより、図17中上向きの矢印で示すように、重要ではない帯域の正規化スペクトルの量子化精度は悪化し、ノイズフロアのレベルが高くなるが、その正規化スペクトルの量子化値の符号化効率は向上する。
従って、図17中下向きの矢印で示すように、符号化効率の向上によって発生した余剰ビットにより、重要な帯域の正規化スペクトルの量子化精度を向上させることができ、その正規化スペクトルのノイズフロアのレベルは低くなる。その結果、重要な帯域の音質を向上させることができる。
また、図17のBに示すように、所定の帯域におけるゲインが比較的大きい場合であっても、符号化効率の向上によって発生した余剰ビットにより、通常の帯域分の正規化スペクトルの量子化値を可変長符号化することができる。その結果、可変長符号化される量子化値に対応する帯域が変動せず、視聴者が極めて違和感のあるノイズを感じることを防止することができる。
以上のように、符号化装置130は、正規化スペクトルNSの所定の量子化値の出現確率を0に制限し、制限後の正規化スペクトルNS3の量子化値Q3を、符号帳CB3に基づいて符号化するので、符号化効率を向上させることができる。
なお、符号化装置130は、符号列B''のビットレートに基づいて出現確率の制限の有無を判定するのではなく、まず、制限を行わずに符号帳CB(制限なし符号帳)に基づいて符号化を行い、そのときのビット数Nが、符号化対象とする量子化値に対応する帯域を削減する必要があるほど多い場合、制限を行って符号化をやり直し、その結果を最終的な符号化結果としてもよい。
[復号装置の一実施の形態の構成例]
図18は、図12の符号化装置130から出力される符号列B''を復号する復号装置の構成例を示すブロック図である。
図18に示す構成のうち、図2の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図18の復号装置150の構成は、受け取り部31、復号部32の代わりに、受け取り部151、復号部152が設けられている点、および符号帳記憶部153が新たに設けられている点が図2の構成と異なる。
復号装置150の受け取り部151は、図12の符号化装置130から出力された符号列B’’を受け取る。受け取り部151は、その符号列B''を、可変長符号Hまたは可変長符号H3、制限情報CI、量子化情報Wまたは量子化情報W3、および正規化係数Fに分解する。受け取り部151は、可変長符号Hまたは可変長符号H3と制限情報CIを復号部152に供給し、量子化情報Wまたは量子化情報W3を逆量子化部33に供給し、正規化係数Fを逆正規化部34に供給する。
復号部152は、受け取り部151から供給される制限情報CIに基づいて、可変長符号Hまたは可変長符号H3を復号する。具体的には、復号部152は、制限情報CIが、制限が行われていないことを示す情報である場合、復号部152は、可変長符号Hを符号帳記憶部36に供給することにより、可変長符号Hに対応する量子化値Qを取得し、復号結果とする。一方、制限情報CIが、制限が行われたことを示す情報である場合、復号部152は、可変長符号H3を符号帳記憶部153に供給することにより、可変長符号H3に対応する量子化値Q3を取得し、復号結果とする。復号部152は、復号結果である量子化値Qまたは量子化値Q3を逆量子化部33に供給する。
符号帳記憶部153は、図12の符号帳記憶部134に記憶されている符号帳CB3と同一の符号帳CB3を記憶する。符号帳記憶部153は、復号部152から可変長符号H3が供給されると、符号帳CB3において、その可変長符号H3に対応付けられている量子化値Q3を読み出し、復号部152に供給する。
なお、復号装置150における、量子化値Qまたは量子化値Q3の逆量子化結果である正規化スペクトルNS、正規化スペクトルNSの逆正規化結果である周波数スペクトルS、周波数スペクトルSの周波数時間変換結果である時間信号Tは、量子化に伴う誤差を含むため、符号化装置130における正規化スペクトルNS、周波数スペクトルS、時間信号Tと完全には一致しない。
[復号装置の処理の説明]
図19は、図18の復号装置150の復号処理を説明するフローチャートである。
図19のステップS50において、復号装置150の受け取り部151は、図12の符号化装置130から出力された符号列B’’を受け取る。
ステップS51において、受け取り部151は、符号列B''を、可変長符号Hまたは可変長符号H3、制限情報CI、量子化情報Wまたは量子化情報W3、および正規化係数Fに分解する。受け取り部151は、可変長符号Hまたは可変長符号H3と制限情報CIを復号部152に供給し、量子化情報Wまたは量子化情報W3を逆量子化部33に供給し、正規化係数Fを逆正規化部34に供給する。
ステップS52において、復号部152は、受け取り部151から供給される制限情報CIが、制限が行われていることを示しているかどうかを判定する。
ステップS52で、制限情報CIが、制限が行われていることを示していると判定された場合、ステップS53において、復号部152は、符号帳記憶部153に記憶されている符号帳CB3に基づいて、可変長符号H3を復号する。復号部152は、復号結果である量子化値Q3を逆量子化部33に供給し、処理をステップS55に進める。
一方、ステップS52で、制限情報CIが、制限が行われていることを示していないと判定された場合、ステップS54において、復号部152は、符号帳記憶部36に記憶されている符号帳CBに基づいて、可変長符号Hを復号する。復号部152は、復号結果である量子化値Qを逆量子化部33に供給し、処理をステップS55に進める。
ステップS55において、逆量子化部33は、復号部152から供給される量子化値Qを、受け取り部151から供給される量子化情報Wに基づいて逆量子化するか、または、復号部152から供給される量子化値Q3を、受け取り部151から供給される量子化情報W3に基づいて逆量子化する。逆量子化部33は、逆量子化の結果得られる正規化スペクトルNSを逆正規化部34に供給する。
ステップS56において、逆正規化部34は、受け取り部151から供給される正規化係数Fを用いて、逆量子化部33から供給される正規化スペクトルNSを所定の帯域ごとに逆正規化し、その結果得られる周波数スペクトルSを逆スペクトル変換部35に供給する。
ステップS57において、逆スペクトル変換部35は、逆正規化部34から供給される周波数スペクトルSを周波数時間変換して、時間信号Tにし、出力する。
以上のように、復号装置150は、符号帳CB3に基づいて可変長符号H3を復号するので、正規化スペクトルNSの所定の量子化値の出現確率を0に制限することにより符号化効率を向上させた可変長符号H3を復号することができる。
[学習装置の構成例]
図20は、符号帳CBと符号帳CB3を学習する学習装置の構成例を示すブロック図である。
図20に示す構成のうち、図3の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図20の学習装置170の構成は、量子化部53、符号化部54、出現確率計算部55、ハフマン符号生成部56の代わりに、量子化部172、符号化部173、出現確率計算部174、ハフマン符号生成部175が設けられている点、および制限部171が新たに設けられている点が図3の構成と異なる。
学習装置170の制限部171は、正規化部52により得られる所定の帯域ごとの正規化スペクトルNS'をそのまま量子化部172に供給する。また、制限部171は、図12の制限部131と同様に、正規化部52により得られる所定の帯域ごとの正規化スペクトルNS'のうちの、重要ではない帯域の正規化スペクトルNS'の所定の量子化値の出現確率を0に制限する。そして、制限部171は、制限後の正規化スペクトルNS3'を量子化部172に供給する。
量子化部172は、図3の量子化部53と同様に、量子化情報W’に基づいて、制限部171から供給される正規化スペクトルNS'を量子化し、その結果得られる量子化値Q'を符号化部173に供給する。このとき、量子化部172は、量子化部53と同様に、符号化部173から量子化値Q'に対応してフィードバックされるビット数N'を取得し、そのビット数N'が所定値になるように量子化情報W'を調整する。量子化部172は、最終的な量子化値Q'を出現確率計算部174に供給する。
また、量子化部172は、正規化スペクトルNS3'についても同様に、量子化情報W3’に基づいて正規化スペクトルNS3'を量子化し、その結果得られる量子化値Q3'を符号化部173に供給する。このとき、量子化部172は、符号化部173から量子化値Q3'に対応してフィードバックされるビット数N3'を取得し、そのビット数N3'が所定値になるように量子化情報W3'を調整する。量子化部172は、最終的な量子化値Q3'を出現確率計算部174に供給する。
符号化部173は、量子化部172から供給される量子化値Q'と量子化値Q3'を固定長符号化する。符号化部173は、ビット数N'として、量子化値Q'の固定長符号のビット数NH’、量子化情報W'のビット数NW’、および正規化係数F’のビット数NF’を加算した値を計算し、量子化部172に供給する。同様に、符号化部173は、ビット数N3'として、量子化値Q3'の固定長符号のビット数NH3'、量子化情報W3'のビット数NW3'、およびビット数NF’を加算した値を計算し、量子化部172に供給する。
これにより、量子化部172は、ビット数N'が、設定された符号列のビットレートに対応する値以下となるように量子化情報W'を調整し、ビット数N3'が、設定された符号列のビットレートに対応する値以下となるように量子化情報W3'を調整する。
出現確率計算部174は、量子化部172から供給される量子化値Q'に基づいて、量子化値Q'(量子化値Q)として取り得る値をエントリとして、エントリごとの出現回数をカウントする。出現確率計算部174は、全時間信号T'におけるエントリごとの出現回数を、各エントリの出現確率Pとして、ハフマン符号生成部175に供給する。
また、出現確率計算部174は、量子化部172から供給される量子化値Q3'に基づいて、量子化値Q3'(量子化値Q3)として取り得る値をエントリとして、エントリごとの出現回数をカウントする。出現確率計算部174は、全時間信号T'におけるエントリごとの出現回数を、各エントリの出現確率P3として、ハフマン符号生成部175に供給する。なお、図13で説明したように、出現確率P3に対応するエントリ数は、出現確率Pに対応するエントリ数より少ない。
ハフマン符号生成部175は、出現確率計算部174から供給される各エントリの出現確率Pに基づいて、各エントリである量子化値に対して、出現確率Pが低いほど長い符号長の可変長符号を割り当てる。ハフマン符号生成部175は、各量子化値と、その量子化値に割り当てられた可変長符号を対応付けた符号帳CBを作成する。この符号帳CBが、図12の符号帳記憶部16と図18の符号帳記憶部36に記憶される。
また、ハフマン符号生成部175は、出現確率計算部174から供給される各エントリの出現確率P3に基づいて、各エントリである量子化値に対して、出現確率P3が低いほど長い符号長の可変長符号を割り当てる。ハフマン符号生成部175は、各量子化値と、その量子化値に割り当てられた可変長符号を対応付けた符号帳CB3を作成する。この符号帳CB3は、エントリ数が符号帳CBに比べて少ない符号帳であり、図12の符号帳記憶部134と図18の符号帳記憶部153に記憶される。
[学習装置の処理の説明]
図20の学習装置170の符号帳CBの作成処理は、正規化部52により得られる正規化スペクトルNS'が制限部171を介して量子化部172に供給される点を除いて、図6の作成処理と同様であるので、符号帳CB3の作成処理についてのみ説明する。
図21は、学習装置170の符号帳CB3の作成処理を説明するフローチャートである。
図21のステップS71乃至S73は、図6のステップS11乃至S13の処理と同様であるので、説明は省略する。
ステップS74において、制限部171は、正規化部52から供給される所定の帯域ごとの正規化スペクトルNS'のうちの、重要ではない帯域の正規化スペクトルNS'の所定の量子化値の出現確率を0に制限する。そして、制限部171は、制限後の正規化スペクトルNS3'を量子化部172に供給する。
ステップS75において、量子化部172は、量子化情報W3'に基づいて、制限部171から供給される正規化スペクトルNS3'を量子化し、その結果得られる量子化値Q3'を符号化部173に供給する。
ステップS76において、符号化部173は、量子化部172から供給される量子化値Q3'を固定長符号化する。符号化部173は、ビット数N3'として、固定長符号のビット数NH3'、量子化情報W3'のビット数NW3'、および正規化係数F3'のビット数NF3'を加算した値を計算し、量子化部172に供給する。
ステップS77において、ビット数N3'が、設定された符号列のビットレートに対応する値以下であるかどうかを判定する。ステップS77で、ビット数N3'が、設定された符号列のビットレートに対応する値以下ではないと判定された場合、量子化部172は、量子化情報W3'を変更する。そして、処理はステップS75に戻り、ビット数N3'が、設定された符号列のビットレートに対応する値以下となるまで、ステップS75乃至S77の処理が繰り返される。
一方、ステップS77で、ビット数N3'が、設定された符号列のビットレートに対応する値以下であると判定された場合、量子化部172は、量子化値Q3'を出現確率計算部174に供給する。
そして、ステップS78において、出現確率計算部174は、量子化部172から供給される量子化値Q3'に基づいて、量子化値Q3'(量子化値Q3)として取り得る値をエントリとして、エントリごとの出現回数をカウントする。
ステップS79において、学習装置170は、全時間信号T'についてエントリごとの出現回数をカウントしたかどうかを判定する。ステップS79でまだ全時間信号T'についてエントリごとの出現回数をカウントしていないと判定された場合、処理はステップS72に戻り、ステップS72乃至S79の処理が繰り返される。
一方、ステップS79で、全時間信号T'についてエントリごとの出現回数をカウントしたと判定された場合、出現確率計算部174は、全時間信号T'についてのエントリごとの出現回数を、各エントリの出現確率P3として、ハフマン符号生成部175に供給する。
そして、ステップS80において、ハフマン符号生成部175は、出現確率計算部174から供給される各エントリの出現確率P3に基づいて、各エントリである量子化値に対して、出現確率P3が低いほど長い符号長の可変長符号を割り当てる。
ステップS81において、ハフマン符号生成部175は、各量子化値と、その量子化値に割り当てられた可変長符号を対応付けた符号帳CB3を作成する。この符号帳CB3が、符号帳記憶部134(図12)と符号帳記憶部153(図18)に記憶される。
なお、符号帳CB3の学習に用いられる学習用の時間信号と、符号帳CBの学習に用いられる学習用の時間信号は、異なっていていてもよい。
また、本技術は、音響信号以外の信号を処理対象とする符号化装置や復号装置にも適用することができる。
[本技術を適用したコンピュータの説明]
上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウェアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
図22は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
コンピュータにおいて、CPU(Central Processing Unit)201,ROM(Read Only Memory)202,RAM(Random Access Memory)203は、バス204により相互に接続されている。
バス204には、さらに、入出力インタフェース205が接続されている。入出力インタフェース205には、入力部206、出力部207、記憶部208、通信部209、及びドライブ210が接続されている。
入力部206は、キーボード、マウス、マイクロフォンなどよりなる。出力部207は、ディスプレイ、スピーカなどよりなる。記憶部208は、ハードディスクや不揮発性のメモリなどよりなる。通信部209は、ネットワークインタフェースなどよりなる。ドライブ210は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア211を駆動する。
以上のように構成されるコンピュータでは、CPU201が、例えば、記憶部208に記憶されているプログラムを、入出力インタフェース205及びバス204を介して、RAM203にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ(CPU201)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア211に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
コンピュータでは、プログラムは、リムーバブルメディア211をドライブ210に装着することにより、入出力インタフェース205を介して、記憶部208にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部209で受信し、記憶部208にインストールすることができる。その他、プログラムは、ROM202や記憶部208に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
例えば、本技術は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
また、本技術は、以下のような構成もとることができる。
(1)
信号の所定の量子化値の出現確率を0に制限する制限部と、
前記所定の量子化値の出現確率が0に制限された、前記信号に対応する学習用の信号の、前記所定の量子化値以外の複数の量子化値のそれぞれに対して、出現確率が低いほど長い符号長の可変長符号が割り当てられた符号帳である制限符号帳に基づいて、前記制限部により制限された前記信号の量子化値を符号化する符号化部と
を備える符号化装置。
(2)
前記符号化部による符号化の結果得られる符号を出力する出力部
をさらに備え、
前記制限部は、前記信号のビットレートが所定値より小さい場合、前記信号の前記所定の量子化値の出現確率を0に制限し、
前記出力部は、前記符号と、前記制限部により制限が行われたかどうかを示す制限情報とを出力する
前記(1)に記載の符号化装置。
(3)
前記符号化部による符号化の結果得られる符号を出力する出力部
をさらに備え、
前記符号化部は、前記所定の量子化値の出現確率が制限されていない前記学習用の信号の複数の量子化値のそれぞれに対して、出現確率が低いほど長い符号長の可変長符号が割り当てられた符号帳である制限なし符号帳に基づいて、前記制限部により制限されていない前記信号の量子化値を符号化し、
前記制限部は、前記符号化部により符号化された、前記制限部により制限されていない前記信号の量子化値の符号量が多い場合、前記信号の前記所定の量子化値の出現確率を0に制限し、
前記符号化部は、前記制限符号帳に基づいて前記制限部により制限された前記信号の量子化値を符号化し、その結果得られる符号を最終的な符号とし、
前記出力部は、前記最終的な符号と、前記制限部により制限が行われたかどうかを示す制限情報とを出力する
前記(1)に記載の符号化装置。
(4)
前記符号化部による符号化の結果得られる符号を出力する出力部
をさらに備え、
前記制限部は、前記信号のスペクトル群のレベルが所定値より小さい場合、その信号のスペクトル群の前記所定の量子化値の出現確率を0に制限し、
前記出力部は、前記符号と、前記制限部により制限が行われたかどうかを示す制限情報とを出力する
前記(1)に記載の符号化装置。
(5)
前記制限部は、前記信号のスペクトル群のうちの所定のスペクトルを有効にし、残りのスペクトルを無効にすることにより、その信号のスペクトル群の前記所定の量子化値の出現確率を0に制限する
前記(1)乃至(4)のいずれかに記載の符号化装置。
(6)
前記制限部は、前記残りのスペクトルのレベルを0にすることにより、前記残りのスペクトルを無効にする
前記(5)に記載の符号化装置。
(7)
前記所定のスペクトルは、前記スペクトル群のスペクトルのうちの、レベルが高い方から順に1以上のスペクトルである
前記(5)に記載の符号化装置。
(8)
符号化装置が、
信号の所定の量子化値の出現確率を0に制限する制限ステップと、
前記所定の量子化値の出現確率が0に制限された、前記信号に対応する学習用の信号の、前記所定の量子化値以外の複数の量子化値のそれぞれに対して、出現確率が低いほど長い符号長の可変長符号が割り当てられた符号帳である制限符号帳に基づいて、前記制限ステップの処理により制限された前記信号の量子化値を符号化する符号化ステップと
を含む符号化方法。
(9)
コンピュータを、
信号の所定の量子化値の出現確率を0に制限する制限部と、
前記所定の量子化値の出現確率が0に制限された、前記信号に対応する学習用の信号の、前記所定の量子化値以外の複数の量子化値のそれぞれに対して、出現確率が低いほど長い符号長の可変長符号が割り当てられた符号帳である制限符号帳に基づいて、前記制限部により制限された前記信号の量子化値を符号化する符号化部と
して機能させるためのプログラム。
(10)
所定の量子化値の出現確率が0に制限された、符号化対象の信号に対応する学習用の信号の、前記所定の量子化値以外の複数の量子化値のそれぞれに対して、出現確率が低いほど長い符号長の可変長符号が割り当てられた符号帳である制限符号帳に基づいて符号化された、前記所定の量子化値の出現確率が0に制限された前記信号の量子化値を受け取る受け取り部と、
前記受け取り部により受け取られた前記量子化値を、前記制限符号帳に基づいて復号する復号部と
を備える復号装置。
(11)
前記受け取り部は、前記制限符号帳に基づいて符号化された、前記所定の量子化値の出現確率が0に制限された前記信号の量子化値と、前記制限が行われたかどうかを示す制限情報とを受け取り、
前記復号部は、前記制限情報が、前記制限が行われたことを示す場合、前記受け取り部により受け取られた前記量子化値を、前記制限符号帳に基づいて復号する
前記(10)に記載の復号装置。
(12)
復号装置が、
所定の量子化値の出現確率が0に制限された、符号化対象の信号に対応する学習用の信号の、前記所定の量子化値以外の複数の量子化値のそれぞれに対して、出現確率が低いほど長い符号長の可変長符号が割り当てられた符号帳である制限符号帳に基づいて符号化された、前記所定の量子化値の出現確率が0に制限された前記信号の量子化値を受け取る受け取りステップと、
前記受け取りステップの処理により受け取られた前記量子化値を、前記制限符号帳に基づいて復号する復号ステップと
を含む復号方法。
(13)
コンピュータを、
所定の量子化値の出現確率が0に制限された、符号化対象の信号に対応する学習用の信号の、前記所定の量子化値以外の複数の量子化値のそれぞれに対して、出現確率が低いほど長い符号長の可変長符号が割り当てられた符号帳である制限符号帳に基づいて符号化された、前記所定の量子化値の出現確率が0に制限された前記信号の量子化値を受け取る受け取り部と、
前記受け取り部により受け取られた前記量子化値を、前記制限符号帳に基づいて復号する復号部と
して機能させるためのプログラム。
130 符号化装置, 131 制限部, 132 符号化部, 133 出力部, 150 復号装置, 151 受け取り部, 152 復号部

Claims (3)

  1. 所定の量子化値の出現確率が0に制限された、符号化対象の信号に対応する学習用の信号の、前記所定の量子化値以外の複数の量子化値のそれぞれに対して、出現確率が低いほど長い符号長の可変長符号が割り当てられた符号帳である制限符号帳に基づいて符号化された、前記所定の量子化値の出現確率が0に制限された前記信号の量子化値、または、前記所定の量子化値の出現確率が制限されていない前記学習用の信号の複数の量子化値のそれぞれに対して、出現確率が低いほど長い符号長の可変長符号が割り当てられた符号帳である制限なし符号帳に基づいて符号化された、前記所定の量子化値の出現確率が制限されていない前記信号の量子化値と、前記符号化の際に前記制限が行われたかどうかを示す制限情報とを受け取る受け取り部と、
    前記制限情報が、前記制限が行われたことを示す場合、前記受け取り部により受け取られた前記所定の量子化値の出現確率が0に制限された前記信号の量子化値を、前記制限符号帳に基づいて復号し、前記制限情報が、前記制限が行われていないことを示す場合、前記受け取り部により受け取られた前記所定の量子化値の出現確率が0に制限されていない前記信号の量子化値を、前記制限なし符号帳に基づいて復号する復号部と
    を備える復号装置。
  2. 復号装置が、
    所定の量子化値の出現確率が0に制限された、符号化対象の信号に対応する学習用の信号の、前記所定の量子化値以外の複数の量子化値のそれぞれに対して、出現確率が低いほど長い符号長の可変長符号が割り当てられた符号帳である制限符号帳に基づいて符号化された、前記所定の量子化値の出現確率が0に制限された前記信号の量子化値、または、前記所定の量子化値の出現確率が制限されていない前記学習用の信号の複数の量子化値のそれぞれに対して、出現確率が低いほど長い符号長の可変長符号が割り当てられた符号帳である制限なし符号帳に基づいて符号化された、前記所定の量子化値の出現確率が制限されていない前記信号の量子化値と、前記符号化の際に前記制限が行われたかどうかを示す制限情報とを受け取る受け取りステップと、
    前記制限情報が、前記制限が行われたことを示す場合、前記受け取りステップの処理により受け取られた前記所定の量子化値の出現確率が0に制限された前記信号の量子化値を、前記制限符号帳に基づいて復号し、前記制限情報が、前記制限が行われていないことを示す場合、前記受け取りステップの処理により受け取られた前記所定の量子化値の出現確率が0に制限されていない前記信号の量子化値を、前記制限なし符号帳に基づいて復号する復号ステップと
    を含む復号方法。
  3. コンピュータを、
    所定の量子化値の出現確率が0に制限された、符号化対象の信号に対応する学習用の信号の、前記所定の量子化値以外の複数の量子化値のそれぞれに対して、出現確率が低いほど長い符号長の可変長符号が割り当てられた符号帳である制限符号帳に基づいて符号化された、前記所定の量子化値の出現確率が0に制限された前記信号の量子化値、または、前記所定の量子化値の出現確率が制限されていない前記学習用の信号の複数の量子化値のそれぞれに対して、出現確率が低いほど長い符号長の可変長符号が割り当てられた符号帳である制限なし符号帳に基づいて符号化された、前記所定の量子化値の出現確率が制限されていない前記信号の量子化値と、前記符号化の際に前記制限が行われたかどうかを示す制限情報とを受け取る受け取り部と、
    前記制限情報が、前記制限が行われたことを示す場合、前記受け取り部により受け取られた前記所定の量子化値の出現確率が0に制限された前記信号の量子化値を、前記制限符号帳に基づいて復号し、前記制限情報が、前記制限が行われていないことを示す場合、前記受け取り部により受け取られた前記所定の量子化値の出現確率が0に制限されていない前記信号の量子化値を、前記制限なし符号帳に基づいて復号する復号部と
    して機能させるためのプログラム。
JP2015225889A 2012-01-17 2015-11-18 復号装置、復号方法、およびプログラム Active JP6032509B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2012006972 2012-01-17
JP2012006972 2012-01-17

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2013554270A Division JP5846220B2 (ja) 2012-01-17 2013-01-09 符号化装置および符号化方法、復号装置および復号方法、プログラム

Publications (2)

Publication Number Publication Date
JP2016054523A JP2016054523A (ja) 2016-04-14
JP6032509B2 true JP6032509B2 (ja) 2016-11-30

Family

ID=48799111

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2013554270A Active JP5846220B2 (ja) 2012-01-17 2013-01-09 符号化装置および符号化方法、復号装置および復号方法、プログラム
JP2015225889A Active JP6032509B2 (ja) 2012-01-17 2015-11-18 復号装置、復号方法、およびプログラム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2013554270A Active JP5846220B2 (ja) 2012-01-17 2013-01-09 符号化装置および符号化方法、復号装置および復号方法、プログラム

Country Status (4)

Country Link
US (3) US9754599B2 (ja)
JP (2) JP5846220B2 (ja)
CN (1) CN104041054A (ja)
WO (1) WO2013108685A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6822121B2 (ja) * 2016-12-19 2021-01-27 ソニー株式会社 画像処理装置、画像処理方法及びプログラム
EP4283877A3 (en) * 2018-06-21 2024-01-10 Sony Group Corporation Encoder and encoding method, decoder and decoding method, and program
JP7115353B2 (ja) * 2019-02-14 2022-08-09 株式会社Jvcケンウッド 処理装置、処理方法、再生方法、及びプログラム
CN113838453B (zh) * 2021-08-17 2022-06-28 北京百度网讯科技有限公司 语音处理方法、装置、设备和计算机存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05110450A (ja) * 1991-10-18 1993-04-30 Canon Inc 符号生成装置
JPH07212243A (ja) * 1994-01-13 1995-08-11 Fuji Photo Film Co Ltd 可変長符号の符号化方法およびその装置
JPH1132334A (ja) * 1997-07-14 1999-02-02 Oki Electric Ind Co Ltd 画像符号化復号化装置及びその方法
JPH11215508A (ja) * 1998-01-27 1999-08-06 Sanyo Electric Co Ltd 符号発生量制御方法およびその方法を用いた符号化装置
JP2001082878A (ja) 1999-09-13 2001-03-30 Tsunehisa Matsuoka 被乾燥処理物の乾燥処理方法
JP4214440B2 (ja) * 2000-10-19 2009-01-28 ソニー株式会社 データ処理装置およびデータ処理方法、並びに記録媒体
JP2003233397A (ja) * 2002-02-12 2003-08-22 Victor Co Of Japan Ltd オーディオ符号化装置、オーディオ符号化プログラム及びオーディオ符号化データ伝送装置
JP3900000B2 (ja) * 2002-05-07 2007-03-28 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
JP4382090B2 (ja) * 2003-06-16 2009-12-09 パナソニック株式会社 符号化装置、符号化方法およびコードブック
US9113194B2 (en) * 2007-12-19 2015-08-18 Arris Technology, Inc. Method and system for interleaving video and data for transmission over a network at a selected bit rate
JP5304504B2 (ja) * 2009-07-17 2013-10-02 ソニー株式会社 信号符号化装置、信号復号装置、信号処理システム、これらにおける処理方法およびプログラム
JP2011082878A (ja) * 2009-10-09 2011-04-21 Sony Corp 符号化装置、復号装置、情報処理システム、符号化方法およびプログラム

Also Published As

Publication number Publication date
US10255925B2 (en) 2019-04-09
US20140334540A1 (en) 2014-11-13
JPWO2013108685A1 (ja) 2015-05-11
US9754599B2 (en) 2017-09-05
US20170345434A1 (en) 2017-11-30
US10607618B2 (en) 2020-03-31
US20190164559A1 (en) 2019-05-30
WO2013108685A1 (ja) 2013-07-25
JP5846220B2 (ja) 2016-01-20
CN104041054A (zh) 2014-09-10
JP2016054523A (ja) 2016-04-14

Similar Documents

Publication Publication Date Title
US8890723B2 (en) Encoder that optimizes bit allocation for information sub-parts
US8019601B2 (en) Audio coding device with two-stage quantization mechanism
JP4224021B2 (ja) 信号のマルチレートによる格子ベクトル量子化の方法とシステム
US7978101B2 (en) Encoder and decoder using arithmetic stage to compress code space that is not fully utilized
KR101330362B1 (ko) 오디오 인코딩 방법, 오디오 디코딩 방법 및 오디오 인코더 디바이스
JP4548348B2 (ja) 音声符号化装置及び音声符号化方法
JP6032509B2 (ja) 復号装置、復号方法、およびプログラム
US8237594B2 (en) Encoding apparatus, decoding apparatus, information processing system, and computer-readable storage medium
KR20080025403A (ko) 디지털 미디어의 효율적인 코딩을 위한 대역을 획득하기위한 주파수 세그먼트화
JP7123910B2 (ja) インデックスコーディング及びビットスケジューリングを備えた量子化器
WO2014107950A1 (zh) 音频信号编码和解码方法、音频信号编码和解码装置
CN111710342B (zh) 编码装置、解码装置、编码方法、解码方法及程序
TW200818124A (en) Encoding an audio signal
JP6289627B2 (ja) 信号の符号化および復号化の方法および装置
US7750829B2 (en) Scalable encoding and/or decoding method and apparatus
JP4335245B2 (ja) 量子化装置、逆量子化装置、音声音響符号化装置、音声音響復号装置、量子化方法、および逆量子化方法
JP2006011170A (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP6337122B2 (ja) オーディオ信号エンコーダ
JP2013174689A (ja) オーディオ符号化装置、オーディオ符号化方法、およびプログラム
JP5188913B2 (ja) 量子化装置、量子化方法、逆量子化装置、逆量子化方法、音声音響符号化装置および音声音響復号装置
Shoa et al. Adaptive rate-distortion optimal in-loop quantization for matching pursuit

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160817

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160929

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161012

R151 Written notification of patent or utility model registration

Ref document number: 6032509

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250