JP6062861B2 - 符号化装置及び符号化方法 - Google Patents

符号化装置及び符号化方法 Download PDF

Info

Publication number
JP6062861B2
JP6062861B2 JP2013537393A JP2013537393A JP6062861B2 JP 6062861 B2 JP6062861 B2 JP 6062861B2 JP 2013537393 A JP2013537393 A JP 2013537393A JP 2013537393 A JP2013537393 A JP 2013537393A JP 6062861 B2 JP6062861 B2 JP 6062861B2
Authority
JP
Japan
Prior art keywords
spectrum
suppression
encoding
celp
pulse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013537393A
Other languages
English (en)
Other versions
JPWO2013051210A1 (ja
Inventor
勝統 大毛
勝統 大毛
利幸 森井
利幸 森井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Corp of America
Original Assignee
Panasonic Intellectual Property Corp of America
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Corp of America filed Critical Panasonic Intellectual Property Corp of America
Publication of JPWO2013051210A1 publication Critical patent/JPWO2013051210A1/ja
Application granted granted Critical
Publication of JP6062861B2 publication Critical patent/JP6062861B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3068Precoding preceding compression, e.g. Burrows-Wheeler transformation
    • H03M7/3071Prediction
    • H03M7/3073Time

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、符号化装置及び符号化方法に関する。
音声及び音楽等を、低ビットレートかつ高音質で圧縮できる符号化方式として、音声信号に適したCELP(Code Excited Linear Prediction)符号化方式と、音楽信号に適した変換符号化方式とを階層(レイヤ)構造にして組み合わせた符号化方式が提案されている(例えば、非特許文献1参照)。なお、以下においては、音声信号と音楽信号とを総称して音響信号と称することもある。
この符号化方式では、符号化装置は、まず、CELP符号化方式で入力信号を符号化してCELP符号化データを生成する。次いで、符号化装置は、入力信号とCELP復号信号(CELP符号化データの復号結果)との残差信号(以下、CELP残差信号と呼ぶ)を周波数領域に変換して得られる残差スペクトルを変換符号化することにより、高音質化を図っている。変換符号化方式としては、残差スペクトルのエネルギが大きい周波数にパルスを立てて、そのパルスの情報を符号化する方式が提案されている(非特許文献1参照)。
しかしながら、CELP符号化方式は、音声信号の符号化には適しているが、音楽信号に対しては符号化モデルが異なるので音質が悪くなる。そのため、上記符号化方式で音楽信号を符号化した場合、CELP残差信号の成分が大きくなるので、変換符号化によりCELP残差信号(残差スペクトル)を符号化しても音質が向上しにくいという課題がある。
この課題を解決するために、CELP復号信号の周波数成分(以下、CELP成分と呼ぶ)の振幅を抑圧した結果を用いて算出される残差スペクトルを変換符号化することで高音質化を図る符号化方式(CELP成分抑圧方法)が提案されている(例えば、特許文献1及び非特許文献1(section 6.11.6.2)参照)。
非特許文献1に開示されたCELP成分抑圧方法では、入力信号のサンプリング周波数が16kHzの場合、0.8kHz〜5.5kHzの中帯域のみでCELP成分の振幅の抑圧(以下、CELP抑圧と呼ぶ)が行われる。ただし、非特許文献1では、符号化装置は、CELP残差信号に対して変換符号化を直接行うのではなく、その前に下位レイヤにおいて別の変換符号化方式(例えば、非特許文献1(Section 6.11.6.1)参照)によってCELP残差信号を小さくしている。このため、符号化装置は、中帯域であっても上記別の変換符号化方式によって符号化された周波数成分に対してはCELP抑圧を行わない。この際、下位レイヤの変換符号化データを上位レイヤに受け渡し、各周波数成分について0以外の値を持っているかを判定している。0以外の値を持っている場合には下位レイヤにてその周波数成分に対し変換符号化が行われたと判断し、CELP抑圧を行わない。値が0だった場合には下位レイヤにてその周波数成分に対し変換符号化が行われていないと判断し、CELP抑圧処理を行っている。また、中帯域内のCELP抑圧を行わない周波数以外の他の周波数では、CELP抑圧の程度(強さ)を示すCELP抑圧係数は一様である。
符号化装置は、変換符号化を行う前に、CELP成分(CELP復号信号)と、CELP抑圧係数コードブックに格納されているCELP抑圧係数とを乗じることでCELP抑圧を行ってから、入力信号とCELP復号信号(CELP抑圧後のCELP復号信号)との残差スペクトルを求め、残差スペクトルを変換符号化する。
一方、復号装置は、符号化装置から送信されるCELP抑圧係数を用いて、CELP復号信号のCELP成分を抑圧し、CELP成分が抑圧されたCELP復号信号に変換符号化の復号信号を加算する。これにより、復号装置では、CELP符号化と変換符号化とを階層構造にして組み合わせた符号化を行う際のCELP符号化による音質の劣化を抑えた復号信号を得ることができる。
米国特許出願公開第2009/0112607号明細書
Recommendation ITU-T G.718,2008年6月
しかしながら、上述したCELP成分抑圧方法を複数のレイヤで多段的に行う場合、下位レイヤにおいて一度でも変換符号化を行った周波数成分については上位レイヤでCELP抑圧を行わないため、変換符号化を行ったレイヤにおける変換符号化データの復号信号を、CELP抑圧を行う全ての上位レイヤに受け渡す必要がある。この際、CELP抑圧を行うレイヤが多くなるほど、上位レイヤに受け渡す下位レイヤの変換符号化データ数が増えていくために、消費するメモリ量が非常に大きくなってしまうという課題がある。
また、下位レイヤの復号信号を上位レイヤに受け渡すという方式を採っているため、CELP抑圧を行うレイヤにおいては、受け渡された下位レイヤの復号信号の全ての周波数成分について値の判定をし、CELP抑圧を行うか否かを決定せざるを得ない。この方式では、CELP抑圧を複数のレイヤで多段的に行う場合、値の判定をすべき復号信号の数が上位レイヤにいくほど増えてしまうため、演算量が非常に大きくなってしまうという課題がある。
本発明の一点目の目的は、CELP抑圧を複数のレイヤにおいて多段的に行う場合に、下位レイヤにおいて各周波数成分が変換符号化された際の周波数インデックス(以下、符号化パルスインデックスと呼ぶ)を記憶する配列を用意し、この配列を上位レイヤに受け渡すことで、メモリ使用量の削減を可能にする符号化装置及び符号化方法を提供することである。
本発明の二点目の目的は、前記配列を下位レイヤから上位レイヤへと受け渡し、下位レイヤからの出力信号に前記配列を単純に掛け合わせることで、前記で述べた値の判定をせずにCELP抑圧を行うことによって演算量の削減を可能にする符号化装置及び符号化方法を提供することである。
本発明の一態様に係る符号化装置は、入力信号に対する第1の符号化により第1符号を取得し、前記第1符号を復号して生成された第1復号信号のスペクトルを出力する第1符号化手段と、前記第1復号信号のスペクトルの振幅を、第1の抑圧係数を用いて抑圧し、第1抑圧スペクトルを生成する第1抑圧手段と、前記入力信号のスペクトルと前記第1抑圧スペクトルとを用いて残差スペクトルを算出する残差スペクトル算出手段と、前記残差スペクトルに対して立てられたパルスに対してパルス位置の周波数インデックスとパルスの振幅とを第2の符号化で符号化することにより第2符号を取得し、前記第2符号を復号して生成された第2復号信号のスペクトルを出力する第2符号化手段と、前記第2符号化手段において符号化された前記第2符号のうち周波数インデックスを記憶したパルス位置記憶配列を出力するパルス位置記憶手段と、前記第2復号信号のスペクトルと前記第1抑圧スペクトルとを加算して得られる加算スペクトルの振幅を、第2の抑圧係数と前記パルス位置記憶配列とを用いて抑圧し、第2抑圧スペクトルを生成する第2抑圧手段と、を具備し、前記パルス位置記憶手段は、前記パルス位置記憶配列の全要素を1で初期化する初期化手段と、前記第2の符号化で符号化されたパルス位置の周波数インデックスに従って前記パルス位置記憶配列の要素に0を格納する記憶手段と、を具備し、前記第2抑圧手段は、式(3)を用いて、前記加算スペクトルの振幅を抑圧し、前記第2抑圧スペクトルを生成する。式(3)において、Snは前記加算スペクトルの振幅を表し、Sn’は前記第2抑圧スペクトルを表し、gは前記第2の抑圧係数を表す。
本発明の一態様に係る符号化方法は、入力信号に対する第1の符号化により第1符号を取得し、前記第1符号を復号して生成された第1復号信号のスペクトルを出力する第1符号化ステップと、前記第1復号信号のスペクトルの振幅を、第1の抑圧係数を用いて抑圧し、第1抑圧スペクトルを生成する第1抑圧ステップと、前記入力信号のスペクトルと前記第1抑圧スペクトルとを用いて残差スペクトルを算出する残差スペクトル算出ステップと、前記残差スペクトルに対して立てられたパルスに対してパルス位置の周波数インデックスとパルスの振幅とを第2の符号化で符号化することにより第2符号を取得し、前記第2符号を復号して生成された第2復号信号のスペクトルを出力する第2符号化ステップと、前記第2符号化ステップにおいて符号化された前記第2符号のうち周波数インデックスを記憶したパルス位置記憶配列を出力するパルス位置記憶ステップと、前記第2復号信号のスペクトルと前記第1抑圧スペクトルを加算して得られる加算スペクトルの振幅を、第2の抑圧係数と前記パルス位置記憶配列とを用いて抑圧し、第2抑圧スペクトルを生成する第2抑圧ステップと、を具備し、前記パルス位置記憶ステップは、前記パルス位置記憶配列の全要素を1で初期化する初期化ステップと、前記第2の符号化で符号化されたパルス位置の周波数インデックスに従って前記パルス位置記憶配列の要素に0を格納する記憶ステップと、を具備し、前記第2抑圧ステップは、式(3)を用いて、前記加算スペクトルの振幅を抑圧し、前記第2抑圧スペクトルを生成する。式(3)において、Snは前記加算スペクトルの振幅を表し、Sn’は前記第2抑圧スペクトルを表し、gは前記第2の抑圧係数を表す。
本発明によれば、過去に変換符号化が行われた符号化パルスインデックスを参照する際に使用するメモリ容量と、CELP成分抑圧処理にかかる演算量とを削減することができる。
本発明の実施の形態に係る符号化装置の構成を示すブロック図 本発明の実施の形態に係る符号化パルスインデックスの抽出手順を説明するための図 本発明の実施の形態に係るパルスインデックス記憶部の構成を示すブロック図 本発明の実施の形態に係る符号化パルスインデックス記憶処理の手順を説明するためのフロー図
以下、本発明の各実施の形態について、図面を参照して詳細に説明する。なお、本発明に係る符号化装置として、音響符号化装置を例にとって説明する。なお、上述のように、音声信号と音楽信号とを総称して音響信号と称することとする。すなわち、音響信号は、実質的に音声信号のみ、実質的に音楽信号のみ、音声信号及び音楽信号が混在した信号、のいずれの信号をも表すものとする。
また、本発明に係る符号化装置は、少なくとも3つの符号化を行うレイヤを有する。以下の説明においては、符号化装置は、音声信号に適した符号化としてCELP符号化を、音楽信号に適した符号化として変換符号化を、それぞれ代表して用いるものとする。符号化装置は、CELP符号化と変換符号化とをレイヤ構造にして組み合わせ、更に変換符号化をレイヤ構造にして組み合わせた符号化方式を用いる。
なお、以下の説明においては、第1の符号化としてCELP符号化を行うレイヤを第1レイヤ、第2の符号化として1度目の変換符号化を行うレイヤを第2レイヤ、第3の符号化として2度目の変換符号化を行うレイヤを第3レイヤと呼ぶ。
(実施の形態)
図1は、本発明の実施の形態1に係る符号化装置100の主要な構成を示すブロック図である。符号化装置100は、音声及び音楽等の入力信号を、CELP符号化と変換符号化とをレイヤ構造にして組み合わせた符号化方式を用いて符号化して、符号化データを出力する。図1に示すように、符号化装置100は、MDCT(Modified Discrete Cosine Transform:修正離散コサイン変換)部101、CELP符号化部102、MDCT部103、CELP成分抑圧部104、CELP残差信号スペクトル算出部105、変換符号化部106、パルスインデックス記憶部107及び加算部108を具備する。CELP成分抑圧部109〜加算部112の各部についてはそれぞれCELP成分抑圧部104〜加算部108の各部を階層的に組み合わせたものである。つまり、ここでは3層のレイヤ構造を想定しており、変換符号化を行う各レイヤにおいてCELP成分を抑圧する構成になっている。以下、CELP符号化部102、及びMDCT部103を第1レイヤとし、CELP成分抑圧部104、CELP残差信号スペクトル算出部105、変換符号化部106、パルスインデックス記憶部107及び加算部108を第2レイヤとし、CELP成分抑圧部109、CELP残差信号スペクトル算出部110、変換符号化部111、パルスインデックス記憶部107及び加算部112を第3レイヤとしてみなす(パルスインデックス記憶部107は、レイヤ2及びレイヤ3において共通して使用される)。
図1に示す符号化装置100において、MDCT部101は、入力信号に対してMDCT処理を行って入力信号スペクトルを生成する。そして、MDCT部101は、生成した入力信号スペクトルをCELP残差信号スペクトル算出部105、110に出力する。
以下、第1レイヤの各部について説明する。
CELP符号化部102は、入力信号をCELP符号化方式により符号化してCELP符号化データ(第1符号)を生成する。また、CELP符号化部102は、生成したCELP符号化データを復号(ローカルデコード)してCELP復号信号(第1復号信号)を生成する。そして、CELP符号化部102は、CELP符号化データを多重化部113に出力し、CELP復号信号をMDCT部103に出力する。
MDCT部103は、CELP符号化部102から入力されるCELP復号信号に対してMDCT処理を行ってCELP復号信号スペクトルを生成する。そして、MDCT部103は、生成したCELP復号信号スペクトルをCELP成分抑圧部104に出力する。
このように、CELP符号化部102及びMDCT部103は、入力信号に対する第1の符号化により第1符号を生成し、得られた第1符号を復号して生成された第1復号信号のスペクトルを出力することで、例えば第1符号化部として動作し、第1レイヤを構成する。
以下、第2レイヤの各部について説明する。
CELP成分抑圧部104は、あらかじめCELP成分抑圧部104に格納されている抑圧係数候補の中から、符号化歪を最小にする最適抑圧係数を選択し、MDCT部103から入力されるCELP復号信号スペクトルの周波数成分毎に乗じて、CELP成分抑圧スペクトルを算出する。そして、CELP成分抑圧部104は、CELP成分抑圧スペクトルをCELP残差信号スペクトル算出部105及び加算部108に出力する。
CELP残差信号スペクトル算出部105は、MDCT部101から入力される入力信号スペクトルと、CELP成分抑圧部104から入力されるCELP成分抑圧スペクトルとの差分であるCELP残差信号スペクトルを算出する。具体的には、CELP残差信号スペクトル算出部105は、入力信号スペクトルからCELP成分抑圧スペクトルを減じることで、CELP残差信号スペクトルを得る。そして、CELP残差信号スペクトル算出部105は、CELP残差信号スペクトルを、変換符号化のターゲット信号として変換符号化部106に出力する。
変換符号化部106は、CELP残差信号スペクトル算出部105から入力されるCELP残差信号スペクトルを変換符号化により符号化して、変換符号化データ(第2符号)を生成する。変換符号化データは、少なくとも変換符号化が行われた周波数成分のインデックスデータ(符号化パルスインデックス)を含む。また、変換符号化部106は、生成した変換符号化データを復号(ローカルデコード)して、変換符号化復号信号スペクトル(第2復号信号)を生成する。このとき、変換符号化部106は、CELP残差信号スペクトルと変換符号化復号信号スペクトルとの歪が小さくなるように符号化を行う。変換符号化部106は、CELP残差信号スペクトルの振幅(エネルギ)が大きい周波数に、パルスを立てることで上記歪を小さくするように符号化を行う。そして、変換符号化部106は、変換符号化復号信号スペクトルを加算部108に、符号化パルスインデックスをパルスインデックス記憶部107に、変換符号化データを多重化部113に、それぞれ出力する。
パルスインデックス記憶部107は、変換符号化部106から入力される符号化パルスインデックスを、例えば、配列の形で記憶し、第3レイヤのCELP成分抑圧部109に出力する。記憶された配列の使い方の詳細は、後述する。
加算部108は、CELP成分抑圧部104から入力されるCELP成分抑圧スペクトルと、変換符号化部106から入力される変換符号化復号信号スペクトルとを加算して復号信号スペクトルを算出し、第3レイヤのCELP成分抑圧部109に出力する。
CELP成分抑圧部104〜加算部108の各部は、以上述べたように動作することで、例えば第2符号化部として動作し、第2レイヤを構成する。
以下、第3レイヤについて説明する。
CELP成分抑圧部109は、あらかじめCELP成分抑圧部109に格納されている抑圧係数候補の中から符号化歪を最小にする最適抑圧係数を選択する。また、CELP成分抑圧部109は、パルスインデックス記憶部107から出力された配列を用いることで、抑圧すべきCELP成分の周波数インデックスを判断する。そして、CELP成分抑圧部109は、第2レイヤの加算部108から入力される復号信号スペクトルのうち、前記判断された周波数インデックスに対応する周波数成分のみに前記最適抑圧係数を乗じてCELP抑圧を行い、CELP成分抑圧スペクトルを算出する。そして、CELP成分抑圧部109は、CELP成分抑圧スペクトルをCELP残差信号スペクトル算出部110及び加算部112に出力する。CELP成分抑圧処理の詳細は後述する。
CELP残差信号スペクトル算出部110は、MDCT部101から入力される入力信号スペクトルと、CELP成分抑圧部109から入力されるCELP成分抑圧スペクトルとの差分であるCELP残差信号スペクトルを算出する。具体的には、CELP残差信号スペクトル算出部110は、入力信号スペクトルからCELP成分抑圧スペクトルを減じることで、CELP残差信号スペクトルを得る。そして、CELP残差信号スペクトル算出部110は、CELP残差信号スペクトルをターゲット信号として変換符号化部111に出力する。
変換符号化部111は、CELP残差信号スペクトル算出部110から入力されるCELP残差信号スペクトルを変換符号化により符号化して、変換符号化データを生成する。変換符号化データは、少なくとも変換符号化が行われた周波数成分のインデックスデータ(符号化パルスインデックス)を含む。また、変換符号化部111は、生成した変換符号化データを復号(ローカルデコード)して、変換符号化復号信号スペクトルを生成する。このとき、変換符号化部111は、CELP残差信号スペクトルと変換符号化復号信号スペクトルとの歪が小さくなるように符号化を行う。変換符号化部111は、CELP残差信号スペクトルの振幅(エネルギ)が大きい周波数に、パルスを立てることで上記歪を小さくするように符号化を行う。そして、変換符号化部111は、変換符号化復号信号スペクトルを加算部112に、符号化パルスインデックスをパルスインデックス記憶部107に、変換符号化データを多重化部113に、それぞれ出力する。
パルスインデックス記憶部107は、変換符号化部111から入力される符号化パルスインデックスを、例えば、配列の形で記憶する。記憶された配列の使い方の詳細は、後述する。
加算部112は、CELP成分抑圧部109から入力されるCELP成分抑圧スペクトルと、変換符号化部111から入力される変換符号化復号信号スペクトルとを加算して復号信号スペクトルを算出し、更に上位のレイヤへ出力する。
CELP成分抑圧部109〜加算部112の各部は、以上述べたように動作することで、例えば第3符号化部として動作し、第3レイヤを構成する。
多重化部113は、CELP符号化部102から入力されるCELP符号化データ、変換符号化部106、及び111から入力される変換符号化データを多重化して、多重化結果を符号化データとして復号装置へ送信する。
次に、符号化装置100(図1)におけるパルスインデックス記憶処理の詳細について説明する。
まず、パルスインデックス記憶部107におけるパルスインデックス記憶方法の一例について説明する。
CELP成分を抑圧する処理を行う際、下位レイヤで変換符号化が行われた周波数成分に関しては、既にその誤差が小さくなるように変換符号化が施されているために、CELP抑圧を行わない。そこでCELP抑圧を行う前に、下位レイヤからの復号信号を参照することで過去に変換符号化が行われた周波数成分かどうかを全ての周波数成分に対して判断する方式が提案されている(例えば、非特許文献1参照)。しかしながら、上位レイヤにおいて多段的にCELP抑圧を行う場合には、下位レイヤから上位レイヤへ受け渡す復号信号の数が増えてしまう。また、下位レイヤからの復号信号に対し、周波数成分ごとに変換符号化が行われたかどうかを判定する必要があるので、演算量が増大してしまう。そこで、過去に変換符号化が行われた周波数成分のインデックス(符号化パルスインデックス)を記憶する仕組みを用意する。
図2は、CELP残差信号算出部105から出力されたCELP残差信号スペクトルが変換符号化部106で符号化され、符号化パルスインデックスがパルスインデックス記憶部107へ出力される手順を示している。
図2では、例えばCELP残差信号スペクトルが26本のパルスによって構成されている場合を例に挙げて説明している。この26本のパルスのうち、変換符号化部106では、パルスの振幅(エネルギ)が大きい周波数に対して符号化が行われる。ただし、符号化されるパルス本数は常に一定ではなく、変換符号化部106に割り振られるビット数、あるいは、CELP残差信号スペクトルのパルス振幅のばらつきによって増減する。ここで符号化されたパルスの周波数インデックス(パルスインデックス)が、パルスインデックス記憶部107へ出力される。
パルスインデックス記憶部107へ入力されるパルスインデックスは、例えば配列の形で記憶される。この配列は、パルスインデックス記憶部107すなわちメモリに記憶される。具体的な記憶方法は以下で述べる。
図3は、パルスインデックス記憶部107の構成を示すブロック図である。パルスインデックス記憶部107は、記憶部201と初期化部202とから構成される。記憶部201は、パルスの周波数インデックス(パルスインデックス)を記憶する配列Pを格納する。配列Pは、必要に応じて適宜更新される。初期化部202は、所定のタイミングで、記憶部201に格納された配列Pを配列初期値で初期化する。
図4は、パルスインデックス記憶部107の記憶処理の手順を示すフロー図である。
初期化部202は、処理対象フレーム(又はサブフレーム)における符号化処理が行われる前に、記憶部201に格納された配列Pを、次式(1)のように、全ての要素が配列初期値となるように初期化する(ST2010)。ここでは、配列初期値として1を用いる。これにより、CELP抑圧の式が簡易な式となり、演算量が削減される。
Figure 0006062861
ここでkは周波数成分のインデックスを表し、Lは変換符号化復号信号スペクトルの長さを表す。この初期化処理は、符号化の処理単位(通常、フレーム又はサブフレーム)について、符号化処理が行われる前の1度のみ実行される。
この初期化された配列Pに対し、記憶部201は、変換符号化部106において変換符号化が施された周波数成分のインデックス(符号化パルスインデックス)が昇順で各要素に格納された配列indx[j]を用いて、配列Pの要素P[indx[j]]の値を、次式(2)のように0で置換(更新)する(ST2020)。これをパルスインデックス記憶処理と呼ぶ。ここでjは配列indxのインデックスを表す。また、Nは配列indxの長さであり、すなわち当該レイヤにおいて立てることのできるパルス本数の最大値である。
Figure 0006062861
そして、記憶部201は、式(2)によりパルスインデックス記憶処理が行われた配列Pを上位レイヤのCELP成分抑圧部109に受け渡す。CELP成分抑圧部109は、配列Pを参照することで次式(3)のようにCELP抑圧を行う。
Figure 0006062861
ここで、Snはn番目のレイヤからの出力信号スペクトルを表し、Sn’はSnに対してCELP抑圧を行った後のCELP成分抑圧スペクトルを表す。gはCELP成分の抑圧係数を表し、0から1までの値を取り得る。
このように、CELP成分抑圧部109は、周波数成分ごとに値を判定してCELP抑圧を行う必要なく、下位レイヤから受け渡された配列Pを、式(3)のような簡便な演算処理を行うだけでCELP抑圧を行うことが可能になる。
次に配列Pは、上位レイヤで変換符号化が行われた際(ここでは、変換符号化部111において実行)に、パルスインデックス記憶部107の記憶部201に受け渡された上位レイヤの符号化パルスインデックスindx’を用いて次式(4)のように更新される(ST2020)。
配列Pの更新処理は、所定回数(基本的には変換符号化を行うレイヤ数)だけ行われる(ST2030)。
Figure 0006062861
このように配列Pは、更に上位レイヤでCELP抑圧処理を伴う変換符号化が行われる場合に備えて更新される。つまり、変換符号化を行う複数のレイヤにおいて多段的にCELP抑圧を行う場合、下位レイヤで更新された配列Pのみを用いればよく、変換符号化が行われたすべての下位レイヤの出力信号を上位レイヤに受け渡して参照する必要がない。
以上、本発明の実施の形態について説明した。
また、上記実施の形態では、CELP成分を抑圧する一例として2段階の抑圧処理を行う階層構造を用いて説明したが、これよりも多段でCELP成分を抑圧する方式についても本発明は実現可能であり、同様の効果が得られる。
また、上記実施の形態では、音声信号に適した符号化の一例としてCELP符号化を用いて説明したが、本発明はADPCM(Adaptive Differential Pulse Code Modulation)、APC(Adaptive Prediction Coding)、ATC(Adaptive Transform Coding)、TCX(Transform Coded Excitation)等を用いても実現可能であり、同様の効果が得られる。
また、上記実施の形態では、音楽信号に適した符号化の一例として変換符号化を用いて説明したが、音声信号に適した符号化方式の復号信号と入力信号との残差信号を周波数領域で効率良く符号化できる方式であれば良い。このような方式として、FPC(Factorial Pulse Coding)及びAVQ(Algebraic Vector Quantization)などがあり、同様の効果を得ることができる。
また、上記実施の形態では、パルスインデックス記憶方法の一例として配列を導入して説明したが、ポインタなど、メモリ上に記憶された符号化パルスインデックス情報に関する論理的位置情報を保持し、インクリメント演算することによって連続的に参照することができるものにおいても、本発明は実現可能である。
また、上記実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はハードウェアとの連携においてソフトウェアで実現することも可能である。
また、上記実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部または全てを含むように1チップ化されてもよい。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)又は、LSI内部の回路セルの接続又は設定を再構成可能なリコンフィギュラブル/プロセッサを利用してもよい。
さらには、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。
2011年10月7日出願の特願2011−223021の日本出願に含まれる明細書、図面及び要約書の開示内容は、すべて本願に援用される。
本発明は、符号化の品質劣化を抑えつつ装置全体としてのメモリ量と演算量とを削減することができ、例えば、パケット通信システム、移動通信システムなどに適用できる。
100 符号化装置
101,103 MDCT部
102 CELP符号化部
104, 109 CELP成分抑圧部
105, 110 CELP残差信号スペクトル算出部
106,111 変換符号化部
107 パルスインデックス記憶部
108, 112 加算部
113 多重化部
201 記憶部
202 初期化部

Claims (2)

  1. 入力信号に対する第1の符号化により第1符号を取得し、前記第1符号を復号して生成された第1復号信号のスペクトルを出力する第1符号化手段と、
    前記第1復号信号のスペクトルの振幅を、第1の抑圧係数を用いて抑圧し、第1抑圧スペクトルを生成する第1抑圧手段と、
    前記入力信号のスペクトルと前記第1抑圧スペクトルとを用いて残差スペクトルを算出する残差スペクトル算出手段と、
    前記残差スペクトルに対して立てられたパルスに対してパルス位置の周波数インデックスとパルスの振幅とを第2の符号化で符号化することにより第2符号を取得し、前記第2符号を復号して生成された第2復号信号のスペクトルを出力する第2符号化手段と、
    前記第2符号化手段において符号化された前記第2符号のうち周波数インデックスを記憶したパルス位置記憶配列を出力するパルス位置記憶手段と、
    前記第2復号信号のスペクトルと前記第1抑圧スペクトルとを加算して得られる加算スペクトルの振幅を、第2の抑圧係数と前記パルス位置記憶配列とを用いて抑圧し、第2抑圧スペクトルを生成する第2抑圧手段と、
    を具備し、
    前記パルス位置記憶手段は、
    前記パルス位置記憶配列の全要素を1で初期化する初期化手段と、
    前記第2の符号化で符号化されたパルス位置の周波数インデックスに従って前記パルス位置記憶配列の要素に0を格納する記憶手段と、
    を具備し、
    前記第2抑圧手段は、式(1)を用いて、前記加算スペクトルの振幅を抑圧し、前記第2抑圧スペクトルを生成する、
    符号化装置。
    Figure 0006062861
    ここで、Snは前記加算スペクトルの振幅を表し、Sn’は前記第2抑圧スペクトルを表し、gは前記第2の抑圧係数を表す。
  2. 入力信号に対する第1の符号化により第1符号を取得し、前記第1符号を復号して生成された第1復号信号のスペクトルを出力する第1符号化ステップと、
    前記第1復号信号のスペクトルの振幅を、第1の抑圧係数を用いて抑圧し、第1抑圧スペクトルを生成する第1抑圧ステップと、
    前記入力信号のスペクトルと前記第1抑圧スペクトルとを用いて残差スペクトルを算出する残差スペクトル算出ステップと、
    前記残差スペクトルに対して立てられたパルスに対してパルス位置の周波数インデックスとパルスの振幅とを第2の符号化で符号化することにより第2符号を取得し、前記第2符号を復号して生成された第2復号信号のスペクトルを出力する第2符号化ステップと、
    前記第2符号化ステップにおいて符号化された前記第2符号のうち周波数インデックスを記憶したパルス位置記憶配列を出力するパルス位置記憶ステップと、
    前記第2復号信号のスペクトルと前記第1抑圧スペクトルを加算して得られる加算スペクトルの振幅を、第2の抑圧係数と前記パルス位置記憶配列とを用いて抑圧し、第2抑圧スペクトルを生成する第2抑圧ステップと、
    を具備し、
    前記パルス位置記憶ステップは、
    前記パルス位置記憶配列の全要素を1で初期化する初期化ステップと、
    前記第2の符号化で符号化されたパルス位置の周波数インデックスに従って前記パルス位置記憶配列の要素に0を格納する記憶ステップと、
    を具備し、
    前記第2抑圧ステップは、式(2)を用いて、前記加算スペクトルの振幅を抑圧し、前記第2抑圧スペクトルを生成する、
    符号化方法。
    Figure 0006062861
    ここで、Snは前記加算スペクトルの振幅を表し、Sn’は前記第2抑圧スペクトルを表し、gは前記第2の抑圧係数を表す。
JP2013537393A 2011-10-07 2012-09-21 符号化装置及び符号化方法 Active JP6062861B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011223021 2011-10-07
JP2011223021 2011-10-07
PCT/JP2012/006022 WO2013051210A1 (ja) 2011-10-07 2012-09-21 符号化装置及び符号化方法

Publications (2)

Publication Number Publication Date
JPWO2013051210A1 JPWO2013051210A1 (ja) 2015-03-30
JP6062861B2 true JP6062861B2 (ja) 2017-01-18

Family

ID=48043395

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013537393A Active JP6062861B2 (ja) 2011-10-07 2012-09-21 符号化装置及び符号化方法

Country Status (4)

Country Link
US (1) US9558752B2 (ja)
EP (1) EP2733699B1 (ja)
JP (1) JP6062861B2 (ja)
WO (1) WO2013051210A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106409300B (zh) * 2014-03-19 2019-12-24 华为技术有限公司 用于信号处理的方法和装置
US10263765B2 (en) * 2016-11-09 2019-04-16 Khalifa University of Science and Technology Systems and methods for low-power single-wire communication
US11133891B2 (en) 2018-06-29 2021-09-28 Khalifa University of Science and Technology Systems and methods for self-synchronized communications
US10951596B2 (en) * 2018-07-27 2021-03-16 Khalifa University of Science and Technology Method for secure device-to-device communication using multilayered cyphers

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19814971A1 (de) * 1998-04-03 1999-10-07 Daimlerchrysler Aerospace Ag Verfahren zur Störbefreiung eines Mikrophonsignals
WO2005111568A1 (ja) * 2004-05-14 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法
KR20080047443A (ko) * 2005-10-14 2008-05-28 마츠시타 덴끼 산교 가부시키가이샤 변환 부호화 장치 및 변환 부호화 방법
US20100017199A1 (en) * 2006-12-27 2010-01-21 Panasonic Corporation Encoding device, decoding device, and method thereof
EP2128858B1 (en) * 2007-03-02 2013-04-10 Panasonic Corporation Encoding device and encoding method
JP4708446B2 (ja) 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
JP5294713B2 (ja) * 2007-03-02 2013-09-18 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
JP4633774B2 (ja) * 2007-10-05 2011-02-16 日本電信電話株式会社 多重ベクトル量子化方法、装置、プログラム及びその記録媒体
US8527265B2 (en) * 2007-10-22 2013-09-03 Qualcomm Incorporated Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
US8209190B2 (en) * 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US8175888B2 (en) * 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
EP2581904B1 (en) * 2010-06-11 2015-10-07 Panasonic Intellectual Property Corporation of America Audio (de)coding apparatus and method
RU2013110317A (ru) 2010-09-10 2014-10-20 Панасоник Корпорэйшн Кодирующее устройство и способ кодирования

Also Published As

Publication number Publication date
EP2733699B1 (en) 2017-09-06
EP2733699A1 (en) 2014-05-21
US20140214411A1 (en) 2014-07-31
WO2013051210A1 (ja) 2013-04-11
EP2733699A4 (en) 2015-04-08
JPWO2013051210A1 (ja) 2015-03-30
US9558752B2 (en) 2017-01-31

Similar Documents

Publication Publication Date Title
RU2488897C1 (ru) Кодирующее устройство, декодирующее устройство и способ
JP5143193B2 (ja) スペクトル包絡情報量子化装置、スペクトル包絡情報復号装置、スペクトル包絡情報量子化方法及びスペクトル包絡情報復号方法
US9218817B2 (en) Low-delay sound-encoding alternating between predictive encoding and transform encoding
JP5413839B2 (ja) 符号化装置および復号装置
JP5695074B2 (ja) 音声符号化装置および音声復号化装置
JP5285162B2 (ja) ピーク検出に基づいた選択型スケーリングマスク演算
EP2206112A1 (en) Method and apparatus for generating an enhancement layer within an audio coding system
JPWO2008072737A1 (ja) 符号化装置、復号装置およびこれらの方法
US8892428B2 (en) Encoding apparatus, decoding apparatus, encoding method, and decoding method for adjusting a spectrum amplitude
JPWO2007132750A1 (ja) Lspベクトル量子化装置、lspベクトル逆量子化装置、およびこれらの方法
US9786292B2 (en) Audio encoding apparatus, audio decoding apparatus, audio encoding method, and audio decoding method
JP6062861B2 (ja) 符号化装置及び符号化方法
JPWO2012032759A1 (ja) 符号化装置及び符号化方法
JP5544370B2 (ja) 符号化装置、復号装置およびこれらの方法
JP5711733B2 (ja) 復号装置、符号化装置及びこれらの方法
WO2008072735A1 (ja) 適応音源ベクトル量子化装置、適応音源ベクトル逆量子化装置、およびこれらの方法
JP2011154383A (ja) 音声符号化装置、音声復号装置およびそれらの方法
JP5606457B2 (ja) 符号化装置および符号化方法
US9123334B2 (en) Vector quantization of algebraic codebook with high-pass characteristic for polarity selection
RU2459283C2 (ru) Кодирующее устройство, декодирующее устройство и способ
JP5544371B2 (ja) 符号化装置、復号装置およびこれらの方法
JP6001451B2 (ja) 符号化装置及び符号化方法
JP5774490B2 (ja) 符号化装置、復号装置およびこれらの方法
JP2013057792A (ja) 音声符号化装置及び音声符号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150723

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160816

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161215

R150 Certificate of patent or registration of utility model

Ref document number: 6062861

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150