JPWO2010150767A1 - 符号化方法、復号方法、それらの方法を用いた装置、プログラム、記録媒体 - Google Patents

符号化方法、復号方法、それらの方法を用いた装置、プログラム、記録媒体 Download PDF

Info

Publication number
JPWO2010150767A1
JPWO2010150767A1 JP2011519899A JP2011519899A JPWO2010150767A1 JP WO2010150767 A1 JPWO2010150767 A1 JP WO2010150767A1 JP 2011519899 A JP2011519899 A JP 2011519899A JP 2011519899 A JP2011519899 A JP 2011519899A JP WO2010150767 A1 JPWO2010150767 A1 JP WO2010150767A1
Authority
JP
Japan
Prior art keywords
signal sequence
shift
duplication
decoding
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011519899A
Other languages
English (en)
Other versions
JP5400880B2 (ja
Inventor
公孝 堤
公孝 堤
茂明 佐々木
茂明 佐々木
祐介 日和▲崎▼
祐介 日和▲崎▼
勝宏 福井
勝宏 福井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011519899A priority Critical patent/JP5400880B2/ja
Publication of JPWO2010150767A1 publication Critical patent/JPWO2010150767A1/ja
Application granted granted Critical
Publication of JP5400880B2 publication Critical patent/JP5400880B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

復号信号を高品質に合成する。本発明の符号化方法は、ローカルデコード係数探索ステップを有す。ローカルデコード係数探索ステップは、複製判定サブステップ、複製シフト候補信号列生成サブステップ、距離計算サブステップ、距離最小シフト量検出サブステップを有す。複製判定サブステップは、符号化対象信号列ごとに、復号信号列から複製シフト候補信号列を生成するかを判定し、複製判定フラグを出力する。複製シフト候補信号列生成サブステップは、複製判定フラグが複製シフト候補信号列を生成することを示す場合には、あらかじめ定めたすべての信号シフト量の候補に対して、複製シフト候補信号列を生成する。距離計算サブステップは、あらかじめ定めた信号列同士の距離を示すパラメータを計算する。距離最小シフト量検出サブステップは、距離が最小となる信号シフト量を求める。

Description

本発明は、音声などの音響信号の符号化方法、復号方法、それらの方法を用いた装置、プログラムに関する。特に、符号化および情報の伝送の際に失われる情報を補完するための技術であって、伝送する符号に対して、損失する情報の一部を利用して得られる符号を付加することにより、復号時に損失した情報を復元する技術に関する。
少ないビットレートで入力信号を符号化する際や符号化したデータを伝送した際にデータの欠落が生じた場合に、ビット数の不足やビットの欠落により、入力信号と復号信号の誤差(符号化歪)が極端に大きくなる場合がある。符号化歪が大きい場合には、これが耳障りなノイズとして知覚される原因となる。伝送によりデータの欠落が生じた場合のノイズを隠蔽するための従来技術として、ある特徴量に着目し、復号信号の特徴量に近い値を持つ過去の復号信号をコピーする手法がある(特許文献1)。
特許文献1の音声信号送信装置1の機能構成例を図1に、音声信号受信装置2の機能構成例を図2にそれぞれ示す。送信装置1において、入力音声信号は入力バッファ10に蓄えられ、音声信号をフレームと呼ばれる一定の時間ごとに区切って、つまりフレーム分割して音声波形符号化部30に送る。音声波形符号化部30では、入力音声信号を音声符号に変換する。音声符号はパケット構成部70に送られる。音声特徴量計算部40では、入力バッファ10に蓄えられた音声信号を用いて、当該フレームにおけるその音声信号の音声特徴量を計算する。音声特徴量とは、ピッチ周期(音声の基本周波数に相当)、パワなどを指し、これらの特徴量のいずれかのみを利用することもあるし、全部を利用することもある。
音声特徴量符号化部50では、前記音声特徴量を決められたビット数で表すことができるように量子化した後、符号に変換する。符号化された音声特徴量は、シフトバッファ60に送られる。シフトバッファ60では、あらかじめ指定された数のフレームにわたって音声特徴量の符号を保持する。そして、シフトバッファ60では、後述する遅延量制御情報が入力されると、遅延量制御情報で指定されたフレーム数だけ前、つまり過去のフレームの音声信号の音声特徴量の符号(「補助情報」ともいう。)をパケット構成部70に送る。また、バッファ残量符号化部20は、バッファ残量が入力されると、バッファ残量を符号化する。そのバッファ残量符号もパケット構成部70に送られる。パケット構成部70では、前記音声信号波形を符号化した符号と、音声特徴量の符号と、遅延量制御情報と、バッファ残量符号を用いてパケットを構成する。パケット送出部80は、パケット構成部70で作成されたパケットの情報を受け取り、音声パケットとしてパケット通信網に送出する。
音声信号受信装置2のパケット受信部81は、パケット通信網から音声パケットを受信し、受信バッファ71に蓄積する。受信した音声パケットに含まれる音声信号波形を符号化した符号は、音声パケット復号部31に送られ、音声信号波形に復号される。パケットロスが発生していないフレームでは、音声パケット復号部31の出力信号が切替スイッチ32を通じて出力音声信号として出力される。バッファ残量復号部21では、受信した音声パケットに含まれるバッファ残量符号から、補助情報を何フレームまでずらしてパケットにつけるかを指定する遅延量制御情報を求める。求められた遅延量制御情報は、図1中のシフトバッファ60とパケット構成部70に送られる。受信した音声パケットに含まれる遅延量制御情報は、紛失処理制御部で利用される。受信バッファ残量判定部22は、受信バッファ71に蓄積されているパケットのフレーム数を検出する。このバッファ残量は、図1中のバッファ残量符号化部20に送られる。
紛失検出部90はパケットロス(紛失)を検出する。パケット受信部81で受信されたパケットはそのパケット番号にしたがって、つまりフレーム番号の順に受信バッファ71に格納される。受信バッファ71からは、格納されたパケットが読み出されるが、読み出される際に読み出すパケットがない場合には、その読み出し動作の直前に、パケットロス(紛失)が発生したと紛失検出部90が判定し、切替スイッチ32を紛失処理制御部の出力側に切替える。特許文献1の発明は、このような処理によって伝送によりデータの欠落が生じた場合のノイズを隠蔽する。
なお、紛失処理制御部は、以下のように動作する。フレームnにおいて、パケットロスが発生したとする。パケットロスが発生した場合は、受信バッファ探索部100が受信バッファ71に蓄積された受信パケットを探索し、フレームn+1以降で受信されているパケットの中で、紛失フレームnに時間の近い(タイムスタンプが直近の)パケットを探索する。パケットに含まれる音声信号波形を符号化した符号は、先読み音声波形復号部32で復号され、音声信号波形が得られる。さらに受信バッファ探索部100において受信バッファ71に蓄積されたパケットの中から、紛失フレームnの音声信号に対応する補助情報が付加されたパケットを探索する。このパケット探索で見つかれば、探索された紛失フレームnの音声信号に対応する補助情報は、音声特徴量復号部51において紛失フレームnの音声信号のピッチ情報とパワ情報に復号され、紛失信号生成部110に送られる。一方、出力音声信号は出力音声バッファ130に蓄えられ、パケット検索により見つからなければ出力音声バッファ130の出力音声信号はピッチ抽出部120においてピッチ周期の分析が行われる。ピッチ抽出部120において抽出されるピッチは、紛失フレームの直前フレームn−1の音声信号に対応するピッチである。直前フレームn−1の音声信号に対応するピッチは、紛失信号生成部110に送られる。紛失信号生成部110は、音声特徴量復号部51あるいはピッチ抽出部120から送られたピッチ情報を用いて、出力音声バッファ中の音声波形をピッチ単位で抽出し、紛失したパケットに対応する音声波形とする。紛失したパケットの直前パケットのピッチ単位で波形を繰り返すのではなく、紛失したパケットに対応する音声波形のピッチ単位で波形を繰り返すことにより、パケットが紛失しても、より自然な復号音声を得ることができる。
国際公開第2005/109401号
特許文献1の発明の場合、ピッチやパワーといった特徴量を符号化し、時間的にずらして伝送するため、復号対象のパケットが紛失しても、符号化された特徴量を復号し、この特徴量に近い値を持つ信号を受信側のバッファから求めることにより、紛失した信号に近い信号を合成することができる。しかし、何らかの特徴量を符号化して伝送する必要があること、受信側のバッファに関する情報について送り側との通信が必要となることなど、高品質な復号音声を生成するための演算を符号化器・復号器のみで行うことができないなどの課題がある。
本発明の符号化方法は、符号化対象信号列生成ステップ、信号符号化ステップ、信号復号ステップ、ローカルデコード係数探索ステップ、符号多重化ステップを有す。符号化対象信号列生成ステップは、音響信号から、あらかじめ定められた数の信号からなる信号列を、符号化対象信号列として生成し、出力する符号化対象信号列とする。例えば、音響信号をあらかじめ定めた数ごとに分割して1つのフレームを形成し、フレームを構成する信号列を符号化対象信号列として出力する。もしくは、フレームをさらに細かく分割したサブフレームを構成する信号列を符号化対象信号列として出力してもよい。または、そのフレーム単位、あるいは近傍数フレーム単位で周波数変換した周波数領域信号列を符号化対象信号列として出力する。さらには、周波数領域信号列をいくつかのサブバンドに分割し、サブバンドを構成する周波数領域信号を符号化対象信号列として出力する。信号符号化ステップは、符号化対象信号列ごとに信号列を符号化し、符号インデクスを出力する。信号復号ステップは、符号インデクスを復号し、復号信号列を出力する。ローカルデコード係数探索ステップは、符号化対象信号列と復号信号列から、複製シフト情報を出力する。符号多重化ステップは、少なくとも符号インデクスと複製シフト情報を多重化して送信信号を生成する。
ローカルデコード係数探索ステップは、複製判定サブステップ、複製シフト候補信号列生成サブステップ、距離計算サブステップ、距離最小シフト量検出サブステップを有す。複製判定サブステップは、符号化対象信号列ごとに、復号信号列から複製シフト候補信号列を生成するかを判定し、複製判定フラグを出力する。例えば、複製判定サブステップは、復号信号列のパワーが閾値以下の場合に複製シフト候補信号列を生成することを示す複製判定フラグを出力すればよい。あるいは、複製判定サブステップは、符号化対象信号列と復号信号列の誤差のパワーが閾値より大きい場合に複製シフト候補信号列を生成することを示す複製判定フラグを出力すればよい。もしくは、信号復号ステップで、符号化対象信号列ごとに割り当てるビット数を計算して割当ビット情報として出力しておき、複製判定サブステップが、符号化対象信号列に割り当てるビット数が閾値以下の場合に複製シフト候補信号列を生成することを示す複製判定フラグを出力してもよい。
複製シフト候補信号列生成サブステップは、複製判定フラグが複製シフト候補信号列を生成することを示す場合には、あらかじめ定めたすべての信号シフト量の候補に対して、複製シフト候補信号列を生成する。例えば、複製シフト候補信号列S τ[k](ただし、k=0,…,L−1、Lは符号化対象信号列の信号の数)を、復号信号列S^[k]から求めればよい。さらに、符号化対象信号列が、周波数領域信号列を周波数帯域で分割したサブバンド周波数領域信号列S(w)[k](ただし、w=0,…,W−1、k=0,…,L’−1、Wは分割した数、L’は1つのサブバンド周波数領域信号列に含まれる信号の数)の場合は、複製シフト候補信号列生成サブステップは、複製シフト候補信号列S τ (w)[k]を、同一の周波数領域信号列から分割されたサブバンド周波数領域信号列に対する復号信号列S^(w)[k]を用いて求めればよい。
距離計算サブステップは、あらかじめ定めた信号列同士の距離を示すパラメータを計算する。あらかじめ定めた信号列同士の距離を示すパラメータとは、複製シフト候補信号列と符号化対象信号列との距離を示すパラメータでもよいし、複製シフト候補信号列と復元信号列とを加算した補完復号候補信号列と、符号化対象信号列との距離を示すパラメータでもよい。また、信号列同士の距離を示すパラメータは、信号列をベクトルと考え、各要素の差の2乗和(ユークリッド距離)としてもよいし、2つの信号列同士の内積としてもよい。距離最小シフト量検出サブステップは、距離計算サブステップの計算結果(距離を示すパラメータ)から、距離が最小となる信号シフト量を求める。どの信号シフト量を選択するかは、距離計算サブステップの計算方法(距離を示すパラメータ)によって決めればよく、距離を示すパラメータがユークリッド距離の場合には距離を示すパラメータが最小となる信号シフト量を選べばよく、距離を示すパラメータが内積の場合には距離を示すパラメータが最大となる信号シフト量を選べばよい。
本発明の復号方法は、符号分離ステップ、信号復号ステップ、ローカルデコード係数複製ステップ、復元信号生成ステップを有す。符号分離ステップは、受信信号から符号インデクスと複製シフト情報とを読み出し、出力する。なお、受信信号に複製判定フラグも含まれている場合は、複製判定フラグも出力する。信号復号ステップは、符号インデクスを復号し、復号信号列を出力する。ローカルデコード係数複製ステップは、復号信号列と複製シフト情報から補完復号信号列を生成する。復元信号生成ステップは、補完復号信号列から元の音響情報を示す信号である復元信号を生成する。符号化方法の説明中で、符号化対象信号列の例を示したが、補完復号信号列は、符号化対象信号列に対応している。つまり、補完復号信号列としては、例えば、フレームを構成する信号列、サブフレームを構成する信号列、周波数領域信号列、サブバンドを構成する信号列などがある。復元信号生成ステップは、これらの補完復号信号列を元の音響信号に復元するステップであり、補完復号信号列がどのような信号列かによって適宜処理を決めればよい。
ローカルデコード係数複製ステップは、複製判定サブステップ、複製シフト信号列生成サブステップ、補完復号信号列生成サブステップを有す。複製判定サブステップは、復号信号列、あるいは第一復号信号を用いてビット割当を行った結果から複製シフト信号列を生成するかを判定し、複製判定フラグを出力する。なお、受信信号に複製判定フラグも含まれている場合は、複製判定サブステップは不要である。
複製シフト信号列生成サブステップは、複製判定フラグが複製シフト候補信号列を生成することを示す場合には、複製シフト情報が示すシフト量に基づいて複製シフト信号列を生成する。例えば、複製シフト候補信号列S τ[k]を、復号信号列S^[k]と複製シフト情報が示すシフト量τから求めればよい。さらに、復号信号列S^(w)[k]が、周波数領域信号列を周波数帯域で分割したサブバンド周波数領域信号列S(w)[k]に対応する信号列の場合には、複製シフト信号列生成サブステップは、複製シフト信号列S・(w)[k]を、同一の周波数領域信号列から分割されたサブバンド周波数領域信号列に対する復号信号列S^(w)[k]を用いて求めればよい。
補完復号信号列生成サブステップは、複製判定フラグが複製シフト候補信号列を生成することを示す場合には複製シフト信号列を補完復号信号列とし、複製判定フラグが複製シフト候補信号列を生成しないことを示す場合には復号信号列を補完復号信号列とし、当該補完復号信号列を出力する。複製判定フラグが複製シフト候補信号列を生成することを示す場合に、復号信号列と複製シフト信号列の和を補完復号信号列としてもよい。
本発明の符号化方法、復号方法によれば、復号信号を時間領域あるいは周波数領域でシフトして得られる信号を、復号信号にコピーあるいは加算することにより符号化歪を低減し、聴感的な雑音を低減する。
まず、コピー元の信号を、復号信号を時間領域あるいは周波数領域でシフトさせて得られる信号としたことで、次の効果が得られる。コピー元の信号を送るためのビットが必要なくなるため、雑音低減のために必要なビット数を節約できる。特に、周波数帯域を等間隔な複数の周波数帯域(以下、「サブバンド」と呼ぶ。)に分割した際、各サブバンドに対応する信号同士には相関が存在するため、特に4〜14kHzといった高域では近隣のサブバンドの信号をコピーあるいは加算して当該サブバンドの信号とすることにより、聴感上の雑音を低減することができる。また、時間領域の信号についても、フレームを一定の間隔(以下、「サブフレーム」と呼ぶ。)に分割した際、各サブフレームに対応する信号間には相関が存在するため、近傍のサブフレームの信号をコピーあるいは加算して当該サブフレームの信号とすることにより、聴感上の雑音を低減することができる。
さらに、復号信号に対してコピーあるいは加算する信号を、復号信号を時間領域あるいは周波数領域でシフトさせて作成し、もとの復号信号と作成した信号からできる新たな復号信号と入力信号とが最短の距離となる際のシフト量を少ないビット数で符号化して伝送するので、符号化歪を低減させるために、復号信号に加算あるいはコピーする信号を少ないビット数で指定することができる。
したがって、少ないビット数で、符号化歪が大きい周波数帯域あるいは時間的範囲から生じる聴覚的雑音の低減を行い復号信号の主観品質を向上できる。
従来の音声信号送信装置の機能構成例を示す図。 従来の音声信号受信装置の機能構成例を示す図。 実施例1の符号化装置の構成例と復号装置の構成例を示す図。 実施例1のローカルデコード係数探索部の構成例とローカルデコード係数複製部の構成例を示す図。 実施例1の符号化装置の処理フロー例と復号装置の処理フロー例を示す図。 時間領域信号列を周波数領域信号列に変換する場合のイメージを示す図。 複製シフト候補信号列を生成する方法を示す図。 実施例1変形例の符号化装置の構成例と復号装置の構成例を示す図。 実施例1変形例の符号化装置の処理フロー例と復号装置の処理フロー例を示す図。 実施例2の符号化装置の構成例と復号装置の構成例を示す図。 実施例2のローカルデコード係数探索部の構成例とローカルデコード係数複製部の構成例を示す図。 実施例2の符号化装置の処理フロー例と復号装置の処理フロー例を示す図。 補完復号候補信号列を生成する方法を示す図。 実施例3の符号化装置の構成例と復号装置の構成例を示す図。 実施例3のローカルデコード係数探索部の構成例とローカルデコード係数複製部の構成例を示す図。 実施例3の符号化装置の処理フロー例と復号装置の処理フロー例を示す図。 周波数領域信号列をサブバンド周波数領域信号列に変換する場合のイメージ、およびサブバンド補完復号信号列を補完復号信号列に変換する場合のイメージを示す図。 復号信号列とサブバンド復号信号列とサブバンド複製シフト候補信号列の関係を示す図。 サブバンド複製シフト信号列の生成方法を示す図。 実施例3変形例の符号化装置の構成例と復号装置の構成例を示す図。 実施例3変形例の符号化装置の処理フロー例と復号装置の処理フロー例を示す図。 実施例4の符号化装置の構成例と復号装置の構成例を示す図。 実施例4の信号符号化部の構成例と信号復号部の構成例を示す図。 実施例4のローカルデコード係数探索部の構成例とローカルデコード係数複製部の構成例を示す図。 実施例4の符号化装置の処理フロー例と復号装置の処理フロー例を示す図。 サブバンド割当ビット情報の算出方法を示す図。 ビット割当テーブルとコードブックの関係を示す図。 符号インデクスを選択する方法を示す図。 実施例4変形例の符号化装置の構成例と復号装置の構成例を示す図。 実施例4変形例の符号化装置の処理フロー例と復号装置の処理フロー例を示す図。 実施例5と実施例5変形例1の符号化装置の構成例を示す図。 実施例5と実施例5変形例1の復号装置の構成例を示す図。 実施例5の信号符号化部の構成例を示す図。 実施例5の信号復号部の構成例を示す図。 実施例5と実施例5変形例1の符号化装置の処理フロー例と復号装置の処理フロー例を示す図。 符号インデクスの生成方法とデータセットの構成を示す図。 実施例5変形例1の信号符号化部の構成例を示す図。 実施例5変形例1の信号復号部の構成例を示す図。 動的ビット再割当部9060の処理手順を示す図。 実施例5変形例2の信号符号化部の構成例を示す図。 実施例5変形例2の信号復号部の構成例を示す図。 実施例5変形例2の符号化装置の処理フロー例と復号装置の処理フロー例を示す図。 コンピュータの機能構成例を示す図。
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。また、以下の説明で「信号列」と言うときは、符号化や復号のために所定の数ごとに分割された信号の組を指している。信号列は所定の数の要素を持つベクトルと考えることもでき、この場合は個々の信号をベクトルの要素と考えることになる。また、単に「信号」と言うときは所定の数ごとに分割されていない信号の並びや単独の信号を指している。
図3〜図7は実施例1を説明するための図である。図3Aは符号化装置の構成例、図3Bは復号装置の構成例を示している。図4Aはローカルデコード係数探索部の構成例、図4Bはローカルデコード係数複製部の構成例を示している。図5Aは符号化装置の処理フロー例、図5Bは復号装置の処理フロー例を示している。図6は、時間領域信号列を周波数領域信号列に変換する場合のイメージを示す図である。図7は複製シフト候補信号列を生成する方法を示す図である。
符号化装置
符号化装置100は、フレーム構成部1010、信号符号化部1030、信号復号部1031、ローカルデコード係数探索部1000、符号多重化部1040を備える。フレーム構成部1010は、マイクロフォンなどのセンサを用いて収録した音響信号を、デジタル形式にした音響信号サンプルにし、一定数Lの音響信号サンプルを纏めてフレームを構成する。そして、フレーム単位で時間周波数変換を行い、一定数Lの音響信号サンプルに対応する周波数領域信号列S[k](k=0,…,L−1)を出力する(S1010)。時間周波数変換として、離散フーリエ変換や離散コサイン変換、修正離散コサイン変換(以下、「MDCT」と呼ぶ。)などを用いる。図6はこれらの時間周波数変換のイメージを示している。本実施例では周波数領域信号列が、符号化の対象となる信号列(以下、「符号化対象信号列」と呼ぶ。)である。したがって、本実施例ではフレーム構成部1010が符号化対象信号列生成部1012に相当する。
信号符号化部1030は、符号化対象信号列ごとに信号列を符号化し、符号インデクスを出力する(S1030)。例えば、信号符号化部1030は、周波数領域信号列S[k](k=0,…,L−1)をL次元ベクトルとみなした周波数領域信号ベクトルに対して、ベクトル量子化を行い、符号インデクスIを出力する。ベクトル量子化の際にはコードブック中から、周波数領域信号ベクトルとの距離が最小となるようなコードベクトルが選択され、選ばれたコードベクトルのインデクスが符号インデクスIとして出力される。距離を示すパラメータの定義としてユークリッド距離を用いた場合、次(1)に従いコードベクトルが選択される。
Figure 2010150767
距離を示すパラメータの定義としてベクトル間の内積を用いる場合は、式(2)に従い、コードベクトルが選択される。
Figure 2010150767
ここで、コードブックに格納されたp番目のコードベクトルをC(p)=(C (p),C (p),…,CL−1 (p))とする。C (p)はp番目のベクトルの第k次元の要素を表している。
信号復号部1031は、符号インデクスを復号し、復号信号列を出力する(S1031)。例えば、信号復号部1031は、符号インデクスIに対応するコードベクトルC(c)=(C (c),C (c),…,CL−1 (c))をコードブック中から読み出し、復号信号列S^[k](k=0,…,L−1)を出力する。なお、復号信号列S^[k]はコードベクトルC(c)を用いて、S^[0]=C (c),S^[1]=C (c),…,S^[L−1]=CL−1 (c)のように求められる。
ローカルデコード係数探索部1000は、符号化対象信号列に相当する周波数領域信号列S[k]と復号信号列S^[k]から、複製シフト情報τを出力する(S1000)。ローカルデコード係数探索部1000は、図4Aに示すように、複製判定部1001、複製シフト候補信号列生成部1002、距離計算部1003、距離最小シフト量検出部1004を具備する。複製判定部1001は、復号信号列S^[k](k=0,…,L−1)から複製シフト候補信号列S τ[k](τ=τ,…,τ、Mは信号シフト量τの候補の数)を生成するかを判定し、複製判定フラグFlagを出力する(S1001)。例えば、複製判定部1001は、復号信号列S^[k]のパワーPが閾値以下の場合に複製シフト候補信号列S τ[k]を生成することを示す複製判定フラグFlag(例えば、Flag=1)を出力し、閾値よりも大きい場合には複製シフト候補信号列S τ[k]を生成しないことを示す複製判定フラグFlag(例えば、Flag=0)を出力すればよい。なお、復号信号列S^[k](k=0,…,L−1)のパワーは、例えば式(3)に従って計算すればよい。
Figure 2010150767
複製シフト候補信号列生成部1002は、複製判定フラグFlagが複製シフト候補信号列を生成しないことを示す場合(Flag=0の場合)には、処理を行わない。そして、複製シフト候補信号列生成部1002は、複製判定フラグFlagが複製シフト候補信号列を生成することを示す場合(Flag=1の場合)には、あらかじめ定めたすべての信号シフト量の候補τ=τ,…,τに対して、複製シフト候補信号列S τ[k]を生成する(S1002)。例えば、複製シフト候補信号列S τ[k]を、
τ[k]=S^[−L−τ+k]
のように求めればよい(図7参照)。
距離計算部1003は、複製シフト候補信号列S τ[k]と周波数領域信号列S[k]との距離を示すパラメータ(以下、「距離パラメータ」という。)を計算する(S1003)。この距離パラメータは、各信号列をベクトルと考え、ベクトル間の距離パラメータd[τ](τ=τ,…,τ)を式(4)や式(5)に示す方法などで求めればよい。なお、式(4)はユークリッド距離を示しており、式(5)は内積を示しているが、これらの式に限定する必要はない。
Figure 2010150767
距離最小シフト量検出部1004は、式(4)によって距離パラメータを求めた場合は、距離パラメータd[τ]が最小となる信号シフト量τを求め、複製シフト情報τとして出力する(S1004)。すなわち、式(6)にしたがって複製シフト情報τを求める。
Figure 2010150767
また、式(5)によって距離パラメータを求めた場合は、距離最小シフト量検出部1004は、距離パラメータd[τ]が最大となる信号シフト量τを求め、複製シフト情報τとして出力する(S1004)。すなわち、式(7)にしたがって複製シフト情報τを求める。
Figure 2010150767
符号多重化部1040は、符号インデクスIと複製シフト情報τを多重化して送信信号を生成する(S1040)。具体的には、符号多重化部1040は、符号インデクスIと複製シフト情報τを入力として、所定の順序に並べて一つのデータセットを生成する。また、IP網などを利用して伝送を行う場合には、必要なヘッダ情報を付加してパケットを生成する。
復号装置
復号装置200は、符号分離部2041、信号復号部2031、ローカルデコード係数複製部2100、周波数時間変換部2021、重畳加算部2011を備える。なお、周波数時間変換部2021と重畳加算部2011をあわせて、復元信号生成部2012と呼ぶ。符号分離部2041は、受信信号から符号インデクスIと複製シフト情報τとを読み出し、出力する(S2041)。信号復号部2031は、符号インデクスIを復号し、復号信号列S^[k](k=0,…,L−1)を出力する(S2031)。
ローカルデコード係数複製部2100は、復号信号列S^[k]と複製シフト情報τから補完復号信号列S[k](k=0,…,L−1)を生成する(S2100)。ローカルデコード係数複製部2100は、図4Bに示すように、複製判定部2001、複製シフト信号列生成部2002、補完復号信号列生成部2006を備える。複製判定部2001は、復号信号列S^[k]から複製シフト信号列S τ[k]を生成するかを判定し、複製判定フラグFlagを出力する(S2001)。複製判定部2001の処理は、符号化装置100の複製判定部1001と同じである。
複製シフト信号列生成部2002は、複製判定フラグFlagが複製シフト候補信号列を生成することを示す場合(Flag=1の場合)には、複製シフト情報τが示すシフト量τに基づいて複製シフト信号列S τ[k]を生成する(S2002)。例えば、複製シフト候補信号列S τ[k]を、復号信号列S^[k]と複製シフト情報が示すシフト量τから、
τ[k]=S^[−L−τ+k]
のように求めればよい。
補完復号信号列生成部2006は、複製判定フラグFlagが複製シフト候補信号列を生成することを示す場合(Flag=1の場合)には複製シフト信号列S τ[k]を補完復号信号列S[k]とし、複製判定フラグFlagが複製シフト候補信号列を生成しないことを示す場合(Flag=0の場合)には復号信号列S^[k]を補完復号信号列S[k]とし、補完復号信号列S[k]を出力する(S2006)。つまり、
Figure 2010150767
のように補完復号信号列S[k]を求める。
復元信号生成部2012は、補完復号信号列S[k]から元の音響情報を示す信号である復元信号を生成する(S2012)。本実施例では、符号化対象信号列は周波数領域信号列S[k]である。つまり、補完復号信号列S[k]は、周波数領域の信号である。そこで、復元信号生成部2012は、周波数時間変換部2021と重畳加算部2011から構成されている。周波数時間変換部2021は、周波数領域信号列S[k]をLサンプルの時間領域の信号列に変換する(S2021)。そして、重畳加算部2011は、時間領域の信号列に窓関数を掛けて得られる信号をフレーム長の半分ずつ重ねて加算することにより復元信号を計算し、これを復元信号とする(S2011)。
実施例1の符号化装置、復号装置によれば、復号信号を時間領域あるいは周波数領域でシフトして得られる信号を、復号信号にコピーあるいは加算することにより符号化歪を低減し、聴感的な雑音を低減する。したがって、少ないビット数で、聴覚的雑音の低減を行い復号信号の主観品質を向上できる。
[変形例]
図8、9に、符号化対象信号列をフレーム単位の時間領域の信号列とした場合の機能構成と処理フローを示す。図8Aは符号化装置の機能構成例、図8Bは復号装置の機能構成例、図9Aは符号化装置の処理フロー例、図9Bは復号装置の処理フロー例を示している。
符号化装置100’と復号装置200’は、符号化対象信号列が符号化装置100と復号装置200と異なるだけである。したがって、構成部の処理としては、符号化対象信号列生成部1012’と復元信号生成部2012’だけが異なる。
符号化対象信号列生成部1012’は、フレーム構成部1010’から構成される。フレーム構成部1010’は、マイクロフォンなどのセンサを用いて収録した音響信号を、デジタル形式にした音響信号サンプルにし、一定数Lの音響信号サンプルを纏めてフレームを構成する。そして、フレーム単位の信号列(以下、「フレーム信号列」という。)s[k](k=0,…,L−1)を出力する(S1010’)。符号化装置100’のその他の構成部の処理は符号化装置100と同じである。
復号装置200’においては、補完復号信号列s[k](k=0,…,L−1)はフレーム信号列s[k]に対応している。つまり、本変形例では、補完復号信号列s[k]は時間領域の信号列である。したがって、復元信号生成部2012’には周波数時間変換部は不要であり、重畳加算部2011のみで構成される。重畳加算部2011は、時間領域の信号列に窓関数を掛けて得られる信号をフレーム長の半分ずつ重ねて加算することにより復元信号を計算し、これを復元信号とする(S2011)。
このような構成なので、本変形例の符号化装置、復号装置も実施例1と同様の効果が得られる。
図10〜図13は実施例2を説明するための図である。図10Aは符号化装置の構成例、図10Bは復号装置の構成例を示している。図11Aはローカルデコード係数探索部の構成例、図11Bはローカルデコード係数複製部の構成例を示している。図12Aは符号化装置の処理フロー例、図12Bは復号装置の処理フロー例を示している。図13は、補完復号候補信号列を生成する方法を示す図である。なお、実施例2の符号化対象信号列は、周波数領域信号列(実施例1と同じ)である。
符号化装置
符号化装置150は、フレーム構成部1010、信号符号化部1030、信号復号部1031、ローカルデコード係数探索部1500、符号多重化部1540を備える。フレーム構成部1010、信号符号化部1030、信号復号部1031は、実施例1の符号化装置100と同じである。
ローカルデコード係数探索部1500は、符号化対象信号列に相当する周波数領域信号列S[k]と復号信号列S^[k]から、複製シフト情報τと複製判定フラグFlagを出力する(S1500)。ローカルデコード係数探索部1500は、図11Aに示すように、複製判定部1501、複製シフト候補信号列生成部1002、距離計算部1503、距離最小シフト量検出部1004を具備する。複製判定部1501は、周波数領域信号列S[k](k=0,…,L−1)と復号信号列S^[k](k=0,…,L−1)との誤差信号のパワーから複製シフト候補信号列S τ[k](τ=τ,…,τ、Mは信号シフト量τの候補の数)を生成するかを判定し、複製判定フラグFlagを出力する(S1501)。例えば、複製判定部1501は、周波数領域信号列S[k]と復号信号列S^[k]の誤差信号(S[k]−S^[k])のパワーPが閾値を上回る場合に複製シフト候補信号列S τ[k]を生成することを示す複製判定フラグFlag(例えば、Flag=1)を出力し、閾値以下の場合には複製シフト候補信号列S τ[k]を生成しないことを示す複製判定フラグFlag(例えば、Flag=0)を出力すればよい。なお、誤差信号(S[k]−S^[k])のパワーは、例えば式(9)に従って計算すればよい。
Figure 2010150767
複製シフト候補信号列生成部1002は、実施例1と同じである。距離計算部1503は、複製シフト候補信号列S τ[k]と復号信号列S^[k]とを加算した補完復号候補信号列S〜τ[k]と、周波数領域信号列S[k]との距離パラメータを計算する(S1503)。この距離パラメータは、各信号列をベクトルと考え、ベクトル間の距離パラメータd[τ](τ=τ,…,τ)を式(10)や式(11)に示す方法などで求めればよい。なお、式(10)はユークリッド距離を示しており、式(11)は内積を示しているが、これらの式に限定する必要はない。
Figure 2010150767
距離最小シフト量検出部1004は、実施例1と同じである。
符号多重化部1540は、符号インデクスIと複製シフト情報τと複製判定フラグFlagを多重化して送信信号を生成する(S1040)。具体的には、符号多重化部1540は、符号インデクスIと複製シフト情報τと複製判定フラグFlagを入力として、所定の順序に並べて一つのデータセットを生成する。また、IP網などを利用して伝送を行う場合には、必要なヘッダ情報を付加してパケットを生成する。
復号装置
復号装置250は、符号分離部2541、信号復号部2031、ローカルデコード係数複製部2500、周波数時間変換部2021、重畳加算部2011を備える。なお、周波数時間変換部2021と重畳加算部2011をあわせて、復元信号生成部2012と呼ぶ。符号分離部2541は、受信信号から符号インデクスIと複製シフト情報τと複製判定フラグFlagを読み出し、出力する(S2541)。信号復号部2031は、実施例1と同じである。
ローカルデコード係数複製部2500は、復号信号列S^[k]と複製シフト情報τと複製判定フラグFlagから補完復号信号列S[k](k=0,…,L−1)を生成する(S2500)。ローカルデコード係数複製部2500は、図11Bに示すように、複製シフト信号列生成部2002、補完復号信号列生成部2506を備える。本実施例の場合、受信信号内に複製判定フラグFlagが含まれているので、複製判定部は必要ない。複製シフト信号列生成部2002は、実施例1と同じである。
補完復号信号列生成部2506は、図13に示すように、複製シフト信号列S τ[k]と復号信号列S^[k]とを加算することにより、補完復号信号列S[k]を生成し、出力する(S2006)。つまり、
Figure 2010150767
のように補完復号信号列S[k]を求める。
復元信号生成部2012は、実施例1と同じである。
以上のような構成により、復号信号列と符号化対象信号列の誤差が大きい場合に符号化歪の低減を行うことができる。
図14〜図19は実施例3を説明するための図である。図14Aは符号化装置の構成例、図14Bは復号装置の構成例、図15Aはローカルデコード係数探索部の構成例、図15Bはローカルデコード係数複製部の構成例、図16Aは符号化装置の処理フロー例、図16Bは復号装置の処理フロー例を示している。図17Aは、周波数領域信号列をサブバンド周波数領域信号列に変換する場合のイメージ、図17Bはサブバンド補完復号信号列を補完復号信号列に変換する場合のイメージを示す図である。図18は復号信号列とサブバンド復号信号列とサブバンド複製シフト候補信号列の関係を示す図である。図19はサブバンド複製シフト信号列の生成方法を示す図である。本実施例では、周波数領域信号列をいくつかの周波数帯ごとに分割したサブバンドの信号列を、符号化対象信号列としている点が実施例2と異なる。
符号化装置
符号化装置300は、フレーム構成部1010、サブバンド分割部3050、信号符号化部3030、信号復号部3031、ローカルデコード係数探索部3000、符号多重化部1540を備える。フレーム構成部1010、符号多重化部1540は、実施例2の符号化装置150と同じである。サブバンド分割部3050は、図17Aに示すように、周波数領域信号列S[k](k=0,…,L−1)を複数のサブバンド周波数領域信号列S(w)[k](w=0,…,W−1、k=0,…,L’−1)に分割する(S3050)。Wは分割する数、L’はサブバンド周波数領域信号列に含まれる信号の数を示している。図17Aは、W=4,L=4L’の例を示している。また、以下では、S(w)[k]を何番目のサブバンド周波数領域信号列であるかを示したいときには「第wサブバンド周波数領域信号列」と呼び、何番目なのかを特定する必要がないときには単に「サブバンド周波数領域信号列」と呼ぶ。本実施例では、サブバンド周波数領域信号列が符号化対象信号列である。
信号符号化部3030は、符号化対象信号列を周波数領域信号列からサブバンド周波数領域信号列に変更しただけで、処理自体は実施例1の信号符号化部1030と同じである。そして、信号符号化部3030は、サブバンド周波数領域信号列S(w)[k]に対する符号インデクスI (w)を出力する(S3030)。
信号復号部3031も、符号インデクスI (w)に対する符号化対象信号列が周波数領域信号列からサブバンド周波数領域信号列に変更しただけで、処理自体は実施例1の信号復号部1031と同じである。そして、信号復号部3031は、復号信号列S^(w)[k](w=0,…,W−1、k=0,…,L’−1)を出力する(S3031)。
ローカルデコード係数探索部3000は、サブバンド周波数領域信号列S(w)[k]と復号信号列S^(w)[k]から、複製シフト情報τ (w)と複製判定フラグFlag (w)を出力する(S3000)。ローカルデコード係数探索部3000は、図15Aに示すように、複製判定部3001、複製シフト候補信号列生成部3002、距離計算部3003、距離最小シフト量検出部3004を具備する。
複製判定部3001は、符号化対象信号列に含まれる信号の数が変わっただけで、実施例2と同じである。つまり、複製判定部3001は、サブバンド周波数領域信号列S(w)[k]と復号信号列S^(w)[k]との誤差信号のパワーから複製シフト候補信号列S τ (w)[k](τ=τ,…,τ、Mは信号シフト量τの候補の数)を生成するかを判定し、複製判定フラグFlag (w)を出力する(S3001)。例えば、複製判定部3001は、サブバンド周波数領域信号列S(w)[k]と復号信号列S^(w)[k]の誤差信号(S(w)[k]−S^(w)[k])のパワーPが閾値を上回る場合に複製シフト候補信号列S τ (w)[k]を生成することを示す複製判定フラグFlag (w)(例えば、Flag (w)=1)を出力し、閾値以下の場合には複製シフト候補信号列S τ (w)[k]を生成しないことを示す複製判定フラグFlag (w)(例えば、Flag (w)=0)を出力すればよい。なお、誤差信号(S(w)[k]−S^(w)[k])のパワーは、例えば式(9)に従って計算すればよい。
Figure 2010150767
複製シフト候補信号列生成部3002は、複製判定フラグFlag (w)が複製シフト候補信号列を生成しないことを示す場合(Flag (w)=0の場合)には、処理を行わない。そして、複製シフト候補信号列生成部3002は、複製判定フラグFlag (w)が複製シフト候補信号列を生成することを示す場合(Flag (w)=1の場合)には、あらかじめ定めたすべての信号シフト量の候補τ=τ,…,τに対して、複製シフト候補信号列S τ (w)[k]を生成する(S3002)。例えば、
Figure 2010150767
のように近傍サブバンドの復号信号列からサブバンド複製シフト候補信号列S τ (w)[k]を生成する。式(14)のように複製シフト候補信号列S τ (w)[k]を生成すれば、複製シフト候補信号列S τ (w)[k]は、もともと同一の周波数領域信号列から分割されたサブバンド周波数領域信号列に対する復号信号列から生成される。通常、同一の周波数領域信号列から分割されたサブバンド周波数領域信号列は互いに相関関係が強いため、距離の近いサブバンド複製シフト候補信号列S τ (w)[k]を得ることができる。図18は、S τ (2)[k]を生成する例を示している。
距離計算部3003、距離最小シフト量検出部3004は、信号列内の信号の数が変わっただけで、実施例1や実施例2と同じである。また、符号多重化部1540は、実施例2と同じである。
復号装置
復号装置400は、符号分離部4041、信号復号部4031、ローカルデコード係数複製部4100、サブバンド結合部4051、周波数時間変換部2021、重畳加算部2011を備える。なお、サブバンド結合部4051と周波数時間変換部2021と重畳加算部2011をあわせて、復元信号生成部4012と呼ぶ。符号分離部4041は、受信信号から符号インデクスI (w)と複製シフト情報τ (w)と複製判定フラグFlag (w)を読み出し、出力する(S4041)。信号復号部4031は、符号インデクスI (w)を復号し、サブバンド復号信号列S^(w)[k](k=0,…,L’−1)を出力する(S4031)。
ローカルデコード係数複製部4100は、サブバンド復号信号列S^(w)[k]と複製シフト情報τ (w)と複製判定フラグFlag (w)からサブバンド補完復号信号列S〜(w)[k](k=0,…,L−1)を生成する(S4100)。ローカルデコード係数複製部4100は、図15Bに示すように、複製シフト信号列生成部4002、補完復号信号列生成部4005を備える。
複製シフト信号列生成部4002は、複製シフト候補信号列生成部3002の方法と同じ方法で、サブバンド複製シフト信号列S・(w)[k](w=0,…,W−1、k=0,…,L’−1)を出力する(S4002)。例えば、複製シフト候補信号列生成部3002が式(14)にしたがって複製シフト候補信号列S τ (w)[k]を生成したのであれば、複製シフト信号列生成部4002は、式(15)にしたがってサブバンド複製シフト信号列S・(w)[k]を生成すればよい。
Figure 2010150767
なお、図19は、式(15)の処理を表している。
補完復号信号列生成部4005は、サブバンド複製シフト信号列S・(w)[k]と復号信号列S^(w)[k]とを加算することにより、サブバンド補完復号信号列S〜(w)[k]を生成し、出力する(S4005)。
サブバンド結合部4051は、図17Bに示すように、複数のサブバンド補完復号信号列を結合し、補完復号信号列を生成する(S4051)。周波数時間変換部2021と重畳加算部2011は、実施例1や実施例2と同じである。
以上の構成により、実施例3の符号化装置、復号装置も実施例1や実施例2と同様の効果が得られる。また、符号化によるひずみの大きい周波数帯域の誤差を低減できるため、さらに聴感上の雑音を低減できる。
[変形例]
図20、21に、符号化対象信号列をサブフレーム単位の時間領域の信号列とした場合の機能構成と処理フローを示す。図20Aは符号化装置の機能構成例、図21Bは復号装置の機能構成例、図21Aは符号化装置の処理フロー例、図21Bは復号装置の処理フロー例を示している。
符号化装置300’と復号装置400’は、符号化対象信号列が符号化装置300と復号装置400と異なるだけである。したがって、構成部の処理としては、符号化対象信号列生成部3012’と復元信号生成部4012’だけが異なる。
符号化対象信号列生成部3012’は、フレーム構成部1010’とサブフレーム分割部3050’から構成される。フレーム構成部1010’は、マイクロフォンなどのセンサを用いて収録した音響信号を、デジタル形式にした音響信号サンプルにし、一定数Lの音響信号サンプルを纏めてフレームを構成する。そして、フレーム単位の信号列(以下、「フレーム信号列」という。)s[k](k=0,…,L−1)を出力する(S1010’)。サブフレーム分割部3050’は、フレーム信号列をいくつかに分割し、サブフレーム信号列s(w)[k](w=0,…,W−1、k=0,…,L’−1)を生成する(S3050’)。符号化装置300’のその他の構成部の処理は符号化装置300と同じである。
復号装置400’においては、サブフレーム補完復号信号列s〜(w)[k](w=0,…,W−1、k=0,…,L’−1)はサブフレーム信号列s(w)[k]に対応している。つまり、本変形例では、サブフレーム補完復号信号列s〜(w)[k]は時間領域の信号列である。したがって、復元信号生成部4012’には周波数時間変換部は不要であり、サブフレーム結合部4051’と重畳加算部2011で構成される。サブフレーム結合部4051’は、サブフレーム補完復号信号列s〜(w)[k]を結合し、補完復号信号列s[k]を生成する(S4051’)。重畳加算部2011は、補完復号信号列s[k]に窓関数を掛けて得られる信号をフレーム長の半分ずつ重ねて加算することにより復元信号を計算し、これを復元信号とする(S2011)。
このような構成なので、本変形例の符号化装置、復号装置も実施例3と同様の効果が得られる。
図22〜図28は実施例4を説明するための図である。図22Aは符号化装置の構成例、図22Bは復号装置の構成例を示している。図23Aは信号符号化部の構成例、図23Bは信号復号部の構成例を示している。図24Aはローカルデコード係数探索部の構成例、図24Bはローカルデコード係数複製部の構成例を示している。図25Aは符号化装置の処理フロー例、図25Bは復号装置の処理フロー例を示している。図26は、サブバンド割当ビット情報の算出方法を示す図、図27は、ビット割当テーブルとコードブックの関係を示す図、図28は符号インデクスを選択する方法を示す図である。なお、本実施例の符号化対象信号列は、サブバンド周波数領域信号列(実施例3と同じ)である。
符号化装置
符号化装置500は、フレーム構成部1010、サブバンド分割部3050、信号符号化部5030、信号復号部5031、ローカルデコード係数探索部5000、符号多重化部5040を備える。フレーム構成部1010とサブバンド分割部3050は、実施例3の符号化装置300と同じである。
信号符号化部5030は、図23Aに示すように、パラメータ計算部5032、第一符号化部5033、第一ローカル復号部5034、動的ビット割当部5035、第二符号化部5036、ローカル符号多重化部5037を備える。パラメータ計算部5032は、サブバンド周波数領域信号列S(w)[k](w=0,…,W−1、k=0,…,L’−1)から、第wサブバンド第一パラメータを算出する。第wサブバンド第一パラメータとして、例えば、第wサブバンド周波数領域信号列S(w)[k]の平均振幅指標A[w](w=0,…,W−1)(以下、「第wサブバンド平均振幅指標」と呼ぶ。)などを利用することができる。第wサブバンド平均振幅指標は次式にしたがって算出する。
Figure 2010150767
なお、第wサブバンド平均振幅指標を用いて、次式により第wサブバンド平均振幅A’[w]を算出することができる。
Figure 2010150767
次に、第一符号化部5033が、第wサブバンド第一パラメータ(w=0,…,W−1)を量子化し、第一信号符号インデクスIを出力する。第wサブバンド第一パラメータとして第wサブバンド平均振幅指標A[w](w=0,…,W−1)を利用する場合には、例えば、第wサブバンド平均振幅指標A[w]をW次元ベクトルとみなしてベクトル量子化を行い、選ばれたコードベクトルのインデクスを第一信号符号インデクスIとして出力する。なお、第wサブバンド第一パラメータを、バイナリ符号化やハフマン符号化によりサブバンド毎に符号化してもよい。
第一ローカル復号部5034は、第一信号符号インデクスIを復号し、第wサブバンド第一復号パラメータ(w=0,…,W−1)を出力する。例えば、第一符号化部5033で第wサブバンド平均振幅指標A[w]を符号化した場合、第一ローカル復号部5034は、第wサブバンド第一復号パラメータとして第wサブバンド復号平均振幅指標A^[w](w=0,…,W−1)を出力する。
動的ビット割当部5035は、第wサブバンド第一復号パラメータから各サブバンドに割り当てるビット数を計算し、第wサブバンド割当ビット情報を出力する。例えば、第wサブバンド第一復号パラメータとして第wサブバンド復号平均振幅指標A[w]を利用した場合、以下のような手順で第wサブバンドの割当ビット情報B[w](w=0,…,W−1)を算出する。まず、第wサブバンド平均振幅指標A[w]から次式で決まる第wサブバンド聴覚的重要度ip[w](w=0,…,W−1)を算出する。
ip[w]=A^[w]/2
次に第wサブバンド聴覚的重要度ip[w]とビット割当テーブルRを利用した二分探索法により、第wサブバンドの割当ビット情報B[w]を出力する。動的ビット割当では、“water Level”を以下の式に基づく二分探索により選択し、“water Level λ”と第wサブバンド聴覚的重要度ip[w]を利用して次式の第wサブバンド割当ビット情報B[w]を算出する。
Figure 2010150767
具体的には、例えば図26に示す方法で算出すればよい。まず、パラメータ(maxIP,minIP,λ,i)を初期値に設定する(S50351)。一時的なB[w]の値として、Bt[w]を計算し、既に計算済のBt[w]との合計Sum_Btを求める(S50352)。Sum_Btが割当可能な総ビット数(total_bit_budget)を越えるかを確認する(S50353)。ステップS50353がYesの場合、パラメータ(minIP,λ,i)を変更する(S50354)。ステップS50353がNoの場合、Bt[w]をB[w]とし、パラメータ(maxIP,λ,i)を変更する(S50355)。iが事前に定めた定数未満かを確認する(S50356)。ステップS50356がYesの場合、ステップS50352に戻る。ステップS50356がNoの場合、B[w]を、第wサブバンドの割当ビット情報B[w]として出力する。また、事前に決定した回数の反復探索が終了した時点で上記のB[w]の式の評価を行う。反復処理を終了する収束条件を別途定義して処理を終了してもよい。例えば、割当ビット数の合計が割当可能な総ビット数(total_bit_budget)に等しくなるような場合に処理を終了するなどの方法が考えられる。最終的なビット数の合計が割当可能な総ビット数を越える場合には、例えばip[w]が小さいサブバンドから順に、上式で選択したビット数よりテーブル一つ分小さいビットを割り当てることにより削減し、割当ビット数の合計が総ビット数の合計よりも小さくなるように調整し、最終的な第wサブバンド割当ビット情報を決定する。
第二符号化部5036は、割当ビット情報B[w]を用いて、第wサブバンド周波数領域信号列S(w)[k]を量子化し、第wサブバンド第二信号符号インデクスI (w)(w=0,…,W−1)を出力する。ここで、図27Aと図27Bに示したように、ビット割当テーブル中のビット数とコードブックの探索範囲は1対1に対応付けられているものとする。なお、この探索範囲同士は重なりを持っていてもよい。図27Aは探索範囲同士が重なりを持っていない場合の例を示しており、図27Bは探索範囲同士が重なりを持っている場合の例を示している。第二符号化部5036は、図28に示した手順により、第wサブバンド周波数領域信号列S(w)[k]を量子化し、第wサブバンド第二信号符号インデクスI (w)を出力する。まず、割当ビット情報B[w]を用いて、第二符号化部5036におけるコードブック探索の範囲を決定する。ここで、B[w]が閾値以下のときには、符号化を行わない。次に、第wサブバンド周波数領域信号列S(w)[k]をベクトルとみなした第wサブバンド周波数領域信号ベクトルとの距離が最小となるようなコードベクトルを、割当ビット情報B[w]から決定したコードブック探索範囲から選択し、選ばれたコードベクトルのインデクスが第wサブバンド第二信号符号インデクスI (w)として出力される。距離を示すパラメータとしてユークリッド距離を用いた場合、式(17)にしたがってコードベクトルが選択される。
Figure 2010150767
また、距離を示すパラメータとしてベクトル間の内積を用いる場合は、式(18)にしたがってコードベクトルが選択される。
Figure 2010150767
ここで、コードブックに格納されたp番目のコードベクトルをC(p)=(C (p),C (p),…,CL’−1 (p))とする。C (p)はp番目のベクトルの第k次元の要素を表している。
ローカル符号多重化部5037は、第wサブバンド第一信号符号インデクスI (w)と第wサブバンド第二信号符号インデクスI (w)とを所定の順番に並べてデータセットとし、符号インデクスIとして出力する。
信号復号部5031は、符号インデクスIを復号し、復号信号列S^(w)[k](k=0,…,L’−1)と割当ビット情報B[w]を出力する(S5031)。信号復号部5031は、ローカル符号分離部5038、第一ローカル復号部5034、動的ビット割当部5035、第二復号部5039、復号パラメータ処理部5044を備える。ローカル符号分離部5038は、符号インデクスIから、所定の位置にあるビット数を読み出すことにより、第wサブバンド第一信号符号インデクスI (w)と第wサブバンド第二信号符号インデクスI (w)を出力する。
第一ローカル復号部5034は、第wサブバンド第一信号符号インデクスI (w)を復号し、第wサブバンド第一復号パラメータを出力する。第一ローカル復号部5034の動作は、信号符号化部5030における第一ローカル復号部5034と同じである。動的ビット割当部5035は、第wサブバンド第一復号パラメータから、各サブバンドに割当てるビット数を計算し、第wサブバンドの割当ビット情報として出力する。動的ビット割当部5035の動作は、信号符号化部5030における動的ビット割当部5035と同一である。
第二復号部5039は、第wサブバンドの割当ビット情報B[w]を用いて、第wサブバンド第二信号符号インデクスI (w)を復号し、第wサブバンド第二復号パラメータを出力する。なお、信号符号化部5030における第二符号化部5036と同じように、ビット割当テーブル中のビット数とコードブックの探索範囲は1対1に対応付けられているものとする。復号の手順は次のとおりである。まず、第wサブバンドの割当ビット情報B[w]を用いて、コードブック探索の範囲を決定する。次に、第wサブバンド第二信号符号インデクスI (w)に対応するコードベクトルを、割当ビット情報B[w]から決まるコードブック探索範囲から選択し、選ばれたコードベクトルに対応するコードベクトルC(p)=(C (p),C (p),…,CL’−1 (p))を第wサブバンド第二復号パラメータとして出力する。
復号パラメータ処理部5044は、第wサブバンド第一復号パラメータと第wサブバンド第二復号パラメータを用いて、復号信号列S^(w)[k]を出力する。例えば、第wサブバンド第一復号パラメータとして第wサブバンドの平均振幅指標A[w]を、第wサブバンド第二復号パラメータとして平均振幅が1になるよう正規化したコードベクトルを用いている場合には、第wサブバンド平均振幅指標から算出される第wサブバンド平均振幅を第wサブバンド第二復号パラメータの各係数に乗算するなどの処理を行い、復号信号列S^(w)[k]を算出する。
ローカルデコード係数探索部5000は、サブバンド周波数領域信号列S(w)[k]と復号信号列S^(w)[k]から、複製シフト情報τ (w)を出力する(S5000)。ローカルデコード係数探索部5000は、図24Aに示すように、複製判定部5001、複製シフト候補信号列生成部3002、距離計算部3003、距離最小シフト量検出部3004を具備する。複製判定部5001は、第wサブバンドの割当ビット情報B[w]が閾値以下の場合は、複製シフト候補信号列S τ[k]を生成することを示す複製判定フラグFlag (w)(例えば、Flag (w)=1)を出力する。一方、第wサブバンドの割当ビット情報B[w]が閾値より大きい場合は、複製シフト候補信号列S τ[k]を生成しないことを示す複製判定フラグFlag (w)(例えば、Flag (w)=0)を出力する。
複製シフト候補信号列生成部3002、距離計算部3003、距離最小シフト量検出部3004は、実施例3の符号化装置300と同じである。
符号多重化部5040は、符号インデクスIと複製シフト情報τ (w)を多重化して送信信号を生成する(S5040)。具体的には、符号多重化部5040は、符号インデクスIと複製シフト情報τ (w)を入力として、所定の順序に並べて一つのデータセットを生成する。また、IP網などを利用して伝送を行う場合には、必要なヘッダ情報を付加してパケットを生成する。
復号装置
復号装置600は、符号分離部6041、信号復号部6031、ローカルデコード係数複製部6100、サブバンド結合部4051、周波数時間変換部2021、重畳加算部2011を備える。なお、サブバンド結合部4051と周波数時間変換部2021と重畳加算部2011をあわせて、復元信号生成部4012と呼ぶ。符号分離部6041は、受信信号から符号インデクスIと複製シフト情報τ (w)を読み出し、出力する(S6041)。信号復号部6031は、符号インデクスIを復号し、復号信号列S^(w)[k](k=0,…,L’−1)と割当ビット情報B[w]を出力する(S6031)。信号復号部6031の処理手順は、信号復号部5031と同じである。
ローカルデコード係数複製部6100は、復号信号列S^(w)[k]と複製シフト情報τ (w)からサブバンド補完復号信号列S〜(w)[k](k=0,…,L−1)を生成する(S6100)。ローカルデコード係数複製部6100は、図24Bに示すように、複製判定部6001、複製シフト信号列生成部4002、補完復号信号列生成部4005を備える。複製判定部6001は、第wサブバンドの割当ビット情報B[w]が閾値以下の場合は、複製シフト候補信号列S τ[k]を生成することを示す複製判定フラグFlag (w)(例えば、Flag (w)=1)を出力する。一方、第wサブバンドの割当ビット情報B[w]が閾値より大きい場合は、複製シフト候補信号列S τ[k]を生成しないことを示す複製判定フラグFlag (w)(例えば、Flag (w)=0)を出力する(S6001)。
複製シフト信号列生成部4002、補完復号信号列生成部4005は、実施例3の復号装置400と同じである。また、サブバンド結合部4051、周波数時間変換部2021、重畳加算部2011も、実施例3の復号装置400と同じである。
以上の構成により、本本実施例の符号化装置、復号装置も実施例3と同様の効果が得られる。
[変形例]
図29、30に、符号化対象信号列をサブフレーム単位の時間領域の信号列とした場合の機能構成と処理フローを示す。図29Aは符号化装置の機能構成例、図29Bは復号装置の機能構成例、図30Aは符号化装置の処理フロー例、図30Bは復号装置の処理フロー例を示している。
符号化装置500’と復号装置600’は、符号化対象信号列が符号化装置500と復号装置600と異なるだけである。したがって、構成部の処理としては、符号化対象信号列生成部3012’と復元信号生成部4012’だけが異なる。符号化対象信号列生成部3012’は実施例3変形例の符号化装置300’と同じであり、復元信号生成部4012’は実施例3変形例の復号装置400’と同じである。
このような構成なので、本変形例の符号化装置、復号装置も実施例4と同様の効果が得られる。
図31〜図36を用いて、実施例5について説明する。図31は符号化装置の構成例、図32は復号装置の構成例を示している。図33は信号符号化部の構成例、図34Aは符号化装置内の信号復号部の構成例、図34Bは復号装置内の信号復号部の構成例を示している。図35Aは符号化装置の処理フロー例、図35Bは復号装置の処理フロー例を示している。図36は、符号インデクスの生成方法とデータセットの構成を示す図である。なお、本実施例の符号化対象信号列は、サブバンド周波数領域信号列(実施例3、4と同じ)である。
符号化装置
符号化装置700は、フレーム構成部1010、サブバンド分割部3050、信号符号化部7030、信号復号部7031、ローカルデコード係数探索部5000、符号多重化部7040を備える。フレーム構成部1010とサブバンド分割部3050は、実施例3の符号化装置300や実施例4の符号化装置500と同じである。
信号符号化部7030は、図33に示すように、パラメータ計算部5032、第一符号化部5033、第一ローカル復号部5034、動的ビット割当部5035、第二符号化部5036を備え、ローカル符号多重化部5037がない点が実施例4の信号符号化部5030と異なる。パラメータ計算部5032、第一符号化部5033、第一ローカル復号部5034、動的ビット割当部5035、第二符号化部5036は信号符号化部5030と同じである。信号符号化部7030は、サブバンド周波数領域信号列S(w)[k](w=0,…,W−1、k=0,…,L’−1)を入力とし、第一信号符号インデクスIと第二信号符号インデクスI (w)を出力する(S7030)。
信号復号部7031は、第一信号符号インデクスIと第二信号符号インデクスI (w)を復号し、復号信号列S^(w)[k](k=0,…,L’−1)と割当ビット情報B[w]を出力する(S7031)。信号復号部7031は、図34(A)に示すように、第一ローカル復号部5034、動的ビット割当部5035、第二復号部5039、復号パラメータ処理部5044を備える。第一ローカル復号部5034、動的ビット割当部5035、第二復号部5039、復号パラメータ処理部5044は、実施例4の符号化装置500と同じである。
ローカルデコード係数探索部5000は、実施例4の符号化装置500と同じである。符号多重化部7040は、第一信号符号インデクスIと第二信号符号インデクスI (w)と割当ビット情報B[w]と複製シフト情報τ (w)を多重化して送信信号を生成する(S7040)。例えば、図36に示すように、符号多重化部7040は、第一信号符号インデクスIを一定ビット数のビット列からなるデータセットとして出力する(S7041)。次に、割当ビット情報B[w]を閾値と比較し(S7042)、閾値より大きい場合は第wサブバンドの第二信号符号インデクスI (w)をB[w]ビットのビット列としてデータセットの最後に追加する(S7043)。一方、割当ビット情報B[w]が閾値以下の場合には、第wサブバンドの複製シフト情報τ (w)をB[w]ビットのビット列としてデータセットの最後に追加する(S7044)。ステップS7042〜S7044の処理を、w=0,…,W−1に対しておこない(S7045,S7046)、送信信号を出力する。
復号装置
復号装置800は、符号分離部8041、信号復号部8032、ローカルデコード係数複製部6100、サブバンド結合部4051、周波数時間変換部2021、重畳加算部2011を備える。なお、サブバンド結合部4051と周波数時間変換部2021と重畳加算部2011をあわせて、復元信号生成部4012と呼ぶ。符号分離部8041は、受信信号から第一信号符号インデクスIと第二信号符号インデクスI (w)を読み出し、出力する(S8041)。
信号復号部8032は、第一信号符号インデクスIと第二信号符号インデクスI (w)を復号し、サブバンドの復号信号列S^(w)[k](k=0,…,L’−1)と割当ビット情報B[w]と複製シフト情報τ (w)を出力する(S8032)。信号復号部8032は、第一ローカル復号部8043、動的ビット割当部5035、第二復号部8042、復号パラメータ処理部5044を備える。まず、第一ローカル復号部8043は、第一信号符号インデクスIを復号し、第wサブバンド第一復号パラメータを出力する。動的ビット割当部5035はサブバンド第一パラメータから割当ビット情報を出力する。動的ビット割当部5035は、実施例4の復号装置600と同じである。第二復号部8042は、第wサブバンドの割当ビット情報B[w]を用いて、第wサブバンド第二信号符号インデクスI (w)を復号し、第wサブバンド第二復号パラメータと複製シフト情報τ (w)を出力する。例えば、第二復号部8042は、全てのw(w=0,…,W−1)について、第wサブバンドの割当ビット情報B[w]が閾値以下の場合は、第二信号符号インデクスI (w)から、B[w]ビットのビット列を読み出して復号することにより、サブバンド複製シフト情報τ (w)を出力する。第wサブバンドの割当ビット情報B[w]が閾値より大きい場合は、第二信号符号インデクスI (w)から、B[w]ビットのビット列を読み出して復号することにより、サブバンド第二復号パラメータを出力する。復号パラメータ処理部5044は、実施例4の復号装置600と同じである。
ローカルデコード係数複製部6100、サブバンド結合部4051、周波数時間変換部2021、重畳加算部2011は、実施例4の復号装置600と同じである。
以上の構成により、本実施例の符号化装置、復号装置も実施例4と同様の効果が得られる。
[変形例1]
本変形例では、動的ビット割当部5035に動的ビット再割当部9060を組合せる。符号化装置の構成例を図31、復号装置の構成例を図32、符号化装置の処理フローを図35A、復号装置の処理フローを図35Bに示す。図37は信号符号化部の構成例、図38Aは符号化装置内の信号復号部の構成例、図38Bは復号装置内の信号復号部の構成例を示している。図39は動的ビット再割当部9060の処理手順を示す図である。
信号符号化部9030は、図37に示すように、パラメータ計算部5032、第一符号化部5033、第一ローカル復号部5034、動的ビット割当部5035、動的ビット再割当部9060、第二符号化部5036を備える。パラメータ計算部5032、第一符号化部5033、第一ローカル復号部5034、動的ビット割当部5035、第二符号化部5036は、実施例5の信号符号化部7030と同じである。
動的ビット再割当部9060は、図39に示すように、以下の手順で割当ビット情報を生成する。動的ビット割当部5035の出力(本変形例内では、「第一割当ビット情報B[w]」と呼ぶ。)と閾値を比較し、閾値以下の場合、サブバンドの割当ビット情報をB[w]=bminとする。閾値以下のサブバンドに対してビットを与えた残りのビット数をbtotalとする。残りのサブバンドに対して、動的ビット割当部5035と同様の動作によって残ったビットbtotalを割当て、第wサブバンドの割当ビット情報の値を全てのwについて決定し、出力する。
このような構成なので、本本実施例の符号化装置、復号装置も実施例5と同様の効果が得られる。また、サブバンドに割り当てられるビット数をさらに適切なものにできるので、さらに主観品質を向上できる。
[変形例2]
図40〜図42に、符号化対象信号列をサブフレーム単位の時間領域の信号列とした場合の機能構成と処理フローを示す。図40は符号化装置の機能構成例、図41は復号装置の機能構成例、図42Aは符号化装置の処理フロー例、図42Bは復号装置の処理フロー例を示している。
符号化装置700’と復号装置800’は、符号化対象信号列が符号化装置700と復号装置800と異なるだけである。したがって、構成部の処理としては、符号化対象信号列生成部3012’と復元信号生成部4012’だけが異なる。符号化対象信号列生成部3012’は実施例3変形例の符号化装置300’と同じであり、復元信号生成部4012’は実施例3変形例の復号装置400’と同じである。
このような構成なので、本変形例の符号化装置、復号装置も実施例5と同様の効果が得られる。
図43に、コンピュータの機能構成例を示す。なお、本発明の符号化方法や復号方法は、コンピュータ2000の記録部2020に、本発明の各ステップをコンピュータ2000に実行させるプログラムを読み込ませ、処理部2010、入力部2030、出力部2040などを動作させることで実現できる。また、コンピュータに読み込ませる方法としては、プログラムをコンピュータ読み取り可能な記録媒体に記録しておき、記録媒体からコンピュータに読み込ませる方法、サーバ等に記録されたプログラムを、電気通信回線等を通じてコンピュータに読み込ませる方法などがある。
100、150、300、500、700、900 符号化装置
200、250、400、600、800、950 復号装置
1000、1500、3000、5000 ローカルデコード係数探索部
1001、1501、2001、3001、5001、6001 複製判定部
1002、3002 複製シフト候補信号列生成部
1003、1503、3003 距離計算部
1004、3004 距離最小シフト量検出部
1010 フレーム構成部
1012、3012 符号化対象信号列生成部
1030、3030、5030、7030、9030 信号符号化部
1031、2031、3031、4031、5031、6031、7031、8032 信号復号部
1040、1540、5040、7040 符号多重化部
2002、4002 複製シフト信号列生成部
2006、2506、4005 補完復号信号列生成部
2011 重畳加算部
2012、4012 復元信号生成部
2021 周波数時間変換部
2041、2541、4041、6041、8041 符号分離部
2100、2500、4100、6100 ローカルデコード係数複製部
3050 サブバンド分割部 4051 サブバンド結合部
5032 パラメータ計算部 5033 第一符号化部
5034、8043 第一ローカル復号部 5035 動的ビット割当部
5036 第二符号化部 5037 ローカル符号多重化部
5038 ローカル符号分離部 5039、8042 第二復号部
5044 復号パラメータ処理部 9060 動的ビット再割当部
本発明は、音声などの音響信号の符号化方法、復号方法、それらの方法を用いた装置、プログラム、記録媒体に関する。特に、符号化および情報の伝送の際に失われる情報を補完するための技術であって、伝送する符号に対して、損失する情報の一部を利用して得られる符号を付加することにより、復号時に損失した情報を復元する技術に関する。
本発明の第1の態様によれば、符号化方法は、各サブバンドに対して割当ビット数を算出するステップと、割当ビット数が所定の閾値以下でない各サブバンドについて、上記各サブバンドのサブバンド周波数領域信号列に対応する符号インデクスと、その符号インデクスに対応する復号信号列とを出力するステップと、割当ビット数が所定の閾値以下である各サブバンドについて、予め定められた複数の信号シフト量の候補のうち、上記各サブバンド以外のサブバンドの復号信号列を信号シフト量の候補でシフトして得られる信号列と上記各サブバンドのサブバンド周波数領域信号列との相関が最大又は距離が最小となる信号シフト量の候補を複製シフト情報として出力するステップと、を有する。
本発明の第2の態様によれば、符号化方法は、各サブフレームに対して割当ビット数を算出するステップと、割当ビット数が所定の閾値以下でない各サブフレームについて、上記各サブフレームの時間領域のサブフレーム信号列に対応する符号インデクスと、その符号インデクスに対応する復号信号列とを出力するステップと、割当ビット数が所定の閾値以下である各サブフレームについて、予め定められた複数の信号シフト量の候補のうち、上記各サブフレーム以外のサブフレームの復号信号列を信号シフト量の候補でシフトして得られる信号列と上記各サブフレームのサブフレーム信号列との相関が最大又は距離が最小となる信号シフト量の候補を複製シフト情報として出力するステップと、を有する。
本発明の第3の態様によれば、復号方法は、各サブバンドの符号インデクスを復号し、上記各サブバンドのサブバンド復号信号列を出力するステップと、上記各サブバンドのサブバンド複製シフト信号列を生成する場合には、上記各サブバンドの複製シフト情報が示すシフト量に基づいて、上記各サブバンド以外のサブバンドのサブバンド復号信号列をシフトして得られる信号列を上記各サブバンドのサブバンド複製シフト信号列として生成するステップと、上記各サブバンドについてサブバンド複製シフト信号列を生成する場合には、上記生成されたサブバンド複製シフト信号列を上記各サブバンドのサブバンド補完復号信号列として出力し、上記各サブバンドについてサブバンド複製シフト信号列を生成しない場合には、上記各サブバンドのサブバンド復号信号列を上記各サブバンドのサブバンド補完復号信号列として出力するステップと、各サブバンドのサブバンド補完復号信号列を結合して周波数領域の補完復号信号列を生成し、この周波数領域の補完復号信号列を時間領域に変換して、復号音響信号を生成するステップと、を有する。
本発明の第4の態様によれば、復号方法は、各サブフレームの符号インデクスを復号し、上記各サブフレームのサブフレーム復号信号列を出力するステップと、上記各サブフレームのサブフレーム複製シフト信号列を生成する場合には、上記各サブフレームの複製シフト情報が示すシフト量に基づいて、上記各サブフレーム以外のサブフレームのサブフレーム復号信号列をシフトして得られる信号列を上記各サブフレームのサブフレーム複製シフト信号列として生成するステップと、上記各サブフレームについてサブフレーム複製シフト信号列を生成する場合には、上記生成されたサブフレーム複製シフト信号列を上記各サブフレームのサブフレーム補完復号信号列として出力し、上記各サブフレームについてサブフレーム複製シフト信号列を生成しない場合には、上記各サブフレームのサブフレーム復号信号列を上記各サブフレームのサブフレーム補完復号信号列として出力するステップと、各サブフレームのサブフレーム補完復号信号列を結合して、復号音響信号を生成するステップと、を有する。
まず、コピー元の信号を、復号信号を時間領域あるいは周波数領域でシフトさせて得られる信号としたことで、次の効果が得られる。特に、周波数帯域を等間隔な複数の周波数帯域(以下、「サブバンド」と呼ぶ。)に分割した際、各サブバンドに対応する信号同士には相関が存在するため、特に4〜14kHzといった高域では近隣のサブバンドの信号をコピーあるいは加算して当該サブバンドの信号とすることにより、聴感上の雑音を低減することができる。また、時間領域の信号についても、フレームを一定の間隔(以下、「サブフレーム」と呼ぶ。)に分割した際、各サブフレームに対応する信号間には相関が存在するため、近傍のサブフレームの信号をコピーあるいは加算して当該サブフレームの信号とすることにより、聴感上の雑音を低減することができる。
[変形例]
図20、21に、符号化対象信号列をサブフレーム単位の時間領域の信号列とした場合の機能構成と処理フローを示す。図20Aは符号化装置の機能構成例、図20Bは復号装置の機能構成例、図21Aは符号化装置の処理フロー例、図21Bは復号装置の処理フロー例を示している。
このような構成なので、本変形例の符号化装置、復号装置も実施例5と同様の効果が得られる。また、サブバンドに割り当てられるビット数をさらに適切なものにできるので、さらに主観品質を向上できる。

Claims (15)

  1. 音響信号から、あらかじめ定められた数の信号からなる信号列を、符号化対象信号列として生成し、出力する符号化対象信号列とする符号化対象信号列生成ステップと、
    前記符号化対象信号列ごとに該符号化対象信号列に対応する符号インデクスを出力する信号符号化ステップと、
    前記符号インデクスを復号し、復号信号列を出力する信号復号ステップと、
    前記符号化対象信号列と前記復号信号列から、複製シフト情報を出力するローカルデコード係数探索ステップと、
    少なくとも前記符号インデクスと前記複製シフト情報を多重化して送信信号を生成する符号多重化ステップと
    を有し、
    前記ローカルデコード係数探索ステップは、
    前記符号化対象信号列ごとに、前記復号信号列を用いて複製シフト候補信号列を生成するかを判定し、複製判定フラグを出力する複製判定サブステップと、
    前記複製判定フラグが複製シフト候補信号列を生成することを示す場合には、あらかじめ定めたすべての信号シフト量の候補に対して、複製シフト候補信号列を生成する複製シフト候補信号列生成サブステップと、
    各複製シフト候補信号列もしくは各複製シフト候補信号列を用いて生成した信号列と前記符号化対象信号列との距離を示すパラメータを計算する距離計算サブステップと、
    前記距離計算サブステップの計算結果から距離が最小となる信号シフト量を求める距離最小シフト量検出サブステップと
    を有する
    ことを特徴とする符号化方法。
  2. 請求項1記載の符号化方法であって、
    前記複製判定サブステップは、前記復号信号列のパワーが閾値以下の場合に複製シフト候補信号列を生成することを示す複製判定フラグを出力し、
    前記複製シフト候補信号列生成サブステップは、複製シフト候補信号列を前記復号信号列から求め、
    前記距離計算サブステップで計算する距離を示すパラメータとは、前記複製シフト候補信号列と前記符号化対象信号列との距離を示すパラメータである
    ことを特徴とする符号化方法。
  3. 請求項1記載の符号化方法であって、
    前記複製判定サブステップは、前記符号化対象信号列と前記復号信号列の誤差のパワーが閾値より大きい場合に複製シフト候補信号列を生成することを示す複製判定フラグを出力し、
    前記複製シフト候補信号列生成サブステップは、複製シフト候補信号列を前記復号信号列から求め、
    前記距離計算サブステップで計算する距離を示すパラメータは、前記複製シフト候補信号列と前記復元信号列とを加算した補完復号候補信号列と、前記符号化対象信号列との距離を示すパラメータである
    ことを特徴とする符号化方法。
  4. 請求項1記載の符号化方法であって、
    前記信号復号ステップは、さらに、符号化対象信号列ごとに割り当てるビット数を計算して割当ビット情報として出力し、
    前記複製判定サブステップは、前記符号化対象信号列に割り当てるビット数が閾値以下の場合に複製シフト候補信号列を生成することを示す複製判定フラグを出力し、
    前記複製シフト候補信号列生成サブステップは、複製シフト候補信号列を前記復号信号列から求め、
    前記距離計算サブステップで計算する距離を示すパラメータとは、前記複製シフト候補信号列と前記符号化対象信号列との距離を示すパラメータである
    ことを特徴とする符号化方法。
  5. 請求項1記載の符号化方法であって、
    前記信号復号ステップは、さらに、符号化対象信号列ごとに割り当てるビット数を計算して割当ビット情報として出力し、
    前記複製判定サブステップは、前記符号化対象信号列に割り当てるビット数が閾値以下の場合に複製シフト候補信号列を生成することを示す複製判定フラグを出力し、
    前記複製シフト候補信号列生成サブステップは、複製シフト候補信号列を前記復号信号列から求め、
    前記距離計算サブステップで計算する距離を示すパラメータは、前記複製シフト候補信号列と前記復元信号列とを加算した補完復号候補信号列と、前記符号化対象信号列との距離を示すパラメータである
    ことを特徴とする符号化方法。
  6. 請求項2から5のいずれかに記載の符号化方法であって、
    前記符号化対象信号列が、周波数領域信号列を周波数帯域で分割したサブバンド周波数領域信号列S(w)[k](ただし、w=0,…,W−1、k=0,…,L’−1、Wは分割した数、L’は1つのサブバンド周波数領域信号列に含まれる信号の数)であり、
    前記複製シフト候補信号列生成サブステップは、複製シフト候補信号列S τ (w)[k]を、同一の周波数領域信号列から分割されたサブバンド周波数領域信号列に対する前記復号信号列S^(w)[k]を用いて求める
    ことを特徴とする符号化方法。
  7. 受信信号から符号インデクスと複製シフト情報とを読み出し、出力する符号分離ステップと、
    前記符号インデクスを復号し、復号信号列を出力する信号復号ステップと、
    前記復号信号列と前記複製シフト情報から補完復号信号列を生成するローカルデコード係数複製ステップと、
    前記補完復号信号列から元の音響情報を示す信号である復元信号を生成する復元信号生成ステップと
    を有し、
    前記ローカルデコード係数複製ステップは、
    前記復号信号列を用いて複製シフト信号列を生成するかを判定し、複製判定フラグを出力する複製判定サブステップと、
    前記複製判定フラグが複製シフト候補信号列を生成することを示す場合には、前記複製シフト情報が示すシフト量に基づいて複製シフト信号列を生成する複製シフト信号列生成サブステップと、
    前記複製判定フラグが複製シフト候補信号列を生成することを示す場合には前記複製シフト信号列を補完復号信号列とし、前記複製判定フラグが複製シフト候補信号列を生成しないことを示す場合には前記復号信号列を補完復号信号列とし、当該補完復号信号列を出力する補完復号信号列生成サブステップと
    を有する
    ことを特徴とする復号方法。
  8. 受信信号から符号インデクスと複製シフト情報と複製判定フラグを読み出し、出力する符号分離ステップと、
    前記符号インデクスを復号し、復号信号列を出力する信号復号ステップと、
    前記復号信号列と前記複製シフト情報と複製判定フラグから補完復号信号列を生成するローカルデコード係数複製ステップと、
    前記補完復号信号列から元の音響情報を示す信号である復元信号を生成する復元信号生成ステップと
    を有し、
    前記ローカルデコード係数複製ステップは、
    前記複製判定フラグが複製シフト候補信号列を生成することを示す場合には、前記複製シフト情報が示すシフト量に基づいて複製シフト信号列を生成する複製シフト信号列生成サブステップと、
    前記複製判定フラグが複製シフト候補信号列を生成することを示す場合には前記複製シフト信号列を補完復号信号列とし、前記複製判定フラグが複製シフト候補信号列を生成しないことを示す場合には前記復号信号列を補完復号信号列とし、当該補完復号信号列を出力する補完復号信号列生成サブステップと
    を有する
    ことを特徴とする復号方法。
  9. 受信信号から符号インデクスと複製シフト情報とを読み出し、出力する符号分離ステップと、
    前記符号インデクスを復号し、復号信号列を出力する信号復号ステップと、
    前記復号信号列と前記複製シフト情報から補完復号信号列を生成するローカルデコード係数複製ステップと、
    前記補完復号信号列から元の音響情報を示す信号である復元信号を生成する復元信号生成ステップと
    を有し、
    前記ローカルデコード係数複製ステップは、
    前記復号信号列から複製シフト信号列を生成するかを判定し、複製判定フラグを出力する複製判定サブステップと、
    前記複製判定フラグが複製シフト候補信号列を生成することを示す場合には、前記複製シフト情報が示すシフト量に基づいて複製シフト信号列を生成する複製シフト信号列生成サブステップと、
    前記復号信号列と前記複製シフト信号列の和を補完復号信号列とし、当該補完復号信号列を出力する補完復号信号列生成サブステップと
    を有する
    ことを特徴とする復号方法。
  10. 受信信号から符号インデクスと複製シフト情報と複製判定フラグを読み出し、出力する符号分離ステップと、
    前記符号インデクスを復号し、復号信号列を出力する信号復号ステップと、
    前記復号信号列と前記複製シフト情報と複製判定フラグから補完復号信号列を生成するローカルデコード係数複製ステップと、
    前記補完復号信号列から元の音響情報を示す信号である復元信号を生成する復元信号生成ステップと
    を有し、
    前記ローカルデコード係数複製ステップは、
    前記複製判定フラグが複製シフト候補信号列を生成することを示す場合には、前記複製シフト情報が示すシフト量に基づいて複製シフト信号列を生成する複製シフト信号列生成サブステップと、
    前記復号信号列と前記複製シフト信号列の和を補完復号信号列とし、当該補完復号信号列を出力する補完復号信号列生成サブステップと
    を有する
    ことを特徴とする復号方法。
  11. 請求項7から10のいずれかに記載の復号方法であって、
    前記復号信号列S^(w)[k]が、周波数領域信号列を周波数帯域で分割したサブバンド周波数領域信号列S(w)[k](ただし、w=0,…,W−1、k=0,…,L’−1、Wは分割した数、L’は1つのサブバンド周波数領域信号列に含まれる信号の数)に対応する信号列であり、
    前記複製シフト信号列生成サブステップは、複製シフト信号列S・(w)[k]を、同一の周波数領域信号列から分割されたサブバンド周波数領域信号列に対する前記復号信号列S^(w)[k]を用いて求める
    ことを特徴とする復号方法。
  12. 音響信号から、あらかじめ定められた数の信号からなる信号列を、符号化対象信号列として生成し、出力する符号化対象信号列する符号化対象信号列生成部と、
    前記符号化対象信号列ごとに該符号化対象信号列に対応する符号インデクスを出力する信号符号化部と、
    前記符号インデクスを復号し、復号信号列を出力する信号復号部と、
    前記符号化対象信号列と前記復号信号列から、複製シフト情報を出力するローカルデコード係数探索部と、
    少なくとも前記符号インデクスと前記複製シフト情報を多重化して送信信号を生成する符号多重化部と
    を備え、
    前記ローカルデコード係数探索部は、
    前記符号化対象信号列ごとに、前記復号信号列を用いて複製シフト候補信号列を生成するかを判定し、複製判定フラグを出力する複製判定手段と、
    前記複製判定フラグが複製シフト候補信号列を生成することを示す場合には、あらかじめ定めたすべての信号シフト量の候補に対して、複製シフト候補信号列を生成する複製シフト候補信号列生成手段と、
    各複製シフト候補信号列もしくは各複製シフト候補信号列を用いて生成した信号列と前記符号化対象信号列との距離を示すパラメータを計算する距離計算手段と、
    前記距離計算手段の計算結果から距離が最小となる信号シフト量を求める距離最小シフト量検出手段と
    を有する
    ことを特徴とする符号化装置。
  13. 受信信号から少なくとも符号インデクスと複製シフト情報とを読み出し、出力する符号分離部と、
    前記符号インデクスを復号し、復号信号列を出力する信号復号部と、
    前記復号信号列と前記複製シフト情報から補完復号信号列を生成するローカルデコード係数複製部と、
    前記補完復号信号列から元の音響情報を示す信号である復元信号を生成する復元信号生成部と
    を備え、
    前記ローカルデコード係数複製部は、
    前記復号信号列を用いて複製シフト信号列を生成するかを判定し、複製判定フラグを出力する複製判定手段と、
    前記複製判定フラグが複製シフト候補信号列を生成することを示す場合には、前記複製シフト情報が示すシフト量に基づいて複製シフト信号列を生成する複製シフト信号列生成手段と、
    前記複製判定フラグが複製シフト候補信号列を生成することを示す場合には前記複製シフト信号列を補完復号信号列とし、前記複製判定フラグが複製シフト候補信号列を生成しないことを示す場合には前記復号信号列を補完復号信号列とし、当該補完復号信号列を出力する、または、前記復号信号列と前記複製シフト信号列の和を補完復号信号列とし、当該補完復号信号列を出力する補完復号信号列生成手段と
    を有する
    ことを特徴とする復号装置。
  14. 受信信号から少なくとも符号インデクスと複製シフト情報と複製判定フラグを読み出し、出力する符号分離部と、
    前記符号インデクスを復号し、復号信号列を出力する信号復号部と、
    前記復号信号列と前記複製シフト情報と複製判定フラグから補完復号信号列を生成するローカルデコード係数複製部と、
    前記補完復号信号列から元の音響情報を示す信号である復元信号を生成する復元信号生成部と
    を備え、
    前記ローカルデコード係数複製部は、
    前記複製判定フラグが複製シフト候補信号列を生成することを示す場合には、前記複製シフト情報が示すシフト量に基づいて複製シフト信号列を生成する複製シフト信号列生成手段と、
    前記複製判定フラグが複製シフト候補信号列を生成することを示す場合には前記複製シフト信号列を補完復号信号列とし、前記複製判定フラグが複製シフト候補信号列を生成しないことを示す場合には前記復号信号列を補完復号信号列とし、当該補完復号信号列を出力する、または、前記復号信号列と前記複製シフト信号列の和を補完復号信号列とし、当該補完復号信号列を出力する補完復号信号列生成手段と
    を有する
    ことを特徴とする復号装置。
  15. 請求項1から11のいずれかに記載の方法の各ステップをコンピュータに実行させるプログラム。
JP2011519899A 2009-06-23 2010-06-22 符号化方法、復号方法、それらの方法を用いた装置、プログラム、記録媒体 Active JP5400880B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011519899A JP5400880B2 (ja) 2009-06-23 2010-06-22 符号化方法、復号方法、それらの方法を用いた装置、プログラム、記録媒体

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2009148793 2009-06-23
JP2009148793 2009-06-23
PCT/JP2010/060522 WO2010150767A1 (ja) 2009-06-23 2010-06-22 符号化方法、復号方法、それらの方法を用いた装置、プログラム
JP2011519899A JP5400880B2 (ja) 2009-06-23 2010-06-22 符号化方法、復号方法、それらの方法を用いた装置、プログラム、記録媒体

Publications (2)

Publication Number Publication Date
JPWO2010150767A1 true JPWO2010150767A1 (ja) 2012-12-10
JP5400880B2 JP5400880B2 (ja) 2014-01-29

Family

ID=43386536

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011519899A Active JP5400880B2 (ja) 2009-06-23 2010-06-22 符号化方法、復号方法、それらの方法を用いた装置、プログラム、記録媒体

Country Status (6)

Country Link
US (1) US20120123788A1 (ja)
EP (1) EP2447943A4 (ja)
JP (1) JP5400880B2 (ja)
CN (1) CN102804263A (ja)
CA (1) CA2765523A1 (ja)
WO (1) WO2010150767A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130114571A1 (en) 2011-11-07 2013-05-09 Qualcomm Incorporated Coordinated forward link blanking and power boosting for flexible bandwidth systems
US9848339B2 (en) * 2011-11-07 2017-12-19 Qualcomm Incorporated Voice service solutions for flexible bandwidth systems
US9516531B2 (en) 2011-11-07 2016-12-06 Qualcomm Incorporated Assistance information for flexible bandwidth carrier mobility methods, systems, and devices
US10951292B2 (en) * 2018-01-26 2021-03-16 California Institute Of Technology Systems and methods for random access communication

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
GB2257606B (en) * 1991-06-28 1995-01-18 Sony Corp Recording and/or reproducing apparatuses and signal processing methods for compressed data
JP3343965B2 (ja) * 1992-10-31 2002-11-11 ソニー株式会社 音声符号化方法及び復号化方法
JP3153075B2 (ja) * 1994-08-02 2001-04-03 日本電気株式会社 音声符号化装置
CA2154911C (en) * 1994-08-02 2001-01-02 Kazunori Ozawa Speech coding device
JPH08179795A (ja) * 1994-12-27 1996-07-12 Nec Corp 音声のピッチラグ符号化方法および装置
JPH08190764A (ja) * 1995-01-05 1996-07-23 Sony Corp ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
TW384434B (en) * 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
SE513520C2 (sv) * 1998-05-14 2000-09-25 Ericsson Telefon Ab L M Förfarande och anordning för maskering av fördröjda paket
US6745162B1 (en) * 2000-06-22 2004-06-01 Sony Corporation System and method for bit allocation in an audio encoder
JP2002268697A (ja) * 2001-03-13 2002-09-20 Nec Corp パケット誤り耐性付き音声復号装置、音声符号化復号装置、及びその方法
JP2003050598A (ja) * 2001-08-06 2003-02-21 Mitsubishi Electric Corp 音声復号装置
AU2003234763A1 (en) * 2002-04-26 2003-11-10 Matsushita Electric Industrial Co., Ltd. Coding device, decoding device, coding method, and decoding method
JP4050961B2 (ja) * 2002-08-21 2008-02-20 松下電器産業株式会社 パケット型音声通信端末
JP4679049B2 (ja) * 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
EP1746580B1 (en) 2004-05-10 2010-03-24 Nippon Telegraph and Telephone Corporation Acoustic signal packet communication method, transmission method, reception method, and device and program thereof
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
EP1953737B1 (en) * 2005-10-14 2012-10-03 Panasonic Corporation Transform coder and transform coding method
CN101308659B (zh) * 2007-05-16 2011-11-30 中兴通讯股份有限公司 一种基于先进音频编码器的心理声学模型的处理方法
CN102081926B (zh) * 2009-11-27 2013-06-05 中兴通讯股份有限公司 格型矢量量化音频编解码方法和系统

Also Published As

Publication number Publication date
EP2447943A1 (en) 2012-05-02
WO2010150767A1 (ja) 2010-12-29
US20120123788A1 (en) 2012-05-17
EP2447943A4 (en) 2013-01-09
CA2765523A1 (en) 2010-12-29
JP5400880B2 (ja) 2014-01-29
CN102804263A (zh) 2012-11-28

Similar Documents

Publication Publication Date Title
JP5283046B2 (ja) ピーク検出に基づく選択的スケーリングマスク計算
AU2016202800B2 (en) Signal processing apparatus and method, and program
US8321229B2 (en) Apparatus, medium and method to encode and decode high frequency signal
RU2469422C2 (ru) Способ и устройство для формирования уровня улучшения в системе кодирования звука
KR101171098B1 (ko) 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
JP5285162B2 (ja) ピーク検出に基づいた選択型スケーリングマスク演算
US10255928B2 (en) Apparatus, medium and method to encode and decode high frequency signal
US20090316914A1 (en) Efficient and Scalable Parametric Stereo Coding for Low Bitrate Audio Coding Applications
US20080077412A1 (en) Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
Hwang Multimedia networking: From theory to practice
JP2004272260A (ja) 帯域拡張技術を利用したデジタルデータの符号化方法、その装置、復号化方法およびその装置
KR20110111443A (ko) 다수 채널 오디오 코딩 시스템 내에서 인핸스먼트 레이어를 생성하기 위한 방법 및 장치
JP4736812B2 (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP4603485B2 (ja) 音声・楽音符号化装置及び音声・楽音符号化方法
JP5400880B2 (ja) 符号化方法、復号方法、それらの方法を用いた装置、プログラム、記録媒体
KR20030040203A (ko) 부호화 장치, 복호화 장치 및 방송 시스템
JP4973397B2 (ja) 符号化装置および符号化方法、ならびに復号化装置および復号化方法
KR20080066537A (ko) 부가정보를 가지는 오디오신호의 부호화/복호화 방법 및장치
JP5235168B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、符号化プログラム、復号プログラム
Ding Wideband audio over narrowband low-resolution media
JP2005114814A (ja) 音声符号化・復号化方法、音声符号化・復号化装置、音声符号化・復号化プログラム、及びこれを記録した記録媒体
Ding Backward compatible wideband voice over narrowband low-resolution media

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130723

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130917

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131015

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131025

R150 Certificate of patent or registration of utility model

Ref document number: 5400880

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350