JP6289627B2 - 信号の符号化および復号化の方法および装置 - Google Patents

信号の符号化および復号化の方法および装置 Download PDF

Info

Publication number
JP6289627B2
JP6289627B2 JP2016522220A JP2016522220A JP6289627B2 JP 6289627 B2 JP6289627 B2 JP 6289627B2 JP 2016522220 A JP2016522220 A JP 2016522220A JP 2016522220 A JP2016522220 A JP 2016522220A JP 6289627 B2 JP6289627 B2 JP 6289627B2
Authority
JP
Japan
Prior art keywords
vectors
subbands
spectral coefficients
vector
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016522220A
Other languages
English (en)
Other versions
JP2016527546A (ja
Inventor
▲澤▼新 ▲劉▼
▲澤▼新 ▲劉▼
磊 苗
磊 苗
晨 胡
晨 胡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2016527546A publication Critical patent/JP2016527546A/ja
Application granted granted Critical
Publication of JP6289627B2 publication Critical patent/JP6289627B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は信号処理の分野に関し、特に、信号の符号化および復号化の方法および装置に関する。
現在、通信伝送において、音声信号または音響信号の品質の重要性がますます高まっている。したがって、信号の符号化および復号化にはより高い要求が課せられている。既存のミディアムレートおよび低レートの信号の符号化アルゴリズムおよび復号化アルゴリズムでは、割当てに利用できるビット数が不十分であるので、割当てに利用可能なビット数を周波数バンド全体に割り当てると、周波数スペクトルに多くのホールが生じ、全て0のベクトルの一部がそれぞれ1ビットによって示される必要があるままになってしまい、ビットの浪費が生じてしまう。更に、これらのアルゴリズムにはいくつかの制限があるために、一部のビットが符号化の後に残ってしまうおそれがあり、またビットの数の浪費が生じてしまう。したがって、復号端による復号化によって得られる信号の品質が悪い。
本発明の実施形態は、信号の聴覚品質を改善することのできる信号の符号化および復号化の方法および装置を提供する。
第1の態様によれば、信号符号化方法が提供される。本方法は、利用可能なビット数および第1の飽和閾値iに従って、符号化されるべきサブバンド数kを決定するステップであって、iは正の数であり、kは正の整数である、ステップと、全てのサブバンドの量子化エンベロープに従って、全てのサブバンドからk個のサブバンドを選択するか、または、心理音響モデルに従って、全てのサブバンドからk個のサブバンドを選択するステップと、k個のサブバンドのスペクトル係数に対して、1回目の符号化操作を実行するステップと、を有する。
第1の態様に関して、第1の可能な実施方式では、k個のサブバンドのスペクトル係数に対して1回目の符号化操作を実行するステップは、k個のサブバンドのスペクトル係数を正規化して、k個のサブバンドの正規化スペクトル係数を取得するステップと、k個のサブバンドの正規化スペクトル係数を量子化して、k個のサブバンドの量子化スペクトル係数を取得するステップと、を有する。
第1の態様の第1の可能な実施方式に関して、第2の可能な実施方式では、本方法は更に、1回目の符号化操作の後に利用可能なビット数のうちの残りのビット数が第1のビット数閾値以上である場合、残りのビット数と、第2の飽和閾値jと、k個のサブバンドの量子化スペクトル係数に従って、2回目の符号化が実行されるべきm個のベクトルを決定するステップであって、jは正の数であり、mは正の整数である、ステップと、m個のベクトルのスペクトル係数に対して、2回目の符号化操作を実行するステップと、を有する。
第1の態様の第2の可能な実施方式に関して、第3の可能な実施方式では、残りのビット数と、第2の飽和閾値jと、k個のサブバンドの量子化スペクトル係数に従って、2回目の符号化が実行されるべきm個のベクトルを決定するステップは、残りのビット数および第2の飽和閾値jに従って、2回目の符号化が実行されるべきベクトル数mを決定するステップと、k個のサブバンドの量子化スペクトル係数に従って、候補スペクトル係数を決定するステップであって、候補スペクトル係数は、k個のサブバンドの正規化スペクトル係数からk個のサブバンドの対応する量子化スペクトル係数を引くことによって得られるスペクトル係数を含む、ステップと、候補スペクトル係数が属するベクトルからm個のベクトルを選択するステップと、を有する。
第1の態様の第3の可能な実施方式に関して、第4の可能な実施方式では、候補スペクトル係数が属するベクトルからm個のベクトルを選択するステップは、候補スペクトル係数の属するベクトルをソートして、ソートされたベクトルを取得するステップと、ソートされたベクトルから最初のm個のベクトルを選択するステップと、を有する。ソートされたベクトルは第1群のベクトルと第2群のベクトルとに分割され、第1群のベクトルは第2群のベクトルの前に配置され、第1群のベクトルは、k個のサブバンドの量子化スペクトル係数の属するベクトルにおいて値が全て0であるベクトルに対応し、第2群のベクトルは、k個のサブバンドの量子化スペクトル係数の属するベクトルにおいて値の全てが0ではないベクトルに対応する。
第1の態様の第4の可能な実施方式に関して、第5の可能な実施方式では、第1群のベクトルおよび第2群のベクトルの各ベクトル群において、異なるサブバンドのベクトルは、ベクトルが位置するサブバンドの周波数の低い順に配列され、同じサブバンドのベクトルは、ベクトルの元の順序で配列される。
第1の態様の第4の可能な実施方式に関して、第6の可能な実施方式では、第1群のベクトルおよび第2群のベクトルの各ベクトル群において、異なるサブバンドのベクトルは、ベクトルが位置するサブバンドの量子化エンベロープの大きい順に配列され、同じサブバンドのベクトルは、ベクトルの元の順序で配列される。
第1の態様の第3の可能な実施方式に関して、第7の可能な実施方式では、候補スペクトル係数が属するベクトルからm個のベクトルを選択するステップは、候補スペクトル係数の属するベクトルが位置するサブバンドの量子化エンベロープの大きい順に、候補スペクトル係数の属するベクトルからm個のベクトルを選択するステップ、を有する。
第1の態様の第2の可能な実施方式〜第7の可能な実施方式のうちいずれかの可能な実施方式に関して、第8の可能な実施方式では、m個のベクトルのスペクトル係数に対して2回目の符号化操作を実行するステップは、m個のベクトルのスペクトル係数の大域的ゲインを決定するステップと、m個のベクトルのスペクトル係数の大域的ゲインを用いて、m個のベクトルのスペクトル係数を正規化するステップと、m個のベクトルの正規化スペクトル係数を量子化するステップと、を有する。
第1の態様の第4の可能な実施方式〜第6の可能な実施方式のいずれかの可能な実施形式に関して、第9の可能な実施方式では、m個のベクトルのスペクトル係数に対して2回目の符号化操作を実行するステップは、第1群のベクトルのスペクトル係数の大域的ゲインと、第2群のベクトルのスペクトル係数の大域的ゲインとを決定するステップと、第1群のベクトルのスペクトル係数の大域的ゲインを用いて、m個のベクトルのうち第1群のベクトルに属するベクトルのスペクトル係数を正規化するステップと、第2群のベクトルのスペクトル係数の大域的ゲインを用いて、m個のベクトルのうち第2群のベクトルに属するベクトルのスペクトル係数を正規化するステップと、m個のベクトルの正規化スペクトル係数を量子化するステップと、を有する。
第1の態様の第3の可能な実施方式〜第9の可能な実施方式のいずれかの可能な実施形式に関して、第10の可能な実施方式では、残りのビット数および第2の飽和閾値jに従って符号化されるべきベクトル数mを決定するステップは、以下の等式
Figure 0006289627
に従ってmを決定するステップを有する。Cは残りのビット数を表し、Mは、各ベクトルに含まれるスペクトル係数の数を表す。
第1の態様または第1の態様の第1の可能な実施方式〜第10の可能な実施方式のうちいずれかの可能な実施方式に関して、第11の可能な実施方式において、利用可能なビット数および第1の飽和閾値iに従って符号化されるべきサブバンド数kを決定するステップは、以下の等式
Figure 0006289627
に従ってkを決定するステップを有する。Bは利用可能なビット数を表し、Lは、各サブバンドに含まれるスペクトル係数の数を表す。
第1の態様または第1の態様の第1の可能な実施方式〜第11の可能な実施方式のいずれかの可能な実施方式に関して、第12の可能な実施方式では、利用可能なビット数および第1の飽和閾値iに従って符号化されるべきサブバンド数kを決定するステップは、信号が過渡信号、摩擦信号またはロングピッチ信号である場合、利用可能なビット数および第1の飽和閾値iに従って、符号化されるべきサブバンド数kを決定するステップ、を有する。
第2の態様によれば、信号復号化方法が提供される。本方法は、利用可能なビット数および第1の飽和閾値iに従って、復号化されるべきサブバンド数kを決定するステップであって、iは正の数であり、kは正の整数である、ステップと、全てのサブバンドの復号化されたエンベロープに従って、全てのサブバンドからk個のサブバンドを選択するか、または、心理音響モデルに従って、全てのサブバンドからk個のサブバンドを選択するステップと、1回目の復号化操作を実行して、k個のサブバンドの量子化スペクトル係数を取得するステップと、を有する。
第2の態様に関して、第1の可能な実施方式では、本方法は更に、1回目の復号化操作の後に利用可能なビット数のうちの残りのビット数が第1のビット数閾値以上である場合、残りのビット数および第2の飽和閾値jに従って、2回目の復号化が実行されるべきベクトルの数mを決定するステップであって、jは正の数であり、mは正の整数である、ステップと、2回目の復号化操作を実行して、m個のベクトルの正規化スペクトル係数を取得するステップと、を有する。
第2の態様の第1の可能な実施方式に関して、第2の可能な実施方式では、本方法は更に、m個のベクトルの正規化スペクトル係数とk個のサブバンドの量子化スペクトル係数との対応関係を決定するステップ、を有する。
第2の態様の第2の可能な実施方式に関して、第3の可能な実施方式では、m個のベクトルの正規化スペクトル係数とk個のサブバンドの量子化スペクトル係数との対応関係を決定するステップは、m個のベクトルとk個のサブバンドの量子化スペクトル係数の属するベクトルのうちの第1のタイプのベクトルとの対応関係を決定するステップ、を有する。m個のベクトルは、第1のタイプのベクトルと1対1の対応関係にある。
第2の態様の第3の可能な実施方式に関して、第4の可能な実施方式では、m個のベクトルとk個のサブバンドの量子化スペクトル係数の属するベクトルのうちの第1のタイプのベクトルとの対応関係を決定するステップは、k個のサブバンドの量子化スペクトル係数の属するベクトルをソートして、ソートされたベクトルを取得するステップであって、ソートされたベクトルは第1群のベクトルと第2群のベクトルとに分割され、第1群のベクトルは第2群のベクトルの前に配置され、第1群のベクトルは、第1群の復号化されたスペクトル係数の属するベクトルにおいて値が全て0であるベクトルを含み、第2群のベクトルは、第1群の復号化されたスペクトル係数の属するベクトルにおいて値の全てが0ではないベクトルを含む、ステップと、ソートされたベクトルから最初のm個のベクトルを、第1のタイプのベクトルとして選択するステップと、第1のタイプのベクトルとm個のベクトルとの対応関係を確立するステップと、を有する。
第2の態様の第4の可能な実施方式に関して、第5の可能な実施方式では、第1群のベクトルおよび第2群のベクトルの各ベクトル群において、異なるサブバンドのベクトルは、ベクトルが位置するサブバンドの周波数の低い順に配列され、同じサブバンドのベクトルは、ベクトルの元の順序で配列される。
第2の態様の第4の可能な実施方式に関して、第6の可能な実施方式では、第1群のベクトルおよび第2群のベクトルの各ベクトル群において、異なるサブバンドのベクトルは、ベクトルが位置するサブバンドの量子化エンベロープの大きい順に配列され、同じサブバンドのベクトルは、ベクトルの元の順序で配列される。
第2の態様の第3の可能な実施方式に関して、第7の可能な実施方式では、m個のベクトルとk個のサブバンドの量子化スペクトル係数の属するベクトルのうちの第1のタイプのベクトルとの対応関係を決定するステップは、k個のサブバンドの量子化スペクトル係数の属するベクトルが位置するサブバンドの量子化エンベロープの大きい順に、k個のサブバンドの量子化スペクトル係数の属するベクトルから、m個のベクトルを第1のタイプのベクトルとして選択するステップと、第1のタイプのベクトルとm個のベクトルとの対応関係を確立するステップと、を有する。
第2の態様の第2の可能な実施方式〜第7の可能な実施方式のうちいずれかの実施方式に関して、第8の可能な実施方式では、本方法は更に、m個のベクトルの大域的ゲインを復号化するステップと、m個のベクトルの大域的ゲインを用いて、m個のベクトルの正規化スペクトル係数を修正して、m個のベクトルのスペクトル係数を取得するステップと、を有する。
第2の態様の第4の可能な実施方式〜第6の可能な実施方式のいずれかの実施方式に関して、第9の可能な実施方式では、本方法は更に、第1の大域的ゲインおよび第2の大域的ゲインを復号化するステップと、第1の大域的ゲインを用いて、m個のベクトルの正規化スペクトル係数のうち第1群のベクトルに対応するスペクトル係数を修正し、第2の大域的ゲインを用いて、m個のベクトルの正規化スペクトル係数のうち第2群のベクトルに対応するスペクトル係数を修正して、m個のベクトルのスペクトル係数を取得するステップと、を有する。
第2の態様の第8の可能な実施方式または第9の可能な実施方式に関して、第10の可能な実施方式では、本方法は更に、k個のサブバンドの量子化スペクトル係数とm個のベクトルのスペクトル係数とを加算して、k個のサブバンドの正規化スペクトル係数を取得するステップと、k個のサブバンドの正規化スペクトル係数のうち値が0であるスペクトル係数に対してノイズ充填を実行し、全てのサブバンドのうちk個のサブバンド以外の別のサブバンドのスペクトル係数を復元して、第1の周波数バンドのスペクトル係数を取得するステップであって、第1の周波数バンドは全てのサブバンドを含む、ステップと、全てのサブバンドのエンベロープを用いて、第1の周波数バンドのスペクトル係数を修正して、第1の周波数バンドの正規化スペクトル係数を取得するステップと、第1の周波数バンドの大域的ゲインを用いて、第1の周波数バンドの正規化スペクトル係数を修正して、第1の周波数バンドの最終的な周波数領域信号を取得するステップと、を有する。
第2の態様の第10の可能な実施方式に関して、第11の可能な実施方式では、k個のサブバンドの量子化スペクトル係数とm個のベクトルのスペクトル係数とを加算してk個のサブバンドの正規化スペクトル係数を取得するステップは、m個のベクトルの正規化スペクトル係数とk個のサブバンドの量子化スペクトル係数との対応関係に従って、m個のベクトルのスペクトル係数とk個のサブバンドの量子化スペクトル係数とを加算するステップ、を有する。
第2の態様の第10の可能な実施方式または第11の可能な実施方式に関して、第12の可能な実施方式では、k個のサブバンドの正規化スペクトル係数のうち値が0であるスペクトル係数に対してノイズ充填を実行するステップは、コア層復号化情報に従って加重値を決定するステップと、加重値を用いて、k個のサブバンドの正規化スペクトル係数のうち値が0であるスペクトル係数に隣接するスペクトル係数とランダムノイズとを加重するステップと、を有する。
第2の態様の第12の可能な実施方式に関して、第13の可能な実施方式では、コア層復号化情報に従って加重値を決定するステップは、コア層復号化情報から信号分類情報を取得するステップと、信号が摩擦信号であると信号分類情報が示す場合、所定の加重値を取得するか、または、信号が摩擦信号以外の別の信号であると信号分類情報が示す場合、コア層復号化情報からピッチ周期を取得し、ピッチ周期に従って加重値を決定するステップと、を有する。
第2の態様の第10の可能な実施方式〜第13の可能な実施方式のうちいずれかの実施方式に関して、第14の可能な実施方式において、全てのサブバンドのうちk個のサブバンド以外の別のサブバンドのスペクトル係数を復元するステップは、全てのサブバンドから、k個のサブバンド以外の別のサブバンドに隣接するn個のサブバンドを選択し、n個のサブバンドのスペクトル係数に従って、k個のサブバンド以外の別のサブバンドのスペクトル係数を復元するステップであって、nは正の整数である、ステップ、または、k個のサブバンドからp個のサブバンドを選択し、p個のサブバンドのスペクトル係数に従って、k個のサブバンド以外の別のサブバンドのスペクトル係数を復元するステップであって、p個のサブバンドの各サブバンドに割り当てられるビット数は第2のビット数閾値以上であり、pは正の整数である、ステップ、を有する。
第2の態様の第1の可能な実施方式〜第14の可能な実施方式のうちいずれかの実施方式に関して、第15の可能な実施方式では、残りのビット数および第2の飽和閾値jに従って2回目の復号化が実行されるべきベクトルの数mを決定するステップは、以下の等式
Figure 0006289627
に従ってmを決定するステップを有する。Cは残りのビット数を表し、Mは、各ベクトルに含まれるスペクトル係数の数を表す。
第2の態様または第2の態様の第1の可能な実施方式〜第15の可能な実施方式のうちいずれかの実施形式に関して、第16の可能な実施方式では、利用可能なビット数および第1の飽和閾値iに従って復号化されるべきサブバンド数kを決定するステップは、以下の等式
Figure 0006289627
に従ってkを決定するステップを有する。Bは利用可能なビット数を表し、Lは、各サブバンドに含まれるスペクトル係数の数を表す。
第2の態様または第2の態様の第1の可能な実施方式〜第16の可能な実施方式のうちいずれかの実施形式に関して、第17の可能な実施方式では、利用可能なビット数および第1の飽和閾値iに従って復号化されるべきサブバンド数kを決定するステップは、信号が過渡信号、摩擦信号またはロングピッチ信号である場合、利用可能なビット数および第1の飽和閾値iに従って、復号化されるべきサブバンド数kを決定するステップ、を有する。
第3の態様によれば、信号符号化装置が提供される。本装置は、利用可能なビット数および第1の飽和閾値iに従って、符号化されるべきサブバンド数kを決定するように構成される決定ユニットであって、iは正の数であり、kは正の整数である、決定ユニットと、決定ユニットによって決定されたサブバンド数kに従って、全てのサブバンドの量子化エンベロープに従って、全てのサブバンドからk個のサブバンドを選択するか、または、心理音響モデルに従って、全てのサブバンドからk個のサブバンドを選択するように構成される選択ユニットと、選択ユニットによって選択されたk個のサブバンドのスペクトル係数に対して、1回目の符号化操作を実行するように構成される符号化ユニットと、を備える。
第3の態様に関して、第1の可能な実施方式では、符号化ユニットは、特に、k個のサブバンドのスペクトル係数を正規化して、k個のサブバンドの正規化スペクトル係数を取得し、k個のサブバンドの正規化スペクトル係数を量子化して、k個のサブバンドの量子化スペクトル係数を取得するように構成される。
第3の態様の第1の可能な実施方式に関して、第2の可能な実施方式では、選択ユニットは更に、1回目の符号化操作の後に利用可能なビット数のうちの残りのビット数が第1のビット数閾値以上である場合、残りのビット数と、第2の飽和閾値jと、k個のサブバンドの量子化スペクトル係数に従って、2回目の符号化が実行されるべきm個のベクトルを決定するように構成される。jは正の数であり、mは正の整数である。符号化ユニットは更に、選択ユニットによって決定されたm個のベクトルのスペクトル係数に対して、2回目の符号化操作を実行するように構成される。
第3の態様の第2の可能な実施方式に関して、第3の可能な実施方式では、選択ユニットは、特に、残りのビット数および第2の飽和閾値jに従って、符号化されるべきベクトル数mを決定するように構成され、k個のサブバンドの量子化スペクトル係数に従って、候補スペクトル係数を決定するように構成され、候補スペクトル係数は、k個のサブバンドの正規化スペクトル係数からk個のサブバンドの対応する量子化スペクトル係数を引くことによって得られるスペクトル係数を含み、候補スペクトル係数が属するベクトルからm個のベクトルを選択するように構成される。
第3の態様の第3の可能な実施方式に関して、第4の可能な実施方式では、選択ユニットは、特に、候補スペクトル係数の属するベクトルをソートして、ソートされたベクトルを取得するように構成され、ソートされたベクトルから最初のm個のベクトルを選択するように構成される。ソートされたベクトルは第1群のベクトルと第2群のベクトルとに分割され、第1群のベクトルは第2群のベクトルの前に配置され、第1群のベクトルは、k個のサブバンドの量子化スペクトル係数の属するベクトルにおいて値が全て0であるベクトルに対応し、第2群のベクトルは、k個のサブバンドの量子化スペクトル係数の属するベクトルにおいて値の全てが0ではないベクトルに対応する。
第3の態様の第3の可能な実施方式に関して、第5の可能な実施方式では、選択ユニットは、特に、候補スペクトル係数の属するベクトルが位置するサブバンドの量子化エンベロープの大きい順に、候補スペクトル係数の属するベクトルからm個のベクトルを選択するように構成される。
第3の態様の第2の可能な実施方式〜第5の可能な実施方式のうちいずれかの実施方式に関して、第6の可能な実施方式では、符号化ユニットは、特に、m個のベクトルのスペクトル係数の大域的ゲインを決定し、m個のベクトルのスペクトル係数の大域的ゲインを用いて、m個のベクトルのスペクトル係数を正規化し、m個のベクトルの正規化スペクトル係数を量子化するように構成される。
第3の態様の第4の可能な実施方式に関して、第7の可能な実施方式では、符号化ユニットは、特に、第1群のベクトルのスペクトル係数の大域的ゲインと、第2群のベクトルのスペクトル係数の大域的ゲインとを決定し、第1群のベクトルのスペクトル係数の大域的ゲインを用いて、m個のベクトルのうち第1群のベクトルに属するベクトルのスペクトル係数を正規化し、第2群のベクトルのスペクトル係数の大域的ゲインを用いて、m個のベクトルのうち第2群のベクトルに属するベクトルのスペクトル係数を正規化し、m個のベクトルの正規化スペクトル係数を量子化するように構成される。
第3の態様の第3の可能な実施方式〜第7の可能な実施方式のうちいずれかの実施方式に関して、第8の可能な実施方式では、選択ユニットは、特に、以下の等式
Figure 0006289627
に従ってmを決定するように構成される。Cは残りのビット数を表し、Mは、各ベクトルに含まれるスペクトル係数の数を表す。
第3の態様または第3の態様の第1の可能な実施方式〜第8の可能な実施方式のうちいずれかの実施形式に関して、第9の可能な実施方式では、決定ユニットは、特に、以下の等式
Figure 0006289627
に従ってkを決定するように構成される。Bは利用可能なビット数を表し、Lは、各サブバンドに含まれるスペクトル係数の数を表す。
第3の態様または第3の態様の第1の可能な実施方式〜第9の可能な実施方式のうちいずれかの実施形式に関して、第10の可能な実施方式では、決定ユニットは、特に、信号が過渡信号、摩擦信号またはロングピッチ信号である場合、利用可能なビット数および第1の飽和閾値iに従って、符号化されるべきサブバンド数kを決定するように構成される。
第4の態様によれば、信号復号化装置が提供される。本装置は、利用可能なビット数および第1の飽和閾値iに従って、復号化されるべきサブバンド数kを決定するように構成される決定ユニットであって、iは正の数であり、kは正の整数である、決定ユニットと、決定ユニットによって決定されたサブバンド数kに従い、全てのサブバンドの復号化されたエンベロープに従って、全てのサブバンドからからk個のサブバンドを選択するか、または、心理音響モデルに従って、全てのサブバンドからk個のサブバンドを選択するように構成される選択ユニットと、1回目の復号化操作を実行して、選択ユニットによって選択されたk個のサブバンドの量子化スペクトル係数を取得するように構成される復号化ユニットと、を備える。
第4の態様に関して、第1の可能な実施方式では、第1の決定ユニットは更に、1回目の復号化操作の後に利用可能なビット数のうちの残りのビット数が第1のビット数閾値以上である場合、残りのビット数と、第2の飽和閾値jと、第1群の復号化されたスペクトル係数とに従って、2回目の復号化が実行されるべきベクトルの数mを決定するように構成される。jは正の数であり、mは正の整数である。復号化ユニットは更に、2回目の復号化操作を実行して、m個のベクトルの正規化スペクトル係数を取得するように構成される。
第4の態様の第1の可能な実施方式に関して、第2の可能な実施方式では、本装置は更に、m個のベクトルの正規化スペクトル係数とk個のサブバンドの量子化スペクトル係数との対応関係を決定するように構成される第2の決定ユニット、を備える。
第4の態様の第2の可能な実施方式に関して、第3の可能な実施方式では、第2の決定ユニットは、特に、m個のベクトルとk個のサブバンドの量子化スペクトル係数の属するベクトルのうちの第1のタイプのベクトルとの対応関係を決定するように構成される。m個のベクトルは、第1のタイプのベクトルと1対1の対応関係にある。
第4の態様の第3の可能な実施方式に関して、第4の可能な実施方式では、第2の決定ユニットは、特に、k個のサブバンドの量子化スペクトル係数の属するベクトルをソートして、ソートされたベクトルを取得するように構成され、ソートされたベクトルは第1群のベクトルと第2群のベクトルとに分割され、第1群のベクトルは第2群のベクトルの前に配置され、第1群のベクトルは、第1群の復号化されたスペクトル係数の属するベクトルにおいて値が全て0であるベクトルを含み、第2群のベクトルは、第1群の復号化されたスペクトル係数の属するベクトルにおいて値の全てが0ではないベクトルを含み、また、ソートされたベクトルから最初のm個のベクトルを、第1のタイプのベクトルとして選択するように構成され、第1のタイプのベクトルとm個のベクトルとの対応関係を確立するように構成される。
第4の態様の第3の可能な実施方式に関して、第5の可能な実施方式では、第2の決定ユニットは、特に、k個のサブバンドの量子化スペクトル係数の属するベクトルが位置するサブバンドの量子化エンベロープの大きい順に、k個のサブバンドの量子化スペクトル係数の属するベクトルから、m個のベクトルを第1のタイプのベクトルとして選択し、第1のタイプのベクトルとm個のベクトルとの対応関係を確立するように構成される。
第4の態様の第1の可能な実施方式〜第5の可能な実施方式のうちいずれかの実施方式に関して、第6の可能な実施方式では、本装置は更に修正ユニットを備える。復号化ユニットは更に、m個のベクトルの大域的ゲインを復号化するように構成される。修正ユニットは、m個のベクトルの大域的ゲインを用いて、m個のベクトルの正規化スペクトル係数を修正して、m個のベクトルのスペクトル係数を取得するように構成される。
第4の態様の第4の可能な実施方式に関して、第7の可能な実施方式では、本装置は更に修正ユニットを備える。復号化ユニットは更に、第1の大域的ゲインおよび第2の大域的ゲインを復号化するように構成される。修正ユニットは、第1の大域的ゲインを用いて、m個のベクトルの正規化スペクトル係数のうち第1群のベクトルに対応するスペクトル係数を修正し、第2の大域的ゲインを用いて、m個のベクトルの正規化スペクトル係数のうち第2群のベクトルに対応するスペクトル係数を修正して、m個のベクトルのスペクトル係数を取得するように構成される。
第4の態様の第6の可能な実施方式または第7の可能な実施方式に関して、第8の可能な実施方式では、本装置は更に、加算ユニットおよび復元ユニットを備える。加算ユニットは、k個のサブバンドの量子化スペクトル係数とm個のベクトルのスペクトル係数とを加算して、k個のサブバンドのスペクトル係数を取得するように構成される。復元ユニットは、k個のサブバンドの正規化スペクトル係数のうち値が0であるスペクトル係数に対してノイズ充填を実行し、全てのサブバンドのうちk個のサブバンド以外の別のサブバンドのスペクトル係数を復元して、第1の周波数バンドのスペクトル係数を取得するように構成される。第1の周波数バンドは、全てのサブバンドを含む。修正ユニットは更に、全てのサブバンドのエンベロープを用いて、第1の周波数バンドのスペクトル係数を修正して、第1の周波数バンドの正規化スペクトル係数を取得するように構成される。修正ユニットは更に、第1の周波数バンドの大域的ゲインを用いて、第1の周波数バンドの正規化スペクトル係数を修正して、第1の周波数バンドの最終的な周波数領域信号を取得するように構成される。
第4の態様の第8の可能な実施方式に関して、第9の可能な実施方式では、加算ユニットは、特に、m個のベクトルの正規化スペクトル係数とk個のサブバンドの量子化スペクトル係数との対応関係に従って、m個のベクトルのスペクトル係数とk個のサブバンドの量子化スペクトル係数とを加算するように構成される。
第4の態様の第8の可能な実施方式または第9の可能な実施方式に関して、第10の可能な実施方式では、復元ユニットは、特に、コア層復号化情報に従って加重値を決定し、加重値を用いて、k個のサブバンドの正規化スペクトル係数のうち値が0であるスペクトル係数に隣接するスペクトル係数とランダムノイズとを加重するように構成される。
第4の態様の第10の可能な実施方式に関して、第11の可能な実施方式では、復元ユニットは、特に、コア層復号化情報から信号分類情報を取得し、信号が摩擦信号であると信号分類情報が示す場合、所定の加重値を取得するか、または、信号が摩擦信号以外の別の信号であると信号分類情報が示す場合、コア層復号化情報からピッチ周期を取得し、ピッチ周期に従って加重値を決定するように構成される。
第4の態様の第8の可能な実施方式〜第11の可能な実施方式のうちいずれかの実施方式に関して、第12の可能な実施方式では、復元ユニットは、特に、全てのサブバンドから、k個のサブバンド以外の別のサブバンドに隣接するn個のサブバンドを選択し、n個のサブバンドのスペクトル係数に従って、k個のサブバンド以外の別のサブバンドのスペクトル係数を復元ように構成され、nは正の整数であり、または、k個のサブバンドからp個のサブバンドを選択し、p個のサブバンドのスペクトル係数に従って、k個のサブバンド以外の別のサブバンドのスペクトル係数を復元するように構成され、p個のサブバンドの各サブバンドに割り当てられるビット数は第2のビット数閾値以上であり、pは正の整数である。
第4の態様の第1の可能な実施方式〜第12の可能な実施方式のうちいずれかの実施方式に関して、第13の可能な実施方式では、第1の決定ユニットは、特に、以下の等式
Figure 0006289627
に従ってmを決定するように構成される。Cは残りのビット数を表し、Mは、各ベクトルに含まれるスペクトル係数の数を表す。
第4の態様または第4の態様の第1の可能な実施方式〜第13の可能な実施方式のうちいずれかの実施形式に関して、第14の可能な実施方式では、第1の決定ユニットは、特に、以下の等式
Figure 0006289627
に従ってkを決定するように構成される。Bは利用可能なビット数を表し、Lは、各サブバンドに含まれるスペクトル係数の数を表す。
第4の態様または第4の態様の第1の可能な実施方式〜第14の可能な実施方式のうちいずれかの実施形式に関して、第15の可能な実施方式では、第1の決定ユニットは、特に、信号が過渡信号、摩擦信号またはロングピッチ信号である場合、利用可能なビット数および第1の飽和閾値iに従って、復号化されるべきサブバンド数kを決定するように構成される。
本発明の実施形態では、利用可能なビット数および第1の飽和閾値に従って符号化されるべきサブバンド数kが決定され、周波数バンド全体ではなく、全てのサブバンドから選択されたk個のサブバンドに対して符号化が実行される。よって、復号化によって得られる信号のスペクトルホールを低減でき、したがって、出力信号の聴覚品質を改善できる。
本発明の実施形態における技術的構成をより明確に説明するために、以下、本発明の実施形態を説明する際に必要な添付の図面を簡単に紹介する。当然ながら、以下の説明において、添付の図面は本発明の実施形態の一部を示すに過ぎない。当業者であれば、これらの添付の図面から創意工夫なく他の図面を更に導出できるであろう。
本発明の実施形態に係る信号符号化方法の概略フローチャートである。 本発明の別の実施形態に係る信号復号化方法の概略フローチャートである。 本発明の実施形態に係る信号符号化方法のプロセスの概略フローチャートである。 本発明の実施形態に係る、2回目の符号化が実行されるべきベクトルを決定するプロセスの概略図である。 本発明の実施形態に係る信号符号化装置の概略ブロック図である。 本発明の実施形態に係る信号復号化装置の概略ブロック図である。 本発明の別の実施形態に係る信号符号化装置の概略ブロック図である。 本発明の別の実施形態に係る信号復号化装置の概略ブロック図である。
以下、本発明の実施形態において添付の図面を参照して、本発明の実施形態における技術的構成を明確かつ完全に説明する。当然ながら、記載の実施形態は本発明の実施形態の一部であって全部ではない。当業者が本発明の実施形態に基づいて創意工夫なく得た他の実施形態は全て、本発明の保護範囲に包含されるものとする。
符号化技術および復号化技術は、様々な電子デバイス、例えば携帯電話、無線装置、パーソナルデータアシスタント(Personal Data Assistant、PDA)、ハンドヘルドまたはポータブルのコンピューター、全地球測位システム(Global Positioning System、GPS)受信器/ナビゲーター、カメラ、オーディオ/ビデオプレーヤー、ビデオカメラ、ビデオレコーダー、監視装置等に幅広く適用される。一般に、このタイプの電子デバイスは音響符号器または音響復号器を有する。音響符号器または復号器は、デジタル回路またはチップ、例えばデジタル信号プロセッサ(Digital Signal Processor、DSP)チップによって直接的に実現されてよく、或いは、ソフトウェアコードのプロセスを実行するようにプロセッサを駆動するソフトウェアコードによって実現されてよい。
図1は、本発明の実施形態に係る信号符号化方法の概略フローチャートである。図1の方法は、例えば音声符号器や音響符号器のような符号端によって実行される。本発明の本実施形態において、信号は音声信号または音響信号を意味し得る。
符号化プロセスにおいて、符号端はまず、時間領域信号を周波数領域信号に変換してよい。例えば、高速フーリエ変換(Fast Fourier Transform、FFT)アルゴリズムや変形離散コサイン変換(Modified Discrete Cosine Transform、MDCT)アルゴリズム等のアルゴリズムを用いて、時間‐周波数変換が実行されてよい。続いて、符号端は、大域的ゲインを用いて周波数領域信号のスペクトル係数を正規化し、正規化スペクトル係数を分割してサブバンドを取得してよい。
110.利用可能なビット数および第1の飽和閾値iに従って、符号化されるべきサブバンド数kを決定する。iは正の数であり、kは正の整数である。
利用可能なビット数は、符号化に用いることのできる総ビット数を意味し得る。
第1の飽和閾値iは予め決定されてよい。例えば、第1の飽和閾値iは、以下の原理に基づいて決定されてよい。すなわち、サブバンドの各スペクトル係数に割り当てられる平均ビット数が第1の飽和閾値i以上である場合、該サブバンドに割り当てられたビットが飽和に達するとみなされてよい。各スペクトル係数に割り当てられる平均ビット数は、サブバンドに割り当てられるビット数とサブバンドのスペクトル係数の数との比であってよい。サブバンドに割り当てられるビットが飽和に達するとは、より多くのビットがサブバンドに割り当てられたとしても、サブバンドのパフォーマンスが明らかには改善されないことを意味し得る。第1の飽和閾値iは正の数であってよい。一般に、i≧1.5である。
更に、第1の飽和閾値iおよびスペクトル係数の数を用いて利用可能なビット数の閾値が決定され、符号化されるべきサブバンド数kが更に決定されてもよい。例えば、i=2であり、総サブバンド数が4であり、スペクトル係数の数が64である2つのサブバンドがあり、スペクトル係数の数が72である2つのサブバンドがあると予め設定する。この場合、3つのサブバンドに含まれるスペクトル係数の最小数は、64+64+72=200である。したがって、利用可能なビット数の閾値は、200×2=400に設定されてよい。利用可能なビット数>400であるとき、kは4である。利用可能なビット数≦400であるとき、kは3である。
120.全てのサブバンドの量子化エンベロープに従って、全てのサブバンドからk個のサブバンドを選択するか、または、心理音響モデルに従って、全てのサブバンドからk個のサブバンドを選択する。
例えば、符号端は、全てのサブバンドの量子化エンベロープの大きい順に、全てのサブバンドからk個のサブバンドを選択してよい。或いは、符号端は、心理音響モデルに従ってサブバンドの重要度を決定してよく、サブバンドの重要度の大きい順にk個のサブバンドを選択してよい。
130.k個のサブバンドのスペクトル係数に対して、1回目の符号化操作を実行する。
当然のことながら、1回目の符号化は、ここでは、符号化プロセスにおいて符号端によりスペクトル係数に対して実行される1回目の符号化操作を意味し得る。本発明の本実施形態では、符号化操作は、正規化、量子化、ビットストリーム書込み等の操作を含んでよい。
従来技術では、符号端は周波数バンド全体にビットを割り当ててから、周波数バンド全体を符号化する。よって、周波数スペクトル全体に多くのホールが生じてしまう。本発明の本実施形態では、符号端はまず、利用可能なビット数および第1の飽和閾値に従って、符号化されるべきサブバンド数kを決定し、それから全てのサブバンドからk個のサブバンドを選択し、符号化を実行する。k個のサブバンド以外の残りのサブバンドにはビットを割り当てない。したがって、これらの残りのサブバンドは符号化されない。このように、k個のサブバンドをより良好に符号化することができ、復号端では、復号化によって得られる信号のスペクトルホールを低減することができ、こうして、出力信号の品質が改善される。したがって、本発明の本実施形態は、信号の聴覚品質を改善することができる。
本発明の本実施形態では、利用可能なビット数および第1の飽和閾値に従って符号化されるべきサブバンド数kが決定され、周波数バンド全体ではなく、全てのサブバンドから選択されたk個のサブバンドに対して符号化が実行される。よって、復号化によって得られる信号のスペクトルホールを低減でき、したがって、出力信号の聴覚品質を改善できる。
本発明の本実施形態は、過渡信号、摩擦信号、ロングピッチ信号等の様々なタイプの音声信号や音響信号に適用可能である。
任意に、実施形態として、信号が過渡信号、摩擦信号またはロングピッチ信号である場合、符号端は、利用可能なビット数および第1の飽和閾値iに従って、符号化されるべきサブバンド数kを決定してよい。
具体的には、符号端は、入力信号が過渡信号、摩擦信号またはロングピッチ信号であるか否かを決定してよい。入力信号が過渡信号、摩擦信号またはロングピッチ信号である場合、図1の方法が実行されてよい。このように、過渡信号、摩擦信号またはロングピッチ信号の符号化品質を改善することができる。
任意に、別の実施形態として、ステップ110において、符号端は、等式(1)、
Figure 0006289627
に従ってサブバンド数kを決定してよい。Bは利用可能なビット数を表してよく、Lはサブバンドのスペクトル係数の数を表してよい。
任意に、別の実施形態として、ステップ130において、符号端は、k個のサブバンドのスペクトル係数を正規化して、k個のサブバンドの正規化スペクトル係数を取得し、k個のサブバンドの正規化スペクトル係数を量子化して、k個のサブバンドの量子化スペクトル係数を取得してよい。
ステップ130において、符号化操作は、スペクトル係数に対する正規化操作および量子化操作を含んでよい。例えば、符号端は、従来技術のプロセスに従って、k個のサブバンドのスペクトル係数を正規化してよい。k個のサブバンドのスペクトル係数を正規化した後、符号端は、k個のサブバンドの正規化スペクトル係数を量子化してよい。例えば、符号端は、代数ベクトル量子化(Algebraic Vector Quantization、AVQ)アルゴリズムや球状ベクトル量子化(Spherical Vector Quantization,、SVQ)アルゴリズム等の一部の格子ベクトル量子化(Lattice Vector Quantization、LVQ)アルゴリズムを用いて、k個のサブバンドの正規化スペクトル係数を量子化してよい。これらのベクトル量子化アルゴリズムには、以下の特徴がある。すなわち、量子化されるベクトルの各群に割り当てられるビット数が決定された後、各ベクトル群に割り当てられるビット数は残りのビット数に従って調整されなくなり、各ベクトル群にビットを割り当てるプロセスは、比較的非依存的になる。割り当てられるビット数は、ベクトル群の値のみに従って決定され、閉ループビット割当ては全てのベクトルに対しては実行されない。
更に、符号化操作は更にビットストリーム書込み操作を含む。例えば、k個のサブバンドのスペクトル係数を正規化および量子化した後、符号端は、k個のサブバンドの量子化スペクトル係数のインデックスをビットストリームに書き込んでよい。ビットストリーム書込み操作は、k個のサブバンドが量子化された後に実行されてよく、或いは、後述する2回目の符号化操作の後に実行されてよく、本発明の本実施形態では限定されない。
任意に、別の実施形態として、ステップ130の後、1回目の符号化の後に利用可能なビット数のうちの残りのビット数が第1のビット数閾値以上である場合、符号端は、残りのビット数と、第2の飽和閾値jと、k個のサブバンドの量子化スペクトル係数に従って、2回目の符号化が実行されるべきm個のベクトルを決定してよい。jは正の数であり、mは正の整数である。そして、符号端は、m個のベクトルのスペクトル係数に対して2回目の符号化操作を実行してよい。
ステップ130において、符号端は、k個のサブバンドのスペクトル係数に対して1回目の符号化操作を実行する。1回目の符号化操作の後、まだ残りのビット数がある可能性がある。符号端は、残りのビット数を第1のビット数閾値と比較してよい。残りのビット数が第1のビット数閾値以上である場合、符号端は更に、残りのビット数を用いて2回目の符号化操作を実行してよい。第1のビット数閾値および第2の飽和閾値jは、両方とも予め設定されてよい。第2の飽和閾値jは第1の飽和閾値iと等しくても等しくなくてもよく、第2の飽和閾値jおよび第1の飽和閾値iは両方とも、同じ原理に基づいて決定されてよい。すなわち、第2の飽和閾値jを決定する原理は以下のようなものであってよい。すなわち、ベクトルの各スペクトル係数に割り当てられる平均ビット数が第2の飽和閾値j以上であるとき、ベクトルに割り当てられるビットが飽和に達するとみなされてよい。一般に、j≧1.5である。
本実施形態では、1回目の符号化操作の後の残りのビット数が第1のビット数閾値以上である場合、残りのビット数と、第2の飽和閾値jと、k個のサブバンドの量子化スペクトル係数に従って、2回目の符号化が実行されるm個のベクトルが決定され、m個のベクトルのスペクトル係数に対して、2回目の符号化操作が実行される。したがって、残りのビット数を完全に利用することができ、信号の符号化品質を更に改善することができる。
任意に、別の実施形態として、符号端は、残りのビット数および第2の飽和閾値jに従って、符号化されるべきベクトル数mを決定してよい。符号端は、k個のサブバンドの量子化スペクトル係数に従って、候補スペクトル係数を決定し、候補スペクトル係数が属するベクトルからm個のベクトルを選択してよい。候補スペクトル係数は、k個のサブバンドの正規化スペクトル係数からk個のサブバンドの対応する量子化スペクトル係数を引くことによって得られるスペクトル係数を含んでよい。
k個のサブバンドの正規化スペクトル係数は、k個のサブバンドの量子化スペクトル係数と1対1の対応関係にある。したがって、減算操作が実行されるとき、1対1の対応関係の方式で、k個のサブバンドの正規化スペクトル係数からk個のサブバンドの量子化スペクトル係数が引かれる。例えば、k個のサブバンドに5個の正規化スペクトル係数があると仮定すると、ステップ130において、符号端は、5個のスペクトル係数を正規化して、5個の正規化スペクトル係数を取得してよい。続いて、符号端は、5個の正規化スペクトル係数を量子化して、5個の量子化スペクトル係数を取得してよい。符号端は、5個の正規化スペクトル係数から、それぞれ5個の正規化スペクトル係数に対応する量子化スペクトル係数を引いてよい。例えば、符号端は、第1の正規化スペクトル係数から第1の量子化スペクトル係数を引いて、新しいスペクトル係数を取得してよい。同様に、符号端は、5個の新しいスペクトル係数を取得してよい。5個の新しいスペクトル係数は、候補スペクトル係数である。
任意に、別の実施形態として、符号端は、等式(2)、
Figure 0006289627
に従ってベクトル数mを決定してよい。Cは残りのビット数を表してよく、Mは各ベクトルに含まれるスペクトル係数の数を表してよい。
任意に、別の実施形態として、符号端は、候補スペクトル係数の属するベクトルをソートして、ソートされたベクトルを取得してよい。符号端は、ソートされたベクトルから最初のm個のベクトルを選択してよい。ソートされたベクトルは、第1群のベクトルと第2群のベクトルとに分割されてよい。第1群のベクトルは、第2群のベクトルの前に配置される。第1群のベクトルは、k個のサブバンドの量子化スペクトル係数の属するベクトルにおいて値が全て0であるベクトルに対応し、第2群のベクトルは、k個のサブバンドの量子化スペクトル係数の属するベクトルにおいて値の全てが0ではないベクトルに対応する。
上記の説明から、k個のサブバンドの正規化スペクトル係数からk個のサブバンドの量子化スペクトル係数を引くことにより、候補スペクトル係数が取得されることが分かるであろう。したがって、候補スペクトル係数の属するベクトルは、正規化スペクトル係数の属するベクトルから量子化スペクトル係数の属するベクトルを引くことによって取得されるものと解釈されてもよい。k個のサブバンドの量子化スペクトル係数の属するベクトルには、値が全て0であるベクトルが存在する可能性があり、値が全て0であるベクトルは、全て0であるスペクトル係数を含むベクトルを意味し得る。符号端は、候補スペクトル係数の属するベクトルをソートして、ソートされたベクトルを取得してよい。ソートされたベクトルにおいて、k個のサブバンドの正規化スペクトル係数が属するベクトルのうち値が全て0であるベクトルからk個のサブバンドの量子化スペクトル係数の属するベクトルのうち値が全て0であるベクトルを引くことによって得られるベクトルは、第1群のベクトルとして分類されてよく、k個のサブバンドの正規化スペクトル係数が属するベクトルのうち値の全てが0ではないベクトルからk個のサブバンドの量子化スペクトル係数が属するベクトルのうち値の全てが0ではないベクトルを引くことによって得られるベクトルは、第2群のベクトルとして分類されてよい。
第1群のベクトルは、第2群のベクトルの前に配置されてよい。したがって、符号端は、第1群のベクトルを始点として最初のm個のベクトルを選択してよい。例えば、mが5であると仮定する。第1群のベクトルに4個のベクトルがある場合、符号端は、第1群のベクトルから該4個のベクトルを選択してから、第2群のベクトルから1個のベクトルを選択してよい。第1群のベクトルに7個のベクトルがある場合、符号端は、第1群のベクトルから最初の5個のベクトルを選択してよい。すなわち、2回目の符号化が実行されるべきm個のベクトルが選択されるとき、第1群のベクトルの優先度は第2群のベクトルの優先度よりも高い。
任意に、別の実施形態として、第1群のベクトルおよび第2群のベクトルの各ベクトル群において、異なるサブバンドのベクトルは、ベクトルの位置するサブバンドの周波数の低い順に配列されてよい。同じサブバンドのベクトルは、ベクトルの元の順序で配列されてよい。
ベクトルの元の順序は、該ベクトルの属するサブバンドにおけるベクトルの元の順序を意味し得る。例えば、第1群のベクトルに、ベクトル0、ベクトル1、ベクトル2、ベクトル3、ベクトル4と付番された5個のベクトルがあると仮定する。ベクトル1およびベクトル2はサブバンド0に属し、ベクトル0およびベクトル3はサブバンド1に属し、ベクトル4はサブバンド2に属する。サブバンド0において、ベクトルの元の順序は、ベクトル1がベクトル2の前に配置されるというものである。サブバンド1において、ベクトルの元の順序は、ベクトル0がベクトル3の前に配置されるというものである。3個のサブバンドにおいて、サブバンド0の周波数が最も低く、サブバンド2の周波数が最も高く、サブバンド1の周波数は、サブバンド0の周波数とサブバンド2の周波数との間である。そして、第1群のベクトルの5個のベクトルは、以下の方式でソートされてよい。第1に、異なるサブバンドに属するベクトルが、サブバンドの周波数の低い順にソートされる。すなわち、サブバンド0に属するベクトルが最高位に配置され、サブバンド1に属するベクトルが中間に配置され、サブバンド2に属するベクトルが最下位に配置される。そして、同じサブバンドに属するベクトルは、ベクトルの元の順序でソートされてよい。このように、第1群のベクトルの5個のベクトルは、ベクトル1、ベクトル2、ベクトル0、ベクトル3、ベクトル4の順序でソートされてよい。第2群のベクトルのベクトルは、第1群のベクトルのベクトルがソートされるのと同様の方式でソートされるので、詳細の説明は省略する。
任意に、別の実施形態として、第1群のベクトルおよび第2群のベクトルの各ベクトル群において、異なるサブバンドのベクトルは、ベクトルが位置するサブバンドの量子化エンベロープの大きい順に配列され、同じサブバンドのベクトルは、ベクトルの元の順序で配列される。
本実施形態では、異なるサブバンドのベクトルは、サブバンドの量子化エンベロープの順序にソートされる。同じサブバンドのベクトルは、ベクトルの元の順序のままでソートされる。例えば、第1群のベクトルに、ベクトル0、ベクトル1、ベクトル2、ベクトル3、ベクトル4と付番された5個のベクトルがあると仮定する。ベクトル1およびベクトル2はサブバンド0に属し、ベクトル0およびベクトル3はサブバンド1に属し、ベクトル4はサブバンド2に属する。サブバンド0において、ベクトルの元の順序は、ベクトル1がベクトル2の前に配置されるというものである。サブバンド1において、ベクトルの元の順序は、ベクトル0がベクトル3の前に配置されるというものである。3個のサブバンドにおいて、サブバンド2の量子化エンベロープが最小であり、サブバンド1の量子化エンベロープが最大であり、サブバンド0の量子化エンベロープは、サブバンド2の量子化エンベロープとサブバンド1の量子化エンベロープとの間である。このように、第1群のベクトルの5個のベクトルは、ベクトル0、ベクトル3、ベクトル1、ベクトル2、ベクトル4の順序にソートされてよい。
任意に、別の実施形態として、符号端は、候補スペクトル係数の属するベクトルが位置するサブバンドの量子化エンベロープの大きい順に、候補スペクトル係数の属するベクトルからm個のベクトルを選択してよい。
本実施形態では、符号端は、もはや候補スペクトル係数の属するベクトルをグループ化しなくてよく、サブバンドの量子化エンベロープの大きい順に、m個のベクトルを直接選択してよい。例えば、ベクトル0、ベクトル1、ベクトル2、ベクトル3と付番された4個のベクトルがあると仮定する。4個のベクトルは、4個のサブバンドすなわちサブバンド0、サブバンド1、サブバンド2、サブバンド3に属する。サブバンドの量子化エンベロープの大きい順が、サブバンド2>サブバンド1>サブバンド3>サブバンド0であると仮定する。3個のベクトルが2回目の符号化のために選択されるとき、サブバンドの量子化エンベロープの大きい順にベクトル2、ベクトル1およびベクトル3が選択される。
複数のベクトルが同じサブバンドに属する場合、サブバンドにおける該複数のベクトルの元の順序で選択が行われてよい。或いは、サブバンドの複数のベクトルについて、値が全て0であるベクトルが最初に選択されてから、値の全てが0ではないベクトルが選択されてよい。例えば、ベクトル0〜ベクトル4と付番された5個のベクトルがあると仮定する。ベクトル0はサブバンド0に属し、ベクトル1〜ベクトル3がサブバンド1に属し、ベクトル4がサブバンド2に属する。サブバンドの量子化エンベロープの大きい順が、サブバンド2>サブバンド1>サブバンド0であると仮定する。3個のベクトルが2回目の符号化のために選択されるとき、サブバンドの量子化エンベロープの大きい順に、ベクトル4が最初に選択され、それから、サブバンド1のベクトル1〜ベクトル3から残りの2個のベクトルが選択される必要がある。このとき、残りの2個のベクトルは、サブバンド1におけるベクトル1〜ベクトル3の元の順序で選択されてよい。或いは、ベクトル1〜ベクトル3の中で値が全て0であるベクトルが優先的に選択されてから、値の全てが0ではないベクトルが選択されてよい。
m個のベクトルのスペクトル係数に対して2回目の符号化を実行するとき、符号端は、まずm個のベクトルのスペクトル係数を正規化してから、m個のベクトルの正規化スペクトル係数を量子化してよい。例えば、符号端は、AVQアルゴリズムやSVQアルゴリズム等の、1回目の符号化が実行されるときに用いられるベクトル量子化アルゴリズムを用いて、m個のベクトルの正規化スペクトル係数を量子化してよい。m個のベクトルの量子化スペクトル係数が取得された後、符号端は、m個のベクトルの量子化スペクトル係数に対してビットストリーム書込み操作を実行してよい。
m個のベクトルのスペクトル係数を正規化するとき、符号端は、異なる大域的ゲインを用いて、m個のベクトルのスペクトル係数を正規化してよい。
任意に、別の実施形態として、符号端は、m個のベクトルのスペクトル係数の大域的ゲインを決定し、m個のベクトルのスペクトル係数の大域的ゲインを用いて、m個のベクトルのスペクトル係数を正規化してよく、それから、m個のベクトルの正規化スペクトル係数を量子化してよい。
任意に、別の実施形態として、符号端は、第1群のベクトルのスペクトル係数の大域的ゲインと、第2群のベクトルのスペクトル係数の大域的ゲインとを決定してよい。符号端は、第1群のベクトルのスペクトル係数の大域的ゲインを用いて、m個のベクトルのうち第1群のベクトルに属するベクトルのスペクトル係数を正規化し、第2群のベクトルのスペクトル係数の大域的ゲインを用いて、m個のベクトルのうち第2群のベクトルに属するベクトルのスペクトル係数を正規化してよい。そして、符号端は、m個のベクトルの正規化スペクトル係数を量子化してよい。
例えば、符号端は、2個の群のベクトルのそれぞれの大域的ゲインを用いて、2個の群のベクトルから選択されるベクトルを正規化してもよい。
符号端により信号を符号化するプロセスを説明した。復号化は、符号化の逆のプロセスである。図2は、本発明の別の実施形態に係る信号復号化方法の概略フローチャートである。図2の方法は、復号端、例えば音声復号器や音響復号器によって実行される。
復号化プロセスにおいて、復号端は、符号端から受信されるビットストリームを復号化してよい。例えば、復号端は、コア層(Core)復号化を実行して低周波数バンド情報を取得してよく、高周波数バンドのサブバンドのエンベロープおよび大域的ゲインを復号化してよい。続いて復号端は、復号化によって得られる上記の情報を用いて、高周波数バンドのスペクトル係数に対して復号化操作および復元操作を実行してよい。
210.利用可能なビット数および第1の飽和閾値iに従って、復号化されるべきサブバンド数kを決定する。iは正の数であり、kは正の整数である。
ステップ210は図1のステップ110と同様であり、ここでは説明を省略する。第1の飽和閾値iは予め決定されてよい。したがって、符号端および復号端は、同じ第1の飽和閾値iを用いてよい。
220.全てのサブバンドの復号化されたエンベロープに従って、全てのサブバンドからk個のサブバンドを選択するか、または、心理音響モデルに従って、全てのサブバンドからk個のサブバンドを選択する。
例えば、復号端は、全てのサブバンドの復号化エンベロープの大きい順に、全てのサブバンドからk個のサブバンドを選択してよい。或いは、復号端は、心理音響モデルに従ってサブバンドの重要度を決定してよく、サブバンドの重要度の大きい順にk個のサブバンドを選択してよい。
230.1回目の復号化操作を実行して、k個のサブバンドの量子化スペクトル係数を取得する。
符号端の場合と同様に、1回目の復号化操作は、復号化プロセスにおいて復号端によりスペクトル係数に対して実行される1回目の復号化操作を意味し得る。1回目の復号化操作は、脱量子化等の操作を含んでよい。復号化操作の具体的なプロセスについては、従来技術を参照されたい。例えば、復号端は、受信されたビットストリームに対して1回目の復号化操作を実行してよい。例えば、復号端は、受信されたビットストリームに基づいて、AVQアルゴリズムやSVQアルゴリズム等の、符号端がk個のサブバンドの正規化スペクトル係数を量子化する際に用いられるベクトル量子化アルゴリズムを用いて、1回目の脱量子化操作を実行して、k個のサブバンドの量子化スペクトル係数を取得してよい。
スペクトル係数を符号化するとき、符号端はまず、利用可能なビット数および第1の飽和閾値に従って、符号化されるべきサブバンド数kを決定してから、全てのサブバンドからk個のサブバンドを選択する。復号化プロセスは符号化プロセスの逆のプロセスであるので、スペクトル係数を復号化するとき、復号端はまず、利用可能なビット数および第1の飽和閾値に従って、復号化されるべきサブバンド数kを決定してから、全てのサブバンドから復号化のためのk個のサブバンドを選択してよい。したがって、復号化によって得られる信号の品質を改善することができ、出力信号の聴覚品質を更に改善することができる。
本発明の本実施形態では、利用可能なビット数および第1の飽和閾値に従って復号化されるべきサブバンド数kが決定され、全てのサブバンドから選択されたk個のサブバンドに対して復号化が実行される。よって、復号化によって得られる信号のスペクトルホールを低減でき、したがって、出力信号の聴覚品質を改善できる。
本発明の本実施形態は、過渡信号、摩擦信号、ロングピッチ信号等の様々なタイプの音声信号や音響信号に適用可能である。
任意に、一実施形態として、信号が過渡信号、摩擦信号またはロングピッチ信号である場合、復号端は、利用可能なビット数および第1の飽和閾値iに従って、復号化されるべきサブバンド数kを決定してよい。
具体的には、復号端は、復号化される信号のタイプまたは復号化によって得られる低周波数バンド情報から抽出される信号のタイプに従って、復号化される信号が過渡信号、摩擦信号またはロングピッチ信号であるか否かを決定してよい。復号化される信号が過渡信号、摩擦信号またはロングピッチ信号である場合、図2の方法が実行されてよい。このように、過渡信号、摩擦信号またはロングピッチ信号の品質を改善することができる。
任意に、別の実施形態として、ステップ210において、復号端もまた、等式(1)に従ってサブバンド数kを決定してよい。
任意に、別の実施形態として、ステップ230の後、1回目の復号化操作の後に利用可能なビット数のうちの残りのビット数が第1のビット数閾値以上である場合、復号端は、残りのビット数および第2の飽和閾値jに従って、2回目の復号化が実行されるべきベクトルの数mを決定してよい。jは正の数であり、mは正の整数である。そして、復号端は、2回目の復号化操作を実行して、m個のベクトルの正規化スペクトル係数を取得してよい。
符号端は、1回目の符号化操作の後に2回目の符号化操作を実行した可能性がある。したがって、復号端は、同じ決定方式で、2回目の復号化操作が実行される必要があるか否かを決定してよい。第2の飽和閾値jも予め決定されてよい。したがって、復号端および符号端は、同じ第2の飽和閾値jを用いてよい。第2の飽和閾値jを決定する原理については、図1の実施形態の説明を参照されたい。ここでは詳細の説明を省略する。
2回目の復号化操作は、脱量子化等の操作を含んでよい。例えば、復号端は、受信されたビットストリームに基づいて、AVQアルゴリズムやSVQアルゴリズム等の、1回目の復号化操作が実行されたときに用いられたベクトル量子化アルゴリズムを用いて、2回目の脱量子化操作を実行して、m個のベクトルの正規化スペクトル係数を取得してよい。
任意に、別の実施形態として、復号端も、等式(2)に従ってベクトル数mを決定してよい。
任意に、別の実施形態として、復号端は、m個のベクトルの正規化スペクトル係数とk個のサブバンドの量子化スペクトル係数との対応関係を決定してよい。
任意に、別の実施形態として、復号端は、m個のベクトルとk個のサブバンドの量子化スペクトル係数の属するベクトルのうちの第1のタイプのベクトルとの対応関係を決定してよい。m個のベクトルは、第1のタイプのベクトルと1対1の対応関係にある。
図1の実施形態のプロセスから、符号端が候補スペクトル係数の属するベクトルからm個のベクトルを2回目の符号化のために選択し、k個のサブバンドの正規化スペクトル係数からk個のサブバンドの量子化スペクトル係数を引くことにより、候補スペクトル係数が取得されることが分かるであろう。したがって、2回目の復号化によりm個のベクトルの正規化スペクトル係数を取得した後、復号端は、候補スペクトル係数の属するベクトルのうちのどのベクトルが具体的にm個のベクトルであるのかを決定する必要がある。すなわち、m個のベクトルと、k個のサブバンドの量子化スペクトル係数の属するベクトルのうち第1のタイプのベクトルとの、1対1の対応関係を決定する必要がある。
具体的には、復号端は、異なる方式に基づいて、m個のベクトルと、k個のサブバンドの量子化スペクトル係数の属するベクトルのうち第1のタイプのベクトルとの対応関係を決定してよい。当然ながら、復号端によって用いられる方式は、符号端が2回目の符号化のためにm個のベクトルを選択するのと同じ方式でなければならない。
任意に、別の実施形態として、復号端は、k個のサブバンドの量子化スペクトル係数の属するベクトルをソートして、ソートされたベクトルを取得してよい。それから、復号端は、ソートされたベクトルから最初のm個のベクトルを、第1のタイプのベクトルとして選択し、第1のタイプのベクトルとm個のベクトルとの対応関係を確立してよい。ソートされたベクトルは、第1群のベクトルと第2群のベクトルとに分割され、第1群のベクトルは第2群のベクトルの前に配置され、第1群のベクトルは、第1群の復号化されたスペクトル係数が属するベクトルにおいて値が全て0であるベクトルを含み、第2群のベクトルは、第1群の復号化されたスペクトル係数の属するベクトルにおいて値の全てが0ではないベクトルを含む。
具体的には、復号端は、k個のサブバンドの量子化スペクトル係数の属するベクトルをソートして、ソートされたベクトルを取得してよい。ソートされたベクトルは、2個のベクトルの群を含むものとみなされてよい。第1群のベクトルは第2群のベクトルの前に配置され、第1群のベクトルは値が全て0であるベクトルであり、第2群のベクトルは値の全てが0ではないベクトルである。続いて、復号端は、ソートされたベクトルから最初のm個のベクトルを、第1のタイプのベクトルとして選択してよい。第1のタイプのベクトルが選択されるとき、第1群のベクトルの優先度が第2群のベクトルの優先度よりも高いことが分かるであろう。
各ベクトル群のベクトルは、異なる方式でソートされてもよい。
任意に、別の実施形態として、第1群のベクトルおよび第2群のベクトルの各ベクトル群において、異なるサブバンドのベクトルは、ベクトルが位置するサブバンドの周波数の低い順に配列され、同じサブバンドのベクトルは、ベクトルの元の順序で配列される。
任意に、別の実施形態として、第1群のベクトルおよび第2群のベクトルの各ベクトル群において、異なるサブバンドのベクトルは、ベクトルが位置するサブバンドの量子化エンベロープの大きい順に配列され、同じサブバンドのベクトルは、ベクトルの元の順序で配列される。
任意に、別の実施形態として、復号端は、k個のサブバンドの量子化スペクトル係数の属するベクトルが位置するサブバンドの量子化エンベロープの大きい順に、k個のサブバンドの量子化スペクトル係数の属するベクトルから、m個のベクトルを第1のタイプのベクトルとして選択してよい。復号端は、第1のタイプのベクトルとm個のベクトルとの対応関係を確立してよい。
任意に、別の実施形態として、復号端は、m個のベクトルの大域的ゲインを復号化し、m個のベクトルの大域的ゲインを用いて、m個のベクトルの正規化スペクトル係数を修正して、m個のベクトルのスペクトル係数を取得してよい。
復号端は、第2の復号化されたスペクトル係数の群を修正してよい。ここで復号端は、復号化によって得られるm個のベクトルの大域的ゲインを用いて、m個のベクトルの正規化スペクトル係数を修正してよい。
任意に、別の実施形態として、復号端は、第1の大域的ゲインおよび第2の大域的ゲインを復号化し、第1の大域的ゲインを用いて、m個のベクトルの正規化スペクトル係数のうち第1群のベクトルに対応するスペクトル係数を修正し、第2の大域的ゲインを用いて、m個のベクトルの正規化スペクトル係数のうち第2群のベクトルに対応するスペクトル係数を修正して、m個のベクトルのスペクトル係数を取得してよい。
図1の実施形態のプロセスから、符号端は2個の大域的ゲインを用いてm個のベクトルのスペクトル係数を正規化してよいことが分かるであろう。したがって、これに対応して、復号端は、2個の大域的ゲインを用いて、m個のベクトルの正規化スペクトル係数を修正してよい。
任意に、別の実施形態として、復号端は、k個のサブバンドの量子化スペクトル係数とm個のベクトルのスペクトル係数とを加算して、k個のサブバンドの正規化スペクトル係数を取得してよい。復号端は、k個のサブバンドの正規化スペクトル係数のうち値が0であるスペクトル係数に対してノイズ充填を実行し、全てのサブバンドのうちk個のサブバンド以外の別のサブバンドのスペクトル係数を復元して、第1の周波数バンドのスペクトル係数を取得してよい。第1の周波数バンドは、全てのサブバンドを含む。復号端は、全てのサブバンドのエンベロープを用いて、第1の周波数バンドのスペクトル係数を修正して、第1の周波数バンドの正規化スペクトル係数を取得し、第1の周波数バンドの大域的ゲインを用いて、第1の周波数バンドの正規化スペクトル係数を修正して、第1の周波数バンドの最終的な周波数領域信号を取得してよい。
2回の復号化の後、2回の復号化によって得られたスペクトル係数は、ビットが割り当てられるk個のサブバンドに属する。したがって、復号端は、2回の復号化によって得られるスペクトル係数を加算して、k個のサブバンドの正規化スペクトル係数を取得する。具体的には、k個のサブバンドの量子化スペクトル係数は、基本的に、符号端により1回目の正規化処理が実行されたスペクトル係数である。m個のベクトルの正規化スペクトル係数は、基本的に、符号端により2回目の正規化処理が実行されたスペクトル係数である。したがって、復号端は、m個のベクトルの正規化スペクトル係数を修正して、m個のベクトルのスペクトル係数を取得する必要がある。続いて、k個のサブバンドの量子化スペクトル係数とm個のベクトルのスペクトル係数とが加算されて、k個のサブバンドの正規化スペクトル係数が取得されてよい。k個のサブバンドの正規化スペクトル係数において値が0であるスペクトル係数について、復号端は、一般に、再構成された音響信号がより自然に聞こえるように、何らかのノイズを充填してよい。加えて、復号端は更に、全てのサブバンドのうちk個のサブバンド以外の別のサブバンドのスペクトル係数を復元する必要がある。第1の周波数バンドは上記の全てのサブバンドを含むので、第1の周波数バンドのスペクトル係数が取得される。ここで、第1の周波数バンドは、フル周波数バンドを意味してよく、或いはフル周波数バンドの一部の周波数バンドを意味してもよい。すなわち、本発明の本実施形態は、フル周波数バンドの処理に適用されてよく、或いは、フル周波数バンドの一部の周波数バンドの処理に適用されてもよい。
任意に、別の実施形態として、復号端は、m個のベクトルの正規化スペクトル係数とk個のサブバンドの量子化スペクトル係数との対応関係に従って、m個のベクトルのスペクトル係数とk個のサブバンドの量子化スペクトル係数とを加算してよい。
具体的には、復号端は、対応関係に従って、候補スペクトル係数の属するベクトルのうちどのベクトルがm個のベクトルであるのかを決定してよい。候補スペクトル係数の属するベクトルは、k個のサブバンドの正規化スペクトル係数が属するベクトルから、k個のサブバンドの量子化スペクトル係数が属するベクトルを引くことによって取得される。したがって、k個のサブバンドの正規化スペクトル係数を取得するために、復号端は、対応関係に従って、m個のベクトルのスペクトル係数を、m個のベクトルのスペクトル係数に対応するk個のサブバンドの量子化スペクトル係数に加算してよい。
k個のサブバンドの正規化スペクトル係数のうち値が0であるスペクトル係数に対してノイズ充填を実行するために、任意に、別の実施形態として、復号端は、コア層復号化情報に従って加重値を決定してから、加重値を用いて、k個のサブバンドの正規化スペクトル係数において値が0であるスペクトル係数に隣接するスペクトル係数とランダムノイズとを加重してよい。
具体的には、値が0であるスペクトル係数について、復号端は、値が0であるスペクトル係数に隣接するスペクトル係数とランダムノイズとを加重してよい。
任意に、別の実施形態として、復号端は、コア層復号化情報から信号分類情報を取得してよい。信号が摩擦信号であると信号分類情報が示す場合、復号端は、所定の加重値を取得してよい。または、信号が摩擦信号以外の別の信号であると信号分類情報が示す場合、復号端は、コア層復号化情報からピッチ周期を取得し、ピッチ周期に従って加重値を決定してよい。
ノイズ充填が加重方式で実行される場合、復号端は、異なる信号のタイプに対して異なる加重値を用いてよい。例えば、信号が摩擦信号である場合、加重値は予め設定されてよい。摩擦信号以外の別の信号の場合、復号端は、ピッチ周期に従って加重値を決定してよい。一般に、ピッチ周期が長いほど加重値は小さくなる。
任意に、別の実施形態として、復号端は、全てのサブバンドから別のサブバンドに隣接するn個のサブバンドを選択し、n個のサブバンドのスペクトル係数に従って、該別のサブバンドのスペクトル係数を回復してよい。nは正の整数である。或いは、復号端は、k個のサブバンドからp個のサブバンドを選択し、p個のサブバンドのスペクトル係数に従って、該別のサブバンドのスペクトル係数を復元してよい。p個のサブバンドの各サブバンドに割り当てられるビット数は、第2のビット数閾値以上である。
具体的には、復号端は、k個のサブバンド以外の該別のサブバンドに隣接するサブバンドのスペクトル係数を用いて、該別のサブバンドのスペクトル係数を復元してよい。或いは、復号端は、比較的多数のビットが割り当てられるサブバンドのスペクトル係数を用いて、該別のサブバンドのスペクトル係数を復元してよい。例えば、比較的多数のビットが割り当てられることは、ビット数が予め設定された第2のビット数閾値以上であることを意味し得る。
最終的な周波数領域信号を取得した後、復号端は、最終的な周波数領域信号に対して周波数−時間変換を実行して、最終的な時間領域信号を取得してよい。
本発明の本実施形態を、具体的な例を参照して後述する。当然ながら、これらの例は、当業者が本発明の本実施形態をより良く理解できるように提供されるに過ぎず、本発明の本実施形態の範囲を限定する意図はない。
図3は、本発明の実施形態に係る信号符号化方法のプロセスの概略フローチャートである。
301.符号端が、時間領域信号に対して時間‐周波数変換を実行する。
302.符号端が、周波数領域信号のスペクトル係数についてサブバンド分割を実行する。
具体的には、符号端は、大域的ゲインを計算し、大域的ゲインを用いて元のスペクトル係数を正規化し、正規化スペクトル係数を分割して、全てのサブバンドを取得してよい。
303.符号端は、全てのサブバンドのエンベロープを計算し、全てのサブバンドのエンベロープを量子化して、全てのサブバンドの量子化エンベロープを取得する。
304.符号端は、符号化されるべきk個のサブバンドを決定する。
具体的には、符号端は、図1の実施形態のプロセスを用いてk個のサブバンドを決定してよく、ここでは説明を省略する。
305.符号端は、k個のサブバンドのスペクトル係数を正規化および量子化する。
具体的には、符号端は、k個のサブバンドのスペクトル係数を正規化して、k個のサブバンドの正規化スペクトル係数を取得してよい。続いて、符号端は、k個のサブバンドの正規化スペクトル係数を量子化してよい。例えば、符号端は、格子ベクトル量子化アルゴリズムを用いてk個のサブバンドの正規化スペクトル係数を量子化して、k個のサブバンドの量子化スペクトル係数を取得する。
306.符号端は、1回目の符号化の後、利用可能なビット数のうちの残りのビット数が第1のビット数閾値以上であるか否かを決定する。
残りのビット数が第1のビット数閾値未満である場合、ステップ307に進む。
残りのビット数が第1のビット数閾値以上である場合、ステップ308に進む。
307.残りのビット数が第1のビット数閾値未満である場合、符号端はビットストリームを書き込む。
具体的には、残りのビット数が第1のビット数閾値未満である場合、残りのビット数は2回目の符号化に用いることができず、符号端は、1回目の符号化の結果のインデックス、量子化された大域的ゲインのインデックス、全てのサブバンドの量子化エンベロープのインデックス等を、ビットストリームに書き込んでよい。具体的なプロセスについては、従来技術を参照されたい。ここでは詳細の説明を省略する。
308.残りのビット数が第1のビット数閾値以上である場合、符号端は、2回目の符号化が実行されるべきm個のベクトルを決定する。
具体的には、符号端は、k個のサブバンドの量子化スペクトル係数に従って候補スペクトル係数を決定し、候補スペクトル係数が属するベクトルからm個のベクトルを選択してよい。
上記の候補スペクトル係数は、k個のサブバンドの正規化スペクトル係数からk個のサブバンドの対応する量子化スペクトル係数を引くことによって得られるスペクトル係数を含んでよい。
一例として、符号端は、候補スペクトル係数が属するベクトルから最初のm個のベクトルを選択してよい。候補スペクトル係数の属するベクトルは、第1群のベクトルと第2群のベクトルとに分割されてよく、第1群のベクトルは第2群のベクトルの前に配置され、第1群のベクトルは、k個のサブバンドの量子化スペクトル係数の属するベクトルにおいて値が全て0であるベクトルに対応し、第2群のベクトルは、k個のサブバンドの量子化スペクトル係数の属するベクトルにおいて値の全てが0ではないベクトルに対応する。
特定の例を参照して説明を後述する。図4は、本発明の実施形態に係る、2回目の符号化が実行されるベクトルを決定するプロセスの概略図である。
図4において、1回目の符号化が実行されるとき、符号端がサブバンド1〜サブバンド3と付番された3個のサブバンドを決定すると仮定する。サブバンド1〜サブバンド3は、周波数の低い順に配列される。各サブバンドには3個のベクトルがあり、ベクトル1a〜ベクトル1iと付番されてよい。各ベクトルには8個の正規化スペクトル係数があり、これらのスペクトル係数の具体値は図4に示すことができる。例えば、サブバンド1のベクトル1aに含まれる正規化スペクトル係数は、51151151である。
3個のサブバンドの正規化スペクトル係数が量子化されて、量子化スペクトル係数が取得される。量子化スペクトル係数の具体値を図4に示す。一部のスペクトル係数は0に量子化され、一部のスペクトル係数は0でない値に量子化される。これらの量子化スペクトル係数も、ベクトル2a〜ベクトル2iと付番されてよい9個のベクトルに属する。例えば、サブバンド1のベクトル1に含まれる8個の正規化スペクトル係数が量子化されて、8個の量子化スペクトル係数40040240が取得され、8個の量子化スペクトル係数40040240はベクトル2aに属する。サブバンド1のベクトル1bに含まれる8個の正規化スペクトル係数が量子化されて、8個の量子化スペクトル係数00000000が取得され、8個の量子化スペクトル係数00000000はベクトル2bに属する。
対応する量子化スペクトル係数が正規化スペクトル係数から引かれて、候補スペクトル係数が取得される。例えば、サブバンド1のベクトル1aに関して、対応する8個の量子化スペクトル係数40040240が8個の正規化スペクトル係数51151151から引かれて、新しいスペクトル係数1111111が取得される。サブバンド1のベクトル1bに関して、8個の量子化スペクトル係数00000000が8個の正規化スペクトル係数11111111から引かれて、新しいスペクトル係数11111111が取得される。他のスペクトル係数も同じ方式で取得することができる。図4に示されるように、取得された新しいスペクトル係数は全て候補スペクトル係数である。
上述の説明から、候補スペクトル係数の属するベクトルも、正規化スペクトル係数の属するベクトルから量子化スペクトル係数の属するベクトルを引くことによって得られるものとみなされてよいことが分かるであろう。したがって、これに対応して、このような候補スペクトル係数も、図4に示すように、上述の正規化ベクトルおよび量子化ベクトルに対応するためにベクトル3a〜ベクトル3iと付番されてよい9個のベクトルに属する。例えば、量子化ベクトル2aがベクトル1aから引かれて、ベクトル3aが取得され、量子化ベクトル2bがベクトル1bから引かれて、ベクトル3bが取得される。
9個のベクトルは、2個のベクトル群を含んでよい。第1群のベクトルには、4個のベクトルすなわちベクトル3b、ベクトル3e、ベクトル3g、ベクトル3iがある。第2群のベクトルには、5個のベクトルすなわちベクトル3a、ベクトル3c、ベクトル3d、ベクトル3f、ベクトル3hがある。第1群のベクトルは、ベクトル2a〜2iにおいて値が全て0であるベクトルを引くことによって取得される。例えば、ベクトル3bは、ベクトル1bから値が全て0であるベクトル2bを引くことによって取得される。ベクトル3eは、ベクトル1eから値が全て0であるベクトル2を引くことによって取得される。他のベクトルも、同じ方式で取得することができる。第2群のベクトルは、ベクトル2a〜2iにおいて値の全てが0ではないベクトルを引くことによって取得される。例えば、ベクトル3aは、ベクトル1aから値の全てが0ではないベクトル1bを引くことによって取得される。ベクトル3cは、ベクトル1cから値の全てが0ではないベクトル2cを引くことによって取得される。他のベクトルも、同じ方式で取得することができる。
図4に示されるように、各ベクトル群はサブバンドの周波数の低い順に配列されてよく、同じサブバンドのベクトルはベクトルの元の順序で配列されてよい。例えば、第1群のベクトルにおいて、ベクトル3bはサブバンド1に属し、ベクトル3eはサブバンド2に属し、ベクトル3gおよびベクトル3iはサブバンド3に属する。第2群のベクトルにおいて、ベクトル3aおよびベクトル3cはサブバンド1に属し、ベクトル3dおよびベクトル3fはサブバンド2に属し、ベクトル3hはサブバンド3に属する。
符号端は、第1群のベクトルおよび第2群のベクトルを含むベクトル群から、最初のm個のベクトルを2回目の符号化のためのベクトルとして選択してよい。例えば、最初の3個のベクトルすなわちベクトル3b、ベクトル3e、ベクトル3gが、2回目の符号化のために選択されてよい。
当然ながら、図4の具体値は当業者が本発明の本実施形態をより良く理解できるようにするために提供されているに過ぎず、本発明の本実施形態の範囲を限定する意図はない。
更に、図4に示される各ベクトル群のベクトルがソートされる方式に加えて、各ベクトル群では、異なるサブバンドのベクトルは、ベクトルが位置するサブバンドの量子化エンベロープの大きい順に配列されてもよく、同じサブバンドのベクトルはベクトルの元の順序で配列されてよい。
309.符号端は、m個のベクトルのスペクトル係数を正規化および量子化する。
m個のベクトルのスペクトル係数を正規化および量子化する具体的なプロセスについては、図1の実施形態の説明を参照されたい。ここでは詳細の説明を省略する。
310.符号端は、ビットストリームを書き込む。
具体的には、符号端は、1回目の符号化によって得られたスペクトル係数のインデックス、2回目の符号化によって得られたスペクトル係数のインデックス、量子化された大域的ゲインのインデックス、全てのサブバンドの量子化エンベロープのインデックス等を、ビットストリームに書き込んでよい。具体的なプロセスについては、従来技術を参照されたい。ここでは詳細の説明を省略する。
本発明の本実施形態では、利用可能なビット数および第1の飽和閾値に従って符号化されるべきサブバンド数kが決定され、周波数バンド全体ではなく、全てのサブバンドから選択されたk個のサブバンドに対して符号化が実行される。よって、復号化によって得られる信号のスペクトルホールを低減でき、したがって、出力信号の聴覚品質を改善できる。
具体的な復号化プロセスは、図3に示される符号化プロセスの逆のプロセスである。m個のベクトルとk個のサブバンドの量子化スペクトル係数の属するベクトルのうち第1のタイプのベクトルとの1対1の対応関係をどのように決定するかを、図4の例を参照して後述する。他のプロセスについては、図2の実施形態のプロセスを参照されたい。詳細の説明は省略する。
例えば、復号端は、1回目の復号化により、ベクトル2a〜ベクトル2iのスペクトル係数を取得してよい。残りのビット数および第2の飽和閾値jに従って、mが5であると決定されたと仮定する。復号端は、2回目の復号化により、5個のベクトルすなわちベクトル3b、ベクトル3e、ベクトル3g、ベクトル3i、ベクトル3aのスペクトル係数を取得してよい。復号端は、5個のベクトルのスペクトル係数を、それぞれベクトル2b、ベクトル2e、ベクトル2g、ベクトル2i、ベクトル2aのスペクトル係数に加算する必要がある。しかしながら、復号化によりベクトル3b、ベクトル3e、ベクトル3g、ベクトル3i、ベクトル3aを取得した後、復号端は、ベクトル2a〜ベクトル2iのうちどの5個のベクトルが取得された5個のベクトルに対応するのかを知らない。したがって、復号端はまず、5個のベクトルとベクトル2b、ベクトル2e、ベクトル2g、ベクトル2i、ベクトル2aとの1対1の対応関係を決定する必要がある。すなわち、ベクトル2b、ベクトル2e、ベクトル2g、ベクトル2i、ベクトル2aは、k個のサブバンドの量子化スペクトル係数の属するベクトルのうち第1のタイプのベクトルである。そして、ベクトル3b、ベクトル3e、ベクトル3g、ベクトル3i、ベクトル3aのスペクトル係数が、ベクトル2b、ベクトル2e、ベクトル2g、ベクトル2i、ベクトル2aのスペクトル係数にそれぞれ加算される。具体的には、復号端は図2の実施形態で説明された方式で決定を実行してよく、ここでは説明を省略する。
図5は、本発明の実施形態に係る信号符号化装置の概略ブロック図である。例えば、図5の装置500は、音声符号器または音響符号器である。装置500は、決定ユニット510、選択ユニット520および符号化ユニット530を有する。
決定ユニット510は、利用可能なビット数および第1の飽和閾値iに従って、符号化されるべきサブバンド数kを決定する。iは正の数であり、kは正の整数である。決定ユニット510によって決定されたサブバンド数kに従って、選択ユニット520は、全てのサブバンドの量子化エンベロープに従って、全てのサブバンドからk個のサブバンドを選択するか、または、心理音響モデルに従って、全てのサブバンドからk個のサブバンドを選択する。符号化ユニット530は、選択ユニット520によって選択されたk個のサブバンドのスペクトル係数に対して、1回目の符号化操作を実行する。
本発明の本実施形態では、利用可能なビット数および第1の飽和閾値に従って符号化されるべきサブバンド数kが決定され、周波数バンド全体ではなく、全てのサブバンドから選択されたk個のサブバンドに対して符号化が実行される。よって、復号化によって得られる信号のスペクトルホールを低減でき、したがって、出力信号の聴覚品質を改善できる。
任意に、一実施形態として、符号化ユニット530は、k個のサブバンドのスペクトル係数を正規化して、k個のサブバンドの正規化スペクトル係数を取得し、k個のサブバンドの正規化スペクトル係数を量子化して、k個のサブバンドの量子化スペクトル係数を取得してよい。
任意に、別の実施形態として、1回目の符号化操作の後に利用可能なビット数のうちの残りのビット数が第1のビット数閾値以上である場合、選択ユニット520は更に、残りのビット数と、第2の飽和閾値jと、k個のサブバンドの量子化スペクトル係数に従って、2回目の符号化が実行されるべきm個のベクトルを決定してよい。jは正の数であり、mは正の整数である。符号化ユニット530は更に、選択ユニット520によって決定されたm個のベクトルのスペクトル係数に対して、2回目の符号化操作を実行してよい。
任意に、別の実施形態として、選択ユニット520は、残りのビット数および第2の飽和閾値jに従って、符号化されるべきベクトル数mを決定し、k個のサブバンドの量子化スペクトル係数に従って、候補スペクトル係数を決定し、候補スペクトル係数が属するベクトルからm個のベクトルを選択してよい。候補スペクトル係数は、k個のサブバンドの正規化スペクトル係数からk個のサブバンドの対応する量子化スペクトル係数を引くことによって得られるスペクトル係数を含んでよい。
任意に、別の実施形態として、選択ユニット520は、候補スペクトル係数の属するベクトルをソートして、ソートされたベクトルを取得してよい。選択ユニット520は、ソートされたベクトルから最初のm個のベクトルを選択してよい。ソートされたベクトルは第1群のベクトルと第2群のベクトルとに分割され、第1群のベクトルは第2群のベクトルの前に配置され、第1群のベクトルは、k個のサブバンドの量子化スペクトル係数の属するベクトルにおいて値が全て0であるベクトルに対応し、第2群のベクトルは、k個のサブバンドの量子化スペクトル係数の属するベクトルにおいて値の全てが0ではないベクトルに対応する。
任意に、別の実施形態として、第1群のベクトルおよび第2群のベクトルの各ベクトル群において、異なるサブバンドのベクトルは、ベクトルの位置するサブバンドの周波数の低い順に配列されてよく、同じサブバンドのベクトルは、ベクトルの元の順序で配列されてよい。
任意に、別の実施形態として、第1群のベクトルおよび第2群のベクトルの各ベクトル群において、異なるサブバンドのベクトルは、ベクトルが位置するサブバンドの量子化エンベロープの大きい順に配列され、同じサブバンドのベクトルは、ベクトルの元の順序で配列される。
任意に、別の実施形態として、選択ユニット520は、候補スペクトル係数の属するベクトルが位置するサブバンドの量子化エンベロープの大きい順に、候補スペクトル係数の属するベクトルからm個のベクトルを選択してよい。
任意に、別の実施形態として、符号化ユニット530は、m個のベクトルのスペクトル係数の大域的ゲインを決定し、m個のベクトルのスペクトル係数の大域的ゲインを用いて、m個のベクトルのスペクトル係数を正規化し、m個のベクトルの正規化スペクトル係数を量子化してよい。
任意に、別の実施形態として、符号化ユニット530は、第1群のベクトルのスペクトル係数の大域的ゲインと、第2群のベクトルのスペクトル係数の大域的ゲインとを決定し、第1群のベクトルのスペクトル係数の大域的ゲインを用いて、m個のベクトルのうち第1群のベクトルに属するベクトルのスペクトル係数を正規化し、第2群のベクトルのスペクトル係数の大域的ゲインを用いて、m個のベクトルのうち第2群のベクトルに属するベクトルのスペクトル係数を正規化し、m個のベクトルの正規化スペクトル係数を量子化してよい。
任意に、別の実施形態として、選択ユニット520は、等式(2)に従ってmを決定してよい。
任意に、別の実施形態として、決定ユニット510は、等式(1)に従ってkを決定してよい。
任意に、別の実施形態として、信号が過渡信号、摩擦信号またはロングピッチ信号である場合、決定ユニット510は、利用可能なビット数および第1の飽和閾値iに従って、符号化されるべきサブバンド数kを決定してよい。
図5の装置500の他の機能および操作については、図1、図3および図4の上述の方法実施形態の符号端が関与するプロセスを参照されたい。繰り返しを避けるために、ここでは詳細の説明を省略する。
図6は、本発明の実施形態に係る信号復号化装置の概略ブロック図である。例えば、図6の装置600は、音声復号器または音響復号器である。装置600は、第1の決定ユニット610、選択ユニット620および復号化ユニット630を有する。
第1の決定ユニット610は、利用可能なビット数および第1の飽和閾値iに従って、復号化されるべきサブバンド数kを決定する。iは正の数であり、kは正の整数である。第1の決定ユニット610によって決定されたサブバンド数kに従い、選択ユニット620は、全てのサブバンドの復号化されたエンベロープに従って、全てのサブバンドからk個のサブバンドを選択するか、または、心理音響モデルに従って、全てのサブバンドからk個のサブバンドを選択する。復号化ユニット630は、1回目の復号化操作を実行して、選択ユニット620によって選択されたk個のサブバンドの量子化スペクトル係数を取得する。
本発明の本実施形態では、利用可能なビット数および第1の飽和閾値に従って復号化されるべきサブバンド数kが決定され、全てのサブバンドから選択されたk個のサブバンドに対して復号化が実行される。よって、復号化によって得られる信号のスペクトルホールを低減でき、したがって、出力信号の聴覚品質を改善できる。
任意に、別の実施形態として、1回目の復号化操作の後に利用可能なビット数のうちの残りのビット数が第1のビット数閾値以上である場合、第1の決定ユニット610は更に、残りのビット数および第2の飽和閾値jに従って、2回目の復号化が実行されるべきベクトルの数mを決定してよい。jは正の数であり、mは正の整数である。復号化ユニット630は更に、2回目の復号化操作を実行して、m個のベクトルの正規化スペクトル係数を取得してよい。
任意に、別の実施形態として、装置600は更に第2の決定ユニット640を有してよい。第2の決定ユニット640は、m個のベクトルの正規化スペクトル係数とk個のサブバンドの量子化スペクトル係数との対応関係を決定してよい。
任意に、別の実施形態として、第2の決定ユニット640は、m個のベクトルとk個のサブバンドの量子化スペクトル係数の属するベクトルのうちの第1のタイプのベクトルとの対応関係を決定してよい。m個のベクトルは、第1のタイプのベクトルと1対1の対応関係にある。
任意に、別の実施形態として、第2の決定ユニット640は、k個のサブバンドの量子化スペクトル係数の属するベクトルをソートして、ソートされたベクトルを取得し、ソートされたベクトルから最初のm個のベクトルを、第1のタイプのベクトルとして選択し、第1のタイプのベクトルとm個のベクトルとの対応関係を確立してよい。ソートされたベクトルは第1群のベクトルと第2群のベクトルとに分割され、第1群のベクトルは第2群のベクトルの前に配置され、第1群のベクトルは、第1群の復号化されたスペクトル係数が属するベクトルにおいて値が全て0であるベクトルを含み、第2群のベクトルは、第1群の復号化されたスペクトル係数の属するベクトルにおいて値の全てが0ではないベクトルを含む。
任意に、別の実施形態として、第1群のベクトルおよび第2群のベクトルの各ベクトル群において、異なるサブバンドのベクトルは、ベクトルが位置するサブバンドの周波数の低い順に配列され、同じサブバンドのベクトルは、ベクトルの元の順序で配列される。
任意に、別の実施形態として、第1群のベクトルおよび第2群のベクトルの各ベクトル群において、異なるサブバンドのベクトルは、ベクトルが位置するサブバンドの量子化エンベロープの大きい順に配列され、同じサブバンドのベクトルは、ベクトルの元の順序で配列される。
任意に、別の実施形態として、第2の決定ユニット640は、k個のサブバンドの量子化スペクトル係数の属するベクトルが位置するサブバンドの量子化エンベロープの大きい順に、k個のサブバンドの量子化スペクトル係数の属するベクトルから、m個のベクトルを第1のタイプのベクトルとして選択し、第1のタイプのベクトルとm個のベクトルとの対応関係を確立してよい。
任意に、別の実施形態として、装置600は更に修正ユニット650を有してよい。
復号化ユニット630は、m個のベクトルの大域的ゲインを復号化してよい。
修正ユニット650は、m個のベクトルの大域的ゲインを用いて、m個のベクトルの正規化スペクトル係数を修正して、m個のベクトルのスペクトル係数を取得してよい。
任意に、別の実施形態として、復号化ユニット630は、第1の大域的ゲインおよび第2の大域的ゲインを復号化してよい。
修正ユニット650は、第1の大域的ゲインを用いて、m個のベクトルの正規化スペクトル係数のうち第1群のベクトルに対応するスペクトル係数を修正し、第2の大域的ゲインを用いて、m個のベクトルの正規化スペクトル係数のうち第2群のベクトルに対応するスペクトル係数を修正して、m個のベクトルのスペクトル係数を取得してよい。
任意に、別の実施形態として、装置600は更に、加算ユニット660および復元ユニット670を有してよい。加算ユニット660は、k個のサブバンドの量子化スペクトル係数とm個のベクトルのスペクトル係数とを加算して、k個のサブバンドの正規化スペクトル係数を取得してよい。復元ユニット670は、k個のサブバンドの正規化スペクトル係数のうち値が0であるスペクトル係数に対してノイズ充填を実行し、全てのサブバンドのうちk個のサブバンド以外の別のサブバンドのスペクトル係数を復元して、第1の周波数バンドのスペクトル係数を取得してよい。第1の周波数バンドは全てのサブバンドを含む。修正ユニット650は、全てのサブバンドのエンベロープを用いて、第1の周波数バンドのスペクトル係数を修正して、第1の周波数バンドの正規化スペクトル係数を取得してよい。修正ユニット650は更に、第1の周波数バンドの大域的ゲインを用いて、第1の周波数バンドの正規化スペクトル係数を修正して、第1の周波数バンドの最終的な周波数領域信号を取得してよい。
任意に、別の実施形態として、復元ユニット670は、コア層復号化情報に従って加重値を決定し、加重値を用いて、k個のサブバンドの正規化スペクトル係数のうち値が0であるスペクトル係数に隣接するスペクトル係数とランダムノイズとを加重してよい。
任意に、別の実施形態として、復元ユニット670は、コア層復号化情報から信号分類情報を取得してよい。信号が摩擦信号であると信号分類情報が示す場合、復元ユニット670は、所定の加重値を取得してよい。または、信号が摩擦信号以外の別の信号であると信号分類情報が示す場合、復元ユニット670は、コア層復号化情報からピッチ周期を取得し、ピッチ周期に従って加重値を決定してよい。
任意に、別の実施形態として、復元ユニット670は、全てのサブバンドから、別のサブバンドに隣接するn個のサブバンドを選択し、n個のサブバンドのスペクトル係数に従って、該別のサブバンドのスペクトル係数を復元してよい。nは正の整数である。または、復元ユニット670は、k個のサブバンドからp個のサブバンドを選択し、p個のサブバンドのスペクトル係数に従って、該別のサブバンドのスペクトル係数を復元してよい。p個のサブバンドの各サブバンドに割り当てられるビット数は、第2のビット数閾値以上であり、pは正の整数である。
任意に、別の実施形態として、第1の決定ユニット610は、等式(2)に従ってmを決定してよい。
任意に、別の実施形態として、第1の決定ユニット610は、等式(1)に従ってkを決定してよい。
任意に、別の実施形態として、信号が過渡信号、摩擦信号またはロングピッチ信号である場合、第1の決定ユニット610は、利用可能なビット数および第1の飽和閾値iに従って、復号化されるべきサブバンド数kを決定してよい。
図6の装置600の他の機能および操作については、図2の上述の方法実施形態における符号端が関与するプロセスを参照されたい。繰り返しを避けるために、ここでは詳細の説明を省略する。
図7は、本発明の別の実施形態に係る信号符号化装置の概略ブロック図である。例えば、図7の装置700は、音声符号器または音響符号器である。装置700は、メモリ710およびプロセッサ720を有する。
メモリ710の例として、ランダムアクセスメモリ、フラッシュメモリ、リードオンリーメモリ、プログラマブルリードオンリーメモリ、不揮発性メモリ、レジスタ等が挙げられる。プロセッサ720は、中央演算処理装置(Central Processing Unit、CPU)であってよい。
メモリ710は、実行可能命令を格納するように構成される。プロセッサ720は、メモリ710に格納された実行可能命令を実行してよく、また、利用可能なビット数および第1の飽和閾値iに従って、符号化されるべきサブバンド数kを決定し(iは正の数であり、kは正の整数である)、全てのサブバンドの量子化エンベロープに従って、全てのサブバンドからk個のサブバンドを選択するか、または、心理音響モデルに従って、全てのサブバンドからk個のサブバンドを選択し、k個のサブバンドのスペクトル係数に対して1回目の符号化操作を実行するように構成される。
本発明の本実施形態では、利用可能なビット数および第1の飽和閾値に従って符号化されるべきサブバンド数kが決定され、周波数バンド全体ではなく、全てのサブバンドから選択されたk個のサブバンドに対して符号化が実行される。よって、復号化によって得られる信号のスペクトルホールを低減でき、したがって、出力信号の聴覚品質を改善できる。
任意に、一実施形態として、プロセッサ720は、k個のサブバンドのスペクトル係数を正規化して、k個のサブバンドの正規化スペクトル係数を取得し、k個のサブバンドの正規化スペクトル係数を量子化して、k個のサブバンドの量子化スペクトル係数を取得してよい。
任意に、別の実施形態として、1回目の符号化の後に利用可能なビット数のうちの残りのビット数が第1のビット数閾値以上である場合、プロセッサ720は更に、残りのビット数と、第2の飽和閾値jと、k個のサブバンドの量子化スペクトル係数に従って、2回目の符号化が実行されるべきm個のベクトルを決定してよい。jは正の数であり、mは正の整数である。プロセッサ720は更に、m個のベクトルのスペクトル係数に対して2回目の符号化操作を実行してよい。
任意に、別の実施形態として、プロセッサ720は、残りのビット数および第2の飽和閾値jに従って、符号化されるべきベクトル数mを決定し、k個のサブバンドの量子化スペクトル係数に従って、候補スペクトル係数を決定し、候補スペクトル係数が属するベクトルからm個のベクトルを選択してよい。候補スペクトル係数は、k個のサブバンドの正規化スペクトル係数からk個のサブバンドの対応する量子化スペクトル係数を引くことによって得られるスペクトル係数を含んでよい。
任意に、別の実施形態として、プロセッサ720は、候補スペクトル係数の属するベクトルをソートして、ソートされたベクトルを取得し、ソートされたベクトルから最初のm個のベクトルを選択してよい。ソートされたベクトルは第1群のベクトルと第2群のベクトルとに分割され、第1群のベクトルは第2群のベクトルの前に配置され、第1群のベクトルは、k個のサブバンドの量子化スペクトル係数の属するベクトルにおいて値が全て0であるベクトルに対応し、第2群のベクトルは、k個のサブバンドの量子化スペクトル係数の属するベクトルにおいて値の全てが0ではないベクトルに対応する。
任意に、別の実施形態として、第1群のベクトルおよび第2群のベクトルの各ベクトル群において、異なるサブバンドのベクトルは、ベクトルの位置するサブバンドの周波数の低い順に配列されてよく、同じサブバンドのベクトルは、ベクトルの元の順序で配列されてよい。
任意に、別の実施形態として、第1群のベクトルおよび第2群のベクトルの各ベクトル群において、異なるサブバンドのベクトルは、ベクトルが位置するサブバンドの量子化エンベロープの大きい順に配列され、同じサブバンドのベクトルは、ベクトルの元の順序で配列される。
任意に、別の実施形態として、プロセッサ720は、候補スペクトル係数の属するベクトルが位置するサブバンドの量子化エンベロープの大きい順に、候補スペクトル係数の属するベクトルからm個のベクトルを選択してよい。
任意に、別の実施形態として、プロセッサ720は、m個のベクトルのスペクトル係数の大域的ゲインを決定し、m個のベクトルのスペクトル係数の大域的ゲインを用いて、m個のベクトルのスペクトル係数を正規化し、m個のベクトルの正規化スペクトル係数を量子化してよい。
任意に、別の実施形態として、プロセッサ720は、第1群のベクトルのスペクトル係数の大域的ゲインと、第2群のベクトルのスペクトル係数の大域的ゲインとを決定し、第1群のベクトルのスペクトル係数の大域的ゲインを用いて、m個のベクトルのうち第1群のベクトルに属するベクトルのスペクトル係数を正規化し、第2群のベクトルのスペクトル係数の大域的ゲインを用いて、m個のベクトルのうち第2群のベクトルに属するベクトルのスペクトル係数を正規化し、m個のベクトルの正規化スペクトル係数を量子化してよい。
任意に、別の実施形態として、プロセッサ720は、等式(2)に従ってmを決定してよい。
任意に、別の実施形態として、プロセッサ720は、等式(1)に従ってkを決定してよい。
任意に、別の実施形態として、信号が過渡信号、摩擦信号またはロングピッチ信号である場合、プロセッサ720は、利用可能なビット数および第1の飽和閾値iに従って、符号化されるべきサブバンド数kを決定してよい。
図7の装置700の他の機能および操作については、図1、図3および図4の上述の方法実施形態における符号端が関与するプロセスを参照されたい。繰り返しを避けるために、ここでは詳細の説明を省略する。
図8は、本発明の別の実施形態に係る信号復号化装置の概略ブロック図である。例えば、図の装置800は、音声復号器または音響復号器である。装置800は、メモリ810およびプロセッサ820を有する。
メモリ810の例として、ランダムアクセスメモリ、フラッシュメモリ、リードオンリーメモリ、プログラマブルリードオンリーメモリ、不揮発性メモリ、レジスタ等が挙げられる。プロセッサ820は、中央演算処理装置(Central Processing Unit、CPU)であってよい。
メモリ810は、実行可能命令を格納するように構成される。プロセッサ820は、メモリ810に格納された実行可能命令を実行してよく、また、利用可能なビット数および第1の飽和閾値iに従って、復号化されるべきサブバンド数kを決定し(iは正の数であり、kは正の整数である)、サブバンド数kに従い、全てのサブバンドの復号化されたエンベロープに従って、全てのサブバンドからk個のサブバンドを選択するか、または、心理音響モデルに従って、全てのサブバンドからk個のサブバンドを選択し、1回目の復号化操作を実行して、k個のサブバンドの量子化スペクトル係数を取得するように構成される。
本発明の本実施形態では、利用可能なビット数および第1の飽和閾値に従って復号化されるべきサブバンド数kが決定され、全てのサブバンドから選択されたk個のサブバンドに対して復号化が実行される。よって、復号化によって得られる信号のスペクトルホールを低減でき、したがって、出力信号の聴覚品質を改善できる。
任意に、別の実施形態として、1回目の復号化操作の後に利用可能なビット数のうちの残りのビット数が第1のビット数閾値以上である場合、プロセッサ820は更に、残りのビット数および第2の飽和閾値jに従って、2回目の復号化が実行されるべきベクトルの数mを決定してよい。jは正の数であり、mは正の整数である。プロセッサ820は更に、2回目の復号化操作を実行して、m個のベクトルの正規化スペクトル係数を取得してよい。
任意に、別の実施形態として、プロセッサ820は、m個のベクトルの正規化スペクトル係数とk個のサブバンドの量子化スペクトル係数との対応関係を決定してよい。
任意に、別の実施形態として、プロセッサ820は、m個のベクトルとk個のサブバンドの量子化スペクトル係数の属するベクトルのうちの第1のタイプのベクトルとの対応関係を決定してよい。m個のベクトルは、第1のタイプのベクトルと1対1の対応関係にある。
任意に、別の実施形態として、プロセッサ820は、k個のサブバンドの量子化スペクトル係数の属するベクトルをソートして、ソートされたベクトルを取得してよく、ソートされたベクトルから最初のm個のベクトルを、第1のタイプのベクトルとして選択してよく、第1のタイプのベクトルとm個のベクトルとの対応関係を確立してよい。ソートされたベクトルは第1群のベクトルと第2群のベクトルとに分割され、第1群のベクトルは第2群のベクトルの前に配置され、第1群のベクトルは、第1群の復号化されたスペクトル係数が属するベクトルにおいて値が全て0であるベクトルを含み、第2群のベクトルは、第1群の復号化されたスペクトル係数の属するベクトルにおいて値の全てが0ではないベクトルを含む。
任意に、別の実施形態として、第1群のベクトルおよび第2群のベクトルの各ベクトル群において、異なるサブバンドのベクトルは、ベクトルが位置するサブバンドの周波数の低い順に配列され、同じサブバンドのベクトルは、ベクトルの元の順序で配列される。
任意に、別の実施形態として、第1群のベクトルおよび第2群のベクトルの各ベクトル群において、異なるサブバンドのベクトルは、ベクトルが位置するサブバンドの量子化エンベロープの大きい順に配列され、同じサブバンドのベクトルは、ベクトルの元の順序で配列される。
任意に、別の実施形態として、プロセッサ820は、k個のサブバンドの量子化スペクトル係数の属するベクトルが位置するサブバンドの量子化エンベロープの大きい順に、k個のサブバンドの量子化スペクトル係数の属するベクトルから、m個のベクトルを第1のタイプのベクトルとして選択し、第1のタイプのベクトルとm個のベクトルとの対応関係を確立してよい。
任意に、別の実施形態として、プロセッサ820は、m個のベクトルの大域的ゲインを復号化し、m個のベクトルの大域的ゲインを用いて、m個のベクトルの正規化スペクトル係数を修正して、m個のベクトルのスペクトル係数を取得してよい。
任意に、別の実施形態として、プロセッサ820は、第1の大域的ゲインおよび第2の大域的ゲインを復号化し、第1の大域的ゲインを用いて、m個のベクトルの正規化スペクトル係数のうち第1群のベクトルに対応するスペクトル係数を修正し、第2の大域的ゲインを用いて、m個のベクトルの正規化スペクトル係数のうち第2群のベクトルに対応するスペクトル係数を修正して、m個のベクトルのスペクトル係数を取得してよい。
任意に、別の実施形態として、プロセッサ820は、k個のサブバンドの量子化スペクトル係数とm個のベクトルのスペクトル係数とを加算して、k個のサブバンドの正規化スペクトル係数を取得してよい。プロセッサ820は、k個のサブバンドの正規化スペクトル係数のうち値が0であるスペクトル係数に対してノイズ充填を実行し、全てのサブバンドのうちk個のサブバンド以外の別のサブバンドのスペクトル係数を復元して、第1の周波数バンドのスペクトル係数を取得してよい。第1の周波数バンドは、全てのサブバンドを含む。プロセッサ820は、全てのサブバンドのエンベロープを用いて、第1の周波数バンドのスペクトル係数を修正して、第1の周波数バンドの正規化スペクトル係数を取得してよい。プロセッサ820は更に、第1の周波数バンドの大域的ゲインを用いて、第1の周波数バンドの正規化スペクトル係数を修正して、第1の周波数バンドの最終的な周波数領域信号を取得してよい。
任意に、別の実施形態として、プロセッサ820は、コア層復号化情報に従って加重値を決定し、加重値を用いて、k個のサブバンドの正規化スペクトル係数のうち値が0であるスペクトル係数に隣接するスペクトル係数とランダムノイズとを加重してよい。
任意に、別の実施形態として、プロセッサ820は、コア層復号化情報から信号分類情報を取得してよい。信号が摩擦信号であると信号分類情報が示す場合、プロセッサ820は、所定の加重値を取得してよい。または、信号が摩擦信号以外の別の信号であると信号分類情報が示す場合、プロセッサ820は、コア層復号化情報からピッチ周期を取得し、ピッチ周期に従って加重値を決定してよい。
任意に、別の実施形態として、プロセッサ820は、全てのサブバンドから、別のサブバンドに隣接するn個のサブバンドを選択し、n個のサブバンドのスペクトル係数に従って、該別のサブバンドのスペクトル係数を復元してよい。nは正の整数である。または、プロセッサ820は、k個のサブバンドからp個のサブバンドを選択し、p個のサブバンドのスペクトル係数に従って、該別のサブバンドのスペクトル係数を復元してよい。p個のサブバンドの各サブバンドに割り当てられるビット数は、第2のビット数閾値以上であり、pは正の整数である。
任意に、別の実施形態として、プロセッサ820は、等式(2)に従ってmを決定してよい。
任意に、別の実施形態として、プロセッサ820は、等式(1)に従ってkを決定してよい。
任意に、別の実施形態として、信号が過渡信号、摩擦信号またはロングピッチ信号である場合、プロセッサ820は、利用可能なビット数および第1の飽和閾値iに従って、復号化されるべきサブバンド数kを決定してよい。
図8の装置800の他の機能および操作については、図2の上述の方法実施形態における符号端が関与するプロセスを参照されたい。繰り返しを避けるために、ここでは詳細の説明を省略する。
当業者であれば、本明細書に開示された実施形態に記載の例と組み合わせて、ユニットおよびアルゴリズムステップが電子機器またはコンピューターソフトウェアと電子機器との組合わせによって実施できることが分かるであろう。機能がハードウェアによって実行されるかソフトウェアによって実行されるかは、技術的構成の特定の応用および設計制約条件によって決まる。当業者であれば、各特定の応用のために記載の機能を実施する際に異なる方法を採用するかもしれないが、該実施が本発明の範囲を超えるとみなされるべきではない。
当業者であれば明らかに理解できるように、説明を簡便にするために、上述のシステム、装置およびユニットの詳細な作業プロセスについては、上述の方法実施形態の対応するプロセスを参照することができ、ここでは詳細の説明を省略する。
本願において提供されるいくつかの実施形態では、当然ながら、開示のシステム、装置および方法は、他の方式で実施されてよい。例えば、記載の装置実施形態は例示に過ぎない。例えば、ユニットの分割は論理的機能の分割に過ぎず、実際の実施では他の分割であってよい。例えば、複数のユニットまたはコンポーネントが別のシステムとして組み合わされるか統合されてよく、或いは、一部の特徴が省略されてよく、または実行されなくてよい。加えて、図示または記載された相互結合または直接的な結合もしくは通信接続は、いくつかのインターフェースを用いて実施されてよい。装置またはユニット間の間接的な結合または通信接続は、電子的形式、機械的方式その他の形式で実施されてよい。
別々の要素として記載されたユニットは物理的に別々であってもなくてもよく、ユニットとして示された要素は物理的なユニットであってもなくてもよく、1つの場所に位置してもよく、複数のネットワークユニットに分散されてもよい。ユニットの一部または全部は、実施形態の構成の目的を達成するための実際の要件に従って選択されてよい。
加えて、本発明の実施形態における機能的ユニットは1つの処理ユニットに統合されてよく、或いは、各ユニットが物理的に単独で存在してよく、或いは、2以上のユニットが1つのユニットに統合されてよい。
機能がソフトウェア機能ユニットの形式で実施され、独立した製品として販売または利用される場合、機能はコンピューター可読記憶媒体に格納されてよい。このような理解に基づき、本発明の技術的構成は基本的に、或いは従来技術に寄与する部分、或いは技術的構成の一部は、ソフトウェア製品の形式で実施されてよい。コンピューターソフトウェア製品は記憶媒体に格納され、本発明の実施形態に記載の方法のステップの全部または一部を実行するようにコンピューター装置(パーソナルコンピューター、サーバーまたはネットワーク装置であってよい)に命令するためのいくつかの命令を備える。上述の記憶媒体の例として、USBフラッシュドライブ、リムーバブルハードディスク、リードオンリーメモリ(ROM、Read-Only Memory)、ランダムアクセスメモリ(RAM、Random Access Memory)、磁気ディスク、光ディスク等の、プログラムコードを格納することができる任意の媒体が挙げられる。
上述の説明は本発明の具体的な実施方式に過ぎず、本発明の保護範囲を限定する意図はない。当業者が本発明に開示の技術的範囲において容易に想到し得る変形または置換は、本発明の保護範囲に包含されるものとする。したがって、本発明の保護範囲は、特許請求の範囲の保護範囲に依拠するものとする。

Claims (20)

  1. 利用可能なビット数および第1の飽和閾値iに従って、符号化されるべきサブバンド数kを決定するステップであって、iは正の数であり、kは正の整数である、ステップと、
    全てのサブバンドの量子化エンベロープに従って、前記全てのサブバンドからk個のサブバンドを選択するか、または、心理音響モデルに従って、前記全てのサブバンドからk個のサブバンドを選択するステップと、
    前記k個のサブバンドのスペクトル係数に対して、1回目の符号化操作を実行するステップと、
    を有する信号符号化方法。
  2. 前記k個のサブバンドのスペクトル係数に対して1回目の符号化操作を実行する前記ステップは、
    前記k個のサブバンドの前記スペクトル係数を正規化して、前記k個のサブバンドの正規化スペクトル係数を取得するステップと、
    前記k個のサブバンドの前記正規化スペクトル係数を量子化して、前記k個のサブバンドの量子化スペクトル係数を取得するステップと、
    を有する、請求項1に記載の方法。
  3. 前記1回目の符号化操作の後に前記利用可能なビット数のうちの残りのビット数が第1のビット数閾値以上である場合、前記残りのビット数と、第2の飽和閾値jと、前記k個のサブバンドの前記量子化スペクトル係数に従って、2回目の符号化が実行されるべきm個のベクトルを決定するステップであって、jは正の数であり、mは正の整数である、ステップと、
    前記m個のベクトルのスペクトル係数に対して、2回目の符号化操作を実行するステップと、
    を更に有する、請求項2に記載の方法。
  4. 前記残りのビット数と、第2の飽和閾値jと、前記k個のサブバンドの前記量子化スペクトル係数に従って2回目の符号化が実行されるべきm個のベクトルを決定する前記ステップは、
    前記残りのビット数および前記第2の飽和閾値jに従って、2回目の符号化が実行されるべきベクトル数mを決定するステップと、
    前記k個のサブバンドの前記量子化スペクトル係数に従って、候補スペクトル係数を決定するステップであって、前記候補スペクトル係数は、前記k個のサブバンドの前記正規化スペクトル係数から前記k個のサブバンドの対応する前記量子化スペクトル係数を引くことによって得られるスペクトル係数を含む、ステップと、
    前記候補スペクトル係数が属するベクトルから前記m個のベクトルを選択するステップと、
    を有する、請求項3に記載の方法。
  5. 前記候補スペクトル係数が属するベクトルから前記m個のベクトルを選択する前記ステップは、
    前記候補スペクトル係数の属する前記ベクトルをソートして、ソートされたベクトルを取得するステップと、
    前記ソートされたベクトルから最初のm個のベクトルを選択するステップと、
    を有し、
    前記ソートされたベクトルは第1群のベクトルと第2群のベクトルとに分割され、前記第1群のベクトルは前記第2群のベクトルの前に配置され、前記第1群のベクトルは、前記k個のサブバンドの前記量子化スペクトル係数の属するベクトルにおいて値が全て0であるベクトルに対応し、前記第2群のベクトルは、前記k個のサブバンドの前記量子化スペクトル係数の属する前記ベクトルにおいて値の全てが0ではないベクトルに対応する、
    請求項4に記載の方法。
  6. 前記m個のベクトルのスペクトル係数に対して2回目の符号化操作を実行する前記ステップは、
    前記m個のベクトルの前記スペクトル係数の大域的ゲインを決定するステップと、
    前記m個のベクトルの前記スペクトル係数の前記大域的ゲインを用いて、前記m個のベクトルの前記スペクトル係数を正規化するステップと、
    前記m個のベクトルの正規化スペクトル係数を量子化するステップと、
    を有する、請求項3乃至5のいずれか一項に記載の方法。
  7. 利用可能なビット数および第1の飽和閾値iに従って、復号化されるべきサブバンド数kを決定するステップであって、iは正の数であり、kは正の整数である、ステップと、
    全てのサブバンドの復号化されたエンベロープに従って、前記全てのサブバンドからk個のサブバンドを選択するか、または、心理音響モデルに従って、前記全てのサブバンドからk個のサブバンドを選択するステップと、
    1回目の復号化操作を実行して、前記k個のサブバンドの量子化スペクトル係数を取得するステップと、
    を有する信号復号化方法。
  8. 前記1回目の復号化操作の後に前記利用可能なビット数のうちの残りのビット数が第1のビット数閾値以上である場合、前記残りのビット数および第2の飽和閾値jに従って、2回目の復号化が実行されるべきベクトルの数mを決定するステップであって、jは正の数であり、mは正の整数である、ステップと、
    2回目の復号化操作を実行して、前記m個のベクトルの正規化スペクトル係数を取得するステップと、
    を更に有する、請求項7に記載の方法。
  9. 前記m個のベクトルの前記正規化スペクトル係数と前記k個のサブバンドの前記量子化スペクトル係数との対応関係を決定するステップ、
    を更に有する、請求項8に記載の方法。
  10. 利用可能なビット数および第1の飽和閾値iに従って、符号化されるべきサブバンド数kを決定するように構成される決定ユニットであって、iは正の数であり、kは正の整数である、決定ユニットと、
    前記決定ユニットによって決定された前記サブバンド数kに従い、全てのサブバンドの量子化エンベロープに従って、前記全てのサブバンドからk個のサブバンドを選択するか、または、心理音響モデルに従って、前記全てのサブバンドからk個のサブバンドを選択するように構成される選択ユニットと、
    前記選択ユニットによって選択された前記k個のサブバンドのスペクトル係数に対して、1回目の符号化操作を実行するように構成される符号化ユニットと、
    を備える信号符号化装置。
  11. 前記符号化ユニットは、前記k個のサブバンドの前記スペクトル係数を正規化して、前記k個のサブバンドの正規化スペクトル係数を取得し、前記k個のサブバンドの前記正規化スペクトル係数を量子化して、前記k個のサブバンドの量子化スペクトル係数を取得するように構成される、
    請求項10に記載の装置。
  12. 前記選択ユニットは更に、前記1回目の符号化操作の後に前記利用可能なビット数のうちの残りのビット数が第1のビット数閾値以上である場合、前記残りのビット数と、第2の飽和閾値jと、前記k個のサブバンドの前記量子化スペクトル係数に従って、2回目の符号化が実行されるべきm個のベクトルを決定するように構成され、jは正の数であり、mは正の整数であり、
    前記符号化ユニットは更に、前記選択ユニットによって決定された前記m個のベクトルのスペクトル係数に対して、2回目の符号化操作を実行するように構成される、
    請求項11に記載の装置。
  13. 前記選択ユニットは、前記残りのビット数および前記第2の飽和閾値jに従って、符号化されるべきベクトル数mを決定するように構成され、前記k個のサブバンドの前記量子化スペクトル係数に従って、候補スペクトル係数を決定するように構成され、前記候補スペクトル係数は、前記k個のサブバンドの前記正規化スペクトル係数から前記k個のサブバンドの対応する前記量子化スペクトル係数を引くことによって得られるスペクトル係数を含み、前記候補スペクトル係数が属するベクトルから前記m個のベクトルを選択するように構成される、
    請求項12に記載の装置。
  14. 前記選択ユニットは、前記候補スペクトル係数の属する前記ベクトルをソートして、ソートされたベクトルを取得するように構成され、前記ソートされたベクトルから最初のm個のベクトルを選択するように構成され、前記ソートされたベクトルは第1群のベクトルと第2群のベクトルとに分割され、前記第1群のベクトルは前記第2群のベクトルの前に配置され、前記第1群のベクトルは、前記k個のサブバンドの前記量子化スペクトル係数の属するベクトルにおいて値が全て0であるベクトルに対応し、前記第2群のベクトルは、前記k個のサブバンドの前記量子化スペクトル係数の属する前記ベクトルにおいて値の全てが0ではないベクトルに対応する、
    請求項13に記載の装置。
  15. 前記符号化ユニットは、前記m個のベクトルの前記スペクトル係数の大域的ゲインを決定し、前記m個のベクトルの前記スペクトル係数の前記大域的ゲインを用いて、前記m個のベクトルの前記スペクトル係数を正規化し、前記m個のベクトルの正規化スペクトル係数を量子化するように構成される、
    請求項12乃至14のいずれか一項に記載の装置。
  16. 利用可能なビット数および第1の飽和閾値iに従って、復号化されるべきサブバンド数kを決定するように構成される第1の決定ユニットであって、iは正の数であり、kは正の整数である、第1の決定ユニットと、
    前記第1の決定ユニットによって決定された前記サブバンド数kに従い、全てのサブバンドの復号化されたエンベロープに従って、前記全てのサブバンドからk個のサブバンドを選択するか、または、心理音響モデルに従って、前記全てのサブバンドからk個のサブバンドを選択するように構成される選択ユニットと、
    1回目の復号化操作を実行して、前記選択ユニットによって選択された前記k個のサブバンドの量子化スペクトル係数を取得するように構成される復号化ユニットと、
    を備える信号復号化装置。
  17. 前記第1の決定ユニットは更に、前記1回目の復号化の後に前記利用可能なビット数のうちの残りのビット数が第1のビット数閾値以上である場合、前記残りのビット数と、第2の飽和閾値jと、第1群の復号化されたスペクトル係数とに従って、2回目の復号化が実行されるべきベクトルの数mを決定するように構成され、jは正の数であり、mは正の整数であり、
    前記復号化ユニットは更に、2回目の復号化操作を実行して、前記m個のベクトルの正規化スペクトル係数を取得するように構成される、
    請求項16に記載の装置。
  18. 前記m個のベクトルの前記正規化スペクトル係数と前記k個のサブバンドの前記量子化スペクトル係数との対応関係を決定するように構成される第2の決定ユニット、
    を更に備える、請求項17に記載の装置。
  19. 請求項1乃至6のいずれか一項に記載の方法をコンピューターに実行させるプログラムが記録されたコンピューター可読記憶媒体。
  20. 請求項7乃至9のいずれか一項に記載の方法をコンピューターに実行させるプログラムが記録されたコンピューター可読記憶媒体。
JP2016522220A 2013-07-01 2014-06-25 信号の符号化および復号化の方法および装置 Active JP6289627B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201310271015.7 2013-07-01
CN201310271015.7A CN104282312B (zh) 2013-07-01 2013-07-01 信号编码和解码方法以及设备
PCT/CN2014/080682 WO2015000373A1 (zh) 2013-07-01 2014-06-25 信号编码和解码方法以及设备

Publications (2)

Publication Number Publication Date
JP2016527546A JP2016527546A (ja) 2016-09-08
JP6289627B2 true JP6289627B2 (ja) 2018-03-14

Family

ID=52143091

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016522220A Active JP6289627B2 (ja) 2013-07-01 2014-06-25 信号の符号化および復号化の方法および装置

Country Status (18)

Country Link
US (2) US10152981B2 (ja)
EP (1) EP2988299A4 (ja)
JP (1) JP6289627B2 (ja)
KR (2) KR20160003264A (ja)
CN (2) CN104282312B (ja)
AU (1) AU2014286765B2 (ja)
BR (1) BR112015030852A2 (ja)
CA (1) CA2912477C (ja)
CL (1) CL2015003765A1 (ja)
HK (1) HK1206136A1 (ja)
IL (1) IL242498B (ja)
MX (1) MX359502B (ja)
MY (1) MY163240A (ja)
NZ (1) NZ714187A (ja)
RU (1) RU2633097C2 (ja)
SG (1) SG11201509391RA (ja)
UA (1) UA113041C2 (ja)
WO (1) WO2015000373A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106409303B (zh) 2014-04-29 2019-09-20 华为技术有限公司 处理信号的方法及设备
CN112751953A (zh) * 2019-10-31 2021-05-04 北京小米移动软件有限公司 电子设备、控制方法、装置及存储介质
CN113140225B (zh) * 2020-01-20 2024-07-02 腾讯科技(深圳)有限公司 语音信号处理方法、装置、电子设备及存储介质
CN117476013A (zh) * 2022-07-27 2024-01-30 华为技术有限公司 音频信号的处理方法、装置、存储介质及计算机程序产品

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5235671A (en) 1990-10-15 1993-08-10 Gte Laboratories Incorporated Dynamic bit allocation subband excited transform coding method and apparatus
KR100188912B1 (ko) * 1992-09-21 1999-06-01 윤종용 서브밴드코딩의 비트재할당 방법
KR100269213B1 (ko) 1993-10-30 2000-10-16 윤종용 오디오신호의부호화방법
KR0144011B1 (ko) * 1994-12-31 1998-07-15 김주용 엠펙 오디오 데이타 고속 비트 할당 및 최적 비트 할당 방법
JP3519859B2 (ja) * 1996-03-26 2004-04-19 三菱電機株式会社 符号器及び復号器
JP3235543B2 (ja) 1997-10-22 2001-12-04 松下電器産業株式会社 音声符号化/復号化装置
US6148283A (en) 1998-09-23 2000-11-14 Qualcomm Inc. Method and apparatus using multi-path multi-stage vector quantizer
JP2005010337A (ja) * 2003-06-18 2005-01-13 Sony Corp 音声信号圧縮方法及び音声信号圧縮装置
WO2006116025A1 (en) * 2005-04-22 2006-11-02 Qualcomm Incorporated Systems, methods, and apparatus for gain factor smoothing
US8396717B2 (en) * 2005-09-30 2013-03-12 Panasonic Corporation Speech encoding apparatus and speech encoding method
EP1989707A2 (fr) 2006-02-24 2008-11-12 France Telecom Procede de codage binaire d'indices de quantification d'une enveloppe d'un signal, procede de decodage d'une enveloppe d'un signal et modules de codage et decodage correspondants
JP4396683B2 (ja) * 2006-10-02 2010-01-13 カシオ計算機株式会社 音声符号化装置、音声符号化方法、及び、プログラム
JPWO2008084688A1 (ja) * 2006-12-27 2010-04-30 パナソニック株式会社 符号化装置、復号装置及びこれらの方法
CN101105940A (zh) * 2007-06-27 2008-01-16 北京中星微电子有限公司 音频编解码的量化方法、反变换方法及音频编解码装置
CN101377926B (zh) * 2007-08-31 2012-06-27 瑞昱半导体股份有限公司 加速量化循环程序功能的音频编码方法
KR20090122142A (ko) * 2008-05-23 2009-11-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
WO2010031003A1 (en) * 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
JP5608660B2 (ja) * 2008-10-10 2014-10-15 テレフオンアクチーボラゲット エル エム エリクソン(パブル) エネルギ保存型マルチチャネルオーディオ符号化
CN101494054B (zh) * 2009-02-09 2012-02-15 华为终端有限公司 一种音频码率控制方法及系统
CN103366755B (zh) * 2009-02-16 2016-05-18 韩国电子通信研究院 对音频信号进行编码和解码的方法和设备
CN101853663B (zh) 2009-03-30 2012-05-23 华为技术有限公司 比特分配方法、编码装置及解码装置
FR2947944A1 (fr) * 2009-07-07 2011-01-14 France Telecom Codage/decodage perfectionne de signaux audionumeriques
US8380524B2 (en) * 2009-11-26 2013-02-19 Research In Motion Limited Rate-distortion optimization for advanced audio coding
CN102081927B (zh) 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
EP2362375A1 (en) 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an audio signal using harmonic locking
US9508356B2 (en) 2010-04-19 2016-11-29 Panasonic Intellectual Property Corporation Of America Encoding device, decoding device, encoding method and decoding method
AU2011358654B2 (en) * 2011-02-09 2017-01-05 Telefonaktiebolaget L M Ericsson (Publ) Efficient encoding/decoding of audio signals
TWI606441B (zh) 2011-05-13 2017-11-21 三星電子股份有限公司 解碼裝置
RU2464649C1 (ru) 2011-06-01 2012-10-20 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ обработки звукового сигнала

Also Published As

Publication number Publication date
US10789964B2 (en) 2020-09-29
NZ714187A (en) 2017-01-27
MX359502B (es) 2018-09-26
BR112015030852A2 (pt) 2017-07-25
KR20160003264A (ko) 2016-01-08
EP2988299A4 (en) 2016-05-25
KR20170089982A (ko) 2017-08-04
RU2633097C2 (ru) 2017-10-11
EP2988299A1 (en) 2016-02-24
CA2912477A1 (en) 2015-01-08
CN108198564A (zh) 2018-06-22
AU2014286765A1 (en) 2015-12-03
IL242498B (en) 2021-05-31
WO2015000373A1 (zh) 2015-01-08
CA2912477C (en) 2019-04-09
MX2015017743A (es) 2016-04-04
US20160111104A1 (en) 2016-04-21
US20190057706A1 (en) 2019-02-21
RU2015156053A (ru) 2017-08-07
JP2016527546A (ja) 2016-09-08
CL2015003765A1 (es) 2016-09-23
CN108198564B (zh) 2021-02-26
MY163240A (en) 2017-08-30
US10152981B2 (en) 2018-12-11
UA113041C2 (uk) 2016-11-25
CN104282312A (zh) 2015-01-14
HK1206136A1 (en) 2015-12-31
SG11201509391RA (en) 2015-12-30
AU2014286765B2 (en) 2017-03-02
CN104282312B (zh) 2018-02-23

Similar Documents

Publication Publication Date Title
JP6321734B2 (ja) 音声信号の符号化と復号化の方法および装置
JP6364518B2 (ja) オーディオ信号符号化及び復号化方法並びにオーディオ信号符号化及び復号化装置
JP6351783B2 (ja) オーディオ信号のビットを割り当てる方法及び装置
EP2863388B1 (en) Bit allocation method and device for audio signal
US10789964B2 (en) Dynamic bit allocation methods and devices for audio signal
WO2012005210A1 (ja) 符号化方法、復号方法、装置、プログラムおよび記録媒体
RU2702265C1 (ru) Способ и устройство обработки сигналов
JP7257965B2 (ja) デジタルオーディオ信号における差分データ

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170509

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170807

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180206

R150 Certificate of patent or registration of utility model

Ref document number: 6289627

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250