JP6317387B2

JP6317387B2 - 加重値関数決定方法

Info

Publication number: JP6317387B2
Application number: JP2016077549A
Authority: JP
Inventors: ソン，ホ−サン; オ，ウン−ミ
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2010-10-18
Filing date: 2016-04-07
Publication date: 2018-04-25
Anticipated expiration: 2031-10-18
Also published as: CA2814944A1; JP5918249B2; JP2018120241A; EP3869508A1; JP2016130868A; US20170358309A1; CN105825860B; EP3869508C0; WO2012053798A2; MY165854A; US10580425B2; KR101747917B1; KR20120039865A; JP2013541737A; CA2814944C; CA2958164C; CN105825861B; CN103262161A; ES2947874T3; US9311926B2

Description

本発明は、線形予測符号化（ＬＰＣ：linear predictive coding）係数を量子化するための加重値関数を決定する装置及びその方法に係り、さらに具体的には、線形予測（ＬＰ：linear prediction）技術で、線形予測符号化係数の量子化効率を向上させるために、低複雑度を有する加重値関数を決定する装置及びその方法に関する。

従来、音声信号及びオーディオ信号を符号化するために、線形予測符号化が適用された。線形予測のために、ＣＥＬＰ（code excited linear prediction）符号化技術が使用されたが、ＣＥＬＰ符号化技術は、入力信号に係わる線形予測符号化係数と、励起信号（excited signal）とを必要とする。入力信号を符号化するとき、ＬＰＣ係数は量子化される。しかし、ＬＰＣ係数をそれ自体で量子化することは、ダイナミックレンジが狭く、安定度確認が困難であるという問題点がある。

また、復号化段階で、入力信号を復元するためのコードブック・インデックスを選択しなければならないが、全てのＬＰＣ係数を同一の重要度にして量子化する場合、最終合成された入力信号の品質の劣化が発生することがある。すなわち、全てのＬＰＣ係数は重要度が異なるので、重要なＬＰＣ係数のエラーが小さくてこそ、最終合成された入力信号の品質が向上するが、かような重要度が異なるという点を考慮せずに、同一の重要度を適用して量子化すれば、入力信号の品質は落ちてしまう。

従って、ＬＰＣ係数を効率的に量子化し、復号化器を介して入力信号を復元するとき、合成信号の品質を向上させる方法が要求される。何よりも類似した複雑度で優秀なコーディング性能を示す技術が必要である。

本発明の一実施形態による装置は、入力信号の中間サブフレーム（mid-subframe）の線形予測符号化（ＬＰＣ）係数を線スペクトル周波数（ＬＳＦ：line spectral frequency）係数またはイミッタンススペクトル周波数（ＩＳＦ：immittance spectral frequency）係数のうちいずれか一つに変換する第１係数変換部と、前記変換されたＩＳＦ係数またはＬＳＦ係数を利用して、前記中間サブフレームのＬＰＣ係数の重要度と係わる加重値関数を決定する加重値関数決定部と、前記決定された加重値関数を利用して、前記変換されたＩＳＦ係数またはＬＳＦ係数を量子化する量子化部と、少なくとも１つのプロセッサを使用して、前記量子化されたＩＳＦ係数またはＬＳＦ係数を、量子化されたＬＰＣ係数に変換する第２係数変換部と、を含み、前記量子化されたＬＰＣ係数は前記装置のエンコーダに出力されもする。

本発明の一実施形態による方法は、入力信号の中間サブフレームの線形予測符号化（ＬＰＣ）係数を線スペクトル周波数（ＬＳＦ）係数またはイミッタンススペクトル周波数（ＩＳＦ）係数のうちいずれか一つに変換する段階と、前記変換されたＩＳＦ係数またはＬＳＦ係数を利用して、前記中間サブフレームのＬＰＣ係数の重要度と係わる加重値関数を決定する段階と、前記決定された加重値関数を利用して、前記変換されたＩＳＦ係数またはＬＳＦ係数を量子化する段階と、少なくとも１つのプロセッサを使用して、前記量子化されたＩＳＦ係数またはＬＳＦ係数を、量子化されたＬＰＣ係数に変換する段階と、を含み、前記量子化されたＬＰＣ係数は、エンコーダに出力されもする。

本発明の一実施形態による装置は、線形予測符号化（ＬＰＣ）係数に対応する線スペクトル周波数（ＬＳＦ）係数またはイミッタンススペクトル周波数（ＩＳＦ）係数を利用して、入力信号の中間サブフレームのＬＰＣ係数の重要度と係わる加重値関数を決定する加重値関数決定部と、前記決定された加重値関数を利用して、前記変換されたＩＳＦ係数またはＬＳＦ係数を量子化する量子化部と、少なくとも１つのプロセッサを使用して、前記量子化されたＩＳＦ係数またはＬＳＦ係数を、量子化されたＬＰＣ係数に変換する第２係数変換部と、を含み、前記量子化されたＬＰＣ係数は、前記装置のエンコーダに出力されもする。
本発明の一実施形態による方法は、線形予測符号化（ＬＰＣ）係数に対応する線スペクトル周波数（ＬＳＦ）係数またはイミッタンススペクトル周波数（ＩＳＦ）係数を利用して、入力信号の中間サブフレームのＬＰＣ係数の重要度と係わる加重値関数を決定する段階と、前記決定された加重値関数を利用して、前記変換されたＩＳＦ係数またはＬＳＦ係数を量子化する段階と、少なくとも１つのプロセッサを使用して、前記量子化されたＩＳＦ係数またはＬＳＦ係数を、量子化されたＬＰＣ係数に変換する段階と、を含み、前記量子化されたＬＰＣ係数は、エンコーダに出力されもする。

本発明の一実施形態によれば、前記方法を遂行するためのプログラムが記録されていることを特徴とするコンピュータで読み取り可能な命令語が記録されていることを特徴とするコンピュータで読み取り可能な記録媒体が提供される。

本発明の一実施形態によるオーディオ信号符号化装置の全体構成を図示した図面である。本発明の一実施形態による図１のＬＰＣ係数量子化部の詳細構成を図示した図面である。本発明の一実施形態によるＬＰＣ係数を量子化する過程を図示した図面である。本発明の一実施形態によるＬＰＣ係数を量子化する過程を図示した図面である。本発明の一実施形態によるＬＰＣ係数を量子化する過程を図示した図面である。本発明の一実施形態によって、図２の加重値関数決定部が加重値関数を決定する過程を図示した図面である。本発明の一実施形態による符号化モード、入力信号の帯域幅情報を利用して、加重値関数を決定する過程を図示した図面である。本発明の一実施形態によって、ＬＰＣ係数を変換したＩＳＦを図示した図面である。本発明の一実施形態によって、符号化モードによる加重値関数を図示した図面である。本発明の一実施形態によって、符号化モードによる加重値関数を図示した図面である。本発明の他の一実施形態によって、図２の加重値関数決定部が加重値関数を決定する過程を図示した図面である。本発明の一実施形態によって、中間サブフレームのＬＰＣ符号化方式を説明するための図面である。

本発明の一実施形態による装置は、入力信号の中間サブフレーム（mid-subframe）の線形予測符号化（ＬＰＣ：linear predictive coding）係数を線スペクトル周波数（ＬＳＦ：line spectral frequency）係数またはイミッタンススペクトル周波数（ＩＳＦ：immittance spectral frequency：ＩＳＦ）係数のうちいずれか一つに変換する第１係数変換部と、前記変換されたＩＳＦ係数またはＬＳＦ係数を利用して、前記中間サブフレームのＬＰＣ係数の重要度と係わる加重値関数を決定する加重値関数決定部と、前記決定された加重値関数を利用して、前記変換されたＩＳＦ係数またはＬＳＦ係数を量子化する量子化部と、少なくとも１つのプロセッサを使用して、前記量子化されたＩＳＦ係数またはＬＳＦ係数を、量子化されたＬＰＣ係数に変換する第２係数変換部と、を含み、前記量子化されたＬＰＣ係数は、前記装置のエンコーダに出力されもする。

本発明の一実施形態による装置の加重値関数決定部は、前記ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数の周波数に対応する補間されたスペクトルサイズ（interpolated spectrum magnitude）を利用して、前記ＩＳＦ係数またはＬＳＦ係数に係わる加重値関数を決定することができる。

本発明の一実施形態による装置の加重値関数決定部は、前記ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数の周波数に対応するＬＰＣスペクトルサイズを利用して、前記ＩＳＦ係数またはＬＳＦ係数に係わる加重値関数を決定することができる。

本発明の一実施形態による方法は、入力信号の中間サブフレームの線形予測符号化（ＬＰＣ）係数を、線スペクトル周波数（ＬＳＦ）係数またはイミッタンススペクトル周波数（ＩＳＦ）係数のうちいずれか一つに変換する段階と、前記変換されたＩＳＦ係数またはＬＳＦ係数を利用して、前記中間サブフレームのＬＰＣ係数の重要度と係わる加重値関数を決定する段階と、前記決定された加重値関数を利用して、前記変換されたＩＳＦ係数またはＬＳＦ係数を量子化する段階と、少なくとも１つのプロセッサを使用して、前記量子化されたＩＳＦ係数またはＬＳＦ係数を、量子化されたＬＰＣ係数に変換する段階と、を含み、前記量子化されたＬＰＣ係数は、エンコーダに出力されもする。

本発明の一実施形態による方法で、加重値関数を決定する段階は、前記ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数の周波数に対応する補間されたスペクトルサイズを利用して、前記ＩＳＦ係数またはＬＳＦ係数に係わる加重値関数を決定することができる。

本発明の一実施形態による方法で加重値関数を決定する段階は、前記ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数の周波数に対応するＬＰＣスペクトルサイズを利用して、前記ＩＳＦ係数またはＬＳＦ係数に係わる加重値関数を決定することができる。

本発明の一実施形態によれば、ＬＰＣ係数をＩＳＦ係数またはＬＳＦ係数に変換して量子化することにより、ＬＰＣ係数の量子化効率を向上させることができる。本発明の一実施形態によれば、ＬＰＣ係数の重要度と係わる加重値関数を決定することにより、ＬＰＣ係数の重要度による合成信号の品質を向上させることができる。

本発明の一実施形態によれば、中間サブフレームのＬＰＣ係数を量子化するために、現在フレームのＬＰＣ係数を量子化するための加重値関数と、以前フレームのＬＰＣ係数を量子化するための加重値関数とを補間することにより、入力信号の品質を向上させることができる。

本発明の一実施形態によれば、ＩＳＦまたはＬＳＦが、実際に入力信号のスペクトル包絡線に影響を及ぼすことを示すサイズ別加重値関数だけではなく、周波数ドメインでの知覚的な特性と、フォルマント（formant）の分布とを考慮した周波数別加重値関数を組み合わせることにより、ＬＰＣ係数の量子化効率を向上させることができ、ＬＰＣ係数に係わる加重値が正確に導き出される。

本発明の一実施形態による装置は、線形予測符号化（ＬＰＣ）係数に対応する線スペクトル周波数（ＬＳＦ）係数またはイミッタンススペクトル周波数（ＩＳＦ）係数を利用して、入力信号の中間サブフレームのＬＰＣ係数の重要度と係わる加重値関数を決定する加重値関数決定部と、前記決定された加重値関数を利用して、前記変換されたＩＳＦ係数またはＬＳＦ係数を量子化する量子化部と、少なくとも１つのプロセッサを使用して、前記量子化されたＩＳＦ係数またはＬＳＦ係数を、量子化されたＬＰＣ係数に変換する第２係数変換部と、を含み、前記量子化されたＬＰＣ係数は、前記装置のエンコーダに出力されてもよい。

本発明の一実施形態による方法は、線形予測符号化（ＬＰＣ）係数に対応する線スペクトル周波数（ＬＳＦ）係数またはイミッタンススペクトル周波数（ＩＳＦ）係数を利用して、入力信号の中間サブフレームのＬＰＣ係数の重要度と係わる加重値関数を決定する段階と、前記決定された加重値関数を利用して、前記変換されたＩＳＦ係数またはＬＳＦ係数を量子化する段階と、少なくとも１つのプロセッサを使用して、前記量子化されたＩＳＦ係数またはＬＳＦ係数を、量子化されたＬＰＣ係数に変換する段階と、を含み、前記量子化されたＬＰＣ係数は、エンコーダに出力されてもよい。

本発明の一実施形態によれば、実施形態の方法を遂行するためのプログラムが記録されていることを特徴とするコンピュータで読み取り可能な記録媒体を提供することができる。

以下、添付された図面に記載した内容を参照して、本発明による実施形態について詳細に説明する。ただし、本発明が実施形態によって制限されたり、あるいは限定されるものではない。各図面に提示された同一の参照符号は、同一の部材を示す。

図１は、本発明の一実施形態によるオーディオ信号符号化装置の全体構成を図示した図面である。図１を参照すれば、本発明の一実施形態によるオーディオ信号符号化装置１００は、前処理部１０１、スペクトル分析部１０２、ＬＰＣ係数抽出部及びオープンループピッチ分析部１０３、符号化モード選択部１０４、ＬＰＣ係数量子化部１０５、符号化部１０６、エラー復元部１０７及びビットストリーム生成部１０８を含む。このとき、オーディオ信号符号化装置１００は、スピーチ（speech）信号に適用されてもよい。

前処理部１０１は、入力信号を前処理（pre-processing）することができる。これを介して、入力信号は、符号化のための準備が完了する。具体的には、前処理部１０１は、ハイパスフィルタ（high pass filtering）、プリエンファシス（pre-emphasis）及びサンプリング（sampling）変換の過程を介して、入力信号を前処理することができる。

スペクトル分析部１０２は、時間−周波数マッピング（time-to-frequency mapping）過程を介して、入力信号に係わる周波数ドメインの特性を分析することができる。そして、スペクトル分析部１０２は、音声活動度探索（voice activity detection）過程を介して、入力信号が、活性信号（active signal）であるか、あるいは黙音（mute）であるかを決定することができる。また、スペクトル分析部１０２は、入力信号で背景ノイズを除去することができる。

ＬＰＣ係数抽出部及びオープンループピッチ分析部１０３は、入力信号の線形予測（ＬＰ）分析を介して、線形予測符号化係数（ＬＰＣ係数）を抽出することができる。一般的に、フレーム当たり１回の線形予測分析が実行されるが、追加的な音質向上のために、２回以上の線形予測分析が実行されてもよい。この場合、１回は、既存の線形予測分析であるフレームエンド（frame-end）のための線形予測であり、残りは、音質向上のための中間サブフレーム（mid-subframe）のための線形予測が追加される。このとき、現在フレームのフレームエンドは、現在フレームを構成するサブフレームのうち最後のサブフレームを意味し、以前フレームのフレームエンドは、以前フレームを構成するサブフレームのうち最後のサブフレームを意味する。

ここで、中間サブフレームは、以前フレームのフレームエンドである最後のサブフレームと、現在フレームのフレームエンドである最後のサブフレームとの間に存在するサブフレームのうち一つ以上のサブフレームを意味する。それにより、ＬＰＣ係数抽出部及びオープンループピッチ分析部１０３は、全２セット以上のＬＰＣ係数を抽出することができる。

そして、ＬＰＣ係数抽出部及びオープンループピッチ分析部１０３は、オープンループ（open-loop）を介して、入力信号のピッチ（pitch）を分析することができる。このとき、分析されたピッチ情報は、適応的なコードブック（adaptive codebook）探索に使用される。

符号化モード選択部１０４は、ピッチ情報、周波数ドメインの分析情報などを利用して、入力信号の符号化モード（coding mode）を選択することができる。一例として、入力信号は、generic mode、voiced mode、unvoiced modeまたはtransition modeに分類された符号化モードによって符号化される。

ＬＰＣ係数量子化部１０５は、ＬＰＣ係数抽出部及びオープンループピッチ分析部１０３で抽出されたＬＰＣ係数を量子化することができる。ＬＰＣ係数量子化部１０５については、図２ないし図９を介して具体的に説明する。

符号化部１０６は、選択された符号化モードによって、ＬＰＣ係数の励起（excitation）信号を符号化する。ＬＰＣ係数の励起信号を符号化するための代表的なパラメータは、adaptive codebook index、adaptive codebook gain、fixed codebook index、fixed codebook gainなどがある。このとき、符号化部１０６は、ＬＰＣ係数の励起信号をサブフレームの単位で符号化することができる。

エラー復元部１０７は、入力信号のフレームでエラーが発生したとき、フレームを復元したり、あるいは隠匿して、全体的な音質向上のための付加情報（side information）を抽出することができる。

ビットストリーム生成部１０８は、符号化された信号をビットストリームに生成することができる。このとき、ビットストリームは、保存や伝送の目的に使用される。

図２は、本発明の一実施形態による図１のＬＰＣ係数量子化部の詳細構成を図示した図面である。図２を参照すれば、２段階の量子化過程が遂行される。最初の段階は、ＬＰＣ係数量子化部２００が、現在フレームまたは以前フレームのフレームエンドのための線形予測に係わり、第２の段階は、音質向上のために、中間サブフレームのための線形予測を行うのである。

現在フレームまたは以前フレームのフレームエンドに係わるＬＰＣ係数量子化部２００は、第１係数変換部２０２、加重値関数決定部２０３、量子化部２０４及び第２係数変換部２０５を含むことができる。

第１係数変換部２０２は、入力信号の現在フレームまたは以前フレームのフレームエンドを線形予測分析して抽出された線形予測符号化（ＬＰＣ）係数を変換することができる。一例として、第１係数変換部２０２は、現在フレームまたは以前フレームのフレームエンドに係わるＬＰＣ係数を、線スペクトル周波数（ＬＳＦ）係数またはイミッタンススペクトル周波数（ＩＳＦ）係数のうちいずれか１つのフォーマットに変換することができる。このとき、ＩＳＦ係数やＬＳＦ係数は、ＬＰＣ係数をより容易に量子化することができるフォーマットを示す。

加重値関数決定部２０３は、ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数を利用して、前記現在フレームのフレームエンド及び以前フレームのフレームエンドに係わるＬＰＣ係数の重要度と係わる加重値関数（weighting function）を決定することができる。一例として、加重値関数決定部２０３は、サイズ別加重値関数と周波数別加重値関数とを決定することができる。そして、加重値関数決定部２０３は、周波数帯域、符号化モード及びスペクトル分析情報のうち少なくとも一つを考慮して、加重値関数を決定することができる。

一例として、加重値関数決定部２０３は、符号化モード別に最適の加重値関数を導き出すことができる。そして、加重値関数決定部２０３は、入力信号の周波数帯域によって、最適の加重値関数を導き出すことができる。また、加重値関数決定部２０３は、入力信号の周波数分析情報によって、最適の加重値関数を導き出すことができる。このとき、周波数分析情報は、スペクトルチルト情報を含んでもよい。

さて、加重値関数決定部２０３を介して導き出された現在フレームのフレームエンドのＬＰＣ係数を量子化するための加重値関数、及び以前フレームのフレームエンドのＬＰＣ係数を量子化するための加重値関数は、中間サブフレームのＬＰＣ係数を量子化するための加重値関数を決定するために、加重値関数決定部２０７に伝達される。

加重値関数決定部２０３の動作については、図４及び図８でさらに具体的に説明する。

量子化部２０４は、現在フレームのフレームエンド、または以前フレームのフレームエンドのＬＰＣ係数が変換されたＩＳＦ係数またはＬＳＦ係数に係わる加重値関数を利用して、変換されたＩＳＦ係数またはＬＳＦ係数を量子化することができる。量子化の結果、現在フレームまたは以前フレームのフレームエンドに係わる量子化されたＩＳＦ係数またはＬＳＦ係数のインデックスが導き出される。

そして、第２係数変換部２０５は、量子化されたＩＳＦ係数（ＱＩＳＦ）または量子化されたＬＳＦ係数（ＱＬＳＦ）を、量子化されたＬＰＣ係数（ＱＬＰＣ）に変換することができる。第２係数変換部２０５を介して導き出された量子化されたＬＰＣ係数は、単純なスペクトル情報を示すのではなく、反映係数（reflection coefficient）を示すので、固定された加重値が使用される。

図２を参照すれば、中間サブフレームに係わるＬＰＣ係数量子化部２０１は、第１係数変換部２０６、加重値関数決定部２０７、量子化部２０８及び第２係数変換部２０９を含んでもよい。

第１係数変換部２０６は、中間サブフレームのＬＰＣ係数を、ＩＳＦ係数またはＬＳＦ係数のうちいずれか一つに変換することができる。

加重値関数決定部２０７は、変換されたＩＳＦ係数またはＬＳＦ係数を利用して、中間サブフレームのＬＰＣ係数の重要度と係わる加重値関数を決定することができる。

一例として、加重値関数決定部２０７は、現在フレームのパラメータと、以前フレームのパラメータとを補間（interpolation）し、前記中間サブフレームのＬＰＣ係数を量子化するための加重値関数を決定することができる。具体的には、加重値関数決定部２０７は、以前フレームのフレームエンドのＬＰＣ係数を量子化するための第１加重値関数と、現在フレームのフレームエンドのＬＰＣ係数を量子化するための第２加重値関数とを補間し、中間サブフレームのＬＰＣ係数を量子化するための加重値関数を決定することができる。

このとき、加重値関数決定部２０７は、線形補間（linear-interpolation）及び非線形補間（non-linear interpolation）のうち少なくとも一つを利用して補間を行うことができる。具体的には、加重値関数決定部２０７は、（１）線形補間及び非線形補間を全ての寸法のベクトルに適用する方式、（２）サブベクトルごとに、線形補間と非線形補間とを異ならせて適用する方式、（３）それぞれのＬＰＣ係数によって、線形補間と非線形補間を異ならせて適用する方式のうちいずれか一つを遂行することができる。

そして、加重値関数決定部２０７は、現在フレームのフレームエンドに係わる第１加重値関数と、以前フレームのフレームエンドに係わる第２加重値関数との全体を利用して補間することもできるが、加重値関数を導き出す数式を分析し、一部の構成要素（component）を利用して補間することもできる。例えば、加重値関数決定部２０７は、サイズ別加重値関数を決定するのに使用されるスペクトル情報を、補間を介して求めることができる。

一例として、加重値関数決定部２０７は、ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数の周波数に対応する補間されたスペクトルサイズを利用して、前記ＩＳＦ係数またはＬＳＦ係数に係わる加重値関数を決定することができる。このとき、補間されたスペクトルサイズは、現在フレームのフレームエンドのスペクトルサイズと、以前フレームのフレームエンドのスペクトルサイズとが補間された結果であることを意味する。具体的には、加重値関数決定部２０７は、ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数の周波数と、周辺周波数に対応するスペクトルサイズとを利用して、中間サブフレームのＩＳＦ係数またはＬＳＦ係数に係わる加重値関数を決定することができる。このとき、加重値関数決定部２０７は、ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数の周波数と周辺周波数とに対応するスペクトルサイズの最大値、平均値または中間値を利用して加重値関数を決定することができる。

補間されたスペクトルサイズを利用して、加重値関数を決定する過程については、図５で具体的に説明する。

他の一例として、加重値関数決定部２０７は、ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数の周波数に対応するＬＰＣスペクトルサイズを利用して、ＩＳＦ係数またはＬＳＦ係数に係わる加重値関数を決定することができる。このとき、ＬＰＣスペクトルサイズは、中間サブフレームのＬＰＣ係数を周波数変換したＬＰＣスペクトルに基づいて決定される。具体的には、加重値関数決定部２０７は、ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数の周波数と周辺周波数とに対応するスペクトルサイズを利用して、ＩＳＦ係数またはＬＳＦ係数に係わる加重値関数を決定することができる。このとき、加重値関数決定部２０７は、ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数の周波数と周辺周波数とに対応するスペクトルサイズの最大値、平均値または中間値を利用して、加重値関数を決定することができる。

ＬＰＣスペクトルサイズを利用して、中間サブフレームに係わる加重値関数を決定する過程は、図８で具体的に説明する。

そして、加重値関数決定部２０７は、中間サブフレームの周波数帯域、符号化モード情報または周波数分析情報のうち少なくとも一つに基づいて、加重値関数を決定することができる。このとき、周波数分析情報は、スペクトルチルト情報を含んでもよい。

また、加重値関数決定部２０７は、ＬＰＣスペクトルサイズまたは補間されたスペクトルサイズのうち少なくとも一つに基づいて、決定されたサイズ別加重値関数と、周波数別加重値関数とを組み合わせ、最終的な加重値関数を決定することができる。このとき、周波数別加重値関数は、中間サブフレームのＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数の周波数に対応する加重値関数であり、バークスケール（bark scale）で表現されてもよい。

量子化部２０８は、中間サブフレームのＬＰＣ係数が変換されたＩＳＦ係数またはＬＳＦ係数に係わる加重値関数を利用して、変換されたＩＳＦ係数またはＬＳＦ係数を量子化することができる。量子化の結果、中間サブフレームに係わる量子化されたＩＳＦ係数またはＬＳＦ係数のインデックスが導き出される。

そして、第２係数変換部２０９は、量子化されたＩＳＦ係数（ＱＩＳＦ）または量子化されたＬＳＦ係数（ＱＬＳＦ）を、量子化されたＬＰＣ係数（ＱＬＰＣ）に変換することができる。第２係数変換部２０５を介して導き出された量子化されたＬＰＣ係数は、単純なスペクトル情報を示すものではなく、反映係数を示すので、固定された加重値が使用される。

以下では、ＬＰＣ係数と加重値関数との関係について具体的に説明する。

音声（speech）信号及びオーディオ信号を時間ドメインで符号化するとき、使用可能な技術のうち一つとして、線形予測（ＬＰＣ）がある。線形予測技術は、短区間予測（short-term prediction）を意味する。このとき、線形予測の結果は、時間ドメインでは、隣接したサンプル間の相関度（correlation）で示し、周波数ドメインでは、スペクトル包絡線で示す。

線形予測技術を応用した符号化技術として、ＣＥＬＰ（code excited linear prediction）技術がある。ＣＥＬＰ技術を使用する音声符号化技術は、Ｇ．７２９、ＡＭＲ(adaptive multi-rate)、ＡＭＲ−ＷＢ（wideband）、ＥＶＲＣ（enhanced variable rate codec）などがある。ＣＥＬＰ技術を利用して、音声及びオーディオ信号を符号化するために、ＬＰＣ係数と励起信号とが必要である。

ＬＰＣ係数は、隣接したサンプル間の相関度を示し、スペクトルピークで表現される。もしＬＰＣ係数の次数が１６次である場合、最大１６個のサンプル間の相関度が導き出される。ＬＰＣ係数の次数は、入力信号の帯域幅によって決定され、一般的に、音声信号の特性によって決定される。このとき、音声信号の主な発声は、フォルマント（formant）の大きさ及び位置によって決定される。入力信号のフォルマントを表現するために、狭帯域（ＮＢ：narrow band：ＮＢ）である３００〜３，４００Ｈｚ区間の入力信号については、１０次のＬＰＣ係数が使用される。そして、広帯域（ＷＢ：wide band）である５０〜７，０００Ｈｚ区間の入力信号については、１６〜２０次のＬＰＣ係数が使用される。

下記数式（１）は、合成フィルタＨ（ｚ）を示すものであり、ａ_ｊは、ＬＰＣ係数を意味し、ｐは、ＬＰＣ係数の次数を意味する。

下記数式（２）は、復号化器で合成された合成信号を意味する。

このとき、

は、合成信号を意味し、

は、励起信号を意味する。そして、Ｎは、同一の係数を利用する符号化フレームの大きさを意味する。このとき、励起信号は、adaptive codebookとfixed codebookとの和として決定される。復号化装置では、復号化された励起信号と量子化されたＬＰＣ係数とを利用して、合成信号を作る。

ＬＰＣ係数は、スペクトルピーク（spectrum peak）として現れるスペクトルのフォルマント情報を表現し、全体スペクトルの包絡線（envelope）を符号化することに使用される。このとき、符号化装置は、ＬＰＣ係数の量子化効率を高めるために、ＬＰＣ係数を、ＩＳＦまたはＬＳＦに変換することができる。

ＩＳＦは、簡単な安定度確認を介して、量子化による発散を防止することができる。もし安定度に問題が発生する場合、量子化されたＩＳＦの間隔を調節することにより、安定度の問題が解決されてもよい。そして、ＬＳＦは、ＩＳＦと違い最後の係数が反映係数である点で違いがあるのみ、残りの特性は同一である。ここで、ＩＳＦまたはＬＳＦは、ＬＰＣ係数から変換された係数であるので、ＬＰＣ係数のスペクトルのフォルマント情報を同一に維持している。

具体的には、ＬＰＣ係数の量子化は、ＬＰＣ係数を、ダイナミックレンジ（dynamic range）が狭く、安定度（stability）確認が容易であり、補間に有利なＩＳＰやＬＳＰに変換した後で遂行されてもよい。ＩＳＰ（immittance spectral pair）やＬＳＰ（line spectral pair）は、ＩＳＦやＬＳＦで表現されてもよい。下記数式（３）は、ＩＳＦとＩＳＰとの関係、またはＬＳＦとＬＳＰとの関係を意味する。

ここで、ｑ_ｉは、ＬＳＰまたはＩＳＰであり、ω_ｉは、ＬＳＦまたはＩＳＦを意味する。ＬＳＦは、量子化効率のために、ベクトル量子化されてもよい。効率を向上させるために、ＬＳＦは、予測ベクトル量子化されてもよい。ベクトル量子化を行う場合、dimensionが高くなれば、ビット効率が向上するが、コードブック・サイズが大きくなり、処理速度が落ちることがある。そのために、マルチステージ・ベクトル量子化（multi-stage vector quantization）を行ったり、スプリットベクトル量子化（split vector quantization）を介して、コードブックのサイズが小さくなる。

ベクトル量子化は、ベクトル内のエントリ（entry）いずれも同一の重要度であると見なし、squared error distance measureを利用して、最も少ないエラーを有するコードブック・インデックスを選択する過程を意味する。しかし、ＬＰＣ係数において、全ての係数の重要度が異なるので、重要な係数のエラーを減少させ、最終合成された信号の知覚的な品質（perceptual quality）が向上するのである。従って、ＬＳＦ係数を量子化するとき、復号化装置は、各ＬＰＣ係数の重要度を表現する加重値関数（weighting function）をsquared error distance measureに適用し、最適のコードブック・インデックスを選択することにより、合成信号の性能を向上させることができる。

本発明の一実施形態によれば、ＩＳＦやＬＳＦの周波数情報と、実際のスペクトルサイズとを利用して、各ＩＳＦまたは各ＬＳＦが、実際にスペクトル包絡線にいかなる影響を与えるかに係わるサイズ別加重値関数を決定することができる。そして、本発明の一実施形態によれば、周波数ドメインの知覚的な特性及びフォルマントの分布を考慮した周波数別加重値関数を、サイズ別加重値関数と組み合わせ、追加的な量子化効率を得ることができる。また、本発明の一実施形態によれば、実際周波数ドメインの大きさを使用するので、全体周波数の包絡線情報が好ましく反映され、各ＩＳＦ係数または各ＬＳＦ係数の加重値を正確に導き出すことができる。

結局、本発明の一実施形態によれば、ＬＰＣ係数を変換したＩＳＦまたはＬＳＦをベクトル量子化するとき、各係数の重要度が異なる場合、ベクトル内で、いかなるエントリが相対的にさらに重要であるかを示す加重値関数を決定することができる。そして、符号化しようとするフレームのスペクトルを分析し、エネルギーが大きい部分にさらに大きい加重値を与えることができる加重値関数を決定することにより、符号化の正確度を向上させることができる。スペクトルのエネルギーが大きいということは、時間ドメインで、相関度が高いということを意味する。

図３Ａ、図３Ｂ、図３Ｃは、本発明の一実施形態によるＬＰＣ係数を量子化する過程を図示した図面である。

図３Ａ、図３Ｂ、図３Ｃを参照すれば、２種形態のＬＰＣ係数を量子化する過程が図示されている。図３Ａは、入力信号の変動性が大きい場合に適用され、図３Ｂは、入力信号の変動性が小さい場合に適用される。入力信号の特性によって、図３Ａと図３Ｂは、スイッチングされて適用されてもよい。そして、図３Ａ、図３Ｂ、図３Ｃは、中間サブフレームのＬＰＣ係数を量子化する過程を示す。

ＬＰＣ係数量子化部３０１は、ＳＱ（scalar quantization）、ＶＱ（vector quantization）、ＳＶＱ（split-vector quantization)、ＭＳＶＱ(multi-stage vector quantization）を介して、ＩＳＦを量子化することができる。ＬＳＦも同一に適用されてもよい。

予測部３０２は、ＡＲ（auto regressive）予測やＭＡ（moving average）予測を行うことができる。このとき、予測次数は、１以上の定数を意味する。

下記数式（４）は、図３Ａを介して量子化されたＩＳＦを介して、コードブック・インデックスを探索するためのエラー関数を意味する。そして、下記数式（５）は、図３Ｂを介して量子化されたＩＳＦを介して、コードブック・インデックスを探索するためのエラー関数を意味する。コードブック・インデックスは、エラー関数を最小化する値を意味する。

また、下記数式（６）は、図３Ｃで、ＩＴＵ−Ｔ（International Telecommunication Union-Telecommunication sector）Ｇ．７１８で使用される中間サブフレームの量子化を介して導き出されたエラー関数を意味する。数式（６）を参考にすれば、現在フレームのフレームエンドについて量子化されたＩＳＦ値

と、以前フレームのフレームエンドについて量子化されたＩＳＦ値

を利用し、中間サブフレームの量子化の結果に係わるエラーを最小化するinterpolation weight setのインデックスが導き出される。

ここで、ｗ（ｎ）は、加重値関数を意味し、ｚ（ｎ）は、図３で、ＩＳＦ（ｎ）からmean値を除外したベクトルである。ｃ（ｎ）は、コードブックを示す。ｐは、ＩＳＦ係数の次数を意味し、ＮＢ（narrow band）では、通常１０、ＷＢ（wide band）では、通常１６〜２０を使用する。

本発明の一実施形態によれば、符号化装置は、ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数の周波数にあたるスペクトルサイズ（spectrum magnitude）を利用したサイズ別加重値関数と、入力信号の知覚的な特性及びフォルマント分布を考慮した周波数別加重値関数とを組み合わせ、最適の加重値関数を決定することができる。

図４は、本発明の一実施形態によって、図２の加重値関数決定部が加重値関数を決定する過程を図示した図面である。図４を参照すれば、スペクトル分析部１０２の詳細構成が図示されている。スペクトル分析部１０２は、補間部４０１及びサイズ計算部４０２を含んでもよい。

補間部４０１は、スペクトル分析部１０２の遂行結果である現在フレームのフレームエンドに係わるスペクトルサイズと、以前フレームのフレームエンドに係わるスペクトルサイズとを補間し、中間サブフレームの補間されたスペクトルサイズを導き出すことができる。このとき、中間サブフレームの補間されたスペクトルサイズは、線形補間または非線形補間を介して導き出される。

サイズ計算部４０２は、中間サブフレームの補間されたスペクトルサイズを利用して、周波数スペクトルビン（bin）のサイズを計算することができる。周波数スペクトルビンの個数は、加重値関数決定部２０７が、ＩＳＦ係数またはＬＳＦ係数を正規化するために設定した範囲に対応する周波数スペクトルビンの個数と同一に決定される。

それにより、サイズ計算部４０２を介して導き出されたスペクトル分析情報である周波数スペクトルビンのサイズは、加重値関数決定部２０７がサイズ別加重値関数を決定するときに活用されてもよい。

この後、加重値関数決定部２０７は、中間サブフレームのＬＰＣ係数が、変換されたＩＳＦまたはＬＳＦを正規化することができる。本過程で、ＩＳＦ係数の最後の係数は、反映係数であるので、同一のweightが適用されてもよい。ＬＳＦは、かような方式が適用されない。ｐ次数のＩＳＦのうち、実際に本過程が適用される範囲は、０〜（ｐ−２）までである。通常０〜（ｐ−２）までのＩＳＦは、０〜πに存在する。加重値関数決定部２０７は、スペクトル分析情報を利用するために、サイズ計算部４０２を介して導き出された周波数スペクトルビンの個数と同一の個数Ｋで正規化を行うことができる。

その後、加重値関数決定部２０７は、サイズ計算部４０２を介して伝達したスペクトル分析情報を利用して、中間サブフレームについて、ＩＳＦ係数またはＬＳＦ係数がスペクトル包絡線に影響を及ぼすサイズ別加重値関数Ｗ_１（ｎ）を決定することができる。一例として、加重値関数決定部２０７は、ＩＳＦ係数またはＬＳＦ係数の周波数情報と、入力信号の実際スペクトルサイズとを利用して、サイズ別加重値関数を決定することができる。このとき、サイズ別加重値関数は、ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数のために決定される。

そして、加重値関数決定部２０７は、ＩＳＦ係数またはＬＳＦ係数の周波数それぞれに対応する周波数スペクトルビンのサイズを利用して、サイズ別加重値関数を決定することができる。

または、加重値関数決定部２０７は、ＩＳＦ係数またはＬＳＦ係数の周波数それぞれに対応するスペクトルビン、及びスペクトルビンの周辺に位置した少なくとも１つの周辺スペクトルビンのサイズを利用して、サイズ別加重値関数を決定することができる。このとき、加重値関数決定部２０７は、スペクトルビン、及び少なくとも１つの周辺スペクトルビンの代表値を抽出し、スペクトル包絡線と係わるサイズ別加重値関数を決定することができる。このとき、代表値の例は、ＩＳＦ係数またはＬＳＦ係数の周波数それぞれに対応するスペクトルビン、及び前記スペクトルビンに係わる少なくとも１つの周辺スペクトルビンの最大値、平均値または中間値であってもよい。

一例として、加重値関数決定部２０７は、ＩＳＦ係数またはＬＳＦ係数の周波数情報を利用して、周波数別加重値関数Ｗ_２（ｎ）を決定することができる。具体的には、加重値関数決定部２０７は、入力信号の知覚的な特性及びフォルマント分布を利用して、周波数別加重値関数を決定することができる。このとき、加重値関数決定部２０７は、バークスケールによって、入力信号の知覚的な特性を抽出することができる。そして、加重値関数決定部２０７は、フォルマントの分布のうち、最初のフォルマントに基づいて、周波数別加重値関数を決定することができる。

一例として、周波数別加重値関数の場合、低周波及び高周波で、相対的に低い加重値を示し、低周波で、一定周波数区間内（first formantに該当する区間）で、同一サイズの加重値を示すことができる。

その後、加重値関数決定部２０７は、サイズ別加重値関数と、周波数別加重値関数とを組み合わせ、最終的な加重値関数を決定することができる。このとき、加重値関数決定部２０７は、サイズ別加重値関数と、周波数別加重値関数とを乗じたり加え、最終的な加重値関数を決定することができる。

他の一例として、加重値関数決定部２０７は、入力信号の符号化モード及び周波数帯域情報を考慮し、サイズ別加重値関数と、周波数別加重値関数とを決定することができる。これについては、図５で具体的に説明する。

図５は、本発明の一実施形態による符号化モード、入力信号の帯域幅情報を利用して、加重値関数を決定する過程を図示した図面である。

加重値関数決定部２０７は、入力信号の帯域幅を確認することができる（Ｓ５０１）。それにより、加重値関数決定部２０７は、入力信号の帯域幅が広帯域（ＷＢ）に属するか否かを判断することができる（Ｓ５０２）。このとき、入力信号の帯域幅が広帯域ではない場合、加重値関数決定部２７０は、入力信号の帯域幅が狭帯域（ＮＢ）に属するか否かを判断することができる。もし入力信号の帯域幅が狭帯域に属さない場合、加重値関数決定部２０７は、加重値関数を決定しない。そして、入力信号の帯域幅が狭帯域に属する場合、加重値関数決定部２０７は、段階Ｓ５０３から段階Ｓ５１０までの過程を介して、帯域幅に基づいて、当該サブブロック（中間サブフレーム）を処理することができる。

そして、入力信号の帯域幅が広帯域である場合、加重値関数決定部２０７は、入力信号の符号化モードを確認することができる（Ｓ５０３）。その後、加重値関数決定部２０７は、入力信号の符号化モードが無声音モード（unvoiced）であるか否かを判断することができる（Ｓ５０４）。入力信号の符号化モードが無声音モードである場合、加重値関数決定部２０７は、無声音モードについて、サイズ別加重値関数を決定し（Ｓ５０５）、無声音モードについて、周波数別加重値関数を決定し（Ｓ５０６）、サイズ別加重値関数と、周波数別加重値関数とを組み合わせることができる（Ｓ５０７）。

一方、入力信号の符号化モードが無声音モードではない場合、加重値関数決定部２０７は、有声音モードについて、サイズ別加重値関数を決定し（Ｓ５０８）、有声音モードについて、周波数別加重値関数を決定し（Ｓ５０９）、サイズ別加重値関数と、周波数別加重値関数とを組み合わせることができる（Ｓ５１０）。もし入力信号の符号化モードがgeneric modeまたはtransition modeである場合、加重値関数決定部２０７は、有声音モードと同一の過程を介して、加重値関数を決定することができる。

一例として、入力信号をＦＦＴ（fast Fourier transform）方式によって周波数変換したとき、ＦＦＴ係数のスペクトルサイズを利用したサイズ別加重値関数は、数式（７）によって決定される。

図６は、本発明の一実施形態によって、ＬＰＣ係数を変換したＩＳＦを図示した図面である。

具体的には、図６は、入力信号を、ＦＦＴを介して周波数ドメインに変換したときのスペクトル結果、スペクトルで導き出されたＬＰＣ係数、及びＬＰＣ係数を変換したＩＳＦを図示している。入力信号にＦＦＴを適用した結果が２５６個のサンプルである場合、１６次線形予測を行えｂ、１６個のＬＰＣ係数が導き出され、１６個のＬＰＣ係数は、１６個のＩＳＦ係数に変換されてもよい。

図７Ａ及び図７Ｂは、本発明の一実施形態によって、符号化モードによる加重値関数を図示した図面である。

具体的には、図７Ａ及び図７Ｂは、図５で、符号化モードによって決定された周波数別加重値関数を示している。グラフ７０１は、有声音モードでの周波数別加重値関数を示す。そして、グラフ７０２は、無声音モードでの周波数別加重値関数を示す。

一例として、グラフ７０１は、下記数式（８）によって決定され、グラフ７０２は、下記数式（９）によって決定される。数式（８）及び数式（９）での定数は、入力信号の特性によって変更されてもよい。

サイズ別加重値関数と、周波数別加重値関数とを組み合わせ、最終的に導き出される加重値関数は、下記数式（１０）によって決定される。

図８は、本発明の他の一実施形態によって、図２の加重値関数決定部が加重値関数を決定する過程を図示した図面である。図８を参照すれば、スペクトル分析部１０２の詳細構成が図示される。スペクトル分析部１０２は、周波数マッピング部８０１及びサイズ計算部８０２を含んでもよい。

周波数マッピング部８０１は、中間サブフレームのＬＰＣ係数を、周波数ドメイン信号にマッピングさせることができる。一例として、周波数マッピング部８０１は、中間サブフレームのＬＰＣ係数をＦＦＴ、またはＭＤＣＴ（modified discrete cosine transform）などを介して周波数変換し、中間サブフレームに係わるＬＰＣスペクトル情報を決定することができる。このとき、周波数マッピング部８０１が２５６pointの代わりに、６４pointのＦＦＴを利用すれば、非常に低い複雑度で周波数変換される。周波数マッピング部８０１は、ＬＰＣスペクトル情報を利用して、中間サブフレームに係わる周波数スペクトルサイズを決定することができる。

サイズ計算部８０２は、中間サブフレームの周波数スペクトルサイズを利用して、周波数スペクトルビンのサイズを計算することができる。周波数スペクトルビンの個数は、加重値関数決定部２０７が、ＩＳＦ係数またはＬＳＦ係数を正規化するために設定した範囲に対応する周波数スペクトルビンの個数と同一に決定される。

それにより、サイズ計算部８０２を介して導き出されたスペクトル分析情報である周波数スペクトルビンのサイズは、加重値関数決定部２０７がサイズ別加重値関数を決定するときに活用される。

その後、加重値関数決定部２０７が加重値関数を決定する過程は、図５ですでに具体的に説明したが、図８ではそれに係わる説明を省略する。

図９は、本発明の一実施形態によって、中間サブフレームのＬＰＣ符号化方式について説明するための図面である。

ＣＥＬＰ符号化技術は、入力信号に係わるＬＰＣ係数と励起信号とを必要とする。入力信号を符号化するとき、ＬＰＣ係数が量子化されてもよい。しかし、ＬＰＣ係数をそれ自体で量子化することは、ダイナミックレンジが広く、安定度確認が困難であるという問題点があるから、ダイナミックレンジが狭く、安定度確認が容易であるＬＳＦ（またはＬＳＰ）やＩＳＦ（ＩＳＰ）に変換されて符号化されてもよい。

このとき、ＩＳＦ係数やＬＳＦ係数に変換されたＬＰＣ係数は、一般的に量子化の効率のためにベクトル量子化される。この過程で、全てのＬＰＣ係数を同一の重要度にして量子化する場合、最終合成された入力信号の品質の劣化が発生することがある。すなわち、全てのＬＰＣ係数は、重要度が異なるので、重要なＬＰＣ係数のエラーが少なくてこそ、最終合成された入力信号の品質が向上する。ＬＰＣ係数の重要度を考慮せずに、同一に重要度を適用して量子化する場合、入力信号の品質は落ちてしまう。かような重要度を決定するための加重値関数が要求される。

一般的に、通信用音声符号化器は、５ｍｓのサブフレームと、２０ｍｓのフレームとから構成される。ＧＳＭ（（登録商標）global system for mobile communication）及び３ＧＰＰ（third generation partnership project）の音声符号化器であるＡＭＲとＡＭＲ−ＷＢは、５ｍｓのサブフレームが４個含まれた２０ｍｓのフレームで構成される。

図９から分かるように、ＬＰＣ係数の量子化は、以前フレームと現在フレームとを構成するサブフレームのうち、最後のフレームである第４のサブフレーム（フレームエンド）を中心に１回ずつ遂行される。現在フレームの最初、第２及び第３のサブフレームのためのＬＰＣ係数は、以前フレームのフレームエンドと、現在フレームのフレームエンドとに係わる量子化されたＬＰＣ係数を補間することによって決定される。

本発明の一実施形態によれば、音質向上のために、第２のサブフレームで線形予測分析を行って導き出されたＬＰＣ係数を符号化することができる。このとき、加重値関数決定部２０７は、以前フレームのフレームエンドに係わるＬＰＣ係数と、現在フレームのフレームエンドに係わるＬＰＣ係数とを利用して、中間サブフレームである現在フレームの第２のサブフレームについて、最適のinterpolation weightをclosed-loopで探索することができる。その後、１６次ＬＰＣ係数について、最もweighted distortionを最小化させるコードブック・インデックスが導き出されて伝送される。

Weighted distortionを求めるためには、１６次ＬＰＣ係数に係わる加重値関数が必要である。このとき、使用される加重値関数は、数式（１１）の通りである。数式（１１）によれば、ＩＳＦ係数の間隔を分析し、ＩＳＦ係数の間隔が狭いところにさらに多くの加重値が適用される。

そして、数式（１２）のように、追加的に低周波数強調（low frequency emphasis）が適用される。このとき、low frequency emphasisは、一次関数からなる数式である。

本発明によれば、ＩＳＦ係数やＬＳＦ係数の間隔のみを利用して、加重値関数が導き出されるので、非常に単純な方式によって複雑度が低い。一般的には、ＩＳＦ係数の間隔が狭いところで、スペクトルエネルギーが高くて重要な成分である可能性が高いが、実際にスペクトル分析が行われれば、かような結果が正確にマッチングされない場合が頻繁に発生する。

従って、本発明の一実施形態によれば、類似した複雑度で、優秀な性能を有する量子化技術が提案される。提案した最初の方式は、以前フレームと現在フレームとの情報を補間して量子化する技術である。そして、第２の方式はＬＰＣ係数の周波数マッピングを介してスペクトル情報を決定し、スペクトル情報を介して、ＬＰＣ係数の量子化のための最適の加重値関数を決定する技術である。

また本発明の一実施形態による方法は、多様なコンピュータで具現される動作を遂行するためのプログラム命令を含むコンピュータで読み取り可能な媒体を含む。前記コンピュータで読み取り可能な媒体は、プログラム命令、データファイル、データ構造などを単独で、または組み合わせて含んでもよい。前記媒体は、プログラム命令が、本発明のために特別に設計されて構成されたものや、コンピュータソフトウェア当業者に公知されて使用可能なものであってもよい。コンピュータで読み取り可能な記録媒体の例としては、ハードディスク、フロッピー（登録商標）ディスク及び磁気テープのような磁気媒体（magnetic media）；ＣＤ（compact disc）−ＲＯＭ（read-only memory）、ＤＶＤ（digital versatile disc）のような光記録媒体（optical media）；フロプティカルディスク（floptical disk）のような磁気−光媒体（magneto-optical media）；及びＲＯＭ（read-only memory）、ＲＡＭ（random-access memory）、フラッシュメモリなどのようなプログラム命令を保存して遂行するように特別に構成されたハードウェア装置；が含まれる。前記媒体は、プログラム命令、データ構造などを指定する信号を伝送する伝送媒体でってもよい。プログラム命令の例としては、コンパイラによって作われるような機械語コードだけではなく、インタープリタなどを使用してコンピュータによって実行される高級言語コードを含む。

以上のように、本発明の一実施形態は、たとえ限定された実施形態と図面とによって説明されたにしても、本発明の一実施形態は、前述の実施形態に限定されるものではなく、本発明が属する分野で当業者であるならば、かような記載から多様な修正及び変形が可能である。従って、本発明の一実施形態は、特許請求の範囲によってのみ把握されるものであり、それと均等であったり、等価である変形は、いずれも本発明思想の範疇に属するものである。
なお、次の付記を記す。
（付記１）入力信号の中間サブフレームの線形予測符号化（ＬＰＣ）係数を、線スペクトル周波数（ＬＳＦ）係数またはイミッタンススペクトル周波数（ＩＳＦ）係数のうちいずれか一つに変換する第１係数変換部と、
前記変換されたＩＳＦ係数またはＬＳＦ係数を利用して、前記中間サブフレームのＬＰＣ係数の重要度と係わる加重値関数を決定する加重値関数決定部と、
前記決定された加重値関数を利用して、前記変換されたＩＳＦ係数またはＬＳＦ係数を量子化する量子化部と、
少なくとも１つのプロセッサを使用して、前記量子化されたＩＳＦ係数またはＬＳＦ係数を、量子化されたＬＰＣ係数に変換する第２係数変換部と、を含み、
前記量子化されたＬＰＣ係数は、装置のエンコーダに出力される装置。
（付記２）前記加重値関数決定部は、
現在フレームのパラメータと、以前フレームのパラメータとを補間し、前記中間サブフレームのＬＰＣ係数を量子化するための加重値関数を決定することを特徴とする付記１に記載の装置。
（付記３）前記加重値関数決定部は、
前記以前フレームのフレームエンドのＬＰＣ係数を量子化するための第１加重値関数と、前記現在フレームのフレームエンドのＬＰＣ係数を量子化するための第２加重値関数とを補間し、前記中間サブフレームのＬＰＣ係数を量子化するための加重値関数を決定することを特徴とする付記２に記載の装置。
（付記４）前記加重値関数決定部は、
線形補間及び非線形補間のうち少なくとも一つを利用して補間を行い、（１）線形補間及び非線形補間を、全ての次数のベクトルに適用する方式、（２）サブベクトルごとに線形補間と非線形補間とを異ならせて適用する方式、（３）それぞれのＬＰＣ係数によって、線形補間と非線形補間とを異ならせて適用する方式のうちいずれか一つを遂行することを特徴とする付記２に記載の装置。
（付記５）前記加重値関数決定部は、
前記ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数の周波数に対応する補間されたスペクトルサイズを利用して、前記ＩＳＦ係数またはＬＳＦ係数に係わる加重値関数を決定することを特徴とする付記１に記載の装置。
（付記６）前記補間されたスペクトルサイズは、
現在フレームのフレームエンドのスペクトルサイズと、以前フレームのフレームエンドのスペクトルサイズとが補間された結果であることを特徴とする付記５に記載の装置。
（付記７）前記加重値関数決定部は、
前記ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数の周波数と周辺周波数とに対応するスペクトルサイズを利用して、前記ＩＳＦ係数またはＬＳＦ係数に係わる加重値関数を決定することを特徴とする付記５に記載の装置。
（付記８）前記加重値関数決定部は、
前記ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数の周波数と周辺周波数とに対応するスペクトルサイズの最大値、平均値または中間値を利用して、加重値関数を決定することを特徴とする付記７に記載の装置。
（付記９）前記加重値関数決定部は、
前記ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数の周波数に対応するＬＰＣスペクトルサイズを利用して、前記ＩＳＦ係数またはＬＳＦ係数に係わる加重値関数を決定することを特徴とする付記１に記載の装置。
（付記１０）前記ＬＰＣスペクトルサイズは、
中間サブフレームのＬＰＣ係数を周波数変換したＬＰＣスペクトルに基づいて決定されることを特徴とする付記９に記載の装置。
（付記１１）前記加重値関数決定部は、
前記ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数の周波数と、周辺周波数とに対応するスペクトルサイズを利用して、前記ＩＳＦ係数またはＬＳＦ係数に係わる加重値関数を決定することを特徴とする付記９に記載の装置。
（付記１２）前記加重値関数決定部は、
前記ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数の周波数と、周辺周波数とに対応するスペクトルサイズの最大値、平均値または中間値を利用して、加重値関数を決定することを特徴とする付記１１に記載の装置。
（付記１３）前記加重値関数決定部は、
前記中間サブフレームの周波数帯域、符号化モード情報または周波数分析情報のうち少なくとも一つに基づいて、加重値関数を決定することを特徴とする付記１に記載の装置。
（付記１４）前記加重値関数決定部は、
ＬＰＣスペクトルサイズまたは補間されたスペクトルサイズのうち少なくとも一つに基づいて、決定されたサイズ別加重値関数と、周波数別加重値関数とを組み合わせ、最終的な加重値関数を決定することを特徴とする付記１に記載の装置。
（付記１５）前記周波数別加重値関数は、
前記中間サブフレームのＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数の周波数に対応する加重値関数であることを特徴とする付記１４に記載の装置。
（付記１６）前記周波数別加重値関数は、
バークスケールで表現されることを特徴とする付記１４に記載の装置。
（付記１７）入力信号の中間サブフレームの線形予測符号化（ＬＰＣ）係数を、線スペクトル周波数（ＬＳＦ）係数またはイミッタンススペクトル周波数（ＩＳＦ）係数のうちいずれか一つに変換する段階と、
前記変換されたＩＳＦ係数またはＬＳＦ係数を利用して、前記中間サブフレームのＬＰＣ係数の重要度と係わる加重値関数を決定する段階と、
前記決定された加重値関数を利用して、前記変換されたＩＳＦ係数またはＬＳＦ係数を量子化する段階と、
少なくとも１つのプロセッサを使用して、前記量子化されたＩＳＦ係数またはＬＳＦ係数を、量子化されたＬＰＣ係数に変換する段階と、を含み、
前記量子化されたＬＰＣ係数は、エンコーダに出力される方法。
（付記１８）前記加重値関数を決定する段階は、
現在フレームのパラメータと、以前フレームのパラメータとを補間し、前記中間サブフレームのＬＰＣ係数を量子化するための加重値関数を決定することを特徴とする付記１７に記載の方法。
（付記１９）前記加重値関数を決定する段階は、
前記以前フレームのフレームエンドのＬＰＣ係数を量子化するための第１加重値関数と、前記現在フレームのフレームエンドのＬＰＣ係数を量子化するための第２加重値関数とを補間し、前記中間サブフレームのＬＰＣ係数を量子化するための加重値関数を決定することを特徴とする付記１８に記載の方法。
（付記２０）前記加重値関数を決定する段階は、
線形補間及び非線形補間のうち少なくとも一つを利用して補間を行い、（１）線形補間及び非線形補間を、全ての次数のベクトルに適用する方式、（２）サブベクトルごとに線形補間と非線形補間とを異ならせて適用する方式、（３）それぞれのＬＰＣ係数によって、線形補間と非線形補間とを異ならせて適用する方式のうちいずれか一つを遂行することを特徴とする付記１８に記載の方法。
（付記２１）前記加重値関数を決定する段階は、
前記ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数の周波数に対応する補間されたスペクトルサイズを利用して、前記ＩＳＦ係数またはＬＳＦ係数に係わる加重値関数を決定することを特徴とする付記１７に記載の方法。
（付記２２）前記補間されたスペクトルサイズは、
現在フレームのフレームエンドのスペクトルサイズと、以前フレームのフレームエンドのスペクトルサイズとが補間された結果であることを特徴とする付記２１に記載の方法。
（付記２３）前記加重値関数を決定する段階は、
前記ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数の周波数と、周辺周波数とに対応するスペクトルサイズを利用して、前記ＩＳＦ係数またはＬＳＦ係数に係わる加重値関数を決定することを特徴とする付記２１に記載の方法。
（付記２４）前記加重値関数を決定する段階は、
前記ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数の周波数と、周辺周波数とに対応するスペクトルサイズの最大値、平均値または中間値を利用して、加重値関数を決定することを特徴とする付記２３に記載の方法。
（付記２５）前記加重値関数を決定する段階は、
前記ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数の周波数に対応するＬＰＣスペクトルサイズを利用して、前記ＩＳＦ係数またはＬＳＦ係数に係わる加重値関数を決定することを特徴とする付記１７に記載の方法。
（付記２６）前記ＬＰＣスペクトルサイズは、
中間サブフレームのＬＰＣ係数を周波数変換したＬＰＣスペクトルに基づいて決定されることを特徴とする付記２５に記載の方法。
（付記２７）前記加重値関数を決定する段階は、
前記ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数の周波数と、周辺周波数とに対応するスペクトルサイズを利用して、前記ＩＳＦ係数またはＬＳＦ係数に係わる加重値関数を決定することを特徴とする付記２５に記載の方法。
（付記２８）前記加重値関数を決定する段階は、
前記ＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数の周波数と、周辺周波数とに対応するスペクトルサイズの最大値、平均値または中間値を利用して、加重値関数を決定することを特徴とする付記２７に記載の方法。
（付記２９）前記加重値関数を決定する段階は、
前記中間サブフレームの周波数帯域、符号化モード情報または周波数分析情報のうち少なくとも一つに基づいて、加重値関数を決定することを特徴とする付記１７に記載の方法。
（付記３０）前記加重値関数を決定する段階は、
ＬＰＣスペクトルサイズまたは補間されたスペクトルサイズのうち少なくとも一つに基づいて、決定されたサイズ別加重値関数と、周波数別加重値関数とを組み合わせ、最終的な加重値関数を決定することを特徴とする付記１７に記載の方法。
（付記３１）前記周波数別加重値関数は、
前記中間サブフレームのＬＰＣ係数から変換されたＩＳＦ係数またはＬＳＦ係数の周波数に対応する加重値関数であることを特徴とする付記３０に記載の方法。
（付記３２）前記周波数別加重値関数は、
バークスケールで表現されることを特徴とする付記３０に記載の方法。
（付記３３）付記１７に記載の方法を遂行するために、少なくとも１つのプロセッサを制御するためのコンピュータで読み取り可能な命令語が記録されていることを特徴とするコンピュータで読み取り可能な記録媒体。
（付記３４）線形予測符号化（ＬＰＣ）係数に対応する線スペクトル周波数（ＬＳＦ）係数、またはイミッタンススペクトル周波数（ＩＳＦ）係数を利用して、入力信号の中間サブフレームのＬＰＣ係数の重要度と係わる加重値関数を決定する加重値関数決定部と、
前記決定された加重値関数を利用して、前記変換されたＩＳＦ係数またはＬＳＦ係数を量子化する量子化部と、
少なくとも１つのプロセッサを使用して、前記量子化されたＩＳＦ係数またはＬＳＦ係数を、量子化されたＬＰＣ係数に変換する第２係数変換部と、を含み、前記量子化されたＬＰＣ係数は、装置のエンコーダに出力される装置。
（付記３５）線形予測符号化（ＬＰＣ）係数に対応する線スペクトル周波数（ＬＳＦ）係数、またはイミッタンススペクトル周波数（ＩＳＦ）係数を利用して、入力信号の中間サブフレームのＬＰＣ係数の重要度と係わる加重値関数を決定する段階と、
前記決定された加重値関数を利用して、前記変換されたＩＳＦ係数またはＬＳＦ係数を量子化する段階と、
少なくとも１つのプロセッサを使用して、前記量子化されたＩＳＦ係数またはＬＳＦ係数を、量子化されたＬＰＣ係数に変換する段階と、を含み、前記量子化されたＬＰＣ係数は、エンコーダに出力される方法。
（付記３６）付記３５に記載の方法を遂行するために、少なくとも１つのプロセッサを制御するためのコンピュータで読み取り可能な命令語が記録されていることを特徴とするコンピュータで読み取り可能な記録媒体。

Claims

加重値関数の決定方法であって、
入力信号のサブフレームの線形予測符号化（ＬＰＣ）係数から、線スペクトル周波数（ＬＳＦ）係数またはイミッタンススペクトル周波数（ＩＳＦ）係数を得るステップと、
前記サブフレームのスペクトルビンの数に基づいて前記ＬＳＦ係数またはＩＳＦ係数を正規化するステップと、
前記サブフレームの、正規化されたＬＳＦ係数または正規化されたＩＳＦ係数の周波数に対応するスペクトルビンのサイズに基づいて前記サブフレームの加重値関数を決定するステップと、
を含む方法。
前記加重値関数を決定するステップは、前記正規化されたＬＳＦ係数または正規化されたＩＳＦ係数の周波数に対応するスペクトルビンのサイズと少なくとも一つの隣接するスペクトルビンのサイズに基づく、請求項１に記載の方法。
前記加重値関数を決定するステップは、前記正規化されたＬＳＦ係数または正規化されたＩＳＦ係数の周波数に対応するスペクトルビンのサイズと少なくとも一つの隣接するスペクトルビンのサイズの中で最大値に基づく、請求項１に記載の方法。
前記スペクトルビンは、前記入力信号の時間-周波数マッピングから得る、
請求項１に記載の方法。
前記時間-周波数マッピングは、高速フーリエ変換(Fast Fourier Transform)によって実行される、請求項４に記載の方法。
前記加重値関数を決定するステップは、前記正規化されたＬＳＦ係数または正規化されたＩＳＦ係数の周波数に対応するスペクトルビンのサイズに基づく第１の加重値関数と前記正規化されたＬＳＦ係数または正規化されたＩＳＦ係数の周波数情報に基づく第２の加重値関数を結合して前記加重値関数を決定する、請求項１に記載の方法。
前記周波数情報は、前記入力信号の符号化モードに対応して得られる、請求項６に記載の方法。
前記第２の加重値関数は、前記入力信号の知覚的特性とフォルマント分布の中で少なくとも一つに基づく、請求項６に記載の方法。