JP2006508384A

JP2006508384A - 音声信号符号化

Info

Publication number: JP2006508384A
Application number: JP2004554728A
Authority: JP
Inventors: ヘーペースヘイエルス，エリク; ウェーイェーオーメン，アルノルデュス; イェーアーマンス，マテウス
Original assignee: Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2002-11-28
Filing date: 2003-10-31
Publication date: 2006-03-09
Anticipated expiration: 2023-10-31
Also published as: ES2278192T3; US7644001B2; KR20050086809A; BR0316611A; CN100405460C; US20060147047A1; EP1568010B1; MXPA05005602A; JP4538324B2; AU2003274520A1; DE60310449T2; DE60310449D1; PL376889A1; WO2004049309A1; RU2005120236A; ATE348386T1; EP1568010A1; KR101008520B1; CN1717577A

Abstract

音声信号を符号化する方法では、第１計算値を取得するため、第１時点における音声信号の特徴を表す第１パラメータの値が計算される。第２計算値を取得するため、以降の第２時点における音声信号の特徴を表す第２パラメータの値が計算される。第１パラメータの個数と第２パラメータの個数は異なる。第２パラメータのサブセットは、音声信号の周波数領域の一部と関連付けされる。この音声信号の周波数領域は、好ましくは、音声信号に存在するすべての周波数をカバーするよう選ばれる。第２パラメータのサブセットの値は、当該サブセットと実質的に同一の周波数領域の一部と関連付けされた第１計算値のサブセットとの差に基づき符号化される。従って、第２パラメータの差分的符号化値は、第２パラメータと実質的に同一の周波数サブ領域に関連する第１パラメータとの差を符号化することにより取得される。これにより、パラメータ数が経時的に可変とされてもパラメータを差分的に符号化することが可能となる。

Description

発明の詳細な説明

本発明は、音声信号符号化方法、音声信号の符号化を行うエンコーダ、及び音声信号を供給する装置に関する。

ステレオプログラムコンテンツのビットレートを低減させるために提案されてきた音声コーダにおける従来技術による手段は、ｉｎｔｅｎｓｉｔｙｓｔｅｒｅｏとＭ/Ｓｓｔｅｒｅｏを有する。

ｉｎｔｅｎｓｉｔｙｓｔｅｒｅｏアルゴリズムでは、高周波数（典型的には、５ｋＨｚ以上）は、当該周波数領域に対するもとのステレオ信号に類似した復号化音声信号を復元することを可能にする時間可変及び周波数依存スケールファクタとインテンシティファクタと合成された単一の（すなわち、モノラル）音声信号により表される。

Ｍ/Ｓアルゴリズムでは、信号は和（ミッドまたはコモン）信号と差（サイドまたは非コモン）信号に分解される。この分解は、主成分解析または時間可変スケールファクタとときには合成される。その後、これらの信号は、変換コーダまたはサブバンドコーダ（それらは何れも波形コーダである）によって独立に符号化される。このアルゴリズムにより実現される情報量の低減は、ソース信号の空間プロパティに強く依存する。例えば、ソース信号がモノラルである場合、差信号はゼロであり、破棄することができる。しかしながら、左右の音声信号の相関が低い場合（しばしば、高周波数領域に対するケースである）、このスキームは、わずかなビットレートの低下しか提供しない。低周波数領域では、Ｍ/Ｓ符号化は、一般に大きな効果を与える。

音声信号のパラメータ記述は、特に音声符号化の分野において近年関心が高まっている。音声信号を記述する（量子化）パラメータの送信は、受信側での知覚的に実質等価な信号を再合成するための送信キャパシティをほとんど必要としない。１つのタイプのパラメータ音声コーダは、モノラル信号の符号化に焦点をあて、ステレオ信号はデュアルモノラル信号として処理される。

他のタイプのパラメータ音声コーダが、ＥＰ−Ａ−１１０７２３２に開示されている。このパラメータ音声エンコーダは、パラメータ符号化スキームを利用して、左右のチャネル信号から構成されるステレオ音声信号の一表現を生成する。送信帯域幅を効率的に利用するため、このような表現は、左右のチャネル信号の組み合わせであるモノラル信号のみに関する情報と、パラメータ情報を有する。ステレオ信号は、パラメータ情報と共にモノラル信号に基づき復元することができる。このパラメータ情報は、左右のチャネルの強度と位相特性を含むステレオ音声信号のローカライゼーションキュー（ｌｏｃａｌｉｚａｔｉｏｎｃｕｅ）を有する。

パラメータ情報は、パラメータが決定される音声信号の周波数領域における音声信号の特徴を決定するパラメータにより表される。符号化された音声信号は、符号化されたモノラル音声信号と、符号化される音声信号の完全な帯域幅または周波数領域に対して決定される１つのグローバルパラメータ（またはグローバルパラメータセット）及び/または音声信号の周波数領域の対応するサブ領域（当該周波数領域のサブ領域はまたｂｉｎと呼ばれる）に対して決定される１以上のローカルパラメータ（またはローカルパラメータセット）から構成されてもよい。

多くの音声符号化スキームでは、経時的に値が変動するパラメータが用いられる。例えば、ＭＰＥＧ−１、レイヤーＩＩＩ（ｍｐ３）、ＡＡＣ（ＡｄｖａｎｃｅｄＡｕｄｉｏＣｏｄｉｎｇ）のような波形コーダでは、ＭＤＣＴ（ＭｏｄｉｆｉｅｄＤｉｓｃｒｅｔｅＣｏｓｉｎｅＴｒａｎｓｆｅｒ）係数の個数は、経時的に変動しうる。

未公開の欧州特許出願第２００２０２０７６５８８．９号（代理人整理番号ＰＨＮＬ０２０３５６）は、パラメータステレオ表示に用いられる周波数サブ領域（ｂｉｎと呼ばれる）の個数は、フレームごとに可変とすることが可能である。

未公開の欧州特許出願第２００２０２７７８６９．２号（代理人整理番号ＰＨＮＬ０２０６９２）は、連続するフレームの対応するパラメータが経時的に差分的に符号化することができるということを開示している。このようにして、時間方向への冗長性を取り除くことができる。パラメータの個数は、連続するフレームにおいて同一である。

Ｅ．Ｇ．ＰＳｃｈｕｉｊｅｒｓらによる「ＡｄｖａｎｃｅｓｉｎＰａｒａｍｅｔｒｉｃｃｏｄｉｎｇｆｏｒｈｉｇｈ−ｑｕａｌｉｔｙａｕｄｉｏ」（１ｓｔＩＥＥＥＢｅｎｅｌｕｘＷｏｒｋｓｈｏｐｏｎＭｏｄｅｌｂａｓｅｄＰｒｏｃｅｓｓｉｎｇａｎｄＣｏｄｉｎｇｏｆＡｕｄｉｏ（ＭＰＣＡ２００２），ＬｅｕｖｅｎＢｅｌｇｉｕｍ，Ｎｏｖ．１５，２００２）において、パラメータステレオ記述により拡張されたパラメータ符号化スキームが記載されている。この記載では、ＩＩＤ（Ｉｎｔｅｒ−ｃｈａｎｎｅｌＩｎｔｅｎｓｉｔｙＤｉｆｆｅｒｅｎｃｅｓ）、ＩＴＤ（Ｉｎｔｅｒ−ｃｈａｎｎｅｌＴｉｍｅＤｉｆｆｅｒｅｎｃｅｓ）及びＩＣＣ（Ｉｎｔｅｒ−ｃｈａｎｎｅｌＣｒｏｓｓＣｏｒｒｅｌａｔｉｏｎ）の３つのパラメータにより、バイノラルキュー（ｂｉｎａｕｒａｌｃｕｅ）のモデル化が試みられている。これらのパラメータは、人間の聴覚系に類似した非一様周波数格子上で推定される。この格子上の周波数ｂｉｎの個数は、典型的には２０である。欧州特許出願第２００２０２０７７８６９．２号では、上記パラメータの符号化のためのスケーラブルアプローチが提案されている。

このパラメータ符号化スキームでは、フレーム単位にスペクトルエンベロープの記述に用いられるＬＰＣ（ＬｉｎｅａｒＰｒｅｄｉｃｔｉｖｅＣｏｄｉｎｇ）係数の個数を変更する可能性が存在する。

本発明の第１の特徴は、請求項１記載の音声信号を符号化する方法を提供する。本発明の第２の特徴は、請求項１０記載の音声信号を符号化するエンコーダを提供する。本発明の第３の特徴は、請求項１１記載の音声信号を供給する装置を提供する。効果的な実施例が従属クレームにより定義される。

本発明の第１の特徴による方法では、パラメータ数が連続するフレームにおいて異なるとき、差分的符号化が実行される。これにより、パラメータのより効率的な符号化が提供され、符号化されたパラメータに必要とされる帯域幅をより少なくすることができる。

音声信号を符号化する方法では、第１計算値を取得するため、第１時点における音声信号の特徴を表す第１パラメータの値が計算される。第２計算値を取得するため、以降の第２時点における音声信号の特徴を表す第２パラメータの値が計算される。第１パラメータの個数と第２パラメータの個数は異なる。第２パラメータのサブセットは、音声信号の周波数領域の一部と関連付けされる。第２パラメータのサブセットの値は、当該サブセットと実質的に同一の周波数領域の一部と関連付けされた第１計算値のサブセットとの差に基づき符号化される。

これにより、パラメータ数が経時的に可変とされてもパラメータを差分的に符号化することが可能となる。

請求項２に定義される実施例では、周波数サブ領域、すなわちｂｉｎにおいて、第１時点での第１フレームでの利用のため、１つのパラメータを計算する必要がある。当該実質的に同一の周波数サブ領域では、第２時点での第２フレームでの利用のため、複数のパラメータを計算する必要がある。第２フレームで利用される複数のパラメータの各々は、１つのパラメータの値に関する各自の差に基づき差分的に符号化される。

複数のパラメータの１つがある周波数サブ領域により完全にはカバーされていない周波数サブ領域と関連付けされているため、これらの周波数サブ領域が同一でない場合には、当該パラメータが１つのパラメータと当該パラメータによりカバーされていない周波数領域に関連するパラメータとに関して符号化されるという訂正が適用されてもよい。

請求項３に定義される実施例では、ある周波数サブ領域、すなわちｂｉｎにおいて、複数のパラメータが第１時点での第１フレームでの利用のため計算される必要がある。実質的に同一なこの周波数サブ領域では、１つのパラメータが第２時点での第２フレームにおける利用のため計算される必要がある。１つのパラメータの値が、複数のパラメータの平均値に関して差分的に符号化される。

請求項４に定義される実施例では、この平均値は複数のパラメータの値の加重和として計算される。

請求項５に定義される実施例では、すべての重みは、第２フレームの１つのパラメータに対応する第１フレームの複数のパラメータの個数により除されたものに等しくされる。

請求項６に定義される実施例では、これらの重みは、対応する周波数のサイズに対応する複数のパラメータのそれぞれに対して選択される。

請求項７に定義される実施例では、周波数サブ領域は、１つのパラメータの周波数サブ領域が複数のパラメータの１つの周波数領域を部分的にしかカバーしないということから同一ではなく、当該１つのパラメータの値の平均値への寄与は、複数のパラメータのその他のものより小さい。好ましくは、それの貢献度は、複数のパラメータの周波数領域を部分的にしかカバーしない１つのパラメータの周波数サブ領域によりカバーされる複数のパラメータの周波数領域の割合に依存する。

請求項８に定義される実施例では、音声信号は異なるパラメータセットにより符号化される。音声信号の周波数領域全体に対して、グローバルパラメータが計算される。これらのグローバルパラメータは、基本（低）クオリティにより音声信号を復号化することを可能にする。復号された音声信号のクオリティを向上させるため、補助的パラメータが符号化される。当該補助的パラメータの個数は経時的に可変とされてもよい。第１フレーム期間中に必要とされる第１パラメータの個数は、後続の第２フレーム期間中に必要とされる第２パラメータの個数より少ない。第１パラメータと第２パラメータの対応するものの各々は、実質的に同一の周波数サブ領域をカバーする。第２パラメータ値が符号化される必要のある周波数サブ領域では、当該パラメータ値は、実質的に同一の周波数サブ領域に関する対応する第１パラメータの値に関して差分的に符号化される。第２パラメータが符号化される必要があるが、対応する第１パラメータの値が利用可能でない周波数領域では、第２パラメータの値はグローバル値に関して差分的に符号化される。

請求項９に定義される実施例では、音声信号は異なるパラメータセットにより符号化される。音声信号の周波数領域全体に対してグローバルパラメータが計算される。これらのグローバルパラメータは、基本（低）クオリティにより音声信号を復号化することを可能にする。復号された音声信号のクオリティを向上させるため、補助的パラメータが符号化される。当該補助的パラメータの個数は経時的に可変とされてもよい。第１フレーム期間中に必要とされる第１パラメータの個数は、後続の第２フレーム期間中に必要とされる第２パラメータの個数より多い。第１パラメータと第２パラメータの対応するものの各々は、実質的に同一の周波数サブ領域をカバーする。第２パラメータ値が符号化される必要のある周波数サブ領域では、当該パラメータ値は、実質的に同一の周波数サブ領域に関する対応する第１パラメータの値に関して差分的に符号化される。第１パラメータの値が利用可能であるが、対応する第２パラメータが符号化される必要がない周波数領域では、アクションは必要でない。

本発明の上記及び他の特徴は、以下に開示される実施例を参照することにより明らかとなるであろう。

異なる図での同一の参照符号は、同一の機能を実行する同一の要素または同一の信号を参照するものである。

図１は、本発明の一実施例によるエンコーダのブロック図を示す。入力ＩＮは、音声信号１を受け取る。この音声信号１は、データリダクションが達成されるように符号化される必要がある。データリダクションは、音声信号の特徴をパラメータにより表すことにより可能となる。これらのパラメータは、音声信号１のある周波数領域内での音声信号の特徴を定義する。音声信号１の周波数領域は、音声信号１に存在するすべての周波数をカバーするものであってもよいし、あるいは音声信号１に存在する周波数のサブ領域であってもよい。パラメータは、可変的な音声信号１を表すことができるように、時間に関して定期的に決定される必要がある。通常、これらのパラメータは、フレームと呼ばれる一定の時間間隔において決定及び符号化される。音声信号１がパラメータによってどのように表されるか、そしてパラメータがどのように符号化されるかということは、本発明には重要ではなく、多くの既知のアプローチが実現されてもよい。本発明は、符号化されるパラメータの個数が連続するフレームにおいて異なるときでさえ、パラメータが差分的に符号化されるという事実に関する。

計算ユニット２は、音声信号１を受け取り、フレームごとに計算された値を供給する。この計算値３は、差分的に符号化されるべきパラメータを表す。符号化された値は、特定のフレームにおいて利用可能であるべきである。メモリ４は、フレームごとの計算値３を格納し、格納した値５を供給する。エンコーダ６は、現在のフレームの計算値３と前のフレームの格納値５の差分を符号化し、差分符号化パラメータ値７を供給する。この差分符号化パラメータ値７は、出力ＯＵＴにおいて符号化音声信号９を供給するため、ユニット８において符号化モノラル音声信号と合成されてもよい。

エンコーダは、専用ハードウェアを有するものであってもよいし、あるいは上記計算及びその他のステップを実行する適切にプログラムされたプロセッサであってもよい。

図２は、第１フレームｔ１期間におけるパラメータ数が第２フレームｔ２期間より少ない状況を概略的に示す。パラメータＰ１，１〜Ｐ１，４（Ｐ１，ｉとして表される）と、それらに関連する周波数サブ領域ＳＦＲＡ１〜ＳＦＲＡ４（ＳＦＲＡｉとして表される）が、第１フレームｔ１の左側に示される。パラメータＰ２，１〜Ｐ２，１６（Ｐ２，ｉとして表される）と、それらに関連する周波数サブ領域ＳＦＲＢ１〜ＳＦＲＢ１６（ＳＦＲＢｉとして表される）が、第１フレームｔ１に続く第２フレームｔ２の右側に示される。

パラメータＰ１，ｉは計算値Ａｉを有し、パラメータＰ２，ｉは計算値Ｂｉを有する。Ｐ１，ｉまたはＰ２，ｉの具体的な値は、インデックスｉを代入することにより得られる。

トータルの周波数領域は、ＦＲにより示される。第１計算値のサブセットＳＵＳ，ｉはそれぞれ１つの計算値Ａ１，ｉを有する。第２計算値のサブセットＳＵＳ２，ｉはそれぞれ複数の計算値Ａ２，ｉを有する（図２で示される例では４つ）。

この結果、同じ周波数サブ領域ＳＦＲＡｉに対応する関連するサブセットＳＵＳ１，ｉとＳＵＳ２，ｉでは、常に４つの第２計算値Ｂｉが１つの第１計算値Ａｉに対応している。４つの第２計算値Ｂｉの各々は、同じ第１計算値Ａｉに関して差分的に符号化されている。このことは、４つの符号化値のそれぞれが対応する第２計算値Ｂｉマイナス第１計算値Ａｉに等しいということを意味している。

図３は、第１フレーム期間中のパラメータ数が第２フレーム期間中より少ない状況の他の概略表示を示す。図２と対照的に、周波数サブ領域ＳＦＲＢ１〜ＳＦＲＢ４を合成することにより得られる周波数サブ領域は、周波数領域ＳＦＲＡ１と同一ではなく、若干小さい。周波数サブ領域ＳＦＲＢ５は、一部は周波数ＳＦＲＡ１において、一部は周波数領域ＳＦＲＡ２において発生する。パラメータＰ２，１〜Ｐ２，４の符号化値は、パラメータＰ１，１の値Ａ１に関して差分的に符号化される。パラメータＰ２，５の符号化値は、パラメータＰ１，２のＡ１またはＡ２の値の何れかに関して差分的に符号化されてもよい。パラメータＰ２，５の値をＢ５の値とＡ１とＡ２の値の加重和との差として符号化することができる。好ましくは、これらの値Ａ１とＡ２は、それぞれ周波数領域ＳＦＲＡ１とＳＦＲＡ２と周波数領域ＳＦＲＢ５との重複部分に従って重み付けされる。

図４は、第１フレーム期間中のパラメータ数が第２フレーム期間中より大きい状況を概略的に示す。図４は、図２に示される状況と類似しているが、フレームｔ１は、後続するフレームｔ２より多くのパラメータＰ１，ｉを有する。

パラメータＰ２，１とＰ２，２（Ｐ２，ｉとして示される）と、それらに関連する周波数サブ領域ＳＦＲＢ１とＳＦＲＢ２（ＳＦＲＢｉとして示される）が、第２フレームｔ２の右側に示される。パラメータＰ１，１〜Ｐ１，７（Ｐ１，ｉとして示される）と、それらに関連する周波数サブ領域ＳＦＲＡ１〜ＳＦＲＡ７（ＳＦＲＡｉとして示される）が、第１フレームｔ１の左側に示される。

パラメータＰ１，ｉは計算値Ａｉを有し、パラメータＰ２，ｉは計算値Ｂｉを有する。パラメータＰ１，ｉまたはＰ２，ｉの具体的な値は、インデックスｉに代入することにより得られる。

第２計算値サブセットＳＵＳ２，ｉの各々は、１つの計算値Ｂｉを有する。第１計算値サブセットＳＵＳ１，ｉの各々は、複数の計算値Ａｉを有する（図４に示される例では、３つである）。

この結果、同一の周波数サブ領域ＳＦＲＢｉに対応する関連するサブセットＳＵＳ１，ｉとＳＵＳ２，ｉでは、常に１つの第２計算値Ｂｉは、３つの第１計算値Ａｉに対応している。

第２計算値Ｂｉは、関連する計算値Ａｉのグループの計算された加重平均に関して差分的に符号化される。Ａｉの値とＢｉの値は、それらが周波数領域ＳＦＲＢｉ内部に生じるか、あるいは少なくとも部分的に重複する周波数サブ領域ＳＦＲＡｉに属するパラメータＰ１，ｉに属する場合、関連しあっている。

加重平均は以下のように計算される。

ただし、Ｖグループはグループパラメータ値を表し、Ｍは関連する計算値Ａｉのグループに属するパラメータの個数であり、ｑｉは以下のような重み関数である。

例えば、重みｑｉは１/Ｍとなるよう選ばれ、パラメータが属するｂｉｎまたは周波数サブ領域のサイズが適切な選択である。

図５は、第１フレーム期間中のパラメータ数が第２フレーム期間中より大きい状況の他の概略表示である。

図４の例では、フレームｔ１のグループに属するｂｉｎは、常にフレームｔ２の１つのｂｉｎの中に完全に含まれる。これは図５に示されるケースと異なり、Ａ３の値に関連するｂｉｎがＢ１の値に関連するｂｉｎの内部に一部のみ属する。Ｂ１の値の重みに関する差分的符号化では、Ａ３の値の重みはより小さいものとして選ばれるかもしれない。好ましくは、この重みの減少は、ｂｉｎＢ１内に完全に属するＡ１及びＡ２のｂｉｎの一部としてＢ１のｂｉｎ内に属するＡ３のｂｉｎの一部に関連付けされる。

例えば、図２〜５に示されるような差分的符号化は、Ｅ．Ｇ．ＰＳｃｈｕｉｊｅｒｓらによる「ＡｄｖａｎｃｅｓｉｎＰａｒａｍｅｔｒｉｃｃｏｄｉｎｇｆｏｒｈｉｇｈ−ｑｕａｌｉｔｙａｕｄｉｏ」（１ｓｔＩＥＥＥＢｅｎｅｌｕｘＷｏｒｋｓｈｏｐｏｎＭｏｄｅｌｂａｓｅｄＰｒｏｃｅｓｓｉｎｇａｎｄＣｏｄｉｎｇｏｆＡｕｄｉｏ（ＭＰＣＡ２００２），ＬｅｕｖｅｎＢｅｌｇｉｕｍ，Ｎｏｖ．１５，２００２）に示されるようなパラメータ符号化スキームに関連し、そこでは、クオリティ/ビットレートのトレードオフにより、ＩＩＤ/ＩＴＤ/ＩＣＣパラメータに用いられるｂｉｎの個数は、典型的である２０個の代わりに、１０〜４０の周波数ｂｉｎに切り替えられてもよい。

図６は、第１フレーム期間中のパラメータ数が第２フレーム期間中より少ない状況を概略的に示す。

図２〜５は、ある固定された周波数領域ＳＦに対応する可変数のパラメータＰ１，ｉとＰ２，ｉ（の集合）を示す。これによると、パラメータ数が変化する場合、周波数サブ領域ＳＦＲＡｉまたはＳＦＲＢｉのサイズは、すべての周波数サブ領域ＳＦＲＡｉまたはＳＦＲＢｉが、固定された周波数領域ＳＦをカバーするよう変化する。

あるいは、図６及び７に示されるように、各パラメータＰ１，ｉとＰ２，ｉはそれぞれ、周波数領域ＳＦＲＡｉとＳＦＲＢｉに属するかもしれない。すなわち、特定のパラメータＰ１，ｉまたはＰ２，ｉにより適用される周波数領域ＳＦＲＡｉまたはＳＦＲＢｉは一定である。フレームｔ１またはｔ２のパラメータＰ１，ｉとＰ２，ｉの個数が変化する場合、すべての周波数領域ＳＦＲＡｉまたはＳＦＲＢｉによりカバーされる周波数領域のトータルサイズは可変となる。これは、ＩＴＤパラメータのケースであるかもしれない。

フレームｔ１において、最左カラムは、トータルの周波数領域ＦＲに対する音声信号１の特徴を表すグローバルパラメータＧＢ１を示す。隣接カラムは、Ｃ１〜Ｃ５により示される５つのパラメータ（ＩＩＤ及び/またはＩＣＣパラメータなどのパラメータセット）を示す。各パラメータＣｉ（またはパラメータセット）は、トータルの周波数領域ＦＲの関連する周波数サブ領域に該当する。これらの周波数サブ領域は一緒になってトータル周波数領域ＦＲをカバーする。フレームｔ１の最右カラムは、２つのパラメータ（パラメータセット）がＡ１とＡの値によりそれぞれ確定される２つの周波数サブ領域ＳＦＲＡ１とＳＦＲＡ２を示す。

フレームｔ２では、最左カラムは、グローバルパラメータＧＢ１に対応するグローバルパラメータＧＢ２を示す。中間のカラムは、パラメータＣ１〜Ｃ５に対応する５つのパラメータＤ１〜Ｄ５を示す。ＧＢ１とＤ１〜Ｄ５に関連付けされた周波数領域はそれぞれ、ＧＢ２とＣ１〜Ｃ５に関連付けされた周波数領域と同一となる。フレームｔ２の最右カラムは、３つの周波数サブ領域ＳＦＲＢ１〜ＳＦＲＢ３と、関連するパラメータの３つの値Ｂ１〜Ｂ３を示す。Ｂ１とＢ２の値に関連付けされた周波数サブ領域ＳＦＲＢ１とＳＦＲＢ２はそれぞれ、Ａ１とＡ２の値に関連付けされた周波数サブ領域ＳＦＲＡ１とＳＦＲＡ２と同一である。Ｂ１とＢ２の値はそれぞれ、Ａ１とＡ２の値に関して差分的符号化される。フレームｔ１にフレームｔ２の周波数サブ領域ＳＦＲＢ３に対応する周波数サブ領域が存在しない場合、フレームｔ１の値に関してＢ３の値を差分的に符号化することはできない。さらに、グローバルパラメータＧＢ２に関してＢ３の値を符号化することにより、データリダクションが可能である。

従って一般には、あるフレームのＡｉの値を有するパラメータのｂｉｎの個数が次のフレームのＢｉの値を有する対応するパラメータのｂｉｎの個数より小さい場合、両方のフレームに実際に存在するｂｉｎのみに対して差分的符号化が実行される。先行するものを有さないｂｉｎは、グローバル値ＧＢ２に関して差分的に符号化される。

図７は、第１フレーム期間中のパラメータの個数が第２フレーム期間中により大きい状況の概略表示を示す。

フレームｔ１では、最左カラムは、トータル周波数領域ＦＲに対する音声信号１の特徴を表すグローバルパラメータＧＢ１を示す。隣接する中間カラムは、Ｃ１〜Ｃ５により示される５つのパラメータ（例えば、ＩＩＤ及び/またはＩＣＣなどのパラメータセット）を示す。各パラメータ（またはパラメータセット）Ｃｉは、トータル周波数領域ＦＲの関連する周波数サブ領域に該当する。周波数サブ領域は一緒になって、トータル周波数領域ＦＲをカバーする。フレームｔ１の最右カラムは、３つのパラメータ（またはパラメータセット）がＡ１〜Ａ３の各値により確定される３つの周波数サブ領域ＳＦＲＡ１〜ＳＦＲＡ３を示す。

フレームｔ２では、最左カラムは、グローバルパラメータＧＢ１に対応するグローバルパラメータＧＢ２を示す。中間カラムは、パラメータＣ１〜Ｃ５に対応する５つのパラメータＤ１〜Ｄ５を示す。ＧＢ１及びＤ１〜Ｄ５に関連する周波数領域はそれぞれ、ＧＢ２及びＣ１〜Ｃ５に関連する周波数領域と同一である。フレームｔ２の最右カラムは、２つの周波数サブ領域ＳＦＲＢ１とＳＦＲＢ２及び関連するパラメータの値であるＢ１とＢ２を示す。Ｂ１とＢ２に関連する周波数サブ領域ＳＦＲＢ１とＳＦＲＢ２は、Ａ１とＡ２の値に関連する周波数サブ領域ＳＦＲＡ１とＳＦＲＡ２と同一である。Ｂ１とＢ２の値はそれぞれ、Ａ１とＡ２の値に関して差分的に符号化される。

従って一般には、あるフレームのＡｉの値を有するパラメータのｂｉｎの個数が次のフレームのＢｉの値を有する対応するパラメータのｂｉｎの個数より大きい場合、両方のフレームに実際に存在するｂｉｎのみに対して差分的符号化が実行される。

図６及び７の両方に関して説明された符号化アルゴリズムは、ビットストリームにおける信号処理を必要としない。

例えば、図６及び７に示されるような状況では、ＡｉとＢｉの値は、ＩＴＤｂｉｎの個数を表すかもしれず、実際の実現では、ＩＴＤのｂｉｎの個数は、１１〜１６において可変とされてもよい。

上記実施例は、本発明を限定するのでなく、例示するためのものであり、当業者は、添付された請求項の範囲から逸脱することなく他の多くの実施例を構成することができるであろう。

例えば、連続するフレームの対応するｂｉｎのオアらメータの変更及び絶対数は、単なる一例である。実際的な状況では、ｂｉｎの個数は実際の音声信号と復号される音声のクオリティに依存するかもしれない（または利用可能な最大ビットストリーム）。例えば、図６及び７に示される状況では、ＡｉとＢｉの値はＩＴＤｂｉｎの個数を表すものであってもよい。特に実際的な状況では、ＩＴＤｂｉｎの個数は、１１〜１６の間で可変とされてもよい。

請求項では、括弧内の任意の参照符号は当該請求項を限定するものとして解釈されるべきでない。「有する」という用語は、請求項に列挙された以外の要素またはステップの存在を排除するものでない。本発明は、複数の要素を有するハードウェアにより実現することも可能であるし、あるいは適切にプログラムされたコンピュータにより実現することも可能である。複数の手段を列挙した装置クレームでは、これら複数の要素が１つのハードウェアアイテムにより実現されてもよい。ある手段が相互に異なる従属クレームに記載されるという事実は、これらの手段の組み合わせが効果的に利用できないということを示すものではない。

図１は、本発明の一実施例によるエンコーダのブロック図を示す。図２は、第１フレーム期間中のパラメータ数が第２フレーム期間中より少ない状況の概略表示を示す。図３は、第１フレーム期間中のパラメータ数が第２フレーム期間中より少ない状況の他の概略表示を示す。図４は、第１フレーム期間中のパラメータ数が第２フレーム期間中より多い状況の概略表示を示す。図５は、第１フレーム期間中のパラメータ数が第２フレーム期間中より多い状況の他の概略表示を示す。図６は、第１フレーム期間中のパラメータ数が第２フレーム期間中より少ない状況の概略表示を示す。図７は、第１フレーム期間中のパラメータ数が第２フレーム期間中より多い状況の概略表示を示す。

Claims

音声信号を符号化する方法であって、
第１計算値を取得するため、第１時点において前記音声信号の特徴を表す第１個数の第１パラメータの値を計算するステップと、
第２計算値を取得するため、以降の第２時点において前記音声信号の特徴を表す前記第１個数と異なる第２個数の第２パラメータの値を計算するステップと、
前記第２パラメータの差分的符号化値を取得するため、前記音声信号の周波数領域の一部に関連する前記第２パラメータのサブセットを、前記周波数領域の一部に関連する前記第２計算値のサブセットと前記周波数領域の一部と実質的に関連する前記第１計算値のサブセットとの差に基づき符号化するステップと、
を有することを特徴とする方法。
請求項１記載の方法であって、
前記第１パラメータと前記第２パラメータは一緒になって前記同一の周波数領域を実質的にカバーし、
前記第１パラメータの個数は、前記第２パラメータの個数より少なく、
前記第１計算値のサブセットは、前記実質的に同一の周波数領域のサブ領域である前記周波数領域の一部に対する１つの値を有し、
前記第２計算値のサブセットは、各々が前記１つの値と対応する第２計算値との差に基づき差分的符号化値の１つに対応する少なくとも２つの第２計算値を有する、
ことを特徴とする方法。
請求項１記載の方法であって、
前記第１パラメータと前記第２パラメータは一緒になって前記同一の周波数領域を実質的にカバーし、
前記第１パラメータの個数は、前記第２パラメータの個数より多く、
前記第２計算値のサブセットは、前記実質的に同一の周波数領域のサブ領域である前記周波数領域の一部に対する１つの値を有し、
前記第１パラメータのサブセットは、少なくとも２つの第１計算値を有し、
前記１つの値に対応する差分的符号化値は、前記１つの値と対応する第１計算値の平均値との差に基づく、
ことを特徴とする方法。
請求項３記載の方法であって、
前記平均値は、重みｑｉによる前記第１計算値の加重和として計算されることを特徴とする方法。
請求項４記載の方法であって、
前記重みｑｉは１/Ｍに等しく、
前記Ｍは、前記周波数領域の一部と少なくとも部分的に重複する周波数サブ領域と関連する第１パラメータの個数である、
ことを特徴とする方法。
請求項４記載の方法であって、
前記重みｑｉは、前記第１パラメータの対応するものに関連する周波数サブ領域のサイズに関することを特徴とする方法。
請求項４記載の方法であって、
前記第２パラメータの周波数領域の一部と完全には重複しない周波数サブ領域と関連する第１パラメータの重みｑｉは減少されることを特徴とする方法。
請求項１記載の方法であって、さらに、
前記音声信号の周波数領域全体に対するグローバル値を計算するステップを有し、
前記第１パラメータと前記第２パラメータの対応するものの各々は、前記同一の周波数領域を実質的にカバーし、
前記第１パラメータの個数は、前記第２パラメータの個数より少なく、
前記第１計算値のサブセットは、前記第１パラメータの各々に対する値を有し、
前記第２計算値のサブセットは、前記第２パラメータの各々に対する値を有し、
第１及び第２計算値の両方が計算される周波数領域では、前記差分的符号化値は、前記対応する第１計算値と第２計算値との差に基づき、
第２パラメータは計算されるが、第１パラメータは計算されない周波数領域では、前記差分的符号化値は、前記対応する第２パラメータと前記グローバル値との差に基づく、
ことを特徴とする方法。
請求項１記載の方法であって、
前記第１パラメータと前記第２パラメータの対応するものの各々は、前記同一の周波数領域を実質的にカバーし、
前記第１パラメータの個数は、前記第２パラメータの個数より多く、
前記第１計算値のサブセットは、前記第１パラメータの各々に対する値を有し、
前記第２計算値のサブセットは、前記第２パラメータの各々に対する値を有し、
第１及び第２計算値の両方が計算される周波数領域では、前記差分的符号化値は、前記対応する第１計算値と第２計算値との差に基づき、
第１パラメータは計算されるが、第２パラメータは計算されない周波数領域では、前記差分的符号化値は、決定される必要がない、
ことを特徴とする方法。
音声信号を符号化するエンコーダであって、
第１計算値を取得するため、第１時点において前記音声信号の特徴を表す第１個数の第１パラメータの値を計算する手段と、
第２計算値を取得するため、以降の第２時点において前記音声信号の特徴を表す前記第１個数と異なる第２個数の第２パラメータの値を計算する手段と、
前記第２パラメータの差分的符号化値を取得するため、前記音声信号の周波数領域の一部に関連する前記第２パラメータのサブセットを、前記周波数領域の一部に関連する前記第２計算値のサブセットと前記周波数領域の一部と実質的に関連する前記第１計算値のサブセットとの差に基づき符号化する手段と、
を有することを特徴とするエンコーダ。
音声信号を供給する装置であって、
音声信号を受信する入力と、
符号化音声信号を取得するため、前記音声信号を符号化する請求項１０記載のエンコーダと、
前記符号化音声信号を供給する出力と、
を有することを特徴とする装置。