JP2016508618A

JP2016508618A - 周波数領域におけるｌｐｃ系符号化のための低周波数エンファシス

Info

Publication number: JP2016508618A
Application number: JP2015554192A
Authority: JP
Inventors: シュテファンデーラ、; ベルンハルトグリル、; クリスティアンヘルムリヒ、; ニコラウスレッテルバッハ、
Original assignee: フラウンホーファーゲゼルシャフトツールフォルデルングデルアンゲヴァンテンフォルシユングエー．フアー．
Priority date: 2013-01-29
Filing date: 2014-01-28
Publication date: 2016-03-22
Anticipated expiration: 2034-01-28
Also published as: US20180293993A9; PT2951814T; CN105122357A; CN105122357B; AR094682A1; CN110047500B; CA2898677C; AR115901A2; MX2015009752A; US10176817B2; ZA201506314B; JP6148811B2; KR101792712B1; US11854561B2; US20150332695A1; ES2635142T3; AU2014211520A1; KR20150110708A; TW201435861A; WO2014118152A1

Abstract

本発明は、ビットストリームを生成するように、非音声オーディオ信号を符号化するためのオーディオエンコーダおよび方法を提供し、オーディオエンコーダは、複数の線形予測符号化係数（ＬＣ）を有する線形予測符号化フィルタ（２）と時間周波数変換器（３）との組合せ（２、３）であって、オーディオ信号（ＡＳ）のフレーム（ＦＩ）および線形予測符号化係数（ＬＣ）に基づきスペクトル（ＳＰ）を出力するために、フレーム（ＦＩ）をフィルタリングし、かつ周波数領域へ変換するよう構成される組合せ（２、３）と、スペクトル（ＳＰ）に基づき処理されたスペクトル（ＰＳ）を計算するよう構成される低周波数エンファシス回路（４）であって、基準スペクトル線（ＲＳＬ）より低い周波数を表す処理されたスペクトル（ＰＳ）のスペクトル線が強調される、低周波数エンファシス回路（４）と、線形予測符号化フィルタ（２）の線形予測符号化係数（ＬＣ）に依拠して低周波数エンファシス回路（４）による処理されたスペクトル（ＰＳ）の計算を制御するよう構成される制御装置（５）とを備える。発明は、さらに、量子化されたスペクトルおよび複数の線形予測符号化係数を含むビットストリームを復号化するための対応するオーディオデコーダ、システムおよび方法ならびに対応するコンピュータプログラムを提供する。【選択図】図１

Description

音楽の音などの非音声信号が、より広い周波数帯域を占有し、人の有声音よりも処理が複雑になり得ることは周知である。ＡＭＲ−ＷＢ＋［非特許文献２］およびｘＨＥ−ＡＡＣ［非特許文献３］等の最新技術のオーディオ符号化システムは、音楽および他の一般の非音声信号のための変換符号化ツールを提供する。このツールは、一般に変換符号化励振（ＴＣＸ）として知られ、かつ周波数領域で量子化されかつエントロピー符号化された励振と呼ばれる線形予測符号化（ＬＰＣ）残差の送信の原則に基づく。しかしながら、ＬＰＣ段階で使用される予測部の限定されたオーダにより、人の聞き取りの感度が非常に良い低周波数で特に復号化された信号にアーチファクトが生じ得る。このため、低周波数エンファシス（low-frequency emphasis）およびデエンファシススキームが導入された［特許文献１、非特許文献１および２］。

前記先行技術の適応低周波数エンファシス（ＡＬＦＥ）スキームでは、エンコーダにおける量子化の前に低周波数スペクトル線を増幅する。特に、低周波数の線は、周波数帯にまとめられ、各帯域のエネルギが計算され、局所的エネルギ最大値を有する帯域を見つける。エネルギ最大値の値および場所に基づいて、最大エネルギ帯より下の帯域は、後の量子化処理においてより正確に量子化されるようブーストされる。

対応するデコーダにおいてＡＬＦＥを逆に行うよう実行される低周波数デエンファシス（low-frequency de-emphasis）も、概念的には非常に類似するものである。エンコーダで行われるように、低周波数帯が確定されかつ最大エネルギを有する帯域が決定される。エンコーダにおける場合と違い、エネルギピークを下回る帯域はここでは減衰される。この手順により、オリジナルのスペクトルの線エネルギが、概ね復元される。

先行技術において、エンコーダにおける帯域エネルギの計算が、量子化の前、すなわち入力されたスペクトルに対し行われる一方、デコーダにおいては、逆に量子化された線、すなわち復号化されたスペクトルに対して行われるという点は、注目に値する。量子化演算は、スペクトルエネルギが平均的に保存されるよう設計できるが、個々のスペクトル線について、正確なエネルギ保存が確約できるわけではない。したがって、ＡＬＦＥを完全に逆転させることはできない。また、先行技術のＡＬＦＥの好ましい実現例では、エンコーダおよびデコーダ両方において開平演算が必要である。このような比較的複雑な演算は、回避することが望ましい。

B. Bessette, U.S. Patent 7,933,769 B2, “Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX”, Apr. 2011 T. Baeckstroem et al., European Patent EP 2 471 061 B1, “Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using linear prediction coding based noise shaping”

3GPP TS 26.290, "Extended AMR Wideband Codec - Transcoding Functions," Dec. 2004 J. Maekinen et al., "AMR-WB+: A New Audio Coding Standard for 3rd Generation Mobile Audio Services," in Proc. ICASSP 2005, Philadelphia, USA, Mar. 2005 M. Neuendorf et al., "MPEG Unified Speech and Audio Coding - The ISO/MPEG Standard for High-Efficiency Audio Coding of All Content Types," in Proc. 132nd Convention of the AES, Budapest, Hungary, Apr. 2012. Also to appear in the Journal of the AES, 2013

本発明の目的は、オーディオ信号処理のための改善された概念を提供することである。より詳細には、本発明の目的は、適応低周波数エンファシスおよびデエンファシスのための改善された概念を提供することにある。本発明の目的は、請求項１に記載のオーディオエンコーダ、請求項１１に記載のオーディオデコーダ、請求項２１に記載のシステム、請求項２２および２３に記載の方法ならびに請求項２４に記載のコンピュータプログラムにより達成される。

ある局面において、本発明は、そこからビットストリームを生成するように非音声オーディオ信号を符号化するためのオーディオエンコーダを提供し、このオーディオエンコーダが、複数の線形予測符号化係数を有する線形予測符号化フィルタと時間周波数変換器との組合せを含み、オーディオ信号のフレームおよび線形予測符号化係数に基づきスペクトルを出力するために、組合せが、フレームをフィルタリングしかつ周波数領域へ変換するよう構成され、さらにスペクトルに基づき処理されたスペクトルを計算するよう構成される低周波数エンファシス回路を含み、基準スペクトル線より低い周波数を表す処理されたスペクトルのスペクトル線が強調され、さらに、線形予測符号化フィルタの線形予測符号化係数に依拠して低周波数エンファシス回路による処理されたスペクトルの計算を制御するよう構成される制御装置とを含む。

線形予測符号化フィルタ（ＬＰＣフィルタ）は、線形予測モデルの情報を使用して、圧縮した形式でサウンドのフレーム化されたデジタル信号のスペクトル包絡を表現するため、オーディオ信号処理および音声処理において使用されるツールである。

時間周波数変換器は、信号のスペクトルを推定するように特にフレーム化されたデジタル信号を時間領域から周波数領域へ変換するためのツールである。時間周波数変換器は、タイプＩＶ離散コサイン変換（ＤＣＴ−ＩＶ）に基づく重複（ｌａｐｐｅｄ）変換である修正離散コサイン変換（ＭＤＣＴ）を使用することが可能で、重複されるという特徴が追加される。これは、より大きなデータセットの連続するフレームに対して行われるよう設計されており、後続のフレームは、１フレームの後半分が次のフレームの前半分と一致するように重ね合わされる。フレーム境界から生じるアーチファクトの回避に役立つため、ＤＣＴのエネルギ圧縮品質に加えて、この重ね合わせは信号圧縮の応用についてＭＤＣＴを特に魅力あるものにする。

低周波数エンファシス回路は、スペクトルに基づき処理されたスペクトルを計算するよう構成され、基準スペクトル線より低い周波数を表す処理されたスペクトルのスペクトル線は、処理されたスペクトルに含まれる低周波数のみを強調するように強調される。基準スペクトル線は、経験に基づいて予め定義されてもよい。

制御装置は、線形予測符号化フィルタの線形予測符号化係数に依拠して低周波数エンファシス回路により処理されたスペクトルの計算を制御するよう構成される。したがって、本発明のエンコーダは、低周波数エンファシス目的で、オーディオ信号のスペクトルを解析する必要がない。さらに、エンコーダおよび後続のデコーダにおいて同じ線形予測符号化係数を使用できるので、適応低周波数エンファシスは、線形予測符号化係数が、エンコーダまた他のなんらかの手段で生成されるビットストリームでデコーダに送信される限り、スペクトル量子化にも関わらず完全に可逆である。一般に、それぞれのデコーダによりビットストリームからオーディオ出力信号を再構成する目的で、線形予測符号化係数は、いずれにしてもビットストリームで送信する必要がある。したがって、ビットストリームのビットレートは、ここに記載する低周波数エンファシスにより増大することはない。

ここに記載の適応低周波数エンファシスシステムは、フレームごとに時間領域とＭＤＣＴ領域の符号化を切り替えられるｘＨＥ−ＡＡＣ［非特許文献３］の低遅延変形である、ＬＤ−ＵＳＡＣのＴＣＸ（ＥＶＳ）コアコーダにおいて実現され得る。

本発明の好ましい実施の形態によれば、オーディオ信号のフレームが線形予測符号化フィルタに入力され、フィルタリングされたフレームが線形予測符号化フィルタにより出力され、かつ時間周波数変換器が、フィルタリングされたフレームに基づいてスペクトルを推定するよう構成される。したがって、線形予測符号化フィルタは、オーディオ信号をその入力として、時間領域で動作し得る。

本発明の好ましい実施の形態によれば、オーディオ信号のフレームが時間周波数変換器に入力され、変換されたフレームが時間周波数変換器により出力され、かつ線形予測符号化フィルタが、変換されたフレームに基づきスペクトルを推定するよう構成される。代替的に、ただし、低周波数エンファシス回路を有する発明のエンコーダの第１の実施の形態と等価な態様で、エンコーダがたとえば［特許文献２］に開示のように周波数領域雑音整形（ＦＤＮＳ）により生成されるフレームのスペクトルに基づき処理されたスペクトルを計算してもよい。より詳細には、ここでのツールの順序は修正される。すなわち、上記のもののような時間周波数変換器は、オーディオ信号のフレームに基づいて変換されたフレームを推定するよう構成されることが可能で、かつ線形予測符号化フィルタは、時間周波数変換器により出力される、変換されたフレームに基づいてオーディオスペクトルを推定するよう構成される。したがって、線形予測符号化フィルタは、変換されたフレームをその入力として、周波数領域で（時間領域ではなく）動作してもよく、線形予測符号化フィルタは、線形予測符号化係数のスペクトル表示（spectral representation）を乗算することにより適用される。

なお、これら２つのアプローチ、すなわち時間領域の線形フィルタリングに続いて時間周波数変換を行うことと、時間周波数変換後に周波数領域においてスペクトル重み付けによる線形フィルタリングを行うことが、等価になるように行われ得ることは、当業者には明らかなはずである。

本発明の好ましい実施の形態によれば、オーディオエンコーダは、処理されたスペクトルに基づいて量子化されたスペクトルを生成するよう構成される量子化装置と、量子化されたスペクトルおよび線形予測符号化係数をビットストリームに埋め込むよう構成されるビットストリーム生成部とを含む。デジタル信号処理における量子化は、入力値の多くのセットをより小さい（カウント可能な）セットにマッピング、たとえば値をなんらかの精度の単位に丸めるプロセスである。量子化を行う装置またはアルゴリズム機能を、量子化装置と呼ぶ。ビットストリーム生成部は、単一のビットストリームに異なるソースからのデジタルデータを埋め込むことができるいずれかの装置でよい。これらの特徴により、適応低周波数エンファシスで生成されるビットストリームを容易に生成することができ、適応低周波数エンファシスは、ビットストリームにすでに含まれる情報を使用するだけで、後続のデコーダにより完全に可逆になる。

本発明の好ましい実施の形態において、制御装置は、線形予測符号化係数のスペクトル表示を推定するよう構成されるスペクトル解析部と、さらなる基準スペクトル線を下回るスペクトル表示の最小値およびスペクトル表示の最大値を推定するよう構成される最小値最大値解析部と、最小値および最大値に基づき基準スペクトル線より低い周波数を表す処理されたスペクトルのスペクトル線を計算するためのスペクトル線エンファシスファクタを計算するよう構成されるエンファシスファクタ計算部とを含み、処理されたスペクトルのスペクトル線は、スペクトル線エンファシスファクタを、フィルタリングされたフレームのスペクトルのスペクトル線に適用することにより強調される。スペクトル解析部は、上記のような時間周波数変換器でもよい。スペクトル表示は、線形予測符号化フィルタの伝達関数であり、必ずしもそうでなくてもよいが、上記のＦＤＮＳのために使用するものと同じスペクトル表示でもよい。スペクトル表示は、線形予測符号化係数の奇数離散フーリエ変換（ＯＤＦＴ）から計算され得る。ｘＨＥ−ＡＡＣおよびＬＤ−ＵＳＡＣでは、伝達関数は、スペクトル表示全体をカバーする３２または６４ＭＤＣＴ領域ゲインで近似化され得る。

本発明の好ましい実施の形態では、エンファシスファクタ計算部は、スペクトル線エンファシスファクタが、基準スペクトル線からスペクトルの最低周波数を表すスペクトル線の方向に増加するような態様で構成される。これは、最低周波数を表すスペクトル線が最も増幅される一方で、基準スペクトル線に隣接するスペクトル線の増幅が最小であることを意味する。基準スペクトル線および基準スペクトル線より高い周波数を表すスペクトル線は、全く強調されない。これにより、可聴的には問題なしに、計算の複雑さが低減できる。

本発明の好ましい実施の形態において、エンファシスファクタ計算部は、第１の式γ＝（α・ｍｉｎ／ｍａｘ）^βにしたがい基底エンファシスファクタを計算するよう構成される第１の段を含み、ここでαは、第１の予め設定された値であり、α＞１であり、βは、第２の予め設定された値であり、０＜β≦１であり、ｍｉｎは、スペクトル表示の最小値であり、ｍａｘは、スペクトル表示の最大値であり、γは、基底エンファシスファクタであり、エンファシスファクタ計算部は、第２の式ε_ｉ＝γ^i’-iにしたがいスペクトル線エンファシスファクタを計算するよう構成される第２の段を含み、ｉ^’は、強調されるべきスペクトル線の数であり、ｉがそれぞれのスペクトル線のインデクスであり、インデクスは、スペクトル線の周波数と共に増加し、ｉ＝０〜ｉ^’−１であり、γは、基底エンファシスファクタであり、かつε_iは、インデクスｉのスペクトル線エンファシスファクタである。基底エンファシスファクタは、第１の式により最小値および最大値の割合から容易に計算される。基底エンファシスファクタは、全スペクトル線ファクタの計算に関する基底としての役割をし、第２の式は、基準スペクトル線からスペクトルの最低周波数を表すスペクトル線の方向に、スペクトル線エンファシスファクタが増加することを確実にする。先行技術の解決法と違い、提案の解決法は、スペクトル帯域ごとの開平演算または同様の複雑な演算が不要である。エンコーダ側とデコーダ側に１つずつ、２つの除算と２つのべき乗演算子を必要とするのみである。

本発明の好ましい実施の形態において、第１の予め設定された値は、４２より小さくかつ２２より大きく、詳細には３８より小さくかつ２６より大きく、より詳細には３４より小さくかつ３０より大きい。上記の間隔は、経験に基づくものである。最良の結果は、第１の予め設定された値が３２に設定された場合に達成され得る。

本発明の好ましい実施の形態において、第２の予め設定された値は、式β＝１／（θ・ｉ’）により決定され、ここで、ｉ’は強調されるスペクトル線の数であり、θは３と５の間、詳細には３．４と４．６の間、より詳細には、３．８と４．２の間のファクタである。これらの間隔も経験に基づくものである。第２の予め設定された値が４に設定される場合に、最良の結果が達成され得ることがわかっている。

本発明の好ましい実施の形態において、基準スペクトル線は、６００Ｈｚと１０００Ｈｚの間、詳細には７００Ｈｚと９００Ｈｚの間、より詳細には７５０Ｈｚと８５０Ｈｚの範囲の周波数を表す。これらの経験的に見つけられた間隔により、十分な低周波数エンファシスが確保されシステムの計算の複雑さが確実に低くなる。これらの間隔により、特に、密度が高いスペクトルにおいて、より低周波数の線が十分な正確さで符号化される。好ましい実施の形態において、基準スペクトル線は、８００Ｈｚを表し、３２のスペクトル線が強調される。

本発明の好ましい実施の形態では、さらなる基準スペクトル線が、基準スペクトル線と同じまたはより高い周波数を表す。これらの特徴により、最小値および最大値の推定が、関連の周波数域で確実に行われる。

本発明の好ましい実施の形態では、制御装置は、最大値が、最小値に第１の予め設定された値であるαを乗算したものを下回る場合にのみ、基準スペクトル線よりも低い周波数を表す処理されたスペクトルのスペクトル線が強調されるような態様で構成される。これらの特徴により、エンコーダの作業負荷が最小化され得るよう、確実に必要な場合にのみ低周波数エンファシスが実行され、かつスペクトル量子化の際に、知覚的に重要でない領域にビットが無駄にされないことを確実にする。

ある局面において、本発明は、非音声オーディオ信号に基づいてビットストリームを復号化して、ビットストリームから復号化された非音声オーディオ出力信号を生成するためのオーディオデコーダであって、特に本発明のオーディオエンコーダにより生成されるビットストリームを復号化するためのものであり、ビットストリームが、量子化されたスペクトルおよび複数の線形予測符号化係数を含み、オーディオデコーダが、ビットストリームから量子化されたスペクトルと線形予測符号化係数とを抽出するよう構成されるビットストリーム受信部と、量子化されたスペクトルに基づいて逆量子化スペクトルを生成するよう構成される逆量子化装置と、逆量子化されたスペクトルに基づいて逆処理されたスペクトルを計算するよう構成される低周波数デエンファシス回路を含み、基準スペクトル線より低い周波数を表す逆処理されたスペクトルのスペクトル線がデエンファサイズ（de-emphasize）され、さらにビットストリームに含まれる線形予測符号化係数に依拠して、低周波数デエンファシス回路による逆処理されたスペクトルの計算を制御するよう構成される制御装置とを含む。

ビットストリーム受信部は、適切な後続の処理段へ分類したデータを送信するよう、単一のビットストリームからのデジタルデータを分類することができるなんらかの装置でよい。特に、ビットストリーム受信部は、ビットストリームから、その後逆量子化装置へ転送される、量子化されたスペクトルおよびその後制御装置へ転送される、線形予測符号化係数を抽出するよう構成される。

逆量子化装置は、量子化されたスペクトルに基づいて逆量子化スペクトルを生成するよう構成されるが、逆量子化とは上記の量子化に関して逆のプロセスである。

低周波数デエンファシス回路は、逆量子化されたスペクトルに基づいて逆処理されたスペクトルを計算するよう構成され、基準スペクトル線より低い周波数を表す逆処理されたスペクトルのスペクトル線が、逆処理されたスペクトルに含まれる低周波数のみがデエンファサイズされるように、デエンファサイズされる。基準スペクトル線は、経験に基づき予め定義されても良い。なお、デコーダの基準スペクトル線は、上記のとおりエンコーダの基準スペクトル線と同じ周波数を表す必要がある。しかしながら、基準スペクトル線が指す周波数は、ビットストリームでこの周波数を送信する必要がないように、デコーダ側に記憶されてもよい。

制御装置は、線形予測符号化フィルタの線形予測符号化係数に依拠して低周波数デエンファシス回路による逆処理されたスペクトルの計算を制御するよう構成される。同じ線形予測符号化係数が、ビットストリームを生成するエンコーダおよびデコーダにおいても使用され得るので、線形予測符号化係数がビットストリームでデコーダに送信される限りにおいては、スペクトル量子化にもかかわらず、適応低周波数エンファシスは完全に可逆である。一般に、線形予測符号化係数は、デコーダによりビットストリームからオーディオ出力信号を再構成する目的で、いずれにしても、ビットストリームで送信する必要がある。したがって、ここに記載のとおり、ビットストリームのビットレートが、低周波数エンファシスおよび低周波数デエンファシスにより増大することはない。

ここに記載の適応低周波数デエンファシスシステムは、時間領域とＭＤＣＴ領域の符号化を切り替えられるｘＨＥ−ＡＡＣ［非特許文献３］の低遅延変形である、ＬＤ−ＵＳＡＣのＴＣＸコアコーダにおいて実現され得る。

これらの特徴により、適応低周波数エンファシスで生成するビットストリームは、容易に復号化され得るが、適応低周波数デエンファシスは、ビットストリームにすでに含まれる情報を使用するだけでデコーダにより実行され得る。

本発明の好ましい実施の形態によれば、オーディオデコーダは、周波数時間変換器と、ビットストリームに含まれる複数の線形予測符号化係数を受ける逆線形予測符号化フィルタとの組合せを含み、この組合せは、逆処理されたスペクトルおよび線形予測符号化係数に基づく出力信号を出力するため、逆処理されたスペクトルを逆フィルタリングしかつ時間領域へ変換するよう構成される。

周波数時間変換器は、上述のとおり時間周波数変換器の動作の逆の動作を行うためのツールである。特に、周波数領域の信号のスペクトルをその時間領域でフレーミングされたデジタル信号に変換してオリジナル信号を推定するためのツールである。周波数時間変換器は、逆修正離散コサイン変換（逆ＭＤＣＴ）を使用し得るが、修正離散コサイン変換は、タイプＩＶ離散コサイン変換（ＤＣＴ−ＩＶ）に基づく重複変換（ｌａｐｐｅｄｔｒａｎｓｆｏｒｍ）であり、重複するという付加的な特徴がある。すなわち、より大きなデータセットの連続するフレームに対して行われるよう設計され、１フレームの後半が次のフレームの前半と一致するよう後続のフレームが重ね合わされる。この重ね合わせは、ＤＣＴのエネルギ圧縮品質と合わせて、信号圧縮の応用についてＭＤＣＴを特に魅力あるものにするが、これは、フレーム境界から生じるアーチファクトの回避に役に立つからである。当業者には、他の変換も可能であることは理解されるであろう。しかしながら、デコーダにおける変換は、エンコーダにおける変換の逆の変換である必要がある。

逆線形予測符号化フィルタは、上記の線形予測符号化フィルタ（ＬＰＣフィルタ）により行われる動作の逆の動作を実行するためのツールである。これは、オーディオ信号処理および音声信号処理において、線形予測モデルの情報を使用して、デジタル信号を再構成するため、フレーム化されたデジタル信号のスペクトル包絡を復号化するために使用されるツールである。線形予測符号化および復号化は、同じ線形予測符号化係数が使用される限り、完全に可逆であり、ここに記載のとおり、ビットストリームに埋め込んだ線形予測符号化係数をエンコーダからデコーダに送信することにより、これを確実に行うことができる。

これらの特徴により、出力信号は容易に処理され得る。

本発明の好ましい実施の形態によれば、周波数時間変換器は、逆処理されたスペクトルに基づいて時間信号を推定するよう構成され、逆線形予測符号化フィルタは、時間信号に基づいて出力信号を出力するよう構成される。したがって、逆線形予測符号化フィルタは、逆処理されたスペクトルを入力として、時間領域で動作し得る。

本発明の好ましい実施の形態によれば、逆線形予測符号化フィルタが逆処理されたスペクトルに基づいて逆フィルタリングされた信号を推定するよう構成され、周波数時間変換器が、逆フィルタリングされた信号に基づいて出力信号を出力するよう構成される。

代替的かつ等価的に、かつエンコーダ側で行われる上記のＦＤＮＳ手順と同様に、周波数時間変換器および逆線形予測符号化フィルタの順序を、後者が先にかつ周波数領域（時間領域ではなく）で行われるように、逆にしてもよい。より詳細には、逆線形予測符号化フィルタは、逆処理されたスペクトルに基づいて逆フィルタリングされた信号を出力してもよく、逆線形予測符号化フィルタが［特許文献２］で示すとおり、線形予測符号化係数のスペクトル表示を乗算（または除算）することにより適用される。したがって、上記のもののような周波数時間変換器は、時間周波数変換器へ入力される、逆フィルタリングされた信号に基づいて、出力信号のフレームを推定するよう構成されても良い。

なお、当業者には、これら２つのアプローチ、すなわち、周波数領域での線形逆フィルタリングに続いて周波数時間変換を行うやりかたと、周波数時間変換の後に時間領域においてスペクトル重み付けにより線形フィルタリングを行うやりかたは、これらが等価になるよう実現できることが明らかなはずである。

本発明の好ましい実施の形態において、制御装置が、線形予測符号化係数のスペクトル表示を推定するよう構成されるスペクトル解析部と、さらなる基準スペクトル線を下回るスペクトル表示の最小値およびスペクトル表示の最大値を推定するよう構成される最小値最大値解析部と、最小値および最大値に基づき、基準スペクトル線より低い周波数を表す逆処理されたスペクトルのスペクトル線を計算するためのスペクトル線デエンファシスファクタを計算するよう構成されるデエンファシスファクタ計算部とを含み、逆処理されたスペクトルのスペクトル線が、スペクトル線デエンファシスファクタを逆量子化されたスペクトルのスペクトル線に適用することによりデエンファサイズされる。スペクトル解析部は、上記のとおり時間周波数変換器でもよい。スペクトル表示は、線形予測符号化フィルタの伝達関数であり、必ずしもそうでなくてもよいが、上記のＦＤＮＳのために使用するものと同じスペクトル表示でもよい。スペクトル表示は、線形予測符号化係数の奇数離散フーリエ変換（ＯＤＦＴ）から計算され得る。ｘＨＥ−ＡＡＣおよびＬＤ−ＵＳＡＣでは、伝達関数は、スペクトル表示全体をカバーする３２または６４ＭＤＣＴ領域ゲインで近似化され得る。

本発明の好ましい実施の形態において、デエンファシスファクタ計算部は、スペクトル線デエンファシスファクタが、基準スペクトル線から逆処理されたスペクトルの最低周波数を表すスペクトル線の方向に減少するような態様で構成される。これは、最低周波数を表すスぺクトル線の減衰が一番大きく、基準スペクトル線に隣接するスペクトル線の減衰が一番小さいことを意味する。基準スペクトル線および基準スペクトル線より高い周波数を表すスぺクトル線は、全くでデエンファサイズされない。これにより、可聴的に問題なく計算の複雑さが低減される。

本発明の好ましい実施の形態においては、デエンファシスファクタ計算部が、第１の式δ＝（α・ｍｉｎ／ｍａｘ）^‐βにしたがい基底デエンファシスファクタを計算するよう構成される第１の段を含み、αは、第１の予め設定された値であり、α＞１であり、βは、第２の予め設定された値であり、０＜β≦１であり、ｍｉｎは、スペクトル表示の最小値であり、ｍａｘは、スペクトル表示の最大値であり、δが基底デエンファシスファクタであり、かつデエンファシスファクタ計算部が、第２の式ζ_ｉ＝δ^i’−iにしたがいスペクトル線デエンファシスファクタを計算するよう構成される第２の段を含み、ｉ’がデエンファサイズ対象のスペクトル線の数であり、ｉがそれぞれのスペクトル線のインデクスであり、インデクスが、スペクトル線の周波数と共に増加し、ｉ＝０〜ｉ^’−１であり、δが基底デエンファシスファクタであり、ζ_iがインデクスｉのスペクトル線デエンファシスファクタである。デエンファシスファクタ計算部の動作は、上記のとおりエンファシスファクタ計算部の動作の逆である。基底デエンファシスファクタは、第１の式により容易な態様で最小値および最大値の比から計算される。この基底デエンファシスファクタは、すべてのスペクトル線デエンファシスファクタの計算の基底として役割を果たし、第２の式により、スぺクトル線デエンファシスファクタが、基準スペクトル線から逆処理スペクトルの最小周波数を表すスぺクトル線の方向に減少することが確実となる。先行技術の解決法とは対照的に、提案の解決法では、スペクトル帯域ごとの開平演算または同様の複雑な演算は不要である。エンコーダとデコーダ側それぞれ１つずつ、２つの除算と２つのべき乗演算子が必要なだけである。

本発明の好ましい実施の形態において、第１の予め設定された値が、４２より小さくかつ２２より大きく、詳細には３８より小さくかつ２６より大きく、より詳細には３４より小さくかつ３０より大きい。上記の間隔は、経験に基づくものである。第１の予め設定された値が３２に設定されている場合に、最良の結果が達成され得る。なお、デコーダの第１の予め設定された値は、エンコーダ１の第１の予め設定された値と同じにする必要がある。

本発明の好ましい実施の形態において、第２の予め設定された値は、式β＝１／（θ・ｉ’）により決定され、ここで、ｉ’はデエンファサイズされるスペクトル線の数であり、θは３と５の間、詳細には３．４と４．６との間、より詳細には、３．８と４．２との間のファクタである。第２の予め設定された値が４に設定される場合に、最良の結果が達成され得る。なお、デコーダの第２の予め設定された値は、エンコーダの第２の予め設定された値と同じのはずである。

本発明の好ましい実施の形態において、基準スペクトル線は、６００Ｈｚと１０００Ｈｚの間、詳細には７００Ｈｚと９００Ｈｚの間、より詳細には７５０Ｈｚと８５０Ｈｚの間の周波数を表す。これらの経験的に見つけられた間隔により、十分な低周波数エンファシスが確保され、システムの計算の複雑さが確実に低くなる。これらの間隔により、特に、密度が高いスペクトルにおいて、より低周波数の線が十分な正確さで符号化されることが確実となる。好ましい実施の形態において、基準スペクトル線は、８００Ｈｚを表し、３２のスペクトル線がデエンファサイズされる。デコーダの基準スペクトル線は、エンコーダの基準スペクトル線と同じ周波数を表すはずであることは、明らかである。

本発明の好ましい実施の形態において、さらなる基準スペクトル線が、基準スペクトル線と同じまたはより高い周波数を表す。これらの特徴により、最小値および最大値の推定が、エンコーダの場合と同様、関連の周波数域で確実に行われる。

本発明の好ましい実施の形態では、最大値が最小値に第１の予め設定された値αを乗算したものを下回る場合にのみ、基準スペクトル線よりも低い周波数を表す逆処理されたスペクトルのスペクトル線がデエンファサイズされるような態様で、制御装置が構成される。これらの特徴により、デコーダの作業負荷が最小化され、量子化の際に知覚的に無関係な領域に対してビットが無駄にされないように、必要な場合にのみ低周波数デエンファシスが実行されることが確実となる。

ある局面において、本発明は、デコーダおよびエンコーダを含むシステムを提供し、エンコーダが、本発明にしたがい設計されかつ／またはデコーダが本発明にしたがい設計される。

ある局面において、本発明は、そこからビットストリームを生成するように非音声オーディオ信号を符号化するための方法を提供し、この方法が、オーディオ信号のフレームおよび線形予測符号化係数に基づきスペクトルを出力するために、複数の線形予測符号化係数を有する線形予測符号化フィルタで、フレームをフィルタリングしかつ周波数領域へ変換するステップと、フィルタリングされたフレームのスペクトルに基づき処理されたスペクトルを計算するステップを含み、基準スペクトル線より低い周波数を表す処理されたスペクトルのスペクトル線が強調され、さらに、線形予測符号化フィルタの線形予測符号化係数に依拠して処理されたスペクトルの計算を制御するステップとを含む。

ある局面において、本発明は、ビットストリームから非音声オーディオ出力信号を生成するよう、ビットストリームを非音声オーディオ信号に基づいて復号化するための方法を提供し、特に先行の請求項に記載の方法により生成されるビットストリームを復号化するための方法であり、ビットストリームが、量子化されたスペクトルおよび複数の線形予測符号化係数を含み、方法が、ビットストリームから量子化されたスペクトルおよび線形予測符号化係数を抽出するステップと、量子化されたスペクトルに基づいて逆量子化スペクトルを生成するステップと、逆量子化されたスペクトルに基づいて逆処理されたスペクトルを計算するステップを含み、基準スペクトル線より低い周波数を表す逆処理されたスペクトルのスペクトル線がデエンファサイズされ、さらにビットストリームに含まれる線形予測符号化係数に依拠して逆処理されたスペクトルの計算を制御するステップとを含む。

ある局面において、本発明は、コンピュータまたは処理装置で実行され、発明の方法を実行するためのコンピュータプログラムを提供する。

発明の好ましい実施の形態について、以下に添付の図面を参照して説明する。

本発明のオーディオエンコーダの第１の実施の形態を示す図である。本発明のオーディオエンコーダの第２の実施の形態を示す図である。本発明のオーディオエンコーダにより実行される低周波数エンファシスの第１の例を示す図である。本発明のオーディオエンコーダにより実行される低周波数エンファシスの第２の例を示す図である。本発明のオーディオエンコーダにより実行される低周波数エンファシスの第３の例を示す図である。本発明のオーディオデコーダの第１の実施の形態を示す図である。本発明のオーディオデコーダの第２の実施の形態を示す図である。本発明のオーディオデコーダにより実行される低周波数デエンファシスの第１の例を示す図である。本発明のオーディオデコーダにより実行される低周波数デエンファシスの第２の例を示す図である。本発明のオーディオデコーダにより実行される低周波数デエンファシスの第３の例を示す図である。

図１ａは、本発明のオーディオエンコーダ１の第１の実施の形態を示す図である。そこからビットストリームＢＳを生成するために、非音声オーディオ信号ＡＳを符号化するためのオーディオエンコーダ１は、複数の線形予測符号化係数ＬＣを有する線形予測符号化フィルタ２と時間周波数変換器３との組合せ２、３を含み、組合せ２、３は、オーディオ信号ＡＳのフレームＦＩおよび線形予測符号化係数ＬＣに基づきスペクトルＳＰを出力するために、フレームＦＩをフィルタリングしかつ周波数領域へ変換するよう構成され、さらにスペクトルＳＰに基づいて処理されたスペクトルＰＳを計算するよう構成される低周波数エンファシス回路（ｅｍｐｈａｓｉｓｅｒ）４を含み、基準スペクトル線ＲＳＬ（図２参照）より低い周波数を表す処理されたスペクトルＰＳのスペクトル線ＳＬ（図２参照）が、強調され、かつさらに線形予測符号化フィルタ２の線形予測符号化係数ＬＣに依拠して低周波数エンファシス回路４による処理されたスペクトルＰＳの計算を制御するよう構成される制御装置５を含む。

線形予測符号化フィルタ（ＬＰＣフィルタ）２は、線形予測モデルの情報を使用して、サウンドのフレーム化されたデジタル信号のスペクトル包絡を圧縮した形式で表すために、オーディオ信号処理および音声処理において使用されるツールである。

時間周波数変換器３は、信号のスペクトルを推定するように特にフレーム化されたデジタル信号を時間領域から周波数領域へ変換するためのツールである。時間周波数変換器３は、タイプＩＶ離散コサイン変換（ＤＣＴ−ＩＶ）に基づく重複（ｌａｐｐｅｄ）変換である修正離散コサイン変換（ＭＤＣＴ）を使用することが可能で、重複されるという特徴が追加される。これは、より大きなデータセットの連続するフレームに対して行われるよう設計されており、後続のフレームは、１フレームの後半が次のフレームの前半と一致するように重ね合わされる。この重ね合わせは、ＤＣＴのエネルギ圧縮品質と合わせて、フレーム境界から生じるアーチファクトの回避に役立つため、信号圧縮の応用についてＭＤＣＴを特に魅力あるものにする。

低周波数エンファシス回路４は、フィルタリングされたフレームＦＦのスペクトルＳＰに基づき処理されたスペクトルＰＳを計算するよう構成され、基準スペクトル線ＲＳＬより低い周波数を表す処理されたスペクトルＰＳのスペクトル線ＳＬは、処理されたスペクトルＰＳに含まれる低周波数のみを強調するように強調される。基準スペクトル線ＲＳＬは、経験に基づいて予め定義されてもよい。

制御装置５は、線形予測符号化フィルタ２の線形予測符号化係数ＬＣに依拠して低周波数エンファシス回路４による処理されたスペクトルＳＰの計算を制御するよう構成される。したがって、本発明によるエンコーダ１は、低周波数エンファシス目的で、オーディオ信号ＡＳのスペクトルＳＰを解析する必要がない。さらに、エンコーダ１および後続のデコーダ１２において同じ線形予測符号化係数ＬＣを使用できるので（図５参照）、適応低周波数エンファシスは、線形予測符号化係数ＬＣが、エンコーダ１また他のなんらかの手段で生成されるビットストリームＢＳでデコーダ１２に送信される限り、スペクトル量子化にも関わらず完全に可逆である。一般に、線形予測符号化係数ＬＣは、それぞれのデコーダ１２によりビットストリームＢＳからオーディオ出力信号ＯＳ（図５を参照）を再構築する目的で、いずれにしてもビットストリームＢＳで送信する必要がある。したがって、ビットストリームＢＳのビットレートは、ここに記載する低周波数エンファシスにより増大することはない。

ここに記載の適応低周波数エンファシスシステムは、フレームごとに時間領域とＭＤＣＴ領域の符号化を切り替えられるｘＨＥ−ＡＡＣ［非特許文献３］の低遅延変形である、ＬＤ−ＵＳＡＣのＴＣＸコアコーダにおいて実現され得る。

本発明の好ましい実施の形態によれば、オーディオ信号ＡＳのフレームＦＩが線形予測符号化フィルタ２に入力され、フィルタリングされたフレームＦＦが線形予測符号化フィルタ２により出力され、かつ時間周波数変換器３が、フィルタリングされたフレームＦＦに基づいてスペクトルＳＰを推定するよう構成される。したがって、線形予測符号化フィルタ２は、オーディオ信号ＡＳをその入力として、時間領域で動作し得る。

本発明の好ましい実施の形態によれば、オーディオエンコーダ１は、処理されたスペクトルＢＳに基づいて量子化されたスペクトルＱＳを生成するよう構成される量子化装置６と、量子化されたスペクトルＱＳおよび線形予測符号化係数ＬＣをビットストリームＢＳに埋め込むよう構成されるビットストリーム生成部７とを含む。デジタル信号処理における量子化は、入力値の大きなセットをより小さい（数えられる）セットにマッピング、すなわち値をなんらかの精度の単位に丸める等のプロセスである。量子化を行う装置またはアルゴリズム機能を量子化装置６と呼ぶ。ビットストリーム生成部７は、単一のビットストリームＢＳに、異なるソース２および６からのデジタルデータを埋め込むことができるいずれかの装置でよい。これらの特徴により、適応低周波数エンファシスで生成されるビットストリームＢＳを容易に生成することができ、適応低周波数エンファシスは、ビットストリームＢＳに含まれる情報を使用するだけで、後続のデコーダ１２により完全に可逆である。

本発明の好ましい実施の形態において、制御装置５は、線形予測符号化係数ＬＣのスペクトル表示ＳＲを推定するよう構成されるスペクトル解析部８と、さらなる基準スペクトル線を下回るスペクトル表示ＳＲの最小値ＭＩおよびスペクトル表示ＳＲの最大値ＭＡを推定するよう構成される最小値最大値解析部９と、最小値ＭＩおよび最大値ＭＡに基づき基準スペクトル線ＲＳＬより低い周波数を表す処理されたスペクトルＰＳのスペクトル線ＳＬを計算するためのスペクトル線エンファシスファクタＳＥＦを計算するよう構成されるエンファシスファクタ計算部１０および１１とを含み、処理されたスペクトルＰＳのスペクトル線ＳＬは、スペクトル線エンファシスファクタＳＬをフィルタリングされたフレームＦＦのスペクトルＳＰのスペクトル線に適用することにより強調される。スペクトル解析部は、上記のとおり時間周波数変換器でもよい。スペクトル表示ＳＲは、線形予測符号化フィルタ２の伝達関数である。スペクトル表示ＳＲは、線形予測符号化係数の奇数離散フーリエ変換（ＯＤＦＴ）から計算され得る。ｘＨＥ−ＡＡＣおよびＬＤ−ＵＳＡＣでは、伝達関数は、スペクトル表示ＳＲ全体をカバーする３２または６４ＭＤＣＴ領域ゲインで近似化され得る。

本発明の好ましい実施の形態では、エンファシスファクタ計算部１０および１１は、スペクトル線エンファシスファクタＳＥＦが、基準スペクトル線ＲＳＬから処理されたスペクトルＰＳの最低周波数を表すスペクトル線ＳＬ_０の方向に増加するような態様で構成される。これは、最低周波数を表すスペクトル線ＳＬ_０が最も増幅される一方で、基準スペクトル線に隣接するスペクトル線ＳＬ_ｉ’−１の増幅が最小であることを意味する。基準スペクトル線ＲＳＬおよび基準スペクトル線ＲＳＬより高い周波数を表すスペクトル線ＳＬ_ｉ’＋１は、全く強調されない。これにより、可聴的に問題なく、計算の複雑さが低減できる。

本発明の好ましい実施の形態において、エンファシスファクタ計算部１０および１１は、第１の式γ＝（α・ｍｉｎ／ｍａｘ）^βにしたがい基底エンファシスファクタＢＥＦを計算するよう構成される第１の段１０を含み、ここでαは第１の予め設定された値であり、α＞１であり、βは、第２の予め設定された値であり、０＜β≦１であり、ｍｉｎは、スペクトル表示ＳＲの最小値ＭＩであり、ｍａｘは、スペクトル表示ＳＲの最大値ＭＡであり、γは、基底エンファシスファクタＢＥＦであり、エンファシスファクタ計算部１０および１１は、第２の式ε_ｉ＝γ^i’-iにしたがいスペクトル線エンファシスファクタＳＥＦを計算するよう構成される第２の段１１を含み、ｉ^’は、強調されるべきスペクトル線ＳＬの数であり、ｉがそれぞれのスペクトル線ＳＬのインデクスであり、インデクスは、スペクトル線ＳＬの周波数と共に増加し、ｉ＝０〜ｉ^’−１であり、γは、基底エンファシスファクタＢＥＦであり、ε_iは、インデクスｉでのスペクトル線エンファシスファクタＳＥＦである。基底エンファシスファクタは、第１の式により最小値および最大値の比から容易に計算される。基底エンファシスファクタＢＥＦは、全スペクトル線エンファシスファクタＳＥＦの計算に関する基底としての役割をし、第２の式は、基準スペクトル線ＲＳＬからスペクトルＰＳの最低周波数を表すスペクトル線ＳＬ_０の方向に、スペクトル線エンファシスファクタＳＥＦが増加することを確実にする。先行技術の解決法と違い、提案の解決法は、スペクトル帯域ごとの開平演算または同様の複雑な演算が不要である。エンコーダ側とデコーダ側に１つずつ、２つの除算と２つのべき乗演算子を必要とするのみである。

本発明の好ましい実施の形態において、第２の予め設定された値は、式β＝１／（θ・ｉ^’）により決定され、ｉ^’は、強調されるスペクトル線ＳＬの数であり、θは、３と５の間、詳細には３．４および４．６の間、より詳細には、３．８および４．２の間のファクタである。これらの間隔も経験に基づくものである。最良の結果は、第２の予め定められた値が４に設定される場合に達成され得ることがわかっている。

本発明の好ましい実施の形態において、基準スペクトル線ＲＳＬが、６００Ｈｚと１０００Ｈｚの間、詳細には、７００Ｈｚと９００Ｈｚの間、より詳細には７５０Ｈｚと８５０Ｈｚの間の周波数を表す。これらの経験的に見つけられた間隔により、十分な低周波数エンファシスが確保され、かつシステムの計算の複雑性が確実に低くなる。これらの間隔は、特に、密度が高いスペクトルにおいて、より低周波数の線が十分な正確さで符号化されることを確実にする。好ましい実施の形態では、基準スペクトル線が８００Ｈｚを表し、３２のスペクトル線が強調される。

スペクトル線エンファシスファクタＳＥＦの計算は、プログラムコードの以下の入来により行われ得る。

本発明の好ましい実施の形態においては、さらなる基準スペクトル線が、基準スペクトル線ＲＳＬより高い周波数を表す。これらの特徴により、最小値ＭＩと最大値ＭＡの推定が、関連の周波数域において行われることが確実になる。

図１ｂは、本発明のオーディオエンコーダ１の第２の実施の形態を示す図である。第２の実施の形態は、第１の実施の形態に基づく。以下では、２つの実施の形態の相違点のみを説明する。

本発明の好ましい実施の形態によれば、オーディオ信号ＡＳのフレームＦＩが時間周波数変換器３に入力され、変換されたフレームＣＦが時間周波数変換器３により出力され、かつ線形予測符号化フィルタ２が、変換されたフレームＣＦに基づきスペクトルＳＰを推定するよう構成される。代替的に、ただし、低周波数エンファシス回路を有する発明のエンコーダ１の第１の実施の形態と等価な態様で、エンコーダ１がたとえば［特許文献２］に開示されるように周波数領域雑音整形（ＦＤＮＳ）により生成されるフレームＦＩのスペクトルＳＰに基づき処理されたスペクトルＰＳを計算してもよい。より詳細には、ここでのツールの順序は修正される。すなわち、上記のもののような時間周波数変換器３は、オーディオ信号ＡＳのフレームＦＩに基づいて変換されたフレームＦＣを推定するよう構成され、かつ線形予測符号化フィルタ２は、時間周波数変換器３により出力される、変換されたフレームＦＣに基づいてオーディオスペクトルＳＰを推定するよう構成される。したがって、線形予測符号化フィルタ２は、変換されたフレームＦＣをその入力として、周波数領域で（時間領域ではなく）動作してもよく、線形予測符号化フィルタ２は、線形予測符号化係数ＬＣのスペクトル表示を乗算することにより適用される。

第１および第２の実施の形態、すなわち、時間領域の線形フィルタリングに続いて時間周波数変換を行うことと、時間周波数変換後に周波数領域においてスペクトル重み付けによる線形フィルタリングを行うことが、等価になるように実現できることは、当業者には明らかなはずである。

図２は、発明のエンコーダにより実行される低周波数エンファシスの第１の例を示す。図２は、共通の座標系における典型的スペクトル線ＳＰ、典型的スペクトル線エンファシスファクタＳＥＦおよび典型的な処理されたスペクトルＳＰを示し、ここで周波数は、ｘ軸に対してプロットされ、周波数に依拠する振幅はｙ軸に対してプロットされる。基準スペクトル線ＲＳＬより低い周波数を表すスペクトル線ＳＬ_０からＳＬ_ｉ’−１が増幅される一方、基準スペクトル線ＲＳＬおよび基準スペクトル線ＲＳＬより高い周波数を表すスペクトル線ＳＬ_ｉ’＋１は増幅されない。図２は、線形予測符号化係数ＬＣのスペクトル表示ＳＲの最小値ＭＩと最大値ＭＡの比が１に近くなるような状況を示す。したがって、スペクトル線ＳＬ_０の最大スペクトル線エンファシスファクタＳＥＦは、約２．５である。

図３は、本発明のエンコーダにより実行される低周波数エンファシスの第２の例を示す。図２に示すような低周波数エンファシスに対する相違点は、線形予測符号化係数ＬＣのスペクトル表示ＳＲの最小値ＭＩと最大値ＭＡの比がより小さい点である。したがって、スペクトル線ＳＬ_０の最大スペクトル線エンファシスファクタＳＥＦは、より小さく、たとえば２．０を下回る。

図４は、本発明のエンコーダにより実行される低周波数エンファシスの第３の例を示す。本発明の好ましい実施の形態では、最大値が最小値に第１の予め設定された値を乗算したものより小さい場合にのみ、基準スペクトル線ＲＳＬより低い周波数を表す処理されたスペクトルＳＰのスペクトル線ＳＬが強調されるような態様で、制御装置５が構成される。これらの特徴により、エンコーダの作業負荷が最小化され得るように、必要な場合にのみ低周波数エンファシスが実行されることが確実となる。図４では、低周波数エンファシスが行われないように、これらの条件が満たされる。

図５は、本発明のデコーダの実施の形態を示す。オーディオデコーダ１２は、ビットストリームＢＳから非音声オーディオ出力信号ＯＳを生成するよう、非音声オーディオ信号に基づきビットストリームＢＳを復号化するよう構成され、特に本発明のオーディオエンコーダ１により生成されるビットストリームＢＳを復号化するよう構成され、ビットストリームＢＳが、量子化されたスペクトルＱＳおよび複数の線形予測符号化係数ＬＣを含む。

オーディオデコーダ１２は、ビットストリームＢＳから量子化されたスペクトルＱＳおよび線形予測符号化係数ＬＣを抽出するよう構成されるビットストリーム受信部１３と、量子化されたスペクトルＱＳに基づいて逆量子化されたスペクトルＤＱを生成するよう構成される逆量子化装置１４と、逆量子化されたスペクトルＤＱに基づいて逆処理されたスペクトルＲＳを計算するよう構成される低周波数デエンファシス回路（ｄｅ‐ｅｍｐｈａｓｉｚｅｒ）１５を含み、基準スペクトル線ＲＳＬＤより低い周波数を表す逆処理されたスペクトルＲＳのスペクトル線ＳＬＤがデエンファサイズされ、さらに、ビットストリームＢＳに含まれる線形予測符号化係数ＬＣに依拠して低周波数デエンファシス回路１５による逆処理されたスペクトルＲＳの計算を制御するよう構成される制御装置１６とを含む。

ビットストリーム受信部１３は、適切な後続の処理段へ分類したデータを送信するよう、単一のビットストリームＢＳからのデジタルデータを分類することができるいずれかの装置でよい。特に、ビットストリーム受信部１３は、ビットストリームＢＳから、その後逆量子化装置１４へ転送される、量子化されたスペクトルＱＳおよびその後制御装置１６へ転送される、線形予測符号化係数ＬＣを抽出するよう構成される。

逆量子化装置１６は、量子化されたスペクトルＱＳに基づいて逆量子された化スペクトルＤＱを生成するよう構成されるが、逆量子化とは上記の量子化に関して逆のプロセスである。

低周波数デエンファシス回路１５は、逆量子化されたスペクトルＱＳに基づいて逆処理されたスペクトルＲＳを計算するよう構成され、基準スペクトル線ＲＳＬＤより低い周波数を表す逆処理されたスペクトルＲＳのスペクトル線ＳＬＤが、逆処理されたスペクトルＲＳに含まれる低周波数のみがデエンファサイズされるように、デエンファサイズされる。基準スペクトル線ＲＳＬＤは、経験に基づき予め定義してもよい。なお、デコーダ１２の基準スペクトル線ＲＳＬＤは、上記のとおりエンコーダ１の基準スペクトル線ＲＳＬと同じ周波数を表すはずである。しかしながら、基準スペクトル線ＲＳＬＤが指す周波数は、ビットストリームＢＳでこの周波数を送信する必要がないように、デコーダ側に記憶されてもよい。

制御装置１６は、線形予測符号化フィルタ２の線形予測符号化係数ＬＳに依拠して低周波数デエンファシス回路１５による逆処理されたスペクトルＲＳの計算を制御するよう構成される。同じの線形予測符号化係数ＬＣが、ビットストリームＢＳを生成するエンコーダ１およびデコーダ１２においても使用され得るので、ビットストリームＢＳで線形予測符号化係数がデコーダ１２に送信される限りにおいては、スペクトル量子化にもかかわらず、適応低周波数エンファシスは完全に可逆である。一般に、線形予測符号化係数ＬＣは、デコーダ１２によりビットストリームＢＳからのオーディオ出力信号ＯＳを再構成する目的で、いずれにしてもビットストリームＢＳで送信する必要がある。したがって、ビットストリームＢＳのビットレートが、ここに記載の低周波数エンファシスおよび低周波数デエンファシスにより増大することはない。

ここに記載の適応低周波数デエンファシスシステムは、フレームごとに時間領域とＭＤＣＴ領域の符号化を切り替えられるｘＨＥ−ＡＡＣ［非特許文献３］の低遅延変形である、ＬＤ−ＵＳＡＣのＴＣＸコアコーダにおいて実現され得る。

これらの特徴により、適応低周波数エンファシスで生成するビットストリームＢＳは、容易に復号化でき、適応低周波数デエンファシスは、ビットストリームＢＳに含まれる情報を使用するだけでデコーダ１２により実行され得る。

本発明の好ましい実施の形態によれば、オーディオデコーダ１２は、周波数時間変換器１７と、ビットストリームＢＳに含まれる複数の線形予測符号化係数ＬＣを受ける逆線形予測符号化フィルタ１８との組合せ１７、１８を含み、組合せ１７、１８は、逆処理されたスペクトルＲＳおよび線形予測符号化係数ＬＣに基づき出力信号ＯＳを出力するため、逆処理されたスペクトルＲＳを逆フィルタリングしかつ時間領域へ変換するよう構成される。

周波数時間変換器１７は、上述のとおり時間周波数変換器３の動作の逆の動作を行うためのツールである。特に、周波数領域の信号のスペクトルをその時間領域でフレーミングされたデジタル信号に変換してオリジナル信号を推定するためのツールである。周波数時間変換器は、逆修正離散コサイン変換（逆ＭＤＣＴ）を使用し得るが、修正離散コサイン変換とは、タイプＩＶ離散コサイン変換（ＤＣＴ−ＩＶ）に基づく重複変換であり、重複するという付加的な特徴がある。すなわち、より大きなデータセットの連続するフレームに対して行われるよう設計され、１フレームの後半が次のフレームの前半と一致するよう後続のフレームが重ね合わされる。この重ね合わせは、ＤＣＴのエネルギ圧縮品質と合わせて、信号圧縮の応用についてＭＤＣＴを特に魅力あるものにするが、これは、フレーム境界から生じるアーチファクトの回避に役立つためである。当業者には、他の変換も可能であることは理解されるであろう。しかしながら、デコーダ１２における変換は、エンコーダ１における変換の逆の変換である必要がある。

逆線形予測符号化フィルタ１８は、上記の線形予測符号化フィルタ（ＬＰＣフィルタ）２により行われる動作の逆の動作を実行するためのツールである。これは、オーディオ信号および音声信号処理において、線形予測モデルの情報を使用して、デジタル信号を再構成するために、フレーム化されたデジタル信号のスペクトル包絡を復号化するために使用されるツールである。線形予測符号化および復号化は、知られているとおり、同じ線形予測符号化係数が使用されるので、完全に可逆であり、ここに記載のとおり、ビットストリームＢＳに埋め込んだ線形予測符号化係数ＬＣをエンコーダ１からデコーダ１２に送信することにより、これを確実に行うことができる。

これらの特徴により、出力信号ＯＳは容易に処理され得る。

本発明の好ましい実施の形態によれば、周波数時間変換器１７は、逆処理されたスペクトルＲＳに基づいて時間信号ＴＳを推定するよう構成され、逆線形予測符号化フィルタ１８は、時間信号ＴＳに基づいて出力信号ＯＳを出力するよう構成される。したがって、逆線形予測符号化フィルタ１８は、時間信号ＴＳをその入力として、時間領域で動作し得る。

本発明の好ましい実施の形態において、制御装置１６は、線形予測符号化係数ＬＣのスペクトル表示ＳＲを推定するよう構成されるスペクトル解析部１９と、さらなる基準スペクトル線を下回るスペクトル表示ＳＲの最小値ＭＩおよびスペクトル表示ＳＲの最大値ＭＡを推定するよう構成される最小値最大値解析部２０と、最小値ＭＩおよび最大値ＭＡに基づいて、基準スペクトル線ＲＳＬＤより低い周波数を表す逆処理されたスペクトルＲＳのスペクトル線ＳＬＤを計算するために、スペクトル線デエンファシスファクタＳＤＦを計算するよう構成されるデエンファシスファクタ計算部２１および２２を含み、逆処理されたスペクトルＲＳのスペクトル線ＳＬＤは、スペクトル線デエンファシスファクタＳＤＦを、逆量子化スペクトルＤＱのスぺクトル線に適用することによりデエンファサイズされる。スペクトル解析部は、上記のとおり時間周波数変換器でもよい。スペクトル表示は、線形予測符号化フィルタの伝達関数である。スペクトル表示は、線形予測符号化係数の奇数離散フーリエ変換（ＯＤＦＴ）から計算され得る。ｘＨＥ−ＡＡＣおよびＬＤ−ＵＳＡＣにおいて、伝達関数は、スペクトル表示全体をカバーする３２または６４ＭＤＣＴ領域ゲインにより近似化され得る。

本発明の好ましい実施の形態において、デエンファシスファクタ計算部は、スペクトル線デエンファシスファクタが、基準スペクトル線から逆処理されたスペクトルの最低周波数を表すスペクトル線の方向に減少するような態様で構成される。これは、最低周波数を表すスぺクトル線の減衰が一番大きく、基準スペクトル線に隣接するスペクトル線の減衰が一番小さいことを意味する。基準スペクトル線および基準スペクトル線より高い周波数を表すスぺクトル線は、全くデエンファサイズされない。これにより、可聴的に問題なく、計算の複雑さが低減される。

本発明の好ましい実施の形態においては、デエンファシスファクタ計算部２１および２２が、第１の式δ＝（α・ｍｉｎ／ｍａｘ）^‐βにしたがい基底デエンファシスファクタＢＤＦを計算するよう構成される第１の段２１を含み、ここでαは、第１の予め設定された値で、α＞１であり、βは、第２の予め設定された値で、０＜β≦１であり、ｍｉｎは、スペクトル表示ＳＲの最小値ＭＩであり、ｍａｘは、スペクトル表示ＳＲの最大値ＭＡであり、δが基底デエンファシスファクタＢＤＦであり、かつデエンファシスファクタ計算部２１および２２が、第２の式ζ_ｉ＝δ^i’-i、にしたがいスペクトル線デエンファシスファクタＳＤＦを計算するよう構成される第２の段２２を含み、ここでｉ’がデエンファサイズ対象のスペクトル線ＳＬＤの数であり、ｉがそれぞれのスペクトル線ＳＬＤのインデクスであり、インデクスが、スペクトル線ＳＬＤの周波数と共に増加し、ｉ＝０〜ｉ^’−１であり、δが基底デエンファシスファクタであり、ζ_iがインデクスｉでのスペクトル線デエンファシスファクタＳＤＦである。デエンファシスファクタ計算部２１および２２の動作は、上記のエンファシスファクタ計算部１０および１１の動作の逆である。基底デエンファシスファクタＢＤＦは、第１の式により最小値ＭＩおよび最大値ＭＡの比から容易に計算される。この基底デエンファシスファクタＢＤＦは、すべてのスペクトル線デエンファシスファクタＳＤＦの計算の基底として役割を果たし、第２の式により、スぺクトル線デエンファシスファクタＳＤＦが、基準スペクトル線ＲＳＬＤから逆処理されたスペクトルＲＳの最低周波数を表すスぺクトル線ＳＬ_０の方向に減少することが確実となる。先行技術の解決法とは対照的に、提案の解決法では、スペクトル帯域ごとの開平演算または同様の複雑な演算は不要である。エンコーダとデコーダ側それぞれ１回ずつ、２つの除算と２つのべき乗演算子が必要なだけである。

本発明の好ましい実施の形態において、第１の予め設定された値は、４２より小さくかつ２２より大きく、詳細には３８より小さくかつ２６より大きく、より詳細には３４より小さくかつ３０より大きい。上記の間隔は、経験に基づくものである。第１の予め設定された値が３２に設定されている場合に、最良の結果が達成され得る。なお、デコーダ１２の第１の予め設定された値は、エンコーダ１の第１の予め設定された値と同じである必要がある。

本発明の好ましい実施の形態において、第２の予め設定された値は、式β＝１／（θ・ｉ’）により決定され、ここで、ｉ’はデエンファサイズされるスペクトル線の数であり、θは３と５の間、詳細には３．４と４．６の間、より詳細には、３．８と４．２の間のファクタである。第２の予め設定された値が４に設定される場合に、最良の結果が達成され得る。なお、デコーダ１２の第２の予め設定された値は、エンコーダ１の第２の予め設定された値と同じである必要がある。

本発明の好ましい実施の形態において、基準スペクトル線ＲＳＬＤは、６００Ｈｚと１０００Ｈｚの間、詳細には７００Ｈｚと９００Ｈｚの間、より詳細には７５０Ｈｚと８５０Ｈｚの間の周波数を表す。これらの経験的に見つけられた間隔により、十分な低周波数エンファシスが確保され、確実にシステムの計算の複雑さが低くなる。これらの間隔により、特に、密度が高いスペクトルにおいて、より低周波数の線が十分な正確さで符号化される。好ましい実施の形態において、基準スペクトル線ＲＳＬＤは、８００Ｈｚを表し、３２のスペクトル線ＳＬがデエンファサイズされる。デコーダ１２の基準スペクトル線ＲＳＬＤは、エンコーダの基準スペクトル線ＲＳＬと同じ周波数を表すはずであることは明らかである。

スペクトル線エンファシスファクタＳＥＦの計算は、プログラムコードの以下の入来により行うことができる。

本発明の好ましい実施の形態では、さらなる基準スペクトル線が、基準スペクトル線ＲＳＬＤと同じまたはより高い周波数を表す。これらの特徴により、最小値ＭＩおよび最大値ＭＡの推定が関連の周波数域で確実に行われる。

図５ｂは、本発明によるオーディオデコーダ１２の第２の実施の形態を示す。第２の実施の形態は、第１の実施の形態に基づく。以下では、これら２つの実施の形態の違いについてのみ説明する。

本発明の好ましい実施の形態にしたがい、逆線形予測符号化フィルタ１８は、逆処理されたスペクトルＲＳに基づいて逆フィルタリングされた信号ＩＦＳを推定するよう構成され、周波数時間変換器１７は、逆フィルタリングされた信号ＩＦＳに基づき出力信号ＯＳを出力するよう構成される。

代替的かつ等価的に、かつエンコーダ側で行われる上記のＦＤＮＳ手順と同様に、周波数時間変換器１７および逆線形予測符号化フィルタ１８の順序を、後者が先に、かつ周波数領域（時間領域ではなく）で行われるように、逆にしてもよい。より詳細には、逆線形予測符号化フィルタ１８は、逆処理されたスペクトルＲＳに基づいて逆フィルタリングされた信号ＩＦＳを出力してもよく、逆線形予測符号化フィルタ２は、［特許文献２］におけるように、線形予測符号化係数ＬＣのスペクトル表示を乗算（または除算）することにより適用される。したがって、上記のもののような周波数時間変換器１７は、時間周波数変換器１７へ入力される、逆フィルタリングされた信号ＩＦＳに基づいて、出力信号ＯＳのフレームを推定するよう構成されても良い。

なお、当業者には、これら２つのアプローチ、すなわち、周波数領域での線形逆フィルタリングに続いて周波数時間変換を行うやりかたと、周波数時間変換の後に時間領域においてスペクトル重み付けにより線形フィルタリングを行うやりかたを、等価になるよう実現できることは明らかなはずである。

図６は、本発明のデコーダにより実行される低周波数デエンファシスの第１の例を示す。図２は、共通の座標系における逆量子化されたスペクトルＤＱ、典型的スペクトル線デエンファシスファクタＳＤＦおよび逆処理されたスペクトルＲＳの典型例を示し、周波数がｘ軸に対してプロットされ、周波数に依拠する振幅がｙ軸に対してプロットされる。基準スペクトル線ＲＳＬＤより低い周波数を表すスペクトル線ＳＬＤ_０からＳＬＤ_ｉ’−１は、デエンファサイズされる一方、基準スペクトル線ＲＳＬＤおよび基準スペクトル線ＲＳＬＤより高い周波数を表すスペクトル線ＳＬＤ_ｉ’＋１はデエンファサイズされない。図６は、線形予測符号化係数ＬＣのスペクトル表示ＳＲの最小値ＭＩおよび最大値ＭＡの比が１に近い状況を示す。したがって、スペクトル線ＳＬ_０の最大スペクトル線エンファシスファクタＳＥＦは、約０．４である。また、図６は、周波数に依拠する量子化誤差ＱＥを示す。強い低周波数デエンファシスにより、量子化誤差ＱＥは、低周波数では非常に低い。

図７は、本発明のデコーダにより実行される低周波数デエンファシスの第２の例を示す。図６に示すような低周波数エンファシスとの違いは、線形予測符号化係数ＬＣのスペクトル表示ＳＲの最小値ＭＩおよび最大値ＭＡの比が、より小さい点である。したがって、スペクトル線ＳＬ_０の最大スペクトル線デエンファシスファクタＳＤＦが初期値で、たとえば０．５を超える。量子化誤差ＱＥは、この場合、より高くなるが、逆処理されたスペクトルＲＳの振幅よりずいぶん低いので、問題にならない。

図８は、本発明のデコーダにより実行される低周波数デエンファシスの第３の例を示す。本発明の好ましい実施の形態では、制御装置１６は、最大値ＭＡが、最小値ＭＩに第１の予め設定された値を乗算したものを下回る場合にのみ、基準スペクトル線ＲＳＬＤよりも低い周波数を表す逆処理されたスペクトルＲＳのスペクトル線ＳＬＤがデエンファサイズされるような態様で構成される。これらの特徴により、デコーダ１２の作業負荷が最小化され得るように、必要な場合にのみ低周波数デエンファシスが実行されることが確実となる。これらの特徴により、エンコーダの作業負荷が最小化され得るように、必要な場合にのみ低周波数デエンファシスが実行されることが確実となる。図８においては、低周波数エンファシスが全く実行されないように、これらの条件が満たされている。

先行技術のＡＬＦＥのアプローチの比較的高い複雑さ（低電力の携帯装置に関する実現性の問題が生じる可能性）および完全な可逆性の欠如（十分な忠実度が得られないリスク）という上記の問題への解決策として、修正適応低周波数エンファシス（ＡＬＦＥ）設計が提案され、その特徴は以下のとおりである。

スペクトル帯ごとの開平演算または同様の複雑な演算を必要としない。必要なのは、エンコーダおよびデコーダ側で各々に１つずつ、２つの除算と２つのべき乗演算子のみである。

スペクトル自体ではなく、ＬＰＣフィルタ係数のスペクトル表示を、エンファシス（デエンファシス）のための制御情報として使用する。エンコーダおよびデコーダにおいて同じＬＰＣ係数が使用されるので、スペクトル量子化にも関わらず、ＡＬＦＥは完全に可逆である。

ここに記載のＡＬＦＥシステムは、フレームごとに時間領域とＭＤＣＴ領域の符号化とを切り替えられるｘＨＥ−ＡＡＣ［非特許文献３］の低遅延変形である、ＬＤ−ＵＳＡＣのＴＣＸコアコーダにおいて実現されている。エンコーダおよびデコーダでのプロセスを以下のとおり要約する。

（１）エンコーダにおいて、ＬＰＣ係数のスペクトル表示の最小値および最大値を、ある周波数を下回ったところで見つける。信号処理において一般に採用されるフィルタのスペクトル表示は、フィルタの伝達関数である。ｘＨＥ−ＡＡＣおよびＬＤ−ＵＳＡＣにおいては、伝達関数は、フィルタ係数の奇数ＤＦＴ（ＯＤＦＴ）から計算された、スペクトル全体をカバーする３２または６４のＭＤＣＴ領域ゲインにより近似化される。

（２）最大値があるグローバルな最小値（０等）より大きく、かつα＞１で（たとえば３２）、最小値のα倍を超えない場合、以下の２つのＡＬＦＥステップを実行する。

（３）低周波数エンファシスファクタγは、γ＝（α・最小値／最大値）βとして、最小値と最大値の比率から計算され、ここで０＜β≦１であり、かつβはαに依拠する。

（４）インデクスｉがある周波数を表すインデクスｉ^’より低い（すなわちすべての線がその周波数、好ましくはステップ１で使用のものと同じ周波数を下回る）ＭＤＣＴ線が、ここでγ^ｉ’−ｉを乗算される。これは、ｉ’に一番近い線の増幅が一番小さいことを意味し、一方で直流に一番近い線である第１の線が最も増幅されることを示唆する。ｉ’＝３２であることが好ましい。

（５）デコーダにおいて、ステップ１および２は、エンコーダにおける場合と同様に実行される（同じ周波数限界）。

（６）ステップ３と同様、エンファシスファクタγの逆数である、低周波数デエンファシスファクタを、δ＝（α・最小値／最大値）−β＝（最大値／（α・最小値））βとして計算する。

（７）インデクスｉがインデクスｉ’より低くかつｉ’がエンコーダにおける場合のように選択されるＭＤＣＴ線は、最終的にδｉ’−ｉが乗算される。結果は、ｉ’に最も近い線の減衰が最も小さく、第１の線の減衰が最大で、かつ全体としてエンコーダ側ＡＬＦＥは完全に可逆になる。

本質的には、提案のＡＬＦＥシステムは、密度が高いスペクトルにおいて、低周波数の線が十分な正確さで符号化されることを確実にする。図８に示すとおり、これを説明する３つのケースが考えられる。最大値が最小値のα倍を上回る場合、ＡＬＦＥは行われない。これは、低周波数ＬＰＣ形状が、入力信号におそらくは強い孤立した低ピッチトーンを起源とする強いピークを含んでいる場合に生じる。ＬＰＣコーダは、典型的には、このような信号を比較的うまく再生できるので、ＡＬＦＥは不要である。

ＬＰＣの形状が平坦な場合、すなわち最大値が最小値に接近する場合、ＡＬＦＥは図６のように最強であり、音楽の雑音のようなアーチファクトの符号化を回避することができる。

近接したトーンの高調波信号等、ＬＰＣの形状が完全に平坦ではなく、ピークがあるわけでもない場合、図７に示すようにゆるやかなＡＬＦＥのみを実行する。なお、ステップ４におけるγおよびステップ７におけるδという指数因子の適用は、べき乗命令を必要とせず、乗算のみで増分的に実行することができる。したがって、発明のＡＬＦＥスキームにより必要となるスペクトル線ごとの複雑性は非常に低い。

装置に関連して、いくつかの局面について説明したが、これらの局面が、対応する方法の説明をも表すことは明らかで、その場合、ブロックまたは装置が方法ステップまたは方法ステップの特徴に対応する。同様に、方法ステップに関連して説明した局面も、対応の装置の対応のブロック、アイテムまたは特徴の説明を表す。方法ステップの一部または全部を、マイクロプロセッサ、プログラマブルコンピュータまたは電子回路等のハードウェア装置により（またはこれを使用して）実行してもよい。いくつかの実施の形態においては、１以上の最も重要な方法ステップを、このような装置により実行してもよい。

なんらかの実現要件に依拠して、本発明の実施の形態は、ハードウェアまたはソフトウェアにより実現できる。その実現は、フロッピーディスク、ＤＶＤ、ブルーレイ、ＣＤ、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭまたはフラッシュメモリ等、それぞれの方法が実行されるようにプログラマブルコンピュータシステムと協働する（または協働可能な）、電子的に可読な制御信号を記憶した非一時的記憶媒体を使用して実行できる。したがって、デジタル記憶媒体は、コンピュータ読み取り可能である。

本発明のいくつかの実施の形態は、ここに記載の方法の１つが実行されるように、プログラマブルコンピュータシステムと協働可能な、電子的に可読な制御信号を有するデータキャリアを含む。

一般に、本発明の実施の形態は、プログラムコードを有するコンピュータプログラム製品として実現でき、このプログラムコードは、コンピュータプログラムがコンピュータ上で実行されると、方法の１つを実行するよう動作する。プログラムコードはたとえば、機械可読なキャリア上に記憶され得る。

他の実施の形態は、機械可読なキャリア上に記憶される、ここに記載の方法のひとつを実行するためのコンピュータプログラムを含む。

したがって、言い換えれば、本発明の方法の実施の形態は、コンピュータ上で実行されると、ここに記載の方法の１つを実行するためのプログラムコードを有するコンピュータプログラムである。

したがって、本発明の方法のさらに他の実施の形態は、ここに記載の方法の１つを実行するためのコンピュータプログラムを記録して含むデータキャリア（デジタル記憶媒体またはコンピュータ可読媒体）である。このデータキャリア、デジタル記憶媒体または記録された媒体は、典型的には有形かつ／または非一時的のものである。

したがって、本発明の方法のさらに他の実施の形態は、ここに記載の方法の１つを実行するためのコンピュータプログラムを表すデータストリームまたは信号のシーケンスである。このデータストリームまたは信号のシーケンスは、たとえば、インターネット等のデータ通信接続を経由して転送されるよう構成され得る。

さらに他の実施の形態は、たとえば、ここに記載の方法の１つを実行するよう構成または適合されたコンピュータまたはプログラマブル論理装置等の処理手段を含む。

さらに他の実施の形態は、ここに記載の方法の１つを実行するためのコンピュータプログラムがインストールされたコンピュータを含む。

本発明のさらに他の実施の形態は、ここに記載の方法の１つを実行するためのコンピュータプログラムを受信部に（たとえば電子的または光学的に）転送するよう構成される装置またはシステムを含む。この受信部は、たとえばコンピュータ、携帯装置、メモリ装置等が可能である。装置またはシステムは、たとえば受信部にコンピュータプログラムを転送するためのファイルサーバを含み得る。

いくつかの実施の形態において、プログラマブル論理装置（たとえばフィールドプログラマブルゲートアレイ）を使用して、ここに記載の方法の機能性の一部または全部を実行することができる。いくつかの実施の形態において、フィールドプログラマブルゲートアレイは、ここに記載の方法の１つを実行するために、マイクロプロセッサと協働し得る。一般的には、これらの方法は、なんらかのハードウェア装置により実行されることが好ましい。

上記の実施の形態は、本発明の原理を説明するためのものに過ぎない。当然ながら、ここに記載の構成および詳細に対する変更および変形が、当業者には明らかになるであろう。したがって、明細書における実施の形態の記載および説明が提示する特定の詳細によってではなく、特許請求の範囲によってのみ限定されることを意図される。

１オーディオエンコーダ
２線形予測符号化フィルタ
３時間周波数変換器
４低周波数エンファシス回路
５制御装置
６量子化装置
７ビットストリーム生成部
８スペクトル解析部
９最小値最大値解析部
１０エンファシスファクタ計算部の第１の段
１１エンファシスファクタ計算部の第２の段
１２オーディオデコーダ
１３ビットストリーム受信部
１４逆量子化装置
１５低周波数デエンファシス回路
１６制御装置
１７周波数時間変換器
１８逆線形予測符号化フィルタ
１９スペクトル解析部
２０最小値最大値解析部
２１デエンファシスファクタ計算部の第１の段
２２デエンファシスファクタ計算部の第２の段
ＡＳオーディオ信号
ＬＣ線形予測符号化係数
ＦＦフィルタリングされたフレーム
ＦＩフレーム
ＳＰスペクトル
ＰＳ処理されたスペクトル
ＱＳ量子化されたスペクトル
ＳＲスペクトル表示
ＭＩスペクトル表示の最小値
ＭＡスペクトル表示の最大値
ＳＥＦスペクトル線エンファシスファクタ
ＢＥＦ位相エンファシスファクタ
ＦＣ時間領域へ変換したフレーム
ＲＳＬ基準スペクトル線
ＳＬスペクトル線
ＤＱ逆量子化されたスペクトル
ＲＳ逆処理されたスペクトル
ＴＳ時間信号
ＳＤＦスペクトル線デエンファシスファクタ
ＢＤＦ基底デエンファシスファクタ
ＩＦＳ逆フィルタリングされた信号
ＳＬＤスペクトル線
ＲＳＬＤ基準スペクトル線
ＱＥ量子化誤差

Claims

ビットストリーム（ＢＳ）を生成するように非音声オーディオ信号（ＡＳ）を符号化するためのオーディオエンコーダであって、前記オーディオエンコーダ（１）は、
複数の線形予測符号化係数（ＬＣ）を有する線形予測符号化フィルタ（２）と時間周波数変換器（３）との組合せ（２、３）であって、オーディオ信号（ＡＳ）のフレーム（ＦＩ）および線形予測符号化係数（ＬＣ）に基づきスペクトル（ＳＰ）を出力するために、前記フレーム（ＦＩ）をフィルタリングし、かつ周波数領域へ変換するよう構成される組合せ（２、３）と、
前記スペクトル（ＳＰ）に基づき処理されたスペクトル（ＰＳ）を計算するよう構成される低周波数エンファシス回路（４）であって、基準スペクトル線（ＲＳＬ）より低い周波数を表す処理されたスペクトル（ＰＳ）のスペクトル線（ＳＬ）が強調される、低周波数エンファシス回路（４）と、
前記線形予測符号化フィルタ（２）の線形予測符号化係数（ＬＣ）に依拠して前記低周波数エンファシス回路（４）による処理されたスペクトル（ＰＳ）の計算を制御するよう構成される制御装置（５）と、
を備える、オーディオエンコーダ。
前記オーディオ信号（ＡＳ）のフレーム（ＦＩ）は、前記線形予測符号化フィルタ（２）に入力され、フィルタリングされたフレーム（ＦＦ）は、前記線形予測符号化フィルタ（２）により出力され、前記時間周波数変換器（３）は、フィルタ処理されたフレーム（ＦＦ）に基づき前記スペクトル（ＳＰ）を推定するよう構成される、先行の請求項に記載のオーディオエンコーダ。
前記オーディオ信号（ＡＳ）のフレーム（ＦＩ）は、前記時間周波数変換器（３）に入力され、変換されたフレーム（ＦＣ）は、前記時間周波数変換器（３）により出力され、前記線形予測符号化フィルタ（２）は、変換されたフレーム（ＦＣ）に基づいて前記スペクトル（ＳＰ）を推定するよう構成される、請求項１に記載のオーディオエンコーダ。
前記オーディオエンコーダ（１）は、前記処理されたスペクトル（ＰＳ）に基づいて量子化されたスペクトル（ＱＳ）を生成するよう構成される量子化装置（６）と、前記量子化されたスペクトル（ＱＳ）および前記線形予測符号化係数（ＬＣ）を前記ビットストリーム（ＢＳ）に埋め込むよう構成されるビットストリーム生成部（７）とを備える、先行の請求項のうちの１つに記載のオーディオエンコーダ。
前記制御装置（５）は、前記線形予測符号化係数（ＬＣ）のスペクトル表示（ＳＲ）を推定するよう構成されるスペクトル解析部（８）と、さらなる基準スペクトル線を下回るスペクトル表示（ＳＲ）の最小値（ＭＩ）およびスペクトル表示（ＳＲ）の最大値（ＭＡ）を推定するよう構成される最小値最大値解析部（９）と、前記最小値（ＭＩ）および前記最大値（ＭＡ）に基づいて前記基準スペクトル線（ＲＳＬ）より低い周波数を表す処理されたスペクトル（ＰＳ）のスペクトル線（ＳＬ）を計算するためのスペクトル線エンファシスファクタ（ＳＥＦ）を計算するよう構成されるエンファシスファクタ計算部（１０、１１）とを含み、前記処理されたスペクトル（ＰＳ）のスペクトル線（ＳＬ）は、フィルタリングされたフレームのスペクトルのスペクトル線に対して前記スペクトル線エンファシスファクタ（ＳＥＦ）を適用することにより強調される、先行の請求項のうちの１つに記載のオーディオエンコーダ。
前記エンファシスファクタ計算部（１０、１１）は、前記スペクトル線エンファシスファクタ（ＳＥＦ）が、前記基準スペクトル線（ＲＳＬ）から前記スペクトル（ＳＰ）の最低周波数を表すスペクトル線（ＳＬ）の方向に増加するように構成される、先行の請求項に記載のオーディオエンコーダ。
前記エンファシスファクタ計算部（１０、１１）は、第１の式、γ＝（α・ｍｉｎ／ｍａｘ）^βにしたがい基底エンファシスファクタ（ＢＥＦ）を計算するよう構成される第１の段（１０）を含み、ここで、αは、第１の予め設定された値であって、α＞１であり、βは、第２の予め設定された値であって、０＜β≦１であり、ｍｉｎは、前記スペクトル表示（ＳＲ）の最小値（ＭＩ）であり、ｍａｘは、前記スペクトル表示（ＳＲ）の最大値（ＭＡ）であり、γは、前記基底エンファシスファクタ（ＢＥＦ）であり、前記エンファシスファクタ計算部（１０、１１）は、第２の式ε_i＝γ^i’-iにしたがいスペクトル線エンファシスファクタ（ＳＥＦ）を計算するよう構成される第２の段（１１）を含み、ここでｉ^’は、強調されるべきスペクトル線（ＳＬ）の数であり、ｉは、それぞれのスぺクトル線（ＳＬ）のインデクスであり、インデクスはスペクトル線の周波数と共に増加し、ｉ＝０〜ｉ^’−１であり、γは前記基底エンファシスファクタ（ＢＥＦ）であり、ε_iはインデクスｉでのスペクトル線エンファシスファクタ（ＳＥＦ）である、請求項５または６に記載のオーディオエンコーダ。
前記第１の予め設定された値は、４２より小さくかつ２２より大きく、詳細には、３８より小さくかつ２６より大きく、さらに詳細には３４より小さくかつ３０より大きい、先行の請求項に記載のオーディオエンコーダ。
前記第２の予め設定された値は、式β＝１／（θ・ｉ^’）にしたがい決定され、ここでｉ^’は、強調されるスペクトル線の数であり、θは、３と５の間、詳細には、３．４と４．６の間、より詳細には３．８と４．２の間のファクタである、請求項７または８に記載のオーディオエンコーダ。
前記基準スペクトル線（ＲＳＬ）は、６００Ｈｚと１０００Ｈｚの間、詳細には、７００Ｈｚと９００Ｈｚの間、より詳細には７５０Ｈｚと８５０Ｈｚの間の周波数を表す、先行の請求項のうちの１つに記載のオーディオエンコーダ。
前記さらなる基準スペクトル線は、前記基準スペクトル線（ＲＳＬ）と同じかまたはより高い周波数を表す、請求項５から１０のうちの１つに記載のオーディオエンコーダ。
前記最大値（ＭＡ）が、前記最小値（ＭＩ）に前記第１の予め設定された値を乗算したものを下回る場合にのみ、前記基準スペクトル線（ＲＳＬ）より低い周波数を表す処理されたスペクトル（ＰＳ）のスペクトル線（ＳＬ）が強調されるように、前記制御装置（５）は構成される、先行の請求項のうちの１つに記載のオーディオエンコーダ。
ビットストリーム（ＢＳ）から非音声オーディオ出力信号（ＯＳ）を生成するように、前記ビットストリーム（ＢＳ）を非音声オーディオ信号（ＡＳ）に基づいて復号化するため、特に請求項１から１２に記載のオーディオエンコーダ（１）により生成されるビットストリーム（ＢＳ）を復号化するためのオーディオデコーダであって、前記ビットストリーム（ＢＳ）は、量子化されたスペクトル（ＱＳ）および複数の線形予測符号化係数（ＬＣ）を含み、前記オーディオデコーダ（１２）は、
前記ビットストリーム（ＢＳ）から量子化されたスペクトル（ＱＳ）と線形予測符号化係数（ＬＣ）とを抽出するよう構成されるビットストリーム受信部（１３）と、
前記量子化されたスペクトル（ＱＳ）に基づいて逆量子化されたスペクトル（ＤＱ）を生成するよう構成される逆量子化装置（１４）と、
前記逆量子化されたスペクトル（ＤＱ）に基づいて逆処理されたスペクトル（ＲＳ）を計算するよう構成される低周波数デエンファシス回路（１５）であって、基準スペクトル線（ＲＳＬＤ）より低い周波数を表す逆処理されたスペクトル（ＲＳ）のスペクトル線（ＳＬＤ）がデエンファサイズされる、低周波数デエンファシス回路（１５）と、
前記ビットストリーム（ＢＳ）に含まれる線形予測符号化係数（ＬＣ）に依拠して、前記低周波数デエンファシス回路（１５）による逆処理されたスペクトル（ＲＳ）の計算を制御するよう構成される制御装置（１６）と、
を備える、オーディオデコーダ。
前記オーディオデコーダ（１２）は、周波数時間変換器（１７）と、前記ビットストリーム（ＢＳ）に含まれる複数の線形予測符号化係数（ＬＣ）を受信する逆線形予測符号化フィルタ（１８）との組合せ（１７、１８）を備え、前記組合せ（１７、１８）は、前記逆処理されたスペクトル（ＲＳ）および前記線形予測符号化係数（ＬＣ）に基づいて出力信号（ＯＳ）を出力するために、前記逆処理されたスペクトル（ＲＳ）を逆フィルタリングし、かつ時間領域に変換するよう構成される、先行の請求項に記載のオーディオデコーダ。
前記周波数時間変換器（１７）は、前記逆処理されたスペクトル（ＲＳ）に基づいて時間信号（ＴＳ）を推定するよう構成され、前記逆線形予測符号化フィルタ（１８）は、前記時間信号（ＴＳ）に基づいて出力信号（ＯＳ）を出力するよう構成される、先行の請求項に記載のオーディオデコーダ。
前記逆線形予測符号化フィルタ（１８）は、前記逆処理されたスペクトル（ＲＳ）に基づいて逆フィルタリングされた信号（ＩＦＳ）を推定するよう構成され、前記周波数時間変換器（１７）は、前記逆フィルタリングされた信号（ＩＦＳ）に基づいて出力信号（ＯＳ）を出力するよう構成される、請求項１４に記載のオーディオデコーダ。
前記制御装置（１６）は、前記線形予測符号化係数（ＬＣ）のスペクトル表示（ＳＲ）を推定するよう構成されるスペクトル解析部（１９）と、さらなる基準スペクトル線を下回るスペクトル表示（ＳＲ）の最小値（ＭＩ）およびスペクトル表示（ＳＲ）の最大値（ＭＡ）を推定するよう構成される最小値最大値解析部（２０）と、前記最小値（ＭＩ）および前記最大値（ＭＡ）に基づき、前記基準スペクトル線（ＲＳＬＤ）より低い周波数を表す逆処理されたスペクトル（ＲＳ）のスペクトル線（ＳＬＤ）を計算するためのスペクトル線デエンファシスファクタ（ＳＤＦ）を計算するよう構成されるデエンファシスファクタ計算部（２１、２２）とを含み、逆処理されたスペクトル（ＲＳ）のスペクトル線（ＳＬＤ）は、前記スペクトル線デエンファシスファクタ（ＳＤＦ）を、前記逆量子化されたスペクトル（ＤＱ）のスペクトルのスペクトル線に適用することによりデエンファサイズされる、請求項１３から１６のうちの１つに記載のオーディオデコーダ。
前記スペクトル線デエンファシスファクタ（ＳＤＦ）が、前記基準スペクトル線（ＲＳＬＤ）から前記逆処理されたスペクトル（ＲＳ）の最低周波数を表すスペクトル線（ＳＬ）の方向へ減少するように、前記デエンファシスファクタ計算部（２１、２２）は構成される、先行の請求項に記載のオーディオデコーダ。
前記デエンファシスファクタ計算部（２１、２２）は、第１の式δ＝（α・ｍｉｍ／ｍａｘ）^‐βにしたがい基底デエンファシスファクタ（ＢＤＦ）を計算するよう構成される第１の段（２１）を含み、ここで、αは、第１の予め設定された値であって、α＞１であり、βは、第２の予め設定された値であって、０＜β≦１であり、ｍｉｎは前記スペクトル表示（ＳＲ）の最小値（ＭＩ）であり、ｍａｘは、前記スペクトル表示（ＳＲ）の最大値であり、δは、前記基底デエンファシスファクタ（ＢＤＦ）であり、前記デエンファシスファクタ計算部（２１、２２）は、第２の式ζ_i＝δ^i’-iにしたがいスペクトル線デエンファシスファクタ（ＳＤＦ）を計算するよう構成される第２の段（２２）を含み、ここでｉ^’は、デエンファサイズされるべきスペクトル線（ＳＬＤ）の数であり、ｉは、それぞれのスペクトル線（ＳＬＤ）のインデクスであり、このインデクスは、スペクトル線の周波数と共に増加し、ｉ＝０〜ｉ^’−１であり、δは、前記基底デエンファシスファクタ（ＢＤＦ）であり、ζ_ｉが、インデクスｉでのスペクトル線デエンファシスファクタ（ＳＤＦ）である、請求項１７または１８に記載のオーディオデコーダ。
前記第１の予め設定された値は、４２より小さくかつ２２より大きく、詳細には３８より小さくかつ２６より大きく、より詳細には３４より小さくかつ３０より大きい、先行の請求項に記載のオーディオデコーダ。
前記第２の予め設定された値は、式β＝１／（θ・ｉ^’）により決定され、ｉ^’は、デエンファサイズされるスペクトル線（ＳＬＤ）の数であり、θは、３と５の間、詳細には３．４と４．６の間、より詳細には３．８と４．２の間のファクタである、請求項１９または２０に記載のオーディオデコーダ。
前記基準スペクトル線（ＲＳＬＤ）は、６００Ｈｚと１０００Ｈｚの間、詳細には７００Ｈｚと９００Ｈｚの間、より詳細には７５０Ｈｚと８５０Ｈｚの間の周波数を表す、請求項１３から２１のうちの１つに記載のオーディオデコーダ。
前記さらなる基準スペクトル線は、基準スペクトル線（ＲＳＬＤ）と同じかまたはより高い周波数を表す、請求項１７から２２のうちの１つに記載のオーディオデコーダ。
前記最大値（ＭＡ）が、前記最小値（ＭＩ）に前記第１の予め設定された値を乗算したものを下回る場合にのみ、前記基準スペクトル線（ＲＳＬＤ）より低い周波数を表す逆処理されたスペクトル（ＲＳ）のスペクトル線（ＳＬＤ）がデエンファサイズされるように、前記制御装置（１６）は構成される、請求項１３から２３のうちの１つに記載のオーディオデコーダ。
デコーダ（１）およびエンコーダ（１２）を含むシステムであって、前記エンコーダ（１）は、請求項１から１２のうちの１つにしたがい設計され、かつ／または前記デコーダは、請求項１３から２４のうちの１つにしたがい設計される、システム。
ビットストリーム（ＢＳ）を生成するように非音声オーディオ信号（ＡＳ）を符号化するための方法であって、前記方法は、
オーディオ信号（ＡＳ）のフレーム（ＦＩ）および線形予測符号化係数（ＬＣ）に基づきスペクトル（ＳＰ）を出力するために、複数の線形予測符号化係数（ＬＣ）を有する線形予測符号化フィルタ（２）で、前記フレーム（ＦＩ）をフィルタリングし、かつ周波数領域へ変換するステップと、
前記スペクトル（ＳＰ）に基づき処理されたスペクトル（ＰＳ）を計算するステップであって、基準スペクトル線（ＲＳＬ）より低い周波数を表す処理されたスペクトル（ＰＳ）のスペクトル線（ＳＬ）が強調される、ステップと、
前記線形予測符号化フィルタ（２）の線形予測符号化係数（ＬＣ）に依拠して処理されたスペクトル（ＰＳ）の計算を制御するステップと、
を含む、方法。
ビットストリーム（ＢＳ）から非音声オーディオ出力信号（ＯＳ）を生成するように、前記ビットストリーム（ＢＳ）を非音声オーディオ信号（ＡＳ）に基づいて復号化するため、特に先行の請求項に記載の方法により生成されるビットストリーム（ＢＳ）を復号化するための方法であって、前記ビットストリーム（ＢＳ）は、量子化されたスペクトル（ＱＳ）および複数の線形予測符号化係数（ＬＣ）を含み、前記方法は、
前記ビットストリーム（ＢＳ）から量子化されたスペクトル（ＱＳ）および線形予測符号化係数（ＬＣ）を抽出するステップと、
前記量子化されたスペクトル（ＱＳ）に基づいて逆量子化されたスペクトル（ＤＱ）を生成するステップと、
前記逆量子化されたスペクトル（ＤＱ）に基づいて逆処理されたスペクトル（ＲＳ）を計算するステップであって、基準スペクトル線（ＲＳＬＤ）より低い周波数を表す逆処理されたスペクトル（ＲＳ）のスペクトル線（ＳＬＤ）がデエンファサイズされる、ステップと、
前記ビットストリーム（ＢＳ）に含まれる線形予測符号化係数（ＬＣ）に依拠して逆処理されたスペクトル（ＲＳ）の計算を制御するステップと、
を含む、方法。
コンピュータまたは処理装置で実行されるときに、請求項２６または２７に記載の方法を実行するためのコンピュータプログラム。