JP6496328B2

JP6496328B2 - 符号化／復号化方法、装置及びシステム

Info

Publication number: JP6496328B2
Application number: JP2016574888A
Authority: JP
Inventors: ▲賓▼ 王; ▲澤▼新 ▲劉▼; 磊苗
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2014-06-26
Filing date: 2015-03-20
Publication date: 2019-04-03
Anticipated expiration: 2035-03-20
Also published as: MX356315B; EP3133600A4; US10339945B2; CN105225671A; BR112016026440B1; US20190333528A1; AU2015281686A1; BR112016026440A2; EP3637416A1; JP2017525992A; KR20160145799A; HK1219802A1; DE202015009942U1; SG11201609523UA; US20170110137A1; BR112016026440B8; MX2016015526A; EP3133600B1; CN105225671B; CA2948410A1

Description

本発明は、オーディオ信号処理技術に関し、特に時間ドメインに基づく符号化／復号化方法、装置及びシステムに関する。

チャネル容量及び記憶空間を節約するために、人間の耳がオーディオ信号の低周波数情報より高周波数情報に敏感でないことを考慮して、通常では高周波数情報はカットされ、減少したオーディオ品質を生じる。したがって、カットされた高周波数情報を再現するために帯域幅拡張技術が導入され、これにより、オーディオ品質を改善する。符号化性能が確保されつつレートが増加すると、符号化され得る高周波数部分のより広い帯域は、受信機がより広い帯域及びより高い品質のオーディオ信号を取得することを可能にする。

従来技術では、高レートの条件では、入力オーディオ信号の周波数スペクトルは、帯域幅拡張技術を使用することにより全帯域において符号化され得る。符号化の基本的な原理は、入力オーディオ信号の全帯域信号を取得するために、帯域通過フィルタ（Band Pass Filter、略してBPF）を使用することにより入力オーディオ信号において帯域通過フィルタリング処理を実行し、全帯域信号のエネルギーEner0を取得するために、全帯域信号においてエネルギー計算を実行し、高周波数帯域符号化情報を取得するために、超広帯域（Super Wide Band、略してSWB）時間帯域拡張（Time Band Extension、略してTBE）エンコーダを使用することにより高周波数帯域信号を符号化し、高周波数帯域信号に従って、全帯域信号を予測するために使用される全帯域線形予測符号化（Linear Predictive Coding、略してLPC）係数及び全帯域（Full Band、略してFB）励振（Excitation）信号を決定し、予測全帯域信号を取得するために、LPC係数及びFB励振信号に従って予測処理を実行し、ディエンファシス（de-emphasis）処理を受けた予測全帯域信号のエネルギーEner1を決定するために、予測全帯域信号においてディエンファシス処理を実行し、Ener0に対するEner1のエネルギー比を計算することである。高周波数帯域符号化情報及びエネルギー比は、デコーダに送信され、これにより、デコーダは、高周波数帯域符号化情報及びエネルギー比に従って入力オーディオ信号の全帯域信号を復元し、入力オーディオ信号を復元することができる。

前述の解決策では、デコーダにより復元された入力オーディオ信号は、比較的ひどい信号歪みを有する傾向がある。

本発明の実施例は、デコーダにより復元された入力オーディオ信号が比較的ひどい信号歪みを有する傾向があるという従来技術の問題を軽減又は解決するための符号化／復号化方法、装置及びシステムを提供する。

第１の態様によれば、本発明は、符号化装置により、入力オーディオ信号の特徴的ファクタを取得するために、入力オーディオ信号の低周波数帯域信号を符号化するステップと、符号化装置により、第１の全帯域信号を取得するために、入力オーディオ信号の高周波数帯域信号において符号化及びスペクトル拡散予測を実行するステップと、符号化装置により、第１の全帯域信号においてディエンファシス処理を実行するステップであり、ディエンファシス処理のディエンファシスパラメータは、特徴的ファクタに従って決定されるステップと、符号化装置により、ディエンファシス処理を受けた第１の全帯域信号の第１のエネルギーを計算するステップと、符号化装置により、第２の全帯域信号を取得するために、入力オーディオ信号において帯域通過フィルタリング処理を実行するステップと、符号化装置により、第２の全帯域信号の第２のエネルギーを計算するステップと、符号化装置により、第１の全帯域信号の第１のエネルギーに対する第２の全帯域信号の第２のエネルギーのエネルギー比を計算するステップと、符号化装置により、入力オーディオ信号を符号化することから生じたビットストリームを復号化装置に送信するステップであり、ビットストリームは、入力オーディオ信号の特徴的ファクタ、高周波数帯域符号化情報及びエネルギー比を含むステップとを含む符号化方法を提供する。

第１の態様を参照して、第１の態様の第１の可能な実現方式では、この方法は、符号化装置により、特徴的ファクタの量を取得するステップと、符号化装置により、特徴的ファクタ及び特徴的ファクタの量に従って特徴的ファクタの平均値を決定するステップと、符号化装置により、特徴的ファクタの平均値に従ってディエンファシスパラメータを決定するステップとを更に含む。

第１の態様又は第１の態様の第１の可能な実現方式を参照して、第１の態様の第２の可能な実現方式では、符号化装置により、第１の全帯域信号を取得するために、入力オーディオ信号の高周波数帯域信号において符号化及びスペクトル拡散予測を実行するステップは、符号化装置により、高周波数帯域信号に従って、全帯域信号を予測するために使用されるLPC係数及び全帯域励振信号を決定するステップと、符号化装置により、第１の全帯域信号を取得するために、LPC係数及び全帯域励振信号において符号化処理を実行するステップとを含む。

第１の態様又は第１の態様の第１若しくは第２の可能な実現方式のいずれか１つを参照して、第１の態様の第３の可能な実現方式では、符号化装置により、第１の全帯域信号においてディエンファシス処理を実行するステップは、符号化装置により、第１の全帯域信号において周波数スペクトル移動修正を実行し、修正された第１の全帯域信号において周波数スペクトル反映処理を実行するステップと、符号化装置により、周波数スペクトル反映処理を受けた第１の全帯域信号においてディエンファシス処理を実行するステップとを含む。

第１の態様又は第１の態様の第１〜第３の可能な実現方式のいずれか１つを参照して、第１の態様の第４の可能な実現方式では、特徴的ファクタは、オーディオ信号の特徴を反映するために使用され、音声ファクタ、スペクトル傾斜、短期平均エネルギー又は短期ゼロ交差率を含む。

第２の態様によれば、本発明は、復号化装置により、符号化装置により送信されたオーディオ信号ビットストリームを受信するステップであり、オーディオ信号ビットストリームは、オーディオ信号ビットストリームに対応するオーディオ信号の特徴的ファクタ、高周波数帯域符号化情報及びエネルギー比を含むステップと、復号化装置により、低周波数帯域信号を取得するために、特徴的ファクタを使用することによりオーディオ信号ビットストリームにおいて低周波数帯域復号化を実行するステップと、復号化装置により、高周波数帯域信号を取得するために、高周波数帯域符号化情報を使用することによりオーディオ信号ビットストリームにおいて高周波数帯域復号化を実行するステップと、復号化装置により、第１の全帯域信号を取得するために、高周波数帯域信号においてスペクトル拡散予測を実行するステップと、復号化装置により、第１の全帯域信号においてディエンファシス処理を実行するステップであり、ディエンファシス処理のディエンファシスパラメータは、特徴的ファクタに従って決定されるステップと、復号化装置により、ディエンファシス処理を受けた第１の全帯域信号の第１のエネルギーを計算するステップと、復号化装置により、オーディオ信号ビットストリームに含まれるエネルギー比、ディエンファシス処理を受けた第１の全帯域信号及び第１のエネルギーに従って第２の全帯域信号を取得するステップであり、エネルギー比は、第１のエネルギーに対する第２の全帯域信号のエネルギーのエネルギー比であるステップと、復号化装置により、第２の全帯域信号、低周波数帯域信号及び高周波数帯域信号に従ってオーディオ信号ビットストリームに対応するオーディオ信号を復元するステップとを含む復号化方法を提供する。

第２の態様を参照して、第２の態様の第１の可能な実現方式では、この方法は、復号化装置により、復号化を通じて特徴的ファクタの量を取得するステップと、復号化装置により、特徴的ファクタ及び特徴的ファクタの量に従って特徴的ファクタの平均値を決定するステップと、復号化装置により、特徴的ファクタの平均値に従ってディエンファシスパラメータを決定するステップとを更に含む。

第２の態様又は第２の態様の第１の可能な実現方式を参照して、第２の態様の第２の可能な実現方式では、復号化装置により、第１の全帯域信号を取得するために、高周波数帯域信号においてスペクトル拡散予測を実行するステップは、復号化装置により、高周波数帯域信号に従って、全帯域信号を予測するために使用されるLPC係数及び全帯域励振信号を決定するステップと、復号化装置により、第１の全帯域信号を取得するために、LPC係数及び全帯域励振信号において符号化処理を実行するステップとを含む。

第２の態様又は第２の態様の第１若しくは第２の可能な実現方式のいずれか１つを参照して、第２の態様の第３の可能な実現方式では、復号化装置により、第１の全帯域信号においてディエンファシス処理を実行するステップは、復号化装置により、第１の全帯域信号において周波数スペクトル移動修正を実行し、修正された第１の全帯域信号において周波数スペクトル反映処理を実行するステップと、復号化装置により、周波数スペクトル反映処理を受けた第１の全帯域信号においてディエンファシス処理を実行するステップとを含む。

第２の態様又は第２の態様の第１〜第３の可能な実現方式のいずれか１つを参照して、第２の態様の第４の可能な実現方式では、特徴的ファクタは、オーディオ信号の特徴を反映するために使用され、音声ファクタ、スペクトル傾斜、短期平均エネルギー又は短期ゼロ交差率を含む。

第３の態様によれば、本発明は、入力オーディオ信号の特徴的ファクタを取得するために、入力オーディオ信号の低周波数帯域信号を符号化するように構成された第１の符号化モジュールと、第１の全帯域信号を取得するために、入力オーディオ信号の高周波数帯域信号において符号化及びスペクトル拡散予測を実行するように構成された第２の符号化モジュールと、第１の全帯域信号においてディエンファシス処理を実行するように構成されたディエンファシス処理モジュールであり、ディエンファシス処理のディエンファシスパラメータは、特徴的ファクタに従って決定されるディエンファシス処理モジュールと、ディエンファシス処理を受けた第１の全帯域信号の第１のエネルギーを計算するように構成された計算モジュールと、第２の全帯域信号を取得するために、入力オーディオ信号において帯域通過フィルタリング処理を実行するように構成された帯域通過処理モジュールとを含み、計算モジュールは、第２の全帯域信号の第２のエネルギーを計算し、第１の全帯域信号の第１のエネルギーに対する第２の全帯域信号の第２のエネルギーのエネルギー比を計算するように更に構成され、入力オーディオ信号を符号化することから生じたビットストリームを復号化装置に送信するように構成された送信モジュールであり、ビットストリームは、入力オーディオ信号の特徴的ファクタ、高周波数帯域符号化情報及びエネルギー比を含む送信モジュールを含む符号化装置を提供する。

第３の態様を参照して、第３の態様の第１の可能な実現方式では、符号化装置は、特徴的ファクタの量を取得し、特徴的ファクタ及び特徴的ファクタの量に従って特徴的ファクタの平均値を決定し、特徴的ファクタの平均値に従ってディエンファシスパラメータを決定するように構成されたディエンファシスパラメータ決定モジュールを更に含む。

第３の態様又は第３の態様の第１の可能な実現方式を参照して、第３の態様の第２の可能な実現方式では、第２の符号化モジュールは、高周波数帯域信号に従って、全帯域信号を予測するために使用されるLPC係数及び全帯域励振信号を決定し、第１の全帯域信号を取得するために、LPC係数及び全帯域励振信号において符号化処理を実行するように具体的に構成される。

第３の態様又は第３の態様の第１若しくは第２の可能な実現方式のいずれか１つを参照して、第３の態様の第３の可能な実現方式では、ディエンファシス処理モジュールは、第２の符号化モジュールにより取得された第１の全帯域信号において周波数スペクトル移動修正を実行し、修正された第１の全帯域信号において周波数スペクトル反映処理を実行し、周波数スペクトル反映処理を受けた第１の全帯域信号においてディエンファシス処理を実行するように具体的に構成される。

第３の態様又は第３の態様の第１〜第３の可能な実現方式のいずれか１つを参照して、第３の態様の第４の可能な実現方式では、特徴的ファクタは、オーディオ信号の特徴を反映するために使用され、音声ファクタ、スペクトル傾斜、短期平均エネルギー又は短期ゼロ交差率を含む。

第４の態様によれば、本発明は、符号化装置により送信されたオーディオ信号ビットストリームを受信するように構成された受信モジュールであり、オーディオ信号ビットストリームは、オーディオ信号ビットストリームに対応するオーディオ信号の特徴的ファクタ、高周波数帯域符号化情報及びエネルギー比を含む受信モジュールと、低周波数帯域信号を取得するために、特徴的ファクタを使用することによりオーディオ信号ビットストリームにおいて低周波数帯域復号化を実行するように構成された第１の復号化モジュールと、高周波数帯域信号を取得するために、高周波数帯域符号化情報を使用することによりオーディオ信号ビットストリームにおいて高周波数帯域復号化を実行し、第１の全帯域信号を取得するために、高周波数帯域信号においてスペクトル拡散予測を実行するように構成された第２の復号化モジュールと、第１の全帯域信号においてディエンファシス処理を実行するように構成されたディエンファシス処理モジュールであり、ディエンファシス処理のディエンファシスパラメータは、特徴的ファクタに従って決定されるディエンファシス処理モジュールと、ディエンファシス処理を受けた第１の全帯域信号の第１のエネルギーを計算し、オーディオ信号ビットストリームに含まれるエネルギー比、ディエンファシス処理を受けた第１の全帯域信号及び第１のエネルギーに従って第２の全帯域信号を取得するように構成された計算モジュールであり、エネルギー比は、第１のエネルギーに対する第２の全帯域信号のエネルギーのエネルギー比である計算モジュールと、第２の全帯域信号、低周波数帯域信号及び高周波数帯域信号に従ってオーディオ信号ビットストリームに対応するオーディオ信号を復元するように構成された復元モジュールとを含む復号化装置を提供する。

第４の態様を参照して、第４の態様の第１の可能な実現方式では、復号化装置は、復号化を通じて特徴的ファクタの量を取得し、特徴的ファクタ及び特徴的ファクタの量に従って特徴的ファクタの平均値を決定し、特徴的ファクタの平均値に従ってディエンファシスパラメータを決定するように構成されたディエンファシスパラメータ決定モジュールを更に含む。

第４の態様又は第４の態様の第１の可能な実現方式を参照して、第４の態様の第２の可能な実現方式では、第２の復号化モジュールは、高周波数帯域信号に従って、全帯域信号を予測するために使用されるLPC係数及び全帯域励振信号を決定し、第１の全帯域信号を取得するために、LPC係数及び全帯域励振信号において符号化処理を実行するように具体的に構成される。

第４の態様又は第４の態様の第１若しくは第２の可能な実現方式のいずれか１つを参照して、第４の態様の第３の可能な実現方式では、ディエンファシス処理モジュールは、第１の全帯域信号において周波数スペクトル移動修正を実行し、修正された第１の全帯域信号において周波数スペクトル反映処理を実行し、周波数スペクトル反映処理を受けた第１の全帯域信号においてディエンファシス処理を実行するように具体的に構成される。

第４の態様又は第４の態様の第１〜第３の可能な実現方式のいずれか１つを参照して、第４の態様の第４の可能な実現方式では、特徴的ファクタは、オーディオ信号の特徴を反映するために使用され、音声ファクタ、スペクトル傾斜、短期平均エネルギー又は短期ゼロ交差率を含む。

第５の態様によれば、本発明は、第３の態様又は第３の態様の第１〜第４の可能な実現方式のいずれか１つによる符号化装置と、第４の態様又は第４の態様の第１〜第４の可能な実現方式のいずれか１つによる復号化装置とを含む符号化／復号化システムを提供する。

本発明の実施例において提供されるコーデック方法、装置及びシステムによれば、ディエンファシス処理は、入力オーディオ信号の特徴的ファクタに従って決定されたディエンファシスパラメータを使用することにより全帯域信号において実行され、次に、全帯域信号は符号化されてデコーダに送信され、これにより、デコーダは、入力オーディオ信号の特徴的ファクタに従って全帯域信号において対応するディエンファシス復号化処理を実行し、入力オーディオ信号を復元する。これは、デコーダにより復元されたオーディオ信号が信号歪みを有する傾向があるという従来技術の問題を解決し、符号化性能を向上させるためにオーディオ信号の特徴的ファクタに従って全帯域信号において適応的なディエンファシス処理を実現し、これにより、デコーダにより復元された入力オーディオ信号は、比較的高い忠実度を有し、元の信号により近い。

本発明の実施例又は従来技術における技術的解決策をより明確に説明するために、以下に、実施例又は従来技術を説明するために必要な添付図面を簡単に紹介する。明らかに、以下の説明における添付図面は、本発明のいくつかの実施例を示しており、当業者は、創造的取り組みを行うことなく、依然としてこれらの添付図面から他の図面を導き得る。
本発明の実施例による符号化方法の実施例のフローチャートである。本発明の実施例による復号化方法の実施例のフローチャートである。本発明の実施例による符号化装置の実施例１の概略構成図である。本発明の実施例による復号化装置の実施例１の概略構成図である。本発明の実施例による符号化装置の実施例２の概略構成図である。本発明の実施例による復号化装置の実施例２の概略構成図である。本発明による符号化／復号化システムの実施例の概略構成図である。

本発明の実施例の目的、技術的解決策及び利点をより明確にするために、以下に、本発明の実施例における添付図面を参照して本発明の実施例における技術的解決策を明確且つ完全に説明する。明らかに、説明する実施例は、本発明の実施例の全てではなく、一部である。創造的取り組みを行うことなく本発明の実施例に基づいて当業者により取得される全ての他の実施例は、本発明の保護範囲内に入るものとする。

図１は、本発明の実施例による符号化方法の実施例の概略フローチャートである。図１に示すように、方法の実施例は以下のステップを含む。

S101：符号化装置は、入力オーディオ信号の特徴的ファクタを取得するために、入力オーディオ信号の低周波数帯域信号を符号化する。

符号化される信号は、オーディオ信号である。特徴的ファクタは、オーディオ信号の特徴を反映するために使用され、“音声ファクタ”、“スペクトル傾斜”、“短期平均エネルギー”又は“短期ゼロ交差率”を含むが、これらに限定されない。特徴的ファクタは、入力オーディオ信号の低周波数帯域信号を符号化することにより、符号化装置により取得されてもよい。具体的には、一例として音声ファクタを使用すると、音声ファクタは、低周波数帯域信号を符号化することにより取得された低周波数帯域符号化情報から抽出されたピッチ周期、代数コードブック及びこれらのそれぞれの利得に従って計算を通じて取得されてもよい。

S102：符号化装置は、第１の全帯域信号を取得するために、入力オーディオ信号の高周波数帯域信号において符号化及びスペクトル拡散予測を実行する。

高周波数帯域信号が符号化された場合、高周波数帯域符号化情報が更に取得される。

S103：符号化装置は、第１の全帯域信号においてディエンファシス処理を実行し、ディエンファシス処理のディエンファシスパラメータは、特徴的ファクタに従って決定される。

S104：符号化装置は、ディエンファシス処理を受けた第１の全帯域信号の第１のエネルギーを計算する。

S105：符号化装置は、第２の全帯域信号を取得するために、入力オーディオ信号において帯域通過フィルタリング処理を実行する。

S106：符号化装置は、第２の全帯域信号の第２のエネルギーを計算する。

S107：符号化装置は、第１の全帯域信号の第１のエネルギーに対する第２の全帯域信号の第２のエネルギーのエネルギー比を計算する。

S108：符号化装置は、入力オーディオ信号を符号化することから生じたビットストリームを復号化装置に送信し、ビットストリームは、入力オーディオ信号の特徴的ファクタ、高周波数帯域符号化情報及びエネルギー比を含む。

さらに、方法の実施例は、符号化装置により、特徴的ファクタの量を取得するステップと、符号化装置により、特徴的ファクタ及び特徴的ファクタの量に従って特徴的ファクタの平均値を決定するステップと、符号化装置により、特徴的ファクタの平均値に従ってディエンファシスパラメータを決定するステップとを更に含む。

具体的には、符号化装置は、特徴的ファクタの１つを取得してもよい。特徴的ファクタが音声ファクタである例を使用すると、符号化装置は、音声ファクタの量を取得し、音声ファクタ及び音声ファクタの量に従って入力オーディオ信号の音声ファクタの平均値を決定し、音声ファクタの平均値に従ってディエンファシスパラメータを更に決定する。

さらに、S102において第１の全帯域信号を取得するために、入力オーディオ信号の高周波数帯域信号において符号化及びスペクトル拡散予測を実行するステップは、符号化装置により、高周波数帯域信号に従って、全帯域信号を予測するために使用されるLPC係数及び全帯域励振信号を決定するステップと、符号化装置により、第１の全帯域信号を取得するために、LPC係数及び全帯域励振信号において符号化処理を実行するステップとを含む。

さらに、S103は、符号化装置により、第１の全帯域信号において周波数スペクトル移動修正を実行し、修正された第１の全帯域信号において周波数スペクトル反映処理を実行するステップと、符号化装置により、周波数スペクトル反映処理を受けた第１の全帯域信号においてディエンファシス処理を実行するステップとを含む。

任意選択で、S103の後に、方法の実施例は、符号化装置により、ディエンファシス処理を受けた第１の全帯域信号においてアップサンプリング及び帯域通過処理を実行するステップを更に含み、対応して、S104は、符号化装置により、ディエンファシス処理、アップサンプリング及び帯域通過処理を受けた第１の全帯域信号の第１のエネルギーを計算するステップを含む。

方法の実施例の具体的な実現方式について、特徴的ファクタが音声ファクタである例を使用することにより以下に説明する。他の特徴的ファクタについては、これらの実現処理は同様であり、詳細については更に説明しない。

具体的には、入力オーディオ信号を受信した後に、符号化装置の信号符号化装置は、入力オーディオ信号から、対応する周波数スペクトル範囲が[0,f1]である低周波数帯域信号を抽出し、入力オーディオ信号の音声ファクタを取得するために、低周波数帯域信号を符号化する。具体的には、信号符号化装置は、低周波数帯域符号化情報を取得するために、低周波数帯域信号を符号化し、音声ファクタを取得するために、低周波数帯域符号化情報に含まれるピッチ周期、代数コードブック及びこれらのそれぞれの利得に従って計算し、音声ファクタに従ってディエンファシスパラメータを決定する。信号符号化装置は、入力オーディオ信号から、対応する周波数スペクトル範囲が[f1,f2]である高周波数帯域信号を抽出し、高周波数帯域符号化情報を取得するために、高周波数帯域信号において符号化及びスペクトル拡散予測を実行し、高周波数帯域信号に従って、全帯域信号を予測するために使用されるLPC係数及び全帯域励振信号を決定し、予測された第１の全帯域信号を取得するために、LPC係数及び全帯域励振信号において符号化処理を実行し、第１の全帯域信号においてディエンファシス処理を実行し、ディエンファシス処理のディエンファシスパラメータは、音声ファクタに従って決定される。第１の全帯域信号が決定された後に、周波数スペクトル移動修正及び周波数スペクトル反映処理が第１の全帯域信号において実行されてもよく、次に、ディエンファシス処理が実行されてもよい。任意選択で、アップサンプリング及び帯域通過フィルタリング処理が、ディエンファシス処理を受けた第１の全帯域信号において実行されてもよい。その後、符号化装置は、処理された第１の全帯域信号の第１のエネルギーEner0を計算し、周波数スペクトル範囲が[f2,f3]である第２の全帯域信号を取得するために、入力オーディオ信号において帯域通過フィルタリング処理を実行し、第２の全帯域信号の第２のエネルギーEner1を決定し、Ener0に対するEner1のエネルギー比（ratio）を決定し、入力オーディオ信号の特徴的ファクタ、高周波数帯域符号化情報及びエネルギー比を、入力オーディオ信号を符号化することから生じたビットストリームに含め、ビットストリームを復号化装置に送信し、これにより、復号化装置は、受信したビットストリーム、特徴的ファクタ、高周波数帯域符号化情報及びエネルギー比に従ってオーディオ信号を復元する。

一般的に、48キロヘルツ（Kilo Hertz、略してKHz）の入力オーディオ信号では、入力オーディオ信号の低周波数帯域信号の対応する周波数スペクトル範囲[0,f1]は、具体的には[0,8KHz]でもよく、入力オーディオ信号の高周波数帯域信号の対応する周波数スペクトル範囲[f1,f2]は、具体的には[8KHz,16KHz]でもよい。第２の全帯域信号に対応する、対応する周波数スペクトル範囲[f2,f3]は、具体的には[16KHz,20KHz]でもよい。以下に、一例として具体的な周波数スペクトル範囲を使用することにより、方法の実施例の実現方式を具体的に説明する。本発明は、この実現方式に適用可能であるが、これに限定されない点に留意すべきである。

具体的な実現では、[0,8KHz]に対応する低周波数帯域信号は、低周波数帯域符号化情報を取得するために、符号励振線形予測（Code Excited Linear Prediction、略してCELP）コア（core）エンコーダを使用することにより符号化されてもよい。コアエンコーダにより使用される符号化アルゴリズムは、既存の代数符号励振線形予測（Algebraic Code Excited Linear Prediction、略してACELP）アルゴリズムでもよいが、これに限定されない。

ピッチ周期、代数コードブック及びこれらのそれぞれの利得は、低周波数帯域符号化情報から抽出され、音声ファクタ（voice_factor）は、既存のアルゴリズムを使用することによる計算を通じて取得され、アルゴリズムの詳細については更に説明しない。音声ファクタが決定された後に、ディエンファシスパラメータを計算するために使用されるディエンファシスファクタμが決定される。以下に、一例として音声ファクタを使用することにより、ディエンファシスファクタμが決定される計算処理を詳細に説明する。

取得された音声ファクタの量Mがまず決定され、通常では、これは4又は5でもよい。M個の音声ファクタは加算及び平均化され、これにより、音声ファクタの平均値varvoiceshapeを決定する。ディエンファシスファクタμは、平均値に従って決定され、ディエンファシスパラメータH(Z)は、以下の式(1)により示されるように、μに従って更に取得されてもよい。
H(Z)=1/(1-μZ^-1) (1)
ここで、H(Z)はZドメインにおける伝達関数の表現であり、Z^-1は遅延単位を表し、μはvarvoiceshapeに従って決定される。varvoiceshapeに関するいずれかの値がμとして選択されてもよく、これは、具体的にはμ=varvoiceshape³、μ=varvoiceshape²、μ=varvoiceshape、又はμ=1-varvoiceshapeでもよいが、これらに限定されない。

[8KHz,16KHz]に対応する高周波数帯域信号は、超広帯域（Super Wide Band）時間帯域拡張（Time Band Extention、略してTBE）エンコーダを使用することにより符号化されてもよい。これは、高周波数帯域励振信号を復元するために、コアエンコーダからピッチ期間、代数コードブック及びこれらのそれぞれの利得を抽出し、高周波数帯域LPC係数を取得するためのLPC分析を実行するために、高周波数帯域信号成分を抽出し、復元された高周波数帯域信号を取得するために、高周波数帯域励振信号及び高周波数帯域LPC係数を統合し、利得調整パラメータgainを取得するために、復元された高周波数帯域信号を入力オーディオ信号内の高周波数帯域信号と比較し、高周波数帯域符号化情報を取得するために、少量のビットを使用することにより、高周波数帯域LPC係数及び利得パラメータgainを量子化することを含む。

さらに、SWBエンコーダは、入力オーディオ信号の高周波数帯域信号に従って、全帯域信号を予測するために使用される全帯域LPC係数及び全帯域励振信号を決定し、予測された第１の全帯域信号を取得するために、全帯域LPC係数及び全帯域励振信号において統合処理を実行し、次に、周波数スペクトル移動修正が、以下の式(2)を使用することにより第１の全帯域信号において実行されてもよい。
S2_k=S1_k×cos(2×PI×f_n×k/f_s) (2)
ここで、kは第kの時間サンプル点を表し、kは正の整数であり、S2は周波数スペクトル移動修正の後の第１の周波数スペクトル信号であり、S1は第１の全帯域信号であり、PIは円の直径に対する円の円周の比であり、f_nは周波数スペクトルが移動する必要のある距離がn個の時間サンプル点であることを示し、nは正の整数であり、f_sは信号サンプリングレートを表す。

周波数スペクトル移動修正の後に、周波数スペクトル反映処理を受けた第１の全帯域信号S3を取得するために、S2において周波数スペクトル反映処理が実行され、周波数スペクトル移動の前後の対応する時間サンプル点の周波数スペクトル信号の振幅が反映される。周波数スペクトル反映の実現方式は、一般的な周波数スペクトル反映と同じでもよく、これにより、周波数スペクトルは、元の周波数スペクトルの構成と同じ構成に配置され、詳細については更に説明しない。

その後、ディエンファシス処理を受けた第１の全帯域信号S4を取得するために、音声ファクタに従って決定されたディエンファシスパラメータH(Z)を使用することによりS3においてディエンファシス処理が実行され、次に、S4のエネルギーEner0が決定される。具体的には、ディエンファシス処理は、ディエンファシスパラメータを有するディエンファシスフィルタを使用することにより実行されてもよい。

任意選択で、S4が取得された後に、アップサンプリング処理を受けた第１の全帯域信号S5を取得するために、ディエンファシス処理を受けた第１の全帯域信号S4において、ゼロ挿入を用いることによりアップサンプリング処理が実行されてもよく、次に、第１の全帯域信号S6を取得するために、[16KHz,20KHz]の通過範囲を有する帯域通過フィルタ（Band Pass Filter、略してBPF）を使用することによりS5において帯域通過フィルタリング処理が実行されてもよく、次に、S6のエネルギーEner0が決定される。アップサンプリング及び帯域通過処理は、ディエンファシス処理を受けた第１の全帯域信号において実行され、次に、第１の全帯域信号のエネルギーが決定され、これにより、高周波数帯域拡張信号の周波数スペクトルエネルギー及び周波数スペクトル構成が、符号化性能を向上させるために調整されてもよい。

第２の全帯域信号は、[16KHz,20KHz]の通過範囲を有する帯域通過フィルタ（Band Pass Filter、略してBPF）を使用することにより入力オーディオ信号において帯域通過フィルタリング処理を実行することで、符号化装置により取得されてもよい。第２の全帯域信号が取得された後に、符号化装置は、第２の全帯域信号のエネルギーEner1を決定し、エネルギーEner0に対するエネルギーEner1の比を計算する。エネルギー比において量子化処理が実行された後に、入力オーディオ信号のエネルギー比、特徴的ファクタ及び高周波数帯域符号化情報は、ビットストリームにパッケージ化され、復号化装置に送信される。

従来技術では、ディエンファシスフィルタリングパラメータH(Z)のディエンファシスファクタμは通常では固定値を有し、入力オーディオ信号の信号タイプは考慮されず、その結果、復号化装置により復元された入力オーディオ信号が信号歪みを有する傾向があることを生じる。

方法の実施例によれば、ディエンファシス処理は、入力オーディオ信号の特徴的ファクタに従って決定されたディエンファシスパラメータを使用することにより全帯域信号において実行され、次に、全帯域信号は符号化されてデコーダに送信され、これにより、デコーダは、入力オーディオ信号の特徴的ファクタに従って全帯域信号において対応するディエンファシス復号化処理を実行し、入力オーディオ信号を復元する。これは、デコーダにより復元されたオーディオ信号が信号歪みを有する傾向があるという従来技術の問題を解決し、符号化性能を向上させるためにオーディオ信号の特徴的ファクタに従って全帯域信号において適応的なディエンファシス処理を実現し、これにより、デコーダにより復元された入力オーディオ信号は、比較的高い忠実度を有し、元の信号により近い。

図２は、本発明の実施例による復号化方法の実施例のフローチャートであり、図１に示す方法の実施例に対応するデコーダ側の方法の実施例である。図２に示すように、方法の実施例は以下のステップを含む。

S201：復号化装置は、符号化装置により送信されたオーディオ信号ビットストリームを受信し、オーディオ信号ビットストリームは、オーディオ信号ビットストリームに対応するオーディオ信号の特徴的ファクタ、高周波数帯域符号化情報及びエネルギー比を含む。

特徴的ファクタは、オーディオ信号の特徴を反映するために使用され、“音声ファクタ”、“スペクトル傾斜”、“短期平均エネルギー”又は“短期ゼロ交差率”を含むが、これらに限定されない。特徴的ファクタは、図１に示す方法の実施例における特徴的ファクタと同じであり、詳細については再び説明しない。

S202：復号化装置は、低周波数帯域信号を取得するために、特徴的ファクタを使用することによりオーディオ信号ビットストリームにおいて低周波数帯域復号化を実行する。

S203：復号化装置は、高周波数帯域信号を取得するために、高周波数帯域符号化情報を使用することによりオーディオ信号ビットストリームにおいて高周波数帯域復号化を実行する。

S204：復号化装置は、第１の全帯域信号を取得するために、高周波数帯域信号においてスペクトル拡散予測を実行する。

S205：復号化装置は、第１の全帯域信号においてディエンファシス処理を実行し、ディエンファシス処理のディエンファシスパラメータは、特徴的ファクタに従って決定される。

S206：復号化装置は、ディエンファシス処理を受けた第１の全帯域信号の第１のエネルギーを計算する。

S207：復号化装置は、オーディオ信号ビットストリームに含まれるエネルギー比、ディエンファシス処理を受けた第１の全帯域信号及び第１のエネルギーに従って第２の全帯域信号を取得し、エネルギー比は、第１のエネルギーに対する第２の全帯域信号のエネルギーのエネルギー比である。

S208：復号化装置は、第２の全帯域信号、低周波数帯域信号及び高周波数帯域信号に従ってオーディオ信号ビットストリームに対応するオーディオ信号を復元する。

さらに、方法の実施例は、復号化装置により、復号化を通じて特徴的ファクタの量を取得するステップと、復号化装置により、特徴的ファクタ及び特徴的ファクタの量に従って特徴的ファクタの平均値を決定するステップと、復号化装置により、特徴的ファクタの平均値に従ってディエンファシスパラメータを決定するステップとを更に含む。

さらに、S204は、復号化装置により、高周波数帯域信号に従って、全帯域信号を予測するために使用されるLPC係数及び全帯域励振信号を決定するステップと、復号化装置により、第１の全帯域信号を取得するために、LPC係数及び全帯域励振信号において符号化処理を実行するステップとを含む。

さらに、S205は、復号化装置により、第１の全帯域信号において周波数スペクトル移動修正を実行し、修正された第１の全帯域信号において周波数スペクトル反映処理を実行するステップと、復号化装置により、周波数スペクトル反映処理を受けた第１の全帯域信号においてディエンファシス処理を実行するステップとを含む。

任意選択で、S205の後に、方法の実施例は、復号化装置により、ディエンファシス処理を受けた第１の全帯域信号においてアップサンプリング及び帯域通過フィルタリング処理を実行するステップを更に含み、対応して、S206は、復号化装置により、ディエンファシス処理、アップサンプリング及び帯域通過処理を受けた第１の全帯域信号の第１のエネルギーを決定するステップを含む。

方法の実施例は、図１に示す方法の実施例における技術的解決策に対応する。方法の実施例の具体的な実現方式について、特徴的ファクタが音声ファクタである例を使用することにより説明する。他の特徴的ファクタについては、これらの実現処理は同様であり、詳細については更に説明しない。

具体的には、復号化装置は、符号化装置により送信されたオーディオ信号ビットストリームを受信し、オーディオ信号ビットストリームは、オーディオ信号ビットストリームに対応するオーディオ信号の特徴的ファクタ、高周波数帯域符号化情報及びエネルギー比を含む。その後、復号化装置は、オーディオ信号ビットストリームからオーディオ信号の特徴的ファクタを抽出し、低周波数帯域信号を取得するために、オーディオ信号の特徴的ファクタを使用することによりオーディオ信号ビットストリームにおいて低周波数帯域復号化を実行し、高周波数帯域信号を取得するために、高周波数帯域符号化情報を使用することによりオーディオ信号ビットストリームにおいて高周波数帯域復号化を実行する。復号化装置は、特徴的ファクタに従ってディエンファシスパラメータを決定し、第１の全帯域信号S1を取得するために、復号化を通じて取得された高周波数帯域信号に従って全帯域信号予測を実行し、周波数スペクトル移動修正処理を受けた第１の全帯域信号S2を取得するために、S1において周波数スペクトル移動修正処理を実行し、信号S3を取得するために、S2において周波数スペクトル反映処理を実行し、信号S4を取得するために、特徴的ファクタに従って決定されたディエンファシスパラメータを使用することによりS3においてディエンファシス処理を実行し、S4の第１のエネルギーEner0を計算する。任意選択で、復号化装置は、信号S5を取得するために、信号S4においてアップサンプリング処理を実行し、信号S6を取得するために、S5において帯域通過フィルタリング処理を実行し、次に、S6の第１のエネルギーEner0を計算する。その後、第２の全帯域信号は、信号S4又はS6、Ener0及び受信したエネルギー比に従って取得され、オーディオ信号ビットストリームに対応するオーディオ信号は、復号化を通じて取得された第２の全帯域信号、低周波数帯域信号及び高周波数帯域信号に従って復元される。

具体的な実現では、低周波数帯域復号化は、低周波数帯域信号を取得するために、特徴的ファクタを使用することによりオーディオ信号ビットストリームにおいてcoreデコーダにより実行されてもよい。高周波数帯域復号化は、高周波数帯域信号を取得するために、高周波数帯域符号化情報においてSWBデコーダにより実行されてもよい。高周波数帯域信号が取得された後に、第１の全帯域信号を取得するために、スペクトル拡散予測は、高周波数帯域信号に従って直接実行されるか、或いは高周波数帯域信号が減衰ファクタにより乗算された後に実行され、周波数スペクトル移動修正処理、周波数スペクトル反映処理及びディエンファシス処理が第１の全帯域信号において実行される。任意選択で、ディエンファシス処理を受けた第１の周波数帯域信号においてアップサンプリング処理及び帯域通過フィルタリング処理が実行される。具体的な実現では、図１に示す方法の実施例のものと同様の実現方式が処理のために使用されてもよく、詳細については再び説明しない。

信号S4又はS6、Ener0及び受信したエネルギー比に従って第２の全帯域信号を取得することは、具体的には、第２の全帯域信号のエネルギーEner1=Ener0×Rを復元するために、エネルギー比R及び第１のエネルギーEner0に従って第１の全帯域信号においてエネルギー調整を実行し、第１の全帯域信号の周波数スペクトル及びエネルギーEner1に従って第２の全帯域信号を取得することである。

方法の実施例によれば、復号化装置は、オーディオ信号ビットストリームに含まれるオーディオ信号の特徴的ファクタを使用することによりディエンファシスパラメータを決定し、全帯域信号においてディエンファシス処理を実行し、特徴的ファクタを使用することによる復号化を通じて低周波数帯域信号を取得し、これにより、復号化装置により復元されたオーディオ信号は、元の入力オーディオ信号により近く、より高い忠実度を有する。

図３は、本発明の実施例による符号化装置の実施例１の概略構成図である。図３に示すように、符号化装置300は、第１の符号化モジュール301と、第２の符号化モジュール302と、ディエンファシス処理モジュール303と、計算モジュール304と、帯域通過処理モジュール305と、送信モジュール306とを含む。第１の符号化モジュール301は、入力オーディオ信号の特徴的ファクタを取得するために、入力オーディオ信号の低周波数帯域信号を符号化するように構成され、特徴的ファクタは、オーディオ信号の特徴を反映するために使用され、音声ファクタ、スペクトル傾斜、短期平均エネルギー又は短期ゼロ交差率を含み、第２の符号化モジュール302は、第１の全帯域信号を取得するために、入力オーディオ信号の高周波数帯域信号において符号化及びスペクトル拡散予測を実行するように構成され、ディエンファシス処理モジュール303は、第１の全帯域信号においてディエンファシス処理を実行するように構成され、ディエンファシス処理のディエンファシスパラメータは、特徴的ファクタに従って決定され、計算モジュール304は、ディエンファシス処理を受けた第１の全帯域信号の第１のエネルギーを計算するように構成され、帯域通過処理モジュール305は、第２の全帯域信号を取得するために、入力オーディオ信号において帯域通過フィルタリング処理を実行するように構成され、計算モジュール304は、第２の全帯域信号の第２のエネルギーを計算し、第１の全帯域信号の第１のエネルギーに対する第２の全帯域信号の第２のエネルギーのエネルギー比を計算するように更に構成され、送信モジュール306は、入力オーディオ信号を符号化することから生じたビットストリームを復号化装置に送信するように構成され、ビットストリームは、入力オーディオ信号の特徴的ファクタ、高周波数帯域符号化情報及びエネルギー比を含む。

さらに、符号化装置300は、特徴的ファクタの量を取得し、特徴的ファクタ及び特徴的ファクタの量に従って特徴的ファクタの平均値を決定し、特徴的ファクタの平均値に従ってディエンファシスパラメータを決定するように構成されたディエンファシスパラメータ決定モジュール307を更に含む。

さらに、第２の符号化モジュール302は、高周波数帯域信号に従って、全帯域信号を予測するために使用されるLPC係数及び全帯域励振信号を決定し、第１の全帯域信号を取得するために、LPC係数及び全帯域励振信号において符号化処理を実行するように具体的に構成される。

さらに、ディエンファシス処理モジュール303は、第２の符号化モジュール302により取得された第１の全帯域信号において周波数スペクトル移動修正を実行し、修正された第１の全帯域信号において周波数スペクトル反映処理を実行し、周波数スペクトル反映処理を受けた第１の全帯域信号においてディエンファシス処理を実行するように具体的に構成される。

この実施例において提供される符号化装置は、図１に示す方法の実施例における技術的解決策を実行するように構成されてもよい。これらの実現原理及び技術的効果は同様であり、詳細については再び説明しない。

図４は、本発明の実施例による復号化装置の実施例１の概略構成図である。図４に示すように、復号化装置400は、受信モジュール401と、第１の復号化モジュール402と、第２の復号化モジュール403と、ディエンファシス処理モジュール404と、計算モジュール405と、復元モジュール406とを含む。受信モジュール401は、符号化装置により送信されたオーディオ信号ビットストリームを受信するように構成され、オーディオ信号ビットストリームは、オーディオ信号ビットストリームに対応するオーディオ信号の特徴的ファクタ、高周波数帯域符号化情報及びエネルギー比を含み、特徴的ファクタは、オーディオ信号の特徴を反映するために使用され、音声ファクタ、スペクトル傾斜、短期平均エネルギー又は短期ゼロ交差率を含み、第１の復号化モジュール402は、低周波数帯域信号を取得するために、特徴的ファクタを使用することによりオーディオ信号ビットストリームにおいて低周波数帯域復号化を実行するように構成され、第２の復号化モジュール403は、高周波数帯域信号を取得するために、高周波数帯域符号化情報を使用することによりオーディオ信号ビットストリームにおいて高周波数帯域復号化を実行し、第１の全帯域信号を取得するために、高周波数帯域信号においてスペクトル拡散予測を実行するように構成され、ディエンファシス処理モジュール404は、第１の全帯域信号においてディエンファシス処理を実行するように構成され、ディエンファシス処理のディエンファシスパラメータは、特徴的ファクタに従って決定され、計算モジュール405は、ディエンファシス処理を受けた第１の全帯域信号の第１のエネルギーを計算し、オーディオ信号ビットストリームに含まれるエネルギー比、ディエンファシス処理を受けた第１の全帯域信号及び第１のエネルギーに従って第２の全帯域信号を取得するように構成され、エネルギー比は、第１のエネルギーに対する第２の全帯域信号のエネルギーのエネルギー比であり、復元モジュール406は、第２の全帯域信号、低周波数帯域信号及び高周波数帯域信号に従ってオーディオ信号ビットストリームに対応するオーディオ信号を復元するように構成される。

さらに、復号化装置400は、復号化を通じて特徴的ファクタの量を取得し、特徴的ファクタ及び特徴的ファクタの量に従って特徴的ファクタの平均値を決定し、特徴的ファクタの平均値に従ってディエンファシスパラメータを決定するように構成されたディエンファシスパラメータ決定モジュール407を更に含む。

さらに、第２の復号化モジュール403は、高周波数帯域信号に従って、全帯域信号を予測するために使用されるLPC係数及び全帯域励振信号を決定し、第１の全帯域信号を取得するために、LPC係数及び全帯域励振信号において符号化処理を実行するように具体的に構成される。

さらに、ディエンファシス処理モジュール404は、第１の全帯域信号において周波数スペクトル移動修正を実行し、修正された第１の全帯域信号において周波数スペクトル反映処理を実行し、周波数スペクトル反映処理を受けた第１の全帯域信号においてディエンファシス処理を実行するように具体的に構成される。

この実施例において提供される復号化装置は、図２に示す方法の実施例における技術的解決策を実行するように構成されてもよい。これらの実現原理及び技術的効果は同様であり、詳細については再び説明しない。

図５は、本発明の実施例による符号化装置の実施例２の概略構成図である。図５に示すように、符号化装置500は、プロセッサ501と、メモリ502と、通信インタフェース503とを含む。プロセッサ501、メモリ502及び通信インタフェース503は、バス（図面に示す太い実線）を用いて接続される。

通信インタフェース503は、オーディオ信号の入力を受信し、復号化装置と通信するように構成される。メモリ502は、プログラムコードを記憶するように構成される。プロセッサ501は、図１に示す方法の実施例における技術的解決策を実行するために、メモリ502に記憶されたプログラムコードを呼び出すように構成される。これらの実現原理及び技術的解決策は同様であり、詳細については再び説明しない。

図６は、本発明の実施例による復号化装置の実施例２の概略構成図である。図６に示すように、復号化装置600は、プロセッサ601と、メモリ602と、通信インタフェース603とを含む。プロセッサ601、メモリ602及び通信インタフェース603は、バス（図面に示す太い実線）を用いて接続される。

通信インタフェース603は、符号化装置と通信し、復元されたオーディオ信号を出力するように構成される。メモリ602は、プログラムコードを記憶するように構成される。プロセッサ601は、図２に示す方法の実施例における技術的解決策を実行するために、メモリ602に記憶されたプログラムコードを呼び出すように構成される。これらの実現原理及び技術的解決策は同様であり、詳細については再び説明しない。

図７は、本発明の実施例による符号化／復号化システムの実施例の概略構成図である。図７に示すように、コーデックシステム700は、符号化装置701と、復号化装置702とを含む。符号化装置701及び復号化装置702は、それぞれ図３に示す符号化装置及び図４に示す復号化装置でもよく、それぞれ図１及び図２に示す方法の実施例における技術的解決策を実行するように構成されてもよい。これらの実現原理及び技術的解決策は同様であり、詳細については再び説明しない。

前述の実施例の説明により、当業者は、本発明がハードウェア、ファームウェア又はこれらの組み合わせにより実現されてもよいことを明確に認識し得る。本発明がソフトウェアにより実現される場合、前述の機能は、コンピュータ読み取り可能媒体に記憶されてもよく、或いはコンピュータ読み取り可能媒体内の１つ以上の命令又はコードとして送信されてもよい。コンピュータ読み取り可能媒体は、コンピュータ記憶媒体と、通信媒体とを含み、通信媒体は、コンピュータプログラムが１つの場所から他に送信されることを可能にするいずれかの媒体を含む。記憶媒体は、コンピュータにアクセス可能ないずれか利用可能な媒体でもよい。以下に例を提供するが、限定を課すものではない。コンピュータ読み取り可能媒体は、RAM、ROM、EEPROM、CD-ROM又は他の光ディスクストレージ若しくはディスク記憶媒体、又は他の磁気記憶デバイス、又は命令若しくはデータ構造の形式で予期されるプログラムコードを搬送又は記憶することができ、コンピュータによりアクセスされることができる他の媒体を含んでもよい。さらに、いずれかの接続は、コンピュータ読み取り可能媒体として適切に定義されてもよい。例えば、ソフトウェアが同軸ケーブル、光ファイバ／ケーブル、ツイストペア、デジタル加入者線（DSL）、又は赤外線、無線及びマイクロ波のような無線技術を使用することによりウェブサイト、サーバ又は他の遠隔ソースから送信される場合、同軸ケーブル、光ファイバ／ケーブル、ツイストペア、DSL、又は赤外線、無線及びマイクロ波のような無線技術は、媒体の定義に含まれる。例えば、本発明により使用されるディスク（Disk）及びディスク（disc）は、コンパクトディスクCD、レーザーディスク、光ディスク、デジタル多目的ディスク（DVD）フロッピーディスク、ブルーレイディスクを含み、ディスク（disk）は、概して磁気手段によりデータをコピーし、ディスク（disc）は、レーザー手段により光学的にデータをコピーする。前述の組み合わせもまた、コンピュータ読み取り可能媒体の保護範囲内に含まれるべきである。

さらに、実施例に応じて、この明細書に記載されるいずれかの方法のいくつかの動作又はイベントは、異なる順序に従って実行されてもよく、或いは追加、結合又は省略されてもよい（例えば、或る特定の目的を実現するために、全ての記載の動作又はイベントが必要であるとは限らない）。さらに、或る実施例では、動作又はイベントは、複数のプロセッサによりハイパースレッディング処理、中断処理又は同時処理を受けてもよく、同時処理は、非順次的実行でもよい。さらに、明瞭性を考慮して、本発明の特定の実施例は、単一のステップ又はモジュールの機能として記載されるが、本発明の技術は、前述の複数のステップ又はモジュールの組み合わせの実行でもよいことが認識されるべきである。

最後に、前述の実施例は、本発明を限定するのとは別に、本発明の技術的解決策を説明することを単に意図する。本発明について前述の実施例を参照して詳細に説明したが、当業者は、本発明の実施例の技術的解決策の範囲を逸脱することなく、依然として前述の実施例において説明した技術的対策に変更を行ってもよく、或いはその一部又は全部の技術的特徴に等価置換を行ってもよいことを認識するべきである。

Claims

符号化装置により、入力オーディオ信号の特徴的ファクタを取得するために、前記入力オーディオ信号の低周波数帯域信号を符号化するステップであり、前記入力オーディオ信号は、第１の周波数スペクトル範囲を有する前記低周波数帯域信号と、第２の周波数スペクトル範囲を有する高周波数帯域信号と、前記第２の周波数スペクトル範囲より高い第３の周波数スペクトル範囲を有する第２の信号とを含むステップと、
前記符号化装置により、前記第３の周波数スペクトル範囲を有する第１の信号を取得するために、前記入力オーディオ信号の前記高周波数帯域信号において符号化及びスペクトル拡散予測を実行するステップと、
前記符号化装置により、前記第１の信号においてディエンファシス処理を実行するステップであり、前記ディエンファシス処理のディエンファシスパラメータは、前記特徴的ファクタに従って決定されるステップと、
前記符号化装置により、ディエンファシス処理を受けた前記第１の信号の第１のエネルギーを計算するステップと、
前記符号化装置により、前記第３の周波数スペクトル範囲を有する前記第２の信号を取得するために、前記入力オーディオ信号において帯域通過フィルタリング処理を実行するステップと、
前記符号化装置により、前記第２の信号の第２のエネルギーを計算するステップと、
前記符号化装置により、前記第１の信号の前記第１のエネルギーに対する前記第２の信号の前記第２のエネルギーのエネルギー比を計算するステップと、
前記符号化装置により、前記入力オーディオ信号を符号化することから生じたビットストリームを復号化装置に送信するステップであり、前記ビットストリームは、前記入力オーディオ信号の前記特徴的ファクタ、高周波数帯域符号化情報及び前記エネルギー比を含むステップと
を含む符号化方法。
前記符号化装置により、特徴的ファクタの量を取得するステップと、
前記符号化装置により、前記特徴的ファクタ及び前記特徴的ファクタの前記量に従って前記特徴的ファクタの平均値を決定するステップと、
前記符号化装置により、前記特徴的ファクタの前記平均値に従って前記ディエンファシスパラメータを決定するステップと
を更に含む、請求項１に記載の方法。
前記符号化装置により、前記第３の周波数スペクトル範囲を有する第１の信号を取得するために、前記入力オーディオ信号の前記高周波数帯域信号においてスペクトル拡散予測を実行する前記ステップは、
前記符号化装置により、前記高周波数帯域信号に従って、全帯域信号を予測するために使用される線形予測符号化（LPC）係数及び全帯域励振信号を決定するステップと、
前記符号化装置により、前記第１の信号を取得するために、前記LPC係数及び前記全帯域励振信号において符号化処理を実行するステップと
を含む、請求項１又は２に記載の方法。
前記符号化装置により、前記第１の信号においてディエンファシス処理を実行する前記ステップは、
前記符号化装置により、前記第１の信号において周波数スペクトル移動修正を実行し、前記修正された第１の信号において周波数スペクトル反映処理を実行するステップであり、前記周波数スペクトル移動修正は、以下の式
S2_k=S1_k×cos(2×PI×f_n×k/f_s)
を使用することにより前記第１の信号において実行され、kは第kの時間サンプル点を表し、kは正の整数であり、S2は前記周波数スペクトル移動修正の後の第１の周波数スペクトル信号であり、S1は前記第１の信号であり、PIは円の直径に対する円の円周の比であり、f_nは周波数スペクトルが移動する必要のある距離がn個の時間サンプル点であることを示し、nは正の整数であり、f_sは信号サンプリングレートを表すステップと、
前記符号化装置により、周波数スペクトル反映処理を受けた前記第１の信号において前記ディエンファシス処理を実行するステップと
を含む、請求項１乃至３のうちいずれか１項に記載の方法。
前記特徴的ファクタは、前記オーディオ信号の特徴を反映するために使用され、音声ファクタ、スペクトル傾斜、短期平均エネルギー又は短期ゼロ交差率を含む、請求項１乃至４のうちいずれか１項に記載の方法。
復号化装置により、符号化装置により送信されたオーディオ信号ビットストリームを受信するステップであり、前記オーディオ信号ビットストリームは、前記オーディオ信号ビットストリームに対応するオーディオ信号の特徴的ファクタ、高周波数帯域符号化情報及びエネルギー比を含むステップと、
前記復号化装置により、第１の周波数スペクトル範囲を有する低周波数帯域信号を取得するために、前記特徴的ファクタを使用することにより前記オーディオ信号ビットストリームにおいて低周波数帯域復号化を実行するステップと、
前記復号化装置により、第２の周波数スペクトル範囲を有する高周波数帯域信号を取得するために、前記高周波数帯域符号化情報を使用することにより前記オーディオ信号ビットストリームにおいて高周波数帯域復号化を実行するステップと、
前記復号化装置により、前記第２の周波数スペクトル範囲より高い第３の周波数スペクトル範囲を有する第１の信号を取得するために、前記高周波数帯域信号においてスペクトル拡散予測を実行するステップと、
前記復号化装置により、前記第１の信号においてディエンファシス処理を実行するステップであり、前記ディエンファシス処理のディエンファシスパラメータは、前記特徴的ファクタに従って決定されるステップと、
前記復号化装置により、ディエンファシス処理を受けた前記第１の信号の第１のエネルギーを計算するステップと、
前記復号化装置により、前記オーディオ信号ビットストリームに含まれる前記エネルギー比、ディエンファシス処理を受けた前記第１の信号及び前記第１のエネルギーに従って、前記第３の周波数スペクトル範囲を有する第２の信号を取得するステップであり、前記エネルギー比は、前記第１のエネルギーに対する前記第２の信号のエネルギーのエネルギー比であるステップと、
前記復号化装置により、前記第２の信号、前記低周波数帯域信号及び前記高周波数帯域信号に従って前記オーディオ信号ビットストリームに対応する前記オーディオ信号を復元するステップと
を含む復号化方法。
前記復号化装置により、復号化を通じて特徴的ファクタの量を取得するステップと、
前記復号化装置により、前記特徴的ファクタ及び前記特徴的ファクタの前記量に従って前記特徴的ファクタの平均値を決定するステップと、
前記復号化装置により、前記特徴的ファクタの前記平均値に従って前記ディエンファシスパラメータを決定するステップと
を更に含む、請求項６に記載の方法。
前記復号化装置により、前記第３の周波数スペクトル範囲を有する第１の信号を取得するために、前記高周波数帯域信号においてスペクトル拡散予測を実行するステップは、
前記復号化装置により、前記高周波数帯域信号に従って、全帯域信号を予測するために使用される線形予測符号化（LPC）係数及び全帯域励振信号を決定するステップと、
前記復号化装置により、前記第１の信号を取得するために、前記LPC係数及び前記全帯域励振信号において符号化処理を実行するステップと
を含む、請求項６又は７に記載の方法。
前記復号化装置により、前記第１の信号においてディエンファシス処理を実行するステップは、
前記復号化装置により、前記第１の信号において周波数スペクトル移動修正を実行し、前記修正された第１の信号において周波数スペクトル反映処理を実行するステップであり、前記周波数スペクトル移動修正は、以下の式
S2_k=S1_k×cos(2×PI×f_n×k/f_s)
を使用することにより前記第１の信号において実行され、kは第kの時間サンプル点を表し、kは正の整数であり、S2は前記周波数スペクトル移動修正の後の第１の周波数スペクトル信号であり、S1は前記第１の信号であり、PIは円の直径に対する円の円周の比であり、f_nは周波数スペクトルが移動する必要のある距離がn個の時間サンプル点であることを示し、nは正の整数であり、f_sは信号サンプリングレートを表すステップと、
前記復号化装置により、周波数スペクトル反映処理を受けた前記第１の信号において前記ディエンファシス処理を実行するステップと
を含む、請求項６乃至８のうちいずれか１項に記載の方法。
前記特徴的ファクタは、前記オーディオ信号の特徴を反映するために使用され、音声ファクタ、スペクトル傾斜、短期平均エネルギー又は短期ゼロ交差率を含む、請求項６乃至９のうちいずれか１項に記載の方法。
入力オーディオ信号の特徴的ファクタを取得するために、前記入力オーディオ信号の低周波数帯域信号を符号化するように構成された第１の符号化モジュールであり、前記入力オーディオ信号は、第１の周波数スペクトル範囲を有する前記低周波数帯域信号と、第２の周波数スペクトル範囲を有する高周波数帯域信号と、前記第２の周波数スペクトル範囲より高い第３の周波数スペクトル範囲を有する第２の信号とを含む第１の符号化モジュールと、
前記第３の周波数スペクトル範囲を有する第１の信号を取得するために、前記入力オーディオ信号の前記高周波数帯域信号において符号化及びスペクトル拡散予測を実行するように構成された第２の符号化モジュールと、
前記第１の信号においてディエンファシス処理を実行するように構成されたディエンファシス処理モジュールであり、前記ディエンファシス処理のディエンファシスパラメータは、前記特徴的ファクタに従って決定されるディエンファシス処理モジュールと、
ディエンファシス処理を受けた前記第１の信号の第１のエネルギーを計算するように構成された計算モジュールと、
前記第３の周波数スペクトル範囲を有する前記第２の信号を取得するために、前記入力オーディオ信号において帯域通過フィルタリング処理を実行するように構成された帯域通過処理モジュールと
を含み、
前記計算モジュールは、前記第２の信号の第２のエネルギーを計算し、前記第１の信号の前記第１のエネルギーに対する前記第２の信号の前記第２のエネルギーのエネルギー比を計算するように更に構成され、
前記入力オーディオ信号を符号化することから生じたビットストリームを復号化装置に送信するように構成された送信モジュールであり、前記ビットストリームは、前記入力オーディオ信号の前記特徴的ファクタ、高周波数帯域符号化情報及び前記エネルギー比を含む送信モジュール
を含む符号化装置。
特徴的ファクタの量を取得し、前記特徴的ファクタ及び前記特徴的ファクタの前記量に従って前記特徴的ファクタの平均値を決定し、前記特徴的ファクタの前記平均値に従って前記ディエンファシスパラメータを決定するように構成されたディエンファシスパラメータ決定モジュールを更に含む、請求項１１に記載の符号化装置。
前記第２の符号化モジュールは、前記高周波数帯域信号に従って、全帯域信号を予測するために使用される線形予測符号化（LPC）係数及び全帯域励振信号を決定し、前記第１の信号を取得するために、前記LPC係数及び前記全帯域励振信号において符号化処理を実行するように構成される、請求項１１又は１２に記載の符号化装置。
前記ディエンファシス処理モジュールは、前記第２の符号化モジュールにより取得された前記第１の信号において周波数スペクトル移動修正を実行し、前記周波数スペクトル移動修正は、以下の式
S2_k=S1_k×cos(2×PI×f_n×k/f_s)
を使用することにより前記第１の信号において実行され、kは第kの時間サンプル点を表し、kは正の整数であり、S2は前記周波数スペクトル移動修正の後の第１の周波数スペクトル信号であり、S1は前記第１の信号であり、PIは円の直径に対する円の円周の比であり、f_nは周波数スペクトルが移動する必要のある距離がn個の時間サンプル点であることを示し、nは正の整数であり、f_sは信号サンプリングレートを表し、前記修正された第１の信号において周波数スペクトル反映処理を実行し、周波数スペクトル反映処理を受けた前記第１の信号において前記ディエンファシス処理を実行するように構成される、請求項１１乃至１３のうちいずれか１項に記載の符号化装置。
前記特徴的ファクタは、前記オーディオ信号の特徴を反映するために使用され、音声ファクタ、スペクトル傾斜、短期平均エネルギー又は短期ゼロ交差率を含む、請求項１１乃至１４のうちいずれか１項に記載の符号化装置。
符号化装置により送信されたオーディオ信号ビットストリームを受信するように構成された受信モジュールであり、前記オーディオ信号ビットストリームは、前記オーディオ信号ビットストリームに対応するオーディオ信号の特徴的ファクタ、高周波数帯域符号化情報及びエネルギー比を含む受信モジュールと、
第１の周波数スペクトル範囲を有する低周波数帯域信号を取得するために、前記特徴的ファクタを使用することにより前記オーディオ信号ビットストリームにおいて低周波数帯域復号化を実行するように構成された第１の復号化モジュールと、
第２の周波数スペクトル範囲を有する高周波数帯域信号を取得するために、前記高周波数帯域符号化情報を使用することにより前記オーディオ信号ビットストリームにおいて高周波数帯域復号化を実行し、前記第２の周波数スペクトル範囲より高い第３の周波数スペクトル範囲を有する第１の信号を取得するために、前記高周波数帯域信号においてスペクトル拡散予測を実行するように構成された第２の復号化モジュールと、
前記第１の信号においてディエンファシス処理を実行するように構成されたディエンファシス処理モジュールであり、前記ディエンファシス処理のディエンファシスパラメータは、前記特徴的ファクタに従って決定されるディエンファシス処理モジュールと、
ディエンファシス処理を受けた前記第１の信号の第１のエネルギーを計算し、前記オーディオ信号ビットストリームに含まれる前記エネルギー比、ディエンファシス処理を受けた前記第１の信号及び前記第１のエネルギーに従って、前記第３の周波数スペクトル範囲を有する第２の信号を取得するように構成された計算モジュールであり、前記エネルギー比は、前記第１のエネルギーに対する前記第２の信号のエネルギーのエネルギー比である計算モジュールと、
前記第２の信号、前記低周波数帯域信号及び前記高周波数帯域信号に従って前記オーディオ信号ビットストリームに対応する前記オーディオ信号を復元するように構成された復元モジュールと
を含む復号化装置。
復号化を通じて特徴的ファクタの量を取得し、前記特徴的ファクタ及び前記特徴的ファクタの前記量に従って前記特徴的ファクタの平均値を決定し、前記特徴的ファクタの前記平均値に従って前記ディエンファシスパラメータを決定するように構成されたディエンファシスパラメータ決定モジュールを更に含む、請求項１６に記載の復号化装置。
前記第２の復号化モジュールは、前記高周波数帯域信号に従って、全帯域信号を予測するために使用される線形予測符号化（LPC）係数及び全帯域励振信号を決定し、前記第１の信号を取得するために、前記LPC係数及び前記全帯域励振信号において符号化処理を実行するように構成される、請求項１６又は１７に記載の復号化装置。
前記ディエンファシス処理モジュールは、前記第１の信号において周波数スペクトル移動修正を実行し、前記周波数スペクトル移動修正は、以下の式
S2_k=S1_k×cos(2×PI×f_n×k/f_s)
を使用することにより前記第１の信号において実行され、kは第kの時間サンプル点を表し、kは正の整数であり、S2は前記周波数スペクトル移動修正の後の第１の周波数スペクトル信号であり、S1は前記第１の信号であり、PIは円の直径に対する円の円周の比であり、f_nは周波数スペクトルが移動する必要のある距離がn個の時間サンプル点であることを示し、nは正の整数であり、f_sは信号サンプリングレートを表し、前記修正された第１の信号において周波数スペクトル反映処理を実行し、周波数スペクトル反映処理を受けた前記第１の信号において前記ディエンファシス処理を実行するように構成される、請求項１６乃至１８のうちいずれか１項に記載の復号化装置。
前記特徴的ファクタは、前記オーディオ信号の特徴を反映するために使用され、音声ファクタ、スペクトル傾斜、短期平均エネルギー又は短期ゼロ交差率を含む、請求項１６乃至１９のうちいずれか１項に記載の復号化装置。
コンピュータに対して請求項１乃至１１のうちいずれか１項に記載の方法を実行させるプログラム。