JP6414635B2

JP6414635B2 - オーディオコーディング方法および装置

Info

Publication number: JP6414635B2
Application number: JP2017519760A
Authority: JP
Inventors: ▲澤▼新 ▲劉▼; ▲賓▼ 王; 磊苗
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2014-06-27
Filing date: 2015-03-23
Publication date: 2018-10-31
Anticipated expiration: 2035-03-23
Also published as: KR20180089576A; US20200027468A1; US11133016B2; EP3136383A1; EP3136383B1; ES2659068T3; CN105225670B; CN105225670A; PL3340242T3; WO2015196837A1; KR101888030B1; ES2882485T3; JP2017524164A; US10460741B2; EP3937169A2; US9812143B2; US20170372716A1; EP3340242B1; US20170076732A1; KR20170003969A

Description

本発明は、通信分野に関し、特に、オーディオコーディング方法および装置に関する。

技術の絶え間ない進化によって、ユーザは、電子デバイスのオーディオ品質に対してますます高い要求を持っている。オーディオ品質を改善する主な方法は、オーディオの帯域幅を改善することである。電子デバイスが、オーディオの帯域幅を増加させるために、従来のコーディング方式でオーディオをコーディングするのであれば、コーディングされたオーディオの情報のビットレートが大幅に増加する。したがって、コーディングされたオーディオの情報が、2つの電子デバイス間で送信される場合、比較的広いネットワーク送信帯域幅が占有される。したがって、対処されるべき問題は、コーディングされたオーディオの情報のビットレートが不変のまま、または、ビットレートが僅かにしか変化せずに、より広い帯域幅を有するオーディオをコーディングすることである。この問題のために、提案される解決策は、帯域幅拡張技術を使用することである。帯域幅拡張技術は、時間領域帯域幅拡張技術および周波数領域帯域幅拡張技術に分けられる。本発明は、時間領域帯域幅拡張技術に関する。

時間領域帯域幅拡張技術では、オーディオにおける各オーディオフレームの線形予測コーディング(LPC, Linear Predictive Coding)係数、線形スペクトルペア(LSP, Linear Spectral Pairs)係数、イミッタンススペクトルペア(ISP, Immittance Spectral Pairs)係数、または、線形スペクトル周波数(LSF, Linear Spectral Frequency)係数のような線形予測パラメータが、一般に、線形予測アルゴリズムを使用することによって計算される。オーディオにおいてコーディング送信が実行される場合、オーディオは、オーディオにおける各オーディオフレームの線形予測パラメータに従ってコーディングされる。しかしながら、コーデック誤り精度要件が比較的高いケースでは、このコーディング方式は、オーディオフレーム間のスペクトルの不連続を引き起こす。

本発明の実施形態は、オーディオコーディング方法および装置を提供する。より広い帯域幅を有するオーディオは、ビットレートが不変のまま、または、ビットレートが僅かにしか変化せずにコーディングされ得、オーディオフレーム間のスペクトルは、より安定である。

第1の態様によれば、本発明の実施形態は、
各オーディオフレームについて、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足することを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定し、または、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないことを判定した場合、第2の修正重みを決定するステップであって、あらかじめ設定された修正条件は、オーディオフレームの信号特性が、このオーディオフレームの前のオーディオフレームの信号特性に類似していることを判定するために使用される、決定するステップと、
決定された第1の修正重みまたは決定された第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正するステップと、
修正されたオーディオフレームの線形予測パラメータに従って、オーディオフレームをコーディングするステップと、を含むオーディオコーディング方法を提供する。

第1の態様を参照して、第1の態様の第1の可能な実施方式では、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するステップは、
以下の式を使用することによって、オーディオフレームのLSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するステップを含む。

ここで、w[i]は、第1の修正重みであり、lsf_new_diff[i]は、オーディオフレームのLSF差分であり、lsf_old_diff[i]は、このオーディオフレームの前のオーディオフレームのLSF差分であり、iは、LSF差分の次数であり、iの値は、0からM-1までの範囲にあり、Mは、線形予測パラメータの次数である。

第1の態様、または、第1の態様の第1の可能な実施方式を参照して、第1の態様の第2の可能な実施方式では、第2の修正重みを決定するステップは、
第2の修正重みを、あらかじめ設定された修正重み値として決定するステップを含み、あらかじめ設定された修正重み値は0よりも大きく、1以下である。

第1の態様、第1の態様の第1の可能な実施方式、または、第1の態様の第2の可能な実施方式を参照して、第1の態様の第3の可能な実施方式では、決定された第1の修正重みに従ってオーディオフレームの線形予測パラメータを修正するステップは、
以下の式を使用することによって、第1の修正重みに従って、オーディオフレームの線形予測パラメータを修正するステップを含む。
L[i]=(1-w[i])*L_old[i]+w[i]*L_new[i]、
ここで、w[i]は、第1の修正重みであり、L[i]は、修正されたオーディオフレームの線形予測パラメータであり、L_new[i]は、オーディオフレームの線形予測パラメータであり、L_old[i]は、このオーディオフレームの前のオーディオフレームの線形予測パラメータであり、iは、線形予測パラメータの次数であり、iの値は、0からM-1までの範囲にあり、Mは、線形予測パラメータの次数である。

第1の態様、第1の態様の第1の可能な実施方式、第1の態様の第2の可能な実施方式、または、第1の態様の第3の可能な実施方式を参照して、第1の態様の第4の可能な実施方式では、決定された第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正するステップは、
以下の式を使用することによって、第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正するステップを含む。
L[i]=(1-y)*L_old[i]+y*L_new[i]、
ここで、yは、第2の修正重みであり、L[i]は、修正されたオーディオフレームの線形予測パラメータであり、L_new[i]は、オーディオフレームの線形予測パラメータであり、L_old[i]は、このオーディオフレームの前のオーディオフレームの線形予測パラメータであり、iは、線形予測パラメータの次数であり、iの値は、0からM-1の範囲にあり、Mは、線形予測パラメータの次数である。

第1の態様、第1の態様の第1の可能な実施方式、第1の態様の第2の可能な実施方式、第1の態様の第3の可能な実施方式、または第1の態様の第4の可能な実施方式を参照して、第1の態様の第5の可能な実施方式では、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足することを判定するステップは、オーディオフレームが、過渡的フレームではないことを判定するステップを含み、過渡的フレームは、非摩擦音から摩擦音への過渡的フレーム、または、摩擦音から非摩擦音への過渡的フレームを含み、
オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないことを判定するステップは、オーディオフレームが、過渡的フレームであることを判定するステップを含む。

第1の態様の第5の可能な実施方式を参照して、第1の態様の第6の可能な実施方式では、オーディオフレームが、摩擦音から非摩擦音への過渡的フレームであることを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいことと、オーディオフレームのコーディングタイプが過渡的であることとを判定するステップを含み、
オーディオフレームが、摩擦音から非摩擦音への過渡的フレームではないことを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/または、オーディオフレームのコーディングタイプが過渡的ではないことを判定するステップを含む。

第1の態様の第5の可能な実施方式を参照して、第1の態様の第7の可能な実施方式では、オーディオフレームが、摩擦音から非摩擦音への過渡的フレームであることを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいことと、オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満であることとを判定するステップを含み、
オーディオフレームが摩擦音から非摩擦音への過渡的フレームではないことを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/または、オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満ではないことを判定するステップを含む。

第1の態様の第5の可能な実施方式を参照して、第1の態様の第8の可能な実施方式では、オーディオフレームが、非摩擦音から摩擦音への過渡的フレームであることを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満であり、前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つであり、オーディオフレームのスペクトルチルト周波数が、第4のスペクトルチルト周波数しきい値よりも大きいことを判定するステップを含み、
オーディオフレームが非摩擦音から摩擦音への過渡的フレームではないことを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満ではなく、ならびに/または、前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つではなく、ならびに/または、オーディオフレームのスペクトルチルト周波数が、第4のスペクトルチルト周波数しきい値よりも大きくないことを判定するステップを含む。

第1の態様の第5の可能な実施方式を参照して、第1の態様の第9の可能な実施方式では、オーディオフレームが、摩擦音から非摩擦音への過渡的フレームであることを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きく、オーディオフレームのコーディングタイプが過渡的であることを判定するステップを含む。

第1の態様の第5の可能な実施方式を参照して、第1の態様の第10の可能な実施方式では、オーディオフレームが、摩擦音から非摩擦音への過渡的フレームであることを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいことと、オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満であることとを判定するステップを含む。

第1の態様の第5の可能な実施方式を参照して、第1の態様の第11の可能な実施方式では、オーディオフレームが非摩擦音から摩擦音への過渡的フレームであることを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満であること、前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つであること、ならびに、オーディオフレームのスペクトルチルト周波数が、第4のスペクトルチルト周波数しきい値よりも大きいことを判定するステップを含む。

第2の態様によれば、本発明の実施形態は、決定ユニット、修正ユニット、およびコーディングユニットを含むオーディオコーディング装置を提供し、
決定ユニットは、各オーディオフレームについて、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足することを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するか、または、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないことを判定した場合、第2の修正重みを決定するように構成され、あらかじめ設定された修正条件は、オーディオフレームの信号特性が、このオーディオフレームの前のオーディオフレームの信号特性に類似していることを判定するために使用され、
修正ユニットは、決定ユニットによって決定された第1の修正重みまたは第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正するように構成され、
コーディングユニットは、修正されたオーディオフレームの線形予測パラメータに従って、オーディオフレームをコーディングするように構成され、修正された線形予測パラメータは、修正ユニットによる修正後に取得される。

第2の態様を参照して、第2の態様の第1の可能な実施方式では、決定ユニットは特に、以下の式を使用することによって、オーディオフレームのLSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するように構成される。

第2の態様、または、第2の態様の第1の可能な実施方式を参照して、第2の態様の第2の可能な実施方式では、決定ユニットは特に、第2の修正重みを、あらかじめ設定された修正重み値として決定するように構成され、あらかじめ設定された修正重み値は、0よりも大きく、1以下である。

第2の態様、第2の態様の第1の可能な実施方式、または第2の態様の第2の可能な実施方式を参照して、第2の態様の第3の可能な実施方式では、修正ユニットは特に、以下の式を使用することによって、第1の修正重みに従って、オーディオフレームの線形予測パラメータを修正するように構成される。
L[i]=(1-w[i])*L_old[i]+w[i]*L_new[i]、
ここで、w[i]は、第1の修正重みであり、L[i]は、修正されたオーディオフレームの線形予測パラメータであり、L_new[i]は、オーディオフレームの線形予測パラメータであり、L_old[i]は、このオーディオフレームの前のオーディオフレームの線形予測パラメータであり、iは、線形予測パラメータの次数であり、iの値は、0からM-1までの範囲にあり、Mは、線形予測パラメータの次数である。

第2の態様、第2の態様の第1の可能な実施方式、第2の態様の第2の可能な実施方式、または、第2の態様の第3の可能な実施方式を参照して、第2の態様の第4の可能な実施方式では、修正ユニットは特に、以下の式を使用することによって、第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正するように構成される。
L[i]=(1-y)*L_old[i]+y*L_new[i]、
ここで、yは、第2の修正重みであり、L[i]は、修正されたオーディオフレームの線形予測パラメータであり、L_new[i]は、オーディオフレームの線形予測パラメータであり、L_old[i]は、このオーディオフレームの前のオーディオフレームの線形予測パラメータであり、iは、線形予測パラメータの次数であり、iの値は、0からM-1までの範囲にあり、Mは、線形予測パラメータの次数である。

第2の態様、第2の態様の第1の可能な実施方式、第2の態様の第2の可能な実施方式、第2の態様の第3の可能な実施方式、または、第2の態様の第4の可能な実施方式を参照して、第2の態様の第5の可能な実施方式では、決定ユニットは特に、オーディオにおける各オーディオフレームについて、オーディオフレームが、過渡的フレームではないことを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定し、オーディオフレームが、過渡的フレームであることを判定した場合、第2の修正重みを決定するように構成され、過渡的フレームは、非摩擦音から摩擦音への過渡的フレーム、または、摩擦音から非摩擦音への過渡的フレームを含む。

第2の態様の第5の可能な実施方式を参照して、第2の態様の第6の可能な実施方式では、決定ユニットは特に、
オーディオにおける各オーディオフレームについて、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/または、オーディオフレームのコーディングタイプが、過渡的ではないことを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定し、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きく、オーディオフレームのコーディングタイプが過渡的であることを判定した場合、第2の修正重みを決定するように構成される。

第2の態様の第5の可能な実施方式を参照して、第2の態様の第7の可能な実施方式では、決定ユニットは特に、
オーディオにおける各オーディオフレームについて、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/または、オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満ではないことを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って第1の修正重みを決定し、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きく、オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満であることを判定した場合、第2の修正重みを決定するように構成される。

第2の態様の第5の可能な実施方式を参照して、第2の態様の第8の可能な実施方式では、決定ユニットは特に、
オーディオにおける各オーディオフレームについて、前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満ではなく、ならびに/または、前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つではなく、ならびに/または、オーディオフレームのスペクトルチルトが、第4のスペクトルチルトしきい値よりも大きくないことを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分および前のオーディオフレームのLSF差分に従って第1の修正重みを決定し、前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満であり、前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つであり、オーディオフレームのスペクトルチルト周波数が、第4のスペクトルチルト周波数しきい値よりも大きいことを判定した場合、第2の修正重みを決定するように構成される。

本発明の実施形態では、オーディオにおける各オーディオフレームについて、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足すると判定された場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って第1の修正重みが決定されるか、または、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないと判定された場合、第2の修正重みが決定され、あらかじめ設定された修正条件は、オーディオフレームの信号特性が、このオーディオフレームの前のオーディオフレームの信号特性に類似していることを判定するために使用され、オーディオフレームの線形予測パラメータは、決定された第1の修正重みまたは決定された第2の修正重みによって修正され、オーディオフレームは、修正されたオーディオフレームの線形予測パラメータに従ってコーディングされる。このように、オーディオフレームの信号特性が、このオーディオフレームの前のオーディオフレームの信号特性に類似しているか否かに従って、異なる修正重みが決定され、オーディオフレームの線形予測パラメータが修正され、これによって、オーディオフレーム間のスペクトルが、より安定になる。さらに、オーディオフレームは、修正されたオーディオフレームの線形予測パラメータに従ってコーディングされ、これによって、ビットレートが変化しないことを保証しながら、デコードによって復元されるスペクトルのフレーム間連続性が強化される。したがって、デコードによって復元されたスペクトルは、オリジナルのスペクトルに接近し、コーディングパフォーマンスが改善される。

本発明の実施形態における技術的解決策をより明確に説明するために、以下は、本実施形態を説明するために必要とされる添付図面を簡単に紹介する。明らかに、以下の説明における添付図面は、単に本発明のいくつかの実施形態しか図示しておらず、当業者であれば、創造的な努力なくこれら添付図面から他の図面を導出し得る。

本発明の実施形態に従うオーディオコーディング方法の概要フローチャートである。実際のスペクトルとLSF差分との比較の図である。本発明の実施形態に従うオーディオコーディング方法のアプリケーションシナリオの例を示す図である。本発明の実施形態に従うオーディオコーディング装置の概要構成図である。本発明の実施形態に従う電子デバイスの概要構成図である。

以下は、本発明の実施形態における添付図面を参照して本発明の実施形態における技術的解決策を明確に説明する。明らかに、説明された実施形態は、本発明の実施形態のすべてではなく単なる一部である。創造的な努力なく本発明の実施形態に基づいて当業者によって取得される他のすべての実施形態は、本発明の保護範囲内にあるものとする。

本発明の実施形態に従うオーディオデコーディング方法のフローチャートである図1を参照されたい。この方法は以下を含む。

ステップ101:オーディオにおける各オーディオフレームについて、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足することを判定した場合、電子デバイスは、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するか、または、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないことを判定した場合、電子デバイスは、第2の修正重みを決定し、あらかじめ設定された修正条件は、オーディオフレームの信号特性が、このオーディオフレームの前のオーディオフレームの信号特性に類似していることを判定するために使用される。

ステップ102:電子デバイスは、決定された第1の修正重みまたは決定された第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正する。

線形予測パラメータは、LPC、LSP、ISP、LSF等を含み得る。

ステップ103:電子デバイスは、修正されたオーディオフレームの線形予測パラメータに従ってオーディオフレームをコーディングする。

この実施形態では、オーディオにおける各オーディオフレームについて、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足することを判定した場合、電子デバイスは、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するか、または、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないことを判定した場合、電子デバイスは、第2の修正重みを決定し、電子デバイスは、決定された第1の修正重みまたは決定された第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正し、修正されたオーディオフレームの線形予測パラメータに従って、オーディオフレームをコーディングする。このように、オーディオフレームの信号特性が、このオーディオフレームの前のオーディオフレームの信号特性に類似しているか否かに従って、異なる修正重みが決定され、オーディオフレームの線形予測パラメータが修正され、これによって、オーディオフレーム間のスペクトルが、より安定になる。それに加えて、オーディオフレームの信号特性が、このオーディオフレームの前のオーディオフレームの信号特性に類似しているか否かに従って、異なる修正重みが決定され、これら信号特性が類似していない場合に決定される第2の修正重みは、可能な限り1に近くなり得る。これによって、オーディオフレームの信号特性が、このオーディオフレームの前のオーディオフレームの信号特性に類似していない場合、オーディオフレームのオリジナルのスペクトル特性が、可能な限り維持されるようなり、したがって、コーディングされたオーディオの情報がデコードされた後に取得されたオーディオの聴覚品質は、より良好である。

ステップ101において、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足するか否かを電子デバイスがどのようにして判定するのかの特定の実施は、修正条件の特定の実施に関連している。例を使用することによって、以下に説明が提供される。

可能な実施方式において、修正条件は、オーディオフレームが、過渡的フレームではないのであれば、
オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足することを、電子デバイスによって判定するステップは、オーディオフレームが、過渡的フレームではないことを判定するステップを含み得、過渡的フレームは、非摩擦音から摩擦音への過渡的フレーム、または、摩擦音から非摩擦音への過渡的フレームを含み、
オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないことを、電子デバイスによって判定するステップは、オーディオフレームが過渡的フレームであることを判定するステップを含み得る。

可能な実施方式では、オーディオフレームが摩擦音から非摩擦音への過渡的フレームであるか否かを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいか否かと、オーディオフレームのコーディングタイプが過渡的であるか否かとを判定することによって実施され得る。特に、オーディオフレームが、摩擦音から非摩擦音への過渡的フレームであることを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいことと、オーディオフレームのコーディングタイプが過渡的であることとを判定するステップを含み得、オーディオフレームが、摩擦音から非摩擦音への過渡的フレームではないことを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/または、オーディオフレームのコーディングタイプが過渡的ではないことを判定するステップを含み得る。

別の可能な実施方式では、オーディオフレームが、摩擦音から非摩擦音への過渡的フレームであるか否かを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第1の周波数しきい値よりも大きいか否かを判定することと、オーディオフレームのスペクトルチルト周波数が、第2の周波数しきい値未満であるか否かを判定することと、によって実施され得る。特に、オーディオフレームが、摩擦音から非摩擦音への過渡的フレームであることを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいことと、オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満であることとを判定するステップを含み得、オーディオフレームが、摩擦音から非摩擦音への過渡的フレームではないことを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/または、オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満ではないことを判定するステップを含み得る。第1のスペクトルチルト周波数しきい値および第2のスペクトルチルト周波数しきい値の特定の値は、本発明のこの実施形態において限定されず、第1のスペクトルチルト周波数しきい値と第2のスペクトルチルト周波数しきい値との値の関係は、限定されない。オプションで、本発明の実施形態では、第1のスペクトルチルト周波数しきい値の値は、5.0であり得、本発明の別の実施形態では、第2のスペクトルチルト周波数しきい値の値は、1.0であり得る。

可能な実施方式では、オーディオフレームが、非摩擦音から摩擦音への過渡的フレームであるか否かを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第3の周波数しきい値未満であるか否かを判定すること、前のオーディオフレームのコーディングタイプが、有声(Voiced)、一般的(Generic)、過渡的(Transition)、およびオーディオ(Audio)の4つのタイプのうちの1つであるか否かを判定すること、ならびに、オーディオフレームのスペクトルチルト周波数が、第4の周波数しきい値よりも大きいか否かを判定すること、によって実施され得る。特に、オーディオフレームが非摩擦音から摩擦音への過渡的フレームであることを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満であること、前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つであること、ならびに、オーディオフレームのスペクトルチルトが、第4のスペクトルチルトしきい値より大きいことを判定するステップを含み得、オーディオフレームが非摩擦音から摩擦音への過渡的フレームではないことを判定するステップは、前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満ではないこと、ならびに/または、前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つではないこと、ならびに/または、オーディオフレームのスペクトルチルト周波数が、第4のスペクトルチルト周波数しきい値よりも大きくないことを判定するステップを含み得る。第3のスペクトルチルト周波数しきい値および第4のスペクトルチルト周波数しきい値の特定の値は、本発明のこの実施形態において限定されず、第3のスペクトルチルト周波数しきい値と第4のスペクトルチルト周波数しきい値との値の関係は、限定されない。本発明の実施形態では、第3のスペクトルチルト周波数しきい値の値は、3.0であり得、本発明の別の実施形態では、第4のスペクトルチルト周波数しきい値の値は、5.0であり得る。

ステップ101において、オーディオフレームのLSF差分と、前のオーディオフレームのLSF差分とに従って、電子デバイスによって、第1の修正重みを決定するステップは、
電子デバイスによって、以下の式を使用することによって、オーディオフレームのLSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するステップを含み得る。

ここで、w[i]は、第1の修正重みであり、lsf_new_diff[i]は、オーディオフレームのLSF差分であり、lsf_new_diff[i]=lsf_new[i]-lsf_new[i-1]であり、lsf_new[i]は、オーディオフレームのi次LSFパラメータであり、lsf_new[i-1]は、オーディオフレームの(i-1)次LSFパラメータであり、lsf_old_diff[i]は、このオーディオフレームの前のオーディオフレームのLSF差分であり、lsf_old_diff[i]=lsf_old[i]-lsf_old[i-1]であり、lsf_old[i]は、このオーディオフレームの前のオーディオフレームのi次LSFパラメータであり、lsf_old[i-1]は、このオーディオフレームの前のオーディオフレームの(i-1)次LSF差分であり、iは、LSFパラメータの次数およびLSF差分の次数であり、iの値は、0からM-1までの範囲にあり、Mは、線形予測パラメータの次数である。

前述した式の原理は以下の通りである。

実際のスペクトルとLSF差分との比較の図である図1Aを参照されたい。図から理解され得るように、オーディオフレームにおけるLSF差分lsf_new_diff[i]は、オーディオフレームにおけるスペクトルエネルギ傾向を反映する。より小さなlsf_new_diff[i]は、より大きな、対応する周波数ポイントのスペクトルエネルギを示す。

より小さなw[i]=lsf_new_diff[i]/lsf_old_diff[i]は、lsf_new[i]に対応する周波数ポイントにおける、前のフレームと現在のフレームとの間の、より大きなスペクトルエネルギ差と、オーディオフレームのスペクトルエネルギが、前のオーディオフレームに対応する周波数ポイントのスペクトルエネルギよりもはるかに大きいこととを示す。

より小さなw[i]=lsf_old_diff[i]/lsf_new_diff[i]は、lsf_new[i]に対応する周波数ポイントにおける、前のフレームと現在のフレームとの間の、より小さなスペクトルエネルギ差と、オーディオフレームのスペクトルエネルギが、前のオーディオフレームに対応する周波数ポイントのスペクトルエネルギよりもはるかに小さいこととを示す。

したがって、前のフレームと現在のフレームとの間のスペクトルを安定にするために、w[i]は、オーディオフレームlsf_new[i]の重みとして使用され得、1-w[i]は、前のオーディオフレームに対応する周波数ポイントの重みとして使用され得る。詳細は、式2に示される。

ステップ101において、電子デバイスによって、第2の修正重みを決定するステップは、
電子デバイスによって、第2の修正重みを、あらかじめ設定された修正重み値として決定するステップを含み得、あらかじめ設定された修正重み値は、0よりも大きく、1以下である。

好適には、あらかじめ設定された修正重み値は、1に近い値である。

ステップ102において、電子デバイスによって、決定された第1の修正重みに従って、オーディオフレームの線形予測パラメータを修正するステップは、
以下の式を使用することによって、第1の修正重みに対応するオーディオフレームの線形予測パラメータを修正するステップを含み得る。
L[i]=(1-w[i])*L_old[i]+w[i]*L_new[i]、式2
ここで、w[i]は、第1の修正重みであり、L[i]は、修正されたオーディオフレームの線形予測パラメータであり、L_new[i]は、オーディオフレームの線形予測パラメータであり、L_old[i]は、このオーディオフレームの前のオーディオフレームの線形予測パラメータであり、iは、線形予測パラメータの次数であり、iの値は、0からM-1までの範囲にあり、Mは、線形予測パラメータの次数である。

ステップ102において、電子デバイスによって、決定された第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正するステップは、
以下の式を使用することによって、第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正するステップを含み得る。
L[i]=(1-y)*L_old[i]+y*L_new[i]、式3
ここで、yは、第2の修正重みであり、L[i]は、修正されたオーディオフレームの線形予測パラメータであり、L_new[i]は、オーディオフレームの線形予測パラメータであり、L_old[i]は、このオーディオフレームの前のオーディオフレームの線形予測パラメータであり、iは、線形予測パラメータの次数であり、iの値は、0からM-1までの範囲にあり、Mは、線形予測パラメータの次数である。

ステップ103において、電子デバイスは特に、修正されたオーディオフレームの線形予測パラメータに従ってオーディオフレームをどのようにコーディングするかに関し、関連する時間領域帯域幅拡張技術を参照されたい。本発明では、詳細は説明されない。

本発明のこの実施形態におけるオーディオコーディング方法は、図2に図示された時間領域帯域幅拡張方法へ適用され得る。時間領域帯域幅拡張方法では、
オリジナルのオーディオ信号は、低帯域信号および高帯域信号へ分割され、
低帯域信号については、低帯域信号コーディング、低帯域励起信号前処理、LP合成、ならびに時間領域エンベロープ計算および量子化のような処理が、連続的に実行され、
高帯域信号については、高帯域信号前処理、LP分析、およびLPC量子化のような処理が、連続的に実行され、
低帯域信号コーディングの結果、LPC量子化の結果、ならびに、時間領域エンベロープ計算および量子化の結果に従って、オーディオ信号に対してMUXが実行される。

LPC量子化は、本発明のこの実施形態におけるステップ101およびステップ102に対応し、オーディオ信号に対して実行されるMUXは、本発明のこの実施形態におけるステップ103に対応する。

本発明の実施形態に従うオーディオコーディング装置の概要構成図である図3を参照されたい。装置は、電子デバイス内に配置され得る。装置300は、決定ユニット310、修正ユニット320、およびコーディングユニット330を含み得る。

決定ユニット310は、オーディオにおける各オーディオフレームについて、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足することを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定し、または、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないことを判定した場合、第2の修正重みを決定するように構成され、あらかじめ設定された修正条件は、オーディオフレームの信号特性が、このオーディオフレームの前のオーディオフレームの信号特性に類似していることを判定するために使用される。

修正ユニット320は、決定ユニット310によって決定された第1の修正重みまたは第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正するように構成される。

コーディングユニット330は、修正されたオーディオフレームの線形予測パラメータに従って、オーディオフレームをコーディングするように構成され、修正された線形予測パラメータは、修正ユニット320による修正後に取得される。

オプションで、決定ユニット310は特に、以下の式を使用することによって、オーディオフレームのLSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するように構成され得る。

オプションで、決定ユニット310は特に、第2の修正重みを、あらかじめ設定された修正重み値として決定するように構成され、あらかじめ設定された修正重み値は、0よりも大きく、1以下である。

オプションで、修正ユニット320は特に、以下の式を使用することによって、第1の修正重みに従って、オーディオフレームの線形予測パラメータを修正するように構成され得る。
L[i]=(1-w[i])*L_old[i]+w[i]*L_new[i]、
ここで、w[i]は、第1の修正重みであり、L[i]は、修正されたオーディオフレームの線形予測パラメータであり、L_new[i]は、オーディオフレームの線形予測パラメータであり、L_old[i]は、このオーディオフレームの前のオーディオフレームの線形予測パラメータであり、iは、線形予測パラメータの次数であり、iの値は、0からM-1までの範囲にあり、Mは、線形予測パラメータの次数である。

オプションで、修正ユニット320は特に、以下の式を使用することによって、第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正するように構成され得る。
L[i]=(1-y)*L_old[i]+y*L_new[i]、
ここで、yは、第2の修正重みであり、L[i]は、修正されたオーディオフレームの線形予測パラメータであり、L_new[i]は、オーディオフレームの線形予測パラメータであり、L_old[i]は、このオーディオフレームの前のオーディオフレームの線形予測パラメータであり、iは、線形予測パラメータの次数であり、iの値は、0からM-1までの範囲にあり、Mは、線形予測パラメータの次数である。

オプションで、決定ユニット310は特に、オーディオにおける各オーディオフレームについて、オーディオフレームが、過渡的フレームではないことを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するか、または、オーディオフレームが、過渡的フレームであることを判定した場合、第2の修正重みを決定するように構成され得、過渡的フレームは、非摩擦音から摩擦音への過渡的フレーム、もしくは、摩擦音から非摩擦音への過渡的フレームを含む。

オプションで、決定ユニット310は特に、オーディオにおける各オーディオフレームについて、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/または、オーディオフレームのコーディングタイプが、過渡的ではないことを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定し、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいことと、オーディオフレームのコーディングタイプが過渡的であることとを判定した場合、第2の修正重みを決定するように構成され得る。

オプションで、決定ユニット310は特に、オーディオにおける各オーディオフレームについて、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/または、オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満ではないことを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定し、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいことと、オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満であることとを判定した場合、第2の修正重みを決定するように構成され得る。

オプションで、決定ユニット310は特に、オーディオにおける各オーディオフレームについて、前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満ではないこと、ならびに/または、前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオのうちの1つではないこと、ならびに/または、オーディオフレームのスペクトルチルトが、第4のスペクトルチルトしきい値よりも大きくないことを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定し、前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満であること、前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つであること、ならびに、オーディオフレームのスペクトルチルト周波数が、第4のスペクトルチルト周波数しきい値よりも大きいことを判定した場合、第2の修正重みを決定するように構成され得る。

この実施形態では、オーディオにおける各オーディオフレームについて、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足することを判定した場合、電子デバイスは、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するか、または、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないことを判定した場合、電子デバイスは、第2の修正重みを決定し、電子デバイスは、決定された第1の修正重みもしくは決定された第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正し、修正されたオーディオフレームの線形予測パラメータに従って、オーディオフレームをコーディングする。このように、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足するか否かに従って、異なる修正重みが決定され、オーディオフレームの線形予測パラメータが修正され、これによって、オーディオフレーム間のスペクトルが、より安定になる。さらに、電子デバイスは、修正されたオーディオフレームの線形予測パラメータに従ってオーディオフレームをコーディングする。したがって、より広い帯域幅を有するオーディオは、ビットレートが不変のまま、または、ビットレートが僅かにしか変化せずにコーディングされることが保証され得る。

本発明の実施形態に従う第1のノードの構成図である図4を参照されたい。第1のノード400は、プロセッサ410、メモリ420、トランシーバ430、およびバス440を含む。

プロセッサ410、メモリ420、およびトランシーバ430は、バス440を使用することによって互いに接続され、バス440は、ISAバス、PCIバス、EISAバス等であり得る。バスは、アドレスバス、データバス、制御バス等へ分類され得る。表示の容易のために、図4におけるバスは、1つの太線のみを使用して表現されるが、これは、1つのみのバス、または、1つのタイプのみのバスしか存在しないことを示してない。

メモリ420は、プログラムを記憶するように構成される。特に、プログラムは、プログラムコードを含み得、プログラムコードは、コンピュータ操作命令を含む。メモリ420は、高速RAMメモリを含み得、さらに、少なくとも1つの磁気ディスクメモリのような不揮発性メモリ(non-volatile memory)を含み得る。

トランシーバ430は、他のデバイスを接続し、他のデバイスと通信するように構成される。

プロセッサ410は、プログラムコードを実行し、オーディオにおける各オーディオフレームについて、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足することを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するか、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないことを判定した場合、第2の修正重みを決定するように構成され、あらかじめ設定された修正条件は、オーディオフレームの信号特性が、このオーディオフレームの前のオーディオフレームの信号特性に類似していることを判定するために使用され、プロセッサ410はさらに、決定された第1の修正重みまたは決定された第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正し、修正されたオーディオフレームの線形予測パラメータに従って、オーディオフレームをコーディングするように構成される。

オプションで、プロセッサ410は特に、以下の式を使用することによって、オーディオフレームのLSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するように構成され得る。

オプションで、プロセッサ410は特に、第2の修正重みを1として決定するか、または、
第2の修正重みを、あらかじめ設定された修正重み値として決定するように構成され得、あらかじめ設定された修正重み値は、0よりも大きく、1以下である。

オプションで、プロセッサ410は特に、以下の式を使用することによって、第1の修正重みに従って、オーディオフレームの線形予測パラメータを修正するように構成され得る。
L[i]=(1-w[i])*L_old[i]+w[i]*L_new[i]、
ここで、w[i]は、第1の修正重みであり、L[i]は、修正されたオーディオフレームの線形予測パラメータであり、L_new[i]は、オーディオフレームの線形予測パラメータであり、L_old[i]は、このオーディオフレームの前のオーディオフレームの線形予測パラメータであり、iは、線形予測パラメータの次数であり、iの値は、0からM-1までの範囲にあり、Mは、線形予測パラメータの次数である。

オプションで、プロセッサ410は特に、以下の式を使用することによって、第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正するように構成され得る。
L[i]=(1-y)*L_old[i]+y*L_new[i]、
ここで、yは、第2の修正重みであり、L[i]は、修正されたオーディオフレームの線形予測パラメータであり、L_new[i]は、オーディオフレームの線形予測パラメータであり、L_old[i]は、このオーディオフレームの前のオーディオフレームの線形予測パラメータであり、iは、線形予測パラメータの次数であり、iの値は、0からM-1までの範囲にあり、Mは、線形予測パラメータの次数である。

オプションで、プロセッサ410は特に、オーディオにおける各オーディオフレームについて、オーディオフレームが、過渡的フレームではないことを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するか、または、オーディオフレームが、過渡的フレームであることを判定した場合、第2の修正重みを決定するように構成され得、過渡的フレームは、非摩擦音から摩擦音への過渡的フレーム、もしくは、摩擦音から非摩擦音への過渡的フレームを含む。

オプションで、プロセッサ410は特に、
オーディオにおける各オーディオフレームについて、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/もしくは、オーディオフレームのコーディングタイプが、過渡的ではないことを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定し、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいことと、オーディオフレームのコーディングタイプが過渡的であることとを判定した場合、第2の修正重みを決定するか、または、
オーディオにおける各オーディオフレームについて、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/もしくは、オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満ではないことを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定し、前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいことと、オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満であることとを判定した場合、第2の修正重みを決定するように構成され得る。

オプションで、プロセッサ410は特に、
オーディオにおける各オーディオフレームについて、前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満ではないこと、ならびに/または、前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つではないこと、ならびに/または、オーディオフレームのスペクトルチルトが、第4のスペクトルチルトしきい値よりも大きくないことを判定した場合、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定し、前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満であること、前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオのうちの1つであること、ならびに、オーディオフレームのスペクトルチルト周波数が、第4のスペクトルチルト周波数しきい値よりも大きいことを判定した場合、第2の修正重みを決定するように構成され得る。

この実施形態では、オーディオにおける各オーディオフレームについて、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足することを判定した場合、電子デバイスは、オーディオフレームの線形スペクトル周波数LSF差分と、前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定し、または、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないことを判定した場合、電子デバイスは、第2の修正重みを決定し、電子デバイスは、決定された第1の修正重みもしくは決定された第2の修正重みに従って、オーディオフレームの線形予測パラメータを修正し、修正されたオーディオフレームの線形予測パラメータに従って、オーディオフレームをコーディングする。このように、オーディオフレームの信号特性と、このオーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足するか否かに従って、異なる修正重みが決定され、オーディオフレームの線形予測パラメータが修正され、これによって、オーディオフレーム間のスペクトルが、より安定になる。さらに、電子デバイスは、修正されたオーディオフレームの線形予測パラメータに従ってオーディオフレームをコーディングする。したがって、より広い帯域幅を有するオーディオは、ビットレートが不変のまま、または、ビットレートが僅かにしか変化せずにコーディングされることが保証され得る。

当業者は、本発明の実施形態における技術は、必要な一般的なハードウェアプラットフォームに加えて、ソフトウェアによって実施され得ることを明確に理解し得る。そのような理解に基づいて、本発明の技術的解決策は本質的に、または、従来技術に寄与する部分は、ソフトウェア製品の形式で実施され得る。ソフトウェア製品は、ROM/RAM、ハードディスク、もしくは光ディスクのような記憶媒体に記憶され、実施形態において説明された方法、または、本発明の実施形態のいくつかの部分を実行するように(パーソナルコンピュータ、サーバ、もしくはネットワークデバイスであり得る)コンピュータデバイスに命令するためのいくつかの命令を含む。

本明細書では、これら実施形態は、進行的な方式で説明される。実施形態と同じまたは類似の部分について互いに参照がなされ得る。各実施形態は、他の実施形態からの相違に焦点を置く。特に、システム実施形態は、基本的に、方法実施形態に類似しており、したがって、簡潔に説明される。関連部分について、方法実施形態の一部における説明に対する参照がなされ得る。

前述した説明は、本発明の実施方式であるが、本発明の保護範囲を制限するように意図されていない。本発明の精神および原理から逸脱することなくなされる任意の修正、等価な置換、または改良も、本発明の保護範囲内にあるものとする。

300 装置
310 決定ユニット
320 修正ユニット
330 コーディングユニット
400 第1のノード
410 プロセッサ
420 メモリ
430 トランシーバ
440 バス

Claims

オーディオコーディング方法であって、
各オーディオフレームについて、前記オーディオフレームの信号特性と、前記オーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足することを判定した場合、前記オーディオフレームの線形スペクトル周波数LSF差分と、前記前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定し、または、前記オーディオフレームの信号特性と、前記前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないことを判定した場合、第2の修正重みを決定するステップであって、前記あらかじめ設定された修正条件は、前記オーディオフレームの前記信号特性が、前記前のオーディオフレームの前記信号特性に類似していることを判定するために使用される、決定するステップと、
前記決定された第1の修正重みまたは前記決定された第2の修正重みに従って、前記オーディオフレームの線形予測パラメータを修正するステップと、
修正された前記オーディオフレームの線形予測パラメータに従って、前記オーディオフレームをコーディングするステップと、
を備えるオーディオコーディング方法。
前記オーディオフレームの線形スペクトル周波数LSF差分と、前記前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するステップは、
以下の式を使用することによって、前記オーディオフレームの前記LSF差分と、前記前のオーディオフレームの前記LSF差分とに従って、前記第1の修正重みを決定するステップを備え、

ここで、w[i]は、前記第1の修正重みであり、lsf_new_diff[i]は、前記オーディオフレームの前記LSF差分であり、lsf_old_diff[i]は、前記前のオーディオフレームの前記LSF差分であり、iは、前記LSF差分の次数であり、iの値は、0からM-1までの範囲にあり、Mは、前記線形予測パラメータの次数である、請求項1に記載の方法。
前記第2の修正重みを決定するステップは、
前記第2の修正重みを、あらかじめ設定された修正重み値として決定するステップを備え、前記あらかじめ設定された修正重み値は、0よりも大きく、1以下である、請求項1または2に記載の方法。
前記決定された第1の修正重みに従って、前記オーディオフレームの線形予測パラメータを修正するステップは、
以下の式を使用することによって、前記第1の修正重みに従って、前記オーディオフレームの前記線形予測パラメータを修正するステップを備え、
L[i]=(1-w[i])*L_old[i]+w[i]*L_new[i]、
ここで、w[i]は、前記第1の修正重みであり、L[i]は、前記修正された前記オーディオフレームの線形予測パラメータであり、L_new[i]は、前記オーディオフレームの前記線形予測パラメータであり、L_old[i]は、前記前のオーディオフレームの線形予測パラメータであり、iは、前記線形予測パラメータの次数であり、前記iの値は、0からM-1までの範囲にあり、Mは、前記線形予測パラメータの前記次数である、請求項1から3のいずれか一項に記載の方法。
前記決定された第2の修正重みに従って、前記オーディオフレームの線形予測パラメータを修正するステップは、
以下の式を使用することによって、前記第2の修正重みに従って、前記オーディオフレームの前記線形予測パラメータを修正するステップを備え、
L[i]=(1-y)*L_old[i]+y*L_new[i]、
ここで、yは、前記第2の修正重みであり、L[i]は、前記修正された前記オーディオフレームの線形予測パラメータであり、L_new[i]は、前記オーディオフレームの前記線形予測パラメータであり、L_old[i]は、前記前のオーディオフレームの前記線形予測パラメータであり、iは、前記線形予測パラメータの前記次数であり、前記iの値は、0からM-1までの範囲にあり、Mは、前記線形予測パラメータの前記次数である、請求項1から4のいずれか一項に記載の方法。
前記オーディオフレームの信号特性と、前記前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足することを判定するステップは、前記オーディオフレームが、過渡的フレームではないことを判定するステップを備え、前記過渡的フレームは、非摩擦音から摩擦音への過渡的フレーム、または、摩擦音から非摩擦音への過渡的フレームを備え、
前記オーディオフレームの信号特性と、前記前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないことを判定するステップは、前記オーディオフレームが過渡的フレームであることを判定するステップを備える、請求項1から5のいずれか一項に記載の方法。
前記オーディオフレームが、摩擦音から非摩擦音への過渡的フレームであることを判定するステップは、前記前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいことと、前記オーディオフレームのコーディングタイプが過渡的であることとを判定するステップを備え、
前記オーディオフレームが、摩擦音から非摩擦音への過渡的フレームではないことを判定するステップは、前記前のオーディオフレームの前記スペクトルチルト周波数が、前記第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/または、前記オーディオフレームの前記コーディングタイプが過渡的ではないことを判定するステップを備える、請求項6に記載の方法。
前記オーディオフレームが、摩擦音から非摩擦音への過渡的フレームであることを判定するステップは、前記前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいことと、前記オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満であることとを判定するステップを備え、
前記オーディオフレームが、摩擦音から非摩擦音への過渡的フレームではないことを判定するステップは、前記前のオーディオフレームの前記スペクトルチルト周波数が、前記第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/または、前記オーディオフレームの前記スペクトルチルト周波数が、前記第2のスペクトルチルト周波数しきい値未満ではないことを判定するステップを備える、請求項6に記載の方法。
前記オーディオフレームが、非摩擦音から摩擦音への過渡的フレームであることを判定するステップは、前記前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満であることと、前記前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つであることと、前記オーディオフレームのスペクトルチルト周波数が、第4のスペクトルチルト周波数しきい値よりも大きいこととを判定するステップを備え、
前記オーディオフレームが、非摩擦音から摩擦音への過渡的フレームではないことを判定するステップは、前記前のオーディオフレームのスペクトルチルト周波数が、前記第3のスペクトルチルト周波数しきい値未満ではないこと、ならびに/または、前記前のオーディオフレームの前記コーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つではないこと、ならびに/または、前記オーディオフレームの前記スペクトルチルト周波数が、前記第4のスペクトルチルト周波数しきい値よりも大きくないことを判定するステップを備える、請求項6に記載の方法。
前記オーディオフレームが、摩擦音から非摩擦音への過渡的フレームであることを判定するステップは、前記前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいことと、前記オーディオフレームのコーディングタイプが過渡的であることとを判定するステップを備える、請求項6に記載の方法。
前記オーディオフレームが、摩擦音から非摩擦音への過渡的フレームであることを判定するステップは、前記前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きいことと、前記オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満であることとを判定するステップを備える、請求項6に記載の方法。
前記オーディオフレームが、非摩擦音から摩擦音への過渡的フレームであることを判定するステップは、前記前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満であることと、前記前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つであることと、前記オーディオフレームのスペクトルチルト周波数が、第4のスペクトルチルト周波数しきい値よりも大きいこととを判定するステップを備える、請求項6に記載の方法。
オーディオコーディング装置であって、決定ユニット、修正ユニット、およびコーディングユニットを備え、
前記決定ユニットは、各オーディオフレームについて、前記オーディオフレームの信号特性と、前記オーディオフレームの前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足することを判定した場合、前記オーディオフレームの線形スペクトル周波数LSF差分と、前記前のオーディオフレームのLSF差分とに従って、第1の修正重みを決定するか、または、前記オーディオフレームの信号特性と、前のオーディオフレームの信号特性とが、あらかじめ設定された修正条件を満足しないことを判定した場合、第2の修正重みを決定するように構成され、前記あらかじめ設定された修正条件は、前記オーディオフレームの前記信号特性が、前記前のオーディオフレームの前記信号特性に類似していることを判定するために使用され、
前記修正ユニットは、前記決定ユニットによって決定された前記第1の修正重みまたは前記第2の修正重みに従って、前記オーディオフレームの線形予測パラメータを修正するように構成され、
前記コーディングユニットは、修正された前記オーディオフレームの線形予測パラメータに従って、前記オーディオフレームをコーディングするように構成され、前記修正された線形予測パラメータは、前記修正ユニットによる修正後に取得される、オーディオコーディング装置。
前記決定ユニットは特に、以下の式を使用することによって、前記オーディオフレームの前記LSF差分と、前記前のオーディオフレームの前記LSF差分とに従って、前記第1の修正重みを決定するように構成され、

ここで、w[i]は、前記第1の修正重みであり、lsf_new_diff[i]は、前記オーディオフレームの前記LSF差分であり、lsf_old_diff[i]は、前記前のオーディオフレームの前記LSF差分であり、iは、前記LSF差分の次数であり、iの値は、0からM-1までの範囲にあり、Mは、前記線形予測パラメータの次数である、請求項13に記載の装置。
前記決定ユニットは特に、前記第2の修正重みを、あらかじめ設定された修正重み値として決定するように構成され、前記あらかじめ設定された修正重み値は、0よりも大きく、1以下である、請求項13または14に記載の装置。
前記修正ユニットは特に、以下の式を使用することによって、前記第1の修正重みに従って、前記オーディオフレームの前記線形予測パラメータを修正するように構成され、
L[i]=(1-w[i])*L_old[i]+w[i]*L_new[i]、
ここで、w[i]は、前記第1の修正重みであり、L[i]は、前記修正された前記オーディオフレームの線形予測パラメータであり、L_new[i]は、前記オーディオフレームの前記線形予測パラメータであり、L_old[i]は、前記前のオーディオフレームの線形予測パラメータであり、iは、前記線形予測パラメータの次数であり、前記iの値は、0からM-1までの範囲にあり、Mは、前記線形予測パラメータの前記次数である、請求項13または14に記載の装置。
前記修正ユニットは特に、以下の式を使用することによって、前記第2の修正重みに従って、前記オーディオフレームの前記線形予測パラメータを修正するように構成され、
L[i]=(1-y)*L_old[i]+y*L_new[i]、
ここで、yは、前記第2の修正重みであり、L[i]は、前記修正された前記オーディオフレームの線形予測パラメータであり、L_new[i]は、前記オーディオフレームの前記線形予測パラメータであり、L_old[i]は、前記前のオーディオフレームの前記線形予測パラメータであり、iは、前記線形予測パラメータの前記次数であり、前記iの値は、0からM-1までの範囲にあり、Mは、前記線形予測パラメータの前記次数である、請求項13から16のいずれか一項に記載の装置。
前記決定ユニットは特に、各オーディオフレームについて、前記オーディオフレームが、過渡的フレームではないことを判定した場合、前記オーディオフレームの前記線形スペクトル周波数LSF差分と、前記前のオーディオフレームの前記LSF差分とに従って、前記第1の修正重みを決定し、前記オーディオフレームが、過渡的フレームであることを判定した場合、前記第2の修正重みを決定するように構成され、前記過渡的フレームは、非摩擦音から摩擦音への過渡的フレーム、または、摩擦音から非摩擦音への過渡的フレームを備える、請求項13から17のいずれか一項に記載の装置。
前記決定ユニットは特に、
各オーディオフレームについて、前記前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/または、前記オーディオフレームのコーディングタイプが、過渡的ではないことを判定した場合、前記オーディオフレームの前記線形スペクトル周波数LSF差分と、前記前のオーディオフレームの前記LSF差分とに従って、前記第1の修正重みを決定し、前記前のオーディオフレームの前記スペクトルチルト周波数が、前記第1のスペクトルチルト周波数しきい値よりも大きいことと、前記オーディオフレームの前記コーディングタイプが過渡的であることとを判定した場合、前記第2の修正重みを決定するように構成された、請求項18に記載の装置。
前記決定ユニットは特に、
各オーディオフレームについて、前記前のオーディオフレームのスペクトルチルト周波数が、第1のスペクトルチルト周波数しきい値よりも大きくないこと、および/または、前記オーディオフレームのスペクトルチルト周波数が、第2のスペクトルチルト周波数しきい値未満ではないことを判定した場合、前記オーディオフレームの前記線形スペクトル周波数LSF差分と、前記前のオーディオフレームの前記LSF差分とに従って、前記第1の修正重みを決定し、前記前のオーディオフレームの前記スペクトルチルト周波数が、前記第1のスペクトルチルト周波数しきい値よりも大きいことと、前記オーディオフレームの前記スペクトルチルト周波数が、前記第2のスペクトルチルト周波数しきい値未満であることとを判定した場合、前記第2の修正重みを決定するように構成された、請求項18に記載の装置。
前記決定ユニットは特に、
各オーディオフレームについて、前記前のオーディオフレームのスペクトルチルト周波数が、第3のスペクトルチルト周波数しきい値未満ではないこと、ならびに/または、前記前のオーディオフレームのコーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つではないこと、ならびに/または、前記オーディオフレームのスペクトルチルトが、第4のスペクトルチルトしきい値よりも大きくないことを判定した場合、前記オーディオフレームの前記線形スペクトル周波数LSF差分および前記前のオーディオフレームの前記LSF差分に従って、前記第1の修正重みを決定し、前記前のオーディオフレームの前記スペクトルチルト周波数が、前記第3のスペクトルチルト周波数しきい値未満であること、前記前のオーディオフレームの前記コーディングタイプが、有声、一般的、過渡的、およびオーディオの4つのタイプのうちの1つであること、ならびに、前記オーディオフレームの前記スペクトルチルト周波数が、前記第4のスペクトルチルト周波数しきい値よりも大きいことを判定した場合、前記第2の修正重みを決定するように構成された、請求項18に記載の装置。
請求項1から12のいずれか一項に記載の方法を実行するように作成されたプログラムが記録されているコンピュータ読取可能な媒体。