JP5400963B2

JP5400963B2 - 修正離散コサイン変換ドメインのオーディオフレーム損失補償器及び補償方法

Info

Publication number: JP5400963B2
Application number: JP2012519872A
Authority: JP
Inventors: 呉鳴; 林志斌; 彭科; ▲トウ▼崢; 蘆晶; 邱小軍; 黎家力; 陳国明; 袁浩; 劉開文
Original assignee: ZTE Corp
Current assignee: ZTE Corp
Priority date: 2009-07-16
Filing date: 2010-02-25
Publication date: 2014-01-29
Anticipated expiration: 2030-02-25
Also published as: BR112012000871A2; CN101958119B; EP2442304A1; EP2442304B1; CN101958119A; US8731910B2; JP2012533094A; WO2011006369A1; RU2488899C1; EP2442304A4; US20120109659A1; HK1165076A1

Description

本発明はオーディオ復号分野に関し、具体的に無遅延、低複雑さのMDCT (Modified Discrete Cosine Transform、修正離散コサイン変換)ドメインのオーディオフレーム損失補償器及び補償方法に関する。

ネットワーク通信において、パケット技術が十分に幅広くアプリケーションされ、各種の形式の情報、例えば音声或いはオーディオ等のデータは符号化された後、パケット技術を採用してネットワークにおいて伝送し、例えばVoIP（ネットワーク電話）等である。情報送信側の送信容量が制限され、または予定遅延時間内にパケット情報フレームが受信側バッファエリアに到達しなく、またはネットワークの輻輳等による音声オーディオフレーム情報が損失し、復号側に合成音声オーディオの品質が急激に低下することを引き起こすため、いくつかの技術を採用してフレーム損失のデータを補償する必要がある。フレーム損失補償器はフレーム損失による音声オーディオ品質の下降の現象を軽減する技術である。従来、フレーム損失の補償の技術が多いが、これらのフレーム損失の補償技術における大部分が音声のフレーム損失補償だけに適用し、オーディオのフレーム損失補償に対して関連の技術が少ない。

従来のオーディオフレーム損失補償方法は最も簡単であるのは前のフレームのMDCT信号を繰り返し或いはミュート静音の代替の方法を採用し、該方法は簡単で且つ遅延がないが、補償効果が著しくなく、他の補償方式、例えばGAPES（ギャップデータ振幅位相の推定技術）はMDCT係数をDSTFT（Discrete Short-Time Fourier Transform、離散短時間フーリエ変換）係数に転化し、該方法の演算の複雑さが高く、メモリの消耗が多く、3GPPはノイズシェーピング挿入技術を採用してオーディオフレーム損失補償を行い、該方法の擬似雑音信号の補償効果がよく、マルチ高調波オーディオ信号への補償効果が極めて悪い。

以上のように、開示されたオーディオフレーム損失補償技術の大部分の効果が著しくなくまたは演算の複雑さが高く且つ遅延時間が長い。

本発明は補償効果がよく、複雑さが低く且つ無遅延であるMDCTドメインオーディオフレーム損失補償器及び補償方法を提供することを解決しようとする技術問題とする。

上述問題を解決するために、本発明は修正離散コサイン変換ドメインのオーディオフレーム損失補償方法であって、
現在損失フレームが第pフレームである際に、予測される予測待ちの周波数点集合を取得し、前記予測待ちの周波数点集合におけるそれぞれの周波数点に対して第p-1フレームの前の複数のフレームにおける修正離散コサイン変換−修正離散サイン変換MDCT-MDSTドメインでの位相と振幅を用いて予測し、第pフレームにおけるMDCT-MDSTドメインでの位相と振幅を取り得て、予測して得た前記第pフレームにおけるMDCT-MDSTドメインでの位相と振幅を用いて第pフレームにおける前記それぞれの周波数点での修正離散コサイン変換ドメインMDCT係数を取り得て、ここで、前記第p-1フレームが第pフレームの前の1つのフレームであるステップaと、
1つのフレーム内における前記予測待ちの周波数点集合の以外の周波数点に対して、第pフレームの前の複数のフレームのMDCT係数値を用いて第pフレームにおける該周波数点でのMDCT係数値を計算するステップbと、
第pフレームのすべての周波数点でのMDCT係数を修正離散コサイン逆変換IMDCTを行い、第pフレームの時間領域信号を取り得るステップcとを含む。

前記の方法はさらに、前記ステップaの前に、現在フレームが損失することを検出する際に、現在損失フレームのタイプを判断し、現在損失フレームがマルチ高調波フレームであると、ステップaを実行することをさらに含む特徴を備えてもよい。

前記の方法はさらに、前記該現在損失フレームのタイプを判断するステップは、
現在損失フレームの前のKフレームの毎フレームのスペクトラムフラットネスを計算し、該Kフレームにおいて、スペクトラムフラットネスがあるしきい値より小さいフレームの個数がK₀より小さいまたはそれに等しいと、現在損失フレームが非マルチ高調波フレームであり、スペクトラムフラットネスが該しきい値より小さいフレームの個数がK₀より大きいと、現在損失フレームがマルチ高調波フレームであり、ここで、K₀<=K、K₀、Kが自然数であることを含む特徴を備えてもよい。

前記の方法はさらに、前記ステップaにおいて、前記予測待ちの周波数点集合を取得する際に、第pフレームの前の複数のフレームのMDCT-MDSTドメイン複素数信号及び/またはMDCT係数を用いて前記予測待ちの周波数点集合S_Cを取得し、或いは、直接に1つのフレーム内のすべての周波数点を前記予測待ちの周波数点集合S_Cに入れることを含む特徴を備えてもよい。

前記の方法はさらに、第pフレームの前の複数のフレームのMDCT-MDSTドメイン複素数信号及び/またはMDCT係数を用いて前記予測待ちの周波数点集合S_Cを取得することは、具体的に、
前記第pフレームの前の複数のフレームをL1フレームとし、前記L1フレームにおいて各周波数点のパワーを計算し、該L1フレームにおいて各フレームのピーク周波数点からなるL1個の集合S₁,…,S_L1を取得し、各集合における対応の周波数点数がN₁,…,N_L1であることと、
前記L1個の集合S₁,…,S_L1から1つの集合S_iを選択し、S_iにおけるそれぞれのピーク周波数点 m_jに対して、j=1…N_i、m_j, m_j±1,…,m_j±kにおいて同時に他のすべてのピーク周波数点集合に属する周波数点が存在するかどうかを判断し、存在すると、m_j, m_j±1,…,m_j±kをいずれも周波数点集合S_Cに入れることと、
S_iにおけるそれぞれのピーク周波数点m_jに対して、j=1…N_i、m_j, m_j±1,…,m_j±kにおいて同時に他のすべてのピーク周波数点集合に属する周波数点がないと、直接に1つのフレーム内のすべての周波数点をいずれも周波数点集合S_Cに入れることとを含み、
ここで、前記kが非負の整数である特徴を備えてもよい。

前記の方法はさらに、前記ピーク周波数点とはパワーがそれと隣接する2つの周波数点でのパワーより大きい周波数点である特徴を備えてもよい。

前記の方法はさらに、前記L1フレームには第p-1フレームを含む際に、第p-1フレームにおける各周波数点のパワーは次のように計算し、

、ここで、

は第p-1フレームにおける周波数点mでのパワーであり、c^p-1(m)は第p-1フレームにおける周波数点mでのMDCT係数であり、c^p-1(m+1)は第p-1フレームにおける周波数点m＋1でのMDCT係数であり、c^p-1(m-1)は第p-1フレームにおける周波数点m−1でのMDCT係数である特徴を備えてもよい。

前記の方法はさらに、前記ステップaにおいて、前記の第pフレームにおけるMDCT-MDSTドメインでの位相と振幅を予測して得るステップは、予測待ちの周波数点に対して、第p-1フレームの前のL2フレームにおける該周波数点のMDCT-MDSTドメインでの位相を用いて線形外挿または線形フィットを行い、第pフレームにおける該周波数点のMDCT-MDSTドメインでの位相を取り得ることと、該L2フレームにおいて1つのフレームにおける該周波数点でのMDCT-MDSTドメインの振幅から第pフレームにおける該周波数点でのMDCT-MDSTドメインの振幅を取り得て、ここで、L2>1であることを含む特徴を備えてもよい。

前記の方法はさらに、L2＝2である際に、第t1フレーム、第t2フレームでこのフレームをそれぞれ表し、次のように第pフレームのMDCT-MDSTドメインの位相を予測し、予測待ちの周波数点mに対して、

、前記

は第pフレームにおける周波数点mのMDCT-MDSTドメインでの位相の予測値であり、前記

は第t1フレームにおける周波数点mのMDCT-MDSTドメインでの位相であり、前記

は第t2フレームにおける周波数点mのMDCT-MDSTドメインでの位相である特徴を備えてもよい。

前記の方法はさらに、L2>2である際に、予測待ちの周波数点に対して、選択した該L2フレームにおける該周波数点のMDCT-MDSTドメインでの位相に線形フィットを行い、第pフレームにおける該周波数点のMDCT-MDSTドメインでの位相を取り得る特徴を備えてもよい。

前記の方法はさらに、前記ステップaにおいて、第p-2フレーム、第p-3フレームのMDCT-MDSTドメイン複素数信号と第p-1フレームのMDCT係数を用いて予測待ちの周波数点集合を取得し、該周波数点集合におけるそれぞれの周波数点に対して、第p-2フレーム、第p-3フレームにおけるMDCT-MDSTドメインでの位相と振幅を用いて予測し、第pフレームにおけるMDCT-MDSTドメインでの位相と振幅を取り得る特徴を備えてもよい。

前記の方法はさらに、前記ステップbにおいて、第p-1フレームのMDCT係数値の半分を採用して第pフレームのMDCT係数値とする特徴を備えてもよい。

本発明はさらに、修正離散コサイン変換ドメインのオーディオフレーム損失補償器であって、前記フレーム損失補償器はマルチ高調波フレーム損失補償モジュール、第2補償モジュール及びIMDCTモジュールを備え、ここで、
前記マルチ高調波フレーム損失補償モジュールは、現在損失フレームが第pフレームである際に、予測待ちの周波数点集合を取得し、前記予測待ちの周波数点集合におけるそれぞれの周波数点に対して、第p-1フレームの前の複数のフレームにおけるMDCT-MDSTドメインでの位相と振幅を用いて予測し、第pフレームにおけるMDCT-MDSTドメインでの位相と振幅を取り得て、前記予測して得た第pフレームにおけるMDCT-MDSTドメインでの位相と振幅を用いて第pフレームにおける前記それぞれの周波数点でのMDCT係数を取り得て、該MDCT係数を第2補償モジュールに送信し、前記第p-1フレームが第pフレームの前1つのフレームであるように設置され、
前記第2補償モジュールは、1つのフレーム内における前記予測待ちの周波数点集合の以外の周波数点に対して、第pフレームの前の複数のフレームのMDCT係数値を用いて第pフレームにおける該周波数点でのMDCT係数値を計算し、第pフレームのすべての周波数点でのMDCT係数をIMDCTモジュールに送信するように設置され、
前記IMDCTモジュールは、第pフレームのすべての周波数点でのMDCT係数をIMDCT変換を行い、第pフレームの時間領域信号を取り得るように設置される。

上述フレーム損失補償器はさらに、前記フレーム損失補償器はフレームタイプ検出モジュールをさらに含み、ここで、
前記フレームタイプ検出モジュールは、損失フレームを検出する際に、現在損失フレームのタイプを判断し、マルチ高調波フレームであると、前記マルチ高調波フレーム損失補償モジュールを指示して補償するように設置される特徴を備えてもよい。

前記フレーム損失補償器は、前記フレームタイプ検出モジュールが、次のように現在損失フレームのタイプを判断し、現在損失フレームの前のKフレームの毎フレームのスペクトラムフラットネスを計算し、該Kフレームにおいて、スペクトラムフラットネスがあるしきい値より小さいフレームの個数がK₀より小さいまたはそれと等しいと、現在損失フレームが非マルチ高調波フレームであり、スペクトラムフラットネスが該しきい値より小さいフレームの個数がK₀より大きいと、現在損失フレームがマルチ高調波フレームであり、ここで、K₀<=K、K₀、Kが自然数であるように設置される特徴を備えてもよい。

前記フレーム損失補償器は、前記マルチ高調波フレーム損失補償モジュールは周波数点集合生成ユニットを含み、前記マルチ高調波フレーム損失補償モジュールは、前記周波数点集合生成ユニットが第pフレームの前の複数のフレームのMDCT-MDSTドメイン複素数信号及び/またはMDCT係数を用いることによって予測待ちの周波数点集合S_Cを取得し、或いは、直接に1つのフレーム内のすべての周波数点を前記予測待ちの周波数点集合S_Cに入れるように設置される特徴を備えてもよい。

前記フレーム損失補償器は、
前記周波数点集合生成ユニットは、次のように第pフレームの前の複数のフレームのMDCT-MDSTドメイン複素数信号及び/またはMDCT係数を用いて予測待ちの周波数点集合S_Cを取得し、
前記第pフレームの前の複数のフレームをL1フレームとし、前記L1フレームにおいて各周波数点のパワーを計算し、該L1フレームにおいて各フレームのピーク周波数点からなるL1個の集合S₁,…,S_L1を取得し、各集合における対応の周波数点数がそれぞれN₁,…,N_L1であり、
前記L1個の集合S₁,…,S_L1から1つの集合S_iを選択し、S_iにおけるそれぞれのピーク周波数点m_jに対して、j=1…N_i、m_j, m_j±1,…,m_j±kにおいて同時に他のすべてのピーク周波数点集合に属する周波数点が存在するかどうかを判断し、存在すると、m_j, m_j±1,…,m_j±kをいずれも周波数点集合S_Cに入れ、
S_iにおけるそれぞれのピーク周波数点m_jに対して、j=1…N_i、m_j, m_j±1,…,m_j±kにおいて同時に他のすべてのピーク周波数点集合に属する周波数点がないと、直接に1つのフレーム内のすべての周波数点をいずれも周波数点集合S_Cに入れ、ここで、kが非負の整数であるように設置される特徴を備えてもよい。

前記フレーム損失補償器は、前記ピーク周波数点とはパワーがそれと隣接する2つの周波数点でのパワーより大きい周波数点である特徴を備えてもよい。

前記フレーム損失補償器は、前記周波数点集合生成ユニットが、前記L1フレームには第p-1フレームを含む際に、第p-1フレームにおける各周波数点のパワーは次のように計算し、

、ここで、

は第p-1フレームにおける周波数点mでのパワーであり、c^p-1(m)は第p-1フレームにおける周波数点mでのMDCT係数であり、c^p-1(m+1)は第p-1フレームにおける周波数点m＋1でのMDCT係数であり、c^p-1(m-1)は第p-1フレームにおける周波数点m−1でのMDCT係数であるように設置される特徴を備えてもよい。

前記フレーム損失補償器は、
前記マルチ高調波フレーム損失補償モジュールは係数生成ユニットをさらに含み、前記マルチ高調波フレーム損失補償モジュールは、前記係数生成ユニットが第p-1フレームの前のL2フレームにおけるMDCT-MDSTドメインでの位相と振幅を用いることによって予測し、第pフレームにおいて前記予測待ちの周波数点集合に属する各周波数点の位相と振幅を取り得て、予測して得た第pフレームの位相と振幅を用いて第pフレームにおける対応の前記それぞれの周波数点でのMDCT係数のMDCT係数を取り得て、該MDCT係数を第2補償モジュールに送信し、ここで、L2>1であるように設置され、
前記係数生成ユニットは位相予測サブユニットと振幅予測サブユニットを含み、ここで、
前記位相予測サブユニットは、予測待ちの周波数点に対して、選択した該L2フレームにおける該周波数点のMDCT-MDSTドメインでの位相を用いて線形外挿または線形フィットを行い、第pフレームにおける該周波数点のMDCT-MDSTドメインでの位相を取り得るように設置され、
前記振幅予測サブユニットは、該L2フレームにおける1つのフレームにおける該周波数点でのMDCT-MDSTドメインの振幅から第pフレームにおける該周波数点でのMDCT-MDSTドメインの振幅を取り得るように設置される特徴を備えてもよい。

前記フレーム損失補償器は、前記位相予測サブユニットが、L2＝2である際に、次のように第pフレームのMDCT-MDSTドメインの位相を予測し、予測待ちの周波数点mに対して、

、ここで、第t1フレーム、第t2フレームは第p-1フレームの前の2つのフレームをそれぞれ表し、前記

は第t2フレームにおける周波数点mのMDCT-MDSTドメインでの位相であるように設置される特徴を備えてもよい。

前記フレーム損失補償器は、前記位相予測サブユニットが、L2>2である際に、次のように第pフレームのMDCT-MDSTドメインの位相を予測し、予測待ちの周波数点に対して、選択した該L2フレームにおける該周波数点のMDCT-MDSTドメインでの位相に線形フィットを行い、第pフレームにおける該周波数点のMDCT-MDSTドメインでの位相を取り得るように設置される特徴を備えてもよい。

前記フレーム損失補償器は、前記マルチ高調波フレーム損失補償モジュールが、第p-2フレーム、第p-3フレームのMDCT-MDSTドメイン複素数信号と第p-1フレームのMDCT係数を用いて予測待ちの周波数点集合を取得し、該周波数点集合におけるそれぞれの周波数点に対して、第p-2フレーム、第p-3フレームにおけるMDCT-MDSTドメインでの位相と振幅予測を用いて第pフレームにおけるMDCT-MDSTドメインでの位相と振幅を取り得るように設置される特徴を備えてもよい。

前記フレーム損失補償器は、前記第2補償モジュールが、第p-1フレームのMDCT係数値の半分を採用して第pフレームにおける前記予測待ちの周波数点集合の以外の周波数点のMDCT係数値とするように設置される特徴を備えてもよい。

本発明が提出するMDCTドメインオーディオフレーム損失補償器及び補償方法は、非マルチ高調波フレームに対して、現在損失フレーム的MDCT係数がその前の複数のフレームのMDCT係数値を用いて計算して得られ、マルチ高調波フレームに対して、それがMDCT-MDSTドメインでの特性を利用して現在損失フレームのMDCT係数を取り得る。従来技術に対して、本発明が無遅延、計算量メモリ量が小さく、実現しやすい等のメリットを有する。

本発明におけるフレーム順序模式図である。本発明におけるMDCTドメインのオーディオフレーム損失補償方法のフローチャートである。本発明におけるマルチ高調波/非マルチ高調波フレームの判断フローチャートである。本発明におけるマルチ高調波フレームのフレーム損失補償方法のフローチャートである。本発明の実施例1におけるマルチ高調波フレーム損失補償MDCT係数の計算方法のフローチャートである。本発明におけるMDCTドメインのオーディオフレーム損失補償器ブロック図である。本発明のほかの実施例におけるMDCTドメインのオーディオフレーム損失補償器のブロック図である。本発明のまた他の実施例におけるMDCTドメインのオーディオフレーム損失補償器のブロック図である。

本発明は、高調波信号がMDCT-MDSTドメインでの位相が線形を呈する特徴を利用し、現在損失フレームの前の複数のフレームの情報を用いて予測し、現在損失フレームのMDCT-MDSTドメインの位相と振幅を取り得て、さらに、現在損失フレームのMDCT係数を取り得て、現在損失フレームのMDCT係数によって現在損失フレームの時間領域信号を取り得る主な思想とする。

本発明はMDCTドメインのオーディオフレーム損失補償方法を提案し、図2に示すように、以下のステップを含む。

ステップS1、復号側に現在フレームのデータパケットが損失することを発見すると、該現在フレームを現在損失フレームと称し、該現在損失フレームのタイプを判断し、現在損失フレームが非マルチ高調波フレームであると、ステップS2を実行し、ではないと、ステップS3を実行し、
ここで、該現在損失フレームのタイプを判断するには現在損失フレームの前のKフレームのMDCT係数によって判断し、図3に示すように、
1a)現在損失フレームの前のKフレームにおけるそれぞれのフレームに対して、該フレームのスペクトラムフラットネスを計算し、そのスペクトラムフラットネスが1つの予め設置したしきいより小さい際に、該フレームが主にマルチ高調波からなり、マルチ高調波定常状態信号フレームであると考えることと、
1b) 上記前のKフレームにおいてマルチ高調波定常状態信号フレームの数目がK₀フレームより小さいまたはそれと等しいと、現在損失フレームが非マルチ高調波フレームであり、ないと、マルチ高調波フレーム（例えば音楽フレーム）であると考え、ここで、K₀<=K 、K₀、Kが予め設置された値であることを含む。

本発明は、現在損失フレームのタイプを判断するには図3に示すような方法に限られなく、他の方法によって判断してもよく、例えば、ゼロ交差レートによって判断し、本発明がこれに限られない。

ステップS2、現在損失フレームが非マルチ高調波フレームであると判断し、1つのフレーム内のすべての周波数点に対して、現在損失フレームの前の複数のフレームのMDCT係数値を用いて現在損失フレームのMDCT係数値を計算し、次に、ステップS4を実行する。

例えば、現在損失フレームの1つ前のフレームのMDCT係数値の半分または他の割合を採用して現在損失フレームのMDCT係数値とする。

ステップS3、現在損失フレームがマルチ高調波フレームであると判断し、無遅延マルチ高調波フレーム損失補償アルゴリズムで推定して現在損失フレームのMDCT係数を取り得て、図4に示すように、具体的に、
3a）第pフレームのデータパケットが損失すると、即ち現在損失フレームが第pフレームであり、第pフレームの前にL1フレームを取ることを含む。

該L1フレームにおいて第p-1フレームを含む際に、現在損失フレームの前フレームにおいて復号して得たMDCT係数によって、FMDST (Fast Modified Discrete Sine Transform、高速修正離散サイン変換)アルゴリズムで該L1フレームにおいて第p-1フレームの以外のL1-1フレームのMDST（Modified Discrete Sine Transform、修正離散サイン変換）係数を取り得る。該L1-1フレームにおけるそれぞれのフレームに対して、毎フレームのMDST係数とMDCT係数を該フレームのMDCT-MDSTドメイン複素数信号に組成し、ここで、MDCT係数が実部パラメータであり、MDST係数が虚部パラメータである。

該L1フレームには第p-1フレームを含まない際に、現在損失フレームの前フレームにおいて復号して得たMDCT係数によって、FMDSTアルゴリズムで該L1フレームのMDST係数を取り得て、該L1フレームにおけるそれぞれのフレームに対して、毎フレームのMDST係数とMDCT係数を該フレームのMDCT-MDSTドメイン複素数信号に組成し、ここで、MDCT係数が実部パラメータであり、MDST係数が虚部パラメータである。

ここで、MDST係数を計算する方法は次の通りである。

第p-1フレームと第p-2フレームのMDCT係数によって逆MDCT変換して第p-2フレームの時間領域信号を取り得て、第p-2フレームと第p-3フレームのMDCT係数によって逆MDCT変換して第p-3フレームの時間領域信号を取り得て、以上の通りであり、
第p-2フレームと第p-3フレームの時間領域信号によってFMDSTアルゴリズムで第p-2フレームのMDST係数を取り得て、第p-3フレームと第p-4フレームの時間領域信号によってFMDSTアルゴリズムで第p-3フレームのMDST係数を取り得て、以上の通りである。

ここで、第pフレーム、第p-1フレーム等の各フレームの順序は図1に示す。

3b）上記L1フレームに対して毎フレームのピーク周波数点集合を求める。

このL1フレームには第p-1フレームを含むと、
第p-1フレームに対して、第p-1フレームのMDCT係数によって第p-1フレームにおいて各周波数点的パワーを計算し、該フレームにおいてパワーが最大である前の複数のピーク周波数点からなる集合を取得し、
第p-1フレームの以外のそれぞれのフレームに対して、該フレームのMDCT-MDSTドメイン複素数信号によって該フレームにおいて各周波数点のパワーを計算し、該フレームにおいてパワーが最大である前の複数のピーク周波数点からなる集合を取得し、ここで、ピーク周波数点とはパワーがそれと隣接する2つの周波数点でのパワーより大きい周波数点である。

このL1フレームには第p-1フレームを含まないと、
該L1フレームにおけるそれぞれのフレームに対して、いずれもそのMDCT-MDSTドメイン複素数信号によって該フレームにおいてパワーが最大である前の複数のピーク周波数点からなる集合を取得する。

このL1個の集合における周波数点数が同様でまたは異なってもよい。

他の方式でこのL1個の集合を取得しても良く、例えば、それぞれのフレームに対して直接にパワーが1つの設定された閾値より大きいピーク周波数点からなる集合を取って、それぞれのフレームが取った閾値は同様でまたは異なってもよい。

3c）L1>1であると、仮にこのL1個の周波数点集合がS₁,…,S_L1と言われ、集合における対応の周波数点数がN₁,…,N_L1であると、1つの集合S_iを選択し、S_iにおけるそれぞれのピーク周波数点m_jに対して、（j=1…N_i）、m_j, m_j±1,…,m_j±k（kが非負の整数であり、普通にk＝0または1を取る）において同時に他のすべてのピーク周波数点集合に属する周波数点が存在するかどうかを判断し、存在すると、m_j, m_j±1,…,m_j±kをいずれも周波数点集合S_Cに入れることと、
S_iにおけるそれぞれのピーク周波数点m_jに対して、（j=1…N_i）、m_j, m_j±1,…,m_j±kにおいて同時に他のすべてのピーク周波数点集合に属する周波数点がないと、直接に1つのフレーム内のすべての周波数点をいずれも周波数点集合S_Cに入れる。

L1＝1であると、仮にこの周波数点集合がS₁と言われ、その対応の周波数点数がN₁であり、ピーク周波数点集合S₁におけるそれぞれのピーク周波数点 m_i（i=1…N₁）に対して、m_i, m_i±1,…,m_i±k kが非負の整数であり、普通にk＝0または1を取る）をいずれも周波数点集合S_Cに入れる。

ステップ3a、3b及びステップ3cの以上部分を実行しなくてもよく、直接に1つのフレーム内のすべての周波数点をいずれも周波数点集合S_Cに入れる。

3d）第p-1フレームの前にL2（L2>1）フレームを取って、該L2フレームを取り得るMDCT-MDSTドメイン複素数信号（具体的な計算方法はステップ3aにおける方法と同様である）を計算する。周波数点集合SCにおけるそれぞれの周波数点に対して、該L2フレームにおけるMDCT-MDSTドメインでの位相を用いて予測し、現在損失フレームにおけるMDCT-MDSTドメインでの位相を取り得て、該L2フレームにおけるMDCT-MDSTドメインでの振幅を用いて予測し、現在損失フレームにおけるMDCT-MDSTドメインでの振幅を取り得て、現在損失フレームの位相と振幅によってさらに現在損失フレームにおける対応の上記それぞれの周波数点でのMDCT係数を取り得る。

L2＝2であると、周波数点集合S_Cにおけるすべての周波数点に対して、それぞれの予測される予測待ちの周波数点を選択したこの2つのフレームにおける該周波数点での位相を用いて線形外挿し、現在損失フレームにおける該周波数点でのMDCT-MDSTドメイン複素数信号位相を取り得て、この2つのフレームにおいて1つのフレームにおける該周波数点でのMDCT-MDSTドメインの振幅から現在損失フレームにおける該周波数点でのMDCT-MDSTドメイン複素数信号の振幅を取り得て、即ち該2つのフレームにおいて1つのフレームにおける該周波数点でのMDCT-MDSTドメインの振幅を現在損失フレームにおける該周波数点でのMDCT-MDSTドメインの振幅とする。

線形外挿の1つの方法は次の通りである。

L2＝2である際に、第t1フレーム、第t2フレームでこの2つのフレームをそれぞれ表し、次のように第pフレームのMDCT-MDSTドメインの位相を予測し、予測される予測待ちの周波数点mに対して、

、上記

は第pフレームにおける周波数点mのMDCT-MDSTドメインでの位相の予測値であり、上記

は第t2フレームにおける周波数点mのMDCT-MDSTドメインでの位相である。

L2>2であると、集合S_Cにおけるすべての周波数点に対して、それぞれの予測待ちの周波数点にこのL2フレームにおける該周波数点のMDCT-MDSTドメインでの位相を用いて線形フィットを行い、現在損失フレームにおける該周波数点でのMDCT-MDSTドメインの複素数信号位相を取り得て、このL2フレームにおける1つのフレームにおける該周波数点でのMDCT-MDSTドメインの振幅から現在損失フレームにおける該周波数点でのMDCT-MDSTドメイン複素数信号の振幅を取り得て、即ち該L2フレームにおける1つのフレームにおける該周波数点でのMDCT-MDSTドメインの振幅を現在損失フレームにおける該周波数点でのMDCT-MDSTドメインの振幅とする。

3e）上記周波数点集合S_Cの他の周波数点に第pフレームの前の複数のフレームのMDCT係数値を用いて第pフレームのMDCT係数値を計算する。例えば、現在損失フレームの1つ前のフレームのMDCT係数値の半分を現在損失フレームのMDCT係数値とする。

本発明の他の実施例において、ステップS3では、ステップ3aの前に、「1つのフレーム内のすべての周波数点に第pフレームの前の複数のフレームのMDCT係数値を用いて第pフレームのMDCT係数値を計算する」ステップを実行し、次に、ステップ3a、3b、3c及び3dを実行した後ステップ3eをスキップしてステップS4に進入しても良く、或いは、ステップ3dの前に「1つのフレーム内のすべての周波数点に第pフレームの前の複数のフレームのMDCT係数値を用いて第pフレームのMDCT係数値を計算する」こと実行し、次に、ステップ3dを実行した後ステップ3eをスキップしてステップS4に進入してもよい。

他の変形を加えてもよく、例えば、ステップ3eはステップ3cの後ステップS4の前に実行すればよく、即ち周波数点集合S_Cを取り得た後実行できる。

ステップS4、上記現在損失フレームにおけるすべての周波数点でのMDCT係数にIMDCT（Inverse MDCT、修正離散コサイン逆変換）変換を行い、現在損失フレームの時間領域信号を取り得る。

上述実施例は以下のように変化しても良く、先に初期補償を行い、即ち先に1つのフレーム内のすべての周波数点に第pフレームの前の複数のフレーム的のMDCT係数値を用いて第pフレームのMDCT係数値を計算し、さらに、現在損失フレームのタイプを判断し、現在損失フレームのタイプによって異なるステップを実行し、非マルチ高調波フレームであると、直接にステップS4を実行し、マルチ高調波フレームであると、ステップS3におけるステップ3a、3b、3c及び3dを実行した後ステップ3eをスキップして直接にステップS4を実行してもよい。

以下で、2つの具体的な実施例を参照して本発明についてさらに説明する。

[実施例1]
ステップ110、復号側に現在フレームのデータパケットが損失することを発見し、現在フレーム（即ち現在損失フレーム）が非マルチ高調波フレームであるか或いはマルチ高調波フレーム（例えば多種の高調波からなる音楽フレーム）であるかを判断し、非マルチ高調波フレームであると、ステップ120を実行し、ではないと、ステップ130を実行し、
具体的な判断方法は、
現在損失フレームの前10フレームのスペクトラムフラットネスを計算し、スペクトラムフラットネスが0.1より小さい際に、該フレームがマルチ高調波定常状態信号フレームであると考える。損失フレームの前10フレームには8フレームより大きいものはマルチ高調波定常状態信号フレームである際に、現在損失フレームがマルチ高調波フレームであると考え、ではないと、非マルチ高調波フレームであると考え、スペクトラムフラットネスの計算方法は次の通りである。

第iフレームのスペクトラムフラットネスSFMiは第iフレーム信号の変換ドメインで信号振幅の幾何平均値と算術平均値の比に定義され、

ここで、

は第iフレーム信号振幅の幾何平均であり、

は第iフレーム信号振幅の算術平均であり、cⁱ(m)は第iフレームにおける周波数点mでのMDCT係数であり、MがMDCTドメイン信号フレームの長さである。

ステップ120、現在損失フレームが非マルチ高調波フレームであると判断すると、1つのフレーム内のすべての周波数点に現在損失フレームの1つ前のフレームのMDCT係数値の半分を用いて現在損失フレームのMDCT係数値とし、即ち、

次に、ステップ140を実行する。

ステップ130、現在損失フレームがマルチ高調波フレームであると判断すると、無遅延マルチ高調波フレーム損失補償アルゴリズムで現在損失フレームのMDCT係数を取り得て、ステップ140を実行し、
具体的に無遅延マルチ高調波フレーム損失補償アルゴリズムで現在損失フレームMDCT係数を取り得る方法は図5に示すように、第pフレームのデータパケットが損失する際に、
まず、1つのフレーム内のすべての周波数点に第p-1フレームにおける該周波数点でのMDCT係数値の半分を用いて第pフレームにおける該周波数点でのMDCT係数値とし、式(2)に示すように、
次に、現在損失フレームの前フレームにおいて復号して取り得たMDCT係数によって、FMDSTアルゴリズムで第p-2フレームと第p-3フレームのMDST係数s^p-2(m)とs^p-3(m) を取り得る。取り得た第p-2フレームと第p-3フレームのMDST係数及び第p-2フレームと第p-3フレームのMDCT係数c^p-2(m)及びc^p-3(m)をMDCT-MDSTドメインの複素数信号に組成し、

ここで、jが虚数符号である。

第p-2フレームと第p-3フレームにおいて各周波数点のパワーを計算し、第p-2フレームと第p-3フレームにおいてパワーが最大である前10個のピーク周波数点（いずれかのフレームにおけるピーク周波数点が10個より少ないと、該フレームにおけるすべてのピーク周波数点を取る）をそれぞれ取って周波数点集合m^p-2,m^p-3に組成する。

第p-1フレームのMDCT係数によって第p-1フレームにおける各周波数点のパワーを推定する。

ここで、

は第p-1フレームにおける周波数点mでのパワーであり、c^p-1(m)は第p-1フレームにおける周波数点mでのMDCT係数であり、ほかには同様である。

第p-1フレームにおいてパワーが最大での前10個のピーク周波数点m_i ^p-1,i=1…10を求める。該フレームにおけるピーク周波数点数N^p-1が10より小さいと、該フレームにおけるすべてのピーク周波数点m_i ^p-1,i=1…N^p-1を取る。

それぞれのm_i ^p-1に対して、m_i ^p-1、m_i ^p-1±1（ピーク周波数点の付近の周波数点にそのパワーは大きい可能性があるため、それを第p-1フレームのピーク周波数点の集合に加える）に同時に集合m^p-2,m^p-3に属する周波数点が存在するかどうかを判断する。同時に集合m^p-2,m^p-3に属すると、下式（6）−（11）によって第pフレームにおける周波数点m_i ^p-1、m_i ^p-1±1（m_i ^p-1、m_i ^p-1±1において1つの点が同時に集合m^p-2,m^p-3に属すれば、m_i ^p-1、m_i ^p-1±1この3つの周波数点に次のように計算する）のMDCT-MDSTドメインでの複素数信号の位相と振幅を求め、

、Aは位相と振幅をそれぞれ表す。例えば、

は第pフレームにおける周波数点mでの位相であり、

は第p-2フレームにおける周波数点mでの位相であり、

は第p-3フレームにおける周波数点mでの位相であり、

は第pフレームにおける周波数点mでの振幅であり、A^p-2(m)は第p-2フレームにおける周波数点mでの振幅であり、他には同様である。

従って、補償して取り得た第pフレームにおける周波数点mでのMDCT係数は、

すべてのm_i ^p-1、m_i ^p-1±1において同時に集合m^p-2,m^p-3に属する周波数点がないと、現在損失フレーム内すべての周波数点を式(6)-(12)によってMDCT係数を推定する。

予測する必要な周波数点を求めなく、直接に現在損失フレーム内すべての周波数点を式(6)-(12)によってMDCT係数を推定してもよい。

ステップ140、現在損失フレームがすべての周波数点でのMDCT係数をIMDCT変換を行い、現在損失フレームの時間領域信号を取り得る。

[実施例2]
ステップ210、復号側に現在フレームのデータパケットが損失することを発見し、現在フレーム（即ち現在損失フレーム）が非マルチ高調波フレームであるか或いはマルチ高調波フレーム（例えば多種の高調波からなる音楽フレーム）であるかを判断し、非マルチ高調波フレームであると、ステップ220を実行し、ではないと、ステップ230を実行し、
現在損失フレームが非マルチ高調波フレームであるか或いはマルチ高調波フレームであるかを具体的に判断する方法は、
現在損失フレームの前10フレームのスペクトラムフラットネスを計算し、それぞれのフレームに対して、該フレームのスペクトラムフラットネスが0.1より小さい際に、該フレームがマルチ高調波定常状態信号フレームであると考える。損失フレームの前10フレームには8フレームより大きいものはマルチ高調波定常状態信号フレームである際に、現在損失フレームがマルチ高調波フレームであると考え、ではないと、非マルチ高調波フレームであると考える。その中、の計算方法は次の通りである。

第iフレームのスペクトラムフラットネスSFM_iは第iフレーム信号の変換ドメインで信号振幅の幾何平均値と算術平均値の比に定義され、

ここで、

は第iフレーム信号振幅の幾何平均であり、

ステップ220、現在損失フレームが非マルチ高調波フレームであると判断すると、1つのフレーム内のすべての周波数点に現在損失フレームの1つ前のフレームのMDCT係数値の半分を用いて現在損失フレームのMDCT係数値とし、即ち、

次に、ステップ240を実行する。

ステップ230、現在損失フレームがマルチ高調波フレームであると判断すると、無遅延マルチ高調波フレーム損失補償アルゴリズムで現在損失フレームのMDCT係数を取り得て、ステップ240を実行し、
具体的に無遅延マルチ高調波フレーム損失補償アルゴリズムで現在損失フレームMDCT係数を取り得る方法は、第pフレームのデータパケットが損失する際に、現在損失フレームの前フレームが復号して取り得たMDCT係数によって、FMDSTアルゴリズムで第p-2フレーム、第p-3フレーム及び第p-4フレームのMDST係数s^p-2(m)、s^p-3(m) 及びs^p-4(m) を取り得る。取り得た第p-2フレーム、第p-3フレーム及び第p-4フレームのMDST係数と第p-2フレーム、第p-3フレーム及び第p-4フレームのMDCT係数c^p-2(m)、c^p-3(m) 及びc^p-4(m) をMDCT-MDSTドメインの複素数信号に組成し、

ここで、jが虚数符号である。

第p-2フレーム、第p-3フレーム及び第p-4フレームにおいて各周波数点のパワーを計算し、第p-2フレーム、第p-3フレーム及び第p-4フレームにおいてパワーが最大である前10個のピーク周波数点（いずれかのフレームにおけるピーク周波数点が10個より少ないと、該フレームにおけるすべてのピーク周波数点を取る）をそれぞれ取って周波数点集合m^p-2,m^p-3,m^p-4に組成する。

周波数点集合m^p-4におけるそれぞれの周波数点m_i ^p-4に対して、m_i ^p-4、m_i ^p-4±1（ピーク周波数点の付近の周波数点にそのパワーは大きい可能性があるため、それを第p-4フレームのピーク周波数点の集合に加える）においてに同時に集合m^p-2,m^p-3に属する周波数点が存在するかどうかを判断する。同時に集合m^p-2,m^p-3に属する周波数点が存在すると、下式（18）−（27）によって第pフレームにおける周波数点m_i ^p-1、m_i ^p-1±1（m_i ^p-1、m_i ^p-1±1において1つの点が同時に集合m^p-2,m^p-3に属すれば、m_i ^p-1、m_i ^p-1±1この3つの周波数点に次のように計算する）のMDCT-MDSTドメインでの複素数信号の位相と振幅を求め、

、Aは位相と振幅をそれぞれ表す。例えば、

は第pフレームにおける周波数点mでの位相であり、

は第p-2フレームにおける周波数点mでの位相であり、

は第p-3フレームにおける周波数点mでの位相であり、

以下で、最小二乗法で異なるフレームにおける同一の周波数点での位相の線形フィット関数

を求め、
ここで、xがフレーム番号を表し、a₀,a₁が求めたい線形フィット関数の係数を表す。

最小二乗準則でフィット誤差を測定する方法によって、方程式

からa₀,a₁を解する。他の実施例において、最小二乗準則と異なるほかの準則でフィット誤差を測定し、フィット係数を推定する。解したa₀,a₁によれば第pフレームにおける周波数点mでの位相

を推定して取り得ることができ、
従って、補償して取り得た第pフレームにおける周波数点mでのMDCT係数が

であり、
すべてのm_i ^p-4、m_i ^p-4±1において同時に集合m^p-2,m^p-3に属する周波数点が存在すると、S_Cで上記のすべての式(18)-(28)によって補償する周波数点からなる集合を表し、1つのフレーム内における周波数点集合S_Cの外での周波数点に現在損失フレームの1つ前のフレームのMDCT係数値の半分を用いて現在損失フレームのMDCT係数値とする。

すべてのm_i ^p-4、m_i ^p-4±1において同時に集合m^p-2,m^p-3に属する周波数点がないと、現在損失フレーム内のすべての周波数点を式(18)-(28)によってMDCT係数を推定する。

予測する必要な周波数点を求めなく、直接に現在損失フレーム内すべての周波数点を式(18)-(28)によってMDCT係数を推定してもよい。

ステップ240、現在損失フレームにおけるすべての周波数点でのMDCT係数にIMDCT変換を行い、現在損失フレームの時間領域信号を取り得る。

本発明はさらにMDCTドメインのオーディオフレーム損失補償器を提供し、フレームタイプ検出モジュール、非マルチ高調波フレーム損失補償モジュール、マルチ高調波フレーム損失補償モジュール、第2補償モジュール及びIMDCTモジュールを備え、図6に示すように、ここで、
上記フレームタイプ検出モジュールは、損失フレームを検出する際に、現在損失フレームのタイプを判断し、非マルチ高調波フレームであると、非マルチ高調波フレーム損失補償モジュールを指示して補償し、マルチ高調波フレームであると、上記マルチ高調波フレーム損失補償モジュールを指示して補償するように設置され、現在損失フレームのタイプを具体的に判断する方法は以上の通りであり、ここで説明しない。

上記非マルチ高調波フレーム損失補償モジュールは、1つのフレーム内のすべての周波数点に現在損失フレームの前の複数のフレームのMDCT係数値を用いて現在損失フレームのMDCT係数値を計算し、該MDCT係数をIMDCTモジュールに送信するように設置され、
上記マルチ高調波フレーム損失補償モジュールは、現在損失フレームが第pフレームである際に、予測待ちの周波数点集合を取得し、上記予測待ちの周波数点集合におけるそれぞれの周波数点に第p-1フレームの前の複数のフレームにおけるMDCT-MDSTドメインでの位相と振幅を用いて予測し、第pフレームにおけるMDCT-MDSTドメインでの位相と振幅を取り得て、前記予測して得た第pフレームにおけるMDCT-MDSTドメインでの位相と振幅を用いて第pフレームにおける対応の上記それぞれの周波数点でのMDCT係数を取り得て、該MDCT係数を第2補償モジュールに送信し、上記第p-1フレームが第pフレームの前1つのフレームであるように設置され、
上記マルチ高調波フレーム損失補償モジュールは、第p-2フレーム、第p-3フレームのMDCT-MDSTドメイン複素数信号と第p-1フレームのMDCT係数を用いて予測待ちの周波数点集合を取得し、該周波数点集合におけるそれぞれの周波数点に第p-2フレーム、第p-3フレームにおけるMDCT-MDSTドメインでの位相と振幅を用いて予測し、第pフレームにおけるMDCT-MDSTドメインでの位相と振幅を取り得るように設置される。

上記マルチ高調波フレーム損失補償モジュールは予測待ちの周波数点集合を取得する際に、第pフレームの前の複数のフレーム的MDCT-MDSTドメイン複素数信号及び/またはMDCT係数を用いて予測待ちの周波数点集合を取得し、或いは、直接に1つのフレーム内のすべての周波数点を上記周波数点集合に入れる。

上記第2補償モジュールは、1つのフレーム内に上記予測待ちの周波数点集合以外の周波数点に第pフレームの前の複数のフレームのMDCT係数値を用いて第pフレームにおける該周波数点でのMDCT係数値を計算し、第pフレームのすべての周波数点でのMDCT係数をIMDCTモジュールに送信し、さらに、上記第2補償モジュールは第p-1フレームのMDCT係数値の半分を用いて第pフレームにおける上記予測待ちの周波数点集合の以外の周波数点のMDCT係数値とするように設置される。

上記マルチ高調波フレーム損失補償モジュールは周波数点集合生成ユニットと係数生成ユニットをさらに含み、ここで、
上記周波数点集合生成ユニットは、予測待ちの周波数点集合S_Cを生成するように設置され、
上記係数生成ユニットは、第p-1フレームの前のL2フレームにおけるMDCT-MDSTドメインでの位相と振幅を用いて予測し、第pフレームにおいて周波数点集合S_Cに属する各周波数点の位相と振幅を取り得て、上記予測して得た第pフレームにおけるMDCT-MDSTドメインでの位相と振幅を用いて、第pフレームにおける対応の上記それぞれの周波数点でのMDCT係数を取り得て、該MDCT係数を第2補償モジュールに送信し、ここで、L2>1であるように設置される。

上記周波数点集合生成ユニットは、次のように予測待ちの周波数点集合S_Cを生成し、上記第pフレームの前の複数のフレームをL1フレームとし、上記L1フレームにおいて各周波数点のパワーを計算し、該L1フレームにおいて各フレームのピーク周波数点からなる集合S₁,…,S_L1を取得し、各集合における対応の周波数点数がN₁,…,N_L1であり、
上記L1個の集合S₁,…,S_L1から1つの集合S_iを選択し、S_iにおけるそれぞれのピーク周波数点m_j m_jに対して、j=1…N_i、m_j, m_j±1,…,m_j±kにおいて同時に他のすべてのピーク周波数点集合に属する周波数点が存在するかどうかを判断し、存在すると、m_j, m_j±1,…,m_j±kをいずれも周波数点集合S_Cに入れ、
S_iにおけるそれぞれのピーク周波数点m_jに対して、j=1…N_i、m_j, m_j±1,…,m_j±kにおいて同時に他のすべてのピーク周波数点集合に属する周波数点がないと、直接に1つのフレーム内のすべての周波数点をいずれも周波数点集合S_Cに入れるように設置され、
ここで、kが非負の整数である。上記ピーク周波数点とはパワーがそれと隣接する2つの周波数点でのパワーより大きい周波数点である。

上記L1フレームには第p-1フレームを含む際に、上記周波数点集合生成ユニットが、第p-1フレームにおける各周波数点のパワーは次のように計算し、

、ここで、

は第p-1フレームにおける周波数点mでのパワーであり、c^p-1(m)は第p-1フレームにおける周波数点mでのMDCT係数であり、c^p-1(m+1)は第p-1フレームにおける周波数点m＋1でのMDCT係数であり、c^p-1(m-1)は第p-1フレームにおける周波数点m−1でのMDCT係数である。

上記係数生成ユニットは位相予測サブユニットと振幅予測サブユニットをさらに含み、ここで、
上記位相予測サブユニットは、予測待ちの周波数点に選択した該L2フレームが該周波数点のMDCT-MDSTドメインでの位相を用いて線形外挿または線形フィットを行い、第pフレームにおける該周波数点のMDCT-MDSTドメインでの位相を取り得るように設置され、
上記振幅予測サブユニットは、該L2フレームにおける1つのフレームの該周波数点のMDCT-MDSTドメインでの振幅から第pフレームにおける該周波数点のMDCT-MDSTドメインでの振幅を取り得るように設置される。

L2＝2である際に、第t1フレーム、第t2フレームでこのフレームをそれぞれ表し、上記位相予測サブユニットは第pフレームのMDCT-MDSTドメインの位相を次のように予測し、予測待ちの周波数点mに対して、

、上記

は第t1フレームにおける周波数点mのMDCT-MDSTドメインでの位相であり、上記

L2>2である際に、上記位相予測サブユニットは第pフレームのMDCT-MDSTドメインの位相を次のように予測し、予測待ちの周波数点に対して、選択した該L2フレームにおける該周波数点のMDCT-MDSTドメインでの位相を線形フィットし、第pフレームにおける該周波数点のMDCT-MDSTドメインでの位相を取り得る。

上記IMDCTモジュールは、上記現在損失フレームにおけるすべての周波数点でのMDCT係数をIMDCT変換を行い、第pフレームの時間領域信号を取り得るように設置される。

図6に示すように、MDCTドメインのオーディオフレーム損失補償器は変更しても良く、図7に示すように、フレームタイプ検出モジュール、非マルチ高調波フレーム損失補償モジュール、マルチ高調波フレーム損失補償モジュール、第2補償モジュール及びIMDCTモジュールを備え、第2補償モジュールとフレームタイプ検出モジュールはマルチ高調波フレーム損失補償モジュールに接続し、マルチ高調波フレーム損失補償モジュールがIMDCTモジュールに接続し、ここで、
上記第2補償モジュールは、1つのフレーム内のすべての周波数点に現在損失フレームの前の複数のフレームのMDCT係数値を用いて現在損失フレームのMDCT係数値を計算し、該MDCT係数をマルチ高調波フレーム損失補償モジュールに送信するように設置され、
上記マルチ高調波フレーム損失補償モジュールは、予測待ちの周波数点集合を取得し、第pフレームにおける予測待ちの周波数点集合において各周波数点のMDCT係数を取り得て、具体的な方法は図6にはマルチ高調波フレーム損失補償モジュールと同様であり、予測待ちの周波数点集合の外の各周波数点に第2補償モジュールから取り得たMDCT係数を用いて第pフレームにおける該周波数点でのMDCT係数とし、第pフレームのすべての周波数点でのMDCT係数をIMDCTモジュールに送信するように設置される。

他の各モジュール機能は図6には各モジュールと同様で、ここで説明しない。

図8に示すように、本発明のもう1つのMDCTドメインのオーディオフレーム損失補償器ブロック図であり、ここで、MDCTドメインのオーディオフレーム損失補償器は非マルチ高調波フレーム損失補償モジュール、フレームタイプ検出モジュール、マルチ高調波フレーム損失補償モジュール及びIMDCTモジュールを備え、ここで、
上記非マルチ高調波フレーム損失補償モジュールは、損失フレームを検出する際に、1つのフレーム内のすべての周波数点に現在損失フレームの前の複数のフレームのMDCT係数値を用いて現在損失フレームのMDCT係数値を計算し、該MDCT係数をフレームタイプ検出モジュールに送信するように設置され、
上記フレームタイプ検出モジュールは、現在損失フレームのタイプを判断し、非マルチ高調波フレームであると、非マルチ高調波フレーム損失補償モジュールから受信したMDCT係数をIMDCTモジュールに送信し、マルチ高調波フレームであると、該MDCT係数をマルチ高調波フレーム損失補償モジュールに送信するように設置され、現在損失フレームのタイプを具体的に判断する方法は以上の通りであり、ここで説明しない。

上記マルチ高調波フレーム損失補償モジュールは、予測待ちの周波数点集合を取得し、第pフレームにおける予測待ちの周波数点集合において各周波数点のMDCT係数を取り得て、具体的な方法は図6にはマルチ高調波フレーム損失補償モジュールと同様であり、予測待ちの周波数点集合の外の各周波数点にフレームタイプ検出モジュールから取り得たMDCT係数を用いて第pフレームにおける該周波数点でのMDCT係数とし、第pフレームのすべての周波数点でのMDCT係数をIMDCTモジュールに送信するように設置され、
上記IMDCTモジュールは、上記現在損失フレームにおけるすべての周波数点でのMDCT係数にIMDCT変換を行い、第pフレームの時間領域信号を取り得るように設置される。

本発明が提案するフレーム損失補償方法及びフレーム損失補償器は、
リアルタイムかつ双方向の通信、例えば、無線、IP会議テレビ及びリアルタイム放送サービスのIPTV、モバイルストリーミングメディア、モバイルTV等の分野のオーディオフレーム損失補償問題に適用でき、トランスポートストリームの誤り耐性の能力を向上するようにする。本発明は補償操作によって音声オーディオネットワーク伝送のパケット損失による音質の下降をよく避け、パケット損失後の音声オーディオ品質の快適度を向上し、良好な主観的な聴覚効果を取得することができる。

従来技術に比べ、本発明が提案するMDCTドメインのオーディオフレーム損失補償器及び補償方法は、無遅延、計算量メモリ量が小さく、実現やすい等のメリットを有する。

Claims

修正離散コサイン変換ドメインのオーディオフレーム損失補償方法であって、
現在損失フレームが第pフレームである際に、予測される予測待ちの周波数点集合を取得し、前記予測待ちの周波数点集合におけるそれぞれの周波数点に対して第p-1フレームの前の複数のフレームにおける修正離散コサイン変換−修正離散サイン変換MDCT-MDSTドメインでの位相と振幅を用いて予測し、第pフレームにおけるMDCT-MDSTドメインでの位相と振幅を取り得て、予測して得た前記第pフレームにおけるMDCT-MDSTドメインでの位相と振幅を用いて第pフレームにおける前記それぞれの周波数点での修正離散コサイン変換ドメインMDCT係数を取り得て、ここで、前記第p-1フレームが第pフレームの前の1つのフレームであるステップaと、
1つのフレーム内における前記予測待ちの周波数点集合の以外の周波数点に対して、第pフレームの前の複数のフレームのMDCT係数値を用いて第pフレームにおける該周波数点でのMDCT係数値を計算するステップbと、
第pフレームのすべての周波数点でのMDCT係数に修正離散コサイン逆変換IMDCTを行い、第pフレームの時間領域信号を取り得るステップcを含むオーディオフレーム損失補償方法。
前記ステップaの前に、現在フレームが損失することを検出する際に、現在損失フレームのタイプを判断し、現在損失フレームがマルチ高調波フレームであると、ステップaを実行することをさらに含む請求項1に記載の方法。
現在損失フレームのタイプを判断するステップは、
現在損失フレームの前のKフレームの毎フレームのスペクトラムフラットネスを計算し、該Kフレームにおいて、スペクトラムフラットネスがあるしきい値より小さいフレームの個数がK₀より小さいまたはそれに等しいと、現在損失フレームが非マルチ高調波フレームであり、スペクトラムフラットネスが該しきい値より小さいフレームの個数がK₀より大きいと、現在損失フレームがマルチ高調波フレームであり、ここで、K₀<=K、K₀、Kが自然数であることを含む請求項2に記載の方法。
前記ステップaにおいて、前記予測待ちの周波数点集合を取得するステップはさらに、
第pフレームの前の複数のフレームのMDCT-MDSTドメイン複素数信号及び/またはMDCT係数を用いて前記予測待ちの周波数点集合S_Cを取得し、或いは、直接に1つのフレーム内のすべての周波数点を前記予測待ちの周波数点集合S_Cに入れることを含む請求項1に記載の方法。
第pフレームの前の複数のフレームのMDCT-MDSTドメイン複素数信号及び/またはMDCT係数を用いて前記予測待ちの周波数点集合S_Cを取得するステップは、
前記第pフレームの前の複数のフレームをL1フレームとし、前記L1フレームにおいて各周波数点のパワーを計算し、該L1フレームにおいて各フレームのピーク周波数点からなるL1個の集合S₁,…,S_L1を取得し、各集合が対応する周波数点数がN₁,…,N_L1であることと、
前記L1個の集合S₁,…,S_L1から1つの集合S_iを選択し、S_iにおけるそれぞれのピーク周波数点 m_jに対して、j=1…N_i、m_j, m_j±1,…,m_j±kにおいて同時に他のすべてのピーク周波数点集合に属する周波数点が存在するかどうかを判断し、
存在すると、m_j, m_j±1,…,m_j±kをいずれも周波数点集合S_Cに入れることと、
同時に他のすべてのピーク周波数点集合に属する周波数点がないと、直接に1つのフレーム内のすべての周波数点をいずれも周波数点集合S_Cに入れ、
ここで、前記kが非負の整数であることを含む請求項4に記載の方法。
前記ピーク周波数点とはパワーがそれと隣接する2つの周波数点でのパワーより大きい周波数点である請求項5に記載の方法。
前記L1フレームには第p-1フレームを含む際に、第p-1フレームにおける各周波数点のパワーは次のように計算し、
、ここで、
は第p-1フレームにおける周波数点mでのパワーであり、c^p-1(m)は第p-1フレームにおける周波数点mでのMDCT係数であり、c^p-1(m+1)は第p-1フレームにおける周波数点m＋1でのMDCT係数であり、c^p-1(m-1)は第p-1フレームにおける周波数点m−1でのMDCT係数である請求項5に記載の方法。
前記ステップaにおいて第pフレームにおけるMDCT-MDSTドメインでの位相と振幅を予測して得るステップは、第p-1フレームの前のL2フレームにおける該周波数点のMDCT-MDSTドメインでの位相を用いて線形外挿または線形フィットを行い、第pフレームにおける該周波数点のMDCT-MDSTドメインでの位相を取り得ること、及び
該L2フレームにおいて1つのフレームにおける該周波数点でのMDCT-MDSTドメインの振幅から第pフレームにおける該周波数点でのMDCT-MDSTドメインの振幅を取り得て、ここで、L2>1であることを含む請求項1〜7のいずれか１項に記載の方法。
L2＝2である際に、第p-1フレームの前のL2フレームにおける該周波数点のMDCT-MDSTドメインでの位相を用いて線形外挿または線形フィットを行い、第pフレームにおける該周波数点のMDCT-MDSTドメインでの位相を取り得るステップは、
下記公式
によって第pフレームのMDCT-MDSTドメインの位相を取り得て、
ここで、第t1フレーム、第t2フレームは第p-1フレームの前の2つのフレームをそれぞれ表し、mが予測される予測待ちの周波数点であり、
は第t1フレームにおける周波数点mのMDCT-MDSTドメインでの位相であり、
は第t2フレームにおける周波数点mのMDCT-MDSTドメインでの位相であることを含む請求項8に記載の方法。
L2>2である際に、第p-1フレームの前のL2フレームにおける該周波数点のMDCT-MDSTドメインでの位相を用いて線形外挿または線形フィットを行い、第pフレームにおける該周波数点のMDCT-MDSTドメインでの位相を取り得るステップは、
前記予測待ちの周波数点に対して、第p-1フレームの前のL2フレームにおける該周波数点のMDCT-MDSTドメインでの位相に線形フィットを行い、第pフレームにおける該周波数点のMDCT-MDSTドメインでの位相を取り得ることを含む請求項8に記載の方法。
第pフレームの前の複数のフレームのMDCT-MDSTドメイン複素数信号及び/またはMDCT係数を用いて前記予測待ちの周波数点集合S_Cを取得するステップは、第p-2フレーム、第p-3フレームのMDCT-MDSTドメイン複素数信号と第p-1フレームのMDCT係数を用いて前記予測待ちの周波数点集合S_Cを取得することを含み、
第p-1フレームの前の複数のフレームにおけるMDCT-MDSTドメインでの位相と振幅を用いて予測し、第pフレームにおけるMDCT-MDSTドメインでの位相と振幅を取り得るステップは、
前記周波数点集合S_Cにおけるそれぞれの周波数点に第p-2フレーム、第p-3フレームにおけるMDCT-MDSTドメインでの位相と振幅を用いて予測し、第pフレームにおけるMDCT-MDSTドメインでの位相と振幅を取り得ることを含む請求項4に記載の方法。
第pフレームの前の複数のフレームのMDCT係数を用いて第pフレームにおける該周波数点でのMDCT係数を計算するステップは、
第pフレームのMDCT係数の値を第p-1フレームのMDCT係数の値の二分の一にすることを含む請求項1〜7のいずれか１項に記載の方法。
修正離散コサイン変換ドメインのオーディオフレーム損失補償器であって、前記フレーム損失補償器はマルチ高調波フレーム損失補償モジュール、第2補償モジュール及びIMDCTモジュールを備え、
前記マルチ高調波フレーム損失補償モジュールは、現在損失フレームが第pフレームである際に、予測される予測待ちの周波数点集合を取得し、前記予測待ちの周波数点集合におけるそれぞれの周波数点に対して、第p-1フレームの前の複数のフレームにおけるMDCT-MDSTドメインでの位相と振幅を用いて予測し、第pフレームにおけるMDCT-MDSTドメインでの位相と振幅を取り得て、前記予測して得た第pフレームにおけるMDCT-MDSTドメインでの位相と振幅を用いて第pフレームにおける前記それぞれの周波数点でのMDCT係数を取り得て、該MDCT係数を第2補償モジュールに送信し、ここで、前記第p-1フレームが第pフレームの前1つのフレームであるように設置され、
前記第2補償モジュールは、1つのフレーム内における前記予測待ちの周波数点集合の以外の周波数点に対して、第pフレームの前の複数のフレームのMDCT係数値を用いて第pフレームにおける該周波数点でのMDCT係数値を計算し、第pフレームのすべての周波数点でのMDCT係数をIMDCTモジュールに送信するように設置され、
前記IMDCTモジュールは、第pフレームのすべての周波数点でのMDCT係数にIMDCT変換を行い、第pフレームの時間領域信号を取り得るように設置される修正離散コサイン変換ドメインのオーディオフレーム損失補償器。
フレームタイプ検出モジュールをさらに含み、前記フレームタイプ検出モジュールは、損失フレームを検出する際に、現在損失フレームのタイプを判断し、マルチ高調波フレームであると、前記マルチ高調波フレーム損失補償モジュールを指示して補償するように設置される請求項13に記載のフレーム損失補償器。
前記フレームタイプ検出モジュールは、次のように現在損失フレームのタイプを判断し、現在損失フレームの前のKフレームの毎フレームのスペクトラムフラットネスを計算し、該Kフレームにおいて、スペクトラムフラットネスがあるしきい値より小さいフレームの個数がK₀より小さいまたはそれに等しいと、現在損失フレームが非マルチ高調波フレームであり、スペクトラムフラットネスが該しきい値より小さいフレームの個数がK₀より大きいと、現在損失フレームがマルチ高調波フレームであり、ここで、K₀<=K、K₀、Kが自然数であるように設置される請求項14に記載のフレーム損失補償器。
前記マルチ高調波フレーム損失補償モジュールは周波数点集合生成ユニットを含み、前記マルチ高調波フレーム損失補償モジュールは、前記周波数点集合生成ユニットが第pフレームの前の複数のフレームのMDCT-MDSTドメイン複素数信号及び/またはMDCT係数を用いることによって前記予測待ちの周波数点集合S_Cを取得し、或いは、直接に1つのフレーム内のすべての周波数点を前記予測待ちの周波数点集合S_Cに入れるように設置される請求項13に記載のフレーム損失補償器。
前記周波数点集合生成ユニットは、次のように第pフレームの前の複数のフレームのMDCT-MDSTドメイン複素数信号及び/またはMDCT係数を用いて前記予測待ちの周波数点集合S_Cを取得し、
前記第pフレームの前の複数のフレームをL1フレームとし、前記L1フレームにおいて各周波数点のパワーを計算し、該L1フレームにおいて各フレームのピーク周波数点からなるL1個の集合S₁,…,S_L1を取得し、各集合における対応の周波数点数がそれぞれN₁,…,N_L1であり、
前記L1個の集合S₁,…,S_L1から1つの集合S_iを選択し、S_iにおけるそれぞれのピーク周波数点m_jに対して、j=1…N_i、m_j, m_j±1,…,m_j±kにおいて同時に他のすべてのピーク周波数点集合に属する周波数点が存在するかどうかを判断し、存在すると、m_j, m_j±1,…,m_j±kをいずれも周波数点集合S_Cに入れ、
S_iにおけるそれぞれのピーク周波数点m_jに対して、j=1…N_i、m_j, m_j±1,…,m_j±kにおいて同時に他のすべてのピーク周波数点集合に属する周波数点がないと、直接に1つのフレーム内のすべての周波数点をいずれも周波数点集合S_Cに入れ、ここで、kが非負の整数であるように設置される請求項16に記載のフレーム損失補償器。
前記ピーク周波数点とはパワーがそれと隣接する2つの周波数点でのパワーより大きい周波数点である請求項17に記載のフレーム損失補償器。
前記周波数点集合生成ユニットは、前記L1フレームには第p-1フレームを含む際に、第p-1フレームにおける各周波数点のパワーは次のように計算し、
、ここで、
は第p-1フレームにおける周波数点mでのパワーであり、c^p-1(m)は第p-1フレームにおける周波数点mでのMDCT係数であり、c^p-1(m+1)は第p-1フレームにおける周波数点m＋1でのMDCT係数であり、c^p-1(m-1)は第p-1フレームにおける周波数点m−1でのMDCT係数であるように設置される請求項17に記載のフレーム損失補償器。
前記マルチ高調波フレーム損失補償モジュールは係数生成ユニットをさらに含み、前記マルチ高調波フレーム損失補償モジュールは、前記係数生成ユニットが第p-1フレームの前のL2フレームにおけるMDCT-MDSTドメインでの位相と振幅を用いることによって予測し、第pフレームにおいて前記予測待ちの周波数点集合に属する各周波数点の位相と振幅を取り得て、予測して得た第pフレームの位相と振幅を用いて第pフレームにおける対応の前記それぞれの周波数点でのMDCT係数のMDCT係数を取り得て、該MDCT係数を第2補償モジュールに送信し、ここで、L2>1であるように設置され、
前記係数生成ユニットは位相予測サブユニットと振幅予測サブユニットを含み、
前記位相予測サブユニットは、予測される予測待ちの周波数点に対して、選択した該L2フレームにおける該周波数点のMDCT-MDSTドメインでの位相を用いて線形外挿または線形フィットを行い、第pフレームにおける該周波数点のMDCT-MDSTドメインでの位相を取り得るように設置され、
前記振幅予測サブユニットは、該L2フレームにおける1つのフレームにおける該周波数点でのMDCT-MDSTドメインの振幅から第pフレームにおける該周波数点でのMDCT-MDSTドメインの振幅を取り得るように設置される請求項13〜19のいずれか１項に記載のフレーム損失補償器。
前記位相予測サブユニットは、L2＝2である際に、下記の公式
によって第pフレームのMDCT-MDSTドメインの位相を予測し、
ここで、第t1フレーム、第t2フレームは第p-1フレームの前の2つのフレームをそれぞれ表し、mが前記予測待ちの周波数点であり、
は第pフレームにおける周波数点mのMDCT-MDSTドメインでの位相の予測値であり、前記
は第t1フレームにおける周波数点mのMDCT-MDSTドメインでの位相であり、
は第t2フレームにおける周波数点mのMDCT-MDSTドメインでの位相であるように設置される請求項20に記載のフレーム損失補償器。
L2>2である際に、次のように第pフレームのMDCT-MDSTドメインの位相を予測し、前記予測待ちの周波数点に対して、選択した該L2フレームにおける該周波数点のMDCT-MDSTドメインでの位相に線形フィットを行い、第pフレームにおける該周波数点のMDCT-MDSTドメインでの位相を取り得るように設置される請求項20に記載のフレーム損失補償器。
前記マルチ高調波フレーム損失補償モジュールは、第p-2フレーム、第p-3フレームのMDCT-MDSTドメイン複素数信号と第p-1フレームのMDCT係数を用いて前記予測待ちの周波数点集合を取得し、及び該周波数点集合におけるそれぞれの周波数点に対して、第p-2フレーム、第p-3フレームにおけるMDCT-MDSTドメインでの位相と振幅予測を用いて第pフレームにおけるMDCT-MDSTドメインでの位相と振幅を取り得るように設置される請求項16に記載のフレーム損失補償器。
前記第2補償モジュールは、第pフレームにおける前記予測待ちの周波数点集合の以外の周波数点のMDCT係数の値を第p-1フレームのMDCT係数の値の二分の一にするように設置される請求項13〜19のいずれか１項に記載のフレーム損失補償器。