JP6177239B2 - 変換符号化または変換復号化のための分析重み付けウィンドウまたは合成重み付けウィンドウの適合化 - Google Patents

変換符号化または変換復号化のための分析重み付けウィンドウまたは合成重み付けウィンドウの適合化 Download PDF

Info

Publication number
JP6177239B2
JP6177239B2 JP2014519605A JP2014519605A JP6177239B2 JP 6177239 B2 JP6177239 B2 JP 6177239B2 JP 2014519605 A JP2014519605 A JP 2014519605A JP 2014519605 A JP2014519605 A JP 2014519605A JP 6177239 B2 JP6177239 B2 JP 6177239B2
Authority
JP
Japan
Prior art keywords
window
size
transform
initial
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014519605A
Other languages
English (en)
Other versions
JP2014524048A (ja
Inventor
ジュリアン・フォーレ
ピーリック・フィリップ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of JP2014524048A publication Critical patent/JP2014524048A/ja
Application granted granted Critical
Publication of JP6177239B2 publication Critical patent/JP6177239B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3002Conversion to or from differential modulation
    • H03M7/3044Conversion to or from differential modulation with several bits only, i.e. the difference between successive samples being coded by more than one bit, e.g. differential pulse code modulation [DPCM]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は信号処理に関し、特に、一連の標本の形の(会話信号のような)音声信号および/またはビデオ信号の処理に関する。本発明は特に、分析ウィンドウまたは合成ウィンドウの変換と変換サイズに対する適合化とによるデジタル音声信号の符号化と復号化に関する。
変換符号化は、変換(周波数)領域において時間信号を符号化することから成る。当該変換により特に、音声信号の周波数特性を使用して符号化の性能を最適化し向上させることができる。例えば、倍音が少数のスペクトル光により周波数領域で表現され、したがって当該倍音を簡潔に符号化できるという事実が利用される。例えば、符号化雑音が殆ど聴こえないように符号化雑音を有利にフォーマットするために、周波数マスク効果も使用される。
従来、変換による符号化と復号化は、以下の5つのステップを適用することによって実施されている。
・符号化すべき(所与の標本化周波数Fsで標本化した)デジタル音声ストリームを、有限数(例えば、2N)の標本から成るフレームに分割する。各フレームは通常、先行フレームと50%だけ重複する。
・変換ステップを信号に適用する。MDCT(Modified Discrete Cosine Transform)と呼ばれる変換のケースでは、(分析ウィンドウと呼ばれる)L=2Nのサイズの重み付けウィンドウhが各フレームに適用される。重み付けされたフレームは、2NからNの変換に従って「畳み込まれる」。hで重み付けしたサイズ2NのフレームT2NのサイズNのフレームTへの「畳み込み」を例えば以下のように行うことができる。
DCT TVを、畳み込まれたフレームTに適用して、変換領域内のサイズNのフレームを得る。これは以下のように表される。
・次に、変換領域内のフレームが、マッチした量子化器を用いることによって量子化される。量子化により、送信データのサイズを削減することができるが、元のフレームに(可聴または不可聴な)雑音が生ずる。符号化のビット・レートが高くなると、当該雑音が減り、量子化フレームが元のフレームに近くなる。
・逆MDCT変換が復号化において量子化フレームに適用される。当該変換は2つのステップを含む。即ち、サイズNの量子化フレームが、(直接変換として表される)逆DCT TVを用いることによって時間領域T におけるサイズNのフレームに変換される。次に、Nから2Nへの「展開」の第2のステップがサイズNの時間フレームT に適用される。合成ウィンドウと呼ばれる重み付けウィンドウhが、以下の式に従ってサイズ2NのフレームT2N に適用される。
・次に、復号化された音声ストリームが、2つの連続するフレームの重複部分を合計することによって合成される。
この機構は、分析フィルタおよび合成フィルタが(2K−1)Nの重複に関して長さL=2KNを有するELTのような、より広い重複を有する変換に拡張されることに留意されたい。したがって、MDCTはK=1であるELTの特別なケースである。変換と所与の重複に関して、(量子化のない)符号化される信号の所謂「完全な」再構築が得られるようにする分析ウィンドウと合成ウィンドウが決定される。
元のX信号と再構築された
信号の差分が無視できると考えられるとき、当該再構築は「準完全な」再構築でもありうる。例えば、音声符号化では、処理信号Xの電力より低い誤差電力50dBを有する差分を無視できるとみなしてもよい。例えば、分析ウィンドウと合成ウィンドウが2つの連続するフレームで変化しない場合には、次の完全再構築条件が成り立つはずである。
したがって、殆どのコーデックでは、分析ウィンドウと合成ウィンドウがメモリに格納されて事前に計算されROMメモリに格納されるか、または、分析ウィンドウと合成ウィンドウが公式を利用して初期化されRAMメモリに格納されるかの何れかであることは容易に理解される。
大部分の時間、場合によってはインデックス反転(h(k)=h(2N−1−k))を除いて、分析ウィンドウと合成ウィンドウは同一であり(h(k)=h(k))、それらをメモリに格納するには2Nのサイズの単一のメモリ空間のみが必要である。
この新たなコーデックは、複数の標本化周波数を管理するためか、(例えば、遷移のケースで)分析ウィンドウ(したがって合成ウィンドウ)のサイズを音声コンテンツに適合させるためかに関わらず、様々なフレーム・サイズNで動作する。これらのコーデックでは、ROMメモリまたはRAMメモリは、様々なフレーム・サイズと同じ数の分析ウィンドウおよび/または合成ウィンドウを含む。
符号化器または復号化器の分析ウィンドウまたは合成ウィンドウの係数(標本とも呼ばれる)をメモリに格納して分析変換または合成変換を実施すべきである。明らかに、様々なサイズの変換を用いる特定のケースでは、使用するサイズごとの重み付けウィンドウをメモリ内で表現しなければならない。
ウィンドウが対称的である好適なケースでは、L/2個だけの係数を格納する必要があり、その他のL/2個はこれらの格納された係数から算術演算を何ら行うことなく演繹される。したがって、MDCT(K=1)では、サイズMと2Mの変換の必要がある場合には、当該ウィンドウが対称であれば(M+2M)=3M個の係数を格納しなければならず、そうでなければ(2M+4M)=6M個の係数を格納しなければならない。音声符号化の典型的な例はM=320またはM=1024である。したがって、非対称のケースでは、これはそれぞれ1920個の係数と6144個の係数を格納しなければならないことを意味する。
係数の表現に望まれる精度に応じて、係数ごとに16ビット、場合によっては24ビットが必要である。これは、低コストのコンピュータに対しては僅かなメモリ空間を意味するものではない。
分析ウィンドウまたは合成ウィンドウの間引き技術が存在する。例えば、N個の標本からM個の標本に変更するために(NはMの倍数)、単純なウィンドウ間引きでは、N/Mのうち1つの標本を取る。N/Mは1より大きい整数である。かかる計算では、式(3)で与えた完全な再構築式は成立しない。例えば、合成ウィンドウが分析ウィンドウの時間反転であるケースでは、以下が成り立つ。
完全再構築条件は、
となる。従来この条件を満たす符号化で使用されるウィンドウは、Malvar正弦ウィンドウである。即ち、
N/Mのうち1つの標本を取ることによってウィンドウh(k)を間引く場合には、当該ウィンドウは、
となる。サイズ2Mのh*(k)が完全再構築条件(式(3))
を満たすためには、N/Mは1に等しくなければならない。ここで、N/Mは1より大きい整数として定義されている。したがって、かかる間引きに関して、完全再構築条件を満たすことはできない。
ここで挙げた例示的な例は容易に一般化される。したがって、小さいサイズのウィンドウを得るための基本ウィンドウを直接的に間引くことにより、完全な再構築性を保証することはできない。
重み付けウィンドウの補間技術も存在する。かかる技術は例えば特許文献1に開示されている。当該技術により、大きなサイズのウィンドウが必要であるとき、ROMに格納されるウィンドウのサイズを削減することができる。
したがって、サイズ2Nのウィンドウとサイズ4Nのウィンドウを格納するのではなく、特許文献1では2Nのウィンドウの標本を4Nのウィンドウのうち2つにおける1つの標本に割り当て、欠落した2N個の標本のみをROMに格納することが提案されている。したがって、ROMの格納サイズは4N+2Nから2N+2Nに削減される。
欧州特許出願公開第2 319 039号明細書
H.S. Malvar、 Signal Processing with Lapped Transformations、 Artech House、 1992 Duhamel et al.、「A fast algorithm for the implementation of filter banks based on TDAC」、ICASSP91 conference
しかし、当該技法にも、実際の変換を適用する前に分析ウィンドウと合成ウィンドウの計算を事前に行う必要がある。したがって、少数の分析ウィンドウと合成ウィンドウのみをメモリに格納して、完全再構築条件を満たしつつ様々なサイズの変換を適用する必要がある。さらに、変換による符号化の前にこれらのウィンドウの事前計算ステップを回避する必要があると思われる。
本発明はこの状況を改善するものである。この目的のため、本発明は、標本フレームに適用される分析(h)重み付けウィンドウまたは合成(h)重み付けウィンドウを用いた変換によりデジタル音声信号を符号化または復号化する方法を提供する。本方法は、所与の初期サイズNの変換に提供され、Nとは異なるMのサイズの二次変換を適用する初期ウィンドウの不規則標本化(E10)を備えるものである。
したがって、格納した初期ウィンドウから、サイズNの変換が与えられると、事前計算を実施することなく、かつ、様々なサイズの他のウィンドウを格納することなく、様々なサイズの変換を適用することができる。したがって、任意のサイズの単一のウィンドウが、様々なサイズの変換に適合させるのに十分でありうる。
不規則標本化により、復号化の最中に所謂「完全」または「準完全」な再構築条件を満たすことができる。
以下で述べる様々な特定の実施形態を、以上で定義した符号化方法または復号化方法のステップに、独立にまたは互いと組み合わせて、追加することができる。
好適な実施形態によれば、標本化ステップは、初期ウィンドウの第1の係数d(0≦d<N/M)から1組の定義された係数N−d−1、N+d、2N−d−1を選択して、所定の完全再構築条件を満たすステップを含む。したがって、完全再構築条件を満たしつつ、様々なサイズの二次変換にマッチするウィンドウを1組の係数から決定することができる。
有利なことに、NはMより大きく、初期ウィンドウの間引きを、少なくとも当該1組の定義された係数を保持することによって実施して、間引きされたウィンドウを得る。したがって、大きなサイズの格納された分析ウィンドウまたは合成ウィンドウから、復号化において完全再構築条件も満たす小さなサイズのウィンドウを得ることができる。
特定の例示的な実施形態では、本方法は、1組の定義された係数と一定の差分だけ離間した第2の組の係数を選択するステップを含み、当該第2の組の係数を保持することによって間引きを実施して間引きされたウィンドウを得る。
このように、所望の変換サイズにマッチする間引きを得ることができる。これにより、得られるウィンドウの周波数応答を最良に保存することができる。
特定の実施形態では、以下の式に従ってサイズ2Nのウィンドウをサイズ2Mのウィンドウに間引きする。
ここで、hは、間引きした分析ウィンドウまたは合成ウィンドウであり、hは初期の分析ウィンドウまたは合成ウィンドウであり、
はX以下の最大の整数であり、
はX以上の最小の整数であり、dは定義された集合の第1の係数の値である。このように、初期ウィンドウと取得したウィンドウの間の係数の数が複数でない場合でも、様々なサイズのウィンドウを最大サイズのウィンドウから得ることができる。NがMより小さいときには、1組の定義された係数の各係数と1組の隣接係数の各係数の間に係数を挿入することによって補間を実施して、補間されたウィンドウを得る。当該補間されたウィンドウは完全再構築も満たし、小さなサイズの格納されたウィンドウからオンザフライで計算することができる。
特定の実施形態では、本方法は、1組の定義された係数と一定の差分だけ離間した第2の組の係数を選択するステップを含み、当該第2の組の係数の各々と1組の隣接係数の各係数の間に係数を挿入することによって補間を行って、補間されたウィンドウを得る。このように、所望の変換サイズにマッチする補間を得ることができる。これにより、取得したウィンドウの周波数応答を最良に保持することができる。
補間されたウィンドウの周波数応答を最適化するために、特定の実施形態では、本方法は、第1の定義された係数と隣接係数とから計算された係数を含む補間ウィンドウを計算し、当該ウィンドウを補間するステップを含む。好適な実施形態では、不規則標本化のステップと、初期ウィンドウの間引きまたは補間を、二次変換の計算に使用される時間畳み込みまたは時間展開を実施するステップの最中に行う。したがって、分析ウィンドウまたは合成ウィンドウの間引きまたは補間は、実際の変換ステップと同時に、したがってオンザフライに実施される。したがって、もはや符号化の最中に取得されている変換サイズにマッチするウィンドウを、符号化の前に事前計算するステップを実施する必要はない。
例示的な実施形態では、初期ウィンドウの間引きと補間の両方を、二次変換の計算に使用される時間畳み込みまたは時間展開を実施するステップの間に行う。これにより、様々なサイズのウィンドウをメモリに格納された単一のウィンドウから取得する可能性をより高めることができる。間引きに関する特定の実施形態では、時間畳み込みの最中の間引きを次式に従って実施する。
ここで、TはM個の標本から成るフレームであり、T2Mは2M個の標本から成るフレームであり、時間展開中の間引きは次式に従って実施される。
ここで、T*はM個の標本から成るフレームであり、T*2Mは2M個の標本から成るフレームである。
特定の同等な例示的な実施形態では、二次変換のサイズがM=3/2Nであるとき、次式に従って、時間畳み込みの最中に初期ウィンドウの間引きを行い、続いて補間を行う。
ここで、TはM個の標本から成るフレームであり、T2Mは2M個の標本から成るフレームであり、hcompは補完ウィンドウであり、二次変換のサイズがM=3/2Nであるとき、次式に従って、時間展開の最中に初期ウィンドウの間引きを行い、続いて補間を行う。
ここで、TはM個の標本から成るフレームであり、T2Mは2M個の標本から成るフレームであり、hcompは補完ウィンドウである。
本発明はまた、標本フレームに適用される分析重み付けウィンドウまたは合成重み付けウィンドウを用いた変換によりデジタル音声信号を符号化または復号化するための装置を対象とする。当該装置は、所与の初期サイズNの変換に与えられる初期ウィンドウを不規則に標本化し、Nとは異なるMのサイズの二次変換を適用するのに適合した標本化モジュールを備えるものである。当該装置は、上述の方法と同じ利点を提供し、上述の方法を実装する。
本発明は、説明した符号化または復号化の方法のステップを、プロセッサにより実行されたときに実装するためのコード命令を含むコンピュータ・プログラムを対象とする。
最後に、本発明はプロセッサ読取可能記憶媒体に関する。当該プロセッサ読取可能記憶媒体は、符号化または復号化の装置に組み込まれるかまたは組み込まれず、場合によっては取外し可能であり、上述の符号化または復号化の方法を実装するコンピュータ・プログラムを格納するものである。
本発明の他の特徴や利点は、純粋に非限定的な例として与えた以下の説明を、添付図面を参照して読めばより明らかになろう。
1実施形態において本発明を実装する符号化および復号化のシステムの1例を示す図である。 本発明に従う分析ウィンドウまたは合成ウィンドウの間引きの1例を示す図である。 本発明の1実施形態に従う、分析ウィンドウまたは合成ウィンドウを不規則標本化してウィンドウを得る図である。 本発明の1実施形態に従う、分析ウィンドウまたは合成ウィンドウを不規則標本化してウィンドウを得る図である。 本発明の1実施形態における有利因子(2/3)の分析ウィンドウまたは合成ウィンドウの不規則標本化を示し、間引きサブステップを示す図である。 本発明の1実施形態における有利因子(2/3)の分析ウィンドウまたは合成ウィンドウの不規則標本化を示し、補間サブステップを示す図である。 本発明に従う符号化または復号化の装置のハードウェアの実施形態の1例を示す図である。
図1は、2Nのサイズの単一の分析ウィンドウと単一の合成ウィンドウがメモリに格納されている、変換により符号化および復号化するためのシステムを示す。デジタル音声ストリームX(t)が標本化モジュール101により標本化周波数Fで標本化され、2M個の標本のフレームT2M(t)が取得される。各フレームは通常、先行フレームと50%だけ重複する。
次に、変換ステップをブロック102と103により信号に適用する。ブロック102で、サイズNの変換に提供される格納された初期ウィンドウの標本化を行って、Nとは異なるMのサイズの二次変換を適用する。次に、2N個の係数から成る分析ウィンドウhの標本化を行って、信号の2M個の標本から成るフレームに適合させる。NがMの倍数であるケースでは当該ケースは間引きであり、NがMの約数であるケースでは当該ケースは補間である。N/Mがこれらの何れかであるケースを提供する。
ブロック102により実装されるステップについては、図2と図3を参照して後で詳述する。ブロック102では、2MからMへの変換に従って重み付きフレームに対する畳み込みを行う。有利なことに、この畳み込みステップは、後述する不規則標本化および間引きまたは補間ステップと組み合わせて行われる。したがって、ブロック102の後、当該信号はM個の標本から成るフレームT(t)の形である。例えば、DCT IVタイプの変換をブロック103で適用して、変換領域、即ちここでは周波数領域においてサイズMのフレームTを取得する。
次に、これらのフレームを量子化モジュール104により量子化して、量子化インデックス形Iで復号化器に送信する。当該復号化器は、モジュール114により逆量子化を行い、変換領域においてフレーム
を取得する。例えば、逆変換モジュール113は逆DCT IVを実施して時間領域においてフレーム
を取得する。次に、ブロック112で、M個から2M個の標本への展開をフレーム
に対して実施する。ブロック112で、サイズ2Mの合成重み付けウィンドウをサイズ2Nのウィンドウhの間引きまたは補間により取得する。NがMより大きいケースでは当該ケースは間引きであり、NがMより小さいケースでは当該ケースは補間である。ブロック112で実施するステップは、図2および図3を参照して後で詳述する。符号化に関して、有利なことに、当該展開ステップは不規則標本化および間引きまたは補間ステップと組み合わせて実施される。これについては後述する。
復号化された音声ストリーム
は、ブロック111で重複部分を合計することによって合成される。
次に、ブロック102とブロック112をより詳細に説明する。これらのブロックでは、不規則標本化ステップE10を実施して、二次変換のサイズMにマッチするウィンドウを定義する。したがって、サイズ2Nの格納されたウィンドウ(hまたはh)の第1の係数d(with0≦d<N/M)から、所定の完全再構築条件を満たす、1組の定義された係数sN−d−1、N+d、2N−d−1が選択される。この集合から、当該ウィンドウの間引きまたは補間を、NがMより大きいか小さいかに従ってE11において実施し、2N個の標本から成るウィンドウから2M個の標本から成るウィンドウへ変更する。
所定の完全再構築条件を求める。このために、以下の式が満たされる(合成と分析のために選択された係数によりサイズNの変換に対する完全再構築が可能であることを保証する)ように標本化を実施しなければならない。
したがって、間引きされたウィンドウが式(3)の完全再構築条件を満たすために、分析ウィンドウ上の点h(k)(k∈[0°;2N−1])から、合成ウィンドウ上の点h(N+k)、および分析ウィンドウ上の点h(N+k)、h(2N−1−k)およびh(N−1−k)をさらに選択することが完全再構築を条件付ける。しかし、これらの6個の点のみを保持することによって、不均衡が生じ、分析ウィンドウがNだけ間引かれ、合成ウィンドウがN/2だけ間引かれることが分かるであろう。
同様に、間引きにおいて分析ウィンドウh(N−k−1)上の点N−k−1を選択する場合には、分析ウィンドウ上の点sh(2N−1−k)、ならびに、合成ウィンドウ上の4つの同一の点h(k)、h(N+k)、h(2N−1−k)およびh(N−1−k)のみを選択することによって完全再構築条件を満たすことができることに留意されたい。
したがって、図2を参照して説明した間引きの間に、(3)の完全再構築条件を満たすために、0<d<N/Mである係数dから、分析ウィンドウ上の次の係数N−d−1、N+d、2N−1−dと合成ウィンドウ上のd、N+d、2N−1−dおよびN−1−dも選択して、分析ウィンドウと合成ウィンドウの間に同一サイズの間引きをもたせることが絶対不可欠である。実際、完全再構築条件は図2に示すように独立に8個の点のサブセットにのみ適用される。このように、分析ウィンドウと合成ウィンドウ上の1組の定義された係数d、N−d−1、N+d、2N−1−dの選択が行われる。
次に、当該間引きを、少なくとも当該1組の定義された係数を保持することによって実施して、間引きされたウィンドウを取得する。他の係数は削除することができる。完全再構築条件を満たす最小の間引きされたウィンドウがこのように取得される。
このように、最小の間引かれた分析ウィンドウを得るために、図2を参照して例示したように点h(k)、h(N+k)、h(2N−1−k)およびh(N−1−k)のみが保持される。
合成ウィンドウに関して、同一の1組の係数を選択し、少なくとも当該1組の定義された係数を保持することによって間引きを行い、間引きされたウィンドウを得る。このように、最小の間引かれた合成ウィンドウを得るために、図2を参照して例示したように点h(k)、h(N+k)、h(2N−1−k)およびh(N−1−k)のみが保持される。
点の間の対称性が与えられると、合成ウィンドウが分析ウィンドウの時間反転であるケースでは、4個の点(h(k)、h(N+k)、h(2N-1−k)およびh(N−1−k))から成るサブセットのみが間引きに必要である。したがって、上で定義した集合を選択することによって、完全再構築の特性を保ちつつ0とN−1の間の任意の値kを選択して分析ウィンドウおよび/または合成ウィンドウを間引くことができる。
適合した間引きにより、間引かれるウィンドウの周波数応答を最良に保存することができる。適合した間引きのケースでは、変換サイズMにより、分析(または合成)ウィンドウの第1のクォータ上でN/Mのうち1つの係数をとり、当該1組の定義された係数と(N/Mの)一定の差分だけ離間する第2の組の係数を選択する。したがって、係数d、N−1−d、N+d、2N−1−dに加えて当該第2の組の係数を保存することによって間引きを実施して間引きされたウィンドウを得る。
図3は、変換サイズMにマッチする不規則標本化の1例を示す。表示したウィンドウは4つのクォータに分割されている。完全再構築条件が与えられると、サイズ2Mの間引きされたウィンドウを得るために以下の式を得る。
ここで、hは、補間または間引いた分析ウィンドウまたは合成ウィンドウであり、hは初期の分析ウィンドウまたは合成ウィンドウであり、
はX以下の最大の整数であり、
はX以上の最小の整数であり、dはオフセットである。当該オフセットは、ウィンドウの第1のクォータ上の開始標本dの関数である。したがって、ブロック102のステップE10は、1組の定義された係数(d、N−d−1、N+d、2N−d−1)から一定の差分(ここではN/M)だけ離間した第2の組の係数を選択することを含む。同じ一定の差分を適用して、第3の組の係数を選択することができる。実際、例えば、ウィンドウを3だけ間引く場合、即ち、N/M=3である場合には、当該差分は各ウィンドウ部で3である。d=0が定義された組の第1の係数である場合には、一定の差分だけ離間した第2の組または第3の組の係数は3および6である、等である。同様に、d=1である場合には、一定の差分だけ離間した第2のまたは第3の組の第1の係数は1、4、7・・・であり、そうでなくd=2である場合には、当該係数は2、5、8・・・である。式7の「d」はしたがって(N/M−1を含めて、0とN/M−1の間の)0、1、または2の値をとりうる。
図3は、ウィンドウの第1のクォータにおいて選択した第1の係数がd=1であるケースを表す。そうすると、一定の差分だけ離間した第2のおよび第3の組の係数は4および7である。
以下の表1は、サイズN=48の変換からより小さなサイズの変換(M=24、16、12および8)へ変更するために保持される点を示す。したがって、サイズM=8の変換を実装するために、標本0、6、12、18、29、35、41、47、48、54、60、66、77、83、89および95が分析ウィンドウまたは合成ウィンドウにおいて考慮され、したがって不規則標本化を示すことが分かる。
以下の表2は、サイズN=48の変換に提供された初期ウィンドウからサイズN=6の変換を生成するのに適したウィンドウへ変更するための実施形態を示す。次に、d:d=0・・・7の値に対してN/M=8および7の確率の間引きが存在する。当該表は、初期ウィンドウに保持された値に対応するインデックスを示す。
元のウィンドウに近い周波数応答をもたせるために、本発明では当該値を
に設定することを提示する。この条件は限定ではない。開始点が各セグメントの末端であると考えられる場合には、式7は
となる。各部では、サイズMの変換を実施してサイズ2Nの初期ウィンドウにおける点を任意に選択することもできる。第1の係数(h(d))M/2−1のうち、インデックス2N−1−d、N−1−dおよびN+dの係数を他の3つの部分から選択することを条件として、当該ウィンドウの第1のクォータから係数をインデックスdにより任意に取得することができる。これは、構築されるサイズ2Mのウィンドウの周波数応答の連続性を改善するのに特に有利である。即ち、インデックスdを賢く選択することによって、不連続性を特に限定することができる。
以下の表3は、2N=48、2M=16である特定の実施形態を示す。
有利な実施形態では、ブロック102および112で、信号フレームの畳み込みまたは展開のステップと同時に標本化ステップを実施する。ここで説明したケースでは、サイズ2Nの分析重み付けウィンドウhが、ブロック102においてオンザフライでサイズ2Mの各フレームを間引くことまたは当該フレームを補間することによって、当該フレームに適用される。当該ステップは、畳み込みステップを記述する式(1)と不規則な間引きを記述する式(7)をグループ化することによって実施される。
当該重み付きフレームは、2MからMへの変換に従って「畳み込まれる」。(サイズ2Nの)hによって重み付けしたサイズ2MのフレームT2MをサイズMのフレームTへ「畳み込む」ことを次式のように行うことができる。
したがって、サイズ2Nのウィンドウをサイズ2Mのウィンドウへ間引きするステップは、サイズ2MのフレームをサイズMのフレームへ畳み込むのと同時に行われる。実施される計算の計算量は、インデックスが変更されるだけで、従来の畳み込みに使用される計算量と同じである。このオンザフライの間引き動作は計算量をさらに必要とするものではない。
同様に、復号化では、サイズ2Nの合成重み付けウィンドウhは、ブロック112においてオンザフライで、サイズ2Mの各フレームに適用されるサイズ2Mのウィンドウに間引かれる。当該ステップは、展開の式(2)を間引きの式(7)または(8)とグループ化することによって実施される。すると、以下の式が得られる。
ここでも、これらの式は従来の展開の式と比べて何ら計算量をさらに生じさせるものではない。これらの式により、何ら事前の計算を行う必要なく、かつ、ウィンドウをさらに格納する必要なく、ウィンドウの間引きをオンザフライで取得することができるようになる。
合成ウィンドウが分析ウィンドウの時間反転であるケース(h(k)=h(2N−1−k))では、割合N/Mは整数(したがって、間引きのみ)であり、式10は
となる。当該実施形態により、分析と合成の時点で使用される単一のウィンドウのみをメモリにもたせることができる。
したがって、畳み込み/展開と間引きのステップを組み合わせて、サイズNで提供された分析/合成ウィンドウを用いてサイズMの変換を実施できることが示された。本発明により、サイズMに提供された分析/合成ウィンドウでサイズMの変換を適用するのと同じ計算量が得られ、追加のメモリは使用されない。この効果は、(非特許文献1で示唆されているように)DCT IVに基づくMDCT変換の効果的な実装に対して示され、当該効果はまた、他の効果的な実装、特に非特許文献2で提供された実装おいて明らかにできることに留意されたい。
本方法は限定的ではなく、特に、分析ウィンドウが0秒である場合や、当該分析ウィンドウを、オフセットされたフレームに適用して符号化遅延を削減する(直近の音声標本が、ウィンドウ部分が0秒を示す直前に当該ウィンドウ部分により重み付けされる)場合に、本方法を適用することができる。この場合、フレームに割り当てられるインデックスとウィンドウに割り当てられるインデックスはオフセットされる。特定の実施形態では、サイズ2Nのウィンドウhが存在しサイズMのフレームが存在する場合に、補間方法の記述が続く。
NがMより小さい場合には、完全再構築条件を満たす1組の係数を同様に選択する。1組の定義された係数に隣接する1組の係数も決定される。当該1組の定義された係数の各係数と1組の隣接係数の各係数の間に係数を挿入することによって補間を実施して、補間されたウィンドウを得る。したがって、式(3)で定義した完全再構築条件を満たすために、位置kとk+1の間に標本を挿入しようとする場合に、分析ウィンドウ上の位置h(k)とh(k+1)の間、h(N−k−1)とh(N−k−2)の間、h(N+k)とh(N+k+1)の間、h(2N−1−k)とh(2N−k−2)の間に点を挿入し、合成ウィンドウ上の位置h(k)とh(k+1)の間、h(N+k)とh(N+k+1)の間、h(2N−1−k)とh(2N−k−2)の間、h(N−1−k)とh(N−k−2)の間に点を挿入することを提案する。これらの新たに挿入された8個の点も、式(3)の完全再構築条件を満たす。
第1の実施形態では、定義された1組の係数または1組の隣接する係数の繰返しにより補間を実施する。第2の実施形態では、取得したウィンドウに対して良好な周波数応答を得るために、係数(hcomp)を計算することによって補間を実施する。このために、サイズ2Nの補完ウィンドウhinitを計算する第1のステップを実施する。当該ウィンドウは、
であるようにサイズ2Nのhの係数の間で補間されたバージョンである。第2のステップでは、ウィンドウhcompは特許文献1に従って計算されるので、完全再構築を示す。このために、当該ウィンドウは、以下の式に従って1組の定義された係数に対して計算される。
当該ウィンドウは、初期化時に計算されるかまたはROMに格納されるかの何れかである。補間と間引きのステップを統合して、変換が効果的に適用される1実施形態を示すことができる。
当該実施形態を、図4Aと図4Bを参照して示す。当該実施形態は次の2つのステップに分解される。図4Aに示す第1のステップでは、本方法はサイズ2Nのウィンドウhから開始してサイズ2N’の第2のウィンドウhを取得する(ここで、2N=96および2N’=32である。即ち、因数3による間引きが実施される)。当該間引きは不規則であり式(7)に従う。図4Bに示す第2のステップでは、1組の補完係数hcompをhの2N’個の係数に追加して、合計で2M個の係数を得る(ここで、補完係数の数は2N’であり、2M=4N’が得られる)。図4Aと図4Bにおける特定の例では、サイズ2M=64のウィンドウを構築することによって、サイズN=48のMDCTに与えたサイズ2N=96の初期ウィンドウを、サイズM=32のMTCTを実装するためのウィンドウに変換している。
ブロック102で、変換の時点に、以下の式を満たすことによってウィンドウhとウィンドウhcompを交互に適用する。
同様に、ブロック112で、逆変換の時点に、次式に従ってウィンドウhが、次いでウィンドウhcompが、交互に適用される。
本発明に従う多数の変形が可能である。したがって、メモリに格納された単一のウィンドウから、補間によって、間引きによって、または間引きされたウィンドウ補間またはその反対によって、様々なサイズのウィンドウを得ることができる。したがって、符号化の柔軟性と復号化の柔軟性は高く、メモリ空間を増大させることも、実施すべき計算も何ら増大させることはない。MDCTの畳み込みの時点または展開の時点に間引きまたは補間を行うことによって、計算量と柔軟性がさらに節約される。
図5は、本発明に従う符号化または復号化の装置のハードウェア実施形態を表す。当該装置は、記憶部および/または作業メモリMEMを備えるメモリ・ブロックBMと協働するプロセッサPROCを備える。有利なことに、当該メモリ・ブロックは、プロセッサPROCにより実行されたときに、本発明に関する符号化または復号化の方法のステップ、特に、所与の初期サイズNの変換に与えられる初期ウィンドウの不規則標本化を実装して、Nとは異なるMのサイズの二次変換を適用するためのコード命令を含むコンピュータ・プログラムを備える。
一般に、図1の説明は、かかるコンピュータ・プログラムのアルゴリズムの諸ステップを繰り返すものである。装置のドライブにより読取可能でありそのメモリ空間にダウンロードできるコンピュータ・プログラムを、メモリ媒体に格納することもできる。かかる装置は、符号化器の場合には音声ストリームX(t)を受信し、または、復号化器の場合には量子化インデックスIを受信するのに適した入力モジュールを備える。当該装置は、符号化器の場合には量子化インデックスIを送信し、復号化器の場合には復号化ストリーム
を送信するのに適した出力モジュールを備える。1つの可能な実施形態では、このように説明した装置は符号化機能と復号化機能の両方を備えることができる。
100 標本化周波数
103 離散余弦変換
104 量子化モジュール

Claims (21)

  1. 標本フレームに適用される分析(ha)重み付けウィンドウを用いた変換によりデジタル音声信号を符号化する方法であって、Nとは異なるサイズMの変換を適用するために、プロセッサによって、所与の初期サイズNの変換に対して提供された初期ウィンドウを不規則標本化するステップ(E10)を含み、
    前記不規則標本化することは、前記初期ウィンドウに適用される第1の値d(0≦d<N/M)から、所定の完全再構築条件を満たす1組の定義された値N−d−1、N+d、2N−d−1を選択することを含む、方法。
  2. NはMより大きく、前記プロセッサによって、間引きされたウィンドウを得るために、少なくとも前記1組の定義された前記値を保持することによって前記初期ウィンドウの間引きを実施するステップを含む、請求項に記載の方法。
  3. 前記プロセッサによって、間引きされたウィンドウ得るために、前記1組の定義されたと一定の差分だけ離間した第2の組のを選択するステップを含み、前記第2の組のも保持することによって前記間引きを実施するステップを含む、請求項に記載の方法。
  4. NがM未満であるとき、前記1組の定義されたの各々と1組の隣接の各々の間にを挿入することによって補間を実施して、補間されたウィンドウを得る、請求項に記載の方法。
  5. 前記1組の定義されたと一定の差分だけ離間した第2の組のを選択するステップを含み、前記第2の組のの各々と1組の隣接の各々の間にを挿入することによって前記補間を実施して前記補間されたウィンドウを得る、請求項に記載の方法。
  6. 前記1組の定義されたと前記隣接とから計算したを含む補完ウィンドウを計算して前記ウィンドウを補間するステップを含む、請求項およびのうち1項に記載の方法。
  7. 前記不規則標本化と前記初期ウィンドウの間引きまたは補間は、前記サイズMの変換の計算に使用される時間畳み込みを実施するステップの間に実施される、請求項1乃至の何れか1項に記載の方法。
  8. 前記初期ウィンドウの間引きと補間の両方が、前記サイズMの変換の計算に使用される時間畳み込みを実施するステップの間に実施される、請求項1乃至の何れか1項に記載の方法。
  9. TMをM個の標本から成るフレームとし、T2Mを2M個の標本から成るフレームとして、前記時間畳み込みの間に間引きが
    に従って実施される、請求項に記載の方法。
  10. 記変換のサイズがM=3/2Nであるとき、TMをM個の標本から成るフレームとし、T2Mを2M個の標本から成るフレームとし、hcompを補完ウィンドウとして、時間畳み込みの間に、前記初期ウィンドウの間引きと、続いて補間とが、
    に従って実施される、請求項に記載の方法。
  11. 標本フレームに適用される分析(ha)重み付けウィンドウを用いた変換によりデジタル音声信号を符号化するための装置であって、Nとは異なるサイズMの変換を適用するための、所与の初期サイズNの変換に対して提供された初期ウィンドウを不規則標本化するように適合された標本化モジュール(102、112)を備え
    前記不規則標本化することは、前記初期ウィンドウに適用される第1の値d(0≦d<N/M)から、所定の完全再構築条件を満たす1組の定義された値N−d−1、N+d、2N−d−1を選択することを含む、装置。
  12. プロセッサにより実行されたときに、請求項1乃至11のうち1項に記載の符号化方法のステップを実施するためのコード命令を含む、コンピュータ・プログラム。
  13. 標本フレームに適用される合成(hs)重み付けウィンドウを用いた変換によりデジタル音声信号を復号化する方法であって、Nとは異なるサイズMの変換を適用するために、プロセッサによって、所与の初期サイズNの変換に対して提供された初期ウィンドウを不規則標本化するステップ(E10)を含み、
    前記不規則標本化することは、前記初期ウィンドウに適用される第1の値d(0≦d<N/M)から、所定の完全再構築条件を満たす1組の定義された値N−d−1、N+d、2N−d−1を選択することを含む、方法。
  14. NはMよりも大きく、間引きされたウィンドウを得るために、少なくとも前記1組の定義された前記値を保持することによって前記初期ウィンドウの間引きを実施するステップを含む、請求項13に記載の方法。
  15. 間引きされたウィンドウ得るために、前記1組の定義された値と一定の差分だけ離間した第2の組の値を選択するステップを含み、前記第2の組の値も保持することによって前記間引きを実施するステップを含む、請求項13に記載の方法。
  16. 前記不規則標本化と前記初期ウィンドウの間引きまたは補間は、前記サイズMの変換の計算に使用される時間展開を実施するステップの間に実施される、請求項13乃至15の何れか1項に記載の方法。
  17. 前記初期ウィンドウの間引きと補間の両方が、前記サイズMの変換の計算に使用される時間展開を実施するステップの間に実施される、請求項13乃至15の何れか1項に記載の方法。
  18. T*MをM個の標本から成るフレームとし、T*2Mを2M個の標本から成るフレームとして、前記時間展開の間に間引きが
    に従って実施される、請求項16に記載の方法。
  19. 前記変換のサイズがM=3/2Nであるとき、TMをM個の標本から成るフレームとし、T2Mを2M個の標本から成るフレームとし、hcompを補完ウィンドウとして、時間展開の間に、前記初期ウィンドウの間引きと、続いて補間とが、
    に従って実施される、請求項13に記載の方法。
  20. 標本フレームに適用される合成(hs)重み付けウィンドウを用いた変換によりデジタル音声信号を復号化するための装置であって、Nとは異なるサイズMの変換を適用するための、所与の初期サイズNの変換に対して提供された初期ウィンドウを不規則標本化するように適合された標本化モジュール(102、112)を備え、
    前記不規則標本化することは、前記初期ウィンドウに適用される第1の値d(0≦d<N/M)から、所定の完全再構築条件を満たす1組の定義された値N−d−1、N+d、2N−d−1を選択することを含む、装置。
  21. プロセッサにより実行されたときに、請求項13乃至19のうち1項に記載の復号化方法のステップを実施するためのコード命令を含む、コンピュータ・プログラム。
JP2014519605A 2011-07-12 2012-07-09 変換符号化または変換復号化のための分析重み付けウィンドウまたは合成重み付けウィンドウの適合化 Active JP6177239B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR1156356 2011-07-12
FR1156356A FR2977969A1 (fr) 2011-07-12 2011-07-12 Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee
PCT/FR2012/051622 WO2013007943A1 (fr) 2011-07-12 2012-07-09 Adaptations de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee

Publications (2)

Publication Number Publication Date
JP2014524048A JP2014524048A (ja) 2014-09-18
JP6177239B2 true JP6177239B2 (ja) 2017-08-09

Family

ID=46639596

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014519605A Active JP6177239B2 (ja) 2011-07-12 2012-07-09 変換符号化または変換復号化のための分析重み付けウィンドウまたは合成重み付けウィンドウの適合化

Country Status (12)

Country Link
US (2) US9368121B2 (ja)
EP (1) EP2732448B1 (ja)
JP (1) JP6177239B2 (ja)
KR (3) KR20140050056A (ja)
CN (1) CN103814406B (ja)
BR (3) BR122021011683B1 (ja)
CA (1) CA2841303C (ja)
ES (1) ES2556268T3 (ja)
FR (1) FR2977969A1 (ja)
MX (1) MX2014000409A (ja)
RU (1) RU2607230C2 (ja)
WO (1) WO2013007943A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2980791A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483879A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5357594A (en) * 1989-01-27 1994-10-18 Dolby Laboratories Licensing Corporation Encoding and decoding using specially designed pairs of analysis and synthesis windows
CA2483322C (en) * 1991-06-11 2008-09-23 Qualcomm Incorporated Error masking in a variable rate vocoder
US5504833A (en) * 1991-08-22 1996-04-02 George; E. Bryan Speech approximation using successive sinusoidal overlap-add models and pitch-scale modifications
JPH06141351A (ja) * 1992-10-26 1994-05-20 Matsushita Electric Ind Co Ltd 信号発生装置
US6269338B1 (en) * 1996-10-10 2001-07-31 U.S. Philips Corporation Data compression and expansion of an audio signal
US6240299B1 (en) * 1998-02-20 2001-05-29 Conexant Systems, Inc. Cellular radiotelephone having answering machine/voice memo capability with parameter-based speech compression and decompression
JP2002515610A (ja) * 1998-05-11 2002-05-28 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 位相変化からの雑音寄与度の決定に基づく音声符号化
US6430529B1 (en) * 1999-02-26 2002-08-06 Sony Corporation System and method for efficient time-domain aliasing cancellation
US6748363B1 (en) * 2000-06-28 2004-06-08 Texas Instruments Incorporated TI window compression/expansion method
US6707869B1 (en) * 2000-12-28 2004-03-16 Nortel Networks Limited Signal-processing apparatus with a filter of flexible window design
US7516064B2 (en) * 2004-02-19 2009-04-07 Dolby Laboratories Licensing Corporation Adaptive hybrid transform for signal analysis and synthesis
FR2870352B1 (fr) * 2004-05-14 2006-06-23 Thales Sa Procede de localisation d'un emetteur avec un reseau synthetique lacunaire d'antennes
WO2006110975A1 (en) * 2005-04-22 2006-10-26 Logovision Wireless Inc. Multimedia system for mobile client platforms
CN1862969B (zh) * 2005-05-11 2010-06-09 尼禄股份公司 自适应块长、常数变换音频解码方法
US8255207B2 (en) * 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
USRE50009E1 (en) * 2006-10-25 2024-06-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
US8214200B2 (en) * 2007-03-14 2012-07-03 Xfrm, Inc. Fast MDCT (modified discrete cosine transform) approximation of a windowed sinusoid
WO2009081003A1 (fr) * 2007-12-21 2009-07-02 France Telecom Codage/decodage par transformee, a fenetres adaptatives
RU2530327C2 (ru) 2008-07-29 2014-10-10 Франс Телеком Способ обновления кодера посредством интерполяции фильтра
KR101061723B1 (ko) * 2008-09-25 2011-09-02 (주)제너시스템즈 사운드 신호의 실시간 보간 장치 및 방법
CN101694773B (zh) * 2009-10-29 2011-06-22 北京理工大学 一种基于tda域的自适应窗切换方法
US9454511B2 (en) * 2011-05-04 2016-09-27 American University Windowing methods and systems for use in time-frequency analysis

Also Published As

Publication number Publication date
KR20140050056A (ko) 2014-04-28
FR2977969A1 (fr) 2013-01-18
KR20190124331A (ko) 2019-11-04
BR112014000611A2 (pt) 2017-02-14
CN103814406B (zh) 2016-05-11
KR102089281B1 (ko) 2020-03-16
WO2013007943A1 (fr) 2013-01-17
RU2607230C2 (ru) 2017-01-10
US20140142930A1 (en) 2014-05-22
US10373622B2 (en) 2019-08-06
JP2014524048A (ja) 2014-09-18
BR112014000611B1 (pt) 2021-09-08
US9368121B2 (en) 2016-06-14
MX2014000409A (es) 2014-09-15
ES2556268T3 (es) 2016-01-14
US20170011747A1 (en) 2017-01-12
BR122021011683B1 (pt) 2022-03-22
CA2841303C (fr) 2021-01-19
KR20190124332A (ko) 2019-11-04
EP2732448B1 (fr) 2015-09-09
EP2732448A1 (fr) 2014-05-21
RU2014104488A (ru) 2015-08-20
KR102089273B1 (ko) 2020-03-16
CN103814406A (zh) 2014-05-21
BR122021011692B1 (pt) 2022-03-22
CA2841303A1 (fr) 2013-01-17

Similar Documents

Publication Publication Date Title
JP6177239B2 (ja) 変換符号化または変換復号化のための分析重み付けウィンドウまたは合成重み付けウィンドウの適合化
US11646047B2 (en) Subband block based harmonic transposition
JP2010515106A (ja) 重み付けウィンドウを用いた低遅延変換符号化
CN108564958B (zh) 音频帧丢失隐藏
JP2004531151A (ja) 時間離散オーディオサンプル値を処理する方法と装置
KR20210114358A (ko) 오디오 데이터를 처리하기 위한 방법 및 장치
RU2530327C2 (ru) Способ обновления кодера посредством интерполяции фильтра
US6915319B1 (en) Method and apparatus for interpolating digital signal
JP5491193B2 (ja) 音声コード化の方法および装置
JP3731575B2 (ja) 符号化装置及び復号装置
KR20150048502A (ko) Qmf 필터링 방법 및 이를 수행하는 장치
AU2023202547B2 (en) Improved Subband Block Based Harmonic Transposition
KR100853690B1 (ko) 엠펙 오디오 디코더의 합성필터 및 그 디코딩 방법
JP2002026738A (ja) オーディオデータ復号処理装置および方法、ならびにオーディオデータ復号処理プログラムを記録したコンピュータ読取可能な記録媒体
TW202334938A (zh) 正交鏡像濾波器域中之沉浸式音訊及視訊服務空間重建濾波器庫
Vithalani et al. Wavelet based speech CODEC

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150701

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160825

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160926

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170612

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170711

R150 Certificate of patent or registration of utility model

Ref document number: 6177239

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250