JP6559658B2 - 低遅延符号化/復号のための音声信号のリサンプリング - Google Patents

低遅延符号化/復号のための音声信号のリサンプリング Download PDF

Info

Publication number
JP6559658B2
JP6559658B2 JP2016518091A JP2016518091A JP6559658B2 JP 6559658 B2 JP6559658 B2 JP 6559658B2 JP 2016518091 A JP2016518091 A JP 2016518091A JP 2016518091 A JP2016518091 A JP 2016518091A JP 6559658 B2 JP6559658 B2 JP 6559658B2
Authority
JP
Japan
Prior art keywords
resampling
signal
samples
filter
linear prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016518091A
Other languages
English (en)
Other versions
JP2016541004A5 (ja
JP2016541004A (ja
Inventor
バラーツ・コヴシー
ステファーヌ・ラゴ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Publication of JP2016541004A publication Critical patent/JP2016541004A/ja
Publication of JP2016541004A5 publication Critical patent/JP2016541004A5/ja
Application granted granted Critical
Publication of JP6559658B2 publication Critical patent/JP6559658B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/06Non-recursive filters
    • H03H17/0621Non-recursive filters with input-sampling frequency and output-delivery frequency which differ, e.g. extrapolation; Anti-aliasing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Analogue/Digital Conversion (AREA)

Description

本発明は、可聴周波数信号の伝送または格納のための可聴周波数信号の処理に関する。より具体的には、本発明は、可聴周波数信号のコード化または復号時のサンプリング周波数の変更に関する。
語音または音楽などの可聴周波数信号を圧縮する(損失を伴う)ための多くの技法がある。コード化は、例えば、ITU−T推奨G.711またはG.729(入力信号が8kHzでサンプリングされ、コーダおよびデコーダがこの同じ周波数で動作する)にあるような入力信号のサンプリング周波数で直接実行することができる。
しかし、いくつかのコード化方法は、サンプリング周波数の変更を使用して、例えば、コード化の複雑性を低減するか、コード化すべき異なる周波数サブバンドに従ってコード化を適応させるか、またはそれがコーダの事前に定義された内部サンプリング周波数と一致するように入力信号を変換する。
ITU−T推奨G.722で定義されるサブバンドコード化では、16kHzでの入力信号は、ADPCM(適応差分パルス符号変調)タイプのコーダによって別々にコード化される2つのサブバンド(8kHzでサンプリングされる)に分割される。この2つのサブバンドへの分割は、23次の有限インパルス応答(FIR)の二次モードミラーフィルタバンクによって行われ、それにより、理論上、16msで23個のサンプルの分析合成遅延(コーダ+デコーダ)が生じる。このフィルタバンクは、多相の実現によって実装される。G.722における2つのサブバンドへの分割により、既定の方法で、それらの先験的な知覚的重要度の関数として異なるビットレートを2つのサブバンドに割り当てることが可能になり、また、低周波数でADPCMタイプの2つのコーダを実行することによって全体的なコード化の複雑性を低減することも可能になる。しかし、それにより、直接のADPCMコード化と比べて、アルゴリズム遅延が引き起こされる。
例えば、非包括的な方法で、FIR(有限インパルス応答)フィルタ、IIR(無限インパルス応答)フィルタまたは多項式補間(スプラインを含む)を使用することによって、デジタル信号のサンプリング周波数を変更する(リサンプリングとも呼ばれる)ための様々な方法が知られている。従来のリサンプリング方法のレビューは、例えば、(非特許文献1)の論文に見ることができる。
FIRフィルタ(対称)の利点は、その簡略化された実装形態(ある条件付き)および線形位相を保証する可能性にある。線形位相フィルタリングは、入力信号の波形の保存を可能にするが、過渡信号上のプレエコータイプのアーチファクトを生成し得る時間的拡散(またはリンギング)を伴う可能性もある。この方法は、適切なフィルタリング特性(帯域幅におけるリップル、エイリアシングまたはスペクトル画像を取り除くのに十分な拒絶レベル、...)を保証するために、一般に、ほぼ1〜数ms程度の遅延(インパルス応答の長さによって決まる)を生じさせる。
IIRフィルタによるリサンプリングの代替形態は、一般に、MATLAB(登録商標)ソフトウェアの「iirgrpdelay」ルーチンにおける例示的な実現によって、例えば、(非特許文献2)の論文で説明されるように、位相が追加の全域通過フィルタリング段階によって補償されない限り、非線形位相につながる。IIRフィルタは、一般に、低次のものであるが、固定小数点表現における実装がより複雑であり、フィルタの状態(またはメモリ)は、帰納的部分に対して高い動的な値に達することができ、全域通過フィルタリングによる位相補償が使用される場合、この問題は拡大される。
図1は、16kHzから12.8kHzに変更するために64kHzで260+1=121個の係数の長さでFIRフィルタを用いた4/5の比率によるダウンサンプリングの例を示す。x軸は、時間(異なる周波数で時間が記録された信号を表すためにmsを単位とする)を表し、y軸は、振幅を表す。上部の正方形の印は、16kHzでの入力信号のサンプルの時間的位置を表す。ここでは、これらのサンプルは20msのフレームの終了に相当することが想定される。連続的な垂直線は、16kHzでの相当するサンプリング時点をマークする。図の下部では、垂直の点線は、12.8kHzでの相当するサンプリング時点をマークし、星印は、12.8kHzでの出力サンプルを象徴する。また、64kHzでのFIRフィルタの121個の係数のインパルス応答(対称)も表されており、この応答は、12.8kHzでの現フレームの最後のサンプルを計算するために位置付けられる(インパルス応答の最大値の位置はこのサンプルと位置合わせされる)。円形の印は、多相表現で使用された値(入力サンプリング時点に相当する)を示す。出力サンプルを得るため、相当する入力サンプルをこれらの値に乗じ、これらの結果を合計する。この図では、現フレームの終了後(次のフレームの開始時)の入力サンプルが未だ知られていないため、12.8kHzでの12個のサンプル(入力フレームの終了まで)を正確には計算できないことが認められよう。図1の条件でのダウンサンプリング遅延は、12個のサンプル(すなわち、12/12.8=0.9375ms)である。
FIRタイプのサンプリング周波数の変更による遅延を低減するための技法がある。
3GPP AMR−WB規格(ITU−T推奨G.722.2としても定義される)では、16kHzでサンプリングされた入力信号は、CELPタイプのコード化を適用する前に、12.8kHzの内部周波数でダウンサンプリングされる。次いで、12.8kHzで復号された信号は、16kHzでリサンプリングされ、高帯域信号と結合される。
12.8kHzの中間周波数を通過する利点は、CELPコード化の複雑性を低減すること、および2の累乗の倍数であるフレーム長を有することを可能にすることであり、それにより、あるCELPパラメータのコード化が容易になる。使用される方法は、複雑性を最小限に抑えるための多相の実現での、FIRフィルタ(64kHzでの121個の係数の)による4/5倍での従来のリサンプリングである。
理論上、コーダ上およびAMR−WBデコーダ上のこのリサンプリングは、図1で表される処理と同様な方法で遅延を生じるはずである。AMR−WBコーデックの事例では、121個の係数のFIRフィルタを用いると、総合遅延は、理論上、64kHzでの2×60個のサンプル(すなわち、16kHzでの2×15個のサンプルまたは1.875ms)であるはずである。実際には、特定の技法は、コーダ部分のみにおける関連遅延を取り除く(補償する)ために、AMR−WBコーダ上で実装され、従って実効遅延を2で除する。
この補償方法については、3GPP規格TS26.190の条項5.1およびITU−T推奨G.722.2の条項5.1で説明されている。FIRフィルタリング遅延を補償するための方法は、12.8kHzに変換すべき16kHzでサンプリングされた新しいフレームの各々に対して、現フレームの終了時に既定の数の0を加えることにある。これらの0は、入力サンプリング周波数で定義され、それらの数は、この周波数でのリサンプリングFIRフィルタの遅延に相当する(すなわち、16kHzでは15個の0が加えられる)。リサンプリングは、20msのフレーム(320個のサンプル)ごとに実装される。従って、AMR−WBコーダのリサンプリングは、左側には(過去に向かって)先行フレーム(リサンプリングメモリ)の終了から30個のサンプルで、かつ右側には15の0で、320個のサンプルの入力フレームを補完して、30+320+15=365個のサンプルのベクトルを形成し、次いで、それを4/5倍でリサンプリングすることに等しい。従って、将来のヌル信号が加えられるため、FIRフィルタは、ゼロ位相で(従って、遅延なしで)実装することができる。理論上、4/5倍によるFIRリサンプリングは、以下のステップに従って実行される。
− 各入力サンプル後に0の3つのサンプルを加えることによって4だけアップサンプリング(16kHzから64kHzへ)するステップ
− 64kHzで120次の対称FIRタイプの伝達関数Hdecim(z)をローパスフィルタリングするステップ
− ローパスフィルタリングされた信号から5つのサンプルのうちの1つのサンプルのみを保持することによって5だけダウンサンプリング(64kHzから12.8kHzへ)するステップ
実際には、このリサンプリングは、64kHzでの中間信号を計算することなく、および変換すべき信号を0と連結することなく(AMR−WBコーデックのソースコードの「decim54.c」ファイルを参照)、最適化された多相の実現に従って等しい方法で実装される。各「位相」に対するFIRフィルタリングは、12.8kHzでの12個のサンプル(すなわち、0.9375ms)の遅延を有する12.8kHzでの24次のFIRフィルタに等しい。
16kHzから12.8kHzへの20msの各フレームのFIRリサンプリングの結果は、次のフレームでのみ利用可能な「真」の将来の信号の代わりに将来の信号として0のブロックを使用することによるエラーを含む12.8kHzでの結果として得られた各フレームの最後の12個のサンプルを除いて、「完全な」入力信号(すなわち、フレームに細分されていない)上に形成されたリサンプリングと同一である。実際には、導入される0は、次のフレームにおけるヌル入力信号の事例をシミュレーションする。
この処理は、上部の正方形の印によって16kHzでの最後の入力サンプルを表す図2の20msのフレームの終了時に示されている。垂直線は、16kHzでの相当するサンプリング時点をマークする。図の下部では、星印は、12個のサンプルの遅延を有する従来のダウンサンプリングによって得ることができる12.8kHzでの出力サンプルを象徴する。次いで、下部の三角形の印は、フィルタリングの継続および遅延の低減を行えるようにフレームの終了時に加えられるヌル値の少なくとも1つのサンプルを使用することによって得られる12.8kHzでの12個のサンプルに相当する。これらのサンプルは、従来のフィルタリングで得られた出力の終了に対するそれらの位置に従って#1〜#12に番号付けられる。また、12.8kHzでの最後の出力サンプルに相当する位置で使用された64kHzでのフィルタのインパルス応答も表されている(インパルス応答の最大値はこのサンプルと位置合わせされる)。円形の印は、多相表現で使用される値(入力サンプリング時点に相当する)を示す。出力サンプルを得るため、相当する入力サンプルまたは0(フレームの終了後の値の場合)をこれらの値に乗じ、これらの結果を合計する。ここでは、この最後のサンプルに対して、加えられた0をインパルス応答から使用されたサンプルのほぼ半分に乗じるため、そのことが重大な推定エラーを招くことが分かる。また、従来のフィルタリング(すなわち、真の入力信号のみを有する)の後に生成された第1のサンプルのエラーは小さく(その終了時のインパルス応答の重みは低く)、従来のフィルタリングからの距離の増大と共にエラーは大きくなる(次いで、インパルス応答の重みは大きくなる)ことも理解されよう。そのことは、図7の結果において観察することができる。
リサンプリングすべき20msの各ブロック(またはフレーム)の終了時に0が加えられる、AMR−WBコーデックで使用される遅延補償方法は、コーダ上のリサンプリング遅延を取り除くことを可能にするが、現フレームの終了時に生成された値(入力において0が加えられた)が直接コード化され、次のフレームの入力信号が知られた時点で真の値に置き換えられない際は、一般に、満足できるものではない。実際には、各フレームの終了時のこれらの通常のエラーは、次のフレームの開始時の真の出力信号への移行期の周期的な不連続性を生成する。これらの不連続性は、聞き取れるものであり、非常に不快である場合が多い。これが、遅延補償がコーダにのみおよび将来の信号部分(ルックアヘッドと呼ばれる)にのみ適用され、AMR−WBデコーダには適用されない理由である。
実際には、AMR−WBコーダでは、16kHzでの新しい20msの入力フレームの各々は、ACELPモデルによってコード化すべき現フレームの最後の15msおよび将来の信号(またはルックアヘッド)の5msに相当する時間セグメントに相当する。コード化すべき現フレームの最初の5msは、既に受信され、先行セグメントの「ルックアヘッド」として格納されている。従って、コーダ上で16kHzから12.8kHzへのリサンプリング後に得られる最後の12個のサンプルは、12.8kHzでの将来の信号の最後のサンプルに相当する。結果的に、12.8kHzでの20ms(すなわち、256個のサンプル)の現フレームおよび将来の信号の5ms(すなわち、64個のサンプル)は、同じ長さのLPC分析ウィンドウによって重み付けされる384個のサンプル(30ms)のLPC分析バッファを形成するために、過去のオリジナル信号(ループバック)の5msで補完される。
リサンプリングエラーを含む12.8kHzでの「ルックアヘッド」の最後の12個のサンプルは、線形予測(LPC)のために使用されるウィンドウにおいて非常に低い相対重みを有し、さらに有力な理由をもって、それらは、推定LPCエンベロープにのみ影響を及ぼし、この影響はごくわずかである。12個の誤ったサンプルは、次のフレーム上で「正確な」リサンプリング値に置き換えることができ、従って、エラーは、将来の信号(ルックアヘッド)のために現フレームに一時的にしか存在せず、LPC分析にのみ影響を及ぼすことに留意することが重要である。従って、AMR−WBコーダの遅延補償技法は、AMR−WBコーデックの現フレームの信号の波形のコード化に影響を及ぼさない。このモードは、以下では、「将来の信号を有するフレームによる使用」と呼ばれる。こうして生成されたサンプルは、中間計算(LPC分析)のために一時的にしか使用されず、次のフレームの信号が知られている際には、正しくリサンプリングされたサンプルに置き換えられる。この構成では、各フレームに対する長さがlg_outの出力フレームに対して、lg_out+12個のサンプルがリサンプリングによって生成されることが述べられよう。
AMR−WBコーダ上で使用されるこの遅延補償技法は、AMR−WBデコーダには適用されない。
従って、コーデック(コーダ+デコーダ)は、コーダ(20msのフレーム+5msのルックアヘッド)およびデコーダ上のリサンプリング(0.9375ms)に起因する25.9375msの総合アルゴリズム遅延を有する。
AMR−WBコーダの遅延補償技法は、コード化信号の質を大いに劣化させるため、G.722コーデックのQMFフィルタリング遅延を低減するために使用できない。実際には、G.722コーデックでは、フィルタリングから得られたサンプル(低帯域および高帯域信号)は、「ルックアヘッド」なしで動作し、あるフレームから別のフレームにこれらの値を訂正することを可能にしない、2つのADPCMサブコーデックの入力信号を直接構成する。このモードは、以下では、「連続的なフレーム単位での使用」と呼ばれる。
R.W.Schafer,L.R.Rabiner,A Digital Signal Processing Approach to Interpolation,Proceedings of the IEEE,vol.61,no.6,June 1973,pp.692−702 P.A.Regalia,S.K.Mitra,P.P.Vaidyanathan,The Digital All−Pass Filter:A Versatile Signal Processing Building Block,Proceedings of the IEEE,vol.76,no.1,Jan.1988
本発明は、先行技術の状況を改善する。
この目的を達成するため、本発明は、可聴周波数信号コード化または復号において可聴周波数信号をリサンプリングするための方法を提案する。方法は、リサンプリングすべき各信号ブロックに対して以下のステップ:
− 適応線形予測によって、或る数の将来の信号サンプルを決定するステップであって、この数が、選ばれたリサンプリング遅延の関数として定義される、ステップと、
− 少なくとも現ブロックのサンプルおよび決定された将来の信号サンプルからリサンプリングサポートベクトルを構築するステップと、
− リサンプリングサポートベクトルのサンプルにリサンプリングフィルタを適用するステップと
を含むものである。
従って、本発明によるリサンプリングは、性能レベルを連続的なリサンプリングに非常に近い状態に維持しながら、フィルタによってリサンプリング遅延を低減すること(ブロックごとまたはフレームごと)を可能にする。各ブロックまたはフレームの将来の信号の予測は、これらの将来のサンプルがヌル値で設定された場合よりも実際のサンプルに近いサンプルを有することを可能にする。従って、これらの後者のサンプルのためのリサンプリングプロセスの性能は、より良いものである。
このリサンプリング方法は、所望の遅延の関数として考慮すべき将来の信号サンプルの数を適応させることが可能であるため、適応できるものでもある。遅延なしのリサンプリングの場合、決定すべき将来の信号サンプルの数は、リサンプリングフィルタの遅延に相当する。フィルタの遅延より低い遅延が許容される場合、将来の信号サンプルの数は、リサンプリングフィルタの遅延のごく一部に相当し得る。
信号ブロックごとに実行されるリサンプリング遅延の適応により、異なるリサンプリング構成(この目的で使用されるFIRフィルタを含む)間で、あるブロックから別のブロックにまたはあるフレームから別のフレームに、容易に切り替えること、あるいは、あるサンプリング周波数での所定のフレームの直接コード化からリサンプリングによる次のフレームのコード化に切り替える(または逆も同様)ことが可能である。
以下で述べられる様々な特定の実施形態は、独立してまたは互いに組み合わせて、上記で定義されるリサンプリング方法のステップに追加することができる。
簡単な実施形態では、適応線形予測によって決定するステップは、以下のステップ:
− 既定の次数の線形予測フィルタの係数を得るステップと、
− 得られた予測フィルタをヌル値の励起信号に適用することによって将来の信号サンプルを得るステップと
を含む。
特定の実施形態では、線形予測フィルタの係数は、コード化または復号ステップで格納されたパラメータを読み取ることによって得られる。
従って、コード化モジュールが、リサンプリングデバイスとは無関係に、予測フィルタのパラメータを既に決定しているLPC分析を含む際は、リサンプリング方法においてこれらのパラメータを再計算する必要はない。格納されている(定量化されているかどうかを問わない)パラメータを読み取るだけで十分である。
別の実施形態では、線形予測フィルタの係数は、少なくとも現ブロックのサンプルからの分析によって得られる。
次いで、LPC分析は、リサンプリングデバイスで直接行われる。
例示的な実施形態では、線形予測は、プリエンファシス処理が実行されている可聴周波数信号上で実行される。
プリエンファシスは、特に、強い傾斜およびスペクトル力学を有する信号に対して、固定小数点表現実装形態におけるより良いデジタル安定性を確保することを可能にする。それは、信号のスペクトル力学を低減し、従って、周波数帯域上の信号の電力の分布は、プリエンファシス後により一様になる。プリエンファシス後のモデリングパラメータは、より低い力学を有し、システムの安定性を確保することが容易であり、固定小数点表現算術を用いてこのモデルを使用してアルゴリズムを実装することも容易である。
可能な実施形態では、適応線形予測は、以下の方法:
− 短期線形予測、
− 長期線形予測、
− 短期線形予測と長期線形予測との組合せ、
− 消去フレーム隠蔽プロセス
のうちの1つからの予測である。
従って、有利な信号対雑音比における有効性を確保する一方で、方法の実装のためのより多くのまたはより少ない正確な予測タイプが可能である。
また、本発明は、可聴周波数信号コーダまたはデコーダにおいて可聴周波数信号をリサンプリングするためのデバイスも対象とする。デバイスは、
− 各信号ブロックに対して、選ばれたリサンプリング遅延の関数として定義される或る数の将来の信号サンプルを決定するのに適した適応線形予測モジュールと、
− 少なくとも現ブロックのサンプルおよび決定された将来の信号サンプルからリサンプリングサポートベクトルを構築するためのモジュールと、
− リサンプリングサポートベクトルのサンプルに適用されるリサンプリングフィルタと
を備えるものである。
このデバイスは、それが実装する、上記に説明される方法と同じ利点を提供する。
特定の実施形態では、適応線形予測モジュールは、コーダまたはデコーダの予測コード化または復号モジュールに含まれる予測分析モジュールと協働する。
従って、いかなるLPC分析モジュールも含む必要がないため、リサンプリングデバイスの複雑性が低減される。コード化または復号モジュールの分析モジュールから得られたパラメータは、コード化または復号中に格納され、従って、リサンプリングにおいて使用することができる。
また、本発明は、説明されるような少なくとも1つのリサンプリングデバイスを備える可聴周波数信号コーダおよびデコーダも対象とする。
特定の実施形態では、コーダまたはデコーダは、異なる遅延を有する少なくとも2つのリサンプリングフィルタを使用するリサンプリングデバイスであって、将来の信号サンプルの数の決定が使用される2つのリサンプリングフィルタの遅延差の関数である上記に説明されるような方法に従ってフィルタの少なくとも1つが実装される、リサンプリングデバイスを備える。
リサンプリングフィルタは異なるコード化モードと関連付けられる場合が多いため、この実施形態は、いかなる可聴アーチファクトも存在することなく、あるコード化モードから別のコード化モードに容易に切り替えることを可能にする。
本発明は、コード命令であって、これらの命令がプロセッサによって実行される際に、説明されるようなリサンプリング方法のステップを実装するためのコード命令を含むコンピュータプログラムを対象とする。
最後に、本発明は、上記に説明されるようなリサンプリング方法を実装するコンピュータプログラムを格納するプロセッサ可読記憶媒体(リサンプリングデバイスに組み込まれているかどうかを問わない、取り外し可能もあり得る)に関する。
本発明の他の特徴および利点は、単に非限定的な例として与えられる以下の説明を読み進め、添付の図面を参照することでより明確に明らかになるであろう。
上記に説明されるような先行技術方法のリサンプリングフィルタのインパルス応答を示す。 上記に説明されるような0による遅延の補償を伴う先行技術方法のリサンプリングフィルタのインパルス応答を示す。 本発明の実施形態によるリサンプリングデバイスを備える例示的な音声信号コーダを示す。 本発明の実施形態によるリサンプリング方法のステップをフロー図の形態で示す。 本発明によるリサンプリング方法の異なる実施形態のステップをフロー図の形態で示す。 本発明の実施形態によるプリエンファシスファクタを決定するステップの詳細をフロー図の形態で示す。 本発明の実施形態による線形予測ステップの詳細をフロー図の形態で示す。 本発明の実施形態で使用された分析ウィンドウの形態を示す。 リサンプリングすべき現信号フレームに続く異なるサンプル位置に対する、AMR−WBコーダで実装された先行技術のリサンプリング方法ならびに本発明の第1および第2の実施形態によるリサンプリング方法のテスト信号への適用によって得られた中心周波数の関数としての信号対雑音比の比較を示す。 リサンプリングすべき現信号フレームに続く異なるサンプル位置に対する、AMR−WBコーダで実装された先行技術のリサンプリング方法ならびに本発明の第1および第2の実施形態によるリサンプリング方法によるリサンプリング周波数の変更の3つの異なる事例に対する信号対雑音比の比較を示す。 本発明の実施形態によるリサンプリングデバイスを備える音声信号デコーダの例を示す。 本発明の実施形態によるリサンプリングデバイスの物理的表現を示す。
図3は、本発明の実施形態によるリサンプリングデバイス300を備える音声コーダの例を示す。
ここで示されるコーデックは、8、16、32または48kHzの入力および出力サンプリング周波数で動作するマルチビットレート(7.2〜128kbit/sで設定されたビットレートで)の音声信号(モノラル)のコーダである。第1に、図3で表されるコーダ部分に関心が集められ、関連デコーダについては、図9と併せて後に説明する。
入力信号は、20msのフレームに分割され(ブロック310)、各フレームは、多重化モジュール313によって多重化される前に、CELPタイプの時間領域(TD)手法(309)に従って、またはMDCTタイプの周波数領域(FD)手法(ブロック312)に従ってコード化することができる。ここでは、CELPおよびMDCTタイプのコード化は当業者に知られていると考えられる。内部コード化周波数のものを含むモードの選択(ブロック311)は、ここでは詳述しない。
ビットレートおよびサンプリング周波数において柔軟であるこのコーデックでは、周波数「fOut」(出力の場合はOut)での周波数「fIn」(入力の場合はIn)のリサンプリング構成の数が必要である。ここで説明される実施形態では、使用された構成を以下の表1に列挙する。
Figure 0006559658
この表では、太字の周波数値は、コーデックの「外部」周波数(すなわち、入力および/または出力周波数)を示し、他の周波数値は、低帯域の信号のコード化のための「内部」サンプリング周波数であり、16kHzでの1つの外部周波数および12.8kHzでの1つの内部周波数しか有さないAMR−WBコード化と同様の方法である。「filt_lenin」は、フィルタの長さを表し、「fac_num」は、アップサンプリングファクタを表し、「fac_den」は、ダウンサンプリングファクタを表す。
一般性を失うことなく、FIRフィルタは、ここに示される例では、カーディナルサイン(sin(x)/x)のウィンドウイングを伴うため、「ウィンドウ方法」と呼ばれる従来の方法に従って設計される。FIRフィルタは、例えば、以下で説明されるように設計される。
例えば、フィルタf_5_8_129は、以下のmatlabコマンドによって得られる。
f_5_8_129=[0 0 0 0 fir1(248,(3775/32000),hanning(249))4.999895 0 0 0 0];
3775Hzの64kHzでのカットオフ周波数(−6dB)を用いる。
これらの係数は、8000Hzでの16個の係数(すなわち、64000Hzでの128個の係数)のフィルタとして、および12800Hzでの24個の係数(すなわち、64000Hzでの120個の係数、最後の値を無視する)のフィルタとして使用される。
フィルタf_12_180は、以下のmatlabコマンドによって得られる。
ftmp=fir1(358,1/12,hanning(359));
f_12_180=[0 ftmp/ftmp(180)0];
8000Hzの192kHzでのカットオフ周波数(−6dB)を用いる。
フィルタf_15_180は、以下のmatlabコマンドによって得られる。
ftmp=fir1(358,1/15,hanning(359));
f_12_180=[0 ftmp/ftmp(180)0];
6400Hzの192kHzでのカットオフ周波数(−6dB)を用いる。
本発明の変形形態では、当然ながら、他のFIRフィルタ設計方法を使用することができる。
これらの変換構成は、一般性を失うことなく、コード化アルゴリズムにおいて2つの内部周波数12.8kHzおよび16kHzを使用することによって、ここで正当化される。内部サンプリング周波数(12.8または16kHz)の選択が行われる方法も、採用すべきコード化のタイプの選択(ブロック311)が行われる方法も、ここでは詳述しない。それは本発明の範囲を超えている。しかし、コーデックの同じ入力および/または出力周波数に対して、各フレームで独立して内部周波数の選択を行うことができ、それは、例えば、フレームNでは、構成iによるリサンプリングの使用が可能であり、フレームN+1では、構成iとは異なる構成j(ただし、同じ「外部」周波数を有する)によるリサンプリングの使用が可能であり、フレームN+2では、リサンプリングの使用が可能でない(入力周波数fInでのフレームの直接コード化を意味する)ことを意味することが留意され、実際には、この最後の事例は、以下の状況:
・ 選ばれたコード化モードが、周波数fInで常に動作するFDタイプのコード化である場合、
・ 選ばれたコード化モードがTDコード化であり、入力周波数fInが内部TDコード化周波数に相当する場合
でのみ、好ましい実施形態で可能である。
しかし、本発明の変形形態では、その切り替えを容易にするために、TDコード化と同じ内部コード化周波数で動作することをFDタイプのコード化に強制することができるであろう。
TDコード化からFDコード化への移行(および逆も同様)については、本発明の範囲を超えるため、ここでは説明されないことに留意されたい。
入力信号のサンプリング周波数fInが内部コード化サンプリング周波数より大きい際は、コード化アルゴリズムTD CODまたはFC CODは、高帯域(6.4または7kHzより大きい周波数)の信号のコード化を提供し、この高帯域のコード化は、ここでは詳述しない。
従って、コーダは、多くのFIRフィルタ係数構成(ブロック305)で動作できるため、パラメータ化可能なリサンプリングフィルタを含むリサンプリングデバイス300を備える。以下で説明される実施形態では、リサンプリングフィルタは、多相フィルタである。本発明は、FIRフィルタによる他のタイプのリサンプリングの実装形態にも適用され、例えば、多相表現を伴わない非最適な複雑性のリサンプリングフィルタなどが挙げられる。そのうえ、本発明は、他のサンプリング周波数変換率に対しても適用される。
最初の3つの構成(番号1〜3)を除いて、他のすべての構成は、0.9375msの遅延(12.8kHzでの12個のサンプル、16kHzでの15個のサンプル、32kHzでの30個のサンプルおよび48kHzでの45個のサンプル)を有するFIRタイプの多相フィルタを使用する。
構成4〜13の多相リサンプリングフィルタリング(ブロック305)は、ITU−T G.718コーデックで定義されたFIRによる多相リサンプリングから得られたアルゴリズムに従って実行される(「modify_fs.c」ファイルのG.718のソースコードにおける実現を参照)。
ここでは、8000Hzの「外部」サンプリング周波数を伴う最初の3つの構成に関心が集められる。これらの構成の場合、より長いFIRフィルタが、適切なフィルタリング性能を有するために必要であり、特に、耳が非常に敏感な周波数で起こり得るスペクトル画像またはスペクトルエイリアシングの十分な拒絶を保証するために必要である。
本発明のリサンプリング方法を実装しなければ、これらの3つの構成は、通常、8000Hzから12800Hzへのリサンプリングの場合は12.8kHzでの25個のサンプルの遅延を、12800Hzから8000Hzへのリサンプリングの場合は8kHzでの15個のサンプルの遅延を、16000Hzから8000Hzへのリサンプリングを生じさせることになる。一般に、出力サンプリング周波数での遅延は、四捨五入してfilt_lenfac_num/fac_den未満の整数にし、filt_lenはフィルタの長さであり、fac_numはアップサンプリングファクタであり、fac_denはダウンサンプリングファクタ(表1も参照)であるが、サンプルの半分の何分の1かの遅延を考慮することも可能になるであろう。
リサンプリングデバイス300における、本発明によるならびに図4aおよび4bを参照して以下で説明されるリサンプリング方法の実装は、このコーダの事例では、以下を可能にする。
− 他の変換構成4〜13(0.9375msの遅延を有する)と同一の遅延を得るために、構成1〜3の実効遅延を制限すること。これを行うため、リサンプリングデバイスは、各信号フレームに対して、選ばれたリサンプリング遅延の関数として定義される或る数の将来の信号サンプルを決定するのに適した適応線形予測モジュール301を備える。サンプルの数は、理論上、パラメータ化可能であるが、実際には、定義されたコーデック構成に対して一定に保たれることが述べられよう。
− 理論的な関連遅延が異なる場合であっても、すべての定義されたリサンプリング構成を切り替えられるようにすること。
表1では説明されない本発明の特定の実施形態では、コーダは、異なる遅延を生じさせる多くの(少なくとも2つの)多相FIRリサンプリングフィルタを備え得る。例えば、マルチビットレートコーダでは、常に16000Hzである入力に対して、ビットレートに応じて2つの異なる内部周波数コード化コアを使用することが可能である(低ビットレートの場合は8000Hzおよび高ビットレートの場合は12800Hz)。十分なフィルタリング性能レベルを有するため、特に、スペクトル画像またはスペクトルエイリアシングの十分な拒絶を保証するため、16000Hzから8000Hzへのリサンプリングには、16000Hzから12800Hzへのリサンプリングより長いFIRフィルタが必要とされる。従って、これらの2つのフィルタリングは、異なる遅延を有する。アーチファクトなしでこれらの2つのコード化モード間で切り替えられるようにするため(ビットレートを変更する場合)、これらの遅延を調和(等しく)しなければならない。リサンプリングFIRフィルタの長さが16000Hzから8000Hzに低減される場合、スペクトルエイリアシングが十分にうまく減衰されなくなり、聞き取れるようになるため、質は一般に劣化する。リサンプリングFIRフィルタの長さが16000Hzから12800Hzに増加されるか、または追加の遅延がリサンプリングされた信号に適用される場合、コード化/復号の全体的な遅延が増大し、それにより、双方向性が妨げられ得る。
本発明のリサンプリング方法を使用することによって、オリジナルのフィルタリングに比べて、質を著しく損失することなく、より長いFIRフィルタリングの遅延をより短いフィルタリング遅延のレベルに低減することが可能である。実際には、シミュレーション結果は、通常のフィルタリングと本発明による低遅延フィルタリングとの間で信号対雑音比が非常に高いことを示している。また、通常のフィルタリングおよび本発明による低遅延フィルタリングで得られた信号間の差は聞き取れないことが試聴テストによっても立証されている。
従って、ここで提示される事例では、コーダは(またはデコーダでさえも)、異なる遅延を有する2つの多相リサンプリングフィルタを備える。リサンプリングフィルタの少なくとも1つは、将来の信号サンプルの数の決定が、2つのデバイスで使用される2つのリサンプリングフィルタの遅延差の関数である、本発明に従って上記に説明されるように実装されたフィルタである。
例えば、表1では、16000Hzの外部周波数ならびに8000Hzおよび12800Hzの内部周波数に対して、構成3〜7を使用することができる。この事例では、入力周波数(filt_len)での遅延は、30個および15個のサンプルのそれぞれであることが分かる。従って、構成3の遅延を構成7の遅延のレベルに低減できるように差(すなわち、16000Hzでの15個のサンプル)を予測することが必要である。後に詳述される本発明は、構成3の遅延を低減するため、ならびに構成3および構成7が透過的に交互に起こることができるようにするために使用できるが、それは、その後に同じ15個のサンプルの遅延を有するようにするためである。
図3のコーダおよび表1に列挙された構成の例に戻るため、
8000Hzから12800Hzへのリサンプリングの場合は、25個から12個のサンプルに遅延を低減すること(すなわち、12800Hzでのplus_sample_out=13個の追加サンプルを生成すること。これには、8000Hzでのplus_sample_in=8個のサンプルの外挿が必要である)が必要であり、
12800Hzから8000Hzへのリサンプリングの場合は、15個から7個のサンプルに遅延を低減すること(すなわち、8000Hzでのplus_sample_out=8個の追加サンプルを生成すること。これには、12800Hzでのplus_sample_in=12個のサンプルの外挿が必要である)が必要であり、
16000Hzから8000Hzへのリサンプリングの場合は、15個から7個のサンプルに遅延を低減すること(すなわち、8000Hzでのplus_sample_out=8個の追加サンプルを生成すること。これには、16000Hzでのplus_sample_in=15個のサンプルの外挿が必要である)が必要である。8000Hzでは、0.9375msは7.5個のサンプルに相当し、7.5個のサンプルは切り捨てて7個のサンプルにしていることに留意すべきである。
図3に示されるリサンプリングデバイス300は、入力として音声信号ブロックを受信し、この実施形態では、それらは、過去のフレームからのサンプルセットもメモリに有するブロック310によって受信された20msのフレームである。
このリサンプリングデバイスは、各信号ブロックまたはフレームに対して、選ばれたリサンプリング遅延の関数として定義される或る数の将来の信号サンプルを決定するのに適した適応線形予測モジュール301を備える。
この予測された或る数の将来の信号サンプルは、リサンプリングサポートベクトルを構築するためのモジュール304によって定義されるリサンプリングサポートを決定するために使用される。このリサンプリングサポートベクトルは、例えば、可能な過去の信号サンプル、現ブロックまたはフレームからのサンプル、およびモジュール301によって予測された将来の信号サンプルを連結したものである。過去の信号サンプルは、リサンプリングFIRフィルタのためのメモリとして機能する。
それにもかかわらず、このサポートベクトルの構築は、以下の実装形態も含む。
− 過去の信号は、リサンプリングFIRフィルタのメモリに格納することができ、従って、現フレームのサンプルとは直接連結されない(しかし、現フレームの信号は、まさに過去の信号を含むこれらのメモリの連続性である)。
− 予測された将来の信号は、別々のベクトルに格納することもでき、そのリサンプリングは、必要なメモリが正しく更新される限り、現フレームの信号のものとは別々に行うことができる。将来の信号の別々のリサンプリングの事例では、リサンプリングフィルタのメモリは、現フレームの最新のサンプルによって初期化される。ここでもまた、この分離にもかかわらず、予測された将来の信号は、まさに現フレームの信号の連続である。
本明細書では、一般性を失うことなく、「サポートベクトルの構築」という用語は、同じベクトルにおいて実際には信号が次々とコピーされることはないが、異なるベクトルに格納される事例も包含する。
次いで、所望の出力周波数でリサンプリングされた信号を得るため、フィルタ305がこのリサンプリングサポートベクトルに適用される。
線形予測モジュール301は、図4aに関連して後で説明されるように線形予測フィルタの係数を決定するのに適した短期予測分析モジュール302(LPC)を備え得る。このLPC分析モジュール(302b)は、別の有利な実施形態では、TDタイプの時間コード化(例えば、CELPコード化)の予測コード化モジュール309に含めることができる。従って、リサンプリングデバイスに役立つ将来のサンプルを予測する目的および伝送前に信号をコード化する目的の両方で、同じ分析モジュールを使用することができる。従って、これは、コード化モジュールの分析モジュールと協働するリサンプリングデバイスの複雑性を低減する。
モジュール301は、将来のサンプルのセットbuffutを得るために、ヌル信号の1/A(z)フィルタリングによる予測フィルタリングモジュール303をさらに備える。
従って、図4aは、本発明の実施形態によるリサンプリング方法の主なステップを示す。
この方法のステップは、入力(BufIn)として、入力サンプリング周波数fInでのlgのサンプルのフレームによって実装される。メモリを通じてこの入力信号の過去のサンプルへのアクセスもある。この入力信号から、ステップE401は、所望の遅延の関数として予測すべきサンプルの数plus_sample_inを決定し、線形予測によって、この数の将来の信号サンプルを予測する。この予測の結果は、リサンプリングサポートベクトルを構築するステップE402において入力信号(現フレームおよびメモリの過去のフレーム)上で連結される。従って、このサポートベクトルは、一実施形態では、過去の信号のサンプル、現フレームのサンプルおよび決定された将来の信号サンプルを連結したものである。
ステップE403では、リサンプリングフィルタリングは、例えば、有限インパルス応答(FIR)で、リサンプリングサポートベクトルのサンプルにリサンプリングフィルタを適用することによって実行され、リサンプリングされた信号bufoutは、出力リサンプリング周波数fOutで、出力として供給される。
次いで、以下のような多くの事例が可能である。
− 連続的なフレーム単位での使用の事例(入力としてlgのサンプル)では、最後のlg_out=lgfac_num/fac_denのサンプルのみが計算される。
− より多くのサンプルを得なければならない事例(将来の信号を有するフレームごとに使用)(入力としてlg+plus_sample_inのサンプル)では、AMR−WB規格のコーダの事例と同様に、lg_out+plus_sample_outのサンプルが計算され、式中、plus_sample_out=plus_sample_infac_num/fac_denである。実際には、AMR−WBコーダでは、20msの現フレームがリサンプリングされ、15個の追加のサンプルがリサンプリングされる。第1のステップは、第2のステップで実行されるリサンプリングからのエラーを置き換える。この例では、lg=320、plus_sample_in=15である。
− 使用は、例えば、メモリ(信号の断片またはブロック)がリサンプリングされる際は(例えば、2つのコード化モード間で切り替える事例では)、1回限りのものでもあり得る。この事例では、リサンプリング入力は、フレーム(例えば、20msの)ではなく、信号ブロックである。本発明を適用するため、変換すべき過去のブロックまたは過去から既に事前に計算されているLPCモデルを有することが必須であることに留意することが重要である。線形予測を既に使用しているTDタイプのコード化を用いると、各フレームにおいてTDコーダおよび/またはデコーダで計算されたおよび/またはコード化されたパラメータ(LPCまたは同等の係数)を格納することが一般に可能であることが述べられよう。従って、本発明の変形形態では、これらのLPCパラメータを再利用することができ、それにより、格納された値(恐らく定量化されている)の簡単な検索を伴うようになるため、ブロック302の実装が簡略化される。
並行して、E405において、リサンプリングフィルタのメモリが更新される。前と同じように、以下のような多くの事例が可能である。
− 生成すべきより多くのサンプルを用いた連続的な使用の事例では、AMR−WB規格の事例と同様に、入力フレームの最後のmem_lenのサンプルは、予測されたサンプルなしで格納される:mem_sig(0...mem_len−1)=frame(lg−mem_len...lg−1)。
リサンプリングが再開され次第、出力サンプリング周波数で得られたサンプルは、予測された入力信号を使用することによって得られたサンプルを置き換える。
− 連続的なフレーム単位での使用の事例では、予測された入力信号を使用することによって得られたサンプルは置き換えられず、lg_outのサンプルのみが出力サンプリング周波数で計算される。新しいフレームがインデックスlg+plus_sample_inのサンプルから始まると見なされる場合、リサンプリングFIRフィルタのメモリは、インデックス(lg...lg+plus_sample_in−1)のこのメモリの一部が真の信号または予測された信号であり得る、インデックス(lg+plus_sample_in−mem_len...lg+plus_sample_in−1)の過去のサンプルから構成される。真の信号を使用することで、第1のサンプルは、予測なしでフィルタリングによって得られたもの(最適なものと見なされた結果)に等しいが、先行フレームの間に予測で得られた最後のサンプルと真の信号で得られた第1のサンプルとの間では、小さな不連続性を有する可能性がある。メモリの予測された信号の使用の事例では、不連続性はないが、わずかなエラーが別のfilt_lenのサンプルに広がる。好ましい実施形態では、このわずかな不連続性は聞き取れないため、第1の解決策が使用される。
− 1回限りの使用の事例では、リサンプリング後のメモリ更新は必要ではないが、相当する過去の入力信号を用いて、リサンプリング動作の前に、リサンプリングメモリを初期化しなければならない。
変形形態では、将来の信号を予測するために使用されるLPC分析は、現フレームの信号上で直接実行されることはないが、1−μ.z−1の形態のフィルタによる現フレームのフィルタリングから得られたプリエンファシスされた信号上で実行され、式中、μは、適応して計算されるかまたは既定の値で設定される。この変形形態は、図4bに示される。図4aに比べて、プリエンファシスファクタμを決定するステップE406が追加されている。このファクタμを使用することによって、入力信号は、このステップE407において、1−μ.z−1フィルタリングによってプリエンファシスされる。このフィルタリングはメモリサンプルを必要とし、従って、この変形形態では、メモリのサイズが1だけ増大されることに留意すべきである。プリエンファシスされる信号は、ステップE401およびE402の入力である。次いで、連結された信号は、ステップE408において、1/(1−μz−1)フィルタリングによって同じファクタμを使用することによってデエンファシスされる。所定の信号に対して、同じファクタμによるデエンファシスが続くLPC分析の前のプリエンファシスのシーケンシングが透過的であること、すなわち、正確に入力信号が回収されることに留意すべきである。従って、信号がプリエンファシス前に格納される場合、計算複雑性を低減するために、予測された部分のみをデエンファシスしなければならない。次いで、このデエンファシスされた予測された部分は、リサンプリングサポートベクトルを形成するために、格納された信号上で連結される。
値が−1〜1であるプリエンファシスファクタμを決定するための多くの技法がある。
− μは一定であり得る(例えば、μ=0.68)、
− μは一定であり得る(入力サンプリング周波数によって決まる)、
− μはスペクトルの傾きの分析に従って適応できるものであり得る(先行技術から知られている方法)。
図5aは、プリエンファシスファクタを決定する図4bのこのステップE406を示す。ステップE501では、信号は分析ウィンドウによってウィンドウ表示される。ステップE502では、次数M=1(r(0)およびr(1))の自己相関が計算され、ステップE503では、雑音閾値(またはノイズフロア)がr(0)に適用され、低レベル入力信号の演算問題が回避される。
雑音閾値の適用の自己相関のこれらのステップについては、例えば、ITU−T推奨G.729のサブセクション3.2.1で説明されている。
シフトk=0,...,Mに対する長さLのウィンドウでの自己相関r(k)の計算は、以下の形態である。
Figure 0006559658
式中、S(n)=s(n).w(n)およびs(n)は、現フレームの信号および恐らくは過去の信号(長さLが現フレームの長さより大きい場合)の最後のL個のサンプルに相当する。
好ましい実施形態では、LPCウィンドウw(n)長さL=240が使用され、その例は、図6に示されている。
このウィンドウの形態は非対称であり、重みはそのサポートの端に集中される(最新のサンプル上で)ことが分かる。L=240のこのウィンドウを構築するためのmatlabコマンドは、例えば、以下の通りである。
Figure 0006559658
本発明の変形形態では、LPC次数Mの他の値、LPCウィンドウの他の形態および長さは、本発明の本質を変更することなく、使用することができるであろう。「ノイズフロア」は、第1の相関係数にファクタ>1を乗じることによってまたはこの第1の係数の値を最小値に制限することによって、従来の方法で使用することができるであろう。
最後に、ステップE504において、μ=r(1)/r(0)としてファクタが計算される。
図5bは、本発明による将来のサンプルを決定するための線形予測の図4のステップE401の実施形態についてより詳細に説明する。
例えば、このステップE401は、現フレームのサンプルおよび恐らくは先行フレームのサンプルから既定の次数の線形予測フィルタの係数を計算するステップE506と、計算された予測フィルタをヌル値の励起信号に適用することによって将来の信号サンプルを得るステップE507とを含み得る。
図5aおよび5bのステップE501、E502およびE503は、同様のものであるが、異なる予測次数Mを有する。分析ウィンドウの形態もしくは長さまたはさらに「ノイズフロア」などの他のパラメータもまた異なり得る。両方の事例では、共通のモジュールを使用して複雑性を低減することができる。
より具体的には、ステップE501では、入力信号(プリエンファシスされているかどうかを問わない)がウィンドウ表示される。例えば、図6に示されるものと同じタイプのウィンドウを使用することが可能である。例えば、G.729規格のサブセクション3.2で説明されるように、E502では、選ばれた次数(例えば、M=10)で自己相関関数が計算され、ステップE503では、ノイズフロアがr(0)に適用される。
ステップE505では、G.729規格のサブセクション3.2.1でも明白に説明されている、「ラグウィンドウイング」(当業者に知られている方法)と呼ばれるステップが実行される。
入力サンプリング周波数(fIn)に対する「ラグウィンドウイング」のこのステップは、以下の形態である。
r(i)=r(i)lag(i)、i=0,...,M
式中、係数wlag(i)は、以下のように定義される。
Figure 0006559658
式中、f=fInは、リサンプリングすべき信号の周波数であり、例えば、f=60Hzである。
ステップE506(図3のモジュール302によって実装される)では、G.729のサブセクション3.2.2またはAMR−WB規格のサブセクション6.4.3を参照して説明されるように、レビンソンダービンアルゴリズムによって次数Mの線形予測フィルタA(z)の係数A[i]、i=0,...,Mが計算される。好ましい実施形態では、LPC次数M=10が使用される。
ステップE507(図3のモジュール303によって実装される)では、将来の信号サンプルの予測を与えるために、合成フィルタ1/A(z)がヌル信号に適用される。
この予測は、長さlg(i=lg...lg+plus_sample_in−1)のフレームの終了時に、plus_sample_inのサンプルに対して、ヌル入力(フィルタ励起信号)での1/A(z)フィルタリングによって、帰納的に実行される。
Figure 0006559658
本発明の変形形態では、線形予測係数を計算するための他の方法を使用することができ、例えば、先行技術から知られている、例えば、SILKコーダで実装されるバーグ方法を使用することが可能であろう。
別の変形形態では、線形予測係数は、適応フィルタリングのLMS(最小二乗平均)またはRLS(逐次最小二乗)タイプの手法によって推定することができるであろう。
別の代替形態では、LPC係数は、FDコーダにおいてさえLPC予測(302b)を使用してTDタイプ(309)のコーダの信号上で実行される(ただし、線形予測はFDコーダで実行される)関連パラメータの分析および/または定量化から直接得ることができるであろう。
例えば、AMR−WBコーデックのCELPデコーダでは、各サブフレームにLPC係数(次数16の)があり、特に、最後のサブフレームで復号されたLPC係数を使用して復号された将来の信号を予測し、従って、CELPデコーダのリサンプリングの遅延を取り除くことが可能である。
別の変形形態では、ステップE507における無励起(ヌル入力)は、例えば、励起領域におけるピッチ予測によって、予測励起に置き換えることができる。
本発明の他の変形形態では、線形予測(短期)は、信号の領域のピッチ予測(長期)に置き換えることができ、この予測は、部分またはマルチタップであり得る。
時間的手法の代わりに周波数領域で予測を実行することが可能であることが認められよう。しかし、周波数領域でのこの代替の手法は、分析変換(例えば、FFT)、将来のスペクトルの予測(例えば、最も重要なスペクトル線の振幅の反復および位相の連続性による)、および逆合成変換または正弦波合成を必要とする。この代替形態は、一般に、上記に説明される時間的手法より複雑であり、周波数分析は、スペクトル線(トーン)を識別できるほど十分な周波数分解能を有することができるほど十分長い時間的サポートを有さなければならないため、なおさらそうである。この手法は、限られた数(フレーム長より少ない)のサンプルを外挿することが目的である際には理想的ではない。
さらなる別の実施形態では、上記に説明される適応線形予測は、より洗練された信号モデルによって将来の信号を外挿するために、消去フレーム隠蔽プロセスに置き換えることができる。そのような技法は、例えば、EP1 316 087の番号の下で公開された欧州特許で説明されている。
本発明の他の変形形態では、FIRフィルタによるリサンプリングは、IIRフィルタリングまたは多項式補間による他のリサンプリング方法に置き換えることができよう。この事例では、原理は同じままであり、将来の信号が予測され、将来の信号を考慮することによってリサンプリングが適用される。一実施形態では、異なる遅延を有する2つのリサンプリング構成の事例が考慮され、本発明は、最も長い遅延を最も低い遅延値にもたらすことを可能にする。
8000Hzから12800Hzへのリサンプリングの例において、上記に説明される本発明の方法による低遅延リサンプリングの有効性を立証できるようにするため、混ざり合った10の正弦曲線からなるテスト信号(その周波数は毎秒変化する)が使用される。i秒後の信号に対して、これらの正弦曲線の周波数は、間隔[fecenter(i)−600、fecenter(i)+600]およびfecenter(i)=500+100iHz、i=1...28で、中心周波数fecenter(i)あたりで無作為に選ばれている。
図7a〜7lは、AMR−WBの先行技術のリサンプリング方法(点線)と、20個のサンプルの分析ウィンドウを有する次数M=4の予測フィルタを用いる本発明による方法のもの(一点鎖線)と、240個のサンプルの分析ウィンドウを有する次数10の線形予測フィルタを用いる本発明による方法のもの(連続線)との間の比較の結果を表す。
図は、テスト信号の中心周波数の関数としての信号対雑音比を表す。
各図は、従来のフィルタリングで得られた従来のフレームの終了に対するサンプルの異なる位置に相当する(図2の番号#1、...、#12に相当する)。例えば、図7aは、従来のフレームの終了後の第2の位置のサンプルに対する信号対雑音比(SNR)を表す。図7bは、現フレームの後の第3の位置の予測されたサンプルに対する信号対雑音比などを表すである。従って、図7lは、現フレームの後の第13の位置の予測されたサンプルに対する信号対雑音比を表す。
予測されたサンプルはフィルタリングの間に使用が増えるため、位置の増加と共にSNRが減少すること、および同じ位置に対しては、高い周波数は予測し難いため、中心周波数の増加と共にSNRが減少することを観察することができる。しかし、すべての事例において、本発明による方法は、低い予測次数を用いる場合でさえ、AMR−WBコーダで使用される方法よりかなり効率的であることが観測される。
低い次数の予測の使用の利点は、固定小数点表現算術の中でも特に、その低い複雑性および計算の実装が容易であることである。次数が高いほど、複雑性が増大すると同時に、フィルタの安定性の確保がより難しくなる。
図8a〜8cは、非常に広い語音信号ベースにわたる同じタイプの結果を示す。その中では、SNRは、3つの異なる事例(図8aの8000Hzから12800Hzへ、図8bの12800Hzから8000Hzへおよび図8cの16000Hzから8000Hzへ)のサンプルの位置の関数と考えられる。前と同じように、本発明によるアルゴリズムは、短いウィンドウを有する低い予測次数を用いる場合でさえ、先行技術(AMR−WB)で使用されるものよりかなり効率的である。
図9は、本発明によるリサンプリングデバイス300を備えるオーディオデコーダの例を示す。リサンプリングデバイスは、図3を参照して説明されるものと同じである。
ここで示されるデコーダは、8、16、32または48kHzの出力サンプリング周波数で動作するマルチビットレート(7.2〜128kbit/sで設定されたビットレートで)の音声信号(モノラル)のデコーダである。
受信され、分離されたフレーム(ブロック901)に基づいて、線形予測(902b)を使用するCELPタイプ(902)の時分割デコーダ(TD DEC)の出力と、周波数領域デコーダ(FD DEC)の出力との間で、出力が切り替えられる(904)。
図10は、本発明によるリサンプリングデバイス300のハードウェア実施形態の例を表す。後者は、可聴周波数信号コーダ、デコーダまたは可聴周波数信号を受信する機器アイテムの不可欠な部分とすることができる。
このタイプのデバイスは、ストレージおよび/または動作メモリMEMを備えるメモリブロックBMと協働するプロセッサPROCを備える。
そのようなデバイスは、サンプリング周波数fInで音声信号フレームBufInを受信するのに適した入力モジュールEを備える。
それは、fOutのサンプリング周波数でリサンプリングされた可聴周波数信号bufoutを送信するのに適した出力モジュールSを備える。
メモリブロックは、これらの命令がプロセッサPROCによって実行される際に、本発明の意味内のリサンプリング方法のステップ、特に、適応線形予測によって、或る数の将来の信号サンプルを決定するステップであって、この数が、選ばれたリサンプリング遅延の関数として定義される、ステップと、少なくとも現ブロックのサンプルおよび決定された将来の信号サンプルからリサンプリングサポートベクトルを構築するステップと、リサンプリングサポートベクトルのサンプルにリサンプリングフィルタを適用するステップとを実装するためのコード命令を含むコンピュータプログラムを有利に含み得る。
通常、図4aの説明は、そのようなコンピュータプログラムのアルゴリズムのステップを繰り返す。また、コンピュータプログラムは、デバイスのリーダによって読み取れるかまたはその記憶空間にダウンロードできる記憶媒体上に格納することもできる。
メモリMEMは、一般に、方法を実装するために必要なすべてのデータを格納する。

Claims (14)

  1. リサンプリングすべき各信号ブロックに対して以下のステップ:
    − 適応線形予測によって、或る数の将来の信号サンプルを決定するステップであって、前記或る数が、可聴周波数信号のコーディング又はデコーディングにおいて用いるリサンプリングフィルタによるリサンプリング処理によって生じる遅延と、許容される遅延との関数として定義される、ステップと、
    − 少なくとも現信号ブロックのサンプルおよび決定された将来の信号サンプルからリサンプリングサポートベクトルを構築するステップと、
    − 前記リサンプリングサポートベクトルの前記サンプルにリサンプリングフィルタを適用するステップと
    を含むことを特徴とする、可聴周波数信号コード化または復号において可聴周波数信号をリサンプリングするための方法。
  2. 適応線形予測によって決定する前記ステップが、以下のステップ:
    − 既定の次数の線形予測フィルタの係数を得るステップと、
    − 前記得られた予測フィルタをヌル値の励起信号に適用することによって将来の信号サンプルを得るステップと
    を含むことを特徴とする、請求項1に記載の方法。
  3. 前記線形予測フィルタの前記係数が、コード化または復号ステップで格納されたパラメータを読み取ることによって得られることを特徴とする、請求項2に記載の方法。
  4. 前記線形予測フィルタの前記係数が、少なくとも前記現ブロックのサンプルからの分析によって得られることを特徴とする、請求項2に記載の方法。
  5. 前記線形予測が、プリエンファシス処理が実行されている可聴周波数信号上で実行されることを特徴とする、請求項1に記載の方法。
  6. 前記適応線形予測が、以下の方法:
    − 短期線形予測、
    − 長期線形予測、
    − 短期線形予測と長期線形予測との組合せ、
    − 消去フレーム隠蔽プロセス
    のうちの1つからの予測であることを特徴とする、請求項1に記載の方法。
  7. − 信号ブロックに対して、可聴周波数信号のコーディング又はデコーディングにおいて用いるリサンプリングフィルタによるリサンプリング処理によって生じる遅延と、許容される遅延との関数として定義される或る数の将来の信号サンプルを決定する適応線形予測モジュールと、
    − 少なくとも現信号ブロックのサンプルおよび決定された将来の信号サンプルからリサンプリングサポートベクトルを構築するためのモジュールと、
    − 前記リサンプリングサポートベクトルの前記サンプルに適用されるリサンプリングフィルタと
    を備えることを特徴とする、可聴周波数信号コーダまたはデコーダにおいて可聴周波数信号をリサンプリングするためのデバイス。
  8. 前記適応線形予測モジュールが、前記コーダまたはデコーダの前記予測コード化または復号モジュールに含まれる予測分析モジュールと協働することを特徴とする、請求項7に記載のデバイス。
  9. 請求項7または8に記載の少なくとも1つのリサンプリングデバイスを備えることを特徴とする、可聴周波数信号コーダ。
  10. 異なる遅延を有する少なくとも2つのリサンプリングフィルタを使用するリサンプリングデバイスを有し、前記フィルタの少なくとも1つが請求項1に記載の方法に従って実装され、前記将来の信号サンプルの前記或る数の決定が前記使用される2つのリサンプリングフィルタの遅延差の関数である、請求項9に記載のコーダ。
  11. 請求項7または8に記載の少なくとも1つのリサンプリングデバイスを備えることを特徴とする、可聴周波数信号デコーダ。
  12. 異なる遅延を有する少なくとも2つのリサンプリングフィルタを使用するリサンプリングデバイスを有し、前記フィルタの少なくとも1つが請求項1に記載の方法に従って実装され、前記将来の信号サンプルの前記或る数の決定が前記使用される2つのリサンプリングフィルタの遅延差の関数である、リサンプリングデバイスを備えることを特徴とする、請求項11に記載のデコーダ。
  13. コード命令であって、前記命令がプロセッサによって実行される際に、請求項1〜6のいずれか一項に記載のリサンプリング方法のステップを実装するためのコード命令を含むコンピュータプログラム。
  14. 請求項1〜6のいずれか一項に記載のリサンプリング方法のステップを実行するためのコード命令を含むコンピュータプログラムが格納されプロセッサ可読記憶媒体。
JP2016518091A 2013-09-30 2014-09-26 低遅延符号化/復号のための音声信号のリサンプリング Active JP6559658B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR1359456 2013-09-30
FR1359456A FR3011408A1 (fr) 2013-09-30 2013-09-30 Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
PCT/FR2014/052430 WO2015044609A1 (fr) 2013-09-30 2014-09-26 Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2017145793A Division JP6559741B2 (ja) 2013-09-30 2017-07-27 低遅延符号化/復号のための音声信号のリサンプリング

Publications (3)

Publication Number Publication Date
JP2016541004A JP2016541004A (ja) 2016-12-28
JP2016541004A5 JP2016541004A5 (ja) 2017-12-07
JP6559658B2 true JP6559658B2 (ja) 2019-08-14

Family

ID=50101931

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2016518091A Active JP6559658B2 (ja) 2013-09-30 2014-09-26 低遅延符号化/復号のための音声信号のリサンプリング
JP2017145793A Active JP6559741B2 (ja) 2013-09-30 2017-07-27 低遅延符号化/復号のための音声信号のリサンプリング

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2017145793A Active JP6559741B2 (ja) 2013-09-30 2017-07-27 低遅延符号化/復号のための音声信号のリサンプリング

Country Status (21)

Country Link
US (2) US10403296B2 (ja)
EP (2) EP3330964B1 (ja)
JP (2) JP6559658B2 (ja)
KR (5) KR102505501B1 (ja)
CN (2) CN105684078B (ja)
BR (2) BR122017018551B1 (ja)
DK (2) DK3330964T3 (ja)
ES (2) ES2935337T3 (ja)
FI (2) FI3330964T3 (ja)
FR (1) FR3011408A1 (ja)
HR (2) HRP20230094T1 (ja)
HU (2) HUE061430T2 (ja)
LT (2) LT3053163T (ja)
MX (1) MX355959B (ja)
PL (2) PL3053163T3 (ja)
PT (2) PT3330964T (ja)
RS (2) RS63937B1 (ja)
RU (2) RU2756042C2 (ja)
SI (2) SI3053163T1 (ja)
WO (1) WO2015044609A1 (ja)
ZA (1) ZA201602919B (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3011408A1 (fr) * 2013-09-30 2015-04-03 Orange Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
FR3015754A1 (fr) * 2013-12-20 2015-06-26 Orange Re-echantillonnage d'un signal audio cadence a une frequence d'echantillonnage variable selon la trame
EP4002359A1 (en) * 2014-06-10 2022-05-25 MQA Limited Digital encapsulation of audio signals
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
FR3025923A1 (fr) * 2014-09-12 2016-03-18 Orange Discrimination et attenuation de pre-echos dans un signal audionumerique
US10325609B2 (en) * 2015-04-13 2019-06-18 Nippon Telegraph And Telephone Corporation Coding and decoding a sound signal by adapting coefficients transformable to linear predictive coefficients and/or adapting a code book
US10115403B2 (en) * 2015-12-18 2018-10-30 Qualcomm Incorporated Encoding of multiple audio signals
WO2017126853A1 (en) 2016-01-21 2017-07-27 Lg Electronics Inc. Display device
US10587294B1 (en) 2018-09-14 2020-03-10 Viasat, Inc. Digital signal conditioner system
US20210224024A1 (en) * 2020-01-21 2021-07-22 Audiowise Technology Inc. Bluetooth audio system with low latency, and audio source and audio sink thereof

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6363345B1 (en) * 1999-02-18 2002-03-26 Andrea Electronics Corporation System, method and apparatus for cancelling noise
GB2352949A (en) * 1999-08-02 2001-02-07 Motorola Ltd Speech coder for communications unit
FR2813722B1 (fr) 2000-09-05 2003-01-24 France Telecom Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif
CN1388965A (zh) * 2000-09-08 2003-01-01 皇家菲利浦电子有限公司 音频信号压缩
CA2397080C (en) * 2001-08-07 2007-06-12 Dspfactory Ltd. Sub-band adaptive signal processing in an oversampled filterbank
JP4446072B2 (ja) * 2004-07-23 2010-04-07 株式会社ディーアンドエムホールディングス オーディオ信号出力装置
CN101006495A (zh) * 2004-08-31 2007-07-25 松下电器产业株式会社 语音编码装置、语音解码装置、通信装置以及语音编码方法
EP1989706B1 (fr) * 2006-02-14 2011-10-26 France Telecom Dispositif de ponderation perceptuelle en codage/decodage audio
CN100485342C (zh) * 2006-03-03 2009-05-06 西安交通大学 机械故障的集成支持向量机混合智能诊断方法
CN100561582C (zh) * 2006-05-22 2009-11-18 上海奇码数字信息有限公司 音频解码器和音频解码方法
CN101086845B (zh) * 2006-06-08 2011-06-01 北京天籁传音数字技术有限公司 声音编码装置及方法以及声音解码装置及方法
JP2010503881A (ja) * 2006-09-13 2010-02-04 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 音声・音響送信器及び受信器のための方法及び装置
JP2008139447A (ja) * 2006-11-30 2008-06-19 Mitsubishi Electric Corp 音声符号化装置及び音声復号装置
ATE500588T1 (de) * 2008-01-04 2011-03-15 Dolby Sweden Ab Audiokodierer und -dekodierer
EP2107556A1 (en) * 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction
CN101714379B (zh) * 2008-10-08 2011-10-26 安凯(广州)微电子技术有限公司 一种音频重采样方法
CN102365680A (zh) * 2009-02-03 2012-02-29 三星电子株式会社 音频信号的编码和解码方法及其装置
US9082395B2 (en) * 2009-03-17 2015-07-14 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
PL2471061T3 (pl) * 2009-10-08 2014-03-31 Fraunhofer Ges Forschung Działający w wielu trybach dekoder sygnału audio, działający w wielu trybach koder sygnału audio, sposoby i program komputerowy stosujące kształtowanie szumu oparte o kodowanie z wykorzystaniem predykcji liniowej
RU2591011C2 (ru) * 2009-10-20 2016-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Кодер аудиосигнала, декодер аудиосигнала, способ кодирования или декодирования аудиосигнала с удалением алиасинга (наложения спектров)
PL3998606T3 (pl) * 2009-10-21 2023-03-06 Dolby International Ab Nadrpóbkowanie w połączonym banku filtrów modułu transpozycji
CN102783034B (zh) * 2011-02-01 2014-12-17 华为技术有限公司 用于提供信号处理系数的方法和设备
EP4243017A3 (en) * 2011-02-14 2023-11-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method decoding an audio signal using an aligned look-ahead portion
CN102324229B (zh) * 2011-09-08 2012-11-28 中国科学院自动化研究所 语音输入设备使用异常的检测方法及系统
CN102324232A (zh) * 2011-09-12 2012-01-18 辽宁工业大学 基于高斯混合模型的声纹识别方法及系统
WO2013056388A1 (en) * 2011-10-18 2013-04-25 Telefonaktiebolaget L M Ericsson (Publ) An improved method and apparatus for adaptive multi rate codec
CN102419981B (zh) * 2011-11-02 2013-04-03 展讯通信(上海)有限公司 音频信号时间尺度和频率尺度缩放处理方法及设备
US9043201B2 (en) * 2012-01-03 2015-05-26 Google Technology Holdings LLC Method and apparatus for processing audio frames to transition between different codecs
CN103227917B (zh) * 2012-01-31 2016-12-14 华为技术有限公司 解码方法和装置
US20130211846A1 (en) * 2012-02-14 2013-08-15 Motorola Mobility, Inc. All-pass filter phase linearization of elliptic filters in signal decimation and interpolation for an audio codec
EP2830061A1 (en) * 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
FR3011408A1 (fr) * 2013-09-30 2015-04-03 Orange Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
US9620134B2 (en) * 2013-10-10 2017-04-11 Qualcomm Incorporated Gain shape estimation for improved tracking of high-band temporal characteristics
US10083708B2 (en) * 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
JP6345780B2 (ja) * 2013-11-22 2018-06-20 クゥアルコム・インコーポレイテッドQualcomm Incorporated ハイバンドコーディングにおける選択的位相補償
US20150149157A1 (en) * 2013-11-22 2015-05-28 Qualcomm Incorporated Frequency domain gain shape estimation
FR3015754A1 (fr) * 2013-12-20 2015-06-26 Orange Re-echantillonnage d'un signal audio cadence a une frequence d'echantillonnage variable selon la trame
FR3023036A1 (fr) * 2014-06-27 2016-01-01 Orange Re-echantillonnage par interpolation d'un signal audio pour un codage / decodage a bas retard
US10236006B1 (en) * 2016-08-05 2019-03-19 Digimarc Corporation Digital watermarks adapted to compensate for time scaling, pitch shifting and mixing

Also Published As

Publication number Publication date
RS63937B1 (sr) 2023-02-28
EP3053163B1 (fr) 2022-11-09
KR20160061420A (ko) 2016-05-31
KR20210142766A (ko) 2021-11-25
KR102638785B1 (ko) 2024-02-21
PL3053163T3 (pl) 2023-04-11
EP3053163A1 (fr) 2016-08-10
FI3330964T3 (fi) 2023-02-22
RU2017144520A3 (ja) 2021-04-09
HUE061442T2 (hu) 2023-06-28
CN105684078A (zh) 2016-06-15
MX355959B (es) 2018-05-07
DK3053163T3 (da) 2023-01-16
JP6559741B2 (ja) 2019-08-14
CN105684078B (zh) 2020-03-27
LT3053163T (lt) 2023-01-10
RU2016117073A (ru) 2017-11-10
RU2756042C2 (ru) 2021-09-24
LT3330964T (lt) 2023-01-10
KR102505501B1 (ko) 2023-03-03
US20160232907A1 (en) 2016-08-11
WO2015044609A1 (fr) 2015-04-02
KR20210142765A (ko) 2021-11-25
RU2016117073A3 (ja) 2018-07-06
BR122017018551B1 (pt) 2022-03-03
ZA201602919B (en) 2019-04-24
US10566004B2 (en) 2020-02-18
DK3330964T3 (da) 2023-02-06
ES2934671T3 (es) 2023-02-23
CN107481726B (zh) 2021-07-30
KR20170103027A (ko) 2017-09-12
RU2679228C2 (ru) 2019-02-06
RU2017144520A (ru) 2019-02-15
KR20230009516A (ko) 2023-01-17
JP2016541004A (ja) 2016-12-28
US10403296B2 (en) 2019-09-03
PL3330964T3 (pl) 2023-04-11
PT3053163T (pt) 2023-01-19
HRP20230101T1 (hr) 2023-03-17
HUE061430T2 (hu) 2023-06-28
PT3330964T (pt) 2023-01-20
EP3330964A1 (fr) 2018-06-06
HRP20230094T1 (hr) 2023-03-17
CN107481726A (zh) 2017-12-15
SI3330964T1 (sl) 2023-01-31
RS63936B1 (sr) 2023-02-28
FR3011408A1 (fr) 2015-04-03
JP2018025783A (ja) 2018-02-15
ES2935337T3 (es) 2023-03-06
MX2016003902A (es) 2016-06-17
FI3053163T3 (fi) 2023-03-01
BR112016006447B1 (pt) 2021-12-28
EP3330964B1 (fr) 2022-11-09
SI3053163T1 (sl) 2023-01-31
KR102514983B1 (ko) 2023-03-29
BR112016006447A2 (pt) 2017-08-01
KR102505502B1 (ko) 2023-03-03
US20170372714A1 (en) 2017-12-28

Similar Documents

Publication Publication Date Title
JP6559741B2 (ja) 低遅延符号化/復号のための音声信号のリサンプリング
JP2016541004A5 (ja)
JP6641302B2 (ja) 低遅延符号化/復号のための補間による音声信号のリサンプリング
JP3954495B2 (ja) 適応ろ波による高周波復元符号化方法の知覚性能の強化方法
JP4842538B2 (ja) 合成発話の周波数選択的ピッチ強調方法およびデバイス
KR100915733B1 (ko) 음성 신호들의 대역폭의 인공 확장을 위한 방법 및 장치
RU2386179C2 (ru) Способ и устройство для кодирования речевых сигналов с расщеплением полосы
KR101699898B1 (ko) 스펙트럼 영역에서 디코딩된 오디오 신호를 처리하기 위한 방법 및 장치
CN105453172B (zh) 应用加权噪音的帧丢失的校正
US9940943B2 (en) Resampling of an audio signal interrupted with a variable sampling frequency according to the frame
EP0843302A2 (en) Voice coder using sinusoidal analysis and pitch control
JP5711645B2 (ja) オーディオ信号出力装置およびオーディオ信号出力方法
JP3749838B2 (ja) 音響信号符号化方法、音響信号復号方法、これらの装置、これらのプログラム及びその記録媒体

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20170719

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170925

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171025

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180717

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180814

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20181113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190702

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190717

R150 Certificate of patent or registration of utility model

Ref document number: 6559658

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250