JP6559658B2 - 低遅延符号化/復号のための音声信号のリサンプリング - Google Patents
低遅延符号化/復号のための音声信号のリサンプリング Download PDFInfo
- Publication number
- JP6559658B2 JP6559658B2 JP2016518091A JP2016518091A JP6559658B2 JP 6559658 B2 JP6559658 B2 JP 6559658B2 JP 2016518091 A JP2016518091 A JP 2016518091A JP 2016518091 A JP2016518091 A JP 2016518091A JP 6559658 B2 JP6559658 B2 JP 6559658B2
- Authority
- JP
- Japan
- Prior art keywords
- resampling
- signal
- samples
- filter
- linear prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012952 Resampling Methods 0.000 title claims description 170
- 230000005236 sound signal Effects 0.000 title claims description 8
- 238000000034 method Methods 0.000 claims description 75
- 239000013598 vector Substances 0.000 claims description 23
- 230000003044 adaptive effect Effects 0.000 claims description 15
- 230000001934 delay Effects 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 230000005284 excitation Effects 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 6
- 230000007774 longterm Effects 0.000 claims description 3
- 238000001914 filtration Methods 0.000 description 37
- 238000005070 sampling Methods 0.000 description 31
- 230000015654 memory Effects 0.000 description 22
- 230000006870 function Effects 0.000 description 14
- 230000004044 response Effects 0.000 description 14
- 230000003595 spectral effect Effects 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000013459 approach Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 230000001965 increasing effect Effects 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 239000000661 sodium alginate Substances 0.000 description 4
- 235000010413 sodium alginate Nutrition 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 239000001099 ammonium carbonate Substances 0.000 description 3
- 238000013213 extrapolation Methods 0.000 description 3
- VEXZGXHMUGYJMC-UHFFFAOYSA-N hydrochloric acid Substances Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 3
- BWHMMNNQKKPAPP-UHFFFAOYSA-L potassium carbonate Substances [K+].[K+].[O-]C([O-])=O BWHMMNNQKKPAPP-UHFFFAOYSA-L 0.000 description 3
- 239000008272 agar Substances 0.000 description 2
- 235000010419 agar Nutrition 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 239000000737 potassium alginate Substances 0.000 description 2
- 235000010408 potassium alginate Nutrition 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 239000001878 Bakers yeast glycan Substances 0.000 description 1
- 239000004277 Ferrous carbonate Substances 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 239000000728 ammonium alginate Substances 0.000 description 1
- 235000010407 ammonium alginate Nutrition 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 238000009960 carding Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000001095 magnesium carbonate Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 239000000770 propane-1,2-diol alginate Substances 0.000 description 1
- 235000010409 propane-1,2-diol alginate Nutrition 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000010415 tropism Effects 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
- H03H17/06—Non-recursive filters
- H03H17/0621—Non-recursive filters with input-sampling frequency and output-delivery frequency which differ, e.g. extrapolation; Anti-aliasing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Computer Hardware Design (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Analogue/Digital Conversion (AREA)
Description
− 各入力サンプル後に0の3つのサンプルを加えることによって4だけアップサンプリング(16kHzから64kHzへ)するステップ
− 64kHzで120次の対称FIRタイプの伝達関数Hdecim(z)をローパスフィルタリングするステップ
− ローパスフィルタリングされた信号から5つのサンプルのうちの1つのサンプルのみを保持することによって5だけダウンサンプリング(64kHzから12.8kHzへ)するステップ
− 適応線形予測によって、或る数の将来の信号サンプルを決定するステップであって、この数が、選ばれたリサンプリング遅延の関数として定義される、ステップと、
− 少なくとも現ブロックのサンプルおよび決定された将来の信号サンプルからリサンプリングサポートベクトルを構築するステップと、
− リサンプリングサポートベクトルのサンプルにリサンプリングフィルタを適用するステップと
を含むものである。
− 既定の次数の線形予測フィルタの係数を得るステップと、
− 得られた予測フィルタをヌル値の励起信号に適用することによって将来の信号サンプルを得るステップと
を含む。
− 短期線形予測、
− 長期線形予測、
− 短期線形予測と長期線形予測との組合せ、
− 消去フレーム隠蔽プロセス
のうちの1つからの予測である。
− 各信号ブロックに対して、選ばれたリサンプリング遅延の関数として定義される或る数の将来の信号サンプルを決定するのに適した適応線形予測モジュールと、
− 少なくとも現ブロックのサンプルおよび決定された将来の信号サンプルからリサンプリングサポートベクトルを構築するためのモジュールと、
− リサンプリングサポートベクトルのサンプルに適用されるリサンプリングフィルタと
を備えるものである。
f_5_8_129=[0 0 0 0 fir1(248,(3775/32000),hanning(249))*4.999895 0 0 0 0];
3775Hzの64kHzでのカットオフ周波数(−6dB)を用いる。
ftmp=fir1(358,1/12,hanning(359));
f_12_180=[0 ftmp/ftmp(180)0];
8000Hzの192kHzでのカットオフ周波数(−6dB)を用いる。
ftmp=fir1(358,1/15,hanning(359));
f_12_180=[0 ftmp/ftmp(180)0];
6400Hzの192kHzでのカットオフ周波数(−6dB)を用いる。
・ 選ばれたコード化モードが、周波数fInで常に動作するFDタイプのコード化である場合、
・ 選ばれたコード化モードがTDコード化であり、入力周波数fInが内部TDコード化周波数に相当する場合
でのみ、好ましい実施形態で可能である。
− 他の変換構成4〜13(0.9375msの遅延を有する)と同一の遅延を得るために、構成1〜3の実効遅延を制限すること。これを行うため、リサンプリングデバイスは、各信号フレームに対して、選ばれたリサンプリング遅延の関数として定義される或る数の将来の信号サンプルを決定するのに適した適応線形予測モジュール301を備える。サンプルの数は、理論上、パラメータ化可能であるが、実際には、定義されたコーデック構成に対して一定に保たれることが述べられよう。
− 理論的な関連遅延が異なる場合であっても、すべての定義されたリサンプリング構成を切り替えられるようにすること。
8000Hzから12800Hzへのリサンプリングの場合は、25個から12個のサンプルに遅延を低減すること(すなわち、12800Hzでのplus_sample_out=13個の追加サンプルを生成すること。これには、8000Hzでのplus_sample_in=8個のサンプルの外挿が必要である)が必要であり、
12800Hzから8000Hzへのリサンプリングの場合は、15個から7個のサンプルに遅延を低減すること(すなわち、8000Hzでのplus_sample_out=8個の追加サンプルを生成すること。これには、12800Hzでのplus_sample_in=12個のサンプルの外挿が必要である)が必要であり、
16000Hzから8000Hzへのリサンプリングの場合は、15個から7個のサンプルに遅延を低減すること(すなわち、8000Hzでのplus_sample_out=8個の追加サンプルを生成すること。これには、16000Hzでのplus_sample_in=15個のサンプルの外挿が必要である)が必要である。8000Hzでは、0.9375msは7.5個のサンプルに相当し、7.5個のサンプルは切り捨てて7個のサンプルにしていることに留意すべきである。
− 過去の信号は、リサンプリングFIRフィルタのメモリに格納することができ、従って、現フレームのサンプルとは直接連結されない(しかし、現フレームの信号は、まさに過去の信号を含むこれらのメモリの連続性である)。
− 予測された将来の信号は、別々のベクトルに格納することもでき、そのリサンプリングは、必要なメモリが正しく更新される限り、現フレームの信号のものとは別々に行うことができる。将来の信号の別々のリサンプリングの事例では、リサンプリングフィルタのメモリは、現フレームの最新のサンプルによって初期化される。ここでもまた、この分離にもかかわらず、予測された将来の信号は、まさに現フレームの信号の連続である。
− 連続的なフレーム単位での使用の事例(入力としてlgのサンプル)では、最後のlg_out=lg*fac_num/fac_denのサンプルのみが計算される。
− より多くのサンプルを得なければならない事例(将来の信号を有するフレームごとに使用)(入力としてlg+plus_sample_inのサンプル)では、AMR−WB規格のコーダの事例と同様に、lg_out+plus_sample_outのサンプルが計算され、式中、plus_sample_out=plus_sample_in*fac_num/fac_denである。実際には、AMR−WBコーダでは、20msの現フレームがリサンプリングされ、15個の追加のサンプルがリサンプリングされる。第1のステップは、第2のステップで実行されるリサンプリングからのエラーを置き換える。この例では、lg=320、plus_sample_in=15である。
− 使用は、例えば、メモリ(信号の断片またはブロック)がリサンプリングされる際は(例えば、2つのコード化モード間で切り替える事例では)、1回限りのものでもあり得る。この事例では、リサンプリング入力は、フレーム(例えば、20msの)ではなく、信号ブロックである。本発明を適用するため、変換すべき過去のブロックまたは過去から既に事前に計算されているLPCモデルを有することが必須であることに留意することが重要である。線形予測を既に使用しているTDタイプのコード化を用いると、各フレームにおいてTDコーダおよび/またはデコーダで計算されたおよび/またはコード化されたパラメータ(LPCまたは同等の係数)を格納することが一般に可能であることが述べられよう。従って、本発明の変形形態では、これらのLPCパラメータを再利用することができ、それにより、格納された値(恐らく定量化されている)の簡単な検索を伴うようになるため、ブロック302の実装が簡略化される。
− 生成すべきより多くのサンプルを用いた連続的な使用の事例では、AMR−WB規格の事例と同様に、入力フレームの最後のmem_lenのサンプルは、予測されたサンプルなしで格納される:mem_sig(0...mem_len−1)=frame(lg−mem_len...lg−1)。
リサンプリングが再開され次第、出力サンプリング周波数で得られたサンプルは、予測された入力信号を使用することによって得られたサンプルを置き換える。
− 連続的なフレーム単位での使用の事例では、予測された入力信号を使用することによって得られたサンプルは置き換えられず、lg_outのサンプルのみが出力サンプリング周波数で計算される。新しいフレームがインデックスlg+plus_sample_inのサンプルから始まると見なされる場合、リサンプリングFIRフィルタのメモリは、インデックス(lg...lg+plus_sample_in−1)のこのメモリの一部が真の信号または予測された信号であり得る、インデックス(lg+plus_sample_in−mem_len...lg+plus_sample_in−1)の過去のサンプルから構成される。真の信号を使用することで、第1のサンプルは、予測なしでフィルタリングによって得られたもの(最適なものと見なされた結果)に等しいが、先行フレームの間に予測で得られた最後のサンプルと真の信号で得られた第1のサンプルとの間では、小さな不連続性を有する可能性がある。メモリの予測された信号の使用の事例では、不連続性はないが、わずかなエラーが別のfilt_lenのサンプルに広がる。好ましい実施形態では、このわずかな不連続性は聞き取れないため、第1の解決策が使用される。
− 1回限りの使用の事例では、リサンプリング後のメモリ更新は必要ではないが、相当する過去の入力信号を用いて、リサンプリング動作の前に、リサンプリングメモリを初期化しなければならない。
− μは一定であり得る(例えば、μ=0.68)、
− μは一定であり得る(入力サンプリング周波数によって決まる)、
− μはスペクトルの傾きの分析に従って適応できるものであり得る(先行技術から知られている方法)。
r(i)=r(i)*wlag(i)、i=0,...,M
式中、係数wlag(i)は、以下のように定義される。
Claims (14)
- リサンプリングすべき各信号ブロックに対して以下のステップ:
− 適応線形予測によって、或る数の将来の信号サンプルを決定するステップであって、前記或る数が、可聴周波数信号のコーディング又はデコーディングにおいて用いるリサンプリングフィルタによるリサンプリング処理によって生じる遅延と、許容される遅延との関数として定義される、ステップと、
− 少なくとも現信号ブロックのサンプルおよび決定された将来の信号サンプルからリサンプリングサポートベクトルを構築するステップと、
− 前記リサンプリングサポートベクトルの前記サンプルにリサンプリングフィルタを適用するステップと
を含むことを特徴とする、可聴周波数信号コード化または復号において可聴周波数信号をリサンプリングするための方法。 - 適応線形予測によって決定する前記ステップが、以下のステップ:
− 既定の次数の線形予測フィルタの係数を得るステップと、
− 前記得られた予測フィルタをヌル値の励起信号に適用することによって将来の信号サンプルを得るステップと
を含むことを特徴とする、請求項1に記載の方法。 - 前記線形予測フィルタの前記係数が、コード化または復号ステップで格納されたパラメータを読み取ることによって得られることを特徴とする、請求項2に記載の方法。
- 前記線形予測フィルタの前記係数が、少なくとも前記現ブロックのサンプルからの分析によって得られることを特徴とする、請求項2に記載の方法。
- 前記線形予測が、プリエンファシス処理が実行されている可聴周波数信号上で実行されることを特徴とする、請求項1に記載の方法。
- 前記適応線形予測が、以下の方法:
− 短期線形予測、
− 長期線形予測、
− 短期線形予測と長期線形予測との組合せ、
− 消去フレーム隠蔽プロセス
のうちの1つからの予測であることを特徴とする、請求項1に記載の方法。 - − 信号ブロックに対して、可聴周波数信号のコーディング又はデコーディングにおいて用いるリサンプリングフィルタによるリサンプリング処理によって生じる遅延と、許容される遅延との関数として定義される或る数の将来の信号サンプルを決定する適応線形予測モジュールと、
− 少なくとも現信号ブロックのサンプルおよび決定された将来の信号サンプルからリサンプリングサポートベクトルを構築するためのモジュールと、
− 前記リサンプリングサポートベクトルの前記サンプルに適用されるリサンプリングフィルタと
を備えることを特徴とする、可聴周波数信号コーダまたはデコーダにおいて可聴周波数信号をリサンプリングするためのデバイス。 - 前記適応線形予測モジュールが、前記コーダまたはデコーダの前記予測コード化または復号モジュールに含まれる予測分析モジュールと協働することを特徴とする、請求項7に記載のデバイス。
- 請求項7または8に記載の少なくとも1つのリサンプリングデバイスを備えることを特徴とする、可聴周波数信号コーダ。
- 異なる遅延を有する少なくとも2つのリサンプリングフィルタを使用するリサンプリングデバイスを有し、前記フィルタの少なくとも1つが請求項1に記載の方法に従って実装され、前記将来の信号サンプルの前記或る数の決定が前記使用される2つのリサンプリングフィルタの遅延差の関数である、請求項9に記載のコーダ。
- 請求項7または8に記載の少なくとも1つのリサンプリングデバイスを備えることを特徴とする、可聴周波数信号デコーダ。
- 異なる遅延を有する少なくとも2つのリサンプリングフィルタを使用するリサンプリングデバイスを有し、前記フィルタの少なくとも1つが請求項1に記載の方法に従って実装され、前記将来の信号サンプルの前記或る数の決定が前記使用される2つのリサンプリングフィルタの遅延差の関数である、リサンプリングデバイスを備えることを特徴とする、請求項11に記載のデコーダ。
- コード命令であって、前記命令がプロセッサによって実行される際に、請求項1〜6のいずれか一項に記載のリサンプリング方法の各ステップを実装するためのコード命令を含むコンピュータプログラム。
- 請求項1〜6のいずれか一項に記載のリサンプリング方法の各ステップを実行するためのコード命令を含むコンピュータプログラムが格納されたプロセッサ可読記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1359456 | 2013-09-30 | ||
FR1359456A FR3011408A1 (fr) | 2013-09-30 | 2013-09-30 | Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard |
PCT/FR2014/052430 WO2015044609A1 (fr) | 2013-09-30 | 2014-09-26 | Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017145793A Division JP6559741B2 (ja) | 2013-09-30 | 2017-07-27 | 低遅延符号化/復号のための音声信号のリサンプリング |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2016541004A JP2016541004A (ja) | 2016-12-28 |
JP2016541004A5 JP2016541004A5 (ja) | 2017-12-07 |
JP6559658B2 true JP6559658B2 (ja) | 2019-08-14 |
Family
ID=50101931
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016518091A Active JP6559658B2 (ja) | 2013-09-30 | 2014-09-26 | 低遅延符号化/復号のための音声信号のリサンプリング |
JP2017145793A Active JP6559741B2 (ja) | 2013-09-30 | 2017-07-27 | 低遅延符号化/復号のための音声信号のリサンプリング |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017145793A Active JP6559741B2 (ja) | 2013-09-30 | 2017-07-27 | 低遅延符号化/復号のための音声信号のリサンプリング |
Country Status (21)
Country | Link |
---|---|
US (2) | US10403296B2 (ja) |
EP (2) | EP3330964B1 (ja) |
JP (2) | JP6559658B2 (ja) |
KR (5) | KR102505501B1 (ja) |
CN (2) | CN105684078B (ja) |
BR (2) | BR122017018551B1 (ja) |
DK (2) | DK3330964T3 (ja) |
ES (2) | ES2935337T3 (ja) |
FI (2) | FI3330964T3 (ja) |
FR (1) | FR3011408A1 (ja) |
HR (2) | HRP20230094T1 (ja) |
HU (2) | HUE061430T2 (ja) |
LT (2) | LT3053163T (ja) |
MX (1) | MX355959B (ja) |
PL (2) | PL3053163T3 (ja) |
PT (2) | PT3330964T (ja) |
RS (2) | RS63937B1 (ja) |
RU (2) | RU2756042C2 (ja) |
SI (2) | SI3053163T1 (ja) |
WO (1) | WO2015044609A1 (ja) |
ZA (1) | ZA201602919B (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR3011408A1 (fr) * | 2013-09-30 | 2015-04-03 | Orange | Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard |
FR3015754A1 (fr) * | 2013-12-20 | 2015-06-26 | Orange | Re-echantillonnage d'un signal audio cadence a une frequence d'echantillonnage variable selon la trame |
EP4002359A1 (en) * | 2014-06-10 | 2022-05-25 | MQA Limited | Digital encapsulation of audio signals |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
FR3025923A1 (fr) * | 2014-09-12 | 2016-03-18 | Orange | Discrimination et attenuation de pre-echos dans un signal audionumerique |
US10325609B2 (en) * | 2015-04-13 | 2019-06-18 | Nippon Telegraph And Telephone Corporation | Coding and decoding a sound signal by adapting coefficients transformable to linear predictive coefficients and/or adapting a code book |
US10115403B2 (en) * | 2015-12-18 | 2018-10-30 | Qualcomm Incorporated | Encoding of multiple audio signals |
WO2017126853A1 (en) | 2016-01-21 | 2017-07-27 | Lg Electronics Inc. | Display device |
US10587294B1 (en) | 2018-09-14 | 2020-03-10 | Viasat, Inc. | Digital signal conditioner system |
US20210224024A1 (en) * | 2020-01-21 | 2021-07-22 | Audiowise Technology Inc. | Bluetooth audio system with low latency, and audio source and audio sink thereof |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6363345B1 (en) * | 1999-02-18 | 2002-03-26 | Andrea Electronics Corporation | System, method and apparatus for cancelling noise |
GB2352949A (en) * | 1999-08-02 | 2001-02-07 | Motorola Ltd | Speech coder for communications unit |
FR2813722B1 (fr) | 2000-09-05 | 2003-01-24 | France Telecom | Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif |
CN1388965A (zh) * | 2000-09-08 | 2003-01-01 | 皇家菲利浦电子有限公司 | 音频信号压缩 |
CA2397080C (en) * | 2001-08-07 | 2007-06-12 | Dspfactory Ltd. | Sub-band adaptive signal processing in an oversampled filterbank |
JP4446072B2 (ja) * | 2004-07-23 | 2010-04-07 | 株式会社ディーアンドエムホールディングス | オーディオ信号出力装置 |
CN101006495A (zh) * | 2004-08-31 | 2007-07-25 | 松下电器产业株式会社 | 语音编码装置、语音解码装置、通信装置以及语音编码方法 |
EP1989706B1 (fr) * | 2006-02-14 | 2011-10-26 | France Telecom | Dispositif de ponderation perceptuelle en codage/decodage audio |
CN100485342C (zh) * | 2006-03-03 | 2009-05-06 | 西安交通大学 | 机械故障的集成支持向量机混合智能诊断方法 |
CN100561582C (zh) * | 2006-05-22 | 2009-11-18 | 上海奇码数字信息有限公司 | 音频解码器和音频解码方法 |
CN101086845B (zh) * | 2006-06-08 | 2011-06-01 | 北京天籁传音数字技术有限公司 | 声音编码装置及方法以及声音解码装置及方法 |
JP2010503881A (ja) * | 2006-09-13 | 2010-02-04 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 音声・音響送信器及び受信器のための方法及び装置 |
JP2008139447A (ja) * | 2006-11-30 | 2008-06-19 | Mitsubishi Electric Corp | 音声符号化装置及び音声復号装置 |
ATE500588T1 (de) * | 2008-01-04 | 2011-03-15 | Dolby Sweden Ab | Audiokodierer und -dekodierer |
EP2107556A1 (en) * | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
CN101714379B (zh) * | 2008-10-08 | 2011-10-26 | 安凯(广州)微电子技术有限公司 | 一种音频重采样方法 |
CN102365680A (zh) * | 2009-02-03 | 2012-02-29 | 三星电子株式会社 | 音频信号的编码和解码方法及其装置 |
US9082395B2 (en) * | 2009-03-17 | 2015-07-14 | Dolby International Ab | Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding |
PL2471061T3 (pl) * | 2009-10-08 | 2014-03-31 | Fraunhofer Ges Forschung | Działający w wielu trybach dekoder sygnału audio, działający w wielu trybach koder sygnału audio, sposoby i program komputerowy stosujące kształtowanie szumu oparte o kodowanie z wykorzystaniem predykcji liniowej |
RU2591011C2 (ru) * | 2009-10-20 | 2016-07-10 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Кодер аудиосигнала, декодер аудиосигнала, способ кодирования или декодирования аудиосигнала с удалением алиасинга (наложения спектров) |
PL3998606T3 (pl) * | 2009-10-21 | 2023-03-06 | Dolby International Ab | Nadrpóbkowanie w połączonym banku filtrów modułu transpozycji |
CN102783034B (zh) * | 2011-02-01 | 2014-12-17 | 华为技术有限公司 | 用于提供信号处理系数的方法和设备 |
EP4243017A3 (en) * | 2011-02-14 | 2023-11-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method decoding an audio signal using an aligned look-ahead portion |
CN102324229B (zh) * | 2011-09-08 | 2012-11-28 | 中国科学院自动化研究所 | 语音输入设备使用异常的检测方法及系统 |
CN102324232A (zh) * | 2011-09-12 | 2012-01-18 | 辽宁工业大学 | 基于高斯混合模型的声纹识别方法及系统 |
WO2013056388A1 (en) * | 2011-10-18 | 2013-04-25 | Telefonaktiebolaget L M Ericsson (Publ) | An improved method and apparatus for adaptive multi rate codec |
CN102419981B (zh) * | 2011-11-02 | 2013-04-03 | 展讯通信(上海)有限公司 | 音频信号时间尺度和频率尺度缩放处理方法及设备 |
US9043201B2 (en) * | 2012-01-03 | 2015-05-26 | Google Technology Holdings LLC | Method and apparatus for processing audio frames to transition between different codecs |
CN103227917B (zh) * | 2012-01-31 | 2016-12-14 | 华为技术有限公司 | 解码方法和装置 |
US20130211846A1 (en) * | 2012-02-14 | 2013-08-15 | Motorola Mobility, Inc. | All-pass filter phase linearization of elliptic filters in signal decimation and interpolation for an audio codec |
EP2830061A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
FR3011408A1 (fr) * | 2013-09-30 | 2015-04-03 | Orange | Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard |
US9620134B2 (en) * | 2013-10-10 | 2017-04-11 | Qualcomm Incorporated | Gain shape estimation for improved tracking of high-band temporal characteristics |
US10083708B2 (en) * | 2013-10-11 | 2018-09-25 | Qualcomm Incorporated | Estimation of mixing factors to generate high-band excitation signal |
JP6345780B2 (ja) * | 2013-11-22 | 2018-06-20 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | ハイバンドコーディングにおける選択的位相補償 |
US20150149157A1 (en) * | 2013-11-22 | 2015-05-28 | Qualcomm Incorporated | Frequency domain gain shape estimation |
FR3015754A1 (fr) * | 2013-12-20 | 2015-06-26 | Orange | Re-echantillonnage d'un signal audio cadence a une frequence d'echantillonnage variable selon la trame |
FR3023036A1 (fr) * | 2014-06-27 | 2016-01-01 | Orange | Re-echantillonnage par interpolation d'un signal audio pour un codage / decodage a bas retard |
US10236006B1 (en) * | 2016-08-05 | 2019-03-19 | Digimarc Corporation | Digital watermarks adapted to compensate for time scaling, pitch shifting and mixing |
-
2013
- 2013-09-30 FR FR1359456A patent/FR3011408A1/fr active Pending
-
2014
- 2014-09-26 KR KR1020217037252A patent/KR102505501B1/ko active IP Right Grant
- 2014-09-26 CN CN201480053813.5A patent/CN105684078B/zh active Active
- 2014-09-26 RS RS20230080A patent/RS63937B1/sr unknown
- 2014-09-26 KR KR1020177024336A patent/KR102505502B1/ko active IP Right Grant
- 2014-09-26 EP EP17206561.7A patent/EP3330964B1/fr active Active
- 2014-09-26 PL PL14796207.0T patent/PL3053163T3/pl unknown
- 2014-09-26 FI FIEP17206561.7T patent/FI3330964T3/fi active
- 2014-09-26 JP JP2016518091A patent/JP6559658B2/ja active Active
- 2014-09-26 RU RU2017144520A patent/RU2756042C2/ru active
- 2014-09-26 PT PT172065617T patent/PT3330964T/pt unknown
- 2014-09-26 SI SI201432007T patent/SI3053163T1/sl unknown
- 2014-09-26 DK DK17206561.7T patent/DK3330964T3/da active
- 2014-09-26 HU HUE17206561A patent/HUE061430T2/hu unknown
- 2014-09-26 RU RU2016117073A patent/RU2679228C2/ru active
- 2014-09-26 SI SI201432006T patent/SI3330964T1/sl unknown
- 2014-09-26 RS RS20230078A patent/RS63936B1/sr unknown
- 2014-09-26 MX MX2016003902A patent/MX355959B/es active IP Right Grant
- 2014-09-26 DK DK14796207.0T patent/DK3053163T3/da active
- 2014-09-26 PT PT147962070T patent/PT3053163T/pt unknown
- 2014-09-26 HU HUE14796207A patent/HUE061442T2/hu unknown
- 2014-09-26 KR KR1020217037251A patent/KR102514983B1/ko active IP Right Grant
- 2014-09-26 LT LTEPPCT/FR2014/052430T patent/LT3053163T/lt unknown
- 2014-09-26 WO PCT/FR2014/052430 patent/WO2015044609A1/fr active Application Filing
- 2014-09-26 KR KR1020227046263A patent/KR102638785B1/ko active IP Right Grant
- 2014-09-26 LT LTEP17206561.7T patent/LT3330964T/lt unknown
- 2014-09-26 BR BR122017018551-9A patent/BR122017018551B1/pt active IP Right Grant
- 2014-09-26 BR BR112016006447-0A patent/BR112016006447B1/pt active IP Right Grant
- 2014-09-26 ES ES17206561T patent/ES2935337T3/es active Active
- 2014-09-26 CN CN201710730282.4A patent/CN107481726B/zh active Active
- 2014-09-26 PL PL17206561.7T patent/PL3330964T3/pl unknown
- 2014-09-26 US US15/025,138 patent/US10403296B2/en active Active
- 2014-09-26 KR KR1020167011201A patent/KR20160061420A/ko active Application Filing
- 2014-09-26 EP EP14796207.0A patent/EP3053163B1/fr active Active
- 2014-09-26 FI FIEP14796207.0T patent/FI3053163T3/fi active
- 2014-09-26 ES ES14796207T patent/ES2934671T3/es active Active
- 2014-09-26 HR HRP20230094TT patent/HRP20230094T1/hr unknown
- 2014-09-26 HR HRP20230101TT patent/HRP20230101T1/hr unknown
-
2016
- 2016-04-29 ZA ZA2016/02919A patent/ZA201602919B/en unknown
-
2017
- 2017-07-27 JP JP2017145793A patent/JP6559741B2/ja active Active
- 2017-08-04 US US15/668,922 patent/US10566004B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6559741B2 (ja) | 低遅延符号化/復号のための音声信号のリサンプリング | |
JP2016541004A5 (ja) | ||
JP6641302B2 (ja) | 低遅延符号化/復号のための補間による音声信号のリサンプリング | |
JP3954495B2 (ja) | 適応ろ波による高周波復元符号化方法の知覚性能の強化方法 | |
JP4842538B2 (ja) | 合成発話の周波数選択的ピッチ強調方法およびデバイス | |
KR100915733B1 (ko) | 음성 신호들의 대역폭의 인공 확장을 위한 방법 및 장치 | |
RU2386179C2 (ru) | Способ и устройство для кодирования речевых сигналов с расщеплением полосы | |
KR101699898B1 (ko) | 스펙트럼 영역에서 디코딩된 오디오 신호를 처리하기 위한 방법 및 장치 | |
CN105453172B (zh) | 应用加权噪音的帧丢失的校正 | |
US9940943B2 (en) | Resampling of an audio signal interrupted with a variable sampling frequency according to the frame | |
EP0843302A2 (en) | Voice coder using sinusoidal analysis and pitch control | |
JP5711645B2 (ja) | オーディオ信号出力装置およびオーディオ信号出力方法 | |
JP3749838B2 (ja) | 音響信号符号化方法、音響信号復号方法、これらの装置、これらのプログラム及びその記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20170719 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170925 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171025 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180717 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180814 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20181113 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190702 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190717 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6559658 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |