JP6084595B2 - 音声信号のタイムワープ処理改良変換符号化 - Google Patents
音声信号のタイムワープ処理改良変換符号化 Download PDFInfo
- Publication number
- JP6084595B2 JP6084595B2 JP2014182138A JP2014182138A JP6084595B2 JP 6084595 B2 JP6084595 B2 JP 6084595B2 JP 2014182138 A JP2014182138 A JP 2014182138A JP 2014182138 A JP2014182138 A JP 2014182138A JP 6084595 B2 JP6084595 B2 JP 6084595B2
- Authority
- JP
- Japan
- Prior art keywords
- warp
- signal
- time
- time warped
- parameter sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000003595 spectral effect Effects 0.000 claims abstract description 59
- 238000000034 method Methods 0.000 claims abstract description 53
- 230000005236 sound signal Effects 0.000 claims abstract description 32
- 238000006243 chemical reaction Methods 0.000 claims description 14
- 238000013139 quantization Methods 0.000 claims description 11
- 230000005540 biological transmission Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 abstract description 6
- 239000011295 pitch Substances 0.000 description 62
- 238000012952 Resampling Methods 0.000 description 36
- 238000012545 processing Methods 0.000 description 22
- 230000009466 transformation Effects 0.000 description 20
- 230000008569 process Effects 0.000 description 13
- 230000008901 benefit Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 7
- 230000002441 reversible effect Effects 0.000 description 7
- 238000000638 solvent extraction Methods 0.000 description 7
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 239000002131 composite material Substances 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002085 persistent effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 230000002087 whitening effect Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Description
によって定義される。
により間隔Iにおける有限エネルギーの信号に対する正規直交基底{uα}を得る。
が構築され、ここで、dk=sk+1−skであり、シーケンスdkは、Ψ(t)が連続微分可能となるように調整される。これにより、正規化ワープ・マップΨkのシーケンスから、タイプAΨ(t)+Bのスケールのアフィン変換に至るまでのΨ(t)が定義される。
は、間隔Iにおける有限エネルギーの信号に対するタイムワープ処理正規直交基底であり、この式は、式(2)のパラメータ・シーケンスskおよびdkの初期設定とは関係なく、区分化点tkおよび正規化ワープ・マップΨkのシーケンスから明確に定義される。これは、t<tkまたはt>tk+Kにおいてuk,n(t)=0であるということを条件として、任意の区分化に適合し、さらに、これは、uk,n(t)が、l<k−pまたはl>k+K+pにおいてtlに依存せず、l<k−pまたはl≧k+K+pにおいて正規化ワープ・マップΨlにも依存しないということを条件として、局所的に定義される。
のような定数0<C1<C2があると想定する。その結果、
は、間隔Iにおける有限エネルギーの信号の空間に対するリース基底の双直交のペアを定義する。
により構成することができる。これは、ヴィッカーハウザー(Wickerhauser)の中間点構造に相当する。
から得られ、ここで周波数指数はn=0,1,2,…。この構成がρ=0の局所性条件と上述したアフィン不変とに従うことの検証は容易である。t軸上に得られるワープ処理基底(3)は、この場合、k≦t≦k+2に対して、
の形に書き換えることができ、ここで、φkは、間隔[0,2]の連続微分可能なマップをそれ自体の上に形成するために、ΨkおよびΨk+1を一緒に併せることにより定義される。
とおくことによって得られる。
により定義され、上式は、間隔[0,2mk]で0から1まで増加し、間隔[2mk,2]で1から0まで減少する。
のような定数0<C1<C2が存在すれば、(8)式の双直交バージョンを導き出すことができる。(4)式中でηk=lkを選択することにより、(5)式の
への特殊化が得られる。
により与えられる。
を得る。
が得られ、ここで、
である。
が得られることになる。(mkに応じて追加のオフセットを導入する)式15によって表されているようなブロック変換の前に、
をマップする再サンプリングが必要となる。
ここで
であり、さらに、
である。
が導き出され、上式は、次のステップで容易に計算される:まず、IV型のDCTを行い、次に、0≦rν<2の条件の下で、オフセット・パラメータmkによって決まるサンプルを2Lに拡大する。次に、窓bk(rν)による窓処理を行う。zk(rν)が求まれば、再サンプリング
により、式(19)に表されたオーバーラップして加える操作に対する等距離サンプル点(p+1/2)/Lにおける信号セグメントykが得られる。
・逆変換
・窓処理
・再サンプリング
・オーバーラップおよび加算
・スペクトル重み付け
・逆変換
・再サンプリング
・窓処理
・オーバーラップおよび加算
を解くことによって得られる。
が含まれ、ここで、aはワープ・パラメータである。h”/h’によってマップh(t)のワープを定義すれば、3つのマップ全てがt=1/2においてaに等しくなる。指数関数マップは、0≦t≦1の全区間において一定のワープを有し、aの小さな値に対しては、他の2つのマップは、この一定の値から非常に小さな偏差を示す。再サンプリング(23)のためのデコーダの中で適用される所定のワープ・マップに対して、エンコーダでは、再サンプリング(式18)に対してその逆が必要となる。反転作業の主要部分は、正規化ワープ・マップの反転から生じる。二次マップの反転には、平方根操作が必要であり、指数関数マップの反転には、対数が必要であり、有理メビウス・マップの反転は、否定ワープ・パラメータを用いたメビウス・マップである。指数関数および分割は同等に高価なので、デコーダにおける計算を最大に軽減することを重視すれば、区分的な二次ワープ・マップ・シーケンスΨkが好ましい選択となる。
・正規化ワープ・マップである。
・円滑なプロトタイプ・ワープ・マップ(25)の1つの再スケールされたコピーによって一緒に結合されている。
・連続微分可能である。
・次式を満たす。
が、一定のステップ・サイズ、通常0.005で量子化される。この場合、得られた整数値は、逐次的にまたは階層的な仕方で、さらに差分符号化される。双方の場合において、得られたサイド情報のビットレートは、通常、1秒あたり数百ビットであり、これは、スピーチ・コーデックにおけるピッチ・データを表すために必要なレートのわずかな部分でしかない。
によって与えられる。これら間隔の外側において、ワープはゼロに設定される。なお、ピッチ周期重複のようなピッチ推定中の系統誤差は、ワープ推定にほとんど影響を与えない。
Claims (5)
- 音声入力信号(100)を受信し、さらにデコーダに送信されるビットストリームを生成するための音声エンコーダであって、
ワープ・パラメータ・シーケンスを推定するためのワープ・パラメータ・エクストラクタ(101)と、
前記ワープ・パラメータ・シーケンスを受信し、さらに前記音声入力信号(100)のタイムワープ処理スペクトル表現を導き出すためのワープ・トランスフォーマ(102)と、
前記音声入力信号(100)を受信するための知覚モデル・カルキュレータ(103)と、
送信時の前記ビットストリーム内におけるサイズを小さくするために、前記ワープ・パラメータ・シーケンスを符号化するためのワープ・コーダ(104)と、
前記音声入力信号の符号化されたタイムワープ処理スペクトル表現を得るために、量子化のための前記タイムワープ処理スペクトル表現を受信するためのエンコーダ(105)であって、前記エンコーダ(105)は前記知覚モデル・カルキュレータ(103)によって制御される、エンコーダと、
前記符号化されたワープ・パラメータ・シーケンスおよび前記音声入力信号の前記符号化されたタイムワープ処理スペクトル表現を受信しさらに多重化するためのマルチプレクサ(106)とを含む、音声エンコーダ。 - 再生された音声信号を導き出すためのタイムワープ処理変換デコーダであって、
ビットストリームを符号化されたワープ・パラメータ・シーケンスおよびタイムワープ処理スペクトル表現の符号化された表現に逆多重化するための逆マルチプレクサ(201)と、
前記ワープ・パラメータ・シーケンスの再生を導き出すために、前記符号化されたワープ・パラメータ・シーケンスを復号化するためのワープ・デコーダ(202)と、
音声信号のタイムワープ処理スペクトル表現を導き出すために、前記タイムワープ処理スペクトル表現の前記符号化された表現を復号化するためのデコーダ(203)と、
前記ワープ・パラメータ・シーケンスの前記再生および前記音声信号の前記タイムワープ処理スペクトル表現を受信し、さらにタイムワープ処理オーバーラップ変換符号化を用いて前記再生された音声出力信号を導き出すための逆ワープ・トランスフォーマ(204)とを含む、デコーダ。 - ビットストリームを生成するための音声符号化の方法であって、
音声入力信号(100)を受信するステップと、
ワープ・パラメータ・シーケンスを推定するステップ(101)と、
前記ワープ・パラメータ・シーケンスを用いて前記音声入力信号(100)のタイムワープ処理スペクトル表現を導き出すステップ(102)と、
送信時に前記ビットストリーム内におけるサイズを小さくするために、前記ワープ・パラメータ・シーケンスを符号化するステップ(104)と、
前記音声入力信号の符号化されたタイムワープ処理スペクトル表現を得るために、前記タイムワープ処理スペクトル表現を量子化するステップ(105)であって、量子化するステップ(105)は知覚モデル・カルキュレータ(103)によって制御される、ステップと、
前記符号化されたワープ・パラメータ・シーケンスおよび前記音声入力信号の前記符号化されたタイムワープ処理スペクトル表現を多重化するステップ(106)とを含む、方法。 - 再生された音声信号を導き出すためのタイムワープ処理変換復号化の方法であって、
ビットストリームを符号化されたワープ・パラメータ・シーケンスおよびタイムワープ処理スペクトル表現の符号化された表現に逆多重化するステップ(201)と、
前記ワープ・パラメータ・シーケンスの再生を導き出すために、前記符号化されたワープ・パラメータ・シーケンスを復号化するステップ(202)と、
音声信号のタイムワープ処理スペクトル表現を導き出すために、前記タイムワープ処理スペクトル表現の前記符号化された表現を復号化するステップ(203)と、
前記ワープ・パラメータ・シーケンスの前記再生および前記音声信号の前記タイムワープ処理スペクトル表現を用いて、タイムワープ処理オーバーラップ変換符号化を用いて前記再生された音声出力信号を導き出すステップ(204)とを含む、方法。 - コンピュータ上で実行されるときに、請求項3または請求項4に記載の方法のいずれかを実行するように構成されるプログラム・コードを有するコンピュータ・プログラム。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US73351205P | 2005-11-03 | 2005-11-03 | |
US60/733,512 | 2005-11-03 | ||
US11/464,176 | 2006-08-11 | ||
US11/464,176 US7720677B2 (en) | 2005-11-03 | 2006-08-11 | Time warped modified transform coding of audio signals |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013106030A Division JP6125324B2 (ja) | 2005-11-03 | 2013-05-20 | 音声信号のタイムワープ処理改良変換符号化 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015018274A JP2015018274A (ja) | 2015-01-29 |
JP6084595B2 true JP6084595B2 (ja) | 2017-02-22 |
Family
ID=37507461
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008538284A Active JP4927088B2 (ja) | 2005-11-03 | 2006-10-24 | 音声信号のタイムワープ処理改良変換符号化 |
JP2011240716A Active JP5323164B2 (ja) | 2005-11-03 | 2011-11-02 | 音声信号のタイムワープ処理改良変換符号化 |
JP2013106030A Active JP6125324B2 (ja) | 2005-11-03 | 2013-05-20 | 音声信号のタイムワープ処理改良変換符号化 |
JP2014182138A Active JP6084595B2 (ja) | 2005-11-03 | 2014-09-08 | 音声信号のタイムワープ処理改良変換符号化 |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008538284A Active JP4927088B2 (ja) | 2005-11-03 | 2006-10-24 | 音声信号のタイムワープ処理改良変換符号化 |
JP2011240716A Active JP5323164B2 (ja) | 2005-11-03 | 2011-11-02 | 音声信号のタイムワープ処理改良変換符号化 |
JP2013106030A Active JP6125324B2 (ja) | 2005-11-03 | 2013-05-20 | 音声信号のタイムワープ処理改良変換符号化 |
Country Status (14)
Country | Link |
---|---|
US (3) | US7720677B2 (ja) |
EP (7) | EP2306455B1 (ja) |
JP (4) | JP4927088B2 (ja) |
KR (1) | KR100959701B1 (ja) |
CN (2) | CN101351840B (ja) |
AT (1) | ATE395687T1 (ja) |
DE (1) | DE602006001194D1 (ja) |
DK (1) | DK1807825T3 (ja) |
ES (5) | ES2967257T3 (ja) |
HK (2) | HK1105159A1 (ja) |
MY (1) | MY141264A (ja) |
PL (1) | PL1807825T3 (ja) |
TW (1) | TWI320172B (ja) |
WO (1) | WO2007051548A1 (ja) |
Families Citing this family (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7720677B2 (en) * | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
US8682652B2 (en) * | 2006-06-30 | 2014-03-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
US7873511B2 (en) * | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
US8239190B2 (en) * | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
KR101380170B1 (ko) * | 2007-08-31 | 2014-04-02 | 삼성전자주식회사 | 미디어 신호 인코딩/디코딩 방법 및 장치 |
TWI455064B (zh) * | 2007-12-20 | 2014-10-01 | Thomson Licensing | 聲影文件突起映圖之決定方法和裝置 |
EP2077551B1 (en) | 2008-01-04 | 2011-03-02 | Dolby Sweden AB | Audio encoder and decoder |
EP2107556A1 (en) | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
AU2013206267B2 (en) * | 2008-07-11 | 2015-10-01 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Providing a time warp activation signal and encoding an audio signal therewith |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
EP2144231A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
CN103000178B (zh) | 2008-07-11 | 2015-04-08 | 弗劳恩霍夫应用研究促进协会 | 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码 |
EP2211335A1 (en) | 2009-01-21 | 2010-07-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal |
PL3246919T3 (pl) | 2009-01-28 | 2021-03-08 | Dolby International Ab | Ulepszona transpozycja harmonicznych |
PL3985666T3 (pl) | 2009-01-28 | 2023-05-08 | Dolby International Ab | Ulepszona transpozycja harmonicznych |
KR101701759B1 (ko) | 2009-09-18 | 2017-02-03 | 돌비 인터네셔널 에이비 | 입력 신호를 전위시키기 위한 시스템 및 방법, 및 상기 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터 판독가능 저장 매체 |
EP2492911B1 (en) * | 2009-10-21 | 2017-08-16 | Panasonic Intellectual Property Management Co., Ltd. | Audio encoding apparatus, decoding apparatus, method, circuit and program |
US9338523B2 (en) * | 2009-12-21 | 2016-05-10 | Echostar Technologies L.L.C. | Audio splitting with codec-enforced frame sizes |
KR101445296B1 (ko) * | 2010-03-10 | 2014-09-29 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 샘플링 레이트 의존 시간 왜곡 윤곽 인코딩을 이용하는 오디오 신호 디코더, 오디오 신호 인코더, 방법, 및 컴퓨터 프로그램 |
EP2372704A1 (en) | 2010-03-11 | 2011-10-05 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Signal processor and method for processing a signal |
JPWO2012046447A1 (ja) | 2010-10-06 | 2014-02-24 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法及び復号方法 |
CN103534754B (zh) | 2011-02-14 | 2015-09-30 | 弗兰霍菲尔运输应用研究公司 | 在不活动阶段期间利用噪声合成的音频编解码器 |
ES2534972T3 (es) | 2011-02-14 | 2015-04-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Predicción lineal basada en esquema de codificación utilizando conformación de ruido de dominio espectral |
CN102959620B (zh) * | 2011-02-14 | 2015-05-13 | 弗兰霍菲尔运输应用研究公司 | 利用重迭变换的信息信号表示 |
CA2827000C (en) | 2011-02-14 | 2016-04-05 | Jeremie Lecomte | Apparatus and method for error concealment in low-delay unified speech and audio coding (usac) |
SG192746A1 (en) | 2011-02-14 | 2013-09-30 | Fraunhofer Ges Forschung | Apparatus and method for processing a decoded audio signal in a spectral domain |
AU2012217153B2 (en) * | 2011-02-14 | 2015-07-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion |
AR085895A1 (es) | 2011-02-14 | 2013-11-06 | Fraunhofer Ges Forschung | Generacion de ruido en codecs de audio |
MY159444A (en) | 2011-02-14 | 2017-01-13 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | Encoding and decoding of pulse positions of tracks of an audio signal |
PL3471092T3 (pl) | 2011-02-14 | 2020-12-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekodowanie pozycji impulsów ścieżek sygnału audio |
AU2012217216B2 (en) | 2011-02-14 | 2015-09-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
CA3076775C (en) | 2013-01-08 | 2020-10-27 | Dolby International Ab | Model based prediction in a critically sampled filterbank |
KR101953613B1 (ko) * | 2013-06-21 | 2019-03-04 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 지터 버퍼 제어부, 오디오 디코더, 방법 및 컴퓨터 프로그램 |
CN105474313B (zh) * | 2013-06-21 | 2019-09-06 | 弗劳恩霍夫应用研究促进协会 | 时间缩放器、音频解码器、方法和计算机可读存储介质 |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
EP2830055A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Context-based entropy coding of sample values of a spectral envelope |
FR3020732A1 (fr) * | 2014-04-30 | 2015-11-06 | Orange | Correction de perte de trame perfectionnee avec information de voisement |
EP3000110B1 (en) | 2014-07-28 | 2016-12-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selection of one of a first encoding algorithm and a second encoding algorithm using harmonics reduction |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
EP3107096A1 (en) | 2015-06-16 | 2016-12-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Downscaled decoding |
CN107710323B (zh) | 2016-01-22 | 2022-07-19 | 弗劳恩霍夫应用研究促进协会 | 使用频谱域重新取样来编码或解码音频多通道信号的装置及方法 |
JP7257975B2 (ja) * | 2017-07-03 | 2023-04-14 | ドルビー・インターナショナル・アーベー | 密集性の過渡事象の検出及び符号化の複雑さの低減 |
EP3483879A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3519830A1 (de) * | 1985-06-03 | 1986-12-18 | Ruhrkohle Ag, 4300 Essen | Verfahren zur kohlehydrierung mit integrierten raffinationsstufen |
JPH01233835A (ja) * | 1988-03-14 | 1989-09-19 | Mitsubishi Electric Corp | 音声時間軸圧縮符号化装置 |
JPH0546199A (ja) * | 1991-08-21 | 1993-02-26 | Matsushita Electric Ind Co Ltd | 音声符号化装置 |
JPH0784597A (ja) * | 1993-09-20 | 1995-03-31 | Fujitsu Ltd | 音声符号化装置および音声復号化装置 |
WO1998006090A1 (en) | 1996-08-02 | 1998-02-12 | Universite De Sherbrooke | Speech/audio coding with non-linear spectral-amplitude transformation |
EP0906664B1 (en) * | 1997-04-07 | 2006-06-21 | Koninklijke Philips Electronics N.V. | Speech transmission system |
US6169970B1 (en) * | 1998-01-08 | 2001-01-02 | Lucent Technologies Inc. | Generalized analysis-by-synthesis speech coding method and apparatus |
US6182042B1 (en) * | 1998-07-07 | 2001-01-30 | Creative Technology Ltd. | Sound modification employing spectral warping techniques |
US6330533B2 (en) | 1998-08-24 | 2001-12-11 | Conexant Systems, Inc. | Speech encoder adaptively applying pitch preprocessing with warping of target signal |
US6502066B2 (en) * | 1998-11-24 | 2002-12-31 | Microsoft Corporation | System for generating formant tracks by modifying formants synthesized from speech units |
DE60018246T2 (de) * | 1999-05-26 | 2006-05-04 | Koninklijke Philips Electronics N.V. | System zur übertragung eines audiosignals |
US6959274B1 (en) * | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
WO2002007372A2 (en) | 2000-07-13 | 2002-01-24 | Qualcomm Incorporated | Maximum distance block coding scheme |
EP1340317A1 (en) | 2000-11-03 | 2003-09-03 | Koninklijke Philips Electronics N.V. | Parametric coding of audio signals |
ATE336774T1 (de) * | 2001-05-28 | 2006-09-15 | Texas Instruments Inc | Programmierbarer melodienerzeuger |
US6879955B2 (en) | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
US6941263B2 (en) * | 2001-06-29 | 2005-09-06 | Microsoft Corporation | Frequency domain postfiltering for quality enhancement of coded speech |
WO2003019527A1 (fr) | 2001-08-31 | 2003-03-06 | Kabushiki Kaisha Kenwood | Procede et appareil de generation d'un signal affecte d'un pas et procede et appareil de compression/decompression et de synthese d'un signal vocal l'utilisant |
JP3994332B2 (ja) * | 2001-09-27 | 2007-10-17 | 株式会社ケンウッド | 音声信号圧縮装置、音声信号圧縮方法、及び、プログラム |
US7555434B2 (en) | 2002-07-19 | 2009-06-30 | Nec Corporation | Audio decoding device, decoding method, and program |
CN1290036C (zh) | 2002-12-30 | 2006-12-13 | 国际商业机器公司 | 根据机器可读词典建立概念知识的计算机系统及方法 |
US7024358B2 (en) * | 2003-03-15 | 2006-04-04 | Mindspeed Technologies, Inc. | Recovering an erased voice frame with time warping |
US7587254B2 (en) * | 2004-04-23 | 2009-09-08 | Nokia Corporation | Dynamic range control and equalization of digital audio using warped processing |
US7433463B2 (en) | 2004-08-10 | 2008-10-07 | Clarity Technologies, Inc. | Echo cancellation and noise reduction method |
US7676362B2 (en) * | 2004-12-31 | 2010-03-09 | Motorola, Inc. | Method and apparatus for enhancing loudness of a speech signal |
US8155965B2 (en) * | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
US8355907B2 (en) * | 2005-03-11 | 2013-01-15 | Qualcomm Incorporated | Method and apparatus for phase matching frames in vocoders |
US7917561B2 (en) | 2005-09-16 | 2011-03-29 | Coding Technologies Ab | Partially complex modulated filter bank |
US7720677B2 (en) * | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
US7873511B2 (en) * | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
US8010350B2 (en) * | 2006-08-03 | 2011-08-30 | Broadcom Corporation | Decimated bisectional pitch refinement |
KR101040160B1 (ko) * | 2006-08-15 | 2011-06-09 | 브로드콤 코포레이션 | 패킷 손실 후의 제한되고 제어된 디코딩 |
US8239190B2 (en) * | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
MX2009013519A (es) * | 2007-06-11 | 2010-01-18 | Fraunhofer Ges Forschung | Codificador de audio para codificar una señal de audio que tiene una porcion similar a un impulso y una porcion estacionaria, metodos de codificacion, decodificador, metodo de decodificacion, y señal de audio codificada. |
EP2077551B1 (en) * | 2008-01-04 | 2011-03-02 | Dolby Sweden AB | Audio encoder and decoder |
CN103000178B (zh) * | 2008-07-11 | 2015-04-08 | 弗劳恩霍夫应用研究促进协会 | 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码 |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
EP2492911B1 (en) * | 2009-10-21 | 2017-08-16 | Panasonic Intellectual Property Management Co., Ltd. | Audio encoding apparatus, decoding apparatus, method, circuit and program |
-
2006
- 2006-08-11 US US11/464,176 patent/US7720677B2/en active Active
- 2006-10-24 ES ES21156798T patent/ES2967257T3/es active Active
- 2006-10-24 EP EP10183308.5A patent/EP2306455B1/en active Active
- 2006-10-24 EP EP21156798.7A patent/EP3852103B1/en active Active
- 2006-10-24 JP JP2008538284A patent/JP4927088B2/ja active Active
- 2006-10-24 ES ES08008361.1T patent/ES2604758T3/es active Active
- 2006-10-24 ES ES17193127T patent/ES2863667T3/es active Active
- 2006-10-24 ES ES10183308.5T patent/ES2646814T3/es active Active
- 2006-10-24 EP EP17193127.2A patent/EP3319086B1/en active Active
- 2006-10-24 EP EP23205462.7A patent/EP4290512A3/en active Pending
- 2006-10-24 EP EP06792443A patent/EP1807825B1/en active Active
- 2006-10-24 DE DE602006001194T patent/DE602006001194D1/de active Active
- 2006-10-24 CN CN200680049867XA patent/CN101351840B/zh active Active
- 2006-10-24 AT AT06792443T patent/ATE395687T1/de active
- 2006-10-24 EP EP23205479.1A patent/EP4290513A3/en active Pending
- 2006-10-24 ES ES06792443T patent/ES2307287T3/es active Active
- 2006-10-24 CN CN201210037454.7A patent/CN102592602B/zh active Active
- 2006-10-24 DK DK06792443T patent/DK1807825T3/da active
- 2006-10-24 KR KR1020087010642A patent/KR100959701B1/ko active IP Right Grant
- 2006-10-24 EP EP08008361.1A patent/EP1953738B1/en active Active
- 2006-10-24 WO PCT/EP2006/010246 patent/WO2007051548A1/en active IP Right Grant
- 2006-10-24 PL PL06792443T patent/PL1807825T3/pl unknown
- 2006-10-25 TW TW095139384A patent/TWI320172B/zh active
-
2007
- 2007-09-21 HK HK07110315A patent/HK1105159A1/xx unknown
-
2008
- 2008-04-29 MY MYPI20081350A patent/MY141264A/en unknown
-
2010
- 2010-01-29 US US12/697,137 patent/US8412518B2/en active Active
-
2011
- 2011-11-02 JP JP2011240716A patent/JP5323164B2/ja active Active
-
2013
- 2013-02-14 US US13/766,945 patent/US8838441B2/en active Active
- 2013-05-20 JP JP2013106030A patent/JP6125324B2/ja active Active
-
2014
- 2014-09-08 JP JP2014182138A patent/JP6084595B2/ja active Active
-
2018
- 2018-10-22 HK HK18113511.3A patent/HK1254427A1/zh unknown
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6084595B2 (ja) | 音声信号のタイムワープ処理改良変換符号化 | |
EP1440300B1 (en) | Encoding device, decoding device and audio data distribution system | |
US7020615B2 (en) | Method and apparatus for audio coding using transient relocation | |
RU2449387C2 (ru) | Способ и устройство для обработки сигнала | |
KR20090083070A (ko) | 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치 | |
JP2005533272A (ja) | オーディオコーディング | |
US20110087494A1 (en) | Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150617 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150623 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20150914 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160531 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160829 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170125 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6084595 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |