JP6748160B2 - オーディオ信号のスペクトルのスペクトル係数のコード化 - Google Patents
オーディオ信号のスペクトルのスペクトル係数のコード化 Download PDFInfo
- Publication number
- JP6748160B2 JP6748160B2 JP2018148125A JP2018148125A JP6748160B2 JP 6748160 B2 JP6748160 B2 JP 6748160B2 JP 2018148125 A JP2018148125 A JP 2018148125A JP 2018148125 A JP2018148125 A JP 2018148125A JP 6748160 B2 JP6748160 B2 JP 6748160B2
- Authority
- JP
- Japan
- Prior art keywords
- spectral
- spectrum
- coefficient
- decoder
- coefficients
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000003595 spectral effect Effects 0.000 title claims description 308
- 238000001228 spectrum Methods 0.000 title claims description 193
- 230000005236 sound signal Effects 0.000 title claims description 50
- 238000000034 method Methods 0.000 claims description 38
- 238000012546 transfer Methods 0.000 claims description 18
- 230000015572 biosynthetic process Effects 0.000 claims description 12
- 238000003786 synthesis reaction Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 11
- 230000011664 signaling Effects 0.000 claims description 11
- 230000007774 longterm Effects 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 7
- 230000002123 temporal effect Effects 0.000 claims description 7
- 230000003044 adaptive effect Effects 0.000 claims description 4
- 230000001419 dependent effect Effects 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims description 3
- 230000007423 decrease Effects 0.000 claims description 2
- 230000006870 function Effects 0.000 description 35
- 238000013507 mapping Methods 0.000 description 28
- 238000010586 diagram Methods 0.000 description 18
- 230000006978 adaptation Effects 0.000 description 15
- 238000009795 derivation Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 9
- 238000007493 shaping process Methods 0.000 description 9
- 238000013139 quantization Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000000354 decomposition reaction Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000001186 cumulative effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 238000005311 autocorrelation function Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000010845 search algorithm Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
上記で提示した代替的な実施形態に加えて、スペクトル係数の符号化/復号は、エントロピー符号化/復号に加えて、現在符号化/復号すべきスペクトル係数をスペクトル的に及び/又は時間的に予測することを含み得ることが留意される。その後、予測残差が、上述したようなエントロピー符号化/復号を受け得る。
D0−Δ<D<D0+Δ
{M.D0−Δ<D<M.D0+Δ:M ∈F}
ここで、Mは、例えば、有限集合Fに属する乗法係数である。例えば、Mは、半分及び2倍のピッチを探索するために0.5、1及び2の値を得ることができる。最後に、Dの全数検索も行うことができる。実際には、この最後の手法は複雑になりすぎる場合がある。図18に検索アルゴリズムの一例を示す。この検索アルゴリズムは、例えば、導出プロセス82又は復号側及び符号化側における導出プロセス82及び84の両方の一部分であってもよい。
Dopt=m.D0+d
入力:分解能r
入力:normVect[N/r]
出力:contextMapping[N/r]
lastNz/2は、スペクトル成分の前のceil(log2(n/2))ビット上でコード化される。
入力:lastNz
入力:contextMapping[N]
入力:スペクトルx[N]
出力:コード化ビットストリーム
ローカル:context[N/2]
・Dopt、又はD0についてのDoptを得るためのパラメータ調整パラメータのいずれかを復号することによって、コンテキストマッピングを復号する。
・lastNzを復号する。
・量子化スペクトルを以下のように復号する。
入力:lastNz
入力:contextMapping[N]
入力:コード化ビットストリーム
ローカル:context[N/2]
出力:量子化スペクトルx[N]
Claims (19)
- スペクトルの系列から構成されたオーディオ信号のスペクトログラムのスペクトル係数を復号するための復号器であって、
1つのスペクトル内でスペクトル係数を走査し、その後に時間的に後続するスペクトルのスペクトル係数に進むスペクトル時間経路に沿って、スペクトル係数を復号するように構成されているとともに、
現在のスペクトルの現在復号すべき(currently to be decoded)スペクトル係数を、現在のスペクトルに属するスペクトル係数を含んでいる前もって復号された(previously decoded)スペクトル係数のテンプレートであって、現在復号すべきスペクトル係数の位置に位置付けられるテンプレートに依存して、コンテキスト適応エントロピー復号によって復号し、現在のスペクトルに属するスペクトル係数と現在復号すべきスペクトル係数との間の相対スペクトル距離又は現在のスペクトルに属するスペクトル係数と現在のスペクトルに属するテンプレートのさらなるスペクトル係数との間の相対スペクトル距離の少なくとも一方をスペクトルの形状に関する情報に依存して調整するように構成されている、復号器。 - 前記スペクトルの形状に関する前記情報の増大に伴って前記相対スペクトル距離が増大するように構成され、前記スペクトルの形状に関する情報は、前記オーディオ信号のピッチ又は周期性の測度を含む、請求項1に記載の復号器。
- 前記スペクトルの形状に関する前記情報は、
前記オーディオ信号のピッチ又は周期性の測度、
前記オーディオ信号のスペクトルの高調波間距離の測度、
前記スペクトルのスペクトル包絡線のフォルマント及び/又はバレーの相対位置、の少なくとも1つを含む、請求項1に記載の復号器。 - 前記復号器は、明示的なシグナル伝達(signalization)から前記スペクトルの形状に関する前記情報を得るように構成されている、請求項1に記載の復号器。
- 前記復号器は、前もって復号されたスペクトル係数又は前記スペクトルの前もって復号されたLPCベースのスペクトル包絡線から、前記スペクトルの形状に関する前記情報を得るように構成されている、請求項1に記載の復号器。
- 前記復号器は、
前記スペクトルの形状に関する前記情報が前記オーディオ信号のピッチの測度であり、該復号器が、前記相対スペクトル距離がピッチの増大に伴って増大するように、前記ピッチの前記測度に依存して前記相対スペクトル距離を調整するように構成されているか、
前記スペクトルの形状に関する前記情報が前記オーディオ信号の周期性の測度であり、該復号器が、前記相対スペクトル距離が周期性の増大に伴って低減するように、前記周期性の測度に依存して前記相対スペクトル距離を調整するように構成されているか、
前記スペクトルの形状に関する前記情報が前記オーディオ信号のスペクトルの高調波間距離の測度であり、該復号器が、前記相対スペクトル距離が高調波間距離の増大に伴って増大するように、前記高調波間距離の前記測度に依存して前記相対スペクトル距離を調整するように構成されているか、又は、
前記スペクトルの形状に関する前記情報が前記スペクトルのスペクトル包絡線のフォルマント及び/又はバレーの相対位置を含み、該復号器が、前記相対スペクトル距離が、前記スペクトル包絡線内の前記バレーの間及び/又は前記スペクトル包絡線の前記フォルマント間のスペクトル距離の増大に伴って増大するように、前記位置に依存して前記相対スペクトル距離を調整するように構成されている、請求項1に記載の復号器。 - エントロピー復号による前記現在復号すべきスペクトル係数の復号において、前記テンプレートの前記前もって復号されたスペクトル係数をスカラー関数に従わせることによって、前記現在復号すべきスペクトル係数のための確率分布推定値を求め、前記エントロピー復号に前記確率分布推定値を使用するように構成されている、請求項1に記載の復号器。
- エントロピー復号として算術復号を使用するように構成されている、請求項1に記載の復号器。
- 前記復号器は、前記現在復号すべきスペクトル係数をスペクトル的に及び/又は時間的に予測し、前記エントロピー復号を介して得られる予測残差で前記スペクトル的な及び/又は時間的な予測を補正することにより、前記現在復号すべきスペクトル係数を復号するように構成されている、請求項1に記載の復号器。
- 請求項1に従ってオーディオ信号のスペクトログラムのスペクトル係数を復号するように構成されている復号器を備えている、変換ベースオーディオ復号器。
- 前記復号器は、スケール係数を使用して前記スペクトルをスケーリングすることによって、前記スペクトルをスペクトル的に整形するように構成されている、請求項10に記載の変換ベースオーディオ復号器。
- 前記スケール係数が線形予測係数情報によって規定される線形予測合成フィルタに依存した伝達関数を表すように、線形予測分析に基づいて前記スケール係数を決定するように構成されている、請求項11に記載の変換ベースオーディオ復号器。
- 前記線形予測係数情報によって規定される前記線形予測合成フィルタに対する前記伝達関数の依存性は、前記伝達関数が知覚的に重み付けされるようなものである、請求項12に記載の変換ベースオーディオ復号器。
- 前記線形予測係数情報によって規定される前記線形予測合成フィルタ1/A(z)に対する前記伝達関数の依存性は、前記伝達関数が1/A(k・z)の伝達関数であるようなものであり、kは定数である、請求項13に記載の変換ベースオーディオ復号器。
- 前記変換ベースオーディオ復号器は、明示的にシグナリングされた長期予測パラメータによって制御される長期予測高調波又はポストフィルタリングをサポートし、前記変換ベースオーディオ復号器は、前記明示的にシグナリングされる長期予測パラメータから前記スペクトルの形状に関する情報を導出するように構成されている、請求項10に記載の変換ベースオーディオ復号器。
- スペクトルの系列から構成されたオーディオ信号のスペクトログラムのスペクトル係数を符号化するための符号化器であって、
1つのスペクトル内でスペクトル係数を走査し、その後に時間的に後続するスペクトルのスペクトル係数に進むスペクトル時間経路に沿って、スペクトル係数を符号化し、
現在のスペクトルの現在符号化すべきスペクトル係数を、現在のスペクトルに属するスペクトル係数を含んでいる前もって符号化されたスペクトル係数のテンプレートであって、現在符号化すべきスペクトル係数の位置に位置付けられるテンプレートに依存して、エントロピー符号化によって符号化し、現在のスペクトルに属するスペクトル係数と現在符号化すべきスペクトル係数との間の相対スペクトル距離又は現在のスペクトルに属するスペクトル係数と現在のスペクトルに属するテンプレートのさらなるスペクトル係数との間の相対スペクトル距離の少なくとも一方をスペクトルの形状に関する情報に依存して調整するように構成された符号化器。 - スペクトルの系列から構成されたオーディオ信号のスペクトログラムのスペクトル係数を復号するための方法であって、
1つのスペクトル内でスペクトル係数を走査し、その後に時間的に後続するスペクトルのスペクトル係数に進むスペクトル時間経路に沿って、スペクトル係数を復号することと、
現在のスペクトルの現在復号すべきスペクトル係数を、現在のスペクトルに属するスペクトル係数を含んでいる前もって復号されたスペクトル係数のテンプレートであって、現在復号すべきスペクトル係数の位置に位置付けられるテンプレートに依存して、エントロピー復号によって復号し、現在のスペクトルに属するスペクトル係数と現在復号すべきスペクトル係数との間の相対スペクトル距離又は現在のスペクトルに属するスペクトル係数と現在のスペクトルに属するテンプレートのさらなるスペクトル係数との間の相対スペクトル距離の少なくとも一方をスペクトルの形状に関する情報に依存して調整することと、を含む方法。 - スペクトルの系列から構成されたオーディオ信号のスペクトログラムのスペクトル係数を符号化するための方法であって、
1つのスペクトル内でスペクトル係数を走査し、その後に時間的に後続するスペクトルのスペクトル係数に進むスペクトル時間経路に沿って、スペクトル係数を符号化することと、
現在のスペクトルの現在符号化すべきスペクトル係数を、現在のスペクトルに属するスペクトル係数を含んでいる前もって符号化されたスペクトル係数のテンプレートであって、現在符号化すべきスペクトル係数の位置に位置付けられるテンプレートに依存して、コンテキスト適応エントロピー符号化によって符号化し、現在のスペクトルに属するスペクトル係数と現在符号化すべきスペクトル係数との間の相対スペクトル距離又は現在のスペクトルに属するスペクトル係数と現在のスペクトルに属するテンプレートのさらなるスペクトル係数との間の相対スペクトル距離の少なくとも一方をスペクトルの形状に関する情報に依存して調整することと、を含む方法。 - コンピュータ上で動作しているときに、請求項17又は18に記載の方法を実施するためのプログラムコードを有するコンピュータプログラム。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13189391 | 2013-10-18 | ||
EP13189391.9 | 2013-10-18 | ||
EP14178806 | 2014-07-28 | ||
EP14178806.7 | 2014-07-28 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016524486A Division JP6385433B2 (ja) | 2013-10-18 | 2014-10-17 | オーディオ信号のスペクトルのスペクトル係数のコード化 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020133541A Division JP7218329B2 (ja) | 2013-10-18 | 2020-08-06 | オーディオ信号のスペクトルのスペクトル係数のコード化 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018205758A JP2018205758A (ja) | 2018-12-27 |
JP6748160B2 true JP6748160B2 (ja) | 2020-08-26 |
Family
ID=51844681
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016524486A Active JP6385433B2 (ja) | 2013-10-18 | 2014-10-17 | オーディオ信号のスペクトルのスペクトル係数のコード化 |
JP2018148125A Active JP6748160B2 (ja) | 2013-10-18 | 2018-08-07 | オーディオ信号のスペクトルのスペクトル係数のコード化 |
JP2020133541A Active JP7218329B2 (ja) | 2013-10-18 | 2020-08-06 | オーディオ信号のスペクトルのスペクトル係数のコード化 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016524486A Active JP6385433B2 (ja) | 2013-10-18 | 2014-10-17 | オーディオ信号のスペクトルのスペクトル係数のコード化 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020133541A Active JP7218329B2 (ja) | 2013-10-18 | 2020-08-06 | オーディオ信号のスペクトルのスペクトル係数のコード化 |
Country Status (17)
Country | Link |
---|---|
US (3) | US9892735B2 (ja) |
EP (1) | EP3058566B1 (ja) |
JP (3) | JP6385433B2 (ja) |
KR (1) | KR101831289B1 (ja) |
CN (2) | CN111009249B (ja) |
AU (1) | AU2014336097B2 (ja) |
BR (1) | BR112016008117B1 (ja) |
CA (1) | CA2925734C (ja) |
ES (1) | ES2660392T3 (ja) |
MX (1) | MX357135B (ja) |
MY (1) | MY181965A (ja) |
PL (1) | PL3058566T3 (ja) |
PT (1) | PT3058566T (ja) |
RU (1) | RU2638734C2 (ja) |
SG (1) | SG11201603046RA (ja) |
TW (1) | TWI578308B (ja) |
WO (1) | WO2015055800A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020190751A (ja) * | 2013-10-18 | 2020-11-26 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オーディオ信号のスペクトルのスペクトル係数のコード化 |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9313359B1 (en) | 2011-04-26 | 2016-04-12 | Gracenote, Inc. | Media content identification on mobile devices |
EP3573056B1 (en) | 2008-07-11 | 2022-08-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and audio decoder |
US20130110522A1 (en) * | 2011-10-21 | 2013-05-02 | Samsung Electronics Co., Ltd. | Energy lossless-encoding method and apparatus, audio encoding method and apparatus, energy lossless-decoding method and apparatus, and audio decoding method and apparatus |
US20190373312A1 (en) | 2012-02-21 | 2019-12-05 | Gracenote, Inc. | Media Content Identification on Mobile Devices |
EP3139381B1 (en) | 2014-05-01 | 2019-04-24 | Nippon Telegraph and Telephone Corporation | Periodic-combined-envelope-sequence generation device, periodic-combined-envelope-sequence generation method, periodic-combined-envelope-sequence generation program and recording medium |
DE102016200637B3 (de) * | 2016-01-19 | 2017-04-27 | Sivantos Pte. Ltd. | Verfahren zur Reduktion der Latenzzeit einer Filterbank zur Filterung eines Audiosignals sowie Verfahren zum latenzarmen Betrieb eines Hörsystems |
JP2018113414A (ja) * | 2017-01-13 | 2018-07-19 | 新光電気工業株式会社 | 半導体装置とその製造方法 |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483878A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
WO2020207593A1 (en) * | 2019-04-11 | 2020-10-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program |
CN110544472B (zh) * | 2019-09-29 | 2021-12-31 | 上海依图信息技术有限公司 | 提升使用cnn网络结构的语音任务的性能的方法 |
US11227614B2 (en) * | 2020-06-11 | 2022-01-18 | Silicon Laboratories Inc. | End node spectrogram compression for machine learning speech recognition |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5583500A (en) | 1993-02-10 | 1996-12-10 | Ricoh Corporation | Method and apparatus for parallel encoding and decoding of data |
IT1281001B1 (it) * | 1995-10-27 | 1998-02-11 | Cselt Centro Studi Lab Telecom | Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio. |
US7110941B2 (en) * | 2002-03-28 | 2006-09-19 | Microsoft Corporation | System and method for embedded audio coding with implicit auditory masking |
EP1734511B1 (en) * | 2002-09-04 | 2009-11-18 | Microsoft Corporation | Entropy coding by adapting coding between level and run-length/level modes |
US7599840B2 (en) * | 2005-07-15 | 2009-10-06 | Microsoft Corporation | Selectively using multiple entropy models in adaptive coding and decoding |
JP4736699B2 (ja) * | 2005-10-13 | 2011-07-27 | 株式会社ケンウッド | 音声信号圧縮装置、音声信号復元装置、音声信号圧縮方法、音声信号復元方法及びプログラム |
DE102006027673A1 (de) | 2006-06-14 | 2007-12-20 | Friedrich-Alexander-Universität Erlangen-Nürnberg | Signaltrenner, Verfahren zum Bestimmen von Ausgangssignalen basierend auf Mikrophonsignalen und Computerprogramm |
US8527265B2 (en) * | 2007-10-22 | 2013-09-03 | Qualcomm Incorporated | Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs |
CN100578619C (zh) * | 2007-11-05 | 2010-01-06 | 华为技术有限公司 | 编码方法和编码器 |
RU2455709C2 (ru) | 2008-03-03 | 2012-07-10 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ и устройство для обработки аудиосигнала |
EP2346029B1 (en) * | 2008-07-11 | 2013-06-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, method for encoding an audio signal and corresponding computer program |
MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
AU2010305383B2 (en) | 2009-10-08 | 2013-10-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping |
CN102884573B (zh) * | 2010-03-10 | 2014-09-10 | 弗兰霍菲尔运输应用研究公司 | 使用取样率依赖时间扭曲轮廓编码的音频信号解码器、音频信号编码器及方法 |
ES2558508T3 (es) * | 2011-01-25 | 2016-02-04 | Nippon Telegraph And Telephone Corporation | Método de codificación, codificador, método de determinación de la cantidad de una característica periódica, aparato de determinación de la cantidad de una característica periódica, programa y medio de grabación |
RU2464649C1 (ru) | 2011-06-01 | 2012-10-20 | Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." | Способ обработки звукового сигнала |
WO2014001182A1 (en) * | 2012-06-28 | 2014-01-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Linear prediction based audio coding using improved probability distribution estimation |
KR101831289B1 (ko) * | 2013-10-18 | 2018-02-22 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. | 오디오 신호의 스펙트럼의 스펙트럼 계수들의 코딩 |
-
2014
- 2014-10-17 KR KR1020167010037A patent/KR101831289B1/ko active IP Right Grant
- 2014-10-17 SG SG11201603046RA patent/SG11201603046RA/en unknown
- 2014-10-17 CN CN202010009068.1A patent/CN111009249B/zh active Active
- 2014-10-17 JP JP2016524486A patent/JP6385433B2/ja active Active
- 2014-10-17 MY MYPI2016000657A patent/MY181965A/en unknown
- 2014-10-17 RU RU2016118776A patent/RU2638734C2/ru active
- 2014-10-17 TW TW103136011A patent/TWI578308B/zh active
- 2014-10-17 BR BR112016008117-0A patent/BR112016008117B1/pt active IP Right Grant
- 2014-10-17 EP EP14792420.3A patent/EP3058566B1/en active Active
- 2014-10-17 CN CN201480056910.XA patent/CN105723452B/zh active Active
- 2014-10-17 CA CA2925734A patent/CA2925734C/en active Active
- 2014-10-17 PL PL14792420T patent/PL3058566T3/pl unknown
- 2014-10-17 WO PCT/EP2014/072290 patent/WO2015055800A1/en active Application Filing
- 2014-10-17 MX MX2016004806A patent/MX357135B/es active IP Right Grant
- 2014-10-17 ES ES14792420.3T patent/ES2660392T3/es active Active
- 2014-10-17 PT PT147924203T patent/PT3058566T/pt unknown
- 2014-10-17 AU AU2014336097A patent/AU2014336097B2/en active Active
-
2016
- 2016-04-15 US US15/130,589 patent/US9892735B2/en active Active
-
2018
- 2018-01-02 US US15/860,311 patent/US10115401B2/en active Active
- 2018-08-07 JP JP2018148125A patent/JP6748160B2/ja active Active
- 2018-10-10 US US16/156,641 patent/US10847166B2/en active Active
-
2020
- 2020-08-06 JP JP2020133541A patent/JP7218329B2/ja active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020190751A (ja) * | 2013-10-18 | 2020-11-26 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オーディオ信号のスペクトルのスペクトル係数のコード化 |
JP7218329B2 (ja) | 2013-10-18 | 2023-02-06 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オーディオ信号のスペクトルのスペクトル係数のコード化 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6748160B2 (ja) | オーディオ信号のスペクトルのスペクトル係数のコード化 | |
JP7260509B2 (ja) | スペクトルエンベロープのサンプル値のコンテキストベースエントロピー符号化 | |
TWI455113B (zh) | 音訊信號解碼器、音訊信號編碼器、用以提供解碼音訊信號表示型態之方法及電腦程式與用以提供音訊信號之編碼表示型態之方法及電腦程式 | |
US8515767B2 (en) | Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs | |
CA2978815C (en) | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal | |
JP2022009710A (ja) | 高位周波数帯域における検出されたピークスペクトル領域を考慮してオーディオ信号を符号化するオーディオ符号器、オーディオ信号を符号化する方法、及びコンピュータプログラム | |
JP2010020346A (ja) | 音声信号および音楽信号を符号化する方法 | |
WO2011044700A1 (en) | Simultaneous time-domain and frequency-domain noise shaping for tdac transforms | |
JP5190445B2 (ja) | 符号化装置および符号化方法 | |
JP6526091B2 (ja) | 低複雑度の調性適応音声信号量子化 | |
WO2016142357A1 (en) | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180823 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180823 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190909 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191029 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20200123 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200422 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200707 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200806 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6748160 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |