JP6100164B2 - オーディオ信号を処理し、音声音響統合符号化方式(usac)のためにより高い時間粒度を供給するための装置および方法 - Google Patents
オーディオ信号を処理し、音声音響統合符号化方式(usac)のためにより高い時間粒度を供給するための装置および方法 Download PDFInfo
- Publication number
- JP6100164B2 JP6100164B2 JP2013532172A JP2013532172A JP6100164B2 JP 6100164 B2 JP6100164 B2 JP 6100164B2 JP 2013532172 A JP2013532172 A JP 2013532172A JP 2013532172 A JP2013532172 A JP 2013532172A JP 6100164 B2 JP6100164 B2 JP 6100164B2
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- configurable
- samples
- ratio
- filter bank
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 199
- 238000012545 processing Methods 0.000 title claims description 88
- 238000000034 method Methods 0.000 title claims description 45
- 238000005070 sampling Methods 0.000 claims description 73
- 230000015572 biosynthetic process Effects 0.000 claims description 41
- 238000003786 synthesis reaction Methods 0.000 claims description 41
- 238000006243 chemical reaction Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 11
- 230000003595 spectral effect Effects 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 10
- 230000001131 transforming effect Effects 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims 1
- 238000012360 testing method Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 6
- 230000002123 temporal effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 239000007993 MOPS buffer Substances 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000004904 shortening Methods 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000005477 standard model Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0012—Smoothing of parameters of the decoder interpolation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Laminated Bodies (AREA)
Description
44.1kHzで作動されるUSAC RM9:約5.6WMOPS;
提案された新たな動作点:約5.0WMOPS。
Claims (16)
- オーディオ信号を処理するための装置であって、
前記オーディオ信号の第1の設定可能な数のサンプルを有する第1のオーディオ信号フレームを受信するように構成され、前記第1の設定可能なサンプル数が、第2の設定可能なサンプル数と異なるように、処理されたオーディオ信号を得るために設定可能なアップサンプリング係数により、前記オーディオ信号をアップサンプリングするように構成され、前記処理されたオーディオ信号の第2の設定可能な数のサンプルを有する第2のオーディオ信号フレームを出力するように構成される信号処理装置(110;205;405)と、
前記信号処理装置(110;205;405)を設定するように構成されるコンフィギュレータ(120;208;408)とを含み、
前記コンフィギュレータ(120;208;408)は、前記第1の設定可能なサンプル数に対する前記第2の設定可能なサンプル数の第1の比率が、第1の比率値を有するとき、前記設定可能なアップサンプリング係数が、第1のアップサンプリング値と等しいように、設定情報に基づいて、前記信号処理装置(110;205;405)を設定するように構成されること、および、前記コンフィギュレータ(120;208;408)は、前記第1の設定可能なサンプル数に対する前記第2の設定可能なサンプル数の異なる第2の比率が、異なる第2の比率値を有するとき、前記設定可能なアップサンプリング係数が、異なる第2のアップサンプリング値と等しく、前記異なる第2のアップサンプリング値が、前記第1のアップサンプリング値と異なるように、前記信号処理装置(110;205;405)を設定するように構成され、かつ、前記第1の比率値または前記第2の比率値は、整数値ではなく、
前記信号処理装置(110;205;405)は、
第1の前処理されたオーディオ信号(as2)を得るために前記オーディオ信号を復号するためのコアデコーダ・モジュール(210)と、
複数のサブバンド信号を含む第2の周波数領域前処理されたオーディオ信号(as3)を得るために前記第1の前処理されたオーディオ信号(as2)を時間領域から周波数領域に変換するためのいくつかの分析フィルタバンクチャネルを有する分析フィルタバンク(220)と、
第3の周波数領域前処理されたオーディオ信号(as4)を得るために、追加のサブバンド信号を生成し、前記第2の周波数領域前処理されたオーディオ信号(as3)に追加するためのサブバンドジェネレータ(230)であって、前記サブバンドジェネレータ(230)は、前記第3の周波数領域前処理されたオーディオ信号(as4)を得るために前記第2の周波数領域前処理されたオーディオ信号(as3)のための追加のサブバンド信号を作成するための前記第2の周波数領域前処理されたオーディオ信号(as3)のサブバンド信号を複製するように構成されているスペクトル帯域レプリケータであるサブバンドジェネレータ(230)と、
前記前処理されたオーディオ信号(as5)を得るために前記第3の周波数領域前処理されたオーディオ信号(as4)を前記周波数領域から前記時間領域に変換するためのいくつかの合成フィルタバンクチャネルを有する合成フィルタバンク(240)とを含み、
前記コンフィギュレータ(120;208;408)は、前記設定可能なアップサンプリング係数が前記分析フィルタバンクチャネルの数に対する前記合成フィルタバンクチャネルの数の第3の比率に等しいように、合成フィルタバンクチャネルの数または分析フィルタバンクのチャネルの数を設定することにより前記信号処理装置(110;205;405)を設定するように構成されている、
ことを特徴とする、装置。 - 前記コンフィギュレータ(120;208;408)は、前記第1の設定可能なサンプル数に対する前記第2の設定可能なサンプル数の前記第2の比率が、前記第1の設定可能なサンプル数に対する前記第2の設定可能なサンプル数の前記第1の比率より大きいとき、前記異なる第2のアップサンプリング値が、前記第1のアップサンプリング値より大きいように、前記信号処理装置(110;205;405)を設定するように構成されることを特徴とする、請求項1に記載の装置。
- 前記コンフィギュレータ(120;208;408)は、前記第1の設定可能なサンプル数に対する前記第2の設定可能なサンプル数の前記第1の比率が、前記第1の比率値を有するとき、前記設定可能なアップサンプリング係数が、前記第1の比率値と等しいように、前記信号処理装置(110;205;405)を設定するように構成されること、および、前記コンフィギュレータ(120;208;408)は、前記第1の設定可能なサンプル数に対する前記第2の設定可能なサンプル数の前記第2の比率が、前記異なる第2の比率値を有するとき、前記設定可能なアップサンプリング係数が、前記異なる第2の比率値と等しいように、前記信号処理装置(110;205;405)を設定するように構成されることを特徴とする、請求項1又は請求項2に記載の装置。
- 前記コンフィギュレータ(120;208;408)は、前記第1の比率が前記第1の比率値を有するとき、前記設定可能なアップサンプリング係数が、2と等しいように、前記信号処理装置(110;205;405)を設定するように構成されること、および、前記コンフィギュレータ(120;208;408)は、前記第2の比率が前記異なる第2の比率値を有するとき、前記設定可能なアップサンプリング係数が、8/3と等しいように、前記信号処理装置(110;205;405)を設定するように構成されることを特徴とする、請求項1〜請求項3のいずれかに記載の装置。
- 前記コンフィギュレータ(120;208;408)は、前記第1の比率が前記第1の比率値を有するとき、前記第1の設定可能なサンプル数が、1024と等しく、前記第2の設定可能なサンプル数が、2048と等しいように、前記信号処理装置(110;205;405)を設定するように構成されること、および、前記コンフィギュレータ(120;208;408)は、前記第2の比率が前記異なる第2の比率値を有するとき、前記第1の設定可能なサンプル数が、768と等しく、前記第2の設定可能なサンプル数が、2048と等しいように、前記信号処理装置(110;205;405)を設定するように構成されることを特徴とする、請求項1〜請求項4のいずれかに記載の装置。
- 前記コアデコーダ・モジュール(210)は、第1のコアデコーダ(510)と第2のコアデコーダ(520)とを含み、前記第1のコアデコーダ(510)は、時間領域において作動するように構成され、かつ前記第2のコアデコーダ(520)は、周波数領域において作動するように構成されることを特徴とする、請求項1〜請求項5のいずれかに記載の装置。
- 前記第1のコアデコーダ(510)は、ACELPデコーダであり、前記第2のコアデコーダ(520)は、FD変換デコーダまたはTCX変換デコーダであることを特徴とする、請求項6に記載の装置。
- 前記ACELPデコーダ(510)は、前記第1のオーディオ信号フレームを処理するように構成され、前記第1のオーディオ信号フレームは、4つのACELPフレームを有し、前記第1のオーディオ信号フレームの前記第1の設定可能なサンプル数が768に等しいとき、前記ACELPフレームのそれぞれは、192のオーディオ信号サンプルを有することを特徴とする、請求項7に記載の装置。
- 前記ACELPデコーダ(510)は、前記第1のオーディオ信号フレームを処理するように構成され、前記第1のオーディオ信号フレームは、3つのACELPフレームを有し、前記第1のオーディオ信号フレームの前記第1の設定可能なサンプル数が768に等しいとき、前記ACELPフレームのそれぞれは、256のオーディオ信号サンプルを有することを特徴とする、請求項8に記載の装置。
- コンフィギュレータ(120;208;408)は、前記オーディオ信号の前記第1の設定可能なサンプル数または前記処理されたオーディオ信号の前記第2の設定可能なサンプル数の少なくとも1つを示している前記設定情報に基づいて、前記信号処理装置(110;205;405)を設定するように構成されることを特徴とする、請求項1〜請求項9のいずれかに記載の装置。
- コンフィギュレータ(120;208;408)は、前記設定情報に基づいて、前記信号処理装置(110;205;405)を設定するように構成され、前記設定情報は、前記オーディオ信号の前記第1の設定可能なサンプル数および前記処理されたオーディオ信号の前記第2の設定可能なサンプル数を示し、前記設定情報は、設定インデックスであることを特徴とする、請求項1〜請求項10のいずれかに記載の装置。
- オーディオ信号を処理するための方法は、
設定可能なアップサンプリング係数を設定するステップと、
前記オーディオ信号の第1の設定可能な数のサンプルを有する第1のオーディオ信号フレームを受信するステップと、
処理されたオーディオ信号を得るために、前記設定可能なアップサンプリング係数によって前記オーディオ信号をアップサンプリングするステップであって、前記第1の設定可能なサンプル数が第2の設定可能なサンプル数と異なるように、前記処理されたオーディオ信号の第2の設定可能な数のサンプルを有する第2のオーディオフレームを出力するように構成されるステップとを含み、
前記設定可能なアップサンプリング係数は、前記第1の設定可能なサンプル数に対する前記第2の設定可能なサンプル数の第1の比率が、第1の比率値を有するとき、前記設定可能なアップサンプリング係数が、第1のアップサンプリング値と等しいように、設定情報に基づいて設定されること、および、前記設定可能なアップサンプリング係数は、前記第1の設定可能なサンプル数に対する前記第2の設定可能なサンプル数の異なる第2の比率が、異なる第2の比率値を有するとき、前記設定可能なアップサンプリング係数が、異なる第2のアップサンプリング値と等しく、前記異なる第2のアップサンプリング値が、前記第1のアップサンプリング値と異なるように、設定され、かつ、前記第1の比率または前記第2の比率は、整数値ではなく、
処理されたオーディオ信号を得るために設定可能なアップサンプリング係数により前記オーディオ信号をアップサンプリングすることは、
第1の前処理されたオーディオ信号を得るためにコアデコーダモジュールにより前記オーディオ信号を復号し、
複数のサブバンド信号を含む第2の周波数領域前処理されたオーディオ信号を得るためにいくつかの分析フィルタバンクチャネルを有する分析フィルタバンクにより前記第1の前処理されたオーディオ信号を時間領域から周波数領域に変換し、
前記第3の周波数領域前処理されたオーディオ信号を得るために前記第2の周波数領域前処理されたオーディオ信号のための前記追加のサブバンド信号を作成するための前記第2の周波数領域前処理されたオーディオ信号のサブバンド信号を複製することにより、サブバンドジェネレータにより追加のサブバンド信号を作成し、前記第2の周波数領域前処理されたオーディオ信号に追加し、
前記処理されたオーディオ信号を得るために、いくつかの合成フィルタバンクチャネルを有する合成フィルタバンクにより前記第3の周波数領域前処理されたオーディオ信号を前記周波数領域から前記時間領域に変換することにより実行され、
前記設定情報を設定することは、設定可能なアップサンプリング係数が分析フィルタバンクチャネルの数に対する合成フィルタバンクのチャネルの数の第3の比率に等しくなるように、合成フィルタバンクのチャネルの数または分析フィルタバンクのチャネルの数を設定することにより、実行されることを特徴とする、方法。 - オーディオ信号を処理するための装置は、
前記オーディオ信号の第1の設定可能な数のサンプルを有する第1のオーディオ信号フレームを受信するように構成され、処理されたオーディオ信号を得るために、設定可能なダウンサンプリング係数によって前記オーディオ信号をダウンサンプリングするように構成され、前記第1の設定可能なサンプル数が第2の設定可能なサンプル数と異なるように、前記処理されたオーディオ信号の第2の設定可能な数のサンプルを有する第2のオーディオフレームを出力するように構成される、信号処理装置(910)と、
前記信号処理装置を設定するように構成されるコンフィギュレータ(920)とを含み、
前記コンフィギュレータ(920)は、前記第1の設定可能なサンプル数に対する前記第2の設定可能なサンプル数の第1の比率が、第1の比率値を有するとき、前記設定可能なダウンサンプリング係数が第1のダウンサンプリング値に等しいように、設定情報に基づいて前記信号処理装置(910)を設定するように構成されること、および、前記コンフィギュレータ(920)は、前記第1の設定可能なサンプル数に対する前記第2の設定可能なサンプル数の異なる第2の比率が、異なる第2の比率値を有するとき、前記設定可能なダウンサンプリング係数が、異なる第2のダウンサンプリング値に等しく、前記異なる第2のダウンサンプリング値が、前記第1のダウンサンプリング値と異なるように、前記信号処理装置(910)を設定するように構成され、かつ、前記第1の比率値または前記第2の比率値は、整数値ではなく、
前記信号処理装置(110;205;405)は、
第1の前処理されたオーディオ信号(as2)を得るために前記オーディオ信号を復号するためのコアデコーダモジュール(210)と、
複数のサブバンド信号を含む第2の周波数領域前処理されたオーディオ信号(as3)を得るために前記第1の前処理されたオーディオ信号(as2)を時間領域から周波数領域に変換するためのいくつかの分析フィルタバンクチャネルを有する分析フィルタバンク(220)とを含み、
前記信号処理装置(110;205;405)は、第3の周波数領域前処理されたオーディオ信号(as4)を得るために前記第2の周波数領域前処理されたオーディオ信号(as3)の複数の最高のサブバンド信号を削除するように構成され、かつ
処理されたオーディオ信号(as5)を得るために前記第3の周波数領域前処理されたオーディオ信号(as4)を周波数領域から時間領域に変換するためのいくつかの合成フィルタバンクチャネルを有する合成フィルタバンク(240)をさらに含み、
前記コンフィギュレータ(120;208;408)は、前記設定可能なダウンサンプリング係数が前記分析フィルタバンクチャネルの数に対する前記合成フィルタバンクチャネルの数の第3の比率に等しいように、合成フィルタバンクチャネルの数または分析フィルタバンクチャネルの数を設定することにより前記信号処理装置(110;205;405)を設定するように構成されている、
ことを特徴とする、装置。 - 前記コンフィギュレータは、前記第1の設定可能なサンプル数に対する前記第2の設定可能なサンプル数の前記第1の比率が、前記第1の設定可能なサンプル数に対する前記第2の設定可能なサンプル数の前記第2の比率より小さいとき、前記第1のダウンサンプリング値が、前記異なる第2のダウンサンプリング値より小さいように、前記信号処理装置(910)を設定するように構成されることを特徴とする、請求項13に記載の装置。
- オーディオ信号を処理するための方法であって、
設定可能なダウンサンプリング係数を設定するステップと、
前記オーディオ信号の第1の設定可能な数のサンプルを有する第1のオーディオ信号フレームを受信するステップと、
処理されたオーディオ信号を得るために、前記設定可能なダウンサンプリング係数によって前記オーディオ信号をダウンサンプリングするステップであって、前記第1の設定可能なサンプル数が前記第2の設定可能なサンプル数と異なるように、前記処理されたオーディオ信号の前記第2の設定可能な数のサンプルを有する第2のオーディオフレームを出力するように構成されるステップとを含み、
前記設定可能なダウンサンプリング係数は、前記第1の設定可能なサンプル数に対する前記第2の設定可能なサンプル数の第1の比率が、第1の比率値を有するとき、前記設定可能なダウンサンプリング係数が、第1のダウンサンプリング値に等しいように、設定情報に基づいて設定されること、および、前記設定可能なダウンサンプリング係数は、前記第1の設定可能なサンプル数に対する前記第2の設定可能なサンプル数の異なる第2の比率が、異なる第2の比率値を有するとき、前記設定可能なダウンサンプリング係数が、異なる第2のダウンサンプリング値に等しく、前記異なる第2のダウンサンプリング値が、前記第1のダウンサンプリング値と異なるように、設定され、かつ、前記第1の比率値または前記第2の比率値は、整数値ではなく、
処理されたオーディオ信号を得るための設定可能なダウンサンプリング係数により前記オーディオ信号をダウンサンプリングすることは、
第1の前処理されたオーディオ信号を得るためにコアデコーダモジュールにより前記オーディオ信号を復号し、
複数のサブバンド信号を含む第2の周波数領域前処理されたオーディオ信号を得るためにいくつかの分析フィルタバンクチャネルを有する分析フィルタバンクにより前記第1の前処理されたオーディオ信号を時間領域から周波数領域に変換し、
第3の周波数領域前処理されたオーディオ信号を得るために前記第2の周波数領域前処理されたオーディオ信号の複数の最高のサブバンド信号を削除し、
前記処理されたオーディオ信号を得るために、いくつかの合成フィルタバンクチャネルを有する合成フィルタバンクにより前記第3の周波数領域前処理されたオーディオ信号を周波数領域から時間領域に変換することにより実行され、
前記設定情報を設定することは、設定可能なダウンサンプリング係数が合成フィルタバンクチャネルの数に対する分析フィルタバンクチャネルの数の第3の比率に等しくなるように、合成フィルタバンクチャネルの数または分析フィルタバンクチャネルの数を設定することにより、実行されることを特徴とする、方法。 - コンピュータプログラムがコンピュータまたは処理装置によって実行されるとき、請求項12または請求項15の方法を実行するための前記コンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US39026710P | 2010-10-06 | 2010-10-06 | |
US61/390,267 | 2010-10-06 | ||
PCT/EP2011/067318 WO2012045744A1 (en) | 2010-10-06 | 2011-10-04 | Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (usac) |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2013543600A JP2013543600A (ja) | 2013-12-05 |
JP2013543600A5 JP2013543600A5 (ja) | 2017-02-09 |
JP6100164B2 true JP6100164B2 (ja) | 2017-03-22 |
Family
ID=44759689
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013532172A Active JP6100164B2 (ja) | 2010-10-06 | 2011-10-04 | オーディオ信号を処理し、音声音響統合符号化方式(usac)のためにより高い時間粒度を供給するための装置および方法 |
Country Status (18)
Country | Link |
---|---|
US (1) | US9552822B2 (ja) |
EP (1) | EP2625688B1 (ja) |
JP (1) | JP6100164B2 (ja) |
KR (1) | KR101407120B1 (ja) |
CN (1) | CN103403799B (ja) |
AR (2) | AR083303A1 (ja) |
AU (1) | AU2011311659B2 (ja) |
BR (1) | BR112013008463B8 (ja) |
CA (1) | CA2813859C (ja) |
ES (1) | ES2530957T3 (ja) |
HK (1) | HK1190223A1 (ja) |
MX (1) | MX2013003782A (ja) |
MY (1) | MY155997A (ja) |
PL (1) | PL2625688T3 (ja) |
RU (1) | RU2562384C2 (ja) |
SG (1) | SG189277A1 (ja) |
TW (1) | TWI486950B (ja) |
WO (1) | WO2012045744A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7103052B2 (ja) | 2018-08-10 | 2022-07-20 | 日本精工株式会社 | テーブル装置 |
JP7268301B2 (ja) | 2018-08-10 | 2023-05-08 | 日本精工株式会社 | テーブル装置 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6100164B2 (ja) * | 2010-10-06 | 2017-03-22 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | オーディオ信号を処理し、音声音響統合符号化方式(usac)のためにより高い時間粒度を供給するための装置および方法 |
US9530424B2 (en) * | 2011-11-11 | 2016-12-27 | Dolby International Ab | Upsampling using oversampled SBR |
TWI557727B (zh) | 2013-04-05 | 2016-11-11 | 杜比國際公司 | 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品 |
AU2014204540B1 (en) * | 2014-07-21 | 2015-08-20 | Matthew Brown | Audio Signal Processing Methods and Systems |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
EP2980795A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP3182411A1 (en) * | 2015-12-14 | 2017-06-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an encoded audio signal |
KR102219752B1 (ko) | 2016-01-22 | 2021-02-24 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 채널 간 시간 차를 추정하기 위한 장치 및 방법 |
CN109328382B (zh) * | 2016-06-22 | 2023-06-16 | 杜比国际公司 | 用于将数字音频信号从第一频域变换到第二频域的音频解码器及方法 |
US10249307B2 (en) * | 2016-06-27 | 2019-04-02 | Qualcomm Incorporated | Audio decoding using intermediate sampling rate |
TWI812658B (zh) | 2017-12-19 | 2023-08-21 | 瑞典商都比國際公司 | 用於統一語音及音訊之解碼及編碼去關聯濾波器之改良之方法、裝置及系統 |
Family Cites Families (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03286698A (ja) | 1990-04-02 | 1991-12-17 | Onkyo Corp | ソフトドーム振動板 |
KR970011728B1 (ko) * | 1994-12-21 | 1997-07-14 | 김광호 | 음향신호의 에러은닉방법 및 그 장치 |
IT1281001B1 (it) | 1995-10-27 | 1998-02-11 | Cselt Centro Studi Lab Telecom | Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio. |
US6006108A (en) * | 1996-01-31 | 1999-12-21 | Qualcomm Incorporated | Digital audio processing in a dual-mode telephone |
DE19742655C2 (de) * | 1997-09-26 | 1999-08-05 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals |
US6208671B1 (en) * | 1998-01-20 | 2001-03-27 | Cirrus Logic, Inc. | Asynchronous sample rate converter |
DE69926821T2 (de) * | 1998-01-22 | 2007-12-06 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten Schaltung zwischen verschiedenen Audiokodierungssystemen |
US6275836B1 (en) * | 1998-06-12 | 2001-08-14 | Oak Technology, Inc. | Interpolation filter and method for switching between integer and fractional interpolation rates |
US6208276B1 (en) * | 1998-12-30 | 2001-03-27 | At&T Corporation | Method and apparatus for sample rate pre- and post-processing to achieve maximal coding gain for transform-based audio encoding and decoding |
JP2000352999A (ja) * | 1999-06-11 | 2000-12-19 | Nec Corp | 音声切替装置 |
WO2001099277A1 (en) * | 2000-06-23 | 2001-12-27 | Stmicroelectronics Asia Pacific Pte Ltd | Universal sampling rate converter for digital audio frequencies |
CA2392640A1 (en) | 2002-07-05 | 2004-01-05 | Voiceage Corporation | A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems |
JP2004120182A (ja) * | 2002-09-25 | 2004-04-15 | Sanyo Electric Co Ltd | デシメーションフィルタおよびインターポレーションフィルタ |
JP4369946B2 (ja) * | 2002-11-21 | 2009-11-25 | 日本電信電話株式会社 | ディジタル信号処理方法、そのプログラム、及びそのプログラムを格納した記録媒体 |
WO2004088841A2 (en) * | 2003-03-31 | 2004-10-14 | Koninklijke Philips Electronics N. V. | Up and down sample rate converter |
ATE511178T1 (de) | 2004-03-25 | 2011-06-15 | Dts Inc | Skalierbarer verlustloser audio-codec und erstellungs-werkzeug |
DE102004043521A1 (de) | 2004-09-08 | 2006-03-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes |
JP4809370B2 (ja) * | 2005-02-23 | 2011-11-09 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | マルチチャネル音声符号化における適応ビット割り当て |
US8032240B2 (en) * | 2005-07-11 | 2011-10-04 | Lg Electronics Inc. | Apparatus and method of processing an audio signal |
US7528745B2 (en) * | 2006-02-15 | 2009-05-05 | Qualcomm Incorporated | Digital domain sampling rate converter |
US7610195B2 (en) * | 2006-06-01 | 2009-10-27 | Nokia Corporation | Decoding of predictively coded data using buffer adaptation |
US9009032B2 (en) * | 2006-11-09 | 2015-04-14 | Broadcom Corporation | Method and system for performing sample rate conversion |
US7912728B2 (en) * | 2006-11-30 | 2011-03-22 | Broadcom Corporation | Method and system for handling the processing of bluetooth data during multi-path multi-rate audio processing |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
PL2301011T3 (pl) * | 2008-07-11 | 2019-03-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Sposób i dyskryminator do klasyfikacji różnych segmentów sygnału audio zawierającego segmenty mowy i muzyki |
CN102089816B (zh) | 2008-07-11 | 2013-01-30 | 弗朗霍夫应用科学研究促进协会 | 音频信号合成器及音频信号编码器 |
US8117039B2 (en) * | 2008-12-15 | 2012-02-14 | Ericsson Television, Inc. | Multi-staging recursive audio frame-based resampling and time mapping |
RU2493618C2 (ru) * | 2009-01-28 | 2013-09-20 | Долби Интернешнл Аб | Усовершенствованное гармоническое преобразование |
KR101622950B1 (ko) * | 2009-01-28 | 2016-05-23 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
US20110087494A1 (en) * | 2009-10-09 | 2011-04-14 | Samsung Electronics Co., Ltd. | Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme |
KR101137652B1 (ko) * | 2009-10-14 | 2012-04-23 | 광운대학교 산학협력단 | 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법 |
EP4358082A1 (en) * | 2009-10-20 | 2024-04-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation |
US8886523B2 (en) * | 2010-04-14 | 2014-11-11 | Huawei Technologies Co., Ltd. | Audio decoding based on audio class with control code for post-processing modes |
JP6100164B2 (ja) * | 2010-10-06 | 2017-03-22 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | オーディオ信号を処理し、音声音響統合符号化方式(usac)のためにより高い時間粒度を供給するための装置および方法 |
KR101748760B1 (ko) * | 2011-03-18 | 2017-06-19 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. | 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치 |
KR20160063405A (ko) * | 2012-04-24 | 2016-06-03 | 브이아이디 스케일, 인크. | Mpeg/3gpp-dash에서의 원활한 스트림 스위칭을 위한 방법 및 장치 |
-
2011
- 2011-10-04 JP JP2013532172A patent/JP6100164B2/ja active Active
- 2011-10-04 MY MYPI2013001206A patent/MY155997A/en unknown
- 2011-10-04 CN CN201180058880.2A patent/CN103403799B/zh active Active
- 2011-10-04 AR ARP110103684A patent/AR083303A1/es active IP Right Grant
- 2011-10-04 MX MX2013003782A patent/MX2013003782A/es active IP Right Grant
- 2011-10-04 PL PL11764739T patent/PL2625688T3/pl unknown
- 2011-10-04 RU RU2013120320/08A patent/RU2562384C2/ru active
- 2011-10-04 EP EP11764739.6A patent/EP2625688B1/en active Active
- 2011-10-04 BR BR112013008463A patent/BR112013008463B8/pt active IP Right Grant
- 2011-10-04 ES ES11764739T patent/ES2530957T3/es active Active
- 2011-10-04 SG SG2013025382A patent/SG189277A1/en unknown
- 2011-10-04 KR KR1020137010454A patent/KR101407120B1/ko active IP Right Grant
- 2011-10-04 CA CA2813859A patent/CA2813859C/en active Active
- 2011-10-04 WO PCT/EP2011/067318 patent/WO2012045744A1/en active Application Filing
- 2011-10-04 AU AU2011311659A patent/AU2011311659B2/en active Active
- 2011-10-05 TW TW100136050A patent/TWI486950B/zh active
-
2013
- 2013-04-03 US US13/855,889 patent/US9552822B2/en active Active
-
2014
- 2014-02-14 HK HK14101461.2A patent/HK1190223A1/xx unknown
-
2015
- 2015-09-14 AR ARP150102919A patent/AR101853A2/es active IP Right Grant
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7103052B2 (ja) | 2018-08-10 | 2022-07-20 | 日本精工株式会社 | テーブル装置 |
JP7268301B2 (ja) | 2018-08-10 | 2023-05-08 | 日本精工株式会社 | テーブル装置 |
Also Published As
Publication number | Publication date |
---|---|
SG189277A1 (en) | 2013-05-31 |
EP2625688A1 (en) | 2013-08-14 |
WO2012045744A1 (en) | 2012-04-12 |
BR112013008463B1 (pt) | 2021-06-01 |
BR112013008463A2 (pt) | 2016-08-09 |
CA2813859C (en) | 2016-07-12 |
RU2013120320A (ru) | 2014-11-20 |
KR20130069821A (ko) | 2013-06-26 |
AU2011311659B2 (en) | 2015-07-30 |
KR101407120B1 (ko) | 2014-06-13 |
CN103403799A (zh) | 2013-11-20 |
TWI486950B (zh) | 2015-06-01 |
CN103403799B (zh) | 2015-09-16 |
AR101853A2 (es) | 2017-01-18 |
RU2562384C2 (ru) | 2015-09-10 |
CA2813859A1 (en) | 2012-04-12 |
JP2013543600A (ja) | 2013-12-05 |
US20130226570A1 (en) | 2013-08-29 |
MY155997A (en) | 2015-12-31 |
MX2013003782A (es) | 2013-10-03 |
AR083303A1 (es) | 2013-02-13 |
PL2625688T3 (pl) | 2015-05-29 |
BR112013008463B8 (pt) | 2022-04-05 |
TW201222532A (en) | 2012-06-01 |
ES2530957T3 (es) | 2015-03-09 |
US9552822B2 (en) | 2017-01-24 |
HK1190223A1 (en) | 2014-06-27 |
EP2625688B1 (en) | 2014-12-03 |
AU2011311659A1 (en) | 2013-05-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6100164B2 (ja) | オーディオ信号を処理し、音声音響統合符号化方式(usac)のためにより高い時間粒度を供給するための装置および方法 | |
RU2680195C1 (ru) | Аудиокодер для кодирования многоканального сигнала и аудиодекодер для декодирования кодированного аудиосигнала | |
JP6268180B2 (ja) | 空間オーディオオブジェクト符号化における時間/周波数分解能の後方互換性のある動的適応のためのエンコーダ、デコーダおよび方法 | |
CN111554310B (zh) | 用频谱域智能间隙填充编码或解码音频信号的设备及方法 | |
CN106796800B (zh) | 音频编码器、音频解码器、音频编码方法和音频解码方法 | |
CN113936675A (zh) | 频域处理器以及时域处理器的音频编码器和解码器 | |
WO2013168414A1 (ja) | 音信号ハイブリッドエンコーダ、音信号ハイブリッドデコーダ、音信号符号化方法、及び音信号復号方法 | |
JP2015535958A (ja) | 後方互換性のある多重分解能空間オーディオオブジェクト符号化のためのエンコーダ、デコーダおよび方法 | |
JP2006323037A (ja) | オーディオ信号復号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140624 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20140919 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20140929 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141014 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150324 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20150619 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150924 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20160324 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160725 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20161003 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161213 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20161226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170222 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6100164 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |