JP6147337B2 - サブバンド領域内での自由選択可能な周波数偏移のための装置、方法およびコンピュータプログラム - Google Patents
サブバンド領域内での自由選択可能な周波数偏移のための装置、方法およびコンピュータプログラム Download PDFInfo
- Publication number
- JP6147337B2 JP6147337B2 JP2015519171A JP2015519171A JP6147337B2 JP 6147337 B2 JP6147337 B2 JP 6147337B2 JP 2015519171 A JP2015519171 A JP 2015519171A JP 2015519171 A JP2015519171 A JP 2015519171A JP 6147337 B2 JP6147337 B2 JP 6147337B2
- Authority
- JP
- Japan
- Prior art keywords
- subband
- frequency
- mdct
- signal
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 148
- 238000004590 computer program Methods 0.000 title claims description 20
- 238000001228 spectrum Methods 0.000 claims description 126
- 239000011159 matrix material Substances 0.000 claims description 111
- 230000003595 spectral effect Effects 0.000 claims description 77
- 230000005236 sound signal Effects 0.000 claims description 56
- 230000006870 function Effects 0.000 claims description 51
- 238000006243 chemical reaction Methods 0.000 claims description 50
- 230000006978 adaptation Effects 0.000 claims description 28
- 238000001914 filtration Methods 0.000 claims description 27
- 230000015572 biosynthetic process Effects 0.000 claims description 14
- 238000003786 synthesis reaction Methods 0.000 claims description 12
- 230000015654 memory Effects 0.000 claims description 11
- 230000009466 transformation Effects 0.000 description 47
- 230000004044 response Effects 0.000 description 31
- 238000004364 calculation method Methods 0.000 description 27
- 238000012545 processing Methods 0.000 description 27
- 238000004422 calculation algorithm Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 23
- 230000008569 process Effects 0.000 description 23
- 230000002829 reductive effect Effects 0.000 description 15
- 238000007792 addition Methods 0.000 description 14
- 239000013598 vector Substances 0.000 description 14
- 230000009467 reduction Effects 0.000 description 13
- 230000000873 masking effect Effects 0.000 description 12
- 238000005457 optimization Methods 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 11
- 230000008901 benefit Effects 0.000 description 10
- 230000001419 dependent effect Effects 0.000 description 10
- 238000000354 decomposition reaction Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 9
- 230000010076 replication Effects 0.000 description 9
- 238000005070 sampling Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 8
- 238000013139 quantization Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 230000008447 perception Effects 0.000 description 7
- 230000002123 temporal effect Effects 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 6
- 238000000844 transformation Methods 0.000 description 6
- 238000007906 compression Methods 0.000 description 5
- 230000006835 compression Effects 0.000 description 5
- 230000000717 retained effect Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000013144 data compression Methods 0.000 description 4
- 238000009795 derivation Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- OVOUKWFJRHALDD-UHFFFAOYSA-N 2-[2-(2-acetyloxyethoxy)ethoxy]ethyl acetate Chemical compound CC(=O)OCCOCCOCCOC(C)=O OVOUKWFJRHALDD-UHFFFAOYSA-N 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 229910003460 diamond Inorganic materials 0.000 description 3
- 239000010432 diamond Substances 0.000 description 3
- 238000007667 floating Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000000737 periodic effect Effects 0.000 description 3
- 230000001629 suppression Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 230000003936 working memory Effects 0.000 description 3
- 210000002469 basement membrane Anatomy 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000036962 time dependent Effects 0.000 description 2
- QDGIAPPCJRFVEK-UHFFFAOYSA-N (1-methylpiperidin-4-yl) 2,2-bis(4-chlorophenoxy)acetate Chemical compound C1CN(C)CCC1OC(=O)C(OC=1C=CC(Cl)=CC=1)OC1=CC=C(Cl)C=C1 QDGIAPPCJRFVEK-UHFFFAOYSA-N 0.000 description 1
- 241000819038 Chichester Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 238000007630 basic procedure Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000035876 healing Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Description
変換行列Hは、MDCTスペクトルをそれぞれのMDSTスペクトルに変換するのに必要とされる。以下が適用される。
decoder_hsbe()
説明:
decoder_hsbe()は、高調波スペクトルバンド拡張(HSBE)のためのデコーダである。ここでのMDCTドメインにおけるローパス信号は、信号の高調波構造が保持されるようにスペクトル的に拡張される。包絡線を再構築するために逆LPCフィルタリングが実行される。信号は逆MDCTにより時間ドメインに変換される。
プロトタイプ:
[y varargout]=decoder_hsbe(X_core,T_idct,G,sideinfo,...
aaf_dat,b_noisefill,b_useMDST);
出力:
y 再構築された時間信号
varargout(1) 包絡線適応前の拡張されたMDCTスペクトル
varargout(2) 包絡線適応前の拡張されたMDSTスペクトル
varargout(3) 包絡線適応前の複素数スペクトル
入力:
X_core MDCT領域における信号のベースバンド
T_idct 逆DCT−IV変換行列
G ダイヤモンド形でのiMDCTに対する逆畳み込み行列
sideinfo 副情報
aaf_dat アンチエイリアシングフィルタ係数を有するデータベース
オプション:
b_noisefill ブーリアン、雑音が追加されたか否かを示す
標準:偽
b_useMDST ブーリアン、あらかじめ計算されたMDSTが使用されることになるか否かを示す。真の場合、X_coreは複素数となる必要がある
標準:偽
説明:
アンチエイリアシングフィルタ(AAF)FIRフィルタ作成ツールである「AAFCreator」:AAF FIRフィルタ作成ツールは、HSBEアルゴリズムのサブバンドシフトによるエイリアシング消去のために必要とされるアンチエイリアシングフィルタを計算する。フィルタは、データベース中のFIRフィルタである。データベースは、.matファイルとして記憶され、1次元構造体を含む。データベース中の全アイテムは、FIRフィルタが使用されることになる角度の表示およびベクトルとしてのフィルタ係数を含む。
プロトタイプ:
Matlab script,no functional name.
出力:
.bmp AAFインパルス応答によるビットマップおよびエイリアシング消去の結果
.mat MATファイルフォーマットでのAAFフィルタを有するデータベース
.wav RIFFオーディオファイルとしてのAAF インパルス応答
入力:
fs テスト信号のサンプリング周波数
NMDCT 変換長N
sig_typ テスト信号タイプ
f テスト信号の周波数
t テスト信号の連続時間
phi 位相角φ、可能な複数の角度
num_opt 最適化パスの数
num_alias 抑制される最高次のエイリアシング成分
b_save_wav ブーリアン、.wavファイルが記憶されるか否かを示す
b_save_bmp ブーリアン、.bmpファイルが記憶されるか否かを示す
b_break ブーリアン、中間結果によりbreakが行われるか否かを示す
path_bmp .bmpファイルに対するパス
path_wav .wavファイルに対するパス
説明:
AAFoptimizer()は、FIRフィルタとしてアンチエリアシングフィルタ(AAF)を発生させる。アルゴリズムは、連続近似による数値的なピーク認識により検出されるエイリアシング成分を最適化する。
プロトタイプ:
[fir x_antialias]=AAFoptimizer(x,X_cmpx,T_imdct,...T_imdst,varargin);
出力:
fir時間ドメインにおけるアンチエイリアシングフィルタのフィルタインパルス応答
x_antialias FIRによるエイリアシングフリーの入力信号x
入力:
X エイリアシング成分を提供された時間信号
X_cmpx MDCT/MDST領域におけるxの複素数表現
T_imdct 逆MDCT行列
T_imdst 逆MDST行列
オプション:
varargin(1) 抑制される最高次のエイリアシング成分
標準:4
varargin(2) 最適化パスの数;標準:3
varargin(3) 位相角φを使用してxが変調されている位相角φ;標準:0
varargin(4) ブーリアン、プロットが確立されるか否かを示す
標準:偽
varargin(5) ブーリアン、確立されたプロットが記憶されるか否かを示す
標準:偽
varargin(6) .bmpファイルに対するパス
標準:0
HSBE processing()
説明:
HSBE processing()は、HSBEによる帯域幅拡張に対して確立される静的ライブラリhsbe.libに対するメインインターフェースである。現在のバージョン1.0では、時間ドメインの信号部分はMDCT/MDSTを使用して変換され、高調波構造が保持されるようにスペクトル的に拡張される。複素帯域幅拡張信号は時間ドメインおよび出力に再変換される。Matlab関数であるdecoder_hsbe()において行われるような包絡線の再構築は、行われない。
プロトタイプ:
HSBE_RESULT HSBEprocessing(HSBE_HANDLE HSBEhandle,...
float *pSamplesIn,float *pSamplesOut,...
unsigned short nSamplesIn,float frequencyOffset);
出力:
HSBE_RESULT エラーコード
pSamplesOut 帯域幅拡張時間信号のベクトルに対するポインタ
入力:
HSBEhandle HSBEハンドル構造体
pSamplesIn 入力信号のベクトルに対するポインタ
nSamplesIn 変換長N
frequencyOffset正規化された周波数としてのラグ周波数flag
説明:
HSBEinit()は、HSBEを初期化するための関数である。ここでは、必要とされる作業メモリが予約され、窓関数が計算され、MDCT/MDST変換行列
が計算される。加えて、HSBE processing()に必要とされる全パラメータがハンドルに導入される。
プロトタイプ:
HSBE_RESULT HSBEinit(HSBE_HANDLE *HSBEhandle,...
unsigned short nSamplesIn,float f_core,float f_hsbe,...
unsigned char windowtype,char flags);
出力:
HSBE_RESULT エラーコード
HSBEhandle HSBEハンドル構造体に対するポインタ
入力:
HSBEhandle HSBEハンドル構造体に対するポインタ
nSamplesIn 変換長N
f_core 正規化された周波数としてのベースバンドのカットオフ周波数fg
f_hsbe 正規化された周波数として再構築されることになる最大周波数
windowtype 使用されることになる窓関数のタイプ
flags チェックフラグ
説明:
HSBE free()は、HSBEinit()により求められたリソースを解放する。
プロトタイプ:
HSBE_RESULT HSBEfree(HSBE_HANDLE*HSBEhandle);
出力:
HSBE_RESULT エラーコード
HSBEhandle HSBEハンドル構造体に対するポインタ
入力:
HSBEhandle HSBEハンドル構造体に対するポインタ
AAC 高度オーディオ符号化
AAF アンチエイリアシングフィルタ
ac−3 ドルビーデジタル適応変換コーダ3
BWE 帯域幅拡張
CD コンパクトディスク
CM−BWE 連続的に修正される帯域幅拡張
DCT 離散余弦波変換
DFT 離散フーリエ変換
DST 離散正弦波変換
DVD デジタル多用途ディスク
FFT 高速フーリエ変換
FIR 有限インパルス応答
HBE 高調波帯域幅拡張
HE−AAC MPEG−4高効率高度オーディオ符号化
HF 高周波数
HSBE 高調波スペクトル帯域幅拡張
JPEG ジョイント・フォトグラフィック・エキスパート・グループ
KiB キビバイト 210バイト=1024バイト
LOT ラップド直交変換
LPC 線形予測コーディング
LTI 線形時不変
MDCT 修正離散余弦波変換
MDST 修正離散正弦波変換
MiB メビバイト=220バイト=1048576バイト
mp3 MPEG−1 オーディオレイヤIII
PC パーソナルコンピュータ
PCM パルスコード変調
PR 完全再構築
QMF 直交ミラーフィルタ
SBR スペクトル帯域複製
SNR 信号対雑音比
TDA 時間ドメインエリアシング
TDAC 時間ドメインエリアシング消去
USAC 統合音声音オーディオコーディング
VoIP ボイス・オーバー・インターネット・プロトコル
Claims (24)
- 周波数が偏移したオーディオ信号をオーディオ入力信号に基づいて生成する装置(100;150;300)において、
前記オーディオ入力信号は、複数の第1サブバンドに対して、1または複数の第1サブバンド値により表されており、
前記装置(100;150;300)は、
前記オーディオ入力信号を受信するインターフェース(110;310)と、
前記周波数が偏移したオーディオ信号を、複数の第2サブバンドに対して1または複数の第2サブバンド値を各々含む信号として生成する周波数偏移部(120;320)と
を備え、
前記第1サブバンド値と前記第2サブバンド値とは各々、それぞれの位相角に関する情報を含み、
前記周波数偏移部(120;320)は、前記第2サブバンド値の1つを、前記第1サブバンド値の1つに基づいて、当該第2サブバンド値の第2位相角の当該第1サブバンド値の第1位相角からの位相角差が、前記周波数が偏移したオーディオ信号を得るために前記オーディオ入力信号を偏移させるべき周波数差を示す周波数情報に依存し、前記第1サブバンドの1つの周波数帯域幅に依存する位相角差となるように生成する構成である
ことを特徴とする成装置。 - 請求項1記載の装置(100;150;300)において、
前記周波数偏移部(120;320)は、
前記第1サブバンドの1つを、前記第2サブバンドの各々に対する周波数情報に基づいて決定し、
前記第2サブバンドのそれぞれの前記1または複数の第2サブバンド値を、決定された各第1サブバンドの1または複数の第1サブバンド値に基づいて生成し、
前記第2のサブバンドのそれぞれの第2サブバンド値のそれぞれ1つを、前記決定された各第1サブバンドの第1サブバンド値のそれぞれ1つに基づいて、各第2サブバンド値の位相角の情報が、各第1サブバンド値の位相各の情報に依存し、かつ、前記オーディオ入力信号を偏移させる周波数差とそのサブバンドの周波数帯域幅に依存するように生成する
構成である
装置。 - 請求項1または2に記載の装置(100;150;300)において、
前記第1サブバンド値の各々および前記第2サブバンド値の各々は複素数として表され、
前記周波数偏移部(120;320)は、複素指数関数の結果値を決定する構成であり、
前記周波数偏移部(120;320)は、第2サブバンド値の少なくとも1つを、前記第1サブバンド値の1つに基づいて、前記第1サブバンド値の前記1つを表す第1の複素数に前記結果値を乗算して前記第2サブバンド値の前記1つを表す第2の複素数を得ることにより生成する構成である
装置。 - 請求項3に記載の装置(100;150;300)において、
前記周波数偏移部(120;320)は、前記複素指数関数の前記結果値を決定する構成であり、前記複素指数関数は、
e-jbφπ/180°
であり、ここで、jは虚数単位であり、bは整数であり、φは、度数法での角度であって、前記第1サブバンドの前記第1サブバンド値を偏移させる周波数差に依存する角度である
装置。 - 請求項1から4のいずれか1項に記載の装置(100;150;300)において、
前記周波数偏移部(120;320)は、前記第2サブバンド値の前記1つを、前記第1サブバンド値の前記1つに基づいて生成する構成であり、
前記第1サブバンド値は、前記オーディオ入力信号の第1のMDCT係数、すなわち前記オーディオ入力信号の修正離散余弦変換の係数、あるいは、前記オーディオ入力信号の第1のQMF係数、すなわち前記オーディオ入力信号のQMF変換の係数である
装置。 - 請求項1から5のいずれか1項に記載の装置(100;150;300)において、
MDCT/MDST変換部(315)をさらに備え、
前記MDCT/MDST変換部(315)は、前記オーディオ入力信号の1または複数の第1のMDCT係数、すなわち前記オーディオ入力信号の修正離散余弦変換の係数を得る構成であり、
前記MDCT/MDST変換部(315)は、前記オーディオ入力信号の前記第1のMDCT係数の1または複数に基づいて、前記オーディオ入力信号の1または複数の第1のMDST係数、すなわち前記オーディオ入力信号の修正離散正弦変換の係数を決定するように構成され、
前記周波数偏移部(120;320)は、前記第1サブバンド値のそれぞれ1つに基づいて、前記第2サブバンド値のそれぞれを生成する構成であり、前記第1サブバンド値はそれぞれ、前記第1のMDCT係数の1つと、この第1のMDCT係数に基づいて決定されている前記第1のMDST係数の1つとに基づいている
装置。 - 請求項6記載の装置(100;150;300)において、
前記周波数偏移部(120;320)は、前記第2サブバンド値のそれぞれを前記第1サブバンド値のそれぞれ1つに基づいて生成する構成であり、前記第1のMDCT係数のそれぞれ、および前記第1のMDST係数のそれぞれは実数値であり、前記第1サブバンド値はそれぞれ、前記第1のMDCT係数の1つと、この第1のMDCT係数に基づいて決定されている虚数単位jの乗算された前記第1のMDST係数の1つとの合計を表す
装置。 - 請求項6または7に記載の装置(100;150;300)において、
前記MDCT/MDST変換部(315)は、前記オーディオ入力信号の前記1または複数の第1のMDST係数を、前記オーディオ入力信号の前記第1のMDCT係数の1または複数に基づいて決定する構成であり、
前記オーディオ入力信号の前記第1のMDCT係数は、1つまたは複数の列を含むMDCT係数行列Xの行列係数として表され、
前記オーディオ入力信号はブロックにサブ分割され、
前記MDCT係数行列Xの前記列のそれぞれは、前記オーディオ入力信号の前記ブロックの1つを表し、
前記MDCT係数行列Xの前記列のそれぞれは、前記オーディオ入力信号のそれぞれの前記ブロックのMDCTスペクトルを形成し、
前記MDCT/MDST変換部(315)は、変換行列Hの行列係数を、前記変換行列Hに前記MDCT係数行列Xを行列乗算することによって行列係数が前記第1のMDST係数を表すMDST係数行列XMDSTが得られるように決定する
装置。 - 請求項6または7に記載の装置(100;150;300)において、
前記MDCT/MDST変換部(315)は、前記オーディオ入力信号の前記1または複数の第1のMDST係数を、前記オーディオ入力信号の前記1または複数の第1のMDCT係数に基づいて決定する構成であり、
前記オーディオ入力信号の前記第1のMDCT係数は、1または複数の列を含むMDCT係数行列Xの行列係数として表され、
前記オーディオ入力信号は、複数のブロックに細分割され、前記MDCT係数行列Xの列のそれぞれが前記複数のブロックの1つを表し、
前記MDCT/MDST変換部(315)は、前記第1のMDST係数を決定するために、
ここで、
X(b)は、前記行列Xのb番目の列であり、
X(b−1)は、前記行列Xのb−1番目の列であり、
X(b−2)は、前記行列Xのb−2番目の列であり、
H0は、第1のサブ行列であり、
H1は、第2のサブ行列であり、
H2は、第3のサブ行列であり、
XMDST(b-1)は、前記第1のMDST係数を含むブロックb−1のMDSTスペクトルを表す
装置。 - 請求項9に記載の装置(100;150;300)において、
前記MDCT/MDST変換部(315)は、前記第1のMDST係数を決定するために、
ここで、前記第1のサブ行列H0の2以上の行列係数は零値であり、前記第2のサブ行列H 1 の2以上の行列係数は零値であり、前記第3のサブ行列H2の2以上の行列係数は零値である
装置。 - 請求項9または10に記載の装置(100;150;300)において、
前記MDCT/MDST変換部(315)は、前記第1のMDST係数を決定するために、
ここで、 前記第2のサブ行列H1は、
装置。 - 請求項1から11のいずれか1項に記載の装置(100;150;300)において、フィルタ部(330)をさらに備え、このフィルタ部(330)は、前記第2サブバンド値を、複数のフィルタ係数を含むフィルタを適用することによりフィルタリングし、前記第1サブバンド値に基づいて前記第2サブバンド値を生成するときに形成された前記第2サブバンド値のスプリアス成分を削減する構成である装置。
- 請求項12記載の装置(100;150;300)において、
前記周波数偏移部(120;320)は、前記第2サブバンド値の前記1つを、前記第1サブバンド値の前記1つに基づいて、前記第2サブバンド値の前記第2位相角が前記第1サブバンド値の前記第1位相角と前記位相角差だけ異なるように、生成する構成であり、
前記フィルタ部(330)は、前記第2サブバンド値を、前記フィルタを適用することによりフィルタリングする構成であり、前記フィルタ係数の1または複数が前記位相角差に依存する
装置。 - 請求項13に記載の装置(100;150;300)において、
記憶装置またはデータベースをさらに備え、
前記フィルタ係数の1または複数が前記位相角差に依存し、
前記フィルタ部(330)は、前記位相角差に依存して、前記記憶装置または前記データベースから前記フィルタ係数を読み出す構成であり、
前記フィルタ部(330)は、前記記憶装置または前記データベースから読み出された前記フィルタ係数を含む前記フィルタを適用することにより、前記第2サブバンド値をフィルタリングする構成である
装置。 - 請求項12から14のいずれか1項に記載の装置(100;150;300)において、
前記フィルタ部(330)は、前記第2サブバンドのそれぞれの前記1または複数の第2サブバンド値のそれぞれをフィルタリングして、前記第2サブバンドのそれぞれに対する1または複数のフィルタリングされたサブバンド値を得る構成であり、
前記フィルタ部(330)は、前記フィルタリングされたサブバンド値のそれぞれを、第1の加数あるいは1または複数のさらなる加数の合計を計算することにより決定する構成であり、
前記第1の加数は、前記第2サブバンドの1つの第2サブバンド値の1つであり、
前記1または複数のさらなる加数は、1または複数の重み付けされたサブバンド値であり、
前記フィルタ部(330)は、前記1または複数の重み付けされたサブバンド値をそれぞれ、前記フィルタ係数の1つに他のサブバンドの1つのサブバンド値をそれぞれ乗算することにより決定する構成である
装置。 - 請求項12から15のいずれか1項に記載の装置(100;150;300)において、
前記フィルタ部(330)は、前記複数のフィルタ係数を含む前記フィルタを適用することによりフィルタリングして、前記第2サブバンド値のスプリアス成分を削減する構成であり、
前記フィルタの前記フィルタ係数は整然とした順序となっており、零ではないフィルタ係数に続く全てのフィルタ係数が零値となっている
装置。 - 請求項1から16のいずれか1項に記載の装置(100;150;300)において、
前記インターフェース(110;310)は、前記オーディオ入力信号の前記第1サブバンドの前記第1サブバンド値を偏移させる周波数差を示す前記周波数情報を受信する構成である装置。 - 請求項1から17のいずれか1項に記載の装置(100;150;300)において、
合成変換部(340)をさらに備え、
この合成変換部は、前記周波数が偏移したオーディオ信号を、前記第2サブバンド値を複数の時間領域標本に変換することにより取得する構成である装置。 - 請求項1から18のいずれか1項に記載の装置(150)において、
周波数が拡張されたオーディオ信号を生成する構成であり、
前記周波数が拡張されたオーディオ信号を、前記周波数が偏移したオーディオ信号の前記第2サブバンド値を生成することにより生成し、前記周波数が拡張されたオーディオ信号は、前記オーディオ入力信号の前記第1サブバンド値と、前記周波数偏移されたオーディオ信号の前記第2サブバンド値とを含む
装置。 - 請求項19に記載の装置(150)において、
合成変換部(340)をさらに備え、
この合成変換部は、前記周波数が拡張されたオーディオ信号を、前記第1サブバンド値と前記第2サブバンド値とを複数の時間領域標本に変換することにより得る構成である装置。 - 請求項19または20に記載の装置(150)において、
スペクトル包絡線が前記周波数が拡張されたオーディオ信号に印加されるように前記周波数が拡張されたオーディオ信号をフィルタリングする構成の包絡線適応部(350)をさらに備える
装置。 - 請求項21に記載の装置(150)において、前記包絡線適応部(350)は、前記周波数が拡張されたオーディオ信号を、LPC係数を使用する逆フィルタリングによりフィルタリングして、前記スペクトル包絡線を前記周波数が拡張されたオーディオ信号に印加する構成である装置。
- 周波数が偏移したオーディオ信号をオーディオ入力信号に基づいて生成する方法において、
前記オーディオ入力信号は、複数の第1サブバンドに対して、1または複数の第1サブバンド値により表されており、
前記オーディオ入力信号を受信し、
前記周波数が偏移したオーディオ信号を、複数の第2サブバンドに対して1または複数の第2サブバンド値を各々含む信号として生成し、
前記第1サブバンド値と前記第2サブバンド値とは各々、それぞれの位相角に関する情報を含み、
前記第2サブバンド値の1つを、前記第1サブバンド値の1つに基づいて、当該第2サブバンド値の第2位相角の当該第1サブバンド値の第1位相角からの位相角差が、前記周波数が偏移したオーディオ信号を得るために前記オーディオ入力信号を偏移させるべき周波数差を示す周波数情報に依存し、前記第1サブバンドの1つの周波数帯域幅に依存する位相角差となるように生成する
方法。 - コンピュータまたは信号プロセッサ上でコンピュータプログラムが実行されるときに、請求項23に記載の方法を実行するコンピュータプログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261667119P | 2012-07-02 | 2012-07-02 | |
US61/667,119 | 2012-07-02 | ||
EP12175808.0 | 2012-07-10 | ||
EP20120175808 EP2682941A1 (de) | 2012-07-02 | 2012-07-10 | Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne |
PCT/EP2013/063827 WO2014005992A1 (de) | 2012-07-02 | 2013-07-01 | Vorrichtung, verfahren und computerprogramm für frei wählbare frequenzverschiebungen in der subband-domäne |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015521759A JP2015521759A (ja) | 2015-07-30 |
JP6147337B2 true JP6147337B2 (ja) | 2017-06-14 |
Family
ID=46762826
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015519171A Active JP6147337B2 (ja) | 2012-07-02 | 2013-07-01 | サブバンド領域内での自由選択可能な周波数偏移のための装置、方法およびコンピュータプログラム |
Country Status (12)
Country | Link |
---|---|
US (1) | US9514767B2 (ja) |
EP (2) | EP2682941A1 (ja) |
JP (1) | JP6147337B2 (ja) |
KR (1) | KR101712475B1 (ja) |
CN (1) | CN104603873B (ja) |
AU (1) | AU2013286049B2 (ja) |
BR (1) | BR112014032265B1 (ja) |
CA (1) | CA2879823C (ja) |
ES (1) | ES2596457T3 (ja) |
MX (1) | MX342099B (ja) |
RU (1) | RU2595889C1 (ja) |
WO (1) | WO2014005992A1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5945626B2 (ja) | 2012-03-29 | 2016-07-05 | テレフオンアクチーボラゲット エルエム エリクソン(パブル) | ハーモニックオーディオ信号の帯域幅拡張 |
ES2738723T3 (es) | 2014-05-01 | 2020-01-24 | Nippon Telegraph & Telephone | Dispositivo de generación de secuencia envolvente combinada periódica, método de generación de secuencia envolvente combinada periódica, programa de generación de secuencia envolvente combinada periódica y soporte de registro |
CN104735649A (zh) * | 2015-03-25 | 2015-06-24 | 江苏物联网研究发展中心 | 基于Gnu Radio的无线链路签名提取方法 |
WO2017050398A1 (en) * | 2015-09-25 | 2017-03-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding |
US10893362B2 (en) | 2015-10-30 | 2021-01-12 | Guoguang Electric Company Limited | Addition of virtual bass |
US9794689B2 (en) * | 2015-10-30 | 2017-10-17 | Guoguang Electric Company Limited | Addition of virtual bass in the time domain |
CN107681993B (zh) * | 2017-09-14 | 2020-10-23 | 维沃移动通信有限公司 | 一种调整音频参数的方法及移动终端 |
US10917074B2 (en) | 2019-03-29 | 2021-02-09 | Bose Corporation | Subband adaptive filter for systems with partially acausal transfer functions |
CN115496993B (zh) * | 2022-09-09 | 2023-07-14 | 锋睿领创(珠海)科技有限公司 | 基于频域融合的目标检测方法、装置、设备及存储介质 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US6782360B1 (en) | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
SE0001926D0 (sv) * | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
SE0004163D0 (sv) * | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
SE0004187D0 (sv) * | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
SE0202159D0 (sv) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
EP1444688B1 (en) * | 2001-11-14 | 2006-08-16 | Matsushita Electric Industrial Co., Ltd. | Encoding device and decoding device |
JP3870193B2 (ja) * | 2001-11-29 | 2007-01-17 | コーディング テクノロジーズ アクチボラゲット | 高周波再構成に用いる符号器、復号器、方法及びコンピュータプログラム |
US7318035B2 (en) * | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
WO2005078707A1 (en) * | 2004-02-16 | 2005-08-25 | Koninklijke Philips Electronics N.V. | A transcoder and method of transcoding therefore |
EP1810281B1 (en) * | 2004-11-02 | 2020-02-26 | Koninklijke Philips N.V. | Encoding and decoding of audio signals using complex-valued filter banks |
KR101276985B1 (ko) * | 2009-03-19 | 2013-06-24 | 쇼와 덴코 가부시키가이샤 | 방전 갭 충전용 조성물 및 정전 방전 보호체 |
RU2452044C1 (ru) * | 2009-04-02 | 2012-05-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот |
EP2239732A1 (en) * | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
CO6440537A2 (es) * | 2009-04-09 | 2012-05-15 | Fraunhofer Ges Forschung | Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio |
TWI484481B (zh) * | 2009-05-27 | 2015-05-11 | 杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
EP3564954B1 (en) * | 2010-01-19 | 2020-11-11 | Dolby International AB | Improved subband block based harmonic transposition |
RU2596033C2 (ru) * | 2010-03-09 | 2016-08-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Устройство и способ получения улучшенной частотной характеристики и временного фазирования способом расширения полосы аудио сигналов в фазовом вокодере |
MY176904A (en) | 2010-06-09 | 2020-08-26 | Panasonic Ip Corp America | Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit, and audio decoding apparatus |
CA2808353C (en) | 2010-09-16 | 2017-05-02 | Dolby International Ab | Cross product enhanced subband block based harmonic transposition |
-
2012
- 2012-07-10 EP EP20120175808 patent/EP2682941A1/de not_active Withdrawn
-
2013
- 2013-07-01 ES ES13737170.4T patent/ES2596457T3/es active Active
- 2013-07-01 JP JP2015519171A patent/JP6147337B2/ja active Active
- 2013-07-01 AU AU2013286049A patent/AU2013286049B2/en active Active
- 2013-07-01 BR BR112014032265-1A patent/BR112014032265B1/pt active IP Right Grant
- 2013-07-01 WO PCT/EP2013/063827 patent/WO2014005992A1/de active Application Filing
- 2013-07-01 RU RU2015102934/08A patent/RU2595889C1/ru active
- 2013-07-01 MX MX2014015749A patent/MX342099B/es active IP Right Grant
- 2013-07-01 EP EP13737170.4A patent/EP2867894B1/de active Active
- 2013-07-01 CA CA2879823A patent/CA2879823C/en active Active
- 2013-07-01 KR KR1020147037169A patent/KR101712475B1/ko active IP Right Grant
- 2013-07-01 CN CN201380045831.4A patent/CN104603873B/zh active Active
-
2014
- 2014-12-31 US US14/588,269 patent/US9514767B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP2867894B1 (de) | 2016-08-24 |
AU2013286049B2 (en) | 2016-02-18 |
CA2879823C (en) | 2018-05-01 |
MX2014015749A (es) | 2015-06-17 |
WO2014005992A1 (de) | 2014-01-09 |
CN104603873B (zh) | 2017-08-25 |
CN104603873A (zh) | 2015-05-06 |
BR112014032265A2 (pt) | 2019-10-22 |
ES2596457T3 (es) | 2017-01-09 |
EP2867894A1 (de) | 2015-05-06 |
US9514767B2 (en) | 2016-12-06 |
RU2595889C1 (ru) | 2016-08-27 |
CA2879823A1 (en) | 2014-01-09 |
JP2015521759A (ja) | 2015-07-30 |
KR101712475B1 (ko) | 2017-03-13 |
AU2013286049A1 (en) | 2015-01-22 |
EP2682941A1 (de) | 2014-01-08 |
MX342099B (es) | 2016-09-13 |
US20150110292A1 (en) | 2015-04-23 |
BR112014032265B1 (pt) | 2021-10-13 |
KR20150043250A (ko) | 2015-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6147337B2 (ja) | サブバンド領域内での自由選択可能な周波数偏移のための装置、方法およびコンピュータプログラム | |
RU2413191C2 (ru) | Системы, способы и устройства для устраняющей разреженность фильтрации | |
RU2649940C2 (ru) | Устройство и способ для декодирования или кодирования звукового сигнала с использованием значений информации энергии для полосы частот восстановления | |
EP1875464B9 (en) | Method, storage medium and apparatus for gain factor attenuation | |
US9037454B2 (en) | Efficient coding of overcomplete representations of audio using the modulated complex lapped transform (MCLT) | |
JP2012163981A (ja) | オーディオコーデックポストフィルタ | |
EP1903558B1 (en) | Audio signal interpolation method and device | |
JP3814611B2 (ja) | 時間離散オーディオサンプル値を処理する方法と装置 | |
KR20090028755A (ko) | 압축된 서브밴드 필터 임펄스 응답들을 형성하는 필터 압축기 및 방법 | |
CN105960675B (zh) | 音频信号解码器中改进的频带扩展 | |
US20100250260A1 (en) | Encoder | |
Thiagarajan et al. | Analysis of the MPEG-1 Layer III (MP3) algorithm using MATLAB | |
EP2720477A1 (en) | Virtual bass synthesis using harmonic transposition | |
Spanias et al. | Analysis of the MPEG-1 Layer III (MP3) Algorithm using MATLAB |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150305 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160421 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160510 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20160729 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170418 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170516 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6147337 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |