JP2016173597A - 高周波オーディオ内容の効率的な復元のための方法およびシステム - Google Patents
高周波オーディオ内容の効率的な復元のための方法およびシステム Download PDFInfo
- Publication number
- JP2016173597A JP2016173597A JP2016102645A JP2016102645A JP2016173597A JP 2016173597 A JP2016173597 A JP 2016173597A JP 2016102645 A JP2016102645 A JP 2016102645A JP 2016102645 A JP2016102645 A JP 2016102645A JP 2016173597 A JP2016173597 A JP 2016173597A
- Authority
- JP
- Japan
- Prior art keywords
- tone
- determining
- frequency
- audio signal
- bin
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 172
- 238000011084 recovery Methods 0.000 title abstract 2
- 230000005236 sound signal Effects 0.000 claims abstract description 175
- 238000002156 mixing Methods 0.000 claims description 69
- 230000001133 acceleration Effects 0.000 claims description 34
- 230000003595 spectral effect Effects 0.000 claims description 25
- 238000000819 phase cycle Methods 0.000 claims description 13
- 230000000875 corresponding effect Effects 0.000 description 47
- 238000001228 spectrum Methods 0.000 description 34
- 238000004364 calculation method Methods 0.000 description 30
- 238000013459 approach Methods 0.000 description 21
- 230000006870 function Effects 0.000 description 17
- 239000011159 matrix material Substances 0.000 description 11
- 238000013519 translation Methods 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 238000013139 quantization Methods 0.000 description 8
- 230000009467 reduction Effects 0.000 description 8
- 239000006185 dispersion Substances 0.000 description 7
- 230000009286 beneficial effect Effects 0.000 description 6
- 238000012360 testing method Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000009897 systematic effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【解決手段】オーディオ信号の第一の周波数サブバンドについて第一の帯域化トーン性値312を決定する方法であって第一の帯域化トーン性値312は、オーディオ信号の低周波成分に基づいてオーディオ信号の高周波成分を近似するために使われる。方法は、オーディオ信号のブロックに基づいて、対応する一組の周波数ビンにおける一組の変換係数を決定する段階と、一組の変換係数を使って一組の周波数ビンについての一組のビン・トーン性値341をそれぞれ決定する段階と、第一の周波数サブバンド内にある一組の周波数ビンの二つ以上の対応する隣り合う周波数ビンについて一組のビン・トーン性値341の二つ以上からなる第一の部分集合を組み合わせて、第一の周波数サブバンドについての第一の帯域化トーン性値312を与える段階とを含む。
【選択図】図3b
Description
本願は2012年2月23日に出願された欧州特許出願第12156631.9号および2012年8月8日に出願された米国仮特許出願第61/680,805号の優先権の利益を主張するものである。両出願はここに参照によってその全体において組み込まれる。
本稿はオーディオ符号化、復号および処理の技術分野に関する。特にオーディオ信号の高周波内容を同じオーディオ信号の低周波内容から効率的な仕方で復元する方法に関する。
b=Tcopy・(1−var{Tcopy,Thigh})+Thigh・(var{Tcopy,Thigh})
として決定されてもよい。ここで、var{Tcopy,Thigh}=((Tcopy−Thigh)/(Tcopy+Thigh))2は源トーン性値Tcopy(または低トーン性値)と目標トーン性値Thighの分散(variance)である。
φk=atan2(Im{TCk},Re{TCk})、 −π<φk≦π
として決定されてもよい。atan2関数は、たとえばインターネット・リンク
http://de.wikipedia.org/wiki/Atan2#atan2
において特定されている。原理的には、atan2関数は、y=Im{TCk}および/またはx=Re{TCk})の負の値を考慮に入れる、y=Im{TCk}およびx=Re{TCk})の比の逆正接関数として記述することができる。図2a、2b、2c、2dのコンテキストで概説されるように、もとのオーディオ信号から導出される異なるスペクトル・データ200、210、220に基づいて異なる帯域化トーン性値231、232、233が決定される必要があることがある。図2aに示した概観に基づいて、発明者は、異なる帯域化トーン性の計算は実際には同じデータに基づいている、特に同じ変換係数(TC)に基づいていることに気がついた。
2(spxend−spxstart)+(sxpend−spxbegin)+6
個の周波数ビンについてトーン性を計算する(ここで、追加の6個のトーン性値は、SPXに基づくエンコーダ内での固有のノッチ・フィルタを構成するために使われる)。計算されたトーン性値を上記のように再利用することによって、トーン性値が決定されるビンの数は
spxend−spxstart−cplbegin+spxstart
+min(spxend−spxbegin+3, spxbegin−spxstart)
=spxend−cplbegin+min(spxend−spxbegin+3, spxbegin−spxstart)
に減る(ここで、追加の3個のトーン性値は、SPXに基づくエンコーダ内での固有のノッチ・フィルタを構成するために使われる)。この最適化前後にトーン性が計算されるビンの比は、トーン性アルゴリズムについてのパフォーマンス改善(および計算量削減)を与える。二段階アプローチは典型的には、帯域化トーン性値の直接計算よりやや複雑になることは注意しておくべきである。よって、完全なトーン性計算のためのパフォーマンス利得(すなわち、計算量削減)は、種々のビットレートについて表2に見出される計算されるトーン性ビンの比よりはやや低くなる。
b=Tlow・(1−var{Tlow,Thigh})+Thigh・(var{Tlow,Thigh})
として決定されてもよい。ここで、Tlow 321はデコーダ・シミュレートされた低域のトーン性であり、Thigh 322はもとの高域のトーン性であり、var{Tlow,Thigh}=((Tlow−Thigh)/(Tlow+Thigh))2は二つのトーン性値Tlow 321およびThigh 322の分散である。
b=Tcopy・(1−var{Tcopy,Thigh})+Thigh・(var{Tcopy,Thigh})
として決定されてもよい。ここで、var{Tcopy,Thigh}=((Tcopy−Thigh)/(Tcopy+Thigh))2は二つのトーン性値Tcopy 323とThigh 322の分散である。
min{spxbegin−spxstart, spxend−sxpbegin}
となりうる。ここで、数(spxbegin−spxstart)は、ノイズ・ブレンディング因子bがデコーダ・シミュレートされた低域の帯域化トーン性値Tlow 321に基づいて決定される場合に適用され、数(spxend−spxbegin)は、ノイズ・ブレンディング因子bが並進された高域の帯域化トーン性値Tcopy 323に基づいて決定される場合に適用される。よって、ある実施形態では、SPXに基づくエンコーダは、(spxbegin−spxstart)と(spxend−sxpbegin)のうちの最小に依存して、ノイズ・ブレンディング因子bの決定のモードを選択するよう構成されていてもよい(帯域化トーン性値Tlow 321に基づく第一のモードと帯域化トーン性値Tcopy 323に基づく第二のモード)。それにより、(特に(spxend−sxpbegin)が(spxbegin−spxstart)より小さい場合)計算上の複雑さが軽減される。
Yn,k=Re{TCn,k}2+Im{TCn,k}2
はビンnおよびブロックkのパワーであり、wn,kは重み付け因子であり、
φn,k=atan2(Re{TCn,k},Im{TCn,k})
はビンnおよびブロックkの位相角である。ビン・トーン性値Tn,kについての上述した公式は、(上記のビン・トーン性値Tn,kについて与えた公式のコンテキストにおいて概説したような)位相角の加速を示す。ビン・トーン性値Tn,kを決定するための他の公式が使用されてもよいことを注意しておくべきである。トーン性計算の加速(すなわち、計算上の複雑さの軽減)は、主として、重み付け因子wの決定に結びつけられた計算上の複雑さの低減に向けられる。
〔態様1〕
オーディオ信号の第一の周波数サブバンド(205)について第一の帯域化トーン性値(311、312)を決定する方法であって、前記第一の帯域化トーン性値は、前記オーディオ信号の低周波成分に基づいて前記オーディオ信号の高周波成分を近似するために使われ、当該方法は:
・前記オーディオ信号のサンプルのブロックに基づいて、対応する一組の周波数ビンにおける一組の変換係数を決定する段階と;
・前記一組の変換係数を使って前記一組の周波数ビンについての一組のビン・トーン性値(341)をそれぞれ決定する段階と;
・前記第一の周波数サブバンド内にある前記一組の周波数ビンの二つ以上の対応する隣り合う周波数ビンについて前記一組のビン・トーン性値の二つ以上からなる第一の部分集合を組み合わせて、それにより前記第一の周波数サブバンドについての前記第一の帯域化トーン性値(311、312)を与える段階とを含む、
方法。
〔態様2〕
態様1記載の方法であって、さらに:
・第二の周波数サブバンド内にある前記一組の周波数ビンの二つ以上の対応する隣り合う周波数ビンについて前記一組のビン・トーン性値の二つ以上からなる第二の部分集合を組み合わせることによって、前記第二の周波数サブバンドにおける第二の帯域化トーン性値(321、322)を決定する段階を含み、前記第一および第二の周波数サブバンドは、少なくとも一つの共通の周波数ビンを含み、前記第一および第二の部分集合は対応する少なくとも一つの共通のビン・トーン性値を含む、
方法。
〔態様3〕
態様1記載の方法であって、
・前記オーディオ信号の低周波成分に基づいて前記オーディオ信号の高周波成分を近似することは、前記低周波成分に対応する低周波数帯域(101)からの一つまたは複数の周波数ビンの一つまたは複数の低周波数変換係数を、前記高周波成分に対応する高周波数帯域(102)にコピーすることを含んでおり、
・前記第一の周波数サブバンドは前記低周波数帯域内にあり;
・第二の周波数サブバンドが前記高周波数帯域内にあり;
・当該方法がさらに、前記第二の周波数サブバンドにコピーされた前記周波数ビンのうちの二つ以上の対応する周波数ビンについて前記一組のビン・トーン性値の二つ以上からなる第二の部分集合を組み合わせることによって、前記第二の周波数サブバンドにおける第二の帯域化トーン性値(233)を決定する段階を含み、
・前記第二の周波数サブバンドは、前記第一の周波数サブバンド内にある周波数ビンからコピーされた少なくとも一つの周波数ビンを含み、
・前記第一および第二の部分集合は対応する少なくとも一つの共通のビン・トーン性値を含む、
方法。
〔態様4〕
態様1ないし3のうちいずれか一項記載の方法であって、
・当該方法はさらに、前記オーディオ信号のブロックの対応するシーケンスに基づいて、変換係数の組のシーケンスを決定することを含み;
・特定の周波数ビンについて、変換係数の組の前記シーケンスは、特定の諸変換係数のシーケンスを含み;
・前記特定の周波数ビンについて前記ビン・トーン性値を決定することは:
・前記特定の諸変換係数のシーケンスに基づいて位相のシーケンスを決定し、
・前記位相のシーケンスに基づいて位相加速を決定することを含み;
・前記特定の周波数ビンについての前記ビン・トーン性値は前記位相加速の関数である、
方法。
〔態様5〕
態様1ないし4のうちいずれか一項記載の方法であって、前記一組のビン・トーン性値の二つ以上からなる第一の部分集合を組み合わせることが:
・前記二つ以上のビン・トーン性値を平均すること;または
・前記二つ以上のビン・トーン性値を合計することを含む、
方法。
〔態様6〕
態様1ないし5のうちいずれか一項記載の方法であって、ある周波数ビンについてのビン・トーン性値は、同じ周波数ビンの変換係数にのみ基づいて決定される、方法。
〔態様7〕
態様1ないし6のうちいずれか一項記載の方法であって、
・前記第一の帯域化トーン性値は、SPXと称されるスペクトル拡張の方式を使って前記オーディオ信号の低周波成分に基づいて前記オーディオ信号の高周波成分を近似するために使われ;
・前記第一の帯域化トーン性値は、SPX座標再送戦略、ノイズ・ブレンディング因子および/または大分散減衰を決定するために使われる、
方法。
〔態様8〕
ノイズ・ブレンディング因子を決定する方法であって、前記ノイズ・ブレンディング因子は、オーディオ信号の低周波成分に基づいて前記オーディオ信号の高周波成分を近似するために使用され、前記高周波成分は高周波数帯域における一つまたは複数の高周波数サブバンド信号を含み、前記低周波成分は低周波数帯域における一つまたは複数の低周波数サブバンド信号を含み、高周波成分を近似することは、一つまたは複数の低周波数サブバンド信号を高周波数帯域にコピーし、それにより一つまたは複数の近似された高周波数サブバンド信号を与えることを含み、当該方法は;
・前記一つまたは複数の高周波数サブバンド信号に基づいて目標帯域化トーン性値(322)を決定する段階と;
・前記一つまたは複数の近似された高周波数サブバンド信号に基づいて源帯域化トーン性値(323)を決定する段階と;
・前記目標および源帯域化トーン性値に基づいて前記ノイズ・ブレンディング因子を決定する段階とを含む、
方法。
〔態様9〕
態様8記載の方法であって、前記ノイズ・ブレンディング因子を、前記目標および源帯域化トーン性値の分散に基づいて決定することを含む、方法。
〔態様10〕
態様8または9記載の方法であって、前記ノイズ・ブレンディング因子bを
b=Tcopy・(1−var{Tcopy,Thigh})+Thigh・(var{Tcopy,Thigh})
として決定することを含み、ここで、var{Tcopy,Thigh}=((Tcopy−Thigh)/(Tcopy+Thigh))2は源トーン性値Tcopyと目標トーン性値Thighの分散である、方法。
〔態様11〕
態様8ないし10のうちいずれか一項記載の方法であって、前記ノイズ・ブレンディング因子は、前記オーディオ信号の前記高周波成分を近似するために前記一つまたは複数の近似された高周波数サブバンド信号に加えられるべきノイズの量を示す、方法。
〔態様12〕
態様8ないし11のうちいずれか一項記載の方法であって、
・前記低周波数帯域(101)は、コピーするために利用可能な低周波数サブバンドのうち最も低い周波数をもつ低周波数サブバンドを示すスタート帯域(201)を含み;
・前記高周波数帯域(101)は、近似されるべき高周波数サブバンドのうち最も低い周波数をもつ高周波数サブバンドを示すビギン帯域(202)を含み;
・前記高周波数帯域(102)は、近似されるべき高周波数サブバンドのうち最も高い周波数をもつ高周波数サブバンドを示すエンド帯域(203)を含み;
・当該方法は、前記スタート帯域と前記ビギン帯域の間の第一の帯域幅を決定することを含み:
・当該方法は、前記ビギン帯域と前記エンド帯域の間の第二の帯域幅を決定することを含む、
方法。
〔態様13〕
態様12記載の方法であって、さらに:
・前記第一の帯域幅が第二の帯域幅より小さい場合、前記スタート帯域と前記ビギン帯域の間の前記低周波数サブバンドの前記一つまたは複数の低周波数サブバンド信号(205)に基づいて、低帯域化トーン性値(321)を決定し、前記目標帯域化トーン性値(322)および前記低帯域化トーン性値(321)に基づいて前記ノイズ・ブレンディング因子を決定することを含む、
方法。
〔態様14〕
態様12記載の方法であって、さらに:
・前記一の帯域幅が前記第二の帯域幅以上である場合、前記スタート帯域と前記スタート帯域に前記第二の帯域幅を加えたものとの間にある前記低周波数サブバンドの前記一つまたは複数の低周波数サブバンド信号(205)に基づいて、前記源帯域化トーン性値(323)を決定することを含む、
方法。
〔態様15〕
態様8ないし14のうちいずれか一項記載の方法であって、ある周波数サブバンドの帯域化トーン性値を決定することが:
・前記オーディオ信号のサンプルのブロックに基づいて、対応する一組の周波数ビンにおける一組の変換係数を決定する段階と;
・前記一組の変換係数を使って前記一組の周波数ビンについての一組のビン・トーン性値(341)をそれぞれ決定する段階と;
・前記周波数サブバンド内にある前記一組の周波数ビンの二つ以上の対応する隣り合う周波数ビンについて前記一組のビン・トーン性値の二つ以上からなる第一の部分集合を組み合わせて、それにより前記周波数サブバンドの前記帯域化トーン性値(311、312)を与える段階とを含む、
方法。
〔態様16〕
オーディオ信号の第一の周波数ビンについての第一のビン・トーン性値を決定する方法であって、前記第一のビン・トーン性値は、前記オーディオ信号の低周波成分に基づいて前記オーディオ信号の高周波成分を近似するために使用され、当該方法は:
・前記オーディオ信号のサンプルのブロックの対応するシーケンスについて前記第一の周波数ビンにおける変換係数のシーケンスを与える段階と;
・前記変換係数のシーケンスに基づいて位相のシーケンスを決定する段階と;
・前記位相のシーケンスに基づいて位相加速を決定する段階と;
・現在の変換係数に基づいてビン・パワーを決定する段階と;
・相続く変換係数のパワーの比の四乗根を示す重み付け因子を、対数近似を使って近似する段階と;
・前記ビン・パワーおよび前記近似された重み付け因子によって前記位相加速に重み付けし、前記第一のビン・トーン性値を与える段階とを含む、
方法。
〔態様17〕
態様16記載の方法であって、
・前記変換係数のシーケンスは、現在の変換係数と、直前の変換係数とを含み、
・前記重み付け因子は、前記現在の変換係数および前記直前の変換係数のパワーの比の四乗根を示す、
方法。
〔態様18〕
態様16または17記載の方法であって、
・前記変換係数は実部および虚部を含む複素数であり;
・現在の変換係数のパワーが、該現在の変換係数の二乗された実部および二乗された虚部に基づいて決定され;
・位相が、前記現在の変換係数の実部および虚部の逆正接関数に基づいて決定される、
方法。
〔態様19〕
態様16ないし18のうちいずれか一項記載の方法であって、
・現在の位相加速が、現在の変換係数の位相に基づき、かつ二つ以上の直前の変換係数の位相に基づいて決定される、方法。
〔態様20〕
態様16ないし19のうちいずれか一項記載の方法であって、前記重み付け因子を近似することは:
・相続く変換係数のシーケンスの現在のものを表わす現在の仮数および現在の指数を与える段階と;
・前記現在の仮数および前記現在の指数に基づいてあらかじめ決定されたルックアップテーブルについてのインデックス値を決定する段階であって、前記ルックアップテーブルは、複数のインデックス値と、該複数のインデックス値の対応する複数の指数関数値との間の関係を与えるものである、段階と;
・前記近似された重み付け因子を、前記インデックス値および前記ルックアップテーブルを使って決定する段階とを含む、
方法。
〔態様21〕
態様20記載の方法であって、前記対数近似は対数関数の線形近似を含む;および/または前記ルックアップテーブルが64個以下のエントリーを含む、方法。
〔態様22〕
態様20または21記載の方法であって、前記重み付け因子を近似することは:
・前記仮数および前記指数に基づいて実数値のインデックス値を決定する段階と;
・前記実数値のインデックス値を打ち切るおよび/または丸めることによって前記インデックス値を決定する段階とを含む、
方法。
〔態様23〕
態様16ないし22のうちいずれか一項記載の方法であって、前記重み付け因子を近似することは:
・現在の変換係数に先行する変換係数を表わす前の仮数および前の指数を与える段階と;
・前記現在の仮数、前記前の仮数、前記現在の指数および前記前の指数に適用される一つまたは複数の加算および/または減算演算に基づいて前記インデックス値を決定する段階とを含む、
方法。
〔態様24〕
態様23記載の方法であって、前記インデックス値が、(ey−ez+2my−2mz)に対するモジュロ演算を実行することによって決定され、ここで、eyは前記現在の仮数、ezは前記前の仮数、myは前記現在の指数、mzは前記前の指数である、方法。
〔態様25〕
多チャネル・オーディオ信号の複数の結合されたチャネルについての複数のトーン性値を決定する方法であって:
・前記複数の結合されたチャネルの第一のチャネルのサンプルのブロックの対応するシーケンスについて変換係数の第一のシーケンスを決定する段階と;
・前記第一の変換係数のシーケンスに基づいて位相の第一のシーケンスを決定する段階と;
・前記第一の位相のシーケンスに基づいて第一の位相加速を決定する段階と;
・前記第一のチャネルについての第一のトーン性値を、前記第一の位相加速に基づいて決定する段階と;
・前記複数の結合されたチャネルの第二のチャネルについてのトーン性値を、前記第一の位相加速に基づいて決定する段階とを含む、
方法。
〔態様26〕
SPXと称されるスペクトル拡張に基づくエンコーダにおける多チャネル・オーディオ信号の第一のチャネルについての帯域化トーン性値を決定する方法であって、前記SPXに基づくエンコーダは、前記第一のチャネルの低周波成分から前記第一のチャネルの高周波成分を近似するよう構成されており;前記第一のチャネルは、前記SPXに基づくエンコーダによって前記多チャネル・オーディオ信号の一つまたは複数の他のチャネルと結合されており;前記帯域化トーン性値はノイズ・ブレンディング因子を決定するために使用され;前記帯域化トーン性値は、ノイズ・ブレンディングの前の近似された高周波成分のトーン性を示し;当該方法は:
・結合の前に、前記第一のチャネルに基づいて複数の変換係数を与える段階と;
・前記複数の変換係数に基づいて前記帯域化トーン性値を決定する段階とを含む、
方法。
〔態様27〕
オーディオ信号の第一の周波数サブバンドについて第一の帯域化トーン性値を決定するよう構成されたシステムであって、前記第一の帯域化トーン性値は、前記オーディオ信号の低周波成分に基づいて前記オーディオ信号の高周波成分を近似するために使われ、当該システムは:
・前記オーディオ信号のサンプルのブロックに基づいて、対応する一組の周波数ビンにおける一組の変換係数を決定する段階と;
・前記一組の変換係数を使って前記一組の周波数ビンについての一組のビン・トーン性値をそれぞれ決定する段階と;
・前記第一の周波数サブバンド内にある前記一組の周波数ビンの二つ以上の対応する隣り合う周波数ビンについて前記一組のビン・トーン性値の二つ以上からなる第一の部分集合を組み合わせて、それにより前記第一の周波数サブバンドについての前記第一の帯域化トーン性値を与える段階とを実行するよう構成されている、
システム。
〔態様28〕
ノイズ・ブレンディング因子を決定するシステムであって、前記ノイズ・ブレンディング因子は、オーディオ信号の低周波成分に基づいて前記オーディオ信号の高周波成分を近似するために使用され、前記高周波成分は高周波数帯域における一つまたは複数の高周波数サブバンド信号を含み、前記低周波成分は低周波数帯域における一つまたは複数の低周波数サブバンド信号を含み、高周波成分を近似することは、一つまたは複数の低周波数サブバンド信号を高周波数帯域にコピーし、それにより一つまたは複数の近似された高周波数サブバンド信号を与えることを含み、当該システムは;
・前記一つまたは複数の高周波数サブバンド信号に基づいて目標帯域化トーン性値を決定する段階と;
・前記一つまたは複数の近似された高周波数サブバンド信号に基づいて源帯域化トーン性値を決定する段階と;
・前記目標および源帯域化トーン性値に基づいて前記ノイズ・ブレンディング因子を決定する段階とを実行するよう構成されている、
システム。
〔態様29〕
オーディオ信号の第一の周波数ビンについての第一のビン・トーン性値を決定するよう構成されたシステムであって、前記第一の帯域化トーン性値は、前記オーディオ信号の低周波成分に基づいて前記オーディオ信号の高周波成分を近似するために使用され、当該システムは:
・前記オーディオ信号のサンプルのブロックの対応するシーケンスについて前記第一の周波数ビンにおける変換係数のシーケンスを与える段階と;
・前記変換係数のシーケンスに基づいて位相のシーケンスを決定する段階と;
・前記位相のシーケンスに基づいて位相加速を決定する段階と;
・現在の変換係数に基づいてビン・パワーを決定する段階と;
・相続く変換係数のパワーの比の四乗根を示す重み付け因子を、対数近似を使って近似する段階と;
・前記ビン・パワーおよび前記近似された重み付け因子によって前記位相加速に重み付けし、前記第一のビン・トーン性値を与える段階とを実行するよう構成されている、
システム。
〔態様30〕
高周波再構成を使ってオーディオ信号をエンコードするよう構成されたオーディオ・エンコーダであって、態様27ないし29記載のシステムの一つまたは複数を有する、オーディオ・エンコーダ。
〔態様31〕
プロセッサ上での実行のために、該プロセッサで実行されたときに態様1ないし26のうちいずれか一項記載の方法段階を実行するために適応されている、ソフトウェア・プログラム。
〔態様32〕
プロセッサ上での実行のために、コンピューティング装置で実行されたときに態様1ないし26のうちいずれか一項記載の方法段階を実行するために適応されているソフトウェア・プログラムを有する記憶媒体。
〔態様33〕
コンピュータ上で実行されたときに態様1ないし26のうちいずれか一項記載の方法段階を実行するための実行可能命令を有する、コンピュータ・プログラム・プロダクト。
Claims (15)
- ノイズ・ブレンディング因子を決定する方法であって、前記ノイズ・ブレンディング因子は、オーディオ信号の低周波成分に基づいて前記オーディオ信号の高周波成分を近似するために使用され、前記高周波成分は高周波数帯域における一つまたは複数の高周波数サブバンド信号を含み、前記低周波成分は低周波数帯域における一つまたは複数の低周波数サブバンド信号を含み、高周波成分を近似することは、一つまたは複数の低周波数サブバンド信号を高周波数帯域にコピーし、それにより一つまたは複数の近似された高周波数サブバンド信号を与えることを含み、当該方法は;
・前記一つまたは複数の高周波数サブバンド信号に基づいて目標帯域化トーン性値(322)を決定する段階と;
・前記一つまたは複数の近似された高周波数サブバンド信号に基づいて源帯域化トーン性値(323)を決定する段階と;
・前記目標および源帯域化トーン性値に基づいて前記ノイズ・ブレンディング因子を決定する段階とを含む、
方法。 - 請求項1記載の方法であって、前記ノイズ・ブレンディング因子bを
b=Tcopy・(1−var{Tcopy,Thigh})+Thigh・(var{Tcopy,Thigh})
として決定することを含み、ここで、var{Tcopy,Thigh}=((Tcopy−Thigh)/(Tcopy+Thigh))2は源トーン性値Tcopyと目標トーン性値Thighの分散である、方法。 - 請求項1または2記載の方法であって、
・前記低周波数帯域(101)は、コピーするために利用可能な低周波数サブバンドのうち最も低い周波数をもつ低周波数サブバンドを示すスタート帯域(201)を含み;
・前記高周波数帯域(101)は、近似されるべき高周波数サブバンドのうち最も低い周波数をもつ高周波数サブバンドを示すビギン帯域(202)を含み;
・前記高周波数帯域(102)は、近似されるべき高周波数サブバンドのうち最も高い周波数をもつ高周波数サブバンドを示すエンド帯域(203)を含み;
・当該方法は、前記スタート帯域と前記ビギン帯域の間の第一の帯域幅を決定することを含み:
・当該方法は、前記ビギン帯域と前記エンド帯域の間の第二の帯域幅を決定することを含む、
方法。 - 請求項3記載の方法であって、さらに:
・前記第一の帯域幅が第二の帯域幅より小さい場合、前記スタート帯域と前記ビギン帯域の間の前記低周波数サブバンドの前記一つまたは複数の低周波数サブバンド信号(205)に基づいて、低帯域化トーン性値(321)を決定し、前記目標帯域化トーン性値(322)および前記低帯域化トーン性値(321)に基づいて前記ノイズ・ブレンディング因子を決定することを含む、
方法。 - 請求項3記載の方法であって、さらに:
・前記一の帯域幅が前記第二の帯域幅以上である場合、前記スタート帯域と前記スタート帯域に前記第二の帯域幅を加えたものとの間にある前記低周波数サブバンドの前記一つまたは複数の低周波数サブバンド信号(205)に基づいて、前記源帯域化トーン性値(323)を決定することを含む、
方法。 - 請求項1ないし5のうちいずれか一項記載の方法であって、ある周波数サブバンドの帯域化トーン性値を決定することが:
・前記オーディオ信号のサンプルのブロックに基づいて、対応する一組の周波数ビンにおける一組の変換係数を決定する段階と;
・前記一組の変換係数を使って前記一組の周波数ビンについての一組のビン・トーン性値(341)をそれぞれ決定する段階と;
・前記周波数サブバンド内にある前記一組の周波数ビンの二つ以上の対応する隣り合う周波数ビンについて前記一組のビン・トーン性値の二つ以上からなる第一の部分集合を組み合わせて、それにより前記周波数サブバンドの前記帯域化トーン性値(311、312)を与える段階とを含む、
方法。 - オーディオ信号の第一の周波数ビンについての第一のビン・トーン性値を決定する方法であって、前記第一のビン・トーン性値は、前記オーディオ信号の低周波成分に基づいて前記オーディオ信号の高周波成分を近似するために使用され、当該方法は:
・前記オーディオ信号のサンプルのブロックの対応するシーケンスについて前記第一の周波数ビンにおける変換係数のシーケンスを与える段階と;
・前記変換係数のシーケンスに基づいて位相のシーケンスを決定する段階と;
・前記位相のシーケンスに基づいて位相加速を決定する段階と;
・現在の変換係数に基づいてビン・パワーを決定する段階と;
・相続く変換係数のパワーの比の四乗根を示す重み付け因子を、対数近似を使って近似する段階と;
・前記ビン・パワーおよび前記近似された重み付け因子によって前記位相加速に重み付けし、前記第一のビン・トーン性値を与える段階とを含む、
方法。 - 請求項7記載の方法であって、前記重み付け因子を近似することは:
・相続く変換係数のシーケンスの現在のものを表わす現在の仮数および現在の指数を与える段階と;
・前記現在の仮数および前記現在の指数に基づいてあらかじめ決定されたルックアップテーブルについてのインデックス値を決定する段階であって、前記ルックアップテーブルは、複数のインデックス値と、該複数のインデックス値の対応する複数の指数関数値との間の関係を与えるものである、段階と;
・前記近似された重み付け因子を、前記インデックス値および前記ルックアップテーブルを使って決定する段階とを含む、
方法。 - 請求項8記載の方法であって、前記重み付け因子を近似することは:
・現在の変換係数に先行する変換係数を表わす前の仮数および前の指数を与える段階と;
・前記現在の仮数、前記前の仮数、前記現在の指数および前記前の指数に適用される一つまたは複数の加算および/または減算演算に基づいて前記インデックス値を決定する段階とを含む、
方法。 - 請求項9記載の方法であって、前記インデックス値が、(ey−ez+2my−2mz)に対するモジュロ演算を実行することによって決定され、ここで、eyは前記現在の仮数、ezは前記前の仮数、myは前記現在の指数、mzは前記前の指数である、方法。
- 多チャネル・オーディオ信号の複数の結合されたチャネルについての複数のトーン性値を決定する方法であって:
・前記複数の結合されたチャネルの第一のチャネルのサンプルのブロックの対応するシーケンスについて変換係数の第一のシーケンスを決定する段階と;
・前記第一の変換係数のシーケンスに基づいて位相の第一のシーケンスを決定する段階と;
・前記第一の位相のシーケンスに基づいて第一の位相加速を決定する段階と;
・前記第一のチャネルについての第一のトーン性値を、前記第一の位相加速に基づいて決定する段階と;
・前記複数の結合されたチャネルの第二のチャネルについてのトーン性値を、前記第一の位相加速に基づいて決定する段階とを含む、
方法。 - SPXと称されるスペクトル拡張に基づくエンコーダにおける多チャネル・オーディオ信号の第一のチャネルについての帯域化トーン性値を決定する方法であって、前記SPXに基づくエンコーダは、前記第一のチャネルの低周波成分から前記第一のチャネルの高周波成分を近似するよう構成されており;前記第一のチャネルは、前記SPXに基づくエンコーダによって前記多チャネル・オーディオ信号の一つまたは複数の他のチャネルと結合されており;前記帯域化トーン性値はノイズ・ブレンディング因子を決定するために使用され;前記帯域化トーン性値は、ノイズ・ブレンディングの前の近似された高周波成分のトーン性を示し;当該方法は:
・結合の前に、前記第一のチャネルに基づいて複数の変換係数を与える段階と;
・前記複数の変換係数に基づいて前記帯域化トーン性値を決定する段階とを含む、
方法。 - オーディオ・デコード方法であって、
オーディオ信号の第一の周波数サブバンドについての第一の帯域化トーン性値を決定するよう構成されたシステムを有しており、高周波再構成を使ってオーディオ信号をエンコードするよう構成されているオーディオ・エンコーダから、エンコードされたオーディオ信号を受領する段階であって、
前記第一の帯域化トーン性値は、前記オーディオ信号の低周波成分に基づいて前記オーディオ信号の高周波成分を近似するために使用され、前記オーディオ信号は、前記第一の帯域化トーン性値および低周波数成分を含み、
前記システムは:
・前記オーディオ信号のサンプルのブロックに基づいて、対応する一組の周波数ビンにおける一組の変換係数を決定する段階と;
・前記一組の変換係数を使って前記一組の周波数ビンについての一組のビン・トーン性値をそれぞれ決定する段階と;
・前記第一の周波数サブバンド内にある前記一組の周波数ビンの二つ以上の対応する隣り合う周波数ビンについて前記一組のビン・トーン性値の二つ以上からなる第一の部分集合を組み合わせて、それにより前記第一の周波数サブバンドについての前記第一の帯域化トーン性値を与える段階とを実行するよう構成されており、
・前記システムはさらに、前記オーディオ信号のブロックの対応するシーケンスに基づいて、変換係数の組のシーケンスを決定するよう構成されており;
・特定の周波数ビンについて、変換係数の組の前記シーケンスは、特定の諸変換係数のシーケンスを含み;
・前記特定の周波数ビンについて前記ビン・トーン性値を決定することは:
・前記特定の諸変換係数のシーケンスに基づいて位相のシーケンスを決定し、
・前記位相のシーケンスに基づいて位相加速を決定することを含み;
・前記特定の周波数ビンについての前記ビン・トーン性値は前記位相加速の関数である、段階と;
受領されたオーディオ信号をデコードする段階と;
前記第一の帯域化トーン性値を使ってデコードされた低周波数成分に基づいて前記オーディオ信号の高周波数成分を再構成する段階とを含む、
オーディオ・デコード方法。 - 請求項13記載の方法段階を実行するよう構成されているオーディオ・デコーダ。
- プロセッサ上での実行のために、該プロセッサで実行されたときに請求項1ないし13のうちいずれか一項記載の方法段階を実行するために適応されている、ソフトウェア・プログラム。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP12156631.9 | 2012-02-23 | ||
EP12156631 | 2012-02-23 | ||
US201261680805P | 2012-08-08 | 2012-08-08 | |
US61/680,805 | 2012-08-08 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014558129A Division JP6046169B2 (ja) | 2012-02-23 | 2013-02-22 | 高周波オーディオ内容の効率的な復元のための方法およびシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016173597A true JP2016173597A (ja) | 2016-09-29 |
JP6334602B2 JP6334602B2 (ja) | 2018-05-30 |
Family
ID=49006324
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014558129A Active JP6046169B2 (ja) | 2012-02-23 | 2013-02-22 | 高周波オーディオ内容の効率的な復元のための方法およびシステム |
JP2016102645A Active JP6334602B2 (ja) | 2012-02-23 | 2016-05-23 | 高周波オーディオ内容の効率的な復元のための方法およびシステム |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014558129A Active JP6046169B2 (ja) | 2012-02-23 | 2013-02-22 | 高周波オーディオ内容の効率的な復元のための方法およびシステム |
Country Status (9)
Country | Link |
---|---|
US (2) | US9666200B2 (ja) |
EP (3) | EP3288033B1 (ja) |
JP (2) | JP6046169B2 (ja) |
KR (2) | KR101679209B1 (ja) |
CN (2) | CN107993673B (ja) |
BR (2) | BR122021018240B1 (ja) |
ES (1) | ES2568640T3 (ja) |
RU (1) | RU2601188C2 (ja) |
WO (1) | WO2013124445A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3435376A1 (en) | 2017-07-28 | 2019-01-30 | Fujitsu Limited | Audio encoding apparatus and audio encoding method |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR122021018240B1 (pt) * | 2012-02-23 | 2022-08-30 | Dolby International Ab | Método para codificar um sinal de áudio multicanal, método para decodificar um fluxo de bits de áudio codificado, sistema configurado para codificar um sinal de áudio, e sistema para decodificar um fluxo de bits de áudio codificado |
KR20150056770A (ko) * | 2012-09-13 | 2015-05-27 | 엘지전자 주식회사 | 손실 프레임 복원 방법 및 오디오 복호화 방법과 이를 이용하는 장치 |
WO2014115225A1 (ja) * | 2013-01-22 | 2014-07-31 | パナソニック株式会社 | 帯域幅拡張パラメータ生成装置、符号化装置、復号装置、帯域幅拡張パラメータ生成方法、符号化方法、および、復号方法 |
EP3742440B1 (en) | 2013-04-05 | 2024-07-31 | Dolby International AB | Audio decoder for interleaved waveform coding |
US9542955B2 (en) * | 2014-03-31 | 2017-01-10 | Qualcomm Incorporated | High-band signal coding using multiple sub-bands |
EP2963646A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal |
JP2016038435A (ja) | 2014-08-06 | 2016-03-22 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP6611042B2 (ja) * | 2015-12-02 | 2019-11-27 | パナソニックIpマネジメント株式会社 | 音声信号復号装置及び音声信号復号方法 |
WO2017125559A1 (en) | 2016-01-22 | 2017-07-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatuses and methods for encoding or decoding an audio multi-channel signal using spectral-domain resampling |
US10681679B1 (en) * | 2017-06-21 | 2020-06-09 | Nxp Usa, Inc. | Resource unit detection in high-efficiency wireless system |
US10187721B1 (en) * | 2017-06-22 | 2019-01-22 | Amazon Technologies, Inc. | Weighing fixed and adaptive beamformers |
CN107545900B (zh) * | 2017-08-16 | 2020-12-01 | 广州广晟数码技术有限公司 | 带宽扩展编码和解码中高频弦信号生成的方法和装置 |
TWI702594B (zh) | 2018-01-26 | 2020-08-21 | 瑞典商都比國際公司 | 用於音訊信號之高頻重建技術之回溯相容整合 |
CN109036457B (zh) * | 2018-09-10 | 2021-10-08 | 广州酷狗计算机科技有限公司 | 恢复音频信号的方法和装置 |
CN110267082B (zh) * | 2019-06-03 | 2020-05-05 | 李少锋 | 按语言最小单元自动切换音视频的播放控制方法及系统 |
CN116134834A (zh) * | 2020-12-31 | 2023-05-16 | 深圳市韶音科技有限公司 | 生成音频的方法和系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005104094A (ja) * | 2003-10-02 | 2005-04-21 | Sumitomo Heavy Ind Ltd | 成形機の監視装置及び監視方法 |
US20100094638A1 (en) * | 2007-11-21 | 2010-04-15 | Tae-Jin Lee | Apparatus and method for deciding adaptive noise level for bandwidth extension |
Family Cites Families (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR920008063B1 (ko) * | 1988-11-22 | 1992-09-22 | 마쯔시다덴기산교 가부시기가이샤 | 텔레비젼신호수신장치 |
US5699477A (en) * | 1994-11-09 | 1997-12-16 | Texas Instruments Incorporated | Mixed excitation linear prediction with fractional pitch |
US7012630B2 (en) | 1996-02-08 | 2006-03-14 | Verizon Services Corp. | Spatial sound conference system and apparatus |
US5913189A (en) * | 1997-02-12 | 1999-06-15 | Hughes Electronics Corporation | Voice compression system having robust in-band tone signaling and related method |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
JP3654117B2 (ja) * | 2000-03-13 | 2005-06-02 | ヤマハ株式会社 | 時間軸方向における楽音波形信号の伸縮方法 |
EP1423847B1 (en) * | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
US6978001B1 (en) | 2001-12-31 | 2005-12-20 | Cisco Technology, Inc. | Method and system for controlling audio content during multiparty communication sessions |
DE60326782D1 (de) * | 2002-04-22 | 2009-04-30 | Koninkl Philips Electronics Nv | Dekodiervorrichtung mit Dekorreliereinheit |
TWI288915B (en) * | 2002-06-17 | 2007-10-21 | Dolby Lab Licensing Corp | Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components |
KR100463417B1 (ko) | 2002-10-10 | 2004-12-23 | 한국전자통신연구원 | 상관함수의 최대값과 그의 후보값의 비를 이용한 피치검출 방법 및 그 장치 |
US20060100861A1 (en) | 2002-10-14 | 2006-05-11 | Koninkijkle Phillips Electronics N.V | Signal filtering |
US7318035B2 (en) * | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
CA2454296A1 (en) * | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
KR100608062B1 (ko) * | 2004-08-04 | 2006-08-02 | 삼성전자주식회사 | 오디오 데이터의 고주파수 복원 방법 및 그 장치 |
US7218240B2 (en) * | 2004-08-10 | 2007-05-15 | The Boeing Company | Synthetically generated sound cues |
US7545875B2 (en) | 2004-11-03 | 2009-06-09 | Nokia Corporation | System and method for space-time-frequency coding in a multi-antenna transmission system |
US7675873B2 (en) | 2004-12-14 | 2010-03-09 | Alcatel Lucent | Enhanced IP-voice conferencing |
US8082156B2 (en) * | 2005-01-11 | 2011-12-20 | Nec Corporation | Audio encoding device, audio encoding method, and audio encoding program for encoding a wide-band audio signal |
CN101180676B (zh) * | 2005-04-01 | 2011-12-14 | 高通股份有限公司 | 用于谱包络表示的向量量化的方法和设备 |
US7630882B2 (en) | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
JP4736812B2 (ja) * | 2006-01-13 | 2011-07-27 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
KR101240261B1 (ko) | 2006-02-07 | 2013-03-07 | 엘지전자 주식회사 | 이동통신 단말기의 영상 통화 장치 및 방법 |
CN101149918B (zh) * | 2006-09-22 | 2012-03-28 | 鸿富锦精密工业(深圳)有限公司 | 具练唱功能的声音处理装置 |
JP2008096567A (ja) | 2006-10-10 | 2008-04-24 | Matsushita Electric Ind Co Ltd | オーディオ符号化装置およびオーディオ符号化方法ならびにプログラム |
DE602008001787D1 (de) * | 2007-02-12 | 2010-08-26 | Dolby Lab Licensing Corp | Verbessertes verhältnis von sprachlichen zu nichtsprachlichen audio-inhalten für ältere oder hörgeschädigte zuhörer |
JP4871894B2 (ja) | 2007-03-02 | 2012-02-08 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法および復号方法 |
US8121535B2 (en) | 2007-03-02 | 2012-02-21 | Qualcomm Incorporated | Configuration of a repeater |
WO2009039897A1 (en) | 2007-09-26 | 2009-04-02 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V. | Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program |
US8509454B2 (en) | 2007-11-01 | 2013-08-13 | Nokia Corporation | Focusing on a portion of an audio scene for an audio signal |
US8223851B2 (en) | 2007-11-23 | 2012-07-17 | Samsung Electronics Co., Ltd. | Method and an apparatus for embedding data in a media stream |
CN101471072B (zh) * | 2007-12-27 | 2012-01-25 | 华为技术有限公司 | 高频重建方法、编码装置和解码装置 |
US8532998B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Selective bandwidth extension for encoding/decoding audio/speech signal |
US20110254913A1 (en) | 2008-12-24 | 2011-10-20 | Panasonic Corporation | Conferencing apparatus and communication setting method |
UA99878C2 (ru) * | 2009-01-16 | 2012-10-10 | Долби Интернешнл Аб | Гармоническое преобразование, усовершенствованное перекрестным произведением |
CN101527141B (zh) * | 2009-03-10 | 2011-06-22 | 苏州大学 | 基于径向基神经网络的耳语音转换为正常语音的方法 |
EP2239732A1 (en) * | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
US8223943B2 (en) | 2009-04-14 | 2012-07-17 | Citrix Systems Inc. | Systems and methods for computer and voice conference audio transmission during conference call via PSTN phone |
US8351589B2 (en) | 2009-06-16 | 2013-01-08 | Microsoft Corporation | Spatial audio for audio conferencing |
US8427521B2 (en) | 2009-10-21 | 2013-04-23 | At&T Intellectual Property I, L.P. | Method and apparatus for providing a collaborative workspace |
WO2011059432A1 (en) * | 2009-11-12 | 2011-05-19 | Paul Reed Smith Guitars Limited Partnership | Precision measurement of waveforms |
US8774787B2 (en) | 2009-12-01 | 2014-07-08 | At&T Intellectual Property I, L.P. | Methods and systems for providing location-sensitive conference calling |
SI2510515T1 (sl) | 2009-12-07 | 2014-06-30 | Dolby Laboratories Licensing Corporation | Dekodiranje večkanalnih avdio kodiranih bitnih prenosov s pomočjo adaptivne hibridne transformacije |
US20110182415A1 (en) | 2010-01-28 | 2011-07-28 | Jacobstein Mark Williams | Methods and apparatus for providing call conferencing services |
MX2012001696A (es) * | 2010-06-09 | 2012-02-22 | Panasonic Corp | Metodo de extension de ancho de banda, aparato de extension de ancho de banda, programa, circuito integrado, y aparato de descodificacion de audio. |
JP6010539B2 (ja) * | 2011-09-09 | 2016-10-19 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 符号化装置、復号装置、符号化方法および復号方法 |
BR122021018240B1 (pt) * | 2012-02-23 | 2022-08-30 | Dolby International Ab | Método para codificar um sinal de áudio multicanal, método para decodificar um fluxo de bits de áudio codificado, sistema configurado para codificar um sinal de áudio, e sistema para decodificar um fluxo de bits de áudio codificado |
-
2013
- 2013-02-22 BR BR122021018240-0A patent/BR122021018240B1/pt active IP Right Grant
- 2013-02-22 US US14/372,733 patent/US9666200B2/en active Active
- 2013-02-22 JP JP2014558129A patent/JP6046169B2/ja active Active
- 2013-02-22 EP EP17190541.7A patent/EP3288033B1/en active Active
- 2013-02-22 BR BR112014020562-0A patent/BR112014020562B1/pt active IP Right Grant
- 2013-02-22 WO PCT/EP2013/053609 patent/WO2013124445A2/en active Application Filing
- 2013-02-22 CN CN201711320050.8A patent/CN107993673B/zh active Active
- 2013-02-22 CN CN201380010593.3A patent/CN104541327B/zh active Active
- 2013-02-22 KR KR1020147023193A patent/KR101679209B1/ko active IP Right Grant
- 2013-02-22 ES ES13705503.4T patent/ES2568640T3/es active Active
- 2013-02-22 EP EP15196734.6A patent/EP3029672B1/en active Active
- 2013-02-22 RU RU2014134317/08A patent/RU2601188C2/ru active
- 2013-02-22 KR KR1020167031826A patent/KR101816506B1/ko active IP Right Grant
- 2013-02-22 EP EP13705503.4A patent/EP2817803B1/en active Active
-
2016
- 2016-05-23 JP JP2016102645A patent/JP6334602B2/ja active Active
-
2017
- 2017-04-21 US US15/494,195 patent/US9984695B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005104094A (ja) * | 2003-10-02 | 2005-04-21 | Sumitomo Heavy Ind Ltd | 成形機の監視装置及び監視方法 |
US20100094638A1 (en) * | 2007-11-21 | 2010-04-15 | Tae-Jin Lee | Apparatus and method for deciding adaptive noise level for bandwidth extension |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3435376A1 (en) | 2017-07-28 | 2019-01-30 | Fujitsu Limited | Audio encoding apparatus and audio encoding method |
US10896684B2 (en) | 2017-07-28 | 2021-01-19 | Fujitsu Limited | Audio encoding apparatus and audio encoding method |
Also Published As
Publication number | Publication date |
---|---|
EP3288033B1 (en) | 2019-04-10 |
EP3288033A1 (en) | 2018-02-28 |
US20150003632A1 (en) | 2015-01-01 |
EP3029672B1 (en) | 2017-09-13 |
EP2817803A2 (en) | 2014-12-31 |
CN107993673B (zh) | 2022-09-27 |
JP6334602B2 (ja) | 2018-05-30 |
JP6046169B2 (ja) | 2016-12-14 |
BR122021018240B1 (pt) | 2022-08-30 |
WO2013124445A2 (en) | 2013-08-29 |
EP2817803B1 (en) | 2016-02-03 |
RU2601188C2 (ru) | 2016-10-27 |
BR112014020562A2 (ja) | 2017-06-20 |
WO2013124445A3 (en) | 2013-11-21 |
CN107993673A (zh) | 2018-05-04 |
ES2568640T3 (es) | 2016-05-03 |
CN104541327B (zh) | 2018-01-12 |
US20170221491A1 (en) | 2017-08-03 |
RU2014134317A (ru) | 2016-04-20 |
JP2015508186A (ja) | 2015-03-16 |
EP3029672A2 (en) | 2016-06-08 |
EP3029672A3 (en) | 2016-06-29 |
KR20160134871A (ko) | 2016-11-23 |
KR101679209B1 (ko) | 2016-12-06 |
CN104541327A (zh) | 2015-04-22 |
KR20140116520A (ko) | 2014-10-02 |
US9984695B2 (en) | 2018-05-29 |
KR101816506B1 (ko) | 2018-01-09 |
BR112014020562B1 (pt) | 2022-06-14 |
US9666200B2 (en) | 2017-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6334602B2 (ja) | 高周波オーディオ内容の効率的な復元のための方法およびシステム | |
JP5539573B2 (ja) | Sbrビットストリームパラメータダウンミックス | |
JP2024147632A (ja) | パラメトリック・マルチチャネル・エンコードのための方法 | |
CN105900168B (zh) | 使用估计的空间参数的音频信号增强 | |
CA2944927C (en) | Apparatus and method for generating a plurality of spectral patterns | |
JP6061121B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、およびプログラム | |
US9230551B2 (en) | Audio encoder or decoder apparatus | |
EP2353160A1 (en) | An apparatus | |
AU2014314477B2 (en) | Frequency band table design for high frequency reconstruction algorithms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170808 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171030 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180403 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180426 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6334602 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |