JP2023082175A - 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 - Google Patents
臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 Download PDFInfo
- Publication number
- JP2023082175A JP2023082175A JP2023060972A JP2023060972A JP2023082175A JP 2023082175 A JP2023082175 A JP 2023082175A JP 2023060972 A JP2023060972 A JP 2023060972A JP 2023060972 A JP2023060972 A JP 2023060972A JP 2023082175 A JP2023082175 A JP 2023082175A
- Authority
- JP
- Japan
- Prior art keywords
- subband
- prediction
- signal
- samples
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 117
- 230000005236 sound signal Effects 0.000 claims abstract description 96
- 230000006870 function Effects 0.000 claims description 58
- 230000004044 response Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 2
- 238000000926 separation method Methods 0.000 abstract description 6
- 238000000354 decomposition reaction Methods 0.000 description 71
- 230000000737 periodic effect Effects 0.000 description 42
- 238000005311 autocorrelation function Methods 0.000 description 20
- 230000008569 process Effects 0.000 description 19
- 230000015572 biosynthetic process Effects 0.000 description 18
- 238000003786 synthesis reaction Methods 0.000 description 18
- 239000011159 matrix material Substances 0.000 description 17
- 238000001228 spectrum Methods 0.000 description 15
- 230000007774 longterm Effects 0.000 description 11
- 238000013139 quantization Methods 0.000 description 11
- 238000007493 shaping process Methods 0.000 description 11
- 230000001747 exhibiting effect Effects 0.000 description 8
- 238000013459 approach Methods 0.000 description 5
- 230000001364 causal effect Effects 0.000 description 5
- 239000002131 composite material Substances 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 5
- 230000003595 spectral effect Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000001934 delay Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000005314 correlation function Methods 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000000116 mitigating effect Effects 0.000 description 2
- 239000011295 pitch Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000005309 stochastic process Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 235000019580 granularity Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/093—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/30—Circuit design
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/30—Circuit design
- G06F30/32—Circuit design at the digital level
- G06F30/327—Logic synthesis; Behaviour synthesis, e.g. mapping logic, HDL to netlist, high-level language to RTL or netlist
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/08—Probabilistic or stochastic CAD
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Geometry (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Magnetic Resonance Imaging Apparatus (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
- Measurement Of Radiation (AREA)
- Design And Manufacture Of Integrated Circuits (AREA)
Abstract
Description
によって得られ、信号は
によって復元される。過程x(t)のサブバンド・サンプル〈x,wα〉はランダム変数であり、その共変行列Rαβは次式のようにして自己相関関数r(τ)によって決定される。
予測係数が式(7)を満たすとき、式(6)の右辺はRαα-ΣβRαβcβに帰着する。正規方程式(7)は、たとえばレヴィンソン・ダービン(Levinson-Durbin)アルゴリズムを使って、効率的な仕方で解くことができる。
数値的な考察により、方程式過程の上記自己相関関数をもつ純粋なマルチ正弦過程を、自己相関関数
をもつ緩和されたマルチ正弦過程で置き換えることができる。ここで、ε>0は比較的小さな緩和パラメータである。後者のモデルは、インパルス関数のない厳密に正のPSDを与える。
1.単一の基本周波数Ω:S={Ων:ν=1,2,…}
2.M個の基本周波数Ω0、Ω1、…、ΩM-1:S={Ωkν:ν=1,2,…, k=0,1,…,M-1}
3.シングル・サイドのバンド・シフトされた基本周波数Ω,θ:S={Ω(ν+θ):ν=1,2,…}
4.やや非調和的なモデル:Ω,a:S={Ων・(1+aν2)1/2: ν=1,2,…} ここで、aがモデルの非調和成分を記述する。
と書ける。
式(14)は、白色ノイズz(t)を入力される単一の遅延ループによって定義される過程、すなわちモデル過程
の自己相関関数にも対応する。これは、単一の基本周波数Ωを示す周期的過程は時間領域におけるT=2π/Ωである遅延に対応することを意味する。
ここで、コサイン変調されたフィルタバンクの場合、
である。窓関数v(t)は実数値であり、偶であると想定される。変調規則の軽微な変化は別として、これは時間きざみ1/LでのサンプリングでL個のサブバンドをもつ、MDCT(Modified Discrete Cosine Transforms[修正離散コサイン変換])、QMF(Quadrature Mirror Filter[直交ミラー・フィルタ])およびELT(Extended Lapped Transforms[拡張重複変換])といった一連のきわめて重要な事例をカバーする。この窓は、継続時間または長さが有限であり、区間[-K/2,K/2]に含まれる支持集合をもつとされる。ここで、Kは重複変換の重複因子であり、Kは窓関数の長さを示す。
式(20)および(21)から、カーネルκν(τ)は|τ|>Kについては0になり、フィルタバンク窓v(t)の典型的な選択については|ν|の関数として急速な減衰をもつことが見て取れる。結果として、ν=n+m+1に関わる式(19)の第二項は、最も低い諸サブバンドについて以外は、しばしば無視できる。
を用いて、Rn,k,m,l=Rn,m[k-l]を得ることができる。
であることがわかる。ここで^付きのUn,m(ω)はUn,m(τ)のフーリエ変換であり、n,mはサブバンド・インデックスを同定し、λは時間スロット・ラグ(λ=k-l)を表わす。式(23)の表現は次のように書き直せる。
重要な観察は、式(24)の第一項は本質的には周波数シフトに対して不変属性をもつということである。式(24)の第二項が無視され、P(ω)が整数νかけるサブバンド間隔πによりP(ω-πν)にシフトされたら、共変において対応するシフトが見出されるRn,m[λ]=±Rn-ν,m-ν[λ]。ここで、符号は時間ラグλの(整数)値に依存する。これは、一般のフィルタバンクの場合に比べ、変調構造をもつフィルタバンクを使うことの利点を反映する。
式(25)は、サブバンド共変行列Rn,mを決定する効率的な手段を提供する。サブバンド・サンプル〈x,wp,0〉は、考えられる周波数によって著しく影響されると想定される、まわりのサブバンド・サンプルの集合{〈x,wn,k〉:(n,k)∈B}によって信頼できる仕方で予測されることができる。絶対周波数ξは、サブバンドの中心周波数π(p+(1/2))に対して相対的な形で、ξ=π(p+(1/2)+f)として表現できる。ここで、pは周波数ξを含むサブバンドのサブバンド・インデックスであり、fは-0.5から+0.5の間の値を取り、サブバンドpの中心周波数に対する周波数ξの位置を示す規格化された周波数パラメータである。サブバンド共変行列Rn,mを決定してしまうと、サンプル・インデックスkにおけるサブバンドn内のサブバンド・サンプルを推定するためにサンプル・インデックスlにおけるサブバンドm内のサブバンド・サンプルに適用される予測器係数cm[l]は、正規方程式(7)を解くことによって見出される。正規方程式(7)は今の場合については次のように書ける。
式(27)の解は、cp[-1]=2cos(ξ), cp[-2]=-1によって与えられ、これは周波数ξ=π(p+(1/2)+f)が
となるように選ばれるのでない限り、一意的である。式(6)による平方予測誤差の平均値が0になることがわかる。結果として、正弦波予測は、式(25)の近似の限りにおいて完璧である。周波数シフトに対する不変属性はここでは、定義ξ=π(p+(1/2)+f)を使うと、予測係数cp[-1]が、規格化された周波数fを用いてcp[-1]=-2(-1)psin(πf)と書き直すことができるという事実によって示される。これは、予測係数は特定のサブバンド内の規格化された周波数fにのみ依存することを意味する。しかしながら、予測係数の絶対値はサブバンド・インデックスpとは独立である。
式(28)のどの解も、式(6)に基づく平方予測誤差の平均値0につながることがわかる。式(28)の無限個の解の間で一つの解を選択するための可能な戦略は、予測係数の平方の和を最小にすることである。これは、次式で与えられる係数につながる。
に対応する緩和された正弦波モデルr(τ)=exp(-ε|τ|)cos(ξτ)を挿入することにより、数値計算により図3の3×3の予測行列要素が得られる。予測行列要素は、正弦波窓関数v(t)=cos(πt/2)をもつ重複K=2の場合において奇数サブバンドpの場合に、規格化された周波数f∈[-1/2,1/2]の関数として示されている。
な、規格化された周波数fを知っての予測器係数の決定を許容する、あらかじめ決定されたルックアップテーブル(たとえば図3に示されるようなもの)が提供されることができる。
によって与えられる。
重要な観察は、T≧2Kであれば、|τ|>KについてはUn,m(τ)=0であるから、各λについて式(31)の0でない項は高々一つであるということである。時間スロット直径D=|J|≦T-Kをもつ予測マスク支持集合B=I×Jを選ぶことによって、(n,k),(m,l)∈Bが|k-l|≦T-Kを含意し、よって式(31)の前記単一の項はq=0についての項であることが観察される。よって、Rn,m[k-l]=Un,m(k-l)となり、これは直交波形の内積であり、n=mかつk=lでない限り0になる。全体として、正規方程式(7)は次のようになる。
ここで、式(19)からの明示的な表現が代入されることができる。この場合についての予測マスク支持集合の幾何構造は、図2の予測マスク205の予測マスク支持集合の見え方をもつことができる。式(6)によって与えられる平方予測誤差の平均値は、近似する波形の補集合
によって張られる空間上へのup(t+T)の投影の平方ノルムに等しい。
実際、Tおよび十分大きなサブバンド・インデックスpを与えられると、式(30)に基づく周期的モデルは、シフト・パラメータθの好適な選択により、式(34)に基づくシフトされたモデルによってよい近似で復元されることができる。n=p+νおよびm=p+μとして式(34)を式(24)に代入して(ここで、νおよびμは予測マスク支持集合のサブバンドpのまわりのサブバンド・インデックスを定義する)、フーリエ解析に基づいて操作すると、共変行列について次の式が得られる。
見て取れるように、式(35)は、目標サブバンド・インデックスpには因子(-1)pλを通じてのみ依存する。大きな周期Tおよび小さな時間的ラグλの場合、l=0についての項のみが式(35)に寄与し、ここでもまた共変行列が恒等行列であることびわかる。すると、(p,-T)のまわりの好適な予測マスク支持集合Bについての正規方程式(26)の右辺は、予測係数を直接
として与える。これは、シフトθ=-π(p+(1/2))/Ωの正準的な選択を用いて、式(19)ないし(33)の第一項の寄与を復元する。
となることがわかる。表においてパラメータθに与えられた役割をφに与えることによって、等価な(T,φ)平面において本質的に分離可能な構造が得られる。サブバンドおよび時間スロット・インデックスに依存する符号の変化を除いて、Tへの依存性は第一のゆっくり変化する因子に含まれ、φへの依存性は式(37)における1周期的な第二の因子に含まれる。
〔態様1〕
オーディオ信号の第一のサブバンド内の第一のサブバンド信号の第一のサンプル(615)を推定する方法であって、前記オーディオ信号の前記第一のサブバンド信号は、前記オーディオ信号からそれぞれ複数のサブバンドにおける複数のサブバンド信号を提供する複数の分解フィルタを有する分解フィルタバンク(612)を使って決定され、当該方法は:
・信号モデルのモデル・パラメータ(613)を決定する段階と;
・前記第一のサブバンド信号から導出された第一の復号されたサブバンド信号の、前のサンプル(614)に適用されるべき予測係数を、前記信号モデルに基づき、前記モデル・パラメータ(613)に基づき、かつ前記分解フィルタバンク(612)に基づいて決定する段階であって、前記前のサンプル(614)の時間スロットは前記第一のサンプル(615)の時間スロットより前である、段階と;
・前記予測係数を前記前のサンプル(614)に適用することによって前記第一のサンプル(615)の推定値を決定する段階とを含む、
方法。
〔態様2〕
・前記信号モデルが、一つまたは複数の正弦波モデル成分を含み、
・前記モデル・パラメータが前記一つまたは複数の正弦波モデル成分の周波数を示す、
態様1記載の方法。
〔態様3〕
前記モデル・パラメータが、マルチ正弦波信号モデルの基本周波数Ωを示す、態様2記載の方法。
〔態様4〕
・前記マルチ正弦波信号モデルが周期的信号成分を有し、
・前記周期的信号成分が複数の正弦波成分を含み、
・前記複数の正弦波成分が前記基本周波数Ωの倍数である周波数をもつ、
態様3記載の方法。
〔態様5〕
当該方法が前記信号モデルの複数のモデル・パラメータ(613)を含む、態様1ないし4のうちいずれか一項記載の方法。
〔態様6〕
・前記信号モデルが、複数の周期的信号成分を有しており、
・前記複数のモデル・パラメータは前記複数の周期的信号成分の複数の基本周波数Ω0、Ω1、……、ΩM-1を示す、
態様5記載の方法。
〔態様7〕
前記複数の信号モデル・パラメータの一つまたは複数は、周期的信号モデルからの前記信号モデルのシフトおよび/または逸脱を示す、態様5または6記載の方法。
〔態様8〕
前記モデル・パラメータを決定する段階が、前記モデル・パラメータおよび予測誤差信号を示す受領されたビットストリームから前記モデル・パラメータを抽出することを含む、態様1ないし7のうちいずれか一項記載の方法。
〔態様9〕
・前記モデル・パラメータを決定する段階が、平方された予測誤差信号の平均値が小さくなるよう前記モデル・パラメータを決定することを含み、
・前記予測誤差信号は、前記第一のサンプルと前記第一のサンプルの前記推定値との間の差に基づいて決定される、
態様1ないし7のうちいずれか一項記載の方法。
〔態様10〕
前記平方予測誤差信号の前記平均値が、前記第一のサブバンド信号の複数の相続く第一のサンプルに基づいて決定される、態様9記載の方法。
〔態様11〕
・前記予測係数を決定する段階が、ルックアップテーブルまたは解析関数を使って前記予測係数を決定することを含み、
・前記ルックアップテーブルまたは前記解析関数は、前記モデル・パラメータから導出されるあるパラメータの関数として前記予測係数を与え、
・前記ルックアップテーブルまたは前記解析関数は前記信号モデルに基づき、かつ前記分解フィルタバンクに基づいてあらかじめ決定される、
態様1ないし10のうちいずれか一項記載の方法。
〔態様12〕
・前記分解フィルタバンクが変調された構造を有し、
・前記予測係数の絶対値が前記第一のサブバンドのインデックス番号と独立である、
態様11記載の方法。
〔態様13〕
・前記モデル・パラメータが、マルチ正弦波信号モデルの基本周波数Ωを示し、
・前記予測係数を決定する段階が、前記第一のサブバンド内にある前記基本周波数Ωの倍数を決定することを含む、
態様11または12記載の方法。
〔態様14〕
前記予測係数を決定する段階が、
・前記基本周波数Ωの倍数が前記第一のサブバンド内にある場合、前記基本周波数Ωの前記倍数の、前記第一のサブバンドの中心周波数からの相対オフセットを決定し、
・前記基本周波数Ωのどの倍数も前記第一のサブバンド内にない場合、前記予測係数を0に設定することを含む、
態様13記載の方法。
〔態様15〕
・前記ルックアップテーブルまたは前記解析関数は、前記予測係数をあるサブバンドの中心周波数からの可能な相対オフセットの関数として与え、
・前記予測係数を決定する段階は、前記予測係数を、決定された相対オフセットを使って前記ルックアップテーブルまたは前記解析関数に基づいて決定することを含む、
態様14記載の方法。
〔態様16〕
・前記ルックアップテーブルは、限られた数の可能な相対オフセットについての限られた数のエントリーを含み、
・前記予測係数を決定する段階は、決定された相対オフセットを、前記限られた数の可能な相対オフセットからの最も近い可能な相対オフセットに丸めることを含む、
態様15記載の方法。
〔態様17〕
前記予測係数を決定する段階は、
・前記モデル・パラメータに基づいて複数のルックアップテーブルのうちの一つを選択し、
・前記予測係数を、前記複数のルックアップテーブルのうちの選択された一つに基づいて決定することを含む、
態様13ないし16のうちいずれか一項記載の方法。
〔態様18〕
・前記モデル・パラメータが周期性Tを示し、
・前記複数のルックアップテーブルが、周期性Tの異なる値についてのルックアップテーブルを含み、
・当該方法が、選択されたルックアップテーブルを、前記モデル・パラメータによって示される周期性Tについてのルックアップテーブルとして決定することを含む、
態様17記載の方法。
〔態様19〕
・前記複数のルックアップテーブルは、[Tmin,Tmax]の範囲内の所定のきざみサイズΔTでの周期性Tの異なる値についてのルックアップテーブルを含み、
・Tminは、T<Tminについては前記オーディオ信号が単一の正弦波モデル成分を有する信号モデルを使ってモデル化できるようなものである、および/または
・Tmaxは、T>Tmaxについては周期性TmaxないしTmax+1についてのルックアップテーブルが実質的に周期性Tmax-1ないしTmaxについてのルックアップテーブルに対応するようなものである、
態様18記載の方法。
〔態様20〕
周期性T>Tmaxを示すモデル・パラメータについて、
・残差周期性Trが[Tmax-1,Tmax]の範囲内にはいるようにTからある整数値を減算することにより、残差周期性Trを決定する段階と;
・前記予測係数を決定するためのルックアップテーブルを、残差周期性Trについてのルックアップテーブルとして決定する段階とをさらに含む、
態様19記載の方法。
〔態様21〕
周期性T<Tminを示すモデル・パラメータについて、
・前記予測係数を決定するためのルックアップテーブルを、周期性Tminについてのルックアップテーブルとして選択する段階と;
・前記予測係数を与える選択されたルックアップテーブルのエントリーを同定するためのルックアップ・パラメータを、比Tmin/Tを使ってスケーリングする段階と;
・前記予測係数を、選択されたルックアップテーブルおよびスケーリングされたルックアップ・パラメータを使って決定する段階とをさらに含む、
態様19ないし20のうちいずれか一項記載の方法。
〔態様22〕
・複数の予測マスク・サポート・サブバンドにおける複数の前のサンプルを示す予測マスク(203、205)を決定する段階であって、前記複数の予測マスク・サポート・サブバンドは前記複数のサブバンドのうちの、前記第一のサブバンドとは異なる少なくとも一つを含む、段階と;
・前記複数の前のサンプルに適用されるべき複数の予測係数を、前記信号モデルに基づき、前記モデル・パラメータに基づき、かつ前記分解フィルタバンクに基づいて決定する段階と;
・前記複数の予測係数を前記複数の前のサンプルにそれぞれ適用することによって前記第一のサンプルの推定値を決定する段階とをさらに含む、
態様1ないし21のうちいずれか一項記載の方法。
〔態様23〕
前記第一のサンプルの推定値を決定する段階が、前記複数のそれぞれの予測係数によって重みをかけられた前記複数の前のサンプルの和を決定することを含む、態様22記載の方法。
〔態様24〕
・前記複数のサブバンドが等しいサブバンド間隔をもち、
・前記第一のサブバンドが前記複数のサブバンドのうちの一つである、
態様1ないし23のうちいずれか一項記載の方法。
〔態様25〕
・前記分解フィルタバンクの前記分解フィルタは互いにシフト不変である;および/または
・前記分解フィルタバンクの前記分解フィルタは共通の窓関数を含む;および/または
・前記分解フィルタバンクの前記分解フィルタは前記共通の窓関数の異なる変調をされたバージョンを含む;および/または
・前記共通の窓関数はコサイン関数を使って変調される;および/または
・前記共通の窓関数は有限の継続時間Kをもつ;および/または
・前記分解フィルタバンクの前記分解フィルタは直交基底をなす;および/または
・前記分解フィルタバンクの前記分解フィルタは正規直交基底をなす;および/または
・前記分解フィルタバンクはコサイン変調されたフィルタバンクを含む;および/または
・前記分解フィルタバンクは臨界サンプリングされたフィルタバンクである;および/または
・前記分解フィルタバンクは重複変換を含む;および/または
・前記分解フィルタバンクは、MDCT、QMF、ELT変換のうちの一つまたは複数を含む;および/または
・前記分解フィルタバンクは変調構造を含む、
態様1ないし24のうちいずれか一項記載の方法。
〔態様26〕
オーディオ信号の第一のサブバンド内の第一のサブバンド信号の第一のサンプルを推定する方法であって、前記オーディオ信号の前記第一のサブバンド信号は、前記オーディオ信号からそれぞれ複数のサブバンドにおける複数のサブバンド信号を提供する複数の分解フィルタを有する分解フィルタバンクを使って決定され、当該方法は:
・複数の予測マスク・サポート・サブバンドにおける複数の前のサンプルを示す予測マスク(203、205)を決定する段階であって、前記複数の予測マスク・サポート・サブバンドは前記複数のサブバンドのうちの、前記第一のサブバンドとは異なる少なくとも一つを含む、段階と;
・前記複数の前のサンプルに適用されるべき複数の予測係数を決定する段階と;
・前記複数の予測係数を前記複数の前のサンプルにそれぞれ適用することによって前記第一のサンプルの推定値を決定する段階とを含む、
方法。
〔態様27〕
前記複数の予測マスク・サポート・サブバンドは、
・前記第一のサブバンドを含む;および/または
・前記第一のサブバンドに直接隣接する前記複数のサブバンドのうちの一つまたは複数を含む、
態様26記載の方法。
〔態様28〕
・当該方法がさらに、信号モデルのモデル・パラメータを決定する段階を含み;
・前記複数の予測係数を決定する段階が、前記複数の予測係数を、前記信号モデルに基づき、前記モデル・パラメータに基づき、かつ前記分解フィルタバンクに基づいて決定することを含む、
態様26または27記載の方法。
〔態様29〕
・前記複数の予測係数を決定する段階が、ルックアップテーブルまたは解析関数を使って前記複数の予測係数を決定することを含み、
・前記ルックアップテーブルまたは前記解析関数は、前記モデル・パラメータから導出されるあるパラメータの関数として前記複数の予測係数を与え、
・前記ルックアップテーブルまたは前記解析関数は前記信号モデルに基づき、かつ前記分解フィルタバンクに基づいてあらかじめ決定される、
態様28記載の方法。
〔態様30〕
・オーディオ信号をエンコードする方法であって、
・複数の分解フィルタを有する分解フィルタバンクを使って前記オーディオ信号から複数のサブバンド信号を決定する段階と;
・態様1ないし29のうちいずれか一項記載の方法を使って前記複数のサブバンド信号のサンプルを推定し、それにより複数の推定されたサブバンド信号を与える段階と;
・複数の予測誤差サブバンド信号のサンプルを、前記複数のサブバンド信号の対応するサンプルおよび前記複数の推定されたサブバンド信号のサンプルに基づいて決定する段階と;
・前記複数の予測誤差サブバンド信号を量子化する段階と;
・前記複数の量子化された予測誤差サブバンド信号を示し、前記複数の推定されたサブバンド信号のサンプルを推定するために使われた一つまたは複数のパラメータを示す
エンコードされたオーディオ信号を生成する段階とを含む、
方法。
〔態様31〕
エンコードされたオーディオ信号をデコードする方法であって、前記エンコードされたオーディオ信号は、複数の量子化された予測誤差サブバンド信号と、複数の推定されたサブバンド信号のサンプルを推定するために使われるべき一つまたは複数のパラメータとを示し、当該方法は、
・前記複数の量子化された予測誤差サブバンド信号を量子化解除して、複数の量子化解除された予測誤差サブバンド信号を与える段階と:
・態様1ないし29のうちいずれか一項記載の方法を使って前記複数の推定されたサブバンド信号のサンプルを推定する段階と;
・複数のデコードされたサブバンド信号のサンプルを、前記複数の推定されたサブバンド信号の対応するサンプルおよび前記複数の量子化解除された予測誤差サブバンド信号のサンプルに基づいて決定する段階と;
・複数の合成フィルタを含む合成フィルタバンクを使って、前記複数のデコードされたサブバンド信号から、デコードされたオーディオ信号を決定する段階とを含む、
方法。
〔態様32〕
オーディオ信号の第一のサブバンド信号の一つまたは複数の第一のサンプルを推定するよう構成されたシステム(103、105)であって、前記オーディオ信号の前記第一のサブバンド信号は、前記オーディオ信号から複数のサブバンド信号を提供する複数の分解フィルタを有する分解フィルタバンクを使って決定され、当該システムは、
・信号モデルのモデル・パラメータを決定するよう構成され、前記第一のサブバンド信号から導出された第一のデコードされたサブバンド信号の一つまたは複数の前のサンプルに適用されるべき一つまたは複数の予測係数を決定するよう構成されている予測器計算器であって、前記一つまたは複数の予測係数は、前記信号モデルに基づき、前記モデル・パラメータに基づき、かつ前記分解フィルタバンクに基づいて決定され、前記一つまたは複数の前のサンプルの時間スロットは前記一つまたは複数の第一のサンプルの時間スロットより前である、予測器計算器と;
・前記一つまたは複数の予測係数を前記一つまたは複数の前のサンプルに適用することによって前記一つまたは複数の第一のサンプルの推定値を決定するよう構成されたサブバンド予測器を有する、
システム。
〔態様33〕
オーディオ信号の第一のサブバンド信号の一つまたは複数の第一のサンプルを推定するよう構成されたシステム(103、105)であって、前記第一のサブバンド信号は第一のサブバンドに対応し、前記第一のサブバンド信号は、それぞれ前記複数のサブバンド内の複数のサブバンド信号を提供する複数の分解フィルタを有する分解フィルタバンクを使って決定され、当該システムは、
・複数の予測マスク・サポート・サブバンドにおいて複数の前のサンプルを示す予測マスク(203、205)を決定するよう構成された予測器計算器であって、前記複数の予測マスク・サポート・サブバンドは前記複数のサブバンドのうち、前記第一のサブバンドとは異なる少なくとも一つを含み、前記予測器計算器はさらに、前記複数の前のサンプルに適用されるべき複数の予測係数を決定するよう構成されている、予測器計算器と;
・前記複数の予測係数を前記複数の前のサンプルにそれぞれ適用することによって前記一つまたは複数の第一のサンプルの推定値を決定するよう構成されたサブバンド予測器とを有する、
システム。
〔態様34〕
オーディオ信号をエンコードするよう構成されたオーディオ・エンコーダであって、
・複数の分解フィルタを使って前記オーディオ信号から複数のサブバンド信号を決定するよう構成された分解フィルタバンクと;
・前記複数のサブバンド信号のサンプルを推定し、それにより複数の推定されたサブバンド信号を与えるよう構成されている、態様32ないし33のうちいずれか一項記載のシステムと;
・複数の予測誤差サブバンド信号のサンプルを、前記複数のサブバンド信号および前記複数の推定されたサブバンド信号の対応するサンプルに基づいて決定するよう構成された差分ユニットと;
・前記複数の予測誤差サブバンド信号を量子化するよう構成された量子化ユニットと;
・前記複数の量子化された予測誤差サブバンド信号と、前記複数の推定されたサブバンド信号のサンプルを推定するために使われた一つまたは複数のパラメータとを示すエンコードされたオーディオ信号を生成するよう構成されたビットストリーム生成ユニットとを有する、
オーディオ・エンコーダ。
〔態様35〕
エンコードされたオーディオ信号をデコードするよう構成されたオーディオ・デコーダであって、前記エンコードされたオーディオ信号は、前記複数の量子化された予測誤差サブバンド信号と、複数の推定されたサブバンド信号のサンプルを推定するために使われた一つまたは複数のパラメータとを示し、当該オーディオ・デコーダは、
・前記複数の量子化された予測誤差サブバンド信号を量子化解除して、それにより複数の量子化解除された予測誤差サブバンド信号を与えるよう構成された逆量子化器と;
・前記複数の推定されたサブバンド信号のサンプルを推定するよう構成されている、態様32または33記載のシステムと;
・前記複数の推定されたサブバンド信号の対応するサンプルに基づき、かつ前記複数の量子化解除された予測誤差サブバンド信号のサンプルに基づいて、複数のデコードされたサブバンド信号のサンプルを決定するよう構成されている加算ユニットと;
・複数の合成フィルタ使って、前記複数のデコードされたサブバンド信号から、デコードされたオーディオ信号を決定するよう構成された合成フィルタバンクとを有する、
オーディオ・デコーダ。
Claims (3)
- サブバンド信号の現在のサンプルを決定するための、オーディオ信号処理装置によって実行される方法であって、前記サブバンド信号は、オーディオ信号のサブバンド領域表現の複数のサブバンドのうちの一つに対応し、当該方法は:
前記サブバンド信号の予備的なサンプルを受領する段階と;
モデル・パラメータを含む信号モデル・データを決定する段階と;
前記サブバンド信号の前のサンプルに適用されるべき予測係数を決定する段階であって、前記予測係数は、前記モデル・パラメータに応答してルックアップテーブルおよび/または解析関数を使って決定される、段階と;
前記サブバンド信号の推定されるサンプルを決定する段階であって、前記推定されるサンプルを決定することは、前記予測係数を前記前のサンプルに適用することを含む、段階と;
前記サブバンド信号の前記推定されるサンプルを前記サブバンド信号の前記予備的なサンプルと組み合わせて、前記サブバンド信号の現在のサンプルを決定する段階とを含む、
方法。 - サブバンド信号の現在のサンプルを決定するように構成されたオーディオ信号処理装置であって、前記サブバンド信号は、オーディオ信号のサブバンド領域表現の複数のサブバンドのうちの一つに対応し、当該オーディオ信号処理装置は:
前記サブバンド信号の予備的なサンプルを受領する段階と;
モデル・パラメータを含む信号モデル・データを決定する段階と;
前記サブバンド信号の前のサンプルに適用されるべき予測係数を決定する段階であって、前記予測係数は、前記モデル・パラメータに応答してルックアップテーブルおよび/または解析関数を使って決定される、段階と;
前記サブバンド信号の推定されるサンプルを決定する段階であって、前記サブバンド信号の前記推定されるサンプルを決定することは、前記予測係数を前記前のサンプルに適用することを含む、段階と;
前記サブバンド信号の前記推定されるサンプルを前記サブバンド信号の前記予備的なサンプルと組み合わせて、前記サブバンド信号の現在のサンプルを決定する段階とを実行するように構成されている、
装置。 - コンピュータによって実行されたときに該コンピュータに請求項1記載の方法を実行させる命令のシーケンスを有する非一時的なコンピュータ可読記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2024000944A JP2024038279A (ja) | 2013-01-08 | 2024-01-09 | 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 |
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361750052P | 2013-01-08 | 2013-01-08 | |
US61/750,052 | 2013-01-08 | ||
US201361875528P | 2013-09-09 | 2013-09-09 | |
US61/875,528 | 2013-09-09 | ||
JP2019171286A JP7053545B6 (ja) | 2013-01-08 | 2019-09-20 | 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 |
JP2021212121A JP7258118B2 (ja) | 2013-01-08 | 2021-12-27 | 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021212121A Division JP7258118B2 (ja) | 2013-01-08 | 2021-12-27 | 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024000944A Division JP2024038279A (ja) | 2013-01-08 | 2024-01-09 | 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023082175A true JP2023082175A (ja) | 2023-06-13 |
JP7418637B2 JP7418637B2 (ja) | 2024-01-19 |
Family
ID=50000954
Family Applications (7)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015551193A Active JP6173484B2 (ja) | 2013-01-08 | 2014-01-07 | 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 |
JP2017131120A Active JP6530787B2 (ja) | 2013-01-08 | 2017-07-04 | 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 |
JP2019093724A Active JP6592634B2 (ja) | 2013-01-08 | 2019-05-17 | 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 |
JP2019171286A Active JP7053545B6 (ja) | 2013-01-08 | 2019-09-20 | 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 |
JP2021212121A Active JP7258118B2 (ja) | 2013-01-08 | 2021-12-27 | 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 |
JP2023060972A Active JP7418637B2 (ja) | 2013-01-08 | 2023-04-04 | 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 |
JP2024000944A Pending JP2024038279A (ja) | 2013-01-08 | 2024-01-09 | 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 |
Family Applications Before (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015551193A Active JP6173484B2 (ja) | 2013-01-08 | 2014-01-07 | 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 |
JP2017131120A Active JP6530787B2 (ja) | 2013-01-08 | 2017-07-04 | 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 |
JP2019093724A Active JP6592634B2 (ja) | 2013-01-08 | 2019-05-17 | 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 |
JP2019171286A Active JP7053545B6 (ja) | 2013-01-08 | 2019-09-20 | 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 |
JP2021212121A Active JP7258118B2 (ja) | 2013-01-08 | 2021-12-27 | 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024000944A Pending JP2024038279A (ja) | 2013-01-08 | 2024-01-09 | 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 |
Country Status (20)
Country | Link |
---|---|
US (8) | US9659567B2 (ja) |
EP (5) | EP3176784B1 (ja) |
JP (7) | JP6173484B2 (ja) |
KR (1) | KR101634979B1 (ja) |
CN (2) | CN107452392B (ja) |
AU (6) | AU2014204954B2 (ja) |
BR (2) | BR122017000308B1 (ja) |
CA (8) | CA3012134C (ja) |
DK (1) | DK2943953T3 (ja) |
ES (3) | ES2769845T3 (ja) |
HK (1) | HK1213081A1 (ja) |
HU (1) | HUE032831T2 (ja) |
IL (10) | IL309437A (ja) |
IN (1) | IN2015MN01874A (ja) |
MX (5) | MX362990B (ja) |
MY (2) | MY173781A (ja) |
PL (1) | PL2943953T3 (ja) |
RU (2) | RU2742460C2 (ja) |
SG (2) | SG10201709631PA (ja) |
WO (1) | WO2014108393A1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2559899C2 (ru) | 2010-04-09 | 2015-08-20 | Долби Интернешнл Аб | Стереофоническое кодирование на основе mdct с комплексным предсказанием |
EP3671738B1 (en) | 2013-04-05 | 2024-06-05 | Dolby International AB | Audio encoder and decoder |
KR102072365B1 (ko) | 2013-04-05 | 2020-02-03 | 돌비 인터네셔널 에이비 | 고급 양자화기 |
JP6543838B2 (ja) * | 2014-08-28 | 2019-07-17 | 株式会社緑野リサーチ | 位相撮影装置およびその復元方法 |
WO2016142002A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
EP3454336B1 (en) | 2017-09-12 | 2020-11-04 | Dolby Laboratories Licensing Corporation | Packet loss concealment for critically-sampled filter bank-based codecs using multi-sinusoidal detection |
CN110068771B (zh) * | 2019-05-28 | 2020-02-07 | 山东大学 | 基于输出响应重构的高精度电池模型参数辨识方法及系统 |
CN110849971B (zh) * | 2019-11-21 | 2021-05-18 | 西南交通大学 | 基于双指数窗函数法的结构模态参数识别方法 |
CN113452472B (zh) * | 2020-03-26 | 2024-05-31 | 瑞昱半导体股份有限公司 | 无线信号的分组检测方法及其系统 |
US11348594B2 (en) | 2020-06-11 | 2022-05-31 | Qualcomm Incorporated | Stream conformant bit error resilience |
CN112259116B (zh) * | 2020-10-14 | 2024-03-15 | 北京字跳网络技术有限公司 | 一种音频数据的降噪方法、装置、电子设备及存储介质 |
CN115598489B (zh) * | 2021-06-28 | 2024-04-05 | 本源量子计算科技(合肥)股份有限公司 | 量子比特参数的测量方法和装置、量子芯片的测试方法 |
CN114454237B (zh) * | 2022-02-18 | 2024-05-14 | 杭州勤鹄科技有限公司 | 一种珍珠棉定长切断装置及方法 |
CN117610313B (zh) * | 2024-01-18 | 2024-04-26 | 西安石油大学 | 页岩油藏人工裂缝的网格加密方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62227198A (ja) * | 1986-03-28 | 1987-10-06 | 松下電器産業株式会社 | 帯域分割予測符号化方法 |
JPH10511243A (ja) * | 1994-12-20 | 1998-10-27 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 知覚符号化システムのサブバンドに波形予測を適用する装置及び方法 |
JP2008546021A (ja) * | 2005-05-31 | 2008-12-18 | マイクロソフト コーポレーション | マルチステージコードブックおよび冗長コーディング技術フィールドを有するサブバンド音声コーデック |
Family Cites Families (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5956674A (en) | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
JP2891193B2 (ja) * | 1996-08-16 | 1999-05-17 | 日本電気株式会社 | 広帯域音声スペクトル係数量子化装置 |
FI114248B (fi) | 1997-03-14 | 2004-09-15 | Nokia Corp | Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
JP4220108B2 (ja) * | 2000-06-26 | 2009-02-04 | 大日本印刷株式会社 | 音響信号符号化システム |
FR2815160B1 (fr) | 2000-10-06 | 2003-01-17 | France Telecom | Procede et dispositif de codage d'un signal audiofrequence |
US6633839B2 (en) * | 2001-02-02 | 2003-10-14 | Motorola, Inc. | Method and apparatus for speech reconstruction in a distributed speech recognition system |
US7225135B2 (en) * | 2002-04-05 | 2007-05-29 | Lectrosonics, Inc. | Signal-predictive audio transmission system |
JP4218271B2 (ja) * | 2002-07-19 | 2009-02-04 | ソニー株式会社 | データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体 |
US20040252772A1 (en) * | 2002-12-31 | 2004-12-16 | Markku Renfors | Filter bank based signal processing |
US7277550B1 (en) * | 2003-06-24 | 2007-10-02 | Creative Technology Ltd. | Enhancing audio signals by nonlinear spectral operations |
ATE425533T1 (de) * | 2003-07-18 | 2009-03-15 | Koninkl Philips Electronics Nv | Audiocodierung mit niedriger bitrate |
WO2005055201A1 (en) * | 2003-12-01 | 2005-06-16 | Aic | A highly optimized method for modelling a windowed signal |
US7392195B2 (en) * | 2004-03-25 | 2008-06-24 | Dts, Inc. | Lossless multi-channel audio codec |
US20060015329A1 (en) * | 2004-07-19 | 2006-01-19 | Chu Wai C | Apparatus and method for audio coding |
WO2006048814A1 (en) * | 2004-11-02 | 2006-05-11 | Koninklijke Philips Electronics N.V. | Encoding and decoding of audio signals using complex-valued filter banks |
JP2006211243A (ja) | 2005-01-27 | 2006-08-10 | Kobe Steel Ltd | ディジタル信号符号化装置,ディジタル信号符号化方法 |
US7720677B2 (en) * | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
JP4876574B2 (ja) * | 2005-12-26 | 2012-02-15 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
JP2009543112A (ja) * | 2006-06-29 | 2009-12-03 | エヌエックスピー ビー ヴィ | 音声パラメータの復号化 |
JP4704499B2 (ja) * | 2006-07-04 | 2011-06-15 | ドルビー インターナショナル アクチボラゲット | 圧縮サブバンド・フィルタ・インパルス応答を作るためのフィルタ・コンプレッサおよび方法 |
FR2912249A1 (fr) | 2007-02-02 | 2008-08-08 | France Telecom | Codage/decodage perfectionnes de signaux audionumeriques. |
GB2441835B (en) * | 2007-02-07 | 2008-08-20 | Sonaptic Ltd | Ambient noise reduction system |
KR101149448B1 (ko) * | 2007-02-12 | 2012-05-25 | 삼성전자주식회사 | 오디오 부호화 및 복호화 장치와 그 방법 |
US8195454B2 (en) * | 2007-02-26 | 2012-06-05 | Dolby Laboratories Licensing Corporation | Speech enhancement in entertainment audio |
KR101380170B1 (ko) * | 2007-08-31 | 2014-04-02 | 삼성전자주식회사 | 미디어 신호 인코딩/디코딩 방법 및 장치 |
CN101816191B (zh) | 2007-09-26 | 2014-09-17 | 弗劳恩霍夫应用研究促进协会 | 用于提取环境信号的装置和方法 |
EP2082396A1 (en) * | 2007-10-17 | 2009-07-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding using downmix |
EP2077551B1 (en) | 2008-01-04 | 2011-03-02 | Dolby Sweden AB | Audio encoder and decoder |
EP2269188B1 (en) * | 2008-03-14 | 2014-06-11 | Dolby Laboratories Licensing Corporation | Multimode coding of speech-like and non-speech-like signals |
BR122020009727B1 (pt) * | 2008-05-23 | 2021-04-06 | Koninklijke Philips N.V. | Método |
ES2401487T3 (es) * | 2008-07-11 | 2013-04-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y procedimiento para la codificación/decodificación de una señal de audio utilizando un esquema de conmutación de generación de señal ajena |
ES2379761T3 (es) | 2008-07-11 | 2012-05-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Proporcinar una señal de activación de distorsión de tiempo y codificar una señal de audio con la misma |
MX2011000375A (es) | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
EP2144231A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
CN102113346B (zh) * | 2008-07-29 | 2013-10-30 | 杜比实验室特许公司 | 用于电声通道的自适应控制和均衡的方法 |
US8457975B2 (en) | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
CN101646123B (zh) * | 2009-08-28 | 2012-09-05 | 中国科学院声学研究所 | 一种模拟听觉感知模型的滤波器组 |
ES2374008B1 (es) * | 2009-12-21 | 2012-12-28 | Telefónica, S.A. | Codificación, modificación y síntesis de segmentos de voz. |
EP2362375A1 (en) | 2010-02-26 | 2011-08-31 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for modifying an audio signal using harmonic locking |
WO2011118018A1 (ja) * | 2010-03-26 | 2011-09-29 | 株式会社フィールドシステム | 発信装置 |
US8600737B2 (en) | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
US20120029926A1 (en) | 2010-07-30 | 2012-02-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals |
CN102088603B (zh) * | 2010-12-31 | 2013-12-04 | 北京大学深圳研究生院 | 用于视频编码器的熵编码器及其实现方法 |
US20120245927A1 (en) * | 2011-03-21 | 2012-09-27 | On Semiconductor Trading Ltd. | System and method for monaural audio processing based preserving speech information |
EP2530840B1 (en) * | 2011-05-30 | 2014-09-03 | Harman Becker Automotive Systems GmbH | Efficient sub-band adaptive FIR-filtering |
CN107326559A (zh) | 2017-06-09 | 2017-11-07 | 杭州慧群机电设备有限公司 | 一种珠绣多色换珠装置 |
-
2014
- 2014-01-07 PL PL14701146T patent/PL2943953T3/pl unknown
- 2014-01-07 IN IN1874MUN2015 patent/IN2015MN01874A/en unknown
- 2014-01-07 HU HUE14701146A patent/HUE032831T2/en unknown
- 2014-01-07 KR KR1020157018150A patent/KR101634979B1/ko active IP Right Grant
- 2014-01-07 AU AU2014204954A patent/AU2014204954B2/en active Active
- 2014-01-07 SG SG10201709631PA patent/SG10201709631PA/en unknown
- 2014-01-07 ES ES16192075T patent/ES2769845T3/es active Active
- 2014-01-07 CN CN201710814654.1A patent/CN107452392B/zh active Active
- 2014-01-07 BR BR122017000308-9A patent/BR122017000308B1/pt active IP Right Grant
- 2014-01-07 ES ES14701146.4T patent/ES2613747T3/es active Active
- 2014-01-07 MX MX2016013420A patent/MX362990B/es unknown
- 2014-01-07 EP EP16192075.6A patent/EP3176784B1/en active Active
- 2014-01-07 EP EP19208681.7A patent/EP3648104B1/en active Active
- 2014-01-07 CA CA3012134A patent/CA3012134C/en active Active
- 2014-01-07 US US14/655,037 patent/US9659567B2/en active Active
- 2014-01-07 CA CA3140749A patent/CA3140749C/en active Active
- 2014-01-07 IL IL309437A patent/IL309437A/en unknown
- 2014-01-07 CA CA3054712A patent/CA3054712C/en active Active
- 2014-01-07 EP EP24166625.4A patent/EP4372602A3/en active Pending
- 2014-01-07 DK DK14701146.4T patent/DK2943953T3/en active
- 2014-01-07 IL IL302061A patent/IL302061B2/en unknown
- 2014-01-07 CA CA3076775A patent/CA3076775C/en active Active
- 2014-01-07 MY MYPI2015702155A patent/MY173781A/en unknown
- 2014-01-07 ES ES19208681T patent/ES2880252T3/es active Active
- 2014-01-07 CA CA3234476A patent/CA3234476A1/en active Pending
- 2014-01-07 BR BR112015016275-4A patent/BR112015016275B1/pt active IP Right Grant
- 2014-01-07 CA CA3121651A patent/CA3121651C/en active Active
- 2014-01-07 MY MYPI2018002422A patent/MY193865A/en unknown
- 2014-01-07 CN CN201480004153.1A patent/CN104919523B/zh active Active
- 2014-01-07 RU RU2017134071A patent/RU2742460C2/ru active
- 2014-01-07 CA CA3092138A patent/CA3092138C/en active Active
- 2014-01-07 MX MX2019002421A patent/MX370086B/es unknown
- 2014-01-07 EP EP21171483.7A patent/EP3893240B1/en active Active
- 2014-01-07 EP EP14701146.4A patent/EP2943953B1/en active Active
- 2014-01-07 SG SG11201504705SA patent/SG11201504705SA/en unknown
- 2014-01-07 WO PCT/EP2014/050139 patent/WO2014108393A1/en active Application Filing
- 2014-01-07 JP JP2015551193A patent/JP6173484B2/ja active Active
- 2014-01-07 RU RU2015127216A patent/RU2636093C2/ru active
- 2014-01-07 CA CA2897321A patent/CA2897321C/en active Active
- 2014-01-07 MX MX2015008659A patent/MX342822B/es active IP Right Grant
-
2015
- 2015-06-16 IL IL239444A patent/IL239444B/en active IP Right Grant
- 2015-07-02 MX MX2022013536A patent/MX2022013536A/es unknown
- 2015-07-02 MX MX2019014295A patent/MX2019014295A/es unknown
-
2016
- 2016-01-26 HK HK16100838.8A patent/HK1213081A1/zh unknown
-
2017
- 2017-04-13 US US15/486,943 patent/US9892741B2/en active Active
- 2017-07-04 JP JP2017131120A patent/JP6530787B2/ja active Active
- 2017-08-15 AU AU2017216470A patent/AU2017216470B2/en active Active
- 2017-12-15 US US15/843,853 patent/US10102866B2/en active Active
-
2018
- 2018-03-15 IL IL258153A patent/IL258153B/en active IP Right Grant
- 2018-09-12 US US16/129,280 patent/US10325608B2/en active Active
- 2018-10-24 IL IL262551A patent/IL262551B/en active IP Right Grant
-
2019
- 2019-05-03 US US16/403,028 patent/US10573330B2/en active Active
- 2019-05-17 JP JP2019093724A patent/JP6592634B2/ja active Active
- 2019-08-05 IL IL268510A patent/IL268510B/en active IP Right Grant
- 2019-09-20 JP JP2019171286A patent/JP7053545B6/ja active Active
- 2019-11-15 AU AU2019264642A patent/AU2019264642B2/en active Active
-
2020
- 2020-02-21 US US16/797,841 patent/US10971164B2/en active Active
- 2020-09-03 IL IL277117A patent/IL277117B/en unknown
-
2021
- 2021-01-04 AU AU2021200013A patent/AU2021200013B2/en active Active
- 2021-04-01 US US17/219,914 patent/US11651777B2/en active Active
- 2021-05-25 IL IL283412A patent/IL283412B/en unknown
- 2021-12-27 JP JP2021212121A patent/JP7258118B2/ja active Active
-
2022
- 2022-02-14 IL IL290600A patent/IL290600B2/en unknown
- 2022-03-10 AU AU2022201676A patent/AU2022201676B2/en active Active
- 2022-09-11 IL IL296350A patent/IL296350B2/en unknown
-
2023
- 2023-03-30 US US18/128,494 patent/US11915713B2/en active Active
- 2023-04-04 JP JP2023060972A patent/JP7418637B2/ja active Active
- 2023-05-16 AU AU2023203057A patent/AU2023203057B2/en active Active
-
2024
- 2024-01-09 JP JP2024000944A patent/JP2024038279A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62227198A (ja) * | 1986-03-28 | 1987-10-06 | 松下電器産業株式会社 | 帯域分割予測符号化方法 |
JPH10511243A (ja) * | 1994-12-20 | 1998-10-27 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 知覚符号化システムのサブバンドに波形予測を適用する装置及び方法 |
JP2008546021A (ja) * | 2005-05-31 | 2008-12-18 | マイクロソフト コーポレーション | マルチステージコードブックおよび冗長コーディング技術フィールドを有するサブバンド音声コーデック |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7258118B2 (ja) | 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230404 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20230421 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230620 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230919 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240109 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7418637 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |