CN114467313A - 用于心理声学频率范围延伸的非线性自适应滤波器组 - Google Patents

用于心理声学频率范围延伸的非线性自适应滤波器组 Download PDF

Info

Publication number
CN114467313A
CN114467313A CN202080067848.XA CN202080067848A CN114467313A CN 114467313 A CN114467313 A CN 114467313A CN 202080067848 A CN202080067848 A CN 202080067848A CN 114467313 A CN114467313 A CN 114467313A
Authority
CN
China
Prior art keywords
target frequency
component
components
spectrum
harmonic spectral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202080067848.XA
Other languages
English (en)
Other versions
CN114467313B (zh
Inventor
J·A·马里格里奥三世
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Boomcloud 360 Inc
Original Assignee
Boomcloud 360 Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Boomcloud 360 Inc filed Critical Boomcloud 360 Inc
Publication of CN114467313A publication Critical patent/CN114467313A/zh
Application granted granted Critical
Publication of CN114467313B publication Critical patent/CN114467313B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/007Protection circuits for transducers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/02Means for controlling the tone frequencies, e.g. attack or decay; Means for producing special musical effects, e.g. vibratos or glissandos
    • G10H1/06Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour
    • G10H1/08Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by combining tones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/02Means for controlling the tone frequencies, e.g. attack or decay; Means for producing special musical effects, e.g. vibratos or glissandos
    • G10H1/06Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour
    • G10H1/12Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms
    • G10H1/125Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms using a digital filter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/155Musical effects
    • G10H2210/321Missing fundamental, i.e. creating the psychoacoustic impression of a missing fundamental tone through synthesis of higher harmonics, e.g. to play bass notes pitched below the frequency range of reproducing speakers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/055Filters for musical processing or musical effects; Filter responses, filter architecture, filter coefficients or control parameters therefor
    • G10H2250/061Allpass filters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

一种系统包括为扬声器提供心理声学频率范围延伸的电路系统。该电路系统从音频信道生成正交分量,并且通过应用正变换来生成旋转频谱正交分量,该正变换将正交分量的频谱从标准基旋转到旋转基。在旋转基上,该电路系统隔离目标频率处的旋转频谱正交分量中的分量,并且通过将标度无关的非线性应用于经隔离的分量来生成加权相位相干谐波频谱正交分量。该电路系统通过应用逆变换来生成谐波频谱分量,该逆变换将加权相位相干谐波频谱正交分量的频谱从旋转基旋转到标准基。该电路系统将谐波频谱分量与音频信道的目标频率之外的频率组合以生成输出信道,并且向扬声器提供该输出信道。

Description

用于心理声学频率范围延伸的非线性自适应滤波器组
技术领域
本公开大体上涉及音频处理,并且更具体地涉及产生超出物理驱动器的带宽的频率的印象。
背景技术
扩音器、耳机、以及其他声学致动器的带宽通常被限制于人类听觉系统的带宽的子域。这通常是可听频谱的低频区域(大约18Hz到250Hz)中的问题。期望修改音频信号以产生超出物理驱动器的带宽的频率的印象。除了简单地延伸驱动器的频率响应之外,取决于应用,可能期望在不增加存在于这些子带中的物理能量的量的情况下增加对某些子带的感知。例如,可能期望使用心理声学印象来减少驱动器的压力,或者改善设备的功耗特性。
发明内容
一些实施例包括一种系统,该系统包括为扬声器提供心理声学频率范围延伸的电路系统。该电路系统从音频信道生成正交分量,该正交分量定义音频信道的正交表示,并且通过应用正变换来生成旋转频谱正交分量,该正变换将正交分量的频谱从标准基旋转到旋转基。在旋转基上,该电路系统隔离目标频率处的旋转频谱正交分量中的分量,并且通过将标度无关的非线性应用于经隔离的分量来生成加权相位相干谐波频谱正交分量。该电路系统通过应用逆变换来生成谐波频谱分量,该逆变换将加权相位相干谐波频谱正交分量的频谱从旋转基旋转到标准基。该电路系统将谐波频谱分量与音频信道的目标频率之外的频率组合以生成输出信道,并且向扬声器提供输出信道。
在一些实施例中,谐波频谱分量包括与音频信道的目标频率不同的频率并在由扬声器呈现时产生目标频率的心理声学印象。
在一些实施例中,正变换旋转正交分量的频谱,使得目标频率被映射到0Hz。逆变换旋转加权相位相干谐波频谱正交分量的频谱,使得0Hz被映射到目标频率。
在一些实施例中,目标频率是目标频率的中心频率。在一些实施例中,目标频率包括18Hz与250Hz之间的频率。在一些实施例中,目标频率低于谐波频谱分量的频率。
在一些实施例中,该电路系统基于扬声器的可再现范围、扬声器的功耗的降低、或者扬声器的增加的使用寿命来确定目标频率。
在一些实施例中,扬声器是移动设备的组件。
在一些实施例中,该电路系统还被配置为使用门函数来隔离目标幅度处的分量。在一些实施例中,该电路系统还被配置为将平滑函数应用于经隔离的分量。
在一些实施例中,标度无关的非线性包括具有经析出因数的幅度的第一类切比雪夫多项式的加权求和
一些实施例包括一种方法。该方法包括:由电路系统:从音频信道生成正交分量,该正交分量定义音频信道的正交表示;通过应用正变换来生成旋转频谱正交分量,该正变换将正交分量的频谱从标准基旋转到旋转基;在旋转基上:隔离目标频率处的旋转频谱正交分量中的分量;以及通过将标度无关的非线性应用于经隔离的分量来生成加权相位相干谐波频谱正交分量;通过应用逆变换来生成谐波频谱分量,该逆变换将加权相位相干谐波频谱正交分量的频谱从旋转基旋转到标准基;将谐波频谱分量与音频信道的目标频率之外的频率组合以生成输出信道;以及向扬声器提供输出信道。
一些实施例包括一种非瞬态计算机可读介质,所述非瞬态计算机可读介质包括所存储的指令,该所存储的指令在由至少一个处理器执行时将至少一个处理器配置为:从音频信道生成正交分量,该正交分量定义音频信道的正交表示;通过应用正变换来生成旋转频谱正交分量,该正变换将正交分量的频谱从标准基旋转到旋转基;在旋转基上:隔离目标频率处的旋转频谱正交分量中的分量;以及通过将标度无关的非线性应用于经隔离的分量来生成加权相位相干谐波频谱正交分量;通过应用逆变换来生成谐波频谱分量,该逆变换将加权相位相干谐波频谱正交分量的频谱从旋转基旋转到标准基;将谐波频谱分量与音频信道的目标频率之外的频率组合以生成输出信道;以及向扬声器提供输出信道。
附图说明
图1是根据一些实施例的音频系统的框图。
图2是根据一些实施例的谐波处理模块的框图。
图3是根据一些实施例的用于心理声学频率范围延伸的过程的流程图。
图4是根据一些实施例的计算机的框图。
图5是根据一些实施例的正变换模块的框图。
图6是根据一些实施例的系数算子模块的框图。
图7是根据一些实施例的逆变换模块的框图。
附图仅出于说明的目的来描绘了各种实施例。本领域技术人员将根据以下讨论容易地认识到,可以在不脱离本文中所描述的原理的情况下采用本文中所说明的结构和方法的备选实施例。
具体实施方式
附图(图)和以下描述仅通过说明的方式涉及优选实施例。应注意,通过以下讨论,本文中所公开的结构和方法的备选实施例将容易地被认为是可行的备选方案,其可以在不脱离所要求保护的原理的情况下被采用。
现在将详细地对若干实施例进行参考,其示例在附图中进行说明。注意,只要可行,相似或类似的附图标记可以附图中使用并可以指示相似或类似的功能性。附图仅出于说明的目的来描绘所公开的系统(或者,方法)的实施例。本领域技术人员将根据以下描述而容易地认识到,可以在不脱离本文中所描述的原理的情况下采用本文中所说明的结构和方法的备选实施例。
实施例涉及提供心理声学频率范围延伸。因为人类听觉系统以非线性方式对提示做出响应,所以可以使用心理声学现象在实际刺激不可行的情况下创建虚拟刺激。音频系统可以包括提供自适应非线性滤波器组的电路系统,该自适应非线性滤波器组使用高度可调谐的、标度无关的非线性从音频信号生成相位相干谐波频谱。相位相干谐波频谱可以与原始音频信号相加,以产生超出物理驱动器的带宽的频率的印象。
自适应非线性滤波器组可以包括多个谐波处理器。每个谐波处理器包括非线性滤波器,该非线性滤波器分析音频信号内的目标子带,并且用可配置的频谱变换重新合成子带的数据。尽管输入频谱包络被输出采用,并且尽管可以存在对子带内的整体振幅动态或子带响应(例如,压缩、选通等)的混合的进一步变换,但是频谱变换本身可以仅取决于频率和相含量。这跨各种音频信号提供了高度的一致性。
频率范围延伸的优点包括允许不能呈现某些频率的(例如,低品质)扬声器产生这些频率的心理声学印象。低成本扬声器(诸如,在移动设备上常见的低成本扬声器)可以提供高品质的收听体验。心理声学频率范围延伸是诸如由在移动设备中找到的处理电路系统且在不需要对扬声器进行硬件修改的情况下通过处理音频信号来实现的。频率范围延伸和频率响应改善在不依靠增加次优子带中的物理能量的量的情况下被实现时可能对改善扬声器驱动器的功耗特性和使用寿命有用。
音频处理系统
图1是根据一些实施例的音频系统100的框图。音频系统100使用非线性滤波器组模块120为扬声器110提供频率范围延伸。系统100包括滤波器组模块120,该滤波器组模块120包括谐波处理模块104(1)、104(2)、104(3)和104(4)、全通滤波器网络模块122、以及组合器模块106。滤波器组模块120使用高度可调谐的、标度无关的非线性从音频信道a(t)生成相位相干谐波频谱。在一些实施例中,如所示出的,谐波处理模块104可以并联连接。一些实施例可以包括串联连接谐波处理模块104,其中给定谐波处理模块的残差以级联方式被传递给后续谐波处理模块。系统100生成向扬声器110提供以用于呈现的输出信道o(t)。滤波器组模块120的谐波处理模块104(1)至104(4)为超出扬声器110的物理带宽的音频信道a(t)提供心理声学频率范围延伸。
滤波器组模块120包括生成谐波频谱分量h(t)(n)的多个谐波处理模块104(n)。在一些实施例中,每个谐波处理模块104(1)到104(4)分析整个音频信道a(t)并合成相应谐波频谱分量h(t)(1)到h(t)(4)。在一些实施例中,每个谐波处理模块可以分析音频信道的不同目标子带。每个谐波频谱分量h(t)(n)是a(t)中的数据的相位相干频谱变换。每个谐波频谱分量h(t)(n)具有加权相位相干谐波频谱(其包括与a(t)的相应目标子带中的数据的频率不同的频率)并在由扬声器110输出时产生相应目标子带的频率的心理声学印象。可以选择谐波处理模块104(n)中的一个或多个谐波处理模块来生成谐波频谱分量h(t)(n),以为扬声器110提供心理声学频率范围延伸。在一些实施例中,对目标子带的选择可以基于扬声器110的能力,诸如扬声器110的频率响应。例如,如果扬声器110无法有效地呈现声音的低频,那么谐波处理模块104可以被配置为针对与低频相对应的频率子带分量,并且这些可以被转换为谐波频谱分量h(t)(n)。音频系统100可以包括一个或多个谐波处理模块104。结合图2至图5讨论了关于谐波处理模块104的附加细节。
全通滤波器网络模块122生成经滤波的音频信道a(t)以确保音频信道a(t)与滤波器组模块120的输出保持相干。全通滤波器网络122通过将匹配相变应用于输入信号a(t)来补偿由于应用谐波处理模块104(n)的相变。这允许在感知上与a(t)不可区分但具有被操纵的相位的信号与由滤波器组模块120生成的谐波频谱分量h(t)(n)之间发生相干求和。
组合器模块106通过组合来自全通滤波器网络模块122的经滤波的音频信道a(t)与来自滤波器组模块120的一个或多个谐波频谱分量h(t)(n)来生成输出信道o(t)。组合器模块106向扬声器110提供输出信道o(t)。在一些实施例中,多个谐波频谱分量h(t)(n)可以被衰减(例如,通过独立调谐)并彼此相加以产生具有期望的非线性特性的聚合滤波器组输出。在一些实施例中,经相加的谐波频谱分量h(t)(n)可以用例如高通滤波、动态范围处理等进行进一步处理,并且与(可能衰减的)经滤波的音频信道a(t)相加。
图2是根据一些实施例的谐波处理模块104的框图。谐波处理模块104提供非线性滤波器,该非线性滤波器分析音频信道并用可配置的频谱变换重新合成目标子带的数据。谐波处理模块104包括全通网络模块202、正变换器模块204、系数算子模块206和逆变换器模块208。全通网络模块202将一对同相变换应用于音频信道x(t)以生成正交分量。正变换器模块204将正变换应用于正交分量,该正变换旋转整个频谱,使得所选择的频率被映射到0Hz以生成旋转频谱正交分量。将所选择的频率移位到0Hz被称为从标准基到旋转基的变化。所选择的频率可以是目标子带的中心频率或其他频率。系数算子模块206在旋转基上执行运算,包括基于频率、幅度或相位对数据进行选择性地滤波、使用标度无关的非线性从数据生成新的加权相位相干谐波频谱、以及修改分量的动态范围以创建加权相位相干旋转频谱正交分量。逆变换器模块208应用逆变换来旋转加权相位相干旋转频谱正交分量的频谱,使得0Hz被映射到所选择的频率以生成谐波频谱分量
Figure BDA0003566233430000061
将0Hz移位到所选择的频率被称为从旋转基到标准基的变化。谐波频谱分量
Figure BDA0003566233430000062
可以包括与音频信道x(t)的目标子带不同的频率,但是在由扬声器呈现时产生音频信道x(t)的目标子带的频率的心理声学印象。
在一些实施例中,向谐波处理模块104输入的音频分量x(t)可以是子带分量a(t)(n)。在该示例中,可以跳过由系数算子模块206进行的用以选择目标频率的选择性滤波。
全通网络202将音频信道x(t)转换为包括正交分量y1(t)和y2(t))的向量y(t)。正交分量y1(t)和y2(t)包括90°相位关系。正交分量y1(t)和y2(t)以及输入信号x(t)包括针对所有频率的单位幅度关系。实值输入信号x(t)由一对匹配的全通滤波器H1和H2进行调谐正交值化。该运算可以经由连续时间原型定义,如等式1中所示出:
Figure BDA0003566233430000071
一些实施例将不一定保证输入(单声道)信号与两个(立体声)正交分量y1(t)和y2(t)中的任一个之间的相位关系,但是导致正交分量y1(t)和y2(t)包括90°相位关系并且正交分量y1(t)和y2(t)以及输入信号x(t)包括所有频率的单位幅度关系。
图3是根据一些实施例的正变换器模块204的框图。正变换器模块204包括旋转矩阵模块302和矩阵乘法器304。正变换器模块204接收正交分量y1(t)和y2(t)并应用正变换以生成包括旋转频谱正交分量u1(t)和u2(t)的向量u(t)。通过经由旋转矩阵模块302生成时变旋转矩阵并经由矩阵乘法器304将其应用于正交分量从而产生旋转频谱正交分量u(t)来应用该变换。向量u(t)是音频信号x(t)的频谱的频移形式并定义了系数空间,在该系统空间中,不同时间t处的每个u被定义为旋转频谱正交分量。由向量u(t)定义的系数是旋转x(t)的频谱使得期望的中心频率θc现在位于0Hz处的结果。
正变换可以作为时变2维旋转对正交信号应用,如等式2所定义:
u[t]=H1(x[t])R2(-θct) (2)
其中H1是全通滤波器,旋转R2(-θct)具有角频率θc并由等式3定义:
Figure BDA0003566233430000072
等式2和3包括对三角函数的迭代调用。在θc恒定的区间内,正变换可以由递归2D旋转而非对三角函数的迭代调用计算。当使用该优化策略时,仅在初始化或改变θc时做出对sin和cos的调用。该优化递归地将每个矩阵R2(-θct)定义为无穷小的旋转矩阵的连续幂,即:R2(-θc(t+1))≡R2(-θct)R2(-θc)。由于将两个2×2矩阵相乘是大多数架构上的高度优化的计算,因此该定义可以提供优于在等式3中呈现的对三角函数的迭代调用的性能优点,然而这是等效的。
图4是根据一些实施例的系数算子模块206的框图。系数算子模块206包括滤波器模块402、幅度模块404、门模块406、除法算子408和410、谐波生成器模块412、以及乘法算子414和416。有效算子模块206使用包括旋转频谱正交分量u1(t)和u2(t)的向量u(t)来生成旋转频谱
Figure BDA0003566233430000081
该旋转频谱
Figure BDA0003566233430000082
包括加权相位相干旋转频谱正交分量
Figure BDA0003566233430000083
Figure BDA0003566233430000084
在一些实施例中,滤波器模块402是双信道低通滤波器。在这种情况下,谐波处理模块104被配置为以两倍于滤波器406的截止频率的带宽对以θc为中心的目标子带执行频谱变换。幅度模块404使用除法算子408和410来确定2D向量的长度,该2D向量被用作瞬时幅度的测量值,该瞬时幅度从经滤波的信号向量被析出因数。该幅度被析出因数,以便允许谐波生成器模块412基于关系不取决于标度的信号来提供谐波。谐波生成器模块412应用加权非线性的总和以基于旋转频谱正交分量的目标子带来生成谐波频谱。然后再次使用由幅度模块404提供的幅度,这次通过门模块406。门模块406生成2D包络,该2D包络的瞬时斜率由摆幅限制器418限制。然后经由乘法算子414和416将所产生的摆幅限制包络应用于谐波生成器模块412的输出。加权谐波之和与时变包络相乘以生成旋转频谱
Figure BDA0003566233430000085
u(t)的系数可以使用等式4以极坐标进行表示:
Figure BDA0003566233430000086
∠u[t]=atan2(u1[t],u2[t]) (4)
其中项||u(t)||是系数信号的瞬时幅度,并且∠u(t)是瞬时相位。现在可以在逆变换阶段之前操纵这些项。
由u(t)定义的系数基于其瞬时幅度而被选择性地滤波。滤波可以包括由门模块406应用的门函数以及由摆幅限制器418应用的摆幅限制滤波器。基于阈值n的门函数可以由等式5定义:
Figure BDA0003566233430000087
其中情况x≥n导致保持系数,而情况x<n导致移除系数。在一些实施例中,情况x<n可以交替地导致衰减,而非完全移除系数。因为门函数对瞬时幅度的估计进行运算,所以其通常比基于实值幅度的门更敏感,同时具有更少伪影。
时域平滑可以经由摆幅限制滤波器来实现,以进一步定制非线性滤波器的响应的包络特性。摆幅限制滤波器是非线性滤波器,其使函数的最大(正)和最小(负)斜率饱和。可以使用各种类型的摆幅限制滤波器或元件,诸如对正和负饱和点(下面标记为S(x))具有独立控制的非线性滤波器。将摆幅限制应用于门函数的输出导致时变包络:S(G(||u[t]||))。这可以用于使系数的包络成形。
为了生成
Figure BDA0003566233430000091
的相位相干谐波频谱,谐波生成器模块412可以使用如等式6所定义的第一类切比雪夫多项式:
Tn(x)=cos(ncos-1(x)) (6)
这些多项式通过对其输出求和来提供谐波的受控生成,如等式7或8所定义:
Figure BDA0003566233430000092
Figure BDA0003566233430000093
或者等效地:
Figure BDA0003566233430000094
其中a=[a0,a1,a2...aN]是应用于相位相干谐波频谱的每个谐波的谐波权重,并且N是最高的所生成的谐波。在两种表示中,非线性与输入标度无关。这防止输出频谱随输入响度而变化,而是仅允许由频谱权重a确定的变化。权重通常被布置为衰减序列,从而模拟人类听觉系统习惯的自然发生声音的谐波序列。该权重系列与传入音频信道的标度无关。
尽管等效,但是等式7具有允许直接操纵输出相位的益处,而等式8省略了可能昂贵的三角函数,从而只对幅度进行运算。图4中所示出的系数算子模块206描绘了根据等式8的运算。
图5是根据一些实施例的逆变换器模块208的框图。逆变换器模块208包括旋转矩阵模块502、矩阵乘法器504、投影算子506和矩阵转置算子508。逆变换器模块208从包括相位相干旋转频谱正交分量
Figure BDA0003566233430000101
Figure BDA0003566233430000102
的旋转频谱
Figure BDA0003566233430000103
生成谐波频谱分量
Figure BDA0003566233430000104
旋转矩阵模块502生成与由矩阵模块302生成的旋转矩阵相同的旋转矩阵。由旋转矩阵模块502生成的矩阵由矩阵转置算子508转置,并且由矩阵乘法器504而被应用于相位相干旋转频谱正交分量
Figure BDA0003566233430000105
Figure BDA0003566233430000106
的传入2D向量。所产生的2D向量由投影算子506被投影到单个维度。
为了执行从旋转基回到标准基的逆变换,输出频谱被移位,使得0Hz返回到其原始位置θc,如等式9所定义:
Figure BDA0003566233430000107
其中P是从二维实系数空间到单个维度的投影,如等式10所定义:
Figure BDA0003566233430000108
因为正变换R2(-θct)包括正交旋转,所以逆变换是转置。该代数结构准许缓存正变换矩阵并仅通过改变系数相乘的顺序对其进行求逆。正是在该意义上,图3中的旋转矩阵模块302以及图5中的旋转矩阵模块502据称为相同的。谐波频谱分量
Figure BDA0003566233430000109
是谐波频谱分量h(t)(n)的示例,并且因此,可以是非线性滤波器在较大滤波器组中的响应。
示例过程
图6是根据一些实施例的用于心理声学频率范围延伸的过程的流程图。图6中所示出的过程可以由音频系统(例如,音频系统100)的组件执行。在其他实施例中,其他实体可以执行图6中的步骤中的一些或所有步骤。实施例可以包括不同和/或附加的步骤,或者按不同顺序执行步骤。
音频系统生成正交分量(605),该正交分量(605)定义音频信道的正交表示。音频信道可以是多信道音频信号的信道,诸如立体声音频信号的左信道或右信道。正交分量包括90°相位关系。正交分量和音频信道包括所有频率的单位幅度关系。在一些实施例中,实值输入信号由一对匹配的全通滤波器进行调谐正交值化。
音频系统通过应用正变换来生成旋转频谱正交分量(610),该正变换将正交分量的频谱(例如,整个频谱)从标准基旋转到旋转基。标准基是指输入音频信道在旋转之前的频率。旋转可以导致目标频率被映射到0Hz。该目标频率可以是谐波处理模块的分析区域的中心,诸如用于心理声学范围延伸的目标子带的中心频率。可以使用如等式3所定义的对三角函数的迭代调用或使用等效的递归2D旋转来计算正变换。
音频系统隔离目标频率和目标幅度处的旋转频谱正交分量(615)。经隔离的分量可以在旋转基上被执行。例如,可以使用滤波器隔离目标频率。在一些实施例中,滤波器移除了高于阈值的频率,并且这具有如下效果:隔离目标子带、围绕正变换被调谐到的中心频率θc对称地跨越阈值的两倍。在一些实施例中,音频系统基于如下因素(诸如,扬声器的可再现范围、扬声器的功耗的降低或扬声器的增加的使用寿命)来确定目标频率。
音频系统还可以诸如通过使用门函数将目标幅度处的分量与旋转频谱正交分量隔离。门函数可以被配置为丢弃子带中的不需要的信息,或者保留幅度包络。门函数还可以包括摆幅限制滤波器或类似平滑函数。
音频系统通过将标度无关的非线性应用于经隔离的分量来生成加权相位相干旋转频谱正交分量(620)。加权相位相干旋转频谱正交分量可以在旋转基上被生成。该旋转基非常适合生成设计器频谱,这是因为其将标准基信号表示为2维向量和因为其使目标频率以零为中心。然后可以将向量进一步分解为极坐标,如等式4中所见,这些极坐标类似于计算短时傅里叶变换(STFT)(关于特定频率的信息的自然描述符)中的单个bin的幅度和幅角。该特定实现具有优于STFT表示的若干明显优点。第一优点在于bin信息仅根据需要进行计算,而非针对整个频谱进行计算。另一优点在于结果以正确表示瞬态数据所需的时间分辨率进行计算。此外,类似于STFT技术中的窗口函数运行的滤波器出于将目标频谱内容与其残差分离的目的轻松地进行调谐,并且在多个谐波处理模块的情况下,可以具有不均匀的调谐。通过分解出模块运行的经隔离的分量的瞬时幅度来使非线性(其功能主要是在给定旋转频谱正交分量中的相位信息的情况下生成相位相干频谱)标度无关。根据一些实施例,非线性本身可以包括第一类切比雪夫多项式的加权求和。该类型的非线性可以针对与旋转频谱正交分量隔离的每个分量生成可调谐的谐波频谱。每个谐波可以由预定义谐波权重an进行加权。
音频系统通过应用逆变换来生成谐波频谱分量(625),该逆变换将加权相位相干旋转频谱正交分量的频谱从旋转基旋转到标准基。逆变换可以旋转频谱,使得0Hz被映射到目标频率。谐波频谱分量包括与目标频率不同的频率,但是在由扬声器呈现时产生目标频率的心理声学印象。谐波频谱分量的频率可以在扬声器的带宽内,而子带频率可以在扬声器的带宽之外。在一些实施例中,子带频率低于谐波频谱分量的频率。在一些实施例中,子带频率包括18Hz与250Hz之间的频率。在一些实施例中,目标子带或频率可以在扬声器的可再现范围内,但是可以出于应用特定的原因而被选择,例如以降低音频系统的功耗或提高扬声器的使用寿命。
音频系统将谐波频谱分量与音频信道的目标频率之外的频率组合以生成输出信道(630),并且向扬声器提供输出信道(635)。在一些实施例中,音频系统通过将谐波频谱分量与原始音频信道组合来生成输出信道,并且向扬声器提供输出信道。在一些实施例中,音频系统对音频信道或音频信道的其他子带分量(例如,排除用于频率范围延伸的(多个)子带分量)进行滤波以确保音频信道或其他子带分量与谐波频谱分量保持相干,并且将经滤波的音频信道或其他子带分量与谐波频谱分量组合来为扬声器生成输出信道。在一些实施例中,经过滤波或原始音频信道与谐波频谱分量的组合可以用例如均衡、压缩等进行进一步处理来为扬声器生成输出信道。
尽管图6中的过程针对单个音频信道的单个子带分量进行了讨论,但是可以执行该过程来为音频信道的多个子带分量和/或为多信道音频信号的多个音频信道提供频率范围延伸。在一些实施例中,不同扬声器可以具有不同的可用带宽或频率响应。例如,移动设备(例如,移动电话)可以包括不平衡的扬声器。不同子带分量可以用于不同扬声器的频率范围延伸。
示例计算机
图7是根据一些实施例的计算机700的框图。计算机700是实现音频系统(诸如,音频系统100)的电路系统的示例。图示了耦接到芯片集704的至少一个处理器702。芯片集704包括存储器控制器集线器720和输入/输出(I/O)控制器集线器722。存储器706和图形适配器712被耦接到存储器控制器集线器720,并且显示设备718耦接到图形适配器712。存储设备708、键盘710、指向设备714和网络适配器716被耦接到I/O控制器集线器722。计算机700可以包括各种类型的输入或输出设备。计算机700的其他实施例具有不同架构。例如,在一些实施例中,存储器706直接耦接到处理器702。
存储设备708包括一个或多个非瞬态计算机可读存储介质,诸如硬盘驱动器、光盘只读存储器(CD-ROM)、DVD或固态存储器设备。存储器706保存由处理器702使用的程序代码(由一个或多个指令组成)和数据。程序代码可以与参考图1至图6描述的处理方面相对应。
指向设备714与键盘710结合使用以将数据输入到计算机系统700中。图形适配器712在显示设备718上显示图像和其他信息。在一些实施例中,显示设备718包括用于接收用户输入和选择的触摸屏能力。网络适配器716将计算机系统700耦接到网络。计算机700的一些实施例具有与图7中所示出的组件不同和/或其他的组件。
电路系统可以包括一个或多个处理器,该一个或多个处理器执行存储在非瞬态计算机可读中的程序代码,该程序代码在被一个或多个处理器执行时将一个或多个处理器配置为实现音频处理系统或音频处理系统的模块。实现音频处理系统或音频处理系统的模块的电路系统的其他示例可以包括集成电路,诸如专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其他类型的计算机电路。
附加考虑
所公开的配置的示例益处和优点包括由于适应于设备的增强音频系统和相关联的音频呈现系统以及可供设备OS使用的其他相关信息(诸如,用例信息(例如,指示音频信号用于音乐播放而非游戏))而导致的动态音频增强。增强音频系统可以被集成到设备中(例如,使用软件开发工具包)或存储在远程服务器上以便按需访问。以这种方式,设备不需要将存储或处理资源专用于维护音频增强系统,该音频增强系统特定于其音频呈现系统或音频呈现配置。在一些实施例中,增强音频系统使得能够对呈现系统信息进行不同级别的查询,使得可以跨不同级别的可用设备特定呈现信息应用有效音频增强。
贯穿本说明书,多个实例可以实现被描述为单个实例的组件、操作或结构。尽管一种或多种方法的单独操作被图示并描述为单独操作,单独操作中的一个或多个单独操作可以被同时执行,并且不需要按所图示的顺序执行操作。在示例配置中被呈现为单独组件的结构和功能性可以被实现为组合结构或组件。类似地,呈现为单个组件的结构和功能性可以被实现为单独组件。这些和其他变型、修改、添加和改进落入本文中的主题的范围内。
某些实施例在本文中被描述为包括逻辑或若干组件、模块或机制。模块可以构成软件模块(例如,实施在机器可读介质上或传输信号中的代码)或硬件模块。硬件模块是能够执行某些操作的有形单元,并且可以以某种方式执行配置或布置。在示例实施例中,一个或多个计算机系统(例如,独立式客户端或服务器计算机系统)或计算机系统的一个或多个硬件模块(例如,处理器或一组处理器)可以由软件(例如,应用或应用部分)配置为操作以进行如本文中所描述的某些操作的硬件模块。
本文中所描述的示例方法的各种操作可以至少部分地由暂时配置(例如,通过软件)或永久配置为执行相关操作的一个或多个处理器执行。无论是暂时配置还是永久配置,此类处理器都可以构成处理器实现的模块,这些处理器实现的模块操作以执行一个或多个操作或功能。在一些示例实施例中,本文中所提到的模块可以包括处理器实现的模块。
类似地,本文中所描述的方法可以至少部分地为处理器实现的。例如,方法的操作中的至少一些操作可以由一个或处理器或处理器实现的硬件模块执行。某些操作的性能可以被分布在一个或多个处理器之间,不仅驻留于单个机器内,而且还跨若干机器部署。在一些示例实施例中,一个或多个处理器可以位于单个位置中(例如,位于家庭环境、办公室环境内或作为服务器场),而在其他实施例中,处理器可以被分布在若干位置上。
除非另有明确说明,否则本文中使用诸如“处理”、“计算”、“运算”、“确定”、“呈现”、“显示”等词语的讨论可以是指机器(例如,计算机)的动作或过程,该机器在一个或多个存储器(例如,易失性存储器、非易失性存储器或其组合)、寄存器或接收、存储、传输或显示信息的其他机器组件内操纵或变换表示为物理(例如,电子、磁性或光学)量的数据。
如本文中所使用,对“一个实施例”或“实施例”的引用是指结合实施例描述的特定元件、特征、结构或特点被包括在至少一个实施例中。在本说明书中的各个地方出现的短语“在一个实施例中”并不一定全部是指同一实施例。
可以使用表述“耦接”和“连接”连同其派生词来描述一些实施例。应理解,这些术语不旨在作为彼此的同义词。例如,可以使用术语“连接”来描述一些实施例以指示两个或更多个元件彼此直接物理或电接触。在另一示例中,可以使用术语“耦接”来描述一些实施例以指示两个或更多个元件直接物理或电接触。然而,术语“耦接”也可以意味着两个或更多个元件彼此不直接接触,但是仍然彼此协作或交互。实施例不限于此上下文。
如本文中所使用,术语“包括”、“包含”、“具有”或其任何其他变型旨在涵盖非排他性包括。例如,包括元件列表的过程、方法、物品或装置并不一定仅限于那些元件,而是可以包括未明确列出的或此类过程、方法、物品或装置固有的其他元件。进一步地,除非另有明确相反地说明,否则“或”是指包含性的或,而不是排他性的或。例如,条件A或B由以下任何一项满足:A为真(或者,存在)且B为假(或者,不存在),A为假(或者,不存在)且B为真(或者,存在),并且A和B都为真(或者,存在)。
此外,“一”或“一个”的使用用于描述本文中的实施例的元件和组件。这样做仅仅是为了方便以及给出本发明的一般意义。本描述应被理解为包括一个或至少一个,并且除非明显另有含义,否则单数也包括复数。
本描述的一些部分依据对信息的操作的算法和符号表示来描述实施例。这些算法描述和表示通常被数据处理领域的技术人员用来将其工作的实质有效地传达给本领域的其他技术人员。这些操作虽然在功能上、计算上或逻辑上进行了描述,但是被理解为由计算机程序或等效电路、微代码等实现。此外,在不失一般性的情况下,有时将这些操作布置称为模块也已证明是方便的。所描述的操作和其相关联的模块可以实施在软件、固件、硬件或其任何组合中。
本文中所描述的步骤、操作或过程中的任何步骤、操作或过程可以单独或与其他设备结合地用一个或多个硬件或软件模块来执行或实现。在一个实施例中,软件模块用计算机程序产品来实现,该计算机程序产品包括计算机可读介质,该计算机可读介质包含计算机程序代码,该计算机程序代码可以被计算机处理器执行以执行所描述的任何或所有步骤、操作或过程。
实施例还可以涉及用于执行本文中的操作的装置。该装置可以出于所需目的来进行专门构造,和/或该装置可以包括由存储在计算机中的计算机程序选择性地启动或重新配置的通用计算设备。这种计算机程序可以存储在非瞬态有形计算机可读存储介质或任何类型的适合于存储电子指令的介质中,这些介质可以耦接到计算机系统总线。此外,本说明书中所提到的任何计算系统可以包括单个处理器或可以是采用多个处理器设计以获得增加的计算能力的架构。
实施例还可以涉及由本文中所描述的计算过程产生的产品。这种产品可以包括由计算过程产生的信息,其中信息存储在非瞬态有形计算机可读存储介质上并可以包括本文中所描述的计算机程序产品或其他数据组合的任何实施例。
在阅读本公开后,本领域技术人员将通过本文中的所公开的原理了解用于使用设备特定元数据进行音频增强的系统和过程的又一些备选结构和功能设计。因此,虽然已说明并描述了特定实施例和应用,但是应理解,所公开的实施例不限于本文中所公开的精确构造和组件。在不脱离随附权利要求书中所限定的精神和范围的情况下,可以在本文中所公开的方法和装置的布置、操作和细节方面进行对于本领域技术人员而言显而易见的各种修改、改变和变型。
最后,说明书中所使用的语言主要是出于可读性和指导性目的来进行选择的,并且其可以不是为了描述或约束专利权而选择的。因此,专利权的范围旨在不受此详细描述的限制,而是受根据基于此的申请而发布的任何权利要求的限制。因此,实施例的公开旨在作为对以下权利要求书中所阐述的专利权的范围的说明,而非限制。714指向设备。

Claims (33)

1.一种系统,包括:
电路系统,被配置为:
从音频信道生成正交分量,所述正交分量定义所述音频信道的正交表示;
通过应用正变换来生成旋转频谱正交分量,所述正变换将所述正交分量的频谱从标准基旋转到旋转基;
在所述旋转基上:
隔离目标频率处的所述旋转频谱正交分量中的分量;以及
通过将标度无关的非线性应用于经隔离的所述分量来生成加权相位相干谐波频谱正交分量;
通过应用逆变换来生成谐波频谱分量,所述逆变换将所述加权相位相干谐波频谱正交分量的频谱从所述旋转基旋转到所述标准基;
将所述谐波频谱分量与所述音频信道的所述目标频率之外的频率组合以生成输出信道;以及
向扬声器提供所述输出信道。
2.根据权利要求1所述的系统,其中所述谐波频谱分量包括与所述音频信道的所述目标频率不同的频率并在由所述扬声器呈现时产生所述目标频率的心理声学印象。
3.根据权利要求1所述的系统,其中:
所述正变换旋转所述正交分量的所述频谱,使得目标频率被映射到0Hz;以及
所述逆变换旋转所述加权相位相干谐波频谱正交分量的所述频谱,使得0Hz被映射到所述目标频率。
4.根据权利要求1所述的系统,其中所述目标频率是所述目标频率的中心频率。
5.根据权利要求1所述的系统,其中所述目标频率包括18Hz与250Hz之间的频率。
6.根据权利要求1所述的系统,其中所述目标频率低于所述谐波频谱分量的频率。
7.根据权利要求1所述的系统,其中所述电路系统还被配置为基于以下至少一项来确定所述目标频率:
所述扬声器的可再现范围;
所述扬声器的功耗的降低;或者
所述扬声器的增加的使用寿命。
8.根据权利要求1所述的系统,其中所述扬声器是移动设备的组件。
9.根据权利要求1所述的系统,其中所述电路系统还被配置为使用门函数来隔离目标幅度处的所述分量。
10.根据权利要求1所述的系统,其中所述电路系统还被配置为将平滑函数应用于经隔离的所述分量。
11.根据权利要求1所述的系统,其中所述标度无关的非线性包括具有经析出因数的幅度的第一类切比雪夫多项式的加权求和。
12.一种方法,包括:由电路系统:
从音频信道生成正交分量,所述正交分量定义所述音频信道的正交表示;
通过应用正变换来生成旋转频谱正交分量,所述正变换将所述正交分量的频谱从标准基旋转到旋转基;
在所述旋转基上:
隔离目标频率处的所述旋转频谱正交分量中的分量;以及
通过将标度无关的非线性应用于经隔离的所述分量来生成加权相位相干谐波频谱正交分量;
通过应用逆变换来生成谐波频谱分量,所述逆变换将所述加权相位相干谐波频谱正交分量的频谱从所述旋转基旋转到所述标准基;
将所述谐波频谱分量与所述音频信道的所述目标频率之外的频率组合以生成输出信道;以及
向扬声器提供所述输出信道。
13.根据权利要求12所述的方法,其中所述谐波频谱分量包括与所述音频信道的所述目标频率不同的频率并在由所述扬声器呈现时产生所述目标频率的心理声学印象。
14.根据权利要求12所述的方法,其中:
所述正变换旋转所述正交分量的所述频谱,使得目标频率被映射到0Hz;以及
所述逆变换旋转所述加权相位相干谐波频谱正交分量的所述频谱,使得0Hz被映射到所述目标频率。
15.根据权利要求12所述的方法,其中所述目标频率是所述目标频率的中心频率。
16.根据权利要求12所述的方法,其中所述目标频率包括18Hz与250Hz之间的频率。
17.根据权利要求12所述的方法,其中所述目标频率低于所述谐波频谱分量的频率。
18.根据权利要求12所述的方法,还包括:由所述电路系统基于以下至少一项来确定所述目标频率:
所述扬声器的可再现范围;
所述扬声器的功耗的降低;或者
所述扬声器的增加的使用寿命。
19.根据权利要求12所述的方法,其中所述扬声器是移动设备的组件。
20.根据权利要求12所述的方法,还包括:由所述电路系统使用门函数来隔离目标幅度处的所述分量。
21.根据权利要求12所述的方法,还包括:由所述电路系统将平滑函数应用于经隔离的所述分量。
22.根据权利要求12所述的方法,其中所述标度无关的非线性包括具有经析出因数的幅度的第一类切比雪夫多项式的加权求和。
23.一种非瞬态计算机可读介质,所述非瞬态计算机可读介质包括所存储的指令,所存储的所述指令在由至少一个处理器执行时将所述至少一个处理器配置为:
从音频信道生成正交分量,所述正交分量定义所述音频信道的正交表示;
通过应用正变换来生成旋转频谱正交分量,所述正变换将所述正交分量的频谱从标准基旋转到旋转基;
在所述旋转基上:
隔离目标频率处的所述旋转频谱正交分量中的分量;以及
通过将标度无关的非线性应用于经隔离的所述分量来生成加权相位相干谐波频谱正交分量;
通过应用逆变换来生成谐波频谱分量,所述逆变换将所述加权相位相干谐波频谱正交分量的频谱从所述旋转基旋转到所述标准基;
将所述谐波频谱分量与所述音频信道的所述目标频率之外的频率组合以生成输出信道;以及
向扬声器提供所述输出信道。
24.根据权利要求23所述的非瞬态计算机可读介质,其中所述谐波频谱分量包括与所述音频信道的所述目标频率不同的频率并在由所述扬声器呈现时产生所述目标频率的心理声学印象。
25.根据权利要求23所述的非瞬态计算机可读介质,其中:
所述正变换旋转所述正交分量的所述频谱,使得目标频率被映射到0Hz;以及
所述逆变换旋转所述加权相位相干谐波频谱正交分量的所述频谱,使得0Hz被映射到所述目标频率。
26.根据权利要求23所述的非瞬态计算机可读介质,其中所述目标频率是所述目标频率的中心频率。
27.根据权利要求23所述的非瞬态计算机可读介质,其中所述目标频率包括18Hz与250Hz之间的频率。
28.根据权利要求23所述的非瞬态计算机可读介质,其中所述目标频率低于所述谐波频谱分量的频率。
29.根据权利要求23所述的非瞬态计算机可读介质,其中所述指令还将所述至少一个处理器配置为基于以下至少一项来确定所述目标频率:
所述扬声器的可再现范围;
所述扬声器的功耗的降低;或者
所述扬声器的增加的使用寿命。
30.根据权利要求23所述的非瞬态计算机可读介质,其中所述扬声器是移动设备的组件。
31.根据权利要求23所述的非瞬态计算机可读介质,其中所述指令还将所述至少一个处理器配置为使用门函数来隔离目标幅度处的所述分量。
32.根据权利要求23所述的非瞬态计算机可读介质,其中所述指令还将所述至少一个处理器配置为将平滑函数应用于经隔离的所述分量。
33.根据权利要求23所述的非瞬态计算机可读介质,其中所述标度无关的非线性包括具有经析出因数的幅度的第一类切比雪夫多项式的加权求和。
CN202080067848.XA 2019-08-08 2020-08-06 用于心理声学频率范围延伸的非线性自适应滤波器组 Active CN114467313B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962884607P 2019-08-08 2019-08-08
US62/884,607 2019-08-08
PCT/US2020/045137 WO2021026314A1 (en) 2019-08-08 2020-08-06 Nonlinear adaptive filterbanks for psychoacoustic frequency range extension

Publications (2)

Publication Number Publication Date
CN114467313A true CN114467313A (zh) 2022-05-10
CN114467313B CN114467313B (zh) 2023-04-14

Family

ID=74498116

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080067848.XA Active CN114467313B (zh) 2019-08-08 2020-08-06 用于心理声学频率范围延伸的非线性自适应滤波器组

Country Status (8)

Country Link
US (1) US11006216B2 (zh)
EP (1) EP3991169A4 (zh)
JP (1) JP7270836B2 (zh)
KR (1) KR102578008B1 (zh)
CN (1) CN114467313B (zh)
BR (1) BR112022002100A2 (zh)
TW (1) TWI740599B (zh)
WO (1) WO2021026314A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117678014A (zh) * 2021-07-08 2024-03-08 博姆云360公司 使用全通滤波器网络的仰角感知线索的无色生成
US11838732B2 (en) * 2021-07-15 2023-12-05 Boomcloud 360 Inc. Adaptive filterbanks using scale-dependent nonlinearity for psychoacoustic frequency range extension
CN117616780A (zh) * 2021-07-15 2024-02-27 博姆云360公司 用于心理声学频率范围扩展的使用尺度依赖非线性的自适应滤波器组

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020054683A1 (en) * 2000-11-08 2002-05-09 Jens Wildhagen Noise reduction in a stereo receiver
US20100063827A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Selective Bandwidth Extension
US20100290643A1 (en) * 2009-05-18 2010-11-18 Harman International Industries, Incorporated Efficiency optimized audio system
US20130044896A1 (en) * 2009-09-18 2013-02-21 Dolby International Ab Virtual Bass Synthesis Using Harmonic Transposition
US20140016792A1 (en) * 2012-07-12 2014-01-16 Harman Becker Automotive Systems Gmbh Engine sound synthesis system
US20140358560A1 (en) * 2013-05-29 2014-12-04 Qualcomm Incorporated Performing order reduction with respect to higher order ambisonic coefficients
CN104704855A (zh) * 2012-10-15 2015-06-10 杜比国际公司 用于减小基于换位器的虚拟低音系统中的延迟的系统及方法
US20160155448A1 (en) * 2013-07-05 2016-06-02 Dolby International Ab Enhanced sound field coding using parametric component generation
CN106941006A (zh) * 2015-11-19 2017-07-11 哈曼贝克自动系统股份有限公司 音频信号分离成谐波和瞬态信号分量和音频信号低音增强
CN110024419A (zh) * 2016-10-11 2019-07-16 Dts公司 用于不对称听觉传输音频再现的增益相位均衡(gpeq)滤波器和调谐方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI556227B (zh) * 2009-05-27 2016-11-01 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
PL2545551T3 (pl) * 2010-03-09 2018-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Poprawiona charakterystyka amplitudowa i zrównanie czasowe w powiększaniu szerokości pasma na bazie wokodera fazowego dla sygnałów audio
US8755447B2 (en) 2010-12-22 2014-06-17 Shure Acquisition Holdings, Inc. Wireless audio equipment using a quadrature modulation system
US9070361B2 (en) * 2011-06-10 2015-06-30 Google Technology Holdings LLC Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component
EP3742440B1 (en) 2013-04-05 2024-07-31 Dolby International AB Audio decoder for interleaved waveform coding
US10134412B2 (en) 2015-09-03 2018-11-20 Shure Acquisition Holdings, Inc. Multiresolution coding and modulation system
US9641191B1 (en) * 2015-11-12 2017-05-02 Guzik Technical Enterprises Digital down converter with equalization
CN108604454B (zh) * 2016-03-16 2020-12-15 华为技术有限公司 音频信号处理装置和输入音频信号处理方法
CN110832881B (zh) 2017-07-23 2021-05-28 波音频有限公司 立体声虚拟低音增强

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020054683A1 (en) * 2000-11-08 2002-05-09 Jens Wildhagen Noise reduction in a stereo receiver
US20060280310A1 (en) * 2000-11-08 2006-12-14 Sony Deutschland Gmbh Noise reduction in a stereo receiver
US20100063827A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Selective Bandwidth Extension
US20100290643A1 (en) * 2009-05-18 2010-11-18 Harman International Industries, Incorporated Efficiency optimized audio system
CN102197662A (zh) * 2009-05-18 2011-09-21 哈曼国际工业有限公司 效率优化的音频系统
US20130044896A1 (en) * 2009-09-18 2013-02-21 Dolby International Ab Virtual Bass Synthesis Using Harmonic Transposition
US20140016792A1 (en) * 2012-07-12 2014-01-16 Harman Becker Automotive Systems Gmbh Engine sound synthesis system
CN104704855A (zh) * 2012-10-15 2015-06-10 杜比国际公司 用于减小基于换位器的虚拟低音系统中的延迟的系统及方法
US20140358560A1 (en) * 2013-05-29 2014-12-04 Qualcomm Incorporated Performing order reduction with respect to higher order ambisonic coefficients
US20160155448A1 (en) * 2013-07-05 2016-06-02 Dolby International Ab Enhanced sound field coding using parametric component generation
CN106941006A (zh) * 2015-11-19 2017-07-11 哈曼贝克自动系统股份有限公司 音频信号分离成谐波和瞬态信号分量和音频信号低音增强
CN110024419A (zh) * 2016-10-11 2019-07-16 Dts公司 用于不对称听觉传输音频再现的增益相位均衡(gpeq)滤波器和调谐方法

Also Published As

Publication number Publication date
US20210044898A1 (en) 2021-02-11
CN114467313B (zh) 2023-04-14
WO2021026314A1 (en) 2021-02-11
KR20220044566A (ko) 2022-04-08
TWI740599B (zh) 2021-09-21
TW202111691A (zh) 2021-03-16
KR102578008B1 (ko) 2023-09-12
US11006216B2 (en) 2021-05-11
EP3991169A1 (en) 2022-05-04
EP3991169A4 (en) 2023-07-12
JP2022543849A (ja) 2022-10-14
JP7270836B2 (ja) 2023-05-10
BR112022002100A2 (pt) 2022-04-12

Similar Documents

Publication Publication Date Title
CN114467313B (zh) 用于心理声学频率范围延伸的非线性自适应滤波器组
TWI765325B (zh) 使用頻譜正交音訊分量之副頻帶空間及串擾處理
Lecomte et al. Cancellation of room reflections over an extended area using Ambisonics
KR102698128B1 (ko) 심리음향 주파수 범위 확장을 위해 스케일 의존적 비선형성을 사용하는 적응형 필터뱅크
CN117616780A (zh) 用于心理声学频率范围扩展的使用尺度依赖非线性的自适应滤波器组
TWI727605B (zh) 用於音訊處理之系統,方法以及非暫時性電腦可讀媒體

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant