CN113259811B - 用于检测音调的方法和音频处理单元及其用途 - Google Patents
用于检测音调的方法和音频处理单元及其用途 Download PDFInfo
- Publication number
- CN113259811B CN113259811B CN202110162459.1A CN202110162459A CN113259811B CN 113259811 B CN113259811 B CN 113259811B CN 202110162459 A CN202110162459 A CN 202110162459A CN 113259811 B CN113259811 B CN 113259811B
- Authority
- CN
- China
- Prior art keywords
- audio
- audio signal
- frequency
- filter
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 238000012545 processing Methods 0.000 title claims abstract description 28
- 230000005236 sound signal Effects 0.000 claims abstract description 321
- 238000004458 analytical method Methods 0.000 claims abstract description 184
- 238000013507 mapping Methods 0.000 claims abstract description 62
- 230000001131 transforming effect Effects 0.000 claims abstract description 4
- 238000001914 filtration Methods 0.000 claims description 45
- 230000000007 visual effect Effects 0.000 description 14
- 230000001419 dependent effect Effects 0.000 description 9
- 238000007620 mathematical function Methods 0.000 description 9
- 230000002238 attenuated effect Effects 0.000 description 8
- 238000005259 measurement Methods 0.000 description 4
- 230000010363 phase shift Effects 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000010355 oscillation Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000010223 real-time analysis Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/04—Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/02—Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/12—Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02163—Only one microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/03—Synergistic effects of band splitting and sub-band processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/45—Prevention of acoustic reaction, i.e. acoustic oscillatory feedback
- H04R25/453—Prevention of acoustic reaction, i.e. acoustic oscillatory feedback electronically
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R27/00—Public address systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明的实施例涉及一种用于检测输入音频信号的突出音调的方法。所述方法包括以下步骤:基于所述输入音频信号建立第一分析音频信号;基于所述输入音频信号建立第二分析音频信号,其中通过将分析音频滤波器应用于所述输入音频信号来建立所述第一分析音频信号和所述第二分析音频信号中的一分析音频信号;比较所述第一分析音频信号和所述第二分析音频信号以获得能级对比;以及通过由对比‑频率映射函数转换所述能级对比来确定所述突出音调的表示。根据本发明的其他实施例,还提供了用于检测输入音频信号的突出音调的音频处理单元以及音频处理单元的用途。
Description
技术领域
本发明涉及一种用于检测音频信号的音调的方法。本发明还涉及一种用于检测音频信号的音调的音频处理单元以及音频处理单元的用途。
背景技术
存在用于检测音频信号的音调或突出音调的各种方法。一个实例是使用频率计数器,所述频率计数器可以简单地对固定时间段内的振荡周期数进行计数。然而,这种方法容易出现错误,例如,如果信号中存在第一泛音(overtone),则频率计数器可能会检测到两倍的振荡。另一方法是使用频谱分析仪,所述频谱分析仪可以是,例如基于对音频信号执行傅里叶变换。然而,此种分析可能相对较慢和/或可能需要较大程度的计算能力。第三种方法是使用许多单独的带通滤波器来隔离许多个别频率段,这又可能需要实施大量组件或大量处理能力。
发明内容
本发明人已经发现与检测音频信号的音调有关的上述问题和挑战,并且随后做出可以改进此种检测的下述发明。
本发明涉及一种用于检测输入音频信号的突出音调的方法,所述方法包括以下步骤:
基于所述输入音频信号建立第一分析音频信号;
基于所述输入音频信号建立第二分析音频信号,其中通过将分析音频滤波器应用于所述输入音频信号来建立所述第一分析音频信号和所述第二分析音频信号中的一分析音频信号;
比较所述第一分析音频信号和所述第二分析音频信号以获得能级对比;以及
通过由对比-频率映射函数转换所述能级对比来确定所述突出音调的表示。
在本发明的示例性实施例中,音频处理单元有助于本发明的方法。提供由单个突出音调控制的输入音频信号。例如,所述输入音频信号可以是来自演奏单乐音的乐器的音频信号。第一分析音频滤波器和第二分析音频滤波器应用于所述输入音频信号,以生成第一分析音频信号和第二分析音频信号。第一音频滤波器是居中于40Hz的带通滤波器,并且第二音频滤波器是居中于80Hz的带通滤波器。如果突出音调位于大约40Hz,则第一滤波器基本上不会衰减输入音频信号以生成第一分析音频信号,而第二带通滤波器基本上会将输入音频信号衰减例如20dB以生成第二分析音频信号。类似地,如果突出音调位于大约80Hz,则第一音频滤波器基本上会衰减输入音频信号以生成第一分析音频信号,而第二音频滤波器基本上不会衰减输入音频信号以生成第二分析音频信号。一般来说,如果突出音调位于两个滤波器的中心频率之间的任何位置,则第一和第二分析音频信号将组合地包含输入音频信号的唯一相对衰减。可以分析频率与相对衰减之间的这种唯一关系,以获得突出音调的表示。比较第一分析音频信号和第二分析音频信号,以获得指示相对衰减的能级对比。例如,这可以简单地通过测量第一音频信号的能级和第二音频信号的能级,并将它们相减以获得其能级之间的差来实施。然后可以通过对比-频率映射函数将能级对比转换为突出音调的表示,所述对比-频率映射函数优选地指示突出音调的相对衰减与频率之间的关系。例如,突出音调的表示可以指示突出音调的频率。或者,它可以仅仅是二进制信号,例如,指示输入音频信号中是否存在特定频率间隔内的突出音调的信号。
因此,本发明允许检测输入音频信号的突出音调。在现有技术中,存在用于检测突出音调的各种其它方法。相比之下,本发明可以提供突出音调的表示,所述突出音调可能较不容易出现错误,与输入音频信号的音量无关,实施起来更快且更便宜,实施起来更容易和/或可能需要较少的计算能力。通过本发明的各种实施例,可以不同程度地并且以不同的组合实现这些优点或其它优点中的一些。
因此,本发明可用于需要检测突出音调的应用中,例如以对乐器进行调音,检测例如不期望的音频反馈等的音频反馈以及进行一般音频分析。音频反馈也可以称为声反馈或拉森效应。然而,应注意,本发明不限于任何特定应用。
附图说明
将在下文中参考附图描述本发明的各种实施例,其中
图1a-图1b说明本发明的实施例以及所述实施例的分析音频滤波器的相关联视觉表示;
图2基于两个分析音频滤波器说明本发明的实施例;
图3说明根据本发明的实施例的方法步骤的视觉表示;
图4基于两个分析音频滤波器和三个分析音频信道说明本发明的实施例;
图5基于三个分析滤波器和两个能级对比说明本发明的实施例;
图6基于三个分析滤波器、三个能级对比和加权平均单元说明本发明的实施例;
图7a-图7b说明两个分析音频滤波器的视觉表示以及相对衰减的相关联表示;
图8a-图8b说明三个分析音频滤波器的视觉表示以及相对衰减的两个表示,以及
图9a-图9c说明各种其它分析音频滤波器组合的视觉表示。
参考符号列表:
1 音频处理单元
2 音频信号输入
3 输入音频信号
4a-4c 滤波单元
5a-5c 分析音频信号
6a-6c 能级检测器
7a-7c 能级
8a-8c 能级比较器
9a-9c 能级对比
10a-10c 频率映射单元
11 突出音调的表示
12a-12c 试验性频率
13 加权平均单元
14a-14c 分析音频信道
15a-15e 能级衰减的频率表示
16 对比-频率映射函数
S1-S4 方法步骤
具体实施方式
下文将给出本发明的各种概念,不限于参考特定实施例的情况。
输入音频信号是音频信号的一种类型,例如,可以将其理解为表示可听声音的数字或模拟信号的类型。音频输入信号可以是,例如适合于任选地通过放大、转换(例如,数模转换)或其它处理的一个或多个中间步骤,提供给扬声器。例如,可以通过音频信号输入(例如,有线或无线连接),将输入音频信号提供给音频信号源。例如,还可以经由记录输入音频信号所基于的声音的麦克风,或经由数字存储装置提供输入音频信号。
典型的音频信号可以由若干个频率组成。例如,这可以通过信号的傅里叶变换来证明。突出音调可以被理解为音频信号的频率分量,其中例如由于较高振幅,所述频率分量与所述音频信号的其它频率至少部分地可区分。具有可区分频率的音频信号的一个实例是基于在乐器上演奏乐音的音频信号。此音频信号可以包括,例如自然频率/基本频率以及若干谐波频率两者,在这种情况下,突出音调将是在所分析的频带内具有最高水平的频率分量。在音频系统中发生谐振或相长干涉的情况下,例如在经历音频反馈时,可能在谐振频率处出现突出音调。由单个音调组成的音频信号被视为此音频信号的突出音调。对于包括若干频率分量的音频信号,例如音乐、语音、最天然存在的声音、噪声等,当特定频率分量的水平与其它频率分量或背景噪声至少部分地可区分开时,则可以将所述频率分量视为突出音调。
一些音频信号由在振幅和相位上动态地变化的连续频率组成。在此类情况下,突出音调在频谱中可能无法清楚地区分。在本发明的一些实施例中,例如通过实施附加滤波器,特别小心地分析此类复杂音频信号仍然可以提供突出音调的准确表示。一般来说,本发明的实施例不限于分析音频信号的特定类型或提供突出音调的特定类型的表示,因为即使通过使用合适的处理和分析工具也可以从复杂的音频信号中提取突出音调的有用表示。然而,为了不因不必要的细节而使本发明的描述不清楚,将主要以简单的音频信号为例来说明输入音频信号的分析。还应注意,在本发明的一些实施例中,可以独立于音频信号的复杂性来提供突出音调的表示,但是对于足够复杂的音频信号,可能会降低准确度或精度。
优选地,通过频率或音调名称指示的突出音调的表示,例如可以是数字表示、模拟表示、视觉指示或实际声波。
分析音频滤波器可以被理解为音频滤波器,所述音频滤波器例如可以是频率相关的放大器电路,在高达例如20kHz的可听频率范围内工作。因此,分析音频滤波器通常可以提供频率相关的放大、衰减、通过和/或相移。音频滤波器可以例如实施为数字电路、模拟电路,和/或被编程到例如数字信号处理器的可编程单元上。音频滤波器的实例是低通滤波器、高通滤波器、带通滤波器和全通滤波器。音频滤波器可以在音频滤波器单元中实施,所述音频滤波器单元可以被理解为物理电路或以数字方式编程的实体。
当将音频滤波器应用于音频信号时,可以将其解释为另一音频信号的生成,例如,将分析音频滤波器应用于输入音频信号可能会导致生成分析音频信号,例如第一或第二分析音频信号。尽管通常对至少一个分析音频滤波器进行滤波,但是分析音频信号不限于滤波后的信号。例如,第一和第二分析音频信号中的一个可以是滤波后的信号,而另一个不是。
能级对比(energy level contrast)可以被理解为两个音频信号的能级之间的差异。音频信号的能级可以是,例如RMS平均值、峰值、音频信号的平方的平均值,或音频信号的包络线的平均值。音频信号的能级还可以是与音频信号的功率电平相关或指示音频信号的功率电平。通常,能级可以指示音频信号的衰减。例如,如果音频信号已通过音频滤波器衰减,则所述音频信号的能级低于音频信号尚未衰减时的能级。例如相对于一些参考能量/强度/音频音量,能级可以例如通过dB量化。
通过比较两个音频信号而获得的能级对比,例如可以作为两个信号的能级之间的比率或减法来获得。能级对比不一定需要明确地计算两个能级,而是可以通过,例如比较两个音频信号来获得。能级对比可以是,例如从两个音频信号的比率获得。或者,可以通过明确地计算第一音频信号的(第一)能级和第二音频信号的(第二)能级来获得能级对比。例如,可以通过能级检测器促进检测音频信号的能级。能级比较器例如可以促进获得能级对比,所述能级比较器可以使用例如两个音频信号或两个能级作为输入。
对比-频率映射函数可以被理解为物理或数字单元,所述物理或数字单元可用于将能级对比转换为突出音调的对应表示。在本发明的典型实施例中,由于不同的分析音频滤波器,因此能级对比至少在一些频率范围内取决于突出音调的频率。对比-频率映射函数可以基于这种取决相关性。例如,对比-频率映射函数可以是分段数学函数的查找表。例如,它可以在频率映射单元中实施。
在本发明的一些实施例中,对比-频率映射函数可以具有若干能级对比作为输入,例如,来自第一和第二分析音频信号的能级对比,以及来自第二和第三分析音频信号的能级对比。
下文参考图式描述本发明的各种实施例。
图1a-图1b说明本发明的实施例以及所述实施例的分析音频滤波器的相关联视觉表示。具体来说,图1a说明实施例的示意性图示,而图1b说明所述实施例的滤波单元4a对音频信号的能量的频率相关效应。
音频处理单元1的实施例,例如,至少部分地使用数字信号处理器实施的音频处理单元。音频处理单元1例如从音频信号输入接收输入音频信号3。在此示例性描述中,输入音频信号3包括突出音调。
此输入音频信号分成两个分析路径:第一分析音频信道14a和第二分析音频信道14b。在第一分析路径中,将输入音频信号提供给应用分析音频滤波器的滤波单元4a。在此示例性实施例中,滤波单元4a被布置成,将低通滤波器应用于输入音频信号以建立第一分析音频信号5a。在第二分析音频信道14b中,输入音频信号3用作第二分析音频信号5b。因此,第一分析音频信号5a与第二分析音频信号5b之间的差,源于信号已进行的滤波。
在图1b中详述滤波器的效应。横轴是以Hz为单位的频率轴,而竖轴是以dB为单位的能级轴。滤波单元4a施加到音频信号的频率相关效应,说明为能级衰减15a的第一频率表示。由于滤波单元是低通滤波器,因此所述滤波单元在低于大约50Hz的低频率下最低限度地衰减信号。然而,频率高于50Hz时,衰减会出现,并且频率越高,衰减越大。因此,经由第一分析音频信道14a和滤波单元4a传播到能级比较器8a的输入音频信号3,将根据能级衰减15a的所示第一频率表示,基于所述音频信号的频率而进行衰减。相反,经由第二分析音频信道14b传播到能级比较器8a的输入音频信号3,将不会被衰减。换句话说,所述输入音频信号将根据能级衰减的所示第二频率表示15b来进行衰减,所述第二频率表示是在0dB处的与频率无关的线。
将第一分析音频信号5a和第二分析音频信号5b都供应到能级比较器8a,所述能级比较器被布置成比较两个信号5a、5b,以获得两个信号的能级对比。一般来说,如果两个信号的能量不同,则这可以通过能级对比指示。确切的细节取决于滤波器的类型以及如何精确地计算能级对比,这在不同的实施例之间有所不同。
在此实施例中,生成两个分析音频信号5a、5b的比率并且测量所得比率的RMS平均值。
将获得的能级对比9a供应到频率映射单元10a。此处,能级对比9a经由对比-频率映射函数转换成突出音调11的表示,例如,突出音调的频率表示。对比-频率映射函数通常可以进行预编程并且基于实施例的滤波器选择。例如,对比-频率映射函数可以基于与图1b中所示的图式类似的图。对比-频率映射函数应优选地能够经由,例如查找表或数学函数,将供应的差异转换成对应频率。
因此,实施例能够将供应的输入音频信号分析成突出音调11的表示。
例如,如果输入音频信号3由大约100Hz频率处的突出音调控制,则与输入音频信号3相比,第一分析音频信号5a衰减大约6dB。第二分析音频信号5b不会衰减,因此所述第二分析音频信号与输入音频信号的差为0dB。能级比较器8a比较两个信号5a、5b的能级,以获得大约6dB的能级对比9a。将此能级对比9a供应到频率映射单元10a,所述频率映射单元经由查找表将差异9a转换成突出音调的频率表示。此查找表指示大约6dB的能级对比必须对应于大约100Hz的突出音调的频率。因此,突出音调11的表示可以是供应给用户或用于进一步音频分析的100Hz的数字或模拟表示。应注意,在这种情况下,如果改变输入音频信号的音频音量,则所获得的能级对比以及因此突出音调的表示在很大程度上不受影响。
例如,如果输入音频信号由大约200Hz的频率处的突出音调控制,则分析过程类似,但能级差为大约17dB,频率映射单元可以将所述能级差转换为大约200Hz的表示。
应注意,此具体实施例受限于以下范围:低于大约50Hz的频率经历大约相同的衰减,因此无法将此衰减精确地映射成频率。此外,在输入音频信号的足够大频率和足够小音量下,输入音频信号3可能会由滤波单元4a衰减到无法获得能级对比9a的程度,所述能级对比真正指示由于分析音频信号的较差信噪比而产生的频率。因此,根据输入音频信号3的音量,此实施例主要对于大约50Hz至大约500Hz的突出音调是准确的。然而,应注意,在本发明的范围内可以改变滤波器类型和配置,例如这可能导致其它频率限制,或甚至没有频率限制(例如,通过实施覆盖所有频率的大量唯一滤波器)。因此,本发明不限于任何特定频率范围。
图2基于两个分析音频滤波器4a、4b说明本发明的实施例。与图1a中所说明的实施例相比,图2中所说明的实施例进一步包括第二滤波单元4b,使得第一分析音频信道14a具有第一滤波单元4a并且第二分析音频信道14b具有第二滤波单元14b。此外,实施例具有在第一滤波单元4a与能级比较器8a之间的第一能级检测器6a,作为第一分析音频信道14a的一部分,以及在第二滤波单元4b与能级比较器8a之间的第二能级检测器6b,作为第二分析音频信道14b的一部分。此外,实施例具有用于提供输入音频信号3的显式音频信号输入2。通常,音频信号输入2可以是,例如有线连接、无线连接、麦克风或数据存储装置。在此实施例中,输入2是基于麦克风。
在此实施例中,因此输入音频信号3通过第一滤波单元4a和第二滤波单元4b单独地滤波。两个滤波单元4a、4b在应用不同的分析音频滤波器的意义上是不同的。例如,它们都可以应用具有相同质量因数(Q),但具有不同滤波器中心频率的带通滤波器。
将两个单独的滤波器应用于输入音频信号3扩大了所述方法的灵活性。例如,可以实施两个单独的滤波器以提高精度、准确度或所述方法能够提供突出音调的准确表示的频率范围。
将输入音频信号3供应给第一滤波单元4a建立第一分析音频信号5a,并且类似地,将输入音频信号3供应给第二滤波单元4b建立第二分析音频信号5b。分别将第一分析音频信号5a和第二分析音频信号5b提供给第一能级检测器6a和第二能级检测器6b。这些能级检测器6a、6b中的每一个能够测量所供应的分析音频信号以检测所述信号的能级。因此,两个能级检测器6a、6b测量分析音频信号5a、5b以提供两个单独的能级7a、7b。
将两个能级7a、7b供应到能级比较器,所述能级比较器将能级7a、7b相比较以获得能级对比9a。例如,如果第一能级是大约-7dB并且第二能级是大约-15dB,则能级差可以是大约8dB。
如先前所解释,当已获得所获得的能级对比9a时,其可以由频率映射单元10a转换以确定突出音调11的表示。
图3说明根据本发明的实施例的方法步骤的视觉表示。本发明的此实施例能够检测输入音频信号的突出音调并且包括四个方法步骤S1-S4。然而,应注意,本发明的实施例不限于这些特定方法步骤。
在第一步骤S1中,基于输入音频信号建立第一分析音频信号。
在下一步骤S2中,基于输入音频信号建立第二分析音频信号。通过将分析音频滤波器应用于输入音频信号来建立第一分析信号和第二分析信号的信号。例如,另一信号可以是输入音频信号。例如,可以通过将分析音频滤波器应用于输入音频信号来建立第一分析音频信号,而第二分析音频信号是输入音频信号。或者,例如,可以通过将分析音频滤波器应用于输入音频信号来建立第二分析音频信号,而第一分析音频信号是输入音频信号。
尽管建立第一和第二分析音频信号的两个步骤S1、S2被展示为单独的步骤,但是这两个步骤也可以并行地执行。
下一步骤,比较第一分析音频信号和第二分析音频信号以获得能级对比。
下一步骤,通过由对比-频率映射函数转换能级对比来确定突出音调的表示。
在本发明的一些实施例中,所述方法在连续地重复执行的步骤的电路或处理器上实施。可以至少部分地并行执行所述步骤中的任一个。
图4基于两个分析音频滤波器4a、4c和三个分析音频信道14a、14b、14c说明本发明的实施例。
将来自音频信号输入2的输入音频信号3供应到所有三个分析音频信道14a、14b、14c。第一分析音频信道14a具有第一滤波单元4a,所述第一滤波单元对输入音频信号3进行滤波以建立第一分析音频信号5a。在第二分析音频信道14b中,输入音频信号用作第二分析音频信号5b。最后,第三分析音频信道14c具有第三滤波单元4c,所述第三滤波单元对输入音频信号进行滤波以建立第三分析音频信号5c。
特定滤波单元还可以称为特定分析音频信道或特定音频信号的滤波单元。例如,第三滤波单元5c还可以称为第三分析音频信道14c的滤波单元或第三分析音频信号5c的滤波单元。
在实施例中,将第一分析音频信号5a和第二分析音频信号供应到第一能级比较器8a,所述第一能级比较器将信号相比较以获得第一能级对比9a。另外,将第二分析音频信号和第三分析音频信号供应到第二能级比较器8b,所述第二能级比较器将信号相比较以获得第二能级对比9b。获得第二能级对比9b可以补充获得第一能级对比9a。例如第二能级对比可以具有不同频率范围,在所述频率范围中,所述第二能级对比适合于确定主音调的表示。
将第一能级对比9a和第二能级对比9b都供应到频率映射单元10a,所述频率映射单元能够基于差异9a、9b确定突出音调11的表示。例如,频率映射单元可以应用高维查找表以将差异9a、9b转换成突出音调11的表示。
图5基于三个分析滤波器4a、4b、4c和两个能级对比说明本发明的实施例。此实施例基本上类似于图4的实施例。然而,图5的实施例进一步包括第二滤波单元。因此,第二分析音频信道14b包括第二滤波单元4b,所述第二滤波单元对输入音频信号3进行滤波以建立第二分析音频信号5b。一旦建立了第一分析音频信号5a、第二分析音频信号5b和第三分析音频信号5c,这些信号就由两个能级比较器8a、8b进行处理以获得两个能级对比9a、9b,又将两个能级对比提供到频率映射单元以确定突出音调11的表示。
图6基于三个分析滤波器4a、4b、4c、三个能级对比9a、9b、9c和加权平均单元13说明本发明的实施例。
通过将输入音频信号3供应到三个单独的滤波单元4a、4b、4c来建立三个分析音频信号5a、5b、5c。随后,分别将第一分析音频信号5a、第二分析音频信号5b和第三分析音频信号5c供应到第一能级检测器6a、第二能级检测器6b和第三能级检测器6c,以分别检测第一能级7a、第二能级7b和第三能级7c。
第一能级7a和第二能级7b在第一能级比较器8a中相比较以获得第一能级对比9a,第二能级7b和第三能级7c在第二能级比较器8b中相比较以获得第二能级对比9b,并且第一能级7a和第三能级7c在第三能级比较器8c中相比较以获得第三能级对比9c。
将三个单独的能级对比9a、9b、9c中的每一个供应到单独的频率映射单元10a、10b、10c。因此,第一能级对比9a通过第一频率映射单元10a转换成第一试验性频率12a,第二能级对比9b通过第二频率映射单元10b转换成第二试验性频率12b,并且第三能级对比9c通过第三频率映射单元10c转换成第三试验性频率12c。
例如,三个频率映射单元10a、10b、10c中的每一个可以应用对比-频率映射函数。优选地,给定的对比-频率映射函数可以至少部分地匹配其输入所基于的滤波器单元的组合频率相关性。
将三个试验性频率12a、12b、12c都供应到加权平均单元,所述加权平均单元被布置成确定三个试验性频率的加权平均值。例如,加权平均值的权重可以取决于输入的试验性频率12a、12b、12c。随后可以基于加权平均值建立突出音调11的表示。
通过具有三个试验性频率和加权平均值,可以改进精度、准确度或方法可适用的频率范围。
图7a-图7b说明两个分析音频滤波器的视觉表示以及相对衰减的相关联表示。如在图1b中,横轴是以Hz为单位的频率轴,而竖轴是以dB为单位的能级轴。相比于图1b,图7a中的视觉表示对应于例如实施为图2中所说明的实施例中的第一和第二滤波单元的两个(不是一个)分析音频滤波器。在图7a中,能级衰减的两个频率表示15a、15b对应于具有大约41Hz和82Hz的相应中心滤波器频率的带通滤波器。
两个滤波器可以应用于包括突出音调的输入音频信号的相对衰减,在图7b中说明为频率表示15c。在低于大约58Hz时相对衰减大于0,并且在高于大约58Hz时相对衰减小于0dB。这反映在低于此频率时第一频率表示15a在衰减轴上高于第二频率表示15b,且反之亦然。
例如,通过对于各种实施例,相对衰减可以是能级对比的基础。在由中心滤波器频率确定的估计频率范围中,频率表示15c显示线性斜率。此线性斜率可以用于使用对比-频率映射函数16将能级对比转换成突出音调的表示。在此示例性图示中,映射函数16简单地为直线(然而,是在非线性标度上)。因此,例如,可以通过映射函数16将大约8dB的相对衰减转换成50Hz的频率。
应注意,此示例性映射函数16不是在滤波器中心频率之外的相对能级衰减15c的频率表示的准确表示。由两个中心滤波器频率确定的估计范围可因此构成有效频带。
在其它实施例中,一个或多个映射函数可以用于还获得在滤波器单元/分析音频滤波器的滤波器中心频率之外的突出音调的准确表示。
图8a-图8b说明三个分析音频滤波器的视觉表示以及相对衰减的两个表示。图8a类似于图7a,不同之处在于,图8a的视觉表示对应于例如实施为图5中所说明的实施例中的第一、第二和第三滤波单元的三个滤波单元。在图8a中,能级衰减的三个频率表示15a、15b、15c对应于具有大约41Hz、82Hz和165Hz的相应中心滤波器频率的带通滤波器。
在图8b中,说明与能级衰减的第一频率表示15a和第二频率表示15b施加的衰减差相对应的第一相对衰减15d。此外,说明与能级衰减的第二频率表示15a和第三频率表示15b施加的衰减差相对应的第二相对衰减15e。图8b中的第一表示15d和第二表示15e各自在单独的频率范围中具有陡峭斜率。因此,对应于图8a中的第一表示15a和第二表示15b的第一对滤波器,可以在第一频率范围中提供突出音调的频率的准确测量,而对应于图8a中的第二表示15b和第三表示15c的第二对滤波器,可以在第二频率范围中提供突出音调的频率的准确测量。例如可以由频率映射单元或通过加权平均值组合这些不同的最佳频率范围。
图8a-图8b还可以解释用于选择音频分析信号进行进一步处理以获得突出频率的表示的一种方法。例如,基于示例性频率表示15a-15e,仅需要能级衰减的第一频率表示15a和第二频率表示15b以获得在大约41Hz至82Hz的频率范围中的突出音调,同时可以省略第三频率表示15c。类似地,仅需要能级衰减的第二频率表示15b和第三频率表示15c就可以获得在大约42Hz至165Hz的频率范围中的突出音调,同时可以省略第一频率表示15a。可以简单地通过比较分析音频信号的能级来确定哪个频率范围是正确的,并因此确定要使用什么分析音频信号和能级对比。例如,如果通过第一频率表示15a可视化的第一分析音频信号的能级大于通过第三频率表示15c可视化的第三分析音频信号的能级,则相关频率范围低于82Hz并且可以相应地执行处理。类似地,如果第一分析音频信号的能级低于第一分析音频信号的能级,则频率范围高于82Hz。
图9a-图9c说明各种其它分析音频滤波器组合的视觉表示。每个子图说明任意频率轴的横轴上以及在任意能级轴的竖轴上的表示。
图9a说明在本发明的实施例中使用多个低通滤波器。每一个别滤波器可以与另一更高截止频率的滤波器组合使用,以确定频率范围中的突出音调的表示。例如,通过类似于关于图1a-图1b描述的方式。通过具有多个低通滤波器而不是单个低通滤波器,可以组合个别频率范围以覆盖任何任意的频率范围。例如,第一滤波器的图示为最左边的表示15a,其可以与图示为具有更高截止频率的表示15b-15e的任一其它滤波器组合地覆盖第一频率范围。随后,图示中下一表示15b的第二滤波器可以与具有更高截止频率的表示15c-15e的任一其它滤波器组合地覆盖下一频率范围等。
例如,在本发明的实施例中,通过截止频率20Hz、100Hz、500Hz、2500Hz和12500Hz实施至少五个单独的低通滤波器。例如,此类滤波器可以具有如在图9a中通过表示15a、15b、15c、15d和15e可视化的频率相关性。由第一表示15a表示的第一滤波器可以与由第三表示15c表示的第三滤波器组合地用于覆盖20Hz至100Hz的频率范围。由第二表示15b表示的第二滤波器可以与由第四表示15d表示的第四滤波器组合地用于覆盖100Hz至500Hz的频率范围等。此类实施例还可以任选地基于未滤波的输入音频信号以用于比较分析音频信号。
在其它实施例中,可以使用高通滤波器而不是低通滤波器实施类似原理。
图9b说明低通滤波器15a、带通滤波器15b和高通滤波器15c可以在本发明的实施例中组合。
图9c说明还可以如何组合多个带通滤波器以覆盖任何任意的频率范围。
在下文中,在不参考特定实施例的情况下展示本发明的各种实施例。
在本发明的实施例中,通过将所述分析音频滤波器应用于所述输入音频信号来建立所述第一分析音频信号。
在本发明的实施例中,所述第二分析音频信号是所述输入音频信号。
在本发明的实施例中,所述方法包括经由输入麦克风记录所述输入音频信号的步骤。
经由输入麦克风记录输入音频信号有利地允许实时分析。
在本发明的实施例中,所述方法包括提供所述输入音频信号的步骤。
提供输入音频信号不限于任何特定方法。例如,可以经由数据存储装置、有线连接、无线连接、输入麦克风等提供所述输入音频信号。
在本发明的实施例中,所述输入音频信号至少部分地由所述突出音调控制。
具有至少部分地由所述突出音调控制的输入音频信号可以有利地改进突出音调的表示的精度或准确度。
在本发明的实施例中,与所述输入音频信号的功率电平相比,所述突出音调具有大于功率电平阈值的功率电平。
在本发明的实施例中,所述功率电平阈值是至少1dB,例如至少3dB,例如至少6dB,例如至少10dB,例如至少20dB。
对于一些实施例,功率电平阈值可以被理解为在可以成功地应用所述方法之前,突出音调应具有的最小功率电平。可以相对于输入音频信号的功率电平,例如输入音频信号的平均功率电平,或输入音频信号的特定频率分量的功率电平,以定义功率电平阈值。例如,此类特定频率分量可以是在应用所述方法的特定频率分析窗口内的频率分量。
例如,在本发明的实施例中,功率电平阈值是6dB。如果输入音频信号具有功率电平-10dB,则在所述方法可以成功地找到突出频率的准确表示之前,突出音调应该具有功率电平-4dB。
将突出音调限制为特定的功率电平是有利的,因为这使确定突出频率的不正确表示的风险最小化。
在本发明的实施例中,所述突出音调的所述表示是所述突出音调的频率表示。
频率表示有利地允许突出音调的频率用于进一步分析或提供给用户。
在本发明的实施例中,所述分析音频滤波器是第一分析音频滤波器,其中通过将所述第一分析音频滤波器应用于所述输入音频信号来建立所述第一分析音频信号,其中通过将第二分析音频滤波器应用于所述输入音频信号来建立所述第二分析音频信号,其中所述第一分析滤波器和所述第二分析滤波器不同。
使用两个不同的滤波器可以有利地对分析进行详细调整。例如,可以增加最佳频率范围的程序或可以改进精度或准确度。
在本发明的实施例中,将所述突出音调的所述表示提供给用户。
例如,可以经由电子视觉显示器、一个或多个LED、或一个或多个七段显示器或其它显示器将表示视觉上提供给用户。这有利地允许用户对确定的表示采取行动。可以实时地或延迟地提供所述表示。
在本发明的实施例中,所述音频输入信号基于来自乐器的声音,其中所述突出音调与所述乐器的音符相关联。
例如,检测与音符相关联的突出音调可以是对乐器进行调音或分析音频信号的动作的一部分。
在本发明的实施例中,所述突出音调与音频反馈相关联。
例如,当扬声器的声音输出取决于附近麦克风记录的声音时,可能会发生音频反馈。此处,麦克风所接收到的信号可以被放大并传递到扬声器,扬声器继而输出放大后的声音,麦克风随后可以再次接收到所述声音,从而构成反馈环路。此种音频反馈通常可以由单个突出音调控制,本发明的方法可以适合于识别所述突出音调。
在本发明的实施例中,比较所述第一分析音频信号和所述第二分析音频信号的所述步骤包括:比较第一能级和第二能级以获得所述能级对比,其中所述第一能级基于所述第一分析音频信号并且所述第二能级基于所述第二分析音频信号。
将比较基于能级可以有利地改进或简化比较。
在本发明的实施例中,所述方法包括测量所述第一分析音频信号以检测所述第一能级的步骤,以及测量所述第二分析音频信号以检测所述第二能级的步骤。
测量分析音频信号以检测其能级是确定能级的简单方法,因此由于简单性而为有利的。例如,此种测量可以通过单独的过程或单元,例如能级检测器执行。还可以将测量执行为比较第一和第二分析音频信号的集成部分。
在本发明的实施例中,比较所述第一能级和所述第二能级的所述步骤包括从所述第二能级减去所述第一能级以获得所述能级对比。
在本发明的实施例中,比较所述第一能级和所述第二能级的所述步骤包括计算所述第一能级与所述第二能级之间的比率以获得所述能级对比。
减法和比率的计算是比较能级的两个示例性方法,这由于其简单且为有利的。
在本发明的实施例中,所述对比-频率映射函数通过所述对比-频率映射函数将所述能级对比转换成所述突出音调。
在本发明的实施例中,所述对比-频率映射函数是查找表。
在本发明的实施例中,所述对比-频率映射函数是数学函数。
有利地,查找表和数学函数两者易于实施并且需要有限的计算功率。
其它对比-频率映射函数,例如第二或第三对比-频率映射函数还可以例如基于查询表和/或数学函数。
数学函数可以例如是线性函数或非线性函数。所述数学函数可以是分段数学函数。
在本发明的实施例中,所述分析音频滤波器具有滤波器中心频率。
对于带通滤波器,滤波器中心频率例如可以被理解为带通滤波器的中心频率和/或滤波器的衰减/增益具有极值点的频率。用于低通滤波器和高通滤波器,滤波器中心频率可以例如被理解为所述滤波器的截止频率。例如截止频率可以被定义为滤波器将输入信号衰减3dB的频率。
在本发明的实施例中,所述分析音频滤波器具有质量因数。
在本发明的实施例中,所述第一分析音频滤波器和所述第二分析音频滤波器各自具有滤波器中心频率,其中所述第二分析音频滤波器的所述滤波器中心频率和所述第一分析音频滤波器的所述滤波器中心频率的频率比为1至1000,例如1.1至100,例如1.5至50,例如2至20,例如10。
例如,滤波器中心频率可以是带通滤波器的中心频率,或高通滤波器或低通滤波器的截止频率。
具有不同滤波器中心频率可以有利地基于这些频率进行音频分析。
在本发明的示例性实施例中,第一分析滤波器具有20.60Hz的滤波器中心频率,并且第二分析滤波器具有164.8Hz的滤波器中心频率。因此,频率比为8。
具有分析音频滤波器的滤波器中心频率的指定频率比可以有利地为所述方法提供一定的最佳频率范围。
或者,在本发明的一些实施例中,第一和第二分析音频滤波器具有相同滤波器中心频率,但具有不同质量因数,或者它们可以是不同种类的滤波器。
在本发明的实施例中,所述第一分析音频滤波器和所述第二分析音频滤波器各自具有滤波器质量因数。
不同分析音频滤波器的滤波器质量因数可以相同,或者它们可以不同。
在本发明的实施例中,所述第一分析音频滤波器和所述第二分析音频滤波器中的任一个的所述质量因数为0.01至100,例如0.1至10,例如2或5。
在本发明的实施例中,所述方法与有效频带相关联,其中所述突出音调的所述表示的频率误差在所述有效频带内比在所述有效频带外小。
例如,频率误差可以与频率的准确度及/或精度成反比。例如,突出音调的频率表示可以不同于突出音调的实际频率,这可以通过频率误差参数化。
具有频率误差较小的频带有利于提供突出音调的精确和/或准确表示。
在本发明的实施例中,所述有效频带基于所述第一分析音频滤波器的所述滤波器中心频率和所述第二分析音频滤波器的所述滤波器中心频率。
将有效频带基于滤波器是有利的,因为随后可以选择滤波器的特性以确定频率误差。
在本发明的实施例中,所述方法包括至少一个辅助音频滤波器,所述至少一个辅助音频滤波器至少部分地衰减所述有效频带外的所述输入音频信号的音频频率。
一些实施例具有减小频率误差的有效频带。相反,在此有效频带外,频率误差可能更大。因此,在一些实施例中,所述方法可能不适用于检测有效频带外的突出音调。因此,实施至少一个辅助音频滤波器以衰减有效频带外的音频频率可以有利地减少不合需要的噪声。例如,此类辅助音频滤波器可以是高通滤波器或低通滤波器。
在本发明的实施例中,所述分析音频滤波器是带通滤波器。
在一些实施例中,第二分析音频滤波器是带通滤波器。
在本发明的实施例中,所述分析音频滤波器是高通滤波器。
在本发明的实施例中,所述分析音频滤波器是低通滤波器。
在本发明的实施例中,第二分析音频滤波器是高通滤波器或低通滤波器。
在本发明的一些实施例中,第一分析音频滤波器是高通滤波器并且第二分析音频滤波器是低通滤波器,或反之亦然。在本发明的一些实施例中,第一分析音频滤波器是带通滤波器,并且第二分析音频滤波器是高通滤波器或低通滤波器,或反之亦然。
在本发明的实施例中,所述分析音频滤波器是全通滤波器。
在本发明的一些实施例中,第二分析音频滤波器是全通滤波器。
全通滤波器可以被理解为应用频率相关相移的滤波器。在具有全通滤波器的实施例中,第一和第二分析音频信号的比较因此可以涉及估计两个音频信号之间的相对相移,因此能级对比指示此相对相移。
在本发明的实施例中,所述能级对比是第一能级对比,其中所述方法进一步包括以下步骤:
基于所述输入音频信号建立第三分析音频信号;以及
比较所述第二分析音频信号和所述第三分析音频信号以获得第二能级对比,其中所述突出音调的所述表示进一步基于所述第二能级对比。
引入第三分析音频信号可以有利地扩展有效频带、改进精度或改进准确度。
在本发明的一些实施例中,可以同时获得第一和第二能级对比。在本发明的一些实施例中,一次仅获得第一和第二能级对比中的一个。例如,在执行所述方法的一个例子中,基于所获得的第一能级对比确定突出音调的表示。在执行所述方法的稍后例子中,基于所获得的第二能级对比确定突出音调的表示。例如,可能会发生的情况为,如果不同的能级对比用于确定不同频率范围中的突出音调的表示,而突出音调的实际频率正在变化。
在本发明的实施例中,通过将第三分析音频滤波器应用于所述输入音频信号来建立所述第三分析音频信号。
第三分析信号可以例如通过对输入音频信号进行滤波来建立,或者可以例如是输入音频信号。应用滤波器有利地允许灵活地分析输入音频信号和确定突出音调的表示。
在本发明的实施例中,所述对比-频率映射函数是第一对比-频率映射函数,其中所述第一对比-频率映射函数将所述第一能级对比转换成第一试验性频率,其中第二对比-频率映射函数将所述第二能级对比转换成第二试验性频率,其中所述突出音调的所述表示基于所述第一试验性频率和所述第二试验性频率。
提供两个映射函数可以有利地改进精度、准确度或有效频带。
在本发明的实施例中,所述方法进一步包括比较所述第一分析音频信号和所述第三分析音频信号以获得第三能级对比的步骤,其中所述突出音调的所述表示基于所述第三能级对比。
获得若干能级对比可以有利地改进精度、准确度或有效频带。
在本发明的实施例中,第三对比-频率映射函数将所述第三能级对比转换成第三试验性频率,其中所述突出音调的所述表示基于所述第三试验性频率。
提供三个或多于三个映射函数可以有利地改进精度、准确度或有效频带。
在本发明的实施例中,比较所述第二分析音频信号和所述第三分析音频信号的所述步骤包括比较所述第二能级和第三能级以获得所述第二能级对比,其中所述第三能级基于所述第三分析音频信号。
在本发明的实施例中,比较所述第一分析音频信号和所述第三分析音频信号的所述步骤包括比较所述第一能级和所述第三能级以获得所述第三能级对比。
在本发明的实施例中,所述方法进一步包括测量所述第三分析音频信号以检测所述第三能级的步骤。
在本发明的实施例中,所述突出音调的所述表示基于所述第一试验性频率和所述第二试验性频率的加权平均值。
在本发明的实施例中,所述突出音调的所述表示基于所述第一试验性频率、所述第二试验性频率和所述第三试验性频率的加权平均值。
加权平均值允许将若干试验性频率组合成突出音调的单个表示,这可以有利地改进精度、准确度或有效频带。
加权平均值可以基于两个、三个或多于三个试验性频率。
加权平均值所使用的权重可以是平坦的,或者取决于频率或能级对比。例如,此种相关性可以连续方式和/或逐步地方式变化。例如,权重可以是分段数学函数或查找表。
在本发明的实施例中,所述方法包括通过单独地将多个分析音频滤波器应用于所述输入音频信号来建立多个分析音频信号的步骤,其中所述多个分析音频信号包括所述第一分析音频信号和所述第二分析音频信号,其中所述多个分析音频滤波器包括所述分析音频滤波器,其中确定所述突出音调的所述表示的所述步骤基于所述多个分析音频信号。
例如,通过将多个分析音频滤波器中的分析音频滤波器应用于输入音频信号来建立多个分析音频信号中的一个分析音频信号。因此,每个分析音频滤波器可以用于建立单独的分析音频信号。
本发明的实施例可以例如包括至少三个分析音频信号,例如至少四个分析音频信号,例如至少五个分析音频信号,例如至少六个分析音频信号。
本发明的实施例可以例如包括至少三个分析音频滤波器,例如至少四个分析音频滤波器,例如至少五个分析音频滤波器,例如至少六个分析音频滤波器。
分析音频滤波器和分析音频信号的数目可以相同或可以不相同。
所建立的多个分析音频信号可以用于确定突出音调的表示。例如,可以通过比较分析音频信号的任何能级来建立一个或多个能级对比,并且突出音调的表示随后可以基于将这一个或多个能级对比中的一个或多个转换成突出音调的表示所基于的一个或多个试验性频率。
通过单独地将多个分析音频滤波器应用于所述输入音频信号来建立多个分析音频信号是有利的,因为这可以改进精度、准确度或有效频带的范围。
本发明的方面涉及一种用于检测输入音频信号的突出音调的音频处理单元,所述音频处理单元包括:
音频信号输入,用于提供所述输入音频信号;
滤波单元,所述滤波单元通信地耦合到所述音频信号输入以将音频分析滤波器应用于所述输入音频信号;
能级比较器,所述能级比较器经由第一分析音频信道和第二分析音频信道通信地耦合到所述音频信号输入,其中所述第一分析音频信道和所述第二分析音频信道中的分析音频信道包括所述滤波单元,其中所述能级比较器被布置成输出能级对比;以及
频率映射单元,所述频率映射单元通信地耦合到所述能级比较器并且被布置成通过由对比-频率映射函数转换所述能级对比来输出所述突出音调的表示。
音频信号输入可以是用于提供输入音频信号的任何类型的输入,例如,基于有线连接、无线连接、麦克风或数据存储装置。因此,音频信号输入未必具有物理连接器。
在本发明的实施例中,所述能级对比基于来自所述第一分析音频信道和所述第二分析音频信道的输入。
在本发明的实施例中,所述滤波单元是第一滤波单元,其中所述第一分析音频信道包括所述第一滤波单元,其中所述第二分析音频信道包括第二滤波单元,其中所述第一滤波单元和所述第二滤波单元不同。
在本发明的实施例中,所述能级比较器被布置成比较第一分析音频信道的第一分析音频信号的能级和第二分析音频信道的第二分析音频信号的能级,以获得所述能级对比。
在本发明的实施例中,所述滤波单元被布置成将第一音频滤波器应用于所述输入音频信号以生成第一分析音频信号。
在本发明的实施例中,所述第二滤波单元被布置成将第二音频滤波器应用于所述输入音频信号以生成第二分析音频信号。
在本发明的实施例中,所述能级比较器通过第一能级检测器通信地耦合到所述第一滤波单元,其中所述能级比较器通过第二能级检测器通信地耦合到所述第二滤波单元。
在本发明的实施例中,所述第一能级检测器被布置成测量所述第一分析音频信号以检测第一能级,并且所述第二能级检测器被布置成测量所述第二分析音频信号以检测第二能级。
在本发明的实施例中,所述频率映射单元被布置成将对比-频率映射函数应用于所述能级对比以输出所述突出音调的所述表示。
在本发明的实施例中,所述音频信号处理单元至少部分地基于数字信号处理器,其中所述数字信号处理器包括所述音频信号输入、所述滤波单元、所述能级比较器和所述频率映射单元中的任一个。
在一些实施例中,数字信号处理器可以进一步包括第二滤波单元、第一能级检测器和第二能级检测器中的任一个。
本发明的方面涉及使用所述音频处理单元来检测音频反馈,其中所述突出音调与所述音频反馈相关联。
每当出现音频反馈时,所述音频反馈通常可以视为输入音频信号的突出音调。因此,本发明的音频处理单元可以有利地用于检测音频反馈。
本发明的方面涉及使用所述音频处理单元来检测乐器的乐音,其中所述突出音调与所述乐音相关联。
例如,检测乐音可以是对乐器进行调音或分析音频信号的动作的一部分。
每当对乐器进行调音时,例如乐器的乐音可以是输入音频信号的基础,并且乐音可以具有要进行调音的基本频率,同时充当输入音频信号的突出音调。
因此,本发明的音频处理单元可以有利地用于检测乐音。
例如,调音可以是一个过程,调整来自乐器的一个或多个音调的音高,以建立音调的特定频率或这些音调之间的特定频率间隔。
乐器可以是弦乐器,例如吉他或钢琴。
在用于检测乐音时,输入音频信号可以例如基于来自乐器的声音。例如,可以经由输入麦克风记录声音。
从上面可以清楚地看出,本发明涉及一种用于检测输入音频信号的突出音调并提供所述音调的表示,例如其频率作为数字或模拟表示的方法和装置。本发明基于将一个或多个频率相关滤波器应用于输入音频信号以建立分析音频信号。由于一个或多个所应用的音频滤波器的频率相关性,分析音频信号的能量是与频率相关的。因此,分析音频信号之间的相对能量可以与突出音调的频率直接相关。将分析音频信号相比较以获得指示信号的相对能量的能级对比。随后可以通过对比-频率映射函数将此能级对比转变成突出音调的表示。因此,本发明提供分析音频信号以提供输入音频信号的突出音调的表示的简单且普遍适用的方法。
上文出于说明而非限制的目的,参考方法和实施例的特定实例对本发明进行了例示。为了理解本发明的实施例,已经提供了例如特定方法和系统结构的细节。应注意,已经省略了对众所周知的系统、装置、电路和方法的详细描述,以免不必要的细节使本发明的描述不清楚。应理解,本发明不限于上述具体实例,并且本领域技术人员也可以在没有这些具体细节的其它实施例中实现本发明。因此,可以在如权利要求书所指定的本发明的范围内以多种变型来设计和改变本发明。
Claims (17)
1.一种用于检测输入音频信号的突出音调的方法,所述方法包括以下步骤:
基于所述输入音频信号建立第一分析音频信号,其中通过将第一分析音频滤波器应用于所述输入音频信号来建立所述第一分析音频信号;
基于所述输入音频信号建立第二分析音频信号,其中通过将第二分析音频滤波器应用于所述输入音频信号来建立所述第二分析音频信号,其中所述第一分析音频滤波器和所述第二分析音频滤波器不同;
比较所述第一分析音频信号和所述第二分析音频信号以获得能级对比;以及
通过由对比-频率映射函数转换所述能级对比来确定所述突出音调的表示,
其中所述第一分析音频滤波器和所述第二分析音频滤波器都具有滤波器中心频率,
其中所述方法与有效频带相关联,其中所述突出音调的所述表示的频率误差在所述有效频带内比在所述有效频带外小,以及
其中所述有效频带是基于所述第一分析音频滤波器的所述滤波器中心频率和所述第二分析音频滤波器的所述滤波器中心频率。
2.根据权利要求1所述的方法,其中所述方法包括步骤:经由输入麦克风输入或记录所述输入音频信号。
3.根据权利要求1所述的方法,其中将所述突出音调的所述表示提供给用户。
4.根据权利要求1所述的方法,其中比较所述第一分析音频信号和所述第二分析音频信号的所述步骤包括:比较第一能级和第二能级以获得所述能级对比,其中所述第一能级是基于所述第一分析音频信号并且所述第二能级是基于所述第二分析音频信号。
5.根据权利要求4所述的方法,其中所述方法包括测量所述第一分析音频信号以检测所述第一能级的步骤,以及测量所述第二分析音频信号以检测所述第二能级的步骤。
6.根据权利要求1所述的方法,其中所述第二分析音频滤波器的所述滤波器中心频率和所述第一分析音频滤波器的所述滤波器中心频率的频率比为1至1000。
7.根据权利要求6所述的方法,其中所述方法包括通过至少一个辅助音频滤波器至少部分地衰减在所述有效频带外的所述输入音频信号的音频频率。
8.根据权利要求1所述的方法,其中所述能级对比是第一能级对比,其中所述方法进一步包括以下步骤:
基于所述输入音频信号建立第三分析音频信号;以及
比较所述第二分析音频信号和所述第三分析音频信号以获得第二能级对比,其中所述突出音调的所述表示是基于所述第二能级对比。
9.根据权利要求8所述的方法,其中通过将第三分析音频滤波器应用于所述输入音频信号来建立所述第三分析音频信号。
10.根据权利要求9所述的方法,其中所述对比-频率映射函数是第一对比-频率映射函数,其中所述第一对比-频率映射函数将所述第一能级对比转换成第一试验性频率,其中第二对比-频率映射函数将所述第二能级对比转换成第二试验性频率,并且其中所述突出音调的所述表示是基于所述第一试验性频率和所述第二试验性频率。
11.根据权利要求10所述的方法,其中所述方法进一步包括:比较所述第一分析音频信号和所述第三分析音频信号以获得第三能级对比的步骤,其中所述突出音调的所述表示是基于所述第三能级对比。
12.根据权利要求11所述的方法,其中第三对比-频率映射函数将所述第三能级对比转换成第三试验性频率,其中所述突出音调的所述表示基于所述第三试验性频率。
13.根据权利要求10所述的方法,其中所述突出音调的所述表示是基于所述第一试验性频率和所述第二试验性频率的加权平均值。
14.根据权利要求1所述的方法,其中所述方法包括:通过单独地将多个分析音频滤波器应用于所述输入音频信号来建立多个分析音频信号的步骤,其中所述多个分析音频信号包括所述第一分析音频信号和所述第二分析音频信号,其中所述多个分析音频滤波器包括所述分析音频滤波器,其中确定所述突出音调的所述表示的所述步骤是基于所述多个分析音频信号。
15.一种用于检测输入音频信号的突出音调的音频处理单元,所述音频处理单元包括:
音频信号输入,用于提供所述输入音频信号;
滤波单元,所述滤波单元通信地耦合到所述音频信号输入,以将第一分析音频滤波器和第二分析音频滤波器应用于所述输入音频信号,其中所述第一分析音频滤波器和所述第二分析音频滤波器不同;
能级比较器,所述能级比较器经由第一分析音频信道和第二分析音频信道通信地耦合到所述音频信号输入,其中所述第一分析音频信道和所述第二分析音频信道中的分析音频信道包括所述滤波单元,其中所述能级比较器被布置成输出能级对比;以及
频率映射单元,所述频率映射单元通信地耦合到所述能级比较器,并且被布置成通过由对比-频率映射函数转换所述能级对比来输出所述突出音调的表示,
其中所述第一分析音频滤波器和所述第二分析音频滤波器都具有滤波器中心频率,
其中所述用于检测输入音频信号的突出音调的音频处理单元配置为与有效频带相关联,其中所述突出音调的所述表示的频率误差在所述有效频带内比在所述有效频带外小,以及
其中所述有效频带是基于所述第一分析音频滤波器的所述滤波器中心频率和所述第二分析音频滤波器的所述滤波器中心频率。
16.一种根据权利要求15所述的音频处理单元的用途,所述音频处理单元用于检测音频反馈,其中所述突出音调与所述音频反馈相关联。
17.一种根据权利要求15所述的音频处理单元的用途,所述音频处理单元用于检测乐器的乐音,其中所述突出音调与所述乐音相关联。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202062972894P | 2020-02-11 | 2020-02-11 | |
US62/972,894 | 2020-02-11 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113259811A CN113259811A (zh) | 2021-08-13 |
CN113259811B true CN113259811B (zh) | 2022-08-26 |
Family
ID=74859021
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110162459.1A Active CN113259811B (zh) | 2020-02-11 | 2021-02-05 | 用于检测音调的方法和音频处理单元及其用途 |
CN202110178815.9A Active CN113259814B (zh) | 2020-02-11 | 2021-02-09 | 检测音频反馈的方法和音频处理系统及其用途 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110178815.9A Active CN113259814B (zh) | 2020-02-11 | 2021-02-09 | 检测音频反馈的方法和音频处理系统及其用途 |
Country Status (4)
Country | Link |
---|---|
US (2) | US11722822B2 (zh) |
CN (2) | CN113259811B (zh) |
DE (2) | DE102021103175A1 (zh) |
GB (2) | GB2596169B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5442712A (en) * | 1992-11-25 | 1995-08-15 | Matsushita Electric Industrial Co., Ltd. | Sound amplifying apparatus with automatic howl-suppressing function |
US5615302A (en) * | 1991-12-16 | 1997-03-25 | Mceachern; Robert H. | Filter bank determination of discrete tone frequencies |
CN1750124A (zh) * | 2004-09-17 | 2006-03-22 | 哈曼贝克自动系统股份有限公司 | 带限音频信号的带宽扩展 |
CN1898970A (zh) * | 2003-12-23 | 2007-01-17 | 英特尔公司 | 音调检测方法和系统 |
CN101401398A (zh) * | 2006-03-06 | 2009-04-01 | 飞思卡尔半导体公司 | 用于音调检测和增强的包括自适应多带通滤波器的增强型音调检测器 |
CN102176313A (zh) * | 2009-10-10 | 2011-09-07 | 北京理工大学 | 基于共振峰频率的汉语普通话单韵母语音可视化方法 |
CN102859579A (zh) * | 2010-02-26 | 2013-01-02 | 弗兰霍菲尔运输应用研究公司 | 用于利用包络整形修改音频信号的装置和方法 |
CN108088582A (zh) * | 2017-12-29 | 2018-05-29 | 广东电网有限责任公司东莞供电局 | 一种声表面波快速测量开关柜温度的方法 |
CN108461087A (zh) * | 2018-02-07 | 2018-08-28 | 芯盾(海南)信息安全技术有限公司 | 数字信号穿过声码器的装置及方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3235925B2 (ja) * | 1993-11-19 | 2001-12-04 | 松下電器産業株式会社 | ハウリング抑制装置 |
US6831986B2 (en) * | 2000-12-21 | 2004-12-14 | Gn Resound A/S | Feedback cancellation in a hearing aid with reduced sensitivity to low-frequency tonal inputs |
US7315264B2 (en) * | 2006-01-17 | 2008-01-01 | D2Audio Corporation | Systems and methods for controlling transient response in the output of a noise shaper |
CN102165792A (zh) * | 2008-09-24 | 2011-08-24 | 雅马哈株式会社 | 环路增益推定装置以及啸叫防止装置 |
EP2425426B1 (en) * | 2009-04-30 | 2013-03-13 | Dolby Laboratories Licensing Corporation | Low complexity auditory event boundary detection |
US8756061B2 (en) * | 2011-04-01 | 2014-06-17 | Sony Computer Entertainment Inc. | Speech syllable/vowel/phone boundary detection using auditory attention cues |
KR102006734B1 (ko) * | 2012-09-21 | 2019-08-02 | 삼성전자 주식회사 | 음성 신호의 처리 방법 및 무선 통신 단말 |
WO2014094242A1 (en) * | 2012-12-18 | 2014-06-26 | Motorola Solutions, Inc. | Method and apparatus for mitigating feedback in a digital radio receiver |
FR3030983B1 (fr) * | 2014-12-19 | 2018-02-16 | STMicroelectronics (Alps) SAS | Systeme et procede de protection de haut-parleur audio |
CA2908891A1 (en) * | 2015-10-15 | 2017-04-15 | Clearwater Clinical Limited | A computer-implemented method for reducing crosstalk in a computer-based audiometer |
US9747887B2 (en) * | 2016-01-12 | 2017-08-29 | Bose Corporation | Systems and methods of active noise reduction in headphones |
CN113766073B (zh) * | 2017-09-29 | 2024-04-16 | 杜比实验室特许公司 | 会议系统中的啸叫检测 |
-
2021
- 2021-01-25 GB GB2100981.6A patent/GB2596169B/en active Active
- 2021-01-26 GB GB2101040.0A patent/GB2595949B/en active Active
- 2021-02-05 CN CN202110162459.1A patent/CN113259811B/zh active Active
- 2021-02-09 CN CN202110178815.9A patent/CN113259814B/zh active Active
- 2021-02-11 US US17/173,777 patent/US11722822B2/en active Active
- 2021-02-11 DE DE102021103175.3A patent/DE102021103175A1/de active Pending
- 2021-02-11 US US17/173,846 patent/US11528558B2/en active Active
- 2021-02-11 DE DE102021103179.6A patent/DE102021103179A1/de active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5615302A (en) * | 1991-12-16 | 1997-03-25 | Mceachern; Robert H. | Filter bank determination of discrete tone frequencies |
US5442712A (en) * | 1992-11-25 | 1995-08-15 | Matsushita Electric Industrial Co., Ltd. | Sound amplifying apparatus with automatic howl-suppressing function |
CN1898970A (zh) * | 2003-12-23 | 2007-01-17 | 英特尔公司 | 音调检测方法和系统 |
CN1750124A (zh) * | 2004-09-17 | 2006-03-22 | 哈曼贝克自动系统股份有限公司 | 带限音频信号的带宽扩展 |
CN101401398A (zh) * | 2006-03-06 | 2009-04-01 | 飞思卡尔半导体公司 | 用于音调检测和增强的包括自适应多带通滤波器的增强型音调检测器 |
CN102176313A (zh) * | 2009-10-10 | 2011-09-07 | 北京理工大学 | 基于共振峰频率的汉语普通话单韵母语音可视化方法 |
CN102859579A (zh) * | 2010-02-26 | 2013-01-02 | 弗兰霍菲尔运输应用研究公司 | 用于利用包络整形修改音频信号的装置和方法 |
CN108088582A (zh) * | 2017-12-29 | 2018-05-29 | 广东电网有限责任公司东莞供电局 | 一种声表面波快速测量开关柜温度的方法 |
CN108461087A (zh) * | 2018-02-07 | 2018-08-28 | 芯盾(海南)信息安全技术有限公司 | 数字信号穿过声码器的装置及方法 |
Also Published As
Publication number | Publication date |
---|---|
GB2596169A (en) | 2021-12-22 |
GB2596169B (en) | 2022-04-27 |
US11722822B2 (en) | 2023-08-08 |
US20210249028A1 (en) | 2021-08-12 |
CN113259811A (zh) | 2021-08-13 |
GB2595949A (en) | 2021-12-15 |
CN113259814B (zh) | 2023-02-17 |
GB202101040D0 (en) | 2021-03-10 |
US11528558B2 (en) | 2022-12-13 |
CN113259814A (zh) | 2021-08-13 |
DE102021103179A1 (de) | 2021-08-12 |
DE102021103175A1 (de) | 2021-08-12 |
GB202100981D0 (en) | 2021-03-10 |
US20210250691A1 (en) | 2021-08-12 |
GB2595949B (en) | 2022-08-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9344822B2 (en) | Estimating nonlinear distortion and parameter tuning for boosting sound | |
KR101106948B1 (ko) | 스펙트럼 수정들에 의한 라우드니스 측정 | |
EP2595153A1 (en) | Sound quality evaluation apparatus and method thereof | |
JP2017506464A (ja) | 周波数依存的減衰段をチューニングするための装置及び方法 | |
US20170201830A1 (en) | Method and apparatus for adjusting a cross-over frequency of a loudspeaker | |
US9626949B2 (en) | System of modeling characteristics of a musical instrument | |
JPH03500583A (ja) | オーディオ信号処理システムを点検する装置 | |
US20170024495A1 (en) | Method of modeling characteristics of a musical instrument | |
JPH05297880A (ja) | ソース音処理方法および装置 | |
CN113259811B (zh) | 用于检测音调的方法和音频处理单元及其用途 | |
WO2019229738A1 (en) | System for decomposition of digital sound samples into sound objects | |
US9281791B2 (en) | Device for adding harmonics to sound signal | |
Sottek et al. | Progress in Roughness Calculation | |
US20090193895A1 (en) | Sound field measuring method and sound field measuring device | |
KR101307430B1 (ko) | 청취 공간 내 파워 응답을 고려한 스피커 시스템의 실시간 성능 평가 및 개선 방법 및 장치 | |
US9928419B2 (en) | Periodicity analysis system | |
JP2006505818A (ja) | オーディオ成分を生成する方法および装置 | |
US9881633B2 (en) | Audio signal processing device, audio signal processing method, and audio signal processing program | |
JPH1026994A (ja) | カラオケ採点装置 | |
US11096001B2 (en) | Systems and methods for digitally modeling analog audio hardware devices | |
JP3046566B2 (ja) | 信号分析方法および信号分析装置 | |
RU2547166C1 (ru) | Способ измерения гармонических искажений электрического сигнала (варианты) и устройство для его осуществления | |
JP2005049688A (ja) | 音響調整装置 | |
JP2011035573A (ja) | 音信号処理装置および音信号処理方法 | |
JP2001013977A (ja) | 音声スペクトルのホルマント強調装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |