CN108989946A - 检测和减少反馈 - Google Patents
检测和减少反馈 Download PDFInfo
- Publication number
- CN108989946A CN108989946A CN201810542126.XA CN201810542126A CN108989946A CN 108989946 A CN108989946 A CN 108989946A CN 201810542126 A CN201810542126 A CN 201810542126A CN 108989946 A CN108989946 A CN 108989946A
- Authority
- CN
- China
- Prior art keywords
- frequency band
- audio signal
- amplitude
- band
- feedback
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title description 9
- 230000009467 reduction Effects 0.000 title description 3
- 230000005236 sound signal Effects 0.000 claims abstract description 202
- 238000000034 method Methods 0.000 claims abstract description 85
- 238000004458 analytical method Methods 0.000 claims description 21
- 230000004044 response Effects 0.000 claims description 18
- 238000004891 communication Methods 0.000 description 139
- 230000002238 attenuated effect Effects 0.000 description 41
- 230000008569 process Effects 0.000 description 23
- 230000006870 function Effects 0.000 description 17
- 238000012545 processing Methods 0.000 description 16
- 238000003860 storage Methods 0.000 description 14
- 208000032041 Hearing impaired Diseases 0.000 description 13
- 238000010586 diagram Methods 0.000 description 9
- 238000013518 transcription Methods 0.000 description 9
- 230000035897 transcription Effects 0.000 description 9
- 239000002131 composite material Substances 0.000 description 8
- 230000007774 longterm Effects 0.000 description 5
- 230000002093 peripheral effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 206010011878 Deafness Diseases 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 201000006549 dyspepsia Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000011514 reflex Effects 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/738—Interface circuits for coupling substations to external telephone lines
- H04M1/76—Compensating for differences in line impedance
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/002—Applications of echo suppressors or cancellers in telephonic connections
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/02—Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/025—Phonemes, fenemes or fenones being the recognition units
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42391—Systems providing special services or facilities to subscribers where the subscribers are hearing-impaired persons, e.g. telephone devices for the deaf
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/03—Synergistic effects of band splitting and sub-band processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R27/00—Public address systems
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Telephone Function (AREA)
Abstract
公开了一种用于检测和减少音频信号中的反馈的计算机实施的方法。该方法可以包括获取音频信号。该方法还可以包括将音频信号分成多个频带。该方法还可以包括:对于多个频带中的每个频带,确定该频带是否包括反馈。该方法还可以包括:对于被确定为包括反馈的每个频带,衰减该频带。该方法还可以包括组合多个频带中的每个频带以产生输出音频信号。
Description
技术领域
本文中讨论的实施方案涉及检测和减少反馈。
背景技术
现代电信服务提供帮助失聪或听力受损者的特征。一个这样的特征是用于听力受损者的文字字幕电话系统。文字字幕电话系统可以包括旨在允许听力受损用户使用普通电话网络的电信中介服务。
本文中所要求保护的主题不限于解决任何缺点或仅在环境——比如上文中所描述的环境——中运行的实施方案。相反,仅提供此背景内容以说明其中可实践本文所描述的一些实施方案的一个示例技术领域。
发明内容
公开了一种用于检测和减少音频信号中的反馈的计算机实施的方法。该方法可以包括获取音频信号。该方法还可以包括将音频信号分成多个频带。该方法还可以包括:对于多个频带中的每个频带,确定该频带是否包括反馈。该方法还可以包括:对于被确定为包括反馈的每个频带,衰减该频带。该方法还可以包括组合多个频带中的每个频带以产生输出音频信号。
本公开内容提供至少以下技术方案:
1.一种用于检测和减少音频信号中的反馈的计算机实施的方法,所述方法包括:
获取音频信号;
将所述音频信号分成多个频带;
选择所述多个频带中的第一频带;
获取幅度阈值和持续时间阈值;
响应于所述第一频带具有的幅度大于所述幅度阈值的持续时间比所述持续时间阈值长,衰减所述第一频带;以及
组合包括衰减的第一频带在内的所述多个频带以产生输出音频信号。
2.根据方案1所述的方法,其中衰减所述第一频带包括:从第一时间点到第二时间点衰减所述第一频带,在所述第一时间点与所述第二时间点之间所述第一频带具有的幅度大于所述幅度阈值的持续时间比所述持续时间阈值长;以及从第三时间点到第四时间点不衰减所述第一频带,在所述第三时间点与所述第四时间点之间所述第一频带不具有大于所述幅度阈值达比所述持续时间阈值长的持续时间的幅度。
3.根据方案1所述的方法,其中所述多个频带中的每个频带包括近似相等的频率带宽。
4.根据方案1所述的方法,其中衰减所述第一频带包括使所述第一频带衰减固定的百分比量。
5.根据方案1所述的方法,其中衰减所述第一频带包括:基于所述第一频带中的反馈量衰减所述第一频带,所述反馈量基于所述第一频带的幅度与所述幅度阈值之间的差值确定。
6.根据方案5所述的方法,其中基于所述第一频带中的反馈量衰减所述第一频带包括:使所述第一频带衰减一个通过所述第一频带的幅度在第二幅度阈值与所述幅度阈值之间的内插而计算的量。
7.根据方案1所述的方法,其中所述幅度阈值和所述持续时间阈值基于对人类语音的音素分析确定。
8.至少一个非暂时性计算机可读介质,被配置为存储一个或多个指令,所述一个或多个指令在由至少一个系统执行时执行根据方案1所述的方法。
9.一种用于检测和减少音频信号中的反馈的计算机实施的方法,所述方法包括:
获取音频信号;
将所述音频信号分成多个频带;
对于所述多个频带中的每个频带,确定所述频带是否包括反馈;
对于被确定为包括反馈的每个频带,衰减所述频带;以及
组合所述多个频带中的每个频带以产生输出音频信号。
10.根据方案9所述的方法,其中确定所述频带是否包括反馈包括:响应于确定所述频带的幅度在第一持续时间阈值上恒定高于幅度阈值而确定所述频带包括反馈。
11.根据方案10所述的方法,其中所述幅度阈值和所述第一持续时间阈值基于对人类语音的音素分析确定。
12.根据方案9所述的方法,其中确定所述频带是否包括反馈包括:响应于确定所述频带的幅度在第二持续时间阈值上增加而确定所述频带包括反馈。
13.根据方案9所述的方法,其中所述多个频带中的每个频带包括近似相等的频率带宽。
14.根据方案9所述的方法,其中所述多个频带中的一个或多个频带包括不同的频率带宽。
15.根据方案9所述的方法,其中衰减所述频带包括使所述频带衰减以下之一:固定的百分比量;基于所述频带中的反馈量的量,所述反馈量基于所述频带的幅度和第一幅度阈值确定;以及基于所述频带的幅度在第二幅度阈值与所述幅度阈值之间的内插的量。
16.至少一个非暂时性计算机可读介质,被配置为存储一个或多个指令,所述一个或多个指令在由至少一个系统执行时执行根据方案9所述的方法。
17.一种用于检测和减少音频信号中的反馈的系统,所述系统包括:
一个或多个处理器,所述一个或多个处理器被配置为:
获取音频信号;
将所述音频信号分成多个频带;
对于所述多个频带中的每个频带,确定所述频带是否包括反馈;以及
对于被确定为包括反馈的每个频带,衰减所述频带。
18.根据方案17所述的系统,其中确定所述频带是否包括反馈包括:响应于确定所述频带的幅度在第一持续时间阈值上恒定高于幅度阈值而确定所述频带包括反馈。
19.根据方案18所述的系统,其中所述幅度阈值和所述第一持续时间阈值是基于对人类语音的音素分析确定的。
20.根据方案17所述的系统,其中确定所述频带是否包括反馈包括:响应于确定所述频带的幅度在第二持续时间阈值上增加而确定所述频带包括反馈。
21.根据方案17所述的系统,其中所述多个频带中的每个频带包括近似相等的频率带宽。
22.根据方案17所述的系统,其中衰减所述频带包括使所述频带衰减以下之一:固定的百分比量;基于所述频带中的反馈量的量,所述反馈量基于所述第一频带的幅度和第一幅度阈值确定;以及基于所述第一频带的幅度在第二幅度阈值与所述幅度阈值之间的内插的量。
附图说明
将通过使用附图利用附加的特征和细节来描述和解释示例实施方案,在附图中:
图1示出了包括可以检测和减少反馈的示例通信设备的示例环境;
图2a至2c是示出被分成多个频带的示例音频信号的示意图;
图3示出了示例频带处理系统;
图4示出了可以用于检测和减少反馈的示例通信设备;
图5示出了与检测和减少反馈相关的示例过程;
图6是用于检测和减少反馈的示例性的计算机实施的方法的流程图;以及
图7是用于检测和减少反馈的另一示例性的计算机实施的方法的流程图。
具体实施方式
本公开内容中的一些实施方案涉及可以检测和减少音频信号中的反馈的方法和/或系统。例如,反馈可能由音响系统中的正反馈回路引起。诸如扬声器等音频输出设备可以输出音频信号。音频信号可以由诸如传声器等音频输入设备检测。传声器可以将音频信号传输到放大器。音频信号可以被放大,并且放大的音频信号可以由扬声器输出,扬声器可以输出更高幅度的(例如,更响亮的)音频信号。该过程本身可以重复,直到音频信号达到非常响亮的水平,变得失真,导致尖锐刺耳的声音,或者导致其他潜在的不良结果。
在一些实施方案中,在通信会话期间,设备可以接收并且产生音频信号。在这些和其他实施方案中,反馈可能存在于设备接收的音频信号中。在一些实施方案中,作为如上所述的设备的扬声器与传声器之间的交互的结果,反馈可能被引入到音频信号中。其他反馈可能基于设备的接收和发送路径内的信号反射而发生。例如,由设备传输的信号可能在双工输出接口处被部分地反射,并且由设备在接收路径上再次接收作为反馈。
本公开内容中的一些实施方案描述了可以被配置为检测和减少音频信号中的反馈的设备。例如,该设备可以将音频信号分成多个频带。每个频带可以被检查以确定该频带中是否存在反馈。在这些和其他实施方案中,被确定为具有反馈的频带中的音频信号可以被衰减。例如,具有反馈的频带中的音频信号可以被衰减一特定百分比量或一个基于该频带中的反馈量的量。
在一些实施方案中,可以针对多个频带中的每个频带单独地确定反馈的存在。例如,在一些实施方案中,当频带中的音频信号的幅度大于幅度阈值的时间段比持续时间阈值长时,可以确定反馈的存在。替代地或附加地,当频带中的音频信号的幅度增加的时间段比持续时间阈值长时,可以确定反馈的存在。
简而言之,在一些实施方案中,该设备可以被配置为使得音频信号中的反馈可以被衰减而不衰减音频信号的不包括反馈的频率。结果,该设备可以被配置为减少由于音频信号中的反馈而导致音频信号变得令人不快或难以理解的情况。例如,通过该设备检测音频信号中的反馈并且减少反馈,可以避免由于反馈而导致音频信号包括尖锐刺耳的声音或非常大声的声音的情况。
在一些实施方案中,本公开内容中描述的系统和/或方法因此可以帮助检测和减少音频信号中的反馈的量。因此,该系统和/或方法至少提供了解决电信技术中与用户设备的设计相关联的技术问题的技术方案。
图1示出了包括可以检测和减少音频信号中的反馈的示例系统的示例环境100。环境100可以根据本公开内容中描述的至少一个实施方案来布置。环境100可以包括网络102、第一通信设备104、通信系统108和第二通信设备110。
网络102可以被配置为将第一通信设备104、通信系统108和第二通信设备110通信地耦合。在一些实施方案中,网络102可以是被配置为发送和接收系统与设备之间的通信的任何网络或网络配置。在一些实施方案中,网络102可以包括有线网络或无线网络,并且可以具有多种不同配置。在一些实施方案中,网络102还可以耦合到或可以包括电信网络的部分,包括电话线比如公共交换电话网(PSTN)线路,用于以多种不同通信协议比如由普通老式电话系统(POTS)所使用的协议发送数据。
第一通信设备104和第二通信设备110中的每一个可以是任何电子或数字计算设备。例如,第一通信设备104和第二通信设备110中的每一个可以包括台式计算机、膝上型计算机、智能电话、移动电话、平板电脑、电话、电话控制台或任何其他计算设备。在一些实施方案中,第一通信设备104和第二通信设备110中的每一个可以被配置为与其他设备建立通信会话。例如,第一通信设备104和第二通信设备110中的每一个可以被配置为经由电话线或通信网络与另一个设备建立呼出电话呼叫。例如,第一通信设备104可以经由无线蜂窝网络进行通信,而第二通信设备110可以经由PSTN线路进行通信。替代地或附加地,第一通信设备104和第二通信设备110可以经由不包括或仅部分地包括PSTN的其他有线或无线网络进行通信。例如,第一通信设备104和第二通信设备110之间的电话呼叫或通信会话可以是基于网际协议的语音传输(VoIP)电话呼叫。替代地或附加地,第一通信设备104和第二通信设备110中的每一个可以被配置为经由网络——比如网络102或另一网络——与其他系统进行通信。在这些实施方案以及其他实施方案中,第一通信设备104和第二通信设备110可以从通信系统108接收数据和将数据发送到通信系统108。
在一些实施方案中,第一通信设备104和第二通信设备110可以各自包括存储器和至少一个处理器,它们被配置为执行本公开内容中所描述的操作以及其他操作。在一些实施方案中,第一通信设备104和第二通信设备110可以包括被配置为由第一通信设备104和第二通信设备110执行以实施本公开内容中所描述的操作的计算机可读指令。
在一些实施方案中,第二通信设备110可以被配置为检测和减少音频信号中的反馈。在一些实施方案中,音频信号可以在第一通信设备104与第二通信设备110之间的通信会话期间获取,该通信会话诸如语音或视频呼叫。在这些和其他实施方案中,音频信号可以源自第二通信设备110或第一通信设备104。例如,音频信号可以由第二通信设备110的传声器生成。替代地或附加地,音频信号可以是存储在第二通信设备110上的音频信号,诸如来自用户112的消息的录音音频、来自另一用户的消息、有声书或其他录音或者其他存储的音频。
在一些实施方案中,第二通信设备110可以在没有网络102的情况下获取音频信号。例如,在一些实施方案中,音频信号可以从第二通信设备110的传声器生成。替代地或附加地,在一些实施方案中,音频信号可以从与第二通信设备110通信地耦合的计算机可读存储装置上的音频文件获取。替代地或附加地,在一些实施方案中,音频信号可以从模拟或数字音频存储设备获取,该模拟或数字音频存储设备诸如录音带、留声机唱片或光碟。替代地或附加地,在一些实施方案中,音频信号可以从来自模拟或数字视频存储设备的视频信号获取,该模拟或数字视频存储设备诸如录像带或光盘。在这些和其他实施方案中,音频信号的来源可能不重要。在这些和其他实施方案中,环境100可以不包括网络102。
在一些实施方案中,音频信号可能包括反馈。反馈可能是反馈回路的结果。在一些实施方案中,反馈回路可以包括在传声器与扬声器之间的声学反馈回路。替代地或附加地,反馈回路可以包括来自由连接到第二通信设备110的网络102中的传输信号的回声或反馈所引起的线路回声的反馈。替代地或附加地,反馈回路可以包括来自源于第二通信设备110与网络102之间的连接中的阻抗混合匹配的混合回声的反馈。音频信号中的反馈也可能是其他类型的反馈的结果。
在这些和其他实施方案中,第二通信设备110可以将音频信号分成多个频带。在一些实施方案中,第二通信设备110可以将音频信号分成在人类通常可听到的范围内的频带。例如,在这些和其他实施方案中,音频信号可以来自从大约0.02千赫(kHz)到大约20kHz的范围的频带被分离。在这些和其他实施方案中,该音频信号的在该范围之外的部分可以被忽略。例如,可能不分析从30kHz到40kHz的频率范围内的音频,因为人类听不到该频率范围。
在一些实施方案中,多个频带中的每个可以包括近似相等的频率带宽。例如,在一些实施方案中,每个频带可以包括0.1kHz的频率、0.5kHz的频率、1kHz的频率或任何其他频率带宽。替代地,在一些实施方案中,音频信号可以被分成频带,其中每个频带包括不同的带宽。例如,较低或较高的频带可以包括更多的频率带宽。例如,频带可以包括对数或其他模式的频率带宽。替代地,在一些实施方案中,频带中的一个或多个频带可以包括不同的频率带宽,而其他频带包括相同的频率带宽。例如,最低频率带宽和最高频率带宽可以包括0.5kHz的频率,而这两个频带之间的频带可以各包括0.1kHz的频率。
在一些实施方案中,第二通信设备110可以确定任何频带是否包括反馈。在这些和其他实施方案中,第二通信设备110可以基于每个频带中的音频信号的幅度与幅度阈值的比较来确定任何频带是否包括反馈。在这些和其他实施方案中,每个频带中的音频信号的幅度可以单独地与幅度阈值相比较。例如,第一频带中的音频信号的幅度可以与幅度阈值相比较以确定第一频带是否包括反馈。单独地,第二频带中的音频信号的幅度可以与幅度阈值相比较以确定第二频带是否包括反馈。每个频带中的音频信号的幅度的比较可以不将一个频带中的音频信号的幅度与另一频带中的音频信号的幅度相比较。在这些和其他实施方案中,当音频信号的幅度大于幅度阈值的持续时间长于持续时间阈值时,频带可以被确定为包括反馈。替代地或附加地,在一些实施方案中,当音频信号的幅度增加的持续时间比持续时间阈值长时,频带可以被确定为包括反馈。
在一些实施方案中,幅度阈值和持续时间阈值可以使用对人类语音的音素分析来确定。替代地或附加地,在一些实施方案中,幅度阈值和持续时间阈值还可以基于第二通信设备110中和/或环境100中的一个或多个放大。在一些实施方案中,幅度阈值和持续时间阈值可以对于不同的频带是不同的。例如,在语言通信过程中,人类语音模式可能包含音高、音调和幅度的变化。人类语音模式可能在不同的频段包括不同的幅度和持续时间。例如,第一频带中的语音通常可以具有第一幅度和第一持续时间,而第二频带中的语音通常可以具有第二幅度和第二持续时间。用于第一频带的第一幅度阈值和第一持续时间阈值可以基于对第一频带典型的第一幅度和第一持续时间。用于第二频带的第二幅度阈值和第二持续时间阈值可以基于对第二频带典型的第二幅度和第二持续时间。因此,用于第一频带的第一幅度阈值和第一持续时间阈值可以与用于第二频带的第二幅度阈值和第二持续时间阈值不同。例如,在讲话过程中,人类话音的幅度和频率范围可以在100毫秒或200毫秒的过程中变化。然而,存在于音频信号中的反馈在100毫秒或200毫秒的持续时间内可能不会在幅度或频率方面变化。例如,音频信号的幅度在该持续时间内可能高于幅度阈值。替代地,音频信号中的反馈的音量可以在诸如200毫秒的持续时间内增加。例如,随着反馈回路被重复,信号的音量可能在一持续时间内增加。
第二通信设备110可以被配置为衰减被确定为包括反馈的频带的音频信号。例如,在一些实施方案中,第二通信设备110可以从第一时间点到第二时间点衰减一频带的音频信号,其中在第一时间点与第二时间点之间音频信号的幅度大于幅度阈值的持续时间比持续时间阈值长。在这些和其他实施方案中,第二通信设备110可以从第三时间点到第四时间点不衰减该频带的音频信号,其中在第三时间点与第四时间点之间音频信号的幅度未大于幅度阈值达比持续时间阈值长的持续时间。频带可以在一些时间点之间被衰减,并且可以在其他时间点之间不被衰减。替代地或附加地,一些频带可以不被衰减,并且一些频带可以在每个时间点之间被衰减。
在一些实施方案中,第二通信设备110可以使具有反馈的频带衰减音频信号的固定的百分比量。例如,在一些实施方案中,具有反馈的频带可以被衰减音频信号的1%、2%、5%、10%、15%、20%、25%、30%或50%或任何其他百分比。替代地或附加地,在一些实施方案中,具有反馈的频带可以被衰减基于该频带中的反馈量的量。频带中的反馈量可以基于频带中的音频信号的幅度与幅度阈值之间的差值来确定。例如,如果反馈量低于第一阈值,音频信号可以不被衰减。如果反馈量高于第二阈值,音频信号可以被衰减固定的百分比量。如果反馈量在第一阈值与第二阈值之间,衰减量可以通过在第一阈值与第二阈值之间对反馈量进行内插来确定。在一些实施方案中,环境100可以包括数模转换器(DAC)。在这些和其他实施方案中,具有反馈的信号可以使DAC的范围饱和。幅度阈值可以处于或接近DAC的最大范围。例如,16位DAC的幅度阈值可以处于或接近±32,767。替代地或附加地,幅度阈值可以相对于0分贝满刻度以分贝为单位。
在一些实施方案中,第一阈值和第二阈值可以与输入信号的长期平均值相关。在这些和其他实施方案中,长期平均值可以不包括当在信号中检测到反馈时对信号的幅度进行平均。在一些实施方案中,阈值可以是长期平均值的120%、130%、150%、200%、500%或任何其他百分比或倍数。在一些实施方案中,第一阈值可以是长期平均值的120%,并且第二阈值可以是长期平均值的200%。
在一些实施方案中,第二通信设备110可以被配置为组合包括衰减的频带在内的每个频带以产生输出音频信号。
现在提供检测和减少音频信号中的反馈的示例。音频信号可以由第二通信设备获取。例如,在一些实施方案中,音频信号可以在与另一通信设备诸如第一通信设备104的通信会话期间至少部分地获取。在这些和其他实施方案中,可以从第一通信设备104向第二通信设备110拨打电话。响应于接收到来自第一通信设备104的呼叫,可以建立第一通信设备104与第二通信设备110之间的通信会话。在通信会话期间,第二通信设备110可以获取音频信号。音频信号可以从第一通信设备104和/或从第二通信设备110获取。
第二通信设备110可以被配置为将音频信号分成10个频带。这些频带可以是从0到0.5kHz、从0.5到1kHz、从1到1.5kHz、从1.5到2kHz、从2到2.5kHz、从2.5到3kHz、从3到3.5kHz、从3.5到4kHz、从4至4.5kHz以及从4.5至5kHz。替代地,音频信号可以被分成其他频带。
第二通信设备110可以被配置为确定10个频带中的每个频带是否包括反馈。第二通信设备110可以被配置为通过确定频带的幅度是否大于幅度阈值的持续时间比持续时间阈值长,来确定频带是否包括反馈。替代地,如果频带的幅度增加的持续时间比持续时间阈值长,可以确定频带包括反馈。
对于被确定为包括反馈的每个频带,第二通信设备110可以被配置为在频带被确定为包括反馈的持续时间期间衰减频带的音频信号。例如,从1kHz到1.5kHz的频带可以被确定为从音频信号的12.2秒到12.9秒包括反馈。该频带可以从12.2秒到12.9秒被衰减。从2.5kHz到3kHz的频带可以被确定为从4.3秒到5.7秒以及从12.6秒到13.8秒包括反馈。该频带可以从4.3秒到5.7秒以及从12.6秒到13.8秒被衰减。其他频带可以在不同的持续时间期间包括反馈,可以在交叠的持续时间期间包括反馈,或者可以不包括反馈。
第二通信设备110可以被配置为使包括反馈的频带中的音频信号衰减固定百分比。例如,第二通信设备110可以将频带衰减10%。替代地,第二通信设备110可以被配置为基于频带中的反馈量来衰减频带中的音频信号。在衰减具有反馈的频带之后,第二通信设备110可以被配置为组合频带以生成输出音频信号。
输出音频信号可以通过扬声器输出并且可以由传声器检测,但是反馈可能不存在于输出音频信号中或者可能被减少。
在一些实施方案中,通信系统108可以包括被联网在一起并且被配置为执行任务的诸如处理器、服务器和数据存储装置等硬件的任何配置。例如,通信系统108可以包括被联网在一起并且被配置为执行检测和减少音频信号(诸如从另一设备获取的音频信号)中的反馈的操作的多个计算系统,诸如每个包括存储器和至少一个处理器的多个服务器,如本公开内容中所述。当检测音频信号是否包括反馈时以及在减少音频信号中的反馈方面,通信系统108可以执行与第二通信设备110类似的功能或者与第二通信设备110相同的功能。
在一些实施方案中,通信系统108还可以被配置为转录诸如第二通信设备110等设备与另一设备之间的通信会话,诸如电话或视频呼叫,如本公开内容中所述。在一些实施方案中,音频信号中的反馈的存在可能阻碍通信会话的转录的生成。在这些和其他实施方案中,除了其他配置之外,通信系统108可以转录由其他设备而不是第二通信设备110生成的或者由第二通信设备110和其他设备两者生成的音频。
此外,在一些实施方案中,环境100可以被配置为便于听力受损用户116和第二用户(比如用户112)之间的辅助通信会话。如在本公开内容中所使用的,“听力受损用户”可以指具有减退的听力能力的人。听力受损用户往往具有通常已在一段时间内减退的一定水平的听力能力,使得听力受损用户可以通过说话进行交流,但是听力受损用户通常在听到他人和/或理解他人方面有困难。
在一些实施方案中,第二通信设备110可以是被配置为向听力受损用户116呈现通信会话的转录的字幕电话,比如57T型号系列或67T型号系列的字幕电话之一,或者运行移动应用程序的设备。例如,在一些实施方案中,第二通信设备110可以包括可视显示器120,该可视显示器120与第二通信设备110集成并且被配置为向听力受损用户116呈现通信会话的文本转录。
在配字幕的通信会话期间,可以使用联网协议通信地耦合通信系统108和第二通信设备110。在通信系统108处,音频信号可以被转录。在一些实施方案中,为了转录音频信号,呼叫助理可以收听从所存储的音频消息接收的音频信号,并将所存储的消息的词语“重新表达”给按照呼叫助理的话音被调准的语音识别计算机程序。在这些实施方案以及其他实施方案中,呼叫助理可以是充当听力受损用户116与所存储的消息之间的人类中介的操作员。在一些实施方案中,可以通过语音识别计算机生成文本转录作为对所存储的消息的音频信号的转录。可以经由一个或多个网络102将文本转录提供给听力受损用户116所使用的第二通信设备110。第二通信设备110可以在听力受损用户116收听来自用户112的消息时显示文本转录。文本转录可以允许听力受损用户116补充从消息接收到的话音信号并且对他或她对在消息中所说的词语的理解进行确认。
在不偏离本公开内容的范围的情况下,可以对环境100进行修改、添加或省略。例如,在一些实施方案中,环境100可以不包括通信系统108。替代地或附加地,在一些实施方案中,环境100可以不包括第一通信设备104或网络102。
图2a至2c示出了具有分成多个频带的示例音频信号202的示意图220、230和240。图2a的示意图220示出了分成10个频带210的音频信号202。示意图220的y轴206可以表示特定频率处的音频信号202的幅度。在一些实施方案中,音频信号202的幅度可以是归一化幅度。示意图220的x轴208可以表示音频信号202的频率。在一些实施方案中,x轴208可以表示从0kHz到20kHz的频率。尽管用10个频带210来描绘,但是在一些实施方案中,可以有多于或少于10个频带。另外,尽管频带210被描绘为具有近似相等的频率带宽,但是频带210可以包括不同的频率带宽。图2a的示意图220可以表示在第一时间点的音频信号202。图2b的示意图230可以表示在第二时间点的音频信号202。图2c的示意图240可以表示在音频信号202被衰减之后的衰减的音频信号204。
在一些实施方案中,诸如图1的第二通信设备110的通信设备可以获取音频信号202。在这些和其他实施方案中,音频信号202可以被分成10个频带210。音频信号202的幅度可以在每个频带210中不同。例如,如图2a所示,音频信号202的幅度可以大体从频带210a到频带210d增加。音频信号202的幅度可以从频带210e到210g保持大致恒定。音频信号202的幅度可以在频带210h中再次达到峰值。音频信号202的幅度可以在频带210i和210j中下降。
通信设备可以分析频带210中的每个以确定频带是否包括反馈。在一些实施方案中,如果特定频带内的音频信号202的幅度大于幅度阈值达大于持续时间阈值的时间段,可以确定反馈被包括在特定频带中。替代地或附加地,在一些实施方案中,如果特定频带内的音频信号202的幅度增加达大于持续时间阈值的时间段,可以确定反馈被包括在该频带中。在这些和其他实施方案中,与幅度阈值相关联的持续时间阈值可以不同于与增加的幅度相关联的持续时间阈值。在一些实施方案中,对于不同的频带,幅度阈值和持续时间阈值可以不同。
不同频带的幅度阈值和持续时间阈值可以通过对人类语音的音素分析来确定。音素可以是语音中的声音单位。特定语言(例如,英语)的常规人类语音可以包括不同幅度、频率和持续时间的音素。其他语言的音素可以包括不同的幅度、频率和/或持续时间。通过分析特定语言的音素,可以确定对于特定频率通常不会出现在其以上的人类语音的相关幅度。因此,对于特定语言可以针对每个频带确定幅度阈值。类似地,持续时间阈值可以基于特定语言的音素。每个频带可以具有不同的持续时间阈值。此外,特定频带的典型幅度增加的持续时间可以从音素分析来确定。在一些实施方案中,幅度阈值可以基于与系统相关联的放大因子来确定。
在一些实施方案中,频带中的反馈的存在可以通过分析频带中音频信号幅度的包络改变的速率来确定。在这些和其他实施方案中,每个频带中的包络检测器可以查看音频信号的多个帧。音频信号的一帧可以是小于持续时间阈值的持续时间。例如,在一些实施方案中,持续时间阈值可以是200ms,而音频信号的一帧可以是100ms。替代地,在一些实施方案中,音频信号的帧可以具有与持续时间阈值相同的持续时间。在一些实施方案中,可以分析多个帧以确定频带是否包括反馈。例如,在一些实施方案中,包络检测器可以每一帧、每隔一帧、每三帧、每四帧或任何其他数目的帧进行查看。例如,如果帧长度是50ms并且持续时间阈值是100ms,可以分析三个帧。例如,在一些实施方案中,音频信号202可以在第一帧中上升到幅度阈值以上,在第二帧期间保持在幅度阈值以上,并且在第三帧期间保持在幅度阈值以上。如果基于包络检测器音频信号202的幅度在3个帧之间恒定超过幅度阈值超过100ms的持续时间阈值,可以确定频带包括反馈。作为另一示例,持续时间阈值可以是160ms,并且帧长度可以是40ms。如果音频信号202的幅度在第一帧中大于幅度阈值,包络检测器还可以确定音频信号202的幅度在第四帧中是否大于幅度阈值。如果音频信号202的幅度在第四帧中保持大于幅度阈值,由于4帧的持续时间(160ms)等于持续时间阈值(160ms),可以确定频带包括反馈。
替代地或附加地,在一些实施方案中,如果音频信号202的幅度在持续时间阈值上增加,可以确定频带包括反馈。例如,持续时间阈值可以是300ms。帧长度可以是100ms。音频信号202的幅度可以在第一帧的一部分期间增加。音频信号202的幅度可以在第二帧和第三帧期间继续增加。音频信号202的幅度还可以在第四帧的一部分期间继续增加。如果音频信号的幅度在4帧之间增加的持续时间大于300ms的持续时间阈值,可以确定频带包括反馈。在一些实施方案中,如果音频信号202的幅度大于幅度阈值但是幅度正在减小,频带可以不被确定为包括反馈。
音频信号202可以被确定为在第一时间点与第二时间点之间在频带210d和210h中包括反馈,如图2a和2b中所见。音频信号202可以被确定为在第一时间点与第二时间点之间在其他频带中不包括反馈。另外,在一些实施方案中,音频信号202可以被确定为在图2a中描绘的第一时间点之前以及在图2b中描绘的第二时间点之后包括反馈。
通信设备可以被配置为衰减音频信号202以产生图2c中描绘的衰减的音频信号204。在这些和其他实施方案中,衰减的音频信号204可以是图2a和2b的、在图2a的第一时间点与图2b的第二时间点之间在被确定为包括反馈的频带210d和210h中被衰减的音频信号202。例如,对于衰减的音频信号204,频带210a、210b、210c、210e、210f、210g、210i和210j中的音频信号202可以不被衰减。在这些和其他实施方案中,音频信号202可以以与上面关于图1所述的类似的方式被衰减。
在一些实施方案中,频带中的音频信号202的衰减可以迭代地执行。在这些和其他实施方案中,音频信号202可以以逐步减小的方式被衰减。例如,音频信号202可以被衰减固定的量,例如1、5、10或任何其他量的分贝。如果在音频信号202被衰减之后,衰减的音频信号202包括反馈,可以对衰减的音频信号202执行附加的衰减。可以以这种逐步减小的方式执行衰减,直到频带不再包括反馈。例如,音频信号202可以被衰减5分贝。在衰减5分贝之后,衰减的音频信号202可以继续包括反馈。音频信号202可以再次被衰减附加的5分贝。该过程可以继续,直到衰减的音频信号202被确定为不包括反馈。在这些和其他实施方案中,用于确定频带是否包括反馈的持续时间阈值可以在逐步减小过程期间减小。例如,在衰减之前,用于特定频带的持续时间阈值可以是200ms。在音频信号202已经衰减了5分贝之后,用于特定频带的持续时间阈值可以减小到150ms。在音频信号202已经衰减了另一个5分贝之后,持续时间阈值可以减小到100ms。在一些实施方案中,逐步减小过程之后可以是用于逐渐减小衰减的渐进逐步增加过程。例如,音频信号202可以被衰减15分贝。在衰减15分贝之后,衰减的音频信号202可以不再包括反馈。音频信号202可以改为被衰减10分贝。如果音频信号202不再包括反馈,音频信号202可以改为被衰减5分贝。该过程可以继续,直到衰减的音频信号202刚好被确定为包括反馈。该过程可以帮助减小音频信号202被衰减的幅度,同时仍减少音频信号202中的反馈。
在不偏离本公开内容的范围的情况下,可以对示意图220、230和240进行修改、添加或省略。例如,在一些实施方案中,音频信号202可以被分成比10个更多或更少的频带。替代地或附加地,在一些实施方案中,音频信号202可以在多于或少于两个频带中包括反馈。替代地或附加地,在一些实施方案中,音频信号202可以在第一时间点与第二时间点之间在一些频带210中包括反馈,但在第三时间点与第四时间点之间不包括反馈。替代地或附加地,在一些实施方案中,音频信号202可以被分成频率在0kHz到5kHz之间的频带210。
图3示出了示例频带处理系统300。处理系统300可以根据本公开内容中描述的至少一个实施方案来布置。处理系统300可以包括分析滤波器组310、处理模块320和合成滤波器组330,它们全部可以通信地耦合。
分析滤波器组310和合成滤波器组330可以各包括模拟滤波器组、数字滤波器组、基于快速傅里叶变换的滤波器组、基于小波的滤波器组和/或其他滤波器系统。在一些实施方案中,分析滤波器组310和合成滤波器组330可以包括不同类型的滤波器。例如,在一些实施方案中,分析滤波器组310可以包括模拟滤波器组,并且合成滤波器组330可以包括数字滤波器组。
分析滤波器组310可以被配置为将输入音频信号305分成不同的频带315。在这些和其他实施方案中,分析滤波器组310可以将输入音频信号305分成任何数目的频带315。在一些实施方案中,增加频带315的数目可以增加检测和减少输入音频信号305中的反馈的分辨率。例如,将输入音频信号305分成更多数目的频带315可以允许输入音频信号305的更大比例不被衰减地通过处理模块320。
在一些实施方案中,分析滤波器组310可以忽略在正常人类听力范围之外的输入音频信号305的频率。例如,在一些实施方案中,可以忽略在0.02kHz到20kHz的范围之外的频率。在这些和其他实施方案中,频带315可以包括在人类听力范围内的频率子集。例如,在一些实施方案中,频带315可以包括从0kHz到5kHz的频率。替代地或附加地,在一些实施方案中,分析滤波器组310可以忽略在正常人类语音范围之外的输入音频信号305的频率。例如,在一些实施方案中,可以忽略在0.08kHz到1kHz的范围之外的频率。替代地或附加地,在一些实施方案中,频带315可以包括从0.3kHz到3kHz的频率。
处理模块320可以被配置为检测和减少频带315中的反馈,如上面关于图1和2a至2c所描述的。在一些实施方案中,处理模块320可以被配置为处理输入音频信号305的帧。例如,处理模块320可以被配置为一次处理输入音频信号305的20ms、50ms、100ms、200ms或任何其他持续时间。在一些实施方案中,处理模块320可以被配置为衰减被确定为包括反馈的频带315并且不衰减被确定为不包括反馈的频带315。在这些和其他实施方案中,处理模块320可以将处理后的频带325提供给合成滤波器组330。在这些和其他实施方案中,特定的处理后的频带325可以是相对于相关联的频带315未改变的。例如,如果特定频带315被确定为不包括反馈,相关联的处理后的频带325可以是相对于特定频带315未改变的。在这些和其他实施方案中,在不同时间点,频带315中没有一个、一些或全部可以被处理以产生不同的处理后的频带325。
合成滤波器组330可以被配置为将不同的处理后的频带325组合成输出音频信号335。
图4例示了可以用于检测和减少音频信号中的反馈的示例通信设备400。通信设备400可以根据本公开内容中所描述的至少一个实施方案来布置。通信设备400可以包括处理器402、存储器404、通信接口406、显示器408、用户接口单元410和外围设备412,它们全部可以通信地耦合。在一些实施方案中,通信设备400可以是本公开内容中所描述的任何系统或设备的一部分。例如,通信设备400可以是图1的第一通信设备104、第二通信设备110或通信系统108中的任何一个的一部分。在一些实施方案中,通信设备400可以是电话控制台的一部分。
通常,处理器402可以包括任何合适的专用或通用计算机、计算实体或包括各种计算机硬件或软件模块的处理设备,并且可以被配置为执行存储在任何适用的计算机可读存储介质上的指令。例如,处理器402可以包括被配置为解释和/或执行程序指令和/或处理数据的微处理器、微控制器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或任何其他数字或模拟电路,或其任意组合。
尽管在图4中被例示为单个处理器,但是应该理解,处理器402可以包括被配置为单独地或共同地执行本文中所描述的任意数量的操作的、分布在任意数量的网络或物理位置处的任意数量的处理器。在一些实施方案中,程序指令可被加载到存储器404中。在这些和其他实施方案中,处理器402可以解释和/或执行存储在存储器404中的程序指令,和/或处理存储在存储器404中的数据。例如,通信设备400可以是图1的第一通信设备104、第二通信设备110或通信系统108的一部分。在这些实施方案以及其他实施方案中,程序指令可以包括处理器402检测和减少存储器404上的音频信号中的反馈。
存储器404可以包括用于携带或具有存储在其上的计算机可执行指令或数据结构的计算机可读存储介质。这样的计算机可读存储介质可以是可以由通用或专用计算机比如处理器402访问的任何可用介质。作为示例而非限制,这样的计算机可读存储介质可以包括非暂时性计算机可读存储介质,包括只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、光盘只读存储器(CD-ROM)或其他光盘存储装置、磁盘存储装置或其他磁存储设备、闪存设备(例如,固态存储器设备),或者可用于携带或存储计算机可执行指令或数据结构形式的期望程序代码并且可以由通用或专用计算机访问的任何其他存储介质。以上的组合也可以被包括在计算机可读存储介质的范围内。例如,计算机可执行指令可以包括被配置为引起处理器402执行某一操作或某组操作的指令和数据,所述某一操作或某组操作诸如方法500或方法600的一个或多个块。附加地或替代地,在一些实施方案中,指令可以被配置为引起处理器402执行图3的频带处理系统300的操作。在这些和其他实施方案中,处理器402可以被配置为执行指令以将音频信号分成频带。在这些和其他实施方案中,图3的分析滤波器组310和/或合成滤波器组330可以被实现为数字滤波器组,该数字滤波器组可以被实现为由处理器402执行的程序代码。替代地或附加地,在一些实施方案中,图3的频带处理系统300可以包括模拟滤波器组作为图3的分析滤波器组310或合成滤波器组330。在这些和其他实施方案中,通信设备400可以包括一个或多个物理模拟滤波器组。在一些实施方案中,分析滤波器组310和合成滤波器组330中的一个可以被实现为由处理器402执行的程序代码,并且另一个可以被实现为一个或多个模拟滤波器组。
通信接口406可以包括被配置为通过网络发送或接收信息的任何组件、设备、系统或其组合。在一些实施方案中,通信接口406可以与其他位置处的、相同位置处的其他设备通信,或者甚至可以与同一系统内的其他部件通信。例如,通信接口406可以包括调制解调器、网卡(无线或有线)、红外通信设备、无线通信设备(比如天线)和/或芯片组(诸如蓝牙设备、802.6设备(例如,城域网(MAN))、WiFi设备、WiMax设备、蜂窝通信设施等)、普通老式电话服务(POTS)和/或诸如此类。通信接口406可以允许与网络和/或本公开内容中所描述的任何其他设备或系统交换数据。
显示器408可以被配置为一个或多个显示器,如LCD、LED或其他类型的显示器。显示器408可以被配置成按照处理器402所指示的呈现视频、文本字幕、用户界面和其他数据。
用户接口单元410可以包括允许用户与通信设备400连系的任何设备。例如,用户接口单元410可以包括鼠标、触控板、键盘、触摸屏、电话机开关、电话小键盘、音量控制器和/或其他特殊用途按钮,以及其他设备。用户接口单元410可以接收来自用户的输入并将输入提供给处理器402。
外围设备412可以包括一个或多个设备。例如,外围设备可以包括传声器、成像器和/或扬声器,以及其他外围设备。在这些实施方案以及其他实施方案中,传声器可以被配置成捕获音频。成像器可以被配置为捕获数字图像。可以以产生视频或图像数据的方式捕获数字图像。在一些实施方案中,扬声器可以播放由通信设备400接收的或者由通信设备400以其他方式生成的音频。在一些实施方案中,由扬声器输出的音频可以由传声器检测。在这些和其他实施方案中,扬声器和传声器的交互可以导致正反馈回路,并且可以在音频信号中生成反馈。在这些和其他实施方案中,处理器402可以被配置为检测和减少音频信号中的反馈,这可以帮助减少由扬声器输出的音频中的反馈。
在不偏离本公开内容的范围的情况下,可以对通信设备400进行修改、添加或省略。
图5示出了与检测和减少反馈相关的示例过程。过程500可以根据本公开内容中描述的至少一个实施方案来布置。在一些实施方案中,过程500可以全部或部分地由诸如分别为图1、3和4的环境100、系统300和/或通信设备400的系统和/或环境来执行。在这些和其他实施方案中,过程500可以基于存储在一个或多个非暂时性计算机可读介质上的指令的执行来执行。虽然被例示为分立的框,但是取决于期望的实现方式,各个框可以被分为附加的框,被组合成更少的框,或者被消除。
过程500可以在框502处开始,在502中,可以获取音频信号。在框504中,可以将音频信号分成多个频带。在一些实施方案中,多个频带中的每个可以包括近似相等的频率带宽。在一些实施方案中,多个频带中的一个或多个可以包括不同的频率带宽。在框506中,可以选择频带。
在框508中,可以确定所选择的频带的幅度是否大于幅度阈值达第一持续时间阈值。在一些实施方案中,可以使用音频信号的帧来分析所选择的频带。在一些实施方案中,音频信号的帧的长度可以比第一持续时间阈值短。例如,在一些实施方案中,第一持续时间阈值可以是200ms,并且帧可以是100ms。在这些和其他实施方案中,可以分析多个帧以确定所选择的频带的幅度是否大于幅度阈值达第一持续时间阈值。在一些实施方案中,幅度阈值和第一持续时间阈值可以基于所选择的频带。响应于所选择的频带的幅度大于幅度阈值达第一持续时间阈值(框508处的“是”),过程500可以转到框512。响应于所选择的频带的幅度未大于幅度阈值达第一持续时间阈值(框508处的“否”),过程500可以转到框510。
在框510中,可以确定所选择的频带的幅度是否增加达第二持续时间阈值。响应于所选择的频带的幅度增加达第二持续时间阈值(框510处的“是”),过程可以转到框512。响应于所选择的频带的幅度未增加达第二持续时间阈值(框510处的“否”),过程可以转到框514。
在框512中,可以衰减所选择的频带。在一些实施方案中,响应于在第一时间点与第二时间点之间所选择的频带满足框508中的条件或框510中的条件,可以从第一时间点到第二时间点衰减所选择的频带。
在一些实施方案中,所选择的频带可以被衰减固定的百分比量。在一些实施方案中,所选择的频带可以被衰减所选择的频带中的反馈量。在这些和其他实施方案中,所选择的频带中的反馈量可以基于所选择的频带的幅度与幅度阈值之间的差值来确定。在一些实施方案中,所选择的频带可以被衰减一个通过在该幅度阈值与第二幅度阈值之间对所选择的频带的幅度进行内插而计算的量。
在框514中,可以不衰减所选择的频带。在框516中,可以确定是否存在另一频带。响应于存在另一频带(框516处的“是”),过程可以返回框506。响应于没有另一频带(框516处的“否”),过程可以转到框518。在框518中,可以组合频带以产生输出音频信号。
本领域技术人员将认识到,对于本文中公开的这个和其他过程、操作和方法,所执行的功能和/或操作可以以不同的顺序来实现。此外,所概述的功能和操作仅作为示例提供,并且一些功能和操作可以是可选的,被组合成更少的功能和操作,或者被扩展成附加的功能和操作,而不会有损于所公开的实施方案的本质。
例如,在一些实施方案中,针对每个频带的框506至516可以作为并行过程来执行。在这些和其他实施方案中,多个处理器可以同时针对频带中的每个频带执行框506至516的操作。附加地或替代地,在一些实施方案中,过程500可以不包括框508。在这些和其他实施方案中,音频信号的频带可以基于音频信号的幅度增加而不是基于音频信号的幅度高于幅度阈值而被衰减。附加地或替代地,在一些实施方案中,过程500可以不包括框510。在这些和其他实施方案中,音频信号的频带可以基于音频信号的幅度高于幅度阈值而不是基于音频信号的幅度增加而被衰减。
图6是用于检测和减少反馈的示例性的计算机实施的方法的流程图。方法600可以根据本公开内容中描述的至少一个实施方案来布置。在一些实施方案中,方法600可以全部或部分地由诸如分别为图1、3和4的环境100、系统300和/或通信设备400的系统和/或环境来执行。在这些和其他实施方案中,方法600可以基于存储在一个或多个非暂时性计算机可读介质上的指令的执行来执行。虽然被例示为分立的框,但是取决于期望的实现方式,各个框可以被分为附加的框,被组合成更少的框,或者被消除。
方法600可以在框602处开始,在框602中,可以获取音频信号。在框604中,可以将音频信号分成多个频带。在一些实施方案中,多个频带中的每个可以包括近似相等的频率带宽。在框606中,可以选择多个频带中的第一频带。在框608中,可以获取幅度阈值和持续时间阈值。在一些实施方案中,幅度阈值和持续时间阈值可以基于对人类语音的音素分析来确定。
在框610中,响应于第一频带的幅度大于幅度阈值的持续时间比持续时间阈值长,可以衰减第一频带。在一些实施方案中,第一频带可以从第一时间点到第二时间点被衰减。在这些和其他实施方案中,在第一时间点与第二时间点之间,第一频带的幅度大于幅度阈值的持续时间可以比持续时间阈值长。在一些实施方案中,第一频带可以从第三时间点到第四时间点不被衰减。在这些和其他实施方案中,在第三时间点与第四时间点之间,第一频带不具有大于幅度阈值的持续时间比持续时间阈值长的幅度。
在一些实施方案中,第一频带可以被衰减固定的百分比量。在一些实施方案中,第一频带可以基于第一频带中的反馈量被衰减。在这些和其他实施方案中,确定的反馈量可以基于第一频带的幅度与幅度阈值之间的差值。在一些实施方案中,第一频带可以被衰减一个通过在该幅度阈值与第二幅度阈值之间对第一频带的幅度进行内插而计算的量。
在框612中,可以组合包括衰减的第一频带在内的多个频带以产生输出音频信号。
本领域技术人员将认识到,对于本文中公开的这个和其他过程、操作和方法,所执行的功能和/或操作可以以不同的顺序来实现。此外,所概述的功能和操作仅作为示例提供,并且一些功能和操作可以是可选的,被组合成更少的功能和操作,或者被扩展成附加的功能和操作,而不会有损于所公开的实施方案的本质。
图7是用于检测和减少反馈的示例性的计算机实施的方法的流程图。方法700可以根据本公开内容中描述的至少一个实施方案来布置。在一些实施方案中,方法700可以全部或部分地由诸如分别为图1、3和4的环境100、系统300和/或通信设备400的系统和/或环境来执行。在这些和其他实施方案中,方法700可以基于存储在一个或多个非暂时性计算机可读介质上的指令的执行来执行。虽然被例示为分立的框,但是取决于期望的实现方式,各个框可以被分为附加的框,被组合成更少的框,或者被消除。
方法700可以在框702处开始,在框702中,可以获取音频信号。在框704中,可以将音频信号分成多个频带。在一些实施方案中,多个频带中的每个可以包括近似相等的频率带宽。在一些实施方案中,多个频带中的一个或多个可以包括不同的频率带宽。
在框706中,对于多个频带中的每个频带,可以确定频带是否包括反馈。在一些实施方案中,响应于确定频带的幅度在第一持续时间阈值上恒定高于幅度阈值,可以确定频带包括反馈。在一些实施方案中,幅度阈值和第一持续时间阈值可以基于对人类语音的音素分析来确定。在一些实施方案中,响应于确定频带的幅度在第二持续时间阈值上增加,可以确定频带包括反馈。
在框708中,对于被确定为包括反馈的每个频带,可以衰减频带。在一些实施方案中,频带可以被衰减固定的百分比量。在一些实施方案中,频带可以被衰减基于频带中的反馈量的量。在这些和其他实施方案中,频带中的反馈量可以基于频带的幅度和第一幅度阈值来确定。在一些实施方案中,频带可以被衰减一个基于频带的幅度在该幅度阈值与第二幅度阈值之间的内插的量。
在框710中,可以组合多个频带中的每个频带以产生输出音频信号。
本领域技术人员将认识到,对于本文中公开的这个和其他过程、操作和方法,可以以不同的顺序来实现所执行的功能和/或操作。此外,所概述的功能和操作仅作为示例被提供,并且所述功能和操作中的一些可以是可选的,被组合成更少的功能和操作,或者被扩展成附加的功能和操作,而不会有损于所公开的实施方案的本质。
如上所述,本文中所描述的实施方案可以包括使用包括各种计算机硬件或软件模块的专用或通用计算机(例如,图4的处理器402),如下面更详细讨论的。此外,如上所述,可以使用用于携带或具有存储在其上的计算机可执行指令或数据结构的计算机可读介质(例如,图4的存储器404)来实现本文中所描述的实施方案。
在一些实施方案中,本文中所描述的不同组件、模块、引擎和服务可以被实现为在计算系统上执行的对象或进程(例如,作为单独的线程)。尽管本文中所描述的一些系统和方法总体上被描述为以软件(存储在通用硬件上和/或由通用硬件执行)来实现,但是特定的硬件实现方式或者软件与特定硬件实现方式的组合也是可能的并且是设想到的。
根据惯例,附图中所例示的各特征可能不是按比例绘制的。在本公开内容中所呈现的图示并不意味着是任何特定装置(例如,设备、系统等)或方法的实际视图,而仅仅是被用来描述本公开内容的各实施方案的理想化表示。因此,为了清楚起见,可以任意扩大或缩小各特征的尺寸。另外,为了清楚起见,可以简化一些附图。因此,附图可能没有描绘给定装置(例如,设备)的所有部件或特定方法的所有操作。
本文中使用的并且特别是在所附权利要求(例如,所附权利要求的主体)中使用的术语总体上意在作为“开放式”术语(例如,术语“包括”应当被解释为“包括但不限于”,术语“具有”应当被解释为“至少具有”,术语“包含”应当被解释为“包含但不限于”等)。
另外,如果特定数量的所介绍的权利要求叙述项(recitation)是预期的,会在权利要求中明确地叙述这样的意图,并且在没有这样的叙述的情况下,不存在这样的意图。例如,作为对理解的帮助,以下所附权利要求可以包含使用介绍性措辞“至少一个”和“一个或多个”以介绍权利要求叙述项。然而,这样的措辞的使用不应被解释为意味着,通过不定冠词“一(a)”或“一(an)”介绍的权利要求叙述项将包含这样的所介绍的权利要求叙述项的任何特定权利要求限制为包含仅一个这样的叙述项的实施方案,即使当相同的权利要求包括介绍性措辞“一个或多个”或者“至少一个”以及诸如“一(a)”或“一(an)”的不定冠词时也如此(例如,“一(a)”和/或“一(an)”应被解释为意指“至少一个”或者“一个或多个”);对于用于介绍权利要求叙述项的定冠词的使用,这同样适用。
另外,即使明确地叙述了特定数量的所介绍的权利要求叙述项,本领域技术人员将认识到,这样的叙述应被解释为意味着至少所叙述的数量(例如,仅叙述“两个叙述项”而没有其他修饰语,意味着至少两个叙述项或两个或更多个叙述项)。此外,在使用类似于“A、B和C等中的至少一个”或“A、B和C等中的一个或多个”的惯例的那些情况下,通常这样的结构意在包括仅A,仅B,仅C,A和B一起,A和C一起,B和C一起,或A、B和C一起等。例如,术语“和/或”的使用意在以这种方式来解释。
此外,无论是在说明书、权利要求书还是附图中,呈现两个或更多个替代术语的任何析取性词语或措辞应被理解为考虑包括术语中的一个、术语中的任何一个或术语两者的可能性。例如,措辞“A或B”应被理解为包括“A”或者“B”或者“A和B”的可能性。
然而,这样的措辞的使用不应被解释为意味着,通过不定冠词“一(a)”或“一(an)”介绍的权利要求叙述项将包含这样的所介绍的权利要求叙述项的任何特定权利要求限制为包含仅一个这样的叙述项的实施方案,即使当相同的权利要求包括介绍性措辞“一个或多个”或者“至少一个”以及诸如“一(a)”或“一(an)”的不定冠词时也如此(例如,“一(a)”和/或“一(an)”应被解释为意指“至少一个”或者“一个或多个”);对于用于介绍权利要求叙述项的定冠词的使用,这同样适用。
另外,术语“第一”、“第二”、“第三”等的使用在本文中不一定用于隐含元件的特定顺序或数量。通常,术语“第一”、“第二”、“第三”等用于如通用标识那样在不同元件之间进行区分。在没有表明术语“第一”、“第二”、“第三”等暗示特定的顺序的情况下,这些术语不应被解释为隐含特定的顺序。此外,在没有表明术语“第一”、“第二”、“第三”等暗示特定数量的元件的情况下,这些术语不应被理解为暗示特定数量的元件。例如,第一小装置可以被描述为具有第一侧,并且第二小装置可以被描述为具有第二侧。关于第二小装置对术语“第二侧”的使用可以是将第二小装置的这样的侧与第一小装置的“第一侧”区分开,而不是暗示第二小装置具有两侧。
本文所叙述的所有示例和条件性语言旨在用于教学对象以帮助读者理解本发明以及本发明人为促进技术而贡献的构思,并且应被解释为不限制这些具体叙述的示例和条件。尽管已经详细描述了本公开内容的实施方案,但是应当理解,在不偏离本公开内容的精神和范围的情况下,可以对此进行各种改变、替换和变更。
Claims (10)
1.一种用于检测和减少音频信号中的反馈的计算机实施的方法,所述方法包括:
获取音频信号;
将所述音频信号分成多个频带;
选择所述多个频带中的第一频带;
获取幅度阈值和持续时间阈值;
响应于所述第一频带具有的幅度大于所述幅度阈值的持续时间比所述持续时间阈值长,衰减所述第一频带;以及
组合包括衰减的第一频带在内的所述多个频带以产生输出音频信号。
2.根据权利要求1所述的方法,其中衰减所述第一频带包括:从第一时间点到第二时间点衰减所述第一频带,在所述第一时间点与所述第二时间点之间所述第一频带具有的幅度大于所述幅度阈值的持续时间比所述持续时间阈值长;以及从第三时间点到第四时间点不衰减所述第一频带,在所述第三时间点与所述第四时间点之间所述第一频带不具有大于所述幅度阈值达比所述持续时间阈值长的持续时间的幅度。
3.根据权利要求1所述的方法,其中衰减所述第一频带包括:基于所述第一频带中的反馈量衰减所述第一频带,所述反馈量基于所述第一频带的幅度与所述幅度阈值之间的差值确定。
4.根据权利要求3所述的方法,其中基于所述第一频带中的反馈量衰减所述第一频带包括:使所述第一频带衰减一个通过所述第一频带的幅度在第二幅度阈值与所述幅度阈值之间的内插而计算的量。
5.根据权利要求1所述的方法,其中所述幅度阈值和所述持续时间阈值基于对人类语音的音素分析确定。
6.至少一个非暂时性计算机可读介质,被配置为存储一个或多个指令,所述一个或多个指令在由至少一个系统执行时执行根据权利要求1所述的方法。
7.一种用于检测和减少音频信号中的反馈的系统,所述系统包括:
一个或多个处理器,所述一个或多个处理器被配置为:
获取音频信号;
将所述音频信号分成多个频带;
对于所述多个频带中的每个频带,确定所述频带是否包括反馈;
对于被确定为包括反馈的每个频带,衰减所述频带;以及
组合所述多个频带中的每个频带以产生输出音频信号。
8.根据权利要求7所述的系统,其中确定所述频带是否包括反馈包括:响应于确定所述频带的幅度在第一持续时间阈值上恒定高于幅度阈值而确定所述频带包括反馈。
9.根据权利要求7所述的系统,其中确定所述频带是否包括反馈包括:响应于确定所述频带的幅度在第二持续时间阈值上增加而确定所述频带包括反馈。
10.根据权利要求7所述的系统,其中衰减所述频带包括使所述频带衰减以下之一:固定的百分比量;基于所述频带中的反馈量的量,所述反馈量基于所述频带的幅度和第一幅度阈值确定;以及基于所述频带的幅度在第二幅度阈值与所述第一幅度阈值之间的内插的量。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/611,441 | 2017-06-01 | ||
US15/611,441 US10540983B2 (en) | 2017-06-01 | 2017-06-01 | Detecting and reducing feedback |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108989946A true CN108989946A (zh) | 2018-12-11 |
Family
ID=64460037
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810542126.XA Pending CN108989946A (zh) | 2017-06-01 | 2018-05-30 | 检测和减少反馈 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10540983B2 (zh) |
CN (1) | CN108989946A (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019051082A1 (en) * | 2017-09-06 | 2019-03-14 | Georgia Tech Research Corporation | SYSTEMS, METHODS AND DEVICES FOR GESTURE RECOGNITION |
CN116959420A (zh) * | 2018-04-16 | 2023-10-27 | 谷歌有限责任公司 | 自动地确定用于经由自动化助理接口接收的口头话语的语音辨识的语言 |
US11363147B2 (en) * | 2018-09-25 | 2022-06-14 | Sorenson Ip Holdings, Llc | Receive-path signal gain operations |
US11450336B1 (en) * | 2020-11-25 | 2022-09-20 | Dialpad, Inc. | System and method for smart feedback cancellation |
FR3141302A1 (fr) * | 2022-10-21 | 2024-04-26 | Continental Automotive Technologies GmbH | Procédé de détection d’un effet larsen |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1398054A (zh) * | 2001-07-16 | 2003-02-19 | 松下电器产业株式会社 | 啸叫检测和抑制设备、方法和计算机程序产品 |
CN1612640A (zh) * | 2003-03-31 | 2005-05-04 | 优利康听力有限公司 | 自适应反馈消除器 |
CN1934897A (zh) * | 2004-02-20 | 2007-03-21 | 松下电器产业株式会社 | 啸叫检测方法及装置、以及具有它们的音响装置 |
JP2010178224A (ja) * | 2009-01-30 | 2010-08-12 | Panasonic Corp | 補聴装置 |
US20110216910A1 (en) * | 2010-03-05 | 2011-09-08 | Samsung Electronics Co., Ltd. | Adaptive notch filter with variable bandwidth, and method and apparatus for canceling howling by using the adaptive notch filter with variable bandwidth |
CN103081511A (zh) * | 2011-03-09 | 2013-05-01 | 松下电器产业株式会社 | 啸声检测装置、啸声抑制装置及啸声检测方法 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5245665A (en) | 1990-06-13 | 1993-09-14 | Sabine Musical Manufacturing Company, Inc. | Method and apparatus for adaptive audio resonant frequency filtering |
US5822370A (en) * | 1996-04-16 | 1998-10-13 | Aura Systems, Inc. | Compression/decompression for preservation of high fidelity speech quality at low bandwidth |
US6778966B2 (en) * | 1999-11-29 | 2004-08-17 | Syfx | Segmented mapping converter system and method |
US6757395B1 (en) | 2000-01-12 | 2004-06-29 | Sonic Innovations, Inc. | Noise reduction apparatus and method |
US20030138117A1 (en) | 2002-01-22 | 2003-07-24 | Goff Eugene F. | System and method for the automated detection, identification and reduction of multi-channel acoustical feedback |
US7492889B2 (en) * | 2004-04-23 | 2009-02-17 | Acoustic Technologies, Inc. | Noise suppression based on bark band wiener filtering and modified doblinger noise estimate |
EP1684543A1 (de) | 2005-01-19 | 2006-07-26 | Success Chip Ltd. | Verfahren zum Unterdrücken von elektroakustischer Rückkopplung |
US8243953B2 (en) | 2005-03-11 | 2012-08-14 | Rane Corporation | Method and apparatus for identifying a feedback frequency in a signal |
GB2456296B (en) | 2007-12-07 | 2012-02-15 | Hamid Sepehr | Audio enhancement and hearing protection |
DK2277327T3 (en) | 2008-04-10 | 2017-01-09 | Gn Resound As | An audio system with feedback cancellation |
EP2237573B1 (en) | 2009-04-02 | 2021-03-10 | Oticon A/S | Adaptive feedback cancellation method and apparatus therefor |
US8737636B2 (en) | 2009-07-10 | 2014-05-27 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for adaptive active noise cancellation |
US8942398B2 (en) | 2010-04-13 | 2015-01-27 | Starkey Laboratories, Inc. | Methods and apparatus for early audio feedback cancellation for hearing assistance devices |
JP2012058358A (ja) * | 2010-09-07 | 2012-03-22 | Sony Corp | 雑音抑圧装置、雑音抑圧方法およびプログラム |
CN103797816B (zh) | 2011-07-14 | 2017-02-15 | 索诺瓦公司 | 语音增强系统和方法 |
CN103187065B (zh) * | 2011-12-30 | 2015-12-16 | 华为技术有限公司 | 音频数据的处理方法、装置和系统 |
CN104871436B (zh) | 2012-12-18 | 2018-03-16 | 摩托罗拉解决方案公司 | 用于减轻在数字无线电接收器中的反馈的方法和设备 |
GB2519117A (en) * | 2013-10-10 | 2015-04-15 | Nokia Corp | Speech processing |
US20170235404A1 (en) * | 2016-02-17 | 2017-08-17 | Monterey Research, Llc | Feedback mechanism for user detection of reference location on a sensing device |
-
2017
- 2017-06-01 US US15/611,441 patent/US10540983B2/en active Active
-
2018
- 2018-05-30 CN CN201810542126.XA patent/CN108989946A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1398054A (zh) * | 2001-07-16 | 2003-02-19 | 松下电器产业株式会社 | 啸叫检测和抑制设备、方法和计算机程序产品 |
CN1612640A (zh) * | 2003-03-31 | 2005-05-04 | 优利康听力有限公司 | 自适应反馈消除器 |
CN1934897A (zh) * | 2004-02-20 | 2007-03-21 | 松下电器产业株式会社 | 啸叫检测方法及装置、以及具有它们的音响装置 |
JP2010178224A (ja) * | 2009-01-30 | 2010-08-12 | Panasonic Corp | 補聴装置 |
US20110216910A1 (en) * | 2010-03-05 | 2011-09-08 | Samsung Electronics Co., Ltd. | Adaptive notch filter with variable bandwidth, and method and apparatus for canceling howling by using the adaptive notch filter with variable bandwidth |
CN103081511A (zh) * | 2011-03-09 | 2013-05-01 | 松下电器产业株式会社 | 啸声检测装置、啸声抑制装置及啸声检测方法 |
Also Published As
Publication number | Publication date |
---|---|
US10540983B2 (en) | 2020-01-21 |
US20180350378A1 (en) | 2018-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108989946A (zh) | 检测和减少反馈 | |
US11527243B1 (en) | Signal processing based on audio context | |
DK2396975T3 (en) | AUTOMATIC FITTING OF HEARING DEVICES | |
US10652674B2 (en) | Hearing enhancement and augmentation via a mobile compute device | |
CN105632508B (zh) | 音频处理方法及音频处理装置 | |
CN108986839A (zh) | 减少音频信号中的噪声 | |
US10368154B2 (en) | Systems, devices and methods for executing a digital audiogram | |
CN106063238B (zh) | 电话会议中的在感知上连续的混合 | |
US20140329511A1 (en) | Audio conferencing | |
US20170195811A1 (en) | Audio Monitoring and Adaptation Using Headset Microphones Inside User's Ear Canal | |
CN108235181A (zh) | 在音频处理装置中降噪的方法 | |
CN106664472A (zh) | 信号处理设备、信号处理方法和计算机程序 | |
US10142760B1 (en) | Audio processing mechanism with personalized frequency response filter and personalized head-related transfer function (HRTF) | |
Bouserhal et al. | An in-ear speech database in varying conditions of the audio-phonation loop | |
US10277183B2 (en) | Volume-dependent automatic gain control | |
US20200260207A1 (en) | Dynamics Processing Effect Architecture | |
US9031836B2 (en) | Method and apparatus for automatic communications system intelligibility testing and optimization | |
US10841713B2 (en) | Integration of audiogram data into a device | |
US11094328B2 (en) | Conferencing audio manipulation for inclusion and accessibility | |
US20210012787A1 (en) | Detection and restoration of distorted signals of blocked microphones | |
WO2016096568A1 (en) | Hearing test system and a computer readable medium | |
JP2012094945A (ja) | 音声通信システム、及び、音声通信装置 | |
CN104184886A (zh) | 一种信息处理方法和电子设备 | |
JP7358919B2 (ja) | 情報処理装置、情報処理方法、及び、プログラム | |
Hribar Jr et al. | Verification of Direct Streaming to Hearing Aids: A How-to Guide to the Digital Listening Environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20181211 |
|
WD01 | Invention patent application deemed withdrawn after publication |