CN104220896B - 用于估计到达方向的系统、方法和设备 - Google Patents
用于估计到达方向的系统、方法和设备 Download PDFInfo
- Publication number
- CN104220896B CN104220896B CN201380019683.9A CN201380019683A CN104220896B CN 104220896 B CN104220896 B CN 104220896B CN 201380019683 A CN201380019683 A CN 201380019683A CN 104220896 B CN104220896 B CN 104220896B
- Authority
- CN
- China
- Prior art keywords
- fitness
- multiple directions
- mike
- passage
- pair
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 254
- 238000012545 processing Methods 0.000 claims description 18
- 238000003860 storage Methods 0.000 abstract description 32
- 238000005259 measurement Methods 0.000 abstract description 18
- 239000011159 matrix material Substances 0.000 description 64
- 239000013598 vector Substances 0.000 description 58
- 238000010586 diagram Methods 0.000 description 54
- 230000014509 gene expression Effects 0.000 description 35
- 238000003491 array Methods 0.000 description 26
- 230000008859 change Effects 0.000 description 25
- 238000004891 communication Methods 0.000 description 22
- 230000005236 sound signal Effects 0.000 description 19
- 238000013507 mapping Methods 0.000 description 18
- 230000008569 process Effects 0.000 description 18
- 238000001914 filtration Methods 0.000 description 17
- 238000005516 engineering process Methods 0.000 description 16
- 230000001747 exhibiting effect Effects 0.000 description 14
- 230000004044 response Effects 0.000 description 14
- 230000006870 function Effects 0.000 description 13
- 238000007476 Maximum Likelihood Methods 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 10
- 238000009499 grossing Methods 0.000 description 10
- 238000007493 shaping process Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 9
- 241000209140 Triticum Species 0.000 description 8
- 235000021307 Triticum Nutrition 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 8
- 238000013461 design Methods 0.000 description 8
- 238000007781 pre-processing Methods 0.000 description 8
- 230000009467 reduction Effects 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 8
- 238000001514 detection method Methods 0.000 description 7
- 238000009826 distribution Methods 0.000 description 7
- 230000002969 morbid Effects 0.000 description 7
- 238000004804 winding Methods 0.000 description 7
- 239000012634 fragment Substances 0.000 description 6
- 238000010606 normalization Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 241000209094 Oryza Species 0.000 description 3
- 235000007164 Oryza sativa Nutrition 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 239000012141 concentrate Substances 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 3
- 238000009795 derivation Methods 0.000 description 3
- 235000013399 edible fruits Nutrition 0.000 description 3
- 230000005611 electricity Effects 0.000 description 3
- 230000005484 gravity Effects 0.000 description 3
- 238000009434 installation Methods 0.000 description 3
- 235000009566 rice Nutrition 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000012800 visualization Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 240000005979 Hordeum vulgare Species 0.000 description 2
- 235000007340 Hordeum vulgare Nutrition 0.000 description 2
- 101100229939 Mus musculus Gpsm1 gene Proteins 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 210000004247 hand Anatomy 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000149 penetrating effect Effects 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 238000007430 reference method Methods 0.000 description 2
- 230000008771 sex reversal Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 101100055224 Anemone leveillei AL10 gene Proteins 0.000 description 1
- 241000707825 Argyrosomus regius Species 0.000 description 1
- 241000222065 Lycoperdon Species 0.000 description 1
- 241000768494 Polymorphum Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000004568 cement Substances 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000005621 ferroelectricity Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000006249 magnetic particle Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 210000002706 plastid Anatomy 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 238000011112 process operation Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000010415 tropism Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01B—MEASURING LENGTH, THICKNESS OR SIMILAR LINEAR DIMENSIONS; MEASURING ANGLES; MEASURING AREAS; MEASURING IRREGULARITIES OF SURFACES OR CONTOURS
- G01B21/00—Measuring arrangements or details thereof, where the measuring technique is not covered by the other groups of this subclass, unspecified or not relevant
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S15/00—Systems using the reflection or reradiation of acoustic waves, e.g. sonar systems
- G01S15/87—Combinations of sonar systems
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S15/00—Systems using the reflection or reradiation of acoustic waves, e.g. sonar systems
- G01S15/87—Combinations of sonar systems
- G01S15/876—Combination of several spaced transmitters or receivers of known location for determining the position of a transponder or a reflector
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
- G01S3/80—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
- G01S3/80—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
- G01S3/8006—Multi-channel systems specially adapted for direction-finding, i.e. having a single aerial system capable of giving simultaneous indications of the directions of different signals
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S5/00—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
- G01S5/18—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S5/00—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
- G01S5/18—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
- G01S5/186—Determination of attitude
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/432—Query formulation
- G06F16/433—Query formulation using audio data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/04817—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance using icons
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0488—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
- G06F3/04883—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/08—Mouthpieces; Microphones; Attachments therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/40—Visual indication of stereophonic sound image
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S15/00—Systems using the reflection or reradiation of acoustic waves, e.g. sonar systems
- G01S15/86—Combinations of sonar systems with lidar systems; Combinations of sonar systems with systems not using wave reflection
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
- G01S3/80—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
- G01S3/802—Systems for determining direction or deviation from predetermined direction
- G01S3/808—Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems
- G01S3/8083—Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems determining direction of source
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/16—Constructional details or arrangements
- G06F1/1613—Constructional details or arrangements for portable computers
- G06F1/1633—Constructional details or arrangements of portable computers not specific to the type of enclosures covered by groups G06F1/1615 - G06F1/1626
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Remote Sensing (AREA)
- Radar, Positioning & Navigation (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Otolaryngology (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- User Interface Of Digital Computer (AREA)
- Telephone Function (AREA)
- Position Input By Displaying (AREA)
Abstract
本发明描述用于将成对差异(例如,相位延迟测量)匹配到源方向候选者的存量且应用成对源方向估计的系统、方法和设备。
Description
根据35U.S.C.§119主张优先权
本专利申请案主张2012年4月13日申请且转让给本受让人的标题为“用于估计到达方向的系统、方法和设备(SYSTEMS,METHODS,AND APPARATUS FOR ESTIMATINGDIRECTION OF ARRIVAL)”的第61/624,181号临时申请案的优先权。本专利申请案还主张2012年5月4日申请且转让给本受让人的标题为“用于估计到达方向的系统、方法和设备(SYSTEMS,METHODS,AND APPARATUS FOR ESTIMATING DIRECTION OF ARRIVAL)”的第61/642,954号临时申请案的优先权。本专利申请案还主张2012年11月14日申请且转让给本受让人的标题为“用于估计到达方向的系统、方法和设备(SYSTEMS,METHODS,AND APPARATUSFOR ESTIMATING DIRECTION OF ARRIVAL)”的第61/726,336号临时申请案的优先权。本专利申请案还主张2012年10月12日申请且转让给本受让人的标题为“用于映射坐标的系统和方法(SYSTEMS AND METHODS FOR MAPPING COORDINATES)”的第61/713,447号临时申请案的优先权。本专利申请案还主张2012年10月15日申请且转让给本受让人的标题为“用于映射座标的系统和方法(SYSTEMS AND METHODS FOR MAPPING COORDINATES)”的第61/714,212号的临时申请案的优先权。
技术领域
本发明涉及音频信号处理。
背景技术
图1展示多麦克风手持机H100的实例,所述多麦克风手持机包含轴线在装置的正面的左右方向上的第一麦克风对MV10-1、MV10-3,及轴线在前后方向上(即,正交于正面)的第二麦克风对MV10-1、MV10-2。此类布置可用以确定用户何时在装置的正面说话(例如,浏览-通话模式)。来自前-后麦克风对的信息可用以解析左-右麦克风对自身通常无法解析的前后方向之间的模糊性。
发明内容
一种根据一股配置的处理多通道信号的方法包含对于所述多通道信号的第一通道对,计算第一多个方向拟合性量度(例如,方向误差或似然度),其中所述第一多个方向拟合性量度当中的每一者是基于多个候选方向当中的一个对应不同候选方向。此方法包含对于所述多通道信号的不同于所述第一对的第二通道对,计算第二多个方向拟合性量度(例如,方向误差或似然度),其中所述第二多个方向拟合性量度当中的每一者是基于所述多个候选方向当中的一个对应不同候选方向。此方法包含基于所述第一多个方向拟合性量度和所述第二多个方向拟合性量度从所述多个候选方向当中选择第一方向。在此方法中,所述第一多个方向拟合性量度中的每一者是基于所述第一对的所述通道之间在所述多通道信号的第一频率分量处的差异,且所述第二多个方向拟合性量度中的每一者是基于所述第二对的所述通道之间在所述第一频率分量处的差异。还揭示具有有形特征的计算机可读存储媒体(例如,非暂时性媒体),所述有形特征致使读取所述特征的机器执行此类方法。
一种根据一股配置的处理多通道信号的设备包含用于对于所述多通道信号的第一通道对计算第一多个方向拟合性量度的装置,其中所述第一多个方向拟合性量度当中的每一者是基于多个候选方向当中的一个对应不同候选方向。此设备包含用于对于所述多通道信号的不同于所述第一对的第二通道对计算第二多个方向拟合性量度的装置,其中所述第二多个方向拟合性量度当中的每一者是基于所述多个候选方向当中的一个对应不同候选方向。此设备包含用于基于所述第一多个方向拟合性量度和所述第二多个方向拟合性量度从所述多个候选方向当中选择第一方向的装置。在此设备中,所述第一多个方向拟合性量度中的每一者是基于所述第一对的所述通道之间在所述多通道信号的第一频率分量处的差异,且所述第二多个方向拟合性量度中的每一者是基于所述第二对的所述通道之间在所述第一频率分量处的差异。
根据一股配置的用于处理多通道信号的另一设备包含量度计算器,所述量度计算器经配置以进行以下操作:对于所述多通道信号的第一通道对,计算第一多个方向拟合性量度,其中所述第一多个方向拟合性量度当中的每一者是基于多个候选方向当中的一个对应不同候选方向;以及对于所述多通道信号的不同于所述第一对的第二通道对,计算第二多个方向拟合性量度,其中所述第二多个方向拟合性量度当中的每一者是基于所述多个候选方向当中的一个对应不同候选方向。此设备包含选择器,所述选择器经配置以基于所述第一多个方向拟合性量度和所述第二多个方向拟合性量度从所述多个候选方向当中选择第一方向。在此设备中,所述第一多个方向拟合性量度中的每一者是基于所述第一对的所述通道之间在所述多通道信号的第一频率分量处的差异,且所述第二多个方向拟合性量度中的每一者是基于所述第二对的所述通道之间在所述第一频率分量处的差异。
附图说明
图1展示多麦克风手持机H100的多个视图。
图2展示用于便携式多麦克风装置的五个不同握持位置的实例。
图3A展示根据一股配置的方法M10的流程图。
图3B展示相对于麦克风对的平面波传播的远场模型。
图3C展示任务T10的实施方案T12。
图3D展示任务T10的实施方案T14。
图4A展示针对四个不同DOA的经解缠相位延迟对频率的曲线图,且图4B展示针对相同DOA的经缠绕相位延迟对频率的曲线图。
图5A展示两个DOA候选者的所测量的相位延迟值及所计算的值的实例。
图5B展示计算帧的DOA差的实例。
图6A展示似然度计算的实例。
图6B说明缩减的候选方向组。
图6C和6D说明用于任务T20和T30的迭代实施的后续阶段的候选方向的搜索组。
图7和8展示偏差移除的实例。
图9展示在帧及频率上绘制所估计的DOA处的源活动似然度的角度图的实例。
图10A展示方法M10的实施方案M20的流程图。
图10B展示方法M10的实施方案MA20的流程图。
图10C展示计算DOA估计的实例。
图10D展示识别每一频率的DOA估计的实例。
图11A展示方法M20的实施方案M25的流程图。
图11B展示线性阵列中的多个麦克风对。
图11C展示使用所计算的似然度来识别针对给定频率的最佳麦克风对及最佳DOA候选者的实例。
图12A说明用于缩减频率分量空间中的搜索的策略的实例。
图12B展示沿着电视屏幕的顶部边缘布置的麦克风的线性阵列。
图13A展示方法M10的实施方案M30的流程图。
图13B展示方法M30的实施方案M100的流程图。
图13C展示方法M100的实施方案M110的流程图。
图14A展示根据一股配置的设备A5的框图。
图14B展示设备A5的实施方案A10的框图。
图14C展示设备A10的实施方案A15的框图。
图14D展示根据一股配置的设备MF5的框图。
图14E展示设备MF5的实施方案MF10的框图。
图15A展示设备MF10的实施方案MF15的框图。
图15B展示1-D测量的模糊性的实例。
图15C展示混淆锥的一个实例。
图16展示扬声器电话应用中的源混淆的实例。
图17A展示2-D麦克风阵列。
图17B展示根据一股配置的方法M200的流程图。
图17C展示在平面极坐标图显示器上展示的DOA估计的实例。
图18A和18B展示在1-D估计的正负号与平面的对应象限之间的对应性。
图18C展示正负号元组的四个值与平面的象限之间的对应性。
图18D展示根据替代性映射的360度显示器。
图19A展示2-D麦克风阵列。
图19B展示2-D麦克风阵列的另一实例。
图19C展示其中点源升高到阵列平面上方的通用情况的实例。
图20A到20D展示一对DOA估计到阵列平面中的角度的转换的推导。
图20E展示所估计仰角角度的计算。
图21A展示通过将替代映射应用于图19B的估计而获得的曲线图。
图21B展示相交混淆锥的实例。
图21C展示图21B的锥体的相交线。
图22A展示麦克风阵列MC10-MC20-MC30的实例。
图22B到22E展示一对DOA估计到阵列平面中的角度的转换的推导。
图23A展示根据一股配置的方法M300的流程图。
图23B展示任务TB300的实施方案TB302的流程图。
图23C展示根据一股配置的设备A300的框图。
图23D展示根据一股配置的设备MF300的框图。
图24A展示方法M300的实施方案M320的流程图。
图24B展示方法M320的实施方案M325的流程图。
图25A展示方法M300的实施方案M330的流程图。
图25B展示所估计仰角角度的指示的显示实例。
图25C展示方法M330的实施方案M340的流程图。
图26A和26B分别展示旋转前后的显示器的实例。
图27A和27B分别展示旋转前后的显示器的实例。
图28A展示其中装置坐标系E与世界坐标系对准的实例。
图28B展示其中装置相对于世界坐标系旋转的实例。
图28C展示DOA到世界参考平面上的投影的到装置的显示平面上的透视映射。
图29A展示投影到世界参考平面上的DOA的透视映射显示的实例。
图29B展示方法M300的实施方案M350的流程图。
图29C展示用于输入的用户接口元件的实例。
图30A到30C展示用户接口的实例。
图31A及31B展示其中使用定向传感器来跟踪装置的定向的实例。
图32A展示设备MF300的实施方案MF320的框图。
图32B展示设备MF320的实施方案MF325的框图。
图32C展示设备A300的实施方案A320的框图。
图33A展示设备MF300的实施方案MF330的框图。
图33B展示设备MF330的实施方案MF340的框图。
图33C展示设备MF300的实施方案MF350的框图。
图33D展示设备A300的实施方案A330的框图。
图33E展示设备A300的实施方案A350的框图。
图34A和34B说明其中源相对于2-D麦克风阵列移动的情形。
图35和36展示用2-D麦克风阵列在如图34A中所示的情形中获得的观测结果的实例。
图37展示其中对如图35和36中所示的观测结果加以组合的实例。
图38展示其中对如图34B中所示的情形中的观测结果加以组合的实例。
图39和40展示用于如图41中所示的会议-呼叫情形的组合观测结果的实例。
图41展示会议-呼叫情形。
图42和43展示针对如图44A中所示的动态情形的组合观测结果的实例。
图44A展示动态情形。
图44B展示具有道路噪声的动态情形。
图45和46展示针对如图44B中所示的具有道路噪声的动态情形的组合观测结果的实例。
图47展示DOA跟踪的实例。
图48A到48D相对于不同阵列配置展示源DOA的实例。
图49A展示根据一股配置的方法MC100的流程图。
图49B展示任务TC200的实施方案TC202的流程图。
图49C展示任务TC200的实施方案TC204的流程图。
图49D展示共面麦克风对。
图49E展示具有两个麦克风对的三麦克风阵列。
图50A展示成对导向向量。
图50B展示用于图50A的向量的元素的索引标号。
图50C展示不共面的麦克风对。
图50D展示成对导向向量的阵列导向矩阵的实例。
图51A展示用于图50D中所示的矩阵A的表达式A+x=y的实例。
图51B展示图51A的实例的一股化。
图52A展示正则化操作的实例。
图52B展示归一化操作的实例。
图53A到53D和54A到54D展示使阵列导向矩阵的行重叠的两个不同实例。
图55A展示其它麦克风阵列配置的若干实例。
图55B展示成对的归一化最小方差无失真响应波束成形器/零陷波束成形器的实例。
图56A展示根据此类一股配置的处理多通道信号的方法MD100的流程图。
图56B展示根据一股配置的设备MFC100的框图。
图56C展示装置FC200的实施方案FC202的框图。
图56D展示装置FC200的实施方案FC204的框图。
图57A展示根据一股配置的用于处理多通道信号的设备MFD100的框图。
图57B展示根据一股配置的设备AC100的框图。
图57C展示鉴别器C200的实施方案C204的框图。
图57D展示根据一股配置的用于处理多通道信号的设备AD100的框图。
图57E展示根据一股配置的集成方法MG100的流程图。
图58A展示如本文所描述的源方向估计的集成方法的一个实例流程图。
图58B展示方法MG100的实施方案MG110的流程图。
图58C展示方法MG110的实施方案MG120的流程图。
图59A展示电话设计,且图59B到59D展示与对应的可视化显示器一起在各种模式中使用此类设计。
图60A展示音频预处理级AP10的框图。
图60B展示音频预处理级AP10的三通道实施方案AP20的框图。
图61A展示通信装置D10的框图。
图61B展示无线装置1102的框图。
具体实施方式
除非通过其上下文明确限制,否则在本文中使用术语“信号”来指示其一股含义中的任一者,包含如在导线、总线或其它传输媒体上表达的存储器位置的状态(或存储器位置组)。除非通过其上下文明确地限制,否则在本文中使用术语“产生”来指示其一股含义中的任一者,例如计算或以其它方式产生。除非通过其上下文明确限制,否则在本文中使用术语“计算”来指示其一股含义中的任一者,例如计算、评估、估计,和/或从多个值进行选择。除非通过其上下文明确地限制,否则使用术语“获得”来指示其一股含义中的任一者,例如计算、导出、接收(例如,从外部装置接收),和/或检索(例如,从存储元件的阵列检索)。除非通过其上下文明确地限制,否则使用术语“选择”来指示其一股含义中的任一者,例如识别、指示、应用和/或使用一组两个或两个以上中的至少一者和少于所有者。除非通过其上下文明确地限制,否则使用术语“确定”来指示其一股含义中的任一者,例如决定、建立、总结、计算、选择和/或评估。在本发明的说明书和权利要求书中使用术语“包括”时,并不排除其它元素或操作。使用术语“基于”(如在“A基于B”)来指示其一股含义中的任一者,包含如下情况:(i)“导出自”(例如,“B为A的前驱物”),(ii)“至少基于”(例如,“A至少基于B”),且如果在特定上下文中适当,(iii)“等于”(例如,“A等于B”或“A与B相同”)。类似地,使用术语“响应于”来指示其一股含义中的任一者,包含“至少响应于”。除非另外指明,否则术语“A、B和C中的至少一者”、“A、B和C中的一或多者”、“A、B和C当中的至少一者”和“A、B和C当中的一或多者”指示“A和/或B和/或C”。除非另外指出,否则术语“A、B和C中的每一者”和“A、B和C当中的每一者”指示“A和B和C”。
对多麦克风音频感测装置的麦克风的“位置”的参考指示所述麦克风的声敏感面的中心的位置,除非上下文另有指示。根据特定上下文,有时使用术语“通道”来指示信号路径且在其它时候指示由此路径载运的信号。除非另有指示,否则使用术语“系列”来指示两个或两个以上项目的序列。使用术语“对数”来指示基数为十的对数,但将此运算扩展到其它基数在本发明的范围内。使用术语“频率分量”来指示信号的一组频率或频带中的一者,例如(例如,由快速傅里叶变换产生)信号的频域表示的样本(或“频段”)或信号的子带(例如,巴克(Bark)尺度或梅尔(mel)尺度子带)。
除非另有指示,否则对具有特定特征的设备的操作的任何揭示内容还明确地希望揭示具有类似特征的方法(且反之亦然),且对根据特定配置的设备的操作的任何揭示内容还明确地希望揭示根据类似配置的方法(且反之亦然)。术语“配置”可参考由其特定上下文指示的方法、设备和/或系统来使用。术语“方法”、“过程”、“程序”和“技术”通用地且可互换地使用,除非特定上下文另有指示。具有多个子任务的“任务”也是方法。术语“设备”和“装置”也通用地且可互换地使用,除非特定上下文另有指示。术语“元件”和“模块”通常用以指示较大配置的一部分。除非由其上下文明确限制,否则术语“系统”在此用以指示其普通意义中的任一者,包含“交互以用于共同目的的元件群组”。
通过参考文献的一部分的任何并入也应理解为并入了在所述部分内参考的术语或变量的定义,其中此些定义出现在文献中的其它地方,以及并入了在所并入部分中参考的任何图。除非起初通过定冠词引入,否则用于修饰权利要求元素的序数术语(例如,“第一”、“第二”、“第三”等)本身不指示所述权利要求元素相对于另一权利要求元素的任何优先级或次序,而是仅区别所述权利要求元素与具有同一名称(如果没有序数术语)的另一权利要求元素。除非通过其上下文明确地限制,否则术语“多个”及“组”中的每一者在本文中用以指示大于1的整数量。
可假定,在发射声场的近场和远场区中,波前分别为球面的及平面的。可将近场定义为距声接收器(例如,麦克风阵列)小于一个波长的空间区。在此定义下,到区边界的距离与频率成反比地变化。在200、700及2000赫兹的频率下,例如,到一个波长边界的距离分别为约170厘米、49厘米及17厘米。改为考虑近场/远场边界处于距麦克风阵列特定距离处(例如,距阵列的麦克风或距阵列的质心50厘米,或距阵列的麦克风或距阵列的质心1米或1.5米)可为有用的。
除如图1中所展示的手持机或其它手持式通信装置之外,可实施以包含多麦克风阵列(或从此类阵列接收音频输入)及执行如本文中所描述的方法的音频感测装置的其它实例还包含桌上型计算机、便携式计算装置(例如,膝上型计算机、笔记型计算机、上网本计算机、超便携式计算机、平板计算机、移动因特网装置、智能笔记本、智能电话等)、音频记录器、视频相机、音频或视频会议装置、机顶盒、游戏系统、数字媒体接收器(例如,流式传输播放器)、媒体播放装置,及显示屏(例如,计算机监视器、电视机)。
具有用于音频感测的多个麦克风的装置可经配置以通过测量用于一或多个频率分量中的每一者的一对麦克风通道之间的差异而估计源信号的到达方向(DOA)以获得相对于对应麦克风对的轴线的到达方向的对应指示。装置可为例如用于话音通信的装置,例如图1中所示的便携式装置。源信号可为例如用户的语音。所述通道对之间的差异可例如为相位或到达时间的差异。对于其中针对两个或两个以上频率分量中的每一者获得此些方向指示的情况,此类技术可包含组合方向指示(例如,平均化方向指示以确定所估计方向是否在这些频率分量内不变)以获得用于信号的DOA估计。
此类DOA估计可用于如本文中所指出的范围,包含空间选择性滤波以及显示和/或跟踪移动源的随时间推移的方向(相对于麦克风的轴线)。举例来说,所估计的DOA可用以显示源相对于装置的当前方向和/或配置空间选择性滤波操作以增强源信号和/或衰减从其它方向到达的声音(或在需要的情况下衰减源信号)。可能需要随时间推移继续此类估计以跟踪可由源和/或麦克风阵列相对于其它者的移动导致的到达方向的改变。举例来说,可使用此类继续估计来更新当前源方向的可视化和/或更新空间选择性滤波操作。
可用于基于时间或相位差的方向估计的频率分量范围通常受到用于麦克风对的空间混叠频率的约束。可被定义为信号的波长为麦克风之间的距离d的两倍所在的频率的此频率通常在有用频率分量范围上外加上限。另外,此类基于差异的方法可能不支持超过1米的源DOA的准确估计,且通常仅支持低DOA分辨率。此类方法通常还仅使用一个固定对来用于跟踪。在此情况下,解析来自用户的语音与来自另一方向的声音(例如,来自另一人的语音)之间的模糊性对前-后麦克风对的相依性可在麦克风放置几何布置上强加显著约束,如将装置放置在表面(例如,桌面)上可有效地遮挡前或后麦克风。
挑战是提供一种用于针对同时发生的多个声音事件估计音频信号的每一帧的二维或三维到达方向(DOA)的方法,所述音频信号在背景噪声及混响下足够强健。可通过最大化可靠频段的数目来增加此类方法的稳健性。可能需要此类方法适合于任意成形的麦克风阵列几何位置,以使得可避免对麦克风放置的特定约束。
在多麦克风装置的使用期间,所要源信号相对于装置的到达方向可能改变。举例来说,装置可为用户可能在使用期间在不同位置握持(例如,在图2中所示的五个实例中的任一者当中)的智能电话(例如,如图1所示)。可能需要从一个握持位置到另一握持位置提供装置的操作连续性,使得在用户的话音上的所要聚焦得以维持。在另一实例中,装置可用作扬声器电话。可能需要提供话音跟踪应用(例如,用户跟踪或通用扬声器电话应用),使得多麦克风装置可任意放置(例如,放置在桌子上用于电话会议、放置在汽车座位上,等),且/或在使用期间任意移动且仍能够跟踪和/或增强一或多个个别说话者中的每一者的话音。可能需要此类方法能够相对于可用麦克风的任意定向来处置任意目标说话者位置。还可能需要此类方法提供瞬时多说话者跟踪/分离能力。令人遗憾的是,当前现有技术水平为单麦克风方法。
还可能需要支持远场应用中的源跟踪,所述源跟踪可用以提供对跟踪关于多麦克风装置处于大距离处及具有未知定向的源的解决方案。此类应用中的多麦克风装置可包含安装于电视机或机顶盒上的可用以支持电话的阵列。实例包含Kinect装置的扩音器阵列(华盛顿州雷蒙德的Microsoft公司)和来自Skype(Microsoft Skype部门)和三星电子(韩国首尔)的扩音器阵列。除大的源到装置距离之外,此类应用通常还遭受不良信号对干扰加噪声比(SINR)及房间混响。
可针对一或多个此类应用(例如,DOA估计以用于源跟踪、源可视化、空间选择性滤波、通用扬声器电话应用,或远场应用)实施如本文中所提议的解决方案。可实施此类方法以在无麦克风放置约束的情况下操作。举例来说,如本文所描述的成对1-D方法可恰当地并入到任何麦克风阵列几何布置中。此类方法还可经实施以使用高达尼奎斯特频率(即,取样频率的一半)且低至较低频率(例如,通过支持具有较大麦克风间距离的额外麦克风对的使用)的可用频段来跟踪源。并非限于单对麦克风用于跟踪,此类方法可经实施以选择所有可用麦克风对当中的当前最佳对。此类方法可用以支持甚至远场情境(高达3米到5米或大于5米的距离)中的源跟踪,且/或提供高得多的DOA分辨率。其它潜在特征包含获得作用中源的准确2-D表示。为获得最佳结果,可能需要每一源为时间稀疏宽带音频源,且每一频率分量(例如,频段或子频带)通常只有一个源占优势。
此类多通道处理一股可适用于(例如)用于扬声器电话应用的源跟踪。此类技术可用以计算对所接收的多通道信号的帧的DOA估计。此类方法可在每一频段下计算每一候选角度关于所观测到的角度的误差(其通过相位延迟来指示)。所述频段下的目标角度为具有最小误差的候选者。在一个实例中,接着跨越频段将误差加总以获得候选者的可能性的测量结果。在另一实例中,将跨越所有频段最频繁出现的目标DOA候选者中的一或多者识别为对给定帧的DOA估计(或估计)。
图3A展示根据一股配置的包含任务T10、T20及T30的方法M10的流程图。任务T10计算多通道信号的一对通道之间的差异(例如,其中每一通道是基于由对应麦克风产生的信号)。用于多个候选方向当中的每一者,任务T20计算基于所计算差异的对应方向拟合性量度(例如,方向误差)。基于所述多个方向拟合性量度,任务T30选择候选方向。
方法M10可经配置以将多通道信号作为一系列片段来处理。典型片段长度的范围为从约5或10毫秒到约40或50毫秒,且所述片段可为重叠的(例如,与邻近片段重叠达25%或50%)或非重叠的。在一个特定实例中,将多通道信号划分成一系列非重叠片段或“帧”,每一者的长度为10毫秒。在另一特定实例中,每一帧的长度为20毫秒。如通过方法M10处理的片段还可为如通过不同操作处理的较大片段(即,子帧),或反过来也是一样。
通道之间的差异的实例包含增益差或比率、到达时间差及相位差。举例来说,可实施任务T10以将一对通道之间的差异计算为所述通道的对应增益值之间的差或比率(例如,量值或能量差)。图3C展示任务T10的此类实施方案T12。
可实施任务T12以计算时域(例如,对于信号的多个子带中的每一者)或频域(例如,对于变换域中的信号的多个频率分量中的每一者,例如,快速傅里叶变换(FFT)、离散余弦变换(DCT)或经修改的DCT(MDCT)域)中的多通道信号的片段的增益的测量结果。此类增益量度的实例包含(不限于)以下各者:总量值(例如,样本值的绝对值的总和)、平均量值(例如,每一样本)、RMS幅度、中值量值、峰值量值、峰值能量、总能量(例如,样本值的平方和),及平均能量(例如,每一样本)。
为了在增益差技术情况下获得准确结果,可能需要将两个麦克风通道的响应相对于彼此进行校准。可能需要将低通滤波器应用于多通道信号,使得增益量度的计算限于多通道信号的音频频率部分(例如,语音频率范围)。举例来说,此类低通滤波器可经实施以具有700赫兹或1、2、5、7、8、10、12或20千赫兹的截止频率(例如,量值响应下降到-3分贝或-20分贝时的频率)。
可实施任务T12以将增益之间的差计算为对数域(例如,以分贝来计的值)中的每一通道的对应增益量度值之间的差或等效地计算为线性域中的增益量度值之间的比率。对于经校准的麦克风对,可采用零增益差来指示源距每一麦克风等距(即,位于所述对的边射方向),可采用具有较大正值的增益差来指示源更接近一个麦克风(即,位于所述对的一个端射方向),且可采用具有较大负值的增益差来指示源更接近另一麦克风(即,位于所述对的另一端射方向)。
在另一实例中,实施任务T10以通道对执行交叉相关以确定所述差异。任务T10的此类实施方案可经配置以基于多通道信号的通道之间的滞后而计算到达时间差。
在另一实例中,实施任务T10以将一对通道之间的差异计算为每一通道的相位之间的差(例如,在信号的特定频率分量处)。图3D展示任务T10的此类实施方案T14。如下文所论述,可针对多个频率分量当中的每一者执行此类计算。
对于由一对麦克风在相对于所述麦克风对的轴线在特定到达方向(DOA)上直接从点源接收的信号,相位差(也称为“相位延迟”)对于每一频率分量不同,并且还取决于麦克风之间的间距。可将特定频率分量(例如,频段)下的相位延迟的所观测值计算为复数FFT系数的虚数项与复数FFT系数的实数项的比率的反正切(还被称为反正切(arctangent))。(如果使用例如DCT或MDCT等实值变换,那么可能需要将此类变换与离散正弦变换配对(例如,如在复数重叠变换或经修改的复数重叠变换中)以获得相位信息。)
如图3B中所展示,特定频率f处的相位延迟值可与远场(即,平面波)假定下的源DOA相关,如其中d表示麦克风之间的距离(以米来计),θ表示相对于正交于阵列轴线的方向的到达角度(以弧度来计),f表示频率(以赫兹来计),且c表示声速(例如,以米/秒来计)。对于不具有混响的单个点源的理想情况,相位延迟与频率的比率将在所有频率上具有相同值如下文更详细论述,相对于麦克风对的DOAθ为一维测量结果,其定义空间圆锥的表面(例如,使得圆锥的轴线为阵列的轴线)。与其中实施任务T10以计算增益差的方法M10的类似实施方案相比,其中实施任务T10以计算相位延迟的方法M10的实施方案将通常对于所述对的麦克风的增益响应之间的失配更为稳健。
此类方法通常实际上受麦克风对的空间混叠频率限制,所述空间混叠频率可被定义为信号的波长为麦克风之间的距离d的两倍所在的频率。空间混叠造成相位缠绕,所述情形通常对可用以提供对特定麦克风对的可靠相位延迟测量结果的频率范围给出上限。
图4A展示针对各自从不同DOA到达的四个信号的实际相位延迟对频率的曲线图,其中用于每一信号的曲线图由对应线模式指示。图4B展示对于相同的四个信号的所观测相位延迟对频率的曲线图(由相同线模式指示),其中每一曲线图的初始部分(即,直到第一相位缠绕出现)以粗体展示。试图通过对所测量相位进行解缠(例如,对图4B中所示的观测结果进行解缠以重建如图4A所示的曲线图)而扩展相位延迟测量的有用频率范围通常不可靠,在存在噪声的情况下尤其如此。
可实施任务T20以例如根据增益差、相位差或到达时间差(例如,取决于任务T10的对应实施方案)而计算方向拟合性量度(例如,方向误差)。举例来说,可实施任务T20以根据具有K个DOA候选者的存量中的每一DOA候选者的频率f处的相位差计算方向误差,其中1≤k≤K且K≥2。任务T20的此实施方案可将用于频率f和DOA候选者k的方向误差计算为平方差(或者,计算为绝对差eph_f_k=),其中表示频率f处的所观测相位差,且表示对应于频率f处的DOA候选者θk的相位差。
可在运行时间之前(例如,在设计或制造期间)根据已知速度值c和距离d以及频率分量f的所要范围计算用于每一DOA候选者θk的相位延迟值且在方法M10的执行期间从存储装置检索(例如,在装置的使用期间)。此类预先计算的库存可经配置以支持所要角度范围及分辨率(例如,均匀分辨率,例如1度、2度、5度、6度、10度或12度;或所要非均匀分辨率)以及所要频率范围及分辨率(其还可为均匀的或非均匀的)。
可能需要通过使用来自频率高于空间混叠频率的分量的相位差测量来扩展有用频率分量的范围。然而,如上文所指出,相位解缠技术在存在噪声的情况下可能变得不可靠。替代相位解缠,可根据针对DOA候选者存量中的每一DOA候选者比较所测量的相位延迟(例如,经缠绕)与经缠绕相位延迟的预先计算值的替代方法实施任务T20。图5A展示此类实例,所述实例包含(有噪声的)所测量的相位延迟值(灰色)与存量的两个DOA候选者的相位延迟值(实线及虚线)的角度对频率曲线图,其中相位缠绕到π到-π的范围。可接着通过计算每一DOA候选者的对应方向误差θi且识别对应于这些方向误差当中的最小者的DOA候选者来确定最佳地匹配如所观测到的信号的DOA候选者。此类方向误差可例如计算为第k DOA候选者的相位延迟值与所观测相位延迟值之间的误差eph_k。在一个实例中,方向误差eph_k表达为所要范围或另一组F频率分量内的即表达为所观测值与候选者相位延迟值之间的平方差的组F内的总和
可能需要跨越尽可能多的频段计算方向误差(例如,eph_f_k、eph_k)以增加对噪声的稳健性。举例来说,可能需要误差计算包含来自超出空间混叠频率的频段的项。在实际应用中,最大频段可受其它因素限制,其它因素可包含可用存储器、计算复杂性、高频下来自硬质体(例如,环境中的物体、装置的外壳)的强反射等。
话语信号在时间频域中通常为稀疏的。如果两个或两个以上源在频域中不相交,那么可实施方法M20以同时跟踪这些源中的一者以上。如果两个或两个以上源在时域中不相交,那么可实施方法M10以跟踪这些源中处于相同频率的一个以上源。
误差还可认为是方差(即,个别误差(所观测相位延迟)从预期值(候选相位延迟)偏离的程度)。所接收信号从时域到频域的转换(例如,通过应用FFT)具有将每一频段中的频谱平均化的效果。如果使用子带表示(例如,梅尔尺度或巴克尺度),那么此平均化更明显。另外,可能需要对DOA估计执行时域平滑(例如,通过应用递归平滑滤波器,例如,一阶无限脉冲响应滤波器)。
即使对于点源及无混响的理想情况(使得源信号的所有频率分量从相同方向到达),信号的所观测相位延迟与特定DOA候选者的所计算相位延迟之间的差对于高频率分量将比低频率分量大。换句话说,根据时间或相位延迟(例如,eph_f_k)表达的方向拟合性量度(例如,方向误差)的值将随着频率而变化,即使DOA的实际误差保持相同也是这样。出于此些原因,可能需要实施任务T20以根据DOA(例如,以指示基于空间角度之间的差异的量度值)而非根据时间或相位延迟来计算方向拟合性量度。
依据DOA对方向误差的表达可通过将频率f处的经缠绕相位延迟(例如,所观测到的相位延迟)表达为信号的DOAθ的函数Ψf_wr来导出。DOA可用以表达此类函数,例如
我们可以假定此表达式等效于作为DOA的函数的用于经解缠相位延迟的对应表达式,例如
只是归因于相位缠绕而接近不连续性。可接着根据所观测DOAθob和候选DOAθk而将方向误差eph_f_k表达为
eph_f_k=|Ψf_wr(θob)-Ψf_wr(θk)|≡|Ψf_un(θob)-Ψf_un(θk)|
或
eph_f_k=(Ψf_wr(θob)-Ψfwr(θk))2≡(Ψf_un(θob)-Ψf_un(θk))2,
其中根据频率fθob_f处的所观测DOA和候选DOAθk而将频率f处的所观测相位延迟与候选相位延迟之间的差表达为
可接着根据所观测DOAθob和候选DOAθk而将跨越F的方向误差eph_k表达为
我们可以对此结果执行泰勒级数扩充以获得以下一阶近似:
可接着使用此近似值来获得如在频率f和DOA候选者θk处观测到的DOAθob_f之间的差异的表达式:
在假设所观测到的经缠绕相位延迟与经解缠相位延迟等值的情况下,可使用(例如,在任务T20中)此表达式来根据DOA(eDOA_f_k、eDOA_k)而非相位延迟(eph_f_k、eph_k)来表达方向误差:
其中[Ψf_wr(θob),Ψf_wr(θk)]的值定义为
为避免在端射方向(θ=+/-90°)上除以零,可能需要实施任务T20以使用二阶近似替代一阶近似执行此类扩展,如在下式中:
其中A=(πfd sinθk)/c,B=(-2πfd cosθk)/c,且
C=-(Ψf_un(θob)-Ψf_un(θk))。
如同在上文一阶实例中,在假定所观测到的经缠绕相位延迟与经解缠相位延迟等值且使用候选DOAθk的情况下,可使用(例如,在任务T20中)此表达式来根据DOA(例如,作为基于角方向之间的差异的量度值的估计,例如角方向之间的平方差)将方向误差表达为所观测及候选经缠绕相位延迟值的函数。图5B展示其中在所接收的多通道信号的多个频率f中的每一者(例如,)处且对于多个DOA候选者θk中的每一者(例如,),任务T20计算方向误差,所述方向误差指示与所接收信号的给定帧的所观测与候选DOA之间的差异有关的此类值。
基于方向拟合性量度任务T30选择用于频率分量的候选方向。举例来说,可实施任务T30以选择与通过任务T20产生的多个方向误差当中的最低者(即,最小者)相关联的候选方向。在另一实例中,实施任务T30以对于多个方向误差中的每一者计算对应似然度,且选择与最高似然度相关联的候选方向。
图6A展示可针对如通过任务T20的实施方案的实例所计算的候选角度k、频率f和帧i的不同元组按需要以方向误差填入的决策空间的一个实例。可能需要实施任务T30以根据此类所计算的DOA差异或误差指示源活动性的似然度。对于特定帧i、频率f和角度k,此类方向似然度L的一个实例可表达为
可实施任务T20以将多个方向拟合性量度中的每一者计算为此类似然度。举例来说,可实施任务T20以如表达式(1)中所示根据如上文所描述的一阶泰勒近似计算似然度:
类似地,可实施任务T20以如表达式(1)中所示根据如上文所描述的二阶泰勒近似计算似然度。
在一些情况下,可能需要对于帧i且对于多个候选角度k中的每一者计算跨越多个频率f的似然度L的总和,且选择具有最大似然度总和的候选角度。对于表达式(1),特定频率处的极好匹配可致使对应似然度比所有其它频率处的似然度有优势,即使所有其它频率都指示另一候选角度k最可能也是这样。为了减小此易感性,可能需要包含正则项λ,如在以下表达式中:
频率特定似然度结果可投影到(帧,角度)平面上(例如,如图7和8中所示)以获得每帧的DOA估计θest_i=θkmnax_i[其中kmax_i=argmaxk∑f∈FL(i,f,k)],其对于噪声和混响是稳健的,因为仅目标优势频段对所述估计有贡献。在此求和中,其中误差大的项具有接近零的似然度值且因此变得对于估计来说为不显著的。如果一方向源在一些频段中占优势,那么那些频段处的误差值对于对应于所述源的候选角度更接近于零。而且,如果另一方向源在其它频段中占优势,那么在其它频段处的误差值对于对应于所述源的候选角度将更接近于零。
在时间和频率两者中,语音往往为稀疏的,使得一组频率F内的总和可包含来自受噪声支配的频段的结果。可能需要包含偏差项β,如以下表达式中:
可随频率和/或时间变化的偏差项可基于噪声的假设分布(例如,高斯)。另外或替代地,偏差项可基于噪声的初始估计(例如,来自仅噪声初始帧)。另外或替代地,可基于来自仅噪声帧的信息(如(例如)通过话音活动检测模块指示)动态地更新偏差项。图7和8分别展示偏差移除之前和之后的似然度曲线图的实例(对于从+90到-90度的候选角度范围和2000个连续帧序列)。
还可将似然度结果投影到(帧,频率)平面上(如图9的底部面板中所展示)以基于方向从属关系指示每一频段的似然度信息(例如,用于话音活动检测)。此面板展示用于每一频率f和帧i的所估计DOA的对应似然度(例如,L(i,f,kmax_i))。此似然度可用以指示语音活动的似然度。另外或替代地,此信息可用以(例如)通过根据到达方向将帧和/或频率分量分类来支持所接收信号的时间和/或频率选择性掩蔽。
如图9的底部面板中所展示的角度图表示类似于光谱图表示。如图9的顶部面板中所展示,可通过在每一帧处绘制每一频率分量的量值来获得光谱图。可通过在每一帧处绘制每一频率下的当前DOA候选者的似然度来获得角度图。
任务T20和T30可作为决策树而迭代而以减小的计算成本提供增大的方向分辨率。在此实施方案的初始阶段中,任务T20针对一组缩减的K个候选方向中的每一者计算方向拟合性量度(例如,方向误差或似然度)。缩减的组可相对于方向均匀分布(例如,如图6B中所示)。或者,缩减的组朝向麦克风对的端射方向(此处方向准确度通常较高)可能比朝向边射方向(此处可靠地鉴别附近方向的能力通常减小)更为集中。任务T30接着根据在所述初始阶段中所计算的方向拟合性量度(例如,如由图6B中的-30度处的粗线所指示)选择所述缩减组候选方向中的一者,例如对应于最小方向误差和/或最大似然度的候选方向。
在所述实施方案的后续阶段中,任务T20计算在所选候选方向的有限跨度(由图6C中的-30度处的粗虚线指示)内的一或多个候选方向的方向拟合性量度(例如,如由图6C中的-15和-45度处的粗线所指示)。任务T30接着根据在所述后续阶段中所计算的方向拟合性量度选择在所述有限跨度内的候选方向中的一者,例如对应于最小方向误差和/或最大似然度的候选方向(例如,如由图6C中的-45度处的粗实线所指示)。
如果需要,可执行任务T20和T30的进一步迭代以实现较高分辨率分辨率举例来说,图6C展示其中任务T20针对在先前两个迭代中选择的候选方向(由图6D中的-30和-45度处的粗虚线指示)之间的一或多个候选方向(例如,如由图6D中的-35和-40度处的实线所指示)计算方向拟合性量度,且任务T30接着根据对应方向拟合性量度(例如,如由图6D中的-35度处的粗实线所指示)选择这些中间候选方向中的一者的又一迭代。
图10A展示包含任务T100、T200和T300的方法M10的实施方案M20的流程图。可使用此类方法以例如针对多通道信号的多个频率分量中的每一者(例如,组F或其子组,如本文所描述)基于来自多通道信号的一对通道的信息选择源信号的候选到达方向。对于所述多个频率分量当中的每一者,任务T100计算所述通道对之间的差异。可实施任务T100以(例如)针对所述多个频率分量当中的每一者执行任务T10的对应实例(例如,任务T12或T14)。
对于所述多个频率分量当中的每一者,任务T200计算多个方向拟合性量度。举例来说,可实施任务T200以针对所述多个频率分量当中的每一者执行任务T20的对应实例。可实施任务T200以针对每一频率分量计算相同数目(例如,K)个方向拟合性量度。或者,可实施任务T200以针对频率分量当中的两者或两者以上中的每一者计算不同数目个方向拟合性量度。
对于所述多个频率分量当中的每一者,任务T300选择候选方向。可实施任务T300以针对所述多个频率分量当中的每一者执行任务T30的对应实例。举例来说,可实施任务T300以针对每一频率分量指示对应于最小方向误差(或最大似然度)的候选方向,如图10C中所示。可接着将帧的DOA估计确定为跨越所有频率分量最频繁指示的候选方向。应明确地指出,对于所述多个频率分量中的每一者,可实施任务T200和T300以如本文所描述作为决策树而迭代经过候选方向的存量。
图10B展示包含任务T100、T200和TA300的方法M10的实施方案MA20的流程图。基于任务T200中所计算的多个方向误差,任务TA300选择候选方向。举例来说,可实施任务TA300以对于每一候选方向计算对应似然度总和(例如,如图10D中所示的全部频率分量)且选择具有最大似然度总和的候选方向。在另一实例中,实施任务TA300以对于每一候选方向计算如图10D中所示的频率分量上的方向误差(或者,似然度)的平均值(例如,中值或最频值),且选择具有最小平均方向误差(或者,最大平均似然度)的候选方向。
有声语音(例如,元音声音)的能量谱往往在音调频率的谐波下具有局部峰值。另一方面,背景噪声的能量谱往往为相对非结构化的。因此,可预期在音调频率的谐波下的输入通道的分量具有比其它分量高的信噪比(SNR)。可能需要配置方法M20而使得所述多个频率分量(例如,组F)限于对应于所估计音调频率的谐波(例如,整数倍)的频率分量。
典型音调频率的范围是从男性说话者的约70到100赫兹到女性说话者的约150到200赫兹。可通过将音调周期计算为邻近音调峰值(例如,主麦克风通道中)之间的距离来估计当前音调频率。可基于输入通道的样本的能量的测量结果(例如,基于样本能量与帧平均能量之间的比率)和/或基于样本的相邻者与已知音调峰值的类似相邻者相关的程度的测量结果将输入通道的样本识别为音调峰值。音调估计程序描述于(例如)在www.3gpp.org处在线提供使用的增强型可变速率编码解码器(EVRC)文档C.S0014-C的第4.6.3章节(第4-44到4-49页)中。在包含语音编码及/或解码的应用(例如,使用编码解码器进行的包含音调估计的话音通信,例如,码激励线性预测(CELP)和原型波形内插(PWI))中,音调频率的当前估计(例如,呈音调周期或“音调滞后”的估计的形式)通常将已经可得到。
可能需要(例如)配置任务T100以使得所计算的通道差异(例如,相位差)的至少25%、50%或75%对应于所估计的音调频率的倍数。方法M20的此类实施方案的其它任务可根据谐波频率的组F类似地制定,且相同原理还可应用于谐波非语音源信号。对于其中不同源信号的谐波通常不相交(例如,每一源的所述组谐波频率分量的至少50%、60%或75%为所述源所特有)的情况,方法M20的此类实施方案可经配置以选择每一源的对应候选方向。在方法M20的相关实施方案中,实施任务T100以计算通道对的至少一子频带的频率分量中的每一者的相位差,且实施任务T200以仅基于对应于所估计音调频率的倍数的那些相位差计算方向拟合性量度。
图11A展示包含任务T400的方法M20的实施方案M25的流程图。此类方法可用以(例如)基于来自多通道信号的一对通道的信息指示源信号的到达方向。基于由任务T300产生的候选方向选择,任务T400指示到达方向。举例来说,可实施任务T400以指示所述候选方向当中最频繁选择的候选方向作为到达方向。对于其中源信号通常如上文所描述在频率上不相交的情况,可实施任务T400以指示一个以上到达方向(例如,以针对一个以上源当中的每一者指示一方向)。举例来说,在此情况下,可实施任务T400以指示由任务T300最频繁地选择的两个候选方向。可能需要配置任务T400的此类实施方案以仅当候选者的选择数目达到或者超过阈值(例如,选择总数的25%、30%、35%或40%)时才指示此类方向。方法M25可随时间推移而迭代以指示多通道信号的一连串帧中的每一者的一或多个到达方向。
具有大间距的麦克风对通常不适合于高频率的DOA估计,因为空间混叠对于此类对开始于相对较低的频率。然而,如本文中所描述的DOA估计方法允许使用超出相位缠绕开始时的频率且甚至高达尼奎斯特频率(即,取样速率的一半)的相位延迟测量结果。通过放松空间混叠约束,此类方法还使得能够使用具有较大麦克风间间隔的麦克风对。因为具有大麦克风间距离的阵列在低频下通常提供更好的方向性(与具有小麦克风间距离的阵列相比较),所以较大阵列的使用通常也将可用相位延迟测量结果的范围扩展到较低频率。
本文所述的DOA估计原理可扩展到线性阵列中的多个麦克风对(例如,如图11B中所示)。用于远场情况的此类应用的一个实例是沿着电视机或其它大幅面视频显示屏幕(例如,如图12B中所展示)的边缘布置的线性麦克风阵列。可能需要配置此类阵列以具有麦克风之间的非均匀(例如,对数)间距,如在图11B和12B的实例中,但具有均匀隔开的麦克风的阵列也可为有用的且明确地涵盖在内。
用于远场源,可预期线性阵列的多个麦克风对观测到基本上相同的DOA。因此,一个选项是对于阵列的两个或两个以上麦克风对中的每一者执行方法M10的实施方案的对应实例(例如,方法M20),且将DOA估计为这些DOA估计的平均值。然而,平均化方案可受所述对中的甚至单个对的失配影响,此情形可降低DOA估计准确性。或者,可能需要从阵列的两个或两个以上麦克风对当中选择用于每一频率的最佳麦克风对(例如,在所述频率处给出最小方向误差或最大似然度的对),使得可针对不同频带选择不同麦克风对。在麦克风对的空间混叠频率处,可能预期对应方向误差将为大的(且对应方向似然度将为小的)。因此,此类方法将倾向于在频率接近于其缠绕频率时自动避免麦克风对,从而减小DOA估计中的相关不确定性。对于较高频段,麦克风之间具有较短距离的对通常将提供更好的估计且可自动地受到喜爱,而对于较低频段,麦克风之间具有较大距离的对通常将提供更好的估计且可自动地受到喜爱。在图11B中所示的四麦克风实例中,六不同麦克风对是可能的(即,)。
在一个实例中,通过针对每一频率f计算P×K值来选择用于每一轴线的最好的对,其中P为对的数目,K为存量的大小,且每一值epk为所观测到的角度θpf(对于对p和频率f)与候选角度θk之间的平方绝对差。用于每一频率f,选择对应于最低误差值epk(或最高似然度值)的对p。此拟合性值还指示频率f处的最佳DOA候选者θk(如图11C中所示)。
图13A展示包含任务T150、T250和T35的方法M10的实施方案M30的流程图。对于多通道信号的多个通道对中的每一者,任务T150执行如本文所描述的任务T10的实例以计算所述对之间的差异(例如,相位差)。对于所述多个通道对当中的每一者,任务T250执行如本文所描述的任务T20的对应实例以计算多个方向拟合性量度。可实施任务T250以针对每一通道对计算相同数目个方向拟合性量度(例如,K个)。或者,可实施任务T250以针对通道对当中的两者或两者以上中的每一者计算不同数目个方向拟合性量度。
方法M30还包含基于多个方向拟合性量度选择候选方向的任务T35。举例来说,可实施任务T35以选择对应于方向误差当中的最小者(或最大似然度)的候选方向。应明确地指出,对于所述多个通道对中的每一者,可实施任务T250和T35以作为决策树而迭代经过候选方向的存量(例如,如下文所描述)。方法M30可用以例如指示多通道信号的频率分量的候选方向(例如,特定帧处)。
图13B展示包含任务T170、T270和T350的方法M20和M30的实施方案M100的流程图。任务T170为针对多个频率分量当中的每一者执行任务T150的对应实例的任务T100和T150的实施方案。任务T270为针对所述多个频率分量当中的每一者执行任务T250的对应实例的任务T200和T250的实施方案。举例来说,可实施任务T270以针对频率分量中的每一者计算用于P对中的每一者的K个方向拟合性量度或用于每一频率分量的总共PxK个方向拟合性量度。用于所述多个频率分量当中的每一者,任务T350执行任务T35的实例以选择对应候选方向。应明确地指出,对于所述多个频率分量中的每一者,可实施任务T270和T350以作为决策树而迭代经过候选方向的存量(例如,如下文所描述)。
方法M100可用以例如针对多通道信号的多个频率分量当中的每一者选择候选方向(例如,在特定帧处)。图13C展示包含如本文所描述的任务T400的实例的方法M100的实施方案M110的流程图。
可能需要通过使用搜索策略(例如二叉树或其它决策树)和/或应用已知信息(例如来自一或多个先前帧的DOA候选者选择)来降低误差计算操作的计算复杂度。对于其中对多通道信号的连续片段(例如,帧)执行方法M20的实施方案的实例(例如,方法M25、M100或M110)的应用,可能需要使用来自前一迭代的信息以减小搜索空间。举例来说,可能需要在方法M20或M25的后续实例中配置任务T200(或在方法M100或M110的后续实例中配置任务T270)以针对比组F的所有频率分量少的频率分量中的每一者计算方向拟合性量度。
图12A说明此类缩减搜索策略的一个实例。在此实例中,实施方法M20(例如,方法M25、M100或M110)的初始实例以记录对于所选候选方向(由星形指示)具有最低方向误差(由经标记框指示)的R个频率分量的指示。R的值的实例包含组F中的元素数目的10%、20%、25%、35%和50%,但可使用被认为适合于特定应用的任何其它值。此缩减的组FR接着用作用于方法M20(例如,方法M25、M100或M110)的下一实例的频率分量的组F。
方法M20(例如,方法M25、M100或M110)的后续实例可类似地限于经缩减组FR,直到例如从上一次全量搜索起已经过指定时间间隔或帧数目(例如,20、50、100或200个帧,或一、二、三、四或五秒),或直到出现指定复位事件。复位事件的一个实例为所选候选方向的改变。复位事件的另一实例为经缩减组FR在所选候选方向处的平均方向误差(例如,均值、中值或最频值)增加(例如,达到或超出阈值)。在此些时间,可通过执行方法M20(例如,方法M25、M100或M110)的实例而起始新循环,其搜索完整组的F个频率分量且选择经缩减搜索组FR的新实例用于所述方法的后续实例,如上文所描述。
除将方法M20的后续实例限制为频率分量的经缩减组FR之外或作为其替代,可能需要实施方法M10(例如,方法M20、M25、M30、M100或M110)的实施方案的后续实例以对于比所有K个候选方向少的候选方向执行任务T20。方法M10(例如,方法M20、M25、M30、M100或M110)的此类后续实例可经配置以例如仅针对距由初始实例选择的候选方向小于(或者,不远于)最大改变角度θΔ的那些候选方向计算方向拟合性量度。可例如通过所要源在平行于麦克风阵列的轴线的方向上的预期最大速度来确定最大改变角度θΔ。最大改变角度θΔ的值的实例包含20、30和45度。
方法M10(例如,方法M20、M25、M30、M100或M110)的后续实例可类似地限于如由角度指示的此类角度搜索窗,直到例如从上一次全量搜索以来已经过指定时间间隔或帧数目(例如,20、50、100或200个帧,或一、二、三、四或五秒),或直到出现指定复位事件。复位事件的一个实例为所选候选方向的改变。复位事件的另一实例为在角度搜索窗内的平均方向拟合性量度(例如,均值、中值或最频值)增加(例如,达到或超出阈值)。在此些时间,可通过执行方法M10(例如,方法M20、M25、M30、M100或M110)的实例而起始新循环,其搜索完整组的K个候选方向且选择新的初始候选方向用于所述方法的后续实例,如上文所描述。
可应用此类方法以获得瞬时跟踪结果(例如,具有小于一帧的延迟)。所述延迟取决于FFT大小及重叠度。举例来说,对于具有50%重叠及16kHz的取样频率的512点FFT,所得256样本延迟对应于16毫秒。此类方法可用以支持通常高达2到3米或甚至高达5米的源阵列距离的源方向的辨别。
可能需要实施任务T20(或T200或T250)以根据例如es(n)=βes(n-1)+(1-β)e(n)(也称为一阶IIR或递归滤波器)等表达式对每一方向拟合性量度执行时间平滑化操作,其中es(n-1)表示用于前一讯框的经平滑化方向拟合性量度,e(n)表示方向拟合性量度的当前未经平滑化的值,es(n)表示方向拟合性量度的当前经平滑化的值,且β为其值可选自从零(无平滑化)到1(无更新)的范围的平滑化因数。平滑化因数β的典型值包含0.1、0.2、0.25、0.3、0.4和0.5。通常但不必使任务T20的此类实施方案使用相同β值来平滑化对应于不同频率分量的方向拟合性量度。类似地,通常但不必使任务T20的此类实施方案使用β的相同值来使平滑化对应于不同候选方向的方向拟合性量度。可实施任务T10(或T100或T150)以对每一所计算的差执行类似时间平滑化操作。可实施任务T30(或T35或T350)以对每一所选候选方向执行类似的时间平滑化操作。可实施任务T400以对每一DOA指示执行类似的时间平滑化操作。
图14A展示根据一股配置的包含量度计算器200和选择器300的设备A5的框图。量度计算器200经配置以针对多通道信号的一对通道之间的所计算的差异且针对多个候选方向当中的每一者计算对应方向方向拟合性量度,所述对应方向拟合性量度是基于所计算的差异(例如,方向误差或似然度,如本文参考任务T20的实施方案所描述)。选择器300经配置以基于对应方向拟合性量度选择候选方向(例如,如本文中参考任务T30的实施方案所描述)。
图14B展示包含差异计算器100的设备A5的实施方案A10的框图。设备A10可经实施以例如执行如本文所描述的方法M10、M20、MA20、M30和/或M100的实例。计算器100经配置以计算多通道信号的一对通道之间的差异(例如,增益差或相位差)(例如,如本文参考任务T10的实施方案所描述)。计算器100可经实施以例如针对多通道信号的多个频率分量当中的每一者计算此类差异(例如,如本文参考任务T100的实施方案所描述)。在此情况下,计算器100还可经实施以在计算差异之前将子带滤波器组应用于信号及/或计算每一通道的频率变换(例如,快速傅里叶变换(FFT)或经修改的离散余弦变换(MDCT))。量度计算器200可实施于设备A10中以针对多个频率分量当中的每一者计算多个方向拟合性量度(例如,如本文参考任务T200的实施方案所描述),且选择器300可实施于设备A10中以基于多个方向拟合性量度选择候选方向(例如,如本文参考任务TA300的实施方案所描述)或针对多个频率分量当中的每一者选择候选方向(例如,如本文参考任务T300的实施方案所描述)。
另外或替代地,计算器100可经实施以针对多通道信号的多个通道对当中的每一者计算此类差异或多个差异(例如,如本文分别参考任务T150和T170的实施方案所描述)。在此些情况下,量度计算器200可经实施以针对多个通道对当中的每一者计算多个方向拟合性量度(例如,如本文分别参考任务T250和T270的实施方案所描述),且选择器300可经实施以基于多个方向拟合性量度选择候选方向(例如,如本文参考任务T35的实施方案所描述)或针对多个频率分量当中的每一者选择对应候选方向(例如,如本文参考任务T350的实施方案所描述)。
图14C展示包含指示器400的设备A10的实施方案A15的框图。指示器400经配置以基于由选择器300产生的多个候选方向选择指示到达方向(例如,如本文参考任务T400的实施方案所描述)。可实施设备A15以例如执行如本文中所描述的方法M25和/或M110的实例。
图14D展示根据一股配置的设备MF5的框图。设备MF5包含用于针对多通道信号的一对通道之间的所计算的差异及针对多个(K个)候选方向中的每一者计算对应方向拟合性量度的装置F20,所述对应方向拟合性量度是基于所计算的差异(例如,方向误差或似然度,如本文参考任务T20的实施方案所描述)。设备MF5还包含用于基于对应方向拟合性量度选择候选方向的装置F30(例如,如本文参考任务T30的实施方案所描述)。
图14E展示可经实施以例如执行如本文所描述的方法M10、M20、M30和/或M100的实例的设备MF5的实施方案MF10的框图。设备MF10包含用于计算多通道信号的一对通道之间的差异(例如,增益差或相位差)(例如,如本文参考任务T10的实施方案所描述)的装置F10。装置F10可经实施以例如针对多通道信号的多个(F个)频率分量当中的每一者计算此类差异(例如,如本文参考任务T100的实施方案所描述)。在此情况下,装置F10还可经实施以包含用于在计算差异之前执行子带分析及/或计算每一通道的频率变换(例如,快速傅里叶变换(FFT)或经修改的离散余弦变换(MDCT))的装置。装置F20可实施于设备MF10中以针对多个频率分量当中的每一者计算多个方向拟合性量度(例如,如本文参考任务T200的实施方案所描述),且装置F30可实施于设备MF10中以基于多个方向拟合性量度选择候选方向(例如,如本文参考任务TA300的实施方案所描述)或针对多个频率分量当中的每一者选择候选方向(例如,如本文参考任务T300的实施方案所描述)。
另外或替代地,装置F10可经实施以针对多通道信号的多个通道对当中的每一者计算此类差异或多个差异(例如,如本文分别参考任务T150和T170的实施方案所描述)。在此些情况下,装置F20可经实施以针对多个通道对当中的每一者计算多个方向拟合性量度(例如,如本文分别参考任务T250和T270的实施方案所描述),且装置F30可经实施以基于多个方向拟合性量度选择候选方向(例如,如本文参考任务T35的实施方案所描述)或针对多个频率分量当中的每一者选择对应候选方向(例如,如本文参考任务T350的实施方案所描述)。
图15A展示设备MF10的实施方案MF15的框图,所述设备包含用于基于由装置F30产生的多个候选方向选择(例如,如本文中参考任务T400的实施方案所描述)指示到达方向的装置F40。可实施设备MF15以(例如)执行如本文中所描述的方法M25和/或M110的实例。
可如本文中所描述来处理由麦克风对或其它线性麦克风阵列接收的信号,以提供指示参考阵列的轴线的角度的所估计DOA。如上文所描述(例如,参考方法M20、MA20、M25、M100和M110),可在线性阵列中使用两个以上麦克风来改善跨越频率范围的DOA估计性能。然而,甚至在此类情况下,线性(即,一维)阵列所支持的DOA估计的范围通常限于180度。
图11B展示一维DOA估计指示相对于正交于阵列的轴线的平面的角度(在+90度到-90度的180度范围内)的测量模型。尽管下文参考如图11B中所展示的上下文描述方法M200和M300和任务TB200的实施方案,但将认识到,此类实施方案不限于此上下文且明确地预期并在此揭示参考其它上下文的对应实施方案(例如,其中DOA估计指示在麦克风MC10的方向上或替代地在远离麦克风MC10的方向上相对于轴线的0到180度的角度)。
所要角度跨度可任意地在180度范围内。举例来说,DOA估计可限于所述范围内的所关注的选定扇区。所要角度分辨率还可以为任意的(例如,均匀地分布在范围内或非均匀地分布,如本文参考图6B到6D所描述)。另外或替代地,所要频率跨度可为任意的(例如,限于话音范围)和/或所要频率分辨率可为任意的(例如,线性的、对数的、梅尔尺度、巴克尺度等)。
图15B展示由来自线性阵列的DOA估计的单向度产生的模糊性的实例。在此实例中,来自麦克风对MC10、MC20的DOA估计(例如,作为如由选择器300产生的候选方向,或如由指示器400产生的DOA估计)指示参考阵列轴线的角度θ。然而,即使此估计非常准确,其也不会指示源是沿着线d1还是沿着线d2定位。
来自线性麦克风阵列的DOA估计(由于其单向度)实际上描述空间中的围绕阵列轴线的正确的圆锥表面(假定麦克风的响应为极佳地全向的)而不是空间中的任何特定方向。此圆锥表面(还被称为“混淆锥”)上的源的实际位置是不确定的。图15C展示此类表面的一个实例。
图16展示扬声器电话应用中的源干扰区的实例,其中三个源(例如,人类说话者的嘴)位于相对于具有线性麦克风阵列的装置D100(例如,智能电话)的不同的相应方向上。在此实例中,源方向d1、d2和d3皆碰巧位于混淆锥上,所述混淆锥是在麦克风MC20处通过在麦克风MC10的方向上相对于阵列轴线的角度(θ+90度)来界定。因为所有三个源方向具有相对于阵列轴线的相同角度,所以麦克风对针对每一源产生相同的DOA估计且未能区分所述源。
为了提供具有较高维数的估计,可能需要将本文中所描述的DOA估计原理扩展到麦克风的二维(2-D)阵列。图17A展示包含具有正交轴线的两个麦克风对的2-D麦克风阵列。在此实例中,第一对MC10、MC20的轴线为x轴,且第二对MC20、MC30的轴线为y轴。可针对第一对执行方法M10的实施方案的实例以产生对应1-D DOA估计θx,且可针对第二对执行方法M10的实施方案的实例以产生对应1-D DOA估计θy。对于从位于通过麦克风轴线界定的平面中的源到达的信号,通过θx和θy描述的混淆锥在信号的到达方向d上重合以指示平面中的独特方向。
图17B展示根据一股配置的包含任务TB100a、TB100b和TB200的方法M200的流程图。任务TB100a计算对多通道信号的关于麦克风的第一线性阵列的轴线的第一DOA估计,且任务TB100a计算对多通道信号的关于麦克风的第二线性阵列的轴线的第二DOA估计。可将任务TB100a和TB100b中的每一者实施为(例如)如本文中所描述的方法M10的实施方案的实例(例如,方法M20、MA20、M30、M100或M110)。基于第一和第二DOA估计,任务TB200计算组合DOA估计。
组合DOA估计的范围可大于第一和第二DOA估计中的任一者的范围。举例来说,可实施任务TB200以组合由任务TB100a和TB100b产生的且具有高达180度的个别范围的1-DDOA估计,以产生指示DOA为高达360度的范围内的角度的组合DOA估计。可实施任务TB200以通过应用映射(例如,(4))将1-D DOA估计θx,θy映射到较大角度范围内的方向,以组合一个角度与来自另一角度的信息(例如,正负号信息)。对于如图17A中所展示的1-D估计(θx,θy)=(45°,45°),例如,可实施TB200以应用此类映射以获得相对于x轴45度的组合估计θc。对于DOA估计的范围为0到180度而不是-90到+90度的情况,将理解,表达式(4)中的轴向极性(即,正或负)条件将依据被测试DOA估计是小于还是达与90度来表达。
可能需要在360度范围显示上展示组合DOA估计θc。举例来说,可能需要将DOA估计显示为平面极坐标图上的角度。举例来说,在例如雷达和生物医学扫描等应用中,平面极坐标图显示是熟悉的。图17C展示在此类显示器上展示的DOA估计的实例。在此实例中,线的方向指示DOA估计且线的长度指示从所述方向到达的分量的当前强度。如此实例中所展示,极坐标图还可包含一或多个同心圆以指示线性或对数(例如,分贝)尺度的方向分量的强度。对于一次一个以上DOA估计可用的情况(例如,对于在频率上不相交的源),可显示用于每一DOA估计的对应线。
图18A和18B分别展示1-D估计θx和θy的正负号与通过阵列轴线界定的平面的对应象限之间的对应关系。图18C展示元组(sign(θx),sign(θy))的四个值与平面的象限之间的对应关系。图18D展示根据替代映射的360度显示(例如,相对于y轴)
应注意,图17A说明特殊情况,其中源位于通过麦克风轴线界定的平面中,使得通过θx和θy描述的混淆锥指示此平面中的独特方向。对于大部分实际应用,可能预期2-D阵列的非线性麦克风对的混淆锥通常不在通过阵列界定的平面中重合,甚至对于远场点源也如此。举例来说,源相对于阵列的平面的高度(例如,源沿着z轴的位移)可在2-D跟踪中起到重要作用。
可能需要产生从三维空间中的任意位置的源接收的信号的到达方向的准确的2-D表示。举例来说,可能需要由任务TB200产生的组合DOA估计在不包含DOA的平面(例如,如通过麦克风阵列或通过装置的显示表面界定的平面)上指示源信号的DOA。此类指示可用以(例如)支持音频感测装置相对于源的任意放置和/或装置和源的任意相对移动(例如,用于扬声器电话和/或源跟踪应用)。
图19A展示类似于图17A但描绘其中源位于x-y平面上方的更一股的情况的实例。在此情况下,阵列的混淆锥的交叉点指示两个可能的到达方向:在x-y平面上方延伸的方向d1,和在x-y平面下方延伸的方向d2。在许多应用中,可通过假定方向d1为正确的且忽略第二方向d2来解决此模糊性。对于装置放置在桌面上的扬声器电话应用,例如,可假定无任何源位于装置下方。在任何情况下,方向d1和d2在x-y平面上的投影为相同的。
虽然在源位于麦克风平面中时,1-D估计θx和θy到360度范围的映射(例如,如表达式(4)或(5)中)可产生适当DOA指示,但所述映射对于并不位于所述平面中的源的更一股情况可产生不准确结果。对于如图17B中所展示的θx=θy的情况,例如,可理解,x-y平面中的对应方向为相对于x轴的45度。然而,将表达式(4)的映射应用于值(θx,θy)=(30°,30°)会产生相对于x轴的30度的组合估计θc,其并不对应于如投影在平面上的源方向。
图19B展示2-D麦克风阵列的另一实例,所述2-D麦克风阵列的轴线界定x-y平面和位于x-y平面上方的源(例如,其中说话者的嘴在桌面上方的扬声器电话应用)。关于x-y平面,源沿着y轴定位(例如,呈相对于x轴90度的角度)。x轴对MC10、MC20指示相对于y-z平面零度的DOA(即,向所述对轴线边射),其与如投影到x-y平面上的源方向一致。尽管源位于y轴正上方,但其常常在z轴方向上偏移30度的仰角。源距x-y平面的此仰角致使y轴对MC20、MC30指示60度(即,相对于x-z平面)而不是90度的DOA。将表达式(4)的映射应用于值(θx,θy)=(0°,60°)会产生相对于x轴的60度的组合估计θc,其并不对应于如投影在平面上的源方向。
在典型使用情况下,源将位于既不在通过阵列轴线界定的平面内也不在阵列轴线正上方的方向上。图19C展示其中点源(即,说话者的嘴)抬起高于通过阵列轴线界定的平面的此类一股情况的实例。为了获得在平面外的源方向的阵列平面中的正确指示,可能需要实施任务TB200以将1-D DOA估计转换成阵列平面中的角度以获得平面中的对应DOA估计。
图20A到20D展示此类(θx,θy)转换为阵列平面中的角度的推导。在图20A和20B中,分别将源向量d投影到x轴上及投影到y轴上。这些投影的长度(分别为d sinθx和d sinθy)为源向量d到x-y平面上的投影p的尺寸,如图20C中所展示。这些尺寸足以确定DOA估计(θx,θy)分别到x-y平面中的p相对于y轴及相对于x轴的角度的转换,如图20D中所展示:
其中ε为如可包含以避免除以零错误的小值。(应注意,参看图19B、19C、20A到20E,且还参看如下文所论述的图22A到22E,如所展示的相对量值d仅是为了便于说明,且针对平面波前保持有效的远场假定,量值d应相对于麦克风阵列的尺寸足够大。)
可实施任务TB200以将根据此类表达式的DOA估计转换成阵列平面中的对应角度且将映射(例如,如表达式(4)或(5))应用于经转换的角度以获得所述平面中的组合DOA估计θc。应注意,任务TB200的此类实施方案可省略如表达式(6)中包含的(替代地,)的计算,这是因为值θc可如结合(例如,如表达式(4)和(5)中所展示)根据来确定。对于也需要值的此类情况,可将其计算为(且对于同样)。
图19C展示其中源信号的DOA通过点(x,y,z)=(5,2,5)的实例。在此情况下,由x轴麦克风对MC10-MC20观测到的DOA为且由y轴麦克风对MC20-MC30观测到的DOA为使用表达式(6)将这些角度转换成x-y平面中的对应角度将产生经转换的DOA估计其对应于给定源位置(x,y)=(5,2)。
将表达式(6)应用于值(θx,θy)=(30°,30°)(如图17B中所展示)将产生经转换的估计通过表达式(4)将所述估计映射为相对于x轴45度的预期值。将表达式(6)应用于值(θx,θy)=(0°,60°)(如图19B中所展示)将产生经转换的估计 通过表达式(4)将所述估计映射为相对于x轴90度的预期值。
可实施任务TB200以应用如上文所描述的转换及映射以将如通过来自2-D正交阵列的任何此类对DOA估计指示的DOA投影到阵列所位于的平面上。此类投影可用于实现跟踪在围绕麦克风阵列的360°范围内的有源说话者的方向,而不管高度差。图21A展示通过将替代映射应用于图19B的经转换的估计 以获得270度的组合方向估计(例如,方位角)获得的曲线图。在此图中,同心圆上的标号指示以分贝来计的相对量值。
还可在计算组合DOA估计之前实施任务TB200以包含关于所观测到的DOA估计的合法性检查。可能需要(例如)验证值(|θx|+|θy|)是否至少等于90度(例如,验证与两个所观测到的估计相关联的混淆锥是否将沿着至少一条线交叉)。
实际上,除了上下混淆以外,由来自2D麦克风阵列的此类DOA估计提供的信息几乎完全呈三维形式。举例来说,由麦克风对MC10-MC20和MC20-MC30观测到的到达方向也可用以估计源相对于x-y平面的仰角角度的量值。如果d表示从麦克风MC20到源的向量,那么向量d到x轴、y轴和x-y平面上的投影的长度可分别表达为d sin(θx),d sin(θy)和(例如,如图20A到20E中所展示)。可接着将仰角的量值估计为
尽管在图10A到10B以及12A到12B的特定实例中线性麦克风阵列具有正交轴线,但可能需要针对其中麦克风阵列的轴线并非正交的更一股情况实施方法M200。图21B展示与具有与共同点源非正交的轴x及r的线性麦克风阵列的响应相关联的交叉混淆锥的实例。图21C展示这些锥的交叉线,所述线界定点源相对于三维中的阵列轴线的两个可能方向d1和d2。
图22A展示麦克风阵列MC10-MC20-MC30的实例,其中MC10-MC20对的轴线为x轴,且MC20-MC30对的轴线r位于x-y平面中且相对于y轴偏斜达偏斜角α。图22B展示使用来自如图22A中所示的阵列的观测(θx,θr)相对于正交轴线x及y获得x-y平面中的组合方向估计的实例。如果d表示从麦克风MC20到源的向量,那么向量d到x轴上及到轴线r上的投影(dx)和(dr)的长度可分别表达为d sin(θx)和d sin(θr),如图22B和22C中所展示。向量p=(px,py)表示向量d到x-y平面上的投影。所估计的值px=d sinθx为已知的,且其留待确定py的值。
假定α值在范围(-90°,+90°)内,关于具有任何其它α值的阵列,可容易地将其映射为此类情况。py的值可从如图22D和22E中所展示的投影向量dr=(d sinθr sinα,d sinθrcosα)的尺寸来确定。观测到向量p与向量dr之间的差正交于dr(即,内积<(p-dr),dr>等于零),因此将py计算为(对于α=0,其缩减为py=d)。可接着分别将相对于正交x轴和y轴的x-y平面中的所要到达角表达为
应注意,表达式(6)为表达式(7)的特殊情况,其中α=0。投影p的维度(px,py)还可用以估计源相对于x-y平面的仰角θh(例如,以与上文参看图20E所描述的方式类似的方式)。
图23A展示根据一股配置的包含任务TB100a和TB100b的实例的方法M300的流程图。方法M300还包含任务TB200的实施方案TB300:计算到达方向到不包含所述到达方向的平面(例如,由阵列轴线界定的平面)的投影。以此方式,2-D阵列可用以将源DOA估计的范围从线性180度估计扩展到平面360度估计。
图23B展示包含子任务TB310和TB320的任务TB300的实施方案TB302的流程图。任务TB310将第一DOA估计(例如,θx)转换为投影平面中的角度(例如,)。举例来说,任务TB310可执行如在例如表达式(6)或(7)中所示的转换。任务TB320组合所转换的角度与来自第二DOA估计的信息(例如,正负号信息)以获得到达方向的投影。举例来说,任务TB320可根据例如表达式(4)或(5)执行映射。
如上文所描述,源DOA估计到两个维度的扩展还可包含估计DOA在90度范围内的仰角角度(例如,以提供描述在阵列平面上的范围的测量范围)。图24A展示包含任务TB400的方法M300的此类实施方案M320的流程图。任务TB400参考包含阵列轴线的平面计算DOA的仰角角度的估计(例如,如本文参考图20E所描述)。方法M320还可经实施以组合所投影DOA估计与估计的仰角角度以产生三维向量。
可能需要在具有包含两个或两个以上线性麦克风阵列的2-D阵列的音频感测装置内执行方法M300的实施方案。可经实施以包含此类2-D阵列且可用以执行用于音频记录和/或话音通信应用的此类方法的便携式音频感测装置的实例包含电话手持机(例如,蜂窝式电话手持机);有线或无线耳机(例如,蓝牙耳机);手持式音频和/或视频记录器;经配置以记录音频和/或视频内容的个人媒体播放器;个人数字助理(PDA)或其它手持式计算装置;以及笔记本计算机、膝上型计算机、上网本计算机、平板计算机,或其它便携式计算装置。所述类别的便携式计算装置当前包含具有如下名称的装置:膝上型计算机、笔记型计算机、上网本计算机、超便携式计算机、平板计算机、移动因特网装置、智能本,和智能电话。此类装置可具有包含显示屏幕的顶部面板和可包含键盘的底部面板,其中所述两个面板可以蛤壳或其它铰接关系连接。此类装置可类似地实施为在顶表面上包含触摸屏显示器的平板计算机。
DOA估计到2-D阵列的扩展(例如,如本文参考方法M200的实施方案和方法M300的实施方案所描述)通常非常适合于扬声器电话应用且足以满足扬声器电话应用。然而,此些原理到N维阵列(其中N>=2)的进一步扩展也是可能的,且可以简单明了的方式执行。举例来说,图17A到22E说明使用来自x-y平面中的不同麦克风对的所观测DOA估计来获得投影到x-y平面中的源方向的估计。以相同方式,可实施方法M200或M300的实例以组合来自x轴麦克风对与z轴麦克风对(或x-z平面中的其它对)的所观测DOA估计以获得投影到x-z平面中的源方向的估计,且对于y-z平面或与麦克风中的三者或三者以上相交的任何其它平面为同样情况。可接着组合2-D投影估计从而以三维形式获得所估计DOA。举例来说,用于投影到x-y平面上的源的DOA估计可与投影到x-z平面上的源的DOA估计组合以获得组合的DOA估计作为(x,y,z)空间中的向量。
对于其中一个目标占优势的跟踪应用,可能需要选择N个线性麦克风阵列(例如,对)用于表示N个相应维度。可实施方法M200或M300以组合用此些线性阵列中的一对特定线性阵列获得的2-D结果与来自其它平面中的一或多个线性阵列中的每一者的DOA估计以提供额外自由度。
可使用来自不同维度的DOA误差的估计来例如使用例如下式等表达式获得组合的似然度估计:
或
其中θ0,i表示针对对i选择的DOA候选者。可能需要使用不同误差当中的最大值来促成较之于接近于混淆锥中的仅一者且因而可能指示假峰值的估计优先选择接近于两个观测结果的混淆锥的估计。可使用此类组合结果来获得(帧,角度)平面(如图8中所示且如本文所述)和/或(帧,频率)曲线图(如图9的下部所示且如本文所述)。
图24B展示用于包含任务TB100c和任务T400的实施方案TB410的方法M320的实施方案M325的流程图。任务TB100c相对于第三麦克风阵列的轴线计算到达方向的第三估计。任务TB410基于来自得自任务TB100a、TB100b和TB100c的DOA估计的信息估计仰角角度。
应明确地指出,可实施方法M200和M300而使得任务TB100a基于对应麦克风通道之间的一种类型的差异(例如,相位差)计算其DOA估计,且任务TB100b(或TB100c)基于对应麦克风通道之间的另一类型的差异(例如,增益差)计算其DOA估计。在方法M325的此类实例的一个应用中,界定x-y平面的阵列扩充到包含前-后对(例如,沿着z轴相对于麦克风MC10、MC20或MC30偏移的第四麦克风)。通过任务TB100c针对此对产生的DOA估计用于任务TB400中以解析仰角角度中的前-后模糊性,使得所述方法提供完整的球形测量范围(例如,在任何平面中都是360度)。在此情况下,可实施方法M325,使得通过任务TB100a和TB100b产生的DOA估计是基于相位差,且通过任务TB100c产生的DOA估计是基于增益差。在特定实例(例如,用于跟踪仅一个源)中,通过任务TB100c产生的DOA估计具有两个状态:第一状态,其指示所述源在平面上方;以及第二状态,其指示所述源在平面下方。
图25A展示方法M300的实施方案M330的流程图。方法M330包含任务TB500:将所计算的投影显示给音频感测装置的用户。任务TB500可经配置以例如以极坐标图的形式(例如,如图17C、18D和21A中所示)在装置的显示屏幕上显示所计算的投影。此类显示屏幕(其可为如图1所示的触摸屏)的实例包含液晶显示器(LCD)、有机发光二极管(OLED)显示器、电润湿显示器、电泳显示器,和干涉式调制器显示器。此类显示器还可包含所估计的仰角角度的指示(例如,如图25B中所示)。
可实施任务TB500以相对于装置的参考方向(例如,装置的主轴)显示所投影的DOA。在此情况下,如所指示的方向将随着装置相对于固定源旋转而改变,即使所述源的位置不改变也是这样。图26A和26B分别展示此类显示器在此旋转之前和之后的实例。
或者,可能需要实施任务TB500以相对于外部参考方向显示所投影的DOA,使得如所指示的方向随着装置相对于固定源旋转而保持恒定。图27A和27B分别展示此类显示器在此旋转之前和之后的实例。
为支持任务TB500的此类实施方案,装置D100可经配置以包含定向传感器(未展示),所述定向传感器参考外部参考方向(例如,重力轴线(例如,正交于地球表面的轴线)或磁轴(例如,地球的磁轴))指示装置的当前空间定向。定向传感器可包含一或多个惯性传感器,例如陀螺仪和/或加速度计。陀螺仪使用角动量的原理来检测绕着一轴线或绕着两个或三个(通常正交)轴线中的每一者的定向改变(例如,俯仰、横滚和/或扭转的改变)。陀螺仪(其可制造为微机电系统(MEMS)装置)的实例包含振动陀螺仪。加速度计检测沿着一轴线或沿着两个或三个(通常正交)轴线中的每一者的加速度。加速度计也可制造为MEMS装置。还可能将陀螺仪和加速度计组合到单个传感器中。另外或替代地,定向传感器可包含一或多个磁场传感器(例如,磁力计),其测量沿着一轴线或沿着两个或三个(通常正交)轴线中的每一者的磁场强度。在一个实例中,装置D100包含磁场传感器,所述磁场传感器指示装置相对于磁轴(例如,地球的磁轴)的当前定向。在此情况下,可实施任务TB500以在旋转成与那一轴线对准的栅格(例如,当作罗盘)上显示所投影的DOA。
图25C展示包含任务TB600和任务TB500的实施方案TB510的方法M330的此类实施方案M340的流程图。任务TB600参考外部参考轴线(例如,重力轴线或磁轴)确定音频感测装置的定向。任务TB510基于所确定的定向显示所计算的投影。
可实施任务TB500以将DOA显示为投影到阵列平面上的角度。对于许多便携式音频感测装置,用于DOA估计的麦克风将位于装置的与显示器相同的表面处(例如,图1中的麦克风ME10、MV10-1和MV10-3)或与彼此间相比更为接近于那一表面(例如,图1中的麦克风ME10、MR10和MVl0-3)。举例来说,平板计算机或智能电话的厚度相对于显示表面的尺寸通常为小的。在此些情况下,预期可忽略投影到阵列平面上的DOA与投影到显示平面上的DOA之间的任何误差,且配置任务TB500以显示投影到阵列平面上的DOA可为可接受的。
对于其中显示平面与阵列平面显著不同的情况,可实施任务TB500以将所估计的DOA从麦克风阵列的轴线所界定的平面投影到显示表面的平面中。举例来说,任务TB500的此类实施方案可显示将投影矩阵应用到所估计DOA的结果,其中投影矩阵描述从阵列平面到显示器的表面平面上的投影。或者,可实施任务TB300以包含此类投影。
如上文所描述,音频感测装置可包含定向传感器,所述定向传感器参考外部参考方向指示装置的当前空间定向。可能需要组合如本文所描述的DOA估计与此类定向信息以参考外部参考方向指示DOA估计。图29B展示包含任务TB600的实例和任务TB300的实施方案TB310的方法M300的此类实施方案M350的流程图。还可实施方法M350以包含如本文所描述的显示任务TB500的实例。
图28A展示其中装置坐标系E与世界坐标系对准的实例。图28A还展示对应于此定向(例如,如由定向传感器所指示)的装置定向矩阵F。图28B展示其中装置经旋转(例如,供用于浏览-通话模式)且矩阵F(例如,如由定向传感器所指示)对应于此新定向的实例。
可实施任务TB310以使用装置定向矩阵F来将DOA估计投影到参考世界坐标系界定的任何平面中。在一个此类实例中,DOA估计为装置坐标系中的向量g。在第一操作中,通过与装置定向矩阵F求内积而将向量g转换为世界坐标系中的向量h。可例如根据例如等表达式执行此类转换。在第二操作中,通过投影将向量h投影到参考世界坐标系而界定的平面P中,其中A为世界坐标系中的平面P的基础矩阵。
在典型实例中,平面P平行于世界坐标系的x-y平面(即,“世界参考平面”)。图28C展示如可通过任务TB500执行的将DOA到世界参考平面上的投影透视映射到装置的显示平面上,其中显示平面相对于世界参考平面的定向由装置定向矩阵F指示。图29A展示投影到世界参考平面上的DOA的此类映射显示的实例。
在另一实例中,任务TB310经配置以在投影到平面P中的分量向量g当中使用较少复数内插而将DOA估计向量g投影到平面P中。在此情况下,可根据例如下式等表达式计算所投影的DOA估计向量Pg
Pg=αgx-y(p)+βgx-z(p)+γgy-z(p),
其中表示装置坐标系的基础向量;θα、θβ、θγ表示平面P与分别由横跨的平面之间的角度,且α、β、γ表示其相应余弦(α2+β2+γ2=1);并且gx-y(p)、gx-z(p)、gy-z(p)分别表示到分量向量的平面P中的投影。对应于α、β和γ当中的最小者的平面为最接近于P的平面,且任务TB310的替代实施方案识别此最小者且将所投影分量向量中的对应一者产生为Pg的近似值。
可能需要配置音频感测装置以在具有不同DOA的源信号当中进行鉴别。举例来说,可能需要配置音频感测装置以对多通道信号执行方向选择性滤波操作以使从在一角度通过范围(angular pass range)内的方向到达的方向分量通过和/或阻断或以其它方式衰减从角度停止范围(angular stop range)内的方向到达的方向分量。
可能需要使用如本文所描述的显示器来支持图形用户接口以使得音频感测装置的用户能够配置方向选择性处理操作(例如,如本文所描述的波束成形操作)。图30A展示此类用户接口的实例,其中圆的无阴影部分指示将通过的方向范围,且阴影部分指示将被阻断的方向范围。圆圈指示触摸屏上的点,用户可以在所述圆圈的外围周围滑动以改变所选范围。所述触摸点可联系起来,使得移动一个点致使其它点在相同角方向或者在相反角方向上移动相等角度。或者,触摸点可独立地加以选择(例如,如图30B中所示)。还可能提供一或多对额外触摸点以支持对一个以上角范围的选择(例如,如图30C中所示)。
作为对如图30A到30C中所示的触摸点的替代,用户接口可包含其它物理或虚拟选择接口(例如,屏幕上的可点选或可触摸图标)以获得用于选择通过/停止带位置和/或宽度的用户输入。此些接口的实例包含如图29C中所示的线性滑块式电位计(linear sliderpotentiometer)、拨动开关(用于二元输入以指示例如上下、左右、顺时针/逆时针),以及转轮或旋钮。
对于其中预期音频感测装置在使用期间保持固定(例如,装置放置在供扬声器电话使用的平坦表面上)的使用情况,指示相对于装置固定的所选方向范围可能就足够了。然而,如果装置相对于所要源的定向在使用期间改变,那么可能不再允许从那一源的方向到达的分量进入。图31A及31B展示其中使用定向传感器来跟踪装置的定向的另一实例。在此情况下,使用装置的方向位移(例如,如由定向传感器所指示)来更新如由用户选择的方向滤波配置(且更新对应显示),使得可维持所要方向响应而不管装置的定向的改变。
可能需要阵列包含的麦克风数目至少等于在任何一个时间有待区分的不同源方向的数目(例如,待形成的波束的数目)。麦克风可为全向的(例如,如可为蜂窝式电话或专用会议装置典型的)或定向的(例如,如可为例如机顶盒等装置典型的)。
本文所述的DOA估计原理可用以支持在多个扬声器当中进行选择。举例来说,多个源的位置可与特定扬声器的手动选择(例如,推动特定按钮,或触摸特定屏幕区域以选择特定对应扬声器或作用中源方向)或特定扬声器的自动选择(例如,通过扬声器辨识)加以组合。在一个此类应用中,音频感测装置(例如,电话)经配置以辨识其拥有者的话音,且优先于其它源的方向而自动地选择对应于所述话音的方向。
图32A展示设备MF300的实施方案MF320的框图。设备MF320包含用于参考包含阵列轴线的平面计算DOA的仰角角度的估计(例如,如本文参考任务TB400所描述)的装置FB400。设备MF320还可经实施以组合所投影DOA估计与估计的仰角角度以产生三维向量。图32B展示设备MF320的实施方案MF325的框图。设备MF325包含用于相对于第三麦克风阵列的轴线计算到达方向的第三估计(例如,如本文参考任务TB100c所描述)的装置FB100c。设备MF325还包含经配置以基于来自得自装置FB100a、FB100b和FB100c的DOA估计的信息估计仰角角度的装置FB400的实施方案FB410。
图32C展示包含仰角计算器B400的设备A300的实施方案A320的框图。仰角计算器B400经配置以参考包含阵列轴线的平面计算DOA的仰角角度的估计(例如,如本文参考任务TB400所描述)。设备A320还可经实施以组合所投影DOA估计与估计的仰角角度以产生三维向量。设备MF320还可经实施以包含经配置以相对于第三麦克风阵列的轴线计算到达方向的第三估计(例如,如本文参考任务TB100c所描述)的第三DOA估计器,且在此情况下,仰角计算器B400可经配置以基于来自三个DOA估计的信息估计仰角角度。
图33A展示设备MF300的实施方案MF330的框图。设备MF320包含用于显示所计算的投影(例如,如本文参考任务TB500所描述)的装置FB500。图33B展示设备MF330的实施方案MF340的框图。设备MF340包含用于参考外部参考轴线确定音频感测装置的定向(例如,如本文参考任务TB600所描述)的装置FB600。设备MF340还包含经配置以基于所确定的定向显示所计算的投影的装置FB500的实施方案FB510。图33C展示包含装置FB600的实例和装置FB300的实施方案FB310的设备MF300的实施方案MF350的框图,装置FB300经配置以使用如由装置FB600产生的定向确定(例如,装置定向矩阵F)来将DOA估计投影到参考世界坐标系(例如世界参考平面)界定的平面中(例如,如本文参考任务TB310所描述)。
图33D展示设备A300的实施方案A330的框图,设备A300包含经配置以显示所计算的投影(例如,如本文参考任务TB500所描述)的显示器B500。图33E展示设备A300的实施方案A350的框图,设备A300包含经配置以参考外部参考轴线确定音频感测装置的定向(例如,如本文参考任务TB600所描述)的定向传感器B600。设备A350还包含投影计算器B300的实施方案B310,其经配置以使用如由传感器B600产生的定向确定(例如,装置定向矩阵F)来将DOA估计投影到参考世界坐标系(例如世界参考平面)界定的平面中(例如,如本文参考任务TB310所描述)。显示器500还可经配置以基于所确定的定向显示所计算的投影(例如,如本文参考任务TB510所描述)。
图34A说明其中源(例如,人说话者)相对于2-D麦克风布置在方向A-B-C-D当中移动的第一情形。图35和36展示使用方法M10的实施方案的实例在此类情形中获得的观测结果的实例。在此实例中,图35展示通过y轴对MC20-MC30的观测结果,其中距离dx为3.6厘米;图36展示通过x轴对MC10-MC20的观测结果,其中距离dy为7.3厘米;且DOA估计的存量以五度的分辨率涵盖-90度到+90度的范围。
可以理解,当源处于麦克风对的端射方向上时,源在麦克风上方或下方的仰角限制所观测到的角度。因此,当源在麦克风的平面外部时,通常不会观测到实际端射。在图35和36中可见,归因于源相对于麦克风平面的仰角,所观测方向即使在源穿过对应端射方向(即,用于x轴对MC10-MC20的方向A和用于y轴对MC20-MC30的方向B)时也不会达到-90度。
图37展示其中使用方法M200的实施方案的实例来组合来自+/-90度范围内的正交轴线的观测结果(如图35和36中针对如图34A中所示的情形所示)以产生麦克风平面在零到360度内的DOA估计的实例。在此实例中,使用1度分辨率。图38展示其中使用方法M200的实施方案的实例来组合来自2-D麦克风布置的观测结果(其中距离dx为3.6厘米且距离dy为7.3厘米)以在于方向D处存在另一源(例如,固定人说话者)的情况下跟踪源(例如,人说话者)在方向A-B-C(如图34B中所示)当中的移动的实例。
如上文所描述,可基于似然度的总和计算DOA估计。当使用方法M200或M300来组合来自不同麦克风轴线(例如,如图37中所示)的观测结果时,可能需要对于每一频段执行组合而非首先计算每一轴线的组合方向,在可能存在一个以上方向源(例如,两个扬声器,或一扬声器与一干扰源)的情况下尤其如此。假定在每一频段只有一个源占优势,则针对每一频率分量计算组合观测结果保留了不同源在不同对应频率下的优势之间的区别。如果在组合观测结果之前对观测结果执行在不同源占优势的频段内的求和(例如,似然度的总和),那么此区别可能丢失,且组合观测结果可能指示在并不对应于任何实际源的位置的方向上的杂散峰值。举例来说,对来自45度处的第一源与225度处的第二源的正交麦克风对的观测结果进行求和,且接着组合经求和的观测结果可能在135度和315度处产生杂散峰值(除了45度和225度处的所要峰值之外)。
图39和40展示针对如图41中所示的会议-呼叫情形的组合观测结果的实例,其中电话固定在桌面上。在约帧5500处,说话者1站起来,且说话者1的移动在约帧9000变得明显。靠近帧9500处还能看出说话者3的移动。图40中的矩形指示目标扇区选择,使得从此扇区外部的方向到达的频率分量可被拒绝或以其它方式衰减,或以其它方式与从所选扇区内的方向到达的频率分量以不同方式加以处理。在此实例中,目标扇区为180度到270度的象限,且是由用户从麦克风平面的四个象限当中选择。此实例还包含来自空调系统的声学干扰。
图42和43展示针对如图44A中所示的动态情形的组合观测结果的实例。在此情形中,说话者1在约帧800处拿起电话,且在约帧2200处将其重新放到桌面上。尽管角度跨度在电话处于此浏览通话位置时较宽,但可以看到,空间响应仍居中于指定DOA中。在约帧400之后的说话者2的移动也是明显的。如在图40中,图42中的矩形指示用户将180度到270度的象限选择为目标扇区。
图45和46展示针对如图44B中所示的具有道路噪声的动态情形的组合观测结果的实例。在此情形中,说话者在约帧200与100之间拿起电话且在约帧1400与2100之间再次拿起电话。在此实例中,图46中的矩形指示用户将270度到360度的象限选择为干扰扇区。图47展示通过方法M300的实施方案针对如图34B和38中所示的情形在360度范围内对于目标和移动干扰源执行的DOA跟踪的实例。
可能需要使用麦克风阵列的方向功能来在从不同方向到达的多通道信号的声音分量之间进行鉴别。举例来说,可能需要将空间定向滤波器(spatially directivefilter)(例如,波束成形器和/或零陷波束成形器)应用于多通道信号以将从不同方向到达的声音分量的能量集中到空间定向滤波器的不同对应输出通道且/或使从特定方向到达的声音分量的能量衰减。
对于麦克风的一维(1-D)阵列,可容易地将源的到达方向(DOA)定义为相对于所述阵列的轴线的角度。可作为由阵列的各个麦克风产生的信号之间的相位差的函数而容易地获得此角度的闭式解,使得在角度改变(例如,从如图48A中所示的情况改变为如图48B中所示的情况)时,相同函数适用。
然而,如上文所指出,1-D阵列不在具有相同到达角度但是从空间中的不同方向到达(例如,如图16中所示)的信号当中进行鉴别。因此,为了支持此些源分量之间的鉴别,可能需要使用扩展到至少两个维度的麦克风阵列。
对于包含处于任意相对位置的两个以上麦克风的阵列(例如,非同轴阵列),作为由阵列的各个麦克风产生的信号之间的相位差(其跨越一定角度范围(例如,从如图48C中所示的情况到如图48D中所示的情况)保持有效)的函数而获得DOA的闭式解可能困难或不切实际。
可能需要响应于源分量中的一或多者的到达角度随时间推移的所检测改变而更新空间定向滤波器。然而,如果产生滤波器系数的过程过于复杂,那么实时地重新计算滤波器系数可能不切实际。因此,用于非同轴阵列的此类系统的设计可能包含在存储不同滤波器系数组所需要的存储量与支持所要空间分辨率所需要的此些组的数目之间进行权衡。举例来说,对于其中需要在x、y和+z方向中的每一者上以10度的分辨率跟踪三个独立源的情况,不同滤波器配置的对应数目超过8700(即,3*180/10*180/10*90/10)。
对于包含处于任意相对位置处的两个以上麦克风的阵列(例如,非同轴阵列)来说,可能需要使用如上文所描述的简单明了的一维扩展原理。关键问题是如何将空间滤波应用于成对1-D DOA估计的此类组合。如下文所描述,可能需要使用基于稳健的1-D DOA估计的成对导向向量来对混合矩阵进行建模。
图49A展示根据一股配置的用于处理包含第一源分量和第二源分量的多通道音频信号的方法MC100的流程图。方法MC100包含任务TC100a、TC100b和TC200。任务TC100a计算第一源分量的相对于第一对麦克风的轴线的第一到达角度以及第二源分量的相对于第一对麦克风的轴线的第一到达角度。任务TC100b计算第一源分量的相对于第二对麦克风的轴线的第二到达角度以及第二源分量的相对于第二对麦克风的轴线的第二到达角度。基于第一到达角度和第二到达角度,任务TC200将空间定向滤波器应用于多通道音频信号以产生输出信号。
可实施方法MC100,使得多通道信号的每一通道是基于由对应麦克风产生的信号。举例来说,可实施任务TC100a以基于来自多通道音频信号的第一通道对的信息来计算第一到达角度,其中第一通道对中的每一通道是基于由第一对麦克风中的对应麦克风产生的信号。类似地,可实施任务TC100b以基于来自多通道音频信号的第二通道对的信息来计算第二到达角度,其中第二通道对中的每一通道是基于由第二对麦克风中的对应麦克风产生的信号。
可实施任务TC100a以基于通道之间的差异计算每一对的每一源分量的到达角度。通道之间的此些差异的实例包含增益差或比率、到达时间差,和相位差(例如,如上文参考方法M10所描述)。举例来说,可将任务TC100a实施为两个子任务(即,每一源分量一个),其中每一子任务为以下方法当中的任一者的实例:方法M10(使得到达角度为通过任务T30选择的候选方向)、方法M20(使得到达角度为通过任务T300选择的候选方向)、方法MA20(使得到达角度为通过任务TA300选择的候选方向)、方法M25(使得到达角度为通过任务T400指示的到达方向)、方法M30(使得到达角度为通过任务T35选择的候选方向)、方法M100(使得到达角度为通过任务T350选择的候选方向),和方法M110(使得到达角度为通过任务T400指示的到达方向)。任务TC100b可类似地实施为两个子任务(即,每一源分量一个),其中每一子任务为方法M10、M20、MA20、M25、M30、M100和M110当中的任一者的实例。
可任意地扩展方法MC100以适应更多源分量和麦克风对(其中麦克风对的数目P至少等于(N-1),其中N为源分量的数目)。举例来说,任务TC100a和TC100b可经扩展以针对每一源分量计算每一额外麦克风对的额外到达角度,且可扩展到针对每一源分量的任务TC100a或TC100b的额外此类实例。对于其中装置包含如本文所描述(例如,参考任务TB600)的定向传感器的情况,可实施任务TC100a和/或TC100b以根据指示哪些麦克风最可能接收直接路径信号和/或不被遮挡(对于当前所确定定向)的映射而从可供使用的麦克风通道当中选择多通道信号的通道。举例来说,如果装置在桌面上面向上,那么后麦克风可能被遮挡。
在典型应用(例如,扬声器电话应用)中,第一和第二源分量当中的至少一个源分量的到达方向在由第一对麦克风的轴线和第二对麦克风的轴线(例如,针对如图49D中所示的共面对)界定的平面外部(例如,上方)。还可实施麦克风阵列,使得第一对麦克风中的一个麦克风也包含在第二对麦克风中(例如,如图49E中所示)。然而,一股来说,方法MC100还适用于不位于共用平面中的麦克风对(例如,如图50C中所示)。图49D、49E和50C中的麦克风的标号的第一数字指示对索引,且第二数字指示麦克风在所述对内的索引。可以看出,图49E的阵列中的共用麦克风具有两个标号。
可能需要实施任务TC200,使得空间定向滤波器将第一源分量的能量集中在输出信号中。举例来说,可实施任务TC200,使得第一源分量的能量相对于第二源分量的能量的比例在输出信号中比在多通道音频信号的每一通道中大(即,比在多通道音频信号的第一通道中大,比在多通道音频信号的第二通道中大,且比在多通道音频信号的第三通道中大)。还可实施任务TC200,使得第二源分量的能量相对于第一源分量的能量的比例在输出信号中比在多通道音频信号的每一通道中小。
可实施任务TC200以计算空间定向滤波器(例如,计算空间定向滤波器的一组滤波器系数)。图49B展示包含子任务TC210、TC220和TC230的任务TC200的此类实施方案TC202的流程图。基于通过任务TC100a和TC100b产生的所计算到达角度,任务TC210计算用于每一对麦克风和每一源分量的导向向量。任务TC220反转基于所述导向向量的矩阵。任务TC230将基于经反转矩阵的空间定向滤波器应用于多通道信号以产生输出信号。
由麦克风阵列产生的多通道信号(即,麦克风通道向量x)可建模为混合矩阵A(还称为阵列流形矩阵(array manifold matrix)或阵列导向矩阵)与源分量的向量y′的乘积。在此情况下,可能需要通过将向量x乘以混合矩阵的倒数A-1以产生经空间滤波的通道的向量y≈y′来解决恢复源分量的问题。
可能需要使用如上文所描述的简单明了的稳健一维DOA估计扩展原理。举例来说,在两对麦克风的二维阵列的轴线在不同方向上的情况下,可能需要根据相对于两个对轴线中的每一者的一维到达角度指示每一源分量的DOA。举例来说,在三对麦克风的三维阵列的轴线在不同方向和平面上的情况下,可能需要根据相对于三个对轴线中的每一者的一维到达角度指示每一源分量的DOA。关键问题是如何将空间滤波应用于成对一维DOA估计的此类组合。
在一个方法中,通过使用成对导向向量而使模型Ay′=x与1-D DOA估计原理组合以构建阵列导向矩阵A,其中每一导引向量是基于一对应到达角度。可实施任务TC210以针对每一麦克风对p和每一源分量n计算如图50A中所示的基于源分量n的相对于对p的轴线的到达角度θn,p的对应成对导引向量。在此实例中,左手侧上的向量元素的索引如图50B中所标记,且lp指示对p的麦克风之间的间距。可以看出,此向量指示对p处的源分量n的传播延迟(例如,如在所述对中的麦克风1处看到的源分量相对于如在所述对中的麦克风2处看到的源分量的相位延迟)。图50D展示对于其中使用三麦克风(即,两对)阵列来跟踪三个不同源的情况的成对导向向量的阵列导向矩阵A的实例。
任务TC220反转基于所述导向向量的矩阵。因为图50D中所示的非正方形矩阵A不可逆,所以可实施任务TC220以改为计算矩阵A的伪逆A+,其中A+=(AHA)-1AH,且AH表示矩阵A的共轭转置。图51A展示用于图50D中所示的矩阵A的表达式A+x=y的实例。在此情况下,任务TC230可经配置以将系数为矩阵A+的第一行的空间定向滤波器应用于麦克风通道向量x(其中每一元素对应于例如图49D、49E或50C中的具有相同标号的麦克风)以获得输出信号y1,在输出信号y1中,源分量1的能量集中且源分量2的能量减小。如果需要,那么还可实施任务TC230以使用矩阵A+的第二行执行对应滤波操作以获得其中源分量2的能量集中且源分量1的能量减小的输出信号。如图51B中所示,任务TC200的此些实施方案可一股化到任意数目的源N(不超过麦克风的数目M)和任意数目的麦克风对p(不超过(M-1))。
图51A和51B展示用于基于稳健1-D DOA估计的空间选择性滤波的简单明了的一维(1-D)成对波束成形-零陷波束成形(BFNF)配置的实例。由于此方法是基于稳健的1-DDOA估计,所以不需要麦克风几何布置的完整知识(例如,每一对麦克风之间的间距的知识可为足够的),且也不需要同时使用所有麦克风进行DOA估计。此类方法非常适合用于如通过本文中所描述的方法(例如,方法M10、M20、MA20、M25、M30、M100和M110)产生的DOA估计,但还可实施任务TC100和TC100b以替代地使用任何其它1-D DOA估计方法。
可实施方法MC100以针对每一频段执行任务TC200的实例。在此情况下,可实施任务TC200的各种实例以使用通过任务TC100a和TC100b提供的所计算到达角度且针对每一频段产生一对应输出信号。一个DOA可跨越所有频率固定,或可准许跨越频率的稍微失配的对准(例如,来自任务TC100a和/或TC100b的不同相应实例)(例如,+/-5、6、10、12或15度)。如果麦克风阵列沿着一轴线包含一个以上对,那么可实施任务TC100a和/或任务TC100b以计算在不同频段中从不同通道对(即,沿着相同轴线但具有不同间距的麦克风)的到达角度。在此些情况下,可实施任务TC200的各种实例以使用通过任务TC100a和TC100b提供的所计算到达角度用于对应频段。举例来说,可实施任务TC210的各种实例以使用来自针对对应频率的适当麦克风对的DOA估计计算导向向量。
方法MC100可经配置以如上文参考方法M10所描述将多通道信号处理为一系列片段(例如,帧)。举例来说,可实施任务TC200以将相同的空间定向滤波器应用于多通道信号的一连串帧中的每一者。还可实施方法MC100以按某一间隔(例如,每五个、10个或20个帧)和/或响应于通过任务TC100a或TC100b所计算的到达角度的改变而更新空间定向滤波器。
如果矩阵AHA处于病态,那么其反转可能变得不可靠。矩阵AHA可能例如在接近于麦克风对的空间混叠频率的频率(即,频率f=c/2lp,其波长为所述对的麦克风之间的距离lp的两倍)处变得处于病态。图52A展示其中伪逆操作经修改而使得改为实施任务TC220以反转通过将正则化因数L>0与一致性矩阵的乘积相加到矩阵AHA(即,通过将正则化值L>0相加到矩阵AHA的对角线的每一元素)而获得的矩阵。L的值可为固定的,或可从一个帧到另一帧(例如,基于矩阵AHA的条件数目和/或决定因素)而改变。
避免由处于病态的矩阵的反转造成的错误的另一方法是通过A+dmax归一化乘积A+x,其中dmax为使得乘积A+dj为最大值的矩阵A的行dj。图52B展示其中实施任务TC220以执行如图51A中所示的正则化实例的此类归一化的实例。还可实施任务TC220以在不存在正则化的情况下执行此类归一化。
在一些情况下,可能需要避免如上文所描述的计算用于归一化操作的分母(denominator)的计算复杂度。在此些情况下,可实施任务TC220以确定矩阵AHA是否处于病态。举例来说,如果矩阵AHA的条件数目大且/或其决定因素的量值极小或为零,那么任务TC220可确定矩阵AHA处于病态。如果矩阵处于病态,那么任务TC220的此类实施方案绕过用于那一频段的麦克风通道中的一者(例如,对应于感测装置的初级麦克风或以其它方式预期将最直接地接收用户的话音的麦克风的通道)而使其不用作用于那一频段的输出信号,而继续应用对应空间定向滤波器以产生用于矩阵AHA不处于病态的其它频段的输出信号。
可以理解,对于其中麦克风中的一者由一个以上对(例如,如图49E的阵列中所示)共用的情况,成对阵列导向矩阵A(例如,如图50D中所示)将包含冗余行。可能需要实施任务TC220以使矩阵A中的导向向量重叠以移除冗余行。图53A到53D以及54A到54D展示根据用于计算所述对中的一者的到达角度的正负号惯例而不同的此重叠的两个不同实例。在第一实例中,在麦克风MC10之前到达麦克风MC20的源分量的到达角度被指派正号,如图53C中所示且如图53B中所指示。在此情况下,图53A中的矩阵A的第二和第四行对应于相同麦克风通道,且导向向量在第二行处重叠以产生图53D中所示的矩阵A。在第二实例中,在麦克风MC10之前到达麦克风MC20的源分量的到达角度被指派负号,如图54C中所示且如图54B中所指示。在此情况下,图54A中的矩阵A的第二和第四行对应于相同麦克风通道,且导向向量在第二行处重叠以产生图54D中所示的矩阵A。尽管此类重叠可能并不始终致使矩阵A变为正方形,但可以理解,对于其中矩阵A为正方形的情况,可实施任务TC220以使用不同于伪逆(例如,高斯-乔丹消除(Gauss-Jordan elimination)、LU分解,等)的用于计算倒数A-1的技术。图55A展示其它麦克风阵列配置的若干实例,其中成对导向向量可类似地在共用麦克风通道处重叠。
还可实施任务TC200以使用如上文所描述的用于矩阵A的成对模型来应用其它波束成形方法,例如自适应性和/或超方向性波束成形技术。图55B展示成对(PW)归一化的最小方差无失真响应(MVDR)BFNF的实例,其中获得导引向量(阵列流形向量)的方式不同于常规方法。在此情况下,归因于在两对之间共享麦克风(例如,图49E中标记为x1,2和x2,1的麦克风)而消除了共用通道。噪声相干矩阵Г可通过测量或通过使用sinc函数进行理论计算来获得。应注意,可将本文所述的BFNF实例一股化到任意数目个源N,使得N<=M,其中M为麦克风的数目。
或者,可实施任务TC200以基于所计算的到达角度从多个空间定向滤波器当中进行选择。在此情况下,可实施任务TC200以根据用于每一源的第一和第二到达角度对选择滤波器。图49C展示包含子任务TC240和TC250的任务TC200的此类实施方案TC204的流程图。基于来自任务TC100a和TC100b的第一和第二到达角度,任务TC240从多个空间定向滤波器当中选择空间定向滤波器(例如,从多组滤波器系数当中选择一组滤波器系数)。任务TC250将所选空间定向滤波器应用于多通道音频信号以产生输出信号。
在如上文所描述的方法MC100中,基于来自多通道信号的信息计算每一源分量和每一麦克风对的到达角度。替代方法使用用于选择或计算空间定向滤波器的相同原理,但在此情况下,以其它方式提供所要到达角度。相同原理还可用以基于每一源分量相对于两个或两个以上扩音器对中的每一者的轴线的所要离开角度而在两个或两个以上维度上产生用于扩音器阵列的波束成形器和/或零陷波束成形器(nullformer)。一股来说,可能需要应用本文所述的原理以基于指定的一维到达角度获得空间定向滤波方法。
图56A展示根据此类一股配置的处理多通道信号的方法MD100的流程图,其包含任务TD100、TD200和TD300。任务TD100计算多个导向向量(例如,如本文参考任务TC210所描述)。所述多个导向向量包含基于相对于第一对换能器的轴线的第一指定到达(或离开)角度的第一导引向量、基于相对于第一对换能器的轴线的第二指定到达(或离开)角度的第二导引向量、基于相对于第二对换能器的轴线的第一指定到达(或离开)角度的第三导引向量,以及基于相对于第二对换能器的轴线的第二指定到达(或离开)角度的第四导引向量。任务TD200反转基于所述多个导向向量的矩阵(例如,如本文参考任务TC220所描述)。任务TD300将基于经反转矩阵的空间定向滤波器应用于多通道信号(例如,如本文参考任务TC230所描述)。
对于其中换能器为麦克风的情况,此类方法可用于麦克风波束成形和/或零陷波束成形。在此情况下,方法MD100可经实施以接收相对于每一对轴线的到达角度,或替代地可经配置以计算来自空间中给定DOA的成对到达角度(例如,通过执行如上文参考图20A到20E或22A到22E所描述的投影的反转)。对于其中换能器为扩音器的情况,此类方法可用于扩音器波束成形和/或零陷波束成形。在此情况下,可实施方法MD100以接收相对于每一对轴线的离开角度,或替代地可经配置以计算来自空间中给定波束方向的成对离开角度(例如,通过执行如上文所描述的投影的反转)。
如本文参考方法MC100和MD100的实施方案所描述的成对波束成形/零陷波束成形(PWBFNF)方案可用于抑制干扰源的直接路径达可用自由度。此些方法的应用包含在没有平滑轨迹假定的情况下的瞬时抑制(例如,抑制非静态噪声)、使用方向掩蔽以获得额外噪声抑制增益,以及使用频宽扩展以获得额外噪声抑制增益。单通道后处理(例如,象限架构的单通道后处理)可用于固定噪声和噪声参考处置(例如,通过对不活动帧进行时间平均而计算噪声参考)。
可能需要获得瞬时抑制,并且最小化例如音乐噪声等伪声。可能需要最大限度地使用用于BFNF的可用自由度。对于两个麦克风对(例如,一个所要源和一个方向干扰源)的情况,可实施方法MC100或MD100以通过将如图50D中所示的阵列导向矩阵的剩余行指引到接近于但不同于干扰源的到达角度的角度(例如,相差五或10度)而提供较宽零陷,或将矩阵的两列指引到干扰源的每一侧上的到达角度以提供居中于干扰源的方向上的较宽零陷。
可实施方法MC100和MD100以单独地对每一帧进行滤波,或可实施馈送-转发网络。可针对高达尼奎斯特速率的范围中的所有频率(除了处于病态的频率以外)设置BFNF。可使用自然掩蔽方法(例如,以获得平滑的自然无缝的积极性转变),使得滤波器的动态范围在所要目标源(例如,第一源分量)强时较大,而在所要目标源弱时较小。
如上文所指出,可实施任务T400(例如,方法M25和M110的任务T400)以指示一个以上源当中的每一者的到达方向(例如,到达角度)。举例来说,可实施任务T400以计算一分布(例如,直方图)(所述分布指示对于每一候选方向,选择候选方向所处的频段的数目),且将源方向指示为此分布的模式。此类任务可包含将源方向指示为所述分布中的每一集群的峰值、均值或重心,其中每一频段处的样本点为所选候选方向的方向误差(或者,似然度)。可实施如本文所描述的方法M200和M300的实施方案的任务TB100a和TB100b当中的每一者以包含任务T400的此类实施方案。同样,可实施如本文所描述的方法MC100的实施方案的任务TC100a和TC100b当中的每一者以包含任务T400的此类实施方案的实例,在此情况下,可能需要将源方向的最大数目限制为阵列导向矩阵中的列的数目。还可使用此类集群来将组F分割成用于每一作用中源的不同频率分量组(例如,不相交组)以供用于其它处理操作。
图56B展示根据一股配置的用于处理包含第一源分量和第二源分量的多通道音频信号的设备MFC100的框图。设备MFC100包含用于计算第一源分量的相对于第一对麦克风的轴线的第一到达角度以及第二源分量的相对于第一对麦克风的轴线的第一到达角度(例如,如本文参考任务TC100a所描述)的装置FC100a。设备MFC100还包含用于计算第一源分量的相对于第二对麦克风的轴线的第二到达角度以及第二源分量的相对于第二对麦克风的轴线的第二到达角度(例如,如本文参考任务TC100b所描述)的装置FC100b。装置FC100a和FC100b当中的每一者可实施为两个子装置(即,每一源分量一个),其中每一子装置为例如设备MF5、MF10和MF15当中的任一者的实例。设备MFC100还包含用于基于第一到达角度和第二到达角度将空间定向滤波器应用于多通道音频信号以产生输出信号(例如,如本文参考任务TC200所描述)的装置FC200。
图56C展示装置FC200的实施方案FC202的框图。装置FC202包含用于基于由装置FC100a和FC100b产生的所计算到达角度而计算每一对麦克风和每一源分量的导向向量的装置TC210。装置FC202还包含用于反转基于导向向量的矩阵的装置FC220。装置FC202还包含用于将基于经反转矩阵的空间定向滤波器应用于多通道信号以产生输出信号的装置FC230。
图56D展示装置FC200的实施方案FC204的框图。装置FC204包含用于基于来自装置FC100a和FC100b的第一和第二到达角度从多个空间定向滤波器当中选择空间定向滤波器(例如,从多组滤波器系数当中选择一组滤波器系数)的装置FC240。装置FC204还包含用于将所选空间定向滤波器应用于多通道音频信号以产生输出信号的装置FC250。
图57A展示根据一股配置的用于处理多通道信号的设备MFD100的框图。设备MFD100包含用于计算多个导向向量(例如,如本文参考任务TC210所描述)的装置FD100。所述多个导向向量包含基于相对于第一对换能器的轴线的第一指定到达(或离开)角度的第一导引向量、基于相对于第一对换能器的轴线的第二指定到达(或离开)角度的第二导引向量、基于相对于第二对换能器的轴线的第一指定到达(或离开)角度的第三导引向量,以及基于相对于第二对换能器的轴线的第二指定到达(或离开)角度的第四导引向量。设备MFD100还包含用于反转基于所述多个导向向量的矩阵(例如,如本文参考任务TC220所描述)的装置FD200。设备MFD100还包含用于将基于经反转矩阵的空间定向滤波器应用于多通道信号(例如,如本文参考任务TC230所描述)的装置FD300。设备MFD100可经实施以接收相对于每一对轴线的到达角度,或替代地可经配置以计算来自空间中给定DOA的成对到达角度(例如,通过执行如上文参考图20A到20E或22A到22E所描述的投影的反转)。
图57B展示根据一股配置的用于处理包含第一源分量和第二源分量的多通道音频信号的设备AC100的框图。设备AC100包含经配置以计算第一源分量的相对于第一对麦克风的轴线的第一到达角度以及第二源分量的相对于第一对麦克风的轴线的第一到达角度(例如,如本文参考任务TC100a所描述)的计算器C100。计算器C100还经配置以计算第一源分量的相对于第二对麦克风的轴线的第二到达角度以及第二源分量的相对于第二对麦克风的轴线的第二到达角度(例如,如本文参考任务TC100b所描述)。计算器C100可实施为例如设备A5、A10和A15当中的任一者的实例(即,对于每一麦克风对和每一源分量)。设备AC100还包含经配置以基于第一到达角度和第二到达角度将空间定向滤波器应用于多通道音频信号以产生输出信号(例如,如本文参考任务TC200所描述)的鉴别器C200。
图57C展示包含选择器C240和空间定向滤波器C250的鉴别器C200的实施方案C204的框图。选择器C240经配置以基于来自计算器C100的第一和第二到达角度从多个空间定向滤波器当中选择空间定向滤波器C250(例如,以从多组滤波器系数当中选择空间定向滤波器C250的滤波器系数)。空间定向滤波器C250经配置以对多通道音频信号进行滤波(例如,根据所选组滤波器系数)以产生输出信号。
图57D展示根据一股配置的用于处理多通道信号的设备AD100的框图。设备AD100包含经配置以计算多个导向向量(例如,如本文参考任务TC210所描述)的计算器D100。所述多个导向向量包含基于相对于第一对换能器的轴线的第一指定到达(或离开)角度的第一导引向量、基于相对于第一对换能器的轴线的第二指定到达(或离开)角度的第二导引向量、基于相对于第二对换能器的轴线的第一指定到达(或离开)角度的第三导引向量,以及基于相对于第二对换能器的轴线的第二指定到达(或离开)角度的第四导引向量。计算器D100还经配置以反转基于所述多个导向向量的矩阵(例如,如本文参考任务TC220所描述)。设备AD100还包含基于经反转矩阵(例如,如本文参考任务TC230所描述)的空间定向滤波器D300,且经布置以对多通道信号进行滤波以产生输出信号。设备AD100可经实施以接收相对于每一对轴线的到达角度,或替代地可经配置以计算来自空间中给定DOA的成对到达角度(例如,通过执行如上文参考图20A到20E或22A到22E所描述的投影的反转)。在另一实例中,鉴别器C200实施为设备AD100的实例。
图58A展示用于如本文所描述的集成方法的一个实例的流程图。此方法包含用于相位延迟估计的存量匹配、获得DOA误差值的误差计算、维度匹配和/或对选择,以及将用于所选DOA候选者的DOA误差映射到源活动性似然度估计。可例如通过如本文所描述的方法M20、MA20、M25、M30、M100或M110的实施方案执行此些操作。还可使用成对DOA估计结果以跟踪一或多个作用中扬声器(例如,使用如本文所描述的方法M200或M300的实施方案)来执行成对空间滤波操作(例如,使用如本文所描述的方法MC100或MD100的实施方案),和/或执行时间和/或频率选择性掩蔽。还可使用活动似然度估计和/或空间滤波操作来获得噪声估计以支持单通道噪声抑制操作。
图57E展示根据一股配置的为方法M200的实施方案(例如,方法M300)且还为方法MC100的实施方案的集成方法MG100的流程图。方法MG100包含如本文所描述的任务TC100a、TC100b、TB200和TC200的实例。图58B展示方法MG100的实施方案MG110的流程图,其中任务TC100a和TC100b中的每一者被实施为如本文所描述的方法M20(例如,M25、M30、M100或M110)的实施方案的相应实例M20a、M20b。图58C展示方法MG110的实施方案MG120的流程图,其包含任务TB200的多个实例TB200a、TB200b(例如,任务TB300),使得每一实例计算不同对应源分量的组合DOA估计。
选择候选方向的方法(例如,如本文所描述的方法M10、M20、MA20、M25、M30、M100或M110的实施方案)可用以支持话音活动检测(VAD),其可在各种使用情况(例如,扬声器电话)中应用于噪声抑制。可实施为基于扇区的方法(即,将环境空间建模为数个离散空间扇区(例如,用于象限架构的四个扇区))的此类技术可包含基于所有扇区的最大似然度(“likelihood_max”)的“vadall”统计。举例来说,如果最大值显著大于仅噪声的阈值,那么vadall统计的值为真(否则为假)。可能需要仅在仅噪声周期期间更新仅噪声阈值。可例如基于语音开始和/或偏移而通过单通道VAD(例如,来自初级麦克风通道)和/或VAD指示此类周期(例如,基于一组频率分量中的每一者的能量的时间导数,如在例如2011年10月27日公开的第2011/0264447A1号美国公开专利申请案和2012年5月24日公开的第2012/0130713号美国公开专利申请案中所描述)。
另外或替代地,此类技术可包含基于每一扇区的最大似然度的每扇区“vad[扇区]”统计。此类统计可经实施以仅在单通道VAD和开始-偏移VAD为真、vadall为真且扇区的最大值大于likelihood_max的某一部分(例如,95%)时才具有真值。可使用此信息来选择具有最大似然度的扇区。可适用的情境包含用户选择的目标扇区与移动干扰源,和用户选择的干扰扇区与移动目标。
可能需要选择瞬时跟踪(PWBFNF性能)与防止干扰扇区的太频繁切换之间的权衡。举例来说,可能需要组合vadall统计与一或多个其它VAD统计。vad[扇区]统计可用以指定干扰扇区和/或触发非固定噪声参考的更新。还可能需要使用(例如)基于最小统计的归一化技术(例如,如2012年5月24日公布的第2012/0130713号美国专利申请公开案中所描述)将vadall统计和/或vad[扇区]统计归一化。
选择候选方向的方法(例如,如本文所描述的方法M10、M20、MA20、M25、M30、M100或M110的实施方案)可用以支持方向掩蔽,其可在各种使用情况(例如,扬声器电话)中应用于噪声抑制。此类技术可用以通过使用DOA估计控制方向性掩蔽技术(例如,使目标象限通过和/或阻断干扰象限)来获得额外噪声抑制增益。此类方法可用于处置混响且可产生额外的6到12分贝增益。可使用所选候选方向用于象限掩蔽(例如,通过根据每一频段指派具有最大似然度的角度)。可能需要基于目标优势(例如,如通过用于各种频段的候选方向的分布所指示,所述分布有力地集中在所要目标源的方向)来控制掩蔽积极性。此类技术可经设计以获得自然掩蔽响应(例如,平滑的自然无缝的积极性转变),使得滤波器的动态范围在所要目标源(例如,第一源分量)强时较大,而在所要目标源弱时较小。
可能需要提供多视角图形用户接口(GUI)以用于源跟踪和/或用于具有方向性掩蔽的PW BFNF扩展。本文中呈现可应用于桌上型免提扬声器电话使用情况的三麦克风(两对)二维(例如,360°)源跟踪和增强方案的各种实例。然而,可能需要实践通用方法以提供对范围从桌上型免提到手持式免提或甚至到手持机使用情况的使用情况的无缝涵盖。虽然三麦克风方案可用于手持式免提使用情况,但可能还需要在装置的背面上使用第四麦克风(如果已经存在)。举例来说,可能需要至少四个麦克风(三个麦克风对)来用以表示(x,y,z)维度。如图1所示的设计具有此特征,如同图59A中所示的设计,具有三个前麦克风(由空心圆指示)和一后麦克风(不可见,由虚线圆指示)。
可能需要在此类装置的显示屏幕上提供现用源的可视化。可应用本文中所描述的扩展原理来通过使用前-后麦克风对获得从2D到3D的简单明了的扩展。为支持多视图GUI,我们可以通过利用多种位置检测方法(例如,如本文所描述的定向传感器(例如,一或多个加速度计、陀螺仪,和/或接近度传感器)和/或由2D角度图依据每一握持模式给出的似然度的方差)中的任一者确定用户的握持模式。取决于当前握持模式,可切换到如适于此类握持模式的两个非同轴麦克风对,且还可在显示器上提供对应的360°2D表示(如果需要)。此类GUI还可经实施以允许用户配置所要方向掩蔽模式(例如,如本文参考图29C到31B所描述)。
举例来说,可实施此类方法以支持在可包含桌上型免提(例如,扬声器电话)模式、肖像浏览通话模式、风景浏览通话模式和手持机模式(即,拿到耳朵处并指向口部)的模式范围当中进行切换。图59B展示在装置的显示屏幕上具有三个前麦克风和对应可视化的桌上型免提模式的实例。图59C展示具有被激活的两个前麦克风和一个后麦克风以及对应显示器的手持式免提(肖像)模式的实例。图59D展示具有被激活的不同对前麦克风和一个后麦克风以及对应显示器的手持式免提(风景)模式的实例。
可能需要提供目标源的增强。可应用本文中所描述的扩展原理来通过还使用前-后麦克风对获得从2D到3D的简单明了的扩展。替代仅从两个维度进行DOA估计(θ1,θ2),我们从另一维度获得额外估计以获得总共三个DOA估计(θ1,θ2,θ3)。在此情况下,如图50D中所示的PWBFNF阵列导向矩阵可扩充到六行(通过所添加的麦克风对),且掩蔽增益函数可从f(θ1)f(θ2)扩充到f(θ1)f(θ2)f(θ3)。通过使用如上文所描述的位置敏感选择,可最佳地使用所有三个麦克风对(而不管当前握持模式),以依据源增强性能获得模式当中的无缝转变。当然,还可一个时间使用三个以上对。
如本文中所论述的用于方向估计的麦克风中的每一者(例如,参考一或多个用户或其它源的位置及跟踪)可具有全向的、双向的或单向的(例如,心形)响应。可使用的各种类型的麦克风包含(不限于)压电麦克风、动态麦克风和驻极体麦克风。明确地指出,可更一股化地将麦克风实施为对辐射或发射(不同于声音)敏感的换能器。在一个此类实例中,麦克风阵列经实施以包含一或多个超声波换能器(例如,对大于15、20、25、30、40或50赫兹或50赫兹以上的声频敏感的换能器)。
可将如本文中所揭示的设备实施为硬件(例如,处理器)与软件和/或与固件的组合。此类设备还可包含如图60A中所示的音频预处理级AP10,其对由麦克风MC10和MC20(例如,一或多个麦克风阵列的实施方案中的麦克风)中的每一者产生的信号执行一或多个预处理操作,以产生经预处理的麦克风信号(例如,左麦克风信号和右麦克风信号中的对应者)以用于输入到任务T10或差异计算器100。此类预处理操作可包含(不限于)阻抗匹配、模数转换、增益控制,和/或模拟域和/或数字域中的滤波。
图60B展示包含模拟预处理级P10a、P10b和P10c的音频预处理级AP10的三通道实施方案AP20的框图。在一个实例中,级P10a、P10b和P10c各自经配置以对对应麦克风信号执行高通滤波操作(例如,具有50、100或200赫兹的截止频率)。通常,级P10a、P10b和P10c经配置以对每一信号执行相同功能。
可能需要音频预处理级AP10将每一麦克风信号产生为数字信号,也就是说,产生为一连串样本。音频预处理级AP20(例如)包含各自经布置以对对应模拟信号进行取样的模/数转换器(ADC)C10a、C10b和C10c。用于声学应用的典型取样率包含8赫兹、12赫兹、16赫兹和从约8赫兹到约16赫兹的范围内的其它频率,但还可使用高达约44.1赫兹、48赫兹或192赫兹的取样率。通常,转换器C10a、C10b和C10c经配置以按相同速率对每一信号进行取样。
在此实例中,音频预处理级AP20还包含数字预处理级P20a、P20b和P20c,其各自经配置以对对应的数字化通道执行一或多个预处理操作(例如,频谱整形)以产生左麦克风信号AL10、中心麦克风信号AC10和右麦克风信号AR10中的对应者以用于输入到任务T10或差异计算器100。通常,级P20a、P20b和P20c经配置以对每一信号执行相同功能。还应注意,预处理级AP10可经配置以产生来自麦克风中的至少一者的信号的不同版本(例如,以不同取样率和/或通过不同频谱整形)以用于内容使用,例如,提供话音通信(例如,电话呼叫)中的近端语音信号。尽管图60A和60B分别展示两通道和三通道实施方案,但应理解,相同原理可扩展到任意数目个麦克风。
图61A展示包含芯片或芯片组CS10(例如,移动台调制解调器(MSM)芯片组)的通信装置D10的框图,所述芯片或芯片组CS10可经实施以体现如本文所描述的设备A5、A10、A15、A300、A320、A330、A350、AC100、AD100、MF5、MF10、MF15、MF300、MF320、MF325、MF330、MF340、MF350、MFC100和MFD100的实施方案中的任一者或多者的元件。芯片/芯片组CS10可包含一个或多个处理器,其可经配置以执行此类设备的软件和/或固件部分(例如,作为指令)。
芯片/芯片组CS10包含:无线电接收器,其经配置以接收射频(RF)通信信号且解码并再现编码于RF信号内的音频信号;以及无线电发射器,其经配置以将基于经由麦克风MC10、MC20和/或MC30接收的音频信息(例如,基于由设备AC100、AD100、MFC100或MFD100的空间定向滤波器产生的输出信号)的经编码音频信号作为描述经编码音频信号的RF通信信号发射到传输通道中。此类装置可经配置以经由本文中提及的编解码器中的任一者或多者而以无线方式发射和接收话音通信数据。
装置D10经配置以经由天线C30接收和发射RF通信信号。装置D10在通往天线C30的路径中还可包含双路复用器和一或多个功率放大器。芯片/芯片组CS10还经配置以经由小键盘C10接收用户输入且经由显示器C20显示信息。在此实例中,装置D10还包含一或多个天线C40以支持全球定位系统(GPS)位置服务和/或与例如无线(例如,BluetoothTM)耳机等外部装置的短程通信。在另一实例中,此类通信装置自身为BluetoothTM耳机,且不具有小键盘C10、显示器C20和天线C30。
通信装置D10可体现在多种通信装置中,包含智能电话以及膝上型计算机和平板计算机。图1展示一个此类实例的前、后和侧视图:手持机H100(例如,智能电话)具有布置在正面上的两个话音麦克风MV10-1和MV10-3、布置在背面上的话音麦克风MV10-2、位于正面的顶部拐角中的另一麦克风ME10(例如,用于增强方向选择性和/或俘获用户的耳朵处的声学误差以供输入到主动噪声消除操作),以及位于背面上的另一麦克风MR10(例如,用于增强方向选择性和/或俘获背景噪声参考)。扩音器LS10在误差麦克风ME10附近布置在正面的顶部中心中,且还提供两个其它扩音器LS20L、LS20R(例如,用于扬声器电话应用)。此类手持机的诸个麦克风之间的最大距离通常为约10或12厘米。装置H100的各个麦克风取决于特定应用的所要轴线配置而可用作如本文所描述的阵列的麦克风MC10、MC20、MC30等。
图61B展示无线装置1102的框图,其可经实施以执行如本文所描述的方法(例如,方法M10、M20、MA20、M25、M30、M100、M110、M200、M300、M320、M325、M330、M340、M350、MC100、MD100、MG100、MG110和MG120中的任一者或多者)。无线装置1102可为远程站、接入终端、手持机、个人数字助理(PDA)、蜂窝式电话,等。
无线装置1102包含控制装置的操作的处理器1104。处理器1104也可被称作中央处理单元(CPU)。可包含只读存储器(ROM)和随机存取存储器(RAM)两者的存储器1106将指令和数据提供到处理器1104。存储器1106的一部分还可包含非易失性随机存取存储器(NVRAM)。处理器1104通常基于存储在存储器1106内的程序指令执行逻辑和算术运算。存储器1106中的指令可执行以实施如本文所描述的一或多种方法。
无线装置1102包含外壳1108,其可包含发射器1110和接收器1112以允许在无线装置1102与远程位置之间发射和接收数据。发射器1110和接收器1112可组合成收发器1114。天线1116可附接到外壳1108且电耦合到收发器1114。无线装置1102还可包含(未展示)多个发射器、多个接收器、多个收发器和/或多个天线。
在此实例中,无线装置1102还包含信号检测器1118,信号检测器1118可用以检测并量化由收发器1114接收的信号的电平。信号检测器1118可将此些信号检测为全部能量、每伪噪声(PN)码片的导频能量、功率谱密度和其它信号。无线装置1102还包含供用于处理信号的数字信号处理器(DSP)1120。
无线装置1102的各个组件通过总线系统1122耦合在一起,总线系统1122除数据总线之外还可包含功率总线、控制信号总线和状态信号总线。为清楚起见,各种总线在图61B中说明为总线系统1122。
一股可在任何收发和/或音频感测应用中,尤其在此类应用的移动或其它便携实例中应用本文中所揭示的方法和设备。举例来说,本文中所揭示的配置的范围包含驻留于经配置以使用码分多址(CDMA)空中接口的无线电话通信系统中的通信装置。然而,所属领域的技术人员将理解,具有本文中所描述的特征的方法及设备可驻留于使用所属领域的技术人员所已知的广泛范围的技术的各种通信系统中的任一者中,例如经由有线和/或无线(例如,CDMA、TDMA、FDMA和/或TD-SCDMA)传输通道使用IP话音(VoIP)的系统。
明确预期且在此揭示,本文中所揭示的通信装置可适于在包交换(例如,经布置以根据例如VoIP等协议载运音频传输的有线和/或无线网络)和/或电路交换的网络中使用。还明确预期且在此揭示,本文中所揭示的通信装置可适于在窄带译码系统(例如,对约四千赫兹或五千赫兹的音频频率范围进行编码的系统)中使用和/或在宽带译码系统(例如,对大于五千赫兹的音频频率进行编码的系统)中使用,包含全频带宽带译码系统和分裂频带宽带译码系统。
可与如本文中所描述的通信装置的发射器和/或接收器一起使用或适于与其一起使用的编解码器的实例包含:增强型可变速率编解码器,如2007年2月的标题为“用于宽带展频数字系统的增强型可变速率编解码器,语音服务选项3、68和70(Enhanced VariableRate Codec,Speech Service Options3,68,and70for Wideband Spread SpectrumDigital Systems)”的第三代合作伙伴计划2(3GPP2)文献C.S0014-C,v1.0中所描述(可在www.3gpp.org处在线得到);可选择模式声码器语音编解码器,如2004年1月的标题为“用于宽带展频通信系统的可选择模式声码器(SMV)服务选项(Selectable Mode Vocoder(SMV)Service Option for Wideband Spread Spectrum Communication Systems)”的3GPP2文献C.S0030-0,v3.0中所描述(可在www.3gpp.org处在线得到);自适应多速率(AMR)语音编解码器,如文献ETSI TS126 092V6.0.0(欧洲电信标准协会(ETSI),法国索菲亚安迪波利斯西德克斯,2004年12月)中所描述;以及AMR宽带语音编解码器,如文献ETSI TS126192V6.0.0(ETSI,2004年12月)中所描述。可使用此编解码器(例如)以从所接收的无线通信信号恢复所再现的音频信号。
提供所描述的配置的呈现以使所属领域的技术人员能够制作或使用本文中所揭示的方法和其它结构。本文中所展示和描述的流程图、框图和其它结构仅是实例,且这些结构的其它变体也在本发明的范围内。对这些配置的各种修改是可能的,且本文中所呈现的一股原理还可应用于其它配置。因此,本发明不希望限于上文所展示的配置,而是将赋予其与在本文中(包含在形成原始揭示内容的一部分的所申请的所附权利要求书中)以任何方式揭示的原理及新颖特征一致的最广范围。
所属领域的技术人员将了解,可使用多种不同技术和技法中的任一者来表示信息和信号。举例来说,可通过电压、电流、电磁波、磁场或磁性粒子、光场或光学粒子或者其任何组合来表示可在整个以上描述中所参考的数据、指令、命令、信息、信号、位及符号。
实施如本文中所揭示的配置的重要设计要求可包含使处理延迟和/或计算复杂性(通常以每秒百万指令或MIPS来测量)最小化,对于计算密集型应用(例如,压缩音频或视听信息(例如,根据压缩格式编码的文件或流,例如本文中所识别的实例中的一者)的回放)或用于宽带通信的应用(例如,在高于八千赫兹(例如,12kHz、16kHz、32kHz、44.1kHz、48kHz或192kHz)的取样速率下的话音通信)尤其如此。
如本文中所揭示的设备(例如,装置A5、A10、A15、A300、A320、A330、A350、AC100、AD100、MF5、MF10、MF15、MF300、MF320、MF325、MF330、MF340、MF350、MFC100和MFD100中的任一者)可实施于对于既定应用视为合适的硬件与软件和/或与固件的任何组合中。举例来说,此类设备的元件可被制造为驻留于(例如)同一芯片上或芯片组中的两个或两个以上芯片中的电子和/或光学装置。此装置的一个实例为固定或可编程逻辑元件(例如,晶体管或逻辑门)阵列,且这些元件中的任一者可实施为一或多个此类阵列。这些元件中的任何两者或两者以上乃至全部可实施于相同阵列内。此阵列或此些阵列可实施于一或多个芯片内(例如,包含两个或两个以上芯片的芯片组内)。
本文中所揭示的设备(例如,设备A5、A10、A15、A300、A320、A330、A350、AC100、AD100、MF5、MF10、MF15、MF300、MF320、MF325、MF330、MF340、MF350、MFC100和MFD100中的任一者)的各种实施方案的一或多个元件可全部或部分实施为一或多组指令,所述一或多组指令经布置以在一或多个固定或可编程逻辑元件阵列上执行,例如,微处理器、嵌入式处理器、IP核心、数字信号处理器、FPGA(现场可编程门阵列)、ASSP(专用标准产品)和ASIC(专用集成电路)。本文中所揭示的设备的实施方案的各种元件中的任一者还可体现为一或多个计算机(例如,包含经编程以执行一或多个组指令或指令序列的一或多个阵列的机器,还称为“处理器”),且这些元件中的任何两者或两者以上乃至全部可实施于同一此计算机或此些计算机内。
如本文中所揭示的处理器或其它用于处理的装置可被制造成驻留于(例如)同一芯片上或芯片组中的两个或两个以上芯片中的一或多个电子和/或光学装置。此装置的一个实例为固定或可编程逻辑元件(例如,晶体管或逻辑门)阵列,且这些元件中的任一者可实施为一或多个此类阵列。此阵列或此些阵列可实施于一或多个芯片内(例如,包含两个或两个以上芯片的芯片组内)。此些阵列的实例包含固定或可编程逻辑元件阵列,例如微处理器、嵌入式处理器、IP核心、DSP、FPGA、ASSP和ASIC。如本文中所揭示的处理器或其它用于处理的装置还可体现为一或多个计算机(例如,包含经编程以执行一或多个指令集或序列的一或多个阵列的机器)或其它处理器。如本文中所描述的处理器可能用来执行任务或执行不与本文揭示的方法的实施的程序直接相关的其它指令集,例如与其中嵌入了处理器的装置或系统(例如,音频感测装置)的另一操作相关的任务。还可能由音频感测装置的处理器执行如本文中所揭示的方法的部分,且在一或多个其它处理器的控制下执行所述方法的另一部分。
所属领域的技术人员将了解,结合本文中所揭示的配置而描述的各种说明性模块、逻辑块、电路和测试以及其它操作可实施为电子硬件、计算机软件,或两者的组合。可用通用处理器、数字信号处理器(DSP)、ASIC或ASSP、FPGA或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其经设计以产生如本文中所揭示的配置的任何组合来实施或执行所述模块、逻辑块、电路和操作。举例来说,可将此配置至少部分实施为硬连线电路,实施为制造到专用集成电路中的电路配置,或实施为加载到非易失性存储装置中的固件程序或者作为机器可读代码从数据存储媒体加载或被加载到数据存储媒体中的软件程序,所述代码是可由例如通用处理器或其它数字信号处理单元等逻辑元件阵列执行的指令。通用处理器可为微处理器,但在替代方案中,处理器可为任何常规的处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如,DSP与微处理器的组合、多个微处理器的组合、一或多个微处理器与DSP核心的联合,或任何其它此配置。软件模块可驻留于非暂时性存储媒体中,例如RAM(随机存取存储器)、ROM(只读存储器)、非易失性RAM(NVRAM)(例如,快闪RAM),可擦除可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)、寄存器、硬盘、可装卸磁盘,或CD-ROM;或此项技术中已知的任何其它形式的存储媒体。说明性存储媒体耦合到处理器,使得处理器可从存储媒体读取信息及将信息写入到存储媒体。在替代方案中,存储媒体可与处理器成一体式。处理器及存储媒体可驻留于ASIC中。ASIC可驻留于用户终端中。在替代方案中,处理器及存储媒体可作为离散组件驻留于用户终端中。
应注意,本文中所揭示的各种方法(方法M10、M20、MA20、M25、M30、M100、M110、M200、M300、M320、M325、M330、M340、M350、MC100、MD100、MG100、MG110和MG120中的任一者)可由例如处理器等逻辑元件阵列执行,且如本文中所描述的设备的各种元件可实施为经设计以在此阵列上执行的模块。如本文中所使用,术语“模块”或“子模块”可指代以软件、硬件或固件的形式包含计算机指令(例如,逻辑表达式)的任何方法、设备、装置、单元或计算机可读数据存储媒体。应理解,多个模块或系统可组合为一个模块或系统,且一个模块或系统可被分离成多个模块或系统以执行相同功能。当以软件或其它计算机可执行指令实施时,过程的要素本质上为用以执行例如与例程、程序、对象、组件、数据结构等有关任务的代码段。术语“软件”应理解为包含源代码、汇编语言代码、机器代码、二进制代码、固件、宏码、微码、可由逻辑元件阵列执行的任何一或多个指令集或序列以及此类实例的任何组合。程序或代码段可存储于处理器可读媒体中或由体现在载波中的计算机数据信号经由传输媒体或通信链路进行传输。
本文中所揭示的方法、方案和技术(例如,方法M10、M20、MA20、M25、M30、M100、M110、M200、M300、M320、M325、M330、M340、M350、MC100、MD100、MG100、MG110和MG120中的任一者)的实施方案还可有形地体现为(例如,在本文中所列举的一或多个计算机可读存储媒体的有形计算机可读特征中)可由包含逻辑元件阵列(例如,处理器、微处理器、微控制器或其它有限状态机)的机器执行的一或多个指令集。术语“计算机可读媒体”可包含可存储或传递信息的任何媒体,包含易失性、非易失性、可装卸以及非可装卸存储媒体。计算机可读媒体的实例包含电子电路、半导体存储器装置、ROM、快闪存储器、可擦除ROM(EROM)、软盘或其它磁性存储装置、CD-ROM/DVD或其它光学存储装置、硬盘或可用于存储所要信息的任何其它媒体、光纤媒体、射频(RF)链路,或可用于携载所要信息且可被存取的任何其它媒体。计算机数据信号可包含可经由传输媒体(例如电子网络通道、光纤、空气、电磁、RF链路等)传播的任何信号。代码段可经由例如因特网或内联网等计算机网络来下载。在任何情况下,本发明的范围不应被解释为受此些实施例限制。
本文中所描述的方法的任务中的任一者可直接体现于硬件中,由处理器执行的软件模块中,或以上两者的组合中。在如本文中所揭示的方法的实施方案的典型应用中,逻辑元件(例如,逻辑门)阵列经配置以执行所述方法的各个任务中的一者、一者以上或甚至全部。所述任务中的一或多者(可能全部)还可实施为在计算机程序产品(例如,一或多个数据存储媒体,例如磁盘、快闪或其它非易失性存储器卡、半导体存储器芯片等)中体现的代码(例如,一或多个指令集),所述计算机程序产品可由包含逻辑元件阵列(例如,处理器、微处理器、微控制器或其它有限状态机)的机器(例如,计算机)读取且/或执行。本文中所揭示的方法的实施方案的任务还可由一个以上此类阵列或机器执行。在这些或其它实施方案中,所述任务可在用于无线通信的装置内执行,所述装置例如为蜂窝式电话或具有此通信能力的其它装置。此装置可经配置以与电路交换和/或包交换网络通信(例如,使用一或多个协议(例如VoIP))。举例来说,此装置可包含经配置以接收和/或发射经编码帧的RF电路。
明确揭示,本文中所揭示的各种方法可由例如手持机、耳机或便携式数字助理(PDA)等便携式通信装置执行,且本文中所描述的各种设备可包含于此类装置内。典型的实时(例如,在线)应用是使用此类移动装置进行的电话会话。
在一或多个示范性实施例中,可以硬件、软件、固件或其任何组合来实施本文中所描述的操作。如果以软件实施,则可将此些操作作为一或多个指令或代码而存储在计算机可读媒体上或经由计算机可读媒体进行传输。术语“计算机可读媒体”包含计算机可读存储媒体和通信(例如,传输)媒体两者。举例来说而非限制,计算机可读存储媒体可包括存储元件阵列,例如半导体存储器(其可包含(非限制)动态或静态RAM、ROM、EEPROM和/或快闪RAM),或铁电、磁阻、双向、聚合或相变存储器;CD-ROM或其它光盘存储装置;和/或磁盘存储装置或其它磁性存储装置。此类存储媒体可以指令或数据结构的形式存储可由计算机存取的信息。通信媒体可包括可用于以指令或数据结构的形式携载所要程序代码且可由计算机存取的任何媒体,包含促进将计算机程序从一处传递到另一处的任何媒体。同样,可恰当地将任何连接称作计算机可读媒体。举例来说,如果使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)或例如红外线、无线电和/或微波的无线技术从网站、服务器或其它远程源传输软件,则同轴电缆、光纤电缆、双绞线、DSL或例如红外线、无线电和/或微波的无线技术包含于媒体的定义中。如本文中所使用,磁盘及光盘包括压缩光盘(CD)、激光光盘、光盘、数字多功能光盘(DVD)、软盘及Blu-ray DiscTM(蓝光光盘协会,加利福尼亚州全球影城(UniversalCity,CA)),其中磁盘通常以磁性方式再现数据,而光盘用激光以光学方式再现数据。以上各者的组合也应包含在计算机可读媒体的范围内。
如本文中所描述的声学信号处理设备可并入到电子装置中,所述电子装置接收语音输入以便控制某些操作,或可另外受益于所需噪声与背景噪声的分离,所述电子装置例如为通信装置。许多应用可受益于增强清晰的所要声音或分离清晰的所要声音与源自多个方向的背景声音。此些应用可包含电子或计算装置中的人机接口,其并入有例如话音辨识及检测、语音增强及分离、话音激活式控制等能力。可能需要在仅提供有限处理能力的装置中合适地实施此类声学信号处理设备。
本文中所描述的模块、元件和装置的各种实施方案的元件可被制造成驻留于(例如)同一芯片上或芯片组中的两个或两个以上芯片中的电子和/或光学装置。此装置的一个实例为固定或可编程逻辑元件(例如,晶体管或门)的阵列。本文中所描述的设备的各种实施方案的一或多个元件还可全部地或部分地实施为经布置以在一或多个固定或可编程逻辑元件阵列(例如,微处理器、嵌入式处理器、IP核心、数字信号处理器、FPGA、ASSP及ASIC)上执行的一或多个指令集。
有可能使如本文中所描述的设备的实施方案的一或多个元件用于执行任务或执行并非与所述设备的操作直接相关的其它指令集,例如与嵌入有所述设备的装置或系统的另一操作相关的任务。还有可能使此设备的实施方案的一个或一个以上元件具有共同结构(例如,用于在不同时间执行对应于不同元件的代码部分的处理器、经执行以在不同时间执行对应于不同元件的任务的指令集,或在不同时间对不同元件执行操作的电子和/或光学装置的布置)。
Claims (36)
1.一种处理多通道信号的方法,所述方法包括:
对于所述多通道信号的第一通道对,计算第一多个方向拟合性量度,其中所述第一多个方向拟合性量度当中的每一者是基于多个候选方向当中的一个对应不同候选方向;
对于所述多通道信号的不同于所述第一对的第二通道对,计算第二多个方向拟合性量度,其中所述第二多个方向拟合性量度当中的每一者是基于所述多个候选方向当中的一个对应不同候选方向;以及
基于所述第一多个方向拟合性量度和所述第二多个方向拟合性量度,从所述多个候选方向当中选择第一方向,
其中所述第一多个方向拟合性量度中的每一者是基于所述第一对的所述通道之间在所述多通道信号的第一频率分量处的差异,
其中所述第二多个方向拟合性量度中的每一者是基于所述第二对的所述通道之间在所述第一频率分量处的差异,且
其中所述从所述多个候选方向当中选择所述第一方向包括确定所述第一多个方向拟合性量度和所述第二多个方向拟合性量度当中的最小方向误差。
2.根据权利要求1所述的方法,其中,对于所述第一多个方向拟合性量度中的每一者,所述第一对的所述通道之间的所述差异是所述第一对中的一个通道中的所述第一频率分量的相位与所述第一对中的另一通道中的所述频率分量的相位之间的差异。
3.根据权利要求1所述的方法,其中所述多通道信号的所述通道是基于由麦克风的线性阵列产生的信号,使得所述多通道信号的所述通道当中的每一者是基于由所述线性阵列的不同麦克风产生的信号。
4.根据权利要求3所述的方法,其中所述第一对中的第一通道对应于所述阵列的第一麦克风,所述第一对中的第二通道对应于所述阵列的第二麦克风,所述第二对中的第一通道对应于所述第一麦克风,且所述第二对中的第二通道对应于所述阵列的第三麦克风。
5.根据权利要求3和4中任一权利要求所述的方法,其中所述第一通道对中的每一通道是基于由所述线性阵列的第一对麦克风中的对应麦克风产生的信号,且
其中所述第二通道对中的每一通道是基于由所述线性阵列的第二对麦克风中的对应麦克风产生的信号,且
其中所述第一对麦克风的所述麦克风分开第一距离,且
其中所述第二对麦克风的所述麦克风分开不同于所述第一距离的第二距离。
6.根据权利要求5所述的方法,其中所述第一频率分量具有小于所述第一距离的两倍且小于所述第二距离的两倍的波长。
7.根据权利要求1所述的方法,其中所述方法包括:
对于所述多通道信号的所述第一通道对,计算第三多个方向拟合性量度,其中所述第三多个方向拟合性量度当中的每一者是基于所述多个候选方向当中的一个对应不同候选方向;
对于所述多通道信号的所述第二通道对,计算第四多个方向拟合性量度,其中所述第四多个方向拟合性量度当中的每一者是基于所述多个候选方向当中的一个对应不同候选方向;以及
基于所述第三多个方向拟合性量度和所述第四多个方向拟合性量度,从所述多个候选方向当中选择第二方向,
其中所述第三多个方向拟合性量度中的每一者是基于所述第一对的所述通道之间在所述多通道信号的不同于所述第一频率分量的第二频率分量处的差异,且
其中所述第四多个方向拟合性量度中的每一者是基于所述第二对的所述通道之间在所述第二频率分量处的差异。
8.根据权利要求7所述的方法,其中所述方法包括基于所述多个候选方向当中的所述所选第一候选方向和所述多个候选方向当中的所述所选第二候选方向指示所述多通道信号的到达方向。
9.根据权利要求7所述的方法,其中所述从所述多个候选方向当中选择所述第一方向包括确定所述第一多个方向拟合性量度和所述第二多个方向拟合性量度当中的最小方向误差,且
其中所述从所述多个候选方向当中选择所述第二方向包括确定所述第三多个方向拟合性量度和所述第四多个方向拟合性量度当中的最小方向误差。
10.根据权利要求9所述的方法,其中所述第一多个方向拟合性量度和所述第二多个方向拟合性量度当中的所述最小方向误差对应于所述多通道信号的所述第一通道对,且
其中所述第三多个方向拟合性量度和所述第四多个方向拟合性量度当中的所述最小方向误差对应于所述多通道信号的所述第二通道对。
11.根据权利要求7到10中任一权利要求所述的方法,其中所述所选第一方向与所述所选第二方向为相同方向。
12.根据权利要求7到10中任一权利要求所述的方法,其中所述所选第一方向为与所述所选第二方向不同的方向。
13.一种用于处理多通道信号的设备,所述设备包括:
用于对于所述多通道信号的第一通道对计算第一多个方向拟合性量度的装置,其中所述第一多个方向拟合性量度当中的每一者是基于多个候选方向当中的一个对应不同候选方向;
用于对于所述多通道信号的不同于所述第一对的第二通道对计算第二多个方向拟合性量度的装置,其中所述第二多个方向拟合性量度当中的每一者是基于所述多个候选方向当中的一个对应不同候选方向;以及
用于基于所述第一多个方向拟合性量度和所述第二多个方向拟合性量度从所述多个候选方向当中选择第一方向的装置,
其中所述第一多个方向拟合性量度中的每一者是基于所述第一对的所述通道之间在所述多通道信号的第一频率分量处的差异,
其中所述第二多个方向拟合性量度中的每一者是基于所述第二对的所述通道之间在所述第一频率分量处的差异,且
其中所述从所述多个候选方向当中选择所述第一方向包括确定所述第一多个方向拟合性量度和所述第二多个方向拟合性量度当中的最小方向误差。
14.根据权利要求13所述的设备,其中,对于所述第一多个方向拟合性量度中的每一者,所述第一对的所述通道之间的所述差异是所述第一对中的一个通道中的所述第一频率分量的相位与所述第一对中的另一通道中的所述频率分量的相位之间的差异。
15.根据权利要求13所述的设备,其中所述多通道信号的所述通道是基于由麦克风的线性阵列产生的信号,使得所述多通道信号的所述通道当中的每一者是基于由所述线性阵列的不同麦克风产生的信号。
16.根据权利要求15所述的设备,其中所述第一对中的第一通道对应于所述阵列的第一麦克风,所述第一对中的第二通道对应于所述阵列的第二麦克风,所述第二对中的第一通道对应于所述第一麦克风,且所述第二对中的第二通道对应于所述阵列的第三麦克风。
17.根据权利要求15和16中任一权利要求所述的设备,其中所述第一通道对中的每一通道是基于由所述线性阵列的第一对麦克风中的对应麦克风产生的信号,且
其中所述第二通道对中的每一通道是基于由所述线性阵列的第二对麦克风中的对应麦克风产生的信号,且
其中所述第一对麦克风的所述麦克风分开第一距离,且
其中所述第二对麦克风的所述麦克风分开不同于所述第一距离的第二距离。
18.根据权利要求17所述的设备,其中所述第一频率分量具有小于所述第一距离的两倍且小于所述第二距离的两倍的波长。
19.根据权利要求13所述的设备,其中所述设备包括:
用于对于所述多通道信号的所述第一通道对计算第三多个方向拟合性量度的装置,其中所述第三多个方向拟合性量度当中的每一者是基于所述多个候选方向当中的一个对应不同候选方向;
用于对于所述多通道信号的所述第二通道对计算第四多个方向拟合性量度的装置,其中所述第四多个方向拟合性量度当中的每一者是基于所述多个候选方向当中的一个对应不同候选方向;以及
用于基于所述第三多个方向拟合性量度和所述第四多个方向拟合性量度从所述多个候选方向当中选择第二方向的装置,
其中所述第三多个方向拟合性量度中的每一者是基于所述第一对的所述通道之间在所述多通道信号的不同于所述第一频率分量的第二频率分量处的差异,且
其中所述第四多个方向拟合性量度中的每一者是基于所述第二对的所述通道之间在所述第二频率分量处的差异。
20.根据权利要求19所述的设备,其中所述设备包括用于基于所述多个候选方向当中的所述所选第一候选方向和所述多个候选方向当中的所述所选第二候选方向指示所述多通道信号的到达方向的装置。
21.根据权利要求19所述的设备,其中所述从所述多个候选方向当中选择所述第一方向包括确定所述第一多个方向拟合性量度和所述第二多个方向拟合性量度当中的最小方向误差,且
其中所述从所述多个候选方向当中选择所述第二方向包括确定所述第三多个方向拟合性量度和所述第四多个方向拟合性量度当中的最小方向误差。
22.根据权利要求21所述的设备,其中所述第一多个方向拟合性量度和所述第二多个方向拟合性量度当中的所述最小方向误差对应于所述多通道信号的所述第一通道对,且
其中所述第三多个方向拟合性量度和所述第四多个方向拟合性量度当中的所述最小方向误差对应于所述多通道信号的所述第二通道对。
23.根据权利要求19到22中任一权利要求所述的设备,其中所述所选第一方向与所述所选第二方向为相同方向。
24.根据权利要求19到22中任一权利要求所述的设备,其中所述所选第一方向为与所述所选第二方向不同的方向。
25.一种用于处理多通道信号的设备,所述设备包括:
量度计算器,其经配置以进行以下操作
对于所述多通道信号的第一通道对,计算第一多个方向拟合性量度,其中所述第一多个方向拟合性量度当中的每一者是基于多个候选方向当中的一个对应不同候选方向,且
对于所述多通道信号的不同于所述第一对的第二通道对,计算第二多个方向拟合性量度,其中所述第二多个方向拟合性量度当中的每一者是基于所述多个候选方向当中的一个对应不同候选方向;以及
选择器,其经配置以基于所述第一多个方向拟合性量度和所述第二多个方向拟合性量度从所述多个候选方向当中选择第一方向,
其中所述第一多个方向拟合性量度中的每一者是基于所述第一对的所述通道之间在所述多通道信号的第一频率分量处的差异,
其中所述第二多个方向拟合性量度中的每一者是基于所述第二对的所述通道之间在所述第一频率分量处的差异,且
其中所述选择器经配置以确定所述第一多个方向拟合性量度和所述第二多个方向拟合性量度当中的最小方向误差。
26.根据权利要求25所述的设备,其中,对于所述第一多个方向拟合性量度中的每一者,所述第一对的所述通道之间的所述差异是所述第一对中的一个通道中的所述第一频率分量的相位与所述第一对中的另一通道中的所述频率分量的相位之间的差异。
27.根据权利要求25所述的设备,其中所述多通道信号的所述通道是基于由麦克风的线性阵列产生的信号,使得所述多通道信号的所述通道当中的每一者是基于由所述线性阵列的不同麦克风产生的信号。
28.根据权利要求27所述的设备,其中所述第一对中的第一通道对应于所述阵列的第一麦克风,所述第一对中的第二通道对应于所述阵列的第二麦克风,所述第二对中的第一通道对应于所述第一麦克风,且所述第二对中的第二通道对应于所述阵列的第三麦克风。
29.根据权利要求27和28中任一权利要求所述的设备,其中所述第一通道对中的每一通道是基于由所述线性阵列的第一对麦克风中的对应麦克风产生的信号,且
其中所述第二通道对中的每一通道是基于由所述线性阵列的第二对麦克风中的对应麦克风产生的信号,且
其中所述第一对麦克风的所述麦克风分开第一距离,且
其中所述第二对麦克风的所述麦克风分开不同于所述第一距离的第二距离。
30.根据权利要求29所述的设备,其中所述第一频率分量具有小于所述第一距离的两倍且小于所述第二距离的两倍的波长。
31.根据权利要求25所述的设备,其中所述量度计算器经配置以进行以下操作
对于所述多通道信号的所述第一通道对,计算第三多个方向拟合性量度,其中所述第三多个方向拟合性量度当中的每一者是基于所述多个候选方向当中的一个对应不同候选方向,且
对于所述多通道信号的所述第二通道对,计算第四多个方向拟合性量度,其中所述第四多个方向拟合性量度当中的每一者是基于所述多个候选方向当中的一个对应不同候选方向,且
其中所述选择器经配置以基于所述第三多个方向拟合性量度和所述第四多个方向拟合性量度从所述多个候选方向当中选择第二方向,且
其中所述第三多个方向拟合性量度中的每一者是基于所述第一对的所述通道之间在所述多通道信号的不同于所述第一频率分量的第二频率分量处的差异,且
其中所述第四多个方向拟合性量度中的每一者是基于所述第二对的所述通道之间在所述第二频率分量处的差异。
32.根据权利要求31所述的设备,其中所述设备包括指示器,所述指示器经配置以基于所述多个候选方向当中的所述所选第一候选方向和所述多个候选方向当中的所述所选第二候选方向指示所述多通道信号的到达方向。
33.根据权利要求31所述的设备,其中所述选择器经配置以确定所述第一多个方向拟合性量度和所述第二多个方向拟合性量度当中的最小方向误差,且确定所述第三多个方向拟合性量度和所述第四多个方向拟合性量度当中的最小方向误差。
34.根据权利要求33所述的设备,其中所述第一多个方向拟合性量度和所述第二多个方向拟合性量度当中的所述最小方向误差对应于所述多通道信号的所述第一通道对,且
其中所述第三多个方向拟合性量度和所述第四多个方向拟合性量度当中的所述最小方向误差对应于所述多通道信号的所述第二通道对。
35.根据权利要求31到34中任一权利要求所述的设备,其中所述所选第一方向与所述所选第二方向为相同方向。
36.根据权利要求31到34中任一权利要求所述的设备,其中所述所选第一方向为与所述所选第二方向不同的方向。
Applications Claiming Priority (13)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261624181P | 2012-04-13 | 2012-04-13 | |
US61/624,181 | 2012-04-13 | ||
US201261642954P | 2012-05-04 | 2012-05-04 | |
US61/642,954 | 2012-05-04 | ||
US201261713447P | 2012-10-12 | 2012-10-12 | |
US61/713,447 | 2012-10-12 | ||
US201261714212P | 2012-10-15 | 2012-10-15 | |
US61/714,212 | 2012-10-15 | ||
US201261726336P | 2012-11-14 | 2012-11-14 | |
US61/726,336 | 2012-11-14 | ||
US13/833,982 | 2013-03-15 | ||
US13/833,982 US9354295B2 (en) | 2012-04-13 | 2013-03-15 | Systems, methods, and apparatus for estimating direction of arrival |
PCT/US2013/032912 WO2013154790A1 (en) | 2012-04-13 | 2013-03-19 | Systems, methods, and apparatus for estimating direction of arrival |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104220896A CN104220896A (zh) | 2014-12-17 |
CN104220896B true CN104220896B (zh) | 2017-04-05 |
Family
ID=49324959
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380019683.9A Expired - Fee Related CN104220896B (zh) | 2012-04-13 | 2013-03-19 | 用于估计到达方向的系统、方法和设备 |
CN201380019519.8A Active CN104246531B (zh) | 2012-04-13 | 2013-04-10 | 用于显示用户接口的系统和方法 |
CN201380019298.4A Active CN104272137B (zh) | 2012-04-13 | 2013-04-10 | 用于映射源位置的系统和方法 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380019519.8A Active CN104246531B (zh) | 2012-04-13 | 2013-04-10 | 用于显示用户接口的系统和方法 |
CN201380019298.4A Active CN104272137B (zh) | 2012-04-13 | 2013-04-10 | 用于映射源位置的系统和方法 |
Country Status (6)
Country | Link |
---|---|
US (7) | US20130275873A1 (zh) |
EP (3) | EP2836851A1 (zh) |
JP (1) | JP6400566B2 (zh) |
CN (3) | CN104220896B (zh) |
IN (2) | IN2014MN02283A (zh) |
WO (6) | WO2013154790A1 (zh) |
Families Citing this family (232)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101909432B1 (ko) | 2010-12-03 | 2018-10-18 | 씨러스 로직 인코포레이티드 | 개인용 오디오 디바이스에서 적응형 잡음 제거기의 실수 제어 |
US8908877B2 (en) | 2010-12-03 | 2014-12-09 | Cirrus Logic, Inc. | Ear-coupling detection and adjustment of adaptive response in noise-canceling in personal audio devices |
JP5039870B2 (ja) * | 2011-01-18 | 2012-10-03 | パナソニック株式会社 | 車両方向特定装置、車両方向特定方法、及びそのプログラム |
US8948407B2 (en) | 2011-06-03 | 2015-02-03 | Cirrus Logic, Inc. | Bandlimiting anti-noise in personal audio devices having adaptive noise cancellation (ANC) |
US9824677B2 (en) | 2011-06-03 | 2017-11-21 | Cirrus Logic, Inc. | Bandlimiting anti-noise in personal audio devices having adaptive noise cancellation (ANC) |
US9076431B2 (en) | 2011-06-03 | 2015-07-07 | Cirrus Logic, Inc. | Filter architecture for an adaptive noise canceler in a personal audio device |
US8848936B2 (en) | 2011-06-03 | 2014-09-30 | Cirrus Logic, Inc. | Speaker damage prevention in adaptive noise-canceling personal audio devices |
US8958571B2 (en) * | 2011-06-03 | 2015-02-17 | Cirrus Logic, Inc. | MIC covering detection in personal audio devices |
US9318094B2 (en) | 2011-06-03 | 2016-04-19 | Cirrus Logic, Inc. | Adaptive noise canceling architecture for a personal audio device |
US9214150B2 (en) | 2011-06-03 | 2015-12-15 | Cirrus Logic, Inc. | Continuous adaptation of secondary path adaptive response in noise-canceling personal audio devices |
US9325821B1 (en) * | 2011-09-30 | 2016-04-26 | Cirrus Logic, Inc. | Sidetone management in an adaptive noise canceling (ANC) system including secondary path modeling |
US20130275873A1 (en) | 2012-04-13 | 2013-10-17 | Qualcomm Incorporated | Systems and methods for displaying a user interface |
US9142205B2 (en) | 2012-04-26 | 2015-09-22 | Cirrus Logic, Inc. | Leakage-modeling adaptive noise canceling for earspeakers |
US9014387B2 (en) | 2012-04-26 | 2015-04-21 | Cirrus Logic, Inc. | Coordinated control of adaptive noise cancellation (ANC) among earspeaker channels |
US9076427B2 (en) | 2012-05-10 | 2015-07-07 | Cirrus Logic, Inc. | Error-signal content controlled adaptation of secondary and leakage path models in noise-canceling personal audio devices |
US9082387B2 (en) | 2012-05-10 | 2015-07-14 | Cirrus Logic, Inc. | Noise burst adaptation of secondary path adaptive response in noise-canceling personal audio devices |
US9318090B2 (en) | 2012-05-10 | 2016-04-19 | Cirrus Logic, Inc. | Downlink tone detection and adaptation of a secondary path response model in an adaptive noise canceling system |
US9319781B2 (en) | 2012-05-10 | 2016-04-19 | Cirrus Logic, Inc. | Frequency and direction-dependent ambient sound handling in personal audio devices having adaptive noise cancellation (ANC) |
US9123321B2 (en) | 2012-05-10 | 2015-09-01 | Cirrus Logic, Inc. | Sequenced adaptation of anti-noise generator response and secondary path response in an adaptive noise canceling system |
US9746916B2 (en) | 2012-05-11 | 2017-08-29 | Qualcomm Incorporated | Audio user interaction recognition and application interface |
US20130304476A1 (en) | 2012-05-11 | 2013-11-14 | Qualcomm Incorporated | Audio User Interaction Recognition and Context Refinement |
US9497544B2 (en) | 2012-07-02 | 2016-11-15 | Qualcomm Incorporated | Systems and methods for surround sound echo reduction |
USD732555S1 (en) * | 2012-07-19 | 2015-06-23 | D2L Corporation | Display screen with graphical user interface |
USD733167S1 (en) * | 2012-07-20 | 2015-06-30 | D2L Corporation | Display screen with graphical user interface |
US8884150B2 (en) * | 2012-08-03 | 2014-11-11 | The Penn State Research Foundation | Microphone array transducer for acoustical musical instrument |
US9264524B2 (en) | 2012-08-03 | 2016-02-16 | The Penn State Research Foundation | Microphone array transducer for acoustic musical instrument |
KR20140029931A (ko) * | 2012-08-31 | 2014-03-11 | 삼성전자주식회사 | 스피커에서 출력되는 음성을 소멸시켜 에코 발생을 차단하는 전자 장치 및 방법 |
US9532139B1 (en) | 2012-09-14 | 2016-12-27 | Cirrus Logic, Inc. | Dual-microphone frequency amplitude response self-calibration |
KR101978688B1 (ko) * | 2012-10-22 | 2019-05-15 | 삼성전자주식회사 | 마이크로폰 장치를 갖는 전자 장치 및 그 운용 방법 |
US10606546B2 (en) * | 2012-12-05 | 2020-03-31 | Nokia Technologies Oy | Orientation based microphone selection apparatus |
TWI471788B (zh) * | 2012-12-14 | 2015-02-01 | Egalax Empia Technology Inc | 用於量測表面聲波觸控模塊的感應區尺寸的系統、處理裝置、與其量測方法 |
US9107010B2 (en) | 2013-02-08 | 2015-08-11 | Cirrus Logic, Inc. | Ambient noise root mean square (RMS) detector |
US9460732B2 (en) | 2013-02-13 | 2016-10-04 | Analog Devices, Inc. | Signal source separation |
US9535858B2 (en) * | 2013-03-07 | 2017-01-03 | Mediatek Inc. | Signal processing system and associated method |
US9369798B1 (en) | 2013-03-12 | 2016-06-14 | Cirrus Logic, Inc. | Internal dynamic range control in an adaptive noise cancellation (ANC) system |
US9106989B2 (en) | 2013-03-13 | 2015-08-11 | Cirrus Logic, Inc. | Adaptive-noise canceling (ANC) effectiveness estimation and correction in a personal audio device |
US9215749B2 (en) | 2013-03-14 | 2015-12-15 | Cirrus Logic, Inc. | Reducing an acoustic intensity vector with adaptive noise cancellation with two error microphones |
US9414150B2 (en) | 2013-03-14 | 2016-08-09 | Cirrus Logic, Inc. | Low-latency multi-driver adaptive noise canceling (ANC) system for a personal audio device |
US9324311B1 (en) | 2013-03-15 | 2016-04-26 | Cirrus Logic, Inc. | Robust adaptive noise canceling (ANC) in a personal audio device |
US9467776B2 (en) | 2013-03-15 | 2016-10-11 | Cirrus Logic, Inc. | Monitoring of speaker impedance to detect pressure applied between mobile device and ear |
US9635480B2 (en) | 2013-03-15 | 2017-04-25 | Cirrus Logic, Inc. | Speaker impedance monitoring |
US9208771B2 (en) | 2013-03-15 | 2015-12-08 | Cirrus Logic, Inc. | Ambient noise-based adaptation of secondary path adaptive response in noise-canceling personal audio devices |
CN103227863A (zh) * | 2013-04-05 | 2013-07-31 | 瑞声科技(南京)有限公司 | 自动切换通话方向系统、方法及应用该系统的移动终端 |
US10206032B2 (en) | 2013-04-10 | 2019-02-12 | Cirrus Logic, Inc. | Systems and methods for multi-mode adaptive noise cancellation for audio headsets |
US9066176B2 (en) | 2013-04-15 | 2015-06-23 | Cirrus Logic, Inc. | Systems and methods for adaptive noise cancellation including dynamic bias of coefficients of an adaptive noise cancellation system |
US9462376B2 (en) | 2013-04-16 | 2016-10-04 | Cirrus Logic, Inc. | Systems and methods for hybrid adaptive noise cancellation |
US9478210B2 (en) | 2013-04-17 | 2016-10-25 | Cirrus Logic, Inc. | Systems and methods for hybrid adaptive noise cancellation |
US9460701B2 (en) | 2013-04-17 | 2016-10-04 | Cirrus Logic, Inc. | Systems and methods for adaptive noise cancellation by biasing anti-noise level |
US9578432B1 (en) | 2013-04-24 | 2017-02-21 | Cirrus Logic, Inc. | Metric and tool to evaluate secondary path design in adaptive noise cancellation systems |
US9774953B2 (en) | 2013-04-29 | 2017-09-26 | University Of Surrey | Microphone array for acoustic source separation |
CN104142791A (zh) * | 2013-05-09 | 2014-11-12 | 腾讯科技(深圳)有限公司 | 资源更换方法、装置及终端 |
CN104412122A (zh) * | 2013-05-30 | 2015-03-11 | 英特尔Ip公司 | 确定移动装置位于室内位置还是室外位置的装置、系统和方法 |
US9264808B2 (en) | 2013-06-14 | 2016-02-16 | Cirrus Logic, Inc. | Systems and methods for detection and cancellation of narrow-band noise |
EP2819430A1 (en) * | 2013-06-27 | 2014-12-31 | Speech Processing Solutions GmbH | Handheld mobile recording device with microphone characteristic selection means |
DE112014003443B4 (de) * | 2013-07-26 | 2016-12-29 | Analog Devices, Inc. | Mikrophonkalibrierung |
US9392364B1 (en) | 2013-08-15 | 2016-07-12 | Cirrus Logic, Inc. | Virtual microphone for adaptive noise cancellation in personal audio devices |
KR20150024650A (ko) * | 2013-08-27 | 2015-03-09 | 삼성전자주식회사 | 전자 장치에서 사운드를 시각적으로 제공하기 위한 방법 및 장치 |
CN104427049A (zh) * | 2013-08-30 | 2015-03-18 | 深圳富泰宏精密工业有限公司 | 便携式电子装置 |
JP6030032B2 (ja) * | 2013-08-30 | 2016-11-24 | 本田技研工業株式会社 | 音響処理装置、音響処理方法、及び音響処理プログラム |
US9666176B2 (en) | 2013-09-13 | 2017-05-30 | Cirrus Logic, Inc. | Systems and methods for adaptive noise cancellation by adaptively shaping internal white noise to train a secondary path |
US10132626B2 (en) * | 2013-09-18 | 2018-11-20 | Infineon Technologies Ag | Adaptive distance estimation |
US9420368B2 (en) | 2013-09-24 | 2016-08-16 | Analog Devices, Inc. | Time-frequency directional processing of audio signals |
US9620101B1 (en) | 2013-10-08 | 2017-04-11 | Cirrus Logic, Inc. | Systems and methods for maintaining playback fidelity in an audio system with adaptive noise cancellation |
US9392353B2 (en) * | 2013-10-18 | 2016-07-12 | Plantronics, Inc. | Headset interview mode |
US9888317B2 (en) * | 2013-10-22 | 2018-02-06 | Nokia Technologies Oy | Audio capture with multiple microphones |
US10146299B2 (en) | 2013-11-08 | 2018-12-04 | Qualcomm Technologies, Inc. | Face tracking for additional modalities in spatial interaction |
US10382864B2 (en) | 2013-12-10 | 2019-08-13 | Cirrus Logic, Inc. | Systems and methods for providing adaptive playback equalization in an audio device |
US10219071B2 (en) | 2013-12-10 | 2019-02-26 | Cirrus Logic, Inc. | Systems and methods for bandlimiting anti-noise in personal audio devices having adaptive noise cancellation |
US9704472B2 (en) | 2013-12-10 | 2017-07-11 | Cirrus Logic, Inc. | Systems and methods for sharing secondary path information between audio channels in an adaptive noise cancellation system |
US20170004845A1 (en) * | 2014-02-04 | 2017-01-05 | Tp Vision Holding B.V. | Handheld device with microphone |
US9282399B2 (en) | 2014-02-26 | 2016-03-08 | Qualcomm Incorporated | Listen to people you recognize |
EP2916241A1 (en) * | 2014-03-03 | 2015-09-09 | Nokia Technologies OY | Causation of rendering of song audio information |
US9369557B2 (en) | 2014-03-05 | 2016-06-14 | Cirrus Logic, Inc. | Frequency-dependent sidetone calibration |
US9479860B2 (en) | 2014-03-07 | 2016-10-25 | Cirrus Logic, Inc. | Systems and methods for enhancing performance of audio transducer based on detection of transducer status |
US9648410B1 (en) | 2014-03-12 | 2017-05-09 | Cirrus Logic, Inc. | Control of audio output of headphone earbuds based on the environment around the headphone earbuds |
CN103957440B (zh) * | 2014-04-01 | 2017-09-29 | 京东方科技集团股份有限公司 | 一种信号处理设备及其方法、显示系统 |
US9319784B2 (en) | 2014-04-14 | 2016-04-19 | Cirrus Logic, Inc. | Frequency-shaped noise-based adaptation of secondary path adaptive response in noise-canceling personal audio devices |
US10540979B2 (en) | 2014-04-17 | 2020-01-21 | Qualcomm Incorporated | User interface for secure access to a device using speaker verification |
US9609416B2 (en) | 2014-06-09 | 2017-03-28 | Cirrus Logic, Inc. | Headphone responsive to optical signaling |
US10181315B2 (en) | 2014-06-13 | 2019-01-15 | Cirrus Logic, Inc. | Systems and methods for selectively enabling and disabling adaptation of an adaptive noise cancellation system |
US20150363157A1 (en) * | 2014-06-17 | 2015-12-17 | Htc Corporation | Electrical device and associated operating method for displaying user interface related to a sound track |
US10051364B2 (en) | 2014-07-03 | 2018-08-14 | Qualcomm Incorporated | Single channel or multi-channel audio control interface |
US10282057B1 (en) * | 2014-07-29 | 2019-05-07 | Google Llc | Image editing on a wearable device |
JP6460676B2 (ja) * | 2014-08-05 | 2019-01-30 | キヤノン株式会社 | 信号処理装置および信号処理方法 |
CN105451151B (zh) | 2014-08-29 | 2018-09-21 | 华为技术有限公司 | 一种处理声音信号的方法及装置 |
KR102262853B1 (ko) | 2014-09-01 | 2021-06-10 | 삼성전자주식회사 | 복수의 마이크를 포함하는 전자 장치 및 이의 운용 방법 |
US9478212B1 (en) | 2014-09-03 | 2016-10-25 | Cirrus Logic, Inc. | Systems and methods for use of adaptive secondary path estimate to control equalization in an audio device |
US20160084937A1 (en) * | 2014-09-22 | 2016-03-24 | Invensense Inc. | Systems and methods for determining position information using acoustic sensing |
US10009676B2 (en) * | 2014-11-03 | 2018-06-26 | Storz Endoskop Produktions Gmbh | Voice control system with multiple microphone arrays |
US10575117B2 (en) * | 2014-12-08 | 2020-02-25 | Harman International Industries, Incorporated | Directional sound modification |
US9622013B2 (en) * | 2014-12-08 | 2017-04-11 | Harman International Industries, Inc. | Directional sound modification |
US9549254B2 (en) | 2014-12-09 | 2017-01-17 | Intel Corporation | Method and system of acoustic signal mixing |
EP3222053B1 (en) * | 2014-12-18 | 2019-11-27 | Huawei Technologies Co. Ltd. | Surround sound recording for mobile devices |
US9552805B2 (en) | 2014-12-19 | 2017-01-24 | Cirrus Logic, Inc. | Systems and methods for performance and stability control for feedback adaptive noise cancellation |
US9712936B2 (en) * | 2015-02-03 | 2017-07-18 | Qualcomm Incorporated | Coding higher-order ambisonic audio data with motion stabilization |
JP6188105B2 (ja) * | 2015-02-03 | 2017-08-30 | エスゼット ディージェイアイ テクノロジー カンパニー リミテッドSz Dji Technology Co.,Ltd | 信号源の位置及び速度を決定するシステム、方法、コンピュータプログラム、回避する方法、及び無人航空機 |
US9650039B2 (en) * | 2015-03-20 | 2017-05-16 | Ford Global Technologies, Llc | Vehicle location accuracy |
US9734845B1 (en) * | 2015-06-26 | 2017-08-15 | Amazon Technologies, Inc. | Mitigating effects of electronic audio sources in expression detection |
GB2540225A (en) * | 2015-07-08 | 2017-01-11 | Nokia Technologies Oy | Distributed audio capture and mixing control |
US10026388B2 (en) | 2015-08-20 | 2018-07-17 | Cirrus Logic, Inc. | Feedback adaptive noise cancellation (ANC) controller and method having a feedback response partially provided by a fixed-response filter |
US9578415B1 (en) | 2015-08-21 | 2017-02-21 | Cirrus Logic, Inc. | Hybrid adaptive noise cancellation system with filtered error microphone signal |
US10244317B2 (en) | 2015-09-22 | 2019-03-26 | Samsung Electronics Co., Ltd. | Beamforming array utilizing ring radiator loudspeakers and digital signal processing (DSP) optimization of a beamforming array |
US9995647B2 (en) * | 2015-09-30 | 2018-06-12 | General Monitors, Inc. | Ultrasonic gas leak location system and method |
CN105223551B (zh) * | 2015-10-12 | 2017-09-01 | 吉林大学 | 一种可穿戴的声源定位跟踪系统及方法 |
US9595248B1 (en) * | 2015-11-11 | 2017-03-14 | Doug Classe | Remotely operable bypass loop device and system |
CN108337926A (zh) * | 2015-11-25 | 2018-07-27 | 索尼公司 | 声音收集装置 |
WO2017106862A1 (en) * | 2015-12-18 | 2017-06-22 | Ppip Llc | Enpoint security appliance/sensor platform |
US10379534B2 (en) | 2016-01-28 | 2019-08-13 | Qualcomm Incorporated | Drone flight control |
US11234072B2 (en) | 2016-02-18 | 2022-01-25 | Dolby Laboratories Licensing Corporation | Processing of microphone signals for spatial playback |
US10667723B2 (en) * | 2016-02-19 | 2020-06-02 | Covidien Lp | Systems and methods for video-based monitoring of vital signs |
US10013966B2 (en) | 2016-03-15 | 2018-07-03 | Cirrus Logic, Inc. | Systems and methods for adaptive active noise cancellation for multiple-driver personal audio device |
JP1572569S (zh) * | 2016-04-19 | 2020-03-09 | ||
JP1622397S (ja) * | 2016-04-19 | 2019-01-21 | 生体情報モニター機能付き電子計算機 | |
CN105788607B (zh) * | 2016-05-20 | 2020-01-03 | 中国科学技术大学 | 应用于双麦克风阵列的语音增强方法 |
USD813884S1 (en) * | 2016-06-01 | 2018-03-27 | Innovation 360 Group AB | Display screen with graphical user interface |
US11032660B2 (en) * | 2016-06-07 | 2021-06-08 | Philip Schaefer | System and method for realistic rotation of stereo or binaural audio |
US11589181B1 (en) * | 2016-06-07 | 2023-02-21 | Philip Raymond Schaefer | System and method for realistic rotation of stereo or binaural audio |
EP3267697A1 (en) * | 2016-07-06 | 2018-01-10 | Oticon A/s | Direction of arrival estimation in miniature devices using a sound sensor array |
US10621992B2 (en) * | 2016-07-22 | 2020-04-14 | Lenovo (Singapore) Pte. Ltd. | Activating voice assistant based on at least one of user proximity and context |
DK3285500T3 (da) * | 2016-08-05 | 2021-04-26 | Oticon As | Binauralt høresystem, der er konfigureret til at lokalisere en lydkilde |
CN106896356B (zh) | 2016-08-17 | 2019-11-19 | 阿里巴巴集团控股有限公司 | 确定距离变化的方法、位置提示方法及其装置和系统 |
JP6888627B2 (ja) * | 2016-08-23 | 2021-06-16 | ソニーグループ株式会社 | 情報処理装置、情報処理方法及びプログラム |
EP3297236A1 (en) * | 2016-09-15 | 2018-03-21 | Mitsubishi Electric R & D Centre Europe B.V. | Efficient sparse channel estimation based on compressed sensing |
US10444887B2 (en) | 2016-09-20 | 2019-10-15 | Cypress Semiconductor Corporation | Force sensing |
EP3516412B1 (en) * | 2016-09-22 | 2020-08-19 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. | Apparatus for estimating a direction of arrival and corresponding method |
US10709422B2 (en) * | 2016-10-27 | 2020-07-14 | Clarius Mobile Health Corp. | Systems and methods for controlling visualization of ultrasound image data |
WO2018088450A1 (ja) * | 2016-11-08 | 2018-05-17 | ヤマハ株式会社 | 音声提供装置、音声再生装置、音声提供方法及び音声再生方法 |
GB2556093A (en) * | 2016-11-18 | 2018-05-23 | Nokia Technologies Oy | Analysis of spatial metadata from multi-microphones having asymmetric geometry in devices |
WO2018095545A1 (en) * | 2016-11-28 | 2018-05-31 | Huawei Technologies Duesseldorf Gmbh | Apparatus and method for unwrapping phase differences |
US11041952B2 (en) * | 2016-12-27 | 2021-06-22 | Texas Instruments Incorporated | Phase-based ultrasonic ranging |
US10771898B2 (en) | 2017-01-09 | 2020-09-08 | Apple Inc. | Locating wireless devices |
KR101893768B1 (ko) * | 2017-02-27 | 2018-09-04 | 주식회사 브이터치 | 음성 인식 트리거를 제공하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체 |
JP6819368B2 (ja) * | 2017-03-07 | 2021-01-27 | 株式会社リコー | 装置、システム、方法およびプログラム |
US11133011B2 (en) * | 2017-03-13 | 2021-09-28 | Mitsubishi Electric Research Laboratories, Inc. | System and method for multichannel end-to-end speech recognition |
US10481236B2 (en) * | 2017-03-15 | 2019-11-19 | Cypress Semiconductor Corporation | Systems and methods for estimating angle of arrival in a wireless device |
US11994604B2 (en) * | 2017-03-15 | 2024-05-28 | Cypress Semiconductor Corporation | System and methods for improving secure phase-based positioning accuracy |
JP6932981B2 (ja) * | 2017-04-27 | 2021-09-08 | セイコーエプソン株式会社 | 表示装置および表示装置の制御方法 |
CN107101623B (zh) * | 2017-05-18 | 2018-07-27 | 金钱猫科技股份有限公司 | 测量方法、系统及装置 |
US10664533B2 (en) | 2017-05-24 | 2020-05-26 | Lenovo (Singapore) Pte. Ltd. | Systems and methods to determine response cue for digital assistant based on context |
US10334360B2 (en) * | 2017-06-12 | 2019-06-25 | Revolabs, Inc | Method for accurately calculating the direction of arrival of sound at a microphone array |
GB2563670A (en) | 2017-06-23 | 2018-12-26 | Nokia Technologies Oy | Sound source distance estimation |
GB201710085D0 (en) | 2017-06-23 | 2017-08-09 | Nokia Technologies Oy | Determination of targeted spatial audio parameters and associated spatial audio playback |
GB201710093D0 (en) * | 2017-06-23 | 2017-08-09 | Nokia Technologies Oy | Audio distance estimation for spatial audio processing |
WO2019002831A1 (en) | 2017-06-27 | 2019-01-03 | Cirrus Logic International Semiconductor Limited | REPRODUCTIVE ATTACK DETECTION |
GB201713697D0 (en) | 2017-06-28 | 2017-10-11 | Cirrus Logic Int Semiconductor Ltd | Magnetic detection of replay attack |
GB2563953A (en) | 2017-06-28 | 2019-01-02 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
US10264186B2 (en) * | 2017-06-30 | 2019-04-16 | Microsoft Technology Licensing, Llc | Dynamic control of camera resources in a device with multiple displays |
GB201801527D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Method, apparatus and systems for biometric processes |
GB201801532D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Methods, apparatus and systems for audio playback |
GB201801526D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Methods, apparatus and systems for authentication |
GB201801530D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Methods, apparatus and systems for authentication |
GB201801528D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Method, apparatus and systems for biometric processes |
CN107479029A (zh) * | 2017-08-10 | 2017-12-15 | 中国计量大学 | 伞式水下声源检测装置及其校准与检测方法 |
US11176957B2 (en) * | 2017-08-17 | 2021-11-16 | Cerence Operating Company | Low complexity detection of voiced speech and pitch estimation |
DE112017007800T5 (de) * | 2017-09-07 | 2020-06-25 | Mitsubishi Electric Corporation | Störgeräuscheliminierungseinrichtung und Störgeräuscheliminierungsverfahren |
US10609479B2 (en) * | 2017-09-14 | 2020-03-31 | Fujitsu Limited | Device and method for determining a sound source direction |
WO2019064181A1 (en) * | 2017-09-26 | 2019-04-04 | Cochlear Limited | ACOUSTIC POINT IDENTIFICATION |
GB201801661D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic International Uk Ltd | Detection of liveness |
GB2567503A (en) | 2017-10-13 | 2019-04-17 | Cirrus Logic Int Semiconductor Ltd | Analysing speech signals |
GB201801663D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Detection of liveness |
GB201804843D0 (en) | 2017-11-14 | 2018-05-09 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
GB201803570D0 (en) | 2017-10-13 | 2018-04-18 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
GB201801664D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Detection of liveness |
GB201801874D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Improving robustness of speech processing system against ultrasound and dolphin attacks |
WO2019094893A1 (en) | 2017-11-13 | 2019-05-16 | Covidien Lp | Systems and methods for video-based monitoring of a patient |
GB201801659D0 (en) | 2017-11-14 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Detection of loudspeaker playback |
CA3086527A1 (en) | 2018-01-08 | 2019-07-11 | Covidien Lp | Systems and methods for video-based non-contact tidal volume monitoring |
US11735189B2 (en) | 2018-01-23 | 2023-08-22 | Cirrus Logic, Inc. | Speaker identification |
US11475899B2 (en) | 2018-01-23 | 2022-10-18 | Cirrus Logic, Inc. | Speaker identification |
US11264037B2 (en) | 2018-01-23 | 2022-03-01 | Cirrus Logic, Inc. | Speaker identification |
CN108257605B (zh) * | 2018-02-01 | 2021-05-04 | Oppo广东移动通信有限公司 | 多通道录音方法、装置及电子设备 |
EP3534596B1 (en) * | 2018-03-02 | 2022-10-26 | Nokia Technologies Oy | An apparatus and associated methods for telecommunications |
US10674305B2 (en) * | 2018-03-15 | 2020-06-02 | Microsoft Technology Licensing, Llc | Remote multi-dimensional audio |
CN108519576B (zh) * | 2018-03-21 | 2021-07-20 | 华南理工大学 | 基于夹角可调非均匀线阵的水下波达方向估计方法与装置 |
GB2572368A (en) * | 2018-03-27 | 2019-10-02 | Nokia Technologies Oy | Spatial audio capture |
US11200893B2 (en) * | 2018-05-07 | 2021-12-14 | Google Llc | Multi-modal interaction between users, automated assistants, and other computing services |
KR102669152B1 (ko) | 2018-05-07 | 2024-05-27 | 구글 엘엘씨 | 사용자, 자동화된 어시스턴트 및 컴퓨팅 서비스 간의 다중 모드 상호 작용 |
US11347801B2 (en) | 2018-05-07 | 2022-05-31 | Google Llc | Multi-modal interaction between users, automated assistants, and other computing services |
US10529356B2 (en) | 2018-05-15 | 2020-01-07 | Cirrus Logic, Inc. | Detecting unwanted audio signal components by comparing signals processed with differing linearity |
US10871543B2 (en) | 2018-06-12 | 2020-12-22 | Kaam Llc | Direction of arrival estimation of acoustic-signals from acoustic source using sub-array selection |
EP3582511A3 (en) * | 2018-06-12 | 2020-03-18 | Harman International Industries, Incorporated | Directional sound modification |
US11547313B2 (en) | 2018-06-15 | 2023-01-10 | Covidien Lp | Systems and methods for video-based patient monitoring during surgery |
US10692490B2 (en) | 2018-07-31 | 2020-06-23 | Cirrus Logic, Inc. | Detection of replay attack |
EP3833241A1 (en) | 2018-08-09 | 2021-06-16 | Covidien LP | Video-based patient monitoring systems and associated methods for detecting and monitoring breathing |
US10915614B2 (en) | 2018-08-31 | 2021-02-09 | Cirrus Logic, Inc. | Biometric authentication |
US11037574B2 (en) | 2018-09-05 | 2021-06-15 | Cirrus Logic, Inc. | Speaker recognition and speaker change detection |
US11012774B2 (en) * | 2018-10-29 | 2021-05-18 | Apple Inc. | Spatially biased sound pickup for binaural video recording |
US11394437B2 (en) * | 2018-12-14 | 2022-07-19 | Qualcomm Incorporated | Beamforming codebook adaptation for flexible wireless devices |
US11617520B2 (en) | 2018-12-14 | 2023-04-04 | Covidien Lp | Depth sensing visualization modes for non-contact monitoring |
CN109709509B (zh) * | 2018-12-24 | 2022-01-11 | 成都爱科特科技发展有限公司 | 一种信号方位趋势的判断方法 |
US10595129B1 (en) * | 2018-12-26 | 2020-03-17 | Motorola Solutions, Inc. | Methods and apparatus for configuring multiple microphones in an electronic communication device |
USD916890S1 (en) * | 2018-12-31 | 2021-04-20 | Andritz Inc. | Display panel portion with a computer icon |
KR102232045B1 (ko) | 2019-01-08 | 2021-03-25 | 삼성전자주식회사 | 전자 장치, 전자 장치의 제어 방법 및 컴퓨터 판독 가능 매체. |
US11315275B2 (en) | 2019-01-28 | 2022-04-26 | Covidien Lp | Edge handling methods for associated depth sensing camera devices, systems, and methods |
KR20200097101A (ko) * | 2019-02-07 | 2020-08-18 | 현대모비스 주식회사 | 차량용 레이더 장치 및 그 제어 방법 |
CN110082712B (zh) * | 2019-03-14 | 2022-12-13 | 哈尔滨工程大学 | 一种声矢量圆阵相干目标方位估计方法 |
EP3957089A1 (en) * | 2019-04-17 | 2022-02-23 | Apple Inc. | Sharing keys for a wireless accessory |
US11023114B2 (en) * | 2019-04-29 | 2021-06-01 | Rohde & Schwarz Gmbh & Co. Kg | Measurement apparatus and measurement method |
CN110471026B (zh) * | 2019-07-22 | 2021-08-24 | 西安电子科技大学 | 一种相位增强的米波雷达目标低仰角doa估计方法 |
KR20210032826A (ko) * | 2019-09-17 | 2021-03-25 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 정보 제공 방법 |
US20210092543A1 (en) * | 2019-09-19 | 2021-03-25 | Qualcomm Incorporated | 3d sound orientation adaptability |
US20220412835A1 (en) * | 2019-10-01 | 2022-12-29 | Prosaris Solutions | Ultrasonic detector |
TW202123220A (zh) | 2019-10-30 | 2021-06-16 | 美商杜拜研究特許公司 | 使用方向性元資料之多通道音頻編碼及解碼 |
CN110954866B (zh) * | 2019-11-22 | 2022-04-22 | 达闼机器人有限公司 | 声源定位方法、电子设备及存储介质 |
KR20210068953A (ko) * | 2019-12-02 | 2021-06-10 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
US10951981B1 (en) * | 2019-12-17 | 2021-03-16 | Northwestern Polyteclmical University | Linear differential microphone arrays based on geometric optimization |
US11468904B2 (en) * | 2019-12-18 | 2022-10-11 | Audio Analytic Ltd | Computer apparatus and method implementing sound detection with an image capture system |
USD921655S1 (en) * | 2020-01-13 | 2021-06-08 | Stryker European Operations Limited | Display screen with animated graphical user interface |
CN113223544B (zh) * | 2020-01-21 | 2024-04-02 | 珠海市煊扬科技有限公司 | 音频的方向定位侦测装置及方法以及音频处理系统 |
IL272380B2 (en) * | 2020-01-30 | 2023-08-01 | Kramer Electronics Ltd | Configurable microphone assembly |
US11484208B2 (en) | 2020-01-31 | 2022-11-01 | Covidien Lp | Attached sensor activation of additionally-streamed physiological parameters from non-contact monitoring systems and associated devices, systems, and methods |
CN113284504A (zh) * | 2020-02-20 | 2021-08-20 | 北京三星通信技术研究有限公司 | 姿态检测方法、装置、电子设备及计算机可读存储介质 |
US11460531B2 (en) | 2020-02-27 | 2022-10-04 | The Boeing Company | Systems and methods for enhanced direction of arrival detection and calculation |
CN111398900B (zh) * | 2020-03-09 | 2022-07-26 | 华南理工大学 | 基于事件驱动的传声器网络分布式滤波方法及系统 |
CN111417054B (zh) * | 2020-03-13 | 2021-07-20 | 北京声智科技有限公司 | 多音频数据通道阵列生成方法、装置、电子设备和存储介质 |
US11276388B2 (en) * | 2020-03-31 | 2022-03-15 | Nuvoton Technology Corporation | Beamforming system based on delay distribution model using high frequency phase difference |
US11335361B2 (en) | 2020-04-24 | 2022-05-17 | Universal Electronics Inc. | Method and apparatus for providing noise suppression to an intelligent personal assistant |
US11796562B2 (en) * | 2020-05-29 | 2023-10-24 | Aivs Inc. | Acoustic intensity sensor using a MEMS triaxial accelerometer and MEMS microphones |
CN112269826B (zh) * | 2020-08-25 | 2022-11-08 | 帝杰曼科技股份有限公司 | 一种基于大数据的可视化加工处理系统及方法 |
US11889302B2 (en) | 2020-08-28 | 2024-01-30 | Apple Inc. | Maintenance of wireless devices |
US20220084525A1 (en) * | 2020-09-17 | 2022-03-17 | Zhejiang Tonghuashun Intelligent Technology Co., Ltd. | Systems and methods for voice audio data processing |
US11624803B2 (en) * | 2020-10-21 | 2023-04-11 | GM Global Technology Operations LLC | System for detecting direction of a vehicle honk and determining location of honking vehicle |
US11694692B2 (en) | 2020-11-11 | 2023-07-04 | Bank Of America Corporation | Systems and methods for audio enhancement and conversion |
US20220159374A1 (en) * | 2020-11-18 | 2022-05-19 | Shure Acquisition Holdings, Inc. | Audio Devices Having Multiple States |
TWI755941B (zh) * | 2020-11-20 | 2022-02-21 | 英業達股份有限公司 | 階層式時間序列預測方法 |
CN112788482B (zh) * | 2021-03-01 | 2021-07-30 | 北京电信易通信息技术股份有限公司 | 一种麦克风阵列定位与云台联动的方法、装置 |
NO346569B1 (en) | 2021-03-08 | 2022-10-17 | Elliptic Laboratories As | Proximity detection for computers or screens |
CN113365190B (zh) * | 2021-06-08 | 2022-07-08 | 湖南普奇水环境研究院有限公司 | 一种测漏设备的抗干扰检测方法、电路及电子设备 |
EP4152321A1 (en) * | 2021-09-16 | 2023-03-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for narrowband direction-of-arrival estimation |
US11689841B2 (en) | 2021-09-29 | 2023-06-27 | Microsoft Technology Licensing, Llc | Earbud orientation-based beamforming |
GB202204269D0 (en) * | 2022-03-25 | 2022-05-11 | Nokia Technologies Oy | An apparatus for mapping sound source direction |
CN116700659B (zh) * | 2022-09-02 | 2024-03-08 | 荣耀终端有限公司 | 一种界面交互方法及电子设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101122636A (zh) * | 2006-08-09 | 2008-02-13 | 富士通株式会社 | 声音到达方向的估测方法以及声音到达方向的估测设备 |
CN101592728A (zh) * | 2009-06-24 | 2009-12-02 | 南京大学 | 基于空气中声传感器阵列的水下低频声源定位方法 |
Family Cites Families (92)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4982375A (en) | 1989-11-13 | 1991-01-01 | The United States Of America As Represented By The Secretary Of The Navy | Acoustic intensity probe |
JP3088174B2 (ja) | 1992-02-06 | 2000-09-18 | 古野電気株式会社 | 水中探知装置 |
JPH05333988A (ja) | 1992-05-30 | 1993-12-17 | Ricoh Co Ltd | 画像形成装置 |
JP3622094B2 (ja) | 1995-10-05 | 2005-02-23 | 株式会社日立製作所 | 地図更新支援装置および地図情報の編集方法 |
US5774562A (en) * | 1996-03-25 | 1998-06-30 | Nippon Telegraph And Telephone Corp. | Method and apparatus for dereverberation |
JP4163294B2 (ja) | 1998-07-31 | 2008-10-08 | 株式会社東芝 | 雑音抑圧処理装置および雑音抑圧処理方法 |
US6549219B2 (en) | 1999-04-09 | 2003-04-15 | International Business Machines Corporation | Pie menu graphical user interface |
US6850496B1 (en) | 2000-06-09 | 2005-02-01 | Cisco Technology, Inc. | Virtual conference room for voice conferencing |
JP4815661B2 (ja) | 2000-08-24 | 2011-11-16 | ソニー株式会社 | 信号処理装置及び信号処理方法 |
CA2393094C (en) | 2000-10-02 | 2009-04-07 | Chubu Electric Power Co., Inc. | Sound source locating system |
DE10133126A1 (de) | 2001-07-07 | 2003-01-16 | Philips Corp Intellectual Pty | Richtungssensitives Audioaufnahmesystem mit Anzeige von Aufnahmegebiet und/oder Störquelle |
DE10320268B4 (de) | 2002-05-31 | 2012-08-16 | Heidelberger Druckmaschinen Ag | Vorrichtung und Verfahren zum Auffinden und Darstellen von Informationen |
US7613310B2 (en) * | 2003-08-27 | 2009-11-03 | Sony Computer Entertainment Inc. | Audio input system |
US7898529B2 (en) | 2003-01-08 | 2011-03-01 | Autodesk, Inc. | User interface having a placement and layout suitable for pen-based computers |
US8849185B2 (en) | 2003-04-15 | 2014-09-30 | Ipventure, Inc. | Hybrid audio delivery system and method therefor |
US7668285B2 (en) | 2004-02-16 | 2010-02-23 | Kabushiki Kaisha Toshiba | X-ray computed tomographic apparatus and image processing apparatus |
US7774707B2 (en) | 2004-12-01 | 2010-08-10 | Creative Technology Ltd | Method and apparatus for enabling a user to amend an audio file |
US7983720B2 (en) | 2004-12-22 | 2011-07-19 | Broadcom Corporation | Wireless telephone with adaptive microphone array |
US8509703B2 (en) | 2004-12-22 | 2013-08-13 | Broadcom Corporation | Wireless telephone with multiple microphones and multiple description transmission |
JP4539385B2 (ja) | 2005-03-16 | 2010-09-08 | カシオ計算機株式会社 | 撮像装置、撮像制御プログラム |
US20070016875A1 (en) * | 2005-07-12 | 2007-01-18 | International Business Machines Corporation | Method and system for partial sizing adjacency constraint in a multi-pane window frame |
US7788607B2 (en) | 2005-12-01 | 2010-08-31 | Navisense | Method and system for mapping virtual coordinates |
US20100226210A1 (en) | 2005-12-13 | 2010-09-09 | Kordis Thomas F | Vigilante acoustic detection, location and response system |
WO2007102805A1 (en) | 2006-03-06 | 2007-09-13 | Razer Usa Ltd | Enhanced 3d sound |
KR100790177B1 (ko) | 2006-04-28 | 2008-01-02 | 삼성전자주식회사 | 휴대단말기에서 이미지 디스플레이 방법 및 장치 |
US9646415B2 (en) | 2006-05-16 | 2017-05-09 | Underground Imaging Technologies, Inc. | System and method for visualizing multiple-sensor subsurface imaging data |
KR100776801B1 (ko) * | 2006-07-19 | 2007-11-19 | 한국전자통신연구원 | 화상 처리 시스템에서의 제스처 인식 장치 및 방법 |
US8310656B2 (en) | 2006-09-28 | 2012-11-13 | Sony Computer Entertainment America Llc | Mapping movements of a hand-held controller to the two-dimensional image plane of a display screen |
US20080101624A1 (en) | 2006-10-24 | 2008-05-01 | Motorola, Inc. | Speaker directionality for user interface enhancement |
JP4823030B2 (ja) | 2006-11-27 | 2011-11-24 | 株式会社ソニー・コンピュータエンタテインメント | 音声処理装置および音声処理方法 |
US20090017910A1 (en) | 2007-06-22 | 2009-01-15 | Broadcom Corporation | Position and motion tracking of an object |
US7626889B2 (en) | 2007-04-06 | 2009-12-01 | Microsoft Corporation | Sensor array post-filter for tracking spatial distributions of signals and noise |
US20080259731A1 (en) | 2007-04-17 | 2008-10-23 | Happonen Aki P | Methods and apparatuses for user controlled beamforming |
WO2008139018A1 (en) | 2007-05-09 | 2008-11-20 | Savox Communications Oy Ab (Ltd) | A display apparatus |
US8005237B2 (en) | 2007-05-17 | 2011-08-23 | Microsoft Corp. | Sensor array beamformer post-processor |
WO2008144784A1 (en) | 2007-06-01 | 2008-12-04 | Technische Universität Graz | Joint position-pitch estimation of acoustic sources for their tracking and separation |
US8144939B2 (en) | 2007-11-08 | 2012-03-27 | Sony Ericsson Mobile Communications Ab | Automatic identifying |
JP4500845B2 (ja) | 2007-11-13 | 2010-07-14 | シャープ株式会社 | 情報表示装置、情報表示方法、プログラム及び記録媒体 |
WO2009076156A2 (en) | 2007-12-07 | 2009-06-18 | Christian Steele | System and method for determination of position |
JP2009246827A (ja) | 2008-03-31 | 2009-10-22 | Nippon Hoso Kyokai <Nhk> | 音源及び仮想音源の位置特定装置、方法及びプログラム |
US8971565B2 (en) | 2008-05-29 | 2015-03-03 | Hie-D Technologies, Llc | Human interface electronic device |
JP5195652B2 (ja) | 2008-06-11 | 2013-05-08 | ソニー株式会社 | 信号処理装置、および信号処理方法、並びにプログラム |
GB2461315B (en) | 2008-06-27 | 2011-09-14 | Wolfson Microelectronics Plc | Noise cancellation system |
ATE556329T1 (de) * | 2008-08-26 | 2012-05-15 | Nuance Communications Inc | Verfahren und vorrichtung zum lokalisieren einer schallquelle |
CN101350931B (zh) | 2008-08-27 | 2011-09-14 | 华为终端有限公司 | 音频信号的生成、播放方法及装置、处理系统 |
US20100095234A1 (en) | 2008-10-07 | 2010-04-15 | Research In Motion Limited | Multi-touch motion simulation using a non-touch screen computer input device |
US8724829B2 (en) * | 2008-10-24 | 2014-05-13 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for coherence detection |
US20100123785A1 (en) | 2008-11-17 | 2010-05-20 | Apple Inc. | Graphic Control for Directional Audio Input |
KR101313218B1 (ko) | 2008-12-08 | 2013-09-30 | 삼성메디슨 주식회사 | 휴대형 초음파 시스템 |
US7880668B1 (en) | 2008-12-08 | 2011-02-01 | Lockheed Martin Corproation | Automated radar elevation angle configuration |
US8369184B2 (en) * | 2009-01-26 | 2013-02-05 | Shotspotter, Inc. | Systems and methods with improved three-dimensional source location processing including constraint of location solutions to a two-dimensional plane |
US8548176B2 (en) | 2009-02-03 | 2013-10-01 | Nokia Corporation | Apparatus including microphone arrangements |
US8620672B2 (en) | 2009-06-09 | 2013-12-31 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for phase-based processing of multichannel signal |
US8171401B2 (en) | 2009-06-19 | 2012-05-01 | Microsoft Corporation | Resizing an editable area in a web page |
FR2948484B1 (fr) | 2009-07-23 | 2011-07-29 | Parrot | Procede de filtrage des bruits lateraux non-stationnaires pour un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile |
US8121618B2 (en) | 2009-10-28 | 2012-02-21 | Digimarc Corporation | Intuitive computing methods and systems |
US9058314B2 (en) | 2009-11-04 | 2015-06-16 | International Business Machines Corporation | Dynamic editing of data representations using cascading weights |
CN102668601A (zh) | 2009-12-23 | 2012-09-12 | 诺基亚公司 | 一种装置 |
US8385559B2 (en) | 2009-12-30 | 2013-02-26 | Robert Bosch Gmbh | Adaptive digital noise canceller |
EP2362381B1 (en) | 2010-02-25 | 2019-12-18 | Harman Becker Automotive Systems GmbH | Active noise reduction system |
US8988970B2 (en) | 2010-03-12 | 2015-03-24 | University Of Maryland | Method and system for dereverberation of signals propagating in reverberative environments |
JP2011191383A (ja) | 2010-03-12 | 2011-09-29 | Panasonic Corp | 騒音低減装置 |
EP2369443B1 (en) | 2010-03-25 | 2017-01-11 | BlackBerry Limited | System and method for gesture detection and feedback |
US9165567B2 (en) | 2010-04-22 | 2015-10-20 | Qualcomm Incorporated | Systems, methods, and apparatus for speech feature detection |
US20110271186A1 (en) | 2010-04-30 | 2011-11-03 | John Colin Owens | Visual audio mixing system and method thereof |
US9053697B2 (en) | 2010-06-01 | 2015-06-09 | Qualcomm Incorporated | Systems, methods, devices, apparatus, and computer program products for audio equalization |
US8515089B2 (en) * | 2010-06-04 | 2013-08-20 | Apple Inc. | Active noise cancellation decisions in a portable audio device |
EP2395501B1 (en) * | 2010-06-14 | 2015-08-12 | Harman Becker Automotive Systems GmbH | Adaptive noise control |
US8583428B2 (en) * | 2010-06-15 | 2013-11-12 | Microsoft Corporation | Sound source separation using spatial filtering and regularization phases |
US20110317848A1 (en) | 2010-06-23 | 2011-12-29 | Motorola, Inc. | Microphone Interference Detection Method and Apparatus |
FR2962235A1 (fr) | 2010-06-30 | 2012-01-06 | France Telecom | Dispositif et procede d'affichage d'informations dans un champ de vision |
US9025782B2 (en) | 2010-07-26 | 2015-05-05 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for multi-microphone location-selective processing |
US8174934B2 (en) * | 2010-07-28 | 2012-05-08 | Empire Technology Development Llc | Sound direction detection |
US8812014B2 (en) | 2010-08-30 | 2014-08-19 | Qualcomm Incorporated | Audio-based environment awareness |
EP2614426A2 (en) | 2010-09-08 | 2013-07-17 | Telefonaktiebolaget L M Ericsson (publ) | Gesture-based control of iptv system |
CA2849718A1 (en) | 2010-09-21 | 2012-03-29 | Cellepathy Ltd. | System and method for sensor-based determination of user role, location, and/or state of one of more in-vehicle mobile devices and enforcement of usage thereof |
US8861756B2 (en) | 2010-09-24 | 2014-10-14 | LI Creative Technologies, Inc. | Microphone array system |
US9100734B2 (en) | 2010-10-22 | 2015-08-04 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for far-field multi-source tracking and separation |
US8898058B2 (en) | 2010-10-25 | 2014-11-25 | Qualcomm Incorporated | Systems, methods, and apparatus for voice activity detection |
US20120117470A1 (en) | 2010-11-10 | 2012-05-10 | Microsoft Corporation | Learning Tool for a Ribbon-Shaped User Interface |
US10726861B2 (en) | 2010-11-15 | 2020-07-28 | Microsoft Technology Licensing, Llc | Semi-private communication in open environments |
US8908877B2 (en) * | 2010-12-03 | 2014-12-09 | Cirrus Logic, Inc. | Ear-coupling detection and adjustment of adaptive response in noise-canceling in personal audio devices |
US8660978B2 (en) | 2010-12-17 | 2014-02-25 | Microsoft Corporation | Detecting and responding to unintentional contact with a computing device |
US8525868B2 (en) | 2011-01-13 | 2013-09-03 | Qualcomm Incorporated | Variable beamforming with a mobile platform |
JP2012150237A (ja) | 2011-01-18 | 2012-08-09 | Sony Corp | 音信号処理装置、および音信号処理方法、並びにプログラム |
US9354310B2 (en) | 2011-03-03 | 2016-05-31 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for source localization using audible sound and ultrasound |
JP2012234150A (ja) | 2011-04-18 | 2012-11-29 | Sony Corp | 音信号処理装置、および音信号処理方法、並びにプログラム |
US10154361B2 (en) | 2011-12-22 | 2018-12-11 | Nokia Technologies Oy | Spatial audio processing apparatus |
US20130275873A1 (en) | 2012-04-13 | 2013-10-17 | Qualcomm Incorporated | Systems and methods for displaying a user interface |
US9069065B1 (en) | 2012-06-27 | 2015-06-30 | Rawles Llc | Audio source localization |
US9615176B2 (en) * | 2012-12-28 | 2017-04-04 | Nvidia Corporation | Audio channel mapping in a portable electronic device |
CN105073073B (zh) | 2013-01-25 | 2018-12-07 | 胡海 | 用于声音可视化及声源定位的设备与方法 |
-
2013
- 2013-03-15 US US13/836,543 patent/US20130275873A1/en not_active Abandoned
- 2013-03-15 US US13/833,982 patent/US9354295B2/en active Active
- 2013-03-15 US US13/835,881 patent/US10107887B2/en active Active
- 2013-03-15 US US13/833,867 patent/US9857451B2/en active Active
- 2013-03-15 US US13/835,139 patent/US9291697B2/en active Active
- 2013-03-15 US US13/834,715 patent/US9360546B2/en active Active
- 2013-03-19 CN CN201380019683.9A patent/CN104220896B/zh not_active Expired - Fee Related
- 2013-03-19 WO PCT/US2013/032912 patent/WO2013154790A1/en active Application Filing
- 2013-03-19 EP EP13714449.9A patent/EP2836851A1/en not_active Withdrawn
- 2013-03-19 WO PCT/US2013/032929 patent/WO2013154792A1/en active Application Filing
- 2013-03-19 WO PCT/US2013/032916 patent/WO2013154791A1/en active Application Filing
- 2013-04-10 WO PCT/US2013/035916 patent/WO2013155148A1/en active Application Filing
- 2013-04-10 JP JP2015505869A patent/JP6400566B2/ja active Active
- 2013-04-10 WO PCT/US2013/035926 patent/WO2013155154A1/en active Application Filing
- 2013-04-10 EP EP13718696.1A patent/EP2836996A1/en not_active Ceased
- 2013-04-10 CN CN201380019519.8A patent/CN104246531B/zh active Active
- 2013-04-10 EP EP13718695.3A patent/EP2836852B1/en active Active
- 2013-04-10 IN IN2283MUN2014 patent/IN2014MN02283A/en unknown
- 2013-04-10 IN IN2195MUN2014 patent/IN2014MN02195A/en unknown
- 2013-04-10 CN CN201380019298.4A patent/CN104272137B/zh active Active
- 2013-04-11 WO PCT/US2013/036080 patent/WO2013155251A1/en active Application Filing
-
2018
- 2018-09-24 US US16/140,227 patent/US10909988B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101122636A (zh) * | 2006-08-09 | 2008-02-13 | 富士通株式会社 | 声音到达方向的估测方法以及声音到达方向的估测设备 |
CN101592728A (zh) * | 2009-06-24 | 2009-12-02 | 南京大学 | 基于空气中声传感器阵列的水下低频声源定位方法 |
Also Published As
Publication number | Publication date |
---|---|
IN2014MN02283A (zh) | 2015-08-07 |
US20130272538A1 (en) | 2013-10-17 |
EP2836851A1 (en) | 2015-02-18 |
WO2013154790A1 (en) | 2013-10-17 |
US20130275873A1 (en) | 2013-10-17 |
IN2014MN02195A (zh) | 2015-09-11 |
CN104272137B (zh) | 2017-05-24 |
US9857451B2 (en) | 2018-01-02 |
JP2015520884A (ja) | 2015-07-23 |
US9291697B2 (en) | 2016-03-22 |
US20130275872A1 (en) | 2013-10-17 |
CN104220896A (zh) | 2014-12-17 |
WO2013155148A1 (en) | 2013-10-17 |
EP2836852A1 (en) | 2015-02-18 |
US10107887B2 (en) | 2018-10-23 |
US9360546B2 (en) | 2016-06-07 |
US9354295B2 (en) | 2016-05-31 |
CN104246531A (zh) | 2014-12-24 |
US10909988B2 (en) | 2021-02-02 |
CN104246531B (zh) | 2017-11-14 |
WO2013154791A1 (en) | 2013-10-17 |
WO2013154792A1 (en) | 2013-10-17 |
JP6400566B2 (ja) | 2018-10-03 |
CN104272137A (zh) | 2015-01-07 |
US20130272097A1 (en) | 2013-10-17 |
US20190139552A1 (en) | 2019-05-09 |
US20130275077A1 (en) | 2013-10-17 |
WO2013155154A1 (en) | 2013-10-17 |
EP2836852B1 (en) | 2020-07-29 |
WO2013155251A1 (en) | 2013-10-17 |
US20130272539A1 (en) | 2013-10-17 |
EP2836996A1 (en) | 2015-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104220896B (zh) | 用于估计到达方向的系统、方法和设备 | |
CN104246878B (zh) | 音频用户交互辨识和上下文精炼 | |
CN102763160B (zh) | 用于稳健噪声降低的麦克风阵列子组选择 | |
CN104254818B (zh) | 音频用户交互辨识和应用程序接口 | |
CN102625946A (zh) | 用于多信道信号的去除回响的系统、方法、设备和计算机可读媒体 | |
CN103181190A (zh) | 用于远场多源追踪和分离的系统、方法、设备和计算机可读媒体 | |
EP3210391B1 (en) | Reverberation estimator | |
JP2014098568A (ja) | 音源位置推定装置、音源位置推定方法および音源位置推定プログラム | |
Yang et al. | Model-based head orientation estimation for smart devices | |
WO2022105571A1 (zh) | 语音增强方法、装置、设备及计算机可读存储介质 | |
Bai et al. | Audio enhancement and intelligent classification of household sound events using a sparsely deployed array | |
CN114830686A (zh) | 声源的改进定位 | |
Boztas | Sound source localization for auditory perception of a humanoid robot using deep neural networks | |
Habib et al. | Auditory inspired methods for localization of multiple concurrent speakers | |
Jian et al. | A new complex mapping method of neural networks used in sound source localization | |
KR102346133B1 (ko) | 심층 신경망 기반의 방향각 추정 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170405 Termination date: 20210319 |
|
CF01 | Termination of patent right due to non-payment of annual fee |