CN104661150A - 用于识别语音的装置和方法 - Google Patents
用于识别语音的装置和方法 Download PDFInfo
- Publication number
- CN104661150A CN104661150A CN201410160179.7A CN201410160179A CN104661150A CN 104661150 A CN104661150 A CN 104661150A CN 201410160179 A CN201410160179 A CN 201410160179A CN 104661150 A CN104661150 A CN 104661150A
- Authority
- CN
- China
- Prior art keywords
- beam forming
- wave beam
- microphone
- forming region
- interval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 20
- 238000006073 displacement reaction Methods 0.000 claims description 14
- 239000000284 extract Substances 0.000 claims description 3
- 230000000052 comparative effect Effects 0.000 claims description 2
- 230000003213 activating effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60N—SEATS SPECIALLY ADAPTED FOR VEHICLES; VEHICLE PASSENGER ACCOMMODATION NOT OTHERWISE PROVIDED FOR
- B60N2/00—Seats specially adapted for vehicles; Arrangement or mounting of seats in vehicles
- B60N2/02—Seats specially adapted for vehicles; Arrangement or mounting of seats in vehicles the seat or part thereof being movable, e.g. adjustable
- B60N2/0224—Non-manual adjustments, e.g. with electrical operation
- B60N2/0244—Non-manual adjustments, e.g. with electrical operation with logic circuits
- B60N2/0272—Non-manual adjustments, e.g. with electrical operation with logic circuits using sensors or detectors for detecting the position of seat parts
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/326—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only for microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
- H04R2201/401—2D or 3D arrays of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
- H04R2201/403—Linear arrays of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/13—Acoustic transducers and sound field adaptation in vehicles
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Otolaryngology (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Aviation & Aerospace Engineering (AREA)
- Transportation (AREA)
- Mechanical Engineering (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Abstract
本发明涉及一种用于识别语音的装置和方法。其中,用于识别语音的装置包括:多个被配置成具有至少一个麦克风的阵列式麦克风;座椅控制器,被配置成检查置于车辆中的座椅的位置;以及麦克风控制器,被配置成基于检查到的座椅的位置设定波束形成区,并控制阵列式麦克风,以便从所设定的波束形成区获得声源数据。用于识别语音的方法,包括:在从外部收到用于进入语音识别模式的信号时,启动多个阵列式麦克风;检查置于车辆中的座椅的位置;基于所检查到的座椅的位置,设定波束形成区;从波束形成区获得声源数据;以及从所获得的声源数据中提取语音数据。
Description
技术领域
本发明涉及一种用于识别语音的装置和方法,更特别涉及一种用于车辆的免提装置等的语音识别装置,以及通过根据驾驶者的位置来改变阵列式麦克风的波束形成区,从而能够提高语音识别率的语音识别装置和方法。
背景技术
用于识别驾驶者语音的普通装置,例如车辆的免提装置等,被实施为通过利用具有朝向驾驶者座椅方向的方向性的单麦克风,或者通过朝着驾驶者的座椅方向、用于波束形成的阵列式麦克风,使得包含在驾驶者语音中的噪声的影响最小。
然而,由于驾驶者的语音通常是在未考虑驾驶者的坐高,驾驶者的位置等的状态下获得的,因此可能不足以提供高质量的呼叫环境。
发明内容
为了解决现有技术中出现的上述问题,同时保持现有技术具有的优点,而提出本发明。
本发明的一个方面提供一种语音识别装置和方法,通过检查驾驶者的座椅位置,并把阵列式麦克风的波束形成区设定成检查到的位置,从而能够更精确地获得驾驶者的语音数据。
根据本发明的示例性实施例,用于识别语音的装置包括:多个被配置成具有至少一个麦克风的阵列式麦克风;座椅控制器,被配置成检查置于车辆中的座椅的位置;以及麦克风控制器,被配置成基于检查到的座椅的位置设定波束形成区,并控制阵列式麦克风,以便从所设定的波束形成区获得声源数据。
麦克风控制器将座椅的总移动距离识别成阵列式麦克风的总波束形成角度。
麦克风控制器将座椅的总移动距离等分成多个区间,并根据所分割的区间,将阵列式麦克风的总波束形成角度等分成多个区间,从而形成第一波束形成区间。
麦克风控制器可以将第一波束形成区间中与座椅位置相对应的区间设定成第一波束形成区。
麦克风控制器可以将第一波束形成区分成多个区间,从而产生多个第二波束形成区间。
麦克风控制器可以控制第一阵列式麦克风和第二阵列式麦克风,以便从多个第二波束形成区间获得不同区间的声源数据。
麦克风控制器可以将从第一阵列式麦克风和第二阵列式麦克风获得的声源数据的信号中获得的具有最大强度的信号的区间,设定成第二波束形成区。
该装置还可以包括语音识别器,该语音识别器从自第二波束形成区获得的声源数据中提取语音数据。
根据本发明另一个实施例,用于识别语音的方法包括:在从外部收到用于进入语音识别模式的信号时,启动多个阵列式麦克风;检查置于车辆中的座椅的位置;基于所检查到的座椅的位置,设定波束形成区;从波束形成区获得声源数据;以及从所获得的声源数据中提取语音数据。
检查座椅位置的步骤可以包括:将座椅的总移动距离等分成多个区间,并检查座椅是否位于经划分的区间的任意位置上。
设定波束形成区的步骤可以包括:通过将阵列式麦克风的总波束形成角度划分成等于通过划分总移动距离而获得的区间,形成第一波束形成区间;和将第一波束形成区间中与座椅位置相对应的区间设定成第一波束形成区。
该方法还可以包括在将与座椅位置相对应的区间设定成第一波束形成区的步骤之后,选择第二波束形成区。
选择所述第二波束形成区的步骤可以包括:将第一波束形成区划分成多个区间;通过第一阵列式麦克风和第二阵列式麦克风,从多个第二波束形成区间获得不同区间的声源数据;将从第一阵列式麦克风和第二阵列式麦克风获得的声源数据信号的强度进行比较;以及根据比较结果,选择从中获得具有最大强度信号的区间,作为第二波束形成区。
附图说明
通过以下的详细说明,并结合附图,本发明的上述和其它目的、特征和优点将会更加显而易见,其中:
图1是表示根据本发明的示例性实施例的语音识别装置的主要结构的方框图;
图2是用来说明根据本发明的示例性实施例的语音识别方法的流程图;
图3-5示出根据本发明的示例性实施例的设定用于识别语音的阵列式麦克风的波束形成区的方法。
具体实施方式
下面结合附图,更详细地说明本发明的示例性实施例。然而,在说明本发明的示例性实施例时,如果可能的话,为本领域的技术人员众所周知,并且不直接与本发明相关的技术内容将被省略。这是为了通过省略不必要的说明,更清楚地讲述本发明的要点,以便不会模糊本发明。
图1是示出根据本发明示例性实施例的语音识别装置的主要结构的方框图。
参见图1,语音识别装置100可以包括通信器110、座椅开关120、座椅控制器130、座椅驱动器140、麦克风控制器150、阵列式麦克风160和语音识别器170。
通信器110执行控制器局域网(CAN)通信,用于实现座椅控制器130与麦克风控制器150之间的通信。
座椅开关120生成用于改变置于车辆中的座椅的位置的信号,并把该信号提供给座椅控制器130。
座椅控制器130根据从座椅开关120提供的信号,控制座椅驱动器140以改变座椅位置。座椅控制器130检查车辆的当前座椅位置信息,并将其提供给麦克风控制器150。座椅控制器130将座椅的总移动距离等分成多个区间,并将多个区间中的、其中安置有座椅的区间的信息提供给麦克风控制器150。
座椅驱动器140基于座椅控制器130的控制,改变座椅的位置。
麦克风控制器150从外部接收用于进入语音识别模式的信号,从而启动阵列式麦克风160。在这种情况下,可以通过独立的输入装置(未示出)接收从外部接收的信号,语音识别模式可以是实现诸如免提服务,利用语音识别的音频、视频和导航(AVN)控制服务,利用语音识别的目的地设定服务之类功能的模式。
当收到用于进入语音识别模式的信号时,麦克风控制器150通过通信器110,向座椅控制器130请求置于车辆中的座椅的位置信息。麦克风控制器150利用从座椅控制器130接收的信息,检查座椅的位置。麦克风控制器150基于检查的当前座椅位置,设定第一波束形成区。更具体地,麦克风控制器150将座椅的总移动距离确定为阵列式麦克风160的总波束形成区间。麦克风控制器150将总波束形成区间划分成与从座椅的总移动距离划分的相等的区间。另外,麦克风控制器150将与从座椅控制器130收到的、座椅置于其中的区间相对应的波束形成区间,设定成第一波束形成区。
麦克风控制器150将第一波束形成区划分成具有相同角度的多个第二波束形成区间。麦克风控制器150将第二波束形成区间中能够更精确地获得声源信号的区间,确定成第二波束形成区。更具体地,麦克风控制器150控制第一阵列式麦克风161,以便获得多个第二波束形成区间中的第一区间的声源信号,并控制第二阵列式麦克风162,以获得多个第二波束形成区间中的第二区间的声源信号。麦克风控制器150将第一区间的声源信号(第一信号)与第二区间的声源信号(第二信号)彼此进行比较,并将第一阵列式麦克风161固定到具有较大信号强度的区间。在此情况下,当第一信号的电平大于第二信号的电平时,麦克风控制器150将第一阵列式麦克风161布置在第一区间中,并将第二阵列式麦克风162移动到第三区间。如果第一信号的电平小于第二信号的电平,则麦克风控制器150将第一阵列式麦克风161移动到第二区间,并将第二阵列式麦克风162移动到第三区间。因而,麦克风控制器150在整个第二波束形成区间内,对分别从第一阵列式麦克风161和第二阵列式麦克风162获得的声源信号强度进行比较。麦克风控制器150将多个第二波束形成区间中的、其中检查到声源信号的最大强度的区间确定成第二波束形成区,并将第一阵列式麦克风161布置在该第二波束形成区中,从而获得声源信号。
另外,麦克风控制器150将获得的声源信号提供给语音识别器170。因而,本发明通过基于驾驶者的位置,对能够获得阵列式麦克风160的声源信号的位置进行改变,可以确保更精确的语音识别性能。
阵列式麦克风160可包括第一阵列式麦克风161和第二阵列式麦克风162。第一阵列式麦克风161可以是收集声源数据的主麦克风,第二阵列式麦克风162可以是用于分析声源信号以确定从第一阵列式麦克风161收集声源数据的最佳区间的副麦克风。
语音识别器170分析从麦克风控制器150提供的声源信号,从而提取语音数据。从语音识别器170提取的语音数据被用于免提服务,利用语音识别的音频、视频和导航(AVN)控制服务,利用语音识别的目的地设定服务,等等。
图2是用于说明根据本发明示例性实施例的语音识别方法的流程图。图3-5是用于说明根据本发明示例性实施例的用于识别语音的阵列式麦克风的波束形成区的设定方法的图示。
参见图1-5,当从外部接收到用于进入语音识别模式的信号时(S11),麦克风控制器150前进到S13。在此情况下,可通过独立的输入装置(未示出)接收来自外部的信号,并且语音识别模式可以是实现诸如免提服务,利用语音识别的音频、视频和导航(AVN)控制服务,以及利用语音识别的目的地设定服务等功能的模式。
麦克风控制器150启动第一阵列式麦克风161和第二阵列式麦克风162(S13)。阵列式麦克风160可以是由两个麦克风构成的一个阵列式麦克风160。
麦克风控制器150通过通信器110,向座椅控制器130请求与置于车辆中的座椅的位置有关的信息(S15)。麦克风控制器150利用从座椅控制器130接收到的信息,检查座椅位置(S17)。参见图3,置于车辆中的座椅S从点A移动到点B。座椅控制器130将从点A到点B的移动距离等分成区间。座椅控制器130可以将座椅S从点A到点B的移动距离定义成n电压,并且可依据从座椅开关120输入的电压电平,检查座椅S的变化后的当前位置。在此情况下,如图3所示,电压电平可被大致分成5个区间,从点A到点B,每个区间的电压值依次为0、n/5、2n/5、3n/5、4n/5和n。座椅控制器130提供被映射成电压值的N值,座椅S通过通信器110以该值被布置成麦克风控制器150。
麦克风控制器150设定第一波束形成区(S19)。更具体地,参考图3和4来说明,麦克风控制器150将座椅S从A点到B点的移动距离确定为阵列式麦克风160的总波束形成区间。麦克风控制器150将总波束形成区间等分成5个区间,如图3所示。另外,麦克风控制器150将与从座椅控制器130接收到的座椅S的位置、被映射成电压值的N值相对应的波束形成区间,设定成第一波束形成区。例如,当麦克风控制器150从座椅控制器130接收到的与座椅S的位置的N值相对应的数值3时,其将总波束形成区间中与数值3相对应的区间,设定为第一波束形成区。
麦克风控制器150然后将第一波束形成区分成具有相同角度的M个第二波束形成区间(S21)。从而,本发明可精确地检查座椅S的位置,从而改善驾驶者语音识别的性能。第二波束形成区间的划分可以如图5所示。与N=3相对应的区域,即第一波束形成区,可被分成总共10个第二波束形成区间。在这种情况下,由于更精细地进行第二波束形成区间的划分,因此可以更精确地获得驾驶者的语音数据。
前进到S23,麦克风控制器150从第一阵列式麦克风161和第二阵列式麦克风162,获得M个经划分的第二波束形成区间中的每个区间的声源信号。参见图5,麦克风控制器150控制阵列式麦克风160,以便获得在10个经划分的第二波束形成区间中、对应于附图标记a的第二波束形成区间和对应于附图标记b的第二波束形成区间中的声源信号。
麦克风控制器150将从与附图标记a相对应的区间获得的第一信号的电平,和从与附图标记b相对应的区间获得的第二信号的电平彼此进行比较(S25)。作为比较的结果,当第一信号的电平大于第二信号的电平时,麦克风控制器150前进到S27;当第二信号的电平大于第一信号的电平时,麦克风控制器150前进到S37。
作为步骤S25的结果,当第一信号的电平大于第二信号的电平时,麦克风控制器150前进到S27,从而将第一阵列式麦克风161固定到与附图标记a相对应的区间,并且从对应于附图标记a的区间获得第一信号。麦克风控制器150控制阵列式麦克风160,以使第二阵列式麦克风162从与附图标记c相对应的第二波束形成区间获得第二信号(S29)。
前进到S31,当第二阵列式麦克风162在其中获得声源信号的第二波束形成区间不是附图标记j时,麦克风控制器150返回到步骤S23,重复上述操作。相反地,当第二阵列式麦克风162在其中获得声源信号的第二波束形成区间是附图标记j时,麦克风控制器150前进到S33。
当第二阵列式麦克风162直到与附图标记j相对应的第二波束形成区间才获得第二信号时,麦克风控制器150将固定第一阵列式麦克风161的第二波束形成区间,识别成具有最大强度声源信号的区间,并将其确定成第二波束形成区(S33)。通过将从被确定成第二波束形成区的区间获得的声源信号提供给语音识别器170,麦克风控制器150控制语音识别器170以获得语音数据(S35)。
作为S25的检查结果,当第一信号的电平小于第二信号的电平时,麦克风控制器150前进到S37,从而控制第一阵列式麦克风161,使得从与附图标记b相对应的第二波束形成区间,获得第一信号。此外,麦克风控制器150前进到S29,从而控制第二阵列式麦克风162,以便从与附图标记b相对应的第二波束形成区间获得第二信号的第二阵列式麦克风162,从与附图标记c相对应的第二波束形成区间获得第二信号。
参考图5进行说明,从第一阵列式麦克风获得区间a的信号,且从第二阵列式麦克风获得区间b的信号。通过对区间a和b的信号进行比较,当区间a的信号的电平大于区间b的信号的电平时,第一阵列式麦克风连续获得区间a的信号,第二阵列式麦克风获得区间c的信号。
当区间c的信号强度大于区间a的信号强度时,第一阵列式麦克风从区间a移动到区域c,从而获得区间c的信号,第二阵列式麦克风获得区间d的信号。当区间c的信号强度大于区间d的信号强度时,第一阵列式麦克风连续获得区间c的信号,第二阵列式麦克风获得区间e的信号。
因而,第二阵列式麦克风一边顺序地将区间从区间b改变到区间j,一边获得信号,直到获得区间j的信号为止。第一阵列式麦克风将从第一阵列式麦克风获得的信号强度,与从第二阵列式麦克风获得的信号强度彼此进行比较,从而将波束形成区改变并固定到具有较大信号强度的区间。
根据本发明的示例性实施例,通过检查驾驶者的座椅位置,并将阵列式麦克风的波束形成区设定成检查到的位置以获得驾驶者的语音数据,可以更精确地获得驾驶者的语音数据。
上面参考本发明的示例性实施例,对根据本发明示例性实施例的语音识别装置和方法进行说明。在本说明书和附图中公开了本发明的示例性实施例,并且使用了特定的术语,但是这些术语只是在普通意义上地使用,以便易于说明本发明的技术内容,帮助理解本发明,并不限制本发明的范围。对本领域的技术人员来说,显然除了在此公开的示例性实施例之外,根据本发明的技术理念,还可进行各种变形。
Claims (14)
1.一种用于识别语音的装置,所述装置包括:
多个被配置成具有至少一个麦克风的阵列式麦克风;
座椅控制器,被配置成检查置于车辆中的座椅的位置;以及
麦克风控制器,被配置成基于检查到的所述座椅的位置设定波束形成区,并控制所述阵列式麦克风,以便从所设定的波束形成区获得声源数据。
2.如权利要求1所述的装置,其中所述麦克风控制器将所述座椅的总移动距离识别成所述阵列式麦克风的总波束形成角度。
3.如权利要求2所述的装置,其中所述麦克风控制器将所述座椅的总移动距离等分成多个区间,并根据所分割的区间,将所述阵列式麦克风的总波束形成角度等分成多个区间,从而形成第一波束形成区间。
4.如权利要求3所述的装置,其中所述麦克风控制器将所述第一波束形成区间中与所述座椅位置相对应的区间设定成第一波束形成区。
5.如权利要求4所述的装置,其中所述麦克风控制器将所述第一波束形成区分成多个区间,从而产生多个第二波束形成区间。
6.如权利要求5所述的装置,其中所述麦克风控制器控制第一阵列式麦克风和第二阵列式麦克风,以便从所述多个第二波束形成区间获得不同区间的声源数据。
7.如权利要求6所述的装置,其中所述麦克风控制器将从所述第一阵列式麦克风和所述第二阵列式麦克风获得的声源数据的信号中获得的具有最大强度的信号的区间,设定成第二波束形成区。
8.如权利要求7所述的装置,还包括语音识别器,所述语音识别器从自所述第二波束形成区获得的声源数据中提取语音数据。
9.一种用于识别语音的方法,所述方法包括:
在从外部收到用于进入语音识别模式的信号时,启动多个阵列式麦克风;
检查置于车辆中的座椅的位置;
基于所检查到的所述座椅的位置,设定波束形成区;
从所述波束形成区获得声源数据;以及
从所获得的声源数据中提取语音数据。
10.如权利要求9所述的方法,其中检查所述座椅位置的步骤包括:将所述座椅的总移动距离等分成多个区间,并检查所述座椅是否位于经划分的区间的任意位置上。
11.如权利要求10所述的方法,其中设定波束形成区的步骤包括:
通过将所述阵列式麦克风的总波束形成角度划分成等于通过划分总移动距离而获得的区间,形成第一波束形成区间;和
将所述第一波束形成区间中与所述座椅位置相对应的区间设定成第一波束形成区。
12.如权利要求11所述的方法,还包括在将与所述座椅位置相对应的区间设定成第一波束形成区的步骤之后,选择第二波束形成区。
13.如权利要求12所述的方法,其中选择所述第二波束形成区的步骤包括:
将所述第一波束形成区划分成多个区间;
通过第一阵列式麦克风和第二阵列式麦克风,从多个第二波束形成区间获得不同区间的声源数据;
将从所述第一阵列式麦克风和第二阵列式麦克风获得的声源数据信号的强度进行比较;以及
根据比较结果,选择从中获得具有最大强度信号的区间,作为第二波束形成区。
14.如权利要求1所述的装置,还包括:
座椅开关,生成用于改变座椅位置的信号,并将所述信号提供给所述座椅控制器;以及
座椅驱动器,被配置成基于所述座椅控制器的控制来改变所述座椅位置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20130144093A KR101491354B1 (ko) | 2013-11-25 | 2013-11-25 | 음성인식 장치 및 방법 |
KR10-2013-0144093 | 2013-11-25 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104661150A true CN104661150A (zh) | 2015-05-27 |
CN104661150B CN104661150B (zh) | 2019-06-04 |
Family
ID=52591697
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410160179.7A Active CN104661150B (zh) | 2013-11-25 | 2014-04-21 | 用于识别语音的装置和方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9530406B2 (zh) |
KR (1) | KR101491354B1 (zh) |
CN (1) | CN104661150B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107187403A (zh) * | 2016-03-15 | 2017-09-22 | 现代自动车株式会社 | 车辆及其控制方法 |
CN108597508A (zh) * | 2018-03-28 | 2018-09-28 | 京东方科技集团股份有限公司 | 用户识别方法、用户识别装置和电子设备 |
CN108885871A (zh) * | 2015-12-31 | 2018-11-23 | 通用电气公司 | 声学地图命令情境化和设备控制 |
CN109192203A (zh) * | 2018-09-29 | 2019-01-11 | 百度在线网络技术(北京)有限公司 | 多音区语音识别方法、装置及存储介质 |
WO2020103353A1 (zh) * | 2018-11-20 | 2020-05-28 | 北京小米智能科技有限公司 | 多波束选取方法及装置 |
CN111516618A (zh) * | 2019-02-05 | 2020-08-11 | 李尔公司 | 电气组件 |
US10785566B2 (en) | 2018-12-05 | 2020-09-22 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method and device for processing an audio signal in a vehicle |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102352560B1 (ko) * | 2017-06-09 | 2022-01-19 | 현대자동차주식회사 | 차량용 키, 차량, 및 그 제어방법 |
US9966059B1 (en) * | 2017-09-06 | 2018-05-08 | Amazon Technologies, Inc. | Reconfigurale fixed beam former using given microphone array |
US10134415B1 (en) * | 2017-10-18 | 2018-11-20 | Ford Global Technologies, Llc | Systems and methods for removing vehicle geometry noise in hands-free audio |
US10657981B1 (en) * | 2018-01-19 | 2020-05-19 | Amazon Technologies, Inc. | Acoustic echo cancellation with loudspeaker canceling beamformer |
CN109688512B (zh) * | 2018-12-26 | 2020-12-22 | 北京猎户星空科技有限公司 | 一种拾音方法及装置 |
KR20210133600A (ko) * | 2020-04-29 | 2021-11-08 | 현대자동차주식회사 | 차량 음성 인식 방법 및 장치 |
US20220130416A1 (en) * | 2020-10-27 | 2022-04-28 | Arris Enterprises Llc | Method and system for improving estimation of sound source localization by using indoor position data from wireless system |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020102002A1 (en) * | 2001-01-26 | 2002-08-01 | David Gersabeck | Speech recognition system |
JP2004262390A (ja) * | 2003-03-04 | 2004-09-24 | Auto Network Gijutsu Kenkyusho:Kk | 車両設定変更装置 |
US20040252845A1 (en) * | 2003-06-16 | 2004-12-16 | Ivan Tashev | System and process for sound source localization using microphone array beamsteering |
US20070038444A1 (en) * | 2005-02-23 | 2007-02-15 | Markus Buck | Automatic control of adjustable elements associated with a vehicle |
CN103092557A (zh) * | 2011-11-01 | 2013-05-08 | 上海博泰悦臻网络技术服务有限公司 | 车载语音输入装置及方法 |
CN103680512A (zh) * | 2012-09-03 | 2014-03-26 | 现代摩比斯株式会社 | 车用阵列话筒的语音识别水平提升系统及其方法 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6173059B1 (en) * | 1998-04-24 | 2001-01-09 | Gentner Communications Corporation | Teleconferencing system with visual feedback |
US6449593B1 (en) * | 2000-01-13 | 2002-09-10 | Nokia Mobile Phones Ltd. | Method and system for tracking human speakers |
US6905219B2 (en) | 2002-05-09 | 2005-06-14 | 3M Innovative Properties Company | Display device |
JP2004198702A (ja) * | 2002-12-18 | 2004-07-15 | Nissan Motor Co Ltd | 車両用音声入力装置 |
KR20060085392A (ko) | 2005-01-24 | 2006-07-27 | 현대자동차주식회사 | 어레이 마이크 시스템 |
WO2007018293A1 (ja) | 2005-08-11 | 2007-02-15 | Asahi Kasei Kabushiki Kaisha | 音源分離装置、音声認識装置、携帯電話機、音源分離方法、及び、プログラム |
JP5014662B2 (ja) | 2006-04-13 | 2012-08-29 | アルパイン株式会社 | 車載用音声認識装置及び音声認識方法 |
KR100827080B1 (ko) | 2007-01-09 | 2008-05-06 | 삼성전자주식회사 | 사용자 인식 기반의 빔 포밍 장치 및 방법 |
JP5156260B2 (ja) * | 2007-04-27 | 2013-03-06 | ニュアンス コミュニケーションズ,インコーポレイテッド | 雑音を除去して目的音を抽出する方法、前処理部、音声認識システムおよびプログラム |
KR101750338B1 (ko) * | 2010-09-13 | 2017-06-23 | 삼성전자주식회사 | 마이크의 빔포밍 수행 방법 및 장치 |
KR20130078919A (ko) | 2012-01-02 | 2013-07-10 | 현대모비스 주식회사 | 차량용 핸즈프리 통화 시스템 및 그 제어 방법 |
US9076450B1 (en) * | 2012-09-21 | 2015-07-07 | Amazon Technologies, Inc. | Directed audio for speech recognition |
KR102033309B1 (ko) * | 2013-10-25 | 2019-10-17 | 현대모비스 주식회사 | 운전석 위치를 고려하는 빔 포밍 마이크 제어 장치 및 방법 |
-
2013
- 2013-11-25 KR KR20130144093A patent/KR101491354B1/ko active IP Right Grant
-
2014
- 2014-04-03 US US14/244,447 patent/US9530406B2/en active Active
- 2014-04-21 CN CN201410160179.7A patent/CN104661150B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020102002A1 (en) * | 2001-01-26 | 2002-08-01 | David Gersabeck | Speech recognition system |
JP2004262390A (ja) * | 2003-03-04 | 2004-09-24 | Auto Network Gijutsu Kenkyusho:Kk | 車両設定変更装置 |
US20040252845A1 (en) * | 2003-06-16 | 2004-12-16 | Ivan Tashev | System and process for sound source localization using microphone array beamsteering |
US20070038444A1 (en) * | 2005-02-23 | 2007-02-15 | Markus Buck | Automatic control of adjustable elements associated with a vehicle |
CN103092557A (zh) * | 2011-11-01 | 2013-05-08 | 上海博泰悦臻网络技术服务有限公司 | 车载语音输入装置及方法 |
CN103680512A (zh) * | 2012-09-03 | 2014-03-26 | 现代摩比斯株式会社 | 车用阵列话筒的语音识别水平提升系统及其方法 |
Non-Patent Citations (1)
Title |
---|
RAMANI DURAISWAMI, ET AL.: ""Active Speech Source Localization By A Dual Coarse-To-Fine Search"", 《IEEE INTERNATIONAL CONFERENCE.ACOUSTICS, SPEECH, AND SIGNAL PROCESSING》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108885871A (zh) * | 2015-12-31 | 2018-11-23 | 通用电气公司 | 声学地图命令情境化和设备控制 |
CN107187403A (zh) * | 2016-03-15 | 2017-09-22 | 现代自动车株式会社 | 车辆及其控制方法 |
CN107187403B (zh) * | 2016-03-15 | 2021-08-10 | 现代自动车株式会社 | 车辆及其控制方法 |
CN108597508A (zh) * | 2018-03-28 | 2018-09-28 | 京东方科技集团股份有限公司 | 用户识别方法、用户识别装置和电子设备 |
CN109192203A (zh) * | 2018-09-29 | 2019-01-11 | 百度在线网络技术(北京)有限公司 | 多音区语音识别方法、装置及存储介质 |
WO2020103353A1 (zh) * | 2018-11-20 | 2020-05-28 | 北京小米智能科技有限公司 | 多波束选取方法及装置 |
US10785566B2 (en) | 2018-12-05 | 2020-09-22 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method and device for processing an audio signal in a vehicle |
US11412326B2 (en) | 2018-12-05 | 2022-08-09 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method and device for processing an audio signal in a vehicle |
CN111516618A (zh) * | 2019-02-05 | 2020-08-11 | 李尔公司 | 电气组件 |
Also Published As
Publication number | Publication date |
---|---|
US20150149164A1 (en) | 2015-05-28 |
CN104661150B (zh) | 2019-06-04 |
US9530406B2 (en) | 2016-12-27 |
KR101491354B1 (ko) | 2015-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104661150A (zh) | 用于识别语音的装置和方法 | |
US10083685B2 (en) | Dynamically adding or removing functionality to speech recognition systems | |
US20130080056A1 (en) | Information Terminal, Server Device, Searching System, and Searching Method Thereof | |
US20140100847A1 (en) | Voice recognition device and navigation device | |
US20160039356A1 (en) | Establishing microphone zones in a vehicle | |
US20160275936A1 (en) | Electronic devices and methods for compensating for environmental noise in text-to-speech applications | |
US9530414B2 (en) | Speech recognition using a database and dynamic gate commands | |
CN103366756A (zh) | 一种声音信号的接收方法及装置 | |
JP2009300537A (ja) | 音声作動システム、音声作動方法および車載装置 | |
US20150221308A1 (en) | Voice recognition system | |
CN108566647A (zh) | 基于nb-iot网络的信号测试系统及方法 | |
CN103699023A (zh) | 车载设备多候选poi的控制方法及系统 | |
JP6214297B2 (ja) | ナビゲーション装置および方法 | |
CN105469804A (zh) | 语音识别装置及方法 | |
JP6281202B2 (ja) | 応答制御システム、およびセンター | |
KR20140067687A (ko) | 대화형 음성인식이 가능한 차량 시스템 | |
CN103592862A (zh) | 车载设备多候选poi的控制系统及方法 | |
US20170018273A1 (en) | Real-time adaptation of in-vehicle speech recognition systems | |
CN109545217B (zh) | 语音信号接收方法、装置、智能终端及可读存储介质 | |
US20150378001A1 (en) | Indoor position information providing apparatus, position notifier apparatus and program | |
CN116442939A (zh) | 基于车辆及用户信息自动识别车机系统语言的方法及装置 | |
JP7216138B2 (ja) | 電子機器、制御方法、およびプログラム | |
US20190082279A1 (en) | Testing of vehicle system module using audio recognition | |
JP2019124976A (ja) | リコメンド装置、リコメンド方法、及びリコメンドプログラム | |
CN102572051B (zh) | 车载免提系统、具有车载免提系统的交通工具及移动电话 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |