CN107430524A - 一种定位声音发出位置的方法和终端设备 - Google Patents
一种定位声音发出位置的方法和终端设备 Download PDFInfo
- Publication number
- CN107430524A CN107430524A CN201580076714.3A CN201580076714A CN107430524A CN 107430524 A CN107430524 A CN 107430524A CN 201580076714 A CN201580076714 A CN 201580076714A CN 107430524 A CN107430524 A CN 107430524A
- Authority
- CN
- China
- Prior art keywords
- sound signal
- sound
- voice
- voice command
- location
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000005236 sound signal Effects 0.000 claims abstract description 125
- 238000000605 extraction Methods 0.000 claims description 29
- 239000000284 extract Substances 0.000 claims description 25
- 230000004044 response Effects 0.000 claims description 6
- 238000004378 air conditioning Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 12
- 238000012545 processing Methods 0.000 description 9
- 230000006854 communication Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000005484 gravity Effects 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000009527 percussion Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60R—VEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
- B60R11/00—Arrangements for holding or mounting articles, not otherwise provided for
- B60R11/02—Arrangements for holding or mounting articles, not otherwise provided for for radio sets, television sets, telephones, or the like; Arrangement of controls thereof
- B60R11/0217—Arrangements for holding or mounting articles, not otherwise provided for for radio sets, television sets, telephones, or the like; Arrangement of controls thereof for loud-speakers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60R—VEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
- B60R16/00—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
- B60R16/02—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
- B60R16/037—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
- B60R16/0373—Voice control
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/02—Details casings, cabinets or mounting therein for transducers covered by H04R1/02 but not provided for in any of its subgroups
- H04R2201/025—Transducer mountings or cabinet supports enabling variable orientation of transducer of cabinet
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
- H04R2430/21—Direction finding using differential microphone array [DMA]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
- H04R2430/23—Direction finding using a sum-delay beam-former
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/13—Acoustic transducers and sound field adaptation in vehicles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Otolaryngology (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Mechanical Engineering (AREA)
- Circuit For Audible Band Transducer (AREA)
- Telephone Function (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明实施例提供了一种定位声音发出位置的方法和终端设备,采集K个第一声音信号;其中,K为大于等于2的整数;根据与N个不同位置对应的N个位置参数,从所述K个第一声音信号中提取M个第二声音信号;其中M小于等于N,N为大于等于2的整数;确定每个第二声音信号对应的位置。本发明实施例中,利用波束成型算法,根据位置参数,从K个第一声音信号中提取M个第二声音信号,从而确定每个第二声音信号对应的发出位置,通过这种方法,可以高效的提取不同位置发出的声音信号,提供语音识别能力,为用户提供了更高的用户体验。
Description
本发明实施例涉及移动通信领域,尤其涉及一种定位声音发出位置的方法和终端设备。
语音识别是目前智能信息系统人机交互界面的核心技术点。为了提升语音识别的成功率,普遍采用声音采集传感器采集声音信号的方案,针对声音发出位置进行声音信号采集和语音识别。
目前,提高语音识别成功率的方案,只能提取一个位置发出的声音信号,对于其他位置发出的声音信号只能被当做噪声滤除而无法准确地提取和定位声音发出位置,也无法进行语音识别。以安装在汽车内的车载系统为例,目前可以通过安装在车载系统上的声音采集传感器采集周围环境中的声音信号,提取出从主驾驶室发出的声音信号,并对所述提取的从主驾驶室发出的声音信号进行语音识别,车载系统可以响应从主驾驶室发出的声音信号。但是,从副驾驶室发出的声音信号或者从车载后排座位发出的声音信号都被车载系统当做噪声滤除而无法准确地提取和定位声音发出位置,更无法进行语音识别。如,车载系统可以提取并语音识别从主驾驶室发出的“开天窗”的语音命令,但是,无法提取从副驾驶室或者从车载后排座位等其他位置发出的“开天窗”的语音命令,也无法定位车载系统内其他声音信号的发出位置。因此,在汽车内的车载系统这样的应用场景下,车载系统无法高效准确地定位汽车内其他声音信号的发出位置,降低了定位声音信号的发出位置的效率,用户体验低下。
发明内容
本发明实施例提供了一种定位声音发出位置的方法和终端设备,以解决只能定位和提取从单一位置发出的声音信息,无法定位和提取从其他位置发出的声音信号的问题。
本发明第一方面,提供了一种定位声音发出位置的方法,包括:采集K个第一声音信号;其中,K为大于等于2的整数;根据与N个不同位置对应
的N个位置参数,从所述K个第一声音信号中提取M个第二声音信号;其中M小于等于N,N为大于等于2的整数;确定每个第二声音信号对应的位置。
在第一种可能的实现方式中,所述根据与N个不同位置对应的N个位置参数,从所述K个第一声音信号中提取M个第二声音信号,具体包括:利用波束成型算法,分别根据所述N个位置参数,从所述K个第一声音信号中提取M个第二声音信号。
结合第一方面,在第二种可能的实现方式中,所述确定每个第二声音信号对应的位置,具体包括:根据第L个第二声音信号对应的位置参数,确定所述第L个第二声音信号对应的位置L;其中,第L个第二声音信号为所述M个第二声音信号中的任意一个。
结合第一方面和上述任一种可能的实现方式,在第三种可能的实现方式中,从所述K个第一声音信号中提取M个第二声音信号后,所述方法还包括:对提取的所述M个第二声音信号进行语音识别;获取所述M个第二声音信号对应的M个语音命令。
结合第一方面和第三种可能的实现方式,在第四种可能的实现方式中,在获取所述M个第二声音信号对应的M个语音命令之后,所述方法还包括:响应所述M个语音命令。
结合第一方面和第四种可能的实现方式,在第五种可能的实现方式中,响应所述M个语音命令包括:根据所述M个语音命令对应的M个不同位置的优先级,优先响应高优先级的语音命令。
本发明第二方面,提供了一种终端设备,其特征在于,所述终端设备包括:K个声音采集传感器,用于采集K个第一声音信号;其中K为大于等于2的整数;处理器,用于根据与N个不同位置对应的N个位置参数,从所述K个第一声音信号中提取M个第二声音信号,并确定每个第二声音信号对应的位置,其中M小于等于N,N为大于等于2的整数。
在第一种可能的实现方式中,所述处理器用于根据与N个不同位置对应的N个位置参数,从所述K个第一声音信号中提取M个第二声音信号,具体包括:所述处理器用于利用波束成型算法,分别根据所述N个位置参数,从所述K个第一声音信号中提取M个第二声音信号。
结合第二方面和第一种可能的实现方式,在第二种可能的实现方式中,所
述处理器用于确定每个第二声音信号对应的位置,具体包括:根据第L个第二声音信号对应的位置参数,确定所述第L个第二声音信号对应的位置L;其中,第L个第二声音信号为所述M个第二声音信号中的任意一个。
结合第二方面和上述任意的一种可能的实现方式,在第三种可能的实现方式中,所述处理器还用于从所述K个第一声音信号中提取M个第二声音信号后,对提取的所述M个第二声音信号进行语音识别,并用于获取所述M个第二声音信号对应的M个语音命令。
结合第二方面和上述任意的一种可能的实现方式,在第四种可能的实现方式中,所述终端设备还包括输出装置;所述输出装置,用于在所述处理器获取所述M个第二声音信号对应的M个语音命令之后,响应所述M个语音命令。
结合第二方面和第四种可能的实现方式中,在第五种可能的实现方式中,所述输出装置用于响应所述M个语音命令,具体包括:
所述输出装置用于根据所述M个语音命令对应的M个不同位置的优先级,优先响应优先级高的命令。
结合第二方面和上述任意的一种可能的实现方式,所述K个声音采集传感器在三维空间内的坐标不同。
本发明第三方面,提供了一种定位声音发出位置的装置,所述装置包括:采集模块,提取模块和确定模块,其中,所述采集模块用于采集K个第一声音信号;其中,K为大于等于2的整数;所述提取模块用于根据与N个不同位置对应的N个位置参数,从所述K个第一声音信号中提取M个第二声音信号;其中M小于等于N,N为大于等于2的整数;宿松确定模块用于确定每个第二声音信号对应的位置。
在第一种可能的实现方式中,所述提取模块用于根据与N个不同位置对应的N个位置参数,从所述K个第一声音信号中提取M个第二声音信号,具体包括:利用波束成型算法,分别根据所述N个位置参数,从所述K个第一声音信号中提取M个第二声音信号。
结合第三方面和第一种可能的实现方式中,在第二种可能的实现方式中,所述确定模块用于确定每个第二声音信号对应的位置,具体包括,所述确定模块用于根据第L个第二声音信号对应的位置参数,确定所述第L个第二声音信号对应的位置L;其中,第L个第二声音信号为所述M个第二声音信号中
的任意一个。
结合第三方面和上述任意的一种可能的实现方式,在第三种可能的实现方式中,所述装置还包括语音识别模块和获取模块,所述语音识别模块用于在所述提取模块用于从所述K个第一声音信号中提取M个第二声音信号后,对提取的所述M个第二声音信号进行语音识别;所述获取模块用于获取所述M个第二声音信号对应的M个语音命令。
结合第三方面和第三种可能的实现方式,在第四种可能的实现方式中,所述装置还包括响应模块,所述响应模块用于在所述获取模块获取所述M个第二声音信号对应的M个语音命令之后,所述响应模块用于响应所述M个语音命令。
结合第三方面和第五中可能的实现方式中,所述响应模块用于响应所述M个语音命令包括:根据所述M个语音命令对应的M个不同位置的优先级,优先响应高优先级的语音命令。
从以上技术方案可以看出,本发明实施例具有以下优点:利用波束成型算法,根据位置参数,从K个第一声音信号中提取M个第二声音信号,从而可以确定每个第二声音信号对应的发出位置,通过这种方法,可以高效的提取不同位置发出的声音信号,提供语音识别能力,为用户提供了更高的用户体验。并通过优先级的方法来处理冲突命令,减少车载中控设备同时响应多个命令带来的误差。
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种定位声音发出位置的方法流程图;
图2A是本发明实施例提供了定位声音发出位置的汽车内室位置示意图;
图2B是本发明另一实施例提供了定位声音发出位置的汽车内室位置示意图;
图3是本发明另一实施例提供了一种定位声音发出位置的方法流程图;
图3A是本发明另一实施例提供了一种定位声音发出位置的方法流程图;
图3B是本发明另一实施例提供了一种定位声音发出位置的方法流程图;
图4是本发明实施例提供的终端设备400结构示意图。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种定位声音发出位置的方法,在本发明实施例中,涉及到的终端设备可以为车载中控设备、智能手机、平板电脑等。
在现有技术中,声音采集传感器采集声音信号的方案结合波束成型算法被应用于采集声音信号和语音识别,通过这种方式已经大大提高了语音识别的成功率,但是通过这种方式只能识别单一的一个声音发出位置发出的声音信号,当有多个位置的声音发出位置发出声音信号时,语音识别系统无法同时识别多个声音信号。
在本发明实施例中,第一声音信号或者第二声音信号仅用于区分,并不代表次序或者顺序。
图1是本发明实施例提供的一种定位声音发出位置的方法流程图,本发明实施例的应用场景可以为任意声音采集和语音识别的场景,本发明实施例中,以车载系统中的声音采集和语音识别为例,所述方法包括以下步骤:
S101,采集K个第一声音信号;其中,K为大于等于2的整数。
在车载系统中,车载系统内部有K个声音采集传感器,处理器则可以采集K个第一声音信号;其中,K为大于等于2的整数。
例如,在车载系统中,可以设置K为2,即可以在驾驶室和副驾驶室里分别安装了第一声音采集传感器和第二声音采集传感器。
第一声音采集传感器和第二声音采集传感器同时采集第一声音信号。可选的,在车载系统中,还可以在车载后排座位或车载内其他位置安装其他声音采集传感器。
在本发明实施例中,第一声音信号为车载系统内部的环境声音,包括从车载内不同位置发出的声音信号和车外的声音信号。其中,所述第一声音信号可以包括从驾驶室位置(例如,如图2A所示,位置①)发出的声音信号,从副驾驶室位置(例如,如图2A所示,位置②)发出的声音信号,从车载系统后排座位的位置(例如,如图2A所示,位置③和位置④)发出的声音信号和车载系统外部的噪音中的至少一个。
S102,根据与N个不同位置对应的N个位置参数,从所述K个第一声音信号中提取M个第二声音信号;其中M小于等于N,N为大于等于2的整数。
同样以车载系统的情况为例进行说明,由于第一声音采集传感器和第二声音采集传感器在空间位置上坐标不重合,而且第一声音采集传感器和第二声音采集传感器拉开了一定的距离。如图2A所示,第一声音采集传感器和第二声音采集传感器分别设置在车载系统的中后视镜A的左右两侧。第一声音采集传感器设置在车载系统的位置C,第二声音采集传感器设置在车载系统的位置B。因此,第一声音采集传感器和第二声音采集传感器采集到的声音信号的时间不相同,从而,对于第一声音采集传感器采集到的声音信号和第二声音采集传感器采集到的声音信号会形成一个相位差。
在本发明另一实施例中,如图2B所示,车载系统包括4个声音采集传感器,此时,K为4。所述4个声音采集传感器设置在车载系统的中央位置,如图2B所示。
从所述K个第一声音信号中提取M个第二声音信号,具体可以为利用波束成型算法,从K个第一声音信号中,提取出M个第二声音信号;也可以为利用波束成型算法,从K个第一声音信号中,过滤其他声音信号,提取M个第二声音信号。
例如,声音信号发出的位置为驾驶室位置,对应的位置参数为驾驶室位置的参数,车载中控设备根据与驾驶室对应的驾驶室的位置参数,从所述K个第一声音信号中提取从驾驶室发出的第二声音信号。
S103,确定每个第二声音信号对应的位置。利用波束成型算法,所述车
载中控设备分别根据N个位置参数,从所述K个第一声音信号中提取M个第二声音信号。
例如,当位置参数是驾驶室的位置参数时,利用波束成型算法,根据驾驶室的位置参数,提取第二声音信号,并根据所述第二声音信号对应的位置参数,确定所述提取的第二声音信号对应的发出位置为驾驶室。
本发明提供了一种定位声音发出位置的方法,利用波束成型算法,根据位置参数,从K个第一声音信号中提取M个第二声音信号,从而可以确定每个第二声音信号对应的发出位置。通过这种方法,可以高效的提取不同位置发出的声音信号,提高了语音识别能力,为用户提供了更高的用户体验。
图3是本发明另一实施例提供了一种定位声音发出位置的方法流程图。本发明实施例同样以应用于车载系统为例进行说明,如图3所示,所述方法包括以下步骤:
S301a,设置响应N个不同位置的语音命令的优先级。
同样以图2A的位置示意图为例,图2A中,位置①为驾驶室位置,位置②为副驾驶室位置,位置③为车载系统后排座位左侧的位置,位置④为车载系统后排座位右侧的位置。
在本发明实施例中,以车载系统为例,假设K为2,N为4,M为2。
车载中控设备在车载系统内根据4个不同位置,设置响应4个不同位置的语音命令的优先级。
例如,以普通家用轿车设置的语音命令优先级为例。
命令 | 开天窗 | 关天窗 | 开收音机 | 播音乐 |
位置① | 1 | 1 | 1 | 1 |
位置② | 1 | 1 | 2 | 2 |
位置③ | 2 | 2 | 3 | 3 |
位置④ | 2 | 2 | 4 | 4 |
表(1) 普通家用轿车设置的语音命令优先级
从表(1)中可以看出来,当位置①发出如“开天窗”、“关天窗”、“开收音机”或者“播音乐”等命令时,位置①发出命令的优先级高于其他位置发出的同样语义的命令的优先级。
在本发明另一实施例中,设置响应N个不同位置的语音命令的优先级时,
加入儿童和成人声音判断因素。设置语音命令为儿童声音的优先级为低优先级或者设置当语音命令为儿童声音时,屏蔽儿童声音的语音命令,设置语音命令为成人声音的优先级为高优先级。
在本发明实施例中以位置①发出命令“空调启动”和位置④同时发出命令“空调关闭”为例。
S301,采集K个第一声音信号。
在本发明实施例中,以K为2举例说明。
其中,在车载系统中,在中后视镜A的左右两侧分别安装了第一声音采集传感器和第二声音采集传感器。
第一声音采集传感器和第二声音采集传感器同时采集第一声音信号。可选的,在车载系统中,还可以在车载后排座位或车载内其他位置安装其他声音采集传感器。
例如,当位置①发出命令“空调启动”的声音信号和位置④同时发出命令“空调关闭”的声音信号时,第一声音采集传感器和第二声音采集传感器同时采集到位置①发出的命令“空调启动”的声音信号,同样第一声音采集传感器和第二声音采集传感器同时采集到位置④发出的命令“空调关闭”的声音信号。
S302,根据与N个不同位置对应的N个位置参数,从所述K个第一声音信号中提取M个第二声音信号;其中M小于等于N,N为大于等于2的整数。
在本发明实施例中,以N为4,M为2进行举例说明。
由于第一声音采集传感器和第二声音采集传感器在空间位置上坐标不重合,而且第一声音采集传感器和第二声音采集传感器拉开了一定的距离。因此,第一声音采集传感器和第二声音采集传感器采集到的声音信号的时间不相同,从而,对于第一声音采集传感器采集到的声音信号和第二声音采集传感器采集的声音信号会形成一个相位差。
本发明以第一声音采集传感器和第二声音采集传感器设置在中后视镜左右为例,本发明对声音采集传感器的数量不做限制,对声音采集传感器的位置也不做限制。例如,还可以将其他声音采集传感器设置在可能发出声音的位置旁边,如安装在如图2A所示的位置①或位置②的座位的后侧。
例如,车载中控设备根据预置的位置①的位置参数,提取从位置①发出的
第二声音信号。利用波束成型算法,根据预置的位置①的位置参数,车载中控设备从采集的第一声音信号中提取从位置①发出的第二声音信号。
同时,车载中控设备根据预置的位置④的位置参数,提取从位置④发出的第二声音信号。利用波束成型算法,根据预置的位置④的位置参数,车载中控设备从采集的第一声音信号中提取从位置④发出的第二声音信号。
例如,车载中控设备利用波束成型算法,根据位置①的位置参数,提取符合预置的位置①的位置参数的声音信号。如,采集到从位置①发出的“空调启动”的声音信号;车载中控设备利用波束成型算法,根据位置④的位置参数,提取符合预置的位置②的位置参数的声音信号。如,采集到从位置④发出的“空调关闭”的声音信号。
S303,确定每个第二声音信号对应的位置。
利用波束成型算法,所述车载中控设备分别根据4个位置参数,从所述2个第一声音信号中提取2个第二声音信号。
例如,当位置参数是位置①的位置参数时,利用波束成型算法,根据位置①的位置参数,提取从位置①发出的第二声音信号,并根据所述第二声音信号对应的位置参数,确定所述提取的第二声音信号对应的发出位置为位置①。
S304,对提取的所述M个第二声音信号进行语音识别。
车载中控设备对所述提取的声音信号进行语音识别,识别提取的声音信号。
例如,车载中控设备对从位置①提取的声音信号进行语音识别,识别提取出的声音信号为“空调启动”;车载中控设备对从位置④提取的声音信号进行语音识别,识别提取出的声音信号为“空调关闭”。
S305,获取所述M个第二声音信号对应的语音命令。
车载中控设备获取所述提取的M个第二声音信号对应的语音命令。
例如,车载中控设备获取所述提取的位置①发出的声音信号对应的语音命令,获取“空调启动”的语音命令;并且,车载中控设备获取所述提取的位置④发出的声音信号对应的语音命令,获取“空调关闭”的语音命令。
S306,响应所述M个语音命令。
车载中控设备根据获取的所述提取的M个第二声音信号对应的语音命令,响应所述M个语音命令。
例如,车载中控设备获取到从位置①发出的“空调启动”的语音命令后,响应所述语音命令,启动空调。
在本发明另一实施例中,车载中控设备对位置①提取的声音信号和位置④提取的声音信号进行语音识别,识别提取的声音信号。车载中控设备对提取的从位置①发出的声音信号和从位置④发出的声音信号进行语音识别,识别提取的声音信号。获取所述提取的位置①发出的声音信号对应的语音命令,和获取所述提取的位置④发出的声音信号对应的语音命令,例如,获取位置①发出的“空调启动”和位置④发出的“空调关闭”的语音命令。车载中控设备根据获取的提取的位置①发出的“空调启动”和位置④发出的“空调关闭”的语音命令,响应所述2个语音命令。可选的,当车载中控设备语音识别到两个位置的语音命令时,会根据所述2个语音命令对应的2个不同位置的优先级,优先响应高优先级的语音命令,例如,位置①的优先级高于位置④的优先级,车载中控设备先响应位置①的语音命令“空调启动”,从而开启空调。车载中控设备再响应位置④的语音命令“空调关闭”,此时由于车载中控设备响应位置①的语音命令为“空调开启”,位置④的语音命令为“空调关闭”,位置①的语音命令和位置④的语音命令为冲突命令,车载中控设备无法同时响应位置①的语音命令和位置④的语音命令。因此,车载中控设备对位置④的声音信号进行语音识别后,获取提取的声音信号对应的语音命令,不响应位置④的语音命令。通过优先级的方法来处理冲突命令,减少车载中控设备响应多个冲突命令时,由于命令冲突带来的车载中控设备无法做出正确的响应,减少响应错误带来的误差。
其中,所述冲突命令具体为,如果至少两个命令会使用同一资源、且执行所述至少两个命令时,对所述使用的同一资源的操作不同,则所述至少两个命令为冲突命令。
在本发明另一实施例中,当获取的两个语音命令冲突时,增加时间判断因素,当高优先级的命令被识别之后的预设时间T1时间内,车载中控设备识别到冲突命令命令,但是识别到的冲突命令的优先级较低时,则忽略优先级较低的命令命令。若高优先级命令被识别之后的预设时间T1时间之后,车载中控设备识别到冲突命令时,车载中控设备则按照识别到的语音命令的时间顺序来顺序响应获取的语音命令。
图3A是本发明另一实施例提供了一种定位声音发出位置的方法流程图,在本发明另一实施例中,在执行步骤S301之前,还可以执行下列步骤:
S401,判断车载系统的至少一个座位是否坐人。
具体的,车载系统可以通过重力感应的方式判断车载系统的座位是否坐人。
例如,通过重力感应的方式判断图2A中的车载系统的座位是否坐人。如判断图2A中的位置①,位置②,位置③或者位置④是否坐人。
当所述车载系统判断所述车载系统的所有座位都没有坐人时,不执行步骤S301。
当所述车载系统判断所述车载系统的至少一个座位坐人时,执行步骤S301。
在采集声音信号之前,首先判断车载系统的至少一个座位上是否坐人,只有在车载系统的座位上坐人,再来定位声音发出的位置,提高声音采集的效率和提高确定声音发出位置的效率。
在本发明另一实施例中,如图3B所示,可以在执行步骤S305后,执行步骤S305a:识别提取的所述M个第二声音信号的声纹。
S305b:测量车载系统的坐人的座位上,用户的重量。
S305c:结合测量的用户的重量和识别的第二声音信号的声纹,确定所述用户的身份。
S305d:根据所述确定的所述用户的身份,确定所述用户发出的第二声音信号对应的语音命令的优先级。
S305e:根据所述用户发出的第二声音信号对应的语音命令的优先级,响应所述第二声音信号对应的语音命令。
通过结合重力感应和声纹识别的方式,确定用户的身份和用户发出的声音信号对应的语音命令的优先级。结合用户发出的声音信号对应的语音命令的优先级,确定响应多个语音命令的优先级。减小由于需要响应多个语音命令,给车载中控设备系统带来的误差和错误。
本发明提供了一种定位声音发出位置的方法,利用波束成型算法,根据位置参数,从K个第一声音信号中提取M个第二声音信号,从而可以确定每个第二声音信号对应的发出位置。更进一步地,设置语音命令的优先级,通过优
先处理高优先级的方法来处理冲突命令,减少车载中控设备响应多个冲突命令带来的冲突,减少响应错误带来的误差,提高了用户体验。
图4是本发明实施例提供了一种终端设备400。可用于执行本发明实施例前述的方法。如图4所示,该终端设备400可以为包括手机、平板电脑、PDA(Personal Digital Assistant,个人数字助理)、POS(Point of Sale,销售终端)、车载中控终端设备等终端设备,终端设备400包括RF(Radio Frequency,射频)电路410、存储器420、输入装置430、显示装置440、传感器450、音频电路460、WiFi(wireless fidelity,无线保真)模块470、处理器480、以及电源490等部件。本领域技术人员可以理解,图4中示出的终端设备结构只做实现方式的举例,并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
RF电路410可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器480处理;另外,将设计上行的数据发送给基站。通常,RF电路410包括但不限于天线、至少一个放大器、收发信机、耦合器、LNA(Low Noise Amplifier,低噪声放大器)、双工器等。此外,RF电路410还可以通过无线通信与网络和其他终端设备通信。所述无线通信可以使用任一通信标准或协议,包括但不限于GSM(Global System of Mobile communication,全球移动通讯系统)、GPRS(General Packet Radio Service,通用分组无线服务)、CDMA(Code Division Multiple Access,码分多址)、WCDMA(Wideband Code Division Multiple Access,宽带码分多址)、LTE(Long Term Evolution,长期演进)、电子邮件、SMS(Short Messaging Service,短消息服务)等。
存储器420可用于存储软件程序以及模块,处理器480通过运行存储在存储器420的软件程序以及模块,从而执行终端设备400的各种功能应用以及数据处理。存储器420可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端设备400的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器420可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
显示装置440可用于显示由用户输入的信息或提供给用户的信息以及终端设备400的各种菜单。显示装置440可包括显示面板441,可选的,可以采用LCD(Liquid Crystal Display,液晶显示器)、OLED(Organic Light-Emitting Diode,有机发光二极管)等形式来配置显示面板441。进一步的,触控面板431可覆盖显示面板441,当触控面板431检测到在其上或附近的触摸操作后,传送给处理器480以确定触摸事件的类型,随后处理器480根据触摸事件的类型在显示面板441上提供相应的视觉输出。虽然在图4中,触控面板431与显示面板441是作为两个独立的部件来实现终端设备400的输入和输入功能。但是在某些实施例中,可以将触控面板431与显示面板441集成而实现终端设备400的输入和输出功能,例如,触控面板431与显示面板441可以集成为触摸屏,实现终端设备400的输入和输出功能。
终端设备400还可包括至少一种传感器450,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板441的亮度,接近传感器可在终端设备400移动到耳边时,关闭显示面板441或者背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于终端设备400还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路460、扬声器461,传声器462可提供用户与终端设备400之间的音频接口。音频电路460可将接收到的音频数据转换后的电信号,传输到扬声器461,由扬声器461转换为声音信号输出;另一方面,传声器462将收集的声音信号转换为电信号,由音频电路460接收后转换为音频数据,再将音频数据输出处理器480处理后,经RF电路410以发送给比如另一手机,或者将音频数据输出至存储器420以便进一步处理。
终端设备400通过WiFi模块470可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图4示出了WiFi模块470,但是可以理解的是,其并不属于终端设备400的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器480是终端设备400的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器420内的软件程序和/或模块,以及调用存储在存储器420内的数据,执行终端设备400的各种功能和处理数据,从而对终端设备进行整体监控。可选的,处理器480可包括一个或多个处理单元;优选的,处理器480可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器480中。处理器480具体可以为中央处理器(Central Processing Unit,CPU)。
终端设备400还包括给各个部件供电的电源490(比如电池),优选的,电源可以通过电源管理系统与处理器480逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
在本发明实施例中,终端设备400包括:K个声音采集传感器450和处理器480具有以下功能:
声音采集传感器450,用于采集K个第一声音信号;其中K为大于等于2的整数。
具体的,所述K个声音采集传感器在三维空间内的坐标不同。
处理器480,用于根据与N个不同位置对应的N个位置参数,从所述K个第一声音信号中提取M个第二声音信号,并确定每个第二声音信号对应的位置,其中M小于等于N,N为大于等于2的整数。
在本发明另一实施例中,所述处理器480用于确定每个第二声音信号对应的位置,具体包括:根据第L个第二声音信号对应的位置参数,确定所述第L个第二声音信号对应的位置L;其中,第L个第二声音信号为所述M个第二声音信号中的任意一个。
在本发明另一实施例中,所述处理器480还用于从所述K个第一声音信号中提取M个第二声音信号后,对提取的所述M个第二声音信号进行语音识别,并用于获取所述M个第二声音信号对应的M个语音命令。
在本发明另一实施例中,终端设备400还包括:输出装置510,所述输出装置510,用于在所述处理器获取所述M个第二声音信号对应的M个语音命令之后,响应所述M个语音命令。
所述输出装置510用于响应所述M个语音命令,具体包括:所述输出装
置用于根据所述M个语音命令对应的M个不同位置的优先级,优先响应优先级高的命令。
在本发明实施例中,所述输出装置510具体可以为音频电路460或者显示装置440。
本发明实施例中,提供了一种定位声音发出位置的方法和终端设备,利用波束成型算法,根据位置参数,从K个第一声音信号中提取M个第二声音信号,从而可以确定每个第二声音信号对应的发出位置,通过这种方法,可以高效的提取不同位置发出的声音信号,提供语音识别能力,为用户提供了更高的用户体验。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元、算法及方法步骤,能够以计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的移动终端和接入终端的分别执行了本发明中所述的方法实施例里的工作过程,具体工作可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,所揭露的服务器和方法,可以通过其它的方式实现。例如,以上所描述的服务器实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元
中。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序命令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (13)
- 一种定位声音发出位置的方法,其特征在于,所述方法包括:采集K个第一声音信号;其中,K为大于等于2的整数;根据与N个不同位置对应的N个位置参数,从所述K个第一声音信号中提取M个第二声音信号;其中M小于等于N,N为大于等于2的整数;确定每个第二声音信号对应的位置。
- 根据权利要求1所述的方法,其特征在于,所述根据与N个不同位置对应的N个位置参数,从所述K个第一声音信号中提取M个第二声音信号,具体包括:利用波束成型算法,分别根据所述N个位置参数,从所述K个第一声音信号中提取M个第二声音信号。
- 根据权利要求1或2所述的方法,其特征在于,所述确定每个第二声音信号对应的位置,具体包括:根据第L个第二声音信号对应的位置参数,确定所述第L个第二声音信号对应的位置L;其中,第L个第二声音信号为所述M个第二声音信号中的任意一个。
- 根据权利要求1-3任一所述的方法,其特征在于,从所述K个第一声音信号中提取M个第二声音信号后,所述方法还包括:对提取的所述M个第二声音信号进行语音识别;获取所述M个第二声音信号对应的M个语音命令。
- 根据权利要求4所述的方法,其特征在于,在获取所述M个第二声音信号对应的M个语音命令之后,所述方法还包括:响应所述M个语音命令。
- 根据权利要求5所述的方法,其特征在于,所述响应所述M个语音命令包括:根据所述M个语音命令对应的M个不同位置的优先级,优先响应高优先级的语音命令。
- 一种终端设备,其特征在于,所述终端设备包括:K个声音采集传感器,用于采集K个第一声音信号;其中K为大于等于2的整数;处理器,用于根据与N个不同位置对应的N个位置参数,从所述K个第一声音信号中提取M个第二声音信号,并确定每个第二声音信号对应的位置,其中M小于等于N,N为大于等于2的整数。
- 根据权利要求7所述的终端设备,其特征在于,所述处理器用于根据与N个不同位置对应的N个位置参数,从所述K个第一声音信号中提取M个第二声音信号,具体包括:所述处理器用于利用波束成型算法,分别根据所述N个位置参数,从所述K个第一声音信号中提取M个第二声音信号。
- 根据权利要求7或8所述的终端设备,其特征在于,所述处理器用于确定每个第二声音信号对应的位置,具体包括:根据第L个第二声音信号对应的位置参数,确定所述第L个第二声音信号对应的位置L;其中,第L个第二声音信号为所述M个第二声音信号中的任意一个。
- 根据权利要求7-9任一所述的终端设备,其特征在于,所述处理器还用于从所述K个第一声音信号中提取M个第二声音信号后,对提取的所述M个第二声音信号进行语音识别,并用于获取所述M个第二声音信号对应的M个语音命令。
- 根据权利要求7-10任一所述的终端设备,其特征在于,所述终端设备还包括输出装置;所述输出装置,用于在所述处理器获取所述M个第二声音信号对应的M个语音命令之后,响应所述M个语音命令。
- 根据权利要求11所述的设备,其特征在于,所述输出装置用于响应所述M个语音命令,具体包括:所述输出装置用于根据所述M个语音命令对应的M个不同位置的优先级,优先响应优先级高的命令。
- 根据权利要求7-12所述的设备,其特征在于,所述K个声音采集传感器在三维空间内的坐标不同。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2015/079391 WO2016183825A1 (zh) | 2015-05-20 | 2015-05-20 | 一种定位声音发出位置的方法和终端设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107430524A true CN107430524A (zh) | 2017-12-01 |
CN107430524B CN107430524B (zh) | 2020-10-27 |
Family
ID=57319145
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580076714.3A Active CN107430524B (zh) | 2015-05-20 | 2015-05-20 | 一种定位声音发出位置的方法和终端设备 |
Country Status (6)
Country | Link |
---|---|
US (1) | US10410650B2 (zh) |
EP (1) | EP3264266B1 (zh) |
JP (1) | JP6615227B2 (zh) |
KR (1) | KR102098668B1 (zh) |
CN (1) | CN107430524B (zh) |
WO (1) | WO2016183825A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110556113A (zh) * | 2018-05-15 | 2019-12-10 | 上海博泰悦臻网络技术服务有限公司 | 基于声纹识别的车辆控制方法与云端服务器 |
CN111319566A (zh) * | 2018-12-14 | 2020-06-23 | 现代自动车株式会社 | 车辆的语音识别功能链接控制系统和方法 |
CN111786860A (zh) * | 2020-06-29 | 2020-10-16 | 广东美的制冷设备有限公司 | 家电及其控制方法和计算机可读存储介质 |
WO2024078460A1 (zh) * | 2022-10-13 | 2024-04-18 | 广州小鹏汽车科技有限公司 | 语音处理方法、语音交互方法、服务器及存储介质 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019069731A1 (ja) * | 2017-10-06 | 2019-04-11 | ソニー株式会社 | 情報処理装置、情報処理方法、プログラム、および移動体 |
DE102018212902A1 (de) * | 2018-08-02 | 2020-02-06 | Bayerische Motoren Werke Aktiengesellschaft | Verfahren zum Bestimmen eines digitalen Assistenten zum Ausführen einer Fahrzeugfunktion aus einer Vielzahl von digitalen Assistenten in einem Fahrzeug, computerlesbares Medium, System, und Fahrzeug |
US10944588B2 (en) * | 2018-11-29 | 2021-03-09 | International Business Machines Corporation | Resolving conflicting commands received by an electronic device |
WO2020184753A1 (ko) * | 2019-03-12 | 2020-09-17 | 엘지전자 주식회사 | 음성 추출 필터를 이용하여 음성 제어를 수행하는 인공 지능 장치 및 그 방법 |
CN110297702B (zh) * | 2019-05-27 | 2021-06-18 | 北京蓦然认知科技有限公司 | 一种多任务并行处理方法和装置 |
JP7198741B2 (ja) * | 2019-12-27 | 2023-01-04 | 本田技研工業株式会社 | 車両操作権管理装置、車両操作権管理方法及びプログラム |
KR20210133600A (ko) * | 2020-04-29 | 2021-11-08 | 현대자동차주식회사 | 차량 음성 인식 방법 및 장치 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090055180A1 (en) * | 2007-08-23 | 2009-02-26 | Coon Bradley S | System and method for optimizing speech recognition in a vehicle |
US20140294195A1 (en) * | 2013-03-28 | 2014-10-02 | Jvis-Usa, Llc | Speaker system such as a sound bar assembly having improved sound quality |
CN104464739A (zh) * | 2013-09-18 | 2015-03-25 | 华为技术有限公司 | 音频信号处理方法及装置、差分波束形成方法及装置 |
CN104442622A (zh) * | 2013-09-25 | 2015-03-25 | 现代自动车株式会社 | 用于车辆的声音控制系统和方法 |
US20150110287A1 (en) * | 2013-10-18 | 2015-04-23 | GM Global Technology Operations LLC | Methods and apparatus for processing multiple audio streams at a vehicle onboard computer system |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0418831A (ja) | 1990-05-14 | 1992-01-23 | Sony Corp | 遠隔制御装置 |
JP3863306B2 (ja) * | 1998-10-28 | 2006-12-27 | 富士通株式会社 | マイクロホンアレイ装置 |
JP3715584B2 (ja) | 2002-03-28 | 2005-11-09 | 富士通株式会社 | 機器制御装置および機器制御方法 |
JP4327510B2 (ja) | 2003-06-05 | 2009-09-09 | コニカミノルタビジネステクノロジーズ株式会社 | リモート操作システム |
CN1815556A (zh) * | 2005-02-01 | 2006-08-09 | 松下电器产业株式会社 | 可利用语音命令操控车辆的方法及系统 |
US8214219B2 (en) * | 2006-09-15 | 2012-07-03 | Volkswagen Of America, Inc. | Speech communications system for a vehicle and method of operating a speech communications system for a vehicle |
JP4547721B2 (ja) | 2008-05-21 | 2010-09-22 | 株式会社デンソー | 自動車用情報提供システム |
US8141115B2 (en) * | 2008-12-17 | 2012-03-20 | At&T Labs, Inc. | Systems and methods for multiple media coordination |
US8660782B2 (en) | 2010-03-31 | 2014-02-25 | Denso International America, Inc. | Method of displaying traffic information and displaying traffic camera view for vehicle systems |
KR101987966B1 (ko) | 2012-09-03 | 2019-06-11 | 현대모비스 주식회사 | 차량용 어레이 마이크의 음성 인식 향상 시스템 및 그 방법 |
TWI598774B (zh) * | 2013-10-25 | 2017-09-11 | 和冠股份有限公司 | 電磁書寫單元及兼具墨水與電磁書寫功能的電磁式手寫筆 |
US20160012827A1 (en) * | 2014-07-10 | 2016-01-14 | Cambridge Silicon Radio Limited | Smart speakerphone |
US20160080861A1 (en) * | 2014-09-16 | 2016-03-17 | Toyota Motor Engineering & Manufacturing North America, Inc. | Dynamic microphone switching |
DE102015220400A1 (de) * | 2014-12-11 | 2016-06-16 | Hyundai Motor Company | Sprachempfangssystem im fahrzeug mittels audio-beamforming und verfahren zum steuern desselben |
US10304463B2 (en) * | 2016-10-03 | 2019-05-28 | Google Llc | Multi-user personalization at a voice interface device |
-
2015
- 2015-05-20 JP JP2017557075A patent/JP6615227B2/ja active Active
- 2015-05-20 WO PCT/CN2015/079391 patent/WO2016183825A1/zh active Application Filing
- 2015-05-20 KR KR1020177030167A patent/KR102098668B1/ko active IP Right Grant
- 2015-05-20 CN CN201580076714.3A patent/CN107430524B/zh active Active
- 2015-05-20 US US15/566,979 patent/US10410650B2/en active Active
- 2015-05-20 EP EP15892204.7A patent/EP3264266B1/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090055180A1 (en) * | 2007-08-23 | 2009-02-26 | Coon Bradley S | System and method for optimizing speech recognition in a vehicle |
US20140294195A1 (en) * | 2013-03-28 | 2014-10-02 | Jvis-Usa, Llc | Speaker system such as a sound bar assembly having improved sound quality |
CN104464739A (zh) * | 2013-09-18 | 2015-03-25 | 华为技术有限公司 | 音频信号处理方法及装置、差分波束形成方法及装置 |
CN104442622A (zh) * | 2013-09-25 | 2015-03-25 | 现代自动车株式会社 | 用于车辆的声音控制系统和方法 |
US20150110287A1 (en) * | 2013-10-18 | 2015-04-23 | GM Global Technology Operations LLC | Methods and apparatus for processing multiple audio streams at a vehicle onboard computer system |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110556113A (zh) * | 2018-05-15 | 2019-12-10 | 上海博泰悦臻网络技术服务有限公司 | 基于声纹识别的车辆控制方法与云端服务器 |
CN111319566A (zh) * | 2018-12-14 | 2020-06-23 | 现代自动车株式会社 | 车辆的语音识别功能链接控制系统和方法 |
CN111786860A (zh) * | 2020-06-29 | 2020-10-16 | 广东美的制冷设备有限公司 | 家电及其控制方法和计算机可读存储介质 |
WO2024078460A1 (zh) * | 2022-10-13 | 2024-04-18 | 广州小鹏汽车科技有限公司 | 语音处理方法、语音交互方法、服务器及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
EP3264266A4 (en) | 2018-03-28 |
EP3264266B1 (en) | 2020-08-05 |
WO2016183825A1 (zh) | 2016-11-24 |
EP3264266A1 (en) | 2018-01-03 |
JP6615227B2 (ja) | 2019-12-04 |
US10410650B2 (en) | 2019-09-10 |
JP2018524620A (ja) | 2018-08-30 |
CN107430524B (zh) | 2020-10-27 |
KR20170129249A (ko) | 2017-11-24 |
KR102098668B1 (ko) | 2020-04-08 |
US20180108368A1 (en) | 2018-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107430524A (zh) | 一种定位声音发出位置的方法和终端设备 | |
US10834237B2 (en) | Method, apparatus, and storage medium for controlling cooperation of multiple intelligent devices with social application platform | |
US10183680B2 (en) | Mobile terminal and method for controlling application for vehicle | |
US9743222B2 (en) | Method for controlling and an electronic device thereof | |
CN106499293B (zh) | 车窗控制方法、装置、移动终端及obd外设 | |
CN108023934B (zh) | 电子装置及其控制方法 | |
US20170243578A1 (en) | Voice processing method and device | |
CN106153065A (zh) | 音频视频导航设备、车辆及控制音频视频导航设备的方法 | |
US20180136661A1 (en) | Mobile electronic device and navigation method thereof | |
CN108764766A (zh) | 一种园区车辆管理的方法及装置 | |
CN110390573A (zh) | 一种产品配置方法和装置 | |
US9602910B2 (en) | Ear jack recognition method and electronic device supporting the same | |
CN109830114A (zh) | 交通信号灯提醒方法和装置 | |
CN106201682B (zh) | 一种应用控制方法及装置 | |
CN109672775A (zh) | 调节唤醒灵敏度的方法、装置及终端 | |
CN106408995A (zh) | 一种信息处理方法及其相关设备 | |
CN109147371A (zh) | 行驶路线确定方法及装置和计算机设备 | |
CN106506296A (zh) | 一种智能设备的控制方法及控制系统 | |
CN107678822B (zh) | 一种信息处理方法及装置、终端和可读存储介质 | |
CN106713648B (zh) | 一种通信方法及移动终端 | |
CN112738730A (zh) | 搜救定位方法、装置及存储介质 | |
CN107484144A (zh) | 一种信息获取方法、终端、服务器及计算机存储介质 | |
CN113742027B (zh) | 交互方法、智能终端及可读存储介质 | |
CN207916789U (zh) | 一种基于蓝牙技术的车辆控制装置及系统 | |
CN113641110B (zh) | 处理方法、处理设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1242440 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |