CN110539721A - 一种车辆控制方法及其装置 - Google Patents
一种车辆控制方法及其装置 Download PDFInfo
- Publication number
- CN110539721A CN110539721A CN201910834613.8A CN201910834613A CN110539721A CN 110539721 A CN110539721 A CN 110539721A CN 201910834613 A CN201910834613 A CN 201910834613A CN 110539721 A CN110539721 A CN 110539721A
- Authority
- CN
- China
- Prior art keywords
- voice
- voice information
- vehicle
- matching
- terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 230000009471 action Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 238000001228 spectrum Methods 0.000 description 8
- 238000012549 training Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 239000000284 extract Substances 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 210000003928 nasal cavity Anatomy 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241001672694 Citrus reticulata Species 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 210000003484 anatomy Anatomy 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000005336 cracking Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60R—VEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
- B60R25/00—Fittings or systems for preventing or indicating unauthorised use or theft of vehicles
- B60R25/10—Fittings or systems for preventing or indicating unauthorised use or theft of vehicles actuating a signalling device
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60R—VEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
- B60R25/00—Fittings or systems for preventing or indicating unauthorised use or theft of vehicles
- B60R25/10—Fittings or systems for preventing or indicating unauthorised use or theft of vehicles actuating a signalling device
- B60R25/102—Fittings or systems for preventing or indicating unauthorised use or theft of vehicles actuating a signalling device a signal being sent to a remote location, e.g. a radio signal being transmitted to a police station, a security company or the owner
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/30—Services specially adapted for particular environments, situations or purposes
- H04W4/40—Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/80—Services using short range communication, e.g. near-field communication [NFC], radio-frequency identification [RFID] or low energy communication
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W76/00—Connection management
- H04W76/10—Connection setup
- H04W76/14—Direct-mode setup
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Mechanical Engineering (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Selective Calling Equipment (AREA)
Abstract
本发明实施例提供一种车辆控制方法及其装置,该方法包括:建立与第一终端之间的无线连接,所述无线连接的方式包括蓝牙方式和红外线方式中的至少一种;接收所述第一终端通过所述无线连接方式传输的第一语音信息;所述第一语音信息携带说话人对所述车辆的控制指令;根据所述第一语音信息和本地预存的第二语音信息进行声音匹配,以确定所述说话人的身份;当所述声音匹配成功时,根据所述第一语音信息携带的所述控制指令控制所述车辆。实施本发明实施例,可以减少非法获得车辆使用权的情况,降低车辆和私人信息存在的安全风险。
Description
技术领域
本申请涉及电子通信技术领域,尤其涉及一种车辆控制方法及其装置。
背景技术
随着智能化信息技术的发展,智能化操控汽车走入了人们的生活中,并逐渐成为人们日常生活中的必需品。汽车作为私人的较大资产,包含了很多个人娱乐、驾驶行为等基本信息,如若遭到非法窃取,可能会带来一些不必要的麻烦,甚至后果不堪设想,所以私人信息安全及车辆安全就变得格外重要。
现在市面上的开锁有机械开锁、遥控开锁、蓝牙开锁等方式,这些开锁方式不具有针对性,任何一个人只要拿到钥匙(如机械钥匙、遥控钥匙、蓝牙钥匙等),就有可能将车启动开走,另外还存在通过配制钥匙、软件破解蓝牙钥匙等非法方式获得车辆使用权的情况,因此存在严重的安全隐患。
发明内容
本发明实施例提供了一种车辆控制方法及其装置,可以克服现有技术的缺陷,保证车辆的使用安全,提升用户使用体验。
第一方面,本发明实施例提供一种车辆控制方法,包括:
建立与第一终端之间的无线连接,所述无线连接的方式包括蓝牙方式和红外线方式中的至少一种;
接收所述第一终端通过所述无线连接方式传输的第一语音信息;所述第一语音信息携带说话人对所述车辆的控制指令;
根据所述第一语音信息和本地预存的第二语音信息进行声音匹配,以确定所述说话人的身份;
当所述声音匹配成功时,根据所述第一语音信息携带的所述控制指令控制所述车辆。
可以看到,本发明实施例中,车辆的中控系统与第一终端建立无线连接后,接收由第一终端发送的第一语音信息,并与本地预存的第二语音信息进行声音匹配,来确定说话人的身份,若匹配成功,则中控系统提取第一语音信息携带的控制指令,并发送给相应的控制单元,控制单元控制相应执行单元执行操作,使合法使用者获得车辆的合法使用权。所以,实施本发明实施例能够保证车辆的使用安全,提升用户使用体验。
另外,可以看到,本发明实施例中,利用蓝牙和红外线方式来进行无线连接和无线传输,不需要实体连线,即可完成中控系统与第一终端的连接与语音的传输,且具有传输速度快、操作简单和实现成本较低的优势,在保证语音传输准确性的同时,提高速度。
基于第一方面,在可能的实施方式中,所述根据所述第一语音信息和本地预存的第二语音信息进行声音匹配,包括:
提取所述第一语音信息的声纹特征,与所述第二语音信息的声纹特征进行声纹匹配;
提取所述第一语音信息的语音特征,与所述第二语音信息的语音特征进行语音匹配;其中,所述语音特征包括词法特征、韵律特征、语种特征、信道特征中的至少一种。
可以看到,本发明实施例中,首先通过提取第一语音信息的声纹特征和语音特征两大类特征,其中语音特征又包含多方面的特征,语音信息的多特征提取方式,有助于增加语音的识别性;然后将第一语音信息的多特征与本地预存的第二语音信息的多特征进行匹配,这种多特征匹配方式,增加语音识别的准确性,提高说话人身份判定的正确性和车辆的使用安全性。
基于第一方面,在可能的实施方式中,所述根据所述第一语音信息携带的所述控制指令控制所述车辆,包括:
提取所述第一语音信息的所述控制指令;
将所述控制指令发送给所述车辆的执行结构的控制单元,以控制所述执行结构;其中所述执行结构包括车门、发动机、空调、座椅、后备箱门、后视镜中的至少一种。
可以看到,本发明实施例中,首先提取第一语音信息携带的控制指令,其中控制指令中含有执行结构的相关信息,中控系统根据控制指令来确定执行结构的控制单元,将控制指令发送给相应的控制单元,再由控制单元控制执行结构执行相应操作。这样根据第一语音信息的内容来实现对不同结构的控制,确保车辆的安全使用,提升用户的使用体验。
基于第一方面,在可能的实施方式中,当所述声音匹配不成功时,执行以下至少一种操作:
记录所述第一语音信息的声纹特征为非法;
通过蜂鸣器进行语音警示;
开启双闪灯进行警示;
向第二终端发送警示消息。
可以看到,本发明实施例中,若是由于合法使用者的误操作,导致匹配不成功,则车辆的中控系统会对应做出一定的响应,以提醒合法使用者操作错误,匹配不成功;若对于非法使用者的非法操作,导致匹配不成功,该实施方式有利于车主或被授权用户可以及时采取一些措施,以降低车辆存在的安全隐患,确保车辆的安全使用,同时也提升用户的使用体验。
第二方面,本发明实施例提供一种用于车辆控制的装置,包括:
无线模块,用于建立与第一终端之间的无线连接,所述无线连接方式包括蓝牙方式和红外线方式中的至少一种;
所述无线模块还用于,接收所述第一终端通过无线连接方式传输的第一语音信息,所述无线连接方式包括蓝牙方式和红外线方式中的至少一种;所述第一语音信息携带说话人对所述车辆的控制指令;
声音识别模块,用于根据所述第一语音信息和本地预存的第二语音信息进行声音匹配,以确定所述说话人的身份;
指令输出模块,用于当所述声音匹配成功时,根据所述第一语音信息携带的所述控制指令控制所述车辆。
在一具体实施例中,声音识别模块具体用于:提取所述第一语音信息的声纹特征,与所述第二语音信息的声纹特征进行声纹匹配。
在一具体实施例中,声音识别模块还用于:提取所述第一语音信息的语音特征,与所述第二语音信息的语音特征进行语音匹配;其中,所述语音特征包括词法特征、韵律特征、语种特征、信道特征中的至少一种。
在一具体实施例中,指令输出模块具体用于:当匹配成功时,提取所述第一语音信息的所述控制指令;将所述控制指令输出到所述车辆的执行结构的控制单元,以控制所述执行结构;其中所述执行结构包括车门、发动机、空调、座椅、后备箱门、后视镜中的至少一种。
在一具体实施例中,指令输出模块还用于:当所述声音匹配不成功时,输出以下至少一种操作指令:
记录所述第一语音信息的声纹特征为非法;
通过蜂鸣器进行语音警示;
开启双闪灯进行警示;
向第二终端发送警示消息。
在一种实现中,该装置可应用于车辆的中控系统。
本发明实施例提供的装置中的各个功能模块具体用于实现第一方面所描述的方法。
第三方面,本发明实施例提供一种车辆控制的系统,包括:车辆的中控系统,终端,车门控制模块,发动机控制模块,空调控制模块,后备箱控制模块等。车辆的中控系统可以通过无线的方式与终端通信,接收或发送一些信息和指令,所述无线连接的方式包括蓝牙方式和红外线方式中的至少一种;中控系统也可以对一些信息进行处理;终端用于获取用户输入的语音,通过无线的方式发送语音信息给车辆的中控系统,或者接收中控系统的反馈信息等;车门控制模块,是车门的控制单元,用来控制车门执行开关门的操作;发动机控制模块,是发动机的控制单元,用于控制发动机的启动;空调控制模块,用于控制空调的开关,温度高低,风速和风向等;后备箱控制模块,用于控制后备箱的开关等。本发明实施例提供的系统中的各个装置和功能模块具体用于实现第一方面所描述的方法。
第四方面,本发明实施例提供一种非易失性存储介质,用于存储程序指令,当该程序指令应用于车辆控制时,可用于实现第一方面所描述的方法。
第五方面,本发明实施例提供一种计算机程序产品,该计算机程序产品包括程序指令,当该计算机程序产品被车辆的中控系统执行时,该车辆的中控系统执行前述第一方面所述方法。该计算机程序产品可以为一个软件安装包,在需要使用前述第一方面的任一种可能的设计提供的方法的情况下,可以下载该计算机程序产品并在车辆的中控系统上执行该计算机程序产品,以实现第一方面所述方法。
可以看到,本发明实施例公开了一种基于人的声纹特征的车辆控制方法,该方法应用于车辆的中控系统。人的声纹具有特定性和稳定性,而且蕴含声纹特征的语音获取方便、自然;同时,运用蓝牙或红外线的无线连接方式建立中控系统与终端之间的连接,并用该无线方式传输语音信息,操作简单,成本低廉;采用声纹特征和语音特征相结合的特征提取方式对语音信息进行匹配识别,以确定说话人的身份,增大了识别的准确性,确保了车辆的安全性;当非法用户进行非法操作时,车辆的中控系统也会做出一定的回应,起到警示的作用,同时也会提醒合法用户其车辆正在被非法操作。所以实施本发明实施例能够确保车辆的使用安全,提升用户使用体验。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例涉及的车辆控制的基本物理要素示意图;
图2是本发明实施例提供的一种车辆控制方法示意图;
图3是本发明实施例提供的另一种车辆控制方法示意图;
图4是本发明实施例提供的一种硬件设备的结构示意图;
图5是本发明实施例提供的一种车辆的控制系统的结构示意图。
具体实施方式
随着计算机网络技术飞速发展,汽车智能化程度也越来越高。车辆的传统开锁方式有机械开锁、钥匙遥控开锁、蓝牙开锁等,这些开锁方式不是根据人的生物特征设计的,不具有特定性,任何一个人只要拿到钥匙,就有可能将车启动开走。而且在一定程度上存在捡到钥匙、软件破解蓝牙钥匙等非法获取到车辆使用权的情况,因此存在严重的安全风险。基于此,本发明实施例提供了一种车辆控制方法及其装置,用于减少非法使用者带来的车辆安全风险和私人信息安全风险。
下面结合本发明实施例中的附图对本发明实施例进行描述。本发明的实施方式部分使用的术语仅用于对本发明的具体实施例进行解释,而非旨在限定本发明。
本发明提供的声纹识别开锁方法技术,是基于人的声纹这个生物特性实现对车辆的开锁。为了便于理解本发明实施例的技术方案,首先解释本发明实施例涉及的相关概念。
声纹:声纹是用电声学仪器显示的携带言语信息的声波频谱。声纹不仅具有特定性,而且有相对稳定性的特点。成年以后,人的声音可保持长期相对稳定不变。无论讲话者是故意模仿他人声音和语气,还是耳语轻声讲话,即使模仿得惟妙惟肖,其声纹却始终相同。每个人发音讲话都是鼻腔、口舌、声道、胸肺多重配合的结果,任何两个人的声纹图谱都不相同。
声纹识别:声纹识别,生物识别技术的一种,也称为说话人识别,包括说话人辨认和说话人确认。声纹识别就是把声信号转换成电信号,再用计算机进行识别。
下面描述本发明实施例提供的一种系统架构。参见图1,本发明实施例提供的系统架构包括车辆和终端,车辆中设置有中控系统。车辆和终端之间可以进行无线交互。
其中,终端可以是手机、平板电脑、手环、录音笔、耳机等可实现无线连接方式的移动设备,甚至是具有蓝牙通信功能的蓝牙钥匙等。
无线交互的方式可以是蓝牙方式、红外线方式、Wifi方式、数据流量方式等的至少一种。
对于下文描述的各方法实施例,为了方便起见,将其都表述为一系列的动作步骤的组合,但是本领域技术人员应该知悉,本申请技术方案的具体实现并不受所描述的一系列的动作步骤的顺序的限制。
参见图2,基于上述系统架构,描述本发明实施例提供的一种车辆控制方法,该方法可应用于车辆的中控系统装置。该方法流程包括但不限于以下步骤:
步骤101.建立与第一终端之间的无线连接。
本发明实施例中,第一终端可以是手机、平板电脑、手环、录音笔、耳机等可实现无线连接方式的移动设备,甚至是具有蓝牙通信功能的蓝牙钥匙等。
本发明实施例中,无线连接可以是蓝牙方式、红外线方式、Wifi方式、数据流量方式等的至少一种。
在一具体实施例中,第一终端为平板电脑时,用户打开平板电脑的蓝牙,车辆的中控系统自动搜索周围的蓝牙设备,当检测到平板电脑的蓝牙名称时,与其配对,建立与平板电脑的无线连接。
在一具体实施例中,第一终端为手机时,用户开启手机红外线,车辆的中控系统检测到红外线或连接请求,并作出反馈回应,建立与手机的无线连接。
在一具体实施例中,第一终端为手环,开启手环的蓝牙,车辆的中控系统自动搜索周围的蓝牙设备,当检测到手环蓝牙名称时,与其配对,建立与手环的无线连接。
在一具有实施例中,打开平板电脑的Wifi,车辆的中控系统也可以通过Wifi建立与平板电脑的无线连接。
步骤102.接收第一终端通过无线连接方式传输的第一语音信息。
在本发明实施例中,终端可采集用户(即说话人)说话的语音,从而获得用户的第一语音信息,并将第一语音信息通过无线连接方式发送给车辆,车辆的中控系统通过无线连接方式接收该第一语音信息,其中,该第一语音信息携带说话人对车辆的控制指令。比如:说话人说“请打开车门”,则第一语音信息所携带说话人对车辆的控制指令为开车门指令;说话人说“请关闭车门”,则第一语音信息所携带说话人对车辆的控制指令为关车门指令;说话人说“请启动发动机”,则第一语音信息所携带说话人对车辆控制指令为启动发动机指令;说话人说“请打开空调”,则第一语音信息所携带有说话人对车辆的控制指令为开空调指令等等。
例如,更具体的,无线连接方式为蓝牙方式,用户的输入语音为“请打开后备箱门”,第一终端通过麦克风采集用户的输入语音,获得该用户的第一语音信息,即第一语音信息所携带了用于指示开后备箱门的控制指令。然后将第一语音信息通过蓝牙的方式发送到车辆的中控系统,车辆的中控系统通过蓝牙方式接收到该第一语音信息。
又例如,更具体的,无线连接方式为红外线方式,用户的输入语音为“请关闭空调”,第一终端通过录音的方式采集用户的输入语音,获得该用户的输入语音,第一语音信息所携带了用于指示关空调的控制指令。然后将第一语音信息通过红外线的方式发送到车辆的中控系统,车辆的中控系统通过红外线方式接收到该第一语音信息。
又例如,更具体的,无线连接方式为Wifi方式,用户的输入语音为“请启动发动机”,第一终端通过车机控制app中语音获取模块采集用户的输入语音,获得该用户的第一语音信息,第一语音信息所携带了用于指示启动发动机的控制指令。然后将第一语音信息通过Wifi方式发送到车辆的中控系统,车辆的中控系统通过Wifi方式接收到该第一语音信息。
步骤103.根据第一语音信息和本地预存的第二语音信息进行声音匹配,以确定说话人的身份。
本地预存的第二语音信息是指由车辆的中控系统预先录入的用户的语音信息,该语音信息可以是任意一个字或几个字或一句话或一段话等。该语音信息的录入方式可以有多种,比如:说话人在车里开启车辆的中控系统进入录音模式,直至录音完毕;或者也可以,说话人开启手机终端的录音功能,将语音录入手机终端,然后通过Wifi或数据流量等的无线连接方式输出到车辆的中控系统;或者也可以,说话人开启平板电脑的录音功能,将语音录入平板电脑终端,然后将平板电脑与车载有线连接,将第二语音信息输出到车辆的中控系统;或者也可以将语音直接录入到一终端的存储设备中,然后将该存储设备直接插入到车辆的中控系统,进而将第二语音信息拷贝到车辆的中控系统等等。
在一具体实施例中,本地预存的第二语音信息实际代表的是一个语音信息库,语音信息库里可能包括车主一个人的语音信息,进行匹配时,第一语音信息只需与库里的该语音信息的声音匹配即可,若匹配成功,则确定说话人身份为合法身份,若匹配不成功,则说明说话人身份为非法身份;语音信息库里也可能包括车主及授权用户等多人的语音信息,进行匹配时,第一语音信息可以遍历库里的多个语音信息进行声音匹配,若和其中某个语音信息匹配成功,则确定说话人身份为合法身份,若和其中任一语音信息皆匹配不成功,则说明说话人身份为非法身份。
在一具体实施例中,声音匹配方法可以使用模板匹配(Template Matching)方法。运用模板匹配方法进行声音匹配,首先是将本地预存的第二语音信息中每个类别(一个类别代表一个人)的声音建立一个或多个标准模板,通过分类决策将待匹配的第一语音信息与第二语音信息中每个类别的模板进行比对,根据与模板的匹配程度将第一语音信息划分到最相似的类别中,也就是完成第一语音信息与本地预存的第二语音信息的匹配。在模板匹配方法中常用的技术有,动态时间规整(DTW)、隐马尔可夫(HMM)理论、矢量量化(VQ)技术。
在一具体实施例中,声音匹配方法可以使用最近邻(k-Nearest Neighbor,kNN)方法。声音中存在的信息在短时间内较为平稳,可以用一些稳态特征来衡量,如:基音、声门增益、低阶反射系数等。最近邻方法进行声音匹配,将第二语音信息中所有人的声音信息作为样本训练集,对每个人的声音信息中的稳态特征进行统计计算,计算其均值、方差和概率密度函数等,每个人的统计量数据作为单个样本的数据。然后计算第一语音信息中的稳态特征的均值、方差和概率密度函数等统计量,并与样本训练集中的其均值、方差和概率密度函数等统计量进行比较,提取样本训练集中与第一语音信息的稳态特征的均值、方差和概率密度函数等统计量中最相似的(最近邻的)样本数据,并判定第一语音信息与该最相似的样本数据匹配,即完成第一语音信息与本地预存的第二语音信息的声音匹配。
在一具体实施例中,声音匹配方法可以使用卷积神经网络(Neural network)方法。使用神经网络方法对声音进行匹配,包括:特征提取阶段、样本训练阶段以及测试匹配阶段。特征提取阶段:通过计算得出第二语音信息中每个人的声音梅尔能量谱特征,并将梅尔能量谱特征分割成小尺寸的片段,作为训练样本。样本训练阶段:对梅尔能量谱特征片段进行训练,并将每个人的声音梅尔能量谱特征片段的训练样本赋予相应的标签,得到卷积神经网络模型。测试匹配阶段:对第一语音信息采用同样的特征提取方法,得到梅尔能量谱特征片段,并输入到训练好的卷积神经网络模型中,卷积神经网络输出与第一语音信息相匹配的标签,即第二语音信息,则整个神经网络完成第一语音信息与第二语音信息的匹配过程。
在一具体实施例中,本地预存的第二语音信息是车主A1直接在中控系统中录入的语音,当A1欲使用车辆时,通过终端输入A1的语音,终端获取第一语音信息,然后通过无线方式发送给车辆的中控系统,中控系统接收到第一语音信息,并将第一语音信息与本地预存的第二语音信息进行声音匹配,匹配成功,确定说话人的身份为合法身份。
在一具体实施例中,本地预存的第二语音信息包括:B1直接对着中控系统说话,中控系统接收到的语音信息;B2直接对着终端说话,然后终端通过无线连接方式将语音信息发送到车辆的中控系统,中控系统接收该语音信息;B3通过U盘将语音信息拷贝到车辆的中控系统,中控系统接收的语音信息。当B3欲使用车辆时,对着终端说话,终端获取到第一语音信息,然后通过无线方式发送给车辆的中控系统,中控系统接收到第一语音信息,并将第一语音信息与本地预存的第二语音信息(包括B1语音信息,B2语音信息和B3语音信息)进行声音匹配,匹配成功,确定说话人的身份为合法身份。当B4欲使用车辆时,对着终端说话,终端获取到第一语音信息,然后通过无线方式发送给车辆的中控系统,中控系统接收到第一语音信息,并将第一语音信息与本地预存的第二语音信息(包括B1语音信息,B2语音信息和B3语音信息)进行声音匹配,匹配不成功,确定说话人的身份为非法身份。
步骤104.当声音匹配成功时,根据第一语音信息携带的控制指令控制车辆。
当第一语音信息和本地预存的第二语音信息声音匹配成功时,车辆的中控系统提取第一语音信息中携带的控制指令,并将该指令发送到车辆的执行结构的控制单元,控制单元控制执行结构执行操作。其中执行结构包括车门、发动机、空调、座椅、后备箱门、后视镜中的至少一种。
在一具体实施例中,若第一语音信息为“请打开车门”,所携带的控制指令为开车门,当声音匹配成功时,提取该指令,并将该指令发送给车门控制模块,车门控制模块控制车门,使其执行打开的动作。
在一具体实施例中,若第一语音信息为“请关闭后备箱”,所携带的控制指令为关后备箱,当声音匹配成功时,提取该指令,并将该指令发送给后备箱控制模块,后备箱控制模块控制后备箱,使其执行关闭的动作。
在一具体实施例中,若第一语音信息为“请启动发动机”,所携带的控制指令为启动发动机,当声音匹配成功时,提取该指令,并将该指令发送给发动机控制模块,发动机控制模块控制发动机,使其执行启动的动作。
在一具体实施例中,若第一语音信息为“请打开空调”,所携带的控制指令为开空调,当声音匹配成功时,提取该指令,并将该指令发送给空调控制模块,空调控制模块控制空调,使其执行打开的动作。
可以看到,实施本发明实施例的技术方案,中控系统可以通过蓝牙或红外线等多种无线方式建立与终端的连接,也可以通过多种无线连接方式获取语音信息,将第一语音信息与本地预存的第二语音信息进行声音匹配,来确定说话人的身份,进而根据第一语音信息携带的控制指令,实现对车辆的控制,降低因非法获得车辆使用权而存在的安全隐患。
参见图3,基于上述系统架构,对终端和车辆之间的消息交互方法进行详细的描述。该方法流程包括但不限于以下步骤:
步骤201.终端接收用户的输入语音,获得第一语音信息。
在本发明实施例中,终端可以有很多种,在前文步骤101中已经介绍,在此不再赘述。
在一具体实施例中,终端接收用户的输入语音方式有很多种,可以是录音笔接收用户输入的语音,可以是手环接收用户输入的语音,可以是手机的车机控制app中的获取语音模块接收用户输入的语音,等等,本发明不做具体限定。
在本发明实施例中,终端接收的第一语音信息携带有说话人对车辆的控制指令,在前文步骤102中已经介绍,在此不再赘述。
步骤202.终端通过无线连接方式发送第一语音信息,车辆的中控系统通过无线连接方式接收第一语音信息。
本发明实施例中,无线连接方式的种类已在前文步骤101中介绍,在此不再赘述。
步骤203.提取第一语音信息的声纹特征,与本地预存的第二语音信息的声纹特征进行声纹匹配。
在本发明实施例中,车辆的中控系统在接收到第一语音信息后,提取第一语音信息的声纹特征。其中,声纹不仅具有特定性,而且有相对稳定性的特点。成年以后,人的声音可保持长期相对稳定不变。无论讲话者是故意模仿他人声音和语气,还是耳语轻声讲话,即使模仿得惟妙惟肖,其声纹却始终相同。每个人发音讲话都是鼻腔、口舌、声道、胸肺多重配合的结果,任何两个人的声纹图谱都不相同。所以,声纹特征指的是与人类的发音机制的解剖学结构有关的声学特征,例如:频谱、倒频谱、共振峰、基因、反射系数等等。
在一具体实施例中,若本地预存的第二语音信息为Z1的语音信息,那么无论Z1模仿Z2的声音,还是模仿Z3的声音,还是模仿其他任何人的声音,只要是第一语音信息为Z1的,那么声纹特征都是一样的,都能与本地预存的第二语音信息的声纹特征匹配成功。
在一具体实施例中,若本地预存的第二语音信息为Z1的语音信息,那么无论Z2模仿Z1的声音,还是Z3模仿Z1的声音,还是其他任何人模仿Z1的声音,只要第一语音信息不是Z1的,那么声纹特征都是不同的,无法与本地预存的第二语音信息的声纹特征匹配成功。
步骤204.提取第一语音信息的语音特征,与本地预存的第二语音信息的语音特征进行语音匹配。
在本发明一种实施例中,语音特征可以是词法特征。不同说话者会有不同的语言使用习惯,字词组合也具有很大的灵活性,同一语义有多种表达方式,这样我们可以利用词法特征来评估说话人的语音信息特征。
例如,一个字词的词法特征受前后字词的影响,也与说话者的表达方式和字词顺序等有关。比如,“一碗饭”、“一顿饭”、“一口饭”、“一粒饭”等,它们的词法特征有可能不同,又如,“不好说”和“说不好”,“事出有因、查无实据”和“查无实据、事出有因”,“我要学”和“要我学”等,它们每一组词语内的字词顺序对调一下,有可能导致词法特征不同。
在本发明一种实施例中,语音特征可以是韵律特征。韵律特征,是语言的一种音系结构,与句法和语篇结构、信息结构等其他语言学结构密切相关,韵律特征可以分为三个主要方面:语调、时域分布和重音,通过超音段特征实现。超音段特征包括音高,强度以及时间特性,由音位或音位群负载。
例如,像音高下倾、重读、停顿等都属于韵律特征。比如,同一个英文单词的美式英语读法和英式英语读法的重音位置不同,韵律特征可能不同;同一个词或句子使用不同响度和音调的读法,韵律特征可能不同等。
在本发明一种实施例中,语音特征可以是语种特征。语种特征指的是说话人的语言种类、方言和口音信息等,不同国家使用的语言不同,比如,中国大部分说话者使用汉语,美国大部分说话者使用英语,日本大部分说话者使用日语等;不同地域户籍的说话人可能使用的语言不同,比如,有的说话人使用普通话,有的说话人使用河南方言,有的说话人使用东北方言,有的说话人使用粤语,有的说话人使用闽南语等;不同地域户籍的说话人使用的语言不同,会带有的口音也不同,河南方言会带有河南口音,东北方言会带有东北口音,粤语带有粤语的口音,闽南语带有闽南语的口音等。
在本发明一种实施例中,语音特征可以是信道特征。终端通过不同的录音设备获得第一语音信息,不同型号的录音设备对语音都会造成一定程度上的畸变,同时由于背景环境和传输方式等的差异,对语音信息也会造成不同程度的损伤,将这些外界影响语音的特征称为信道特征。
例如,通过手机的录音机录入说话者的语音与通过录音笔录入说话者的语音,信道特征可能不一样;在安静的室内录入说话者的语音与在喧闹的大街上录入说话者的语音,信道特征可能不一样;终端通过蓝牙无线连接方式传输语音与终端通过红外线无线连接方式传输语音,信道特征可能不一样等。
需要说明的是,步骤203和步骤204之间和没有必然的先后顺序,也就是说,步骤203可能在步骤204之前执行,步骤203也可能在步骤204之后执行,步骤203和步骤204还可能同时执行,本发明不做限定。
步骤205.判断步骤203的声纹匹配和步骤204的语音匹配是否均成功。当声纹匹配和语音匹配均成功时,继续执行后续步骤206;当声纹匹配和语音匹配中至少一个不成功时,继续执行后续步骤207。
步骤206.当声纹匹配和语音匹配均成功时,根据第一语音信息携带的控制指令控制车辆。
在本发明一种实施例中,当前文步骤203和前文步骤204中声纹匹配和语音匹配均成功时,提取第一语音信息携带的控制指令,并将该控制指令发送给执行结构的控制单元,控制单元控制执行结构执行相应操作。其中执行结构包括车门、发动机、空调、座椅、后备箱门、后视镜中的至少一种。
例如,若第一语音信息为“请打开车门”,所携带的控制指令为开车门,当针对第一语音信息的声纹匹配和语音匹配均匹配成功时,提取该指令,并将该指令发送给车门控制模块,车门控制模块控制车门,使其执行打开的动作。
例如,若第一语音信息为“请关闭后备箱”,所携带的控制指令为关后备箱,当针对第一语音信息的声纹匹配和语音匹配均匹配成功时,提取该指令,并将该指令发送给后备箱控制模块,后备箱控制模块控制后备箱,使其执行关闭的动作。
例如,若第一语音信息为“请启动发动机”,所携带的控制指令为启动发动机,当针对第一语音信息的声纹匹配和语音匹配均匹配成功时,提取该指令,并将该指令发送给发动机控制模块,发动机控制模块控制发动机,使其执行启动的动作。
例如,若第一语音信息为“请打开空调”,所携带的控制指令为开空调,当针对第一语音信息的声纹匹配和语音匹配均匹配成功时,提取该指令,并将该指令发送给空调控制模块,空调控制模块控制空调,使其执行打开的动作。
步骤207.当声纹匹配和语音匹配中至少有一个匹配不成功时,进行相应的后续处理。
当前文步骤203和前文步骤204中声纹匹配和语音匹配中至少有一个匹配不成功时,可以执行以下至少一种操作:记录第一语音信息的声纹特征为非法;通过蜂鸣器进行语音警示;开启双闪灯进行警示;向第二终端发送警示消息。
具体的,若声纹匹配和语音匹配这两种匹配中至少有一个匹配不成功,即可能是声纹匹配不成功,也可能是声纹匹配和语音匹配均不成功,则匹配结果不成功的原因可能是第一终端的操作者为非法身份。这种情况下,在一种示例中,车辆的中控系统可能会记录所述第一语音信息的声纹特征为非法,以便如果车辆出现安全事故,可以将该声纹特征提供给警方作为评判非法操作者的依据。在一种示例中,车辆也可能会通过蜂鸣器进行语音警示,语音警示类似于报警声,可以使非法操作者产生胆怯心理,以致其停止非法操作。在一种示例中,
车辆可能会自动开启双闪灯,以警示非法操作者正在进行非法操作,如果仍然继续非法操作,双闪灯会一直闪烁,致使其产生胆怯心理,以停止非法操作。在一种示例中,车辆的中控系统会向具有合法身份者的第二终端发送警示消息,以提醒合法身份者,其车辆正在被非法操作,其中,第二终端为区别于第一终端的终端,第二终端例如可以是手机、电脑、服务器等设备,也可以是专有的管理平台(例如车辆管理平台或公安系统);中控系统向第二终端发送警示消息的发送方式可以是蓝牙方式、红外线方式、Wifi方式、数据流量方式等的至少一种。
需要说明的是,步骤207为一种可选的步骤。在其他实现中,当声纹匹配和语音匹配中至少有一个匹配不成功时还可以有其他的后续处理方式。
可以看到,实施本发明实施例的技术方案,终端可以通过多种方式获得第一语音信息,并通过多种无线连接方式发送给车辆的中控系统。车辆的中控系统提取第一语音信息的声纹特征和语音特征,并与本地预存的第二语音信息的声纹特征和语音特征进行匹配,匹配成功即可实现对车辆的控制,匹配不成功时,中控系统也会做出一定的响应,所以实施本发明实施例既能够增加车辆使用的安全性,极大程度地避免车辆被非法窃用,又能使合法用户便捷地使用车辆,提升用户的使用体验。
为了更加清楚地理解本发明的方案,下面以两个实际应用场景为例进行描述。
举例来说,在一种应用场景中。一用户为车主,想要使用自己的私家车外出,出门后发现自己忘带车钥匙或车钥匙不小心锁在家里了,但又没有钥匙,这时候车主可以拿出手机,对着手机说“请解锁车辆”,然后手机通过Wifi的方式将车主的语音信息发送到车辆中控系统,车辆的中控系统将车主的语音信息与预存的第二语音信息进行声纹特征匹配和语音特征匹配,经确认匹配成功,用户为合法身份,则用户获取该车辆的合法使用权。
又举例来说,在又一种应用场景中。一用户想要使用该车辆,发现自己既没有带车钥匙,也没有带手机,但是手上拿着一平板电脑,这时候,可以对着平板电脑说“请解锁车辆”和“打开车门”,然后分别通过蓝牙的方式发送到车辆的中控系统,车辆的中控系统将用户的语音信息与预存的第二语音信息进行声纹特征匹配和语音特征匹配,经确认匹配成功,用户为合法身份,车辆解锁,车门打开,则用户获取该车辆的合法使用权。
另外,除了本实施例中的方案,还可以通过一种远程的方式来实现对车辆的控制,一种车辆控制方法如下。
第一终端通过前文步骤201中的多种方式获得用户的第一语音信息,将第一语音信息上传至云端服务器,其中云端服务器中存储有预先录入的第二语音信息,云端服务器提取第一语音信息的声纹特征和语音特征,并与第二语音信息的声纹特征和语音特征进行匹配,得到匹配结果。若匹配成功,云端服务器会记录匹配成功的结果,并将匹配结果和第一语音信息携带的控制指令发送给车辆的中控系统,中控系统再将匹配结果和控制指令发送到对应的控制单元,控制单元控制执行单元执行对应操作。若匹配不成功,云端服务器会记录匹配不成功的结果,同时记录第一语音信息的声纹特征为非法,然后向第二终端发送警示消息,向车辆的中控系统发送匹配结果,中控系统接收到匹配结果的信息后,可以执行以下至少一种操作:通过蜂鸣器进行语音警示;开启双闪灯进行警示。
举例来说,在一应用场景中,车主E在外出差,车放在家里,车主E的一朋友F想借用E的车,这时就需要获取车主E的第一语音信息来解锁车辆。E通过终端录入解锁的语音信息,即第一语音信息,并上传至服务器,服务器接收该第一语音信息,并将第一语音信息的声纹特征和语音特征与服务器中的第二语音信息的声纹特征和语音特征进行匹配,匹配成功后,云端服务器记录匹配结果,并发送匹配结果和第一语音信息携带的解锁控制指令给车辆的中控系统,中控系统将接收到的解锁指令发送到控制单元,控制单元控制车辆进行解锁的动作,F获得车辆的使用权。
上文详细阐述了本发明实施例的系统框架、终端设备以及车辆控制方法,基于相同的发明构思,下面继续提供本发明实施例的硬件设备。
参见图4,图4是本发明实施例提供的一种车辆的中控系统装置40的结构示意图,该装置可以包括:
无线模块401,用于建立与第一终端之间的无线连接,所述无线连接方式包括蓝牙方式和红外线方式中的至少一种。
在一具体实施例中,所述无线模块还用于,接收所述第一终端通过无线连接方式传输的第一语音信息,所述无线连接方式包括蓝牙方式和红外线方式中的至少一种;所述第一语音信息携带说话人对所述车辆的控制指令。
声音识别模块402,用于根据所述第一语音信息和本地预存的第二语音信息进行声音匹配,以确定所述说话人的身份。
在一具体实施例中,声音识别模块具体还用于,提取所述第一语音信息的声纹特征,与所述第二语音信息的声纹特征进行声纹匹配。
在一具体实施例中,声音识别模块具体还用于,提取所述第一语音信息的语音特征,与所述第二语音信息的语音特征进行语音匹配;其中,所述语音特征包括词法特征、韵律特征、语种特征、信道特征中的至少一种。
指令输出模块403,用于当所述声音匹配成功时,根据所述第一语音信息携带的所述控制指令控制所述车辆。
在一具体实施例中,指令输出模块具体用于,当匹配成功时,提取所述第一语音信息的所述控制指令;将所述控制指令输出到所述车辆的执行结构的控制单元,以控制所述执行结构;其中所述执行结构包括车门、发动机、空调、座椅、后备箱门、后视镜中的至少一种。
在一具体实施例中,指令输出模块具体还用于,当所述声音匹配不成功时,输出以下至少一种操作指令:
记录所述第一语音信息的声纹特征为非法;
通过蜂鸣器进行语音警示;
开启双闪灯进行警示;
向第二终端发送警示消息。
存储模块404,用于存储第一语音信息和第二语音信息。
上述中控系统装置40的各功能模块可用于实现图2实施例所描述的方法,或者,上述中控系统装置40的各功能模块可用于实现图3实施例中针对车辆侧所描述的方法,具体内容可参考图2、图3实施例的相关步骤中的描述,为了说明书的简洁,这里不再赘述。
参见图5,图5为本发明实施例公开的一种车辆的控制系统50的结构示意图。本实施例中车辆的控制系统50可包括:中控系统501,车门控制模块502,发动机控制模块503,后备箱控制模块504,空调控制模块505等。其中,
中控系统501,在一种示例中可以包括无线模块401,声音识别模块402,存储器模块404,指令输出模块403等。
车门控制模块502,是车门的控制单元,用来控制车门执行开关门的操作。
发动机控制模块503,是发动机的控制单元,控制发动机的启动等。
后备箱控制模块504,是后备箱的控制单元,控制后备箱的开与关等。
空调控制模块505,是空调的控制单元,控制空调的开关,温度的高低,风速,风向等。
具体实现中,该车门控制模块502,发动机控制模块503,后备箱控制模块504、空调控制模块505等可以部署在一块集成式电子控制单元(Electronic Control Unit,ECU)上,也可以分别部署在多块独立部署的电子控制单元(Electronic Control Unit,ECU)上。
若车门控制模块502,发动机控制模块503,后备箱控制模块504、空调控制模块505等集中部署在一块集成式ECU上。中控系统501中的无线模块401通过蓝牙或者红外线等无线方式接收由终端发送的第一语音信息,中控系统501中的声音识别模块402并将第一语音信息与本地预存的第二语音信息进行声音匹配,若匹配成功,提取第一语音信息所携带的控制指令,并将控制指令通过指令输出模块403发送到集成式电子控制单元ECU上的相应功能模块(例如车门控制模块502,或者发动机控制模块503,或者后备箱控制模块504,或者空调控制模块505),ECU的相应功能模块控制其对应的执行结构执行操作。
若车门控制模块502,发动机控制模块503,后备箱控制模块504、空调控制模块505等分散分布在独立部署的ECU上。中控系统501中的无线模块401通过蓝牙或者红外线等无线方式接收由终端发送的第一语音信息,中控系统501中的声音识别模块402并将第一语音信息与本地预存的第二语音信息进行声音匹配,若匹配成功,提取第一语音信息所携带的控制指令,并将控制指令通过指令输出模块403发送到对应的ECU(例如车门控制模块502所在ECU,或者发动机控制模块503所在ECU,或者后备箱控制模块504所在ECU,或者空调控制模块505所在ECU),该ECU再控制相应的执行结构执行操作。
例如,当第一语音信息为“请打开车门”或“请关闭车门”时,车辆的中控系统501中的无线模块401通过蓝牙方式或红外线方式接收到终端发送的第一语音信息后,声音识别模块402会将第一语音信息与本地的第二语音信息进行声音匹配,若匹配成功,确定说话人为合法身份,提取第一语音信息中所携带的开车门或关车门的控制指令,并将控制指令通过指令输出模块403输出至车门控制模块502,车门控制模块502控制车门执行开门或关门的操作。
又例如,当第一语音信息为“请打开后备箱”或“请关闭后备箱”时,车辆的中控系统501中的无线模块401通过蓝牙方式或红外线方式接收到终端发送的第一语音信息后,声音识别模块402会将第一语音信息与本地的第二语音信息进行声音匹配,若匹配成功,确定说话人为合法身份,提取第一语音信息中所携带的开后备箱或关后备箱的控制指令,并将控制指令通过指令输出模块403输出至后备箱控制模块504,后备箱控制模块504控制后备箱执行开或关的操作。
又例如,当第一语音信息为“请启动发动机”时,车辆的中控系统501中的无线模块401通过蓝牙方式或红外线方式接收到终端发送的第一语音信息后,声音识别模块402会将第一语音信息与本地的第二语音信息进行声音匹配,若匹配成功,确定说话人为合法身份,提取第一语音信息中所携带的启动发动机的控制指令,并将控制指令通过指令输出模块403输出至发动机控制模块503,发动机控制模块503控制发动机执行启动的操作。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。
Claims (10)
1.一种车辆控制方法,其特征在于,所述方法应用于车辆的中控系统,所述方法包括:
建立与第一终端之间的无线连接,所述无线连接的方式包括蓝牙方式和红外线方式中的至少一种;
接收所述第一终端通过所述无线连接方式传输的第一语音信息;所述第一语音信息携带说话人对所述车辆的控制指令;
根据所述第一语音信息和本地预存的第二语音信息进行声音匹配,以确定所述说话人的身份;
当所述声音匹配成功时,根据所述第一语音信息携带的所述控制指令控制所述车辆。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一语音信息和本地预存的第二语音信息进行声音匹配,包括:
提取所述第一语音信息的声纹特征,与所述第二语音信息的声纹特征进行声纹匹配。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一语音信息和本地预存的第二语音信息进行语音匹配,还包括:
提取所述第一语音信息的语音特征,与所述第二语音信息的语音特征进行语音匹配;其中,所述语音特征包括词法特征、韵律特征、语种特征、信道特征中的至少一种。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述第一语音信息携带的所述控制指令控制所述车辆,包括:
提取所述第一语音信息的所述控制指令;
将所述控制指令发送给所述车辆的执行结构的控制单元,以控制所述执行结构;其中所述执行结构包括车门、发动机、空调、座椅、后备箱门、后视镜中的至少一种。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:当所述声音匹配不成功时,执行以下至少一种操作:
记录所述第一语音信息的声纹特征为非法;
通过蜂鸣器进行语音警示;
开启双闪灯进行警示;
向第二终端发送警示消息。
6.一种用于车辆控制的装置,其特征在于,所述装置应用于车辆的中控系统,包括:
无线模块,用于建立与第一终端之间的无线连接,所述无线连接方式包括蓝牙方式和红外线方式中的至少一种;
所述无线模块还用于,接收所述第一终端通过无线连接方式传输的第一语音信息,所述无线连接方式包括蓝牙方式和红外线方式中的至少一种;所述第一语音信息携带说话人对所述车辆的控制指令;
声音识别模块,用于根据所述第一语音信息和本地预存的第二语音信息进行声音匹配,以确定所述说话人的身份;
指令输出模块,用于当所述声音匹配成功时,根据所述第一语音信息携带的所述控制指令控制所述车辆。
7.根据权利要求6所述的装置,其特征在于,声音识别模块具体用于:提取所述第一语音信息的声纹特征,与所述第二语音信息的声纹特征进行声纹匹配。
8.根据权利要求7所述的装置,其特征在于,声音识别模块还用于:提取所述第一语音信息的语音特征,与所述第二语音信息的语音特征进行语音匹配;其中,所述语音特征包括词法特征、韵律特征、语种特征、信道特征中的至少一种。
9.根据权利要求6-8所述的装置,其特征在于,指令输出模块具体用于:当匹配成功时,提取所述第一语音信息的所述控制指令;将所述控制指令输出到所述车辆的执行结构的控制单元,以控制所述执行结构;其中所述执行结构包括车门、发动机、空调、座椅、后备箱门、后视镜中的至少一种。
10.根据权利要求9所述的装置,其特征在于,指令输出模块还用于:当所述声音匹配不成功时,输出以下至少一种操作指令:
记录所述第一语音信息的声纹特征为非法;
通过蜂鸣器进行语音警示;
开启双闪灯进行警示;
向第二终端发送警示消息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910834613.8A CN110539721A (zh) | 2019-09-04 | 2019-09-04 | 一种车辆控制方法及其装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910834613.8A CN110539721A (zh) | 2019-09-04 | 2019-09-04 | 一种车辆控制方法及其装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110539721A true CN110539721A (zh) | 2019-12-06 |
Family
ID=68711270
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910834613.8A Pending CN110539721A (zh) | 2019-09-04 | 2019-09-04 | 一种车辆控制方法及其装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110539721A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111755005A (zh) * | 2020-06-30 | 2020-10-09 | 深圳市海邻科信息技术有限公司 | 车载设备控制方法、车载设备控制装置和车载系统 |
CN112116911A (zh) * | 2020-09-22 | 2020-12-22 | 福建鸿兴福食品有限公司 | 一种声音布控方法、装置及计算机可读存储介质 |
CN113830026A (zh) * | 2020-06-24 | 2021-12-24 | 华为技术有限公司 | 一种设备控制方法及计算机可读存储介质 |
CN115257628A (zh) * | 2022-07-20 | 2022-11-01 | 小米汽车科技有限公司 | 车辆控制方法、装置、存储介质、车辆及芯片 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013219479A (ja) * | 2012-04-06 | 2013-10-24 | Denso Corp | 車載用受信装置 |
CN104925022A (zh) * | 2015-04-30 | 2015-09-23 | 北京车音网科技有限公司 | 一种车辆远程控制的方法、终端、设备及车载控制设备 |
CN105607467A (zh) * | 2015-12-29 | 2016-05-25 | 大连楼兰科技股份有限公司 | 智能手表汽车远程启动系统及方法 |
CN109461439A (zh) * | 2019-01-08 | 2019-03-12 | 深圳市高觉科技有限公司 | 一种语音信息指令的采集方法 |
CN110077362A (zh) * | 2019-05-07 | 2019-08-02 | 广东工业大学 | 一种安全装置 |
-
2019
- 2019-09-04 CN CN201910834613.8A patent/CN110539721A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013219479A (ja) * | 2012-04-06 | 2013-10-24 | Denso Corp | 車載用受信装置 |
CN104925022A (zh) * | 2015-04-30 | 2015-09-23 | 北京车音网科技有限公司 | 一种车辆远程控制的方法、终端、设备及车载控制设备 |
CN105607467A (zh) * | 2015-12-29 | 2016-05-25 | 大连楼兰科技股份有限公司 | 智能手表汽车远程启动系统及方法 |
CN109461439A (zh) * | 2019-01-08 | 2019-03-12 | 深圳市高觉科技有限公司 | 一种语音信息指令的采集方法 |
CN110077362A (zh) * | 2019-05-07 | 2019-08-02 | 广东工业大学 | 一种安全装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113830026A (zh) * | 2020-06-24 | 2021-12-24 | 华为技术有限公司 | 一种设备控制方法及计算机可读存储介质 |
CN111755005A (zh) * | 2020-06-30 | 2020-10-09 | 深圳市海邻科信息技术有限公司 | 车载设备控制方法、车载设备控制装置和车载系统 |
CN112116911A (zh) * | 2020-09-22 | 2020-12-22 | 福建鸿兴福食品有限公司 | 一种声音布控方法、装置及计算机可读存储介质 |
CN112116911B (zh) * | 2020-09-22 | 2023-12-19 | 深圳易美诺科技有限公司 | 一种声音布控方法、装置及计算机可读存储介质 |
CN115257628A (zh) * | 2022-07-20 | 2022-11-01 | 小米汽车科技有限公司 | 车辆控制方法、装置、存储介质、车辆及芯片 |
CN115257628B (zh) * | 2022-07-20 | 2023-06-20 | 小米汽车科技有限公司 | 车辆控制方法、装置、存储介质、车辆及芯片 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110539721A (zh) | 一种车辆控制方法及其装置 | |
US8639508B2 (en) | User-specific confidence thresholds for speech recognition | |
US9202465B2 (en) | Speech recognition dependent on text message content | |
US10255913B2 (en) | Automatic speech recognition for disfluent speech | |
US7676363B2 (en) | Automated speech recognition using normalized in-vehicle speech | |
US8560313B2 (en) | Transient noise rejection for speech recognition | |
US8438028B2 (en) | Nametag confusability determination | |
US9570066B2 (en) | Sender-responsive text-to-speech processing | |
US8756062B2 (en) | Male acoustic model adaptation based on language-independent female speech data | |
US8762151B2 (en) | Speech recognition for premature enunciation | |
CN109785828A (zh) | 基于用户语音风格的自然语言生成 | |
US9484027B2 (en) | Using pitch during speech recognition post-processing to improve recognition accuracy | |
US20120109649A1 (en) | Speech dialect classification for automatic speech recognition | |
US9997155B2 (en) | Adapting a speech system to user pronunciation | |
US9911408B2 (en) | Dynamic speech system tuning | |
US9865249B2 (en) | Realtime assessment of TTS quality using single ended audio quality measurement | |
US20180074661A1 (en) | Preferred emoji identification and generation | |
US8438030B2 (en) | Automated distortion classification | |
US9881609B2 (en) | Gesture-based cues for an automatic speech recognition system | |
US20160300050A1 (en) | Verifying a user with biometric data | |
JP2009145755A (ja) | 音声認識装置 | |
US9473094B2 (en) | Automatically controlling the loudness of voice prompts | |
JP2003330485A (ja) | 音声認識装置、音声認識システム及び音声認識方法 | |
US10866948B2 (en) | Address book management apparatus using speech recognition, vehicle, system and method thereof | |
US20120197643A1 (en) | Mapping obstruent speech energy to lower frequencies |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 1008, Shenye logistics building, No. 2088, Baoan North Road, Sungang street, Luohu District, Shenzhen City, Guangdong Province Applicant after: Baoneng Automobile Group Co., Ltd Address before: 1008, Shenye logistics building, No. 2088, Baoan North Road, Sungang street, Luohu District, Shenzhen City, Guangdong Province Applicant before: BAONENG AUTOMOBILE Co.,Ltd. |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191206 |