CN115547313A

CN115547313A - 一种基于驾驶员语音控制行驶车辆急停的方法

Info

Publication number: CN115547313A
Application number: CN202211140473.2A
Authority: CN
Inventors: 张卫东; 蒋昊; 柏林; 常建; 史颂华; 潘晶; 衣博文
Original assignee: Hainan University
Current assignee: Hainan University
Priority date: 2022-09-20
Filing date: 2022-09-20
Publication date: 2022-12-30

Abstract

本发明涉及语音控制技术领域，具体涉及一种基于驾驶员语音控制行驶车辆急停的方法，包括获取驾驶车辆的驾驶员的语音信息；采用BERT‑L模型对驾驶员的语音信息向量化；将向量化的词向量群与车载终端预存储的向量词库进行匹配，以确认是否存在停车指令；若匹配成功，则获得停车指令，且检测车辆的的车速达到预设速度时，执行停车指令，控制行驶车辆紧急停车，本发明设置语音控制优先级高于机械控制优先级，避免了驾驶员在紧急情况下的误操作对行驶车辆的影响；通过BERT‑L模型对语音信息向量化，可以实现智能车辆在离线下的语音控制，同时也保证了实时性。考虑车速的影响因素，提高了控制车辆停驶的准确性。

Description

一种基于驾驶员语音控制行驶车辆急停的方法

技术领域

本发明涉及语音控制技术领域，尤其涉及一种基于驾驶员语音控制行驶车辆急停的方法。

背景技术

我国社会经济快速发展，交通工具日益增多，交通事故问题也越来越严峻。据分析，导致交通事故越来越严峻的主要原因大致可分为三类因素，分别为驾驶员的不规范驾驶行为、路人的不自觉行为和不可预见因素，其中，驾驶员的不规范驾驶行为尤为突出。这类不规范的驾驶行为主要体现在传统的行驶车辆紧急停驶的控制方式，主要是基于手刹或者脚刹的机械控制来进行实现。所以，当面临突发状况时，很难保证大脑处于理智可以正确采取一些操作，大大增加了交通事故发生的概率。

为了解决此类问题，当前的技术也是对停驶操作进一步的简化。例如：把紧急停车集成为一个按钮控制或者是通过触控显示屏即可停车等。但这些依旧需要驾驶员去操作，并不能保证可以避免驾驶员不正确行为所导致的重大交通事故。因此，控制行驶车辆紧急停驶技术成为一种迫切需求。

发明内容

有鉴于此，本发明的目的在于提出一种基于驾驶员语音控制行驶车辆急停的方法，以解决驾车人员面临突发状况下，无法执行正确操作所导致的巨大交通事故的问题。

基于上述目的，本发明提供了一种基于驾驶员语音控制行驶车辆急停的方法，包括：

获取驾驶车辆的驾驶员的语音信息；

采用BERT-L模型对驾驶员的语音信息向量化；

将向量化的词向量群与车载终端预存储的向量词库进行匹配，以确认是否存在停车指令；

若匹配成功，则获得停车指令，且检测车辆的的车速达到预设速度时，执行停车指令，控制行驶车辆紧急停车。

可选的，所述采用BERT-L模型对驾驶员的语音信息向量化，具体操作为：

步骤1、BERT-L中的CLS和SEP对驾驶员的语音信息按句进行分解；

步骤2、对分解后的每一个句子中字的令牌和所在句子位置Position，通过向量形式来表示，总位长88，字向量在前，位向量在后，位长分别位64位和24位。

可选的，所述将向量化的词向量群与车载终端预存储的向量词库进行匹配，以确认是否存在停车指令，具体操作为：

步骤1、二进制词向量群对之前预存储的二进制向量词库进行匹配，得到属于语音信息中的一个或多个二进制关键词向量；

步骤2、根据得到的一个或多个二进制关键词向量，再对得到的语音信息进行二进制关键词向量进行确定；

步骤3、对匹配得到的二进制关键词向量进行规则匹配处理，判断二进制关键词向量所在句子中的位置前后是否存在带有二进制否定字向量或者词向量；

步骤4、若是有则判定为非执行指令则不执行任何操作；反之，判定为存在停车指令。

可选的，所述二进制词向量群是由多个二进制词向量组成，其中二进制词向量是由二进制字向量组成。

可选的，所述获取驾驶车辆的驾驶员的语音信息，具体操作为：根据车辆上的语音设备采集的环境因素指标，判断所述环境因素指标是否符合采集驾驶员语音信息条件；若符合，则将开始获取驾驶员的语音信息。

本发明的有益效果：语音控制优先级高于机械控制优先级，避免了驾驶员在紧急情况下的误操作对行驶车辆的影响；通过BERT-L模型对语音信息向量化，可以实现智能车辆在离线下的语音控制，同时也保证了实时性。考虑车速的影响因素，提高了控制车辆停驶的准确性。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例的硬件运行环境的终端结构示意图；

图2为本发明实施例的流程示意图；

图3为本发明实施例的BERT-L的模型示意图；

图中标记为：

1001、车载麦克风；1002、通信线；1003、车速检测仪；1004、存储器。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，对本发明进一步详细说明。

需要说明的是，除非另外定义，本发明使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。本发明中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性，而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同，而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接，而是可以包括电性的连接，不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系，当被描述对象的绝对位置改变后，则该相对位置关系也可能相应地改变。

本申请实施例公开了一种基于驾驶员语音控制行驶车辆急停的方法，

如图1所示，硬件运行环境的终端结构包括车载麦克风1001、车速检测仪1003(ELM327)和储存器1004(高速RAM存储器)，分别采用高速GHYAT通信线1002进行连接，其中作为一种计算机存储介质的存储器1004中又包括操作系统、识别模块、处理模块、控制模块以及基于语音控制车辆停止行驶的程序和BERT-L模型框架。

进一步，硬件用途说明：(1)车速检测仪1003主要用于连接车辆轮胎，与控制模块进行数据通信；(2)车载麦克风1001主要用于接收车内人员的语音信息，与识别模块进行数据通信；(3)控制模块主要用于调用存储器1004中存储的基于车辆语音控制行驶车辆停车程序，从而对行驶车辆进行停止行驶。

如图2所示，该方法具体包括如下步骤：

S101：随车辆启动开启的车载麦克风获取驾驶车辆的驾驶员的语音信息；

在执行S101之前，还包括根据车辆上的语音设备采集的环境因素指标，判断所述环境因素指标是否符合采集驾驶员语音信息条件；若符合，则将开始获取驾驶员的语音信息。

S102：采用BERT-L模型对驾驶员的语音信息向量化；

具体包括以下步骤：

步骤1、处理模块在接收到驾驶员的语音信息后，调用BERT-L模型；

步骤2、BERT-L模型中的CLS和SEP使驾驶员的语音信息按句进行分解，以不同的时间间隔为依据；

步骤3、对分解后的每一个句子中字(Token)和所在句子位置(Position)，通过向量形式来表示，总位长88，字向量在前，位向量在后，位长分别位64位和24位。

S103：将向量化的词向量群与车载终端预存储的向量词库进行匹配，以确认是否存在停车指令；

具体包括以下步骤：

步骤1、二进制向量群对之前预存储的二进制向量词库进行匹配，得到属于语音信息中的一个或多个二进制关键词向量；

步骤4、若匹配成功，则判定为非执行指令则不执行任何操作；反之，判定为存在停车指令，根据得到的一个或多个二进制关键词向量发送给控制模块匹配成功的信号，使控制模块执行停车指令。

车辆终端二进制向量的匹配技术，具体此处不作限定。

S104：若匹配成功，则获得停车指令，且车速检测仪检测车辆的的车速达到预设速度时，执行停车指令，控制行驶车辆紧急停车。预设速度设置为不高于20Km/h，当车速未达到预设速度时，判定为车辆在低速行驶，此时驾驶员有充足的时间进行机械紧急制动，当停车指令与车速达到预设速度两个条件同时满足时，控制模块执行停车指令，进行紧急停车，提高了控制车辆停驶的准确性，避免了车辆在低速或者没有行驶时，驾驶员的语音信息引起控制模块误操作的情况。

如图3所示，BERT-L模型包括输入(Input)的Token和输出(Output)的Vector以及CLS和SEP。其中，Token指的是驾驶员每句话所含的一个字；向量(Vector)指的是Token向量化后的字向量，是由两个向量的和组成，位长分别位64位和24位，字向量(TokenEmbedding)在前，位向量(Position Embedding)在后；CLS指的是一句话开端的标定，SEP则是同一句话结尾的标定。

进一步，CLS和SEP通过句子之间和字之间的间隔的时间不同来判定一个句子的开端和结尾。例如：一句话大约间隔1ms，而同在一句话内的字大约间隔0.25ms。

所属领域的普通技术人员应当理解：以上任何实施例的讨论仅为示例性的，并非旨在暗示本发明的范围(包括权利要求)被限于这些例子；在本发明的思路下，以上实施例或者不同实施例中的技术特征之间也可以进行组合，步骤可以以任意顺序实现，并存在如上的本发明的不同方面的许多其它变化，为了简明它们没有在细节中提供。

本发明旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此，凡在本发明的精神和原则之内，所做的任何省略、修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于驾驶员语音控制行驶车辆急停的方法，其特征在于，包括如下步骤：

获取驾驶车辆的驾驶员的语音信息；

采用BERT-L模型对驾驶员的语音信息向量化；

2.根据权利要求1所述的基于驾驶员语音控制行驶车辆急停的方法，其特征在于，所述采用BERT-L模型对驾驶员的语音信息向量化，具体操作为：

步骤1、BERT-L中的CLS和SEP对驾驶员的语音信息按句进行分解；

3.根据权利要求1所述的基于驾驶员语音控制行驶车辆急停的方法，其特征在于，所述将向量化的词向量群与车载终端预存储的向量词库进行匹配，以确认是否存在停车指令，具体操作为：

4.根据权利要求3所述的基于驾驶员语音控制行驶车辆急停的方法，其特征在于，所述二进制词向量群是由多个二进制词向量组成，其中二进制词向量是由二进制字向量组成。

5.根据权利要求1所述的基于驾驶员语音控制行驶车辆急停的方法，其特征在于，所述获取驾驶车辆的驾驶员的语音信息，具体操作为：

根据车辆上的语音设备采集的环境因素指标，判断所述环境因素指标是否符合采集驾驶员语音信息条件；若符合，则将开始获取驾驶员的语音信息。