CN115547313A - 一种基于驾驶员语音控制行驶车辆急停的方法 - Google Patents
一种基于驾驶员语音控制行驶车辆急停的方法 Download PDFInfo
- Publication number
- CN115547313A CN115547313A CN202211140473.2A CN202211140473A CN115547313A CN 115547313 A CN115547313 A CN 115547313A CN 202211140473 A CN202211140473 A CN 202211140473A CN 115547313 A CN115547313 A CN 115547313A
- Authority
- CN
- China
- Prior art keywords
- driver
- vehicle
- voice
- voice information
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 17
- 239000013598 vector Substances 0.000 claims abstract description 65
- 230000007613 environmental effect Effects 0.000 claims description 6
- 206010039203 Road traffic accident Diseases 0.000 description 5
- 230000006399 behavior Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000001788 irregular Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 208000003443 Unconsciousness Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60R—VEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
- B60R16/00—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
- B60R16/02—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
- B60R16/023—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for transmission of signals between vehicle parts or subsystems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Abstract
本发明涉及语音控制技术领域,具体涉及一种基于驾驶员语音控制行驶车辆急停的方法,包括获取驾驶车辆的驾驶员的语音信息;采用BERT‑L模型对驾驶员的语音信息向量化;将向量化的词向量群与车载终端预存储的向量词库进行匹配,以确认是否存在停车指令;若匹配成功,则获得停车指令,且检测车辆的的车速达到预设速度时,执行停车指令,控制行驶车辆紧急停车,本发明设置语音控制优先级高于机械控制优先级,避免了驾驶员在紧急情况下的误操作对行驶车辆的影响;通过BERT‑L模型对语音信息向量化,可以实现智能车辆在离线下的语音控制,同时也保证了实时性。考虑车速的影响因素,提高了控制车辆停驶的准确性。
Description
技术领域
本发明涉及语音控制技术领域,尤其涉及一种基于驾驶员语音控制行驶车辆急停的方法。
背景技术
我国社会经济快速发展,交通工具日益增多,交通事故问题也越来越严峻。据分析,导致交通事故越来越严峻的主要原因大致可分为三类因素,分别为驾驶员的不规范驾驶行为、路人的不自觉行为和不可预见因素,其中,驾驶员的不规范驾驶行为尤为突出。这类不规范的驾驶行为主要体现在传统的行驶车辆紧急停驶的控制方式,主要是基于手刹或者脚刹的机械控制来进行实现。所以,当面临突发状况时,很难保证大脑处于理智可以正确采取一些操作,大大增加了交通事故发生的概率。
为了解决此类问题,当前的技术也是对停驶操作进一步的简化。例如:把紧急停车集成为一个按钮控制或者是通过触控显示屏即可停车等。但这些依旧需要驾驶员去操作,并不能保证可以避免驾驶员不正确行为所导致的重大交通事故。因此,控制行驶车辆紧急停驶技术成为一种迫切需求。
发明内容
有鉴于此,本发明的目的在于提出一种基于驾驶员语音控制行驶车辆急停的方法,以解决驾车人员面临突发状况下,无法执行正确操作所导致的巨大交通事故的问题。
基于上述目的,本发明提供了一种基于驾驶员语音控制行驶车辆急停的方法,包括:
获取驾驶车辆的驾驶员的语音信息;
采用BERT-L模型对驾驶员的语音信息向量化;
将向量化的词向量群与车载终端预存储的向量词库进行匹配,以确认是否存在停车指令;
若匹配成功,则获得停车指令,且检测车辆的的车速达到预设速度时,执行停车指令,控制行驶车辆紧急停车。
可选的,所述采用BERT-L模型对驾驶员的语音信息向量化,具体操作为:
步骤1、BERT-L中的CLS和SEP对驾驶员的语音信息按句进行分解;
步骤2、对分解后的每一个句子中字的令牌和所在句子位置Position,通过向量形式来表示,总位长88,字向量在前,位向量在后,位长分别位64位和24位。
可选的,所述将向量化的词向量群与车载终端预存储的向量词库进行匹配,以确认是否存在停车指令,具体操作为:
步骤1、二进制词向量群对之前预存储的二进制向量词库进行匹配,得到属于语音信息中的一个或多个二进制关键词向量;
步骤2、根据得到的一个或多个二进制关键词向量,再对得到的语音信息进行二进制关键词向量进行确定;
步骤3、对匹配得到的二进制关键词向量进行规则匹配处理,判断二进制关键词向量所在句子中的位置前后是否存在带有二进制否定字向量或者词向量;
步骤4、若是有则判定为非执行指令则不执行任何操作;反之,判定为存在停车指令。
可选的,所述二进制词向量群是由多个二进制词向量组成,其中二进制词向量是由二进制字向量组成。
可选的,所述获取驾驶车辆的驾驶员的语音信息,具体操作为:根据车辆上的语音设备采集的环境因素指标,判断所述环境因素指标是否符合采集驾驶员语音信息条件;若符合,则将开始获取驾驶员的语音信息。
本发明的有益效果:语音控制优先级高于机械控制优先级,避免了驾驶员在紧急情况下的误操作对行驶车辆的影响;通过BERT-L模型对语音信息向量化,可以实现智能车辆在离线下的语音控制,同时也保证了实时性。考虑车速的影响因素,提高了控制车辆停驶的准确性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的硬件运行环境的终端结构示意图;
图2为本发明实施例的流程示意图;
图3为本发明实施例的BERT-L的模型示意图;
图中标记为:
1001、车载麦克风;1002、通信线;1003、车速检测仪;1004、存储器。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,对本发明进一步详细说明。
需要说明的是,除非另外定义,本发明使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。本发明中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
本申请实施例公开了一种基于驾驶员语音控制行驶车辆急停的方法,
如图1所示,硬件运行环境的终端结构包括车载麦克风1001、车速检测仪1003(ELM327)和储存器1004(高速RAM存储器),分别采用高速GHYAT通信线1002进行连接,其中作为一种计算机存储介质的存储器1004中又包括操作系统、识别模块、处理模块、控制模块以及基于语音控制车辆停止行驶的程序和BERT-L模型框架。
进一步,硬件用途说明:(1)车速检测仪1003主要用于连接车辆轮胎,与控制模块进行数据通信;(2)车载麦克风1001主要用于接收车内人员的语音信息,与识别模块进行数据通信;(3)控制模块主要用于调用存储器1004中存储的基于车辆语音控制行驶车辆停车程序,从而对行驶车辆进行停止行驶。
如图2所示,该方法具体包括如下步骤:
S101:随车辆启动开启的车载麦克风获取驾驶车辆的驾驶员的语音信息;
在执行S101之前,还包括根据车辆上的语音设备采集的环境因素指标,判断所述环境因素指标是否符合采集驾驶员语音信息条件;若符合,则将开始获取驾驶员的语音信息。
S102:采用BERT-L模型对驾驶员的语音信息向量化;
具体包括以下步骤:
步骤1、处理模块在接收到驾驶员的语音信息后,调用BERT-L模型;
步骤2、BERT-L模型中的CLS和SEP使驾驶员的语音信息按句进行分解,以不同的时间间隔为依据;
步骤3、对分解后的每一个句子中字(Token)和所在句子位置(Position),通过向量形式来表示,总位长88,字向量在前,位向量在后,位长分别位64位和24位。
S103:将向量化的词向量群与车载终端预存储的向量词库进行匹配,以确认是否存在停车指令;
具体包括以下步骤:
步骤1、二进制向量群对之前预存储的二进制向量词库进行匹配,得到属于语音信息中的一个或多个二进制关键词向量;
步骤2、根据得到的一个或多个二进制关键词向量,再对得到的语音信息进行二进制关键词向量进行确定;
步骤3、对匹配得到的二进制关键词向量进行规则匹配处理,判断二进制关键词向量所在句子中的位置前后是否存在带有二进制否定字向量或者词向量;
步骤4、若匹配成功,则判定为非执行指令则不执行任何操作;反之,判定为存在停车指令,根据得到的一个或多个二进制关键词向量发送给控制模块匹配成功的信号,使控制模块执行停车指令。
车辆终端二进制向量的匹配技术,具体此处不作限定。
S104:若匹配成功,则获得停车指令,且车速检测仪检测车辆的的车速达到预设速度时,执行停车指令,控制行驶车辆紧急停车。预设速度设置为不高于20Km/h,当车速未达到预设速度时,判定为车辆在低速行驶,此时驾驶员有充足的时间进行机械紧急制动,当停车指令与车速达到预设速度两个条件同时满足时,控制模块执行停车指令,进行紧急停车,提高了控制车辆停驶的准确性,避免了车辆在低速或者没有行驶时,驾驶员的语音信息引起控制模块误操作的情况。
如图3所示,BERT-L模型包括输入(Input)的Token和输出(Output)的Vector以及CLS和SEP。其中,Token指的是驾驶员每句话所含的一个字;向量(Vector)指的是Token向量化后的字向量,是由两个向量的和组成,位长分别位64位和24位,字向量(TokenEmbedding)在前,位向量(Position Embedding)在后;CLS指的是一句话开端的标定,SEP则是同一句话结尾的标定。
进一步,CLS和SEP通过句子之间和字之间的间隔的时间不同来判定一个句子的开端和结尾。例如:一句话大约间隔1ms,而同在一句话内的字大约间隔0.25ms。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。
本发明旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.一种基于驾驶员语音控制行驶车辆急停的方法,其特征在于,包括如下步骤:
获取驾驶车辆的驾驶员的语音信息;
采用BERT-L模型对驾驶员的语音信息向量化;
将向量化的词向量群与车载终端预存储的向量词库进行匹配,以确认是否存在停车指令;
若匹配成功,则获得停车指令,且检测车辆的的车速达到预设速度时,执行停车指令,控制行驶车辆紧急停车。
2.根据权利要求1所述的基于驾驶员语音控制行驶车辆急停的方法,其特征在于,所述采用BERT-L模型对驾驶员的语音信息向量化,具体操作为:
步骤1、BERT-L中的CLS和SEP对驾驶员的语音信息按句进行分解;
步骤2、对分解后的每一个句子中字的令牌和所在句子位置Position,通过向量形式来表示,总位长88,字向量在前,位向量在后,位长分别位64位和24位。
3.根据权利要求1所述的基于驾驶员语音控制行驶车辆急停的方法,其特征在于,所述将向量化的词向量群与车载终端预存储的向量词库进行匹配,以确认是否存在停车指令,具体操作为:
步骤1、二进制词向量群对之前预存储的二进制向量词库进行匹配,得到属于语音信息中的一个或多个二进制关键词向量;
步骤2、根据得到的一个或多个二进制关键词向量,再对得到的语音信息进行二进制关键词向量进行确定;
步骤3、对匹配得到的二进制关键词向量进行规则匹配处理,判断二进制关键词向量所在句子中的位置前后是否存在带有二进制否定字向量或者词向量;
步骤4、若是有则判定为非执行指令则不执行任何操作;反之,判定为存在停车指令。
4.根据权利要求3所述的基于驾驶员语音控制行驶车辆急停的方法,其特征在于,所述二进制词向量群是由多个二进制词向量组成,其中二进制词向量是由二进制字向量组成。
5.根据权利要求1所述的基于驾驶员语音控制行驶车辆急停的方法,其特征在于,所述获取驾驶车辆的驾驶员的语音信息,具体操作为:
根据车辆上的语音设备采集的环境因素指标,判断所述环境因素指标是否符合采集驾驶员语音信息条件;若符合,则将开始获取驾驶员的语音信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211140473.2A CN115547313A (zh) | 2022-09-20 | 2022-09-20 | 一种基于驾驶员语音控制行驶车辆急停的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211140473.2A CN115547313A (zh) | 2022-09-20 | 2022-09-20 | 一种基于驾驶员语音控制行驶车辆急停的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115547313A true CN115547313A (zh) | 2022-12-30 |
Family
ID=84728175
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211140473.2A Pending CN115547313A (zh) | 2022-09-20 | 2022-09-20 | 一种基于驾驶员语音控制行驶车辆急停的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115547313A (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105867179A (zh) * | 2016-03-29 | 2016-08-17 | 乐视控股(北京)有限公司 | 一种车载语音控制方法和装置、设备 |
CN107585155A (zh) * | 2017-08-31 | 2018-01-16 | 上海航盛实业有限公司 | 一种辅助驾驶控制系统 |
US20180326998A1 (en) * | 2017-05-09 | 2018-11-15 | Omron Corporation | Stop intention determination apparatus and stop intention determination method |
CN111539212A (zh) * | 2020-04-13 | 2020-08-14 | 腾讯科技(武汉)有限公司 | 文本信息处理方法、装置、存储介质及电子设备 |
CN111581361A (zh) * | 2020-04-22 | 2020-08-25 | 腾讯科技(深圳)有限公司 | 一种意图识别方法及装置 |
JP2020181526A (ja) * | 2019-04-26 | 2020-11-05 | 三菱電機株式会社 | 運転支援装置および運転支援方法 |
CN112836496A (zh) * | 2021-01-25 | 2021-05-25 | 之江实验室 | 一种基于bert和前馈神经网络的文本纠错方法 |
CN113704444A (zh) * | 2021-10-28 | 2021-11-26 | 江西中业智能科技有限公司 | 基于自然语言处理的问答方法、系统、设备及存储介质 |
EP3944232A1 (en) * | 2020-07-25 | 2022-01-26 | Nxp B.V. | Voice control for autonomous vehicles |
CN114446296A (zh) * | 2022-01-24 | 2022-05-06 | 北京旗偲智能科技有限公司 | 车载用语音交互方法、装置及车辆 |
CN114694643A (zh) * | 2022-03-21 | 2022-07-01 | 北京博汇数据科技有限公司 | 一种基于融合相似度计算的语音指令映射方法及系统 |
-
2022
- 2022-09-20 CN CN202211140473.2A patent/CN115547313A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105867179A (zh) * | 2016-03-29 | 2016-08-17 | 乐视控股(北京)有限公司 | 一种车载语音控制方法和装置、设备 |
US20180326998A1 (en) * | 2017-05-09 | 2018-11-15 | Omron Corporation | Stop intention determination apparatus and stop intention determination method |
CN107585155A (zh) * | 2017-08-31 | 2018-01-16 | 上海航盛实业有限公司 | 一种辅助驾驶控制系统 |
JP2020181526A (ja) * | 2019-04-26 | 2020-11-05 | 三菱電機株式会社 | 運転支援装置および運転支援方法 |
CN111539212A (zh) * | 2020-04-13 | 2020-08-14 | 腾讯科技(武汉)有限公司 | 文本信息处理方法、装置、存储介质及电子设备 |
CN111581361A (zh) * | 2020-04-22 | 2020-08-25 | 腾讯科技(深圳)有限公司 | 一种意图识别方法及装置 |
EP3944232A1 (en) * | 2020-07-25 | 2022-01-26 | Nxp B.V. | Voice control for autonomous vehicles |
CN112836496A (zh) * | 2021-01-25 | 2021-05-25 | 之江实验室 | 一种基于bert和前馈神经网络的文本纠错方法 |
CN113704444A (zh) * | 2021-10-28 | 2021-11-26 | 江西中业智能科技有限公司 | 基于自然语言处理的问答方法、系统、设备及存储介质 |
CN114446296A (zh) * | 2022-01-24 | 2022-05-06 | 北京旗偲智能科技有限公司 | 车载用语音交互方法、装置及车辆 |
CN114694643A (zh) * | 2022-03-21 | 2022-07-01 | 北京博汇数据科技有限公司 | 一种基于融合相似度计算的语音指令映射方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11567509B2 (en) | Control system, control method, and non-transitory storage medium | |
CN103488752B (zh) | 一种poi智能检索的检索方法 | |
CN112507704B (zh) | 多意图识别方法、装置、设备及存储介质 | |
EP4047561A1 (en) | Method for recognizing an emotion of a driver, apparatus, device, medium and vehicle | |
WO2022027894A1 (zh) | 驾驶员行为检测方法、装置、电子设备、存储介质和程序 | |
CN109346074A (zh) | 一种语音处理方法及系统 | |
CN111309876A (zh) | 一种服务请求的处理方法、装置、电子设备及存储介质 | |
KR20210015861A (ko) | 스마트 주행 기기의 주행 상태 인식 방법 및 장치, 기기 | |
US20230205998A1 (en) | Named entity recognition system and named entity recognition method | |
CN111737990A (zh) | 一种词槽填充方法、装置、设备及存储介质 | |
CN115547313A (zh) | 一种基于驾驶员语音控制行驶车辆急停的方法 | |
CN113012687B (zh) | 一种信息交互方法、装置及电子设备 | |
CN115312028A (zh) | 语音识别方法、装置、计算机可读存储介质及计算机设备 | |
CN115544232A (zh) | 车载智能问答和信息推荐方法及装置 | |
KR20220082789A (ko) | 차량 기반의 음성 처리 방법, 음성 처리 장치, 전자장비, 저장매체 및 컴퓨터 프로그램 | |
CN115080745A (zh) | 基于人工智能的多场景文本分类方法、装置、设备及介质 | |
CN114090781A (zh) | 基于文本数据的容斥事件检测方法和装置 | |
US20210193129A1 (en) | Agent device, agent system, and computer-readable storage medium | |
CN114312778A (zh) | 一种巡航控制系统的功能安全需求获取方法及装置 | |
CN113535308A (zh) | 语言调整方法、装置、电子设备及介质 | |
CN113392812A (zh) | 基于深度神经网络的道路车道线检测方法及系统 | |
CN112464675A (zh) | 一种言辞矛盾检测方法、装置、设备及存储介质 | |
CN110588524A (zh) | 一种信息显示的方法及车载辅助显示系统 | |
CN113707148B (zh) | 语音识别准确率的确定方法、装置、设备以及介质 | |
CN111376857A (zh) | 车辆控制方法、装置、电子设备和计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |