CN111354359A - 一种车辆语音控制方法、装置、设备、系统及介质 - Google Patents
一种车辆语音控制方法、装置、设备、系统及介质 Download PDFInfo
- Publication number
- CN111354359A CN111354359A CN202010168571.1A CN202010168571A CN111354359A CN 111354359 A CN111354359 A CN 111354359A CN 202010168571 A CN202010168571 A CN 202010168571A CN 111354359 A CN111354359 A CN 111354359A
- Authority
- CN
- China
- Prior art keywords
- instruction
- vehicle
- target
- model
- voice control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000007781 pre-processing Methods 0.000 claims abstract description 22
- 238000012545 processing Methods 0.000 claims description 26
- 230000009467 reduction Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 13
- 238000004422 calculation algorithm Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 230000009471 action Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 206010011878 Deafness Diseases 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请公开了一种车辆语音控制方法,包括:采集车辆中包含有用户声音的声音信息,对声音信息进行预处理以获取目标指令;将目标指令与预先建立的模型库中存储的各模型指令进行对比,判断是否存在与目标指令匹配的相配模型指令;如果是,则将相配模型指令对应的车辆操作作为目标操作,并发送相应的控制指令以完成目标操作。由此可见,本申请增加了操控车辆的便利性和安全性;完成本地端语音识别,增加了用户体验感。此外,本申请所提供的一种车辆语音控制装置、设备、系统及介质与上述方法对应。
Description
技术领域
本申请涉及车辆控制技术领域,特别是涉及一种车辆语音控制方法、装置、设备、系统及介质。
背景技术
随着车联网技术的迅猛发展,现代车辆的设计能够满足用户越来越多的需求。现有技术中,车辆通常采用CAN总线与大量的车辆设备连接,例如车窗、车灯及车门等,并为用户提供具有不同功能的控制按键,用户通过手动按压控制按键的方式以控制不同车辆设备完成动作。例如,按压打开音乐的按键,车辆则相应的为用户开始播放音乐;从而满足了用户的需求。
现有技术虽能满足用户对车辆的不同需求,但是,通过手动按压按键的方式控制车辆操作,往往需要用户转移视线且移动手臂或身躯,为用户的操作带来严重的不便;当用户在行车过程中,通过手动按压按键的方式控制车辆将产生很大的安全隐患。并且,对于处于非驾驶位的乘客由于距离按键位置较远,不便于通过按键来满足自身的各种需求,用户体验感差。
发明内容
本申请的目的是提供一种车辆语音控制方法、装置、设备、系统及介质,能够根据接收到的声音信息,确定出目标操作并通过发送相应的控制指令以完成目标操作,从而实现用户不论处于车内的任何位置,仅通过语音便能控制车辆进行各种操作,无需手动按压按键也能满足用户的各种需求。增加操控车辆的便利性,大大提高了用户在行车过程中的安全性;利用预先建立的模型库与目标指令进行对比,从而完成本地端语音识别,增加了用户体验感。
为解决上述技术问题,本申请提供一种车辆语音控制方法,所述方法包括:
采集车辆中包含有用户声音的声音信息,对所述声音信息进行预处理以获取目标指令;
将所述目标指令与预先建立的模型库中存储的各模型指令进行对比,判断是否存在与所述目标指令匹配的相配模型指令;
如果是,则将所述相配模型指令对应的车辆操作作为目标操作,并发送相应的控制指令以完成所述目标操作。
优选地,每一个所述车辆操作在所述模型库中对应不同的模型指令。
优选地,在所述发送相应的控制指令以完成所述目标操作之后,还包括:
发送展示指令以向用户反馈车辆的当前执行情况。
优选地,所述对所述声音信息进行预处理以获取目标指令具体为:
根据NR降噪算法,对所述声音信息进行降噪处理以获取目标指令。
优选地,所述对所述声音信息进行预处理以获取目标指令具体为:
根据AEC回音消除算法,对所述声音信息进行消除回音处理以获取目标指令。
优选地,还包括:
根据接收到的更新指令,对所述模型库中存储的各模型指令进行添加或删减操作。
为解决上述技术问题,本申请还提供一种车辆语音控制装置,包括:
采集模块,用于采集车辆中包含有用户声音的声音信息,对所述声音信息进行预处理以获取目标指令;
判断模块,用于将所述目标指令与预先建立的模型库中存储的各模型指令进行对比,判断是否存在与所述目标指令匹配的相配模型指令;如果是,则进入发送模块;
发送模块,用于将所述相配模型指令对应的车辆操作作为目标操作,并发送相应的控制指令以完成所述目标操作。
优选地,还包括:
反馈模块,用于在所述发送相应的控制指令以完成所述目标操作之后,发送展示指令以向用户反馈车辆的当前执行情况。
优选地,还包括:
更新模块,用于根据接收到的更新指令,对所述模型库中存储的各模型指令进行添加或删减操作。
为解决上述技术问题,本申请还提供一种车辆语音控制设备,包括存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上述任一项所述的车辆语音控制方法的步骤。
为解决上述技术问题,本申请还提供一种车辆语音控制系统,包括:
声音采集器,用于采集车辆中包含有用户声音的声音信息,将所述声音信息发送至处理器;
处理器,用于接收声音采集器发送的声音信息,对所述声音信息进行预处理以获取目标指令;将所述目标指令与预先建立的模型库中存储的各模型指令进行对比,判断是否存在与所述目标指令匹配的相配模型指令;如果是,则将所述相配模型指令对应的车辆操作作为目标操作,并发送相应的控制指令以完成所述目标操作。
为解决上述技术问题,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述的车辆语音控制方法的步骤。
本申请所提供的一种车辆语音控制方法,包括:采集车辆中包含有用户声音的声音信息,对声音信息进行预处理以获取目标指令;将目标指令与预先建立的模型库中存储的各模型指令进行对比,判断是否存在与目标指令匹配的相配模型指令;如果是,则将相配模型指令对应的车辆操作作为目标操作,并发送相应的控制指令以完成目标操作。由此可见,本申请根据接收到的声音信息,确定出目标操作并通过发送相应的控制指令以完成目标操作,从而实现了用户不论处于车内的任何位置,仅通过语音便能控制车辆进行各种操作,无需手动按压按键也能满足用户的各种需求。增加了操控车辆的便利性,大大提高了用户在行车过程中的安全性;利用预先建立的模型库与目标指令进行对比,从而完成本地端语音识别,增加了用户体验感。
此外,本申请所提供的一种车辆语音控制装置、设备、系统及介质与上述方法对应,具有同样的有益效果。
附图说明
为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种车辆语音控制方法的流程图;
图2为本申请实施例提供的一种车辆语音控制装置的结构图;
图3为本申请实施例提供的一种车辆语音控制设备的结构图;
图4为本申请实施例提供的一种车辆语音控制系统的结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本申请保护范围。
本申请的核心是提供一种车辆语音控制方法、装置、设备、系统及介质,能够根据接收到的声音信息,确定出目标操作并通过发送相应的控制指令以完成目标操作,从而实现用户不论处于车内的任何位置,仅通过语音便能控制车辆进行各种操作,无需手动按压按键也能满足用户的各种需求。增加操控车辆的便利性,大大提高了用户在行车过程中的安全性;利用预先建立的模型库与目标指令进行对比,从而完成本地端语音识别,增加了用户体验感。
为了使本技术领域的人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。
图1为本申请实施例提供的一种应用于处理器的车辆语音控制方法的流程图;如图1所示,本申请提供的一种车辆语音控制方法,包括步骤S101-步骤S103:
步骤S101:采集车辆中包含有用户声音的声音信息,对声音信息进行预处理以获取目标指令;
在一个实施例中,通过车辆内的声音采集器采集包含有用户声音的声音信息。具体地,声音采集器可以为麦克风。声音采集器对采集到的声音信息进行模数转换。
在具体实施中,在采集车辆中包含有用户声音的声音信息之前,还包括:
判断是否接收到开启采集指令,如果是,则采集声音信息。
具体地,可通过判断是否接收到开启采集指令,以确定车内将要发出的声音是否为用户发出的控制车辆操作的指令,从而避免误收集其它声音作为用户发出的指令,导致产生误操作。例如,当接收到“Hi”或“启动”等语音时,可作为开启采集指令并采集声音信息,从而提高车辆语音控制的准确性和有效性。
在一个实施例中,本申请实施例提出的处理器具体为车辆中的微控制单元。当接收到声音采集器发送的声音信息时,可对声音信息进行预处理以获取用于体现用户对车辆的操作需求的目标指令。
在一个实施例中,对声音信息进行预处理以获取目标指令具体为:
根据NR降噪算法,对声音信息进行降噪处理以获取目标指令。
具体地,声音采集器采集到的声音信息包含有用户发出的指示车辆进行操作的指令声音,也包含有一些车内其它的噪音。因此,处理器接收到声音信息同样包含有许多噪音,为更清晰地识别出体现用户对车辆的操作需求的目标指令,可根据NR降噪算法,对接收到的声音信息进行降噪处理得到目标指令。通过NR降噪算法对声音信息进行稳态噪音消除。具体地,稳态噪声是指噪声强度波动范围在5dB以内的连续性噪声,或重复频率大于10Hz的脉冲噪声。
在一个实施例中,对声音信息进行预处理以获取目标指令具体为:
根据AEC回音消除算法,对声音信息进行消除回音处理以获取目标指令。
具体地,在实际的车内环境中,通常包含有一些非稳态噪音,例如,在车内播放的音乐。对于存在非稳态噪音的情况,可根据AEC回音消除算法,对声音信息进行消除回音处理。
需要说明的是,本申请提出的车辆语音控制方法中,对声音信息进行预处理可为首先对声音信息进行降噪处理,对降噪处理后得到的指令再进行消除回音处理,将完成消除回音处理后得到的指令作为目标指令。
步骤S102:将目标指令与预先建立的模型库中存储的各模型指令进行对比,判断是否存在与目标指令匹配的相配模型指令;如果是,则进入步骤S103;
步骤S103:将相配模型指令对应的车辆操作作为目标操作,并发送相应的控制指令以完成目标操作。
在具体实施中,预先建立存储有各模型指令的模型库,例如,模型库中包含有打开空调、打开车灯和播放音乐等模型指令。通过将目标指令与模型库中各模型指令进行对比,可判断出模型库中是否包含有与目标指令匹配的相配模型指令;如果是,则说明用户想要对车辆进行相配模型指令对应的车辆操作,则将相配模型指令对应的车辆操作作为目标操作。根据目标操作确定出执行该操作的车辆设备,向该车辆设备发送相应的控制指令以完成目标操作。本领域技术人员可知,可通过特征提取的方式判断模型库中是否存在与目标指令匹配的相配模型指令。具体地,提取目标指令中的关键特征作为与各模型指令进行对比的依据,当关键特征与模型指令中的特征一致时,则可确定该模型指令为相配模型指令。详细的特征提取相关内容可参见现有技术,本申请实施例不再赘述。
在一个实施例中,每一个车辆操作在模型库中对应不同的模型指令。例如,对于打开车门的操作,在模型库中对应的模型指令可为“打开车门”,也可为“open the door”。当获取的目标指令与“打开车门”模型指令匹配时,可确定目标操作为打开车门的操作;当获取的目标指令与“open the door”模型指令匹配时,同样确定目标操作为打开车门的操作。从而实现用户可根据个人喜好与习惯对车辆进行语音命令,控制车辆完成各种操作。
本申请所提供的一种车辆语音控制方法,包括:采集车辆中包含有用户声音的声音信息,对声音信息进行预处理以获取目标指令;将目标指令与预先建立的模型库中存储的各模型指令进行对比,判断是否存在与目标指令匹配的相配模型指令;如果是,则将相配模型指令对应的车辆操作作为目标操作,并发送相应的控制指令以完成目标操作。由此可见,本申请确定出目标操作并通过发送相应的控制指令以完成目标操作,从而实现了用户不论处于车内的任何位置,仅通过语音便能控制车辆进行各种操作,无需手动按压按键也能满足用户的各种需求。增加了操控车辆的便利性,大大提高了用户在行车过程中的安全性;利用预先建立的模型库与目标指令进行对比,从而完成本地端语音识别,增加了用户体验感。
在一个实施例中,本申请提出的车辆语音控制方法,在发送相应的控制指令以完成目标操作之后,还包括:
发送展示指令以向用户反馈车辆的当前执行情况。
具体地,在发送相应的控制指令后,可向车辆上用于展示信息的展示设备发送展示指令,从而向用户反馈车辆的当前执行情况。在一个实施例中,展示设备具体可为显示器或播放器。当展示设备为显示器时,可根据接收到的展示指令,在显示屏上显示当前执行情况。当展示设备为播放器时,可根据接收到的展示指令,向车内乘客播放目标操作的当前执行情况。
进一步地,将目标指令与预先建立的模型库中存储的各模型指令进行对比,判断是否存在与目标指令匹配的相配模型指令;如果不存在,则说明用户发出的声音信息不正确;或暂未提供该项车辆服务;则可发送展示指令至展示设备以提示用户操作失败。例如,当目标指令为“打开车灯”指令,且处理器在模型库中获取到相配模型指令时,则可向播放器发送用于表示操作成功的展示指令,播放器接收到展示指令后,播报“好的,车灯已打开”的提示音。当处理器在模型库中并未获取到展示指令时,可向播放器发送用于表示操作失败的展示指令,播放器接收到展示指令后,播报“没有听清楚”或者“没有这项操作”的提示音。
在一个实施例中,本申请提出的车辆语音控制方法,还包括:
根据接收到的更新指令,对模型库中存储的各模型指令进行添加或删减操作。
为了能提供更丰富的模型指令以适应用户多样化的需求,可根据接收到的更新指令,对模型库中存储的各模型指令进行添加或删减操作。当车辆添加了新的操作时,可通过发送更新指令相应的添加模型库中的模型指令。也可根据用户的习惯和喜好,更新模型库中的模型指令。例如,用户习惯用英文沟通,则可在模型库中添加相应的英文模型指令,从而增加了操作的灵活性,提升了用户体验感。
本申请还提供一种车辆语音控制装置和车辆语音控制设备对应的实施例。需要说明的是,本申请从两个角度进行描述,一种是基于功能模块的角度,另一种是基于硬件的角度。
图2为本申请实施例提供的一种车辆语音控制装置的结构图;如图2所示,本申请实施例提供的一种车辆语音控制装置,包括:
采集模块10,用于采集车辆中包含有用户声音的声音信息,对声音信息进行预处理以获取目标指令;
判断模块11,用于将目标指令与预先建立的模型库中存储的各模型指令进行对比,判断是否存在与目标指令匹配的相配模型指令;如果是,则进入发送模块12;
发送模块12,用于将相配模型指令对应的车辆操作作为目标操作,并发送相应的控制指令以完成目标操作。
本申请实施例提供的一种车辆语音控制装置,还包括:
反馈模块,用于在发送相应的控制指令以完成目标操作之后,发送展示指令以向用户反馈车辆的当前执行情况。
本申请实施例提供的一种车辆语音控制装置,还包括:
更新模块,用于根据接收到的更新指令,对模型库中存储的各模型指令进行添加或删减操作。
由于本部分的实施例与方法部分的实施例相互对应,因此本部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。本申请所提供的车辆语音控制装置,有益效果与提供的一种应用于处理器的车辆语音控制方法的有益效果相同。
图3为本申请实施例提供的一种车辆语音控制设备的结构图;如图3所示,本申请实施例提供的一种车辆语音控制设备,包括存储器20,用于存储计算机程序;
处理器21,用于执行计算机程序时实现如上述任一项的车辆语音控制方法的步骤。
其中,处理器21可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器21可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器21也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器21可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器21还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器20可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器20还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器20至少用于存储以下计算机程序201,其中,该计算机程序被处理器21加载并执行之后,能够实现前述任一实施例公开的车辆语音控制方法中的相关步骤。另外,存储器20所存储的资源还可以包括操作系统202和数据203等,存储方式可以是短暂存储或者永久存储。其中,操作系统202可以包括Windows、Unix、Linux等。
在一些实施例中,车辆语音控制设备还可包括有输入输出接口22、通信接口23、电源24以及通信总线25。
本领域技术人员可以理解,图3中示出的结构并不构成对车辆语音控制设备的限定,可以包括比图示更多或更少的组件。
由于该部分的实施例与方法部分的实施例相互对应,因此该部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。在本申请的一些实施例中,处理器和存储器可通过总线或其它方式连接。
本申请所提供的一种车辆语音控制设备,能够实现如下方法:采集车辆中包含有用户声音的声音信息,对声音信息进行预处理以获取目标指令;将目标指令与预先建立的模型库中存储的各模型指令进行对比,判断是否存在与目标指令匹配的相配模型指令;如果是,则将相配模型指令对应的车辆操作作为目标操作,并发送相应的控制指令以完成目标操作。由此可见,本申请确定出目标操作并通过发送相应的控制指令以完成目标操作,从而实现了用户不论处于车内的任何位置,仅通过语音便能控制车辆进行各种操作,无需手动按压按键也能满足用户的各种需求。增加了操控车辆的便利性,大大提高了用户在行车过程中的安全性;利用预先建立的模型库与目标指令进行对比,从而完成本地端语音识别,增加了用户体验感。
图4为本申请实施例提供的一种车辆语音控制系统的结构图;如图4所示,本申请实施例提供的一种车辆语音控制系统,包括:
声音采集器30,用于采集车辆中包含有用户声音的声音信息,并将接收到的声音信息发送至处理器31;
处理器31,用于接收声音采集器发送的声音信息,对声音信息进行预处理以获取目标指令;将目标指令与预先建立的模型库中存储的各模型指令进行对比,判断是否存在与目标指令匹配的相配模型指令;如果是,则将相配模型指令对应的车辆操作作为目标操作,并发送相应的控制指令以完成目标操作。
在一个实施例中,通过车辆内的声音采集器30采集包含有用户声音的声音信息。具体地,声音采集器30可以为麦克风。声音采集器30对采集到的声音信息进行模数转换。声音采集器30将转换后的声音信息发送至处理器31。
在一个实施例中,本申请实施例提出的处理器31具体为用于车辆中的微控制单元。当接收到声音采集器30发送的声音信息时,可对声音信息进行预处理以获取用于体现用户对车辆的操作需求的目标指令。
需要说明的是,对声音信息进行预处理具体可为降噪处理或消除回音处理;同时,预处理也可为首先对声音信息进行降噪处理,再对降噪处理后得到的指令再进行消除回音处理,将完成消除回音处理后得到的指令作为目标指令。本领域技术人员可根据实际应用情况,确定预处理包含的操作,本申请实施例不作限定。
在具体实施中,处理器31预先建立存储有各模型指令的模型库,例如,模型库中包含有打开空调、打开车灯和播放音乐等模型指令。通过将目标指令与模型库中各模型指令进行对比,可判断出模型库中是否包含有与目标指令匹配的相配模型指令;如果是,则说明用户想要对车辆进行相配模型指令对应的车辆操作,则将相配模型指令对应的车辆操作作为目标操作。根据目标操作确定出执行该操作的车辆设备,向该车辆设备发送相应的控制指令以完成目标操作。本领域技术人员可知,可通过特征提取的方式判断模型库中是否存在与目标指令匹配的相配模型指令。具体地,提取目标指令中的关键特征作为与各模型指令进行对比的依据,当关键特征与模型指令中的特征一致时,则可确定该模型指令为相配模型指令。详细的特征提取相关内容可参见现有技术,本申请实施例不再赘述。
本申请所提供的一种车辆语音控制系统,包括:声音采集器,用于采集车辆中包含有用户声音的声音信息,将声音信息发送至处理器;处理器,用于接收声音采集器发送的声音信息,对声音信息进行预处理以获取目标指令;将目标指令与预先建立的模型库中存储的各模型指令进行对比,判断是否存在与目标指令匹配的相配模型指令;如果是,则将相配模型指令对应的车辆操作作为目标操作,并发送相应的控制指令以完成目标操作。由此可见,本申请根据接收到的声音信息,确定出目标操作并通过发送相应的控制指令以完成目标操作,从而实现了用户不论处于车内的任何位置,仅通过语音便能控制车辆进行各种操作,无需手动按压按键也能满足用户的各种需求。增加了操控车辆的便利性,大大提高了用户在行车过程中的安全性;利用预先建立的模型库与目标指令进行对比,从而完成本地端语音识别,增加了用户体验感。
最后,本申请还提供一种计算机可读存储介质对应的实施例。计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述方法实施例中记载的步骤。
可以理解的是,如果上述实施例中的方法以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上对本申请所提供的一种车辆语音控制方法、装置、设备、系统及介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
Claims (10)
1.一种车辆语音控制方法,其特征在于,所述方法包括:
采集车辆中包含有用户声音的声音信息,对所述声音信息进行预处理以获取目标指令;
将所述目标指令与预先建立的模型库中存储的各模型指令进行对比,判断是否存在与所述目标指令匹配的相配模型指令;
如果是,则将所述相配模型指令对应的车辆操作作为目标操作,并发送相应的控制指令以完成所述目标操作。
2.根据权利要求1所述的车辆语音控制方法,其特征在于,每一个所述车辆操作在所述模型库中对应不同的模型指令。
3.根据权利要求1所述的车辆语音控制方法,其特征在于,在所述发送相应的控制指令以完成所述目标操作之后,还包括:
发送展示指令以向用户反馈车辆的当前执行情况。
4.根据权利要求1所述的车辆语音控制方法,其特征在于,所述对所述声音信息进行预处理以获取目标指令具体为:
根据NR降噪算法,对所述声音信息进行降噪处理以获取目标指令。
5.根据权利要求1所述的车辆语音控制方法,其特征在于,所述对所述声音信息进行预处理以获取目标指令具体为:
根据AEC回音消除算法,对所述声音信息进行消除回音处理以获取目标指令。
6.根据权利要求1所述的车辆语音控制方法,其特征在于,还包括:
根据接收到的更新指令,对所述模型库中存储的各模型指令进行添加或删减操作。
7.一种车辆语音控制装置,其特征在于,包括:
采集模块,用于采集车辆中包含有用户声音的声音信息,对所述声音信息进行预处理以获取目标指令;
判断模块,用于将所述目标指令与预先建立的模型库中存储的各模型指令进行对比,判断是否存在与所述目标指令匹配的相配模型指令;如果是,则进入发送模块;
发送模块,用于将所述相配模型指令对应的车辆操作作为目标操作,并发送相应的控制指令以完成所述目标操作。
8.一种车辆语音控制设备,其特征在于,包括存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至6任一项所述的车辆语音控制方法的步骤。
9.一种车辆语音控制系统,其特征在于,包括:
声音采集器,用于采集车辆中包含有用户声音的声音信息,并将接收到的声音信息发送至处理器;
处理器,用于接收声音采集器发送的声音信息,对所述声音信息进行预处理以获取目标指令;将所述目标指令与预先建立的模型库中存储的各模型指令进行对比,判断是否存在与所述目标指令匹配的相配模型指令;如果是,则将所述相配模型指令对应的车辆操作作为目标操作,并发送相应的控制指令以完成所述目标操作。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的车辆语音控制方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010168571.1A CN111354359A (zh) | 2020-03-11 | 2020-03-11 | 一种车辆语音控制方法、装置、设备、系统及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010168571.1A CN111354359A (zh) | 2020-03-11 | 2020-03-11 | 一种车辆语音控制方法、装置、设备、系统及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111354359A true CN111354359A (zh) | 2020-06-30 |
Family
ID=71197471
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010168571.1A Pending CN111354359A (zh) | 2020-03-11 | 2020-03-11 | 一种车辆语音控制方法、装置、设备、系统及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111354359A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112071303A (zh) * | 2020-08-17 | 2020-12-11 | 黄冈格罗夫氢能汽车有限公司 | 一种燃料电池氢能汽车语音控制车灯系统 |
CN112576137A (zh) * | 2020-12-03 | 2021-03-30 | 广州橙行智动汽车科技有限公司 | 车窗控制方法、装置、车辆及存储介质 |
CN113280562A (zh) * | 2021-04-20 | 2021-08-20 | 华人运通(江苏)技术有限公司 | 车载冰箱的智能语音控制方法、装置、设备及存储介质 |
CN113820972A (zh) * | 2021-08-25 | 2021-12-21 | 阿波罗智联(北京)科技有限公司 | 信息处理及车辆控制方法、装置、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105448294A (zh) * | 2015-12-09 | 2016-03-30 | 江苏天安智联科技股份有限公司 | 一种应用于车载设备的智能语音识别系统 |
JP2017087950A (ja) * | 2015-11-09 | 2017-05-25 | 三菱自動車工業株式会社 | 車両用音声操作装置 |
CN206907479U (zh) * | 2017-07-24 | 2018-01-19 | 厦门盈趣科技股份有限公司 | 一种语音识别模块 |
CN108735203A (zh) * | 2018-03-28 | 2018-11-02 | 上海乐愚智能科技有限公司 | 语音交互方法、终端及计算机可读介质 |
CN109920419A (zh) * | 2019-03-05 | 2019-06-21 | 百度在线网络技术(北京)有限公司 | 语音控制方法和装置、电子设备及计算机可读介质 |
-
2020
- 2020-03-11 CN CN202010168571.1A patent/CN111354359A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017087950A (ja) * | 2015-11-09 | 2017-05-25 | 三菱自動車工業株式会社 | 車両用音声操作装置 |
CN105448294A (zh) * | 2015-12-09 | 2016-03-30 | 江苏天安智联科技股份有限公司 | 一种应用于车载设备的智能语音识别系统 |
CN206907479U (zh) * | 2017-07-24 | 2018-01-19 | 厦门盈趣科技股份有限公司 | 一种语音识别模块 |
CN108735203A (zh) * | 2018-03-28 | 2018-11-02 | 上海乐愚智能科技有限公司 | 语音交互方法、终端及计算机可读介质 |
CN109920419A (zh) * | 2019-03-05 | 2019-06-21 | 百度在线网络技术(北京)有限公司 | 语音控制方法和装置、电子设备及计算机可读介质 |
Non-Patent Citations (1)
Title |
---|
杨忠明等, 西安电子科技大学出版社 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112071303A (zh) * | 2020-08-17 | 2020-12-11 | 黄冈格罗夫氢能汽车有限公司 | 一种燃料电池氢能汽车语音控制车灯系统 |
CN112576137A (zh) * | 2020-12-03 | 2021-03-30 | 广州橙行智动汽车科技有限公司 | 车窗控制方法、装置、车辆及存储介质 |
CN112576137B (zh) * | 2020-12-03 | 2022-08-19 | 广州橙行智动汽车科技有限公司 | 车窗控制方法、装置、车辆及存储介质 |
CN113280562A (zh) * | 2021-04-20 | 2021-08-20 | 华人运通(江苏)技术有限公司 | 车载冰箱的智能语音控制方法、装置、设备及存储介质 |
CN113820972A (zh) * | 2021-08-25 | 2021-12-21 | 阿波罗智联(北京)科技有限公司 | 信息处理及车辆控制方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111354359A (zh) | 一种车辆语音控制方法、装置、设备、系统及介质 | |
JP3479691B2 (ja) | 実時間作動での音声対話又は音声命令による1つ又は複数の機器の自動制御方法及びこの方法を実施する装置 | |
CN206595039U (zh) | 一种车载语音交互系统 | |
US7991618B2 (en) | Method and device for outputting information and/or status messages, using speech | |
CN111354363A (zh) | 车载语音识别方法、装置、可读存储介质及电子设备 | |
CN110851221A (zh) | 一种智慧家居场景配置的方法及装置 | |
CN111916088B (zh) | 一种语音语料的生成方法、设备及计算机可读存储介质 | |
CN112017650B (zh) | 电子设备的语音控制方法、装置、计算机设备和存储介质 | |
US20150310853A1 (en) | Systems and methods for speech artifact compensation in speech recognition systems | |
CN114360527B (zh) | 车载语音交互方法、装置、设备及存储介质 | |
JP4104313B2 (ja) | 音声認識装置、プログラム及びナビゲーションシステム | |
CN113643704A (zh) | 车机语音系统的测试方法、上位机、系统和存储介质 | |
CN110767240B (zh) | 儿童口音识别的设备控制方法、设备、存储介质及装置 | |
CN110767219B (zh) | 语义更新方法、装置、服务器和存储介质 | |
US9715878B2 (en) | Systems and methods for result arbitration in spoken dialog systems | |
CN111833870A (zh) | 车载语音系统的唤醒方法、装置、车辆和介质 | |
US11996099B2 (en) | Dialogue system, vehicle, and method of controlling dialogue system | |
CN110737422B (zh) | 一种声音信号采集方法及装置 | |
CN110297617B (zh) | 一种主动对话的发起方法和装置 | |
CN118280356A (zh) | 语音交互方法、电子设备、车辆及存储介质 | |
CN117238288A (zh) | 车辆控制方法和车辆 | |
CN112017651B (zh) | 电子设备的语音控制方法、装置、计算机设备和存储介质 | |
CN117672226A (zh) | 本地化语音辨识助理 | |
CN110400568B (zh) | 智能语音系统的唤醒方法、智能语音系统及车辆 | |
CN112185368A (zh) | 自适应的人机语音对话装置和设备、交互系统和车辆 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200630 |