CN117476005A - 基于语音识别车顶帐篷控制方法、系统、车辆及存储介质 - Google Patents

基于语音识别车顶帐篷控制方法、系统、车辆及存储介质 Download PDF

Info

Publication number
CN117476005A
CN117476005A CN202311545183.0A CN202311545183A CN117476005A CN 117476005 A CN117476005 A CN 117476005A CN 202311545183 A CN202311545183 A CN 202311545183A CN 117476005 A CN117476005 A CN 117476005A
Authority
CN
China
Prior art keywords
voice
information
roof tent
recognized
tent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311545183.0A
Other languages
English (en)
Inventor
尹昊
张小红
方宜学
江乐光
曹开忠
李军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangling Motors Corp Ltd
Original Assignee
Jiangling Motors Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangling Motors Corp Ltd filed Critical Jiangling Motors Corp Ltd
Priority to CN202311545183.0A priority Critical patent/CN117476005A/zh
Publication of CN117476005A publication Critical patent/CN117476005A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

本申请涉及汽车帐篷控制技术领域,尤其是涉及一种基于语音识别车顶帐篷控制方法、系统、车辆及存储介质。方法包括获取待识别语音信息并进行预处理,其中,预处理包括采用回声消除算法抑制采集的待识别语音信息音频信号中的车载环境自噪声;对预处理后的待识别语音信息进行分段处理以获得各语音片段,并提取各语音片段的声纹信息;根据提取声纹信息与预设的声纹数据库中语段进行匹配,判断对应的语音控制指令是否为车顶帐篷语音控制指令;若为车顶帐篷语音控制指令,根据车顶帐篷语音控制指令,对车顶帐篷进行自动化控制的动力液压系统进行控制实现开合,如此,实现对车顶帐篷打开或者折叠过程的强交互性及稳定性,提升用户的体验感。

Description

基于语音识别车顶帐篷控制方法、系统、车辆及存储介质
技术领域
本申请涉及汽车帐篷控制技术领域,尤其是涉及一种基于语音识别车顶帐篷控制方法、系统、车辆及存储介质。
背景技术
车顶帐篷,又称为车顶上的“家”,随着汽车制造业而发展起来的周边产业,国内随着汽车保有量的上升,自驾旅游渐渐升温,车顶帐篷便是户外自驾游的可选装备之一,例如,在越野车型上,车顶帐篷固定安装于车辆顶部车架,当需要使用时,将车顶帐篷内的帐篷防水布打开搭好,通过车辆天窗或者从外界阶梯进入,从而拥有更大的私人空间。
目前随着车辆智能化的发展,车辆的更多功能都慢慢实现与用户进行智能交互,相关技术中,手动的车顶帐篷在国内应用广泛,但是由于车辆本身车顶部位置较高,现有的手动车顶帐篷在安装与使用过程需要花费很大的力气,而对于可以远程操控帐篷自动打开或者折叠的车顶帐篷,其控制车顶帐篷的自动打开或者折叠操作复杂,同时交互性差,基于此,需要一种全新的车顶帐篷控制装置及控制方法实现对车顶帐篷打开或者折叠过程的强交互性及稳定性。
发明内容
本申请旨在提出一种基于语音识别车顶帐篷控制方法、系统、车辆及存储介质,以解决现有技术中控制车顶帐篷的自动打开或者折叠操作复杂,同时与用户的交互性差问题。
第一方面,本申请实施例提供一种基于语音识别车顶帐篷控制方法,包括:
声控功能开启后,持续性获取待识别语音信息并进行预处理,其中,预处理包括采用回声消除算法抑制采集的待识别语音信息音频信号中的车载环境自噪声;
对预处理后的所述待识别语音信息进行分段处理以获得各语音片段,并提取各语音片段的声纹信息;
根据提取各语音片段的声纹信息与预设的声纹数据库中语段进行匹配,判断所述待识别语音信息对应的语音控制指令是否为车顶帐篷语音控制指令;
若为车顶帐篷语音控制指令,根据车顶帐篷的实际状态以及所述车顶帐篷语音控制指令,对车顶帐篷开合进行自动化控制。
根据本申请的一些实施例,所述对预处理后的所述待识别语音信息进行分段处理以获得各语音片段,并提取各语音片段的声纹信息,包括:
根据预处理后的所述待识别语音信息进行语音增强处理,通过提取语音增强处理后待识别语音信息音色与预设的音色库比对判断是否为相同的音色;
若判断待识别语音信息为相同的音色,根据预设的窗长对所述待识别语音信息进行分段处理得到各语音片段,并提取各语音片段的声纹信息;
根据所述声纹信息判断车内人员操作的应用类型是否为娱乐类应用;
若所述应用的类型不为娱乐类应用,将所述车内人员判定为语音交互对象;若所述应用的类型为娱乐类应用,将所述车内人员判定为非语音交互对象。
根据本申请的一些实施例,所述根据预处理后的所述待识别语音信息进行语音增强处理,通过提取语音增强处理后待识别语音信息音色与预设的音色库比对判断是否为相同的音色,包括:
若判断所述待识别语音信息为多种不同音色,根据预设的音色库对所述待识别语音信息中相同音色语段进行提取得到待识别语段信息;
根据预设的窗长逐一对所述待识别语段信息进行分段处理得到各语音片段,并提取各语音片段的声纹信息。
根据本申请的一些实施例,所述根据提取各语音片段的声纹信息与预设的声纹数据库中语段进行匹配,判断所述待识别语音信息对应的语音控制指令是否为车顶帐篷语音控制指令,包括:
依次将每一语音片段的声纹信息与预设的声纹数据库中预存声纹信息进行匹配;
通过对匹配成功后每一语音片段的声纹信息进行组合,得到所述待识别语音信息对应的语音控制指令;
根据所述语音控制指令的控制逻辑判断是否为车顶帐篷语音控制指令。
根据本申请的一些实施例,所述依次将每一语音片段的声纹信息与预设的声纹数据库中预存声纹信息进行匹配,包括:
若存在某一语音片段的声纹信息与预设的声纹数据库中预存声纹信息匹配失败,则终止后续的语音片段的声纹信息进行匹配,并确定所述待识别语音信息为非语音控制指令信息。
根据本申请的一些实施例,所述若为车顶帐篷语音控制指令,根据车顶帐篷的实际状态以及所述车顶帐篷语音控制指令,对车顶帐篷开合进行自动化控制,包括:
若为车顶帐篷语音控制指令,实时获取所述车顶帐篷的当前状态信号,其中,所述当前状态信号包括车顶帐篷的打开以及关闭情况;
根据所述车顶帐篷语音控制指令以及所述当前状态信号,判断所述车顶帐篷的当前状态是否为所述车顶帐篷语音控制指令执行后的状态;
若是,则终止执行所述车顶帐篷语音控制指令对应的控制策略并发出语音提示。
根据本申请的一些实施例,所述根据所述车顶帐篷语音控制指令以及所述当前状态信号,判断所述车顶帐篷的当前状态是否为所述车顶帐篷语音控制指令执行后的状态,包括:
根据所述车顶帐篷语音控制指令以及所述当前状态信号对应操作码设置的匹配位,其中,所述匹配位由一字节地址0及1表示;
若所述车顶帐篷语音控制指令与所述当前状态信号对应的匹配位相同,则所述车顶帐篷的当前状态为所述车顶帐篷语音控制指令执行后的状态;
若所述车顶帐篷语音控制指令与所述当前状态信号对应的匹配位不相同,则所述车顶帐篷的当前状态为所述车顶帐篷语音控制指令待执行前的状态。
第二方面,本申请实施例提供一种基于语音识别车顶帐篷控制装置,包括:
第一获取模块,被配置为持续采集目标车辆内用户发出的待识别语音信息;
预处理模块,被配置为对所述获取模块持续采集的待识别语音信息进行降噪及语音增强处理;
语音分段模块,被配置为对所述预处理模块处理后的待识别语音信息进行分段处理,以得到各语音片段的声纹信息;
第一判断模块:被配置为根据预处理后的所述待识别语音信息进行语音增强处理,通过提取语音增强处理后待识别语音信息音色与预设的音色库比对判断是否为相同的音色;
声纹匹配模块,被配置为对所述语音分段模块得到各语音片段的声纹信息与预设初级声纹数据库中存储的声纹信息进行匹配;
第二判断模块:被配置为根据所述声纹匹配模块的匹配结果判断所述待识别语音信息对应的语音控制指令是否为车顶帐篷语音控制指令;
第二获取模块,被配置为根据所述第二判断模块的判断结果,实时获取车顶帐篷的当前状态信号;
确定模块,被配置为根据所述第二判断模块的判断结果以及所述第二获取模块获取的当前状态信号,对车顶帐篷开合进行自动化控制。
第三方面,本申请实施例还提供一种车辆,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上述第一方面实施例任一项所述的基于语音识别车顶帐篷控制方法的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,所述可读存储介质上存储有车辆电动侧滑移门测试方法对应计算机程序,该计算机程序被处理器执行时实现如上述第一方面实施例任一项所述的基于语音识别车顶帐篷控制方法的步骤。
可以理解的是,上述第二方面至第四方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
本申请实施例中上述的技术方案,至少具有如下技术效果或优点:
通过声控功能开启后,持续性获取待识别语音信息并进行预处理,其中,预处理包括采用回声消除算法抑制采集的待识别语音信息音频信号中的车载环境自噪声;对预处理后的所述待识别语音信息进行分段处理以获得各语音片段,并提取各语音片段的声纹信息;根据提取各语音片段的声纹信息与预设的声纹数据库中语段进行匹配,判断所述待识别语音信息对应的语音控制指令是否为车顶帐篷语音控制指令;若为车顶帐篷语音控制指令,根据车顶帐篷的实际状态以及所述车顶帐篷语音控制指令,对车顶帐篷进行自动化控制的动力液压系统进行控制实现开合,如此,实现对车顶帐篷打开或者折叠过程的强交互性及稳定性,提升用户的体验感。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请实施例示出的一种基于语音识别车顶帐篷控制方法的流程图;
图2是根据本申请实施例示出的一种基于语音识别车顶帐篷控制方法的框图;
图3是根据本申请实施例示出的车辆的功能框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
本申请的说明书和权利要求书及所述附图中术语“第一”、“第二”、“第三”等是区别于不同的对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如,包含了一系列步骤或单元,或者可选地,还包括没有列出的步骤或单元,或者可选地还包括这些过程、方法、产品或设备固有的其它步骤或单元。
附图中仅示出了与本申请相关的部分而非全部内容。在更加详细地讨论示例性实施例之前,应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
在本说明书中使用的术语“部件”、“模块”、“系统”、“单元”等用于表示计算机相关的实体、硬件、固件、硬件和软件的组合、软件或执行中的软件。例如,单元可以是但不限于在处理器上运行的进程、处理器、对象、可执行文件、执行线程、程序和/或分布在两个或多个计算机之间。此外,这些单元可从在上面存储有各种数据结构的各种计算机可读介质执行。单元可例如根据具有一个或多个数据分组(例如来自与本地系统、分布式系统和/或网络间的另一单元交互的第二单元数据。例如,通过信号与其它系统交互的互联网)的信号通过本地和/或远程进程来通信。
请参阅图1,图1示出了本申请一示例性实施例提供的一种基于语音识别车顶帐篷控制方法的流程图,详述如下:
步骤S100:声控功能开启后,持续性获取待识别语音信息并进行预处理,其中,预处理包括采用回声消除算法抑制采集的待识别语音信息音频信号中的车载环境自噪声;
在本步骤中,需要说明的是,目前并没有应用于车顶帐篷的语音识别控制方法,其更多通过遥控设备进行开合,而在本实施例中的基于语音识别车顶帐篷控制方法中,可以理解的是,车顶帐篷的执行端可以通过电机动力系统或者液压系统执行,其电机动力系统或者液压系统与车辆控制器ECU通讯连接,通过车辆控制器ECU发出的指令控制电机动力系统或者液压系统执行车顶帐篷开合,同时,车辆控制器ECU与车辆声控功能配置的麦克风通讯连接,车辆控制器ECU中存储预设有语音过滤识别程序,
具体地,可以通过目标车辆配置的多个麦克风对车载空间进行音区信号分离,至少将车载空间分为前座位音区、后座位音区,根据各音区内的麦克风组成分布式麦克风网络,通过分布式麦克风网络实时采集所述车载环境下的音频,根据回声消除算法抑制采集的待识别语音信息音频信号中的车载环境自噪声。
需要说明的是,回声消除指的是设备自身扬声器播放的声音经不同的路径一次或多次反射后进入麦克风所产生的回声集合 ,也可称作设备自噪声。用户通过语音同设备进行交互的时候,回声信号和干净的语音信号混合,这会恶化采集到的语音信号的信噪比,严重干扰后续的信号处理算法和唤醒识别模块的性能。所以原始麦克风信号要先通过回声消除算法模块,消除设备自噪声,以达到提升信噪比的目的。回声消除主要的原理是采用自适应滤波技术,动态的实时跟踪车内的声学信道,参考音经过这个信道的滤波,模拟出传到麦克风处的回声,最后原始的麦克风信号减掉这个回声信号,达到消除车载设备自噪声的目的。
在一示例性实施例中,若目标车辆内除了驾驶员外,当还搭乘其他人员,为了从多种不同的音频中多个说话人的声音进行分离,可以通过盲源分离算法进行分离,盲源分离的主要原理是采用一个变换矩阵,通过不断迭代更新,使最终输出的各分量信号之间的互信息最小。在车载场景,往往会出现大家同时说话的情况,通过盲源分离可以将每个人的声音按照顺序分离出来,可同时实现四个人分别进行人机交互。
当然,为了避免目标车辆在上电后持续采集语音信息,在另一个实施例中,还可以通过设置某一个词语或者名称进行唤醒目标车辆的语音控制系统,当用户想通过语音对目标车辆进行控制时,可以通过先说出该词语或者名称进行唤醒,再进行后续的语音控制。
步骤S200:对预处理后的所述待识别语音信息进行分段处理以获得各语音片段,并提取各语音片段的声纹信息;
在本步骤中,根据预处理后的所述待识别语音信息进行语音增强处理,通过提取语音增强处理后待识别语音信息音色与预设的音色库比对判断是否为相同的音色;音色库为预存在目标车辆存储器中的音色资源,其中,在车辆语音系统使用前,通过前期对用户的语音进行录入创建音色库,音色库中可以存储多个用户的音色信息,当有未录入的用户音色信息的用户使用该车辆时,从而过滤该用户的语音信息,
若判断待识别语音信息为相同的音色,根据预设的窗长对所述待识别语音信息进行分段处理得到各语音片段,并提取各语音片段的声纹信息;
可选地,若判断所述待识别语音信息为多种不同音色,根据预设的音色库对所述待识别语音信息中相同音色语段进行提取得到待识别语段信息;
在一示例性实施例中,为了进一步提高提高识别准确性,还可以对待识别语音信息再进行语音增强处理,语音增强可以理解为降噪过程,在语音增强的过程中随着环境噪音的减弱,同时,有一些含有信息要素的音频也被消除,降低了用户语音命令被准确识别的概率。示例性地,可以通过已训练的语音增强模型进行语音增强步骤,得到语音增强的待识别语音信息。
具体地,根据语音增强处理后的待识别语音信息,通过提取语音增强处理后待识别语音信息音色与预设的音色库比对判断是否为同一个人发出,若判断待识别语音信息为同一个人发出语音,再根据预设的窗长对待识别语音信息进行分段处理得到各语音片段,并提取各语音片段的声纹信息;
需要说明的是,预设的音色库可以通过驾驶员进行设置预存,示例性地,当驾驶员初次驾驶目标车辆时,若驾驶员想通过语音进行控制车辆,可以通过采集当前驾驶员的音色信息进行预存,当该用户再次驾驶想通过语音进行交互时,目标车辆根据当前采集的待识别语音信息音色与预设的音色库比对进,从而更加准确判断是否为同一个人发出语音。
根据预设的窗长逐一对所述待识别语段信息进行分段处理得到各语音片段,并提取各语音片段的声纹信息;
根据所述声纹信息判断车内人员操作的应用类型是否为娱乐类应用;可以理解的是,娱乐类应用包括车载娱乐系统的相关功能,例如,车内人员想要对播放音乐亦或打开导航地图等进行语音控制,该类功能属于娱乐类应用;
若所述应用的类型不为娱乐类应用,将所述车内人员判定为语音交互对象;若所述应用的类型为娱乐类应用,将所述车内人员判定为非语音交互对象。
步骤S300:根据提取各语音片段的声纹信息与预设的声纹数据库中语段进行匹配,判断所述待识别语音信息对应的语音控制指令是否为车顶帐篷语音控制指令;
在本步骤中,依次将每一语音片段的声纹信息与预设的声纹数据库中预存声纹信息进行匹配;可以理解的是,声纹信息是用于对
通过对匹配成功后每一语音片段的声纹信息进行组合,得到所述待识别语音信息对应的语音控制指令;
根据所述语音控制指令的控制逻辑判断是否为车顶帐篷语音控制指令;
可选地,若存在某一语音片段的声纹信息与预设的声纹数据库中预存声纹信息匹配失败,则终止后续的语音片段的声纹信息进行匹配,并确定所述待识别语音信息为非语音控制指令信息。
步骤S400:若为车顶帐篷语音控制指令,根据车顶帐篷的实际状态以及所述车顶帐篷语音控制指令,对车顶帐篷开合进行自动化控制。
在本步骤中,若为车顶帐篷语音控制指令,实时获取所述车顶帐篷的当前状态信号,其中,所述当前状态信号包括车顶帐篷的打开以及关闭情况;
根据所述车顶帐篷语音控制指令以及所述当前状态信号,判断所述车顶帐篷的当前状态是否为所述车顶帐篷语音控制指令执行后的状态;
若是,则终止执行所述车顶帐篷语音控制指令对应的控制策略并发出语音提示。
可选地,所述根据所述车顶帐篷语音控制指令以及所述当前状态信号,判断所述车顶帐篷的当前状态是否为所述车顶帐篷语音控制指令执行后的状态,包括:
根据所述车顶帐篷语音控制指令以及所述当前状态信号对应操作码设置的匹配位,其中,所述匹配位由一字节地址0及1表示;可以理解的是,在目标车辆控制器与各执行端进行信息交互时,其控制指令的载体为操作码,其操作码中包括了多个字节的位数,在本步骤中,对所述车顶帐篷语音控制指令以及所述当前状态信号对应操作码进行预设一字节匹配位,该匹配位用于区别车顶帐篷语音控制指令是打开车顶帐篷指令还是关闭车顶帐篷指令;以及对车顶帐篷当前状态是打开状态还是关闭状态进行表示;
可选地,通过匹配位设置“0”表示车顶帐篷当前状态是打开状态,以及车顶帐篷语音控制指令是打开车顶帐篷指令,通过匹配位设置“1”表示车顶帐篷当前状态是关闭状态,以及车顶帐篷语音控制指令是关闭车顶帐篷指令;
在一些实施方式中,如果车顶帐篷语音控制指令以及所述当前状态信号对应操作码进行预设一字节匹配位都为“0”或“1”,则说明该车顶帐篷语音控制指令对应的控制与车顶帐篷当前状态冲突,即该车顶帐篷的当前状态为该车顶帐篷语音控制指令控制后的状态,该语音控制指令不可执行,此时,可以通过车载娱乐系统进行语音提示,
若所述车顶帐篷语音控制指令与所述当前状态信号对应的匹配位相同,则所述车顶帐篷的当前状态为所述车顶帐篷语音控制指令执行后的状态;
若所述车顶帐篷语音控制指令与所述当前状态信号对应的匹配位不相同,则所述车顶帐篷的当前状态为所述车顶帐篷语音控制指令待执行前的状态。
上述方法步骤中,通过声控功能开启后,持续性获取待识别语音信息并进行预处理,其中,预处理包括采用回声消除算法抑制采集的待识别语音信息音频信号中的车载环境自噪声;对预处理后的所述待识别语音信息进行分段处理以获得各语音片段,并提取各语音片段的声纹信息;根据提取各语音片段的声纹信息与预设的声纹数据库中语段进行匹配,判断所述待识别语音信息对应的语音控制指令是否为车顶帐篷语音控制指令;若为车顶帐篷语音控制指令,根据车顶帐篷的实际状态以及所述车顶帐篷语音控制指令,对车顶帐篷进行自动化控制的动力液压系统进行控制实现开合,如此,实现对车顶帐篷打开或者折叠过程的强交互性及稳定性,提升用户的体验感。
请参阅图2,图2示出了本申请一示例性实施例提供的一种基于语音识别车顶帐篷控制装置200,包括:
第一获取模块210,被配置为持续采集目标车辆内用户发出的待识别语音信息;
预处理模块220,被配置为对所述获取模块210持续采集的待识别语音信息进行降噪及语音增强处理;
语音分段模块230,被配置为对所述预处理模块220处理后的待识别语音信息进行分段处理,以得到各语音片段的声纹信息;
第一判断模块240,被配置为根据预处理后的所述待识别语音信息进行语音增强处理,通过提取语音增强处理后待识别语音信息音色与预设的音色库比对判断是否为相同的音色;
声纹匹配模块250,被配置为对所述语音分段模块得到各语音片段的声纹信息与预设初级声纹数据库中存储的声纹信息进行匹配;
第二判断模块260,被配置为根据所述声纹匹配模块250的匹配结果判断所述待识别语音信息对应的语音控制指令是否为车顶帐篷语音控制指令;
第二获取模块270,被配置为根据所述第二判断模块260的判断结果,实时获取车顶帐篷的当前状态信号;
确定模块280,被配置为根据所述第二判断模块270的判断结果以及所述第二获取模块270获取的当前状态信号,对车顶帐篷开合进行自动化控制。
请参阅图3,图3是根据本申请一示例性实施例示出的车辆600的功能框图,车辆600可包括各种子系统,例如,信息娱乐系统610、感知系统620、决策控制系统630、驱动系统640以及计算平台650。可选的,车辆600可包括更多或更少的子系统,并且每个子系统都可包括多个部件。另外,车辆600的每个子系统和部件可以通过有线或者无线的方式实现互连。
在一些实施例中,信息娱乐系统610可以包括通信系统611,娱乐系统612以及导航系统613。
通信系统611可以包括无线通信系统,无线通信系统可以直接地或者经由通信网络来与一个或多个设备无线通信。例如,无线通信系统可使用3G蜂窝通信,例如CDMA、EVD0、GSM/GPRS,或者4G蜂窝通信,例如LTE。或者5G蜂窝通信。无线通信系统可利用WiFi与无线局域网(wireless local area network,WLAN)通信。在一些实施例中,无线通信系统可利用红外链路、蓝牙或ZigBee与设备直接通信。其他无线协议,例如各种车辆通信系统,例如,无线通信系统可包括一个或多个专用短程通信(dedicated short range communications,DSRC)设备,这些设备可包括车辆和/或路边台站之间的公共和/或私有数据通信。
娱乐系统612可以包括显示设备,麦克风和音响,用户可以基于娱乐系统在车内收听广播,播放音乐;或者将手机和车辆联通,在显示设备上实现手机的投屏,显示设备可以为触控式,用户可以通过触摸屏幕进行操作。
在一些情况下,可以通过麦克风获取用户的语音信号,并依据对用户的语音信号的分析实现用户对车辆600的某些控制,例如调节车内温度等。在另一些情况下,可以通过音响向用户播放音乐。
导航系统613可以包括由地图供应商所提供的地图服务,从而为车辆600提供行驶路线的导航,导航系统613可以和车辆的全球定位系统621、惯性测量单元622配合使用。地图供应商所提供的地图服务可以为二维地图,也可以是高精地图。
感知系统620可包括感测关于车辆600周边的环境的信息的若干种传感器。例如,感知系统620可包括全球定位系统621(全球定位系统可以是GPS系统,也可以是北斗系统或者其他定位系统)、惯性测量单元(inertial measurement unit,IMU)622、激光雷达623、毫米波雷达624、超声雷达625以及摄像装置626。感知系统620还可包括被监视车辆600的内部系统的传感器(例如,车内空气质量监测器、燃油量表、机油温度表等)。来自这些传感器中的一个或多个的传感器数据可用于检测对象及其相应特性(位置、形状、方向、速度等)。这种检测和识别是车辆600的安全操作的关键功能。
全球定位系统621用于估计车辆600的地理位置。
惯性测量单元622用于基于惯性加速度来感测车辆600的位姿变化。在一些实施例中,惯性测量单元622可以是加速度计和陀螺仪的组合。
激光雷达623利用激光来感测车辆600所位于的环境中的物体。在一些实施例中,激光雷达623可包括一个或多个激光源、激光扫描器以及一个或多个检测器,以及其他系统组件。
毫米波雷达624利用无线电信号来感测车辆600的周边环境内的物体。在一些实施例中,除了感测物体以外,毫米波雷达624还可用于感测物体的速度和/或前进方向。
超声雷达625可以利用超声波信号来感测车辆600周围的物体。
摄像装置626用于捕捉车辆600的周边环境的图像信息。摄像装置626可以包括单目相机、双目相机、结构光相机以及全景相机等,摄像装置626获取的图像信息可以包括静态图像,也可以包括视频流信息。
决策控制系统630包括基于感知系统620所获取的信息进行分析决策的计算系631,决策控制系统630还包括对车辆600的动力系统进行控制的整车控制器632,以及用于控制车辆600的转向系统633、油门634和制动系统635。
计算系统631可以操作来处理和分析由感知系统620所获取的各种信息以便识别车辆600周边环境中的目标、物体和/或特征。目标可以包括行人或者动物,物体和/或特征可包括交通信号、道路边界和障碍物。计算系统631可使用物体识别算法、运动中恢复结构(Structure from Motion,SFM)算法、视频跟踪等技术。在一些实施例中,计算系统631可以用于为环境绘制地图、跟踪物体、估计物体的速度等等。计算系统631可以将所获取的各种信息进行分析并得出对车辆的控制策略。
整车控制器632可以用于对车辆的动力电池和引擎641进行协调控制,以提升车辆600的动力性能。
转向系统633可操作来调整车辆600的前进方向。例如在一个实施例中可以为方向盘系统。
油门634用于控制引擎641的操作速度并进而控制车辆600的速度。
制动系统635用于控制车辆600减速。制动系统635可使用摩擦力来减慢车轮644。在一些实施例中,制动系统635可将车轮644的动能转换为电流。制动系统635也可采取其他形式来减慢车轮644转速从而控制车辆600的速度。
驱动系统640可包括为车辆600提供动力运动的组件。在一个实施例中,驱动系统640可包括引擎641、能量源642、传动系统643和车轮644。引擎641可以是内燃机、电动机、空气压缩引擎或其他类型的引擎组合,例如汽油发动机和电动机组成的混动引擎,内燃引擎和空气压缩引擎组成的混动引擎。引擎641将能量源642转换成机械能量。
能量源642的示例包括汽油、柴油、其他基于石油的燃料、丙烷、其他基于压缩气体的燃料、乙醇、太阳能电池板、电池和其他电力来源。能量源642也可以为车辆600的其他系统提供能量。
传动系统643可以将来自引擎641的机械动力传送到车轮644。传动系统643可包括变速箱、差速器和驱动轴。在一个实施例中,传动系统643还可以包括其他器件,比如离合器。其中,驱动轴可包括可耦合到一个或多个车轮644的一个或多个轴。
车辆600的部分或所有功能受计算平台650控制。计算平台650可包括至少一个处理器651,处理器651可以执行存储在例如存储器652这样的非暂态计算机可读介质中的指令653。在一些实施例中,计算平台650还可以是采用分布式方式控制车辆600的个体组件或子系统的多个计算设备。
处理器651可以是任何常规的处理器,诸如商业可获得的CPU。可替换地,处理器651还可以包括诸如图像处理器(Graphic Process Unit,GPU),现场可编程门阵列(FieldProgrammable Gate Array,FPGA)、片上系统(System on Chip,SOC)、专用集成芯片(Application Specific Integrated Circuit,ASIC)或它们的组合。尽管图3功能性地图示了处理器、存储器、和在相同块中的计算机的其它元件,但是本领域的普通技术人员应该理解该处理器、计算机、或储器实际上可以包括可以或者可以不存储在相同的物理外壳内的多个处理器、计算机、或存储器。例如,存储器可以是硬盘驱动器或位于不同于计算机的外壳内的其它存储介质。因此,对处理器或计算机的引用将被理解为包括对可以或者可以不并行操作的处理器或计算机或存储器的集合的引用。不同于使用单一的处理器来执行此处所描述的步骤,诸如转向组件和减速组件的一些组件每个都可以具有其自己的处理器,处理器只执行与特定于组件的功能相关的计算。
在本公开实施方式中,处理器651可以执行上述的基于语音识别车顶帐篷控制方法的步骤。
在此处所描述的各个方面中,处理器651可以位于远离该车辆并且与该车辆进行无线通信。在其它方面中,此处所描述的过程中的一些在布置于车辆内的处理器上执行而其它则由远程处理器执行,包括采取执行单一操纵的必要步骤。
在一些实施例中,第四存储器652可包含指令653(例如,程序逻辑),指令653可被第四处理器651执行来执行车辆600的各种功能。存储器652也可包含额外的指令,包括向信息娱乐系统610、感知系统620、决策控制系统630、驱动系统640中的一个或多个发送数据、从其接收数据、与其交互和/或对其进行控制的指令。
除了指令653以外,存储器652还可存储数据,例如道路地图、路线信息,车辆的位置、方向、速度以及其它这样的车辆数据,以及其他信息。这种信息可在车辆600在自主、半自主和/或手动模式中操作期间被车辆600和计算平台650使用。
计算平台650可基于从各种子系统(例如,驱动系统640、感知系统620和决策控制系统630)接收的输入来控制车辆600的功能。例如,计算平台650可利用来自决策控制系统630的输入以便控制转向系统633来避免由感知系统620检测到的障碍物。在一些实施例中,计算平台650可操作来对车辆600及其子系统的许多方面提供控制。
可选地,上述这些组件中的一个或多个可与车辆600分开安装或关联。例如,存储器652可以部分或完全地与车辆600分开存在。上述组件可以按有线和/或无线方式来通信地耦合在一起。
可选地,上述组件只是一个示例,实际应用中,上述各个模块中的组件有可能根据实际需要增添或者删除,图3不应理解为对本公开实施例的限制。
可选地,车辆600或者与车辆600相关联的感知和计算设备(例如计算系统631、计算平台650)可以基于所识别的物体的特性和周围环境的状态(例如,交通、雨、道路上的冰、等等)来预测识别的物体的行为。可选地,每一个所识别的物体都依赖于彼此的行为,因此还可以将所识别的所有物体全部一起考虑来预测单个识别的物体的行为。车辆600能够基于预测的识别的物体的行为来调整它的速度。换句话说,自动驾驶汽车能够基于所预测的物体的行为来确定车辆将需要调整到(例如,加速、减速、或者停止)何种稳定状态。在这个过程中,也可以考虑其它因素来确定车辆600的速度,诸如,车辆600在行驶的道路中的横向位置、道路的曲率、静态和动态物体的接近度等等。
除了提供调整自动驾驶汽车的速度的指令之外,计算设备还可以提供修改车辆600的转向角的指令,以使得自动驾驶汽车遵循给定的轨迹和/或维持与自动驾驶汽车附近的物体(例如,道路上的相邻车道中的车辆)的安全横向和纵向距离。
在一些实施例中,本公开还提供一种计算机可读存储介质,所述存储介质上存储有基于语音识别车顶帐篷控制方法对应的程序,所述基于语音识别车顶帐篷控制方法对应的程序被处理器执行时实现上述实施例所述的基于语音识别车顶帐篷控制方法的步骤。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。
显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或者特性可以包含在本实施例申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是相同的实施例,也不是与其它实施例互斥的独立的或是备选的实施例。本领域技术人员可以显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (10)

1.一种基于语音识别车顶帐篷控制方法,其特征在于,包括:
声控功能开启后,持续性获取待识别语音信息并进行预处理,其中,预处理包括采用回声消除算法抑制采集的待识别语音信息音频信号中的车载环境自噪声;
对预处理后的所述待识别语音信息进行分段处理以获得各语音片段,并提取各语音片段的声纹信息;
根据提取各语音片段的声纹信息与预设的声纹数据库中语段进行匹配,判断所述待识别语音信息对应的语音控制指令是否为车顶帐篷语音控制指令;
若为车顶帐篷语音控制指令,根据车顶帐篷的实际状态以及所述车顶帐篷语音控制指令,对车顶帐篷开合进行自动化控制。
2.根据权利要求1所述的一种基于语音识别车顶帐篷控制方法,其特征在于,所述对预处理后的所述待识别语音信息进行分段处理以获得各语音片段,并提取各语音片段的声纹信息,包括:
根据预处理后的所述待识别语音信息进行语音增强处理,通过提取语音增强处理后待识别语音信息音色与预设的音色库比对判断是否为相同的音色;
若判断待识别语音信息为相同的音色,根据预设的窗长对所述待识别语音信息进行分段处理得到各语音片段,并提取各语音片段的声纹信息;
根据所述声纹信息判断车内人员操作的应用类型是否为娱乐类应用;
若所述应用的类型不为娱乐类应用,将所述车内人员判定为语音交互对象;若所述应用的类型为娱乐类应用,将所述车内人员判定为非语音交互对象。
3.根据权利要求2所述的一种基于语音识别车顶帐篷控制方法,其特征在于,所述根据预处理后的所述待识别语音信息进行语音增强处理,通过提取语音增强处理后待识别语音信息音色与预设的音色库比对判断是否为相同的音色,包括:
若判断所述待识别语音信息为多种不同音色,根据预设的音色库对所述待识别语音信息中相同音色语段进行提取得到待识别语段信息;
根据预设的窗长逐一对所述待识别语段信息进行分段处理得到各语音片段,并提取各语音片段的声纹信息。
4.根据权利要求1所述的一种基于语音识别车顶帐篷控制方法,其特征在于,所述根据提取各语音片段的声纹信息与预设的声纹数据库中语段进行匹配,判断所述待识别语音信息对应的语音控制指令是否为车顶帐篷语音控制指令,包括:
依次将每一语音片段的声纹信息与预设的声纹数据库中预存声纹信息进行匹配;
通过对匹配成功后每一语音片段的声纹信息进行组合,得到所述待识别语音信息对应的语音控制指令;
根据所述语音控制指令的控制逻辑判断是否为车顶帐篷语音控制指令。
5.根据权利要求4所述的一种基于语音识别车顶帐篷控制方法,其特征在于,所述依次将每一语音片段的声纹信息与预设的声纹数据库中预存声纹信息进行匹配,包括:
若存在某一语音片段的声纹信息与预设的声纹数据库中预存声纹信息匹配失败,则终止后续的语音片段的声纹信息进行匹配,并确定所述待识别语音信息为非语音控制指令信息。
6.根据权利要求1所述的一种基于语音识别车顶帐篷控制方法,其特征在于,所述若为车顶帐篷语音控制指令,根据车顶帐篷的实际状态以及所述车顶帐篷语音控制指令,对车顶帐篷开合进行自动化控制,包括:
若为车顶帐篷语音控制指令,实时获取所述车顶帐篷的当前状态信号,其中,所述当前状态信号包括车顶帐篷的打开以及关闭情况;
根据所述车顶帐篷语音控制指令以及所述当前状态信号,判断所述车顶帐篷的当前状态是否为所述车顶帐篷语音控制指令执行后的状态;
若是,则终止执行所述车顶帐篷语音控制指令对应的控制策略并发出语音提示。
7.根据权利要求6所述的一种基于语音识别车顶帐篷控制方法,其特征在于,所述根据所述车顶帐篷语音控制指令以及所述当前状态信号,判断所述车顶帐篷的当前状态是否为所述车顶帐篷语音控制指令执行后的状态,包括:
根据所述车顶帐篷语音控制指令以及所述当前状态信号对应操作码设置的匹配位,其中,所述匹配位由一字节地址0及1表示;
若所述车顶帐篷语音控制指令与所述当前状态信号对应的匹配位相同,则所述车顶帐篷的当前状态为所述车顶帐篷语音控制指令执行后的状态;
若所述车顶帐篷语音控制指令与所述当前状态信号对应的匹配位不相同,则所述车顶帐篷的当前状态为所述车顶帐篷语音控制指令待执行前的状态。
8.一种基于语音识别车顶帐篷控制装置,其特征在于,包括:
第一获取模块,被配置为持续采集目标车辆内用户发出的待识别语音信息;
预处理模块,被配置为对所述获取模块持续采集的待识别语音信息进行降噪及语音增强处理;
语音分段模块,被配置为对所述预处理模块处理后的待识别语音信息进行分段处理,以得到各语音片段的声纹信息;
第一判断模块,被配置为根据预处理后的所述待识别语音信息进行语音增强处理,通过提取语音增强处理后待识别语音信息音色与预设的音色库比对判断是否为相同的音色;
声纹匹配模块,被配置为对所述语音分段模块得到各语音片段的声纹信息与预设初级声纹数据库中存储的声纹信息进行匹配;
第二判断模块,被配置为根据所述声纹匹配模块的匹配结果判断所述待识别语音信息对应的语音控制指令是否为车顶帐篷语音控制指令;
第二获取模块,被配置为根据所述第二判断模块的判断结果,实时获取车顶帐篷的当前状态信号;
确定模块,被配置为根据所述第二判断模块的判断结果以及所述第二获取模块获取的当前状态信号,对车顶帐篷开合进行自动化控制。
9.一种车辆,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7任一项所述的基于语音识别车顶帐篷控制方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述可读存储介质上存储有车辆电动侧滑移门测试方法对应计算机程序,该计算机程序被处理器执行时实现如权利要求1-7任一项所述的基于语音识别车顶帐篷控制方法的步骤。
CN202311545183.0A 2023-11-20 2023-11-20 基于语音识别车顶帐篷控制方法、系统、车辆及存储介质 Pending CN117476005A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311545183.0A CN117476005A (zh) 2023-11-20 2023-11-20 基于语音识别车顶帐篷控制方法、系统、车辆及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311545183.0A CN117476005A (zh) 2023-11-20 2023-11-20 基于语音识别车顶帐篷控制方法、系统、车辆及存储介质

Publications (1)

Publication Number Publication Date
CN117476005A true CN117476005A (zh) 2024-01-30

Family

ID=89634687

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311545183.0A Pending CN117476005A (zh) 2023-11-20 2023-11-20 基于语音识别车顶帐篷控制方法、系统、车辆及存储介质

Country Status (1)

Country Link
CN (1) CN117476005A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117953893A (zh) * 2024-03-26 2024-04-30 江苏云途半导体有限公司 一种集成了mcu和声音控制器的后备箱开关系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117953893A (zh) * 2024-03-26 2024-04-30 江苏云途半导体有限公司 一种集成了mcu和声音控制器的后备箱开关系统

Similar Documents

Publication Publication Date Title
WO2021052213A1 (zh) 调整油门踏板特性的方法和装置
CN117476005A (zh) 基于语音识别车顶帐篷控制方法、系统、车辆及存储介质
CN113596705B (zh) 一种发声装置的控制方法、发声系统以及车辆
CN110366852B (zh) 信息处理设备、信息处理方法和记录介质
CN114954438A (zh) 车辆行驶控制方法、装置、车辆、可读存储介质及芯片
CN113064153B (zh) 一种确定目标对象跟踪门限的方法、装置
CN115035494A (zh) 图像处理方法、装置、车辆、存储介质及芯片
CN115123257A (zh) 路面减速带位置识别方法、装置、车辆、存储介质及芯片
CN115042821A (zh) 车辆控制方法、装置、车辆及存储介质
CN115056784B (zh) 车辆控制方法、装置、车辆、存储介质及芯片
CN114842440B (zh) 自动驾驶环境感知方法、装置、车辆及可读存储介质
CN115022547A (zh) 车载摄像头清洗方法、装置、车辆、存储介质及芯片
CN115203457A (zh) 图像检索方法、装置、车辆、存储介质及芯片
CN115221151A (zh) 车辆数据的传输方法、装置、车辆、存储介质及芯片
US20200005806A1 (en) Call quality improvement system, apparatus and method
CN115257628B (zh) 车辆控制方法、装置、存储介质、车辆及芯片
CN114572219B (zh) 自动超车方法、装置、车辆、存储介质及芯片
CN115082772B (zh) 地点识别方法、装置、车辆、存储介质及芯片
CN115063639B (zh) 生成模型的方法、图像语义分割方法、装置、车辆及介质
CN115297434B (zh) 服务调用方法、装置、车辆、可读存储介质及芯片
CN115115707B (zh) 车辆落水检测方法、车辆、计算机可读存储介质及芯片
CN115139946B (zh) 车辆落水检测方法、车辆、计算机可读存储介质及芯片
CN115179930B (zh) 车辆控制方法、装置、车辆及可读存储介质
CN114802435B (zh) 车辆控制方法、装置、车辆、存储介质及芯片
US20240236599A9 (en) Sound-Making Apparatus Control Method, Sound-Making System, and Vehicle

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination