CN111883118A - 一种基于个性化语音的车辆控制方法、装置及存储介质 - Google Patents

一种基于个性化语音的车辆控制方法、装置及存储介质 Download PDF

Info

Publication number
CN111883118A
CN111883118A CN202010656466.2A CN202010656466A CN111883118A CN 111883118 A CN111883118 A CN 111883118A CN 202010656466 A CN202010656466 A CN 202010656466A CN 111883118 A CN111883118 A CN 111883118A
Authority
CN
China
Prior art keywords
voice
personalized
vehicle
user
vehicle control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010656466.2A
Other languages
English (en)
Inventor
王珏
韦安阳
彭鸿
管迪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Geely Holding Group Co Ltd
Zhejiang Geely Automobile Research Institute Co Ltd
Original Assignee
Zhejiang Geely Holding Group Co Ltd
Zhejiang Geely Automobile Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Geely Holding Group Co Ltd, Zhejiang Geely Automobile Research Institute Co Ltd filed Critical Zhejiang Geely Holding Group Co Ltd
Priority to CN202010656466.2A priority Critical patent/CN111883118A/zh
Publication of CN111883118A publication Critical patent/CN111883118A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mechanical Engineering (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明涉及一种基于个性化语音的车辆控制方法、装置及存储介质,引导用户完成对个性化语音以及与个性化语音绑定的至少一个车辆控制命令的自定义设置;根据语音识别结果,采集用户输入的语音信息;对语音信息进行处理和识别得到语音识别结果;根据语音识别结果,检索到与语音信息匹配的目标个性化语音;获取与目标个性化语音绑定的至少一个车辆控制命令;在安全控制逻辑允许时,执行至少一个车辆控制命令,并通过车机娱乐系统与用户语音交互。本发明的方法通过简单又个性化的语音指令实现对车辆的特定控制,提供用户更多的自主控制体验。

Description

一种基于个性化语音的车辆控制方法、装置及存储介质
技术领域
本发明涉及车辆控制领域,尤其涉及一种基于个性化语音的车辆控制方法、装置及存储介质。
背景技术
随着汽车电子及车辆网技术的不断发展,车内人机交互的技术也取得了日新月异的发展。其中,语音控制技术随着机器语言识别算法的不断进化,已经在人机交互中得到了广泛的应用。语音控制不需要驾驶员手动操纵按钮或者中控大屏,也不需要驾驶员移动视线,尽量减少了驾驶员注意力的分散,在人机交互的各种方式中,有非常显著的优势。
目前量产车上的语音控制功能,必须通过特定含义的语音指令来实现特定的功能,例如要实现打开天窗的功能,必须给出类似“打开天窗”或类似与功能内容一致的语音指令,才能实现特定的控制功能,语音指令较为固定不变。此外,用户无法对车辆所具备的控制功能进行扩展,如果某一项功能并未定义语音控制的功能,用户则无法通过语音指令去实现相应的控制功能。还有,目前市面上绝大多数带有语音控制功能的车辆都不支持用户输入对应多个控制功能的语音指令,若用户在一句语音指令中包含多个控制命令,车辆将无法执行相应的控制命令或者只能执行第一条控制命令。
以上的不足影响了用户使用语音控制功能的体验,无法满足用户对于个性化的使用需求。一个能够个性化定义语音控制指令、能够让用户自己扩展控制功能、能够通过简单的语音指令同时实现多个控制功能的语音交互方法或系统,对于满足不同用户的个性化用车需求以及树立品牌的潮流形象,体现对用户的关怀都是非常有意义的。
发明内容
本发明要解决的技术问题是在语音交互中进一步满足不同用户个性化用车习惯、对车辆控制功能扩展语音控制功能以及通过简单语音指令实现多个控制功能。
为解决上述技术问题,本发明公开了一种基于个性化语音的车辆控制方法、装置及存储介质。具体技术方案如下所述:
第一方面,本发明公开了一种基于个性化语音的车辆控制方法,所述方法包括:
引导用户完成对个性化语音以及与所述个性化语音绑定的至少一个车辆控制命令的自定义设置,并将所述个性化语音及绑定的至少一个车辆控制命令存储于个性化语音存储库中;
在个性化语音控制功能开启的状态下,采集用户输入的语音信息;
对所述语音信息进行处理和识别,得到语音识别结果;
根据所述语音识别结果,在所述个性化语音存储库中检索到与所述语音信息匹配的目标个性化语音;
获取与所述目标个性化语音绑定的至少一个车辆控制命令;
在整车安全控制逻辑允许的前提下,执行所述至少一个车辆控制命令,并通过车机娱乐系统与用户进行语音交互。
进一步地,所述引导用户完成对个性化语音以及与所述个性化语音绑定的至少一个车辆控制命令的自定义设置包括:
响应于用户新建个性化语音的需求,通过车载麦克风采集用户输入的个性化语音信息;
对所述个性化语音信号进行信息处理和语音识别,得到第一语音识别结果;
在用户确认所述第一语音识别结果无误后,获取用户针对所述个性化语音信息所选择的至少一个车辆控制命令。
进一步地,所述引导用户完成对个性化语音以及与所述个性化语音绑定的至少一个车辆控制命令的自定义设置还包括:
响应于用户新建个性化语音的需求,通过所述车机娱乐系统的个性化语音设置界面或通过与所述车机娱乐系统通信连接的智能移动设备,获取用户输入的个性化语音的内容以及与所述个性化语音绑定的至少一个车辆控制命令。
进一步地,所述完成对与所述个性化语音绑定的至少一个车辆控制命令的自定义设置还包括:
基于所述个性化语音设置界面展示的向用户开放的车辆控制命令,获取用户在所述个性化语音设置界面中为所述个性化语音选择的至少一个车辆控制命令,所述至少一个车辆控制命令对应至少一个车辆控制功能;
和/或,基于用户对车辆的直接控制操作,所述车机娱乐系统的控制器采集并记录用户的操作指令,作为与所述个性化语音绑定的至少一个车辆控制命令。
进一步地,所述方法还包括:
通过车辆预设的语音控制功能或通过与所述车机娱乐系统通信连接的移动智能终端,控制所述个性化语音控制功能的开启和关闭;
在所述个性化语音控制功能关闭状态,按照车机娱乐系统出厂预设的语音控制逻辑对用户的语音指令进行识别处理。
进一步地,所述方法还包括:
在所述个性化语音存储库中未检索到与所述语音识别结果匹配的目标个性化语音时,反馈匹配失败信息,并按照车机娱乐系统出厂预设的语音处理逻辑进行识别处理。
进一步地,基于整车安全控制逻辑,根据当前的整车行驶状态判断是否允许执行所述至少一个车辆控制命令;
在不允许执行所述至少一个车辆控制命令时,反馈执行失败信息,并通过所述车机娱乐系统与用户进行语音交互。
第二方面,本发明公开了一种基于个性化语音的车辆控制装置,所述装置包括:
指令输入模块,用于引导用户完成对个性化语音以及与所述个性化语音绑定的至少一个车辆控制命令的自定义设置;
以及,在个性化语音控制功能开启的状态下,采集用户输入的个性化语音信息;
语音识别模块,用于对所述个性化语音信息进行处理和识别,得到语音识别结果;
个性化语音处理模块,用于根据所述语音识别结果,在所述个性化语音存储库中检索到与所述个性化语音信息匹配的目标个性化语音;
个性化语音存储库,用于存储所述个性化语音及与所述个性化语音绑定的至少一个车辆控制命令;
车辆控制器,用于获取与所述目标个性化语音绑定的至少一个车辆控制命令并进行判断;
执行器,用于在整车安全控制逻辑允许的前提下,执行所述至少一个车辆控制命令。
进一步地,所述指令输入模块包括:
麦克风,用于采集用户的语音信息;
语音采集处理模块,用于对所述语音信息进行音频处理;
和/或,车机娱乐系统的交互界面,用于获取用户通过虚拟键盘输入的控制指令。
第三方面,本发明公开了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行如第一方面所述的一种基于个性化语音的车辆控制方法。
第四方面,本发明公开了一种计算机存储介质,所述计算机存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或至少一段程序由处理器加载并执行以实现如如第一方面所述的一种基于个性化语音的车辆控制方法。
采用上述技术方案,本发明所述的一种基于个性化语音的车辆控制方法、装置及存储介质具有如下有益效果:本发明提供的方法可以满足用户自定义语音指令的需求,而不是完全依照主机厂商设定的语音指令形式;同时,对于没有匹配语音控制功能的车辆控制功能,用户同样能够对其进行添加个性化语音指令;此外,本发明提供的方法实现了通过简单的语音指令执行多个控制功能,而不局限于一条语音指令对应一个控制功能,极大地满足了不同用户的使用习惯、使用需求,尤其是对于年轻客户群体。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种基于个性化语音的车辆控制方法的流程示意图;
图2是本发明实施例提供的一种用户自定义设置个性化语音的流程图;
图3是本发明实施例提供的一种自定义设置个性化语音的系统实现原理图;
图4是本发明实施例提供的一种用户使用个性化语音控制的流程图;
图5是本发明实施例提供的一种使用个性化语音控制的系统实现原理图;
图6是本发明实施例提供的一种基于个性化语音的车辆控制装置的结构示意图;
图7是本发明实施例提供的运行一种基于个性化语音的车辆控制方法的计算机设备的硬件结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本发明的描述中,需要理解的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1是本发明实施例提供的一种基于个性化语音的车辆控制方法的流程示意图,本说明书提供了如实施例或流程示意图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或服务器产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。具体的如图1所示,所述基于个性化语音的车辆控制方法可以包括:
S110:引导用户完成对个性化语音以及与所述个性化语音绑定的至少一个车辆控制命令的自定义设置,并将所述个性化语音及绑定的至少一个车辆控制命令存储于个性化语音存储库中。
可以理解的是,目前量产车上的语音控制功能,必须要通过预设的特定语言内容、语言形式才能实现对应的车辆控制功能,而预设的语音指令一般是机械式、固定化的,一条语音指令对应一个车辆控制功能,对于追求时尚潮流的用户群体,无法满足他们对语音指令的个性化需求以及个性化的用车习惯。故本发明提供的方法可以实现用户根据自己的喜好设置个性化语音比如在语音指令中加入流行语,同时将个性化语音与多个车辆控制指令对应,提供给用户个性化的用车体验。
在一些可行的实施方式中,所述引导用户完成对个性化语音以及与所述个性化语音绑定的至少一个车辆控制命令的自定义设置可以包括以下步骤:
S111:响应于用户新建个性化语音的需求,通过车载麦克风采集用户输入的个性化语音信息。
可以理解的是,基于车机娱乐系统的个性化语音设置界面或者车辆预设的语音控制功能,获取用户新建个性化语音的需求,响应于用户的新建需求,激活车载麦克风的语音采集功能。
S112:对所述个性化语音信号进行信息处理和语音识别,得到第一语音识别结果。
具体地,对所述个性化语音信号进行端点检测,准确地确定出所述个性化语音的起始和结束时间点;接着对所述个性化语言信号进行语音增强处理,优选地,可采用滤波消除环境噪声的影响。
具体地,基于特征提取技术、模式匹配准则及模型训练技术等对处理后的所述个性化语音信号进行识别,得到第一识别结果,所述第一识别结果包含了转换所述个性化语音信号后得到的文本内容。
S113:在用户确认所述第一语音识别结果无误后,获取用户针对所述个性化语音信息所选择的至少一个车辆控制命令。
优选地,用户可以通过在车机娱乐系统的个性化语音设置界面中确认所述第一语音识别结果是否无误,还可以通过车机娱乐系统对所述第一语音识别结果的朗读播报确认所述第一识别结果是否无误。
进一步地,所述完成对与所述个性化语音绑定的至少一个车辆控制命令的自定义设置还包括:
基于所述个性化语音设置界面展示的向用户开放的车辆控制命令,获取用户在所述个性化语音设置界面中为所述个性化语音选择的至少一个车辆控制命令,所述至少一个车辆控制命令对应至少一个车辆控制功能;
和/或,基于用户对车辆的直接控制操作,所述车机娱乐系统的控制器采集并记录用户的操作指令,作为与所述个性化语音绑定的至少一个车辆控制命令。
可以理解的是,车机娱乐系统预设的语音控制功能中的语音指令对应的是部分车辆控制功能,在目前量产车上,用户无法对其他的车辆控制功能添加语音指令进而通过语音控制车辆的某种功能。在本发明实施例提供的方法中,在用户自定义设置个性化语音环节,向用户开放了可由用户控制的所有车辆控制功能,使得语音控制的范围更大,赋予了用户更多的车辆自主权;此外,用户可以将多个车辆控制功能进行组合成为一种控制模式,并为该种模式添加一条个性化语音指令,实现了一条简单语音指令控制多个复杂的指令或者指令集,提升了语音交互系统的使用效率,改善了用户的使用体验。
进一步地,响应于用户新建个性化语音的需求,除了通过所述车机娱乐系统的个性化语音设置界面,用户还可以通过与所述车机娱乐系统通信连接的智能移动设备,获取用户输入的个性化语音的内容以及与所述个性化语音绑定的至少一个车辆控制命令。
S120:在个性化语音控制功能开启的状态下,采集用户输入的语音信息。
优选地,所述方法还包括:
通过车辆预设的语音控制功能或通过与所述车机娱乐系统通信连接的移动智能终端,控制所述个性化语音控制功能的开启和关闭;
在所述个性化语音控制功能关闭状态,按照车机娱乐系统出厂预设的语音控制逻辑对用户的语音指令进行识别处理。
可以理解的是,为了避免用户或者其他乘客可能造成的误触发情况,在车机娱乐系统中设置了个性化语音控制功能的开闭,用户可以通过关闭个性化语音控制识别功能来避免误触发的发生;当误触发情况发生时,用户可以通过语音关键词如“取消”等复合对应的个性化语音指令,恢复到个性化语音指令生效前的车辆状态。
S130:对所述语音信息进行处理和识别,得到语音识别结果。
优选地,对所述语音信息进行端点检测,准确地确定出所述语音信息的起始和结束时间点;接着对所述语音信息进行语音增强处理,可采用滤波消除环境噪声的影响。
优选地,基于特征提取技术、模式匹配准则及模型训练技术等对处理后的所述语音信息进行识别,得到语音识别结果,所述语音识别结果包含了转换所述语音信息后得到的文本内容。
S140:根据所述语音识别结果,在所述个性化语音存储库中检索到与所述语音信息匹配的目标个性化语音。
在一些可行的实施方式中,在出厂预设的语音指令中检索是否有与所述语音识别结果相匹配的语音指令,若无,则继续在所述个性化语音存储库中检索是否有与所述语音信息匹配的目标个性化语音。或者,优先在所述个性化语音存储库中检索与所述语音信息匹配的目标个性化语音。
优选地,所述方法还包括:
在所述个性化语音存储库中未检索到与所述语音识别结果匹配的目标个性化语音时,反馈匹配失败信息,并按照车机娱乐系统出厂预设的语音处理逻辑进行识别处理。
S150:获取与所述目标个性化语音绑定的至少一个车辆控制命令。
具体地,在所述个性化语音存储库中获取与所述目标个性化语音绑定的至少一个车辆控制命令,并将所述至少一个车辆控制命令返给给车机娱乐系统的控制器,并由车机娱乐系统的控制器将所述至少一个车辆控制命令发送至整车相应的控制器。
S160:在整车安全控制逻辑允许的前提下,执行所述至少一个车辆控制命令,并通过车机娱乐系统与用户进行语音交互。
优选地,在整车相应的控制器收到车辆控制命令后,将当前执行器的状态回送至车机娱乐系统的控制器,并对车辆控制命令作出响应。车机娱乐系统的控制器存储整车相应的控制器返回的状态信息,以便用户在发出取消指令后,车辆能够返回到之前的状态。在整车安全控制逻辑允许的前提下,整车相应的控制器直接执行对应的车辆控制命令,并在执行完毕后,反馈完成状态至车机娱乐系统的控制器,车机娱乐系统通过语音与用户进行交互,告知用户对应的功能开启成功。
在一些可行的实施方式中,所述方法还包括:
基于整车安全控制逻辑,根据当前的整车行驶状态判断是否允许执行所述至少一个车辆控制命令;
在不允许执行所述至少一个车辆控制命令时,反馈执行失败信息,并通过所述车机娱乐系统与用户进行语音交互。
实施例二
本发明提供的一种基于个性化语音的车辆控制方法中,主要包括两个环节,一是用户自定义设置个性化语音的环节,一是使用个性化语音进行车辆控制的环节。
图2是本发明实施例提供的一种用户自定义设置个性化语音的流程图,图4是本发明实施例提供的一种自定义设置个性化语音的系统实现原理图。本说明书提供了如实施例或流程示意图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。具体的结合图2和图4所示,所述基于个性化语音的车辆控制方法中用户自定义设置个性化语音的环节可以包括:
S210:基于在车机娱乐系统中预先添加的个性化语音设置界面,用户进入该界面中选择新建一条语音控制指令。
S220:通过语音输入的方式,由车上的麦克风采集用户输入的个性化语音,并传送到语音采集处理模块,语音采集处理模块将处理后的语音信号发送各车机娱乐系统中的车机娱乐控制器里的语音识别模块进行语音识别。语音识别模块识别的语音结果,发送至车机娱乐控制器中的个性化语音处理模块,并有个性化语音处理模块将对应的语音输入,存储在个性化语音存储库中。图4中虚线框部分也可以通过车机系统上的键盘或者与车机联通的个人移动设备来实现。
S230:用户在车机娱乐系统的交互界面中确认车机娱乐系统识别显示的个性化语音指令是否正确。
S240:为个性化语音指令选择对应的整车控制指令或指令集。
优选地,一种选择方式是在车辆的人机交互界面中提供主机厂向用户开放的所有整车控制指令,用户可以选择个性化语音指令对应的一个或者多个控制指令,进行相应的详细操作定义;另一种方式是用户直接在车辆进行相应的操作,车机娱乐系统的控制器记录用户所有的操作指令,并显示在交互界面中供用户确认。在用户最终确认相应控制指令后,个性化语音处理模块将相应的控制指令保存并且与对应的个性化语音指令关联存储在个性化语音库中,则该个性化语音指令创建成功。
图3是本发明实施例提供的本发明实施例提供的一种用户使用个性化语音控制的流程图,图5是本发明实施例提供的一种使用个性化语音控制的系统实现原理图。本说明书提供了如实施例或流程示意图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。具体的结合图3和图5所示,所述基于个性化语音的车辆控制方法中使用个性化语音进行车辆控制的环节可以包括:
S310:当个性化语音指令设置成功并处于功能激活状态时,用户发出的语音指令,通过车载麦克风传送到语音采集处理模块进行滤波消噪等处理,语音采集处理模块将处理后的语音信号发送给车机娱乐控制器中的语音识别模块。语音识别模块识别的语音结果,被传送到车机娱乐控制器中的个性化语音处理模块。图5中虚线框部分也可以通过与车机联通的个人移动设备来实现。
S320:个性化语音处理模块先检索个性化语音存储库中存储的个性化语音,如若没有匹配的语音指令,则反馈未找到个性化语音匹配信号的信息至车机娱乐控制器,使其按照一般车机语音处理逻辑进行处理。
S330:如若有相匹配的个性化语音指令,则个性化语音处理模块从个性化语音存储库中获取该个性化语音对应的控制指令,并将其反馈给车机娱乐控制器,由车机娱乐控制器将控制指令发送给整车相应的车辆控制器。
S340:车辆控制器收到控制指令后,将当前执行器或控制功能的状态发回给车机娱乐控制器,并对控制指令作出相应。车机娱乐控制器存储相应车辆控制器返回的状态信息,以便在用户取消个性化语音指令时返回到之前的状态。
S350:出于安全角度考虑,整车相应的控制器内部会有一套逻辑,根据车辆当前的行驶状态来判断是否执行具体的控制指令。若判断不能执行控制指令,将直接反馈车机娱乐控制器无法执行指令的信号,同时车机娱乐控制器通过语音与用户进行交互,告知用户当前车辆状态不能激活控制功能;如果判断可以执行控制指令,将直接执行控制指令,并且在指令执行完毕后,反馈给车机娱乐控制器,车机娱乐控制器通过语音与用户进行交互,告知用户对应的控制功能开启成功。
举一实例,用户可以在选择新建语音控制命令后,语音输入“燃烧吧,我的小宇宙!”,然后在交互界面中选择驾驶模式为“运动”,车内氛围灯颜色调整为“红色”,音响音量调整为50%,并存储语音指令。激活个性化语音功能之后,用户在车里发出“燃烧吧,我的小宇宙”的语音指令后,整车会自动调节驾驶模式,氛围灯颜色和音量大小;发出“取消:燃烧吧,我的小宇宙”的指令后,整车会自动调节恢复个性化指令生效前的状态。
实施例三
本发明实施例还提供了一种基于个性化语音的车辆控制装置,如图6所示,所述基于个性化语音的车辆控制装置包括:
指令输入模块610,用于引导用户完成对个性化语音以及与所述个性化语音绑定的至少一个车辆控制命令的自定义设置;
以及,在个性化语音控制功能开启的状态下,采集用户输入的个性化语音信息。
进一步地,所述指令输入模块可以包括:
麦克风,用于采集用户的语音信息;
语音采集处理模块620,用于对所述语音信息进行音频处理;
和/或,车机娱乐系统的交互界面,用于获取用户通过虚拟键盘输入的控制指令。
语音识别模块630,用于对所述个性化语音信息进行处理和识别,得到语音识别结果。
个性化语音处理模块640,用于根据所述语音识别结果,在所述个性化语音存储库中检索到与所述个性化语音信息匹配的目标个性化语音。
个性化语音存储库650,用于存储所述个性化语音及与所述个性化语音绑定的至少一个车辆控制命令。
在一些可行的实施方式中,所述语音识别模块630、所述个性化语音处理模块640和所述个性化语音存储库650集成在车机娱乐系统或者整车上其他的控制器中,或者所述所述个性化语音处理模块640和所述个性化语音存储库650集成在一个独立的控制器中。
车辆控制器660,用于获取与所述目标个性化语音绑定的至少一个车辆控制命令并进行判断。
执行器670,用于在整车安全控制逻辑允许的前提下,执行所述至少一个车辆控制命令。
本发明实施例所述的一种基于个性化语音的车辆控制装置与方法实施例基于相同的发明构思,详情请参考方法实施例,在此不再赘述。
本发明实施例还提供了一种计算机设备,所述计算机设备包括:处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如本发明实施例的一种基于个性化语音的车辆控制方法。
存储器可用于存储软件程序以及模块,处理器通过运行存储在存储器的软件程序以及模块,从而执行各种功能应用。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、功能所需的应用程序等;存储数据区可存储根据所述设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器还可以包括存储器控制器,以提供处理器对存储器的访问。
本发明实施例所提供的方法实施例可以在计算机终端、服务器或者类似的运算装置中执行,即上述计算机设备可以包括计算机终端、服务器或者类似的运算装置。图7是本发明实施例提供的运行一种基于个性化语音的车辆控制方法的计算机设备的硬件结构框图,如图7所示,该计算机设备的内部结构可包括但不限于:处理器、网络接口及存储器。其中,计算机设备内的处理器、网络接口及存储器可通过总线或其他方式连接,在本说明书实施例所示图7中以通过总线连接为例。
其中,处理器(或称CPU(Central Processing Unit,中央处理器))是计算机设备的计算核心以及控制核心。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI、移动通信接口等)。存储器(Memory)是计算机设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的存储器可以是高速RAM存储设备,也可以是非不稳定的存储设备(non-volatile memory),例如至少一个磁盘存储设备;可选的还可以是至少一个位于远离前述处理器的存储装置。存储器提供存储空间,该存储空间存储了电子设备的操作系统,可包括但不限于:Windows系统(一种操作系统),Linux(一种操作系统),Android(安卓,一种移动操作系统)系统、IOS(一种移动操作系统)系统等等,本发明对此并不作限定;并且,在该存储空间中还存放了适于被处理器加载并执行的一条或一条以上的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。在本说明书实施例中,处理器加载并执行存储器中存放的一条或一条以上指令,以实现上述方法实施例提供的基于个性化语音的车辆控制方法。
本发明实施例还提供了一种计算机存储介质,所述计算机存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行如本发明实施例所述的一种基于个性化语音的车辆控制方法。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、系统和服务器实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于个性化语音的车辆控制方法,其特征在于,所述方法包括:
引导用户完成对个性化语音以及与所述个性化语音绑定的至少一个车辆控制命令的自定义设置,并将所述个性化语音及绑定的至少一个车辆控制命令存储于个性化语音存储库中;
在个性化语音控制功能开启的状态下,采集用户输入的语音信息;
对所述语音信息进行处理和识别,得到语音识别结果;
根据所述语音识别结果,在所述个性化语音存储库中检索到与所述语音信息匹配的目标个性化语音;
获取与所述目标个性化语音绑定的至少一个车辆控制命令;
在整车安全控制逻辑允许的前提下,执行所述至少一个车辆控制命令,并通过车机娱乐系统与用户进行语音交互。
2.根据权利要求1所述的一种基于个性化语音的车辆控制方法,其特征在于,所述引导用户完成对个性化语音以及与所述个性化语音绑定的至少一个车辆控制命令的自定义设置包括:
响应于用户新建个性化语音的需求,通过车载麦克风采集用户输入的个性化语音信息;
对所述个性化语音信号进行信息处理和语音识别,得到第一语音识别结果;
在用户确认所述第一语音识别结果无误后,获取用户针对所述个性化语音信息所选择的至少一个车辆控制命令。
3.根据权利要求2所述的一种基于个性化语音的车辆控制方法,其特征在于,所述引导用户完成对个性化语音以及与所述个性化语音绑定的至少一个车辆控制命令的自定义设置还包括:
响应于用户新建个性化语音的需求,通过所述车机娱乐系统的个性化语音设置界面或通过与所述车机娱乐系统通信连接的智能移动设备,获取用户输入的个性化语音的内容以及与所述个性化语音绑定的至少一个车辆控制命令。
4.根据权利要求2或3中任一项所述的一种基于个性化语音的车辆控制方法,其特征在于,所述完成对与所述个性化语音绑定的至少一个车辆控制命令的自定义设置还包括:
基于所述个性化语音设置界面展示的向用户开放的车辆控制命令,获取用户在所述个性化语音设置界面中为所述个性化语音选择的至少一个车辆控制命令,所述至少一个车辆控制命令对应至少一个车辆控制功能;
和/或,基于用户对车辆的直接控制操作,所述车机娱乐系统的控制器采集并记录用户的操作指令,作为与所述个性化语音绑定的至少一个车辆控制命令。
5.根据权利要求1所述的一种基于个性化语音的车辆控制方法,其特征在于,所述方法还包括:
通过车辆预设的语音控制功能或通过与所述车机娱乐系统通信连接的移动智能终端,控制所述个性化语音控制功能的开启和关闭;
在所述个性化语音控制功能关闭状态,按照车机娱乐系统出厂预设的语音控制逻辑对用户的语音指令进行识别处理。
6.根据权利要求1所述的一种基于个性化语音的车辆控制方法,其特征在于,所述方法还包括:
在所述个性化语音存储库中未检索到与所述语音识别结果匹配的目标个性化语音时,反馈匹配失败信息,并按照车机娱乐系统出厂预设的语音处理逻辑进行识别处理。
7.根据权利要求1所述的一种基于个性化语音的车辆控制方法,其特征在于,所述方法还包括:
基于整车安全控制逻辑,根据当前的整车行驶状态判断是否允许执行所述至少一个车辆控制命令;
在不允许执行所述至少一个车辆控制命令时,反馈执行失败信息,并通过所述车机娱乐系统与用户进行语音交互。
8.一种基于个性化语音的车辆控制装置,其特征在于,所述装置包括:
指令输入模块,用于引导用户完成对个性化语音以及与所述个性化语音绑定的至少一个车辆控制命令的自定义设置;
以及,在个性化语音控制功能开启的状态下,采集用户输入的个性化语音信息;
语音识别模块,用于对所述个性化语音信息进行处理和识别,得到语音识别结果;
个性化语音处理模块,用于在所述语音识别结果表示所述个性化语音信息为个性化语音时,在所述个性化语音存储库中检索到与所述个性化语音信息匹配的目标个性化语音;
个性化语音存储库,用于存储所述个性化语音及与所述个性化语音绑定的至少一个车辆控制命令;
车辆控制器,用于获取与所述目标个性化语音绑定的至少一个车辆控制命令并进行判断;
执行器,用于在整车安全控制逻辑允许的前提下,执行所述至少一个车辆控制命令。
9.根据权利要求8所述的一种基于个性化语音的车辆控制装置,其特征在于,所述指令输入模块包括:
麦克风,用于采集用户的语音信息;
语音采集处理模块,用于对所述语音信息进行音频处理;
和/或,车机娱乐系统的交互界面,用于获取用户通过虚拟键盘输入的控制指令。
10.一种计算机存储介质,其特征在于,所述计算机存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或至少一段程序由处理器加载并执行以实现如权利要求1至7中任一项所述的一种基于个性化语音的车辆控制方法。
CN202010656466.2A 2020-07-09 2020-07-09 一种基于个性化语音的车辆控制方法、装置及存储介质 Pending CN111883118A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010656466.2A CN111883118A (zh) 2020-07-09 2020-07-09 一种基于个性化语音的车辆控制方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010656466.2A CN111883118A (zh) 2020-07-09 2020-07-09 一种基于个性化语音的车辆控制方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN111883118A true CN111883118A (zh) 2020-11-03

Family

ID=73150600

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010656466.2A Pending CN111883118A (zh) 2020-07-09 2020-07-09 一种基于个性化语音的车辆控制方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN111883118A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112721834A (zh) * 2021-01-13 2021-04-30 智马达汽车有限公司 一种车辆控制方法及控制系统
CN113409615A (zh) * 2021-06-18 2021-09-17 深圳市易流科技股份有限公司 一种驾驶员监控系统及驾驶员监控方法
CN113450778A (zh) * 2021-06-09 2021-09-28 惠州市德赛西威汽车电子股份有限公司 一种基于语音交互控制的训练方法及存储介质
CN113538944A (zh) * 2021-06-11 2021-10-22 广汽本田汽车有限公司 汽车语音提示信息的配置系统、方法、设备及存储介质
CN113581070A (zh) * 2021-06-11 2021-11-02 广汽本田汽车有限公司 汽车提示音设置系统、方法、运行控制装置及存储介质
CN113763926A (zh) * 2021-09-17 2021-12-07 中国第一汽车股份有限公司 一种整车语音交互性能测试系统
CN113820972A (zh) * 2021-08-25 2021-12-21 阿波罗智联(北京)科技有限公司 信息处理及车辆控制方法、装置、电子设备及存储介质
CN114089741A (zh) * 2021-10-16 2022-02-25 南昌大学 一种自定义语音和智能高效精准循迹的移动装置
CN114327355A (zh) * 2021-12-30 2022-04-12 科大讯飞股份有限公司 语音输入方法、电子设备以及计算机存储介质
CN115148189A (zh) * 2022-07-27 2022-10-04 中国第一汽车股份有限公司 一种驾驶员自定义语音命令多功能同步实现系统及方法
WO2023241281A1 (zh) * 2022-06-15 2023-12-21 武汉路特斯汽车有限公司 一种车辆控制方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105989841A (zh) * 2015-02-17 2016-10-05 上海汽车集团股份有限公司 车载语音控制方法及装置
CN106683673A (zh) * 2016-12-30 2017-05-17 智车优行科技(北京)有限公司 驾驶模式的调整方法、装置和系统、车辆
CN109493865A (zh) * 2018-10-17 2019-03-19 北京车和家信息技术有限公司 信号处理方法、终端及车辆
CN111002996A (zh) * 2019-12-10 2020-04-14 广州小鹏汽车科技有限公司 车载语音交互方法、服务器、车辆和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105989841A (zh) * 2015-02-17 2016-10-05 上海汽车集团股份有限公司 车载语音控制方法及装置
CN106683673A (zh) * 2016-12-30 2017-05-17 智车优行科技(北京)有限公司 驾驶模式的调整方法、装置和系统、车辆
CN109493865A (zh) * 2018-10-17 2019-03-19 北京车和家信息技术有限公司 信号处理方法、终端及车辆
CN111002996A (zh) * 2019-12-10 2020-04-14 广州小鹏汽车科技有限公司 车载语音交互方法、服务器、车辆和存储介质

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112721834A (zh) * 2021-01-13 2021-04-30 智马达汽车有限公司 一种车辆控制方法及控制系统
CN112721834B (zh) * 2021-01-13 2022-09-23 浙江智马达智能科技有限公司 一种车辆控制方法及控制系统
CN113450778A (zh) * 2021-06-09 2021-09-28 惠州市德赛西威汽车电子股份有限公司 一种基于语音交互控制的训练方法及存储介质
CN113538944A (zh) * 2021-06-11 2021-10-22 广汽本田汽车有限公司 汽车语音提示信息的配置系统、方法、设备及存储介质
CN113581070A (zh) * 2021-06-11 2021-11-02 广汽本田汽车有限公司 汽车提示音设置系统、方法、运行控制装置及存储介质
CN113409615A (zh) * 2021-06-18 2021-09-17 深圳市易流科技股份有限公司 一种驾驶员监控系统及驾驶员监控方法
CN113820972A (zh) * 2021-08-25 2021-12-21 阿波罗智联(北京)科技有限公司 信息处理及车辆控制方法、装置、电子设备及存储介质
CN113763926A (zh) * 2021-09-17 2021-12-07 中国第一汽车股份有限公司 一种整车语音交互性能测试系统
CN113763926B (zh) * 2021-09-17 2024-03-15 中国第一汽车股份有限公司 一种整车语音交互性能测试系统
CN114089741A (zh) * 2021-10-16 2022-02-25 南昌大学 一种自定义语音和智能高效精准循迹的移动装置
CN114327355A (zh) * 2021-12-30 2022-04-12 科大讯飞股份有限公司 语音输入方法、电子设备以及计算机存储介质
WO2023241281A1 (zh) * 2022-06-15 2023-12-21 武汉路特斯汽车有限公司 一种车辆控制方法、装置、设备及存储介质
CN115148189A (zh) * 2022-07-27 2022-10-04 中国第一汽车股份有限公司 一种驾驶员自定义语音命令多功能同步实现系统及方法

Similar Documents

Publication Publication Date Title
CN111883118A (zh) 一种基于个性化语音的车辆控制方法、装置及存储介质
US9211854B2 (en) System and method for incorporating gesture and voice recognition into a single system
JP6011584B2 (ja) 音声認識装置及び音声認識システム
CN110254393A (zh) 一种基于人脸识别技术的汽车自适应控制方法
KR102437833B1 (ko) 음성 명령 기반 작업 선택 장치, 차량, 음성 명령 기반 작업 선택 방법
CN109584883A (zh) 移动终端、远程声纹控制车机的方法及系统
CN108657186B (zh) 智能驾驶舱交互方法和装置
WO2022062491A1 (zh) 一种基于智能座舱的车载智能硬件管控方法和智能座舱
CN106427840A (zh) 一种自适应车辆驾驶模式的方法以及终端
CN110460921A (zh) 一种拾音控制方法、装置、车辆和存储介质
CN110232924A (zh) 车载语音管理方法、装置、车辆及存储介质
CN115457959A (zh) 语音交互方法、服务器及计算机可读存储介质
CN111354359A (zh) 一种车辆语音控制方法、装置、设备、系统及介质
US20130013310A1 (en) Speech recognition system
CN110956967A (zh) 基于声纹识别的车辆控制方法与车辆
CN114327185A (zh) 一种车机屏幕控制方法、装置、介质及电子设备
CN113760423A (zh) 具有智能用户界面的车辆
US20230317072A1 (en) Method of processing dialogue, user terminal, and dialogue system
JP7192858B2 (ja) 機器制御装置及び機器を制御する制御方法
CN107545895B (zh) 信息处理方法和电子设备
CN114974232A (zh) 语音信息的处理方法及相关产品
KR102386040B1 (ko) 음성 입력을 처리하기 위한 방법, 장치 및 명령어들을 갖는 컴퓨터 판독 가능한 저장 매체, 음성 처리 기능을 갖는 자동차, 및 사용자 단말기
CN113593556A (zh) 一种车载语音操作系统人机互动方法及装置
US9858918B2 (en) Root cause analysis and recovery systems and methods
CN114043987A (zh) 指令处理方法、装置、终端和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination