CN113470637A

CN113470637A - 一种车载多个音频媒体的语音控制方法

Info

Publication number: CN113470637A
Application number: CN202110506589.2A
Authority: CN
Inventors: 李大勇
Original assignee: Simba Network Technology Nanjing Co ltd
Current assignee: Simba Network Technology Nanjing Co ltd
Priority date: 2021-05-10
Filing date: 2021-05-10
Publication date: 2021-10-01

Abstract

本发明涉及汽车信息娱乐技术领域，且公开了一种车载多个音频媒体的语音控制方法，包括以下步骤：S1：监听多个音频媒体应用的状态；S2：根据各个音频媒体应用的状态情况决策出当前状态下应该响应控制指令的音频媒体；S3：接收用户输入的语音控制启动指令；S4：接收所述用户输入的语音信息；S5：根据所述语音信息生成的控制指令；S6：判断音频媒体是否适合执行控制指令；S7：执行控制命令。本发明以语音播报或者文字显示的方式对驾驶者的控制操作做出回应，增强了语音的控制能力，为驾驶者带来方便并减少了因分心带来的潜在安全隐患，实现对多个音频媒体的控制，提供控制的准确性和稳定性。

Description

一种车载多个音频媒体的语音控制方法

技术领域

本发明涉及汽车信息娱乐技术领域，具体为一种车载多个音频媒体的语音控制方法。

背景技术

随着语音技术的不断突破，语音基础能力变得更强，语音交互称得上是一个“有价值的工具”，具体的表现有能够支持打断、多轮对话，支持上下文理解，可以自动纠错，支持免唤醒，降低了误触发并提升了响应速度，这些能力的提升将语音技术和车载系统结合变成一种很好的结合，能够给驾驶者提供更加方便和安全的交互方式。

车载系统中可能存在多个音频媒体，对这些音频媒体应用进行基本的语音控制也是用户迫切的需求，但是一般的车载多个音频媒体的语音控制方法语音的控制能力不足，提高了驾驶者因分心带来的潜在安全隐患。

发明内容

（一）解决的技术问题

针对现有技术的不足，本发明提供了一种车载多个音频媒体的语音控制方法，该控制方法增强了语音的控制能力，为驾驶者带来方便并减少了因分心带来的潜在安全隐患。

（二）技术方案

为实现上述目的，本发明提供如下技术方案：

一种车载多个音频媒体的语音控制方法，包括以下步骤：

S1：监听多个音频媒体应用的状态；

S2：根据各个音频媒体应用的状态情况决策出当前状态下应该响应控制指令的音频媒体；

S3：接收用户输入的语音控制启动指令；

S4：接收所述用户输入的语音信息；

S5：根据所述语音信息生成的控制指令；

S6：判断音频媒体是否适合执行控制指令；

S7：执行控制命令；

S8：提示驾驶者执行结果；

S9：识别控制流程结束。

作为本发明再进一步的方案，所述S1中监听并保存多个音频媒体应用的状态，包括但不限于前后台、暂停、播放。

进一步的，所述S2中当某个音频媒体状态发生变化时，根据监听到的其他音频媒体状态决策出当前状态下响应语音控制的音频媒体。

在前述方案的基础上，所述S5中用户下发的控制指令和计算出需要响应的音频媒体状态进行判断，如果判断不成功则不进行控制。

进一步的，所述S8中依据是否适合执行控制指令和执行的结果对用户进行提示。

（三）有益效果

与现有技术相比，本发明提供了一种车载多个音频媒体的语音控制方法，具备以下有益效果：

1、本发明以语音播报或者文字显示的方式对驾驶者的控制操作做出回应，增强了语音的控制能力，为驾驶者带来方便并减少了因分心带来的潜在安全隐患。

2、本发明通过监听各个音频媒体应用的状态，决策出状态变化后应该响应语音指令的音频媒体应用，从而实现对多个音频媒体的控制，提供控制的准确性和稳定性。

3、本发明安全高效，智能化程度高，具有很好的市场前景。

附图说明

图1为本发明提出的一种车载多个音频媒体的语音控制方法的流程结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参照图1，一种车载多个音频媒体的语音控制方法，包括以下步骤：

S1：监听多个音频媒体应用的状态，车载系统中包含多个音频媒体应用，需要在开机后监听各个应用的状态变化，包括但不限于前后台、播放、暂停，并全局保存各应用变化后的状态数据；

在监听到某个音频媒体应用状态发生任何变化时，结合之前保存的歌音频媒体应用的全局状态数据，按照产品的具体需要决策出当前场景下应该接受并处理语音指令的音频媒体应用，并记录下此应用的标识；

在此就某一种决策方案说明如下：

情况1，全局没有其他音频媒体应用的状态数据，则当前监听的状态应用作为接受并处理语音指令的应用；

情况2，状态切换到前台，判断其他音频媒体应用是否有播放状态，如果有继续使用播放状态的应用作为语音控制的应用，如果此状态变化的应用作为语音控制的应用；

情况3，状态切换到后台，继续保持之前的语音控制应用；

情况4，状态切换到播放，此状态变化的应用作为语音控制的应用；

情况5，状态切换为暂停，判断其他音频媒体应用是否有播放状态，如果有继续使用播放状态的应用作为语音控制的应用，如果此状态变化的应用作为语音控制的应用；

这种方案简单描述就是以播放状态为主，如果都没有播放则以最后切换过前台的音频媒体应用作为语音控制的应用；

S3：接收用户输入的语音控制启动指令，具体的，驾驶员通过车内按钮或者唤醒词等方式输入语音控制启动指令，从而激活语音识别功能；

S4：接收所述用户输入的语音信息，具体的，在步骤3激活语音采集功能之后，接收用户输入的语音信息，通过监听各个音频媒体应用的状态，决策出状态变化后应该响应语音指令的音频媒体应用，从而实现对多个音频媒体的控制，提供控制的准确性和稳定性；

S5：根据所述语音信息生成的控制指令，依据采集语音的数据通过相关的语音技术获取到驾驶者控制意图的指令；

S6：判断音频媒体是否适合执行控制指令，获取到指令后，根据当前接收并执行语音指令的应用和其状态情况，判断是否适合执行该指令，如果不适合执行则依据情况生成提示信息后执行步骤8，如果适合执行则执行步骤7；

在此就一种判断是否适合执行的方案进行简单的说明：

如果不存在全局标识的音频应用，则选择一个默认的应用作为判断是否适合执行的应用；

此应用状态没有状态或者处于暂停，则可以进行播放控制；

此应用处于播放状态，则可以进行暂停控制；

上述只是简单说明了两种状态下的判断，其他状态可以依据产品需要自行定义，在此只是说明操作的可执行性；

S7：执行控制命令，对当前全局标识的音频应用执行指令对应的控制操作，并根据操作情况或直接生成提示信息后执行步骤8；

S8：提示驾驶者执行结果，以语音播报或者文字显示的方式对驾驶者的控制操作做出回应，增强了语音的控制能力，为驾驶者带来方便并减少了因分心带来的潜在安全隐患；

S9：识别控制流程结束。

在该文中的描述中，需要说明的是，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种车载多个音频媒体的语音控制方法，其特征在于，包括以下步骤：

S1：监听多个音频媒体应用的状态；

S3：接收用户输入的语音控制启动指令；

S4：接收所述用户输入的语音信息；

S5：根据所述语音信息生成的控制指令；

S6：判断音频媒体是否适合执行控制指令；

S7：执行控制命令；

S8：提示驾驶者执行结果；

S9：识别控制流程结束。

2.根据权利要求1所述的一种车载多个音频媒体的语音控制方法，其特征在于，所述S1中监听并保存多个音频媒体应用的状态，包括但不限于前后台、暂停、播放。

3.根据权利要求2所述的一种车载多个音频媒体的语音控制方法，其特征在于，所述S2中当某个音频媒体状态发生变化时，根据监听到的其他音频媒体状态决策出当前状态下响应语音控制的音频媒体。

4.根据权利要求1所述的一种车载多个音频媒体的语音控制方法，其特征在于，所述S5中用户下发的控制指令和计算出需要响应的音频媒体状态进行判断，如果判断不成功则不进行控制。

5.根据权利要求1所述的一种车载多个音频媒体的语音控制方法，其特征在于，所述S8中依据是否适合执行控制指令和执行的结果对用户进行提示。