CN108305620A

CN108305620A - 一种依赖大数据的本地云端混合的主动式交互语音识别系统

Info

Publication number: CN108305620A
Application number: CN201810439722.5A
Authority: CN
Inventors: 殷新莹; 张峥
Original assignee: Shanghai Ying Shi Automotive Technology Co Ltd
Current assignee: Shanghai Ying Shi Automotive Technology Co Ltd
Priority date: 2018-05-09
Filing date: 2018-05-09
Publication date: 2018-07-20

Abstract

本发明公开了一种依赖大数据的本地云端混合的主动式交互语音识别系统，包括语音输入模块、对话引擎、嵌入式语音识别模块、嵌入式自然语义理解模块、云端语言识别模块、仲裁模块和云端自然语义理解模块，所述语音输入模块采集语音信息并分别传输给嵌入式语音识别模块和云端语言识别模块，云端语言识别模块还与云端自然语义理解模块相连接，嵌入式语音识别模块还与嵌入式自然语义理解模块相连接，本发明的有益效果是：1、识别率高，识别速度快；2、指令下达简单快速，被控对象丰富；3、主动问询。

Description

一种依赖大数据的本地云端混合的主动式交互语音识别系统

技术领域

本发明涉及一种语音识别系统，具体是一种依赖大数据的本地云端混合的主动式交互语音识别系统。

背景技术

传统的车载语音识别系统，由于识别时间长，识别率低，语义指令下达繁琐等原因无法广泛运用在如车窗，雨刮，大灯等车载执行器上。

传统的车载语音识别系统都是等待用户用按钮或者语音唤醒后才能下达语音指令，无法主动开始跟用户的交互，无法按照大数据的积累主动为用户提供合适的建议。

语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。

现有方案一：

本地语音识别方案；

用户通过车载娱乐系统的麦克风进行语音输入，车载娱乐系统通过本地的语音识别引擎得到识别结果，利用识别结果对车载娱乐系统的应用进行操作和控制。

现有方案二：

云端语音识别方案；

用户通过车载娱乐系统的麦克风进行语音输入，车载娱乐系统通过云端的语音识别引擎得到识别结果，利用识别结果对车载娱乐系统的应用进行操作和控制。

发明内容

本发明的目的在于提供一种依赖大数据的本地云端混合的主动式交互语音识别系统，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：

一种依赖大数据的本地云端混合的主动式交互语音识别系统，包括语音输入模块、对话引擎、嵌入式语音识别模块、嵌入式自然语义理解模块、云端语言识别模块、仲裁模块和云端自然语义理解模块，所述语音输入模块采集语音信息并分别传输给嵌入式语音识别模块和云端语言识别模块，云端语言识别模块还与云端自然语义理解模块相连接，嵌入式语音识别模块还与嵌入式自然语义理解模块相连接，嵌入式自然语义理解模块和云端自然语义理解模块分别对输入的语音信号进行语义理解后将结果输出到仲裁模块，仲裁模块根据输入的信号控制应用模块。

作为本发明的进一步技术方案：所述应用模块还通过对话引擎连接语音输入模块。

与现有技术相比，本发明的有益效果是：1、识别率高，识别速度快；2、指令下达简单快速，被控对象丰富；3、主动问询。

附图说明

图1为本发明的整体示意图；

图2为本发明的工作流程图；

图3为对话引擎的原理示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1-3，一种依赖大数据的本地云端混合的主动式交互语音识别系统，包括语音输入模块、对话引擎、嵌入式语音识别模块、嵌入式自然语义理解模块、云端语言识别模块、仲裁模块和云端自然语义理解模块，所述语音输入模块采集语音信息并分别传输给嵌入式语音识别模块和云端语言识别模块，云端语言识别模块还与云端自然语义理解模块相连接，嵌入式语音识别模块还与嵌入式自然语义理解模块相连接，嵌入式自然语义理解模块和云端自然语义理解模块分别对输入的语音信号进行语义理解后将结果输出到仲裁模块，仲裁模块根据输入的信号控制应用模块。

应用模块还通过对话引擎连接语音输入模块。

本发明的工作原理是：一、在整体架构方面采用本地和云端结合的混合语音识别方案

用户通过车载娱乐系统的麦克风进行语音输入，车载娱乐系统根据网络连接情况和具体输入语音命令，语音信号同时或仅进入本地嵌入式语音识别/云端语音识别系统，完成语音识别过程之后经过本地嵌入式自然语义理解/云端自然语义理解的语义理解系统后，经过仲裁将识别结果作用于调用语音识别功能的应用。

二、对话引擎方面采用智能唤醒命令词达到一步到位的识别效果

对话引擎根据不同场景允许不同的命令词作为唤醒词，比如在音乐播放的过程中支持‘上一首/下一首’作为唤醒和命令，比如在车速低于60公里/时，天气晴朗，温度在18和26度之间时支持‘打开天窗/车窗’作为唤醒命令词；比如在空调关闭时‘打开空调’可以作为唤醒命令词；比如在空调打开时‘温度高一点’可以作为唤醒命令词。反之在前置条件不满足是，这些词是不会唤醒语音识别系统并作为命令生效，这样的设计也避免了在同一时刻存在过多的唤醒词，降低了误识别的风险。

三、丰富的被控对象包括大灯，雨刮，车窗，天窗等。

四、问询式的主动交互系统

主动交互式系统通过所有用户的用户行为收集建立以大数据为基础的宏观主动交互式算法，通过个人行为的收集建立用户画像，结合宏观主动交互算法和个人用户自画像形成用户级主动交互算法。系统以车辆所有的传感器所收集到的信号和互联网数据作为系统输入，包括油门踏板，车内摄像头，车内外温度传感器，娱乐系统的操作，停车地点等，互联网数据包含当时当地的天气，路况，节日等所有可能对用户车内行为造成影响的因素，以主动式的交互作为系统输出。宏观的算法根据所有用户的行为收集不断迭代优化，个人的算法根据宏观算法和个人用户对于主动交互的反馈进行不断的迭代优化

比如在大雾天气系统会自动开启雾灯并提示用户“由于大雾天气，车辆已自动开启雾灯”；在系统查询得到车辆所在区域天气晴朗，PM2.5良好，气温适宜的情况下提示用户“当前适合打开天窗，是否需要打开”。比如用户A在两次提示后均实施了开天窗行为，下次系统会在满足条件后自动打开，用户B在第一次提示后未执行操作系统会在收缩或调整策略下次再提示，用户C在第一次提示未执行对应建议第二次提示中途就主动中断关闭语音提示系统将不再进行同类别的提示。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

此外，应当理解，虽然本说明书按照实施方式加以描述，但并非每个实施方式仅包含一个独立的技术方案，说明书的这种叙述方式仅仅是为清楚起见，本领域技术人员应当将说明书作为一个整体，各实施例中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

Claims

1.一种依赖大数据的本地云端混合的主动式交互语音识别系统，包括语音输入模块、对话引擎、嵌入式语音识别模块、嵌入式自然语义理解模块、云端语言识别模块、仲裁模块和云端自然语义理解模块，其特征在于，所述语音输入模块采集语音信息并分别传输给嵌入式语音识别模块和云端语言识别模块，云端语言识别模块还与云端自然语义理解模块相连接，嵌入式语音识别模块还与嵌入式自然语义理解模块相连接，嵌入式自然语义理解模块和云端自然语义理解模块分别对输入的语音信号进行语义理解后将结果输出到仲裁模块，仲裁模块根据输入的信号控制应用模块。

2.根据权利要求1所述的一种依赖大数据的本地云端混合的主动式交互语音识别系统，其特征在于，所述应用模块还通过对话引擎连接语音输入模块。