CN108305620A - 一种依赖大数据的本地云端混合的主动式交互语音识别系统 - Google Patents
一种依赖大数据的本地云端混合的主动式交互语音识别系统 Download PDFInfo
- Publication number
- CN108305620A CN108305620A CN201810439722.5A CN201810439722A CN108305620A CN 108305620 A CN108305620 A CN 108305620A CN 201810439722 A CN201810439722 A CN 201810439722A CN 108305620 A CN108305620 A CN 108305620A
- Authority
- CN
- China
- Prior art keywords
- module
- clouds
- speech recognition
- semantic understanding
- embedded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 13
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 230000003993 interaction Effects 0.000 description 4
- 238000004378 air conditioning Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000000034 method Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000003595 mist Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/34—Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开了一种依赖大数据的本地云端混合的主动式交互语音识别系统,包括语音输入模块、对话引擎、嵌入式语音识别模块、嵌入式自然语义理解模块、云端语言识别模块、仲裁模块和云端自然语义理解模块,所述语音输入模块采集语音信息并分别传输给嵌入式语音识别模块和云端语言识别模块,云端语言识别模块还与云端自然语义理解模块相连接,嵌入式语音识别模块还与嵌入式自然语义理解模块相连接,本发明的有益效果是:1、识别率高,识别速度快;2、指令下达简单快速,被控对象丰富;3、主动问询。
Description
技术领域
本发明涉及一种语音识别系统,具体是一种依赖大数据的本地云端混合的主动式交互语音识别系统。
背景技术
传统的车载语音识别系统,由于识别时间长,识别率低,语义指令下达繁琐等原因无法广泛运用在如车窗,雨刮,大灯等车载执行器上。
传统的车载语音识别系统都是等待用户用按钮或者语音唤醒后才能下达语音指令,无法主动开始跟用户的交互,无法按照大数据的积累主动为用户提供合适的建议。
语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。
现有方案一:
本地语音识别方案;
用户通过车载娱乐系统的麦克风进行语音输入,车载娱乐系统通过本地的语音识别引擎得到识别结果,利用识别结果对车载娱乐系统的应用进行操作和控制。
现有方案二:
云端语音识别方案;
用户通过车载娱乐系统的麦克风进行语音输入,车载娱乐系统通过云端的语音识别引擎得到识别结果,利用识别结果对车载娱乐系统的应用进行操作和控制。
发明内容
本发明的目的在于提供一种依赖大数据的本地云端混合的主动式交互语音识别系统,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种依赖大数据的本地云端混合的主动式交互语音识别系统,包括语音输入模块、对话引擎、嵌入式语音识别模块、嵌入式自然语义理解模块、云端语言识别模块、仲裁模块和云端自然语义理解模块,所述语音输入模块采集语音信息并分别传输给嵌入式语音识别模块和云端语言识别模块,云端语言识别模块还与云端自然语义理解模块相连接,嵌入式语音识别模块还与嵌入式自然语义理解模块相连接,嵌入式自然语义理解模块和云端自然语义理解模块分别对输入的语音信号进行语义理解后将结果输出到仲裁模块,仲裁模块根据输入的信号控制应用模块。
作为本发明的进一步技术方案:所述应用模块还通过对话引擎连接语音输入模块。
与现有技术相比,本发明的有益效果是:1、识别率高,识别速度快;2、指令下达简单快速,被控对象丰富;3、主动问询。
附图说明
图1为本发明的整体示意图;
图2为本发明的工作流程图;
图3为对话引擎的原理示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-3,一种依赖大数据的本地云端混合的主动式交互语音识别系统,包括语音输入模块、对话引擎、嵌入式语音识别模块、嵌入式自然语义理解模块、云端语言识别模块、仲裁模块和云端自然语义理解模块,所述语音输入模块采集语音信息并分别传输给嵌入式语音识别模块和云端语言识别模块,云端语言识别模块还与云端自然语义理解模块相连接,嵌入式语音识别模块还与嵌入式自然语义理解模块相连接,嵌入式自然语义理解模块和云端自然语义理解模块分别对输入的语音信号进行语义理解后将结果输出到仲裁模块,仲裁模块根据输入的信号控制应用模块。
应用模块还通过对话引擎连接语音输入模块。
本发明的工作原理是:一、在整体架构方面采用本地和云端结合的混合语音识别方案
用户通过车载娱乐系统的麦克风进行语音输入,车载娱乐系统根据网络连接情况和具体输入语音命令,语音信号同时或仅进入本地嵌入式语音识别/云端语音识别系统,完成语音识别过程之后经过本地嵌入式自然语义理解/云端自然语义理解的语义理解系统后,经过仲裁将识别结果作用于调用语音识别功能的应用。
二、对话引擎方面采用智能唤醒命令词达到一步到位的识别效果
对话引擎根据不同场景允许不同的命令词作为唤醒词,比如在音乐播放的过程中支持‘上一首/下一首’作为唤醒和命令,比如在车速低于60公里/时,天气晴朗,温度在18和26度之间时支持‘打开天窗/车窗’作为唤醒命令词;比如在空调关闭时‘打开空调’可以作为唤醒命令词;比如在空调打开时‘温度高一点’可以作为唤醒命令词。反之在前置条件不满足是,这些词是不会唤醒语音识别系统并作为命令生效,这样的设计也避免了在同一时刻存在过多的唤醒词,降低了误识别的风险。
三、丰富的被控对象包括大灯,雨刮,车窗,天窗等。
四、问询式的主动交互系统
主动交互式系统通过所有用户的用户行为收集建立以大数据为基础的宏观主动交互式算法,通过个人行为的收集建立用户画像,结合宏观主动交互算法和个人用户自画像形成用户级主动交互算法。系统以车辆所有的传感器所收集到的信号和互联网数据作为系统输入,包括油门踏板,车内摄像头,车内外温度传感器,娱乐系统的操作,停车地点等,互联网数据包含当时当地的天气,路况,节日等所有可能对用户车内行为造成影响的因素,以主动式的交互作为系统输出。宏观的算法根据所有用户的行为收集不断迭代优化,个人的算法根据宏观算法和个人用户对于主动交互的反馈进行不断的迭代优化
比如在大雾天气系统会自动开启雾灯并提示用户“由于大雾天气,车辆已自动开启雾灯”;在系统查询得到车辆所在区域天气晴朗,PM2.5良好,气温适宜的情况下提示用户“当前适合打开天窗,是否需要打开”。比如用户A在两次提示后均实施了开天窗行为,下次系统会在满足条件后自动打开,用户B在第一次提示后未执行操作系统会在收缩或调整策略下次再提示,用户C在第一次提示未执行对应建议第二次提示中途就主动中断关闭语音提示系统将不再进行同类别的提示。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
Claims (2)
1.一种依赖大数据的本地云端混合的主动式交互语音识别系统,包括语音输入模块、对话引擎、嵌入式语音识别模块、嵌入式自然语义理解模块、云端语言识别模块、仲裁模块和云端自然语义理解模块,其特征在于,所述语音输入模块采集语音信息并分别传输给嵌入式语音识别模块和云端语言识别模块,云端语言识别模块还与云端自然语义理解模块相连接,嵌入式语音识别模块还与嵌入式自然语义理解模块相连接,嵌入式自然语义理解模块和云端自然语义理解模块分别对输入的语音信号进行语义理解后将结果输出到仲裁模块,仲裁模块根据输入的信号控制应用模块。
2.根据权利要求1所述的一种依赖大数据的本地云端混合的主动式交互语音识别系统,其特征在于,所述应用模块还通过对话引擎连接语音输入模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810439722.5A CN108305620A (zh) | 2018-05-09 | 2018-05-09 | 一种依赖大数据的本地云端混合的主动式交互语音识别系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810439722.5A CN108305620A (zh) | 2018-05-09 | 2018-05-09 | 一种依赖大数据的本地云端混合的主动式交互语音识别系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108305620A true CN108305620A (zh) | 2018-07-20 |
Family
ID=62846488
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810439722.5A Pending CN108305620A (zh) | 2018-05-09 | 2018-05-09 | 一种依赖大数据的本地云端混合的主动式交互语音识别系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108305620A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109065040A (zh) * | 2018-08-03 | 2018-12-21 | 北京奔流网络信息技术有限公司 | 一种语音信息处理方法以及智能电器 |
CN109887490A (zh) * | 2019-03-06 | 2019-06-14 | 百度国际科技(深圳)有限公司 | 用于识别语音的方法和装置 |
CN111833875A (zh) * | 2020-07-10 | 2020-10-27 | 安徽芯智科技有限公司 | 一种嵌入式语音交互系统 |
WO2024088085A1 (zh) * | 2022-10-28 | 2024-05-02 | 广州小鹏汽车科技有限公司 | 语音交互方法、语音交互装置、车辆和可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101414866A (zh) * | 2007-10-17 | 2009-04-22 | 中卫视讯卫星科技(北京)有限公司 | 移动目标卫星跟踪定位、识别、语音视频、数据传输终端机 |
CN105551494A (zh) * | 2015-12-11 | 2016-05-04 | 奇瑞汽车股份有限公司 | 一种基于手机互联的车载语音识别系统及识别方法 |
CN106384594A (zh) * | 2016-11-04 | 2017-02-08 | 湖南海翼电子商务股份有限公司 | 语音识别的车载终端及其方法 |
-
2018
- 2018-05-09 CN CN201810439722.5A patent/CN108305620A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101414866A (zh) * | 2007-10-17 | 2009-04-22 | 中卫视讯卫星科技(北京)有限公司 | 移动目标卫星跟踪定位、识别、语音视频、数据传输终端机 |
CN105551494A (zh) * | 2015-12-11 | 2016-05-04 | 奇瑞汽车股份有限公司 | 一种基于手机互联的车载语音识别系统及识别方法 |
CN106384594A (zh) * | 2016-11-04 | 2017-02-08 | 湖南海翼电子商务股份有限公司 | 语音识别的车载终端及其方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109065040A (zh) * | 2018-08-03 | 2018-12-21 | 北京奔流网络信息技术有限公司 | 一种语音信息处理方法以及智能电器 |
CN109887490A (zh) * | 2019-03-06 | 2019-06-14 | 百度国际科技(深圳)有限公司 | 用于识别语音的方法和装置 |
CN111833875A (zh) * | 2020-07-10 | 2020-10-27 | 安徽芯智科技有限公司 | 一种嵌入式语音交互系统 |
CN111833875B (zh) * | 2020-07-10 | 2023-06-06 | 安徽芯智科技有限公司 | 一种嵌入式语音交互系统 |
WO2024088085A1 (zh) * | 2022-10-28 | 2024-05-02 | 广州小鹏汽车科技有限公司 | 语音交互方法、语音交互装置、车辆和可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108305620A (zh) | 一种依赖大数据的本地云端混合的主动式交互语音识别系统 | |
US8738368B2 (en) | Speech processing responsive to a determined active communication zone in a vehicle | |
US7729920B2 (en) | Systems and methods for predicting consequences of misinterpretation of user commands in automated systems | |
WO2009140884A1 (zh) | 一种车载语音交互系统 | |
EP2045140B1 (en) | Adjustment of vehicular elements by speech control | |
CN110435660A (zh) | 一种车辆驾驶情景模式的自动控制方法及装置 | |
CN113345433B (zh) | 一种车外语音交互系统 | |
CN108382155B (zh) | 一种带提醒功能的空调语音控制装置 | |
CN106347260B (zh) | 一种基于语音识别的车辆控制系统及其控制方法 | |
CN108831461B (zh) | 一种天窗语音控制方法及系统 | |
GB2366434A (en) | Selective speaker adaption for an in-vehicle speech recognition system | |
CN111145757A (zh) | 车载语音智能蓝牙集成装置和方法 | |
CN105047196B (zh) | 语音识别系统中的语音假象补偿系统和方法 | |
CN111833875A (zh) | 一种嵌入式语音交互系统 | |
CN109410929A (zh) | 车辆部件控制方法及装置、计算机可读存储介质、终端 | |
JP7261626B2 (ja) | 車載機器制御システム、車載機器制御装置、車載機器制御方法、及びプログラム | |
CN205022503U (zh) | 智能车语音控制系统 | |
CN113555017A (zh) | 基于ai智能语音车载氛围灯控制系统及方法 | |
KR20130053915A (ko) | 제스처 인식을 통한 차량 시스템 제어 장치 | |
CN115580967A (zh) | 车辆灯光的声控集成控制系统及方法 | |
CN114530154A (zh) | 车载机器人及其操作方法、介质和计算机程序产品 | |
CN107472254A (zh) | 一种车辆控制的方法及系统 | |
CN206441536U (zh) | 一种基于人脸识别的主动语音助手 | |
CN113223527A (zh) | 一种用于电动车智能仪表的语音控制方法及电动车 | |
CN110329185A (zh) | 一种汽车座椅控制系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180720 |
|
RJ01 | Rejection of invention patent application after publication |