CN104318924A - 一种实现语音识别功能的方法 - Google Patents

一种实现语音识别功能的方法 Download PDF

Info

Publication number
CN104318924A
CN104318924A CN201410636777.7A CN201410636777A CN104318924A CN 104318924 A CN104318924 A CN 104318924A CN 201410636777 A CN201410636777 A CN 201410636777A CN 104318924 A CN104318924 A CN 104318924A
Authority
CN
China
Prior art keywords
control program
voice
sound control
application program
program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410636777.7A
Other languages
English (en)
Inventor
韩庆恺
解威
赵银祥
战杨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyang Mxnavi Co Ltd
Original Assignee
Shenyang Mxnavi Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenyang Mxnavi Co Ltd filed Critical Shenyang Mxnavi Co Ltd
Priority to CN201410636777.7A priority Critical patent/CN104318924A/zh
Publication of CN104318924A publication Critical patent/CN104318924A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

一种实现语音识别功能的方法,其特征在于:有一个声音采集模块,能够支持声音录入功能,将声音采集为数字数据,即配备麦克风或者可以提供相同功能的其他设备;有语音识别模块将声音数据转化为文本;有语义解析模块将文本理解为指令或者指令集;声控程序,可以按照各自的意愿制定出非常人性化的交互方式和产品体验;支持至少一种唤醒录音方式,可以通过唤醒词唤醒、硬件按钮唤醒或者软件按钮唤醒;最终实现真正的语音功能。本发明的优点:可以控制导航机播报内容及播报时机、录音开始停止状态,及交互次数和发声,产品体验完全依赖于开发者的想法和设计,与声音控制程序没有任何耦合;给开发者带来了全新的体验。

Description

一种实现语音识别功能的方法
技术领域
本发明涉及导航领域,特别涉及了一种实现语音识别功能的方法。
背景技术
随着汽车电子行业的兴起,汽车导航系统开始走入人们的视线。汽车导航系统,是在嵌入式硬件、全球GPS定位、地理信息数据的基础上,为驾驶者提供电子地图、车辆定位、实时语音引导、实时画面引导等服务的综合体。
提到科技的进步,则不能不提及产品的人工智能化,语言和声音作为人与人之间最常用和最便利的方式,如果能应用到人机交互中,那将会大大提高用户体验,效率及安全性。语音识别经过几十年的坎坷发展,到如今已经初步达到可应用的水平,从降噪到识别到语义解析都达到一个空前的高水平。
但是在应用界还并没有非常的普及,出现的产品也还远远没有达到完全“解放双手”的目的,从开发上讲,效率和成本都是非常的高,而且目前很多企业应用的方案可维护和可扩展性很差,一旦有需求的变更,则会对开发者造成非常大的困扰;从产品上讲,出现的一些语音识别的平台,将会造成语音产品同质化严重的情况,不利于该行业的发展。现在的语音产品开发方案存在着很多问题,诸如效率低,灵活性差,产品体验不够好,产品同质化严重等问题,很多企业为了想做语音识别产品而没有好的方案,最后仅只投入了根据识别文字匹配字符串的功能。
发明内容
本发明的目的是为了在导航终端实现语音产品,特提供了一种实现语音识别功能的方法。
本发明提供了一种实现语音识别功能的方法,其特征在于:所述的实现语音识别功能的方法,具备以下特征:
有一个声音采集模块,能够支持声音录入功能,将声音采集为数字数据,即配备麦克风或者可以提供相同功能的其他设备;
有语音识别模块将声音数据转化为文本;
有语义解析模块将文本理解为指令或者指令集;
声控程序,通过定义通信接口的方式将应用程序和语音控制程序本来存在的复杂度降低而不相互耦合,双方只是相互约定好原则,就可以按照各自的意愿制定出非常人性化的交互方式和产品体验;
有至少一款的应用程序,与声控程序进行交互,实现语音识别功能;
支持至少一种唤醒录音方式,可以通过唤醒词唤醒、硬件按钮唤醒或者软件按钮唤醒;
用户功能通过语音唤醒词唤醒或者硬件/软件按钮触发开始录音,录音状态下,用户可以输入自己的指令,语音处理模块将会经过声音采集,声音识别,语义解析,命令下发,命令执行,命令执行反馈,反馈意见处理等几个过程,最终实现真正的语音功能,其中该专利更强调的是命令执行反馈和反馈意见处理的部分。
所述的实现语音识别功能的方法,通过语音输入,声控程序负责识别和解析,并将指令发送给应用程序,不用关心具体的处理方式,将声音控制程序真正作成一个与业务无关的平台;应用程序通过与声控程序的接口,可以控制导航机播报内容及播报时机、录音开始停止状态,及交互次数和发声,产品体验完全依赖于开发者的想法和设计,与声音控制程序没有任何耦合;除了语音播报,声控程序能够显示和记录下人机交互的对话过程,方便查看。
所述的实现语音识别功能的方法,实现的硬件整体框架分为三个部分:
终端设备:负责声音采集,音频数据与服务器的传输,解析结果获取和处理;云端服务器:负责语音识别和语义解析,并从网络获取相应的信息,为终端设备提供数据;车联网服务器:负责整合网络资源,为云端服务器提供信息;
终端设备实现原理和流程:
用户对着声音采集设备说出指令;
声控程序通过操作系统API获取音频数据,将音频数据发送到云端服务器上,云端服务器进行识别,解析,最终将解析结果发送给声控程序;
声控程序根据解析结果,识别是哪一类的指令,并发送给指定的应用程序;
应用程序根据自己的优先级,进行响应,如果能处理则进行自处理,如果不能处理,则返回给声控程序不能处理的通知,由声控程序通知下一个应用程序;
以此类推,直到所有应用都经过了处理为止;
云端服务器实现原理和流程:
云端服务器在此方案中处于可选的地位,如果不选,则此逻辑需要在声控程序里实现;
服务器主要解决识别和解析的作用,由服务器选择使用哪家的识别和解析引擎,并且也可以自身也做解析,实现个性化;
服务器需要做好良好的封装,以便在替换语音识别和解析引擎时,对终端没有影响;
如果是问答性的指令,可以从车联网服务器上获取相关信息,然后返回给终端设备;
车联网服务器:提供网络信息资源。
实现语音识别功能的方法,具体实现的步骤如下:
系统启动,默认启动声音控制程序,将初始化语音识别和语义解析模块初始化;
初始化成功后,用户可以通过唤醒词唤醒或者硬件/软件按钮触发开始录音;
导航仪的声音控制程序收到语音指令后,进行识别和解析,将解析结果发送给优先级最高的应用程序;
应用程序接收到解析结果之后,进行分析和处理,将处理结果发送给声音控制程序;
如果应用程序反馈未处理,声音控制程序再将解析结果发送给优先级次之的应用程序,依次类推;
所有应用都没有能够处理的命令,声音控制程序给出相应的反馈信息;
以上七个接口既可以将声音控制程序和应用程序的独立开来,相互开发互不影响,且业务逻辑完全放到了应用程序中;
启动完成握手协议,应用程序启动后,需要通知到声音控制程序,方便其协调;声音控制程序向应用程序发送解析结果指令,让应用程序进行处理;应用程序触发声音控制程序进行播报,并给出播报内容,这是为了使语音产品的发声角色保持统一;声音控制程序播报结束给到应用程序的通知,让应用程序进行下一步的处理;应用程序触发声音控制程序进行录音,这是核心接口,触发自动的人机交互功能;应用程序通知声音控制程序结束对话,声音控制程序回到待机状态;应用程序通知声音控制程序发过来的某条指令是否被处理:如果被处理,则声音控制程序不会将其发送给其他应用;如果未被处理,则声音控制程序需要继续发送给其他应用;另外,还有一个辅助卖萌接口;声音控制程序自发处理,若是不能被识别的指令,则可以给出卖萌或者其他反馈。
本发明的优点:
本发明所述的实现语音识别功能的方法,效率和可扩展性都非常强可以解决开发效率低,产品单一化同质化严重的问题;通过语音输入,声控程序负责识别和解析,并将指令发送给应用程序,不用关心具体的处理方式,将声音控制程序真正作成一个与业务无关的平台;应用程序通过与声控程序的接口,可以控制导航机播报内容及播报时机、录音开始停止状态,及交互次数和发声,产品体验完全依赖于开发者的想法和设计,与声音控制程序没有任何耦合;除了语音播报,声控程序能够显示和记录下人机交互的对话过程,方便查看;给开发者带来了全新的体验。语音识别产品势在必行,目前作为车载导航,一个安全性需要非常高的领域,支持语音识别更是刚需。
附图说明
下面结合附图及实施方式对本发明作进一步详细的说明:
图1为实现语音识别功能的方法框架结构示意图;
图2为终端设备内部的框架原理图;
图3为云端服务器内部的框架原理图;
图4为车联网服务器内部的框架原理图。
具体实施方式
实施例1
本发明提供了一种实现语音识别功能的方法,其特征在于:所述的实现语音识别功能的方法,具备以下特征:
有一个声音采集模块,能够支持声音录入功能,将声音采集为数字数据,即配备麦克风或者可以提供相同功能的其他设备;
有语音识别模块将声音数据转化为文本;
有语义解析模块将文本理解为指令或者指令集
有一款声控程序,负责a)、b)、c)的实现,并通过定义通信接口的方式将应用程序和语音控制程序本来存在的复杂度降低而不相互耦合,双方只是相互约定好原则,就可以按照各自的意愿制定出非常人性化的交互方式和产品体验;
有至少一款的应用程序,与d)程序进行交互,实现语音识别功能;
支持至少一种唤醒录音方式,可以通过唤醒词唤醒、硬件按钮唤醒或者软件按钮唤醒;
用户功能通过语音唤醒词唤醒或者硬件/软件按钮触发开始录音,录音状态下,用户可以输入自己的指令,语音处理模块将会经过声音采集,声音识别,语义解析,命令下发,命令执行,命令执行反馈,反馈意见处理等几个过程,最终实现真正的语音功能,其中该专利更强调的是命令执行反馈和反馈意见处理的部分。
所述的实现语音识别功能的方法,通过语音输入,声控程序负责识别和解析,并将指令发送给应用程序,不用关心具体的处理方式,将声音控制程序真正作成一个与业务无关的平台;应用程序通过与声控程序的接口,可以控制导航机播报内容及播报时机、录音开始停止状态,及交互次数和发声,产品体验完全依赖于开发者的想法和设计,与声音控制程序没有任何耦合;除了语音播报,声控程序能够显示和记录下人机交互的对话过程,方便查看。
所述的实现语音识别功能的方法,实现的硬件整体框架分为三个部分:
终端设备:负责声音采集,音频数据与服务器的传输,解析结果获取和处理;云端服务器:负责语音识别和语义解析,并从网络获取相应的信息,为终端设备提供数据;车联网服务器:负责整合网络资源,为云端服务器提供信息;
终端设备实现原理和流程:
用户对着声音采集设备说出指令;
声控程序通过操作系统API获取音频数据,将音频数据发送到云端服务器上,云端服务器进行识别,解析,最终将解析结果发送给声控程序;
声控程序根据解析结果,识别是哪一类的指令,并发送给指定的应用程序;
应用程序根据自己的优先级,进行响应,如果能处理则进行自处理,如果不能处理,则返回给声控程序不能处理的通知,由声控程序通知下一个应用程序;
以此类推,直到所有应用都经过了处理为止;
云端服务器实现原理和流程:
云端服务器在此方案中处于可选的地位,如果不选,则此逻辑需要在声控程序里实现;
服务器主要解决识别和解析的作用,由服务器选择使用哪家的识别和解析引擎,并且也可以自身也做解析,实现个性化;
服务器需要做好良好的封装,以便在替换语音识别和解析引擎时,对终端没有影响;
如果是问答性的指令,可以从车联网服务器上获取相关信息,然后返回给终端设备;
车联网服务器:提供网络信息资源。
实现语音识别功能的方法,具体实现的步骤如下:
系统启动,默认启动声音控制程序,将初始化语音识别和语义解析模块初始化;
初始化成功后,用户可以通过唤醒词唤醒或者硬件/软件按钮触发开始录音;
导航仪的声音控制程序收到语音指令后,进行识别和解析,将解析结果发送给优先级最高的应用程序;
应用程序接收到解析结果之后,进行分析和处理,将处理结果发送给声音控制程序;
如果应用程序反馈未处理,声音控制程序再将解析结果发送给优先级次之的应用程序,依次类推;
所有应用都没有能够处理的命令,声音控制程序给出相应的反馈信息;
以上七个接口既可以将声音控制程序和应用程序的独立开来,相互开发互不影响,且业务逻辑完全放到了应用程序中;
启动完成握手协议,应用程序启动后,需要通知到声音控制程序,方便其协调;声音控制程序向应用程序发送解析结果指令,让应用程序进行处理;应用程序触发声音控制程序进行播报,并给出播报内容,这是为了使语音产品的发声角色保持统一;声音控制程序播报结束给到应用程序的通知,让应用程序进行下一步的处理;应用程序触发声音控制程序进行录音,这是核心接口,触发自动的人机交互功能;应用程序通知声音控制程序结束对话,声音控制程序回到待机状态;应用程序通知声音控制程序发过来的某条指令是否被处理:如果被处理,则声音控制程序不会将其发送给其他应用;如果未被处理,则声音控制程序需要继续发送给其他应用;另外,还有一个辅助卖萌接口;声音控制程序自发处理,若是不能被识别的指令,则可以给出卖萌或者其他反馈。

Claims (4)

1.一种实现语音识别功能的方法,其特征在于:所述的实现语音识别功能的方法,具备以下特征:
有一个声音采集模块,能够支持声音录入功能,将声音采集为数字数据,即配备麦克风或者可以提供相同功能的其他设备;
有语音识别模块将声音数据转化为文本;
有语义解析模块将文本理解为指令或者指令集
声控程序,通过定义通信接口的方式将应用程序和语音控制程序本来存在的复杂度降低而不相互耦合,双方只是相互约定好原则,就可以按照各自的意愿制定出非常人性化的交互方式和产品体验;
有至少一款的应用程序,与声控程序进行交互,实现语音识别功能;
支持至少一种唤醒录音方式,可以通过唤醒词唤醒、硬件按钮唤醒或者软件按钮唤醒;
用户功能通过语音唤醒词唤醒或者硬件/软件按钮触发开始录音,录音状态下,用户可以输入自己的指令,语音处理模块将会经过声音采集,声音识别,语义解析,命令下发,命令执行,命令执行反馈,反馈意见处理等几个过程,最终实现真正的语音功能,更强调的是命令执行反馈和反馈意见处理的部分。
2.按照权利要求1所述的实现语音识别功能的方法,其特征在于:所述的实现语音识别功能的方法,通过语音输入,声控程序负责识别和解析,并将指令发送给应用程序,不用关心具体的处理方式,将声音控制程序真正作成一个与业务无关的平台;应用程序通过与声控程序的接口,可以控制导航机播报内容及播报时机、录音开始停止状态,及交互次数和发声,产品体验完全依赖于开发者的想法和设计,与声音控制程序没有任何耦合;除了语音播报,声控程序能够显示和记录下人机交互的对话过程,方便查看。
3.按照权利要求1所述的实现语音识别功能的方法,其特征在于:所述的实现语音识别功能的方法,实现的硬件整体框架分为三个部分:
终端设备:负责声音采集,音频数据与服务器的传输,解析结果获取和处理;云端服务器:负责语音识别和语义解析,并从网络获取相应的信息,为终端设备提供数据;车联网服务器:负责整合网络资源,为云端服务器提供信息;
终端设备实现原理和流程:
用户对着声音采集设备说出指令;
声控程序通过操作系统API获取音频数据,将音频数据发送到云端服务器上,云端服务器进行识别,解析,最终将解析结果发送给声控程序;
声控程序根据解析结果,识别是哪一类的指令,并发送给指定的应用程序;
应用程序根据自己的优先级,进行响应,如果能处理则进行自处理,如果不能处理,则返回给声控程序不能处理的通知,由声控程序通知下一个应用程序;
以此类推,直到所有应用都经过了处理为止;
云端服务器实现原理和流程:
云端服务器在此方案中处于可选的地位,如果不选,则此逻辑需要在声控程序里实现;
服务器主要解决识别和解析的作用,由服务器选择使用哪家的识别和解析引擎,并且也可以自身也做解析,实现个性化;
服务器需要做好良好的封装,以便在替换语音识别和解析引擎时,对终端没有影响;
如果是问答性的指令,可以从车联网服务器上获取相关信息,然后返回给终端设备;
车联网服务器:提供网络信息资源。
4.按照权利要求1所述的实现语音识别功能的方法,其特征在于:
实现语音识别功能的方法,具体实现的步骤如下:
系统启动,默认启动声音控制程序,将初始化语音识别和语义解析模块初始化;
初始化成功后,用户可以通过唤醒词唤醒或者硬件/软件按钮触发开始录音;
导航仪的声音控制程序收到语音指令后,进行识别和解析,将解析结果发送给优先级最高的应用程序;
应用程序接收到解析结果之后,进行分析和处理,将处理结果发送给声音控制程序;
如果应用程序反馈未处理,声音控制程序再将解析结果发送给优先级次之的应用程序,依次类推;
所有应用都没有能够处理的命令,声音控制程序给出相应的反馈信息;
以上七个点既可以将声音控制程序和应用程序的独立开来,相互开发互不影响,且业务逻辑完全放到了应用程序中;
启动完成握手协议,应用程序启动后,需要通知到声音控制程序,方便其协调;声音控制程序向应用程序发送解析结果指令,让应用程序进行处理;应用程序触发声音控制程序进行播报,并给出播报内容,这是为了使语音产品的发声角色保持统一;声音控制程序播报结束给到应用程序的通知,让应用程序进行下一步的处理;应用程序触发声音控制程序进行录音,这是核心接口,触发自动的人机交互功能;应用程序通知声音控制程序结束对话,声音控制程序回到待机状态;应用程序通知声音控制程序发过来的某条指令是否被处理:如果被处理,则声音控制程序不会将其发送给其他应用;如果未被处理,则声音控制程序需要继续发送给其他应用;另外,还有一个辅助卖萌接口;声音控制程序自发处理,若是不能被识别的指令,则可以给出卖萌或者其他反馈。
CN201410636777.7A 2014-11-12 2014-11-12 一种实现语音识别功能的方法 Pending CN104318924A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410636777.7A CN104318924A (zh) 2014-11-12 2014-11-12 一种实现语音识别功能的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410636777.7A CN104318924A (zh) 2014-11-12 2014-11-12 一种实现语音识别功能的方法

Publications (1)

Publication Number Publication Date
CN104318924A true CN104318924A (zh) 2015-01-28

Family

ID=52374147

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410636777.7A Pending CN104318924A (zh) 2014-11-12 2014-11-12 一种实现语音识别功能的方法

Country Status (1)

Country Link
CN (1) CN104318924A (zh)

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104715754A (zh) * 2015-03-05 2015-06-17 北京华丰亨通科贸有限公司 一种快速响应语音命令的方法及装置
CN105448294A (zh) * 2015-12-09 2016-03-30 江苏天安智联科技股份有限公司 一种应用于车载设备的智能语音识别系统
CN106297801A (zh) * 2016-08-16 2017-01-04 北京云知声信息技术有限公司 语音处理方法及装置
CN106297785A (zh) * 2016-08-09 2017-01-04 董文亮 一种基于车联网的智能服务系统
CN106328135A (zh) * 2016-08-19 2017-01-11 北京智能管家科技有限公司 一种基于语音的应用切换方法及装置
CN106356062A (zh) * 2015-07-17 2017-01-25 深圳前海智云谷科技有限公司 机器智能识别与人工服务相结合的语音识别方法及系统
CN106486122A (zh) * 2016-12-26 2017-03-08 旗瀚科技有限公司 一种智能语音交互机器人
CN106598536A (zh) * 2016-10-31 2017-04-26 深圳众思科技有限公司 电子设备的录音启动方法、装置及电子设备
CN106782558A (zh) * 2016-12-27 2017-05-31 重庆峰创科技有限公司 一种带有图像理解的智能语音车载交互系统
CN107018228A (zh) * 2016-01-28 2017-08-04 中兴通讯股份有限公司 一种语音控制系统、语音处理方法及终端设备
CN107170446A (zh) * 2017-05-19 2017-09-15 深圳市优必选科技有限公司 语义处理服务器及用于语义处理的方法
CN107204185A (zh) * 2017-05-03 2017-09-26 深圳车盒子科技有限公司 车载语音交互方法、系统及计算机可读存储介质
CN107315793A (zh) * 2017-06-14 2017-11-03 北京嘀哒时空网络科技有限公司 一种基于语音的体育赛事数据统计方法、系统
CN107945796A (zh) * 2017-11-13 2018-04-20 百度在线网络技术(北京)有限公司 语音识别方法、装置、设备及计算机可读介质
CN108237993A (zh) * 2017-12-18 2018-07-03 北京车和家信息技术有限公司 一种人机交互方法、人机交互装置及车辆
CN108320751A (zh) * 2018-01-31 2018-07-24 北京百度网讯科技有限公司 一种语音交互方法、装置、设备和服务器
CN108469894A (zh) * 2018-03-13 2018-08-31 深圳阿凡达智控有限公司 语音识别芯片控制方法、装置以及系统
CN108831475A (zh) * 2018-05-24 2018-11-16 广州市千钧网络科技有限公司 一种文本消息提取方法及系统
CN109036430A (zh) * 2018-09-29 2018-12-18 芜湖星途机器人科技有限公司 语音控制终端
CN109102805A (zh) * 2018-09-20 2018-12-28 北京长城华冠汽车技术开发有限公司 语音交互方法、装置及实现装置
CN109119075A (zh) * 2018-07-25 2019-01-01 北京小米移动软件有限公司 语音识别场景唤醒方法及装置
CN109147776A (zh) * 2017-06-19 2019-01-04 丽宝大数据股份有限公司 具有声控功能的显示装置及声控时机指示方法
CN109147779A (zh) * 2018-08-14 2019-01-04 苏州思必驰信息科技有限公司 语音数据处理方法和装置
CN109410925A (zh) * 2018-08-30 2019-03-01 安徽声讯信息技术有限公司 一种基于多服务器解析传输的语音校验系统及方法
CN109524007A (zh) * 2017-09-18 2019-03-26 光宝科技股份有限公司 设备声控方法、终端装置及伺服器
CN110235087A (zh) * 2017-01-20 2019-09-13 华为技术有限公司 一种实现语音控制的方法和终端
CN110290475A (zh) * 2019-05-30 2019-09-27 深圳米唐科技有限公司 车载人机交互方法、系统及计算机可读存储介质
CN111613205A (zh) * 2020-05-22 2020-09-01 云知声智能科技股份有限公司 基于嵌入式设备的语音交互方法
CN113571049A (zh) * 2021-07-22 2021-10-29 成都航盛智行科技有限公司 基于vr的车身控制系统和方法
CN113593543A (zh) * 2020-04-30 2021-11-02 阿里巴巴集团控股有限公司 智能音箱语音服务系统、方法、装置及设备
CN114779931A (zh) * 2022-04-12 2022-07-22 兰州空间技术物理研究所 一种宇航用人机交互平台
CN117808013A (zh) * 2024-02-29 2024-04-02 济南幼儿师范高等专科学校 一种互动式多语言交流系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020082844A1 (en) * 2000-12-20 2002-06-27 Van Gestel Henricus Antonius Wilhelmus Speechdriven setting of a language of interaction
CN103442138A (zh) * 2013-08-26 2013-12-11 华为终端有限公司 语音控制方法、装置及终端
CN103885783A (zh) * 2014-04-03 2014-06-25 深圳市三脚蛙科技有限公司 一种应用程序的语音控制方法及装置
CN103915095A (zh) * 2013-01-06 2014-07-09 华为技术有限公司 语音识别的方法、交互设备、服务器和系统
CN104050966A (zh) * 2013-03-12 2014-09-17 百度国际科技(深圳)有限公司 终端设备的语音交互方法和使用该方法的终端设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020082844A1 (en) * 2000-12-20 2002-06-27 Van Gestel Henricus Antonius Wilhelmus Speechdriven setting of a language of interaction
CN103915095A (zh) * 2013-01-06 2014-07-09 华为技术有限公司 语音识别的方法、交互设备、服务器和系统
CN104050966A (zh) * 2013-03-12 2014-09-17 百度国际科技(深圳)有限公司 终端设备的语音交互方法和使用该方法的终端设备
CN103442138A (zh) * 2013-08-26 2013-12-11 华为终端有限公司 语音控制方法、装置及终端
CN103885783A (zh) * 2014-04-03 2014-06-25 深圳市三脚蛙科技有限公司 一种应用程序的语音控制方法及装置

Cited By (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104715754A (zh) * 2015-03-05 2015-06-17 北京华丰亨通科贸有限公司 一种快速响应语音命令的方法及装置
CN106356062A (zh) * 2015-07-17 2017-01-25 深圳前海智云谷科技有限公司 机器智能识别与人工服务相结合的语音识别方法及系统
CN105448294A (zh) * 2015-12-09 2016-03-30 江苏天安智联科技股份有限公司 一种应用于车载设备的智能语音识别系统
CN107018228A (zh) * 2016-01-28 2017-08-04 中兴通讯股份有限公司 一种语音控制系统、语音处理方法及终端设备
CN106297785A (zh) * 2016-08-09 2017-01-04 董文亮 一种基于车联网的智能服务系统
CN106297801A (zh) * 2016-08-16 2017-01-04 北京云知声信息技术有限公司 语音处理方法及装置
CN106328135B (zh) * 2016-08-19 2019-10-18 北京儒博科技有限公司 一种基于语音的应用切换方法及装置
CN106328135A (zh) * 2016-08-19 2017-01-11 北京智能管家科技有限公司 一种基于语音的应用切换方法及装置
CN106598536A (zh) * 2016-10-31 2017-04-26 深圳众思科技有限公司 电子设备的录音启动方法、装置及电子设备
CN106486122A (zh) * 2016-12-26 2017-03-08 旗瀚科技有限公司 一种智能语音交互机器人
CN106782558A (zh) * 2016-12-27 2017-05-31 重庆峰创科技有限公司 一种带有图像理解的智能语音车载交互系统
CN110235087A (zh) * 2017-01-20 2019-09-13 华为技术有限公司 一种实现语音控制的方法和终端
CN110235087B (zh) * 2017-01-20 2021-06-08 华为技术有限公司 一种实现语音控制的方法和终端
US11238860B2 (en) 2017-01-20 2022-02-01 Huawei Technologies Co., Ltd. Method and terminal for implementing speech control
CN107204185A (zh) * 2017-05-03 2017-09-26 深圳车盒子科技有限公司 车载语音交互方法、系统及计算机可读存储介质
CN107170446A (zh) * 2017-05-19 2017-09-15 深圳市优必选科技有限公司 语义处理服务器及用于语义处理的方法
CN107315793A (zh) * 2017-06-14 2017-11-03 北京嘀哒时空网络科技有限公司 一种基于语音的体育赛事数据统计方法、系统
CN109147776A (zh) * 2017-06-19 2019-01-04 丽宝大数据股份有限公司 具有声控功能的显示装置及声控时机指示方法
CN109524007A (zh) * 2017-09-18 2019-03-26 光宝科技股份有限公司 设备声控方法、终端装置及伺服器
CN107945796A (zh) * 2017-11-13 2018-04-20 百度在线网络技术(北京)有限公司 语音识别方法、装置、设备及计算机可读介质
CN107945796B (zh) * 2017-11-13 2021-05-25 百度在线网络技术(北京)有限公司 语音识别方法、装置、设备及计算机可读介质
CN108237993A (zh) * 2017-12-18 2018-07-03 北京车和家信息技术有限公司 一种人机交互方法、人机交互装置及车辆
CN108320751A (zh) * 2018-01-31 2018-07-24 北京百度网讯科技有限公司 一种语音交互方法、装置、设备和服务器
US11587560B2 (en) 2018-01-31 2023-02-21 Beijing Baidu Netcom Science And Technology Co., Ltd. Voice interaction method, device, apparatus and server
CN108469894A (zh) * 2018-03-13 2018-08-31 深圳阿凡达智控有限公司 语音识别芯片控制方法、装置以及系统
CN108831475A (zh) * 2018-05-24 2018-11-16 广州市千钧网络科技有限公司 一种文本消息提取方法及系统
CN108831475B (zh) * 2018-05-24 2020-09-29 广州市千钧网络科技有限公司 一种文本消息提取方法及系统
CN109119075A (zh) * 2018-07-25 2019-01-01 北京小米移动软件有限公司 语音识别场景唤醒方法及装置
CN109147779A (zh) * 2018-08-14 2019-01-04 苏州思必驰信息科技有限公司 语音数据处理方法和装置
CN109410925A (zh) * 2018-08-30 2019-03-01 安徽声讯信息技术有限公司 一种基于多服务器解析传输的语音校验系统及方法
CN109102805A (zh) * 2018-09-20 2018-12-28 北京长城华冠汽车技术开发有限公司 语音交互方法、装置及实现装置
CN109036430A (zh) * 2018-09-29 2018-12-18 芜湖星途机器人科技有限公司 语音控制终端
CN110290475A (zh) * 2019-05-30 2019-09-27 深圳米唐科技有限公司 车载人机交互方法、系统及计算机可读存储介质
CN113593543A (zh) * 2020-04-30 2021-11-02 阿里巴巴集团控股有限公司 智能音箱语音服务系统、方法、装置及设备
CN113593543B (zh) * 2020-04-30 2024-06-11 浙江未来精灵人工智能科技有限公司 智能音箱语音服务系统、方法、装置及设备
CN111613205A (zh) * 2020-05-22 2020-09-01 云知声智能科技股份有限公司 基于嵌入式设备的语音交互方法
CN113571049A (zh) * 2021-07-22 2021-10-29 成都航盛智行科技有限公司 基于vr的车身控制系统和方法
CN114779931A (zh) * 2022-04-12 2022-07-22 兰州空间技术物理研究所 一种宇航用人机交互平台
CN117808013A (zh) * 2024-02-29 2024-04-02 济南幼儿师范高等专科学校 一种互动式多语言交流系统

Similar Documents

Publication Publication Date Title
CN104318924A (zh) 一种实现语音识别功能的方法
US11810554B2 (en) Audio message extraction
US10489112B1 (en) Method for user training of information dialogue system
JP7418526B2 (ja) 自動アシスタントを起動させるための動的および/またはコンテキスト固有のホットワード
US11922925B1 (en) Managing dialogs on a speech recognition platform
CN110018735B (zh) 智能个人助理接口系统
EP3234945B1 (en) Application focus in speech-based systems
US9542956B1 (en) Systems and methods for responding to human spoken audio
CA2756140C (en) Service oriented speech recognition for in-vehicle automated interaction
CN110047481B (zh) 用于语音识别的方法和装置
CN110428825B (zh) 用于忽略流式媒体内容中的触发词的方法和系统
GB2512178A (en) Method for voice activation of a software agent from standby mode
US20140142945A1 (en) Application Services Interface to ASR
KR20230107860A (ko) 실제 노이즈를 사용한 음성 개인화 및 연합 트레이닝
CN113362828A (zh) 用于识别语音的方法和装置
CN109144458B (zh) 用于执行与语音输入相对应的操作的电子设备
KR20190062982A (ko) 전자 장치 및 전자 장치의 동작 방법
JP2022101663A (ja) ヒューマンコンピュータインタラクション方法、装置、電子機器、記憶媒体およびコンピュータプログラム
JP2023505917A (ja) 音声インタラクション方法、装置、機器、及びコンピュータ記憶媒体
US10497370B2 (en) Recognition module affinity
CN113611316A (zh) 人机交互方法、装置、设备以及存储介质
CN110473524B (zh) 语音识别系统的构建方法和装置
CN112259090A (zh) 基于语音交互的业务办理方法、装置和电子设备
CN116013257A (zh) 语音识别、语音识别模型训练方法、装置、介质及设备
CN109524000A (zh) 离线对话实现方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150128