CN106356057A - 一种基于计算机应用场景语义理解的语音识别系统 - Google Patents

一种基于计算机应用场景语义理解的语音识别系统 Download PDF

Info

Publication number
CN106356057A
CN106356057A CN201610712612.2A CN201610712612A CN106356057A CN 106356057 A CN106356057 A CN 106356057A CN 201610712612 A CN201610712612 A CN 201610712612A CN 106356057 A CN106356057 A CN 106356057A
Authority
CN
China
Prior art keywords
module
user
speech
speech recognition
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610712612.2A
Other languages
English (en)
Inventor
冯海洪
毛德平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Mic Technology Co Ltd
Original Assignee
Anhui Mic Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Mic Technology Co Ltd filed Critical Anhui Mic Technology Co Ltd
Priority to CN201610712612.2A priority Critical patent/CN106356057A/zh
Publication of CN106356057A publication Critical patent/CN106356057A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

本发明公开了一种基于计算机应用场景语义理解的语音识别系统,包括语音采集模块、语音处理模块、语音识别模块、用户识别模块、语义理解模块以及命令执行模块;本发明使用语音采集模块采集用户语音指令,经语音处理模块形成音频文件,使用语音识别模块将音频文件转换为文字信息,使用身份识模块识别用户身份,经语义理解模块对文字信息进行理解,采用命令执行模块执行相关操作,通过设计基于计算机应用场景的语义理解模块,大大提高了语音识别的智能化程度,让用户获得更加自然的交互体验,提高了语音识别的准确率。

Description

一种基于计算机应用场景语义理解的语音识别系统
技术领域
本发明属于语音识别技术领域,涉及一种语音识别系统,具体是一种基于计算机应用场景语义理解的语音识别系统。
背景技术
场景应用,是指“现场的、互动的、有生命力的场景移动应用”。据悉,场景应用(LiveApp)由云来团队于2012年初自主创新研发而成,它是基于移动互联网的连接引擎技术,是移动互联网一种全新基于用户场景的信息连接方式。鉴于移动互联网用户思维的产品设计理念,场景应用迎合了手机用户的使用习惯,为用户提供极致简单的连接和体验方式。
场景应用(LiveApp)从传播属性来说,它以社交网络为传播路径,极速连接用户,重构企业与用户之间的商业关系。可以连接微信、微博、来往、易信、百度、浏览器、UC、Line、whatsapp、facebook、googlemobile,同时通过二维码、图形二维码、声波识别无缝连接用户和商品。
场景应用主要体现在针对特定客户、特定时间点,出于某一特定情感诉求而产生的应用访问和体验。而计算机应用场景语义理解则是针对特定用户、特定时间点,出于某一特定目的而产生的语音指令,对用户语音的文本信息进行理解。
发明内容
本发明的目的在于提供一种智能程度和准确率高的基于计算机应用场景语义理解的语音识别系统。
本发明的目的可以通过以下技术方案实现:
基于计算机应用场景语义理解的语音识别系统,包括语音采集模块、语音处理模块、语音识别模块、用户识别模块、语义理解模块以及命令执行模块;
所述的语音采集模块,安装在用户鼠标内,用于采集用户说话的声音信号,并通过USB输出到语音处理模块;
所述的语音处理模块,安装在本地计算机内,用于将接收到用户说话的声音信号转换为数字信号,生成音频文件,通过以太网输出到语音识别模块和用户识别模块;
所述的语音识别模块,安装在线语音识别服务器内,用于将接收到的音频文件转换为文字信息,并发送到语义理解模块,同时获取音频文件中话音的声纹特征发送给用户身份识别单元;
所述的用户识别模块,安装在在线语音识别服务器内,用于根据声纹特征识别出对应的用户身份,并发送给语义理解模块;
所述的语义理解模块,安装在在线语音识别服务器内,根据接收到的文字信息和用户身份信息,基于计算机应用场景,根据特定用户、特定时间点、出于某一特定目的而产生的语音命令判断文字的内涵,理解用户的真实意图,通过以太网输出语义分析信息包到命令执行模块;其中,所述的语义分析信息包包含操作域和内容域;
所述的命令执行模块,安装在本地计算机内,根据接收到语义分析信息包里的操作域,执行不同的操作动作,并将语义分析信息包里的内容域作为该操作动作的参数。
进一步地,所述的语音采集使用麦克风采集用户声音信号,所述的麦克风通过安装在鼠标上的语音按键控制启动和关闭。
本发明的有益效果:本发明使用语音采集模块采集用户语音指令,经语音处理模块形成音频文件,使用语音识别模块将音频文件转换为文字信息,使用身份识模块识别用户身份,经语义理解模块对文字信息进行理解,采用命令执行模块执行相关操作,通过设计基于计算机应用场景的语义理解模块,大大提高了语音识别的智能化程度,让用户获得更加自然的交互体验,提高了语音识别的准确率。
附图说明
下面结合附图和具体实施例对本发明作进一步详细描述。
图1是本发明的系统示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所示,本发明提供了一种基于计算机应用场景语义理解的语音识别系统,包括语音采集模块、语音处理模块、语音识别模块、用户识别模块、语义理解模块以及命令执行模块。
语音采集模块,安装在用户鼠标内,用于采集用户说话的声音信号,并通过USB输出到语音处理模块。其中,语音采集使用麦克风采集用户声音信号,通过安装在鼠标上的语音按键控制麦克风启动和关闭。
语音处理模块,安装在本地计算机内,用于将接收到用户说话的声音信号转换为数字信号,生成音频文件,通过以太网输出到语音识别模块和 用户识别模块。
语音识别模块,安装在线语音识别服务器内,用于将接收到的音频文件转换为文字信息,并发送到语义理解模块,同时获取音频文件中话音的声纹特征发送给用户身份识别单元。语音识别模块通过抽取音频文件中话音所具有的频谱等物理特征,与预先存储的母音、子音或单词的物理特征模型进行比较,从而将语音转换为文字信息。
用户识别模块,安装在在线语音识别服务器内,用于根据声纹特征识别出对应的用户身份,并发送给语音理解模块。而对于语音识别的身份确认技术,其原理是每个人的生物特征不同,用户识别模块工作原理为:每个人发音特征各不相同,因此可利用人的发音特点、即通话话音来提取话音声纹特征(声纹特征也可称为特征码,是能够反映该话音生物特征的标识,可能是一串数字或是一个数字及其他符号的组合系列或是用来描述变化趋势的数字或坐标点的组合等),通过不同用户的不同声纹特征区别不同的用户。
语义理解模块,安装在在线语音识别服务器内,根据接收到的文字信息和用户身份信息,基于计算机应用场景,根据特定用户、特定时间点、出于某一特定目的而产生的语音命令判断文字的内涵,理解用户的真实意图,通过以太网输出语义分析信息包到命令执行模块。例如:“听音乐”背后的意图是:打开音乐播放器,并播放音乐。其中,语义分析信息包包含分析出来的操作域和内容域,操作域包含针对用户语音命令形成的操作指令,内容域包含该操作指令的参数信息。
通过设计基于计算机应用场景的语义理解模块,大大提高了语音识别的智能化程度,让用户获得更加自然的交互体验。这主要体现在以下几个 方面:
1、不同的语音口令,指向相同的计算机控制动作;例如:“关闭计算机”、“关计算机”“关机”等语音口令,经过语义理解模块处理后,都指向关机操作;
2、简单的口令可以快速实现原本复杂的计算机操作;例如:计算机要实现卸载程序,需要这样操作:开始菜单-控制面板-卸载更改程序,现在可以语音口令“卸载程序”,一步到位。
3、根据计算机应用场景理解用户语音命令的方式引导用户操作计算机;例如:突然网络掉线了,用户可以说口令:“网络掉线了”,计算机根据这个口令,打开网络设置界面,并引导用户检查网络。
命令执行模块,安装在本地计算机内,根据接收到语义分析信息包里的操作域,执行不同的操作动作,并将语义分析信息包里的内容域作为该操作动作的参数,实现相关功能。
本发明工作流程:用户在操作计算机时,突然想打开“控制面板”进行设置,此时,按住鼠标上的语音按键,说:“控制面板”,语音采集模块将采集到的声音信号发送到语音处理模块,形成音频文件,语音识别模块将音频文件转换为文字信息,用户识别模块识别用户身份,语义理解模块基于计算机应用场景对文字信息进行理解,输出语义分析信息包,命令执行模块控制打开“控制面板”。在用语音控制时,用户无需做任何退出现在正在执行的操作界面。
用户在浏览互联网时,想在百度上搜索框里输入:“什么是计算机应用场景?”,用户除了用键盘输入方式,还可用这样操作,按住鼠标上的语音按键,说:“什么是计算机应用场景?”,语音采集模块将采集到的声音信 号发送到语音处理模块,形成音频文件,语音识别模块将音频文件转换为文字信息,用户识别模块识别用户身份,语义理解模块基于计算机应用场景对文字信息进行理解,输出语义分析信息包,命令执行模块根据接收到语义分析信息包里的操作域,执行在百度搜索框内输入文字的操作,并将语义分析信息包里的内容域“什么是计算机应用场景?”作为输入的信息,将文本信息输入到百度搜索里,实现相关功能。
本发明使用语音采集模块采集用户语音指令,经语音处理模块形成音频文件,使用语音识别模块将音频文件转换为文字信息,使用身份识模块识别用户身份,经语义理解模块对文字信息进行理解,采用命令执行模块执行相关操作,通过设计基于计算机应用场景的语义理解模块,大大提高了语音识别的智能化程度,让用户获得更加自然的交互体验,提高了语音识别的准确率。
为了描述的方便,描述以上装置时以功能分为各种单元、模块分别描述。当然,在实施本申请时可以把各单元、模块的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施方式或者实施方式的某些部分所述的方法。
以上所描述的装置实施方式仅仅是示意性的,其中所述作为分离部件 说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施方式方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本申请可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的 技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (2)

1.基于计算机应用场景语义理解的语音识别系统,其特征在于:包括语音采集模块、语音处理模块、语音识别模块、用户识别模块、语义理解模块以及命令执行模块;
所述的语音采集模块,安装在用户鼠标内,用于采集用户说话的声音信号,并通过USB输出到语音处理模块;
所述的语音处理模块,安装在本地计算机内,用于将接收到用户说话的声音信号转换为数字信号,生成音频文件,通过以太网输出到语音识别模块和用户识别模块;
所述的语音识别模块,安装在线语音识别服务器内,用于将接收到的音频文件转换为文字信息,并发送到语义理解模块,同时获取音频文件中话音的声纹特征发送给用户身份识别单元;
所述的用户识别模块,安装在在线语音识别服务器内,用于根据声纹特征识别出对应的用户身份,并发送给语义理解模块;
所述的语义理解模块,安装在在线语音识别服务器内,根据接收到的文字信息和用户身份信息,基于计算机应用场景,根据特定用户、特定时间点、出于某一特定目的而产生的语音命令判断文字的内涵,理解用户的真实意图,通过以太网输出语义分析信息包到命令执行模块;其中,所述的语义分析信息包包含操作域和内容域;
所述的命令执行模块,安装在本地计算机内,根据接收到语义分析信息包里的操作域,执行不同的操作动作,并将语义分析信息包里的内容域作为该操作动作的参数。
2.根据权利要求1所述的基于计算机应用场景语义理解的语音识别系统,其特征在于:所述的语音采集使用麦克风采集用户声音信号,所述的麦克风通过安装在鼠标上的语音按键控制启动和关闭。
CN201610712612.2A 2016-08-24 2016-08-24 一种基于计算机应用场景语义理解的语音识别系统 Pending CN106356057A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610712612.2A CN106356057A (zh) 2016-08-24 2016-08-24 一种基于计算机应用场景语义理解的语音识别系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610712612.2A CN106356057A (zh) 2016-08-24 2016-08-24 一种基于计算机应用场景语义理解的语音识别系统

Publications (1)

Publication Number Publication Date
CN106356057A true CN106356057A (zh) 2017-01-25

Family

ID=57844709

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610712612.2A Pending CN106356057A (zh) 2016-08-24 2016-08-24 一种基于计算机应用场景语义理解的语音识别系统

Country Status (1)

Country Link
CN (1) CN106356057A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107146622A (zh) * 2017-06-16 2017-09-08 合肥美的智能科技有限公司 冰箱、语音交互系统、方法、计算机设备、可读存储介质
CN108305633A (zh) * 2018-01-16 2018-07-20 平安科技(深圳)有限公司 语音验证方法、装置、计算机设备和计算机可读存储介质
CN108984800A (zh) * 2018-08-22 2018-12-11 广东小天才科技有限公司 一种语音搜题方法及终端设备
CN109036379A (zh) * 2018-09-06 2018-12-18 百度时代网络技术(北京)有限公司 语音识别方法、设备及存储介质
CN109887503A (zh) * 2019-01-20 2019-06-14 北京联合大学 一种智能服务机器人的人机交互方法
CN110085230A (zh) * 2019-04-30 2019-08-02 徐州重型机械有限公司 控制工程机械的方法、装置、系统及计算机可读存储介质
CN110164455A (zh) * 2018-02-14 2019-08-23 阿里巴巴集团控股有限公司 用户身份识别的装置、方法和存储介质
CN111326158A (zh) * 2020-01-23 2020-06-23 深圳市安顺康医疗电子有限公司 一种基于智能终端的语音操控方法
CN111428512A (zh) * 2020-03-27 2020-07-17 大众问问(北京)信息科技有限公司 一种语义识别方法、装置及设备
CN111477232A (zh) * 2020-04-03 2020-07-31 江苏安全技术职业学院 一种基于计算机的人工智能识别系统
EP3627290A4 (en) * 2017-05-18 2021-03-03 Guohua Liu DEVICE SIDE HUMAN COMPUTER INTERACTION METHOD AND SYSTEM
CN114124597A (zh) * 2021-10-28 2022-03-01 青岛海尔科技有限公司 一种物联网设备的控制方法、设备及系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1323003A (zh) * 2001-06-22 2001-11-21 清华大学 盲人用的汉语智能计算机系统
CN1547191A (zh) * 2003-12-12 2004-11-17 北京大学 结合语义和声纹信息的说话人身份确认系统
CN101807398A (zh) * 2009-02-16 2010-08-18 宏正自动科技股份有限公司 语音识别装置及其操作方法
CN202041916U (zh) * 2011-03-18 2011-11-16 上海第二工业大学 一种声控鼠标
CN202584048U (zh) * 2012-05-17 2012-12-05 大连民族学院 一种基于dsp图像定位、语音识别的智能鼠标
CN202841290U (zh) * 2012-06-04 2013-03-27 百度在线网络技术(北京)有限公司 移动终端的解锁装置及具有该解锁装置的移动终端
CN103065628A (zh) * 2012-11-20 2013-04-24 江南大学 语音交互控制的导览系统及其方法
CN103077234A (zh) * 2013-01-07 2013-05-01 季雪峰 语音网址导航系统及方法
CN103186231A (zh) * 2011-12-30 2013-07-03 上海博泰悦臻电子设备制造有限公司 语音鼠标装置
CN104731549A (zh) * 2015-04-09 2015-06-24 徐敏 一种基于鼠标的语音识别人机交互装置及其方法
CN105187484A (zh) * 2014-05-30 2015-12-23 Lg电子株式会社 移动终端和控制移动终端的方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1323003A (zh) * 2001-06-22 2001-11-21 清华大学 盲人用的汉语智能计算机系统
CN1547191A (zh) * 2003-12-12 2004-11-17 北京大学 结合语义和声纹信息的说话人身份确认系统
CN101807398A (zh) * 2009-02-16 2010-08-18 宏正自动科技股份有限公司 语音识别装置及其操作方法
CN202041916U (zh) * 2011-03-18 2011-11-16 上海第二工业大学 一种声控鼠标
CN103186231A (zh) * 2011-12-30 2013-07-03 上海博泰悦臻电子设备制造有限公司 语音鼠标装置
CN202584048U (zh) * 2012-05-17 2012-12-05 大连民族学院 一种基于dsp图像定位、语音识别的智能鼠标
CN202841290U (zh) * 2012-06-04 2013-03-27 百度在线网络技术(北京)有限公司 移动终端的解锁装置及具有该解锁装置的移动终端
CN103065628A (zh) * 2012-11-20 2013-04-24 江南大学 语音交互控制的导览系统及其方法
CN103077234A (zh) * 2013-01-07 2013-05-01 季雪峰 语音网址导航系统及方法
CN105187484A (zh) * 2014-05-30 2015-12-23 Lg电子株式会社 移动终端和控制移动终端的方法
CN104731549A (zh) * 2015-04-09 2015-06-24 徐敏 一种基于鼠标的语音识别人机交互装置及其方法

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11163356B2 (en) 2017-05-18 2021-11-02 Guohua Liu Device-facing human-computer interaction method and system
EP3627290A4 (en) * 2017-05-18 2021-03-03 Guohua Liu DEVICE SIDE HUMAN COMPUTER INTERACTION METHOD AND SYSTEM
CN107146622A (zh) * 2017-06-16 2017-09-08 合肥美的智能科技有限公司 冰箱、语音交互系统、方法、计算机设备、可读存储介质
CN107146622B (zh) * 2017-06-16 2021-02-19 合肥美的智能科技有限公司 冰箱、语音交互系统、方法、计算机设备、可读存储介质
CN108305633A (zh) * 2018-01-16 2018-07-20 平安科技(深圳)有限公司 语音验证方法、装置、计算机设备和计算机可读存储介质
CN110164455A (zh) * 2018-02-14 2019-08-23 阿里巴巴集团控股有限公司 用户身份识别的装置、方法和存储介质
CN108984800B (zh) * 2018-08-22 2020-10-16 广东小天才科技有限公司 一种语音搜题方法及终端设备
CN108984800A (zh) * 2018-08-22 2018-12-11 广东小天才科技有限公司 一种语音搜题方法及终端设备
CN109036379A (zh) * 2018-09-06 2018-12-18 百度时代网络技术(北京)有限公司 语音识别方法、设备及存储介质
CN109887503A (zh) * 2019-01-20 2019-06-14 北京联合大学 一种智能服务机器人的人机交互方法
CN110085230A (zh) * 2019-04-30 2019-08-02 徐州重型机械有限公司 控制工程机械的方法、装置、系统及计算机可读存储介质
CN111326158A (zh) * 2020-01-23 2020-06-23 深圳市安顺康医疗电子有限公司 一种基于智能终端的语音操控方法
CN111428512A (zh) * 2020-03-27 2020-07-17 大众问问(北京)信息科技有限公司 一种语义识别方法、装置及设备
CN111428512B (zh) * 2020-03-27 2023-12-12 大众问问(北京)信息科技有限公司 一种语义识别方法、装置及设备
CN111477232A (zh) * 2020-04-03 2020-07-31 江苏安全技术职业学院 一种基于计算机的人工智能识别系统
CN114124597A (zh) * 2021-10-28 2022-03-01 青岛海尔科技有限公司 一种物联网设备的控制方法、设备及系统

Similar Documents

Publication Publication Date Title
CN106356057A (zh) 一种基于计算机应用场景语义理解的语音识别系统
JP7346609B2 (ja) 自然言語理解(nlu)フレームワークを使用して意味探索を実行するシステムおよび方法
Vaidya et al. Cocaine noodles: exploiting the gap between human and machine speech recognition
US20190311036A1 (en) System and method for chatbot conversation construction and management
Gu et al. Speech intention classification with multimodal deep learning
CN107220235A (zh) 基于人工智能的语音识别纠错方法、装置及存储介质
CN107680602A (zh) 语音欺诈识别方法、装置、终端设备及存储介质
CN109740053B (zh) 基于nlp技术的敏感词屏蔽方法和装置
CN107480162A (zh) 基于人工智能的搜索方法、装置、设备及计算机可读存储介质
CN109523989A (zh) 语音合成方法、语音合成装置、存储介质及电子设备
CN109271493A (zh) 一种语言文本处理方法、装置和存储介质
CN108288468A (zh) 语音识别方法及装置
CN109102809A (zh) 一种用于智能机器人的对话方法及系统
US10108698B2 (en) Common data repository for improving transactional efficiencies of user interactions with a computing device
CN109686383B (zh) 一种语音分析方法、装置及存储介质
US11657800B2 (en) Electronic device with wakeup word determined multi-mode operation
CN110047481A (zh) 用于语音识别的方法和装置
CN102637433A (zh) 识别语音信号中所承载的情感状态的方法和系统
US11568853B2 (en) Voice recognition method using artificial intelligence and apparatus thereof
CN110010136A (zh) 韵律预测模型的训练和文本分析方法、装置、介质和设备
CN106649253A (zh) 基于后验证的辅助控制方法及系统
Feng et al. A review of speech-centric trustworthy machine learning: Privacy, safety, and fairness
CN109410935A (zh) 一种基于语音识别的目的地搜索方法及装置
CN112382287A (zh) 语音交互方法、装置、电子设备和存储介质
CN110851650B (zh) 一种评论输出方法、装置、以及计算机存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170125

RJ01 Rejection of invention patent application after publication