CN109524002A - 智能语音识别方法及装置 - Google Patents

智能语音识别方法及装置 Download PDF

Info

Publication number
CN109524002A
CN109524002A CN201811632331.1A CN201811632331A CN109524002A CN 109524002 A CN109524002 A CN 109524002A CN 201811632331 A CN201811632331 A CN 201811632331A CN 109524002 A CN109524002 A CN 109524002A
Authority
CN
China
Prior art keywords
result
parsing result
speech analysis
alternative parsing
alternative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811632331.1A
Other languages
English (en)
Inventor
龙涛
乔磊
顾根平
肖彦果
滕敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Huitong Group Co Ltd
Original Assignee
Jiangsu Huitong Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Huitong Group Co Ltd filed Critical Jiangsu Huitong Group Co Ltd
Priority to CN201811632331.1A priority Critical patent/CN109524002A/zh
Publication of CN109524002A publication Critical patent/CN109524002A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2816Controlling appliance services of a home automation network by calling their functionalities
    • H04L12/282Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Automation & Control Theory (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

一种智能语音识别方法及装置,所述方法包括:接收语音采集设备的语音指令;发送所述语音指令至至少一个语音解析服务器;从所述至少一个语音解析服务器接收至少一个语音解析结果;从所述至少一个语音解析结果中筛选出备选解析结果;以及根据所述备选解析结果,发送控制指令至智能家电网络中的智能设备。通过结合AI智能识别技术,跨平台进行语音解析,从所述至少一个语音解析结果中筛选出备选解析结果,提高语音识别的准确度,从而提供了更好的语音识别效果。

Description

智能语音识别方法及装置
技术领域
本发明涉及智能家电领域,具体地涉及一种智能语音识别方法及装置。
背景技术
随着语音识别技术的发展,越来越多的智能家居以及控制入口增加了语音控制的功能,但是各语音搜索引擎的性能却有较大的差异。例如,有的语音搜索引擎适配英文比较好,有的适配中文比较好,有的适配专业词汇比较好等等。每个控制入口相应都有自己的语音采集设备,解析结果也是只输出给对应智能家居,语音识别的准确度有待提高。
因此,需要一种新的智能语音识别方法及装置,以提高语音识别的准确度以及用户体验。
发明内容
本发明实施例提供一种智能语音识别方法,包括:接收语音采集设备的语音指令;发送所述语音指令至至少一个语音解析服务器;从所述至少一个语音解析服务器接收至少一个语音解析结果;从所述至少一个语音解析结果中筛选出备选解析结果;以及根据所述备选解析结果,发送控制指令至智能家电网络中的智能设备。
可选地,从所述至少一个语音解析结果中筛选出备选解析结果包括:获取所述智能设备的平台信息以及场景信息;以及根据所述平台信息以及场景信息,通过AI算法从所述至少一个语音解析结果中筛选出与平台和场景对应的备选解析结果。
可选地,所述方法还包括:将所述平台信息以及场景信息存入AI(全称)算法数据库中。
可选地,所述方法还包括:根据用户的后续操作,判断所述备选解析结果是否正确。
可选地,所述方法还包括:将判断结果以及对应的备选解析结果存入AI算法数据库中。
可选地,所述从所述至少一个语音解析结果中筛选出备选解析结果还包括:根据所述AI算法数据库中的数据进行筛选。
可选地,所述方法还包括:若所述备选解析结果正确,将所述备选解析结果存入网关数据库中。
可选地,所述根据所述备选解析结果,发送控制指令至所述智能设备还包括:根据所述备选解析结果以及所述网关数据库中的数据,发送控制指令至所述智能设备。
本发明实施例还提供一种智能语音识别装置,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现所述智能语音识别方法中的步骤,所述步骤包括:接收语音采集设备的语音指令;发送所述语音指令至至少一个语音解析服务器;从所述至少一个语音解析服务器接收至少一个语音解析结果;从所述至少一个语音解析结果中筛选出备选解析结果;以及根据所述备选解析结果,发送控制指令至智能家电网络中的智能设备。
可选地,从所述至少一个语音解析结果中筛选出备选解析结果包括:获取所述智能设备的平台信息以及场景信息;以及根据所述平台信息以及场景信息,通过AI算法从所述至少一个语音解析结果中筛选出与平台和场景对应的备选解析结果。
可选地,所述装置还包括:将所述平台信息以及场景信息存入AI算法数据库中。
可选地,所述装置还包括:根据用户的后续操作,判断所述备选解析结果是否正确。
可选地,所述装置还包括:将判断结果以及对应的备选解析结果存入AI算法数据库中。
可选地,所述从所述至少一个语音解析结果中筛选出备选解析结果还包括:根据所述AI算法数据库中的数据进行筛选。
可选地,所述装置还包括:若所述备选解析结果正确,将所述备选解析结果存入网关数据库中。
可选地,所述根据所述备选解析结果,发送控制指令至所述智能设备还包括:根据所述备选解析结果以及所述网关数据库中的数据,发送控制指令至所述智能设备。
与现有技术相比,本发明实施例的技术方案具有以下优点:
发送所述语音指令至至少一个语音解析服务器;从所述至少一个语音解析服务器接收至少一个语音解析结果;从所述至少一个语音解析结果中筛选出备选解析结果;以及根据所述备选解析结果,发送控制信号至所述智能设备。通过结合AI智能识别技术,跨平台进行语音解析,从所述至少一个语音解析结果中筛选出备选解析结果,提高语音识别的准确度,从而提供了更好的语音识别效果。
进一步,将所述平台信息、场景信息以及判断结果存入AI算法数据库中,通过在识别的过程中建立客户独立的语音数据库,从而实现语音识别水平的进一步提升。
附图说明
图1是本发明实施例提供的一种智能语音识别方法的流程示意图;以及
图2是本发明实施例提供的一种智能语音识别装置的结构示意图。
具体实施方式
参考图1,图1是本发明实施例提供的一种智能语音识别方法的流程示意图。
在S11中,接收语音采集设备的语音指令。
在一些实施例中,用户触发语音输入。具体的,用户向所述语音采集设备输入语音信息。在具体实施中,所述语音采集设备可以是用户的智能终端,例如手机、平板电脑或智能语音音箱等等,也可以是用户想要控制的智能设备,例如智能洗衣机、智能冰箱等等,用户通过这些智能设备上的按钮语音输入设备完成语音输入。用户可以通过智能终端对所述智能设备进行远程操控,也可以直接向想要控制的智能设备输入语音指令。
由于多个语音采集设备可能对应不同的物理接口以及数据格式,因此所述智能家电网络中的智能网关采用跨平台技术获取不同语音采集设备的语音指令。
在S12中,发送所述语音指令至至少一个语音解析服务器。
在一些实施例中,以家庭场景为例,用户可以包括三个使用者,两个大人,一个小孩,大人主要使用中文进行语音输入,而小孩使用中文进行语音输入。接收到所述语音指令之后,所述智能网关将所述语音指令发送至至少一个语音解析服务器。
在所述至少一个语音解析服务器中,每个语音解析服务器的性能存在差异。假设小孩使用英语进行语音输入,则擅长适配英语的语音解析服务器反馈的结果可能是最准确的。相较于现有技术只是通过一个语音解析服务器进行语音解析,本方案中通过多平台解析的方法可以提高语音解析结果的准确度。
在S13中,从所述至少一个语音解析服务器接收至少一个语音解析结果。
在一些实施例中,所述智能网关可以从所述至少一个语音解析服务器接收至少一个语音解析结果。
在S14中,从所述至少一个语音解析结果中筛选出备选解析结果。
在一些实施例中,所述从所述至少一个语音解析结果中筛选出备选解析结果包括:获取所述智能设备的平台信息以及场景信息;根据所述平台信息以及场景信息,通过AI算法从所述至少一个语音解析结果中筛选出与平台和场景对应的备选解析结果。
具体地,所述智能网关在筛选之前,需要获取本次语音指令对应的平台信息以及场景信息。所述平台信息为用户想要控制的智能设备,所述场景信息为所述智能设备所处的场景,包括时间、地点等等。
例如,用户希望通过智能语音音箱控制客厅里的智能电灯,在所述智能网关接收语音采集设备的语音指令后,还可以获取所述智能设备的平台信息以及场景信息,在本场景中,所述平台信息为智能电灯,所述场景信息可以为客厅(地点)和/或凌晨(时间)。
结合所述平台信息以及所述场景信息进行筛选,所述智能网关可以提高筛选备选解析结果的准确性。
在S15中,根据所述备选解析结果,发送控制指令至智能家电网络中的智能设备。
在一些实施例中,所述智能网关筛选出备选解析结果后,并不是直接将所述备选解析结果发送给所述智能家电网络中的智能设备,而是根据所述备选解析结果找到对应的控制指令,将所述控制指令发送至智能家电网络中的智能设备。
具体地,所述智能网关解析出备选解析结果为文本信息,若将备选解析结果直接发送给所述智能设备,所述智能设备无法识别,而所述智能网关中存储有对应每个智能设备的指令集,智能网关根据备选解析结果从指令集中选择出具体控制指令并发送至所述智能设备。
接收到所述控制指令之后,所述智能设备根据所述控制指令进行对应操作。仍以智能电灯为例,接收到所述控制指令后,所述智能电灯可以进行开关灯或者亮度调整等操作。
在S16中,所述将所述平台信息以及场景信息存入AI算法数据库中。
在一些实施例中,将获取到的所述平台信息以及场景信息存入AI算法数据库中,作为AI算法的校验值,训练所述AI算法,从而提高所述AI算法筛选备选解析结果的准确度。所述AI算法数据库中的数据适于协助所述AI算法筛选出所述备选解析结果。
在一些实施例中,所述从所述至少一个语音解析结果中筛选出备选解析结果还包括:根据所述AI算法数据库中的数据进行筛选。
可以理解的是,本实施例并不对S15和S16的执行顺序做出限制,在获取所述平台信息以及场景信息后,就可将其存入所述AI算法数据库中。
在S17中,根据用户的后续操作,判断所述备选解析结果是否正确。
在一些实施例中,所述AI算法并不能从所述至少一个语音解析结果中选择出正确的备选结果。因此,为进一步提升AI算法的性能,需要对所述AI算法的筛选结果进行判断。如果用户在一定时间内没有后续操作,可以认为所述备选解析结果正确;反之,则可以认为所述备选解析结果错误。
仍以所述家庭场景为例,若用户通过语音输入希望调高所述智能电灯的亮度,且在预定时间内(如5分钟)没有后续操作,则说明所筛选的备选解析结果正确;如果所述备选解析结果不正确的话,用户可能会在短时间内发出新的语音指令或与上次一样的语音指令。因此,如果用户进行上述后续操作行为,则可以判断所述备选解析结果不正确。
在S18中,若所述备选解析结果正确,将所述备选解析结果存入网关数据库中。
在一些实施例中,若所述备选解析结果正确,意味着所述智能网关根据所述备选结果选择发送的控制指令也是正确的。将所述备选解析结果存入网关数据库作为智能网关进行选择时的参考,可以进一步提升所述智能网关选择控制指令的准确性。所述网关数据库中的数据适于协助向所述智能设备发送控制指令。
在一些实施例中,所述根据所述备选解析结果,发送控制指令至所述智能设备还包括:根据所述备选解析结果以及所述网关数据库中的数据,发送控制指令至所述智能设备。
在S19中,将判断结果以及对应的备选解析结果存入AI算法数据库中。
在一些实施例中,无论判断结果正确与否,都将所述判断结果以及对应的备选解析结果存入AI算法数据库中。所述判断结果和对应的备选解析结果也作为AI算法的校验值,进一步提高AI算法筛选备选解析结果的准确性。
参考图2,图2是本发明实施例提供的一种智能语音识别装置的结构示意图,所述装置包括存储器11和处理器12,所述存储器上11存储有可在所述处理器12上运行的计算机程序,所述存储在存储器11上的计算机程序即为实现上述方法步骤的程序,所述处理器12执行所述程序时实现上文所述步骤。所述存储器11可以包括:ROM、RAM、磁盘或光盘等。所述步骤包括:接收语音采集设备的语音指令;发送所述语音指令至至少一个语音解析服务器;从所述至少一个语音解析服务器接收至少一个语音解析结果;从所述至少一个语音解析结果中筛选出备选解析结果;以及根据所述备选解析结果,发送控制指令至智能家电网络中的智能设备。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (16)

1.一种智能语音识别方法,其特征在于,包括:
接收语音采集设备的语音指令;
发送所述语音指令至至少一个语音解析服务器;
从所述至少一个语音解析服务器接收至少一个语音解析结果;
从所述至少一个语音解析结果中筛选出备选解析结果;以及
根据所述备选解析结果,发送控制指令至智能家电网络中的智能设备。
2.根据权利要求1所述的智能语音识别方法,其特征在于,从所述至少一个语音解析结果中筛选出备选解析结果包括:
获取所述智能设备的平台信息以及场景信息;以及
根据所述平台信息以及场景信息,通过AI算法从所述至少一个语音解析结果中筛选出与平台和场景对应的备选解析结果。
3.根据权利要求2所述的智能语音识别方法,其特征在于,还包括:将所述平台信息以及场景信息存入AI算法数据库中。
4.根据权利要求1所述的智能语音识别方法,其特征在于,还包括:根据用户的后续操作,判断所述备选解析结果是否正确。
5.根据权利要求4所述的智能语音识别方法,其特征在于,还包括:将判断结果以及对应的备选解析结果存入AI算法数据库中。
6.根据权利要求5所述的智能语音识别方法,其特征在于,所述从所述至少一个语音解析结果中筛选出备选解析结果还包括:根据所述AI算法数据库中的数据进行筛选。
7.根据权利要求4所述的智能语音识别方法,其特征在于,还包括:若所述备选解析结果正确,将所述备选解析结果存入网关数据库中。
8.根据权利要求7所述的智能语音识别方法,其特征在于,所述根据所述备选解析结果,发送控制指令至所述智能设备还包括:根据所述备选解析结果以及所述网关数据库中的数据,发送控制指令至所述智能设备。
9.一种智能语音识别装置,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现的步骤包括:
接收语音采集设备的语音指令;
发送所述语音指令至至少一个语音解析服务器;
从所述至少一个语音解析服务器接收至少一个语音解析结果;
从所述至少一个语音解析结果中筛选出备选解析结果;以及
根据所述备选解析结果,发送控制指令至智能家电网络中的智能设备。
10.根据权利要求9所述的智能语音识别装置,其特征在于,从所述至少一个语音解析结果中筛选出备选解析结果包括:
获取所述智能设备的平台信息以及场景信息;以及
根据所述平台信息以及场景信息,通过AI算法从所述至少一个语音解析结果中筛选出与平台和场景对应的备选解析结果。
11.根据权利要求10所述的智能语音识别装置,其特征在于,还包括:将所述平台信息以及场景信息存入AI算法数据库中。
12.根据权利要求9所述的智能语音识别装置,其特征在于,还包括:根据用户的后续操作,判断所述备选解析结果是否正确。
13.根据权利要求12所述的智能语音识别装置,其特征在于,还包括:将判断结果以及对应的备选解析结果存入AI算法数据库中。
14.根据权利要求13所述的智能语音识别装置,其特征在于,所述从所述至少一个语音解析结果中筛选出备选解析结果还包括:根据所述AI算法数据库中的数据进行筛选。
15.根据权利要求12所述的智能语音识别装置,其特征在于,还包括:若所述备选解析结果正确,将所述备选解析结果存入网关数据库中。
16.根据权利要求15所述的智能语音识别装置,其特征在于,所述根据所述备选解析结果,发送控制指令至所述智能设备还包括:根据所述备选解析结果以及所述网关数据库中的数据,发送控制指令至所述智能设备。
CN201811632331.1A 2018-12-28 2018-12-28 智能语音识别方法及装置 Pending CN109524002A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811632331.1A CN109524002A (zh) 2018-12-28 2018-12-28 智能语音识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811632331.1A CN109524002A (zh) 2018-12-28 2018-12-28 智能语音识别方法及装置

Publications (1)

Publication Number Publication Date
CN109524002A true CN109524002A (zh) 2019-03-26

Family

ID=65797672

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811632331.1A Pending CN109524002A (zh) 2018-12-28 2018-12-28 智能语音识别方法及装置

Country Status (1)

Country Link
CN (1) CN109524002A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111190715A (zh) * 2019-12-31 2020-05-22 杭州涂鸦信息技术有限公司 产品服务的分发调度方法和系统、可读存储介质及计算机

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012168349A (ja) * 2011-02-15 2012-09-06 Alpine Electronics Inc 音声認識システムおよびこれを用いた検索システム
CN103092181A (zh) * 2012-12-28 2013-05-08 吴玉胜 基于智能电视设备的家电控制方法及系统
CN104199810A (zh) * 2014-08-29 2014-12-10 科大讯飞股份有限公司 一种基于自然语言交互的智能服务方法及系统
CN105027198A (zh) * 2013-02-25 2015-11-04 三菱电机株式会社 语音识别系统以及语音识别装置
US20170076726A1 (en) * 2015-09-14 2017-03-16 Samsung Electronics Co., Ltd. Electronic device, method for driving electronic device, voice recognition device, method for driving voice recognition device, and non-transitory computer readable recording medium

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012168349A (ja) * 2011-02-15 2012-09-06 Alpine Electronics Inc 音声認識システムおよびこれを用いた検索システム
CN103092181A (zh) * 2012-12-28 2013-05-08 吴玉胜 基于智能电视设备的家电控制方法及系统
CN105027198A (zh) * 2013-02-25 2015-11-04 三菱电机株式会社 语音识别系统以及语音识别装置
CN104199810A (zh) * 2014-08-29 2014-12-10 科大讯飞股份有限公司 一种基于自然语言交互的智能服务方法及系统
US20170076726A1 (en) * 2015-09-14 2017-03-16 Samsung Electronics Co., Ltd. Electronic device, method for driving electronic device, voice recognition device, method for driving voice recognition device, and non-transitory computer readable recording medium

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111190715A (zh) * 2019-12-31 2020-05-22 杭州涂鸦信息技术有限公司 产品服务的分发调度方法和系统、可读存储介质及计算机
CN111190715B (zh) * 2019-12-31 2023-05-12 杭州涂鸦信息技术有限公司 产品服务的分发调度方法和系统、可读存储介质及计算机

Similar Documents

Publication Publication Date Title
CN105786993B (zh) 应用程序的功能插件推荐方法及装置
CN109522083B (zh) 一种页面智能化响应交互系统及方法
CN105979376A (zh) 一种推荐方法和装置
CN109086276B (zh) 数据翻译方法、装置、终端及存储介质
CN110489626A (zh) 一种信息采集方法和装置
CN109271533A (zh) 一种多媒体文件检索方法
CN107544271A (zh) 终端控制方法、装置及计算机可读存储介质
CN109376069B (zh) 一种测试报告的生成方法及设备
CN109739961A (zh) 一种人机语言交互方法及装置
CN109493852A (zh) 一种语音识别的评测方法及装置
CN108766431B (zh) 一种基于语音识别的自动唤醒方法及电子设备
CN107609047A (zh) 应用推荐方法、装置、移动设备及存储介质
US20230326468A1 (en) Audio processing of missing audio information
CN111552633A (zh) 接口的异常调用测试方法、装置、计算机设备及存储介质
CN112463106A (zh) 基于智能屏幕的语音交互方法、装置、设备及存储介质
CN106548779A (zh) 儿童锁启动方法及装置
CN109637536B (zh) 一种自动化识别语义准确性的方法及装置
CN111246285A (zh) 一种解说视频中声音的分离方法、音量调节方法及装置
CN111413877A (zh) 控制家电设备的方法及装置
WO2023273776A1 (zh) 语音数据的处理方法及装置、存储介质、电子装置
CN111816170A (zh) 一种音频分类模型的训练和垃圾音频识别方法和装置
CN109524002A (zh) 智能语音识别方法及装置
CN114120969A (zh) 智能终端的语音识别功能测试方法、系统、电子设备
CN106356056A (zh) 语音识别方法和装置
CN111343660B (zh) 一种应用程序的测试方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination