CN113488038A - 智能设备的语音识别方法、系统及存储介质和终端设备 - Google Patents

智能设备的语音识别方法、系统及存储介质和终端设备 Download PDF

Info

Publication number
CN113488038A
CN113488038A CN202110674062.0A CN202110674062A CN113488038A CN 113488038 A CN113488038 A CN 113488038A CN 202110674062 A CN202110674062 A CN 202110674062A CN 113488038 A CN113488038 A CN 113488038A
Authority
CN
China
Prior art keywords
intelligent device
intelligent
voice
voice recognition
instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110674062.0A
Other languages
English (en)
Inventor
蔡正浩
杨天成
贾琳琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen TCL New Technology Co Ltd
Original Assignee
Shenzhen TCL New Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen TCL New Technology Co Ltd filed Critical Shenzhen TCL New Technology Co Ltd
Priority to CN202110674062.0A priority Critical patent/CN113488038A/zh
Publication of CN113488038A publication Critical patent/CN113488038A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明实施例公开了智能设备的语音识别方法、系统及存储介质和终端设备,应用于信息处理技术领域。第一智能设备会在发起语音控制时,接收用户输入的语音指令后,共享第二智能设备的离线语音识别功能,即将语音指令发送给第二智能设备,由第二智能设备通过离线语音识别功能对语音指令进行识别,并返回识别结果即设备操作信息给第一智能设备。这样,可以不需要在每个智能设备中都部署离线的语音识别功能,而对某些第二智能设备中的离线语音识别功能进行共享,尽可能地节省了用户使用的智能设备的资源,且能将智能设备的资源使用效率最大化。

Description

智能设备的语音识别方法、系统及存储介质和终端设备
技术领域
本发明涉及信息处理技术领域,特别涉及智能设备的语音识别方法、系统及存储介质和终端设备。
背景技术
近年来,智能家居设备越来越广泛,比如小型家庭机器人、智能灯、扫地机器人、智能音箱、智能空调、智能冰箱、智能电视和各类传感器等越来越普遍,而在智能设备(比如电视、空调、音箱和扫地机器人等)中具有语音控制功能的也越来越常见,这样,用户可以输入语音指令(比如打开空调、关闭空调和制冷模式等语音)到智能设备,而智能设备会识别出语音指令相应的设备操作信息,并执行相应操作。
现有的智能设备在识别语音指令时,一般可以包括在线识别和离线识别,在线识别时,需要智能设备向后台请求对用户输入的语音指令进行识别;而离线识别时,需要在智能设备部署语音识别模型,这样,在智能设备所在网络不稳定的情况下,也可以通过语音指令来控制,但是用户使用的智能设备的资源一般都有限,而在智能设备中预置语音识别模型会占用智能设备的较多资源,会对智能设备的正常运行造成一定影响。
发明内容
本发明实施例提供智能设备的语音识别方法、系统及存储介质和终端设备,实现了对智能设备中离线语音识别功能的共享。
本发明实施例一方面提供一种智能设备的语音识别方法,应用于第一智能设备,所述方法包括:
接收用户输入所述第一智能设备的语音指令;
确定识别所述语音指令的第二智能设备,所述第二智能设备具有离线语音识别功能,其识别的语音指令与所述第一智能设备的语音指令有交集;
将所述语音指令发送给所述第二智能设备,以便所述第二智能设备通过离线语音识别功能识别所述语音指令对应的设备操作信息;
接收所述第二智能设备返回的所述设备操作信息,根据所述设备操作信息进行相应操作。
本发明实施例另一方面提供一种智能设备的语音识别方法,应用于具有离线语音识别功能的第二智能设备,所述方法包括:
接收第一智能设备发送的语音指令;
调用预置的语音识别模型,及根据预置的语音识别模型对所述语音指令进行识别,得到设备操作信息;
将所述设备操作信息发送给所述第一智能设备,以便所述第一智能设备根据所述设备操作信息进行相应操作。
本发明实施例又一方面还提供一种智能设备,包括:
用户指令接收单元,用于接收用户输入所述智能设备的语音指令;
设备确定单元,用于确定识别所述语音指令的第二智能设备,所述第二智能设备具有离线语音识别功能,其识别的语音指令与所述智能设备的语音指令有交集;
指令发送单元,用于将所述语音指令发送给所述第二智能设备,以便所述第二智能设备通过离线语音识别功能识别所述语音指令对应的设备操作信息;
操作接收单元,用于接收所述第二智能设备返回的所述设备操作信息,根据所述设备操作信息进行相应操作。
本发明实施例又一方面还提供一种智能设备,所述智能设备具有离线语音识别功能,包括:
指令接收单元,用于接收第一智能设备发送的语音指令;
语音识别单元,用于调用预置的语音识别模型,及根据预置的语音识别模型对所述语音指令进行识别,得到设备操作信息;
操作发送单元,用于将所述设备操作信息发送给所述第一智能设备,以便所述第一智能设备根据所述设备操作信息进行相应操作。
本发明实施例另一方面还提供一种计算机可读存储介质,所述计算机可读存储介质储存多个计算机程序,所述计算机程序适于由处理器加载并执行如本发明实施例一方面或另一方面所述的智能设备的语音识别方法。
本发明实施例另一方面还提供一种终端设备,包括处理器和存储器;
所述存储器用于储存多个计算机程序,所述计算机程序用于由处理器加载并执行如本发明实施例一方面或另一方面所述的智能设备的语音识别方法;所述处理器,用于实现所述多个计算机程序中的各个计算机程序。
可见,在本发明实施例中,第一智能设备会在发起语音控制时,接收用户输入的语音指令后,会共享第二智能设备的离线语音识别功能,即将语音指令发送给第二智能设备,由第二智能设备通过离线语音识别功能对语音指令进行识别,并返回识别结果即设备操作信息给第一智能设备。这样,可以不需要在每个智能设备中都部署离线的语音识别功能,而对某些第二智能设备中的离线语音识别功能进行共享,尽可能地节省了用户使用的智能设备的资源,且能将智能设备的资源使用效率最大化。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种智能设备的语音识别方法的示意图;
图2是本发明一个实施例提供的一种智能设备的语音识别方法的流程图;
图3是本发明另一个实施例提供的一种智能设备的语音识别方法的流程图;
图4是本发明一个应用实施例中第一智能设备储存第二智能设备信息的流程图;
图5是本发明一个应用实施例中第一智能设备共享第二智能设备的离线语音识别功能的流程图;
图6是本发明另一应用实施例中智能设备的语音识别方法所应用于的分布式系统的示意图;
图7是本发明另一应用实施例中区块结构的示意图;
图8是本发明实施例提供的一种智能设备的逻辑结构示意图;
图9是本发明实施例提供的另一种智能设备的逻辑结构示意图;
图10是本发明实施例提供的一种终端设备的逻辑结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排它的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例提供一种智能设备的语音识别方法,主要是由第一智能设备共享第二智能设备的离线语音识别功能,具体如图1所示,第一智能设备可以通过如下步骤实现语音识别:
接收用户输入所述第一智能设备的语音指令;确定识别所述语音指令的第二智能设备,所述第二智能设备具有离线语音识别功能,其识别的语音指令与所述第一智能设备的语音指令有交集;将所述语音指令发送给所述第二智能设备,以便所述第二智能设备通过离线语音识别功能识别所述语音指令对应的设备操作信息;接收所述第二智能设备返回的所述设备操作信息,根据所述设备操作信息进行相应操作。
而对于第二智能设备可以通过如下步骤实现语音识别:
接收第一智能设备发送的语音指令;调用预置的语音识别模型,及根据预置的语音识别模型对所述语音指令进行识别,得到设备操作信息;将所述设备操作信息发送给所述第一智能设备,以便所述第一智能设备根据所述设备操作信息进行相应操作。
其中,第一智能设备可以是无离线语音识别功能的智能家居设备,比如智能空调、智能冰箱和智能灯等设备,也可以是具有离线语音识别功能的智能家居设备;而第二智能设备可以是具有离线语音识别功能的智能家居设备,比如智能音响、智能电视和家庭机器人等设备。且第一智能设备和第二智能设备都可以是同一用户使用的不同智能家居设备。
上述第二智能设备具有离线语音识别功能,具体地,会在第二智能设备中预置语音识别模型,而语音识别模型是一种基于人工智能的机器学习模型。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
而机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
这样,可以不需要在每个智能设备中都部署离线的语音识别功能,而对某些第二智能设备中的离线语音识别功能进行共享,尽可能地节省了用户使用的智能设备的资源,且能将智能设备的资源使用效率最大化。
本发明一个实施例提供一种智能设备的语音识别方法,主要是由第一智能设备所执行的方法,流程图如图2所示,包括:
步骤101,接收用户输入第一智能设备的语音指令。
可以理解,在一种情况下,第一智能设备是可以支持语音控制功能的设备,即第一智能设备会提供语音获取接口,通过该语音获取接口可以接收用户输入的语音指令,但是第一智能设备并不支持离线语音识别功能,而支持在线语音识别功能,即第一智能设备在接收到语音指令后,向后台请求对该语音指令进行识别,并接收后台返回的该语音指令对应的设备操作信息,进而根据接收的设备操作信息执行相应的操作。
在本发明实施例中,第一智能设备会共享其它智能设备(比如第二智能设备的)的离线语音识别功能,则当第一智能设备接收到语音指令后,可以直接执行如下步骤102到104。或者,第一智能设备在接收到语音指令后,会先判断第一智能设备的在线语音识别是否满足第一预置条件,如果满足,才会执行如下步骤102到104;如果不满足,则不会执行如下步骤102到104,而是使用在线语音识别方式对接收的语音指令进行识别。
其中,第一预置条件可以包括但不限于如下任一条件:在预设时间段内第一智能设备的在线语音识别失败的次数超过某一预置次数(比如1周内在线语音识别失败次数超过5次等),及在预设时间段内第一智能设备的在线语音识别的平均响应时间超过某一预置时间。这里平均响应时间是指在一段时间内,当第一智能设备向后台发起请求对语音指令的识别到后台返回语音识别结果之间的平均时间。
另一种情况下,第一智能设备可以是具有离线语音识别功能的智能设备,该第一智能设备在本地的离线语音识别功能出现异常或出现延迟时,也可以共享第二智能设备的离线语音识别功能,具体地,第一智能设备在接收到用户输入的语音指令后,会先确定本地的离线语音识别是否满足第二预置条件,如果满足,则执行如下步骤102到104;如果不满足,直接使用本地的离线语音识别功能对语音指令进行识别。其中,第二预置条件可以包括但不限于如下任一条件:在预置时间段内本地离线语音识别的失败次数达到预置值,在预置时间段内本地离线语音识别的平均延时时间超过预置值等。其中,本地离线语音识别的失败可以包括当第一智能设备按照本地离线语音识别功能识别的结果进行相应操作后,用户对第一智能设备的操作进行报错,则认为本地离线语音识别失败等。
步骤102,确定识别语音指令的第二智能设备,第二智能设备具有离线语音识别功能,且第二智能设备识别的语音指令与第一智能设备的语音指令有交集。
可以理解,第一智能设备可以预先获知具有离线语音识别功能的其它智能设备(比如第二智能设备),并将这些第二智能设备中可以识别的语音指令与第一智能设备的语音指令有交集的第二智能设备(可以为一个或多个)的信息储存到第一智能设备中。具体地:
具有离线语音识别功能的第二智能设备会主动发送广播消息,并将第二智能设备的关键信息携带在广播消息中,当第一智能设备接收到该广播消息后,可以获取第二智能设备发送的关键信息,并根据关键信息与第二智能设备之间建立通信连接,然后通过该通信连接接收第二智能设备发送的可支持指令集,该可支持指令集用于描述第二智能设备的离线语音识别功能所支持的语音指令;当根据可支持指令集确定第二智能设备所支持的语音指令与第一智能设备的语音指令有交集时,储存第二智能设备的信息,当第二智能设备所支持的语音指令与第一智能设备的语音指令之间不具有交集时,不会储存第二智能设备的信息。
其中,关键信息可以包括用于标识第二智能设备具有离线语音识别功能的信息,还可以包括但不限于如下信息:第二智能设备的设备类型、设备名称、支持离线语音识别的语种以及在共享离线语音识别功能过程中使用的协议信息,包括协议类型、协议名称、协议的数据格式、协议的版本、最低兼容协议版本及对接的(Internet Protocol,IP)和端口等。这里使用的协议信息是指在第一智能设备与第二智能设备之间基于语音指令进行通信过程中所使用协议的信息。
进一步地,第一智能设备不仅需要确定是否与第二智能设备的语音指令之间具有交集,且在与第二智能设备之间建立通信连接之前,还需要确定关键信息中包括的协议信息与第一智能设备的语音指令对应的协议信息是否一致,及关键信息中包括的语种信息与第一智能设备的语音指令对应的语种信息是否一致,只有这两种信息都一致时,才会与第二智能设备之间建立通信连接。
本实施例中,第一智能设备中储存了第二智能设备的信息后,当第一智能设备发起本实施例的语音识别流程时,可以根据本地储存的第二智能设备的信息中选择任一第二智能设备,以执行如下步骤103。
需要说明的是,如果在第一智能设备中储存了多个第二智能设备的信息,在选择其中某一第二智能设备时,会对多个第二智能设备进行比较,具体地:
由于第二智能设备通过离线语音识别功能识别的语音指令与第一智能设备的语音指令之间有交集,说明第二智能设备通过离线语音识别功能并不能识别第一智能设备接收的全部语音指令,则可以从多个第二智能设备中,选择能离线识别的语音指令与第一智能设备的语音指令之间的交集最大的第二智能设备;或者选择在一段时间内对第一智能设备的语音指令识别失败次数最少的第二智能设备。
步骤103,将语音指令发送给第二智能设备,以便第二智能设备通过离线语音识别功能识别语音指令对应的设备操作信息。
步骤104,接收第二智能设备返回的设备操作信息,根据设备操作信息进行相应操作。
可见,在本实施例的方法中,第一智能设备会在发起语音控制时,接收用户输入的语音指令后,会共享第二智能设备的离线语音识别功能,即将语音指令发送给第二智能设备,由第二智能设备通过离线语音识别功能对语音指令进行识别,并返回识别结果即设备操作信息给第一智能设备。这样,可以不需要在每个智能设备中都部署离线的语音识别功能,而对某些第二智能设备中的离线语音识别功能进行共享,尽可能地节省了用户使用的智能设备的资源,且能将智能设备的资源使用效率最大化。
本发明另一个实施例提供一种智能设备的语音识别方法,主要是由具有离线语音识别功能的第二智能设备所执行的方法,流程图如图3所示,包括:
步骤201,接收第一智能设备发送的语音指令。
可以理解,一种情况下,第一智能设备可以是无离线语音识别功能的设备,用户会向第一智能设备输入语音指令,而第一智能设备会直接将该语音指令发送给具有离线语音识别功能的第二智能设备,或者,在第一智能设备的在线语音识别满足第一预置条件时,才将该语音指令发送给第二智能设备,具体方法见上述实施例中所述,在此不进行赘述。
另一种情况下,第一智能设备也可以是具有离线语音识别功能的设备,当接收到用户输入的语音指令后,可以判断本地离线语音识别是否满足第二预置条件,如果满足,会将语音指令发送给第二智能设备,以共享第二智能设备的离线语音识别功能。
步骤202,调用预置的语音识别模型。
当第二智能设备接收到第一智能设备发送的语音指令后,会调用本地预置的语音识别模型,该语音识别模型是一个机器学习模型,可以通过一定的训练方法训练得到,并将其运行逻辑储存在第二智能设备中。
步骤203,根据预置的语音识别模型对语音指令进行识别,得到设备操作信息。
步骤204,将设备操作信息发送给第一智能设备,以便第一智能设备根据设备操作信息进行相应操作。
进一步地,在执行上述步骤201到204之前,第二智能设备还会主动通过广播的形式发送第二智能设备的关键信息,该关键信息中包括用于标识第二智能设备具有离线语音识别功能的信息,还可以包括其它信息,具体见上述实施例中所述;当第一智能设备接收到关键信息后,根据关键信息在第二智能设备与第一智能设备之间建立通信连接,则第二智能设备会通过该通信连接将第二智能设备的可支持指令集发送给第一智能设备,以便第一智能设备在确定第二智能设备所支持的语音指令与第一智能设备的语音指令有交集时,储存第二智能设备的信息。其中,第二智能设备的可支持指令集用于描述第二智能设备的离线语音识别功能所支持的语音指令。
这样,第二智能设备主动将可共享的离线语音识别功能的信息(即上述关键信息)进行广播,而其它智能设备(比如第一智能设备)会在发起语音识别流程时,共享第二智能设备的离线语音识别功能,在尽可能地节省用户使用的智能设备的资源的同时,能将智能设备的资源使用效率最大化。
以下以一个具体的应用实例来说明本发明实施例中的语音识别方法,本实施例中,第一智能设备是智能空调或智能冰箱等无离线语音识别功能的设备,具有离线语音识别功能的第二智能设备可以是智能音响或机器人等设备,本实施例的方法主要包括两个部分:
(一)如图4所示,第一智能设备可以通过如下步骤储存具有离线语音识别功能的第二智能设备的信息:
步骤301,第二智能设备主动发送广播消息,在广播消息中携带第二智能设备的关键信息,该关键信息中可以包括:第二智能设备的设备类型、设备名称、用于标识第二智能设备具有离线语音识别功能的信息、支持离线语音识别的语种以及在离线语音识别过程中使用的协议信息,包括协议类型、协议名称、协议的数据格式、协议的版本、最低兼容协议版本及对接的IP和端口等。
步骤302,与第二智能设备在同一局域网内的第一智能设备会监听到第二智能设备发送的广播消息,并解析到其中携带的关键信息。
本实施例中,第一智能设备与第二智能设备处于同一局域网内,这样,第二智能设备可以发送用户数据报协议(User Datagram Protocol,UDP)的广播消息,这样广播消息会转发给局域网内的所有其它设备,包括第一智能设备。
步骤303,第一智能设备会将关键信息中的协议信息与第一智能设备的语音指令对应的协议信息进行匹配,如果相一致,则继续执行步骤304;如果不一致,则结束流程。
其中,在对协议信息进行匹配时,可以按照但不限于如下几个方面进行匹配,具体地:
(1)协议类型的匹配:
将第二智能设备的关键信息中包括的协议类型,比如传输控制协议(Transmission Control Protocol,TCP)或UDP类型,与第一智能设备传输语音指令时的协议类型进行匹配,需要协议类型一致。
(2)协议的数据格式的匹配:
将第二智能设备的关键信息中包括的协议的数据格式,与第一智能设备传输语音指令时使用协议的数据格式进行匹配,需要协议的数据格式一致。
(3)协议版本的匹配:
将第二智能设备的关键信息中包括的协议版本,与第一智能设备传输语音指令时使用协议的版本进行匹配,需要协议版本一致,或者第一智能设备和第二智能设备中任一智能设备对应的协议版本能兼容另一智能设备对应的协议版本。
步骤304,第一智能设备会将关键信息中的语种信息与第一智能设备的语音指令对应的语种信息进行匹配,如果相一致,则继续执行步骤305;如果不一致,结束流程。
一般情况下,不同语种(比如英语、普通话或粤语等)对应的语音识别模型是分开训练的,如果第二智能设备中预置的语音识别模型可以识别的语音指令的语种信息,与第一智能设备发送的语音指令的语种信息不一致时,第二智能设备对第一智能设备发送的语音指令的识别不是很准确,因此,为了识别的准确性,第一智能设备需要进行语种信息的匹配,当匹配一致时,才会在第一智能设备与第二智能设备之间共享第二智能设备的离线语音识别功能。
步骤305,第一智能设备会与第二智能设备之间建立通信连接,比如建立基于传输控制协议(Transmission Control Protocol,TCP)或UDP的通信连接。
步骤306,第二智能设备将其可支持指令集通过上述通信连接发送给第一智能设备。
步骤307,第一智能设备会根据接收的可支持指令集,确定第二智能设备通过离线语音识别功能可识别的语音指令与第二智能设备的语音指令之间是否有交集,如果有交集,则储存第二智能设备的信息;如果没有交集,则结束流程。
具体地,第一智能设备接收的可支持指令集1中可以包括多个语音指令,这样,第一智能设备在判定是否有交集时,可以先确定第一智能设备的语音指令集2,并基于快速排序算法分别对第二智能设备的可支持指令集1中的语音指令及第一智能设备的语音指令集2进行字符串排序,即将语音指令按照字符串从小到大的顺序排列,然后在对各个指令集进行之后的处理过程中,可以按照该排列顺序进行逐一处理,具体地:
针对可支持指令集1,从其中取一个语音指令1,并可以按照二分搜索法在另一语音指令集2中进行搜索,如果搜索到与之前取出的一个语音指令1相匹配的语音指令,则可支持指令集1与语音指令集2之间有交集;如果未搜索到与之前取出的一个语音指令1相匹配的语音指令,则从可支持指令集1中再取另一语音指令2,并在另一语音指令集2中进行搜索,如此循环操作,直到可支持指令集1中的所有语音指令都被取出并执行相应搜索为止,如果可支持指令集1中任一语音指令与另一语音指令集2中的语音指令都不相匹配,则可支持指令集1与语音指令集2之间无交集。
(二)如图5所示,第一智能设备可以通过如下步骤共享第二智能设备的离线语音识别功能:
步骤401,用户向第一智能设备输入语音指令。
步骤402,第一智能设备获取用户输入的语音指令,判断第一智能设备的在线语音识别是否满足第一预置条件,如果满足,继续执行步骤403;如果不满足,第一智能设备会通过在线语音识别方式,将语音指令发送给后台,请求后台进行语音指令的识别。其中预置条件见上述实施例中所述,在此不进行赘述。
步骤403,第一智能设备确定第二智能设备,将语音指令发送给确定的第二智能设备;同时第一智能设备还可以将语音指令发送给后台,请求后台进行语音指令的识别。
步骤404,第二智能设备接收到语音指令后,调用预置的语音识别模型,对语音指令进行识别得到设备操作信息,返回给第一智能设备。
步骤405,第一智能设备接收到第二智能设备返回的设备操作信息,进行相应操作。
可见,本发明实施例的方法中,能让局域网内需要使用语音识别的第一智能设备和具有离线语音识别功能的第二智能设备通过统一协议互相发现,并共享第二智能设备的离线语音识别功能,快速得到语音识别的结果,即设备操作信息,提升用户语音交互体验。
以下以另一具体的应用实例来说明本发明中智能设备的语音识别方法,本发明实施例中的智能设备主要为分布式系统100,该分布式系统可以包括客户端300及多个节点200(接入网络中的任意形式的计算设备,如服务器、用户终端),客户端300与节点200之间通过网络通信的形式连接。
以分布式系统为区块链系统为例,参见图6是本发明实施例提供的分布式系统100应用于区块链系统的一个可选的结构示意图,由多个节点200(接入网络中的任意形式的计算设备,如服务器、用户终端)和客户端300形成,节点之间形成组成的点对点(P2P,Peer ToPeer)网络,P2P协议是一个运行在传输控制协议(TCP,Transmission Control Protocol)协议之上的应用层协议。在分布式系统中,任何机器如服务器、终端都可以加入而成为节点,节点包括硬件层、中间层、操作系统层和应用层。
参见图6示出的区块链系统中各节点的功能,涉及的功能包括:
1)路由,节点具有的基本功能,用于支持节点之间的通信。
节点除具有路由功能外,还可以具有以下功能:
2)应用,用于部署在区块链中,根据实际业务需求而实现特定业务,记录实现功能相关的数据形成记录数据,在记录数据中携带数字签名以表示任务数据的来源,将记录数据发送到区块链系统中的其它节点,供其它节点在验证记录数据来源以及完整性成功时,将记录数据添加到临时区块中。
例如,应用实现的业务还包括实现智能设备的语音识别功能的代码,该智能设备的语音识别功能主要包括:
接收用户输入所述第一智能设备的语音指令;确定识别所述语音指令的第二智能设备,所述第二智能设备具有离线语音识别功能,其识别的语音指令与所述第一智能设备的语音指令有交集;将所述语音指令发送给所述第二智能设备,以便所述第二智能设备通过离线语音识别功能识别所述语音指令对应的设备操作信息;接收所述第二智能设备返回的所述设备操作信息,根据所述设备操作信息进行相应操作。
或者,该智能设备的语音识别功能主要包括:
接收第一智能设备发送的语音指令;调用预置的语音识别模型,及根据预置的语音识别模型对所述语音指令进行识别,得到设备操作信息;将所述设备操作信息发送给所述第一智能设备,以便所述第一智能设备根据所述设备操作信息进行相应操作。
3)区块链,包括一系列按照产生的先后时间顺序相互接续的区块(Block),新区块一旦加入到区块链中就不会再被移除,区块中记录了区块链系统中节点提交的记录数据。
参见图7为本发明实施例提供的区块结构(Block Structure)一个可选的示意图,每个区块中包括本区块存储交易记录的哈希值(本区块的哈希值)、以及前一区块的哈希值,各区块通过哈希值连接形成区块链。另外,区块中还可以包括有区块生成时的时间戳等信息。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了相关的信息,用于验证其信息的有效性(防伪)和生成下一个区块。
本发明实施例还提供一种智能设备,比如上述的第一智能设备,其结构示意图如图8所示,具体可以包括:
用户指令接收单元10,用于接收用户输入所述智能设备的语音指令。
设备确定单元11,用于确定识别所述语音指令的第二智能设备,所述第二智能设备具有离线语音识别功能,其识别的语音指令与所述智能设备的语音指令有交集。
具体地,如果本实施例的智能设备是无离线语音识别功能的设备,该设备确定单元11,具体用于当所述智能设备的在线语音识别满足第一预置条件时,确定识别所述语音指令的第二智能设备;其中,所述第一预置条件包括如下任一条件:在预设时间段内所述智能设备的在线语音识别失败的次数超过某一预置次数,在预设时间段内所述智能设备的在线语音识别的平均响应时间超过某一预置时间。
指令发送单元12,用于将所述用户指令接收单元10接收的语音指令发送给所述设备确定单元11确定的第二智能设备,以便所述第二智能设备通过离线语音识别功能识别所述语音指令对应的设备操作信息。
操作接收单元13,用于接收所述第二智能设备返回的所述设备操作信息,根据所述设备操作信息进行相应操作。
进一步地,本实施例的智能设备还可以包括:
关键信息单元14,用于获取所述第二智能设备发送的关键信息,所述关键信息中包括:用于标识所述第二智能设备具有离线语音识别功能的信息;
指令集单元15,用于根据所述关键信息单元14获取的关键信息,与所述第二智能设备之间建立通信连接;通过所述通信连接接收所述第二智能设备发送的可支持指令集,所述可支持指令集用于描述所述第二智能设备的离线语音识别功能所支持的语音指令;
储存单元16,用于当根据所述指令集单元15接收的可支持指令集确定所述第二智能设备所支持的语音指令与所述智能设备的语音指令有交集时,储存所述第二智能设备的信息。则上述设备确定单元11会根据储存单元16储存的信息来确定第二智能设备。
进一步地,上述所述关键信息还包括:所述第二智能设备在共享离线语音识别过程中使用的协议信息,所述协议信息包括如下至少一个信息:数据格式和协议版本;则指令集单元15,还用于确定所述关键信息中包括的协议信息与所述智能设备的语音指令对应的协议信息是否一致,如果一致,则执行所述与所述第二智能设备之间建立通信连接的步骤。
进一步地,所述关键信息还包括:离线语音识别的语种信息;则所述指令集单元15,还用于确定所述关键信息中包括的语种信息与所述智能设备的语音指令对应的语种信息是否一致,如果一致,则执行所述与所述第二智能设备之间建立通信连接的步骤。
在本实施例的智能设备在发起语音控制时,用户指令接收单元10接收用户输入的语音指令,并共享第二智能设备的离线语音识别功能,即通过指令发送单元12将语音指令发送给第二智能设备,由第二智能设备通过离线语音识别功能对语音指令进行识别,并返回识别结果即设备操作信息给本实施例的智能设备。这样,可以不需要在每个智能设备中都部署离线的语音识别功能,而对某些第二智能设备中的离线语音识别功能进行共享,尽可能地节省了用户使用的智能设备的资源,且能将智能设备的资源使用效率最大化。
本发明实施例还提供一种智能设备,比如上述的第二智能设备,该智能设备具有离线语音识别功能,其结构示意图如图9所示,具体可以包括:
指令接收单元20,用于接收第一智能设备发送的语音指令;
语音识别单元21,用于当所述指令接收单元20接收到语音指令后,调用预置的语音识别模型,及根据预置的语音识别模型对所述语音指令进行识别,得到设备操作信息;
操作发送单元22,用于将所述语音识别单元21得到的设备操作信息发送给所述第一智能设备,以便所述第一智能设备根据所述设备操作信息进行相应操作。
进一步地,本实施例的智能设备还可以包括:
关键信息发送单元23,用于发送本实施例的智能设备的关键信息;所述关键信息中包括:用于标识所述智能设备具有离线语音识别功能的信息;
指令集发送单元24,用于与所述第一智能设备之间建立通信连接;通过所述通信连接将所述智能设备的可支持指令集发送给所述第一智能设备,所述可支持指令集用于描述所述智能设备的离线语音识别功能所支持的语音指令,以便所述第一智能设备在确定所述智能设备所支持的语音指令与所述第一智能设备的语音指令有交集时,储存所述智能设备的信息。
这样,本实施例的智能设备主动将可共享的离线语音识别功能的信息(即上述关键信息)进行广播,而其它智能设备(比如第一智能设备)会在发起语音识别流程时,共享本实施例的智能设备的离线语音识别功能,在尽可能地节省用户使用的智能设备的资源的同时,能将智能设备的资源使用效率最大化。
本发明实施例还提供一种终端设备,其结构示意图如图10所示,该终端设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(centralprocessing units,CPU)30(例如,一个或一个以上处理器)和存储器31,一个或一个以上存储应用程序321或数据322的存储介质32(例如一个或一个以上海量存储设备)。其中,存储器31和存储介质32可以是短暂存储或持久存储。存储在存储介质32的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对终端设备中的一系列指令操作。更进一步地,中央处理器30可以设置为与存储介质32通信,在终端设备上执行存储介质32中的一系列指令操作。
具体地,在存储介质32中储存的应用程序321包括智能设备的语音识别的应用程序,且该程序可以包括上述智能设备中的用户指令接收单元10,设备确定单元11,指令发送单元12,操作接收单元13,关键信息单元14,指令集单元15和储存单元16,在此不进行赘述。更进一步地,中央处理器30可以设置为与存储介质32通信,在终端设备上执行存储介质32中储存的智能设备的语音识别的应用程序对应的一系列操作。
终端设备还可以包括一个或一个以上电源33,一个或一个以上有线或无线网络接口34,一个或一个以上输入输出接口35,和/或,一个或一个以上操作系统323,例如WindowsServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述方法实施例中所述的由上述第一智能设备所执行的步骤可以基于该图10所示的终端设备的结构。
本发明实施例还提供另一种终端设备,其结构与上述图10所示的终端设备的结构类似,不同的是,本实施例的终端设备中,在存储介质中储存的应用程序包括智能设备的语音识别的应用程序,且该程序可以包括上述智能设备中的指令接收单元20,语音识别单元21,操作发送单元22,关键信息发送单元23和指令集发送单元24,在此不进行赘述。更进一步地,中央处理器可以设置为与存储介质通信,在终端设备上执行存储介质中储存的智能设备的语音识别的应用程序对应的一系列操作。而上述方法实施例中所述的由上述第二智能设备所执行的步骤可以基于本实施例中终端设备的结构。
本发明实施例另一方面还提供一种计算机可读存储介质,所述计算机可读存储介质储存多个计算机程序,所述计算机程序适于由处理器加载并执行如上述第一智能设备或第二智能设备所执行的智能设备的语音识别方法。
本发明实施例另一方面还提供一种终端设备,包括处理器和存储器;
所述存储器用于储存多个计算机程序,所述计算机程序用于由处理器加载并执行如上述第一智能设备或第二智能设备所执行的智能设备的语音识别方法;所述处理器,用于实现所述多个计算机程序中的各个计算机程序。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM)、随机存取存储器(RAM)、磁盘或光盘等。
以上对本发明实施例所提供的智能设备的语音识别方法、系统及存储介质和终端设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (11)

1.一种智能设备的语音识别方法,其特征在于,应用于第一智能设备,所述方法包括:
接收用户输入所述第一智能设备的语音指令;
确定识别所述语音指令的第二智能设备,所述第二智能设备具有离线语音识别功能,其识别的语音指令与所述第一智能设备的语音指令有交集;
将所述语音指令发送给所述第二智能设备,以便所述第二智能设备通过离线语音识别功能识别所述语音指令对应的设备操作信息;
接收所述第二智能设备返回的所述设备操作信息,根据所述设备操作信息进行相应操作。
2.如权利要求1所述的方法,其特征在于,所述确定识别所述语音指令的第二智能设备之前,所述方法还包括:
获取所述第二智能设备发送的关键信息,所述关键信息中包括:用于标识所述第二智能设备具有离线语音识别功能的信息;
根据所述关键信息,与所述第二智能设备之间建立通信连接;
通过所述通信连接接收所述第二智能设备发送的可支持指令集,所述可支持指令集用于描述所述第二智能设备的离线语音识别功能所支持的语音指令;
当根据所述可支持指令集确定所述第二智能设备所支持的语音指令与所述第一智能设备的语音指令有交集时,储存所述第二智能设备的信息。
3.如权利要求2所述的方法,其特征在于,所述关键信息还包括:所述第二智能设备在共享离线语音识别过程中使用的协议信息,所述协议信息包括如下至少一个信息:数据格式和协议版本;
则所述根据所述关键信息,与所述第二智能设备之间建立通信连接之前,还包括:
确定所述关键信息中包括的协议信息与所述第一智能设备的语音指令对应的协议信息是否一致,如果一致,则执行所述与所述第二智能设备之间建立通信连接的步骤。
4.如权利要求2所述的方法,其特征在于,所述关键信息还包括:离线语音识别的语种信息;
则所述根据所述关键信息,与所述第二智能设备之间建立通信连接之前,还包括:
确定所述关键信息中包括的语种信息与所述第一智能设备的语音指令对应的语种信息是否一致,如果一致,则执行所述与所述第二智能设备之间建立通信连接的步骤。
5.如权利要求1至4任一项所述的方法,其特征在于,所述确定识别所述语音指令的第二智能设备,具体包括:
当所述第一智能设备的在线语音识别满足第一预置条件时,确定识别所述语音指令的第二智能设备;
其中,所述第一预置条件包括如下任一条件:在预设时间段内所述第一智能设备的在线语音识别失败的次数超过某一预置次数,在预设时间段内所述第一智能设备的在线语音识别的平均响应时间超过某一预置时间。
6.一种智能设备的语音识别方法,其特征在于,应用于具有离线语音识别功能的第二智能设备,所述方法包括:
接收第一智能设备发送的语音指令;
调用预置的语音识别模型,及根据预置的语音识别模型对所述语音指令进行识别,得到设备操作信息;
将所述设备操作信息发送给所述第一智能设备,以便所述第一智能设备根据所述设备操作信息进行相应操作。
7.如权利要求6所述的方法,其特征在于,所述接收第一智能设备发送的语音指令之前,所述方法还包括:
发送所述第二智能设备的关键信息;所述关键信息中包括:用于标识所述第二智能设备具有离线语音识别功能的信息;
与所述第一智能设备之间建立通信连接;
通过所述通信连接将所述第二智能设备的可支持指令集发送给所述第一智能设备,所述可支持指令集用于描述所述第二智能设备的离线语音识别功能所支持的语音指令,以便所述第一智能设备在确定所述第二智能设备所支持的语音指令与所述第一智能设备的语音指令有交集时,储存所述第二智能设备的信息。
8.一种智能设备,其特征在于,包括:
用户指令接收单元,用于接收用户输入所述智能设备的语音指令;
设备确定单元,用于确定识别所述语音指令的第二智能设备,所述第二智能设备具有离线语音识别功能,其识别的语音指令与所述智能设备的语音指令有交集;
指令发送单元,用于将所述语音指令发送给所述第二智能设备,以便所述第二智能设备通过离线语音识别功能识别所述语音指令对应的设备操作信息;
操作接收单元,用于接收所述第二智能设备返回的所述设备操作信息,根据所述设备操作信息进行相应操作。
9.一种智能设备,其特征在于,所述智能设备具有离线语音识别功能,包括:
指令接收单元,用于接收第一智能设备发送的语音指令;
语音识别单元,用于调用预置的语音识别模型,及根据预置的语音识别模型对所述语音指令进行识别,得到设备操作信息;
操作发送单元,用于将所述设备操作信息发送给所述第一智能设备,以便所述第一智能设备根据所述设备操作信息进行相应操作。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质储存多个计算机程序,所述计算机程序适于由处理器加载并执行如权利要求1至7任一项所述的智能设备的语音识别方法。
11.一种终端设备,其特征在于,包括处理器和存储器;
所述存储器用于储存多个计算机程序,所述计算机程序用于由处理器加载并执行如权利要求1至7任一项所述的智能设备的语音识别方法;所述处理器,用于实现所述多个计算机程序中的各个计算机程序。
CN202110674062.0A 2021-06-17 2021-06-17 智能设备的语音识别方法、系统及存储介质和终端设备 Pending CN113488038A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110674062.0A CN113488038A (zh) 2021-06-17 2021-06-17 智能设备的语音识别方法、系统及存储介质和终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110674062.0A CN113488038A (zh) 2021-06-17 2021-06-17 智能设备的语音识别方法、系统及存储介质和终端设备

Publications (1)

Publication Number Publication Date
CN113488038A true CN113488038A (zh) 2021-10-08

Family

ID=77935461

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110674062.0A Pending CN113488038A (zh) 2021-06-17 2021-06-17 智能设备的语音识别方法、系统及存储介质和终端设备

Country Status (1)

Country Link
CN (1) CN113488038A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107622771A (zh) * 2017-09-30 2018-01-23 广东美的制冷设备有限公司 家电设备及其控制方法、系统及计算机可读存储介质
CN108510984A (zh) * 2017-02-24 2018-09-07 九阳股份有限公司 一种智能家电设备的语音协同控制方法
CN109495360A (zh) * 2018-12-18 2019-03-19 深圳国美云智科技有限公司 一种智能家居物联平台、离线语音控制方法及系统
CN111694605A (zh) * 2020-05-18 2020-09-22 Oppo广东移动通信有限公司 语音信息处理方法及装置、存储介质和电子设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108510984A (zh) * 2017-02-24 2018-09-07 九阳股份有限公司 一种智能家电设备的语音协同控制方法
CN107622771A (zh) * 2017-09-30 2018-01-23 广东美的制冷设备有限公司 家电设备及其控制方法、系统及计算机可读存储介质
CN109495360A (zh) * 2018-12-18 2019-03-19 深圳国美云智科技有限公司 一种智能家居物联平台、离线语音控制方法及系统
CN111694605A (zh) * 2020-05-18 2020-09-22 Oppo广东移动通信有限公司 语音信息处理方法及装置、存储介质和电子设备

Similar Documents

Publication Publication Date Title
US20220197953A1 (en) Model pushing method and device, model requesting method and device, storage medium and electronic device
CN112988485B (zh) 电力物联网设备模拟测试方法及装置
CN111708702A (zh) 模拟测试方法、客户端、服务端、系统与可读存储介质
CN106713391B (zh) 一种session信息的共享方法和共享系统
CN111600936A (zh) 一种适用于泛在电力物联网边缘终端的基于多容器的非对称处理系统
US11956118B2 (en) Fault root cause identification method, apparatus, and device
Gagné et al. Distributed beagle: An environment for parallel and distributed evolutionary computations
TW201419809A (zh) 一種具高度適應性交談管理機制之遠端管理系統
CN114024972A (zh) 一种长连接通信方法、系统、装置、设备及存储介质
CN113630418B (zh) 一种网络服务识别方法、装置、设备及介质
CN108287859B (zh) 一种多媒体信息检索方法及装置
CN110995489B (zh) 大数据平台服务器管理方法、装置、服务器及存储介质
CN111010444B (zh) 一种实现Wowza流媒体引擎分布式集群的系统及方法
CN113488038A (zh) 智能设备的语音识别方法、系统及存储介质和终端设备
US7543300B2 (en) Interface for application components
Hine et al. Scalable emulation of enterprise systems
CN109582841A (zh) 一种应用识别方法、装置、服务器及存储介质
Manju Bala et al. Blockchain-based iot architecture for software-defined networking
CN114358776A (zh) 基于fisco bcos与ipfs的物联网溯源方法、及其相关设备
CN112766486A (zh) 神经网络结构的搜索方法、终端、服务器及可读存储介质
CN108055305B (zh) 一种存储扩展方法及存储扩展装置
CN107342942B (zh) 一种多节点控制器集群的信息传输方法及装置
CN113593557B (zh) 分布式会话方法、装置、计算机设备及存储介质
CN113132233B (zh) 数据处理方法、软件定义网络控制器和数据处理系统
CN115665210B (zh) 一种用户问题处理方法、用户问题处理装置及客服系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination