CN105405442A - 语音的识别方法、装置和设备 - Google Patents

语音的识别方法、装置和设备 Download PDF

Info

Publication number
CN105405442A
CN105405442A CN201510713592.6A CN201510713592A CN105405442A CN 105405442 A CN105405442 A CN 105405442A CN 201510713592 A CN201510713592 A CN 201510713592A CN 105405442 A CN105405442 A CN 105405442A
Authority
CN
China
Prior art keywords
speech data
mapping relations
infrared
terminal equipment
identification information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510713592.6A
Other languages
English (en)
Other versions
CN105405442B (zh
Inventor
高斯太
唐沐
侯恩星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Technology Co Ltd
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Priority to CN201510713592.6A priority Critical patent/CN105405442B/zh
Publication of CN105405442A publication Critical patent/CN105405442A/zh
Application granted granted Critical
Publication of CN105405442B publication Critical patent/CN105405442B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B15/00Systems controlled by a computer
    • G05B15/02Systems controlled by a computer electric

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Telephonic Communication Services (AREA)
  • Selective Calling Equipment (AREA)

Abstract

本公开是关于一种语音的识别方法、装置和设备,该方法包括:采集语音数据;将所述语音数据转换为控制指令,所述控制指令携带有控制动作信息及目标终端设备的标识信息;向所述目标终端设备发送所述控制指令,以使得所述目标终端设备执行所述控制动作。本公开可以提高语音识别系统的可靠性。

Description

语音的识别方法、装置和设备
技术领域
本公开涉及终端设备领域,尤其涉及语音的识别方法、装置和设备。
背景技术
随着信息技术的快速发展,通过遥控器对家居设备进行语音遥控已成为一种非常流行的生活模式。
相关技术中,通过遥控器对家居设备进行语音遥控时,通常需要将采集到的语音数据通过无线网络发送到服务器,服务器进行语音数据的识别后,再将识别的结果返回到遥控器,以实现对家居设备的语音遥控。然而,由于遥控器需要将语音数据发送到服务器进行语音识别,这需要依赖良好的网络环境,如果一旦出现网络不畅的现象,则将造成整个遥控过程失败,从而使得系统的可靠性较低。
发明内容
为克服相关技术中存在的问题,本公开提供一种语音的识别方法、装置和设备。
根据本公开实施例的第一方面,提供一种语音的识别方法,包括:
采集语音数据;
将所述语音数据转换为控制指令,所述控制指令携带有控制动作信息及目标终端设备的标识信息;
向所述目标终端设备发送所述控制指令,以使得所述目标终端设备执行所述控制动作。
结合第一方面,在第一方面的第一种可能的实现方式中,所述将所述语音数据转换为控制指令,包括:
根据所述语音数据,查询所述语音数据与红外控制编码之间的映射关系,获得与所述语音数据对应的目标红外控制编码,将所述目标红外控制编码对应终端设备的标识信息作为目标终端设备的标识信息;根据所述语音数据,查询所述语音数据与控制动作信息之间的映射关系,获得与所述语音数据对应的控制动作信息。
结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,所述根据所述语音数据,查询所述语音数据与红外控制编码之间的映射关系,获得与所述语音数据对应的目标红外控制编码,将所述目标红外控制编码对应终端设备的标识信息作为目标终端设备的标识信息,包括:
根据所述语音数据,查询所述语音数据与红外控制编码之间的映射关系,获得与所述语音数据对应的目标红外控制编码;
若目标红外控制编码的数量为多个,则将优先级最高的目标红外控制编码对应的终端设备的标识信息作为目标终端设备的标识信息。
结合第一方面的第一种可能的实现方式,在第一方面的第三种可能的实现方式中,所述根据所述语音数据,查询所述语音数据与红外控制编码之间的映射关系,获得与所述语音数据对应的目标红外控制编码,将所述目标红外控制编码对应终端设备的标识信息作为目标终端设备的标识信息,包括:
根据所述语音数据,查询所述语音数据与红外控制编码的映射关系,获得与所述语音数据对应的目标红外控制编码;
若目标红外控制编码的数量为多个,则将时间戳最早的目标红外控制编码对应的终端设备的标识信息作为目标终端设备的标识信息。
结合第一方面的第一种可能的实现方式,在第一方面的第四种可能的实现方式中,所述根据所述语音数据,查询所述语音数据与红外控制编码之间的映射关系,获得与所述语音数据对应的目标红外控制编码,将所述目标红外控制编码对应终端设备的标识信息作为目标终端设备的标识信息,包括:
根据所述语音数据,查询所述语音数据与红外控制编码的映射关系,获得与所述语音数据对应的目标红外控制编码;
若目标红外控制编码的数量为多个,则将所有目标红外控制编码分别对应的终端设备的标识信息均作为目标终端设备的标识信息。
结合第一方面,在第一方面的第五种可能的实现方式中,所述将所述语音数据转换为控制指令之前,所述方法还包括:
根据所述语音数据,查询预先存储的与所述语音数据相关的映射关系;其中,所述映射关系包括如下一种或者几种:语音数据与红外控制编码之间的映射关系,语音数据与控制动作信息之间的映射关系。
结合第一方面,在第一方面的第六种可能的实现方式中,所述将所述语音数据转换为控制指令之前,所述方法还包括:
与移动终端建立无线连接;
在采集到语音数据时,向所述移动终端发送请求消息;
接收所述移动终端根据所述请求消息发送的与所述语音数据相关的映射关系;其中,所述映射关系包括如下一种或者几种:语音数据与红外控制编码之间的映射关系,语音数据与控制动作信息之间的映射关系;
根据所述语音数据,查询所述与所述语音数据相关的映射关系;
删除所述与所述语音数据相关的映射关系。
根据本公开实施例的第二方面,提供一种语音的识别装置,包括:
采集模块,用于采集语音数据;
转换模块,用于将所述采集模块采集的所述语音数据转换为控制指令,所述控制指令携带有控制动作信息及目标终端设备的标识信息;
第一发送模块,用于向所述目标终端设备发送所述转换模块转换得到的所述控制指令,以使得所述目标终端设备执行所述控制动作。
结合第二方面,在第二方面的第一种可能的实现方式中,所述转换模块包括:第一查询子模块和第二查询子模块;
所述第一查询子模块,用于根据所述采集模块采集的所述语音数据,查询所述语音数据与红外控制编码之间的映射关系,获得与所述语音数据对应的目标红外控制编码,将所述目标红外控制编码对应终端设备的标识信息作为目标终端设备的标识信息;
第二查询子模块,用于根据所述采集模块采集的所述语音数据,查询所述语音数据与控制动作信息之间的映射关系,获得与所述语音数据对应的控制动作信息。
结合第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中,所述第一查询子模块包括:第一查询单元和第一选择单元;
所述第一查询单元,用于根据所述语音数据,查询所述语音数据与红外控制编码之间的映射关系,获得与所述语音数据对应的目标红外控制编码;
所述第一选择单元,用于在所述第一查询单元查询的目标红外控制编码的数量为多个时,将优先级最高的目标红外控制编码对应的终端设备的标识信息作为目标终端设备的标识信息。
结合第二方面的第一种可能的实现方式,在第二方面的第三种可能的实现方式中,所述第一查询子模块包括:第二查询单元和第二选择单元;
所述第二查询单元,用于根据所述语音数据,查询所述语音数据与红外控制编码的映射关系,获得与所述语音数据对应的目标红外控制编码;
所述第二选择单元,用于在所述第二查询单元查询的目标红外控制编码的数量为多个时,将时间戳最早的目标红外控制编码对应的终端设备的标识信息作为目标终端设备的标识信息。
结合第二方面的第一种可能的实现方式,在第二方面的第四种可能的实现方式中,所述第一查询子模块包括:第三查询单元和第三选择单元;
所述第三查询单元,用于根据所述语音数据,查询所述语音数据与红外控制编码的映射关系,获得与所述语音数据对应的目标红外控制编码;
所述第三选择单元,用于在所述第三查询单元查询的目标红外控制编码的数量为多个时,将所有目标红外控制编码分别对应的终端设备的标识信息均作为目标终端设备的标识信息。
结合第二方面,在第二方面的第五种可能的实现方式中,所述装置还包括:第一查询模块;
所述第一查询模块,用于根据所述采集模块采集的所述语音数据,查询预先存储的与所述语音数据相关的映射关系;其中,所述映射关系包括如下一种或者几种:语音数据与红外控制编码之间的映射关系,语音数据与控制动作信息之间的映射关系。
结合第二方面,在第二方面的第六种可能的实现方式中,所述装置还包括:建立模块、第二发送模块、接收模块、第二查询模块和删除模块;
所述建立模块,用于与移动终端建立无线连接;
所述第二发送模块,用于在所述建立模块建立与所述移动终端之间的无线连接,并在所述采集模块采集到所述语音数据时,向所述移动终端发送请求消息;
所述接收模块,用于接收所述移动终端根据所述请求消息发送的与所述语音数据相关的映射关系;其中,所述映射关系包括如下一种或者几种:语音数据与红外控制编码之间的映射关系,语音数据与控制动作信息之间的映射关系;
所述第二查询模块,用于根据所述语音数据,查询所述接收模块接收的所述与所述语音数据相关的映射关系;
所述删除模块,用于删除所述第二查询模块查询的所述与所述语音数据相关的映射关系。
根据本公开实施例的第三方面,提供一种语音的识别装置,包括:
存储器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
采集语音数据;
将所述语音数据转换为控制指令,所述控制指令携带有控制动作信息及目标终端设备的标识信息;
向所述目标终端设备发送所述控制指令,以使得所述目标终端设备执行所述控制动作。
本公开的实施例提供的技术方案可以包括以下有益效果:
通过采集语音数据,将该语音数据转换为控制指令,该控制指令携带有控制动作信息及目标终端设备的标识信息,并向目标终端设备发送控制指令,以使得目标终端设备执行控制动作。由于遥控器在采集到语音数据之后,可以直接将该语音数据转换为控制指令,从而使得目标终端设备执行控制指令中的控制动作,这样,可以避免相关技术中由于需要对语音数据进行识别,使得识别过程依赖网络环境的现象,因此,提高了语音识别系统的可靠性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种语音的识别方法的流程图;
图2是根据另一示例性实施例示出的一种语音的识别方法的流程图;
图3是根据又一示例性实施例示出的一种语音的识别方法的流程图;
图4是根据再一示例性实施例示出的一种语音的识别方法的流程图;
图5是根据一示例性实施例示出的一种语音的识别装置的框图;
图6是根据另一示例性实施例示出的一种语音的识别装置的框图;
图7是根据又一示例性实施例示出的一种语音的识别装置的框图;
图8是根据再一示例性实施例示出的一种语音的识别装置的框图;
图9是根据再一示例性实施例示出的一种语音的识别装置的框图;
图10是根据再一示例性实施例示出的一种语音的识别装置的框图;
图11是根据再一示例性实施例示出的一种语音的识别装置的框图;
图12是根据再一示例性实施例示出的一种语音的识别装置的框图
图13是根据一示例性实施例示出的一种用于语音的识别装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种语音的识别方法的流程图,如图1所示,本实施例涉及的语音的识别方法用于遥控器中,该语音的识别方法包括以下步骤。
在步骤S11中,采集语音数据。
在本公开实施例中,可以在遥控器中安装麦克风,以采集语音数据,当然,也可以采用其他方式采集语音数据,对于采集语音数据的具体形式,本实施例在此不作限制。
在步骤S12中,将所述语音数据转换为控制指令。
其中,控制指令携带有控制动作信息及目标终端设备的标识信息。在本公开实施例中,在采集到语音数据之后,遥控器通过查询语音数据与控制指令之间的对应关系,即可获得语音数据对应的控制指令。其中,该控制指令中携带有控制动作信息及目标终端设备的标识信息。举例来说,若遥控器通过转换获得的控制指令为“打开电视”,则控制动作信息为“打开”,而目标终端设备的标识信息为“电视”。
在步骤S13中,向所述目标终端设备发送所述控制指令,以使得所述目标终端设备执行所述控制动作。
在本公开实施例中,遥控器在获得控制指令之后,将该控制指令发送给目标终端设备,目标终端设备根据接收到的控制指令,执行控制指令中的控制动作。例如:获得的控制指令若为“打开电视”,则遥控器会将“打开电视”这一控制指令发送给电视,电视根据接收到的控制指令,将执行“打开”这一动作。
本实施例的语音的识别方法,通过采集语音数据,将该语音数据转换为控制指令,该控制指令携带有控制动作信息及目标终端设备的标识信息,并向目标终端设备发送控制指令,以使得目标终端设备执行控制动作。由于遥控器在采集到语音数据之后,可以直接将该语音数据转换为控制指令,从而使得目标终端设备执行控制指令中的控制动作,这样,可以避免相关技术中由于需要对语音数据进行识别,使得识别过程依赖网络环境的现象,因此,提高了语音识别系统的可靠性。
图2是根据另一示例性实施例示出的一种语音的识别方法的流程图,该方法用于遥控器中,本实施例在图1所示实施例的基础上,对将语音数据转换为控制指令的实施例,作详细说明,如图2所示,该语音的识别方法包括以下步骤。
在步骤S21中,采集语音数据。
在步骤S22中,根据所述语音数据,查询所述语音数据与红外控制编码之间的映射关系,获得与所述语音数据对应的目标红外控制编码,将所述目标红外控制编码对应终端设备的标识信息作为目标终端设备的标识信息;根据所述语音数据,查询所述语音数据与控制动作信息之间的映射关系,获得与所述语音数据对应的控制动作信息。
在本公开实施例中,每一终端设备都有其对应的控制该终端设备的红外控制编码,也就是说,遥控器要实现对某一终端设备的遥控,需要预先存储有控制该终端设备的红外控制编码。当遥控器采集到语音数据之后,则根据语音数据,查询语音数据与红外控制编码之间的映射关系,获得与语音数据对应的目标红外控制编码,并将目标红外控制编码对应终端设备的标识信息作为目标终端设备的标识信息。举例来说,若遥控器采集到的语音数据为“打开电视”,则通过查询语音数据与红外控制编码之间的映射关系,找到控制语音数据中的“电视”的目标红外控制编码,并将获得的该目标红外控制编码对应的终端设备“电视”的标识信息作为目标终端设备的标识信息。
其中,若遥控器获得的目标红外控制编码为多个时,确定目标终端设备的标识信息的方式可以包括以下几种:
第一种:根据语音数据,查询语音数据与红外控制编码之间的映射关系,获得与语音数据对应的目标红外控制编码,若目标红外控制编码的数量为多个,则将优先级最高的目标红外控制编码对应的终端设备的标识信息作为目标终端设备的标识信息。
具体地,若遥控器通过查询获得的与语音数据对应的目标红外控制编码的数量为多个时,例如包括至少两个时,可以根据目标红外控制编码的优先级顺序,选择优先级最高的目标红外控制编码对应的终端设备的标识信息作为目标终端设备的标识信息。举例来说,若遥控器获得的目标红外控制编码为两个,分别是控制海尔电视的红外控制编码和控制三星电视的红外控制编码,若控制海尔电视的红外控制编码的优先级高于控制三星电视的红外控制编码,则将海尔电视的标识信息作为目标终端设备的标识信息。
需要进行说明的是,目标红外控制编码的优先级顺序可以是由用户设置的,也可以是按照终端设备的使用频率进行设置的,如:将使用频率最高的终端设备的优先级设置为最高等等,对于目标红外控制编码的优先级顺序的具体设置方式,本发明在此不作限制。
第二种:根据语音数据,查询语音数据与红外控制编码的映射关系,获得与语音数据对应的目标红外控制编码,若目标红外控制编码的数量为多个,则将时间戳最早的目标红外控制编码对应的终端设备的标识信息作为目标终端设备的标识信息。
具体地,若遥控器通过查询获得的与语音数据对应的目标红外控制编码的数量为多个时,例如包括至少两个时,可以根据目标红外控制编码的时间戳,选择时间戳最早的目标红外控制编码对应的终端设备的标识信息作为目标终端设备的标识信息,也就是说,遥控器会将第一个添加的目标红外控制编码对应的终端设备作为目标终端设备。例如:若遥控器获得的目标红外控制编码为两个,分别是控制三星电视的红外控制编码和控制索尼电视的红外控制编码,通过查询各目标红外控制编码的时间戳,发现控制三星电视的红外控制编码是在2015年9月18日早上八点保存的,控制索尼电视的红外控制编码是在2015年9月18日早上八点十分保存的,则将三星电视的标识信息作为目标终端设备的标识信息。
第三种:根据语音数据,查询语音数据与红外控制编码的映射关系,获得与语音数据对应的目标红外控制编码;若目标红外控制编码的数量为多个,则将所有目标红外控制编码分别对应的终端设备的标识信息均作为目标终端设备的标识信息。
具体地,若遥控器通过查询获得的与语音数据对应的目标红外控制编码的数量为多个时,例如包括至少两个时,可以将所有目标红外控制编码分别对应的终端设备的标识信息均作为目标终端设备的标识信息。例如:若遥控器获得的目标红外控制编码为两个,分别是控制三星电视的红外控制编码和控制索尼电视的红外控制编码,则将三星电视和索尼电视的标识信息均作为目标终端设备的标识信息。
另外,在确定出目标终端设备的标识信息之后,还需要根据语音数据,查询语音数据与控制动作信息之间的映射关系,获得与语音数据相对应的控制动作信息。例如:若遥控器采集到的语音数据为“打开电视”,则通过查询语音数据与控制动作信息之间的映射关系,即可得到控制动作信息为“打开”。
在步骤S23中,向所述目标终端设备发送所述控制指令,以使得所述目标终端设备执行所述控制动作。
在本公开实施例中,遥控器将获得的控制指令发送给目标终端设备,目标终端设备将执行相应的控制动作,例如:电视执行打开操作或者机顶盒执行关闭操作等。
本实施例的语音的识别方法,通过采集语音数据,将该语音数据转换为控制指令,该控制指令携带有控制动作信息及目标终端设备的标识信息,并向目标终端设备发送控制指令,以使得目标终端设备执行控制动作。由于遥控器在采集到语音数据之后,可以直接将该语音数据转换为控制指令,从而使得目标终端设备执行控制指令中的控制动作,这样,可以避免相关技术中由于需要对语音数据进行识别,使得识别过程依赖网络环境的现象,因此,提高了语音识别系统的可靠性。另外,当目标红外控制编码的数量为多个时,根据不同的方式确定出目标终端设备,提高了确定目标终端设备的准确性。
图3是根据又一示例性实施例示出的一种语音的识别方法的流程图,该方法用于遥控器中,本实施例在图1所示实施例的基础上,对与语音数据相关的映射关系的获取方式的实施例,作详细说明,如图3所示,该语音的识别方法包括以下步骤。
在步骤S31中,采集语音数据。
在步骤S32中,根据所述语音数据,查询预先存储的与所述语音数据相关的映射关系。
在本公开实施例中,在遥控器本地存储有与语音数据相关的映射关系,其中,映射关系包括如下一种或者几种:语音数据与红外控制编码之间的映射关系,语音数据与控制动作信息之间的映射关系。
在步骤S33中,将所述语音数据转换为控制指令。
当遥控器采集到语音数据之后,通过查询预先存储在本地的与语音数据相关的映射关系,即可直接将语音数据转换为控制指令。
在步骤S34中,向所述目标终端设备发送所述控制指令,以使得所述目标终端设备执行所述控制动作。
本实施例的语音的识别方法,通过采集语音数据,将该语音数据转换为控制指令,该控制指令携带有控制动作信息及目标终端设备的标识信息,并向目标终端设备发送控制指令,以使得目标终端设备执行控制动作。由于遥控器在采集到语音数据之后,可以直接将该语音数据转换为控制指令,从而使得目标终端设备执行控制指令中的控制动作,这样,可以避免相关技术中由于需要对语音数据进行识别,使得识别过程依赖网络环境的现象,因此,提高了语音识别系统的可靠性。另外,由于遥控器可以直接根据预先存储在本地的与语音数据相关的映射关系,即可将语音数据转换为控制指令,从而完成对目标终端设备相应的控制,由此提高了对目标终端设备进行控制的效率。
图4是根据再一示例性实施例示出的一种语音的识别方法的流程图,该方法用于遥控器中,本实施例在图1所示实施例的基础上,对与语音数据相关的映射关系的获取方式的实施例,作详细说明,如图4所示,该语音的识别方法包括以下步骤。
在步骤S41中,采集语音数据。
在步骤S42中,与移动终端建立无线连接。
在步骤S43中,在采集到语音数据时,向所述移动终端发送请求消息。
在步骤S44中,接收所述移动终端根据所述请求消息发送的与所述语音数据相关的映射关系。
在本公开实施例中,遥控器在采集到语音数据后,需要向移动终端发送请求消息,以使移动终端根据该请求消息向遥控器发送与语音数据相关的映射关系。其中,该映射关系包括如下一种或者几种:语音数据与红外控制编码之间的映射关系,语音数据与控制动作信息之间的映射关系。
在步骤S45中,根据所述语音数据,查询所述与所述语音数据相关的映射关系。
在步骤S46中,删除所述与所述语音数据相关的映射关系。
在本公开实施例中,遥控器根据采集到的语音数据,查询移动终端发送的与语音数据相关的映射关系,以将语音数据转换为控制指令。查询完毕之后,遥控器将删除移动终端发送的与语音数据相关的映射关系,以节省遥控器的存储空间。
在步骤S47中,将所述语音数据转换为控制指令。
遥控器通过查询移动终端发送的与语音数据相关的映射关系,即可直接将语音数据转换为控制指令。
在步骤S48中,向所述目标终端设备发送所述控制指令,以使得所述目标终端设备执行所述控制动作。
本实施例的语音的识别方法,通过采集语音数据,将该语音数据转换为控制指令,该控制指令携带有控制动作信息及目标终端设备的标识信息,并向目标终端设备发送控制指令,以使得目标终端设备执行控制动作。由于遥控器在采集到语音数据之后,可以直接将该语音数据转换为控制指令,从而使得目标终端设备执行控制指令中的控制动作,这样,可以避免相关技术中由于需要对语音数据进行识别,使得识别过程依赖网络环境的现象,因此,提高了语音识别系统的可靠性。另外,由于遥控器在根据语音数据查询与语音数据相关的映射关系之后,会删除该与语音数据相关的映射关系,由此可以节省遥控器的存储空间。
图5是根据一示例性实施例示出的一种语音的识别装置的框图,如图5所示,该识别装置包括采集模块11、转换模块12和第一发送模块13。
采集模块11用于采集语音数据;
转换模块12用于将所述采集模块11采集的所述语音数据转换为控制指令,所述控制指令携带有控制动作信息及目标终端设备的标识信息;
第一发送模块13用于向所述目标终端设备发送所述转换模块12转换得到的所述控制指令,以使得所述目标终端设备执行所述控制动作。
其中,如图6所示,图6是根据另一示例性实施例示出的一种语音的识别装置的框图,在图5所示实施例的基础上,所述转换模块12包括:第一查询子模块121和第二查询子模块122;
所述第一查询子模块121用于根据所述采集模块11采集的所述语音数据,查询所述语音数据与红外控制编码之间的映射关系,获得与所述语音数据对应的目标红外控制编码,将所述目标红外控制编码对应终端设备的标识信息作为目标终端设备的标识信息;
第二查询子模块122用于根据所述采集模块11采集的所述语音数据,查询所述语音数据与控制动作信息之间的映射关系,获得与所述语音数据对应的控制动作信息。
另外,如图7所示,图7是根据又一示例性实施例示出的一种语音的识别装置的框图,在图6所示实施例的基础上,所述第一查询子模块121包括第一查询单元1211和第一选择单元1212。
所述第一查询单元1211用于根据所述语音数据,查询所述语音数据与红外控制编码之间的映射关系,获得与所述语音数据对应的目标红外控制编码;
所述第一选择单元1212用于在所述第一查询单元1211查询的目标红外控制编码的数量为多个时,将优先级最高的目标红外控制编码对应的终端设备的标识信息作为目标终端设备的标识信息。
另外,如图8所示,图8是根据再一示例性实施例示出的一种语音的识别装置的框图,在图6所示实施例的基础上,所述第一查询子模块121包括第二查询单元1213和第二选择单元1214。
所述第二查询单元1213用于根据所述语音数据,查询所述语音数据与红外控制编码的映射关系,获得与所述语音数据对应的目标红外控制编码;
所述第二选择单元1214用于在所述第二查询单元1213查询的目标红外控制编码的数量为多个时,将时间戳最早的目标红外控制编码对应的终端设备的标识信息作为目标终端设备的标识信息。
另外,如图9所示,图9是根据再一示例性实施例示出的一种语音的识别装置的框图,在图6所示实施例的基础上,所述第一查询子模块121包括第三查询单元1215和第三选择单元1216。
所述第三查询单元1215用于根据所述语音数据,查询所述语音数据与红外控制编码的映射关系,获得与所述语音数据对应的目标红外控制编码;
所述第三选择单元1216用于在所述第三查询单元1215查询的目标红外控制编码的数量为多个时,将所有目标红外控制编码分别对应的终端设备的标识信息均作为目标终端设备的标识信息。
另外,如图10所示,图10是根据再一示例性实施例示出的一种语音的识别装置的框图,在图5所示实施例的基础上,所述装置还包括第一查询模块14。
所述第一查询模块14用于根据所述采集模块11采集的所述语音数据,查询预先存储的与所述语音数据相关的映射关系;其中,所述映射关系包括如下一种或者几种:语音数据与红外控制编码之间的映射关系,语音数据与控制动作信息之间的映射关系。
另外,如图11所示,图11是根据再一示例性实施例示出的一种语音的识别装置的框图,在图5所示实施例的基础上,所述装置包括建立模块15、第二发送模块16、接收模块17、第二查询模块18和删除模块19。
所述建立模块15用于与移动终端建立无线连接;
所述第二发送模块16用于在所述建立模块15建立与所述移动终端之间的无线连接,并在所述采集模块11采集到所述语音数据时,向所述移动终端发送请求消息;
所述接收模块17用于接收所述移动终端根据所述请求消息发送的与所述语音数据相关的映射关系;其中,所述映射关系包括如下一种或者几种:语音数据与红外控制编码之间的映射关系,语音数据与控制动作信息之间的映射关系;
所述第二查询模块18用于根据所述语音数据,查询所述接收模块17接收的所述与所述语音数据相关的映射关系;
所述删除模块19用于删除所述第二查询模块18查询的所述与所述语音数据相关的映射关系。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
以上描述了语音的识别装置的内部功能和结构,如图12所示,该语音的识别装置可实现为:
采集语音数据;
将所述语音数据转换为控制指令,所述控制指令携带有控制动作信息及目标终端设备的标识信息;
向所述目标终端设备发送所述控制指令,以使得所述目标终端设备执行所述控制动作。
本实施例中,通过采集语音数据,将该语音数据转换为控制指令,该控制指令携带有控制动作信息及目标终端设备的标识信息,并向目标终端设备发送控制指令,以使得目标终端设备执行控制动作。由于遥控器在采集到语音数据之后,可以直接将该语音数据转换为控制指令,从而使得目标终端设备执行控制指令中的控制动作,这样,可以避免相关技术中由于需要对语音数据进行识别,使得识别过程依赖网络环境的现象,因此,提高了语音识别系统的可靠性。
图13是根据一示例性实施例示出的一种用于语音的识别装置的框图。例如,装置1900可以被提供为一遥控器。参照图13,装置1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922用于执行指令,以执行下述方法:
采集语音数据;
将所述语音数据转换为控制指令,所述控制指令携带有控制动作信息及目标终端设备的标识信息;
向所述目标终端设备发送所述控制指令,以使得所述目标终端设备执行所述控制动作。
其中,所述将所述语音数据转换为控制指令,包括:
根据所述语音数据,查询所述语音数据与红外控制编码之间的映射关系,获得与所述语音数据对应的目标红外控制编码,将所述目标红外控制编码对应终端设备的标识信息作为目标终端设备的标识信息;根据所述语音数据,查询所述语音数据与控制动作信息之间的映射关系,获得与所述语音数据对应的控制动作信息。
其中,所述根据所述语音数据,查询所述语音数据与红外控制编码之间的映射关系,获得与所述语音数据对应的目标红外控制编码,将所述目标红外控制编码对应终端设备的标识信息作为目标终端设备的标识信息,包括:
根据所述语音数据,查询所述语音数据与红外控制编码之间的映射关系,获得与所述语音数据对应的目标红外控制编码;
若目标红外控制编码的数量为多个,则将优先级最高的目标红外控制编码对应的终端设备的标识信息作为目标终端设备的标识信息。
其中,所述根据所述语音数据,查询所述语音数据与红外控制编码之间的映射关系,获得与所述语音数据对应的目标红外控制编码,将所述目标红外控制编码对应终端设备的标识信息作为目标终端设备的标识信息,包括:
根据所述语音数据,查询所述语音数据与红外控制编码的映射关系,获得与所述语音数据对应的目标红外控制编码;
若目标红外控制编码的数量为多个,则将时间戳最早的目标红外控制编码对应的终端设备的标识信息作为目标终端设备的标识信息。
其中,所述根据所述语音数据,查询所述语音数据与红外控制编码之间的映射关系,获得与所述语音数据对应的目标红外控制编码,将所述目标红外控制编码对应终端设备的标识信息作为目标终端设备的标识信息,包括:
根据所述语音数据,查询所述语音数据与红外控制编码的映射关系,获得与所述语音数据对应的目标红外控制编码;
若目标红外控制编码的数量为多个,则将所有目标红外控制编码分别对应的终端设备的标识信息均作为目标终端设备的标识信息。
其中,所述将所述语音数据转换为控制指令之前,所述方法还包括:
根据所述语音数据,查询预先存储的与所述语音数据相关的映射关系;其中,所述映射关系包括如下一种或者几种:语音数据与红外控制编码之间的映射关系,语音数据与控制动作信息之间的映射关系。
其中,所述将所述语音数据转换为控制指令之前,所述方法还包括:
与移动终端建立无线连接;
在采集到语音数据时,向所述移动终端发送请求消息;
接收所述移动终端根据所述请求消息发送的与所述语音数据相关的映射关系;其中,所述映射关系包括如下一种或者几种:语音数据与红外控制编码之间的映射关系,语音数据与控制动作信息之间的映射关系;
根据所述语音数据,查询所述与所述语音数据相关的映射关系;
删除所述与所述语音数据相关的映射关系。
装置1900还可以包括一个电源组件1926用于执行装置1900的电源管理,一个有线或无线网络接口1950用于将装置1900连接到网络,和一个输入输出(I/O)接口1958。装置1900可以操作基于存储在存储器1932的操作系统,例如WindowsServerTM,MacOSXTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (15)

1.一种语音的识别方法,其特征在于,包括:
采集语音数据;
将所述语音数据转换为控制指令,所述控制指令携带有控制动作信息及目标终端设备的标识信息;
向所述目标终端设备发送所述控制指令,以使得所述目标终端设备执行所述控制动作。
2.根据权利要求1所述的方法,其特征在于,所述将所述语音数据转换为控制指令,包括:
根据所述语音数据,查询所述语音数据与红外控制编码之间的映射关系,获得与所述语音数据对应的目标红外控制编码,将所述目标红外控制编码对应终端设备的标识信息作为目标终端设备的标识信息;根据所述语音数据,查询所述语音数据与控制动作信息之间的映射关系,获得与所述语音数据对应的控制动作信息。
3.根据权利要求2所述的方法,其特征在于,所述根据所述语音数据,查询所述语音数据与红外控制编码之间的映射关系,获得与所述语音数据对应的目标红外控制编码,将所述目标红外控制编码对应终端设备的标识信息作为目标终端设备的标识信息,包括:
根据所述语音数据,查询所述语音数据与红外控制编码之间的映射关系,获得与所述语音数据对应的目标红外控制编码;
若目标红外控制编码的数量为多个,则将优先级最高的目标红外控制编码对应的终端设备的标识信息作为目标终端设备的标识信息。
4.根据权利要求2所述的方法,其特征在于,所述根据所述语音数据,查询所述语音数据与红外控制编码之间的映射关系,获得与所述语音数据对应的目标红外控制编码,将所述目标红外控制编码对应终端设备的标识信息作为目标终端设备的标识信息,包括:
根据所述语音数据,查询所述语音数据与红外控制编码的映射关系,获得与所述语音数据对应的目标红外控制编码;
若目标红外控制编码的数量为多个,则将时间戳最早的目标红外控制编码对应的终端设备的标识信息作为目标终端设备的标识信息。
5.根据权利要求2所述的方法,其特征在于,所述根据所述语音数据,查询所述语音数据与红外控制编码之间的映射关系,获得与所述语音数据对应的目标红外控制编码,将所述目标红外控制编码对应终端设备的标识信息作为目标终端设备的标识信息,包括:
根据所述语音数据,查询所述语音数据与红外控制编码的映射关系,获得与所述语音数据对应的目标红外控制编码;
若目标红外控制编码的数量为多个,则将所有目标红外控制编码分别对应的终端设备的标识信息均作为目标终端设备的标识信息。
6.根据权利要求1所述的方法,其特征在于,所述将所述语音数据转换为控制指令之前,所述方法还包括:
根据所述语音数据,查询预先存储的与所述语音数据相关的映射关系;其中,所述映射关系包括如下一种或者几种:语音数据与红外控制编码之间的映射关系,语音数据与控制动作信息之间的映射关系。
7.根据权利要求1所述的方法,其特征在于,所述将所述语音数据转换为控制指令之前,所述方法还包括:
与移动终端建立无线连接;
在采集到语音数据时,向所述移动终端发送请求消息;
接收所述移动终端根据所述请求消息发送的与所述语音数据相关的映射关系;其中,所述映射关系包括如下一种或者几种:语音数据与红外控制编码之间的映射关系,语音数据与控制动作信息之间的映射关系;
根据所述语音数据,查询所述与所述语音数据相关的映射关系;
删除所述与所述语音数据相关的映射关系。
8.一种语音的识别装置,其特征在于,包括:
采集模块,用于采集语音数据;
转换模块,用于将所述采集模块采集的所述语音数据转换为控制指令,所述控制指令携带有控制动作信息及目标终端设备的标识信息;
第一发送模块,用于向所述目标终端设备发送所述转换模块转换得到的所述控制指令,以使得所述目标终端设备执行所述控制动作。
9.根据权利要求8所述的装置,其特征在于,所述转换模块包括:第一查询子模块和第二查询子模块;
所述第一查询子模块,用于根据所述采集模块采集的所述语音数据,查询所述语音数据与红外控制编码之间的映射关系,获得与所述语音数据对应的目标红外控制编码,将所述目标红外控制编码对应终端设备的标识信息作为目标终端设备的标识信息;
第二查询子模块,用于根据所述采集模块采集的所述语音数据,查询所述语音数据与控制动作信息之间的映射关系,获得与所述语音数据对应的控制动作信息。
10.根据权利要求9所述的装置,其特征在于,所述第一查询子模块包括:第一查询单元和第一选择单元;
所述第一查询单元,用于根据所述语音数据,查询所述语音数据与红外控制编码之间的映射关系,获得与所述语音数据对应的目标红外控制编码;
所述第一选择单元,用于在所述第一查询单元查询的目标红外控制编码的数量为多个时,将优先级最高的目标红外控制编码对应的终端设备的标识信息作为目标终端设备的标识信息。
11.根据权利要求9所述的装置,其特征在于,所述第一查询子模块包括:第二查询单元和第二选择单元;
所述第二查询单元,用于根据所述语音数据,查询所述语音数据与红外控制编码的映射关系,获得与所述语音数据对应的目标红外控制编码;
所述第二选择单元,用于在所述第二查询单元查询的目标红外控制编码的数量为多个时,将时间戳最早的目标红外控制编码对应的终端设备的标识信息作为目标终端设备的标识信息。
12.根据权利要求9所述的装置,其特征在于,所述第一查询子模块包括:第三查询单元和第三选择单元;
所述第三查询单元,用于根据所述语音数据,查询所述语音数据与红外控制编码的映射关系,获得与所述语音数据对应的目标红外控制编码;
所述第三选择单元,用于在所述第三查询单元查询的目标红外控制编码的数量为多个时,将所有目标红外控制编码分别对应的终端设备的标识信息均作为目标终端设备的标识信息。
13.根据权利要求8所述的装置,其特征在于,所述装置还包括:第一查询模块;
所述第一查询模块,用于根据所述采集模块采集的所述语音数据,查询预先存储的与所述语音数据相关的映射关系;其中,所述映射关系包括如下一种或者几种:语音数据与红外控制编码之间的映射关系,语音数据与控制动作信息之间的映射关系。
14.根据权利要求8所述的装置,其特征在于,所述装置还包括:建立模块、第二发送模块、接收模块、第二查询模块和删除模块;
所述建立模块,用于与移动终端建立无线连接;
所述第二发送模块,用于在所述建立模块建立与所述移动终端之间的无线连接,并在所述采集模块采集到所述语音数据时,向所述移动终端发送请求消息;
所述接收模块,用于接收所述移动终端根据所述请求消息发送的与所述语音数据相关的映射关系;其中,所述映射关系包括如下一种或者几种:语音数据与红外控制编码之间的映射关系,语音数据与控制动作信息之间的映射关系;
所述第二查询模块,用于根据所述语音数据,查询所述接收模块接收的所述与所述语音数据相关的映射关系;
所述删除模块,用于删除所述第二查询模块查询的所述与所述语音数据相关的映射关系。
15.一种语音的识别装置,其特征在于,包括:
存储器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
采集语音数据;
将所述语音数据转换为控制指令,所述控制指令携带有控制动作信息及目标终端设备的标识信息;
向所述目标终端设备发送所述控制指令,以使得所述目标终端设备执行所述控制动作。
CN201510713592.6A 2015-10-28 2015-10-28 语音的识别方法、装置和设备 Active CN105405442B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510713592.6A CN105405442B (zh) 2015-10-28 2015-10-28 语音的识别方法、装置和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510713592.6A CN105405442B (zh) 2015-10-28 2015-10-28 语音的识别方法、装置和设备

Publications (2)

Publication Number Publication Date
CN105405442A true CN105405442A (zh) 2016-03-16
CN105405442B CN105405442B (zh) 2019-12-13

Family

ID=55470885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510713592.6A Active CN105405442B (zh) 2015-10-28 2015-10-28 语音的识别方法、装置和设备

Country Status (1)

Country Link
CN (1) CN105405442B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106023578A (zh) * 2016-07-14 2016-10-12 广州视源电子科技股份有限公司 可穿戴设备及家居设备的控制方法
CN106128456A (zh) * 2016-06-16 2016-11-16 美的集团股份有限公司 智能家电的语音控制方法、终端及系统
CN106288229A (zh) * 2016-09-20 2017-01-04 珠海格力电器股份有限公司 一种空调控制方法、装置、集中控制节点及系统
CN107316641A (zh) * 2017-06-30 2017-11-03 联想(北京)有限公司 一种语音控制方法及电子设备
CN107809655A (zh) * 2016-12-21 2018-03-16 深圳中盛智兴科技有限公司 智能遥控器和智能设备、智能遥控方法及系统
CN107863104A (zh) * 2017-11-17 2018-03-30 出门问问信息科技有限公司 一种语音控制方法及装置
CN111883129A (zh) * 2020-08-03 2020-11-03 海信视像科技股份有限公司 终端设备控制方法、装置及终端设备
CN113470633A (zh) * 2020-03-31 2021-10-01 宇龙计算机通信科技(深圳)有限公司 终端控制方法、装置、存储介质和电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201927172U (zh) * 2010-12-21 2011-08-10 上海盛淘智能科技有限公司 学习型语音控制红外遥控器
CN102360187A (zh) * 2011-05-25 2012-02-22 吉林大学 语谱图互相关的驾驶员汉语语音控制系统及方法
CN102647522A (zh) * 2012-04-07 2012-08-22 西北工业大学 基于手机平台的多功能通用遥控系统
CN104145304A (zh) * 2012-03-08 2014-11-12 Lg电子株式会社 用于多个装置语音控制的设备和方法
CN204116902U (zh) * 2014-02-10 2015-01-21 美的集团股份有限公司 对家用电器语音控制的语音控制端及控制终端
CN104780470A (zh) * 2014-01-13 2015-07-15 广东美的制冷设备有限公司 家用电器的控制方法及终端
CN104885406A (zh) * 2012-12-18 2015-09-02 三星电子株式会社 用于在家庭网络系统中远程控制家庭设备的方法和设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201927172U (zh) * 2010-12-21 2011-08-10 上海盛淘智能科技有限公司 学习型语音控制红外遥控器
CN102360187A (zh) * 2011-05-25 2012-02-22 吉林大学 语谱图互相关的驾驶员汉语语音控制系统及方法
CN104145304A (zh) * 2012-03-08 2014-11-12 Lg电子株式会社 用于多个装置语音控制的设备和方法
CN102647522A (zh) * 2012-04-07 2012-08-22 西北工业大学 基于手机平台的多功能通用遥控系统
CN104885406A (zh) * 2012-12-18 2015-09-02 三星电子株式会社 用于在家庭网络系统中远程控制家庭设备的方法和设备
CN104780470A (zh) * 2014-01-13 2015-07-15 广东美的制冷设备有限公司 家用电器的控制方法及终端
CN204116902U (zh) * 2014-02-10 2015-01-21 美的集团股份有限公司 对家用电器语音控制的语音控制端及控制终端

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106128456A (zh) * 2016-06-16 2016-11-16 美的集团股份有限公司 智能家电的语音控制方法、终端及系统
CN106023578A (zh) * 2016-07-14 2016-10-12 广州视源电子科技股份有限公司 可穿戴设备及家居设备的控制方法
CN106288229A (zh) * 2016-09-20 2017-01-04 珠海格力电器股份有限公司 一种空调控制方法、装置、集中控制节点及系统
CN106288229B (zh) * 2016-09-20 2018-09-07 珠海格力电器股份有限公司 一种空调控制方法、装置、集中控制节点及系统
CN107809655A (zh) * 2016-12-21 2018-03-16 深圳中盛智兴科技有限公司 智能遥控器和智能设备、智能遥控方法及系统
CN107316641A (zh) * 2017-06-30 2017-11-03 联想(北京)有限公司 一种语音控制方法及电子设备
CN107863104A (zh) * 2017-11-17 2018-03-30 出门问问信息科技有限公司 一种语音控制方法及装置
CN113470633A (zh) * 2020-03-31 2021-10-01 宇龙计算机通信科技(深圳)有限公司 终端控制方法、装置、存储介质和电子设备
CN111883129A (zh) * 2020-08-03 2020-11-03 海信视像科技股份有限公司 终端设备控制方法、装置及终端设备
CN111883129B (zh) * 2020-08-03 2024-05-03 海信视像科技股份有限公司 终端设备控制方法、装置及终端设备

Also Published As

Publication number Publication date
CN105405442B (zh) 2019-12-13

Similar Documents

Publication Publication Date Title
CN105405442A (zh) 语音的识别方法、装置和设备
CN102984586B (zh) 智能电视应用程序的管理方法和装置
CN103674012A (zh) 语音定制方法及其装置、语音识别方法及其装置
CN105530683A (zh) 网络连接方法和装置
CN103237058A (zh) 红外控制的学习方法
CN102346643A (zh) 可学习型遥控器实现方法及装置
CN105185085A (zh) 数据通信系统、方法及装置
CN104836840A (zh) 移动终端的控制方法、服务器、装置和系统
CN105187480A (zh) 配置文件获取方法、装置及系统
CN111312253A (zh) 语音控制方法、云端服务器及终端设备
CN109561002B (zh) 家电设备的语音控制方法及装置
CN104767839A (zh) 一种ip定位方法及装置
CN104462570A (zh) 网页内容获取方法及装置
CN104967544A (zh) 网络接入设备联动方法及网络接入设备联动装置
CN104581332A (zh) 一种设置通用遥控器的方法和系统
CN111739650B (zh) 匿名社交接触回溯方法、装置、电子设备及存储介质
CN103677814A (zh) 一种程序获取方法、装置及系统
CN104866650A (zh) 一种创建抽象设备的方法和装置
CN101515297B (zh) 历史数据查询方法、路由服务器和查询终端和系统
CN102710447A (zh) 终端设备云修复方法和系统
CN109067820B (zh) 一种基于路由器的物联网中心化智能设备管理方法及系统
CN109525469B (zh) 智能家居设备的联网方法及智能家居设备
CN109346080B (zh) 语音控制方法、装置、设备和存储介质
CN101340630B (zh) 移动信息终端型号的自动识别方法
CN103488712A (zh) 一种自动化测试方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant