CN114500140A - 用于语音设备唤醒的方法、装置、平台设备及存储介质 - Google Patents
用于语音设备唤醒的方法、装置、平台设备及存储介质 Download PDFInfo
- Publication number
- CN114500140A CN114500140A CN202210111765.7A CN202210111765A CN114500140A CN 114500140 A CN114500140 A CN 114500140A CN 202210111765 A CN202210111765 A CN 202210111765A CN 114500140 A CN114500140 A CN 114500140A
- Authority
- CN
- China
- Prior art keywords
- voice
- information
- current user
- wake
- equipment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000004044 response Effects 0.000 claims abstract description 13
- 230000002618 waking effect Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000004590 computer program Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013523 data management Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/282—Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/2821—Avoiding conflicts related to the use of home appliances
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Automation & Control Theory (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Computer Security & Cryptography (AREA)
- Telephone Function (AREA)
- Selective Calling Equipment (AREA)
Abstract
本申请涉及智慧家居技术领域,公开一种用于语音设备唤醒的方法、装置、平台设备及存储介质。该方法包括:接收第一语音设备发送的当前用户语音唤醒信息;确定与当前用户语音唤醒信息匹配的当前用户身份信息,以及与所述当前用户身份信息匹配的第二语音设备;控制所述第二语音设备进行唤醒响应。这样,不同的用户可唤醒对应的语音设备,而不会一呼多应,提高了语音设备唤醒的准确性和智能性。
Description
技术领域
本申请涉及智慧家居技术领域,例如涉及用于语音设备唤醒的方法、装置、平台设备及存储介质。
背景技术
随着智能技术的发展,智慧家居理念的不断深入,全屋性的智慧家居系统越来越普遍。在一个全屋智慧家居系统下,为了满足不同位置用户的语音控制,通常会在场所内布置多个具有语音功能的设备,用以捕捉位于各个角落用户的语音命令。虽然各个语音设备之间具有一定的距离,但是难免会出现用户所发出的语音能够同时被两个甚至多个语音设备接收到的问题。
目前,各个语音设备之间没有集中仲裁机制,当用户发出唤醒词后,如果多个语音设备均接收到语音信号,多个语音设备会同时响应,即用户会听到多个语音设备的响应词,例如:用户发出唤醒词“###”,同时三个语音设备接收到该唤醒词,三个语音设备可能会同时发出“您好,我在”的响应词,导致全屋智慧家居系统的智能化程度大打折扣,用户体验感不佳,往往需要走近特定家居设备才能单独唤醒语音设备。
发明内容
为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。所述概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。
本公开实施例提供了一种用于语音设备唤醒的方法、装置、平台设备和存储介质,以解决智慧家居系统中多语音设备唤醒智能性有待提高的技术问题。
在一些实施例中,所述方法包括:
接收第一语音设备发送的当前用户语音唤醒信息;
确定与当前用户语音唤醒信息匹配的当前用户身份信息,以及与所述当前用户身份信息匹配的第二语音设备;
控制所述第二语音设备进行唤醒响应。
在一些实施例中,所述用于语音设备唤醒的装置,包括:
接收模块,被配置为接收第一语音设备发送的当前用户语音唤醒信息;
确定模块,被配置为确定与当前用户语音唤醒信息匹配的当前用户身份信息,以及与所述当前用户身份信息匹配的第二语音设备;
控制模块,被配置为控制所述第二语音设备进行唤醒响应。
在一些实施例中,所述用于语音设备唤醒的装置,包括处理器和存储有程序指令的存储器,所述处理器被配置为在执行所述程序指令时,执行上述用于语音设备唤醒方法。
在一些实施例中,所述平台设备,包括上述用于语音设备唤醒的装置。
在一些实施例中,所述存储介质,存储有程序指令,所述程序指令在运行时,执行上述用于语音设备唤醒的方法
本公开实施例提供的用于语音设备唤醒的方法、装置和平台设备,可以实现以下技术效果:
智慧家居系统中,平台设备接收到用户发出的语音唤醒信息后,可对语音唤醒信息进行解析,确定发出语音唤醒信息的用户身份信息,并可确定与用户身份信息匹配的语音设备,从而,唤醒匹配的语音设备,这样,不同的用户可唤醒对应的语音设备,而不会一呼多应,提高了语音设备唤醒的准确性和智能性,也提高了用户体验。
以上的总体描述和下文中的描述仅是示例性和解释性的,不用于限制本申请。
附图说明
一个或多个实施例通过与之对应的附图进行示例性说明,这些示例性说明和附图并不构成对实施例的限定,附图中具有相同参考数字标号的元件示为类似的元件,附图不构成比例限制,并且其中:
图1是本公开实施例提供的一种智慧家居系统的结构示意图;
图2是本公开实施例提供的一种用于语音设备唤醒方法的流程示意图;
图3是本公开实施例提供的一种用于语音设备唤醒方法的流程示意图;
图4是本公开实施例提供的一种用于语音设备唤醒装置的结构示意图;
图5是本公开实施例提供的一种用于语音设备唤醒装置的结构示意图;
图6是本公开实施例提供的一种用于语音设备唤醒装置的结构示意图。
具体实施方式
为了能够更加详尽地了解本公开实施例的特点与技术内容,下面结合附图对本公开实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本公开实施例。在以下的技术描述中,为方便解释起见,通过多个细节以提供对所披露实施例的充分理解。然而,在没有这些细节的情况下,一个或多个实施例仍然可以实施。在其它情况下,为简化附图,熟知的结构和装置可以简化展示。
本公开实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开实施例的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。
除非另有说明,术语“多个”表示两个或两个以上。
本公开实施例中,字符“/”表示前后对象是一种“或”的关系。例如,A/B表示:A或B。
术语“和/或”是一种描述对象的关联关系,表示可以存在三种关系。例如,A和/或B,表示:A或B,或,A和B这三种关系。
本公开实施例中,智慧家居系统中,有多个具有语音功能的智能设备,即语音设备,这些设备可与智慧家居系统中的平台设备进行通讯,平台设备可对每个语音设备进行数据管理以及控制,当然,语音设备之间也可进行通讯,这样,用户发出语音唤醒信息后,通过一个、两个或多个语音设备,平台设备可接收到语音唤醒信息,并可对语音唤醒信息进行解析,确定发出语音唤醒信息的用户身份信息,还可根据使用语音设备的习惯次数信息,确定与用户身份信息匹配的语音设备,从而,唤醒匹配的语音设备,这样,不同的用户可唤醒对应的语音设备,而不会一呼多应,提高了语音设备唤醒的准确性和智能性,也提高了用户体验。
图1是本公开实施例提供的一种智慧家居系统的结构示意图。如图1所示,智慧家居系统包括:平台设备100,以及与平台设备100进行通讯的智能家居设备200。并且,有一个、两个或多个智能家居设备200具有语音功能,即语音设备200。例如:智能家居设备200可为智能音箱、带语音面板的空调、带语音面板的冰箱、智能电视等等。平台设备100可为云端服务器设备,智能家居设备200为语音设备200时,平台设备100可与每个语音设备200进行通讯,从而,可对语音设备200进行数据管理以及远程控制。
本公开实施例中,智慧家居系统中,平台设备可实现语音设备的唤醒,并且不会一呼多应,提高了语音设备唤醒的准确性和智能性。
图2是本公开实施例提供的一种用于语音设备唤醒方法的流程示意图。如图2所示,语音设备唤醒的过程包括:
步骤201:接收第一语音设备发送的当前用户语音唤醒信息。
本公开实施例中,智慧家居系统中,平台设备可与语音设备进行通讯,智慧家居系统中的当前用户发出语音唤醒信息时,当前用户设定范围内的语音设备即可将接收到的当前用户语音唤醒信息发送给平台设备,因此,发送当前用户语音唤醒信息的语音设备可为第一语音设备,第一语音设备可为一个、两个、或多个。当前用户的位置不同,对应的第一语音设备也不同。
这样,第一语音设备发送了当前用户语音唤醒信息,则平台设备可接收到当前用户语音唤醒信息。
步骤202:确定与当前用户语音唤醒信息匹配的当前用户身份信息,以及与当前用户身份信息匹配的第二语音设备。
智慧家居系统中,平台设备可与每个语音设备进行通讯,并可对语音设备进行数据管理以及远程控制。并且,平台设备还可获取每个用户的语音音色特征信息,以及使用语音设备的习惯次数信息等等,从而得到用户身份信息、语音音色特征信息、语音设备、习惯次数信息等等之间的对应关系。在一些实施例中,可获取用户的语音音色特征信息,以及使用语音设备的习惯次数信息;保存用户身份信息与语音音色特征信息之间的第一对应关系;保存用户身份信息与语音设备,以及习惯次数信息之间的第二对应关系。
表1是本公开实施例提供的一种用户身份信息与语音音色特征信息之间的第一对应关系。表2是本公开实施例提供的一种用户身份信息与语音设备,以及习惯次数信息之间的第二对应关系。
用户身份信息 | 语音音色特征信息 |
用户ID1 | 语音音色特征信息1 |
用户ID2 | 语音音色特征信息2 |
用户ID3 | 语音音色特征信息3 |
…… | …… |
表1
可通过数据输入、网络获取等等方式,获取用户的语音音色特征信息,以及使用语音设备的习惯次数信息,并保存第一对应关系以及第二对应关系。
在一些实施例中,平台设备中保存了用户身份信息与语音音色特征信息之间的第一对应关系,以及用户身份信息与语音设备,以及习惯次数信息之间的第二对应关系。从而,可对接收的当前用户语音唤醒信息进行解析,确定当前用户语音特征信息;根据保存的第一对应关系,确定与当前用户语音特征信息匹配的当前用户身份信息;根据保存的第二对应关系,将当前用户身份信息中,习惯次数信息大于阈值的语音设备确定为第二语音设备。
例如:保存的第一对应关系、第二对应关系分别如表1、表2所示,则若解析当前用户语音唤醒信息后的,得到的当前用户语音特征信息为语音音色特征信息2,则根据表1可确定当前用户身份信息为用户ID2,并可根据表2,可确定习惯次数信息大于阈值的语音设备。其中,可将习惯次数信息中的最大值对应的语音设备确定为第二语音设备,例如:根据表2,电视对应习惯次数信息最大,因此,可将阈值确定为14,从而,大于14的有语音设备是电视,从而,可将电视确定为第二语音设备。或者,预设一个阈值,可为10、12、20等等,从而,将当前用户身份信息中,习惯次数信息大于阈值的语音设备都可确定为第二语音设备。
表2
并且,本公开实施例中,习惯次数信息可为一段时间内的习惯次数,例如:一周、一个月、一个季度、或一年等等,或者,是智慧家居系统运行以来,统计的所有习惯次数,因此,对应的阈值也可根据统计的时间不同而不同。
在一些实施例中,当前用户身份信息中,习惯次数信息大于阈值的语音设备可能有一个、两个或多个,这样,可将习惯次数信息大于阈值的语音设备确定为待唤醒语音设备;在待唤醒设备的个数大于1个的情况下,获取每个待唤醒语音设备的设备位置信息,以及根据当前用户语音唤醒信息,确定当前用户位置信息;根据设备位置信息,以及当前用户位置信息,将与当前用户最近的待唤醒语音设备确定为第二语音设备。
例如:当前用户身份信息为用户ID3,其中,大于阈值10的语音设备有智能音箱和台灯,因此,可将智能音箱和台灯确定为待唤醒语音设备,并且,根据智能音箱位置信息、台灯位置信息、以及当前用户位置信息,确定台灯离当前用户最近,从而,可将台灯确定为第二语音设备。
本公开实施例中,第一语音设备可与第二语音设备为同一个设备,也可不是同一个设备。
步骤203:控制第二语音设备进行唤醒响应。
可向第二语音设备发送唤醒指令,控制第二语音设备进行唤醒响应。例如:第二语音设备可发出“您好!我在”的语音。
可见,本实施例中,用户发出语音唤醒信息后,通过一个、两个或多个语音设备,平台设备可接收到语音唤醒信息后,可对语音唤醒信息进行解析,确定发出语音唤醒信息的用户身份信息,并可确定与用户身份信息匹配的语音设备,从而,唤醒匹配的语音设备,这样,不同的用户可唤醒对应的语音设备,而不会一呼多应,提高了语音设备唤醒的准确性和智能性,也提高了用户体验。
当然,控制第二语音设备进行唤醒响应后,还可更新第二对应关系。即保存的用户身份信息与语音设备,以及习惯次数信息之间的第二对应关系中,习惯次数信息发生了变化,第二语音设备的习惯次数信息+1,从而,可实时更新惯次数信息,进一步保证了语音设备唤醒的准确性和智能性。
下面将操作流程集合到具体实施例中,举例说明本发明实施例提供的用于语音设备唤醒过程。
本实施例中,智慧家居系统如图1所示,其中,平台设备保存了如表1、表2所示的对应关系,而阈值与每个用户身份信息对应的最大习惯次数信息匹配。
图3是本公开实施例提供的一种用于语音设备唤醒方法的流程示意图。如图3所示,语音设备唤醒过程包括:
步骤301:是否接收到当前用户语音唤醒信息?若是,执行步骤302,否则,返回步骤301。
通过智慧家居系统中的语音设备,可接收到用户发出的当前用户语音唤醒信息。例如:用户发出“小X小X”,在用户位置的设定范围内的语音设备即第一语音设备可将对应的当前用户语音唤醒信息发送给平台设备,从而,平台设备接收到当前用户语音唤醒信息,执行步骤302。
步骤302:对当前用户语音唤醒信息进行解析,确定当前用户语音特征信息。
步骤303:根据保存的第一对应关系,确定与当前用户语音特征信息匹配的当前用户身份信息。
步骤304:根据保存的第二对应关系,将当前用户身份信息中,最大的习惯次数信息对应的语音设备确定为待唤醒语音设备。
步骤305:判断待唤醒设备的个数是否大于1个?若是,执行步骤306,否则,执行步骤308。
步骤306:获取每个待唤醒语音设备的设备位置信息,以及根据当前用户语音唤醒信息,确定当前用户位置信息。
步骤307:根据设备位置信息,以及当前用户位置信息,将与当前用户最近的待唤醒语音设备确定为第二语音设备。转入步骤309。
步骤308:将待唤醒语音设备确定为第二语音设备。转入步骤309。
步骤309:向第二语音设备发送唤醒指令,控制第二语音设备进行唤醒响应。
步骤310:更新第二对应关系,将第二对应关系中,当前用户身份信息中,与第二语音设备对应的习惯次数信息+1。本次唤醒流程结束。
可见,本实施例中,平台设备可接收到语音唤醒信息后,可对语音唤醒信息进行解析,确定发出语音唤醒信息的用户身份信息,并可确定与用户身份信息匹配的语音设备,从而,唤醒匹配的语音设备,这样,不同的用户可唤醒对应的语音设备,而不会一呼多应,提高了语音设备唤醒的准确性和智能性,也提高了用户体验。并且,还可兼顾用户习惯次数以及距离,进一步提高了语音设备唤醒的准确性和智能性。
根据上述用于语音设备唤醒的过程,可构建一种用于语音设备唤醒的装置。
图4是本公开实施例提供的一种用于语音设备唤醒装置的结构示意图。如图4所示,用于语音设备唤醒装置包括:接收模块410、确定模块420和控制模块430。
接收模块410,被配置为接收第一语音设备发送的当前用户语音唤醒信息。
确定模块420,被配置为确定与当前用户语音唤醒信息匹配的当前用户身份信息,以及与当前用户身份信息匹配的第二语音设备。
控制模块430,被配置为控制第二语音设备进行唤醒响应。
在一些实施例中,还包括:获取保存模块,被配置为获取用户的语音音色特征信息,以及使用语音设备的习惯次数信息;保存用户身份信息与语音音色特征信息之间的第一对应关系;以及,保存用户身份信息与语音设备,以及习惯次数信息之间的第二对应关系。
在一些实施例中,确定模块420,具体被配置为对当前用户语音唤醒信息进行解析,确定当前用户语音特征信息;根据保存的第一对应关系,确定与当前用户语音特征信息匹配的当前用户身份信息;根据保存的第二对应关系,将当前用户身份信息中,习惯次数信息大于阈值的语音设备确定为第二语音设备。
在一些实施例中,确定模块420,还被配置为将习惯次数信息大于阈值的语音设备确定为待唤醒语音设备;在待唤醒设备的个数大于1个的情况下,获取每个待唤醒语音设备的设备位置信息,以及根据当前用户语音唤醒信息,确定当前用户位置信息;根据设备位置信息,以及当前用户位置信息,将与当前用户最近的待唤醒语音设备确定为第二语音设备。
在一些实施例中,还包括:更新模块,被配置为更新第二对应关系。
本实施例中,慧家居系统如图1所示,其中,平台设备中,阈值可与统计时间一个月相对应,例如可为20。
图5是本公开实施例提供的一种用于语音设备唤醒装置的结构示意图。如图5所示,用于语音设备唤醒装置包括:接收模块410、确定模块420和控制模块430,还可包括:获取保存模块440、以及更新模块450。
其中,获取保存模块440可获取用户的语音音色特征信息,以及一个月时间内使用语音设备的习惯次数信息,并保存用户身份信息与语音音色特征信息之间的第一对应关系;保存用户身份信息与语音设备,以及习惯次数信息之间的第二对应关系。
这样,接收模块410接收到当前用户语音唤醒信息后,确定模块420可对当前用户语音唤醒信息进行解析,确定当前用户语音特征信息;并可根据获取保存模块440保存的第一对应关系,确定与当前用户语音特征信息匹配的当前用户身份信息;以及根据获取保存模块440保存的第二对应关系,将当前用户身份信息中,习惯次数信息大于20的语音设备确定为待唤醒语音设备。并且,在待唤醒设备的个数大于1个的情况下,确定模块420还获取每个待唤醒语音设备的设备位置信息,以及根据当前用户语音唤醒信息,确定当前用户位置信息;然后,根据设备位置信息,以及当前用户位置信息,将与当前用户最近的待唤醒语音设备确定为第二语音设备。当然,在待唤醒设备的个数等于1的情况,确定模块420可直接将待唤醒语音设备确定为第二语音设备。
从而,控制模块430可向第二语音设备发送唤醒指令,控制第二语音设备进行唤醒响应。并且,更新模块450可以现在时间为截点,更新第二对应关系中,当前用户身份信息中,与第二语音设备对应的习惯次数信息。可能是将与第二语音设备对应的习惯次数信息+1,也有可能是不变。
可见,本实施例中,用于语音设备唤醒的装置可接收到语音唤醒信息后,可对语音唤醒信息进行解析,确定发出语音唤醒信息的用户身份信息,并可确定与用户身份信息匹配的语音设备,从而,唤醒匹配的语音设备,这样,不同的用户可唤醒对应的语音设备,而不会一呼多应,提高了语音设备唤醒的准确性和智能性,也提高了用户体验。并且,还可兼顾用户习惯次数以及距离,进一步提高了语音设备唤醒的准确性和智能性。
本公开实施例提供了一种用于语音设备唤醒的装置,其结构如图6所示,包括:
处理器(processor)1000和存储器(memory)1001,还可以包括通信接口(Communication Interface)1002和总线1003。其中,处理器1000、通信接口1002、存储器1001可以通过总线1003完成相互间的通信。通信接口1002可以用于信息传输。处理器1000可以调用存储器1001中的逻辑指令,以执行上述实施例的用于语音设备唤醒的方法。
此外,上述的存储器1001中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
存储器1001作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序,如本公开实施例中的方法对应的程序指令/模块。处理器1000通过运行存储在存储器1001中的程序指令/模块,从而执行功能应用以及数据处理,即实现上述方法实施例中的用于语音设备唤醒的方法。
存储器1001可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,存储器1001可以包括高速随机存取存储器,还可以包括非易失性存储器。
本公开实施例提供了一种用于语音设备唤醒装置,包括:处理器和存储有程序指令的存储器,处理器被配置为在执行程序指令时,执行用于语音设备唤醒方法。
本公开实施例提供了一种平台设备,包括上述用于语音设备唤醒装置。
本公开实施例提供了一种存储介质,存储有程序指令,所述程序指令在运行时,执行如上述用于语音设备唤醒的方法。
本公开实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述用于语音设备唤醒方法。
上述的存储介质可以是暂态计算机可读存储介质,也可以是非暂态计算机可读存储介质。
本公开实施例的技术方案可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括一个或多个指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开实施例所述方法的全部或部分步骤。而前述的存储介质可以是非暂态存储介质,包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等多种可以存储程序代码的介质,也可以是暂态存储介质。
以上描述和附图充分地示出了本公开的实施例,以使本领域的技术人员能够实践它们。其他实施例可以包括结构的、逻辑的、电气的、过程的以及其他的改变。实施例仅代表可能的变化。除非明确要求,否则单独的部件和功能是可选的,并且操作的顺序可以变化。一些实施例的部分和特征可以被包括在或替换其他实施例的部分和特征。本公开实施例的范围包括权利要求书的整个范围,以及权利要求书的所有可获得的等同物。当用于本申请中时,虽然术语“第一”、“第二”等可能会在本申请中使用以描述各元件,但这些元件不应受到这些术语的限制。这些术语仅用于将一个元件与另一个元件区别开。比如,在不改变描述的含义的情况下,第一元件可以叫做第二元件,并且同样第,第二元件可以叫做第一元件,只要所有出现的“第一元件”一致重命名并且所有出现的“第二元件”一致重命名即可。第一元件和第二元件都是元件,但可以不是相同的元件。而且,本申请中使用的用词仅用于描述实施例并且不用于限制权利要求。如在实施例以及权利要求的描述中使用的,除非上下文清楚地表明,否则单数形式的“一个”(a)、“一个”(an)和“所述”(the)旨在同样包括复数形式。类似地,如在本申请中所使用的术语“和/或”是指包含一个或一个以上相关联的列出的任何以及所有可能的组合。另外,当用于本申请中时,术语“包括”(comprise)及其变型“包括”(comprises)和/或包括(comprising)等指陈述的特征、整体、步骤、操作、元素,和/或组件的存在,但不排除一个或一个以上其它特征、整体、步骤、操作、元素、组件和/或这些的分组的存在或添加。在没有更多限制的情况下,由语句“包括一个…”限定的要素,并不排除在包括所述要素的过程、方法或者设备中还存在另外的相同要素。本文中,每个实施例重点说明的可以是与其他实施例的不同之处,各个实施例之间相同相似部分可以互相参见。对于实施例公开的方法、产品等而言,如果其与实施例公开的方法部分相对应,那么相关之处可以参见方法部分的描述。
本领域技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,可以取决于技术方案的特定应用和设计约束条件。所述技术人员可以对每个特定的应用来使用不同方法以实现所描述的功能,但是这种实现不应认为超出本公开实施例的范围。所述技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本文所披露的实施例中,所揭露的方法、产品(包括但不限于装置、设备等),可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,可以仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例。另外,在本公开实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
附图中的流程图和框图显示了根据本公开实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。在附图中的流程图和框图所对应的描述中,不同的方框所对应的操作或步骤也可以以不同于描述中所披露的顺序发生,有时不同的操作或步骤之间不存在特定的顺序。例如,两个连续的操作或步骤实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
Claims (10)
1.一种用于语音设备唤醒的方法,其特征在于,包括:
接收第一语音设备发送的当前用户语音唤醒信息;
确定与当前用户语音唤醒信息匹配的当前用户身份信息,以及与所述当前用户身份信息匹配的第二语音设备;
控制所述第二语音设备进行唤醒响应。
2.根据权利要求1所述的方法,其特征在于,还包括:
获取用户的语音音色特征信息,以及使用语音设备的习惯次数信息;
保存所述用户身份信息与语音音色特征信息之间的第一对应关系;
保存所述用户身份信息与语音设备,以及习惯次数信息之间的第二对应关系。
3.根据权利要求2所述的方法,其特征在于,所述确定与当前用户语音唤醒信息匹配的当前用户身份信息,以及与所述当前用户身份信息匹配的第二语音设备包括:
对所述当前用户语音唤醒信息进行解析,确定当前用户语音特征信息;
根据保存的第一对应关系,确定与所述当前用户语音特征信息匹配的当前用户身份信息;
根据保存的第二对应关系,将所述当前用户身份信息中,习惯次数信息大于阈值的语音设备确定为第二语音设备。
4.根据权利要求3所述的方法,其特征在于,所述将所述当前用户身份信息中,习惯次数信息大于阈值的语音设备确定为第二语音设备包括:
将所述习惯次数信息大于阈值的语音设备确定为待唤醒语音设备;
在所述待唤醒设备的个数大于1个的情况下,获取每个所述待唤醒语音设备的设备位置信息,以及根据所述当前用户语音唤醒信息,确定当前用户位置信息;
根据所述设备位置信息,以及所述当前用户位置信息,将与所述当前用户最近的待唤醒语音设备确定为第二语音设备。
5.根据权利要求2所述的方法,其特征在于,所述控制所述第二语音设备进行唤醒响应之后,还包括:
更新所述第二对应关系。
6.一种用于语音设备唤醒的装置,其特征在于,包括:
接收模块,被配置为接收第一语音设备发送的当前用户语音唤醒信息;
确定模块,被配置为确定与当前用户语音唤醒信息匹配的当前用户身份信息,以及与所述当前用户身份信息匹配的第二语音设备;
控制模块,被配置为控制所述第二语音设备进行唤醒响应。
7.根据权利要求6所述的装置,其特征在于,还包括:
获取保存模块,被配置为获取用户的语音音色特征信息,以及使用语音设备的习惯次数信息;保存所述用户身份信息与语音音色特征信息之间的第一对应关系;以及,保存所述用户身份信息与语音设备,以及习惯次数信息之间的第二对应关系;
则,所述确定模块,具体被配置为对所述当前用户语音唤醒信息进行解析,确定当前用户语音特征信息;根据保存的第一对应关系,确定与所述当前用户语音特征信息匹配的当前用户身份信息;根据保存的第二对应关系,将所述当前用户身份信息中,习惯次数信息大于阈值的语音设备确定为第二语音设备。
8.一种用于语音设备唤醒的装置,该装置包括处理器和存储有程序指令的存储器,其特征在于,所述处理器被配置为在执行所述程序指令时,执行如权利要求1至5任一项所述用于语音设备唤醒的方法。
9.一种平台设备,其特征在于,包括:如权利要求6或8所述用于语音设备唤醒的装置。
10.一种存储介质,存储有程序指令,其特征在于,所述程序指令在运行时,执行如权利要求1至5任一项所述用于语音设备唤醒的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210111765.7A CN114500140B (zh) | 2022-01-29 | 2022-01-29 | 用于语音设备唤醒的方法、装置、平台设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210111765.7A CN114500140B (zh) | 2022-01-29 | 2022-01-29 | 用于语音设备唤醒的方法、装置、平台设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114500140A true CN114500140A (zh) | 2022-05-13 |
CN114500140B CN114500140B (zh) | 2024-03-19 |
Family
ID=81478677
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210111765.7A Active CN114500140B (zh) | 2022-01-29 | 2022-01-29 | 用于语音设备唤醒的方法、装置、平台设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114500140B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109391528A (zh) * | 2018-08-31 | 2019-02-26 | 百度在线网络技术(北京)有限公司 | 语音智能设备的唤醒方法、装置、设备及存储介质 |
CN113848747A (zh) * | 2021-11-03 | 2021-12-28 | 珠海格力电器股份有限公司 | 智能家居设备控制方法及装置 |
CN113903337A (zh) * | 2021-10-13 | 2022-01-07 | 海尔(深圳)研发有限责任公司 | 用于语音空调控制的方法、装置、云端服务器及存储介质 |
-
2022
- 2022-01-29 CN CN202210111765.7A patent/CN114500140B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109391528A (zh) * | 2018-08-31 | 2019-02-26 | 百度在线网络技术(北京)有限公司 | 语音智能设备的唤醒方法、装置、设备及存储介质 |
CN113903337A (zh) * | 2021-10-13 | 2022-01-07 | 海尔(深圳)研发有限责任公司 | 用于语音空调控制的方法、装置、云端服务器及存储介质 |
CN113848747A (zh) * | 2021-11-03 | 2021-12-28 | 珠海格力电器股份有限公司 | 智能家居设备控制方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN114500140B (zh) | 2024-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107704275B (zh) | 智能设备唤醒方法、装置、服务器及智能设备 | |
CN108520743B (zh) | 智能设备的语音控制方法、智能设备及计算机可读介质 | |
CN109410952B (zh) | 一种语音唤醒方法、装置及系统 | |
CN106782526A (zh) | 语音控制方法和装置 | |
CN110634468B (zh) | 语音唤醒方法、装置、设备及计算机可读存储介质 | |
CN105469789A (zh) | 一种语音信息的处理方法及终端 | |
CN110986307B (zh) | 用于空调的控制方法及装置、空调 | |
CN107655154A (zh) | 终端控制方法、空调器及计算机可读存储介质 | |
CN108932947B (zh) | 语音控制方法及家电设备 | |
CN110277092A (zh) | 一种语音播报方法、装置、电子设备及可读存储介质 | |
CN111933135A (zh) | 终端控制方法、装置、智能终端及计算机可读存储介质 | |
CN113436631B (zh) | 语音信息处理方法、系统及用于语音信息处理的装置 | |
CN111343348A (zh) | 互动式语音应答菜单的应用方法、系统、装置及存储介质 | |
CN113218058B (zh) | 用于控制空调器的方法及装置、服务器 | |
CN106331392A (zh) | 控制方法及控制装置 | |
CN112925895A (zh) | 自然语言软件运维方法及装置 | |
CN114500140A (zh) | 用于语音设备唤醒的方法、装置、平台设备及存储介质 | |
CN112700770A (zh) | 语音控制方法、音箱设备、计算设备和存储介质 | |
CN111984740A (zh) | 业务数据表处理方法、装置、计算机设备和存储介质 | |
CN107222383B (zh) | 一种对话管理方法和系统 | |
CN113848738A (zh) | 智能设备的控制方法以及装置 | |
CN112820302A (zh) | 声纹识别方法、装置、电子设备和可读存储介质 | |
CN112416113B (zh) | 一种机器人的个性化人机交互方法、装置及终端设备 | |
CN113241067B (zh) | 一种语音交互方法及其系统、语音交互设备 | |
CN112885341A (zh) | 一种语音唤醒方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |