CN116168695A - 用于语音设备唤醒的方法、装置、设备及存储介质 - Google Patents
用于语音设备唤醒的方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN116168695A CN116168695A CN202211557007.4A CN202211557007A CN116168695A CN 116168695 A CN116168695 A CN 116168695A CN 202211557007 A CN202211557007 A CN 202211557007A CN 116168695 A CN116168695 A CN 116168695A
- Authority
- CN
- China
- Prior art keywords
- voice
- equipment
- space
- position information
- current user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000002618 waking effect Effects 0.000 title claims abstract description 28
- 230000004044 response Effects 0.000 claims abstract description 54
- 238000013507 mapping Methods 0.000 claims description 26
- 230000008447 perception Effects 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 6
- 230000003993 interaction Effects 0.000 description 6
- 238000004590 computer program Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72448—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
- H04M1/72454—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to context-related or environment-related conditions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72448—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
- H04M1/72457—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to geographic location
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/12—Details of telephonic subscriber devices including a sensor for measuring a physical value, e.g. temperature or motion
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
Abstract
本申请涉及智慧家居技术领域,公开一种用于语音设备唤醒的方法、装置、设备及存储介质。该方法包括:获取当前用户的当前用户位置信息,并发送给与所述当前用户处于同一空间中关联的第一语音设备;在所述当前用户说出语音唤醒词的情况下,获取所述第一语音设备中每个被唤醒的第二语音设备发送的语音距离竞争值,其中,所述语音距离竞争值是对应的所述第二语音设备根据所述当前用户位置信息,以及保存的在所述空间中的设备空间位置信息确定的;根据所述语音距离竞争值,将一个所述第二语音设备确定为语音响应设备,并控制所述语音响应设备进行唤醒应答。这样,提高了语音设备的智能性以及用户体验。
Description
技术领域
本申请涉及智慧家居技术领域,例如涉及用于语音设备唤醒的方法、装置、设备及存储介质。
背景技术
随着计算机技术的发展,语音设备成为人工智能领域的重要应用之一,语音设备可以通过智能对话与即时问答的智能交互,有助于用户解决各种问题、即语音设备可以回答用户的问题,还可以满足用户提出的需求,例如用户语音说出需求为播放一首XX歌曲,则语音设备可以为用户播放该XX歌曲。
然而,随着具有语音交互能力的语音设备越来越多,出现了不少在同一场景(同一个家里或同一个房间)下存在有多台语音设备的情况,这种情况下,如果用户唤醒语音设备,并发起语音请求,则会有多台语音设备同时响应并回复用户发起的语音请求,从而极大地降低了用户的体验感。
发明内容
为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。所述概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。
本公开实施例提供了一种用于语音设备唤醒的方法、装置、设备和存储介质,以解决空气语音设备智能性有待提高的技术问题。
在一些实施例中,所述方法包括:
获取当前用户的当前用户位置信息,并发送给与所述当前用户处于同一空间中关联的第一语音设备;
在所述当前用户说出语音唤醒词的情况下,获取所述第一语音设备中每个被唤醒的第二语音设备发送的语音距离竞争值,其中,所述语音距离竞争值是对应的所述第二语音设备根据所述当前用户位置信息,以及保存的在所述空间中的设备空间位置信息确定的;
根据所述语音距离竞争值,将一个所述第二语音设备确定为语音响应设备,并控制所述语音响应设备进行唤醒应答。
在一些实施例中,所述装置包括:
第一获取模块,被配置为获取当前用户的当前用户位置信息,并发送给与所述当前用户处于同一空间中关联的第一语音设备;
第二获取模块,被配置为在所述当前用户说出语音唤醒词的情况下,获取所述第一语音设备中每个被唤醒的第二语音设备发送的语音距离竞争值,其中,所述语音距离竞争值是对应的所述第二语音设备根据所述当前用户位置信息,以及保存的在所述空间中的设备空间位置信息确定的;
唤醒控制模块,被配置为根据所述语音距离竞争值,将一个所述第二语音设备确定为语音响应设备,并控制所述语音响应设备进行唤醒应答。
在一些实施例中,所述用于语音设备唤醒的装置,包括处理器和存储有程序指令的存储器,所述处理器被配置为在执行所述程序指令时,执行上述用于语音设备唤醒方法。
在一些实施例中,所述唤醒设备,包括上述用于语音设备唤醒的装置。
在一些实施例中,所述存储介质,存储有程序指令,所述程序指令在运行时,执行上述用于语音设备唤醒的方法。
本公开实施例提供的用于语音设备唤醒的方法、装置和设备,可以实现以下技术效果:
通过空间位置感知,确定语音设备在空间中的设备空间位置信息,从而,用户说出语音唤醒词时,可根据用户位置信息,以及设备空间位置信息,得到与同一空间中每个语音设备对应的语音距离竞争值,并可根据语音距离竞争值,将一个语音设备确定为语音响应设备后,控制语音响应设备进行唤醒应答,这样,在多个语音设备被唤醒的状况下,只有一个语音设备进行唤醒应答,不会出现多台语音设备同时响应并回复用户发起的语音请求的现象,提高了语音设备的智能性,也提高了用户体验。
以上的总体描述和下文中的描述仅是示例性和解释性的,不用于限制本申请。
附图说明
一个或多个实施例通过与之对应的附图进行示例性说明,这些示例性说明和附图并不构成对实施例的限定,附图中具有相同参考数字标号的元件示为类似的元件,附图不构成比例限制,并且其中:
图1是本公开实施例提供的一种用于语音设备唤醒系统的结构示意图;
图2是本公开实施例提供的一种用于语音设备唤醒方法的流程示意图;
图3是本公开实施例提供的一种用于确定语音设备空间位置的流程示意图;
图4是本公开实施例提供的一种用于语音设备唤醒的信令交互示意图;
图5是本公开实施例提供的一种用于语音设备唤醒装置的结构示意图;
图6是本公开实施例提供的一种用于语音设备唤醒装置的结构示意图。
具体实施方式
为了能够更加详尽地了解本公开实施例的特点与技术内容,下面结合附图对本公开实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本公开实施例。在以下的技术描述中,为方便解释起见,通过多个细节以提供对所披露实施例的充分理解。然而,在没有这些细节的情况下,一个或多个实施例仍然可以实施。在其它情况下,为简化附图,熟知的结构和装置可以简化展示。
本公开实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开实施例的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。
除非另有说明,术语“多个”表示两个或两个以上。
本公开实施例中,字符“/”表示前后对象是一种“或”的关系。例如,A/B表示:A或B。
术语“和/或”是一种描述对象的关联关系,表示可以存在三种关系。例如,A和/或B,表示:A或B,或,A和B这三种关系。
本公开实施例中,语音设备可为具有语音功能的智能设备,可与云端设备连接,实现互联网应用。并且,通过空间位置感知能力,以及终端设备的测绘能力,云端设备可得到较为精准的空间户型地图,从而,语音设备连网后,可得到语音设备在空间户型地图中的设备空间位置信息并发送给对应的语音设备。这样,用户说出语音唤醒词时,被唤醒的语音设备即可根据用户位置信息,以及设备空间位置信息确定与同一空间中每个语音设备对应的语音距离竞争值,然后,唤醒设备即可根据语音距离竞争值,将一个语音设备确定为语音响应设备后,控制语音响应设备进行唤醒应答,这样,在多个语音设备被唤醒的状况下,只有一个语音设备进行唤醒应答,不会出现多台语音设备同时响应并回复用户发起的语音请求的现象,提高了语音设备的智能性,也提高了用户体验。
图1是本公开实施例提供的一种用于语音设备唤醒系统的结构示意图。如图1所示,用于语音设备唤醒系统包括:云端设备100,以及,与云端设备100可分别通讯的各个语音设备200。
本公开实施例中,语音设备200可处于家居环境空间中,因此,语音设备200可为客厅中空调、电视、智能灯具,卧室的空调、加湿器、智能音箱,洗漱间的洗衣机、热水器,厨房的智能灶具、冰箱等等这些具有语音功能的家居设备。当然,语音设备200也可处于办公环境空间中,因此,语音设备200可为房间1中的空调、饮水机,房间2中的空调、投影仪,房间3中的空调、打印机等等这些具有语音功能的办公设备。
可见,语音设备200处于设定空间中,这样,云端设备100可通过设定空间内的无线保真WIFI感知能力,生成设定空间的空间映射地图,以及,通过具有空间地图绘制能力的终端设备,得到设定空间的空间实地地图。
其中,设定空间内布局了WIFI波收发装置,设定空间可为家居屋舍,例如:三居室的一个家居空间,或者,多房间的办公空间等等,这样,云端设备可通过WIFI波收发装置,获取设定空间内WIFI波的信道状态信息(Channel State Information,CSI)数据。然后,可进行数据处理,得到对应的设定空间的空间映射地图。具有空间地图绘制能力的终端设备,例如:配置了加速度和陀螺仪等装置的手机,可进行空间地图绘制,得到设定空间的空间实地地图。
这样,云端设备可将空间映射地图,以及空间实地地图进行映射,得到设定空间的空间户型地图。当然,在一些实施例中,可将空间户型地图发送前端交互设备进行呈现,这样,用户可进行确认以及同步修改,进一步提高了空间户型地图的准确性。
得到空间户型地图后,在设定空间中的语音设备处于在线状态的情况下,云端设备可得到语音设备在空间户型地图中的设备空间位置信息,并发送给语音设备进行保存。
其中,得到语音设备在空间户型地图中的设备空间位置信息可有多种,在一些实施例中,语音设备进行网络绑定时,可直接上传位置信息,例如:位于客厅东南角的空调进行网络绑定时,可上传位置信息,这样,云端设备可在空间户型地图中客厅的东南角标定空调对应的位置信息。
在一些实施例中,得到语音设备在空间户型地图中的设备空间位置信息包括:获取语音设备与终端设备之间的相对设备位置信息,其中,相对设备位置信息是终端设备根据接收到的语音设备发送的设定波段的声波的强度确定的;根据终端设备在空间户型地图中的终端位置信息,以及相对设备位置信息,得到语音设备在空间户型地图中的设备空间位置信息。
终端设备还具有拾音功能,例如:手机,这样,语音设备连网后,可发出特定波段的声波,从而,终端设备可通过配置的拾音装置接收到对应的声波,并可根据接收到的声波的强度,确定语音设备与终端设备之间的相对设备位置信息。并且,由于终端设备具有空间地图绘制能力,因此,云端设备也可得到终端设备在空间户型地图中的终端位置信息,并可根据终端位置信息,以及相对设备位置信息,得到语音设备在空间户型地图中的设备空间位置信息。
当然,在一些实施例中,还可将设备空间位置信息发送前端交互设备进行呈现,这样,用户可进行交互确认、设备信息修改以及设备位置调整等等,进一步,提高了设备空间位置信息的准确性。
云端设备得到设备空间位置信息,可发送给对应的语音设备进行保存。这样,用户说出语音唤醒词时,唤醒设备可根据准确清晰的设备空间位置信息,控制一个语音设备进行唤醒应答。其中,唤醒设备可为云端设备,也为与用户处于同一空间中的某个语音设备。
图2是本公开实施例提供的一种用于语音设备唤醒方法的流程示意图。如图2所示,语音设备唤醒的过程可包括:
步骤201:获取当前用户的当前用户位置信息,并发送给与当前用户处于同一空间中关联的第一语音设备。
语音设备处于在线状态时,可互相发送已保存的设备空间位置信息,这样,同一空间下的语音设备可建立小组关联。在一些实施例中,接收处于在线状态的语音设备发送的设备空间位置信息;根据设备空间位置信息,将同一空间中的语音设备进行关联。
例如:处于在线状态的语音设备发送的设备空间位置信息,云端设备即可将同处于客厅中的语音设备进行关联,将同处于卧室中的语音设备进行关联。
云端设备可通过空间位置感知技术,确定当前用户的当前用户位置信息,在一些实施例中,可包括:获取设定空间内无线保真WIFI波的当前信道状态信息CSI数据,得到当前空间聚类信息;确定当前空间聚类信息与第一空间聚类信息之间存在的当前差异空间聚类信息,其中,第一空间聚类信息为设定空间内无人状态时对应的空间聚类信息;根据保存的第一空间聚类信息与空间地图信息之间的映射关系,确定与当前差异空间聚类信息匹配的当前空间信息,并将当前空间信息确定为感知出的当前人体空间信息。无线保真WIFI波具有较强的空间覆盖能力,可通过WIFI波的信道状态信息CSI数据,得到空间聚类信息,并形成了空间聚类信息与保存的空间地图信息之间的映射关系,这样,空间有人体时或人体位置变动时,空间聚类信息发生变化时,即可通过映射关系,感知出对应的人体空间信息,这样,实现了人在空间下的精准感知。
云端设备可将获取的当前用户位置信息发送给与当前用户处于同一空间中关联的第一语音设备。
在一些实施例中,唤醒设备可与用户处于同一空间中的某个语音设备。因此,在一些实施例中,云端设备进行同一空间下设备关联时,还可将同一空间中语音性能信息最佳的语音设备确定唤醒设备,其中,语音性能信息包括:拾音能力、音质效果、唤醒成功率等中一个或多个。例如:客厅的语音设备中,电视具有最佳的语音性能信息,则可将电视确定为客厅的唤醒设备,而若智能音箱时卧室中语音性能信息最佳的语音设备,则可将智能音箱确定为卧室的唤醒设备。
这样,本端语音设备为与当前用户处于同一空间中的语音性能信息最佳的语音设备,即为唤醒设备,从而,可接收云端设备感知出的当前用户位置信息,并且,本端语音设备还接收并保存云端设备发送的本端语音设备在空间户型地图中的设备空间位置信息,以及接收云端设备发送的与本端语音设备处于同一空间中关联的第一语音设备的设备信息。即在确定本端语音设备为同一空间中语音性能信息最佳的语音设备的情况下,云端设备向主控设备发送处于同一空间中关联的第一语音设备的设备信息,其中,语音性能信息包括:拾音能力、音质效果、唤醒成功率等中一个或多个。从而,唤醒设备可将根据接收的设备信息,将当前用户位置信息发送给第一语音设备。
当然,在一些实施例中,不管唤醒设备是云端设备还是语音设备,还可通过其他方式获取当前用户的当前用户位置信息,例如:通过当前用户佩戴的智能穿戴设备,云端设备可获取当前用户的当前用户位置信息。或者,作为唤醒设备的语音设备通过配置的红外检测装置,可获取当前用户的当前用户位置信息,具体就一一累述了。
步骤202:在当前用户说出语音唤醒词的情况下,获取第一语音设备中每个被唤醒的第二语音设备发送的语音距离竞争值,其中,语音距离竞争值是对应的第二语音设备根据当前用户位置信息,以及保存的在空间中的设备空间位置信息确定的。
当前用户说出语音唤醒词,例如“小*,小*”,这样,同一空间中的每个唤醒识别词为“小*,小*”的第一语音设备即会被唤醒,处于唤醒状态的第一语音设备即为第二语音设备。
每个语音设备中保存了在空间户型地图中的设备空间位置信息,那么第二语音设备中也保存了对应的设备空间位置信息,并且也得到了当前用户的当前用户位置信息,从而,第二语音设备可根据当前用户位置信息,以及保存的在空间中的设备空间位置信息,确定对应的语音距离竞争值。其中,可根据当前用户位置信息、设备空间位置信息,得到第二语音设备与当前用户之间的相对距离信息。在一些实施例,可直接根据相对距离信息确定对应的语音距离竞争值。例如:相对距离信息大于3m的,对应的语音距离竞争值为1,而相对距离信息在2.5~3m中,对应的语音距离竞争值为2,以此类推,可确定相对距离信息对应的语音距离竞争值
在一些实施例中,还可根据相对距离信息,以及第二语音设备的语音性能信息,确定语音距离竞争值。例如:第一个第二语音设备确定的相对距离信息为1.5m,直接对应的语音距离竞争值为3,第二个第二语音设备确定的相对距离信息为1m,直接对应的语音距离竞争值为5,并且,第一个第二语音设备的拾音能力很强,高于第二个第二语音设备,那么,第一个第二语音设备的权重系数可确定为1.2,而第二个第二语音设备权重系数可为0.8,那么,经过权重运算后,第一个第二语音设备对应的语音距离竞争值为3*1.2=4.2,而第二个第二语音设备对应的语音距离竞争值为5*0.8=4。
每个处于唤醒状态的第二语音设备都可将确定的语音距离竞争值,发送给唤醒设备,即发送给云端设备或者某个语音设备,从而,获取到第二语音设备发送的语音距离竞争值。
步骤203:根据语音距离竞争值,将一个第二语音设备确定为语音响应设备,并控制语音响应设备进行唤醒应答。
获取到语音距离竞争值后,可进行排序,将语音距离竞争值最大的,即根据语音设备与当前用户之间的相对距离确定竞争能力最强的第二语音设备,确定为语音响应设备,从而,可向语音响应设备发送应答指令,而向其他第二语音设备发送禁止应答指令,从而,收到应答指令的语音响应设备可进行唤醒应答,而其他第二语音设备均不应答。实现了多个语音设备被唤醒,但只有一个语音设备进行唤醒应答,不会出现多台语音设备同时响应并回复用户发起的语音请求的现象,提高了语音设备的智能性,也提高了用户体验。
可见,本公开实施例中,保存了语音设备在空间中的设备空间位置信息,这样,通过空间位置感知,确定了用户的用户位置信息,从而,用户说出语音唤醒词时,可根据用户位置信息,以及设备空间位置信息,得到与同一空间中每个语音设备对应的语音距离竞争值,并可根据语音距离竞争值,将一个语音设备确定为语音响应设备后,控制语音响应设备进行唤醒应答,这样,在多个语音设备被唤醒的状况下,只有一个语音设备进行唤醒应答,不会出现多台语音设备同时响应并回复用户发起的语音请求的现象,提高了语音设备的智能性,也提高了用户体验。
下面将操作流程集合到具体实施例中,举例说明本发明实施例提供的语音设备唤醒过程。
本实施例中,用于语音设备唤醒系统可如图1所示,云端设备可确定每个语音设备在设定空间中设备空间位置信息。
图3是本公开实施例提供的一种用于确定语音设备空间位置的流程示意图。结合图3,确定语音设备空间位置包括:
步骤301:根据设定空间内的无线保真WIFI感知能力,生成设定空间的空间映射地图。
步骤302:通过配置有加速度传感器和陀螺仪等装置的手机,得到设定空间的空间实地地图。
步骤303:将空间映射地图,以及空间实地地图进行映射,得到设定空间的空间户型地图。
步骤304:将空间户型地图发送给交互设备进行呈现,并根据接收到用户绘制指令,对空间户型地图进行修改以及确认保存。
步骤305:获取处于在线状态的语音设备与手机之间的相对设备位置信息。
语音设备连网处于在线状态后,可发送设定波段的声波,手机通过配置的拾音装置,可接收该声波,并根据接收到的声波强度,得到语音设备与手机之间的相对设备位置信息,并可发送给云端设备,从而,云端设备获取到相对设备位置信息。
步骤306:根据手机在空间户型地图中的终端位置信息,以及相对设备位置信息,得到语音设备在空间户型地图中的设备空间位置信息。
步骤307:将设备空间位置信息发送给交互设备进行呈现,并根据接收到的用户修改调整指令,进行设备空间位置信息的调整、修改以及确认。
步骤308:保存设备空间位置信息,并发送给对应的语音设备。
这样,完成了语音设备在空间户型地图中的位置信息了,即设备空间位置信息。这样,可结合设备空间位置信息进行语音设备唤醒了。
图4是本公开实施例提供的一种用于语音设备唤醒的信令交互示意图。结合图4,语音设备唤醒包括:
步骤401:云端设备根据语音设备上线时,发送的设备空间位置信息,将同一空间中的语音设备进行关联。
步骤402:将同一空间中,语音性能信息最佳的语音设备确定为唤醒设备,并将处于同一空间中关联的第一语音设备的设备信息发送给唤醒设备。
步骤403:当前用户说出语音唤醒词时,云端设备通过空间位置感知,获取到当前用户的当前用户位置信息,并发送给与当前用户处于同一空间中的唤醒设备。
步骤404:唤醒设备获取当前用户的当前用户位置信息,并发送给与当前用户处于同一空间中关联的第一语音设备。
步骤405:第一语音设备中每个被唤醒的第二语音设备根据当前用户位置信息、对应的设备空间位置信息,得到对应的第二语音设备与当前用户之间的相对距离信息,并根据相对距离信息,以及第二语音设备的语音性能信息,确定对应的语音距离竞争值。
步骤406:唤醒设备获取第二语音设备发送的语音距离竞争值。
步骤407:唤醒设备将最大的语音距离竞争值对应的第二语音设备确定为语音响应设备。
步骤408:唤醒设备向语音响应设备发送应答指令,向其他第二语音设备发送禁止应答指令。
步骤409:语音响应设备进行唤醒应答。
可见,本实施例中,通过空间位置感知能力,以及终端设备的测绘能力,云端设备可得到较为精准的空间户型地图,从而,语音设备连网后,可得到语音设备在空间户型地图中的设备空间位置信息并发送给对应的语音设备。这样,用户说出语音唤醒词时,被唤醒的语音设备即可根据用户位置信息,以及设备空间位置信息确定与同一空间中每个语音设备对应的语音距离竞争值,然后,唤醒设备即可根据语音距离竞争值,将一个语音设备确定为语音响应设备后,控制语音响应设备进行唤醒应答,这样,在多个语音设备被唤醒的状况下,只有一个语音设备进行唤醒应答,不会出现多台语音设备同时响应并回复用户发起的语音请求的现象,提高了语音设备的智能性,也提高了用户体验。
根据上述用于语音设备唤醒的过程,可构建一种用于语音设备唤醒的装置。
图5是本公开实施例提供的一种用于语音设备唤醒装置的结构示意图。如图5所示,该装置包括:第一获取模块510、第二获取模块520和唤醒控制模块530。
第一获取模块510,被配置为获取当前用户的当前用户位置信息,并发送给与当前用户处于同一空间中关联的第一语音设备。
第二获取模块520,被配置为在当前用户说出语音唤醒词的情况下,获取第一语音设备中每个被唤醒的第二语音设备发送的语音距离竞争值,其中,语音距离竞争值是对应的第二语音设备根据当前用户位置信息,以及保存的在空间中的设备空间位置信息确定的。
唤醒控制模块530,被配置为根据语音距离竞争值,将一个第二语音设备确定为语音响应设备,并控制语音响应设备进行唤醒应答。
在一些实施例中,用于语音设备唤醒的装置应用于云端服务器中时,该装置还包括:
感知绘制模块,被配置为根据设定空间内的无线保真WIFI感知能力,生成设定空间的空间映射地图,以及,通过具有空间地图绘制能力的终端设备,得到设定空间的空间实地地图。
映射分析模块,被配置为将空间映射地图,以及空间实地地图进行映射,得到设定空间的空间户型地图。
确定发送模块,被配置为在设定空间中的语音设备处于在线状态的情况下,得到语音设备在空间户型地图中的设备空间位置信息,并发送给语音设备进行保存。
在一些实施例中,确定发送模块,具体被配置为获取语音设备与终端设备之间的相对设备位置信息,其中,相对设备位置信息是终端设备根据接收到的语音设备发送的设定波段的声波的强度确定的;根据终端设备在空间户型地图中的终端位置信息,以及相对设备位置信息,得到语音设备在空间户型地图中的设备空间位置信息。
在一些实施例中,用于语音设备唤醒的装置应用于云端服务器中时,该装置还包括:关联模块,被配置为接收处于在线状态的语音设备发送的设备空间位置信息;根据设备空间位置信息,将同一空间中的语音设备进行关联。
在一些实施例中,用于语音设备唤醒的装置应用于语音设备中时,该装置还包括:
第一接收模块,被配置为接收并保存云端设备发送的本端语音设备在空间户型地图中的设备空间位置信息,其中,设备空间位置信息是云端设备根据设定空间内的无线保真WIFI感知能力,生成设定空间的空间映射地图,以及,通过具有空间地图绘制能力的终端设备,得到设定空间的空间实地地图;并将空间映射地图,以及空间实地地图进行映射,得到设定空间的空间户型地图后,在确定本端语音设备处于在线状态的情况下得到的。
第二接收模块,被配置为接收云端设备发送的与本端语音设备处于同一空间中关联的第一语音设备的设备信息,其中,云端设备接收处于在线状态的语音设备发送的设备空间位置信息,并根据设备空间位置信息,将同一空间中的语音设备进行关联。
在一些实施例中,用于语音设备唤醒的装置应用于语音设备中时,该装置还包括:竞争值确定模块,被配置为根据当前用户位置信息、设备空间位置信息,得到第二语音设备与当前用户之间的相对距离信息;根据相对距离信息,以及第二语音设备的语音性能信息,确定语音距离竞争值。
可见,本实施例中,通过空间位置感知能力,以及终端设备的测绘能力,云端设备可得到较为精准的空间户型地图,从而,语音设备连网后,可得到语音设备在空间户型地图中的设备空间位置信息并发送给对应的语音设备。这样,用户说出语音唤醒词时,被唤醒的语音设备即可根据用户位置信息,以及设备空间位置信息确定与同一空间中每个语音设备对应的语音距离竞争值,然后,用于语音设备唤醒的装置即可根据语音距离竞争值,将一个语音设备确定为语音响应设备后,控制语音响应设备进行唤醒应答,这样,在多个语音设备被唤醒的状况下,只有一个语音设备进行唤醒应答,不会出现多台语音设备同时响应并回复用户发起的语音请求的现象,提高了语音设备的智能性,也提高了用户体验。
本公开实施例提供了一种用于语音设备唤醒的装置,其结构如图6所示,包括:
处理器(processor)1000和存储器(memory)1001,还可以包括通信接口(Communication Interface)1002和总线1003。其中,处理器1000、通信接口1002、存储器1001可以通过总线1003完成相互间的通信。通信接口1002可以用于信息传输。处理器1000可以调用存储器1001中的逻辑指令,以执行上述实施例的用于语音设备唤醒的方法。
此外,上述的存储器1001中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
存储器1001作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序,如本公开实施例中的方法对应的程序指令/模块。处理器1000通过运行存储在存储器1001中的程序指令/模块,从而执行功能应用以及数据处理,即实现上述方法实施例中的用于语音设备唤醒的方法。
存储器1001可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,存储器1001可以包括高速随机存取存储器,还可以包括非易失性存储器。
本公开实施例提供了一种用于语音设备唤醒装置,包括:处理器和存储有程序指令的存储器,处理器被配置为在执行程序指令时,执行用于语音设备唤醒方法。
本公开实施例提供了一种设备,包括上述用于语音设备唤醒装置,可为云端设备或语音设备。
本公开实施例提供了一种存储介质,存储有程序指令,所述程序指令在运行时,执行如上述用于语音设备唤醒的方法。
本公开实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述用于语音设备唤醒方法。
上述的存储介质可以是暂态计算机可读存储介质,也可以是非暂态计算机可读存储介质。
本公开实施例的技术方案可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括一个或多个指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开实施例所述方法的全部或部分步骤。而前述的存储介质可以是非暂态存储介质,包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等多种可以存储程序代码的介质,也可以是暂态存储介质。
以上描述和附图充分地示出了本公开的实施例,以使本领域的技术人员能够实践它们。其他实施例可以包括结构的、逻辑的、电气的、过程的以及其他的改变。实施例仅代表可能的变化。除非明确要求,否则单独的部件和功能是可选的,并且操作的顺序可以变化。一些实施例的部分和特征可以被包括在或替换其他实施例的部分和特征。本公开实施例的范围包括权利要求书的整个范围,以及权利要求书的所有可获得的等同物。当用于本申请中时,虽然术语“第一”、“第二”等可能会在本申请中使用以描述各元件,但这些元件不应受到这些术语的限制。这些术语仅用于将一个元件与另一个元件区别开。比如,在不改变描述的含义的情况下,第一元件可以叫做第二元件,并且同样第,第二元件可以叫做第一元件,只要所有出现的“第一元件”一致重命名并且所有出现的“第二元件”一致重命名即可。第一元件和第二元件都是元件,但可以不是相同的元件。而且,本申请中使用的用词仅用于描述实施例并且不用于限制权利要求。如在实施例以及权利要求的描述中使用的,除非上下文清楚地表明,否则单数形式的“一个”(a)、“一个”(an)和“所述”(the)旨在同样包括复数形式。类似地,如在本申请中所使用的术语“和/或”是指包含一个或一个以上相关联的列出的任何以及所有可能的组合。另外,当用于本申请中时,术语“包括”(comprise)及其变型“包括”(comprises)和/或包括(comprising)等指陈述的特征、整体、步骤、操作、元素,和/或组件的存在,但不排除一个或一个以上其它特征、整体、步骤、操作、元素、组件和/或这些的分组的存在或添加。在没有更多限制的情况下,由语句“包括一个…”限定的要素,并不排除在包括所述要素的过程、方法或者设备中还存在另外的相同要素。本文中,每个实施例重点说明的可以是与其他实施例的不同之处,各个实施例之间相同相似部分可以互相参见。对于实施例公开的方法、产品等而言,如果其与实施例公开的方法部分相对应,那么相关之处可以参见方法部分的描述。
本领域技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,可以取决于技术方案的特定应用和设计约束条件。所述技术人员可以对每个特定的应用来使用不同方法以实现所描述的功能,但是这种实现不应认为超出本公开实施例的范围。所述技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本文所披露的实施例中,所揭露的方法、产品(包括但不限于装置、设备等),可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,可以仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例。另外,在本公开实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
附图中的流程图和框图显示了根据本公开实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。在附图中的流程图和框图所对应的描述中,不同的方框所对应的操作或步骤也可以以不同于描述中所披露的顺序发生,有时不同的操作或步骤之间不存在特定的顺序。例如,两个连续的操作或步骤实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
Claims (11)
1.一种用于语音设备唤醒的方法,其特征在于,包括:
获取当前用户的当前用户位置信息,并发送给与所述当前用户处于同一空间中关联的第一语音设备;
在所述当前用户说出语音唤醒词的情况下,获取所述第一语音设备中每个被唤醒的第二语音设备发送的语音距离竞争值,其中,所述语音距离竞争值是对应的所述第二语音设备根据所述当前用户位置信息,以及保存的在所述空间中的设备空间位置信息确定的;
根据所述语音距离竞争值,将一个所述第二语音设备确定为语音响应设备,并控制所述语音响应设备进行唤醒应答。
2.根据权利要求1所述的方法,其特征在于,还包括:
根据设定空间内的无线保真WIFI感知能力,生成所述设定空间的空间映射地图,以及,通过具有空间地图绘制能力的终端设备,得到所述设定空间的空间实地地图;
将所述空间映射地图,以及所述空间实地地图进行映射,得到所述设定空间的空间户型地图;
在所述设定空间中的语音设备处于在线状态的情况下,得到所述语音设备在所述空间户型地图中的所述设备空间位置信息,并发送给所述语音设备进行保存。
3.根据权利要求2所述的方法,其特征在于,所述得到所述语音设备在所述空间户型地图中的设备空间位置信息包括:
获取所述语音设备与所述终端设备之间的相对设备位置信息,其中,所述相对设备位置信息是所述终端设备根据接收到的所述语音设备发送的设定波段的声波的强度确定的;
根据所述终端设备在所述空间户型地图中的终端位置信息,以及所述相对设备位置信息,得到所述语音设备在所述空间户型地图中的设备空间位置信息。
4.根据权利要求1所述的方法,其特征在于,还包括:
接收处于在线状态的语音设备发送的设备空间位置信息;
根据所述设备空间位置信息,将同一空间中的语音设备进行关联。
5.根据权利要求1所述的方法,其特征在于,还包括:
接收并保存云端设备发送的本端语音设备在空间户型地图中的设备空间位置信息,其中,所述设备空间位置信息是所述云端设备根据设定空间内的无线保真WIFI感知能力,生成所述设定空间的空间映射地图,以及,通过具有空间地图绘制能力的终端设备,得到所述设定空间的空间实地地图;并将所述空间映射地图,以及所述空间实地地图进行映射,得到所述设定空间的空间户型地图后,在确定所述本端语音设备处于在线状态的情况下得到的;
接收所述云端设备发送的与所述本端语音设备处于同一空间中关联的所述第一语音设备的设备信息,其中,所述云端设备接收处于在线状态的语音设备发送的设备空间位置信息,并根据所述设备空间位置信息,将同一空间中的语音设备进行关联。
6.根据权利要求5所述的方法,其特征在于,还包括:
在确定本端语音设备为所述同一空间中语音性能信息最佳的语音设备的情况下,所述云端设备向所述主控设备发送处于同一空间中关联的第一语音设备的设备信息,其中,所述语音性能信息包括:拾音能力、音质效果、唤醒成功率等中一个或多个。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述第二语音设备根据所述当前用户位置信息,以及保存的设备空间位置信息确定语音距离竞争值包括:
根据所述当前用户位置信息、所述设备空间位置信息,得到所述第二语音设备与所述当前用户之间的相对距离信息;
根据所述相对距离信息,以及所述第二语音设备的语音性能信息,确定所述语音距离竞争值。
8.一种用于语音设备唤醒的装置,其特征在于,该装置包括:
第一获取模块,被配置为获取当前用户的当前用户位置信息,并发送给与所述当前用户处于同一空间中关联的第一语音设备;
第二获取模块,被配置为在所述当前用户说出语音唤醒词的情况下,获取所述第一语音设备中每个被唤醒的第二语音设备发送的语音距离竞争值,其中,所述语音距离竞争值是对应的所述第二语音设备根据所述当前用户位置信息,以及保存的在所述空间中的设备空间位置信息确定的;
唤醒控制模块,被配置为根据所述语音距离竞争值,将一个所述第二语音设备确定为语音响应设备,并控制所述语音响应设备进行唤醒应答。
9.一种用于语音设备唤醒的装置,该装置包括处理器和存储有程序指令的存储器,其特征在于,所述处理器被配置为在执行所述程序指令时,执行如权利要求1至7任一项所述用于语音设备唤醒的方法。
10.一种唤醒设备,其特征在于,包括:如权利要求8或9所述用于语音设备唤醒的装置。
11.一种存储介质,存储有程序指令,其特征在于,所述程序指令在运行时,执行如权利要求1至7任一项所述用于语音设备唤醒的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211557007.4A CN116168695A (zh) | 2022-12-06 | 2022-12-06 | 用于语音设备唤醒的方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211557007.4A CN116168695A (zh) | 2022-12-06 | 2022-12-06 | 用于语音设备唤醒的方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116168695A true CN116168695A (zh) | 2023-05-26 |
Family
ID=86410158
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211557007.4A Pending CN116168695A (zh) | 2022-12-06 | 2022-12-06 | 用于语音设备唤醒的方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116168695A (zh) |
-
2022
- 2022-12-06 CN CN202211557007.4A patent/CN116168695A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110211580B (zh) | 多智能设备应答方法、装置、系统及存储介质 | |
CN108735209B (zh) | 唤醒词绑定方法、智能设备及存储介质 | |
CN109450750A (zh) | 设备的语音控制方法、装置、移动终端和家电设备 | |
CN109032039B (zh) | 一种语音控制的方法及装置 | |
CN109712624A (zh) | 一种多语音助手协调方法、装置和系统 | |
CN107144819A (zh) | 一种声源定位方法、装置及电子设备 | |
CN109450747B (zh) | 一种唤醒智能家居设备的方法、装置及计算机存储介质 | |
CN108063701B (zh) | 一种控制智能设备的方法及装置 | |
CN110767225A (zh) | 一种语音交互方法、装置及系统 | |
US20190272459A1 (en) | Electronic device and method for controlling external electronic device based on use pattern information corresponding to user | |
CN107742520B (zh) | 语音控制方法、装置及系统 | |
CN112198810A (zh) | 用于智能家居设备导航控制的方法、装置及智能家居设备 | |
CN104344497A (zh) | 空调器及其控制方法、装置 | |
CN110515449B (zh) | 唤醒智能设备的方法及装置 | |
CN116168695A (zh) | 用于语音设备唤醒的方法、装置、设备及存储介质 | |
CN112037785A (zh) | 智能设备的控制方法、装置、电子设备及存储介质 | |
CN111916084A (zh) | 智能家居语音控制方法及装置、设备、存储介质 | |
CN114143521A (zh) | 一种游戏投影方法、投影仪及存储介质 | |
US20230048330A1 (en) | In-Vehicle Speech Interaction Method and Device | |
CN111076347A (zh) | 一种空调控制方法、装置、存储介质及空调 | |
CN113242163B (zh) | 语音唤醒方法和装置 | |
CN112820302B (zh) | 声纹识别方法、装置、电子设备和可读存储介质 | |
KR20190044895A (ko) | 통신 제어 방법 및 이를 지원하는 전자 장치 | |
CN113848738A (zh) | 智能设备的控制方法以及装置 | |
CN109561424B (zh) | 一种数据标识生成方法及移动终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |