CN113241068A - 语音信号的响应方法和装置、存储介质及电子装置 - Google Patents

语音信号的响应方法和装置、存储介质及电子装置 Download PDF

Info

Publication number
CN113241068A
CN113241068A CN202110326971.5A CN202110326971A CN113241068A CN 113241068 A CN113241068 A CN 113241068A CN 202110326971 A CN202110326971 A CN 202110326971A CN 113241068 A CN113241068 A CN 113241068A
Authority
CN
China
Prior art keywords
voice signal
devices
determining
sound information
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110326971.5A
Other languages
English (en)
Inventor
李阅苗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Haier Technology Co Ltd
Haier Smart Home Co Ltd
Original Assignee
Qingdao Haier Technology Co Ltd
Haier Smart Home Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Haier Technology Co Ltd, Haier Smart Home Co Ltd filed Critical Qingdao Haier Technology Co Ltd
Priority to CN202110326971.5A priority Critical patent/CN113241068A/zh
Publication of CN113241068A publication Critical patent/CN113241068A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2816Controlling appliance services of a home automation network by calling their functionalities
    • H04L12/282Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Automation & Control Theory (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种语音信号的响应方法和装置、存储介质及电子装置,其中,上述方法包括:确定目标区域的主设备和从设备,并通过主设备获取所有设备接收到语音信号源发出的语音信号的唤醒时间和声音信息,其中,唤醒时间用于指示设备接收到语音信号的时间,声音信息用于指示设备检测到的语音信号的强度,所有设备包括:主设备和从设备;根据唤醒时间和声音信息确定满足预设条件的目标设备,以指示目标设备响应语音信号,即根据设备与语音信号源的距离和设备检测到的语音信号的强度确定目标设备。采用上述技术方案,解决了相关技术中,用户发出语音信号时,多个设备同时响应用户的语音信号等问题。

Description

语音信号的响应方法和装置、存储介质及电子装置
技术领域
本发明涉及通信领域,具体而言,涉及一种语音信号的响应方法和装置、存储介质及电子装置。
背景技术
随着科学技术的进步和互联网的发展,智能设备的普及,用户家庭中可能存在多个可以识别用户语音信息的设备,例如,用户家庭中存在识别用户语音信息的音箱、空调、冰箱等,每个可以识别用户语音信息的设备都有一个独立的语音入口,因此,导致用户在家中说出语音信息时,可以理解为唤醒词,多个语音入口都有可能“听”到用户的语音信息,进而多个设备同时响应用户。
针对相关技术中,用户发出语音信号时,多个设备同时响应用户的语音信号等问题,尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种语音信号的响应方法和装置、存储介质及电子装置,以至少解决相关技术中,用户发出语音信号时,多个设备同时响应用户的语音信号等问题。
根据本发明实施例的一个实施例,提供了一种语音信号的响应方法,包括:确定目标区域的主设备和从设备,并通过所述主设备获取所有设备接收到语音信号源发出的语音信号的唤醒时间和声音信息其中,所述唤醒时间用于指示设备接收到所述语音信号的时间,所述声音信息用于指示设备检测到的所述语音信号的强度,所述所有设备包括:所述主设备和所述从设备;根据所述唤醒时间和所述声音信息确定满足预设条件的目标设备,以指示所述目标设备响应所述语音信号。
在一个示例性实施例中根据所述唤醒时间和所述声音信息确定满足预设条件的目标设备,包括:根据所述唤醒时间确定所述所有设备中任意两个设备距离所述语音信号源的距离差;根据所述距离差确定距离所述语音信号源最近的多个第一设备;从所述声音信息中获取所述多个第一设备的多个第一声音信息;从所述多个第一声音信息确定语音信号强度最强所对应的第一设备作为所述目标设备,以通过所述目标设备响应所述语音信号。
在一个示例性实施例中,根据所述距离差确定距离所述语音信号源最近的多个第一设备,包括:分别获取所述所有设备中任意两个设备的距离差,得到多个距离差;在检测到所述多个距离差中的目标距离差小于预设阈值的情况下,将所述目标距离差对应的两个设备作为所述距离所述语音信号源最近的多个第一设备。
在一个示例性实施例中,根据所述唤醒时间确定所述所有设备中任意两个设备距离所述语音信号源的距离差,包括:获取所述语音信号在空气中的传播速度;根据所述传播速度和所述任意两个设备的唤醒时间确定所述所有设备中任意两个设备距离所述语音信号源的距离差。
在一个示例性实施例中,根据所述唤醒时间和所述声音信息确定满足预设条件的目标设备,包括:根据所述唤醒时间确定所述所有设备中任意两个设备距离所述语音信号源的距离差;根据所述距离差确定距离所述语音信号源最近的第二设备;根据所述声音信息确定所述第二设备的第二声音信息是否为所述所有设备中语音信号的强度最强的第二设备;在确定为是的情况下,将所述第二设备作为所述目标设备,以通过所述目标设备响应所述语音信号。
在一个示例性实施例中,确定目标区域的主设备和从设备,包括:确定所述目标区域内的所有设备;为所述所有设备建立对等网络,并在建立的所述对等网络中根据选举算法选举出所述主设备和所述从设备。
根据本发明实施例的另一个实施例,还提供了一种语音信号的响应装置,包括:接收模块,用于确定目标区域的主设备和从设备,并通过所述主设备获取所有设备接收到语音信号源发出的语音信号的唤醒时间和声音信息,其中,所述唤醒时间用于指示设备接收到所述语音信号的时间,所述声音信息用于指示设备检测到的所述语音信号的强度,所述所有设备包括:所述主设备和所述从设备;指示模块,用于根据所述唤醒时间和所述声音信息确定满足预设条件的目标设备,以指示所述目标设备响应所述语音信号。
在一个示例性实施例中,所述装置还包括:第一确定模块,根据所述唤醒时间确定所述所有设备中任意两个设备距离所述语音信号源的距离差;第二确定模块,根据所述距离差确定距离所述语音信号源最近的多个第一设备;获取模块,用于从所述声音信息中获取所述多个第一设备的多个第一声音信息;响应模块,用于从所述多个第一声音信息确定语音信号强度最强所对应的第一设备作为所述目标设备,以通过所述目标设备响应所述语音信号。
根据本发明实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述语音信号的响应方法。
根据本发明实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的语音信号的响应方法。
在本发明实施例中,确定目标区域的主设备和从设备,并通过所述主设备获取所有设备接收到语音信号源发出的语音信号的唤醒时间和声音信息,其中,所述唤醒时间用于指示设备与所述语音信号源的距离,所述声音信息用于指示设备检测到的所述语音信号的强度,所述所有设备包括:所述主设备和所述从设备;根据所述唤醒时间和所述声音信息确定满足预设条件的目标设备,以指示所述目标设备响应所述语音信号,即根据设备与语音信号源的距离和设备检测到的语音信号的强度确定目标设备。采用上述技术方案,解决了相关技术中,用户发出语音信号时,多个设备同时响应用户的语音信号等问题,进而使得在用户发出语音信号时,仅有一个设备响应用户,提高用户的体验感。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例的一种语音信号的响应方法的移动终端的硬件结构框图;
图2是根据本发明实施例的语音信号的响应方法的流程图;
图3是根据本发明实施例的语音信号的响应方法的对等网络部署示意图;
图4是根据本发明实施例的语音信号的响应方法的系统交互流程图;
图5是根据本发明实施例的语音信号的响应方法的计算距离差示意图;
图6是根据本发明实施例的用户处于中轴线的示意图;
图7是根据本发明实施例的语音信号的响应方法的选择方案顺序的示意图;
图8是根据本发明实施例的一种语音信号的响应装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本申请实施例所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明实施例的一种语音信号的响应方法的移动终端的硬件结构框图。如图1所示,移动终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,在一个示例性实施例中,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示等同功能或比图1所示功能更多的不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的语音信号的响应方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种语音信号的响应方法,应用于上述移动终端,图2是根据本发明实施例的语音信号的响应方法的流程图,该流程包括如下步骤:
步骤S202,确定目标区域的主设备和从设备,并通过所述主设备获取所有设备接收到语音信号源发出的语音信号的唤醒时间和声音信息,其中,所述唤醒时间用于指示设备接收到所述语音信号的时间,所述声音信息用于指示设备检测到的所述语音信号的强度,所述所有设备包括:所述主设备和所述从设备;
步骤S204,根据所述唤醒时间和所述声音信息确定满足预设条件的目标设备,以指示所述目标设备响应所述语音信号。
通过上述步骤,确定目标区域的主设备和从设备,并通过所述主设备获取所有设备接收到语音信号源发出的语音信号的唤醒时间和声音信息,其中,所述唤醒时间用于指示设备接收到所述语音信号的时间,所述声音信息用于指示设备检测到的所述语音信号的强度,所述所有设备包括:所述主设备和所述从设备;根据所述唤醒时间和所述声音信息确定满足预设条件的目标设备,以指示所述目标设备响应所述语音信号,即根据设备与语音信号源的距离和设备检测到的语音信号的强度确定目标设备。采用上述技术方案,解决了相关技术中,用户发出语音信号时,多个设备同时响应用户的语音信号等问题,进而使得在用户发出语音信号时,仅有一个设备响应用户,提高用户的体验感。
上述步骤S204可以有多种实现方式,本发明实施例主要提供了两种实现方案:
方案一:
根据所述唤醒时间确定所述所有设备中任意两个设备距离所述语音信号源的距离差;根据所述距离差确定距离所述语音信号源最近的多个第一设备;从所述声音信息中获取所述多个第一设备的多个第一声音信息;从所述多个第一声音信息确定语音信号强度最强所对应的第一设备作为所述目标设备,以通过所述目标设备响应所述语音信号。
换言之,目标区域中所有设备分为主设备和从设备两种类型的设备,其中,所有设备上均有测距引擎,所有设备之间通过对等网络保持时间的精密同步,从而所有设备可以将唤醒时间和声音信息发送至主设备,主设备通过唤醒时间分别确定两两设备之间的距离差,主设备通过测距引擎比较所有距离差,在所有设备中确定距离语音信号源的最近的多个第一设备,即多个第一设备与语音信号源的距离相同或相近,进而在获取多个第一设备的语音信号强度,在多个语音信号强度中确定语音信号最强的语音信号对应的设备,将该设备做为目标设备,进而使得有且仅有一个目标设备响应用户。
在一个示例性实施例中,分别获取所述所有设备中任意两个设备的距离差,得到多个距离差;在检测到所述多个距离差中的目标距离差小于预设阈值的情况下,将所述目标距离差对应的两个设备作为所述距离所述语音信号源最近的多个第一设备。
也就是说,根据所述唤醒时间分别确定所述所有设备距离所述语音信号源的多个距离之后,确定两两距离的多个距离差,首先通过距离差确定距离语音信号源最近的设备,然后确定与距离语音信号源最近的设备的距离差小于预设阈值的其他设备,将距离语音信号源最近的设备和与距离语音信号源最近的设备的距离差小于预设阈值的其他设备作为第一设备,也就是说,第一设备的数量为一个或多个。
在一个示例性实施例中,获取所述语音信号在空气中的传播速度;根据所述传播速度和所述任意两个设备的唤醒时间确定所述所有设备中任意两个设备距离所述语音信号源的距离差。
可以理解为,通过语音信号在空气中的传播速度和设备接收到语音信号的时间,即唤醒时间,计算两两设备之间的距离差。
举例来讲,假设用户家庭中有三个设备:设备A、设备B、设备C,声波速度为V,设备A的唤醒时间为t1,设备B的唤醒时间为t2,设备C的唤醒时间为t3,设备A接收到的语音信号的声音信息为X,设备B接收到的语音信号的声音信息为Y,设备C接收到的语音信号的声音信息为Z,设备A与设备B的距离差为d12=V(t1-t2),设备A与设备C的距离差为d12=V(t1-t3),设备B与设备C的距离差为d12=V(t2-t3),假设如果d12=-20cm,d13=-60cm,预设范围为[-50cm,+50cm],设备A与语音信号源的距离小于B,设备A与语音信号源的距离小于C,则设备A为距离语音信号源最近的设备,但是设备A与设备B的距离差为-20cm,在预设范围内,则设备A和设备B均作为第一设备,获取设备A和设备B的接收到的语音信号的声音信息,假设X>Y,则设备A即为目标设备,设备A响应语音信号。
方案二:
根据所述唤醒时间确定所述所有设备中任意两个设备距离所述语音信号源的距离差;根据所述距离差确定距离所述语音信号源最近的第二设备;根据所述声音信息确定所述第二设备的第二声音信息是否为所述所有设备中语音信号的强度最强的第二设备;在确定为是的情况下,将所述第二设备作为所述目标设备,以通过所述目标设备响应所述语音信号。
可以理解为,首先通过距离差确定距离语音信号源最近的第二设备,然后通过声音信息指示的声音强度确定声音强度最强的设备,判断声音强度最强的设备和距离语音信号源最近的第二设备是否是同一个设备,在是同一个设备的情况下,将所述第二设备作为所述目标设备,通过目标设备响应所述语音信号。
举例来讲,假设用户家庭中有三个设备:设备A、设备B、设备C,声波速度为V,设备A的唤醒时间为t1,设备B的唤醒时间为t2,设备C的唤醒时间为t3,设备A接收到的语音信号的声音信息为X,设备B接收到的语音信号的声音信息为Y,设备C接收到的语音信号的声音信息为Z,设备A与设备B的距离差为d12=V(t1-t2),设备A与设备C的距离差为d12=V(t1-t3),设备B与设备C的距离差为d12=V(t2-t3),假设如果d12=-20cm,d13=-60cm,设备A与语音信号源的距离小于B,设备A与语音信号源的距离小于C,则设备A为距离语音信号源最近的设备,假设X>Y,则设备A即为目标设备,设备A响应语音信号,假设X<Y,则设备A不为目标设备。
在一个示例性实施例中,通过确定所述目标区域内的所有设备;为所述所有设备建立对等网络,并在建立的所述对等网络中根据选举算法选举出所述主设备和所述从设备。
可以理解为,将目标区域中的所有设备构建对等网络,对等网络是去中心化的,不需要网关和其他第三方设备等“中心”的支持,对等网络可以通过wifi-mesh,ble-mesh或其他技术构建,在目标区域中的所有设备通过分布式选举算法协商出一个主设备,未被选举为主设备的设备为从设备,分布式选举算法可以从paxos,Raft,ZAB等中任选一种实现,本发明实施对构建对等网络的技术和分布式选举算法不做限定。需要说明的是主设备和从设备是动态调整的,当主设备出现异常时,选举算法会启动重新选举。
为了更好的理解上述语音信号的响应方法的过程,以下再结合可选实施例对上述语音信号的响应的实现方法流程进行说明,但不用于限定本发明实施例的技术方案。
在一个示例性实施例中,通过分布式部署语音设备,进而实现判断距离用户最近的语音设备且接收到的语音强度最强的语音设备,从而指挥该语音设备给应答用户以及后续的与用户进行交互,具体步骤如下:
步骤1:用户家庭存在多个语音设备(相当于上述实施例中的所有设备),例如,用户家庭存在语音音箱A,语音冰箱B,语音冰箱C,语音冰箱D;
步骤2:用户家里的语音设备通过无线网状网wifi mesh或者蓝牙mesh构建一个对等网络,设备可以通过对等网络将信息同时快速发布给网络上其他节点对应的设备上,如图3所示,图3是根据本发明实施例的语音信号的响应方法的对等网络部署示意图;
步骤3:对等网络中通过分布式选举算法协商出一个主设备,主设备启动测距引擎,各语音设备之间通过对等网络保持时间的精密同步;
步骤4::用户发出唤醒词,声波以340米/秒的速度到达各个语音设备;
步骤5:语音音箱A,语音冰箱B,语音冰箱C,语音冰箱D分别对唤醒词进行匹配,如果确定为目标唤醒词,则将收到唤醒词的时间和声音分贝(相当于上述实施例中的唤醒时间和声音信息)发到主设备;
步骤6:主设备从其他从设备收到对应的唤醒时间和声音分贝和主设备自己的唤醒时间和声音分贝,进而由测距引擎进行比较;
步骤7:测距引擎判断最近且声音分贝最强的设备,并通知该设备响应用户;
步骤8:被通知到的设备回复用户“在呢”或者其他语音,完成唤醒。
如图4所示,图4是根据本发明实施例的语音信号的响应方法的系统交互流程图,具体的:
步骤S401:分布式的所有语音设备构建对等网络,对等网络是去中心化的,不需要网关和其他第三方设备等“中心”的支持,对等网络可以通过无线网状网wifi-mesh,蓝牙网状网ble-mesh或其他技术构建;
步骤S402:所有语音设备通过分布式选举算法协商出一个主设备,未被选举为主设备的设备成为从设备;
需要说明的是,分布式选举算法可以从paxos,Raft,ZAB等中任选一种,主设备和从设备是动态调整的,当主设备出现异常时,选举算法会启动重新选举相互新的主设备。
步骤S403:选举出来的主设备给其他从设备同步精确时间;
需要说明的是,由于声波的速度是340米,一般用户家庭两个语音设备之间的距离在0.5~20米,所以为了避免误差太大,时间需要精确到0.0001。
步骤S404:用户发出唤醒词(相当于上述实施例中的语音信号);
步骤S405:所有语音设备分别都“听”到了的声音,语音设备并记录设备接收到唤醒词的时间和声音分贝;
步骤S406:收到用户语音的语音设备开始识别唤醒词,如果不是目标唤醒词则直接放弃;
步骤S407:如果确定识别为目标唤醒词,则计算声音分贝,并将收到唤醒词的时间和声音分贝数发到主设备;
步骤S408:主设备分别收到从设备的唤醒时间和声音分贝,由测距引擎计算距离差;
由测距引擎计算距离差,具体的步骤如下:
假设用户家庭中有三个设备:设备A、设备B、设备C,声波速度为V,设备A的唤醒时间为t1,设备B的唤醒时间为t2,设备C的唤醒时间为t3,设备A与设备B的距离差为d12=V(t1-t2),设备A与设备C的距离差为d12=V(t1-t3),设备B与设备C的距离差为d12=V(t2-t3),如图5所示,图5是根据本发明实施例的语音信号的响应方法的计算距离差示意图。
步骤S409:确定距离最近且声音分贝最强的语音设备为目标设备;
步骤S410:通知目标设备响应用户;
步骤S411:被通知到的语音设备回复用户“在呢”,完成唤醒。
上述步骤S409的实现方法有很多种,本发明可选实施例给出了一种实现方法,具体的:
步骤1:计算距离差;
具体的,假设设备A、设备B、设备C,声波速度为V,设备A的唤醒时间为t1,设备B的唤醒时间为t2,设备C的唤醒时间为t3,设备A与设备B的距离差为d12=V(t1-t2),设备A与设备C的距离差为d12=V(t1-t3),设备B与设备C的距离差为d12=V(t2-t3)。假设如果d12<0,设备A与用户的距离小于B,如果d13<0,设备A与语音信号源的距离小于C。
步骤2:确定声音分贝;
如果两个语音产品的距离差比较小,要考虑设备接收到的唤醒词的声音分贝,一般来讲,面向用户的语音设备接收到的声音分贝要大于背向或者侧向用户时的语音设备接收到的声音分贝,如图6所示,图6是根据本发明实施例的用户处于中轴线的示意图,当用户处于设备A和设备B的中轴线附近走动时,设备A和设备B离用户的距离差比较小,此时判断声音分贝大小,具体方法如下:选择距离差最小的两个点,如图7所示,如果设备A和设备B距离差>=50cm,则先判断距离,选择距离最近的设备做为目标设备。如果设备A和设备B距离差<50cm,则判断声音分贝,选择分贝最强设备做为目标设备。
通过上述步骤,确定目标区域的主设备和从设备,并通过所述主设备获取所有设备接收到语音信号源发出的语音信号的唤醒时间和声音信息,其中,所述唤醒时间用于指示设备接收到所述语音信号的时间,所述声音信息用于指示设备检测到的所述语音信号的强度,所述所有设备包括:所述主设备和所述从设备;根据所述唤醒时间和所述声音信息确定满足预设条件的目标设备,以指示所述目标设备响应所述语音信号,即根据设备与语音信号源的距离和设备检测到的语音信号的强度确定目标设备。采用上述技术方案,解决了相关技术中,用户发出语音信号时,多个设备同时响应用户的语音信号等问题,进而使得在用户发出语音信号时,仅有一个设备响应用户,提高用户的体验感。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
图8是根据本发明实施例的一种语音信号的响应装置的结构框图;如图8所示,包括:
生成模块82,用于确定目标区域的主设备和从设备,并通过所述主设备获取所有设备接收到语音信号源发出的语音信号的唤醒时间和声音信息,其中,所述唤醒时间用于指示设备接收到所述语音信号的时间,所述声音信息用于指示设备检测到的所述语音信号的强度,所述所有设备包括:所述主设备和所述从设备;
添加模块84,用于根据所述唤醒时间和所述声音信息确定满足预设条件的目标设备,以指示所述目标设备响应所述语音信号。
根据上述技术方案,确定目标区域的主设备和从设备,并通过所述主设备获取所有设备接收到语音信号源发出的语音信号的唤醒时间和声音信息,其中,所述唤醒时间用于指示设备接收到所述语音信号的时间,所述声音信息用于指示设备检测到的所述语音信号的强度,所述所有设备包括:所述主设备和所述从设备;根据所述唤醒时间和所述声音信息确定满足预设条件的目标设备,以指示所述目标设备响应所述语音信号,即根据设备与语音信号源的距离和设备检测到的语音信号的强度确定目标设备。采用上述技术方案,解决了相关技术中,用户发出语音信号时,多个设备同时响应用户的语音信号等问题,进而使得在用户发出语音信号时,仅有一个设备响应用户,提高用户的体验感。
可选地,所述装置还包括:第一确定模块,根据所述唤醒时间确定所述所有设备中任意两个设备距离所述语音信号源的距离差;第二确定模块,根据所述距离差确定距离所述语音信号源最近的多个第一设备;获取模块,用于从所述声音信息中获取所述多个第一设备的多个第一声音信息;响应模块,用于从所述多个第一声音信息确定语音信号强度最强所对应的第一设备作为所述目标设备,以通过所述目标设备响应所述语音信号。
换言之,目标区域中所有设备分为主设备和从设备两种类型的设备,其中,所有设备上均有测距引擎,所有设备之间通过对等网络保持时间的精密同步,从而所有设备可以将唤醒时间和声音信息发送至主设备,主设备通过唤醒时间分别确定两两设备之间的距离差,主设备通过测距引擎比较所有距离差,在所有设备中确定距离语音信号源的最近的多个第一设备,即多个第一设备与语音信号源的距离相同或相近,进而在获取多个第一设备的语音信号强度,在多个语音信号强度中确定语音信号最强的语音信号对应的设备,将该设备做为目标设备,进而使得有且仅有一个目标设备响应用户。
在一个示例性实施例中,获取模块,还用于分别获取所述所有设备中任意两个设备的距离差,得到多个距离差;在检测到所述多个距离差中的目标距离差小于预设阈值的情况下,将所述目标距离差对应的两个设备作为所述距离所述语音信号源最近的多个第一设备。
也就是说,根据所述唤醒时间分别确定所述所有设备距离所述语音信号源的多个距离之后,确定两两距离的多个距离差,首先通过距离差确定距离语音信号源最近的设备,然后确定与距离语音信号源最近的设备的距离差小于预设阈值的其他设备,将距离语音信号源最近的设备和与距离语音信号源最近的设备的距离差小于预设阈值的其他设备作为第一设备,也就是说,第一设备的数量为一个或多个。
在一个示例性实施例中,获取模块,还用于获取所述语音信号在空气中的传播速度;确定模块,还用于根据所述传播速度和所述任意两个设备的唤醒时间确定所述所有设备中任意两个设备距离所述语音信号源的距离差。
可以理解为,通过语音信号在空气中的传播速度和设备接收到语音信号的时间,即唤醒时间,计算两两设备之间的距离差。
举例来讲,假设用户家庭中有三个设备:设备A、设备B、设备C,声波速度为V,设备A的唤醒时间为t1,设备B的唤醒时间为t2,设备C的唤醒时间为t3,设备A接收到的语音信号的声音信息为X,设备B接收到的语音信号的声音信息为Y,设备C接收到的语音信号的声音信息为Z,设备A与设备B的距离差为d12=V(t1-t2),设备A与设备C的距离差为d12=V(t1-t3),设备B与设备C的距离差为d12=V(t2-t3),假设如果d12=-20cm,d13=-60cm,预设范围为[-50cm,+50cm],设备A与语音信号源的距离小于B,设备A与语音信号源的距离小于C,则设备A为距离语音信号源最近的设备,但是设备A与设备B的距离差为-20cm,在预设范围内,则设备A和设备B均作为第一设备,获取设备A和设备B的接收到的语音信号的声音信息,假设X>Y,则设备A即为目标设备,设备A响应语音信号。
在一个可选实施例中,第一确定模块,还用于根据所述唤醒时间确定所述所有设备中任意两个设备距离所述语音信号源的距离差;根据所述距离差确定距离所述语音信号源最近的第二设备;根据所述声音信息确定所述第二设备的第二声音信息是否为所述所有设备中语音信号的强度最强的第二设备;在确定为是的情况下,将所述第二设备作为所述目标设备,以通过所述目标设备响应所述语音信号。
可以理解为,首先通过距离差确定距离语音信号源最近的第二设备,然后通过声音信息指示的声音强度确定声音强度最强的设备,判断声音强度最强的设备和距离语音信号源最近的第二设备是否是同一个设备,在是同一个设备的情况下,将所述第二设备作为所述目标设备,通过目标设备响应所述语音信号。
举例来讲,假设用户家庭中有三个设备:设备A、设备B、设备C,声波速度为V,设备A的唤醒时间为t1,设备B的唤醒时间为t2,设备C的唤醒时间为t3,设备A接收到的语音信号的声音信息为X,设备B接收到的语音信号的声音信息为Y,设备C接收到的语音信号的声音信息为Z,设备A与设备B的距离差为d12=V(t1-t2),设备A与设备C的距离差为d12=V(t1-t3),设备B与设备C的距离差为d12=V(t2-t3),假设如果d12=-20cm,d13=-60cm,设备A与语音信号源的距离小于B,设备A与语音信号源的距离小于C,则设备A为距离语音信号源最近的设备,假设X>Y,则设备A即为目标设备,设备A响应语音信号,假设X<Y,则设备A不为目标设备。
在一个示例性实施例中,上述装置还包括:建立模块,用于通过确定所述目标区域内的所有设备;为所述所有设备建立对等网络,并在建立的所述对等网络中根据选举算法选举出所述主设备和所述从设备。
可以理解为,将目标区域中的所有设备构建对等网络,对等网络是去中心化的,不需要网关和其他第三方设备等“中心”的支持,对等网络可以通过wifi-mesh,ble-mesh或其他技术构建,在目标区域中的所有设备通过分布式选举算法协商出一个主设备,未被选举为主设备的设备为从设备,分布式选举算法可以从paxos,Raft,ZAB等中任选一种实现,本发明实施对构建对等网络的技术和分布式选举算法不做限定。需要说明的是主设备和从设备是动态调整的,当主设备出现异常时,选举算法会启动重新选举。
本发明的实施例还提供了一种存储介质,该存储介质包括存储的程序,其中,上述程序运行时执行上述任一项的方法。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的程序代码:
S1,确定目标区域的主设备和从设备,并通过所述主设备获取所有设备接收到语音信号源发出的语音信号的唤醒时间和声音信息,其中,所述唤醒时间用于指示设备接收到所述语音信号的时间,所述声音信息用于指示设备检测到的所述语音信号的强度,所述所有设备包括:所述主设备和所述从设备;
S2,根据所述唤醒时间和所述声音信息确定满足预设条件的目标设备,以指示所述目标设备响应所述语音信号。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,确定目标区域的主设备和从设备,并通过所述主设备获取所有设备接收到语音信号源发出的语音信号的唤醒时间和声音信息,其中,所述唤醒时间用于指示设备接收到所述语音信号的时间,所述声音信息用于指示设备检测到的所述语音信号的强度,所述所有设备包括:所述主设备和所述从设备;
S2,根据所述唤醒时间和所述声音信息确定满足预设条件的目标设备,以指示所述目标设备响应所述语音信号。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种语音信号的响应方法,其特征在于,包括:
确定目标区域的主设备和从设备,并通过所述主设备获取所有设备接收到语音信号源发出的语音信号的唤醒时间和声音信息,其中,所述唤醒时间用于指示设备接收到所述语音信号的时间,所述声音信息用于指示设备检测到的所述语音信号的强度,所述所有设备包括:所述主设备和所述从设备;
根据所述唤醒时间和所述声音信息确定满足预设条件的目标设备,以指示所述目标设备响应所述语音信号。
2.根据权利要求1所述的语音信号的响应方法,其特征在于,根据所述唤醒时间和所述声音信息确定满足预设条件的目标设备,包括:
根据所述唤醒时间确定所述所有设备中任意两个设备距离所述语音信号源的距离差;
根据所述距离差确定距离所述语音信号源最近的多个第一设备;
从所述声音信息中获取所述多个第一设备的多个第一声音信息;
从所述多个第一声音信息确定语音信号强度最强所对应的第一设备作为所述目标设备,以通过所述目标设备响应所述语音信号。
3.根据权利要求2所述的语音信号的响应方法,其特征在于,根据所述距离差确定距离所述语音信号源最近的多个第一设备,包括:
分别获取所述所有设备中任意两个设备的距离差,得到多个距离差;
在检测到所述多个距离差中的目标距离差小于预设阈值的情况下,将所述目标距离差对应的两个设备作为所述距离所述语音信号源最近的多个第一设备。
4.根据权利要求2所述的语音信号的响应方法,其特征在于,根据所述唤醒时间确定所述所有设备中任意两个设备距离所述语音信号源的距离差,包括:
获取所述语音信号在空气中的传播速度;
根据所述传播速度和所述任意两个设备的唤醒时间确定所述所有设备中任意两个设备距离所述语音信号源的距离差。
5.根据权利要求1所述的语音信号的响应方法,其特征在于,根据所述唤醒时间和所述声音信息确定满足预设条件的目标设备,包括:
根据所述唤醒时间确定所述所有设备中任意两个设备距离所述语音信号源的距离差;
根据所述距离差确定距离所述语音信号源最近的第二设备;
根据所述声音信息确定所述第二设备的第二声音信息是否为所述所有设备中语音信号的强度最强的第二设备;
在确定为是的情况下,将所述第二设备作为所述目标设备,以通过所述目标设备响应所述语音信号。
6.根据权利要求1所述的语音信号的响应方法,其特征在于,确定目标区域的主设备和从设备,包括:
确定所述目标区域内的所有设备;
为所述所有设备建立对等网络,并在建立的所述对等网络中根据选举算法选举出所述主设备和所述从设备。
7.一种语音信号的响应装置,其特征在于,包括:
接收模块,用于确定目标区域的主设备和从设备,并通过所述主设备获取所有设备接收到语音信号源发出的语音信号的唤醒时间和声音信息,其中,所述唤醒时间用于指示设备接收到所述语音信号的时间,所述声音信息用于指示设备检测到的所述语音信号的强度,所述所有设备包括:所述主设备和所述从设备;
指示模块,用于根据所述唤醒时间和所述声音信息确定满足预设条件的目标设备,以指示所述目标设备响应所述语音信号。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第一确定模块,根据所述唤醒时间确定所述所有设备中任意两个设备距离所述语音信号源的距离差;
第二确定模块,根据所述距离差确定距离所述语音信号源最近的多个第一设备;
获取模块,用于从所述声音信息中获取所述多个第一设备的多个第一声音信息;
响应模块,用于从所述多个第一声音信息确定语音信号强度最强所对应的第一设备作为所述目标设备,以通过所述目标设备响应所述语音信号。
9.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至6任一项中所述的方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至6任一项中所述的方法。
CN202110326971.5A 2021-03-26 2021-03-26 语音信号的响应方法和装置、存储介质及电子装置 Pending CN113241068A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110326971.5A CN113241068A (zh) 2021-03-26 2021-03-26 语音信号的响应方法和装置、存储介质及电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110326971.5A CN113241068A (zh) 2021-03-26 2021-03-26 语音信号的响应方法和装置、存储介质及电子装置

Publications (1)

Publication Number Publication Date
CN113241068A true CN113241068A (zh) 2021-08-10

Family

ID=77130521

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110326971.5A Pending CN113241068A (zh) 2021-03-26 2021-03-26 语音信号的响应方法和装置、存储介质及电子装置

Country Status (1)

Country Link
CN (1) CN113241068A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114121003A (zh) * 2021-11-22 2022-03-01 云知声(上海)智能科技有限公司 基于局域网的多智能设备协同语音唤醒方法
CN114422559A (zh) * 2021-12-31 2022-04-29 深圳海翼智新科技有限公司 设备的控制方法、装置、电子设备及存储介质
WO2024103926A1 (zh) * 2022-11-17 2024-05-23 Oppo广东移动通信有限公司 语音控制方法、装置、存储介质以及电子设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106847298A (zh) * 2017-02-24 2017-06-13 海信集团有限公司 一种基于弥漫式语音交互的拾音方法和装置
CN109391528A (zh) * 2018-08-31 2019-02-26 百度在线网络技术(北京)有限公司 语音智能设备的唤醒方法、装置、设备及存储介质
US20190341048A1 (en) * 2018-08-31 2019-11-07 Baidu Online Network Technology (Beijing) Co., Ltd. Method, Apparatus and Device for Interaction of Intelligent Voice Devices, and Storage Medium
CN111192591A (zh) * 2020-02-10 2020-05-22 百度在线网络技术(北京)有限公司 智能设备的唤醒方法、装置、智能音箱及存储介质
CN111833899A (zh) * 2020-07-27 2020-10-27 腾讯科技(深圳)有限公司 一种基于多音区的语音检测方法、相关装置及存储介质
CN111916079A (zh) * 2020-08-03 2020-11-10 深圳创维-Rgb电子有限公司 一种电子设备的语音响应方法、系统、设备和存储介质
CN112037789A (zh) * 2020-08-07 2020-12-04 海尔优家智能科技(北京)有限公司 设备唤醒方法、装置、存储介质及电子装置
CN112331214A (zh) * 2020-08-13 2021-02-05 北京京东尚科信息技术有限公司 设备唤醒方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106847298A (zh) * 2017-02-24 2017-06-13 海信集团有限公司 一种基于弥漫式语音交互的拾音方法和装置
CN109391528A (zh) * 2018-08-31 2019-02-26 百度在线网络技术(北京)有限公司 语音智能设备的唤醒方法、装置、设备及存储介质
US20190341048A1 (en) * 2018-08-31 2019-11-07 Baidu Online Network Technology (Beijing) Co., Ltd. Method, Apparatus and Device for Interaction of Intelligent Voice Devices, and Storage Medium
CN111192591A (zh) * 2020-02-10 2020-05-22 百度在线网络技术(北京)有限公司 智能设备的唤醒方法、装置、智能音箱及存储介质
CN111833899A (zh) * 2020-07-27 2020-10-27 腾讯科技(深圳)有限公司 一种基于多音区的语音检测方法、相关装置及存储介质
CN111916079A (zh) * 2020-08-03 2020-11-10 深圳创维-Rgb电子有限公司 一种电子设备的语音响应方法、系统、设备和存储介质
CN112037789A (zh) * 2020-08-07 2020-12-04 海尔优家智能科技(北京)有限公司 设备唤醒方法、装置、存储介质及电子装置
CN112331214A (zh) * 2020-08-13 2021-02-05 北京京东尚科信息技术有限公司 设备唤醒方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
徐鲁辉: "《Hadoop大数据原理与应用试验教程》", 31 January 2020, 西安电子科技大学出版社 *
谭粤飞 等: "《区块链技术基础教程》", 31 May 2020, 东北财经大学出版社 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114121003A (zh) * 2021-11-22 2022-03-01 云知声(上海)智能科技有限公司 基于局域网的多智能设备协同语音唤醒方法
CN114422559A (zh) * 2021-12-31 2022-04-29 深圳海翼智新科技有限公司 设备的控制方法、装置、电子设备及存储介质
WO2024103926A1 (zh) * 2022-11-17 2024-05-23 Oppo广东移动通信有限公司 语音控制方法、装置、存储介质以及电子设备

Similar Documents

Publication Publication Date Title
CN113241068A (zh) 语音信号的响应方法和装置、存储介质及电子装置
CN111510923A (zh) 一种通信方法、装置及系统
EP3369215B1 (en) Bulk propagation timing measurement messaging
CN111640431B (zh) 一种设备响应处理方法及装置
CN111093261A (zh) 定时提前量的确定方法、装置、设备及介质
CN115379420A (zh) 用于执行感知任务的通信方法及通信装置
CN103687001A (zh) 一种进行定位的方法和设备
US10425911B2 (en) Positioning apparatus and method
EP3368915B1 (en) Bulk fine timing measurement message scheduling
CN107645771B (zh) 一种定位方法及装置
CN111972016A (zh) 定位方法、装置、终端、网络侧设备和存储介质
CN110933741B (zh) 用户设备的定位方法及装置
KR102454365B1 (ko) 위치 측정 장치 및 방법, 위치 측정을 위한 데이터베이스 구축 장치 및 방법
CN115914986A (zh) 感知数据传输方法、设备、装置及存储介质
EP3369214B1 (en) Bulk fine timing measurement allocation message
CN111182612B (zh) 一种自组网中节点的入网同步方法及装置
CN110346754B (zh) 一种定位时刻获取方法及装置
CN111417143B (zh) 小区上报方法及网络设备
CN111385817B (zh) 邻区上报方法、装置、e-smlc及终端
CN115955724A (zh) 通信业务处理方法、装置、基站及存储介质
US10271228B2 (en) Systems and methods for automatically assigning an area code to a radio access network (RAN) node
CN109714722B (zh) 室内天线的管理方法、装置、电子设备及存储介质
WO2017074748A1 (en) Location detection using bulk fine timing
JP2021078043A (ja) 多数のアンテナを選択的に使用する制御装置、制御方法、及びプログラム。
CN111586700A (zh) 一种信号覆盖范围的调整方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210810

RJ01 Rejection of invention patent application after publication