CN110072177B - 空间划分信息获取方法、装置及存储介质 - Google Patents

空间划分信息获取方法、装置及存储介质 Download PDF

Info

Publication number
CN110072177B
CN110072177B CN201910363989.5A CN201910363989A CN110072177B CN 110072177 B CN110072177 B CN 110072177B CN 201910363989 A CN201910363989 A CN 201910363989A CN 110072177 B CN110072177 B CN 110072177B
Authority
CN
China
Prior art keywords
sound signal
sound
direct
spatial
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910363989.5A
Other languages
English (en)
Other versions
CN110072177A (zh
Inventor
王昭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Technology Wuhan Co Ltd
Original Assignee
Beijing Xiaomi Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Intelligent Technology Co Ltd filed Critical Beijing Xiaomi Intelligent Technology Co Ltd
Priority to CN201910363989.5A priority Critical patent/CN110072177B/zh
Publication of CN110072177A publication Critical patent/CN110072177A/zh
Priority to US16/695,699 priority patent/US10999691B2/en
Priority to EP19217171.8A priority patent/EP3734992A1/en
Application granted granted Critical
Publication of CN110072177B publication Critical patent/CN110072177B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/301Automatic calibration of stereophonic sound system, e.g. with test microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/12Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本公开是关于一种空间划分信息获取方法、装置及存储介质,属于智能家居技术领域。所述方法包括:控制声源设备播放第一声音信号;获取第二声音信号;根据第二声音信号获取直达强度信息;根据直达强度信息获取空间划分信息,空间划分信息用于指示声源设备和声音采集设备是否处于同一空间区域。由于声源设备与声音采集设备是否处于同一空间区域(比如是否同一房间)内,对声音采集设备接收到的由声源设备发出的直达声音信号的强度有很大的影响,因此,本公开通过直达强度信息可以很容易区分两个声源设备与声音采集设备是否处于同一空间区域,从而提高了智能家居设备的空间划分的准确性。

Description

空间划分信息获取方法、装置及存储介质
技术领域
本公开实施例涉及智能家居技术领域,特别涉及一种空间划分信息获取方法、装置及存储介质。
背景技术
随着人工智能技术领域的不断发展,在智能家居设备中的应用越来越多,在人们日常生活的家居环境中,布置多台语音功能的智能家居设备以提高语音播放效果也已经非常普遍。
相关技术中,可以对实际布置的位置所处的空间进行划分,例如,通过智能家居设备向空间播放一个声音信号,通过自身的接收器感知接收到的声音信号,确定空间的房间冲击响应(Room Impulse Response,RIR),通过RIR进一步得到房间的混响时间,根据房间的混响时间反推得到该智能家居设备所处空间的区域大小,将不同智能家居设备各自计算得到的区域大小相互比较,从而确定不同的智能家居设备是否处于同一个区域内。
发明内容
本公开实施例提供了一种空间划分信息获取方法、装置及存储介质。所述技术方案如下:
根据本公开实施例的一个方面,提供了一种空间划分信息获取方法,所述方法包括:
控制声源设备播放第一声音信号;
获取第二声音信号,所述第二声音信号是所述第一声音信号传播到声音采集设备时,由所述声音采集设备采集到的声音信号;
根据所述第二声音信号获取直达强度信息,所述直达强度信息用于指示所述第二声音信号中的直达声音信号的强度;所述直达声音信号是从所述声源设备处触发且未经物理反射到达所述声音采集设备的声音信号;
根据所述直达强度信息获取空间划分信息,所述空间划分信息用于指示所述声源设备和所述声音采集设备是否处于同一空间区域。
可选的,所述第二声音信号是所述声音采集设备中的麦克风阵列采集到的声音信号,所述麦克风阵列包含至少两个麦克风;
所述根据所述第二声音信号获取直达强度信息,包括:
获取空间分布信息,所述空间分布信息用于指示所述至少两个麦克风之间的空间分布关系;
根据所述空间分布信息,获取所述第二声音信号的空间相关性矩阵;
根据所述空间相关性矩阵以及所述第二声音信号获取所述直达强度信息。
通过上述可选实现方式,可以根据空间分布信息获取到空间相关性矩阵,并根据控件相关性矩形获取到直达强度信息,提供了一种从第二声音信号中获取到直达声音信号的强度的方案。
可选的,所述获取空间分布信息,包括:
构建包含所述至少两个麦克风的空间坐标系;
获取所述至少两个麦克风分别在所述空间坐标系内的空间坐标;
获取包含所述至少两个麦克风分别在所述空间坐标系内的空间坐标的所述空间分布信息。
通过上述可选实现方式,控制设备通过建立空间坐标系,来确定至少两个麦克风的空间坐标,并获取包含至少两个麦克风分别在空间坐标系内的空间坐标的空间分布信息,提供一种用于从第二声音信号中获取到直达声音信号的空间分布信息获取方案。
可选的,所述根据所述空间分布信息,获取所述第二声音信号的空间相关性矩阵,包括:
获取直达角,所述直达角是所述第一声音信号的发射源与所述空间坐标系的原点之间的连线与第一坐标轴之间的夹角,所述第一坐标轴是所述空间坐标系中的任一坐标轴;
根据所述直达角以及所述至少两个麦克风在所述空间坐标系内的空间坐标,获取所述第二声音信号的空间相关性矩阵。
通过上述可选实现方式,通过控制设备中预先设置的算法获取直达角,并根据直达角获取空间相关性矩阵,从而提供了一种结合空间分布信息获取空间相关性矩阵的方案。
可选的,所述根据所述空间相关性矩阵以及所述第二声音信号获取所述直达强度信息,包括:
根据所述空间相关性矩阵以及所述第二声音信号构建目标方程,所述目标方程中的未知量为所述直达声音信号以及混响声音信号,所述混响声音信号是从所述声源设备处触发且经物理反射到达所述声音采集设备的声音信号;
通过最小二乘法对所述目标方程求伪逆,获取所述直达强度信息。
通过上述可选实现方式,通过空间相关性矩阵以及所述第二声音信号构建目标方程来获取直达强度信息,从而提供一种根据空间相关性矩阵获取第二声音信号中的直达声音信号的强度的方案。
可选的,所述根据所述直达强度信息获取空间划分信息,包括:
根据所述直达信号强度与信号强度阈值之间的大小关系,获取所述空间划分信息。
通过上述可选实现方式,由于直达信号强度在相同空间区域以及不同空间区域的值具有较大的差异,利用获取的直达信号强度与信号强度阈值之间的大小关系,即可以实现空间划分,从而提高了空间划分的便捷性和可靠性。
可选的,所述根据所述直达信号强度与信号强度阈值之间的大小关系,获取所述空间划分信息之前,还包括:
获取所述第一声音信号的信号强度;
根据所述第一声音信号的信号强度获取所述信号强度阈值。
通过上述可选实现方式,控制设备也可以获取到第一声音信号的信号强度,根据对应的信号强度确定相应的信号强度阈值,从而提高直达信号强度进行对比以及空间划分的准确性。
根据本公开实施例的另一个方面,提供了一种空间划分信息获取装置,所述装置包括:
控制模块,用于控制声源设备播放第一声音信号;
声音信号获取模块,用于获取第二声音信号,所述第二声音信号是所述第一声音信号传播到声音采集设备时,由所述声音采集设备采集到的声音信号;
强度信息获取模块,用于根据所述第二声音信号获取直达强度信息,所述直达强度信息用于指示所述第二声音信号中的直达声音信号的强度;所述直达声音信号是从所述声源设备处触发且未经物理反射到达所述声音采集设备的声音信号;
空间划分信息获取模块,用于根据所述直达强度信息获取空间划分信息,所述空间划分信息用于指示所述声源设备和所述声音采集设备是否处于同一空间区域。
可选的,所述第二声音信号是所述声音采集设备中的麦克风阵列采集到的声音信号,所述麦克风阵列包含至少两个麦克风;
所述强度信息获取模块,包括:
空间分布信息获取子模块,用于获取空间分布信息,所述空间分布信息用于指示所述至少两个麦克风之间的空间分布关系;
相关性矩阵获取子模块,用于根据所述空间分布信息,获取所述第二声音信号的空间相关性矩阵;
强度信息获取子模块,用于根据所述空间相关性矩阵以及所述第二声音信号获取所述直达强度信息。
可选的,所述空间分布信息获取子模块,包括:
坐标系构建单元,用于构建包含所述至少两个麦克风的空间坐标系;
坐标获取单元,用于获取所述至少两个麦克风分别在所述空间坐标系内的空间坐标;
空间分布信息获取单元,用于获取包含所述至少两个麦克风分别在所述空间坐标系内的空间坐标的所述空间分布信息。
可选的,所述相关性矩阵获取子模块,包括:
直达角获取单元,用于获取直达角,所述直达角是所述第一声音信号的发射源与所述空间坐标系的原点之间的连线与第一坐标轴之间的夹角,所述第一坐标轴是所述空间坐标系中的任一坐标轴;
相关性矩阵获取单元,用于根据所述直达角以及所述至少两个麦克风分别在所述空间坐标系内的空间坐标,获取所述第二声音信号的空间相关性矩阵。
可选的,所述强度信息获取子模块,包括:
方程构建单元,用于根据所述空间相关性矩阵以及所述第二声音信号构建目标方程,所述目标方程中的未知量为所述直达声音信号以及混响声音信号,所述混响信号是从所述声源设备处触发且经物理反射到达所述声音采集设备的声音信号;
强度信息获取单元,用于通过最小二乘法对所述目标方程求伪逆,获取所述直达强度信息。
可选的,所述空间划分信息取模块,用于根据所述直达信号强度与信号强度阈值之间的大小关系,获取所述空间划分信息。
可选的,所述装置还包括:
大小关系获取模块,用于在所述空间划分信息获取模块根据所述直达信号强度与信号强度阈值之间的大小关系,获取所述空间划分信息之前,获取所述第一声音信号的信号强度;
阈值获取模块,用于根据所述第一声音信号的信号强度获取所述信号强度阈值。
根据本公开实施例的另一个方面,提供了一种空间划分信息获取装置,所述装置包括:
处理器;
用于存储所述处理器的可执行指令的存储器;
其中,所述处理器被配置为:
控制声源设备播放第一声音信号;
获取第二声音信号,所述第二声音信号是所述第一声音信号传播到声音采集设备时,由所述声音采集设备采集到的声音信号;
根据所述第二声音信号获取直达强度信息,所述直达强度信息用于指示所述第二声音信号中的直达声音信号的强度;所述直达声音信号是从所述声源设备处触发且未经物理反射到达所述声音采集设备的声音信号;
根据所述直达强度信息获取空间划分信息,所述空间划分信息用于指示所述声源设备和所述声音采集设备是否处于同一空间区域。
根据本公开实施例的另一个方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中包含可执行指令,由处理器调用所述可执行指令以实现如上述第一方面以及第一方面任一可选实现方式所述的空间划分信息获取方法。
本公开实施例提供的技术方案可以包括以下有益效果:
通过控制声源设备播放第一声音信号,获取由声音采集设备采集到的声音信号,根据采集到的声音信号中的直达强度信息完成对声源设备以及声音采集设备的空间划分,由于声源设备与声音采集设备是否处于同一空间区域(比如是否同一房间)内,对声音采集设备接收到的由声源设备发出的直达声音信号的强度有很大的影响,因此,通过直达强度信息可以很容易区分两个声源设备与声音采集设备是否处于同一空间区域,从而提高了智能家居设备的空间划分的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是本公开实施例提供的一种智能家居设备的应用场景的空间布局示意图;
图2是本公开实施例涉及公式【2】的一种声音信号能量随时间变化的示意图;
图3是根据一示例性实施例示出的一种空间划分信息获取方法的流程图;
图4是根据一示例性实施例示出的一种空间划分信息获取方法的流程图;
图5是本公开实施例涉及的一种声音采集设备的结构示意图;
图6是本公开实施例涉及的一种声音采集设备的构建的空间坐标系的示意图;
图7是本公开实施例涉及的一种智能家居设备的空间分布的结构示意图;
图8是本公开实施例涉及的一种第二声音信号中直达声音能量与第一声音信号的音量之间的关系图;
图9是根据另一示例性实施例示出的一种空间划分信息获取装置的框图;
图10是根据一示例性实施例示出的一种用于智能家居设备的装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
本公开实施例描述的智能家居应用场景是为了更加清楚地说明本公开实施例的技术方案,并不构成对本公开实施例提供的技术方案的限定,本领域普通技术人员可知,随着新的智能家居设备的出现,本公开实施例提供的技术方案对于类似的技术问题,同样适用。
为了便于理解,下面首先对本申请实施例涉及的一些名词以及应用场景进行简单介绍。
房间冲击响应(Room Impulse Response,RIR):室内声学中,将系统脉冲在室内的脉冲响应函数称为房间冲击响应。对于同一房间,声源到接收点的脉冲响应是唯一的,包含了室内声场的所有声学特性。
直达声(Direct Sound):从声源发出未经任何反射,直接到达接收点的声音信号。
早期反射声(Early Reflections):从声源发出,经室内墙壁、天花板或者地面反射1~2次后到达接收点的声音。一般比直达声晚到 50ms以内的反射声均属于早期反射声。
混响声(Reverberation):从声源发出,比直达声晚到50ms以上的多次反射声均称为混响声。
混响时间(Reverberation Time):指声源停止发声后,发出的声音信号的声能密度降低为从声源发出的声音信号的声能密度的1/ (10^6)时所需的时间,或者,发出的声音信号的声压级衰变60分贝所需要的时间。
请参考图1,其示出了本公开实施例提供的一种智能家居设备的应用场景的空间布局示意图。如图1所示,在房间100中,包含了若干个智能家居设备101。
其中,智能家居设备101是具有放音功能和/或拾音功能的家居设备。例如,智能家居设备101可以包括但不限于智能电视、智能机器人、智能音箱、智能冰箱、智能空调、智能电饭煲、智能传感器(比如红外传感器、光线传感器、震动传感器以及声音传感器等)、智能净水器等固定安装或者小范围移动的设备。或者,智能家居设备101 也可以是MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、智能蓝牙耳机等移动设备。
可选的,各个智能家居设备之间还可以通过有线网络或无线网络相连,可选地,无线网络或者有线网络使用标准通信技术和/或协议。网络通常为因特网、但也可以是任何网络,包括但不限于局域网 (Local AreaNetwork,LAN)、城域网(Metropolitan AreaNetwork, MAN)、广域网(Wide Area Network,MAN)、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合。在一些实施例中,使用包括超文本标记语言(Hyper TextMark-up Language,HTML)、可扩展标记语言(Extensible Markup Language,XML)等的技术和/或格式来代表通过网络交换的数据。此外还可以使用诸如安全套接字层(SecureSocket Layer,SSL)、传输层安全(Transport Layer Security,TLS)、虚拟专用网络(Virtual Private Network,VPN)、网际协议安全(Internet Protocol Security,IPsec)等常规加密技术来加密所有或者一些链路。在另一些实施例中,还可以使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。
可选的,在房间100中,还可以包含一个或者多个控制设备102,控制设备102可以通过上述有线网络或无线网络与智能家居设备101 相连,用户可以通过对控制设备102的控制,使得相应的智能家居设备执行相应的操作。可选的,该控制设备102可以是智能终端。可选的,智能终端可以是智能手机、平板电脑、电子书阅读器、智能眼镜、智能手表等。例如,用户可以通过智能手机,控制智能家居设备中的 A设备向B设备发送数据或者信号,或者,用户通过智能手机,控制智能家居设备中的智能冰箱的温度等等。
其中,在一种可能的实现方式中,上述智能家居设备101中的一个或者多个设备也可以作为上述控制设备102。
在相关技术中,需要对智能家居设备进行房间划分时,可以通过各个智能家居设备对各自所在的空间大小进行计算,例如,可以采用基于声音的判决方法。比如:在一个房间中,当该智能家居设备作为声源,发出一个声音信号之后,该智能家居设备的接收端可以接收到自身发出的声音信号。其中,该智能家居设备的接收端接收到的声音信号不仅包含该智能家居设备自身发出声音信号的声源(发送端)直接传达至接收端的声音信号,还包含该智能家居设备自身发出的声音信号经房间墙壁、天花板以及其他物品反射形成的声音信号(反射声)。因此,智能家居设备的接收端接收到的声音信号是该智能家居设备发送端发出的原声音信号的直达声和反射声叠加形成的。其中,该反射声可以反应该智能家居设备所在房间的大小以及反射特性,其中,房间的反射特性一般不会发生改变,即,接收端接收的声音信号可以看做是直达声信号在时域上卷积了房间冲击响应RIR后得到的声音信号,因此,可以通过求得房间的RIR,进一步确定出房间的混响时间,根据房间的混响时间反推得到该智能家居设备所处空间的区域大小,从而将自身划分在计算的空间区域大小范围内。
在一种可能实现的方式中,该智能家居设备的接收端接收到发送端发出的声音信号与房间冲击响应之间的关系表达式可以如公式【1】所示:
h(k)=Ry(k)=W[y(n)y*(n-k)]; 【1】
其中,h(k)是房间冲击响应的时域表示,k为时域上的偏移量; Ry(k)是智能家居设备的接收端接收到发送端发出的声音信号的自相关函数;W表示接收信号的归一化能量;y(n)是智能家居设备的接收端接收到发送端发出的声音信号,n为此次播放声音信号的第n时刻;
智能家居设备可以根据接收到的声音信号得到上述公式【1】,对其进行解卷积,得到归一化能量W的曲线表达式,如公式【2】所示:
Figure GDA0002723762300000101
其中,G为常数,t为对应的接收到的声音信号的时间。上述公式表示归一化能量W是房间冲击响应的平方在连续时间上的积分。可选的,当归一化能量W按照离散时间点表示时,可以表示为:
Figure GDA0002723762300000102
智能家居设备可以通过上述公式【2】,进一步得到对应各个时间点上接收到的声音信号强度。请参考图2,其示出了本公开实施例涉及公式【2】的一种声音信号能量随时间变化的示意图。如图2所示,横轴代表时间t(s),纵轴代表归一化能量W(dB),即,对应接收到的声音信号强度。
一般的,开发人员可以通过经验,在智能家居设备中设置归一化能量的衰减范围,以便于智能家居设备可以对归一化能量数据进行选择确定,从而推算出房间混响时间。例如:统计[-5dB,-35dB]接收到的声音信号强度内的信号衰减时间,从而进一步得到相应的房间混响时间,反推出房间的大小。后续利用不同智能家居设备各自计算得到的房间大小进行比较,将房间大小相同或者相近的智能家居设备划分在相同的空间区域内,从而完成对智能家居设备的空间划分。
相关技术中,采用智能家居设备对自身播放的声音信号进行采集,该过程中,通过智能家居设备采集自身播放的声音信号计算房间内的 RIR值,推算房间大小,通过不同智能家居设备得到的房间大小进行对比,判断不同的智能家居设备是否处于同一个房间区域内,从而对智能家居设备的空间区域划分。当处于不同房间的智能家居设备,计算出的房间大小相近时,或者,不同房间内的RIR相近时,则会存在将不同房间的智能家居设备划分在相同的空间区域内,使得空间划分结果的准确性不高等问题。
在本公开提供的技术方案中,对于智能家居设备的应用场景,通过声源设备播放第一声音信号,声音采集设备采集第二声音信号,获取第二声音信号中的直达声音信号,以此作为智能家居设备的空间划分的依据,以提高智能家居设备进行空间划分时的准确性。下面,将通过几个实施例,对本公开提供的技术方案进行介绍说明。
图3是根据一示例性实施例示出的一种空间划分信息获取方法的流程图。该方法可应用于图1所示的智能家居设备的应用场景中。该方法可以包括如下几个步骤:
在步骤301中,控制声源设备播放第一声音信号。
在步骤302中,获取第二声音信号。
其中,第二声音信号是第一声音信号传播到声音采集设备时,由声音采集设备采集到的声音信号。
在步骤303中,根据第二声音信号获取直达强度信息。
其中,直达强度信息用于指示第二声音信号中的直达声音信号的强度;直达声音信号是从声源设备处触发且未经物理反射到达声音采集设备的声音信号。
在步骤304中,根据直达强度信息获取空间划分信息。
其中,空间划分信息用于指示声源设备和声音采集设备是否处于同一空间区域。
可选的,第二声音信号是声音采集设备中的麦克风阵列采集到的声音信号,麦克风阵列包含至少两个麦克风;
上述根据第二声音信号获取直达强度信息,包括:
获取空间分布信息,空间分布信息用于指示至少两个麦克风之间的空间分布关系;
根据空间分布信息,获取第二声音信号的空间相关性矩阵;
根据空间相关性矩阵以及第二声音信号获取直达强度信息。
可选的,上述获取空间分布信息,包括:
构建包含至少两个麦克风的空间坐标系;
获取至少两个麦克风分别在所述空间坐标系内的空间坐标;
获取包含至少两个麦克风分别在空间坐标系内的空间坐标的空间分布信息。
可选的,上述根据空间分布信息,获取第二声音信号的空间相关性矩阵,包括:
获取直达角,直达角是第一声音信号的发射源与空间坐标系的原点之间的连线与第一坐标轴之间的夹角,第一坐标轴是空间坐标系中的任一坐标轴;
根据直达角以及至少两个麦克风分别在所述空间坐标系内的空间坐标,获取麦克风阵列的空间相关性矩阵。
可选的,上述根据空间相关性矩阵以及第二声音信号获取直达强度信息,包括:
根据空间相关性矩阵以及第二声音信号构建目标方程,目标方程中的未知量为直达声音信号以及混响声音信号,混响信号是从声源设备处触发且经物理反射到达声音采集设备的声音信号;
通过最小二乘法对目标方程求伪逆,获取直达强度信息。
可选的,上述根据直达强度信息获取空间划分信息,包括:
根据直达信号强度与信号强度阈值之间的大小关系,获取空间划分信息。
可选的,上述根据直达信号强度与信号强度阈值之间的大小关系,获取空间划分信息之前,还包括:
获取第一声音信号的信号强度;
根据第一声音信号的信号强度获取信号强度阈值。
综上所述,本公开通过控制声源设备播放第一声音信号,获取由声音采集设备采集到的声音信号,根据采集到的声音信号中的直达强度信息完成对声源设备以及声音采集设备的空间划分,由于声源设备与声音采集设备是否处于同一空间区域(比如是否同一房间)内,对声音采集设备接收到的由声源设备发出的直达声音信号的强度有很大的影响,因此,通过直达强度信息可以很容易区分两个声源设备与声音采集设备是否处于同一空间区域,从而提高了智能家居设备的空间划分的准确性。
图4是根据一示例性实施例示出的一种空间划分信息获取方法的流程图。该方法可应用于图1所示的智能家居设备的应用场景中。该方法可以由控制设备执行,该方法可以包括如下几个步骤:
在步骤401中,控制声源设备播放第一声音信号。
控制设备对声源设备和声音采集设备进行空间划分,以确定这两个设备是否处于同一空间区域(比如同一房间)时,可以控制声源设备播放第一声音信号,可选的,该智能家居设备可以是上述图1所示的应用场景中的控制设备。第一声音信号可以是一段歌曲、一段录音、一段广播等。例如,用户可以通过智能手机,控制智能音箱播放一段歌曲,或者,打开智能收音机播放广播等。
在步骤402中,获取第二声音信号。
其中,第二声音信号是第一声音信号传播到声音采集设备时,由声音采集设备采集到的声音信号。
在智能家居设备的应用场景中,具有声音采集功能的声音采集设备可以对声源设备播放的第一声音信号进行采集。其中,声音采集设备在采集声源设备播放的第一声音信号,是第一声音信号直接传播至声音采集设备的以及通过空间中的物体进行反射,再次到达声音采集设备,被声音采集设备采集到的声音信号,即,声音采集设备获取的第二声音信号中,既包含第一声音信号直接传播至声音采集设备的声音信号(即,未经物理反射),也包含通过空间中的物体进行反射(即,经过物理反射),再次到达声音采集设备的声音信号。可选的,反射第一声音信号的物体可以是空间中的墙壁、天花板、地面以及室内的其他智能家居设备等。可选的,该声音采集设备也可以是一个智能音箱。
可选的,声音采集设备可以将采集到的第二声音信号发送给控制设备,从而使得控制设备获取到第二声音信号。比如,该控制设备可以是独立于声音采集设备和声源设备之外的设备,比如智能终端、智能路由器或者服务器等;或者,该控制设备也可以是声源设备。
可选的,上述控制设备也可以是声音采集设备,即控制设备通过内置的声音采集组件(比如麦克风组件)采集获得上述第二声音信号。
可选的,通过声源设备播放的第一声音信号,通过空间传播,被声音采集设备采集。声音采集设备采集到的第二声音信号与声源设备播放的第一声音信号之间可以通过时域的函数表达式表示或者频域的函数表达式表示。例如,以两者之间的函数表达式在频域表达为例,声音采集设备采集到的第二声音信号可以通过空间传递函数H(ω) 来表示,其中,由于频域的空间传递函数H(ω)可以分解为两个部分,直达成分函数HD(ω)和混响成分函数HR(ω),其中,直达成分函数HD(ω)即对应上述从声源设备处触发且未经物理反射到达声音采集设备的声音信号的函数,混响成分函数HR(ω)即对应上述从声源设备处触发且经过物理反射到达声音采集设备的声音信号的函数。可选的,在混响成分函数HR(ω)中,还可以表示早期混响成分的声音信号。可选的,如上图2所示,早期混响成分的声音信号可以是t1至t2内包含的声音信号。可选的,t1至t2可以由开发人员预先在声源采集设备中设置。其中,ω是声源设备播放的第一声音信号的频率。
可选的,声音采集设备可以通过自身的麦克风采集声音信号,例如,该声音采集设备可以拥有一个麦克风阵列,该麦克风阵列中包含至少两个麦克风,请参考图5,其示出了本公开实施例涉及的一种声音采集设备的结构示意图,如图5所示,在声音采集设备500中,包含了多个麦克风501,多个麦克风组成麦克风阵列,可选的,声音采集设备可以通过这多个麦克风共同采集声源设备发送的第一声音信号,将各个麦克风采集到的声音信号进行叠加,从而得到第二声音信号。例如,对于声音采集设备拥有M个麦克风的麦克风阵列,其中第m个麦克风接收到的声音信号可以按照公式【3】表示为:
X(m)(ω,t)=[HD (m)(ω,t)+HR (m)(ω,t)]*S(ω,t); 【3】
其中,X(m)(ω,t)是对应第m个麦克风接收到的声音信号, HD (m)(ω,t)是对应于第m个麦克风接收到的声音信号的直达成分函数,HR (m)(ω,t)对应于第m个麦克风接收到的声音信号的混响成分函数,t是对应声源设备播放第一声音信号的时间,S表示是声源设备播放的第一声音信号。
在步骤403中,获取空间分布信息。
其中,空间分布信息用于指示至少两个麦克风之间的空间分布关系,即,当上述声音采集设备包含麦克风阵列时,指示该麦克风阵列中各个麦克风之间的空间分布关系。
可选的,控制设备可以根据至少两个麦克风之间的相对位置关系获取该至少两个麦克风的空间分布信息。比如,控制设备中可以预先存储声音采集设备中的麦克风阵列的阵列结构以及阵列尺寸,该阵列结构可以包括阵列中的各个麦克风之间的相对方向,控制设备结合阵列结构和阵列尺寸可以获取到上述空间分布信息。或者,控制设备也可以从其它设备中获取到麦克风阵列的阵列结构以及阵列尺寸,比如,控制设备可以从服务器或者声音采集设备中获取到麦上述克风阵列的阵列结构以及阵列尺寸。
在一种可能实现的方式中,控制设备在获取声音采集设备的麦克风阵列的空间分布信息时,可以先构建麦克风阵列的空间坐标系,即,构建包含至少两个麦克风的空间坐标系;进一步获取至少两个麦克风分别各自在空间坐标系中的坐标;从而获取包含至少两个麦克风分别在空间坐标系内的空间坐标的空间分布信息。
可选的,控制设备在构建空间坐标系时,可以根据预先存储的坐标原点建立空间坐标系,例如,开发人员可以选择麦克风阵列其中的一个麦克风作为坐标原点,当声音采集设备在需要构建空间坐标系时,根据该麦克风作为原点建立坐标系;或者,开发人员也可以选择麦克风阵列中各个麦克风阵列的几何中心作为坐标原点。可选的,该空间坐标系可以是三维的,也可以是二维的。例如,声音采集设备的麦克风阵列以平面形式排列时,该声音采集设备构建的空间坐标系可以是二维的。请参考图6,其示出了本公开实施例涉及的一种声音采集设备的构建的空间坐标系的示意图,如图6所示,其中包含了原点麦克风601,坐标轴一602,坐标轴二603。其中,坐标轴一以及坐标轴二的方向也可以由开发人员预先设置。
在步骤404中,根据空间分布信息,获取第二声音信号的空间相关性矩阵。
可选的,控制设备可以根据获取到的空间分布信息,获取到第二声音信号的空间相关性矩阵R(ω)。在一种可能实现的方式中,控制设备可以先获取直达角,其中,该直达角是第一声音信号的发射源与空间坐标系的原点之间的连线与第一坐标轴之间的夹角,第一坐标轴是空间坐标系中的任一坐标轴。可选的,该第一坐标轴可以是开发人员预先指定的一个坐标轴。例如,当上述构建的坐标系为二维直角坐标系,开发人员可以预先指定以构建的坐标轴中y轴为第一坐标轴。请参考图7,其示出了本公开实施例涉及的一种智能家居设备的空间分布的结构示意图。如图7所示,其中包含了声源设备701,声音采集设备702,坐标轴原点703,坐标轴一704,坐标轴二705,第m 个麦克风706,直达角θ。控制设备可以根据声源设备发送的第一声音信号,通过预设算法确定声源设备与其中坐标轴二之间的夹角,将该夹角获取为直达角。其中,该预设算法可以是开发人员预先设置在控制设备中的。
控制设备可以根据直达角以及至少两个麦克风分别在所述空间坐标系内的空间坐标,获取第二声音信号的空间相关性矩阵。其中,第二声音信号的空间相关性矩阵包含直达声音信号的空间相关性矩阵以及混响声音信号的空间相关性矩阵,其中,直达声音信号即是上述第一声音信号从声源设备处触发且未经物理反射到达声音采集设备的声音信号;混响声音信号即是上述第一声音信号从声源设备处触发且经物理反射到达声音采集设备的声音信号。
可选的,直达声音信号的空间相关性dab可以用公式【4】计算得到:
Figure GDA0002723762300000171
其中,ra表示第a个麦克在构建的坐标系中的坐标,rb表示第b 个麦克风在构建的坐标系中的坐标,α(θ)表示直达角,j表示虚数, c为声音在空间的传播速度。dab则表示第i个麦克风与第j个麦克风各自直达声音信号之间的相关性;控制设备可以根据上述公式【4】,计算得到直达声音信号的空间相关性矩阵:
Figure GDA0002723762300000172
可选的,混响声音信号的空间相关性rab可以用公式【5】计算得到:
Figure GDA0002723762300000173
rab则表示第i个麦克风与第j个麦克风各自混响声音信号之间的相关性;控制设备可以根据上述公式【5】,计算得到混响声音信号的空间相关性矩阵:
Figure GDA0002723762300000174
可选的,第二声音信号的空间相关性矩阵还包含直达声音信号对应的频域能量以及混响声音信号对应的频域能量。以PD(ω)表示直达声音信号对应的频域能量,以PR(ω)表示混响声音信号对应的频域能量为例,当声源信号播放的第一声音信号为S(ω,t),声音采集设备采集的第二声音信号中,对应的直达成分函数HD(ω,t)和混响成分函数HR(ω,t),相应的,PD(ω)和PR(ω)进一步可以表示为:
PD(ω)=E[|S(ω,t)|2|HD(ω,t)|2];
PR(ω)=E[|S(ω,t)|2|HR(ω,t)|2]。
在步骤405中,根据空间相关性矩阵以及第二声音信号获取直达强度信息。
可选的,控制设备可以先根据空间相关性矩阵以及第二声音信号构建目标方程,目标方程中的未知量为直达声音信号对应的频域能量以及混响声音信号对应的频域能量。
可选的,声音采集设备采集的第二声音信号的相关性矩阵可以用公式【6】表示:
R(ω)=E[X(ω,t)XH(ω,t)]; 【6】
其中,X(ω,t)=[X(1)(ω,t),X(2)(ω,t)…X(M)(ω,t)]T;即,对应每个麦克风接收到的第二声音信号组成的矩阵;E可以表示为X(ω,t)与XH(ω,t)之间的数学期望。即,声音采集设备的第二声音信号的相关性矩阵可以通过声音采集设备内各个麦克风采集的第二声音信号直接表示。
可选的,控制设备便可以根据上述公式3计算出相应的R(ω)。由于在扩散场条件下,声源设备播放的第一声音信号传播至声音采集设备时,该声音采集设备采集的第二声音信号中,包含的直达声音信号与混响声音信号的相关性很小,因此可以忽略不计,因此,声音采集设备采集的第二声音信号的相关性矩阵也可以通过第二声音信号的直达声音信号的空间相关性矩阵以及其对应的频域能量,与第二声音信号的混响声音信号的空间相关性矩阵以及其对应的频域能量之和来近似表示。如公式【7】所示:
Figure GDA0002723762300000191
因此,通过公式【6】以及公式【7】,可以建立目标方程,如公式【8】所示为:
Figure GDA0002723762300000192
控制设备可以通过最小二乘法对上述目标方程求伪逆,得到其中的PD(ω)以及PR(ω)组成的矩阵。例如,控制设备通过对上述目标方程求伪逆得到PD(ω)的值。进一步的,控制设备可以将PD (ω)的值作为第二声音信号包含的直达强度信息,从而获取到直达强度信息。其中,直达强度信息即是上述直达声音信号对应的频域能量,可以指示第二声音信号中的直达声音信号的强度。可选的,当有需要计算房间内的直达成分函数HD(ω)时,控制设备还可以将该直达强度信息带入PD(ω)=E[|S(ω,t)|2|HD(ω,t)|2]中,在已知声源设备发送的声音信号时,可以推算出该房间内的HD(ω,t);类似的,当有需要计算房间内的混响成分函数HR(ω)时,控制设备还可以将该混响强度信息带入PR(ω)=E[|S(ω,t)|2|HR(ω,t) |2]中,从而推算出该房间内的HR(ω,t)。
在步骤406中,获取第一声音信号的信号强度;
可选的,控制设备还可以获取到第一声音信号的信号强度,例如:第一声音的音量、第一声音信号的频率等。以第一声音的音量为例,控制设备在控制声源设备播放第一声音信号时,可以对第一声音信号的音量进行控制,用户可以将第一声音信号的音量调高或者调低等。
在步骤407中,根据第一声音信号的信号强度获取信号强度阈值。
可选的,控制设备中可以存储有第一声音信号的信号强度与信号强度阈值对应的关系表,请参考表1,其示出了第一声音信号的信号强度所在的强度区间与信号强度阈值之间一种对应关系。
信号强度区间 信号强度阈值
强度区间一 信号强度阈值一
强度区间二 信号强度阈值二
强度区间三 信号强度阈值三
…… ……
表1
当控制设备获取到第一声音信号的信号强度时,可以通过查询上述表1,得到信号强度阈值,例如,当控制设备获取到第一声音信号的信号强度处于强度区间一时,控制设备通过查询上述表1,得到对应的信号强度阈值一。可选的,上述表1也可以存储在服务器中,控制设备可以向服务器发送查询请求,从而通过服务器查询上述表1,从而得到第一声音信号的信号强度对应的信号强度阈值。可选的,上述表1中存储的信号强度阈值可以是开发人员通过实际经验选择,并预先设置的。
在步骤408中,根据直达信号强度与信号强度阈值之间的大小关系,获取空间划分信息。
其中,空间划分信息用于指示声源设备和声音采集设备是否处于同一空间。
控制设备可以通过获取到的信号强度阈值,判断上述求解目标方程得到的直达信号强度与信号强度阈值之间的大小关系,确定声源设备和声音采集设备是否处于同一空间。可选的,当上述求解目标方程得到的直达信号强度大于信号强度阈值时,确定声源设备和声音采集设备处于同一空间,否则,确定声源设备和声音采集设备不处于同一空间。
例如,以声源设备以发送的第一声音信号的信号强度处于强度区间二内为例,控制设备可以通过上述表1,获取到信号强度为强度区间二对应的信号强度阈值为信号强度阈值二,并且,控制设备还可以通过上述步骤,得到声音采集设备接收到的第二声音信号中包含的直达声音信号的直达信号强度,当控制设备得到的直达信号强度大于信号强度阈值二时,确定声源设备和声音采集设备处于同一空间,否则,确定声源设备和声音采集设备不处于同一空间。
请参考图8,其示出了本公开实施例涉及的一种第二声音信号中直达声音能量与第一声音信号的音量之间的关系图。如图8所示,其中包含了第一折线801,第二折线802,第三折线803,第四折线804,第五折线805。其中,第一折线801和第二折线802是声源设备与声音采集设备处于同一房间不同位置时直达声音能量与第一声音信号音量的关系曲线;第三折线803,第四折线804以及第五折线805是声源设备与声音采集设备处于不同房间时直达声音能量与第一声音信号音量的关系曲线。由图8可知,开发人员可以选择合适的判决门限值(即,信号强度阈值),预先存储在上述表1中,从而确定声源设备与声音采集设备是否处于同一房间区域。比如,以第一折线801 为例,在声源设备以发送的第一声音信号的信号强度是50%时,控制设备通过上述步骤,得到声音采集设备接收到的第二声音信号中包含的直达声音信号的直达信号强度可以为0.006。当控制设备通过上述表1,获取到信号强度是50%时对应的信号强度阈值为0.005时,可以确定声源设备和声音采集设备处于同一空间,从而获取到声源设备和声音采集设备的空间划分信息。
可选的,控制设备还可以将获取到的空间划分信息存储至自身的存储器中,或者,存储至云端中,当用户改变声源设备或者声音采集设备的位置时,可以根据对存储的空间划分信息进行修正,保证空间区域划分的正确性。可选的,智能家居设备在完成对空间区域划分之后,当用户处于某个空间区域使用智能家居设备时(例如,在房间内播放一首歌曲),智能家居设备可以根据该空间区域内的多个智能家居设备协同播放等,提高房间内的播放效果。
综上所述,本公开通过控制声源设备播放第一声音信号,获取由声音采集设备采集到的声音信号,根据采集到的声音信号中的直达强度信息完成对声源设备以及声音采集设备的空间划分,由于声源设备与声音采集设备是否处于同一空间区域(比如是否同一房间)内,对声音采集设备接收到的由声源设备发出的直达声音信号的强度有很大的影响,因此,通过直达强度信息可以很容易区分两个声源设备与声音采集设备是否处于同一空间区域,从而提高了智能家居设备的空间划分的准确性。
另外,在上述直达声音能量的计算过程中,由于将噪声信号可以划分在混响声音能量中,因此,直达声音能量相对于其他参数(例如:相关技术中的RIR)在混响、扩散场噪声等场景下,具有更强的鲁棒性等特点,适用于复杂家居场景。
下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节,请参照本公开方法实施例。
图9是根据另一示例性实施例示出的一种空间划分信息获取装置的框图。该装置具有实现上述智能家居设备的方法示例的功能,所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。该装置可以是上文介绍的智能家居设备,也可以设置在智能家居设备中。该装置900可以包括:控制模块90,声音信号获取模块902、强度信息获取模块903和空间划分信息获取模块902。
所述控制模块90,用于控制声源设备播放第一声音信号;
所述声音信号获取模块902,用于获取第二声音信号,所述第二声音信号是所述第一声音信号传播到声音采集设备时,由所述声音采集设备采集到的声音信号;
所述强度信息获取模块903,用于根据所述第二声音信号获取直达强度信息,所述直达强度信息用于指示所述第二声音信号中的直达声音信号的强度;所述直达声音信号是从所述声源设备处触发且未经物理反射到达所述声音采集设备的声音信号;
所述空间划分信息获取模块904,用于根据所述直达强度信息获取空间划分信息,所述空间划分信息用于指示所述声源设备和所述声音采集设备是否处于同一空间区域。
可选的,所述第二声音信号是所述声音采集设备中的麦克风阵列采集到的声音信号,所述麦克风阵列包含至少两个麦克风;
所述根据所述强度信息获取模块903,包括:空间分布信息获取子模块,相关性矩阵获取子模块以及强度信息获取子模块;
所述空间分布信息获取子模块,用于获取空间分布信息,所述空间分布信息用于指示所述至少两个麦克风之间的空间分布关系;
所述相关性矩阵获取子模块,用于根据所述空间分布信息,获取所述第二声音信号的空间相关性矩阵;
所述强度信息获取子模块,用于根据所述空间相关性矩阵以及所述第二声音信号获取所述直达强度信息。
可选的,所述空间分布信息获取子模块,包括:坐标系构建单元,坐标获取单元以及空间分布信息获取单元;
所述坐标系构建单元,用于构建包含所述至少两个麦克风的空间坐标系;
所述坐标获取单元,用于获取所述至少两个麦克风分别在所述空间坐标系内的空间坐标;
所述空间分布信息获取单元,用于获取包含所述至少两个麦克风分别在所述空间坐标系内的空间坐标的所述空间分布信息。
可选的,所述相关性矩阵获取子模块,包括:直达角获取单元和相关性矩阵获取单元;
所述直达角获取单元,用于获取直达角,所述直达角是所述第一声音信号的发射源与所述空间坐标系的原点之间的连线与第一坐标轴之间的夹角,所述第一坐标轴是所述空间坐标系中的任一坐标轴;
所述相关性矩阵获取单元,用于根据所述直达角以及所述至少两个麦克风分别在所述空间坐标系内的空间坐标,获取所述第二声音信号的空间相关性矩阵。
可选的,所述强度信息获取子模块,包括:方程构建单元和强度信息获取单元;
所述方程构建单元,用于根据所述空间相关性矩阵以及所述第二声音信号构建目标方程,所述目标方程中的未知量为所述直达声音信号以及混响声音信号,所述混响信号是从所述声源设备处触发且经物理反射到达所述声音采集设备的声音信号;
所述强度信息获取单元,用于通过最小二乘法对所述目标方程求伪逆,获取所述直达强度信息。
可选的,所述空间划分信息获取模块903,用于,
根据所述直达信号强度与信号强度阈值之间的大小关系,获取所述空间划分信息。
可选的,所述装置还包括:大小关系获取模块和阈值获取模块;
所述大小关系获取模块,用于在所述空间划分信息获取模块根据所述直达信号强度与信号强度阈值之间的大小关系,获取所述空间划分信息之前,获取所述第一声音信号的信号强度;
所述阈值获取模块,用于根据所述第一声音信号的信号强度获取所述信号强度阈值。
需要说明的一点是,上述实施例提供的装置在实现其功能时,仅以上述各个功能模块的划分进行举例说明,实际应用中,可以根据实际需要而将上述功能分配由不同的功能模块完成,即将设备的内容结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本公开一示例性实施例还提供了一种空间划分信息获取装置,能够实现本公开提供的空间划分信息获取方法。该装置可以是上文介绍的智能家居设备,也可以设置在智能家居设备中。该装置包括:处理器,以及用于存储处理器的可执行指令的存储器。其中,所述处理器被配置为:
控制声源设备播放第一声音信号;
获取第二声音信号,所述第二声音信号是所述第一声音信号传播到声音采集设备时,由所述声音采集设备采集到的声音信号;
根据所述第二声音信号获取直达强度信息,所述直达强度信息用于指示所述第二声音信号中的直达声音信号的强度;所述直达声音信号是从所述声源设备处触发且未经物理反射到达所述声音采集设备的声音信号;
根据所述直达强度信息获取空间划分信息,所述空间划分信息用于指示所述声源设备和所述声音采集设备是否处于同一空间区域。
可选的,所述处理器被配置为:所述第二声音信号是所述声音采集设备中的麦克风阵列采集到的声音信号,所述麦克风阵列包含至少两个麦克风;
所述根据所述第二声音信号获取直达强度信息,包括:
获取空间分布信息,所述空间分布信息用于指示所述至少两个麦克风之间的空间分布关系;
根据所述空间分布信息,获取所述第二声音信号的空间相关性矩阵;
根据所述空间相关性矩阵以及所述第二声音信号获取所述直达强度信息。
可选的,所述获取空间分布信息,所述处理器被配置为:
构建包含所述至少两个麦克风的空间坐标系;
获取所述至少两个麦克风分别在所述空间坐标系内的空间坐标;
获取包含所述至少两个麦克风分别在所述空间坐标系内的空间坐标的所述空间分布信息。
可选的,所述根据所述空间分布信息,获取所述第二声音信号的空间相关性矩阵,所述处理器被配置为:
获取直达角,所述直达角是所述第一声音信号的发射源与所述空间坐标系的原点之间的连线与第一坐标轴之间的夹角,所述第一坐标轴是所述空间坐标系中的任一坐标轴;
根据所述直达角以及所述至少两个麦克风分别在所述空间坐标系内的空间坐标,获取所述第二声音信号的空间相关性矩阵。
可选的,所述根据所述空间相关性矩阵以及所述第二声音信号获取所述直达强度信息,所述处理器被配置为:
根据所述空间相关性矩阵以及所述第二声音信号构建目标方程,所述目标方程中的未知量为所述直达声音信号以及混响声音信号,所述混响信号是从所述声源设备处触发且经物理反射到达所述声音采集设备的声音信号;
通过最小二乘法对所述目标方程求伪逆,获取所述直达强度信息。
可选的,所述根据所述直达强度信息获取空间划分信息,所述处理器被配置为:
根据所述直达信号强度与信号强度阈值之间的大小关系,获取所述空间划分信息。
可选的,所述处理器还被配置为:所述根据所述直达信号强度与信号强度阈值之间的大小关系,获取所述空间划分信息之前,
获取所述第一声音信号的信号强度;
根据所述第一声音信号的信号强度获取所述信号强度阈值。
上述主要从智能家居设备交互的角度,对本公开实施例提供的方案进行了介绍。可以理解的是,智能家居设备为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。结合本公开中所公开的实施例描述的各示例的单元及算法步骤,本公开实施例能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同的方法来实现所描述的功能,但是这种实现不应认为超出本公开实施例的技术方案的范围。
图10是根据一示例性实施例示出的一种用于智能家居设备的装置的框图。例如,装置1000可以被提供为上述实施例涉及的智能家居设备。参照图10,装置1000包括处理组件1022,其进一步包括一个或多个处理器,以及由存储器1032所代表的存储器资源,用于存储可由处理部件1022执行的指令,例如应用程序。存储器1032中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1022被配置为执行指令,以执行上述空间划分信息获取的方法中,由智能家居设备执行的全部或者部分步骤。
装置1000还可以包括一个电源组件1026被配置为执行装置1000 的电源管理,一个有线或无线网络接口1050被配置为将装置1000连接到网络,和一个输入输出(I/O)接口1038。装置1000可以操作基于存储在存储器1032的操作系统,例如Windows ServerTM,MacOS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本公开实施例还提供了一种非临时性计算机可读存储介质,其上存储有计算机程序,所述计算机程序被智能家居设备的处理器执行时实现如上文介绍的空间划分信息获取方法。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和 /或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A 和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (14)

1.一种空间划分信息获取方法,其特征在于,所述方法包括:
控制声源设备播放第一声音信号;
获取第二声音信号,所述第二声音信号是所述第一声音信号传播到声音采集设备时,由所述声音采集设备中的麦克风阵列采集到的声音信号,所述麦克风阵列包含至少两个麦克风;
获取空间分布信息,所述空间分布信息用于指示所述至少两个麦克风之间的空间分布关系;
根据所述空间分布信息,获取所述第二声音信号的空间相关性矩阵,所述第二声音信号的空间相关性矩阵包含直达声音信号的空间相关性矩阵以及混响声音信号的空间相关性矩阵;
根据所述空间相关性矩阵以及所述第二声音信号获取直达强度信息,所述直达强度信息是所述直达声音信号对应的频域能量,所述直达强度信息用于指示所述第二声音信号中的直达声音信号的强度;所述直达声音信号是从所述声源设备处触发且未经物理反射到达所述声音采集设备的声音信号;
根据所述直达强度信息获取空间划分信息,所述空间划分信息用于指示所述声源设备和所述声音采集设备是否处于同一空间区域。
2.根据权利要求1所述的方法,其特征在于,所述获取空间分布信息,包括:
构建包含所述至少两个麦克风的空间坐标系;
获取所述至少两个麦克风分别在所述空间坐标系内的空间坐标;
获取包含所述至少两个麦克风分别在所述空间坐标系内的空间坐标的所述空间分布信息。
3.根据权利要求2所述的方法,其特征在于,所述根据所述空间分布信息,获取所述第二声音信号的空间相关性矩阵,包括:
获取直达角,所述直达角是所述第一声音信号的发射源与所述空间坐标系的原点之间的连线与第一坐标轴之间的夹角,所述第一坐标轴是所述空间坐标系中的任一坐标轴;
根据所述直达角以及所述至少两个麦克风分别在所述空间坐标系内的空间坐标,获取所述第二声音信号的空间相关性矩阵。
4.根据权利要求1所述的方法,其特征在于,所述根据所述空间相关性矩阵以及所述第二声音信号获取所述直达强度信息,包括:
根据所述空间相关性矩阵以及所述第二声音信号构建目标方程,所述目标方程中的未知量为所述直达声音信号以及混响声音信号,所述混响声音信号是从所述声源设备处触发且经物理反射到达所述声音采集设备的声音信号;
通过最小二乘法对所述目标方程求伪逆,获取所述直达强度信息。
5.根据权利要求1至4任一所述的方法,其特征在于,所述根据所述直达强度信息获取空间划分信息,包括:
根据直达信号强度与信号强度阈值之间的大小关系,获取所述空间划分信息。
6.根据权利要求5所述的方法,其特征在于,所述根据直达信号强度与信号强度阈值之间的大小关系,获取所述空间划分信息之前,还包括:
获取所述第一声音信号的信号强度;
根据所述第一声音信号的信号强度获取所述信号强度阈值。
7.一种空间划分信息获取装置,其特征在于,所述装置包括:
控制模块,用于控制声源设备播放第一声音信号;
声音信号获取模块,用于获取第二声音信号,所述第二声音信号是所述第一声音信号传播到声音采集设备时,由所述声音采集设备中的麦克风阵列采集到的声音信号,所述麦克风阵列包含至少两个麦克风;
强度信息获取模块,包括:
空间分布信息获取子模块,用于获取空间分布信息,所述空间分布信息用于指示所述至少两个麦克风之间的空间分布关系;
相关性矩阵获取子模块,用于根据所述空间分布信息,获取所述第二声音信号的空间相关性矩阵,所述第二声音信号的空间相关性矩阵包含直达声音信号的空间相关性矩阵以及混响声音信号的空间相关性矩阵;
强度信息获取子模块,用于根据所述空间相关性矩阵以及所述第二声音信号获取直达强度信息,所述直达强度信息是所述直达声音信号对应的频域能量,所述直达强度信息用于指示所述第二声音信号中的直达声音信号的强度;所述直达声音信号是从所述声源设备处触发且未经物理反射到达所述声音采集设备的声音信号;
空间划分信息获取模块,用于根据所述直达强度信息获取空间划分信息,所述空间划分信息用于指示所述声源设备和所述声音采集设备是否处于同一空间区域。
8.根据权利要求7所述的装置,其特征在于,所述空间分布信息获取子模块,包括:
坐标系构建单元,用于构建包含所述至少两个麦克风的空间坐标系;
坐标获取单元,用于获取所述至少两个麦克风分别在所述空间坐标系内的空间坐标;
空间分布信息获取单元,用于获取包含所述至少两个麦克风分别在所述空间坐标系内的空间坐标的所述空间分布信息。
9.根据权利要求8所述的装置,其特征在于,所述相关性矩阵获取子模块,包括:
直达角获取单元,用于获取直达角,所述直达角是所述第一声音信号的发射源与所述空间坐标系的原点之间的连线与第一坐标轴之间的夹角,所述第一坐标轴是所述空间坐标系中的任一坐标轴;
相关性矩阵获取单元,用于根据所述直达角以及所述至少两个麦克风分别在所述空间坐标系内的空间坐标,获取所述第二声音信号的空间相关性矩阵。
10.根据权利要求7所述的装置,其特征在于,所述强度信息获取子模块,包括:
方程构建单元,用于根据所述空间相关性矩阵以及所述第二声音信号构建目标方程,所述目标方程中的未知量为所述直达声音信号以及混响声音信号,混响信号是从所述声源设备处触发且经物理反射到达所述声音采集设备的声音信号;
强度信息获取单元,用于通过最小二乘法对所述目标方程求伪逆,获取所述直达强度信息。
11.根据权利要求7至10任一所述的装置,其特征在于,
所述空间划分信息取模块,用于根据直达信号强度与信号强度阈值之间的大小关系,获取所述空间划分信息。
12.根据权利要求11所述的装置,其特征在于,所述装置还包括:
大小关系获取模块,用于在所述空间划分信息获取模块根据所述直达信号强度与信号强度阈值之间的大小关系,获取所述空间划分信息之前,获取所述第一声音信号的信号强度;
阈值获取模块,用于根据所述第一声音信号的信号强度获取所述信号强度阈值。
13.一种空间区域划分信息获取装置,其特征在于,所述装置包括:
处理器;
用于存储所述处理器的可执行指令的存储器;
其中,所述处理器被配置为:
控制声源设备播放第一声音信号;
获取第二声音信号,所述第二声音信号是所述第一声音信号传播到声音采集设备时,由所述声音采集设备采集到的声音信号,麦克风阵列包含至少两个麦克风;
获取空间分布信息,所述空间分布信息用于指示所述至少两个麦克风之间的空间分布关系;
根据所述空间分布信息,获取所述第二声音信号的空间相关性矩阵,所述第二声音信号的空间相关性矩阵包含直达声音信号的空间相关性矩阵以及混响声音信号的空间相关性矩阵;
根据所述空间相关性矩阵以及所述第二声音信号获取直达强度信息,所述直达强度信息是所述直达声音信号对应的频域能量,所述直达强度信息用于指示所述第二声音信号中的直达声音信号的强度;所述直达声音信号是从所述声源设备处触发且未经物理反射到达所述声音采集设备的声音信号;
根据所述直达强度信息获取空间划分信息,所述空间划分信息用于指示所述声源设备和所述声音采集设备是否处于同一空间区域。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包含可执行指令,由处理器调用所述可执行指令以实现上述权利要求1至6任一所述的空间划分信息获取方法。
CN201910363989.5A 2019-04-30 2019-04-30 空间划分信息获取方法、装置及存储介质 Active CN110072177B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201910363989.5A CN110072177B (zh) 2019-04-30 2019-04-30 空间划分信息获取方法、装置及存储介质
US16/695,699 US10999691B2 (en) 2019-04-30 2019-11-26 Method for acquiring spatial division information, apparatus for acquiring spatial division information, and storage medium
EP19217171.8A EP3734992A1 (en) 2019-04-30 2019-12-17 Method for acquiring spatial division information, apparatus for acquiring spatial division information, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910363989.5A CN110072177B (zh) 2019-04-30 2019-04-30 空间划分信息获取方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN110072177A CN110072177A (zh) 2019-07-30
CN110072177B true CN110072177B (zh) 2022-04-08

Family

ID=67370098

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910363989.5A Active CN110072177B (zh) 2019-04-30 2019-04-30 空间划分信息获取方法、装置及存储介质

Country Status (3)

Country Link
US (1) US10999691B2 (zh)
EP (1) EP3734992A1 (zh)
CN (1) CN110072177B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110364161A (zh) 2019-08-22 2019-10-22 北京小米智能科技有限公司 响应语音信号的方法、电子设备、介质及系统
JP7191793B2 (ja) * 2019-08-30 2022-12-19 株式会社東芝 信号処理装置、信号処理方法、及びプログラム
CN110853657B (zh) * 2019-11-18 2022-05-13 北京小米智能科技有限公司 空间划分方法、装置及存储介质
CN113393853B (zh) * 2021-04-29 2023-02-03 青岛海尔科技有限公司 混合声信号的处理方法及装置、存储介质及电子装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108028955A (zh) * 2016-03-18 2018-05-11 谷歌有限责任公司 用于提供交互式内容的方法和系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6999593B2 (en) 2003-05-28 2006-02-14 Microsoft Corporation System and process for robust sound source localization
WO2011145030A1 (en) 2010-05-20 2011-11-24 Koninklijke Philips Electronics N.V. Distance estimation using sound signals
US9194938B2 (en) 2011-06-24 2015-11-24 Amazon Technologies, Inc. Time difference of arrival determination with direct sound
US9769424B2 (en) * 2013-10-24 2017-09-19 Telefonaktiebolaget Lm Ericsson (Publ) Arrangements and method thereof for video retargeting for video conferencing
KR20180038326A (ko) 2016-10-06 2018-04-16 엘지전자 주식회사 이동 로봇
KR102338376B1 (ko) * 2017-09-13 2021-12-13 삼성전자주식회사 디바이스 그룹을 지정하기 위한 전자 장치 및 이의 제어 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108028955A (zh) * 2016-03-18 2018-05-11 谷歌有限责任公司 用于提供交互式内容的方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Estimating Direct-to-Reverberant Energy Ratio Using D/R Spatial Correlation Matrix Model;Yusuke Hioka,et al.;《IEEE TRANSACTIONS ON AUDIO》;20110405;第2374-2384页 *

Also Published As

Publication number Publication date
EP3734992A1 (en) 2020-11-04
US10999691B2 (en) 2021-05-04
CN110072177A (zh) 2019-07-30
US20200351604A1 (en) 2020-11-05

Similar Documents

Publication Publication Date Title
CN110072177B (zh) 空间划分信息获取方法、装置及存储介质
US10779102B2 (en) Smartphone moves location of binaural sound
CN107613428B (zh) 声音处理方法、装置和电子设备
US10694313B2 (en) Audio communication system and method
CN105792090B (zh) 一种增加混响的方法与装置
US10567871B1 (en) Automatically movable speaker to track listener or optimize sound performance
US10292000B1 (en) Frequency sweep for a unique portable speaker listening experience
CN112672251A (zh) 一种扬声器的控制方法和系统、存储介质及扬声器
US10616684B2 (en) Environmental sensing for a unique portable speaker listening experience
WO2021103760A1 (zh) 一种智能音箱音效自适应调整方法、系统及存储介质
US11599329B2 (en) Capacitive environmental sensing for a unique portable speaker listening experience
CN116261094A (zh) 可动态调整目标聆听点并消除环境物件干扰的音响系统
US11114082B1 (en) Noise cancelation to minimize sound exiting area
US11277706B2 (en) Angular sensing for optimizing speaker listening experience
TWI842055B (zh) 可動態調整目標聆聽點並消除環境物件干擾的音響系統
US12002166B2 (en) Method and device for communicating a soundscape in an environment
TWI842056B (zh) 可動態調整目標聆聽點並消除環境物件干擾的音響系統
JP2023104512A (ja) 音量制御装置、機器、制御システム、およびプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20221213

Address after: 430000 No. 006, floor 1, No. 66, Jiufeng 1st Road, Donghu New Technology Development Zone, Wuhan, Hubei Province (Wuhan area of free trade zone)

Patentee after: Xiaomi Technology (Wuhan) Co.,Ltd.

Address before: Room 101-103, 1 / F, unit 2, building F, lin66, Zhufang Road, Haidian District, Beijing 100085

Patentee before: BEIJING XIAOMI INTELLIGENT TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right