CN113963691A - 语音设备的调节方法、系统、装置、设备及存储介质 - Google Patents
语音设备的调节方法、系统、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113963691A CN113963691A CN202111211270.3A CN202111211270A CN113963691A CN 113963691 A CN113963691 A CN 113963691A CN 202111211270 A CN202111211270 A CN 202111211270A CN 113963691 A CN113963691 A CN 113963691A
- Authority
- CN
- China
- Prior art keywords
- noise
- voice
- sensitivity
- adjusting
- equipment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 230000035945 sensitivity Effects 0.000 claims abstract description 78
- 230000005236 sound signal Effects 0.000 claims description 25
- 238000004891 communication Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 8
- 230000033228 biological regulation Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000012544 monitoring process Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000004888 barrier function Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/282—Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/12—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
- H04L67/125—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks involving control of end-device applications over a network
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Automation & Control Theory (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请涉及一种语音设备的调节方法、系统、装置、设备及存储介质;其中,所述方法包括:获取所述语音设备所在的指定空间的多个位置的噪声信号;基于所述噪声信号,确定所述指定空间的噪声分布;基于所述噪声分布,调节所述语音设备的唤醒灵敏度。本申请用以解决现有技术中,语音设备的误唤醒率高的问题。
Description
技术领域
本申请涉及智能家居控制技术领域,尤其涉及一种语音设备的调节方法、系统、装置、设备及存储介质。
背景技术
随着科学技术的不断发展,语音助手成为智能家居控制领域的研究热点。越来越多的语音设备放置在家中,无论是客厅和卧室都有语音设备,例如:智能音箱。语音唤醒较为依赖于环境,在安静的环境下可以有着较好的唤醒率及用户体验,对语音识别的效果也更加准确。
但是,当环境比较嘈杂时,容易误唤醒语音设备,导致误唤醒率高。
发明内容
本申请提供了一种语音设备的调节方法、系统、装置、设备及存储介质,用以解决现有技术中语音设备的误唤醒率高的问题。
第一方面,本申请实施例提供了一种语音设备的调节方法,包括:
获取所述语音设备所在的指定空间的多个位置的噪声信号;
基于所述噪声信号,确定所述指定空间的噪声分布;
基于所述噪声分布,调节所述语音设备的唤醒灵敏度。
可选的,所述基于所述噪声信号,确定所述指定空间的噪声分布,包括:
基于所述噪声信号,确定噪声的来源方向;
获取所述指定空间的地图信息;其中,所述地图信息用于指示所述指定空间的空间布局;
基于所述来源方向、所述地图信息以及所述噪声信号,确定所述指定空间的噪声分布。
可选的,所述获取所述语音设备所在的指定空间的多个位置的噪声信号,包括:
获取所述语音设备所在的指定空间的多个位置的声音信号;
对所述声音信号进行频率分析,从所述声音信号中,提取频率在预设频率范围内的声音信号,作为所述噪声信号。
可选的,所述基于所述噪声分布,调节所述语音设备的唤醒灵敏度,包括:
基于所述噪声分布,判断所述语音设备当前所在位置的噪声的大小是否超过预设值,得到判断结果;
基于所述判断结果,调节所述语音设备的唤醒灵敏度。
可选的,所述基于所述判断结果,调节所述语音设备的唤醒灵敏度,包括:
若所述判断结果指示所述噪声的大小超过所述预设值,则降低所述语音设备的唤醒灵敏度。
可选的,所述降低所述语音设备的唤醒灵敏度,包括:
将所述语音设备的唤醒灵敏度设置为预设最低灵敏度。
可选的,所述基于所述判断结果,调节所述语音设备的唤醒灵敏度,包括:
若所述判断结果指示所述噪声的大小小于所述预设值,则计算所述噪声的大小和第一预设值的和,得到中间结果;
利用第二预设值除以所述中间结果,得到所述唤醒灵敏度。
可选的,所述语音设备上安装有声音传感器阵列;其中,所述声音传感器阵列包括多个声音传感器;
所述基于所述噪声分布,调节所述语音设备的唤醒灵敏度,包括:
计算所述语音设备当前所在位置的噪声的大小和第一预设值的和,得到中间结果;
利用第二预设值除以所述中间结果,得到所述语音设备的整体灵敏度;
调节靠近所述来源方向的所述声音传感器的唤醒灵敏度低于所述整体灵敏度。
第二方面,本申请实施例提供了一种语音设备的调节系统,包括:服务器和至少一个所述语音设备;
所述服务器,用于获取所述语音设备所在的指定空间的多个位置的噪声信号;基于所述噪声信号,确定所述指定空间的噪声分布;基于所述噪声分布,调节各个所述语音设备的唤醒灵敏度。
第三方面,本申请实施例提供了一种语音设备的调节装置,包括:
获取模块,用于获取所述语音设备所在的指定空间的多个位置的噪声信号;
确定模块,用于基于所述噪声信号,确定所述指定空间的噪声分布;
调节模块,用于基于所述噪声分布,调节所述语音设备的唤醒灵敏度。
第四方面,本申请实施例提供了一种电子设备,包括:处理器、存储器和通信总线,其中,处理器和存储器通过通信总线完成相互间的通信;
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述存储器中所存储的程序,实现第一方面所述的语音设备的调节方法。
第五方面,本申请实施例提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的语音设备的调节方法。
本申请实施例提供的上述技术方案与现有技术相比具有如下优点:本申请实施例提供的该方法,通过获取所述语音设备所在的指定空间的多个位置的噪声信号;基于所述噪声信号,确定所述指定空间的噪声分布;基于所述噪声分布,调节所述语音设备的灵敏度。通过监测语音设备所在指定空间的噪声情况,调节语音设备唤醒的灵敏度,减少语音设备的误唤醒率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的语音设备的调节系统的示意图;
图2为本申请实施例提供的语音设备的调节系统的一种实现方式的示意图;
图3为本申请实施例提供的指定空间的示意图;
图4为本申请实施例提供的语音设备的调节方法的流程示意图;
图5为本申请实施例提供的调节语音设备灵敏度的方法的原理示意图;
图6为本申请实施例提供的基于噪声分布调节语音设备的灵敏度的具体方法示意图;
图7为本申请实施例提供的语音设备的调节装置的结构示意图;
图8为本申请实施例提供的电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了解决现有技术中,语音设备的误唤醒率高的问题,本申请实施例提供了一种语音设备的调节方法,通过监测语音设备所在指定空间的噪声情况,调节语音设备唤醒的灵敏度,减少语音设备的误唤醒率。
在详细介绍本申请实施例提供的语音设备的调节方法之前,首先介绍本申请实施例提供的一种语音设备的调节系统,如图1所示,本申请实施例提供的一种语音设备的调节系统,包括:服务器101和至少一个语音设备102;各个语音设备102均与服务器101建立通信连接,且各个语音设备102和服务器101均位于同一个局域网中。
服务器101,用于获取语音设备102所在的指定空间的多个位置的噪声信号;基于噪声信号,确定指定空间的噪声分布;基于噪声分布,调节各个语音设备102的唤醒灵敏度。
其中,在具体实现时,如图2所示,服务器101可以是边缘服务器,部署在家庭的局域网中。语音设备102是指能够通过语音指令进行控制的智能设备,在家庭中具体指智能家居设备,例如:智能音箱、空气净化器等智能家居设备,在具体实现时,语音设备102与边缘服务器部署在同一个局域网中。
在具体实现时,可以通过声音采集设备,例如:声音传感器(例如:麦克风),以及携带有声音传感器的智能家居设备采集语音设备所在的指定空间的多个位置的噪声信号;例如,如图2所示,通过带有麦克风的智能家居设备,例如:智能电视、智能空调等获取噪声信号;还可以通过带有声音传感器或者声音传感器阵列的语音设备采集语音设备所在的指定空间的多个位置的噪声信号。其中,边缘服务器根据环境中噪声的分布,为各个语音设备设置好唤醒灵敏度后,各个语音设备分别向边缘服务器返回设置唤醒灵敏度成功的消息,该消息中可以携带该语音设备当前所设置的唤醒灵敏度。
在具体实现时,所有的声音采集设备可以全部由声音传感器、携带有声音传感器的智能设备或者语音设备中的某一种实现。此外,还可以选择上述三种实现方式中的任意两种方式实现。另外,如图3所示,在具体实现时,声音采集设备还可以同时包括声音传感器(例如:麦克风(mic))、携带有声音传感器的智能家居设备(例如:带麦克风(mic)的智能家居设备)以及带有声音传感器或者声音传感器阵列的语音设备等。通常,语音设备对声音的采集频率要小于单独的声音传感器。而且,声音传感器的采集的声音信号的频率范围也要广于语音设备。
另外,在具体实现时,为了降低语音设备的功耗,可以将指定空间中的部分语音设备的采集频率降低,通过部分语音设备和麦克风即可获知整个指定空间的噪声分布情况。而且,对于智能音箱、加湿器、空气净化器等语音设备,相对体积比较小,在实际应用中会根据用户的需求移动到不同的位置,在移动的过程中,也能够根据指定空间的噪声分布,确定移动过程中各个位置的噪声大小,从而动态的、实时的调整语音设备的唤醒灵敏度,有效降低误唤醒率。而且,在移动的过程中也无需实时采集声音信号,即可实现对语音设备的唤醒灵敏度的调节,更加简便。
在一个具体实施例中,通常通过指定空间中固定的智能家居设备中携带的声音传感器采集指定空间的多个位置的噪声信号,例如:利用在指定空间中较为固定的智能电视、空调中麦克风采集噪声信号。
在声音采集设备采集声音信号时,为了减低功耗,可以每间隔预设时间采集一次。例如,每间隔3秒,采集2秒时长的声音信号。在具体实现时,可以将采集的声音信号上传到服务器101中,具体的,可以上传到家庭中的边缘服务器中,不上传云端,以有效的保证用户的隐私。
下面结合图4对本申请实施例提供的语音设备的调节方法做详细说明。
如图4所示,本申请实施例提供了一种语音设备的调节方法,应用于图1所示的服务器中,该方法具体包括如下步骤:
步骤401,获取语音设备所在的指定空间的多个位置的噪声信号;
其中,噪声信号是指与语音信号的频率范围有重叠的信号。在具体实现时,可以通过声音采集设备,例如:声音传感器(例如:麦克风),以及携带有声音传感器的智能家居设备采集语音设备所在的指定空间的多个位置的噪声信号;例如,如图2所示,通过带有麦克风的智能家居设备,例如:智能电视、智能空调等获取噪声信号;还可以通过带有声音传感器或者声音传感器阵列的语音设备采集语音设备所在的指定空间的多个位置的噪声信号。其中,边缘服务器根据环境中噪声的分布,为各个语音设备设置好唤醒灵敏度后,各个语音设备分别向边缘服务器返回设置唤醒灵敏度成功的消息,该消息中可以携带该语音设备当前所设置的唤醒灵敏度。
在具体实现时,所有的声音采集设备可以全部由声音传感器、携带有声音传感器的智能设备或者语音设备中的某一种实现。此外,还可以选择上述三种实现方式中的任意两种方式实现。另外,如图3所示,在具体实现时,声音采集设备还可以同时包括声音传感器(例如:麦克风(mic))、携带有声音传感器的智能家居设备(例如:带麦克风(mic)的智能家居设备)以及带有声音传感器或者声音传感器阵列的语音设备等。
在具体实现时,实际声音采集设备采集的是语音设备所在指定空间的多个位置的声音信号,其中,包含在预设频率范围内的噪声信号,也包括其他声音信号,但是实际在本申请实施例中,只关心在语音信号的频率范围内的噪声信号,因此,当服务器获取到语音设备所在指定空间的多个位置的声音信号后,对声音信号进行频率分析,从声音信号中,提取频率在预设频率范围内的声音信号,作为噪声信号。其中,在具体实现时,预设频率范围可以设定为语音信号的频率范围:300Hz~3.4kHz。其中,在具体实现时,服务器可以是边缘服务器,部署在家庭的局域网中。
步骤402,基于噪声信号,确定指定空间的噪声分布;
具体的,如图5所示,基于噪声信号,确定噪声的来源方向;获取指定空间的地图信息;其中,地图信息用于指示指定空间的空间布局;基于来源方向、地图信息以及噪声信号,确定指定空间的噪声分布。
其中,通过多个不同位置的噪声信号,能够实现对声源的定位,从而得到噪声的来源方向和位置。具体的,可以利用基于波束形成的方法或者基于高分辨率谱估计的方法,还可以利用基于声达时延差(TDOA)的方法,当然也可以采用其他定位方法,这里不做具体限定。在具体实现时,可以根据实际情况需要选择合适的定位方法。
其中,地图信息中包括:语音设备的位置信息、各个声音采集设备的位置信息,以及指定空间内各类阻挡物的布局等,例如:各个家具的位置信息和尺寸信息、墙体的位置信息和尺寸信息等。其中,语音设备的位置信息和声音采集设备的位置信息可以预先设置好,也可以通过室内定位技术,例如:Wi-Fi、蓝牙、红外线、超宽带、RFID、ZigBee、动作捕捉和超声波等任意一种常见室内定位技术获取语音设备的位置信息和声音采集设备的位置信息。在具体实现时,可以根据实际情况需要选择合适的室内定位方法。
在具体实现时,地图信息可以预先存储在服务器中,其中,地图信息中的部分信息,也可以通过扫地机器人获取到,并上传至服务器中。
在具体实现时,在没有阻挡物的情况下,随着声音的传输距离的增加,声音的响度(又称音量)逐渐减小,且按照一定的声音衰减系数减小。如果有阻挡物,不同的材质,声音的衰减程度不同。已知指定空间的多个位置的噪声信号的响度,噪声的来源方向和位置,以及基于地图信息指示的指定空间的布局情况和声音衰减系数计算距离噪声来源不同距离下的噪声的响度,从而得到指定空间的噪声分布。
步骤403,基于噪声分布,调节语音设备的唤醒灵敏度。
通过步骤402得到整个指定空间的噪声分布后,即已知了指定空间各个位置的噪声分布,判断语音设备当前所在位置的噪声的大小是否超过预设值,得到判断结果;基于判断结果,调节语音设备的唤醒灵敏度,如图6所示,如果判断结果指示噪声的大小超过预设值,则降低语音设备的唤醒灵敏度,具体的,将语音设备的唤醒灵敏度设置为预设最低灵敏度。在具体实现时,预设最低灵敏度可以设置为0或者其他灵敏度值或者灵敏度等级。
在本申请实施例中,当噪声的大小超出了预设值,则说明语音设备当前所处环境十分吵闹,此时降低语音设备的灵敏度,能够避免因为环境中的声音造成误唤醒的情况,减少语音设备的误唤醒率。
如果判断结果指示噪声的大小小于预设值,则计算噪声的大小和第一预设值的和,得到中间结果;利用第二预设值除以中间结果,得到唤醒灵敏度。为了便于理解,举例说明,设噪声的大小(又叫分贝数)为x,第一预设值为k,第二预设值为m;则唤醒灵敏度f为f=m/(x+k);其中,第一预设值k和第二预设值m为预先设定好的常数系数。
如果语音设备上安装有声音传感器阵列;其中,声音传感器阵列包括多个声音传感器;则当判定噪声的大小小于预设值时,计算语音设备当前所在位置的噪声的大小和第一预设值的和,得到中间结果;利用第二预设值除以中间结果,得到语音设备的整体灵敏度;其中,计算整体灵敏度的方法请参见上述举例,这里不再展开描述;调节靠近来源方向的声音传感器的唤醒灵敏度低于整体灵敏度。将靠近来源方向的声音传感器阵列中的声音传感器的灵敏度调的更低一些,能够进一步避免误唤醒,能够更加精准的控制声音传感器阵列中各个声音传感器的唤醒灵敏度。
在本申请实施例中,通过获取语音设备所在的指定空间的多个位置的噪声信号;基于噪声信号,确定指定空间的噪声分布;基于噪声分布,调节语音设备的唤醒灵敏度。通过监测语音设备所在指定空间的噪声情况,调节语音设备唤醒的灵敏度,减少语音设备的误唤醒率。
基于同一构思,本申请实施例中提供了一种语音设备的调节装置,该装置的具体实施可参见方法实施例部分的描述,重复之处不再赘述,如图7所示,该装置主要包括:
获取模块701,用于获取语音设备所在的指定空间的多个位置的噪声信号;
确定模块702,用于基于噪声信号,确定指定空间的噪声分布;
调节模块703,用于基于噪声分布,调节语音设备的唤醒灵敏度。
在一个具体实施例中,确定模块702,用于基于噪声信号,确定噪声的来源方向;获取指定空间的地图信息;其中,地图信息用于指示指定空间的空间布局;基于来源方向、地图信息以及噪声信号,确定指定空间的噪声分布。
在一个具体实施例中,获取模块701,用于获取语音设备所在的指定空间的多个位置的声音信号;对声音信号进行频率分析,从声音信号中,提取频率在预设频率范围内的声音信号,作为噪声信号。
在一个具体实施例中,调节模块703,用于基于噪声分布,判断语音设备当前所在位置的噪声的大小是否超过预设值,得到判断结果;基于判断结果,调节语音设备的唤醒灵敏度。
在一个具体实施例中,调节模块703,用于若判断结果指示噪声的大小超过预设值,则降低语音设备的唤醒灵敏度。
在一个具体实施例中,调节模块703,用于将语音设备的唤醒灵敏度设置为预设最低灵敏度。
在一个具体实施例中,调节模块703,用于若判断结果指示噪声的大小小于预设值,则计算噪声的大小和第一预设值的和,得到中间结果;利用第二预设值除以中间结果,得到唤醒灵敏度。
在一个具体实施例中,调节模块703,用于当语音设备上安装有声音传感器阵列;其中,声音传感器阵列包括多个声音传感器时,计算语音设备当前所在位置的噪声的大小和第一预设值的和,得到中间结果;利用第二预设值除以中间结果,得到语音设备的整体灵敏度;调节靠近来源方向的声音传感器的唤醒灵敏度低于整体灵敏度。
在本申请实施例中,通过获取语音设备所在的指定空间的多个位置的噪声信号;基于噪声信号,确定指定空间的噪声分布;基于噪声分布,调节语音设备的唤醒灵敏度。通过监测语音设备所在指定空间的噪声情况,调节语音设备唤醒的灵敏度,减少语音设备的误唤醒率。
基于同一构思,本申请实施例中还提供了一种电子设备,如图8所示,该电子设备主要包括:处理器801、存储器802和通信总线803,其中,处理器801和存储器802通过通信总线803完成相互间的通信。其中,存储器802中存储有可被处理器801执行的程序,处理器801执行存储器802中存储的程序,实现如下步骤:
获取语音设备所在的指定空间的多个位置的噪声信号;
基于噪声信号,确定指定空间的噪声分布;
基于噪声分布,调节语音设备的唤醒灵敏度。
上述电子设备中提到的通信总线803可以是外设部件互连标准(PeripheralComponent Interconnect,简称PCI)总线或扩展工业标准结构(Extended IndustryStandard Architecture,简称EISA)总线等。该通信总线803可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器802可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器801的存储装置。
上述的处理器801可以是通用处理器,包括中央处理器(Central ProcessingUnit,简称CPU)、网络处理器(Network Processor,简称NP)等,还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,当该计算机程序在计算机上运行时,使得计算机执行上述实施例中所描述的语音设备的调节方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机指令时,全部或部分地产生按照本申请实施例所述的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、微波等)方式向另外一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如软盘、硬盘、磁带等)、光介质(例如DVD)或者半导体介质(例如固态硬盘)等。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
Claims (12)
1.一种语音设备的调节方法,其特征在于,包括:
获取所述语音设备所在的指定空间的多个位置的噪声信号;
基于所述噪声信号,确定所述指定空间的噪声分布;
基于所述噪声分布,调节所述语音设备的唤醒灵敏度。
2.根据权利要求1所述的语音设备的调节方法,其特征在于,所述基于所述噪声信号,确定所述指定空间的噪声分布,包括:
基于所述噪声信号,确定噪声的来源方向;
获取所述指定空间的地图信息;其中,所述地图信息用于指示所述指定空间的空间布局;
基于所述来源方向、所述地图信息以及所述噪声信号,确定所述指定空间的噪声分布。
3.根据权利要求2所述的语音设备的调节方法,其特征在于,所述获取所述语音设备所在的指定空间的多个位置的噪声信号,包括:
获取所述语音设备所在的指定空间的多个位置的声音信号;
对所述声音信号进行频率分析,从所述声音信号中,提取频率在预设频率范围内的声音信号,作为所述噪声信号。
4.根据权利要求1~3任意一项所述的语音设备的调节方法,其特征在于,所述基于所述噪声分布,调节所述语音设备的唤醒灵敏度,包括:
基于所述噪声分布,判断所述语音设备当前所在位置的噪声的大小是否超过预设值,得到判断结果;
基于所述判断结果,调节所述语音设备的唤醒灵敏度。
5.根据权利要求4所述的语音设备的调节方法,其特征在于,所述基于所述判断结果,调节所述语音设备的唤醒灵敏度,包括:
若所述判断结果指示所述噪声的大小超过所述预设值,则降低所述语音设备的唤醒灵敏度。
6.根据权利要求5所述的语音设备的调节方法,其特征在于,所述降低所述语音设备的唤醒灵敏度,包括:
将所述语音设备的唤醒灵敏度设置为预设最低灵敏度。
7.根据权利要求4所述的语音设备的调节方法,其特征在于,所述基于所述判断结果,调节所述语音设备的唤醒灵敏度,包括:
若所述判断结果指示所述噪声的大小小于所述预设值,则计算所述噪声的大小和第一预设值的和,得到中间结果;
利用第二预设值除以所述中间结果,得到所述唤醒灵敏度。
8.根据权利要求2所述的语音设备的调节方法,其特征在于,所述语音设备上安装有声音传感器阵列;其中,所述声音传感器阵列包括多个声音传感器;
所述基于所述噪声分布,调节所述语音设备的唤醒灵敏度,包括:
计算所述语音设备当前所在位置的噪声的大小和第一预设值的和,得到中间结果;
利用第二预设值除以所述中间结果,得到所述语音设备的整体灵敏度;
调节靠近所述来源方向的所述声音传感器的唤醒灵敏度低于所述整体灵敏度。
9.一种语音设备的调节系统,其特征在于,包括:服务器和至少一个所述语音设备;
所述服务器,用于获取所述语音设备所在的指定空间的多个位置的噪声信号;基于所述噪声信号,确定所述指定空间的噪声分布;基于所述噪声分布,调节各个所述语音设备的唤醒灵敏度。
10.一种语音设备的调节装置,其特征在于,包括:
获取模块,用于获取所述语音设备所在的指定空间的多个位置的噪声信号;
确定模块,用于基于所述噪声信号,确定所述指定空间的噪声分布;
调节模块,用于基于所述噪声分布,调节所述语音设备的唤醒灵敏度。
11.一种电子设备,其特征在于,包括:处理器、存储器和通信总线,其中,处理器和存储器通过通信总线完成相互间的通信;
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述存储器中所存储的程序,实现权利要求1~8任意一项所述的语音设备的调节方法。
12.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1~8任意一项所述的语音设备的调节方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111211270.3A CN113963691A (zh) | 2021-10-18 | 2021-10-18 | 语音设备的调节方法、系统、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111211270.3A CN113963691A (zh) | 2021-10-18 | 2021-10-18 | 语音设备的调节方法、系统、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113963691A true CN113963691A (zh) | 2022-01-21 |
Family
ID=79464293
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111211270.3A Pending CN113963691A (zh) | 2021-10-18 | 2021-10-18 | 语音设备的调节方法、系统、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113963691A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101922964A (zh) * | 2010-05-27 | 2010-12-22 | 合肥工业大学 | 一种可辨别噪声来源方向的环境噪声监测装置和方法 |
CN110460921A (zh) * | 2019-07-15 | 2019-11-15 | 中国第一汽车股份有限公司 | 一种拾音控制方法、装置、车辆和存储介质 |
CN110500721A (zh) * | 2019-08-21 | 2019-11-26 | 宁波奥克斯电气股份有限公司 | 一种空调语音控制方法、装置以及空调器 |
US20210016431A1 (en) * | 2019-07-19 | 2021-01-21 | Lg Electronics Inc. | Robot and method for recognizing wake-up word thereof |
CN112311635A (zh) * | 2020-11-05 | 2021-02-02 | 深圳市奥谷奇技术有限公司 | 语音打断唤醒方法、装置及计算机可读存储介质 |
CN112786042A (zh) * | 2020-12-28 | 2021-05-11 | 北京百度网讯科技有限公司 | 车载语音设备的调整方法、装置、设备及存储介质 |
-
2021
- 2021-10-18 CN CN202111211270.3A patent/CN113963691A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101922964A (zh) * | 2010-05-27 | 2010-12-22 | 合肥工业大学 | 一种可辨别噪声来源方向的环境噪声监测装置和方法 |
CN110460921A (zh) * | 2019-07-15 | 2019-11-15 | 中国第一汽车股份有限公司 | 一种拾音控制方法、装置、车辆和存储介质 |
US20210016431A1 (en) * | 2019-07-19 | 2021-01-21 | Lg Electronics Inc. | Robot and method for recognizing wake-up word thereof |
CN110500721A (zh) * | 2019-08-21 | 2019-11-26 | 宁波奥克斯电气股份有限公司 | 一种空调语音控制方法、装置以及空调器 |
CN112311635A (zh) * | 2020-11-05 | 2021-02-02 | 深圳市奥谷奇技术有限公司 | 语音打断唤醒方法、装置及计算机可读存储介质 |
CN112786042A (zh) * | 2020-12-28 | 2021-05-11 | 北京百度网讯科技有限公司 | 车载语音设备的调整方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10672387B2 (en) | Systems and methods for recognizing user speech | |
US10063965B2 (en) | Sound source estimation using neural networks | |
CN107976651B (zh) | 一种基于麦克风阵列的声源定位方法及装置 | |
US9813810B1 (en) | Multi-microphone neural network for sound recognition | |
US11069366B2 (en) | Method and device for evaluating performance of speech enhancement algorithm, and computer-readable storage medium | |
CN109920419B (zh) | 语音控制方法和装置、电子设备及计算机可读介质 | |
KR102633176B1 (ko) | 환경 잡음 보상 시스템에서 에러를 감소시키기 위한 방법 | |
CN107408386A (zh) | 基于语音方向控制电子装置 | |
CN111294704B (zh) | 音频处理方法、装置及存储介质 | |
CN112992140B (zh) | 智能设备的控制方法、装置、设备及存储介质 | |
CN112437391B (zh) | 用于开放环境的麦克风测试方法及系统 | |
CN110767225A (zh) | 一种语音交互方法、装置及系统 | |
WO2019121397A1 (en) | System and method for determining occupancy | |
US20180206045A1 (en) | Scene and state augmented signal shaping and separation | |
JP2014191616A (ja) | 独居高齢者の見守り方法、装置およびサービス提供システム | |
CN113132193A (zh) | 智能设备的控制方法、装置、电子设备以及存储介质 | |
CN110493092B (zh) | 基于远场语音和iot的万能遥控以及家电遥控方法 | |
Hammoud et al. | Ultrasense: A self-calibrating ultrasound-based room occupancy sensing system | |
CN110169082A (zh) | 组合音频信号输出 | |
CN110782884A (zh) | 远场拾音噪声处理方法、装置、设备及存储介质 | |
CN113963691A (zh) | 语音设备的调节方法、系统、装置、设备及存储介质 | |
JP2000004495A (ja) | 複数マイク自由配置による複数話者位置推定方法 | |
CN113488031B (zh) | 确定电子设备的方法、装置、存储介质及电子装置 | |
CN114049897A (zh) | 一种电器设备的控制方法、装置、电子设备和存储介质 | |
CN111596557B (zh) | 设备控制方法、装置、电子设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |