CN115171699A - 唤醒参数的调整方法和装置、存储介质及电子装置 - Google Patents

唤醒参数的调整方法和装置、存储介质及电子装置 Download PDF

Info

Publication number
CN115171699A
CN115171699A CN202210612576.8A CN202210612576A CN115171699A CN 115171699 A CN115171699 A CN 115171699A CN 202210612576 A CN202210612576 A CN 202210612576A CN 115171699 A CN115171699 A CN 115171699A
Authority
CN
China
Prior art keywords
awakening
audio
detected
wake
average value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210612576.8A
Other languages
English (en)
Inventor
吕丹阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Haier Technology Co Ltd
Haier Smart Home Co Ltd
Original Assignee
Qingdao Haier Technology Co Ltd
Haier Smart Home Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Haier Technology Co Ltd, Haier Smart Home Co Ltd filed Critical Qingdao Haier Technology Co Ltd
Priority to CN202210612576.8A priority Critical patent/CN115171699A/zh
Publication of CN115171699A publication Critical patent/CN115171699A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/20Pattern transformations or operations aimed at increasing system robustness, e.g. against channel noise or different working conditions

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Electric Clocks (AREA)

Abstract

本申请公开了一种唤醒参数的调整方法和装置、存储介质及电子装置,涉及智能家居领域,该唤醒参数的调整方法包括:从待检测设备的噪声音频数据中确定能够唤醒待检测设备的误唤醒音频;将待检测设备的唤醒音频和误唤醒音频分别输入至全局背景模型中,并获取全局背景模型输出的第一均值和第二均值,其中,第一均值用于指示唤醒音频与标准唤醒音频的第一匹配度,第二均值用于指示误唤醒音频与标准唤醒音频的第二匹配度;根据第一均值和第二均值调整待检测设备的唤醒参数,其中,唤醒参数用于指示唤醒待检测设备的唤醒音频与标准唤醒音频的最低匹配度。

Description

唤醒参数的调整方法和装置、存储介质及电子装置
技术领域
本申请涉及通信领域,具体而言,涉及一种唤醒参数的调整方法和装置、存储介质及电子装置。
背景技术
目前很多智能家电设备,都能有语音唤醒功能,用唤醒词当作触发机制,当用户要打开有语音功能的设备时,不需要动手,只要直接说出“唤醒词”,处于休眠/待机状态下的设备接收到用户的声音指令后,会从休眠/待机状态迅速进入工作状态。所以语音唤醒就是通过提前设定的唤醒词,激活智能家电设备的引擎,打开语音交互功能,达到解放双手,随叫随到的效果。
目前的绝大多数智能家电设备需要有一个特定唤醒词,比如百度的“小度”、海尔的“小优”、小米的“小爱”,阿里天猫精灵智能音箱的“天猫精灵”,京东叮咚智能音箱的“叮咚叮咚”,激活Google智能助手,如“Hey Google”等等;但是有些情况下,智能家电设备会发生误唤醒;误唤醒是指智能家电设备听到与唤醒词相近的音频而被误触发的情况,这会导致处于工作状态的智能家电设备会将“听”到的内容在本地或云端保存下来,引起用户对隐私安全问题的担忧,给用户生活带来了麻烦。
事实上,误唤醒和唤醒是相对的。误唤醒是指当设备收到不是预先设定的唤醒词命令后,错误将这个语料识别成唤醒词条,导致不是用户自身意图的对设备唤醒情况发生。因此,这种误唤醒在一定程度上会产生很不好的用户体验。从而给用户造成不必要的困扰和麻烦。
针对相关技术中,智能家电设备的误唤醒在一定程度上会产生很不好的用户体验,从而给用户造成不必要的困扰和麻烦等问题,尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种唤醒参数的调整方法和装置、存储介质及电子装置,以至少解决相关技术中,智能家电设备的误唤醒在一定程度上会产生很不好的用户体验,从而给用户造成不必要的困扰和麻烦等问题。
根据本申请实施例的一个实施例,提供了一种唤醒参数的调整方法,包括:从待检测设备的噪声音频数据中确定能够唤醒所述待检测设备的误唤醒音频;将所述待检测设备的唤醒音频和所述误唤醒音频分别输入至全局背景模型中,并获取所述全局背景模型输出的第一均值和第二均值,其中,所述第一均值用于指示所述唤醒音频与标准唤醒音频的第一匹配度,所述第二均值用于指示所述误唤醒音频与所述标准唤醒音频的第二匹配度;根据所述第一均值和所述第二均值调整所述待检测设备的唤醒参数,其中,所述唤醒参数用于指示唤醒所述待检测设备的唤醒音频与所述标准唤醒音频的最低匹配度。
在一个示例性实施例中,根据所述第一均值和所述第二均值调整所述待检测设备的唤醒参数,包括:在多个所述第二均值中确定均值相同的第三均值的第一数量,以及根据所述第二均值的第二数量和所述第一数量确定所述第三均值的权重;根据所述第三均值、第三均值的权重确定第四均值;根据所述第一均值和所述第四均值的平均数调整所述待检测设备的唤醒参数。
在一个示例性实施例中,将所述待检测设备的唤醒音频和所述误唤醒音频分别输入至全局背景模型中,并获取所述全局背景模型输出的第一均值和第二均值,包括:通过所述全局背景模型确定所述唤醒音频和误唤醒音频的第一声波信息和第二声波信息;通过全局背景模型对比所述第一声波信息和所述标准唤醒音频的标准声波信息,得到所述第一均值,以及通过全局背景模型对比所述第二声波信息和所述标准唤醒音频的标准声波信息,得到所述第二均值。
在一个示例性实施例中,将所述待检测设备的误唤醒音频输入至全局背景模型中,并获取所述全局背景模型输出的第二均值,包括:确定同一所述误唤醒音频唤醒所述待检测设备的次数,并在所述误唤醒音频中确定所述次数大于预设阈值的第一误唤醒音频;将所述第一误唤醒音频输入至全局背景模型中,并获取所述全局背景模型输出的所述第一误唤醒音频对应的第二均值。
在一个示例性实施例中,从待检测设备的噪声音频数据中确定能够唤醒所述待检测设备的误唤醒音频之前,所述方法还包括:获取所述噪声音频的标签数据,其中,所述标签数据用于指示所述噪声音频的分贝、所述噪声音频与所述待检测设备的距离、同时播放的噪声音频的数量;确定与所述同时播放的噪声音频的数量一致的音频设备;根据所述待检测设备的距离控制所述音频设备移动到目标位置,以及控制音频设备根据所述噪声音频的分贝向所述待检测设备播放所述噪声音频。
在一个示例性实施例中,根据所述第一均值和所述第二均值调整所述待检测设备的唤醒参数之后,所述方法还包括:接收所述待检测设备对应的目标对象的反馈信息,其中,所述反馈信息用于指示所述目标对象对所述待检测设备的唤醒率的置信度;统计所述反馈信息,以确定不同的置信度分别对应的数量;根据所述不同的置信度以及所述不同的置信度分别对应的数量再次调整所述待检测设备的唤醒模块的唤醒参数。
在一个示例性实施例中,根据所述不同的置信度以及所述不同的置信度分别对应的数量再次调整所述待检测设备的唤醒模块的唤醒参数,包括:根据所述待检测设备的唤醒率的置信度的总数量与所述不同的置信度分别对应的数量确定不同的置信度分别对应的权重;根据所述不同的置信度分别对应的权重再次调整所述待检测设备的唤醒模块的唤醒参数。
根据本申请实施例的另一个实施例,还提供了一种唤醒参数的调整装置,包括:确定模块,用于从待检测设备的噪声音频数据中确定能够唤醒所述待检测设备的误唤醒音频;获取模块,用于将所述待检测设备的唤醒音频和所述误唤醒音频分别输入至全局背景模型中,并获取所述全局背景模型输出的第一均值和第二均值,其中,所述第一均值用于指示所述唤醒音频与标准唤醒音频的第一匹配度,所述第二均值用于指示所述误唤醒音频与所述标准唤醒音频的第二匹配度;调整模块,用于根据所述第一均值和所述第二均值调整所述待检测设备的唤醒参数,其中,所述唤醒参数用于指示唤醒所述待检测设备的唤醒音频与所述标准唤醒音频的最低匹配度。
根据本申请实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述唤醒参数的调整方法。
根据本申请实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的唤醒参数的调整方法。
在本申请实施例中,从待检测设备的噪声音频数据中确定能够唤醒所述待检测设备的误唤醒音频;将所述待检测设备的唤醒音频和所述误唤醒音频分别输入至全局背景模型中,并获取所述全局背景模型输出的第一均值和第二均值,其中,所述第一均值用于指示所述唤醒音频与标准唤醒音频的第一匹配度,所述第二均值用于指示所述误唤醒音频与所述标准唤醒音频的第二匹配度;根据所述第一均值和所述第二均值调整所述待检测设备的唤醒参数,其中,所述唤醒参数用于指示唤醒所述待检测设备的唤醒音频与所述标准唤醒音频的最低匹配度;采用上述技术方案,解决了智能家电设备的误唤醒在一定程度上会产生很不好的用户体验,从而给用户造成不必要的困扰和麻烦等问题,本发明通过模拟用户实际生活场景,从待检测设备的噪声音频数据中确定能够唤醒所述待检测设备的误唤醒音频。通过自动化工具进行音频分析,可以统计出误唤醒音频与标准唤醒音频的匹配度和唤醒音频与标准唤醒音频的匹配度,进而给开发人员提供可靠数据以及策略,达到帮助解决设备被误唤醒以及唤醒灵敏度之间无法协调的问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例的一种唤醒参数的调整方法的硬件环境示意图;
图2是根据本申请实施例的唤醒参数的调整方法的流程图;
图3是根据本申请实施例的唤醒参数的调整方法的示意图(一);
图4是根据本申请实施例的唤醒参数的调整方法的示意图(二);
图5是根据本申请实施例的唤醒参数的调整方法的时序图;
图6是根据本申请实施例的一种唤醒参数的调整装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例的一个方面,提供了一种唤醒参数的调整方法。该唤醒参数的调整方法广泛应用于智慧家庭(Smart Home)、智能家居、智能家用设备生态、智慧住宅(IntelligenceHouse)生态等全屋智能数字化控制应用场景。可选地,在本实施例中,上述唤醒参数的调整方法可以应用于如图1所示的由终端设备102和服务器104所构成的硬件环境中。如图1所示,服务器104通过网络与终端设备102进行连接,可用于为终端或终端上安装的客户端提供服务(如应用服务等),可在服务器上或独立于服务器设置数据库,用于为服务器104提供数据存储服务,可在服务器上或独立于服务器配置云计算和/或边缘计算服务,用于为服务器104提供数据运算服务。
上述网络可以包括但不限于以下至少之一:有线网络,无线网络。上述有线网络可以包括但不限于以下至少之一:广域网,城域网,局域网,上述无线网络可以包括但不限于以下至少之一:WIFI(Wireless Fidelity,无线保真),蓝牙。终端设备102可以并不限定于为PC、手机、平板电脑、智能空调、智能烟机、智能冰箱、智能烤箱、智能炉灶、智能洗衣机、智能热水器、智能洗涤设备、智能洗碗机、智能投影设备、智能电视、智能晾衣架、智能窗帘、智能影音、智能插座、智能音响、智能音箱、智能新风设备、智能厨卫设备、智能卫浴设备、智能扫地机器人、智能擦窗机器人、智能拖地机器人、智能空气净化设备、智能蒸箱、智能微波炉、智能厨宝、智能净化器、智能饮水机、智能门锁等。
在本实施例中提供了一种唤醒参数的调整方法,应用于计算机终端,图2是根据本申请实施例的唤醒参数的调整方法的流程图,该流程包括如下步骤:
步骤S202,从待检测设备的噪声音频数据中确定能够唤醒所述待检测设备的误唤醒音频;
需要说明的是,误唤醒音频为所述噪声音频中所述待检测设备被唤醒的音频,所述噪声音频和误唤醒音频中不包含唤醒词。
步骤S204,将所述待检测设备的唤醒音频和所述误唤醒音频分别输入至全局背景模型中,并获取所述全局背景模型输出的第一均值和第二均值,其中,所述第一均值用于指示所述唤醒音频与标准唤醒音频的第一匹配度,所述第二均值用于指示所述误唤醒音频与所述标准唤醒音频的第二匹配度;
需要说明的是,唤醒音频中包含唤醒词,所述唤醒音频为使用所述待检测设备的目标对象发出的音频信息,因此唤醒音频与标准唤醒音频存在一定的区别。
步骤S206,根据所述第一均值和所述第二均值调整所述待检测设备的唤醒参数,其中,所述唤醒参数用于指示唤醒所述待检测设备的唤醒音频与所述标准唤醒音频的最低匹配度。
通过上述步骤,从待检测设备的噪声音频数据中确定能够唤醒所述待检测设备的误唤醒音频;将所述待检测设备的唤醒音频和所述误唤醒音频分别输入至全局背景模型中,并获取所述全局背景模型输出的第一均值和第二均值,其中,所述第一均值用于指示所述唤醒音频与标准唤醒音频的第一匹配度,所述第二均值用于指示所述误唤醒音频与所述标准唤醒音频的第二匹配度;根据所述第一均值和所述第二均值调整所述待检测设备的唤醒参数,其中,所述唤醒参数用于指示唤醒所述待检测设备的唤醒音频与所述标准唤醒音频的最低匹配度,解决了相关技术中,智能家电设备的误唤醒在一定程度上会产生很不好的用户体验,从而给用户造成不必要的困扰和麻烦等问题,进而本发明通过模拟用户实际生活场景,从待检测设备的噪声音频数据中确定能够唤醒所述待检测设备的误唤醒音频。通过自动化工具进行音频分析,可以统计出误唤醒音频与标准唤醒音频的匹配度和唤醒音频与标准唤醒音频的匹配度,进而给开发人员提供可靠数据以及策略,达到帮助解决设备被误唤醒以及唤醒灵敏度之间无法协调的问题。
需要说明的是,上述唤醒参数为唤醒所述待检测设备的唤醒音频与所述标准唤醒音频的最低匹配度,可以理解为,在用户发出的唤醒音频与标准唤醒音频的匹配度大于或等于所述最低匹配度(即达到所述唤醒参数)的情况下,所述用户发出的唤醒音频才可以将所述待检测设备唤醒;在用户发出的唤醒音频与标准唤醒音频的匹配度小于所述最低匹配度(即未达到所述唤醒参数)的情况下,所述用户发出的唤醒音频不可以将所述待检测设备唤醒。举例来讲,在所述唤醒参数为87.5时,所述唤醒参数用于指示“唤醒所述待检测设备的唤醒音频与所述标准唤醒音频的最低匹配度为87.5%”,在用户发出的唤醒音频与标准唤醒音频的匹配度为90%的情况下,可以唤醒所述待检测设备;在用户发出的唤醒音频与标准唤醒音频的匹配度为80%的情况下,不可以唤醒所述待检测设备。
在一个示例性实施例中,根据所述第一均值和所述第二均值调整所述待检测设备的唤醒参数,包括:在多个所述第二均值中确定均值相同的第三均值的第一数量,以及根据所述第二均值的第二数量和所述第一数量确定所述第三均值的权重;根据所述第三均值、第三均值的权重确定第四均值;根据所述第一均值和所述第四均值的平均数调整所述待检测设备的唤醒参数。
举例来讲,第二均值为“80、81、82、85、85、82、82、82、81、82”的情况下,在第二均值中确定均值相同的第三均值“80”、“81”、“82”、“85”,“80”的数量为1、“81”的数量为2、“82”的数量为5、“85”的数量为2;“80”的权重为1/10;“81”的权重为1/5;“82”权重为1/2;“85”的权重为1/5,第四均值为“82.2”;在第一均值为“92”的情况下,根据“82.2”和“92”的平均数调整所述待检测设备的唤醒参数为87.1。
可选的,在一个示例性实施例中,根据所述第一均值和所述第二均值调整所述待检测设备的唤醒参数,包括:在多个所述第二均值中确定均值相同的第三均值的第一数量,以及在多个所述第一均值中确定均值相同的第五均值的第三数量;根据所述第二均值的第二数量和所述第一数量确定所述第三均值的权重,以及根据所述第一均值的第四数量和所述第三数量确定所述第五均值的权重;根据所述第三均值、第三均值的权重、第五均值、第五均值的第三数量确定第六均值;根据所述第一均值和所述第六均值的平均数调整所述待检测设备的唤醒参数。
作为一种可选的方案,将所述待检测设备的唤醒音频和所述误唤醒音频分别输入至全局背景模型中,并获取所述全局背景模型输出的第一均值和第二均值,还包括:
S1,通过所述全局背景模型确定所述唤醒音频和误唤醒音频的第一声波信息和第二声波信息;
S2,通过全局背景模型对比所述第一声波信息和所述标准唤醒音频的标准声波信息,得到所述第一均值;
S3,通过全局背景模型对比所述第二声波信息和所述标准唤醒音频的标准声波信息,得到所述第二均值。
需要说明的是,第一均值和第二均值为所述全局背景模型根据所述第一声波信息和所述第二声波信息与所述标准声波信息进行对比得到的。
在一个示例性实施例中,将所述待检测设备的误唤醒音频输入至全局背景模型中,并获取所述全局背景模型输出的第二均值,包括:确定同一所述误唤醒音频唤醒所述待检测设备的次数,并在所述误唤醒音频中确定所述次数大于预设阈值的第一误唤醒音频;将所述第一误唤醒音频输入至全局背景模型中,并获取所述全局背景模型输出的所述第一误唤醒音频对应的第二均值。
需要说明的是,获取误唤醒音频之后,对误唤醒音频进行分类统计,得到唤醒次数大于预设阈值的第一误唤醒音频,将所述第一误唤醒音频输入至全局背景模型中,并获取所述全局背景模型输出的所述第一误唤醒音频对应的第二均值。
进一步举例说明,可选的例如采用离线计算框架对噪声音频进行阶段性预测并标注,在噪声音频将所述待检测设备唤醒的情况下,记录误唤醒音频唤醒所述待检测设备一次,其中,可选的例如预设在误唤醒音频在相同距离唤醒所述待检测设备两次的情况下,记录误唤醒音频唤醒所述待检测设备两次,以及剔除幻想次数小于10次的数据,进而达到了提高误唤醒音频的准确性的目的,实现了提高误唤醒音频的精准度的技术效果。
作为一种可选的方案,从待检测设备的噪声音频数据中确定能够唤醒所述待检测设备的误唤醒音频之前,还包括:
S1,获取所述噪声音频的标签数据,其中,所述标签数据用于指示所述噪声音频的分贝、所述噪声音频与所述待检测设备的距离、同时播放的噪声音频的数量;
S2,确定与所述同时播放的噪声音频的数量一致的音频设备;
S3,根据所述待检测设备的距离控制所述音频设备移动到目标位置,以及控制音频设备根据所述噪声音频的分贝向所述待检测设备播放所述噪声音频。
需要说明的是,本申请中的音频设备为可移动的音频设备或者不可移动的音频设备;在所述音频设备为可移动的音频设备的情况下,根据所述待检测设备的距离控制所述音频设备移动到目标位置,以及控制音频设备根据所述噪声音频的分贝向所述待检测设备播放所述噪声音频;在所述音频设备为不可移动的音频设备的情况下,根据所述噪声音频的标签数据在所述目标区域中的设备中确定目标音频设备,目标音频设备与所述待检测设备的距离与所述噪声音频与所述待检测设备的距离一致。
在一个示例性实施例中,根据所述第一均值和所述第二均值调整所述待检测设备的唤醒参数之后,还包括:接收所述待检测设备对应的目标对象的反馈信息,其中,所述反馈信息用于指示所述目标对象对所述待检测设备的唤醒率的置信度;统计所述反馈信息,以确定不同的置信度分别对应的数量;根据所述不同的置信度以及所述不同的置信度分别对应的数量再次调整所述待检测设备的唤醒模块的唤醒参数。
也就是说,在待检测设备发布之后,还会根据目标对象的反馈信息对所述唤醒参数进行调整,具体的,根据所述反馈信息确定所述目标对象对所述待检测设备的唤醒率的置信度,以及确定不同的置信度分别对应的数量。
举例来讲,在反馈信息用于指示目标对象所述待检测设备的唤醒率较为满意,确定所目标对象对所述待检测设备的唤醒率的置信度为90%;在反馈信息用于指示目标对象所述待检测设备的唤醒率非常满意,确定所目标对象对所述待检测设备的唤醒率的置信度为95%;在反馈信息用于指示目标对象所述待检测设备的唤醒率一般满意,确定所目标对象对所述待检测设备的唤醒率的置信度为85%等,上述数值仅是为了更好的理解本实施例,本发明实施例对此不作限定。
在一个示例性实施例中,根据所述不同的置信度以及所述不同的置信度分别对应的数量再次调整所述待检测设备的唤醒模块的唤醒参数,包括:根据所述待检测设备的唤醒率的置信度的总数量与所述不同的置信度分别对应的数量确定不同的置信度分别对应的权重;根据所述不同的置信度分别对应的权重再次调整所述待检测设备的唤醒模块的唤醒参数。
可选的,在确定不同的置信度的权重的情况下,根据所述不同的置信度分别对应的权重和所述不同的置信度确定平均置信度,根据平均置信度再次调整所述待检测设备的唤醒模块的唤醒参数。
可选的,根据置信度与参数调整范围的对应关系确定所述平均置信度对应的目标参数调整范围,根据所述目标参数调整范围调整所述唤醒参数。
为了更好的理解上述唤醒参数的调整方法的过程,以下再结合可选实施例对上述唤醒参数的调整的实现方法流程进行说明,但不用于限定本申请实施例的技术方案。
在本实施例中提供了一种唤醒参数的调整方法,图5是根据本申请实施例的唤醒参数的调整方法的时序图,具体如下步骤:
步骤1:模拟用户真实场景,以测试所述待检测设备的误唤醒音频;
具体的:通过类比用户环境进行多方位多点测试,本发明将大概率覆盖用户常用场景。按照不同距离、音频数量、音频类型及音量强弱等参照因素做组合对比测试。如表1所示;
表1
Figure BDA0003673382320000111
Figure BDA0003673382320000121
Figure BDA0003673382320000131
Figure BDA0003673382320000141
例如,图3是根据本申请实施例的唤醒参数的调整方法的示意图(一),如图3所示,以热水器为例,热水器+声源1个,对所述热水器进行误唤醒检测。
例如,图4是根据本申请实施例的唤醒参数的调整方法的示意图(二),如图4所示,以热水器为例,热水器+声源2个,对所述热水器进行误唤醒检测。
需要说明的是,模拟常用噪音音频作为输入数据,尽可能得覆盖用户实际应用场景。作为输入音频非常灵活机动,如有需要可以随意更改。
步骤2:后台程序自动统计待检测设备的误唤醒次数,将待检测设备被误唤醒时的语料音频录制存储,并解析声波,通过TVM-I-Vector建模方式以UBM为基础的,根据UBM输出的均值进行相应统计量的计算以及统计概率;
需要说明的是,I-Vector建模方式称为全局差异空间建模(Total VariabilityModeling,TVM),采用该方法提取的I-Vector记为TVM-I-Vector。
步骤S3:将热水器唤醒音频的声波的UBM均值与误唤醒音频的声波的UBM均值进行差量计算。
步骤4:针对大概率误唤醒音频,输出声波的UBM均值与误唤醒音频的声波的UBM均值的差值。以使终端根据所述差值调整唤醒参数,进而提高唤醒成功率,降低误唤醒率。
本发明实施例主要通过大概率覆盖用户常用场景。按照不同距离、音频数量、音频类型及音量强弱等参照因素组合做误唤醒对比测试(测试频率以及组合方式,可以灵活调整)。通过TVM-I-Vector建模方式以UBM为基础的,根据UBM的均值及方差进行相应统计量的计算。最后输出对比差值,以使终端根据所述差值调整唤醒参数,进而帮助设备端解决误唤醒和识别灵敏度之间的平衡。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例的方法。
图6是根据本申请实施例的一种唤醒参数的调整装置的结构框图;如图6所示,包括:
确定模块62,用于从待检测设备的噪声音频数据中确定能够唤醒所述待检测设备的误唤醒音频;
获取模块64,用于将所述待检测设备的唤醒音频和所述误唤醒音频分别输入至全局背景模型中,并获取所述全局背景模型输出的第一均值和第二均值,其中,所述第一均值用于指示所述唤醒音频与标准唤醒音频的第一匹配度,所述第二均值用于指示所述误唤醒音频与所述标准唤醒音频的第二匹配度;
调整模块66,用于根据所述第一均值和所述第二均值调整所述待检测设备的唤醒参数,其中,所述唤醒参数用于指示唤醒所述待检测设备的唤醒音频与所述标准唤醒音频的最低匹配度。
通过上述装置,从待检测设备的噪声音频数据中确定能够唤醒所述待检测设备的误唤醒音频;将所述待检测设备的唤醒音频和所述误唤醒音频分别输入至全局背景模型中,并获取所述全局背景模型输出的第一均值和第二均值,其中,所述第一均值用于指示所述唤醒音频与标准唤醒音频的第一匹配度,所述第二均值用于指示所述误唤醒音频与所述标准唤醒音频的第二匹配度;根据所述第一均值和所述第二均值调整所述待检测设备的唤醒参数,其中,所述唤醒参数用于指示唤醒所述待检测设备的唤醒音频与所述标准唤醒音频的最低匹配度,解决了相关技术中,智能家电设备的误唤醒在一定程度上会产生很不好的用户体验,从而给用户造成不必要的困扰和麻烦等问题,进而本发明通过模拟用户实际生活场景,从待检测设备的噪声音频数据中确定能够唤醒所述待检测设备的误唤醒音频。通过自动化工具进行音频分析,可以统计出误唤醒音频与标准唤醒音频的匹配度和唤醒音频与标准唤醒音频的匹配度,进而给开发人员提供可靠数据以及策略,达到帮助解决设备被误唤醒以及唤醒灵敏度之间无法协调的问题。
在一个示例性实施例中,调整模块66,用于在多个所述第二均值中确定均值相同的第三均值的第一数量,以及根据所述第二均值的第二数量和所述第一数量确定所述第三均值的权重;根据所述第三均值、第三均值的权重确定第四均值;根据所述第一均值和所述第四均值的平均数调整所述待检测设备的唤醒参数。
在一个示例性实施例中,获取模块64,用于通过所述全局背景模型确定所述唤醒音频和误唤醒音频的第一声波信息和第二声波信息;通过全局背景模型对比所述第一声波信息和所述标准唤醒音频的标准声波信息,得到所述第一均值,以及通过全局背景模型对比所述第二声波信息和所述标准唤醒音频的标准声波信息,得到所述第二均值。
在一个示例性实施例中,获取模块64,用于确定同一所述误唤醒音频唤醒所述待检测设备的次数,并在所述误唤醒音频中确定所述次数大于预设阈值的第一误唤醒音频;将所述第一误唤醒音频输入至全局背景模型中,并获取所述全局背景模型输出的所述第一误唤醒音频对应的第二均值。
在一个示例性实施例中,确定模块62,用于获取所述噪声音频的标签数据,其中,所述标签数据用于指示所述噪声音频的分贝、所述噪声音频与所述待检测设备的距离、同时播放的噪声音频的数量;确定与所述同时播放的噪声音频的数量一致的音频设备;根据所述待检测设备的距离控制所述音频设备移动到目标位置,以及控制音频设备根据所述噪声音频的分贝向所述待检测设备播放所述噪声音频。
在一个示例性实施例中,调整模块66,用于接收所述待检测设备对应的目标对象的反馈信息,其中,所述反馈信息用于指示所述目标对象对所述待检测设备的唤醒率的置信度;统计所述反馈信息,以确定不同的置信度分别对应的数量;根据所述不同的置信度以及所述不同的置信度分别对应的数量再次调整所述待检测设备的唤醒模块的唤醒参数。
在一个示例性实施例中,调整模块66,用于根据所述待检测设备的唤醒率的置信度的总数量与所述不同的置信度分别对应的数量确定不同的置信度分别对应的权重;根据所述不同的置信度分别对应的权重再次调整所述待检测设备的唤醒模块的唤醒参数。
本申请的实施例还提供了一种存储介质,该存储介质包括存储的程序,其中,上述程序运行时执行上述任一项的方法。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的程序代码:
S1,从待检测设备的噪声音频数据中确定能够唤醒所述待检测设备的误唤醒音频;
S2,将所述待检测设备的唤醒音频和所述误唤醒音频分别输入至全局背景模型中,并获取所述全局背景模型输出的第一均值和第二均值,其中,所述第一均值用于指示所述唤醒音频与标准唤醒音频的第一匹配度,所述第二均值用于指示所述误唤醒音频与所述标准唤醒音频的第二匹配度;
S3,根据所述第一均值和所述第二均值调整所述待检测设备的唤醒参数,其中,所述唤醒参数用于指示唤醒所述待检测设备的唤醒音频与所述标准唤醒音频的最低匹配度。
本申请的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,从待检测设备的噪声音频数据中确定能够唤醒所述待检测设备的误唤醒音频;
S2,将所述待检测设备的唤醒音频和所述误唤醒音频分别输入至全局背景模型中,并获取所述全局背景模型输出的第一均值和第二均值,其中,所述第一均值用于指示所述唤醒音频与标准唤醒音频的第一匹配度,所述第二均值用于指示所述误唤醒音频与所述标准唤醒音频的第二匹配度;
S3,根据所述第一均值和所述第二均值调整所述待检测设备的唤醒参数,其中,所述唤醒参数用于指示唤醒所述待检测设备的唤醒音频与所述标准唤醒音频的最低匹配度。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围c。

Claims (10)

1.一种唤醒参数的调整方法,其特征在于,包括:
从待检测设备的噪声音频数据中确定能够唤醒所述待检测设备的误唤醒音频;
将所述待检测设备的唤醒音频和所述误唤醒音频分别输入至全局背景模型中,并获取所述全局背景模型输出的第一均值和第二均值,其中,所述第一均值用于指示所述唤醒音频与标准唤醒音频的第一匹配度,所述第二均值用于指示所述误唤醒音频与所述标准唤醒音频的第二匹配度;
根据所述第一均值和所述第二均值调整所述待检测设备的唤醒参数,其中,所述唤醒参数用于指示唤醒所述待检测设备的唤醒音频与所述标准唤醒音频的最低匹配度。
2.根据权利要求1所述的唤醒参数的调整方法,其特征在于,根据所述第一均值和所述第二均值调整所述待检测设备的唤醒参数,包括:
在多个所述第二均值中确定均值相同的第三均值的第一数量,以及根据所述第二均值的第二数量和所述第一数量确定所述第三均值的权重;
根据所述第三均值、第三均值的权重确定第四均值;
根据所述第一均值和所述第四均值的平均数调整所述待检测设备的唤醒参数。
3.根据权利要求1所述的唤醒参数的调整方法,其特征在于,将所述待检测设备的唤醒音频和所述误唤醒音频分别输入至全局背景模型中,并获取所述全局背景模型输出的第一均值和第二均值,包括:
通过所述全局背景模型确定所述唤醒音频和误唤醒音频的第一声波信息和第二声波信息;
通过全局背景模型对比所述第一声波信息和所述标准唤醒音频的标准声波信息,得到所述第一均值,以及通过全局背景模型对比所述第二声波信息和所述标准唤醒音频的标准声波信息,得到所述第二均值。
4.根据权利要求1所述的唤醒参数的调整方法,其特征在于,将所述待检测设备的误唤醒音频输入至全局背景模型中,并获取所述全局背景模型输出的第二均值,包括:
确定同一所述误唤醒音频唤醒所述待检测设备的次数,并在所述误唤醒音频中确定所述次数大于预设阈值的第一误唤醒音频;
将所述第一误唤醒音频输入至全局背景模型中,并获取所述全局背景模型输出的所述第一误唤醒音频对应的第二均值。
5.根据权利要求1-4任一项所述的唤醒参数的调整方法,其特征在于,从待检测设备的噪声音频数据中确定能够唤醒所述待检测设备的误唤醒音频之前,所述方法还包括:
获取所述噪声音频的标签数据,其中,所述标签数据用于指示所述噪声音频的分贝、所述噪声音频与所述待检测设备的距离、同时播放的噪声音频的数量;
确定与所述同时播放的噪声音频的数量一致的音频设备;
根据所述待检测设备的距离控制所述音频设备移动到目标位置,以及控制音频设备根据所述噪声音频的分贝向所述待检测设备播放所述噪声音频。
6.根据权利要求1-4任一项所述的唤醒参数的调整方法,其特征在于,根据所述第一均值和所述第二均值调整所述待检测设备的唤醒参数之后,所述方法还包括:
接收所述待检测设备对应的目标对象的反馈信息,其中,所述反馈信息用于指示所述目标对象对所述待检测设备的唤醒率的置信度;
统计所述反馈信息,以确定不同的置信度分别对应的数量;
根据所述不同的置信度以及所述不同的置信度分别对应的数量再次调整所述待检测设备的唤醒模块的唤醒参数。
7.根据权利要求6所述的唤醒参数的调整方法,其特征在于,根据所述不同的置信度以及所述不同的置信度分别对应的数量再次调整所述待检测设备的唤醒模块的唤醒参数,包括:
根据所述待检测设备的唤醒率的置信度的总数量与所述不同的置信度分别对应的数量确定不同的置信度分别对应的权重;
根据所述不同的置信度分别对应的权重再次调整所述待检测设备的唤醒模块的唤醒参数。
8.一种唤醒参数的调整装置,其特征在于,包括:
确定模块,用于从待检测设备的噪声音频数据中确定能够唤醒所述待检测设备的误唤醒音频;
获取模块,用于将所述待检测设备的唤醒音频和所述误唤醒音频分别输入至全局背景模型中,并获取所述全局背景模型输出的第一均值和第二均值,其中,所述第一均值用于指示所述唤醒音频与标准唤醒音频的第一匹配度,所述第二均值用于指示所述误唤醒音频与所述标准唤醒音频的第二匹配度;
调整模块,用于根据所述第一均值和所述第二均值调整所述待检测设备的唤醒参数,其中,所述唤醒参数用于指示唤醒所述待检测设备的唤醒音频与所述标准唤醒音频的最低匹配度。
9.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至7任一项中所述的方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至7任一项中所述的方法。
CN202210612576.8A 2022-05-31 2022-05-31 唤醒参数的调整方法和装置、存储介质及电子装置 Pending CN115171699A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210612576.8A CN115171699A (zh) 2022-05-31 2022-05-31 唤醒参数的调整方法和装置、存储介质及电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210612576.8A CN115171699A (zh) 2022-05-31 2022-05-31 唤醒参数的调整方法和装置、存储介质及电子装置

Publications (1)

Publication Number Publication Date
CN115171699A true CN115171699A (zh) 2022-10-11

Family

ID=83483883

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210612576.8A Pending CN115171699A (zh) 2022-05-31 2022-05-31 唤醒参数的调整方法和装置、存储介质及电子装置

Country Status (1)

Country Link
CN (1) CN115171699A (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101924190B1 (ko) * 2017-07-17 2018-11-30 주식회사 온카드시스템 음성인식을 이용한 본인인증 보안 시스템
US20190088262A1 (en) * 2017-09-19 2019-03-21 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for pushing information
CN110070857A (zh) * 2019-04-25 2019-07-30 北京梧桐车联科技有限责任公司 语音唤醒模型的模型参数调整方法及装置、语音设备
CN110570861A (zh) * 2019-09-24 2019-12-13 Oppo广东移动通信有限公司 用于语音唤醒的方法、装置、终端设备及可读存储介质
CN111816214A (zh) * 2020-08-10 2020-10-23 濮阳职业技术学院 一种声乐演唱技能检测系统
CN111866660A (zh) * 2020-06-29 2020-10-30 深圳优地科技有限公司 声音播放方法、机器人、终端设备及存储介质
CN111880856A (zh) * 2020-07-31 2020-11-03 Oppo广东移动通信有限公司 语音唤醒方法、装置、电子设备及存储介质
WO2021013137A1 (zh) * 2019-07-25 2021-01-28 华为技术有限公司 一种语音唤醒方法及电子设备
CN112712809A (zh) * 2021-03-29 2021-04-27 北京远鉴信息技术有限公司 一种语音检测方法、装置、电子设备及存储介质
CN113160815A (zh) * 2021-04-15 2021-07-23 深圳市欧瑞博科技股份有限公司 语音唤醒的智能控制方法、装置、设备及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101924190B1 (ko) * 2017-07-17 2018-11-30 주식회사 온카드시스템 음성인식을 이용한 본인인증 보안 시스템
US20190088262A1 (en) * 2017-09-19 2019-03-21 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for pushing information
CN110070857A (zh) * 2019-04-25 2019-07-30 北京梧桐车联科技有限责任公司 语音唤醒模型的模型参数调整方法及装置、语音设备
WO2021013137A1 (zh) * 2019-07-25 2021-01-28 华为技术有限公司 一种语音唤醒方法及电子设备
CN110570861A (zh) * 2019-09-24 2019-12-13 Oppo广东移动通信有限公司 用于语音唤醒的方法、装置、终端设备及可读存储介质
CN111866660A (zh) * 2020-06-29 2020-10-30 深圳优地科技有限公司 声音播放方法、机器人、终端设备及存储介质
CN111880856A (zh) * 2020-07-31 2020-11-03 Oppo广东移动通信有限公司 语音唤醒方法、装置、电子设备及存储介质
CN111816214A (zh) * 2020-08-10 2020-10-23 濮阳职业技术学院 一种声乐演唱技能检测系统
CN112712809A (zh) * 2021-03-29 2021-04-27 北京远鉴信息技术有限公司 一种语音检测方法、装置、电子设备及存储介质
CN113160815A (zh) * 2021-04-15 2021-07-23 深圳市欧瑞博科技股份有限公司 语音唤醒的智能控制方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
US11556857B2 (en) Electrical panel for determining a power main of a smart plug
CN114755931A (zh) 控制指令的预测方法和装置、存储介质及电子装置
CN113593548A (zh) 智能设备的唤醒方法和装置、存储介质及电子装置
CN115171699A (zh) 唤醒参数的调整方法和装置、存储介质及电子装置
WO2023173596A1 (zh) 语句文本的意图识别方法和装置、存储介质及电子装置
CN115345225A (zh) 推荐场景的确定方法及装置、存储介质及电子装置
CN115512686A (zh) 唤醒结果的确定方法、装置、存储介质及电子装置
CN113270099B (zh) 智能语音提取方法、装置、电子设备及存储介质
CN117877474A (zh) 控制语音的响应方法和装置、存储介质及电子装置
CN118158012A (zh) 组合命令的确定方法和装置、存储介质及电子装置
CN115357446A (zh) 设备的测试方法和装置、存储介质及电子装置
CN116072113A (zh) 控制指令的确定方法及装置、存储介质及电子装置
CN118262722A (zh) 待唤醒设备的唤醒方法及装置、存储介质及电子装置
CN115171657A (zh) 语音设备的测试方法和装置、存储介质
CN116386597A (zh) 方言识别模型的构建方法和装置、存储介质及电子装置
CN117725995A (zh) 一种基于大模型的知识图谱构建方法、装置及介质
CN116364079A (zh) 设备控制方法、装置和存储介质及电子装置
CN116301511A (zh) 设备交互方法、装置、存储介质及电子装置
CN117524200A (zh) 唤醒模型迭代方法、装置、存储介质及电子装置
CN116450080A (zh) 交互能力的确定方法和装置、存储介质及电子装置
CN116072124A (zh) 用户身份识别方法、存储介质及电子装置
CN116545791A (zh) 参数调整方法及装置、存储介质及电子装置
CN118118282A (zh) 音频播放方法、装置、存储介质及电子装置
CN115312051A (zh) 设备的语音控制方法和装置、存储介质及电子装置
CN115312048A (zh) 设备唤醒方法及装置、存储介质及电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination