CN114187904A - 相似度阈值获取方法、语音家电及计算机可读存储介质 - Google Patents
相似度阈值获取方法、语音家电及计算机可读存储介质 Download PDFInfo
- Publication number
- CN114187904A CN114187904A CN202010862292.5A CN202010862292A CN114187904A CN 114187904 A CN114187904 A CN 114187904A CN 202010862292 A CN202010862292 A CN 202010862292A CN 114187904 A CN114187904 A CN 114187904A
- Authority
- CN
- China
- Prior art keywords
- similarity threshold
- current
- pressure level
- sound pressure
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 79
- 238000013507 mapping Methods 0.000 claims abstract description 62
- 230000007613 environmental effect Effects 0.000 claims abstract description 30
- 238000004590 computer program Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000002354 daily effect Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000002618 waking effect Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/282—Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Automation & Control Theory (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Emergency Alarm Devices (AREA)
Abstract
本发明公开了一种相似度阈值获取方法、语音家电及计算机可读存储介质,该相似度阈值获取方法包括:获取声音信息和当前时间信息;当确定声音信息为环境声信息,获取时间信息与相似度阈值的第一映射关系,根据当前时间信息和第一映射关系获取参考相似度阈值;根据环境声信息和参考相似度阈值确定当前相似度阈值。根据本实施例的技术方案,能够结合使用场景和参考相似度阈值调整相似度阈值,使得语音家电的相似度阈值能够更加符合使用场景,有效减少了语音家电在不同场景影响下唤醒难和误唤醒的情况,提高了用户体验。
Description
技术领域
本发明涉及语音识别技术领域,特别涉及一种相似度阈值获取方法、语音家电及计算机可读存储介质。
背景技术
随着语音识别技术的发展,语音家电逐渐进入到人们的生活,语音家电能够获取用户的语音信息,从语音信息中识别出控制指令,并根据该控制指令执行对应的操作。在对语音家电进行语音控制之前,需要先对语音家电进行唤醒,常见的方法是在语音家电中预先设定好唤醒词和相似度阈值,当语音家电采集到语音信息,计算得出语音信息与唤醒词的相似度,若达到相似度阈值则语音家电唤醒成功。
但是,不同的使用场景对相似度的计算有不同的影响程度,为了避免出现误唤醒或者唤醒失败的问题,常见的做法是将每天分成若干个时间段,并为各个时间段预先设置对应的相似度阈值。但是每个用户的生活习惯不同,很难确保预先设定的相似度阈值符合用户的实际需求,从而容易影响用户的使用体验。
发明内容
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
本发明实施例提供了一种相似度阈值获取方法、语音家电及计算机可读存储介质,能够结合使用场景调整相似度阈值,提高用户体验。
第一方面,本发明实施例提供了一种相似度阈值获取方法,应用于语音家电,包括以下步骤:
获取声音信息和当前时间信息;
当确定声音信息为环境声信息,获取时间信息与相似度阈值的第一映射关系,根据当前时间信息和第一映射关系获取参考相似度阈值;
根据环境声信息和参考相似度阈值确定当前相似度阈值。
本发明实施例的相似度阈值获取方法,应用于语音家电,至少具有以下有益效果:获取声音信息和当前时间信息;当确定声音信息为环境声信息,获取时间信息与相似度阈值的第一映射关系,根据当前时间信息和第一映射关系获取参考相似度阈值;根据环境声信息和参考相似度阈值确定当前相似度阈值。根据本实施例的技术方案,能够结合使用场景和参考相似度阈值调整相似度阈值,使得语音家电的相似度阈值能够更加符合使用场景,有效减少了语音家电在不同场景影响下唤醒难和误唤醒的情况,提高了用户体验。
可选地,在本发明的另一个实施例中,根据环境声信息和参考相似度阈值确定当前相似度阈值,具体包括:获取环境声信息的当前声压级;获取与参考相似度阈值所对应的参考声压级;根据当前声压级和参考声压级确定当前相似度阈值。通过参考相似度阈值作为历史数据的参考,提高了当前相似度阈值确定的效率。
可选地,在本发明的另一个实施例中,根据当前声压级和参考声压级确定当前相似度阈值,具体包括:根据当前声压级和参考声压级确定调整值;根据参考相似度阈值和调整值得到当前相似度阈值。能够利用声压级和相似度阈值的对应关系,快速确定当前相似度阈值。
可选地,在本发明的另一个实施例中,根据当前声压级和参考声压级确定当前相似度阈值,具体包括:当参考声压级和当前声压级之间的差值大于或等于预设声压级阈值,获取声压级和相似度阈值的第二映射关系,根据当前声压级和第二映射关系确定当前相似度阈值。当参考声压级和当前声压级差值较大,体现了当前使用场景与历史使用场景有较大的差异,因此通过当前声压级和第二映射关系确定当前相似度阈值能够更加符合当前使用场景。
可选地,在本发明的另一个实施例中,根据当前声压级和参考声压级确定当前相似度阈值,具体包括:当参考声压级和当前声压级之间的差值小于预设声压级阈值,将参考相似度阈值确定为当前相似度阈值。当参考声压级和当前声压级的差值较小,则当前使用场景与历史使用场景较为相似,将参考相似度阈值确定为当前相似度阈值能够提高相似度阈值的调整效率。
可选地,在本发明的另一个实施例中,声音信息为预设时间段内连续获取到的信息;获取环境声信息的当前声压级,具体包括:获取环境声信息于预设时间段内的平均声压级,将平均声压级设置为当前声压级。通过采集预设时间段内的平均声压级,能够使当前声压级更准确地体现当前使用场景,避免偶尔的环境声变化对相似度阈值造成影响。
可选地,在本发明的另一个实施例中,当确定声音信息为环境声信息,获取时间信息与相似度阈值的第一映射关系,具体包括:当未能从声音信息中识别出唤醒词,确定声音信息为环境声信息,并获取时间信息与相似度阈值的第一映射关系。能够在语音家电未唤醒的情况下进行相似度阈值的调整,确保语音家电的相似度阈值适用于当前使用场景。
可选地,在本发明的另一个实施例中,在根据声音信息和参考相似度阈值确定当前相似度阈值之后,还包括:根据当前相似度阈值和当前时间信息更新第一映射关系。确定当前相似度阈值后更新第一映射关系,使得根据第一映射关系得出的参考相似度阈值更加符合用户的使用习惯,提高了用户体验。
第二方面,本发明实施例还提供了一种语音家电,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上所述的相似度阈值获取方法。
本发明实施例提供的语音家电,至少具有以下有益效果:该语音家电通过处理器执行存储在存储器中的计算机程序,能够使得语音家电执行以下相似度阈值获取方法:获取声音信息和当前时间信息;当确定声音信息为环境声信息,获取时间信息与相似度阈值的第一映射关系,根据当前时间信息和第一映射关系获取参考相似度阈值;根据环境声信息和参考相似度阈值确定当前相似度阈值。根据本实施例的技术方案,能够结合使用场景和参考相似度阈值调整相似度阈值,使得语音家电的相似度阈值能够更加符合使用场景,有效减少了语音家电在不同场景影响下唤醒难和误唤醒的情况,提高了用户体验。
第三方面,本发明实施例还提供一种计算机可读存储介质,存储有计算机可执行指令,计算机可执行指令用于执行如上所述的相似度阈值获取方法。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
图1是本发明一个实施例提供的相似度阈值获取方法的流程图;
图2是本发明另一个实施例提供的相似度阈值获取方法中根据当前声压级和参考声压级确定当前相似度阈值的流程图;
图3是本发明另一个实施例提供的相似度阈值获取方法中根据调整值确定当前相似度阈值的流程图;
图4是本发明另一个实施例提供的相似度阈值获取方法中根据第二映射关系和当前声压级确定当前相似度阈值的流程图;
图5是本发明另一个实施例提供的相似度阈值获取方法中根据参考相似度阈值确定当前相似度阈值的流程图;
图6是本发明另一个实施例提供的相似度阈值获取方法中获取平均声压级的流程图;
图7是本发明另一个实施例提供的相似度阈值获取方法中确定声音信息为环境声信息的流程图;
图8是本发明另一个实施例提供的相似度阈值获取方法中更新第一映射关系的流程图;
图9是本发明另一个实施例提供的相似度阈值获取方法及其应用的流程图;
图10是本发明另一个实施例提供的语音家电的装置示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
需要说明的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书、权利要求书或上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本发明提供了一种相似度阈值获取方法、语音家电及计算机可读存储介质,获取声音信息和当前时间信息;当确定声音信息为环境声信息,获取时间信息与相似度阈值的第一映射关系,根据当前时间信息和第一映射关系获取参考相似度阈值;根据环境声信息和参考相似度阈值确定当前相似度阈值。根据本实施例的技术方案,能够结合使用场景和参考相似度阈值调整相似度阈值,使得语音家电的相似度阈值能够更加符合使用场景,有效减少了语音家电在不同场景影响下唤醒难和误唤醒的情况,提高了用户体验。
需要说明的是,语音家电可以是任意常见家电设备,例如语音空调器、语音电饭煲、语音微波炉等,该家电设备能够设定好的唤醒词,从获取的声音信息中识别出唤醒词后唤醒并进入语音识别的工作状态即可,本发明实施例并不对语音家电的具体类型多作限制。
下面结合附图,对本发明实施例作进一步阐述。
如图1所示,图1是本发明一个实施例提供的相似度阈值获取方法的流程图,该相似度阈值获取方法包括但不限于有步骤S110、步骤S120和步骤S130。
步骤S110,获取声音信息和当前时间信息。
需要说明的是,声音信息的采集可以通过任意现有的设备,可以使用语音家电中本身具备的拾音设备,例如麦克风,也可以额外增加传感器,例如声压级检测传感器等常见的设备,能够实现声音信息的采集即可,本发明实施例并不涉及硬件结构的改进,在此不再赘述。本领域技术人员可以理解的是,对当前时间信息的采集,可以是在语音家电内部设置时钟装置,例如设置在控制处理芯片中的计时器等现有结构,也可以是在语音家电与无线网络连接的情况下,通过网络获取当前时间信息,具体方式根据实际需求和语音家电配备的硬件设备调整,能够实现时间信息的获取即可,在此不再赘述。
在一实施例中,声音信息可以是语音家电采集到的所有声音信息,也可以是特定频率的声音信息,例如对于一些高频和低频的声音,并不会对语音家电的唤醒造成影响,可以通过设置声音频率阈值的方式进行过滤,避免采集无用的声音信息。
在一实施例中,当前时间信息可以是日常使用的时刻信息,例如上午10时10分10秒,也可以是以一天为周期的计时时刻,例如第20小时20分20秒,具体方式根据实际需求选取即可,在此不再赘述。
步骤S120,当确定声音信息为环境声信息,获取时间信息与相似度阈值的第一映射关系,根据当前时间信息和第一映射关系获取参考相似度阈值;
在一实施例中,环境声信息可以是语音家电在唤醒之前所采集的任意声音信息,由于语音家电所处的环境在不同的时间段有一定的差异,因此语音家电所采集到的声音信息的可能种类较多,无论是在安静的使用场景或者吵杂的使用场景中,环境声信息都有可能包含语音信息和环境声信息,例如外界的杂音,也可能室内的人说话的声音,此时所采集的声音信息虽然包含语音信息,但是在未与唤醒词匹配成功的情况下,语音家电未唤醒,此时可以将该语音信息同时确定为环境声信息。需要说明的是,本申请实施例并不对语音识别技术进行改进,从语音信息中识别出唤醒词,可以采用现有技术中任意的方案,本实施例不多作赘述。
在一实施例中,第一映射关系可以是任意形式,例如对应表,或者换算关系式,也可以是映射曲线,能够实现映射关系即可。可以理解的是,可以通过第一映射关系实现使用场景的划分,例如将每天分为连续的若干个时间段,每个时间段对应不同的参考相似度阈值,即时间信息与参考相似度阈值的第一映射关系不同,以对应不同的使用场景。本领域技术人员可以理解的是,使用场景可以是固定的时间,也可以是根据所确定的相似度阈值的变化幅度进行确定,例如在一段时间内的当前相似度阈值相同或者差距小于预设阈值,将该时间段确定一个使用场景。由于在同一使用场景中,参考相似度阈值可以认定为相同或者相似,因此通过使用场景的区分,能够更加快速地获取初始的相似度阈值,例如,当从一个安静的使用场景切换到吵杂的使用场景,如果采用现有技术中场景切换后对环境声进行采集判断后得出相似度阈值,很可能在计算过程中用户发起唤醒,但是因为相似度阈值未进行调整导致唤醒失败,而采用本实施例的方案,能够在切换使用场景后采用对应的参考相似度阈值进行场景的适配,确保在当前的使用场景不会出现误唤醒或者不唤醒的情况,再通过环境声信息进行调整以达到更佳的效果。可以理解的是,第一映射关系的获取方式可以是多种,例如,常见的语音家电可以与终端通信连接,用户在终端的APP直接输入第一映射关系并发送至语音家电中完成设置,例如,设定上午10点至11点,参考相似度阈值为90%,具体的格式可以根据实际需求调整,本实施例不多作限定。
步骤S130,根据环境声信息和参考相似度阈值确定当前相似度阈值。
在一实施例中,当前相似度阈值的确定可以是任意方式,例如以参考相似度阈值作为基准数値,根据环境声信息确定增量或者减量,通过二者的相加得出当前相似度阈值,也可以是根据环境声信息直接确定当前相似度阈值,例如环境声信息较小的情况下,由于参考相似度阈值实质上为历史数据,因此可以直接将参考相似度阈值确定为当前相似度阈值,具体方式根据实际需求选取即可。需要说明的是,当前相似度阈值可以是实时根据当前时间信息获取,也可以是设置采集周期的方式获取,也可以是检测到声音信息的分贝数有较大变化的情况下获取,具体方式根据实际需求选取即可。
本发明的另一个实施例还提供了一种相似度阈值获取方法,如图2所示,图2是图1中步骤S130的细化流程的另一个实施例的示意图,该步骤S130包括但不限于以下步骤:
步骤S210,获取环境声信息的当前声压级;
步骤S220,获取与参考相似度阈值所对应的参考声压级;
步骤S230,根据当前声压级和参考声压级确定当前相似度阈值。
在一实施例中,声压级是常见的声音强度的计量单位,一个区域的声压级越高,声音信息越容易被感知,也就更容易被采集,因此对于语音家电而言,所处使用场景的环境声的声压级越高,所采集到的环境声也更多,对于唤醒词的识别干扰较大,此时唤醒词识别的相似度较低,此时需要将相似度阈值适当调低,避免唤醒失败。可以理解的是,当前声压级的采集可以通过现有技术的声压级传感器获取,也可以通过语音家电的拾音设备获取到环境声信息后计算得出,本实施例并未对具体的采集方法作出改进,仅对数据使用方法作出改进,在此不再赘述。
在一实施例中,所采集的当前声压级还可以用于生成与当前相似度阈值的映射关系,例如形成图4所示实施例中的第二映射关系。可以理解的是,在声压级与相似度阈值之间具有映射关系的情况下,可以根据该映射关系获取参考声压级,当然,参考声压级也可以通过上述实施例所述的终端进行设定,提高用户的使用体验。
在一实施例中,当前声压级和参考声压级可以是实时的数值,也可以是一个时间段内的统计数值,例如一个时间段内的平均数、中位数、方差等,是具体形式根据实际系统选取即可。可以理解的是,本实施例所确定的当前相似度阈值可以是固定的值,也可以是连续变化的取值系列,例如当前声压级为实时采集的数值,在参考声压级为固定值的情况下,由于环境的变化使得当前声压级为连续变化的曲线,因此所得出的当前相似度阈值在一段时间内也可以是连续变化的。
本发明的另一个实施例还提供了一种相似度阈值获取方法,如图3所示,图3是图2中步骤S230的细化流程的另一个实施例的示意图,该步骤S230包括但不限于以下步骤:
步骤S310,根据当前声压级和参考声压级确定调整值;
步骤S320,根据参考相似度阈值和调整值得到当前相似度阈值。
在一实施例中,调整值根据当前声压级和参考声压级的大小关系确定,例如当前声压级和参考声压级的差值大于预设声压级阈值的情况下,根据该差值获取对应的增加量或者减小量作为调整值,参考相似度阈值和调整值求和之后得出当前相似度阈值。可以理解的是,当前声压级和参考声压级的差值与调整值之间可以建立映射关系,以实现快速获取调整值。
在一实施例中,调整值可以用于与参考相似度阈值进行数值求和,以得到当前相似度阈值,例如参考相似度阈值为80%,确定的调整值为5%,则当前相似度阈值得出为85%,又如,确定的调整值为-10%,则当前相似度阈值得出为70%;另外,调整值也可以是参考相似度阈值调整的系数,例如当前声压级在数值上为参考声压级的0.9倍,则确定调整值为0.9,此事当前相似度阈值为参考相似度阈值与0.9的乘积,具体调整值的类型根据实际需求选取即可。
本发明的另一个实施例还提供了一种相似度阈值获取方法,如图4所示,图4是图2中步骤S230的细化流程的另一个实施例的示意图,该步骤S230包括但不限于以下步骤:
步骤S410,当参考声压级和当前声压级之间的差值大于或等于预设声压级阈值,获取声压级和相似度阈值的第二映射关系,根据当前声压级和第二映射关系确定当前相似度阈值。
在一实施例中,预设声压级阈值可以根据实际需求设定任意的数值,声压级的不同,反映出的使用场景也不同,设置预设声压级阈值,能够用于声压级差距较大的场景,声压级阈值的具体数值可以根据实际情况调整,也可以通过终端APP输入至语音家电中,在此不再赘述。
在一实施例中,声压级之间的差值大于或等于预设声压级阈值,则在先使用的相似度阈值无法满足当前的场景,需要快速进行调整,可以是根据第二映射关系直接匹配出当前相似度阈值,从而省去计算和动态调整的过程。需要说明的是,第二映射关系可以在确定当前相似度阈值后自动学习,例如每次获取到当前相似度阈值后,根据当前相似度阈值和当前声压级的更新第二映射关系,完成自适应学习。
本发明的另一个实施例还提供了一种相似度阈值获取方法,如图5所示,图5是图2中步骤S230的细化流程的另一个实施例的示意图,该步骤S230包括但不限于以下步骤:
步骤S510,当参考声压级和当前声压级之间的差值小于预设声压级阈值,将参考相似度阈值确定为当前相似度阈值。
基于上述实施例中,预设声压级阈值的大小能够反映两个场景之间声压级的差距,当两个声压级之间的差值小于预设声压级阈值,则两个场景之间的声压级较为相似,例如在日常生活中,午睡休息的使用场景和看书的使用场景,其声压级之间的差距较小,在这种情况下在先场景的声压级能够直接适用,也不会对唤醒有太大的影响,基于此,直接将参考相似度阈值设置为当前相似度阈值,能够快速得出适用的相似度阈值,简化语音家电的调整过程。
另外,本发明的另一个实施例还提供了一种相似度阈值获取方法,如图6所示,图6是图2中步骤S210的细化流程的另一个实施例的示意图,其中,声音信息为预设时间段内连续获取到的信息,该步骤S210包括但不限于以下步骤:
步骤S610,获取环境声信息于预设时间段内的平均声压级,将平均声压级设置为当前声压级。
在一实施例中,由于环境声是不断发生变化的,若采用实时的声压级信息进行相似度阈值的调整,很容易在偶尔有较大声压级变化的情况下,对相似度阈值进行不必要的调整,例如常见的休息常见中,外界有汽车经过导致声压级增大,因此,采用预设时间段内的平均声压级能够更好地避免声压级突然增大产生的干扰。
在一实施例中,预设时间段可以是任意的设定方式,例如语音家电出厂设置时设定好固定的时间段,也可以是通过终端的APP进行参数设定,具体方式和数值根据实际需求调整即可。
本发明的另一个实施例还提供了一种相似度阈值获取方法,如图7所示,图7是图1中步骤S120的细化流程的另一个实施例的示意图,该步骤S120包括但不限于以下步骤:
步骤S710,当未能从声音信息中识别出唤醒词,确定声音信息为环境声信息,并获取时间信息与相似度阈值的第一映射关系。
需要说明的是,唤醒词的识别可以采用现有技术中任意的语音识别方法,本实施例并未对具体的语音识别方法作出改进,在此不再赘述。
在一实施例中,由于声音信息可能包含语音信息,对于未被唤醒的语音家电而言,除了唤醒词以外的语音信息都可以认定为环境声信息,因此,可以在检测到声音信息中包含语音信息时,根据预先设定的唤醒词进行识别匹配,当相似度值大于或等于相似度阈值时进行唤醒,否则将该语音信息确定为环境声信息,用于确定当前相似度阈值。
本发明的另一个实施例还提供了一种相似度阈值获取方法,如图8所示,图8是图1中步骤S130的细化流程的另一个实施例的示意图,该步骤S130包括但不限于以下步骤:
步骤S810,根据当前相似度阈值和当前时间信息更新第一映射关系。
在一实施例中,第一映射关系可以是实时更新,也可以是每隔一段时间段进行更新,例如,当声音信息根据图6中所示实施例进行周期性采集的情况下,第一映射关系也可以是采集周期与当前相似度阈值的对应关系,具体的方式根据当前相似度阈值的获取方式确定即可。
基于上述实施例,第一映射关系可以用于区分不同的使用场景,从而生成用户的习惯曲线,例如经过多次更新和自适应学习后,得出每天的中午12点至2点为休息时间,2点至5点为工作时间,在第一映射关系中,可以根据不同的时间段信息得出不同的相似度阈值,从而实现语音家电相似度阈值的自适应调整,提高用户体验。需要说明的是,第一映射关系可以以一天为一个更新周期,以适配用户每天的生活场景,也可以根据实际需求调整更新周期,在此不再赘述。需要说明的是,由于每天在同一时间段的使用场景有可能不同,可以在更新第一映射关系之前对当前相似度阈值进行判断,例如当前相似度阈值与历史数据中的过去10次参考相似度阈值之间的数值相差较大,可以判断当天属于例外场景,对此进行记录并且不根据当前相似度阈值更新第一映射关系。当然,也可以在例外场景的累计次数较多的情况下替换历史数据中的参考相似度阈值,根据实际需求调整自适应学习的方式即可。
另外,本实施例还提供了语音家电获取相似度阈值并应用的详细流程图,该详细流程图如图9所示,包括但不限于有以下步骤:
步骤S910,获取声音信息和当前时间信息,当声音信息包括唤醒词,执行步骤S922,当声音信息不包括唤醒词,执行步骤S921;
步骤S921,获取时间信息与相似度阈值的第一映射关系,根据当前时间信息和第一映射关系获取参考相似度阈值,执行步骤S931;
步骤S922,获取当前相似度阈值,执行语音家电的唤醒识别,结束相似度阈值的获取;
步骤S931,获取环境声信息的平均声压级,将平均声压级设置为当前声压级;
步骤S932,获取与参考相似度阈值对应的参考声压级,执行步骤941,或者,当参考声压级与当前声压级的差值大于或等于预设声压级阈值,执行步骤S951,当参考声压级与当前声压级的差值小于预设声压级阈值,执行步骤S952;
步骤S941,根据参考声压级和当前声压级确定调整值;
步骤S942,根据参考相似度阈值和调整值得到当前相似度阈值,执行步骤S960;
步骤S951,获取声压级和相似度阈值的第二映射关系,根据当前声压级和第二映射关系确定当前相似度阈值,执行步骤S960;
步骤S952,将参考相似度阈值确定为当前相似度阈值,执行步骤S960;
步骤S960,根据当前相似度阈值和当前时间信息更新第一映射关系,重新执行步骤S910。
在一实施例中,采用本实施例的步骤,能够获取声音信息和当前时间信息;当确定声音信息为环境声信息,获取时间信息与相似度阈值的第一映射关系,根据当前时间信息和第一映射关系获取参考相似度阈值;根据环境声信息和参考相似度阈值确定当前相似度阈值,结合使用场景和参考相似度阈值调整相似度阈值,使得语音家电的相似度阈值能够更加符合使用场景,有效减少了语音家电在不同场景影响下唤醒难和误唤醒的情况,提高了用户体验。
另外,参考图10,本发明的一个实施例还提供了一种语音家电1000,该语音家电1000包括:存储器1020、处理器1010及存储在存储器1020上并可在处理器1010上运行的计算机程序。
处理器1010和存储器1020可以通过总线或者其他方式连接。
实现上述实施例的相似度阈值获取方法所需的非暂态软件程序以及指令存储在存储器1020中,当被处理器1010执行时,执行上述实施例中的应用于语音家电的相似度阈值获取方法,例如,执行以上描述的图1中的方法步骤S110至S130,图2中的方法步骤S210至S230,图3中的方法步骤S310至S320,图4中的方法步骤S410,图5中的方法步骤S510,图6中的方法步骤S610,图7中的方法步骤S710,图8中的方法步骤S810,图9中的方法步骤S910至S960。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
此外,本发明的一个实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个处理器或控制器执行,例如,被上述控制单元实施例中的一个处理器执行,可使得上述处理器执行上述实施例中的相似度阈值获取方法,例如,执行以上描述的图1中的方法步骤S110至S130,图2中的方法步骤S210至S230,图3中的方法步骤S310至S320,图4中的方法步骤S410,图5中的方法步骤S510,图6中的方法步骤S610,图7中的方法步骤S710,图8中的方法步骤S810,图9中的方法步骤S910至S960。本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
以上是对本发明的较佳实施进行了具体说明,但本发明并不局限于上述实施方式,熟悉本领域的技术人员在不违背本发明精神的前提下还可作出种种的等同变形或替换,这些等同的变形或替换均包含在本发明权利要求所限定的范围内。
Claims (10)
1.一种相似度阈值获取方法,应用于语音家电,其特征在于,包括:
获取声音信息和当前时间信息;
当确定所述声音信息为环境声信息,获取时间信息与相似度阈值的第一映射关系,根据所述当前时间信息和所述第一映射关系获取参考相似度阈值;
根据所述环境声信息和所述参考相似度阈值确定当前相似度阈值。
2.根据权利要求1所述的一种相似度阈值获取方法,其特征在于,所述根据所述环境声信息和所述参考相似度阈值确定当前相似度阈值,具体包括:
获取所述环境声信息的当前声压级;
获取与所述参考相似度阈值所对应的参考声压级;
根据所述当前声压级和所述参考声压级确定当前相似度阈值。
3.根据权利要求2所述的一种相似度阈值获取方法,其特征在于,所述根据所述当前声压级和所述参考声压级确定当前相似度阈值,具体包括:
根据所述当前声压级和所述参考声压级确定调整值;
根据参考相似度阈值和所述调整值得到当前相似度阈值。
4.根据权利要求2所述的一种相似度阈值获取方法,其特征在于,所述根据所述当前声压级和所述参考声压级确定当前相似度阈值,具体包括:
当所述参考声压级和所述当前声压级之间的差值大于或等于预设声压级阈值,获取声压级和相似度阈值的第二映射关系,根据所述当前声压级和所述第二映射关系确定当前相似度阈值。
5.根据权利要求2所述的一种相似度阈值获取方法,其特征在于,所述根据所述当前声压级和所述参考声压级确定当前相似度阈值,具体包括:
当所述参考声压级和所述当前声压级之间的差值小于预设声压级阈值,将所述参考相似度阈值确定为当前相似度阈值。
6.根据权利要求2至5任一项所述的一种相似度阈值获取方法,其特征在于,所述声音信息为预设时间段内连续获取到的信息;所述获取所述环境声信息的当前声压级,具体包括:
获取所述环境声信息于所述预设时间段内的平均声压级,将所述平均声压级设置为所述当前声压级。
7.根据权利要求1所述的一种相似度阈值获取方法,其特征在于,所述当确定所述声音信息为环境声信息,获取时间信息与相似度阈值的第一映射关系,具体包括:
当未能从所述声音信息中识别出唤醒词,确定所述声音信息为环境声信息,并获取时间信息与相似度阈值的第一映射关系。
8.根据权利要求1所述的一种相似度阈值获取方法,其特征在于,在所述根据所述声音信息和所述参考相似度阈值确定当前相似度阈值之后,还包括:
根据所述当前相似度阈值和所述当前时间信息更新所述第一映射关系。
9.一种语音家电,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8中任意一项所述的相似度阈值获取方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令被计算机执行时实现如权利要求1至8任意一项所述相似度阈值获取方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010862292.5A CN114187904A (zh) | 2020-08-25 | 2020-08-25 | 相似度阈值获取方法、语音家电及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010862292.5A CN114187904A (zh) | 2020-08-25 | 2020-08-25 | 相似度阈值获取方法、语音家电及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114187904A true CN114187904A (zh) | 2022-03-15 |
Family
ID=80600642
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010862292.5A Pending CN114187904A (zh) | 2020-08-25 | 2020-08-25 | 相似度阈值获取方法、语音家电及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114187904A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114758460A (zh) * | 2022-04-24 | 2022-07-15 | 南京腾优信息科技有限公司 | 一种具有催促就寝功能的就寝监督声音强度检测系统 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001282286A (ja) * | 2000-03-30 | 2001-10-12 | Sharp Corp | 音声処理装置 |
CA2733684A1 (en) * | 2010-03-17 | 2011-09-17 | Harman International Industries, Incorporated | Audio power management system |
CN103971680A (zh) * | 2013-01-24 | 2014-08-06 | 华为终端有限公司 | 一种语音识别的方法、装置 |
CN104820556A (zh) * | 2015-05-06 | 2015-08-05 | 广州视源电子科技股份有限公司 | 唤醒语音助手的方法及装置 |
CN108447472A (zh) * | 2017-02-16 | 2018-08-24 | 腾讯科技(深圳)有限公司 | 语音唤醒方法及装置 |
CN108700926A (zh) * | 2016-04-11 | 2018-10-23 | 惠普发展公司,有限责任合伙企业 | 基于环境噪声唤醒计算设备 |
CN108847219A (zh) * | 2018-05-25 | 2018-11-20 | 四川斐讯全智信息技术有限公司 | 一种唤醒词预设置信度阈值调节方法及系统 |
CN109346071A (zh) * | 2018-09-26 | 2019-02-15 | 出门问问信息科技有限公司 | 唤醒处理方法、装置及电子设备 |
CN109741755A (zh) * | 2018-12-25 | 2019-05-10 | 苏州思必驰信息科技有限公司 | 语音唤醒词阈值管理装置及管理语音唤醒词阈值的方法 |
WO2019207912A1 (ja) * | 2018-04-23 | 2019-10-31 | ソニー株式会社 | 情報処理装置及び情報処理方法 |
CN111081251A (zh) * | 2019-11-27 | 2020-04-28 | 云知声智能科技股份有限公司 | 语音唤醒方法及装置 |
-
2020
- 2020-08-25 CN CN202010862292.5A patent/CN114187904A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001282286A (ja) * | 2000-03-30 | 2001-10-12 | Sharp Corp | 音声処理装置 |
CA2733684A1 (en) * | 2010-03-17 | 2011-09-17 | Harman International Industries, Incorporated | Audio power management system |
CN103971680A (zh) * | 2013-01-24 | 2014-08-06 | 华为终端有限公司 | 一种语音识别的方法、装置 |
CN104820556A (zh) * | 2015-05-06 | 2015-08-05 | 广州视源电子科技股份有限公司 | 唤醒语音助手的方法及装置 |
CN108700926A (zh) * | 2016-04-11 | 2018-10-23 | 惠普发展公司,有限责任合伙企业 | 基于环境噪声唤醒计算设备 |
CN108447472A (zh) * | 2017-02-16 | 2018-08-24 | 腾讯科技(深圳)有限公司 | 语音唤醒方法及装置 |
WO2019207912A1 (ja) * | 2018-04-23 | 2019-10-31 | ソニー株式会社 | 情報処理装置及び情報処理方法 |
CN108847219A (zh) * | 2018-05-25 | 2018-11-20 | 四川斐讯全智信息技术有限公司 | 一种唤醒词预设置信度阈值调节方法及系统 |
CN109346071A (zh) * | 2018-09-26 | 2019-02-15 | 出门问问信息科技有限公司 | 唤醒处理方法、装置及电子设备 |
CN109741755A (zh) * | 2018-12-25 | 2019-05-10 | 苏州思必驰信息科技有限公司 | 语音唤醒词阈值管理装置及管理语音唤醒词阈值的方法 |
CN111081251A (zh) * | 2019-11-27 | 2020-04-28 | 云知声智能科技股份有限公司 | 语音唤醒方法及装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114758460A (zh) * | 2022-04-24 | 2022-07-15 | 南京腾优信息科技有限公司 | 一种具有催促就寝功能的就寝监督声音强度检测系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112489648B (zh) | 唤醒处理阈值调整方法、语音家电、存储介质 | |
CN105185380B (zh) | 一种信息处理方法及电子设备 | |
CN109974235B (zh) | 控制家电设备的方法、装置和家电设备 | |
CN111968644B (zh) | 智能设备唤醒方法、装置及电子设备 | |
CN112506070B (zh) | 智能家居设备的控制方法和装置 | |
CN109859774B (zh) | 语音设备及其端点检测灵敏度调节方法、装置和存储介质 | |
CN110556107A (zh) | 可自动调节语音识别灵敏度的控制方法、系统、空调器及可读存储介质 | |
CN110686354A (zh) | 一种语音空调的控制方法、语音空调的控制装置及空调器 | |
CN112311635B (zh) | 语音打断唤醒方法、装置及计算机可读存储介质 | |
CN112880119A (zh) | 一种空调控制方法、装置、存储介质及空调 | |
CN110767225A (zh) | 一种语音交互方法、装置及系统 | |
CN110500721A (zh) | 一种空调语音控制方法、装置以及空调器 | |
CN110716444A (zh) | 一种基于智能家居的声音控制方法、装置和存储介质 | |
CN114187904A (zh) | 相似度阈值获取方法、语音家电及计算机可读存储介质 | |
CN114373462A (zh) | 语音交互设备及其控制方法、控制装置 | |
CN112932225B (zh) | 智能唤醒枕头以及基于智能唤醒枕头的唤醒方法 | |
CN113028612B (zh) | 空调器的控制方法、装置、存储介质和处理器 | |
CN113848747A (zh) | 智能家居设备控制方法及装置 | |
CN110567134A (zh) | 智能空调的自动运行控制方法、系统以及存储介质 | |
CN110941189A (zh) | 智能家居系统及其控制方法、可读存储介质 | |
CN111324328A (zh) | 音量调节方法及装置 | |
CN114815635A (zh) | 计算机可读存储介质、智能面板及其语音交互方法 | |
CN112164398B (zh) | 语音设备及其唤醒方法、装置以及存储介质 | |
CN108683981A (zh) | 电子设备的扬声器排水方法、装置、电子设备及存储介质 | |
CN113889109A (zh) | 语音唤醒模式的调节方法、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |