CN111429902A - 用于唤醒设备的方法和装置 - Google Patents
用于唤醒设备的方法和装置 Download PDFInfo
- Publication number
- CN111429902A CN111429902A CN202010185000.9A CN202010185000A CN111429902A CN 111429902 A CN111429902 A CN 111429902A CN 202010185000 A CN202010185000 A CN 202010185000A CN 111429902 A CN111429902 A CN 111429902A
- Authority
- CN
- China
- Prior art keywords
- sensitivity
- awakening
- interaction
- determining
- wake
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000002618 waking effect Effects 0.000 title claims abstract description 36
- 230000003993 interaction Effects 0.000 claims abstract description 149
- 230000035945 sensitivity Effects 0.000 claims abstract description 118
- 238000004590 computer program Methods 0.000 claims description 9
- 230000002452 interceptive effect Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 11
- 230000006399 behavior Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/227—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Traffic Control Systems (AREA)
- Navigation (AREA)
Abstract
本申请实施例公开了用于唤醒设备的方法和装置。上述方法的一具体实施方式包括:获取预设时间段内用户与设备的交互信息;获取用户的行为数据,确定设备的使用场景;获取设备的移动速度;根据交互信息、使用场景以及移动速度,确定设备的唤醒灵敏度;基于唤醒灵敏度、预设的唤醒阈值以及用户的唤醒语音,唤醒设备。该实施方式可以提高设备唤醒的正确率。
Description
技术领域
本申请实施例涉及计算机技术领域,具体涉及用于唤醒设备的方法和装置。
背景技术
随着人们对出行舒适度的要求越来越高,车载娱乐信息系统搭载语音助手的普及度越来越高,人们已经逐渐依赖上在出行时使用语音助手来完成一些车载控制,比如,导航、听音乐、控制空调等能力已逐渐被人们所接受。然而,语音助手经常被误唤醒,给人们带来的不小的困扰,甚至影响到人们的出行安全,以至于不得不关闭语音助手,这已经是业界车载语音助手的痛点。
发明内容
本申请实施例提出了用于唤醒设备的方法和装置。
第一方面,本申请实施例提供了一种用于唤醒设备的方法,包括:获取预设时间段内用户与设备的交互信息;获取上述用户的行为数据,确定上述设备的使用场景;获取上述设备的移动速度;根据上述交互信息、上述使用场景以及上述移动速度,确定上述设备的唤醒灵敏度;基于上述唤醒灵敏度、预设的唤醒阈值以及上述用户的唤醒语音,唤醒上述设备。
在一些实施例中,上述设备包括车载设备;以及上述获取预设时间段内用户与设备的语音交互信息,包括:获取上述车载设备启动后预设时间段内用户与上述车载设备的语音交互信息。
在一些实施例中,上述交互信息包括语音交互信息;以及上述根据上述交互信息、上述使用场景以及上述移动速度,确定上述设备的唤醒灵敏度,包括:根据上述语音交互信息,确定上述用户与上述设备的语音交互次数以及每次语音交互的交互时长;根据每次语音交互的交互时长,确定平均交互时长;根据上述语音交互次数、上述平均交互时长、上述使用场景以及上述移动速度,确定上述设备的唤醒灵敏度。
在一些实施例中,上述使用场景包括音乐播放场景和导航使用场景;以及上述根据上述交互信息、上述使用场景以及上述移动速度,确定上述设备的唤醒灵敏度,包括:确定上述使用场景中音频的输出音量;根据上述语音交互次数、上述平均交互时长、上述输出音量以及上述移动速度,确定上述设备的唤醒灵敏度。
在一些实施例中,上述根据上述交互信息、上述使用场景以及上述移动速度,确定上述设备的唤醒灵敏度,包括:根据交互次数与灵敏度增加量的第一预设对应关系、交互时长与灵敏度增加量的第二预设对应关系、上述输出音量与灵敏度增加量的第三预设对应关系以及预设的灵敏度基础值,确定上述设备的唤醒灵敏度。
在一些实施例中,上述基于上述唤醒灵敏度、预设的唤醒阈值以及上述用户的唤醒语音,唤醒上述设备,包括:确定上述唤醒语音与预设的唤醒词的相似度;根据上述唤醒灵敏度、上述相似度以及上述唤醒阈值,唤醒上述设备。
第二方面,本申请实施例提供了一种用于唤醒设备的装置,包括:第一获取单元,被配置成获取预设时间段内用户与设备的交互信息;第二获取单元,被配置成获取上述用户的行为数据,确定上述设备的使用场景;第三获取单元,被配置成获取上述设备的移动速度;灵敏度确定单元,被配置成根据上述交互信息、上述使用场景以及上述移动速度,确定上述设备的唤醒灵敏度;设备唤醒单元,被配置成基于上述唤醒灵敏度、预设的唤醒阈值以及上述用户的唤醒语音,唤醒上述设备。
在一些实施例中,上述设备包括车载设备;以及上述第一获取单元进一步被配置成:获取上述车载设备启动后预设时间段内用户与上述车载设备的语音交互信息。
在一些实施例中,上述交互信息包括语音交互信息;以及上述灵敏度确定单元进一步被配置成:根据上述语音交互信息,确定上述用户与上述设备的语音交互次数以及每次语音交互的交互时长;根据每次语音交互的交互时长,确定平均交互时长;根据上述语音交互次数、上述平均交互时长、上述使用场景以及上述移动速度,确定上述设备的唤醒灵敏度。
在一些实施例中,上述使用场景包括音乐播放场景和导航使用场景;以及上述灵敏度确定单元进一步被配置成:确定上述使用场景中音频的输出音量;根据上述语音交互次数、上述平均交互时长、上述输出音量以及上述移动速度,确定上述设备的唤醒灵敏度。
在一些实施例中,上述灵敏度确定单元进一步被配置成:根据交互次数与灵敏度增加量的第一预设对应关系、交互时长与灵敏度增加量的第二预设对应关系、上述输出音量与灵敏度增加量的第三预设对应关系以及预设的灵敏度基础值,确定上述设备的唤醒灵敏度。
在一些实施例中,上述设备唤醒单元进一步被配置成:确定上述唤醒语音与预设的唤醒词的相似度;根据上述唤醒灵敏度、上述相似度以及上述唤醒阈值,唤醒上述设备。
第三方面,本申请实施例提供了一种终端设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行,使得上述一个或多个处理器实现如第一方面任一实施例所描述的方法。
第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面任一实施例所描述的方法。
本申请的上述实施例提供的用于唤醒设备的方法和装置,首先可以获取预设时间段内用户与设备的交互信息。还可以获取用户的行为数据,以确定设备的使用场景。还可以获取设备的移动速度。然后,根据交互信息、使用场景以及移动速度,确定设备的唤醒灵敏度。最后,基于唤醒灵敏度、预设的唤醒阈值以及用户的唤醒语音,唤醒设备。本实施例的方法,可以提高设备唤醒的正确率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是根据本申请的用于唤醒设备的方法的一个实施例的流程图;
图2是根据本申请的用于唤醒设备的方法的一个应用场景的示意图;
图3是根据本申请的用于唤醒设备的方法的另一个实施例的流程图;
图4是根据本申请的用于唤醒设备的装置的一个实施例的结构示意图;
图5是适于用来实现本申请实施例的终端设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
参考图1,示出了根据本申请的用于唤醒设备的方法的一个实施例的流程100。本实施例的用于唤醒设备的方法,包括以下步骤:
步骤101,获取预设时间段内用户与设备的交互信息。
在本实施例中,用于唤醒设备的方法的执行主体可以通过有线连接方式或者无线连接方式获取预设时间段内用户与设备的交互信息。上述预设时间段可以包括预先设定的固定时间段,如下午3点至3点 10分,还可以包括用户唤醒设备前的10分钟等。上述交互信息可以包括用户对设备上设置的按钮的操作信息,用户对设备的语音交互信息等等。执行主体可以通过设备上设置的硬件电路来获取上述交互信息,还可以通过设备上安装的麦克风获取上述交互信息。上述设备可以包括车载设备、手机、智能机器人等等。
步骤102,获取用户的行为数据,确定设备的使用场景。
本实施例中,执行主体还可以获取用户的行为数据,并确定设备的使用场景。具体的,用户的行为数据可以包括用户对设备的按钮或显示屏进行的操作信息。上述使用场景可以包括音乐播放场景、视频播放场景等等。
步骤103,获取设备的移动速度。
执行主体可以根据设备中安装的速度传感器来确定设备的移动速度。或者,执行主体可以根据设备中安装的定位传感器以及对应的时间段来确定设备的移动速度。
步骤104,根据交互信息、使用场景以及移动速度,确定设备的唤醒灵敏度。
执行主体在获取上述信息后,可以确定设备的唤醒灵敏度。具体的,执行主体可以将获取的上述信息输入到预设的模型中,得到设备的唤醒灵敏度。上述预设的模型可以用于表征获取的上述信息与唤醒灵敏度的对应关系。
步骤105,基于唤醒灵敏度、预设的唤醒阈值以及用户的唤醒语音,唤醒设备。
执行主体在确定唤醒灵敏度后,可以在监听到用户的唤醒语音后,结合预设的唤醒阈值,来唤醒设备。具体的,执行主体在监听到用户的唤醒语音后,可以提取上述唤醒语音的特征信息,确定上述唤醒语音与预设的唤醒词的相似度。根据上述相似度确定唤醒值。如果上述唤醒值与唤醒灵敏度的和大于唤醒阈值,则唤醒设备。如果小于,则不唤醒设备。
继续参见图2,图2是根据本实施例的用于唤醒设备的方法的一个应用场景的示意图。在图2的应用场景中,用户对车辆点火后,车辆上电。车载设备可以获取上电后10分钟内用户与车载设备的互动信息,同时获取车辆的速度以及车载设备的使用场景。并根据上述信息,调整车载设备的唤醒灵敏度。并根据上述唤醒灵敏度以及预设的唤醒阈值,来唤醒车载设备。
本申请的上述实施例提供的用于唤醒设备的方法,首先可以获取预设时间段内用户与设备的交互信息。还可以获取用户的行为数据,以确定设备的使用场景。还可以获取设备的移动速度。然后,根据交互信息、使用场景以及移动速度,确定设备的唤醒灵敏度。最后,基于唤醒灵敏度、预设的唤醒阈值以及用户的唤醒语音,唤醒设备。本实施例的方法,可以提高设备唤醒的正确率。
继续参见图3,其示出了根据本申请的用于唤醒设备的方法的另一个实施例的流程300。本实施例中,上述设备包括车载设备。如图3 所示,本实施例的用于唤醒设备的方法,可以包括以下步骤:
步骤301,获取车载设备启动后预设时间段内用户与车载设备的语音交互信息。
本实施例中,执行主体可以在车载设备启动后,获取预设时间段内的用户与车载设备的语音交互信息。上述预设时间段可以为10分钟。执行主体在车载设备上电后,可以获取用户与车载设备的语音交互信息。
步骤302,根据语音交互信息,确定用户与设备的语音交互次数以及每次语音交互的交互时长。
在获取到语音交互信息后,执行主体根据上述语音交互信息,确定出用户与设备的语音交互次数。具体的,如果上述语音交互信息中,用户间隔1分钟或2分钟未发出语音,则认为用户结束了上次的语音交互。这样,执行主体可以得到语音交互次数,还可以得到每次交互的起始时间和结束时间。根据每次交互的起始时间和结束时间,可以计算出每次语音交互的交互时长。
步骤303,根据每次语音交互的交互时长,确定平均交互时长。
执行主体在计算得到每次语音交互的交互时长后,可以计算各交互时长的平均值,得到平均交互时长。
在计算得到语音交互次数和平均交互时长后,执行主体可以结合使用场景和移动速度,来确定车载设备的唤醒灵敏度。具体的,执行主体可以将上述语音交互次数、平均交互时长使用场景和移动速度输入预设的灵敏度确定模型,来确定唤醒灵敏度。上述灵敏度确定模型用于表征语音交互次数、平均交互时长、使用场景和移动速度与灵敏度的对应关系。
在本实施例的一些可选的实现方式中,设备的使用场景可以包括音乐播放场景和导航使用场景。执行主体还可以结合一下步骤来确定唤醒灵敏度:
步骤304,确定使用场景中音频的输出音量。
本实施例中,执行主体可以确定使用场景中音频的输出音量。具体的,对于音乐播放场景来说,执行主体可以确定音乐播放的音量。对于导航使用场景来说,执行主体可以确定导航语音的音量。在一些实际应用中,音乐播放场景和导航使用场景可以同时存在,则此时,执行主体可以将音乐播放的音量和导航语音的音量中的最大值,作为音频的输出音量。
执行主体在得到语音交互次数、平均交互时长、输出音量后,可以结合移动速度,来确定设备的唤醒灵敏度。具体的,执行主体可以根据输出音量所处的范围,来确定唤醒灵敏度。例如,输出音量位于 15~20db之间时,执行主体可以将唤醒灵敏度设置为30。
在本实施例的一些可选的实现方式中,执行主体可以根据步骤 305来确定唤醒灵敏度。
步骤305,根据交互次数与灵敏度增加量的第一预设对应关系、交互时长与灵敏度增加量的第二预设对应关系、所述输出音量与灵敏度增加量的第三预设对应关系以及预设的灵敏度基础值,确定所述设备的唤醒灵敏度。
本实施例中,执行主体可以预先设置交互次数与灵敏度增加量的第一预设对应关系、交互时长与灵敏度增加量的第二预设对应关系、所述输出音量与灵敏度增加量的第三预设对应关系。上述交互次数、平均交互时长、输出音量以及移动速度都可以作为灵敏度的影响因子。具体的,上述第一预设对应关系、第二预设对应关系和第三预设对应关系可以如下表1所示:
表1灵敏度影响因子表格
执行主体可以根据上表,确定每个影响因子对应的灵敏度增加量。上述预设的灵敏度基础值可以设置为5。执行主体可以将各个灵敏度增加量分别与灵敏度基础值相加,得到唤醒灵敏度。
步骤306,确定唤醒语音与预设的唤醒词的相似度。
执行主体还可以计算唤醒语音与预设的唤醒词的相似度。执行主体可以通过分别提取唤醒语音与预设的唤醒词的特征信息,并比较二者的特征信息,得到相似度。
步骤307,根据唤醒灵敏度、相似度以及唤醒阈值,唤醒设备。
执行主体可以根据确定的唤醒灵敏度、相似度以及唤醒阈值,唤醒设备。如果唤醒灵敏度与相似度的和大于唤醒阈值,则唤醒设备。如果小于,则不唤醒设备。
本申请的上述实施例提供的用于唤醒设备的方法,可以考虑车辆驾驶过程中的各个影响因子,并根据各影响因子提高唤醒灵敏度,从而提高设备唤醒的准确率。
进一步参考图4,作为对上述各图所示方法的实现,本申请提供了一种用于唤醒设备的装置的一个实施例,该装置实施例与图1所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图4所示,本实施例的用于唤醒设备的装置400包括:第一获取单元401、第二获取单元402、第三获取单元403、灵敏度确定单元 404和设备唤醒单元405。
第一获取单元401,被配置成获取预设时间段内用户与设备的交互信息。
第二获取单元402,被配置成获取用户的行为数据,确定设备的使用场景。
第三获取单元403,被配置成获取设备的移动速度。
灵敏度确定单元404,被配置成根据交互信息、使用场景以及移动速度,确定设备的唤醒灵敏度。
设备唤醒单元405,被配置成基于唤醒灵敏度、预设的唤醒阈值以及用户的唤醒语音,唤醒设备。
在本实施例的一些可选的实现方式中,设备包括车载设备。第一获取单元进一步被配置成:获取车载设备启动后预设时间段内用户与车载设备的语音交互信息。
在本实施例的一些可选的实现方式中,交互信息包括语音交互信息。灵敏度确定单元进一步被配置成:根据语音交互信息,确定用户与设备的语音交互次数以及每次语音交互的交互时长;根据每次语音交互的交互时长,确定平均交互时长;根据语音交互次数、平均交互时长、使用场景以及移动速度,确定设备的唤醒灵敏度。
在本实施例的一些可选的实现方式中,使用场景包括音乐播放场景和导航使用场景。灵敏度确定单元进一步被配置成:确定使用场景中音频的输出音量;根据语音交互次数、平均交互时长、输出音量以及移动速度,确定设备的唤醒灵敏度。
在本实施例的一些可选的实现方式中,灵敏度确定单元进一步被配置成:根据交互次数与灵敏度增加量的第一预设对应关系、交互时长与灵敏度增加量的第二预设对应关系、输出音量与灵敏度增加量的第三预设对应关系以及预设的灵敏度基础值,确定设备的唤醒灵敏度。
在本实施例的一些可选的实现方式中,设备唤醒单元进一步被配置成:确定唤醒语音与预设的唤醒词的相似度;根据唤醒灵敏度、相似度以及唤醒阈值,唤醒设备。
应当理解,用于唤醒设备的装置400中记载的单元401至单元405 分别与参考图1中描述的方法中的各个步骤相对应。由此,上文针对用于唤醒设备的方法描述的操作和特征同样适用于装置400及其中包含的单元,在此不再赘述。
下面参考图5,其示出了适于用来实现本公开的实施例的电子设备500的结构示意图。本公开的实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图5示出的终端设备仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
如图5所示,电子设备500可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储装置508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有电子设备500操作所需的各种程序和数据。处理装置501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线 504。
通常,以下装置可以连接至I/O接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置 506;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许电子设备500与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图5中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从ROM 502被安装。在该计算机程序被处理装置501执行时,执行本公开的实施例的方法中限定的上述功能。需要说明的是,本公开的实施例所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取预设时间段内用户与设备的交互信息;获取用户的行为数据,确定设备的使用场景;获取设备的移动速度;根据交互信息、使用场景以及移动速度,确定设备的唤醒灵敏度;基于唤醒灵敏度、预设的唤醒阈值以及用户的唤醒语音,唤醒设备。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的实施例的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网 (WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开的实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括第一获取单元、第二获取单元、第三获取单元、灵敏度确定单元和设备唤醒单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,第三获取单元还可以被描述为“获取设备的移动速度的单元”。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (14)
1.一种用于唤醒设备的方法,包括:
获取预设时间段内用户与设备的交互信息;
获取所述用户的行为数据,确定所述设备的使用场景;
获取所述设备的移动速度;
根据所述交互信息、所述使用场景以及所述移动速度,确定所述设备的唤醒灵敏度;
基于所述唤醒灵敏度、预设的唤醒阈值以及所述用户的唤醒语音,唤醒所述设备。
2.根据权利要求1所述的方法,其中,所述设备包括车载设备;以及
所述获取预设时间段内用户与设备的语音交互信息,包括:
获取所述车载设备启动后预设时间段内用户与所述车载设备的语音交互信息。
3.根据权利要求1所述的方法,其中,所述交互信息包括语音交互信息;以及
所述根据所述交互信息、所述使用场景以及所述移动速度,确定所述设备的唤醒灵敏度,包括:
根据所述语音交互信息,确定所述用户与所述设备的语音交互次数以及每次语音交互的交互时长;
根据每次语音交互的交互时长,确定平均交互时长;
根据所述语音交互次数、所述平均交互时长、所述使用场景以及所述移动速度,确定所述设备的唤醒灵敏度。
4.根据权利要求3所述的方法,其中,所述使用场景包括音乐播放场景和导航使用场景;以及
所述根据所述交互信息、所述使用场景以及所述移动速度,确定所述设备的唤醒灵敏度,包括:
确定所述使用场景中音频的输出音量;
根据所述语音交互次数、所述平均交互时长、所述输出音量以及所述移动速度,确定所述设备的唤醒灵敏度。
5.根据权利要求4所述的方法,其中,所述根据所述交互信息、所述使用场景以及所述移动速度,确定所述设备的唤醒灵敏度,包括:
根据交互次数与灵敏度增加量的第一预设对应关系、交互时长与灵敏度增加量的第二预设对应关系、所述输出音量与灵敏度增加量的第三预设对应关系以及预设的灵敏度基础值,确定所述设备的唤醒灵敏度。
6.根据权利要求1所述的方法,其中,所述基于所述唤醒灵敏度、预设的唤醒阈值以及所述用户的唤醒语音,唤醒所述设备,包括:
确定所述唤醒语音与预设的唤醒词的相似度;
根据所述唤醒灵敏度、所述相似度以及所述唤醒阈值,唤醒所述设备。
7.一种用于唤醒设备的装置,包括:
第一获取单元,被配置成获取预设时间段内用户与设备的交互信息;
第二获取单元,被配置成获取所述用户的行为数据,确定所述设备的使用场景;
第三获取单元,被配置成获取所述设备的移动速度;
灵敏度确定单元,被配置成根据所述交互信息、所述使用场景以及所述移动速度,确定所述设备的唤醒灵敏度;
设备唤醒单元,被配置成基于所述唤醒灵敏度、预设的唤醒阈值以及所述用户的唤醒语音,唤醒所述设备。
8.根据权利要求7所述的装置,其中,所述设备包括车载设备;以及
所述第一获取单元进一步被配置成:
获取所述车载设备启动后预设时间段内用户与所述车载设备的语音交互信息。
9.根据权利要求7所述的装置,其中,所述交互信息包括语音交互信息;以及
所述灵敏度确定单元进一步被配置成:
根据所述语音交互信息,确定所述用户与所述设备的语音交互次数以及每次语音交互的交互时长;
根据每次语音交互的交互时长,确定平均交互时长;
根据所述语音交互次数、所述平均交互时长、所述使用场景以及所述移动速度,确定所述设备的唤醒灵敏度。
10.根据权利要求9所述的装置,其中,所述使用场景包括音乐播放场景和导航使用场景;以及
所述灵敏度确定单元进一步被配置成:
确定所述使用场景中音频的输出音量;
根据所述语音交互次数、所述平均交互时长、所述输出音量以及所述移动速度,确定所述设备的唤醒灵敏度。
11.根据权利要求10所述的装置,其中,所述灵敏度确定单元进一步被配置成:
根据交互次数与灵敏度增加量的第一预设对应关系、交互时长与灵敏度增加量的第二预设对应关系、所述输出音量与灵敏度增加量的第三预设对应关系以及预设的灵敏度基础值,确定所述设备的唤醒灵敏度。
12.根据权利要求7所述的装置,其中,所述设备唤醒单元进一步被配置成:
确定所述唤醒语音与预设的唤醒词的相似度;
根据所述唤醒灵敏度、所述相似度以及所述唤醒阈值,唤醒所述设备。
13.一种终端设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。
14.一种计算机可读介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如权利要求1-6中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010185000.9A CN111429902B (zh) | 2020-03-17 | 2020-03-17 | 用于唤醒设备的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010185000.9A CN111429902B (zh) | 2020-03-17 | 2020-03-17 | 用于唤醒设备的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111429902A true CN111429902A (zh) | 2020-07-17 |
CN111429902B CN111429902B (zh) | 2023-08-18 |
Family
ID=71547945
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010185000.9A Active CN111429902B (zh) | 2020-03-17 | 2020-03-17 | 用于唤醒设备的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111429902B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112311635A (zh) * | 2020-11-05 | 2021-02-02 | 深圳市奥谷奇技术有限公司 | 语音打断唤醒方法、装置及计算机可读存储介质 |
CN112581960A (zh) * | 2020-12-18 | 2021-03-30 | 北京百度网讯科技有限公司 | 语音唤醒方法、装置、电子设备及可读存储介质 |
CN114356275A (zh) * | 2021-12-06 | 2022-04-15 | 上海小度技术有限公司 | 交互控制方法、装置、智能语音设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000106592A (ja) * | 1998-09-29 | 2000-04-11 | Brother Ind Ltd | 音声応答機能付電話装置 |
CN106796497A (zh) * | 2014-09-12 | 2017-05-31 | 苹果公司 | 用于始终监听语音触发的动态阈值 |
CN109584873A (zh) * | 2018-12-13 | 2019-04-05 | 北京极智感科技有限公司 | 一种车载语音系统的唤醒方法、装置、可读介质及设备 |
CN109618059A (zh) * | 2019-01-03 | 2019-04-12 | 北京百度网讯科技有限公司 | 移动终端中语音识别功能的唤醒方法和装置 |
CN109920418A (zh) * | 2019-02-20 | 2019-06-21 | 北京小米移动软件有限公司 | 调整唤醒灵敏度的方法及装置 |
CN110047487A (zh) * | 2019-06-05 | 2019-07-23 | 广州小鹏汽车科技有限公司 | 车载语音设备的唤醒方法、装置、车辆以及机器可读介质 |
CN110525450A (zh) * | 2019-09-06 | 2019-12-03 | 浙江吉利汽车研究院有限公司 | 一种调节车载语音灵敏度的方法及系统 |
US20190371342A1 (en) * | 2018-06-05 | 2019-12-05 | Samsung Electronics Co., Ltd. | Methods and systems for passive wakeup of a user interaction device |
-
2020
- 2020-03-17 CN CN202010185000.9A patent/CN111429902B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000106592A (ja) * | 1998-09-29 | 2000-04-11 | Brother Ind Ltd | 音声応答機能付電話装置 |
CN106796497A (zh) * | 2014-09-12 | 2017-05-31 | 苹果公司 | 用于始终监听语音触发的动态阈值 |
US20190371342A1 (en) * | 2018-06-05 | 2019-12-05 | Samsung Electronics Co., Ltd. | Methods and systems for passive wakeup of a user interaction device |
CN109584873A (zh) * | 2018-12-13 | 2019-04-05 | 北京极智感科技有限公司 | 一种车载语音系统的唤醒方法、装置、可读介质及设备 |
CN109618059A (zh) * | 2019-01-03 | 2019-04-12 | 北京百度网讯科技有限公司 | 移动终端中语音识别功能的唤醒方法和装置 |
CN109920418A (zh) * | 2019-02-20 | 2019-06-21 | 北京小米移动软件有限公司 | 调整唤醒灵敏度的方法及装置 |
CN110047487A (zh) * | 2019-06-05 | 2019-07-23 | 广州小鹏汽车科技有限公司 | 车载语音设备的唤醒方法、装置、车辆以及机器可读介质 |
CN110525450A (zh) * | 2019-09-06 | 2019-12-03 | 浙江吉利汽车研究院有限公司 | 一种调节车载语音灵敏度的方法及系统 |
Non-Patent Citations (2)
Title |
---|
HAO WENYANG;: "Effects of Phase-Locking Deficits on Speech Recognition in Older Adults With Presbycusis" * |
楼小龙: "面向大屏显示的体感交互效率评估与优化方法研究" * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112311635A (zh) * | 2020-11-05 | 2021-02-02 | 深圳市奥谷奇技术有限公司 | 语音打断唤醒方法、装置及计算机可读存储介质 |
CN112581960A (zh) * | 2020-12-18 | 2021-03-30 | 北京百度网讯科技有限公司 | 语音唤醒方法、装置、电子设备及可读存储介质 |
CN114356275A (zh) * | 2021-12-06 | 2022-04-15 | 上海小度技术有限公司 | 交互控制方法、装置、智能语音设备及存储介质 |
CN114356275B (zh) * | 2021-12-06 | 2023-12-29 | 上海小度技术有限公司 | 交互控制方法、装置、智能语音设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111429902B (zh) | 2023-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10331399B2 (en) | Smart audio playback when connecting to an audio output system | |
CN111429902A (zh) | 用于唤醒设备的方法和装置 | |
KR20150121038A (ko) | 음성 제어식 통신 커넥션 | |
CN105103457A (zh) | 便携式终端、助听器以及在便携式终端中指示声源的位置的方法 | |
US20200258517A1 (en) | Electronic device for providing graphic data based on voice and operating method thereof | |
CN107613146B (zh) | 一种音量调整方法、装置及移动终端 | |
US20230252964A1 (en) | Method and apparatus for determining volume adjustment ratio information, device, and storage medium | |
JP6906584B2 (ja) | デバイスをウェイクアップするための方法及び装置 | |
CN109817214B (zh) | 应用于车辆的交互方法和装置 | |
CN109582274B (zh) | 音量调节方法、装置、电子设备及计算机可读存储介质 | |
WO2017185782A1 (zh) | 一种自定义闹钟提醒的方法及装置 | |
CN111524501A (zh) | 语音播放方法、装置、计算机设备及计算机可读存储介质 | |
EP4192021A1 (en) | Audio data processing method and apparatus, and device and storage medium | |
CN110675848A (zh) | 音频处理方法、装置及存储介质 | |
US20220391163A1 (en) | Automatic volume adjustment method and apparatus, medium, and device | |
CN111768759A (zh) | 用于生成信息的方法和装置 | |
CN108668011B (zh) | 输出方法、输出设备以及电子设备 | |
KR20180092163A (ko) | 비디오 재생을 위한 전자 장치 및 서버 | |
CN111435600A (zh) | 用于处理音频的方法和装置 | |
CN112259076A (zh) | 语音交互方法、装置、电子设备及计算机可读存储介质 | |
CN111276127A (zh) | 语音唤醒方法、装置、存储介质及电子设备 | |
US10966028B2 (en) | Mobile terminal and computer-readable storage medium | |
CN112218149B (zh) | 一种多媒体数据采集方法、装置、设备及介质 | |
CN111381796B (zh) | 一种在客户端上实现ktv功能的处理方法、装置及用户设备 | |
CN117133290A (zh) | 一种多意图语音操作方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20211011 Address after: 100176 101, floor 1, building 1, yard 7, Ruihe West 2nd Road, Beijing Economic and Technological Development Zone, Daxing District, Beijing Applicant after: Apollo Zhilian (Beijing) Technology Co.,Ltd. Address before: 2 / F, baidu building, No. 10, Shangdi 10th Street, Haidian District, Beijing 100085 Applicant before: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |