CN111968644A - 智能设备唤醒方法、装置及电子设备 - Google Patents

智能设备唤醒方法、装置及电子设备 Download PDF

Info

Publication number
CN111968644A
CN111968644A CN202010900576.9A CN202010900576A CN111968644A CN 111968644 A CN111968644 A CN 111968644A CN 202010900576 A CN202010900576 A CN 202010900576A CN 111968644 A CN111968644 A CN 111968644A
Authority
CN
China
Prior art keywords
target
frequency
time period
awakening
threshold value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010900576.9A
Other languages
English (en)
Other versions
CN111968644B (zh
Inventor
宋汉冲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Oribo Technology Co Ltd
Original Assignee
Shenzhen Oribo Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Oribo Technology Co Ltd filed Critical Shenzhen Oribo Technology Co Ltd
Priority to CN202010900576.9A priority Critical patent/CN111968644B/zh
Publication of CN111968644A publication Critical patent/CN111968644A/zh
Application granted granted Critical
Publication of CN111968644B publication Critical patent/CN111968644B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Electric Clocks (AREA)
  • Telephone Function (AREA)

Abstract

本申请公开了一种智能设备唤醒方法、装置及电子设备,涉及智能设备技术领域。当接收到指令语音,确定当前时间段内的标准唤醒阈值和所述指令语音对应的目标用户,获取所述目标用户在当前时间段内对智能设备的目标使用频率,获取当前时间段内所述目标使用频率对应的目标唤醒阈值,若所述标准唤醒阈值与所述目标唤醒阈值不同,则将所述智能设备的当前时间段内的唤醒阈值由所述标准唤醒阈值更新为所述目标唤醒阈值,基于更新后的所述唤醒阈值对指令语音进行识别,对所述智能设备执行唤醒操作。如此,可以动态调整在不同时间段内智能设备的唤醒阈值,提高对智能设备的唤醒率,降低误唤醒率。

Description

智能设备唤醒方法、装置及电子设备
技术领域
本申请涉及智能设备技术领域,更具体地,涉及一种智能设备唤醒方法、装置及电子设备。
背景技术
智能设备(如,手机、电脑、机器人、智能穿戴设备、智能家居以及车站设备等)可以通过语音进行唤醒。而语音识别技术在近些年取得了显著的进步,该技术已进入工业、家电、智能家居等各个领域。语音唤醒即是语音识别技术的一种形式,其不直接接触硬件设备,通过语音即可将设备唤醒运行。语音作为人们最自然的交流方式,通过语音唤醒这种非接触式的方式启动设备无疑是更友好的。
在现有技术中,用户一般是通过说出指定唤醒词,唤醒对应的智能设备。但在实际使用中,用户的发音常常发生音变、衰减等,使得智能设备难以准确地识别用户说出的语音是否包含指定唤醒词,而导致正确唤醒率下降。此外,真实环境下总是存在很多噪声,比如说话声、开门声、电视发出的声音等,这些声音有时候也会将智能设备唤醒,称为误唤醒。误唤醒为用户体验带来了极大的困扰,极大的影响用户的使用体验。
发明内容
有鉴于此,本申请提出了一种智能设备唤醒方法、装置及电子设备,以改善上述问题。
第一方面,本申请实施例提供了一种智能设备唤醒方法,所述方法包括:当接收到指令语音,确定当前时间段内的标准唤醒阈值和所述指令语音对应的目标用户;获取所述目标用户在当前时间段内对智能设备的目标使用频率;获取当前时间段内所述目标使用频率对应的目标唤醒阈值;若所述标准唤醒阈值与所述目标唤醒阈值不同,则将所述智能设备的当前时间段内的唤醒阈值由所述标准唤醒阈值更新为所述目标唤醒阈值;基于更新后的所述唤醒阈值对指令语音进行识别,对所述智能设备执行唤醒操作。
第二方面,本申请实施例提供了一种智能设备唤醒装置,所述装置包括:确定模块、获取模块、阈值更新模块及唤醒模块。确定模块,用于当接收到指令语音,确定当前时间段内的标准唤醒阈值和所述指令语音对应的目标用户;获取模块,用于获取所述目标用户在当前时间段内对智能设备的目标使用频率,获取当前时间段内所述目标使用频率对应的目标唤醒阈值;阈值更新模块,用于若所述标准唤醒阈值与所述目标唤醒阈值不同,则将所述智能设备的当前时间段内的唤醒阈值由所述标准唤醒阈值更新为所述目标唤醒阈值;唤醒模块,用于基于更新后的所述唤醒阈值对指令语音进行识别,对所述智能设备执行唤醒操作。
第三方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储器;一个或多个程序,其中所述一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行上述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有程序代码,所述程序代码可被处理器调用执行上述的方法。
相对于现有技术,本申请提供的方案中,当接收到指令语音,确定当前时间段内的标准唤醒阈值和所述指令语音对应的目标用户,获取目标用户在当前时间段内对智能设备的目标使用频率,获取当前时间段内目标使用频率对应的目标唤醒阈值,若所述标准唤醒阈值与所述目标唤醒阈值不同,则将所述智能设备的当前时间段内的唤醒阈值由所述标准唤醒阈值更新为所述目标唤醒阈值,基于更新后的所述唤醒阈值对指令语音进行识别,对所述智能设备执行唤醒操作。如此,可以根据目标用户在一个时间段内对智能设备的目标使用频率,动态地更新目标用户在这个时间段内的唤醒阈值,使更新后的唤醒阈值与目标用户在这个时间段内对智能设备的使用习惯匹配,从而可以降低对智能设备的误唤醒率,即可以更加准确地识别出用户说出的指令语音是否是唤醒指令语音。
本申请的这些方面或其他方面在以下实施例的描述中会更加简明易懂。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请一实施例提供的智能设备唤醒方法的流程示意图。
图2示出了图1所示步骤S110在一种实施方式中的子步骤流程示意图。
图3示出了图1所示步骤S120在一种实施方式中的子步骤流程示意图。
图4示出了本申请一实施例提供的智能设备唤醒方法的另一流程示意图。
图5是根据本申请一实施例提供的一种智能设备唤醒装置的框图。
图6是本申请实施例的用于执行根据本申请实施例的智能设备唤醒方法的电子设备的框图。
图7是本申请实施例的用于保存或者携带实现根据本申请实施例的路径生成方法的程序代码的存储单元。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
语音唤醒的应用领域较广,配置有语音唤醒功能的电子设备,可以作为本申请实施例中的智能设备,如手机、电脑、机器人、智能穿戴设备、智能家居以及车站设备。可以通过对智能设备执行语音唤醒操作来唤醒智能设备的工作状态,如通过语音唤醒操作使智能设备从待机状态切换为工作状态;也可以是唤醒智能设备的某些功能,如唤醒智能设备的语音助手等。
一些实施方式中,当进行唤醒时,用户说出一段语音信息,智能设备可以接收到用户的语音信息并对语音信息进行识别,如果从用户的语音信息中识别出预设唤醒词时,可以判定为接收到唤醒语音,进行相应的唤醒。
其中,智能设备在识别接收到的语音是否为唤醒语音时,可以计算接收到的语音进行处理后与标准唤醒语音的相似度,得到相似度值,根据该相似度值与唤醒阈值的大小确定是否接收到唤醒指令,是否执行唤醒操作。
若相似度值大于唤醒阈值,说明接收到的语音与标准唤醒语音的相似度比较大,符合条件,可以确定用户语音是一个唤醒指令语音,并对智能设备执行唤醒操作。
若相似度值小于或等于当前唤醒阈值,说明接收到的语音与标准唤醒语音的相似度较低,不符合条件,可以确定接收到的语音不是一个唤醒指令语音,不执行唤醒操作。
一些实施方式中,当进行唤醒时,用户说出一段语音信息,智能设备可以接收到用户的语音信息并对语音信息中的声纹特征和语音信息的内容进行识别,如果用户的声纹特征是目标声纹特征时,则判断语音信息中是否包含预设的操作指令,有则唤醒智能设备,并执行对应的操作指令。
但是,上述的唤醒方式中,唤醒阈值通常被设置为一个固定的值,这就会导致出现以下几种情况:
若该唤醒阈值设置得过高,用户语音与标准唤醒语音需要具有极高的相似度,才可能被识别成唤醒指令语音,用户语音唤醒智能设备的难度较大,比如,即使是用户说出唤醒词,也可能因发声音量、噪音问题、口音问题等获得较低的相似度值导致唤醒失败,唤醒率较低;
而若唤醒阈值设置得过低,用户语音与标准唤醒语音在相似度较低时,也可能被识别成唤醒指令语音,这样非常容易导致一些并非用于唤醒智能设备的语音,错误地被识别成唤醒指令语音,误识别率较高,相应地,误唤醒率也比较高。
本申请实施例中,唤醒率表示接收并识别出唤醒语音,执行对应唤醒操作的次数,与实际接收到唤醒语音的总次数的比值;误唤醒率可以表示,接收到的语音信号为非唤醒语音却执行唤醒操作的次数,与接收到的语音信号为非唤醒语音的总次数的比值。
为了有效提高唤醒率,并且可以降低误唤醒率,发明人经过长期的研究,提出一种智能设备唤醒方法、装置及智能设备,可以根据用户使用智能设备的频率来动态调整唤醒阈值,以使智能设备的唤醒阈值与用户在当前时间段的使用习惯相匹配,从而提高了智能设备中语音唤醒功能的准确性。下面对该内容进行详细描述。
请参照图1,图1为本申请一实施例提供的一种智能设备唤醒方法的流程示意图。下面对该方法包括的步骤进行阐述。
步骤S110,当接收到指令语音,确定当前时间段内的标准唤醒阈值和所述指令语音对应的目标用户。
在本申请实施例中,智能设备接收到的指令语音可以为目标用户输入的任意语音。在一个周期的每个时间段内,智能设备可以针对目标用户存储至少两个唤醒阈值,唤醒阈值是针对目标用户的指令语音与标准唤醒语音之间的相似度而设置的阈值,表征的是目标用户的指令语音被识别为唤醒指令语音需要达到的条件,可以理解,唤醒阈值越低,智能设备越容易被唤醒。
上述的至少两个唤醒阈值分别对应目标用户在该时间段内对智能设备的不同使用频率。在该至少两个唤醒阈值中包含一标准唤醒阈值,即,在任意时间段内,接受到用户的指令语音均采用的初始唤醒阈为标准唤醒阈值,本实施例中,可以将智能设备位于中频使用时间内的智能设备的唤醒阈值看做为所处当前时间段内的当前唤醒阈值为标准唤醒阈值。
实际应用中,智能设备还可以通过判断接收到的指令语音中的声纹特征来确定所述指令语音对应的所述目标用户,详细地,根据声纹特征确定对应的目标用户可以包括图2所示步骤。
步骤S111,提取所述指令语音中的声纹特征。
在该实施方式中,由于不同个体的声纹特征具有差异,即不同用户的语音中携带的,可以通过声纹特征来判断对智能设备发送指令语音的目标用户的身份。实际应用中,在接收到用户的指令语音之后,可以先提取用户语音指令中的声纹特征,根据所述声纹特征确定用户对应的目标用户身份信息,并且根据目标用户的对应身份信息确定与目标用户对应的当前时间段的目标使用频率。
在另一些实施方式中,还可以在提取指令语音中的声纹特征之前,先获取指令语音与标准唤醒语音的相似度值,在其相似度值大于标准唤醒阈值时,再提取指令语音中的声纹特征。其中,该与指令语音匹配的标准唤醒语音可以是智能设备中提前预存的一段唤醒音频。
步骤S112,当所述声纹特征与保存的所述目标用户的声纹特征符合预设条件时,则确定接收到所述目标用户的指令语音。
在本实施例中,当用户第一次使用智能设备的语音唤醒功能时,智能设备可以自动存储该用户的声纹特征,以用于该用户在后续使用智能设备的语音唤醒功能是,智能设备可以根据存储的声纹特征确定该用户的身份信息,并根据该用户的身信息确定对应的唤醒阈值。
可选地,智能设备可以将从指令语音中提取的声纹特征与智能设备提前预存的目标用户的声纹特征库中的声纹特征信息进行匹配,查询是否有与指令语音中提取出的声纹特征相似度较高的预存的声纹特征,若与指令语音中提取的声纹特征相似度较高的预存声纹特征,则确定接收到该目标用户发送的指令语音。
步骤S120,获取所述目标用户在当前时间段内对智能设备的目标使用频率。
在本实施例中,智能设备以目标用户的声纹特征为基础建立了一个数据存储系统,即,每个用户在使用一次该智能设备的语音唤醒功能后,智能设备都会以每个用户的声纹特征为标识,存储该声纹特征标识对应下的每个用户的历史使用数据,其中,历史使用数据可以包括每个用户使用语音唤醒功能的次数和每次使用语音唤醒功能时的时间。
可以理解,智能设备可以从该数据存储系统中获取指令语音对应的目标用户在当前时间段内的历史使用数据,并根据历史使用数据确定目标用户在当前时间段内对智能设备的目标使用频率。
在本申请实施例中,可以通过图2所示的步骤来获取所述目标用户在当前时间段内对智能设备的目标使用频率,即,步骤S120可以包括图3所示的步骤。
步骤S121,分别获取所述目标用户在至少一个周期的不同时间段内对所述智能设备的历史使用频率。
步骤S122,分别统计所述至少一个周期的多个相同时间段的历史使用频率,并计算出所述至少一个周期内各相同时间段内的平均使用频率。
步骤S123,将各相同时间段内的所述平均使用频率确定为对应时间段的目标使用频率。
一个可能的例子中,以一个周期为7天为例,智能设备可以将凌晨1点至上午7点的时间段确定为第一时间段,将上午8点至中午12点的时间段确定为第二时间段,将下午1点至下午6点确定为第三时间段,对应地,第一时间段、第二时间段及第三时间段即为以7天为一个周期中的不同时间段。进一步地,智能设备需要从数据存储系统中获取该目标用户在一个周期内的每一天在上述三个时间段内的历史使用频率,例如,在上述一个周期内每一天的第一时间段内,智能设备获取到的目标用户对智能设备的历史使用频率分别为2次、1次、2次、4次、2次、2次及1次;在上述一个周期内每一天的第二时间段内,智能设备获取到的目标用户对智能设备的历史使用频率分别为4次、5次、7次、9次、6次、5次及6次;在上述一个周期内每一天的第三时间段内,智能设备获取到的目标用户对智能设备的历史使用频率分别为10次、12次、13次、9次、11次、10次及12次。
进一步地,智能设备可以分别计算一个周期内的不同时间段内的平均使用评率。对应地,针对上述例子的第一时间段,智能设备根据一个周期内用户在第一时间段的历史使用频率可以计算出第一时间段的平均使用频率为2次,同理可知,该用户在第二时间段的平均使用频率为6次,在第三时间段的平均使用频率为11次。
基于此,将步骤S122中计算出的每个时间段内的平均使用频率确定为各时间段对应的目标使用频率。例如,智能设备确定该目标用户在第一时间段内的目标使用频率为2次,第二时间段内的目标使用频率为6次,第三时间段的目标使用频率为11次。
实际应用中,智能设备可以根据接收到目标用户指令语音的时间,判断该时间的智能设备位于哪个时间段。示例性地,若智能设备在下午2点接收到目标用户的指令语音,则智能设备确定在接收到目标用户的指令语音时位于上述例子中的第三时间段,对应地,确定智能设备在下午2点时的目标使用频率为11次。
基于此,可以在所述智能设备中周期性地更新所述目标用户在不同时间段的目标使用频率。
实际应用中,目标用户每使用一次智能设备的语音唤醒功能,则智能设备中数据存储系统中的历史使用数据就会更新一次,对应地,目标用户在某具体时段内对智能设备的目标使用频率会一直发生变化,因此,智能设备需要周期性更新目标用户在不同时间段的目标使用频率。示例性地,仍以7天为一个周期,智能设备在本周一可以对上周一至上周日的三个时间段内的目标使用频率进行计算,例如,智能设备计算出上周一至上周日的第一时间段的目标使用频率为2次;智能设备在本周二可以对上周二至本周一的三个时间段内的目标使用频率进行计算,例如,智能设备计算出上周二至本周一的第一时间段的目标使用频率为4次。进一步地,智能设备则会将当前的目标使用频率更新为4次。即智能设备可以每天都以当天的时间为基准,根据前7天的历史数据确定当天的目标使用频率,达到周期性更新目标用户在不同时间段的目标使用频率。
基于此,在通过获取目标用户的历史使用数据来确定目标用户在某时段内的平均使用频率后,还需要根据平均使用频率确定对应的频率使用时间段,并确定不同频率使用时间段内智能设备的目标唤醒阈值,确定不同频率使用时间段内智能设备的目标唤醒阈值可以通过图4所示的步骤确定。
步骤S410,将同一周期内的不同时间段的所述平均使用频率进行高中低频的等级划分。
仍以步骤S120所举的实施例为例,将平均使用频率小于5次的时间段划分为低频使用时间,将平均使用频率在大于等于5次小于10次的时间段划分为中频使用时间,将平均使用频率在大于等于10次的时间段划分为高频使用时间。即,该周期内包括三个频率使用时间段:低频使用时间、中频使用时间及高频使用时间。
步骤S420,若所述平均使用频率为高频范围,则将所述平均使用频率对应的时间段确定为高频使用时间,其中,所述高频使用时间对应的所述目标唤醒阈值低于所述标准唤醒阈值。
例如,目标用户在第三时间段内对智能设备的平均使用频率为11次,对应地,可以确定在第三时间段内智能设备为目标用户的高频使用时间。其中,标准唤醒阈值可以是智能设备中最开始预设的固定唤醒阈值(如0.4),则可以确定位于高频使用时间内的智能设备的目标唤醒阈值应该低于该标准唤醒阈值,以提高对智能设备的唤醒率。在本申请实施例中,智能设备的唤醒阈值可以是通过算法进行多人训练得到的,在此情况下,智能设备位于高频使用时间内的唤醒阈值一般为一个固定值(如0.2)。
步骤S430,若所述平均使用频率为中频范围,则将所述平均使用频率对应的时间段确定为中频使用时间,其中,所述中频使用时间对应的所述目标唤醒阈值为所述标准唤醒阈值。
示例性地,目标用户在第二时间段内对智能设备的平均使用频率为6次,对应地,可以确定在第二时间内智能设备为目标用户的中频使用时间,则可以确定位于中频使用时间内的智能设备的目标唤醒阈值为智能设备的标准唤醒阈值(如0.4)。
步骤S440,若所述平均使用频率为低频范围,则将所述平均使用频率对应的时间段确定为低频使用时间,其中,所述低频频使用时间对应的所述目标唤醒阈值高于所述标准唤醒阈值。
示例性地,目标用户在第一时间段内对智能设备的平均使用频率为2次,对应地,可以确定在第一时间段内智能设备为目标用户的低频使用时间,则可以确定位于低频使用时间内的智能设备的目标唤醒阈值应该高于标准唤醒阈值,在本实施例中,智能设备位于低频使用时间内的唤醒阈值可以看作一个固定值(如0.7)。
实际应用中,智能设备会存储所述目标用户的声纹特征与所述智能设备的对应于所述目标用户的目标唤醒阈值的对应关系。示例性地,智能设备会以该目标用户的声纹特征为标识,存储该目标用户在第一时间段、第二时间段及第三时间段内的目标唤醒阈值,以供智能设备在下一次接收到该目标用户的指令语音时,可以根据该目标用户指令语中的声纹特征确定当前时间段的目标唤醒阈值。
步骤S130,获取当前时间段内所述目标使用频率对应的目标唤醒阈值。
步骤S140,若所述标准唤醒阈值与所述目标唤醒阈值不同,则将所述智能设备的当前时间段内的唤醒阈值由所述标准唤醒阈值更新为所述目标唤醒阈值。
可选地,智能设备根据获取到的当前时间段内的目标使用频率确定该目标使用频率对应的目标唤醒阈值,示例性地,若接收到目标用户发送指令语音的时间为下午2点,这个时间点是位于上述实施例中目标用户的高频使用时间内,则智能设备获取该目标用户在高频使用时间内的唤醒阈值(如0.2)作为目标唤醒阈值。若步骤S110中确定的当前时间段内的标准唤醒阈值为0.4,即当前时间段内的标准唤醒阈值与获取到的目标唤醒阈值不相同,智能设备会自动将当前时间段内的唤醒阈值由标准唤醒阈值调整为目标唤醒阈值,即将唤醒阈值由0.4调整至0.2,对应地,智能设备当前的唤醒阈值更新为0.2。
步骤S150,基于更新后的所述唤醒阈值对指令语音进行识别,对所述智能设备执行唤醒操作。
基于此,在智能设备将当前的唤醒阈值调整为0.2后,将接收到的指令语音进行处理,获取指令语音与标准唤醒语音的相似度值,并将该相似度值与当前的唤醒阈值进行比较,若该相似度值大于当前的唤醒阈值,智能设备确定接收到了唤醒指令,并执行唤醒操作;若相似度值小于或等于当前的唤醒阈值,则智能设备确定接收到的不是唤醒指令,不执行唤醒操作。
本申请提供的智能设备唤醒方法,可以根据用户在一个时间段内对智能设备的使用频率,动态调整智能设备在该时段内的唤醒阈值,实现在智能设备使用频率较高的时间段内,降低唤醒阈值以提高唤醒率,在智能设备使用频率较低的时间段内,调高唤醒阈值以降低误唤醒率,提升每名用户的唤醒使用体验。
请参照图5,其中示出了本申请实施例提供的一种智能设备唤醒装置500的结构框图。该装置500可以包括:确定模块510、获取模块520、阈值更新模块530和唤醒模块540。
确定模块510用于当接收到指令语音,确定当前时间段内的标准唤醒阈值和所述指令语音对应的目标用户。
获取模块520用于获取所述目标用户在当前时间段内对智能设备的目标使用频率,获取当前时间段内所述目标使用频率对应的目标唤醒阈值。
阈值更新模块530用于若所述标准唤醒阈值与所述目标唤醒阈值不同,则将所述智能设备的当前时间段内的唤醒阈值由所述标准唤醒阈值更新为所述目标唤醒阈值。
唤醒模块540用于基于更新后的所述唤醒阈值对指令语音进行识别,对所述智能设备执行唤醒操作。
可选地,确定模块510还可以用于提取所述指令语音中的声纹特征,当所述声纹特征与保存的所述目标用户的声纹特征符合预设条件时,则确定接收到所述目标用户的指令语音。
可选地,获取模块520还可以用于分别获取所述目标用户在至少一个周期的不同时间段内对所述智能设备的历史使用频率,分别统计所述至少一个周期的多个相同时间段的历史使用频率,并计算出所述至少一个周期内各相同时间段内的平均使用频率,将各相同时间段内的所述平均使用频率确定为对应时间段的目标使用频率。
可选地,获取模块520还可以用于在所述智能设备中周期性的更新所述目标用户在不同时间段的目标使用频率。
可选地,阈值更新模块530还可以用于将同一周期内的不同时间段的所述平均使用频率进行高中低频的等级划分,若所述平均使用频率为高频范围,则将所述平均使用频率对应的时间段确定为高频使用时间,其中,所述高频使用时间对应的所述目标唤醒阈值低于所述标准唤醒阈值,若所述平均使用频率为中频范围,则将所述平均使用频率对应的时间段确定为中频使用时间,其中,所述中频使用时间对应的所述目标唤醒阈值为所述标准唤醒阈值,若所述平均使用频率为低频范围,则将所述平均使用频率对应的时间段确定为低频使用时间,其中,所述低频频使用时间对应的所述目标唤醒阈值高于所述标准唤醒阈值。
参照图6,其中示出了本申请实施例提供的一种电子设备600的结构框图,本申请实施例提供的智能设备唤醒方法可以由该电子设备600执行。
本申请实施例中的电子设备600可以包括一个或多个如下部件:处理器601、存储602、以及一个或多个应用程序,其中一个或多个应用程序可以被存储在存储器602中并被配置为由一个或多个处理器601执行,一个或多个程序配置用于执行如前述方法实施例所描述的方法。
处理器601可以包括一个或者多个处理核。处理器601利用各种接口和线路连接整个电子设备600内的各个部分,通过运行或执行存储在存储器602内的指令、程序、代码集或指令集,以及调用存储在存储器602内的数据,执行电子设备600的各种功能和处理数据。可选地,处理器601可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable LogicArray,PLA)中的至少一种硬件形式来实现。处理器601可集成中央处理器(CentralProcessing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器601中,单独通过一块通信芯片进行实现。
存储器602可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。存储器602可用于存储指令、程序、代码、代码集或指令集。存储器602可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储电子设备600在使用中所创建的数据(比如上述的各种对应关系)等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,所显示或讨论的模块相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
请参考图7,其示出了本申请实施例提供的一种计算机可读存储介质的结构框图。该计算机可读介质700中存储有程序代码,所述程序代码可被处理器调用执行上述方法实施例中所描述的方法。
计算机可读存储介质700可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地,计算机可读存储介质700包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质700具有执行上述方法中的任何方法步骤的程序代码710的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码710可以例如以适当形式进行压缩。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种智能设备唤醒的方法,其特征在于,所述方法包括:
当接收到指令语音,确定当前时间段内的标准唤醒阈值和所述指令语音对应的目标用户;
获取所述目标用户在当前时间段内对智能设备的目标使用频率;
获取当前时间段内所述目标使用频率对应的目标唤醒阈值;
若所述标准唤醒阈值与所述目标唤醒阈值不同,则将所述智能设备的当前时间段内的唤醒阈值由所述标准唤醒阈值更新为所述目标唤醒阈值;
基于更新后的所述唤醒阈值对指令语音进行识别,对所述智能设备执行唤醒操作。
2.根据权利要求1所述的方法,其特征在于,所述获取所述目标用户在当前时间段内对智能设备的目标使用频率,包括:
分别获取所述目标用户在至少一个周期的不同时间段内对所述智能设备的历史使用频率;
分别统计所述至少一个周期的多个相同时间段的历史使用频率,并计算出所述至少一个周期内各相同时间段内的平均使用频率;
将各相同时间段内的所述平均使用频率确定为对应时间段的目标使用频率。
3.根据权利要求2所述的方法,其特征在于,所述将各相同时间段内的所述平均使用频率确定为对应时间段的所述目标使用频率,包括:
将同一周期内的不同时间段的所述平均使用频率进行高中低频的等级划分;
若所述平均使用频率为高频范围,则将所述平均使用频率对应的时间段确定为高频使用时间,其中,所述高频使用时间对应的所述目标唤醒阈值低于所述标准唤醒阈值;
若所述平均使用频率为中频范围,则将所述平均使用频率对应的时间段确定为中频使用时间,其中,所述中频使用时间对应的所述目标唤醒阈值为所述标准唤醒阈值;
若所述平均使用频率为低频范围,则将所述平均使用频率对应的时间段确定为低频使用时间,其中,所述低频频使用时间对应的所述目标唤醒阈值高于所述标准唤醒阈值。
4.根据权利要求1所述的方法,其特征在于,在对所述智能设备执行唤醒操作之前,所述方法还包括:
提取所述指令语音中的声纹特征;
当所述声纹特征与保存的所述目标用户的声纹特征符合预设条件时,则确定接收到所述目标用户的指令语音。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
存储所述目标用户的声纹特征与所述智能设备的对应于所述目标用户的目标唤醒阈值的对应关系。
6.根据权利要求1-3中任意一项所述的方法,其特征在于,所述方法还包括:
在所述智能设备中周期性地更新所述目标用户在不同时间段的目标使用频率。
7.一种智能设备唤醒装置,其特征在于,所述装置包括:
确定模块,用于当接收到指令语音,确定当前时间段内的标准唤醒阈值和所述指令语音对应的目标用户;
获取模块,用于获取所述目标用户在当前时间段内对智能设备的目标使用频率,获取当前时间段内所述目标使用频率对应的目标唤醒阈值;
阈值更新模块,用于若所述标准唤醒阈值与所述目标唤醒阈值不同,则将所述智能设备的当前时间段内的唤醒阈值由所述标准唤醒阈值更新为所述目标唤醒阈值;
唤醒模块,用于基于更新后的所述唤醒阈值对指令语音进行识别,对所述智能设备执行唤醒操作。
8.根据权利要求7所述的装置,其特征在于,所述获取模块通过如下方式获取所述目标用户在当前时间段内对智能设备的目标使用频率:
分别获取所述目标用户在至少一个周期的不同时间段内对所述智能设备的历史使用频率;分别统计所述至少一个周期的多个相同时间段的历史使用频率,并计算出所述至少一个周期内各相同时间段内的平均使用频率;将各相同时间段内的所述平均使用频率确定为对应时间段的目标使用频率。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器;
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行如权利要求1-6中任意一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序代码,所述程序代码可被处理器调用执行如权利要求1-6中任意一项所述的方法。
CN202010900576.9A 2020-08-31 2020-08-31 智能设备唤醒方法、装置及电子设备 Active CN111968644B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010900576.9A CN111968644B (zh) 2020-08-31 2020-08-31 智能设备唤醒方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010900576.9A CN111968644B (zh) 2020-08-31 2020-08-31 智能设备唤醒方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN111968644A true CN111968644A (zh) 2020-11-20
CN111968644B CN111968644B (zh) 2022-12-27

Family

ID=73401037

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010900576.9A Active CN111968644B (zh) 2020-08-31 2020-08-31 智能设备唤醒方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN111968644B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113470658A (zh) * 2021-05-31 2021-10-01 翱捷科技(深圳)有限公司 一种智能耳机及其语音唤醒阈值调整方法
CN113470660A (zh) * 2021-05-31 2021-10-01 翱捷科技(深圳)有限公司 一种基于路由器流量的语音唤醒阈值调整方法及系统
CN113470659A (zh) * 2021-05-31 2021-10-01 翱捷科技(深圳)有限公司 一种基于光强的语音唤醒阈值调整方法及装置
CN114429766A (zh) * 2022-01-29 2022-05-03 北京百度网讯科技有限公司 调整播放音量的方法、装置、设备以及存储介质
CN115457955A (zh) * 2022-07-29 2022-12-09 青岛海尔科技有限公司 分布式唤醒的决策方法、装置、存储介质及电子装置
CN116030817A (zh) * 2022-07-18 2023-04-28 荣耀终端有限公司 语音唤醒方法、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070271097A1 (en) * 2006-05-18 2007-11-22 Fujitsu Limited Voice recognition apparatus and recording medium storing voice recognition program
CA3045628A1 (en) * 2016-12-19 2018-06-28 Rovi Guides, Inc. Systems and methods for distinguishing valid voice commands from false voice commands in an interactive media guidance application
CN109147788A (zh) * 2018-10-19 2019-01-04 珠海格力电器股份有限公司 本地语音库的更新方法及装置
WO2019235858A1 (en) * 2018-06-05 2019-12-12 Samsung Electronics Co., Ltd. A voice assistant device and method thereof
CN110992962A (zh) * 2019-12-04 2020-04-10 珠海格力电器股份有限公司 语音设备的唤醒调整方法、装置、语音设备及存储介质
CN111326149A (zh) * 2020-02-25 2020-06-23 青岛海尔空调器有限总公司 一种提高语音辨识率的优化方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070271097A1 (en) * 2006-05-18 2007-11-22 Fujitsu Limited Voice recognition apparatus and recording medium storing voice recognition program
CA3045628A1 (en) * 2016-12-19 2018-06-28 Rovi Guides, Inc. Systems and methods for distinguishing valid voice commands from false voice commands in an interactive media guidance application
WO2019235858A1 (en) * 2018-06-05 2019-12-12 Samsung Electronics Co., Ltd. A voice assistant device and method thereof
CN109147788A (zh) * 2018-10-19 2019-01-04 珠海格力电器股份有限公司 本地语音库的更新方法及装置
CN110992962A (zh) * 2019-12-04 2020-04-10 珠海格力电器股份有限公司 语音设备的唤醒调整方法、装置、语音设备及存储介质
CN111326149A (zh) * 2020-02-25 2020-06-23 青岛海尔空调器有限总公司 一种提高语音辨识率的优化方法及系统

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113470658A (zh) * 2021-05-31 2021-10-01 翱捷科技(深圳)有限公司 一种智能耳机及其语音唤醒阈值调整方法
CN113470660A (zh) * 2021-05-31 2021-10-01 翱捷科技(深圳)有限公司 一种基于路由器流量的语音唤醒阈值调整方法及系统
CN113470659A (zh) * 2021-05-31 2021-10-01 翱捷科技(深圳)有限公司 一种基于光强的语音唤醒阈值调整方法及装置
CN114429766A (zh) * 2022-01-29 2022-05-03 北京百度网讯科技有限公司 调整播放音量的方法、装置、设备以及存储介质
CN116030817A (zh) * 2022-07-18 2023-04-28 荣耀终端有限公司 语音唤醒方法、设备及存储介质
CN116030817B (zh) * 2022-07-18 2023-09-19 荣耀终端有限公司 语音唤醒方法、设备及存储介质
CN115457955A (zh) * 2022-07-29 2022-12-09 青岛海尔科技有限公司 分布式唤醒的决策方法、装置、存储介质及电子装置

Also Published As

Publication number Publication date
CN111968644B (zh) 2022-12-27

Similar Documents

Publication Publication Date Title
CN111968644B (zh) 智能设备唤醒方法、装置及电子设备
CN111223497B (zh) 一种终端的就近唤醒方法、装置、计算设备及存储介质
CN108847219B (zh) 一种唤醒词预设置信度阈值调节方法及系统
CN107644642B (zh) 语义识别方法、装置、存储介质及电子设备
CN105654949B (zh) 一种语音唤醒方法及装置
CN111880856A (zh) 语音唤醒方法、装置、电子设备及存储介质
CN111949323B (zh) 智能设备唤醒的优化方法、装置、智能设备及存储介质
JP2019533193A (ja) 音声制御システム及びそのウェイクアップ方法、ウェイクアップ装置、並びに家電製品、コプロセッサ
CN108564948B (zh) 一种语音识别方法及电子设备
CN110782891B (zh) 一种音频处理方法、装置、计算设备及存储介质
CN111161728B (zh) 一种智能设备的唤醒方法、装置、设备及介质
CN110634468B (zh) 语音唤醒方法、装置、设备及计算机可读存储介质
CN112420041B (zh) 智能设备唤醒阈值的控制方法、装置、智能设备及存储介质
CN111312222A (zh) 一种唤醒、语音识别模型训练方法及装置
CN112233676A (zh) 智能设备唤醒方法、装置、电子设备及存储介质
CN109240641B (zh) 音效调整方法、装置、电子设备以及存储介质
CN111722696B (zh) 用于低功耗设备的语音数据处理方法和装置
CN112581960A (zh) 语音唤醒方法、装置、电子设备及可读存储介质
CN112185369A (zh) 一种基于语音控制的音量调节方法、装置、设备和介质
CN113963695A (zh) 一种智能设备的唤醒方法、装置、设备及存储介质
CN113132193B (zh) 智能设备的控制方法、装置、电子设备以及存储介质
CN113160815B (zh) 语音唤醒的智能控制方法、装置、设备及存储介质
WO2022222045A1 (zh) 语音信息处理方法及设备
CN112669837A (zh) 智能终端的唤醒方法、装置及电子设备
CN112420043A (zh) 基于语音的智能唤醒方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant