CN110989963B - 唤醒词推荐方法及装置、存储介质 - Google Patents

唤醒词推荐方法及装置、存储介质 Download PDF

Info

Publication number
CN110989963B
CN110989963B CN201911159681.5A CN201911159681A CN110989963B CN 110989963 B CN110989963 B CN 110989963B CN 201911159681 A CN201911159681 A CN 201911159681A CN 110989963 B CN110989963 B CN 110989963B
Authority
CN
China
Prior art keywords
wake
word
rate
recommended
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911159681.5A
Other languages
English (en)
Other versions
CN110989963A (zh
Inventor
张新成
任伟
张巍耀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Wutong Chelian Technology Co Ltd
Original Assignee
Beijing Wutong Chelian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Wutong Chelian Technology Co Ltd filed Critical Beijing Wutong Chelian Technology Co Ltd
Priority to CN201911159681.5A priority Critical patent/CN110989963B/zh
Publication of CN110989963A publication Critical patent/CN110989963A/zh
Application granted granted Critical
Publication of CN110989963B publication Critical patent/CN110989963B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • G06F9/453Help systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开一种唤醒词推荐方法及装置、存储介质,属于电子技术应用领域。该方法包括:获取至少两个待推荐唤醒词;获取该至少两个待推荐唤醒词中的每个待推荐唤醒词的使用率和该每个待推荐唤醒词的唤醒率;根据每个待推荐唤醒词的使用率和该每个待推荐唤醒词的唤醒率,确定该每个待推荐唤醒词的使用唤醒率;根据该至少两个待推荐唤醒词的使用唤醒率,推荐该至少两个待推荐唤醒词。本申请有助于提高自定义的唤醒词对智能终端的唤醒率。

Description

唤醒词推荐方法及装置、存储介质
技术领域
本申请涉及电子技术应用领域,特别涉及一种唤醒词推荐方法及装置、存储介质。
背景技术
智能家居、智能机器人、车载终端以及智能手机等智能终端通常在唤醒之后才能正常工作。目前,智能终端可以捕捉用户输入的唤醒词,根据预先构建的唤醒模型对该唤醒词进行识别,如果识别成功,则唤醒智能终端。其中,唤醒词可以是用户预先在智能终端中自定义的。
但是,用户自定义的唤醒词对智能终端的唤醒率较低。
发明内容
本申请提供一种唤醒词推荐方法及装置、存储介质,有助于提高自定义的唤醒词对智能终端的唤醒率。所述技术方案如下:
第一方面,提供一种唤醒词推荐方法,所述方法包括:
获取至少两个待推荐唤醒词;
获取所述至少两个待推荐唤醒词中的每个待推荐唤醒词的使用率和所述每个待推荐唤醒词的唤醒率;
根据所述每个待推荐唤醒词的使用率和所述每个待推荐唤醒词的唤醒率,确定所述每个待推荐唤醒词的使用唤醒率;
根据所述至少两个待推荐唤醒词的使用唤醒率,推荐所述至少两个待推荐唤醒词。
可选地,所述获取至少两个待推荐唤醒词,包括:
接收用户输入的初始唤醒词;
根据所述初始唤醒词获取至少一个衍生唤醒词;
将所述初始唤醒词和所述至少一个衍生唤醒词,确定为所述至少两个待推荐唤醒词。
可选地,所述根据所述初始唤醒词获取至少一个衍生唤醒词,包括:
对所述初始唤醒词进行拆分重组得到至少一个衍生唤醒词;和/或,
根据所述初始唤醒词,通过语义联想获取至少一个衍生唤醒词。
可选地,所述获取所述至少两个待推荐唤醒词中的每个待推荐唤醒词的使用率和所述每个待推荐唤醒词的唤醒率,包括:
从目标语料库中获取所述至少两个待推荐唤醒词中的每个待推荐唤醒词的使用率,所述目标语料库记录有至少一个目标词汇以及每个所述目标词汇的使用率;
从唤醒率库中获取所述至少两个待推荐唤醒词中的每个待推荐唤醒词的唤醒率,所述唤醒率库记录有至少一个目标词汇以及每个所述目标词汇的唤醒率。
可选地,在从目标语料库中获取所述至少两个待推荐唤醒词中的每个待推荐唤醒词的使用率之前,所述方法还包括:
获取用户语料集,所述用户语料集包括至少一个用户语料,所述用户语料包括至少一个目标词汇;
对所述用户语料集进行分析,确定所述用户语料集中的每个目标词汇在所述用户语料集中的使用率;
根据所述用户语料集中的每个目标词汇以及所述每个目标词汇的使用率,生成所述目标语料库。
可选地,在从唤醒率库中获取所述至少两个待推荐唤醒词中的每个待推荐唤醒词的唤醒率之前,所述方法还包括:
获取用户习惯语料,所述用户习惯语料为使用频率高于目标频率的用户语料;
对所述用户习惯语料进行特征提取得到至少一个目标词汇;
根据词汇识别模型,确定所述至少一个目标词汇中的每个目标词汇的识别率;
根据所述每个目标词汇的识别率,确定所述每个目标词汇的唤醒率;
根据所述至少一个目标词汇中的每个目标词汇以及所述每个目标词汇的唤醒率,生成所述唤醒率库。
可选地,所述根据所述每个待推荐唤醒词的使用率和所述每个待推荐唤醒词的唤醒率,确定所述每个待推荐唤醒词的使用唤醒率,包括:
将所述每个待推荐唤醒词的使用率和所述每个待推荐唤醒词的唤醒率的乘积,确定为所述每个待推荐唤醒词的使用唤醒率。
第二方面,提供一种唤醒词推荐装置,所述装置包括:
第一获取模块,用于获取至少两个待推荐唤醒词;
第二获取模块,用于获取所述至少两个待推荐唤醒词中的每个待推荐唤醒词的使用率和所述每个待推荐唤醒词的唤醒率;
第一确定模块,用于根据所述每个待推荐唤醒词的使用率和所述每个待推荐唤醒词的唤醒率,确定所述每个待推荐唤醒词的使用唤醒率;
推荐模块,用于根据所述至少两个待推荐唤醒词的使用唤醒率,推荐所述至少两个待推荐唤醒词。
可选地,所述第一获取模块,包括:
接收单元,用于接收用户输入的初始唤醒词;
获取单元,用于根据所述初始唤醒词获取至少一个衍生唤醒词;
确定单元,用于将所述初始唤醒词和所述至少一个衍生唤醒词,确定为所述至少两个待推荐唤醒词。
可选地,所述获取单元,用于:
对所述初始唤醒词进行拆分重组得到至少一个衍生唤醒词;和/或,
根据所述初始唤醒词,通过语义联想,获取至少一个衍生唤醒词。
可选地,所述第二获取模块,用于:
从目标语料库中获取所述至少两个待推荐唤醒词中的每个待推荐唤醒词的使用率,所述目标语料库记录有至少一个目标词汇以及每个所述目标词汇的使用率;
从唤醒率库中获取所述至少两个待推荐唤醒词中的每个待推荐唤醒词的唤醒率,所述唤醒率库记录有至少一个目标词汇以及每个所述目标词汇的唤醒率。
可选地,所述装置还包括:
第三获取模块,用于获取用户语料集,所述用户语料集包括至少一个用户语料,所述用户语料包括至少一个目标词汇;
分析模块,用于对所述用户语料集进行分析,确定所述用户语料集中的每个目标词汇在所述用户语料集中的使用率;
第一生成模块,用于根据所述用户语料集中的每个目标词汇以及所述每个目标词汇的使用率,生成所述目标语料库。
可选地,所述装置还包括:
第四获取模块,用于获取用户习惯语料,所述用户习惯语料为使用频率高于目标频率的用户语料;
提取模块,用于对所述用户习惯语料进行特征提取得到至少一个目标词汇;
第二确定模块,用于根据词汇识别模型,确定所述至少一个目标词汇中的每个目标词汇的识别率;
第三确定模块,用于根据所述每个目标词汇的识别率,确定所述每个目标词汇的唤醒率;
第二生成模块,用于根据所述至少一个目标词汇中的每个目标词汇以及所述每个目标词汇的唤醒率,生成所述唤醒率库。
可选地,所述第一确定模块,用于将所述每个待推荐唤醒词的使用率和所述每个待推荐唤醒词的唤醒率的乘积,确定为所述每个待推荐唤醒词的使用唤醒率。
第三方面,提供一种唤醒词推荐装置,包括:处理器和存储器,
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述存储器上所存储的计算机程序,实现如第一方面或第一方面的任一可选方式所述的唤醒词推荐方法。
第四方面,提供一种存储介质,当所述存储介质中的程序由处理器执行时,能够实现如第一方面或第一方面的任一可选方式所述的唤醒词推荐方法。
本申请提供的技术方案带来的有益效果是:
本申请提供的唤醒词推荐方法及装置、存储介质,智能终端获取至少两个待推荐唤醒词后,获取该至少两个待推荐唤醒词中的每个待推荐唤醒词的使用率和该每个待推荐唤醒词的唤醒率,根据每个待推荐唤醒词的使用率和该每个待推荐唤醒词的唤醒率,确定该每个待推荐唤醒词的使用唤醒率,根据该至少两个待推荐唤醒词的使用唤醒率,推荐该至少两个待推荐唤醒词,这样一来,用户可以根据智能终端推荐的该至少两个待推荐唤醒词自定义智能终端的唤醒词,由于智能终端根据至少两个待推荐唤醒词的使用唤醒率推荐该至少两个待推荐唤醒词,而使用唤醒率是根据使用率和唤醒率确定的,因此,该待推荐唤醒词能够满足唤醒率要求,有助于提高自定义的唤醒词对智能终端的唤醒率;并且,还能够保证自定义的唤醒词满足用户的使用习惯。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种唤醒词推荐方法的方法流程图;
图2是本申请实施例提供的另一种唤醒词推荐方法的方法流程图;
图3是本申请实施例提供的一种获取待推荐唤醒词的方法流程图;
图4是本申请实施例提供的一种建立目标语料库的方法流程图;
图5是本申请实施例提供的一种建立唤醒率库的方法流程图;
图6是本申请实施例提供的一种唤醒词推荐装置的框图;
图7是本申请实施例提供的一种第一获取模块的框图;
图8是本申请实施例提供的另一种唤醒词推荐装置的框图;
图9是本申请实施例提供的一种唤醒词推荐装置的结构示意图。
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
具体实施方式
为了使本申请的原理、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
语音功能在车载终端等智能终端的实际应用中越来越重要,用户使用语音功能的场景也越来越多,而使用语音功能的前提是要使用唤醒词唤醒智能终端。唤醒词可以是智能终端的系统预置的,也可以是用户自定义的,系统预置的唤醒词通常是经过持久训练的,其具有较高的唤醒率,而用户自定义的唤醒词通常没有经过训练和筛选,其唤醒率较低。本申请实施例提供的方案,通过向用户推荐唤醒词,使用户能够根据智能终端的推荐自定义的唤醒词,提高用户自定义的唤醒词对智能终端的唤醒率。
本申请实施例提供的唤醒词推荐方法可以由智能终端执行,该智能终端可以是智能家居设备、智能机器人、智能车机、车载终端、智能手机、平板电脑、智能电视、智能手表、动态影像专家压缩标准音频层面4(英文:Moving Picture Experts Group Audio LayerIV;简称:MP4)播放器、动态影像专家压缩标准音频层面5(英文:Moving Picture ExpertsGroup Audio Layer V;简称:MP5)播放器、膝上型便携计算机或台式计算机等等。
请参考图1,其示出了本申请实施例提供的一种唤醒词推荐方法的方法流程图,该唤醒词推荐方法可以应用于智能终端。参见图1,该方法可以包括:
步骤101、获取至少两个待推荐唤醒词。
步骤102、获取该至少两个待推荐唤醒词中的每个待推荐唤醒词的使用率和该每个待推荐唤醒词的唤醒率。
步骤103、根据每个待推荐唤醒词的使用率和该每个待推荐唤醒词的唤醒率,确定该每个待推荐唤醒词的使用唤醒率。
步骤104、根据该至少两个待推荐唤醒词的使用唤醒率,推荐该至少两个待推荐唤醒词。
综上所述,本申请实施例提供的唤醒词推荐方法,由于智能终端根据至少两个待推荐唤醒词的使用唤醒率推荐该至少两个待推荐唤醒词,用户可以根据智能终端推荐的该至少两个待推荐唤醒词自定义智能终端的唤醒词,而使用唤醒率是根据使用率和唤醒率确定的,因此,该待推荐唤醒词能够满足唤醒率要求,有助于提高自定义的唤醒词对智能终端的唤醒率;并且,还能够保证自定义的唤醒词满足用户的使用习惯。
请参考图2,其示出了本申请实施例提供的另一种唤醒词推荐方法的方法流程图,该唤醒词推荐方法可以应用于智能终端。参见图2,该方法可以包括:
步骤201、获取至少两个待推荐唤醒词。
在本申请实施例中,用户可以自定义智能终端的唤醒词,在用户自定义智能终端的唤醒词时,智能终端可以获取至少两个待推荐唤醒词,然后向用户推荐该待推荐唤醒词,使用户能够根据智能终端的推荐自定义智能终端的唤醒词。
可选地,请参考图3,其示出了本申请实施例提供的一种智能终端获取待推荐唤醒词的方法流程图,参见图3,该方法可以包括如下子步骤:
子步骤2011、接收用户输入的初始唤醒词。
用户在自定义智能终端的唤醒词时,可以向智能终端输入唤醒词,智能终端可以接收用户输入的唤醒词,并将该用户输入的唤醒词确定为初始唤醒词。
可选地,智能终端可以提供输入界面,该输入界面中可以包括输入控件,用户可以通过该输入控件向智能终端输入初始唤醒词。其中,该输入控件可以是输入框,用户可以在输入框中输入初始唤醒词;或者,该输入控件可以是唤醒词选项控件,每个唤醒词选项控件可以对应一个唤醒词,用户可以通过唤醒词选项控件触发唤醒词输入指令,该唤醒词输入指令可以携带相应的唤醒词选项控件对应的唤醒词,智能终端可以通过接收用户触发的唤醒词输入指令接收用户输入的初始唤醒词。
可选地,智能终端可以具有语音采集组件,用户可以通过智能终端的语音采集组件向智能终端输入初始唤醒词,智能终端可以通过语音采集组件采集用户语音,将用户语音中携带的词汇确定为初始唤醒词。其中,该语音采集组件例如可以是麦克风等。
需要说明的是,为了保证识别率以及唤醒率的要求,用户输入的初始唤醒词通常包括2~6个文字,且初始唤醒词的文字可以是中文、英文等任意类型的文字。例如,初始唤醒词包括3个中文文字,或者,初始唤醒词包括3个中文文字,或者,初始唤醒词包括2个中文文字和1个英文文字等等,示例地,该初始唤醒词可以是“你好小度”(4个中文文字),或者,该初始唤醒词可以是“hello xiao du”(3个英文文字),或者,该初始唤醒词可以是“hello小度”(1个英文文字和2个中文文字),本申请实施对此不做限定。
子步骤2012、根据该初始唤醒词获取至少一个衍生唤醒词。
智能终端接收用户输入的初始唤醒词后,可以根据该初始唤醒词获取至少一个衍生唤醒词。可选地,智能终端可以对初始唤醒词进行拆分重组得到至少一个衍生唤醒词;和/或,智能终端可以根据初始唤醒词,通过语义联想获取至少一个衍生唤醒词。
可选地,智能终端对初始唤醒词进行拆分重组得到至少一个衍生唤醒词可以包括:智能终端对初始唤醒词进行拆分得到至少两个词语,根据该至少两个词语的实体语言的组词方式对该至少两个词语进行重组得到至少一个衍生唤醒词。其中,该实体语言的组词方式例如中文组词方式、英文组词方式等等。示例地,以初始唤醒词为“你好小度”为例,智能终端对该初始唤醒词“你好小度”进行拆分可以得到两个词语“你好”和“小度”,根据该两个词语的实体语言的组词方式对该两个词语进行重组得到的衍生唤醒词可以是“小度你好”。容易理解,此处的描述仅仅示例性的,实际应用中,智能终端对该初始唤醒词“你好小度”进行拆分还可以得到“你”、“好”、“小”和“度”这四个字,对该四个字进行重组得到衍生唤醒词,本申请实施例对此不做限定。
可选地,智能终端根据初始唤醒词,通过语义联想获取至少一个衍生唤醒词可以包括:智能终端根据初始唤醒词从联想词库中获取至少一个衍生唤醒词,该联想词库中可以记录有词汇与联想词的关联关系,智能终端可以根据该初始唤醒词,查询联想词库得到与该初始唤醒词关联的至少一个联想词,将该至少一个联想词确定为至少一个衍生唤醒词,并获取该至少一个衍生唤醒词。示例地,假设初始唤醒词为“向日”,智能终端根据该初始唤醒词“向日”通过语义联想可以获取到联想词“向日葵”,则智能终端将该联想词“向日葵”确定为初始唤醒词“向日”的衍生唤醒词。
需要说明的是,在本申请实施例中,联想词库可以位于智能终端中,也可以位于服务器中。若联想词库位于智能终端中,智能终端可以根据该初始唤醒词查询本地存储的联想词库,来获取至少一个衍生唤醒词。若联想词库位于服务器中,智能终端可以生成携带该初始唤醒词的词汇获取请求,并向服务器发送该词汇获取请求,服务器接收到该词汇获取请求后,根据该词汇获取请求所携带的初始唤醒词查询本地存储的联想词库,得到该初始唤醒词对应的至少一个联想词,并向智能终端发送该至少一个联想词,智能终端接收到该至少一个联想词后,将该至少一个联想词确定为至少一个衍生唤醒词。
本领域技术人员容易理解,本申请实施例所描述的智能终端获取衍生唤醒词的方法仅仅是示例性的,实际应用中,智能终端获取衍生唤醒词的方式多种多样,本申请实施例在此不再赘述。
子步骤2013、将该初始唤醒词和该至少一个衍生唤醒词,确定为至少两个待推荐唤醒词。
智能终端获取到初始唤醒词和至少一个衍生唤醒词后,可以将该初始唤醒词和该至少一个衍生唤醒词确定为至少两个待推荐唤醒词。示例地,智能终端将初始唤醒词“你好小度”和衍生唤醒词“你好度小”、“小度你好”确定为待推荐唤醒词。
步骤202、获取该至少两个待推荐唤醒词中的每个待推荐唤醒词的使用率。
可选地,智能终端可以从目标语料库中获取该至少两个待推荐唤醒词中的每个待推荐唤醒词的使用率,该目标语料库记录有至少一个目标词汇以及每个目标词汇的使用率。可选地,对于每个待推荐唤醒词,智能终端可以从目标语料库中查找与该待推荐唤醒词相同的目标词汇,并从目标语料库中确定与该待推荐唤醒词相同的目标词汇的使用率,将与该待推荐唤醒词相同的目标词汇的使用率确定为该待推荐唤醒词的使用率。
示例地,在本申请实施例中,目标语料库可以如下表1所示:
表1
目标词汇 使用率
目标词汇Z1 Pn1
目标词汇Z2 Pn2
目标词汇Z3 Pn3
目标词汇Z4 Pn4
... ...
以待推荐唤醒词为“你好小度”为例,智能终端可以从表1所示的目标语料库中查找与该待推荐唤醒词“你好小度”相同的目标词汇,假设与该待推荐唤醒词“你好小度”相同的目标词汇为“目标词汇Z1”,智能终端从表1所示的目标语料库中确定该“目标词汇Z1”的使用率为Pn1,将智能终端将使用率Pn1确定为待推荐唤醒词“你好小度”的使用率。
容易理解,目标语料库可能存在与待推荐唤醒词相同的目标词汇,也可能不存在与待推荐唤醒词相同的目标词汇,若目标语料库存在与待推荐唤醒词相同的目标词汇,智能终端可以从目标语料库中获取到待推荐唤醒词的使用率,而若目标语料库不存在与待推荐唤醒词相同的目标词汇,智能终端无法从目标语料库中获取到待推荐唤醒词的使用率,本申请实施例中,若目标语料库不存在与待推荐唤醒词相同的目标词汇,智能终端可以丢弃该待推荐唤醒词。
步骤203、获取该至少两个待推荐唤醒词中的每个待推荐唤醒词的唤醒率。
可选地,智能终端可以从唤醒率库中获取该至少两个待推荐唤醒词中的每个待推荐唤醒词的唤醒率,该唤醒率库记录有至少一个目标词汇以及每个目标词汇的唤醒率。可选地,对于每个上待推荐唤醒词,智能终端可以从唤醒率库中查找与该待推荐唤醒词相同的目标词汇,并从唤醒率库中确定与该待推荐唤醒词相同的目标词汇的唤醒率,将与该待推荐唤醒词相同的目标词汇的唤醒率确定为该待推荐唤醒词的唤醒率。
示例地,在本申请实施例中,唤醒率库可以如下表2所示:
表2
目标词汇 唤醒率
目标词汇Z1 Pm1
目标词汇Z2 Pm2
目标词汇Z3 Pm3
目标词汇Z4 Pm4
... ...
仍以待推荐唤醒词为“你好小度”为例,智能终端可以从表2所示的唤醒率库中查找与该待推荐唤醒词“你好小度”相同的目标词汇,假设与该待推荐唤醒词“你好小度”相同的目标词汇为“目标词汇Z1”,智能终端从表2所示的唤醒率库中确定该“目标词汇Z1”的唤醒率为Pm1,将智能终端将唤醒率Pm1确定为待推荐唤醒词“你好小度”的唤醒率。
容易理解,唤醒率库可能存在与待推荐唤醒词相同的目标词汇,也可能不存在与待推荐唤醒词相同的目标词汇,若唤醒率库存在与待推荐唤醒词相同的目标词汇,智能终端可以从目标语料库中获取到待推荐唤醒词的唤醒率,而若唤醒率库不存在与待推荐唤醒词相同的目标词汇,智能终端无法从唤醒率库中获取到待推荐唤醒词的唤醒率,本申请实施例中,若唤醒率库不存在与待推荐唤醒词相同的目标词汇,智能终端可以丢弃该待推荐唤醒词。
步骤204、根据每个待推荐唤醒词的使用率和该每个待推荐唤醒词的唤醒率,确定该每个待推荐唤醒词的使用唤醒率。
可选地,对于每个待推荐唤醒词,智能终端可以将该每个待推荐唤醒词的使用率和该每个待推荐唤醒词的唤醒率的乘积,确定为该每个待推荐唤醒词的使用唤醒率。示例地,仍以待推荐唤醒词为“你好小度”为例,智能终端可以将待推荐唤醒词“你好小度”的使用率Pn1和唤醒率Pm1的乘积确定为待推荐唤醒词为“你好小度”的使用唤醒率。也即是,智能终端将Px1=Pn1×Pm1确定为待推荐唤醒词“你好小度”的使用唤醒率。
本领域技术人员容易理解,本申请实施例根据使用率和唤醒率确定使用唤醒率的方式仅仅是示例性的,实际应用中,根据使用率和唤醒率确定使用唤醒率的方式多种多样,例如,可以通过大数据分析确定出使用率、唤醒率以及使用唤醒率的函数关系,根据使用率、唤醒率以及使用唤醒率的函数关系确定使用唤醒率,本申请实施例在此不再赘述。此外,容易理解,本申请实施例中的使用唤醒率是综合使用率和唤醒率确定的,因此,在一些场景中,该使用唤醒率也称为综合概率等等,本申请实施例对此不做限定。
步骤205、根据该至少两个待推荐唤醒词的使用唤醒率,推荐该至少两个待推荐唤醒词。
智能终端确定至少两个待推荐唤醒词的使用唤醒率后,可以根据该至少两个待推荐唤醒词的使用唤醒率,推荐该至少两个待推荐唤醒词。可选地,智能终端可以根据使用唤醒率对该至少两个待推荐唤醒词进行排序得到唤醒词列表,然后向用户推荐该唤醒词列表,以向用户推荐该至少两个待推荐唤醒词。其中,智能终端可以根据使用唤醒率从大到小的顺序对该至少两个待推荐唤醒词进行排序,或者,可以根据使用唤醒率从小到大的顺序对该至少两个待推荐唤醒词进行排序,本申请实施例对此不做限定。
示例地,假设至少两个待推荐唤醒词包括“你好小度”、“你好度小”和“小度你好”,“你好小度”的使用唤醒率为Px1,“你好度小”的使用唤醒率为Px2,“小度你好”的使用唤醒率为Px3,且Px1>Px3>Px2,则智能终端根据使用唤醒率从大到小的顺序对“你好小度”、“你好度小”和“小度你好”得到的唤醒词列表可以如下表3所示,智能终端可以向用户推荐如下表3所示的唤醒词列表。
表3
需要说明的是,智能终端推荐至少两个待推荐唤醒词后,用户可以根据智能终端的推荐选择至少一个待推荐唤醒词作为该智能终端的唤醒词,容易理解,由于智能终端根据至少两个待推荐唤醒词的使用唤醒率推荐该至少两个待推荐唤醒词,而使用唤醒率是根据使用率和唤醒率确定的,因此,该待推荐唤醒词能够满足唤醒率要求,有助于提高用户自定义的唤醒词对智能终端的唤醒率,且能够满足用户的使用习惯。
本领域技术人员容易理解,步骤202中使用到的目标语料库和步骤203中使用到的唤醒率库均可以是智能终端预先建立的,也即是,在步骤202之前,本申请实施例提供的唤醒词推荐方法还可以包括智能终端建立目标语料库的过程,在步骤203之前,本申请实施例提供的唤醒词推荐方法还可以包括智能终端建立唤醒率库的过程。其中,智能终端建立目标语料库的过程可以参考下述图4实施例,智能终端建立唤醒率库的过程可以参考下述图5实施例。
请参考图4,其示出了本申请实施例提供的一种智能终端建立目标语料库的方法流程图,参见图4,该方法可以包括如下步骤:
步骤401、获取用户语料集,该用户语料集包括至少一个用户语料,每个用户语料包括至少一个目标词汇。
智能终端可以收集至少一个用户语料,将收集到的至少一个用户语料整合形成用户语料集,其中,每个用户语料包括至少一个目标词汇。可选地,智能终端可以具有语音采集组件,智能终端可以通过语音采集组件采集用户的日常用语,将用户的日常用语作为用户语料。
示例地,用户语料集可以为{我要去医院,我去上班,下班啦,我今天中午吃的面条},该用户语料集包括“我要去医院”、“我去上班”、“下班啦”和“我今天中午吃的面条”一共4个用户语料,对于用户语料“我要去医院”,“我”、“要”、“去”、“医院”、“我要”、“要去”、“我要去”、“去医院”以及“我要去医院”等均为目标词汇。
步骤402、对该用户语料集进行分析,确定该用户语料集中的每个目标词汇在该用户语料集中的使用率。
可选地,对于用户语料集中的每个用户语料,智能终端对该用户语料进行解析得到至少一个目标词汇,对于每个目标词汇,智能终端将该目标词汇在该用户语料集中出现的概率确定为该目标词汇在该用户语料集中使用率,例如,智能终端将该目标词汇在该用户语料集中出现的次数与用户语料集中的所有目标词汇的数量的比值,确定为该目标词汇在该用户语料集中使用率。
示例地,以用户语料“我要去医院”为例,智能终端对该用户语料进行解析可以得到“我”、“要”、“去”、“医院”、“我要”、“要去”、“我要去”、“去医院”以及“我要去医院”等目标词汇,对于目标词汇“我要去医院”,智能终端可以将该目标词汇“我要去医院”在用户语料集中出现的次数与用户语料集中的所有目标词汇的数量的比值,确定为该目标词汇“我要去医院”在该用户语料集中使用率。
步骤403、根据该用户语料集中的每个目标词汇以及该每个目标词汇的使用率,生成目标语料库。
可选地,对于用户语料集中的每个目标词汇,智能终端可以将该目标词汇与该目标词汇的使用率关联存储,得到目标语料库。其中,该目标语料库可以如表1所示。
请参考图5,其示出了本申请实施例提供的一种智能终端建立唤醒率库的方法流程图,参见图5,该方法可以包括如下步骤:
步骤501、获取用户习惯语料,该用户习惯语料为使用频率高于目标频率的用户语料。
在本申请实施例中,智能终端可以收集用户语料,将收集到的用户语料中,使用频率高于目标频率的用户语料确定为频率高于目标频率的用户语料。其中,目标频率可以由智能终端配置,其用于界定用户语料的使用频率的高低,对于一用户语料,若该用户语料的使用频率高于目标频率,则该用户语料的使用频率较高,可以认为该用户语料是用户习惯语料,若该用户语料的使用频率不高于目标频率,则该用户语料的使用频率较低,可以认为该用户语料不是用户习惯语料。可选地,智能终端可以将收集到的各个用户语料的使用频率与目标频率进行比较来判断用户语料的使用频率是否高于目标频率。
步骤502、对该用户习惯语料进行特征提取得到至少一个目标词汇。
在本申请实施例中,智能终端可以通过特征提取算法对用户习惯语料进行特征提取得到用户习惯语料的特征词汇,将提取到的特征词汇确定为目标词汇。
可选地,用户习惯语料可以是语音形式的语料,智能终端可以通过梅尔频率倒谱系数(英文:Mel-frequency cepstral coefficients;简称:MFCC)提取算法对该用户习惯语料进行特征提取。
步骤503、根据词汇识别模型,确定该至少一个目标词汇中的每个目标词汇的识别率。
可选地,智能终端中可以配置有词汇识别模型,该词汇识别模型的输入为词汇,输出为识别率,对于提取得到的每个目标词汇,智能终端可以将目标词汇输入至词汇识别模型,该词汇识别模型通过计算确定出该目标词汇的识别率。
需要说明的是,智能终端在根据词汇识别模型确定目标词汇的识别率之前,可以通过机器学习训练该汇识别模型,或者,该词汇识别模型也可以是预先训练好配置在智能终端中的,本申请实施例对此不做限定。
步骤504、根据每个目标词汇的识别率,确定该每个目标词汇的唤醒率。
本领域技术人员容易理解,唤醒词唤醒智能终端的前提是智能终端能够识别该唤醒词,通常情况下,如果智能终端能够准确识别唤醒词,则智能终端一定能唤醒,而如果智能终端无法准确识别唤醒词,智能终端也可以使用近似唤醒方式或命中唤醒方式唤醒,例如,智能终端的唤醒词为“向日葵”,如果识别出的唤醒词为“向日”,则智能终端可以根据近似唤醒方式或命中唤醒方式,通过“向日葵”唤醒智能终端。由此可见,对于某一词汇,唤醒率通常大于或等于识别率(也即是唤醒率≥识别率),因此在本申请实施例中,智能终端可以根据每个目标词汇的识别率,确定该每个目标词汇的唤醒率,可选地,对于每个目标词汇,智能终端可以将目标词汇的识别率确定为该目标词汇的唤醒率,或者,智能终端可以将该目标词汇的识别率与识别率误差之和确定为该目标词汇的唤醒率,该识别率误差可以由智能终端对历史识别过程分析得到,本申请实施对此不做限定。
步骤505、根据至少一个目标词汇中的每个目标词汇以及该每个目标词汇的唤醒率,生成唤醒率库。
可选地,对于提取到的每个目标词汇,智能终端可以将该目标词汇与该目标词汇的唤醒率关联存储,得到唤醒率库。其中,该唤醒率库可以如表2所示。
本申请实施例中,智能终端根据用户输入的初始唤醒词获取至少一个衍生唤醒词,将初始唤醒词和衍生唤醒词均确定为待推荐唤醒词,根据待推荐唤醒词的使用率和唤醒率确定该待推荐唤醒词的使用唤醒率,并根据使用唤醒率向用户推荐该待推荐唤醒词,使用户能够根据智能终端的推荐自定义的唤醒词,由于唤醒率是基于用户习惯语料训练得到的,使用率是基于用户语料训练得到的,因此综合的使用唤醒率都是基于用户习惯得到的,这样一来,最终推荐的待推荐唤醒词也是用户所能接受的,既能满足用户习惯又能满足唤醒率要求。
需要说明的是,本申请实施例提供的唤醒词推荐方法步骤的先后顺序可以进行适当调整,步骤也可以根据情况进行相应增减,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化的方法,都应涵盖在本申请的保护范围之内,因此不再赘述。
综上所述,本申请实施例提供的唤醒词推荐方法,由于智能终端根据至少两个待推荐唤醒词的使用唤醒率推荐该至少两个待推荐唤醒词,用户可以根据智能终端推荐的该至少两个待推荐唤醒词自定义智能终端的唤醒词,而使用唤醒率是根据使用率和唤醒率确定的,因此,该待推荐唤醒词能够满足唤醒率要求,有助于提高自定义的唤醒词对智能终端的唤醒率;并且,还能够保证自定义的唤醒词满足用户的使用习惯。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
请参考图6,其示出了本申请实施例提供的一种唤醒词推荐装置600的框图,该唤醒词推荐装置600可以为智能终端中的程序组件。参见图6,该唤醒词推荐装置600可以包括但不限于:
第一获取模块601,用于获取至少两个待推荐唤醒词;
第二获取模块602,用于获取该至少两个待推荐唤醒词中的每个待推荐唤醒词的使用率和该每个待推荐唤醒词的唤醒率;
第一确定模块603,用于根据每个待推荐唤醒词的使用率和该每个待推荐唤醒词的唤醒率,确定该每个待推荐唤醒词的使用唤醒率;
推荐模块604,用于根据该至少两个待推荐唤醒词的使用唤醒率,推荐该至少两个待推荐唤醒词。
综上所述,本申请实施例提供的唤醒词推荐装置,由于智能终端根据至少两个待推荐唤醒词的使用唤醒率推荐该至少两个待推荐唤醒词,用户可以根据智能终端推荐的该至少两个待推荐唤醒词自定义智能终端的唤醒词,而使用唤醒率是根据使用率和唤醒率确定的,因此,该待推荐唤醒词能够满足唤醒率要求,有助于提高自定义的唤醒词对智能终端的唤醒率;并且,还能够保证自定义的唤醒词满足用户的使用习惯。
可选地,请参考图7,其示出了本申请实施例提供的一种第一获取模块601的框图,参见图7,该第一获取模块601包括:
接收单元6011,用于接收用户输入的初始唤醒词;
获取单元6012,用于根据该初始唤醒词获取至少一个衍生唤醒词;
确定单元6013,用于将该初始唤醒词和该至少一个衍生唤醒词,确定为至少两个待推荐唤醒词。
可选地,该获取单元6012,用于:
对初始唤醒词进行拆分重组得到至少一个衍生唤醒词;和/或,
根据初始唤醒词,通过语义联想,获取至少一个衍生唤醒词。
可选地,第二获取模块602,用于:
从目标语料库中获取至少两个待推荐唤醒词中的每个待推荐唤醒词的使用率,该目标语料库记录有至少一个目标词汇以及每个目标词汇的使用率;
从唤醒率库中获取至少两个待推荐唤醒词中的每个待推荐唤醒词的唤醒率,该唤醒率库记录有至少一个目标词汇以及每个目标词汇的唤醒率。
可选地,请参考图8,其示出了本申请实施例提供的另一种唤醒词推荐装置600的框图,参见图8,在图6的基础上,该唤醒词推荐装置600还包括:
第三获取模块605,用于获取用户语料集,该用户语料集包括至少一个用户语料,该用户语料包括至少一个目标词汇;
分析模块606,用于对该用户语料集进行分析,确定该用户语料集中的每个目标词汇在该用户语料集中的使用率;
第一生成模块607,用于根据该用户语料集中的每个目标词汇以及该每个目标词汇的使用率,生成目标语料库。
可选地,请继续参考图8,该唤醒词推荐装置600还包括:
第四获取模块608,用于获取用户习惯语料,该用户习惯语料为使用频率高于目标频率的用户语料;
提取模块609,用于对该用户习惯语料进行特征提取得到至少一个目标词汇;
第二确定模块610,用于根据词汇识别模型,确定该至少一个目标词汇中的每个目标词汇的识别率;
第三确定模块611,用于根据每个目标词汇的识别率,确定该每个目标词汇的唤醒率;
第二生成模块612,用于根据至少一个目标词汇中的每个目标词汇以及该每个目标词汇的唤醒率,生成唤醒率库。
可选地,第一确定模块603,用于将每个待推荐唤醒词的使用率和该每个待推荐唤醒词的唤醒率的乘积,确定为该每个待推荐唤醒词的使用唤醒率。
综上所述,本申请实施例提供的唤醒词推荐装置,由于智能终端根据至少两个待推荐唤醒词的使用唤醒率推荐该至少两个待推荐唤醒词,用户可以根据智能终端推荐的该至少两个待推荐唤醒词自定义智能终端的唤醒词,而使用唤醒率是根据使用率和唤醒率确定的,因此,该待推荐唤醒词能够满足唤醒率要求,有助于提高自定义的唤醒词对智能终端的唤醒率;并且,还能够保证自定义的唤醒词满足用户的使用习惯。
本申请实施例提供了一种唤醒词推荐装置,包括:处理器和存储器,
该存储器,用于存储计算机程序。
该处理器,用于执行该存储器上所存储的计算机程序,实现上述实施例提供的唤醒词推荐方法。
请参考图9,其示出了本申请实施例提供的一种唤醒词推荐装置900的结构示意图。该装置900可以是智能家居设备、智能机器人、智能车机、车载终端、智能手机、平板电脑、智能电视、智能手表、MP4播放器、MP5播放器、膝上型便携计算机或台式计算机等等。装置900还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,装置900包括有:处理器901和存储器902。
处理器901可以包括一个或多个处理核心,比如4核心处理器、9核心处理器等。处理器901可以采用数字信号处理(英文:Digital Signal Processing;简称:DSP)、现场可编程门阵列(英文:Field-Programmable Gate Array;简称:FPGA)、可编程逻辑阵列(英文:Programmable Logic Array;简称:PLA)中的至少一种硬件形式来实现。处理器901也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称中央处理器(英文:Central Processing Unit;简称:CPU);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器901可以在集成有图像处理器(英文:Graphics Processing Unit;简称:GPU),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器901还可以包括人工智能(英文:ArtificialIntelligence;简称:AI)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器902可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器902还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器902中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器901所执行以实现本申请实施例提供的唤醒词推荐方法。
在一些实施例中,装置900还可选包括有:外围设备接口903和至少一个外围设备。处理器901、存储器902和外围设备接口903之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口903相连。示例地,外围设备包括:射频电路904、显示屏905、摄像头组件906、音频电路907、定位组件908或电源909中的至少一种。
外围设备接口903可被用于将输入/输出(英文:Input/Output;简称:I/O)相关的至少一个外围设备连接到处理器901和存储器902。在一些实施例中,处理器901、存储器902和外围设备接口903被集成在同一芯片或电路板上;在一些其他实施例中,处理器901、存储器902和外围设备接口903中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路904用于接收和发射射频(英文:Radio Frequency;简称:RF)信号,也称电磁信号。射频电路904通过电磁信号与通信网络以及其他通信设备进行通信。射频电路904将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路904包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路904可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或无线保真(英文:Wireless Fidelity;简称:WiFi)网络。在一些实施例中,射频电路904还可以包括近距离无线通信(英文:Near FieldCommunication;简称:NFC)有关的电路,本申请对此不加以限定。
显示屏905用于显示用户界面(英文:User Interface;简称:UI)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏905是触摸显示屏时,显示屏905还具有采集在显示屏905的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器901进行处理。此时,显示屏905还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏905可以为一个,设置装置900的前面板;在另一些实施例中,显示屏905可以为至少两个,分别设置在装置900的不同表面或呈折叠设计;在再一些实施例中,显示屏905可以是柔性显示屏,设置在装置900的弯曲表面上或折叠面上。甚至,显示屏905还可以设置成非矩形的不规则图形,也即异形屏。显示屏905可以为有机发光二极管(英文:Organic Light-Emitting Diode;简称:OLED)显示屏。
摄像头组件906用于采集图像或视频。可选地,摄像头组件906包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及虚拟现实(英文:Virtual Reality;简称:VR)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件906还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路907可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器901进行处理,或者输入至射频电路904以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在装置900的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器901或射频电路904的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路907还可以包括耳机插孔。
定位组件908用于定位装置900的当前地理位置,以实现导航或基于位置的服务(英文:Location Based Service;简称:LBS)。定位组件908可以是基于美国的全球定位系统(英文:Global Positioning System;简称:GPS)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。
电源909用于为装置900中的各个组件进行供电。电源909可以是交流电、直流电、一次性电池或可充电电池。当电源909包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,装置900还包括有一个或多个传感器910。该一个或多个传感器910包括但不限于:加速度传感器911、陀螺仪传感器912、压力传感器913、指纹传感器914、光学传感器915以及接近传感器916。
加速度传感器911可以检测以装置900建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器911可以用于检测重力加速度在三个坐标轴上的分量。处理器901可以根据加速度传感器911采集的重力加速度信号,控制触摸显示屏905以横向视图或纵向视图进行用户界面的显示。加速度传感器911还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器912可以检测装置900的机体方向及转动角度,陀螺仪传感器912可以与加速度传感器911协同采集用户对装置900的3D动作。处理器901根据陀螺仪传感器912采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器913可以设置在装置900的侧边框和/或触摸显示屏905的下层。当压力传感器913设置在装置900的侧边框时,可以检测用户对装置900的握持信号,由处理器901根据压力传感器913采集的握持信号进行左右手识别或快捷操作。当压力传感器913设置在触摸显示屏905的下层时,由处理器901根据用户对触摸显示屏905的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器914用于采集用户的指纹,由处理器901根据指纹传感器914采集到的指纹识别用户的身份,或者,由指纹传感器914根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器901授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器914可以被设置装置900的正面、背面或侧面。当装置900上设置有物理按键或厂商Logo时,指纹传感器914可以与物理按键或厂商Logo集成在一起。
光学传感器915用于采集环境光强度。在一个实施例中,处理器901可以根据光学传感器915采集的环境光强度,控制触摸显示屏905的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏905的显示亮度;当环境光强度较低时,调低触摸显示屏905的显示亮度。在另一个实施例中,处理器901还可以根据光学传感器915采集的环境光强度,动态调整摄像头组件906的拍摄参数。
接近传感器916,也称距离传感器,通常设置在装置900的前面板。接近传感器916用于采集用户与装置900的正面之间的距离。在一个实施例中,当接近传感器916检测到用户与装置900的正面之间的距离逐渐变小时,由处理器901控制触摸显示屏905从亮屏状态切换为息屏状态;当接近传感器916检测到用户与装置900的正面之间的距离逐渐变大时,由处理器901控制触摸显示屏905从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图9中示出的结构并不构成对装置900的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
本申请实施例提供了一种存储介质,当该存储介质中的程序由处理器执行时,能够实现上述实施例提供的唤醒词推荐方法。该存储介质可以是非暂态的。例如,该存储介质可以是只读存储器(英文:Read-Only Memory;简称:ROM)、随机存取存储器(英文:RandomAccess Memory;简称:RAM)、紧凑型光盘只读储存器(英文:Compact Disc Read-OnlyMemory;简称:CD-ROM)、磁带、软盘和光数据存储设备等。
本申请中术语“A或B的至少一种”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A或B的至少一种,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。同理,“A、B或C的至少一种”表示可以存在七种关系,可以表示:单独存在A,单独存在B,单独存在C,同时存在A和B,同时存在A和C,同时存在C和B,同时存在A、B和C这七种情况。同理,“A、B、C或D的至少一种”表示可以存在十五种关系,可以表示:单独存在A,单独存在B,单独存在C,单独存在D,同时存在A和B,同时存在A和C,同时存在A和D,同时存在C和B,同时存在D和B,同时存在C和D,同时存在A、B和C,同时存在A、B和D,同时存在A、C和D,同时存在B、C和D,同时存在A、B、C和D,这十五种情况。
本申请中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
本申请中术语“第一”和“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。术语“多个”指两个或两个以上,除非另有明确的限定。
本申请中术语“至少一种”表示一种或多种,多种表示两种或两种以上。同理,“至少一个”表示一个或多个,多个表示两个或两个以上。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的示例性实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (16)

1.一种唤醒词推荐方法,其特征在于,所述方法包括:
获取至少两个待推荐唤醒词;
获取所述至少两个待推荐唤醒词中的每个待推荐唤醒词的使用率和所述每个待推荐唤醒词的唤醒率;
根据所述每个待推荐唤醒词的使用率和所述每个待推荐唤醒词的唤醒率,确定所述每个待推荐唤醒词的使用唤醒率;
根据所述至少两个待推荐唤醒词的使用唤醒率,推荐所述至少两个待推荐唤醒词,所述至少两个待推荐唤醒词用于用户选择所述至少两个待推荐唤醒词中的至少一个待推荐唤醒词作为用于唤醒智能终端的唤醒词。
2.根据权利要求1所述的方法,其特征在于,所述获取至少两个待推荐唤醒词,包括:
接收用户输入的初始唤醒词;
根据所述初始唤醒词获取至少一个衍生唤醒词;
将所述初始唤醒词和所述至少一个衍生唤醒词,确定为所述至少两个待推荐唤醒词。
3.根据权利要求2所述的方法,其特征在于,所述根据所述初始唤醒词获取至少一个衍生唤醒词,包括:
对所述初始唤醒词进行拆分重组得到至少一个衍生唤醒词;和/或,
根据所述初始唤醒词,通过语义联想获取至少一个衍生唤醒词。
4.根据权利要求1所述的方法,其特征在于,所述获取所述至少两个待推荐唤醒词中的每个待推荐唤醒词的使用率和所述每个待推荐唤醒词的唤醒率,包括:
从目标语料库中获取所述至少两个待推荐唤醒词中的每个待推荐唤醒词的使用率,所述目标语料库记录有至少一个目标词汇以及每个所述目标词汇的使用率;
从唤醒率库中获取所述至少两个待推荐唤醒词中的每个待推荐唤醒词的唤醒率,所述唤醒率库记录有至少一个目标词汇以及每个所述目标词汇的唤醒率。
5.根据权利要求4所述的方法,其特征在于,在从目标语料库中获取所述至少两个待推荐唤醒词中的每个待推荐唤醒词的使用率之前,所述方法还包括:
获取用户语料集,所述用户语料集包括至少一个用户语料,所述用户语料包括至少一个目标词汇;
对所述用户语料集进行分析,确定所述用户语料集中的每个目标词汇在所述用户语料集中的使用率;
根据所述用户语料集中的每个目标词汇以及所述每个目标词汇的使用率,生成所述目标语料库。
6.根据权利要求4所述的方法,其特征在于,在从唤醒率库中获取所述至少两个待推荐唤醒词中的每个待推荐唤醒词的唤醒率之前,所述方法还包括:
获取用户习惯语料,所述用户习惯语料为使用频率高于目标频率的用户语料;
对所述用户习惯语料进行特征提取得到至少一个目标词汇;
根据词汇识别模型,确定所述至少一个目标词汇中的每个目标词汇的识别率;
根据所述每个目标词汇的识别率,确定所述每个目标词汇的唤醒率;
根据所述至少一个目标词汇中的每个目标词汇以及所述每个目标词汇的唤醒率,生成所述唤醒率库。
7.根据权利要求1至6任一所述的方法,其特征在于,所述根据所述每个待推荐唤醒词的使用率和所述每个待推荐唤醒词的唤醒率,确定所述每个待推荐唤醒词的使用唤醒率,包括:
将所述每个待推荐唤醒词的使用率和所述每个待推荐唤醒词的唤醒率的乘积,确定为所述每个待推荐唤醒词的使用唤醒率。
8.一种唤醒词推荐装置,其特征在于,所述装置包括:
第一获取模块,用于获取至少两个待推荐唤醒词;
第二获取模块,用于获取所述至少两个待推荐唤醒词中的每个待推荐唤醒词的使用率和所述每个待推荐唤醒词的唤醒率;
第一确定模块,用于根据所述每个待推荐唤醒词的使用率和所述每个待推荐唤醒词的唤醒率,确定所述每个待推荐唤醒词的使用唤醒率;
推荐模块,用于根据所述至少两个待推荐唤醒词的使用唤醒率,推荐所述至少两个待推荐唤醒词,所述至少两个待推荐唤醒词用于用户选择所述至少两个待推荐唤醒词中的至少一个待推荐唤醒词作为用于唤醒智能终端的唤醒词。
9.根据权利要求8所述的装置,其特征在于,所述第一获取模块,包括:
接收单元,用于接收用户输入的初始唤醒词;
获取单元,用于根据所述初始唤醒词获取至少一个衍生唤醒词;
确定单元,用于将所述初始唤醒词和所述至少一个衍生唤醒词,确定为所述至少两个待推荐唤醒词。
10.根据权利要求9所述的装置,其特征在于,所述获取单元,用于:
对所述初始唤醒词进行拆分重组得到至少一个衍生唤醒词;和/或,
根据所述初始唤醒词,通过语义联想获取至少一个衍生唤醒词。
11.根据权利要求8所述的装置,其特征在于,所述第二获取模块,用于:
从目标语料库中获取所述至少两个待推荐唤醒词中的每个待推荐唤醒词的使用率,所述目标语料库记录有至少一个目标词汇以及每个所述目标词汇的使用率;
从唤醒率库中获取所述至少两个待推荐唤醒词中的每个待推荐唤醒词的唤醒率,所述唤醒率库记录有至少一个目标词汇以及每个所述目标词汇的唤醒率。
12.根据权利要求11所述的装置,其特征在于,所述装置还包括:
第三获取模块,用于获取用户语料集,所述用户语料集包括至少一个用户语料,所述用户语料包括至少一个目标词汇;
分析模块,用于对所述用户语料集进行分析,确定所述用户语料集中的每个目标词汇在所述用户语料集中的使用率;
第一生成模块,用于根据所述用户语料集中的每个目标词汇以及所述每个目标词汇的使用率,生成所述目标语料库。
13.根据权利要求11所述的装置,其特征在于,所述装置还包括:
第四获取模块,用于获取用户习惯语料,所述用户习惯语料为使用频率高于目标频率的用户语料;
提取模块,用于对所述用户习惯语料进行特征提取得到至少一个目标词汇;
第二确定模块,用于根据词汇识别模型,确定所述至少一个目标词汇中的每个目标词汇的识别率;
第三确定模块,用于根据所述每个目标词汇的识别率,确定所述每个目标词汇的唤醒率;
第二生成模块,用于根据所述至少一个目标词汇中的每个目标词汇以及所述每个目标词汇的唤醒率,生成所述唤醒率库。
14.根据权利要求8至13任一所述的装置,其特征在于,
所述第一确定模块,用于将所述每个待推荐唤醒词的使用率和所述每个待推荐唤醒词的唤醒率的乘积,确定为所述每个待推荐唤醒词的使用唤醒率。
15.一种唤醒词推荐装置,其特征在于,包括:处理器和存储器,
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述存储器上所存储的计算机程序,实现如权利要求1至7任一所述的唤醒词推荐方法。
16.一种存储介质,其特征在于,当所述存储介质中的程序由处理器执行时,能够实现如权利要求1至7任一所述的唤醒词推荐方法。
CN201911159681.5A 2019-11-22 2019-11-22 唤醒词推荐方法及装置、存储介质 Active CN110989963B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911159681.5A CN110989963B (zh) 2019-11-22 2019-11-22 唤醒词推荐方法及装置、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911159681.5A CN110989963B (zh) 2019-11-22 2019-11-22 唤醒词推荐方法及装置、存储介质

Publications (2)

Publication Number Publication Date
CN110989963A CN110989963A (zh) 2020-04-10
CN110989963B true CN110989963B (zh) 2023-08-01

Family

ID=70086134

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911159681.5A Active CN110989963B (zh) 2019-11-22 2019-11-22 唤醒词推荐方法及装置、存储介质

Country Status (1)

Country Link
CN (1) CN110989963B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115309876A (zh) * 2022-07-26 2022-11-08 珠海格力电器股份有限公司 唤醒词推荐度的计算方法、装置、电子设备及存储介质

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102999161B (zh) * 2012-11-13 2016-03-02 科大讯飞股份有限公司 一种语音唤醒模块的实现方法及应用
CN103095911B (zh) * 2012-12-18 2014-12-17 苏州思必驰信息科技有限公司 一种通过语音唤醒寻找手机的方法及系统
US20160055847A1 (en) * 2014-08-19 2016-02-25 Nuance Communications, Inc. System and method for speech validation
CN105096939B (zh) * 2015-07-08 2017-07-25 百度在线网络技术(北京)有限公司 语音唤醒方法和装置
CN106815507A (zh) * 2015-11-30 2017-06-09 中兴通讯股份有限公司 语音唤醒实现方法、装置及终端
CN106910498A (zh) * 2017-03-01 2017-06-30 成都启英泰伦科技有限公司 提高语音控制命令词识别率的方法
KR102411766B1 (ko) * 2017-08-25 2022-06-22 삼성전자주식회사 음성 인식 서비스를 활성화하는 방법 및 이를 구현한 전자 장치
CN108536668B (zh) * 2018-02-26 2022-06-07 科大讯飞股份有限公司 唤醒词评估方法及装置、存储介质、电子设备
CN108564951B (zh) * 2018-03-02 2021-05-25 云知声智能科技股份有限公司 智能降低语音控制设备误唤醒概率的方法
CN108492827B (zh) * 2018-04-02 2019-07-30 百度在线网络技术(北京)有限公司 应用程序的唤醒处理方法、装置及存储介质
CN108735210A (zh) * 2018-05-08 2018-11-02 宇龙计算机通信科技(深圳)有限公司 一种语音控制方法及终端
CN108899028A (zh) * 2018-06-08 2018-11-27 广州视源电子科技股份有限公司 语音唤醒方法、搜索方法、装置和终端
CN110444210B (zh) * 2018-10-25 2022-02-08 腾讯科技(深圳)有限公司 一种语音识别的方法、唤醒词检测的方法及装置
CN109243462A (zh) * 2018-11-20 2019-01-18 广东小天才科技有限公司 一种语音唤醒方法及装置
CN109493849A (zh) * 2018-12-29 2019-03-19 联想(北京)有限公司 语音唤醒方法、装置及电子设备
CN110148405B (zh) * 2019-04-10 2021-07-13 北京梧桐车联科技有限责任公司 语音指令处理方法及装置、电子设备及存储介质
CN109887507B (zh) * 2019-04-22 2021-03-12 成都启英泰伦科技有限公司 一种降低相似语音命令词误识别率的方法
CN110211576B (zh) * 2019-04-28 2021-07-30 北京蓦然认知科技有限公司 一种语音识别的方法、装置和系统
CN110211605A (zh) * 2019-05-24 2019-09-06 珠海多士科技有限公司 智能设备语音灵敏度调节方法、装置、设备和存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115309876A (zh) * 2022-07-26 2022-11-08 珠海格力电器股份有限公司 唤醒词推荐度的计算方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN110989963A (zh) 2020-04-10

Similar Documents

Publication Publication Date Title
CN111524501B (zh) 语音播放方法、装置、计算机设备及计算机可读存储介质
CN111127509B (zh) 目标跟踪方法、装置和计算机可读存储介质
CN111027490B (zh) 人脸属性识别方法及装置、存储介质
CN111276122B (zh) 音频生成方法及装置、存储介质
CN111681655A (zh) 语音控制方法、装置、电子设备及存储介质
CN111613213B (zh) 音频分类的方法、装置、设备以及存储介质
CN111428079B (zh) 文本内容处理方法、装置、计算机设备及存储介质
CN110837557B (zh) 摘要生成方法、装置、设备及介质
CN111341317B (zh) 唤醒音频数据的评价方法、装置、电子设备及介质
CN112100528B (zh) 对搜索结果评分模型进行训练的方法、装置、设备、介质
CN108831423B (zh) 提取音频数据中主旋律音轨的方法、装置、终端及存储介质
CN111681654A (zh) 语音控制方法、装置、电子设备及存储介质
CN113744736B (zh) 命令词识别方法、装置、电子设备及存储介质
CN113782025B (zh) 语音识别方法、装置、终端及存储介质
CN113362836B (zh) 训练声码器方法、终端及存储介质
CN111028846B (zh) 免唤醒词注册的方法和装置
CN110989963B (zh) 唤醒词推荐方法及装置、存储介质
CN115035187A (zh) 声源方向确定方法、装置、终端、存储介质及产品
CN113162837B (zh) 语音消息的处理方法、装置、设备及存储介质
CN111145723B (zh) 转换音频的方法、装置、设备以及存储介质
CN115221888A (zh) 实体提及的识别方法、装置、设备及存储介质
CN112487162A (zh) 确定文本语义信息的方法、装置、设备以及存储介质
CN111898488A (zh) 视频图像的识别方法、装置、终端及存储介质
CN113160802B (zh) 语音处理方法、装置、设备及存储介质
CN111524533B (zh) 语音操作方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant