CN108509225B - 一种信息处理方法及电子设备 - Google Patents

一种信息处理方法及电子设备 Download PDF

Info

Publication number
CN108509225B
CN108509225B CN201810262323.6A CN201810262323A CN108509225B CN 108509225 B CN108509225 B CN 108509225B CN 201810262323 A CN201810262323 A CN 201810262323A CN 108509225 B CN108509225 B CN 108509225B
Authority
CN
China
Prior art keywords
voice information
information
electronic equipment
word
awakening
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810262323.6A
Other languages
English (en)
Other versions
CN108509225A (zh
Inventor
王旭阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201810262323.6A priority Critical patent/CN108509225B/zh
Publication of CN108509225A publication Critical patent/CN108509225A/zh
Priority to US16/367,235 priority patent/US11194378B2/en
Application granted granted Critical
Publication of CN108509225B publication Critical patent/CN108509225B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • G06F1/3231Monitoring the presence, absence or movement of users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping
    • G06F9/4418Suspend and resume; Hibernate and awake
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/3287Power saving characterised by the action undertaken by switching off individual functional units in the computer system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/22Interactive procedures; Man-machine interfaces
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本申请公开了一种信息处理方法和电子设备,所述方法包括:采集用户在唤醒电子设备前,对电子设备输入的语音信息,存储语音信息,基于存储的语音信息生成备选唤醒词,备选唤醒词用于将电子设备由休眠状态切换至唤醒状态。本申请能够实现对唤醒词进行自动扩展,通过扩展后的唤醒词,用户能够更加快捷的唤醒电子设备,提升了用户体验。

Description

一种信息处理方法及电子设备
技术领域
本申请涉及电子技术领域,尤其涉及一种信息处理方法及电子设备。
背景技术
随着电子技术的不断发展,电子设备具有越来越多的功能。其中,大多数的电子设备都具备语音交互功能。
目前,电子设备的语音交互功能,普遍采用语音唤醒词将电子设备从低功耗模式唤醒,以完成与用户复杂的语音交互任务。其中,唤醒词可以是电子设备预先设定的唤醒词,也可以是用户自定义设置的唤醒词。无论是电子设备预先设定的唤醒词还是用户自定义设置的唤醒词,都需要用户记忆该唤醒词,并且能够精确的说出该唤醒词,否则无法唤醒电子设备进行语音交互。
但是,在实际应用过程中,用户很可能对唤醒词的记忆并不完全准确,反复尝试说出若干个与设定唤醒词在语音或语义层面相似的词后,并不能唤醒设备,从而影响用户体验。
发明内容
有鉴于此,本申请提供一种信息处理方法,能够实现对唤醒词进行自动扩展,通过扩展后的唤醒词,用户能够更加快捷的唤醒电子设备,提升了用户体验。
本申请提供了一种信息处理方法,应用于电子设备,所述方法包括:
采集用户在唤醒所述电子设备前,对所述电子设备输入的语音信息;
存储所述语音信息;
基于所述存储的语音信息生成备选唤醒词,所述备选唤醒词用于将所述电子设备由休眠状态切换至唤醒状态。
优选地,所述采集用户在唤醒所述电子设备前,对所述电子设备输入的语音信息后,还包括:
判断所述语音信息表征的语义信息是否满足预设条件,所述预设条件为所述电子设备由休眠状态切换至唤醒状态;
当所述语音信息表征的语义信息不满足预设条件时,存储所述语音信息。
优选地,所述基于所述存储的语音信息生成备选唤醒词包括:
在所述电子设备唤醒状态下的空闲时段,基于所述存储的语音信息生成备选唤醒词。
优选地,所述基于所述存储的语音信息生成备选唤醒词包括:
将所述语音信息切分为至少一个待处理信息;
计算每个所述待处理信息与目标唤醒词的相似度;
判断所述待处理信息与所述目标唤醒词的相似度是否大于预设阈值;
当所述待处理信息与所述目标唤醒词的相似度大于预设阈值时,将所述待处理信息确定为所述备选唤醒词。
优选地,所述当所述待处理信息与所述目标唤醒词的相似度大于预设阈值时,还包括:
判断所述待处理信息的字数是否满足预设字数范围;
当所述待处理信息的字数满足预设字数范围时,将所述待处理信息确定为所述备选唤醒词。
优选地,所述采集用户在唤醒所述电子设备前,对所述电子设备输入的语音信息后,还包括:
对所述语音信息进行声纹识别;
基于声纹识别特征对所述语音信息进行分类,将具有相同声纹识别特征的语音信息归为一类;
相应的,基于所述存储的语音信息生成备选唤醒词包括:
分别基于每一类中的所述语音信息生成备选唤醒词。
一种电子设备,包括:
存储器,用于存储应用程序与应用程序运行所产生的数据;
音频采集装置,用于采集用户在唤醒所述电子设备前,对所述电子设备输入的语音信息;
所述存储器,还用于存储所述语音信息;
处理器,用于运行所述应用程序以基于所述存储的语音信息生成备选唤醒词,所述备选唤醒词用于将所述电子设备由休眠状态切换至唤醒状态。
优选地,所述在所述音频采集装置采集用户在唤醒所述电子设备前,对所述电子设备输入的语音信息后,所述处理器,还用于:
判断所述语音信息表征的语义信息是否满足预设条件,所述预设条件为所述电子设备由休眠状态切换至唤醒状态;
当所述语音信息表征的语义信息不满足预设条件时,所述存储器存储所述语音信息。
优选地,所述处理器在基于所述存储的语音信息生成备选唤醒词时,具体用于:
在所述电子设备唤醒状态下的空闲时段,基于所述存储的语音信息生成备选唤醒词。
优选地,在所述音频采集装置采集用户在唤醒所述电子设备前,对所述电子设备输入的语音信息后,所述处理器,还用于:
对所述语音信息进行声纹识别;
基于声纹识别特征对所述语音信息进行分类,将具有相同声纹识别特征的语音信息归为一类;
分别基于每一类中的所述语音信息生成备选唤醒词。
从上述技术方案可以看出,本申请公开的一种信息处理方法,当需要对电子设备的唤醒词进行自动扩展时,采集用户在唤醒电子设备前对电子设备输入的语音信息,并将采集到的语音信息进行存储,然后根据存储的语音信息生成用于将电子设备由休眠状态切换至唤醒状态的唤醒词。本申请能够实现对唤醒词进行自动扩展,通过扩展后的唤醒词,用户能够更加快捷的唤醒电子设备,提升了用户体验。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请公开的一种信息处理方法实施例1的方法流程图;
图2为本申请公开的一种信息处理方法实施例2的方法流程图;
图3为本申请公开的一种信息处理方法实施例3的方法流程图;
图4为本申请公开的一种电子设备实施例1的结构示意图;
图5为本申请公开的一种电子设备实施例2的结构示意图;
图6为本申请公开的一种电子设备实施例3的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
如图1所示,为本申请公开的一种信息处理方法实施例1的方法流程图,所述方法应用于电子设备,所述方法可以包含以下步骤:
S101、采集用户在唤醒电子设备前,对电子设备输入的语音信息;
当需要对电子设备的唤醒词进行自动扩展时,在电子设备被唤醒前,采集用户对电子设备输入的语音信息。例如,在电子设备被唤醒前,用户A对电子设备输入“今天天气怎么样”的语音信息,则将用户输出的“今天天气怎么样”的语音信息进行采集。在采集用户对电子设备输入的语音信息时,可以通过电子设备中的麦克风进行采集。另外,在采集电子设备被唤醒前用户对电子设备输入的语音信息时,可以设置一定的采集频率。例如,每间隔10分钟采集一次。
S102、存储语音信息;
由于电子设备在唤醒前的处理能力较弱,因此将采集到的用户在唤醒电子设备前对电子设备输入的语音信息进行存储。
S103、基于存储的语音信息生成备选唤醒词,备选唤醒词用于将电子设备由休眠状态切换至唤醒状态。
当电子设备具有较强的处理能力时,例如,当电子设备被唤醒后,对存储的语音信息进行处理,生成能够用于将电子设备由休眠状态切换至唤醒状态的唤醒词。例如,将“今天天气”作为电子设备的备选唤醒词。
综上所述,在上述实施例中,当需要对电子设备的唤醒词进行自动扩展时,采集用户在唤醒电子设备前对电子设备输入的语音信息,并将采集到的语音信息进行存储,然后根据存储的语音信息生成用于将电子设备由休眠状态切换至唤醒状态的唤醒词。本申请能够实现对唤醒词进行自动扩展,通过扩展后的唤醒词,用户能够更加快捷的唤醒电子设备,提升了用户体验。
如图2所示,为本申请公开的一种信息处理方法实施例2的方法流程图,所述方法应用于电子设备,所述方法可以包含以下步骤:
S201、采集用户在唤醒电子设备前,对电子设备输入的语音信息;
当需要对电子设备的唤醒词进行自动扩展时,在电子设备被唤醒前,采集用户对电子设备输入的语音信息。例如,在电子设备被唤醒前,用户A对电子设备输入“今天天气怎么样”的语音信息,则将用户输出的“今天天气怎么样”的语音信息进行采集。在采集用户对电子设备输入的语音信息时,可以通过电子设备中的麦克风进行采集。另外,在采集电子设备被唤醒前用户对电子设备输入的语音信息时,可以设置一定的采集频率。例如,每间隔10分钟采集一次。
S202、判断语音信息表征的语义信息是否满足预设条件,预设条件为电子设备由休眠状态切换至唤醒状态;
当采集到用户在唤醒电子设备前对电子设备输入的语音信息后,进一步判断获取到的语音信息表征的语义信息是否能将电子设备由休眠状态切换至唤醒状态。需要说明的是,在判断获取到的语音信息表征的语义信息是否能将电子设备由休眠状态切换至唤醒状态时,可以对获取到的语音信息进行语义理解,得到与所述语音信息对应的语义信息。
S203、当语音信息表征的语义信息不满足预设条件时,存储语音信息;
当语音信息表征的语音信息不能将电子设备由休眠状态切换至唤醒状态时,由于电子设备在唤醒前的处理能力较弱,因此将采集到的用户在唤醒电子设备前对电子设备输入的语音信息进行存储。例如,将用户输出的“今天天气怎么样”进行存储。
S204、基于存储的语音信息生成备选唤醒词,备选唤醒词用于将电子设备由休眠状态切换至唤醒状态。
当电子设备具有较强的处理能力时,例如,当电子设备被唤醒后,对存储的语音信息进行处理,生成能够用于将电子设备由休眠状态切换至唤醒状态的唤醒词。例如,将“今天天气怎么样”中的“今天天气”作为电子设备的备选唤醒词。
综上所述,在上述实施例中,当需要对电子设备的唤醒词进行自动扩展时,采集用户在唤醒电子设备前对电子设备输入的语音信息,并进一步判断采集到的语音信息表征的语音信息是否能将电子设备由休眠状态切换至唤醒状态,当语音信息表征的语义信息不能将电子设备由休眠状态切换至唤醒状态时,将采集到的语音信息进行存储,然后根据存储的语音信息生成用于将电子设备由休眠状态切换至唤醒状态的唤醒词。本申请能够实现对唤醒词进行自动扩展,通过扩展后的唤醒词,用户能够更加快捷的唤醒电子设备,提升了用户体验。
具体的,在上述的实施例中,步骤S103和步骤S204中基于存储的语音信息生成备选唤醒词的其中一种实现方式可以是:在电子设备唤醒状态下的空闲时段,基于存储的语音信息生成备选唤醒词。通过在电子设备唤醒状态下的空闲时段对存储的语音信息进行处理,能够加大电子设备对语音信息的处理能力。
具体的,在上述的实施例中,在基于存储的语音信息生成备选唤醒词的其中一种实现方式可以包括以下步骤:
S1、将语音信息切分为至少一个待处理信息;
在根据存储的语音信息生成备选唤醒词时,可以将获取到的语音信息切分为至少一个待处理信息。例如,将语音信息“今天天气怎么样”切分成“今天天气”和“怎么样”两个待处理信息。
S2、计算每个待处理信息与目标唤醒词的相似度;
然后分别计算每个待处理信息与目标唤醒词的相似度,其中,目标唤醒词为能够将电子设备唤醒的词。例如,假设目标唤醒词为“天气”,计算待处理信息“今天天气”和“天气”与目标唤醒词“天气”的相似度。
S3、判断待处理信息与目标唤醒词的相似度是否大于预设阈值;
根据计算结果,判断待处理信息与目标唤醒词的相似度是否大于预设阈值,例如,是否大于60%等。
S4、当待处理信息与目标唤醒词的相似度大于预设阈值时,将待处理信息确定为备选唤醒词。
通过判断,当待处理信息与目标唤醒词的相似度大于预设阈值时,将待处理信息确定为备选唤醒词。例如,当待处理信息“今天天气”与目标唤醒词“天气”的相似度大于预设阈值时,将“今天天气”确定为备选唤醒词。
具体的,在上述实施例中,为了使确定的备选唤醒词更有利于用户唤醒电子设备,在待处理信息与目标唤醒词的相似度大于预设阈值后,还可以进一步包括:
S5、判断待处理信息的字数是否满足预设字数范围;
即进一步判断与目标唤醒词的相似度大于预设阈值的待处理信息的字数是否满足预设字数范围,例如,是否在3~5个字范围内。
S6、当待处理信息的字数满足预设字数范围时,将待处理信息确定为备选唤醒词。
当待处理信息的相似度大于预设阈值,且字数满足预设字数范围时,将待处理信息确定为备选唤醒词。例如,将“今天天气”确定为备选唤醒词。
如图3所示,为本申请公开的一种信息处理方法实施例3的方法流程图,所述方法应用于电子设备,所述方法可以包含以下步骤:
S301、采集用户在唤醒电子设备前,对电子设备输入的语音信息;
当需要对电子设备的唤醒词进行自动扩展时,在电子设备被唤醒前,采集用户对电子设备输入的语音信息。例如,在电子设备被唤醒前,用户A对电子设备输入“今天天气怎么样”的语音信息,则将用户输出的“今天天气怎么样”的语音信息进行采集。在采集用户对电子设备输入的语音信息时,可以通过电子设备中的麦克风进行采集。另外,在采集电子设备被唤醒前用户对电子设备输入的语音信息时,可以设置一定的采集频率。例如,每间隔10分钟采集一次。
S302、对语音信息进行声纹识别;
由于在电子设备唤醒前,对电子设备输入语音信息的可能不止一个用户。例如,用户A输入了“今天天气怎么样”、“北京天气怎么样”的语音信息,用户B输入了“到北京怎么走”、“距离北京多远”的语音信息。为了提升用户体验,针对不同的用户扩展不同的唤醒词,当采集到用户在唤醒电子设备前,对电子设备输入的语音信息后,对获取到的语音信息进行声纹识别,通过声纹识别能够识别出语音信息中不同的用户。
S303、基于声纹识别特征对语音信息进行分类,将具有相同声纹识别特征的语音信息归为一类;
通过声纹识别,将具有相同声纹识别特征的语音信息归为一类,即将同一用户的语音信息归为一类。例如,将用户A输出的“今天天气怎么样”、“北京天气怎么样”的语音信息归为一类,将用户B输出的“到北京怎么走”、“距离北京多远”的语音信息归为一类。
S304、存储经过分类的语音信息;
由于电子设备在唤醒前的处理能力较弱,因此将采集到的经过分类的用户在唤醒电子设备前对电子设备输入的语音信息进行存储。
S305、分别基于每一类中的所述语音信息生成备选唤醒词,备选唤醒词用于将电子设备由休眠状态切换至唤醒状态。
当电子设备具有较强的处理能力时,例如,当电子设备被唤醒后,对存储的每一类语音信息分别进行处理,生成能够用于将电子设备由休眠状态切换至唤醒状态的唤醒词。例如,将“今天天气”作为电子设备的备选唤醒词。
综上所述,在上述实施例中,当需要对电子设备的唤醒词进行自动扩展时,采集用户在唤醒电子设备前对电子设备输入的语音信息,并对语音信息进行声纹识别,基于声纹识别特征对语音信息进行分类,将具有相同声纹识别特征的语音信息归为一类,并将经过分类后的语音信息进行存储,然后分别基于每一类中的语音信息生成用于将电子设备由休眠状态切换至唤醒状态的唤醒词。本申请能够实现对唤醒词进行自动扩展,通过扩展后的唤醒词,用户能够更加快捷的唤醒电子设备,提升了用户体验。
如图4所示,为本申请公开的一种电子设备实施例1的结构示意图,所述电子设备可以包含:
存储器401,用于存储应用程序与应用程序运行所产生的数据;
音频采集装置402,用于采集用户在唤醒电子设备前,对电子设备输入的语音信息;
当需要对电子设备的唤醒词进行自动扩展时,在电子设备被唤醒前,采集用户对电子设备输入的语音信息。例如,在电子设备被唤醒前,用户A对电子设备输入“今天天气怎么样”的语音信息,则将用户输出的“今天天气怎么样”的语音信息进行采集。在采集用户对电子设备输入的语音信息时,可以通过电子设备中的麦克风进行采集。另外,在采集电子设备被唤醒前用户对电子设备输入的语音信息时,可以设置一定的采集频率。例如,每间隔10分钟采集一次。
存储器401,还用于存储语音信息;
由于电子设备在唤醒前的处理能力较弱,因此将采集到的用户在唤醒电子设备前对电子设备输入的语音信息进行存储。
处理器403,用于运行所述应用程序以基于存储的语音信息生成备选唤醒词,备选唤醒词用于将电子设备由休眠状态切换至唤醒状态。
当电子设备具有较强的处理能力时,例如,当电子设备被唤醒后,对存储的语音信息进行处理,生成能够用于将电子设备由休眠状态切换至唤醒状态的唤醒词。例如,将“今天天气”作为电子设备的备选唤醒词。
综上所述,在上述实施例中,当需要对电子设备的唤醒词进行自动扩展时,采集用户在唤醒电子设备前对电子设备输入的语音信息,并将采集到的语音信息进行存储,然后根据存储的语音信息生成用于将电子设备由休眠状态切换至唤醒状态的唤醒词。本申请能够实现对唤醒词进行自动扩展,通过扩展后的唤醒词,用户能够更加快捷的唤醒电子设备,提升了用户体验。
如图5所示,为本申请公开的一种电子设备实施例2的结构示意图,所述电子设备可以包含:
存储器501,用于存储应用程序与应用程序运行所产生的数据;
音频采集装置502,用于采集用户在唤醒电子设备前,对电子设备输入的语音信息;
当需要对电子设备的唤醒词进行自动扩展时,在电子设备被唤醒前,采集用户对电子设备输入的语音信息。例如,在电子设备被唤醒前,用户A对电子设备输入“今天天气怎么样”的语音信息,则将用户输出的“今天天气怎么样”的语音信息进行采集。在采集用户对电子设备输入的语音信息时,可以通过电子设备中的麦克风进行采集。另外,在采集电子设备被唤醒前用户对电子设备输入的语音信息时,可以设置一定的采集频率。例如,每间隔10分钟采集一次。
处理器503,用于运行所述应用程序以判断语音信息表征的语义信息是否满足预设条件,预设条件为电子设备由休眠状态切换至唤醒状态;
当采集到用户在唤醒电子设备前对电子设备输入的语音信息后,进一步判断获取到的语音信息表征的语义信息是否能将电子设备由休眠状态切换至唤醒状态。需要说明的是,在判断获取到的语音信息表征的语义信息是否能将电子设备由休眠状态切换至唤醒状态时,可以对获取到的语音信息进行语义理解,得到与所述语音信息对应的语义信息。
存储器501,还用于当语音信息表征的语义信息不满足预设条件时,存储语音信息;
当语音信息表征的语音信息不能将电子设备由休眠状态切换至唤醒状态时,由于电子设备在唤醒前的处理能力较弱,因此将采集到的用户在唤醒电子设备前对电子设备输入的语音信息进行存储。例如,将用户输出的“今天天气怎么样”进行存储。
处理器503,还用于基于存储的语音信息生成备选唤醒词,备选唤醒词用于将电子设备由休眠状态切换至唤醒状态。
当电子设备具有较强的处理能力时,例如,当电子设备被唤醒后,对存储的语音信息进行处理,生成能够用于将电子设备由休眠状态切换至唤醒状态的唤醒词。例如,将“今天天气怎么样”中的“今天天气”作为电子设备的备选唤醒词。
综上所述,在上述实施例中,当需要对电子设备的唤醒词进行自动扩展时,采集用户在唤醒电子设备前对电子设备输入的语音信息,并进一步判断采集到的语音信息表征的语音信息是否能将电子设备由休眠状态切换至唤醒状态,当语音信息表征的语义信息不能将电子设备由休眠状态切换至唤醒状态时,将采集到的语音信息进行存储,然后根据存储的语音信息生成用于将电子设备由休眠状态切换至唤醒状态的唤醒词。本申请能够实现对唤醒词进行自动扩展,通过扩展后的唤醒词,用户能够更加快捷的唤醒电子设备,提升了用户体验。
具体的,在上述的实施例中,处理器基于存储的语音信息生成备选唤醒词的其中一种实现方式可以是:在电子设备唤醒状态下的空闲时段,基于存储的语音信息生成备选唤醒词。通过在电子设备唤醒状态下的空闲时段对存储的语音信息进行处理,能够加大电子设备对语音信息的处理能力。
具体的,在上述的实施例中,处理器在基于存储的语音信息生成备选唤醒词的其中一种实现方式可以包括以下步骤:
S1、将语音信息切分为至少一个待处理信息;
在根据存储的语音信息生成备选唤醒词时,可以将获取到的语音信息切分为至少一个待处理信息。例如,将语音信息“今天天气怎么样”切分成“今天天气”和“怎么样”两个待处理信息。
S2、计算每个待处理信息与目标唤醒词的相似度;
然后分别计算每个待处理信息与目标唤醒词的相似度,其中,目标唤醒词为能够将电子设备唤醒的词。例如,假设目标唤醒词为“天气”,计算待处理信息“今天天气”和“天气”与目标唤醒词“天气”的相似度。
S3、判断待处理信息与目标唤醒词的相似度是否大于预设阈值;
根据计算结果,判断待处理信息与目标唤醒词的相似度是否大于预设阈值,例如,是否大于60%等。
S4、当待处理信息与目标唤醒词的相似度大于预设阈值时,将待处理信息确定为备选唤醒词。
通过判断,当待处理信息与目标唤醒词的相似度大于预设阈值时,将待处理信息确定为备选唤醒词。例如,当待处理信息“今天天气”与目标唤醒词“天气”的相似度大于预设阈值时,将“今天天气”确定为备选唤醒词。
具体的,在上述实施例中,为了使确定的备选唤醒词更有利于用户唤醒电子设备,在待处理信息与目标唤醒词的相似度大于预设阈值后,还可以进一步包括:
S5、判断待处理信息的字数是否满足预设字数范围;
即进一步判断与目标唤醒词的相似度大于预设阈值的待处理信息的字数是否满足预设字数范围,例如,是否在3~5个字范围内。
S6、当待处理信息的字数满足预设字数范围时,将待处理信息确定为备选唤醒词。
当待处理信息的相似度大于预设阈值,且字数满足预设字数范围时,将待处理信息确定为备选唤醒词。例如,将“今天天气”确定为备选唤醒词。
如图6所示,为本申请公开的一种电子设备实施例3的结构示意图,所述电子设备可以包含:
存储器601,用于存储应用程序与应用程序运行所产生的数据;
音频采集装置602,用于采集用户在唤醒电子设备前,对电子设备输入的语音信息;
当需要对电子设备的唤醒词进行自动扩展时,在电子设备被唤醒前,采集用户对电子设备输入的语音信息。例如,在电子设备被唤醒前,用户A对电子设备输入“今天天气怎么样”的语音信息,则将用户输出的“今天天气怎么样”的语音信息进行采集。在采集用户对电子设备输入的语音信息时,可以通过电子设备中的麦克风进行采集。另外,在采集电子设备被唤醒前用户对电子设备输入的语音信息时,可以设置一定的采集频率。例如,每间隔10分钟采集一次。
处理器603,用于运行所述应用程序以对语音信息进行声纹识别;
由于在电子设备唤醒前,对电子设备输入语音信息的可能不止一个用户。例如,用户A输入了“今天天气怎么样”、“北京天气怎么样”的语音信息,用户B输入了“到北京怎么走”、“距离北京多远”的语音信息。为了提升用户体验,针对不同的用户扩展不同的唤醒词,当采集到用户在唤醒电子设备前,对电子设备输入的语音信息后,对获取到的语音信息进行声纹识别,通过声纹识别能够识别出语音信息中不同的用户。
处理器603,还用于基于声纹识别特征对语音信息进行分类,将具有相同声纹识别特征的语音信息归为一类;
通过声纹识别,将具有相同声纹识别特征的语音信息归为一类,即将同一用户的语音信息归为一类。例如,将用户A输出的“今天天气怎么样”、“北京天气怎么样”的语音信息归为一类,将用户B输出的“到北京怎么走”、“距离北京多远”的语音信息归为一类。
存储器601,还用于存储经过分类的语音信息;
由于电子设备在唤醒前的处理能力较弱,因此将采集到的经过分类的用户在唤醒电子设备前对电子设备输入的语音信息进行存储。
处理器603,还用于分别基于每一类中的所述语音信息生成备选唤醒词,备选唤醒词用于将电子设备由休眠状态切换至唤醒状态。
当电子设备具有较强的处理能力时,例如,当电子设备被唤醒后,对存储的每一类语音信息分别进行处理,生成能够用于将电子设备由休眠状态切换至唤醒状态的唤醒词。例如,将“今天天气”作为电子设备的备选唤醒词。
综上所述,在上述实施例中,当需要对电子设备的唤醒词进行自动扩展时,采集用户在唤醒电子设备前对电子设备输入的语音信息,并对语音信息进行声纹识别,基于声纹识别特征对语音信息进行分类,将具有相同声纹识别特征的语音信息归为一类,并将经过分类后的语音信息进行存储,然后分别基于每一类中的语音信息生成用于将电子设备由休眠状态切换至唤醒状态的唤醒词。本申请能够实现对唤醒词进行自动扩展,通过扩展后的唤醒词,用户能够更加快捷的唤醒电子设备,提升了用户体验。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (7)

1.一种信息处理方法,其特征在于,应用于电子设备,所述方法包括:
采集用户在唤醒所述电子设备前,对所述电子设备输入的语音信息;判断所述语音信息表征的语义信息是否满足预设条件,所述预设条件为所述电子设备由休眠状态切换至唤醒状态;
当所述语音信息表征的语义信息不满足预设条件时,存储所述语音信息;
当电子设备被唤醒后,基于所述存储的语音信息生成备选唤醒词,所述备选唤醒词用于将所述电子设备由休眠状态切换至唤醒状态;
所述基于所述存储的语音信息生成备选唤醒词包括:
将所述语音信息切分为至少一个待处理信息;
计算每个所述待处理信息与目标唤醒词的相似度;
判断所述待处理信息与所述目标唤醒词的相似度是否大于预设阈值;
当所述待处理信息与所述目标唤醒词的相似度大于预设阈值时,将所述待处理信息确定为所述备选唤醒词。
2.根据权利要求1所述的方法,其特征在于,所述基于所述存储的语音信息生成备选唤醒词包括:
在所述电子设备唤醒状态下的空闲时段,基于所述存储的语音信息生成备选唤醒词。
3.根据权利要求1所述的方法,其特征在于,所述当所述待处理信息与所述目标唤醒词的相似度大于预设阈值时,还包括:
判断所述待处理信息的字数是否满足预设字数范围;
当所述待处理信息的字数满足预设字数范围时,将所述待处理信息确定为所述备选唤醒词。
4.根据权利要求1所述的方法,其特征在于,所述采集用户在唤醒所述电子设备前,对所述电子设备输入的语音信息后,还包括:
对所述语音信息进行声纹识别;
基于声纹识别特征对所述语音信息进行分类,将具有相同声纹识别特征的语音信息归为一类;
相应的,基于所述存储的语音信息生成备选唤醒词包括:
分别基于每一类中的所述语音信息生成备选唤醒词。
5.一种电子设备,其特征在于,包括:
存储器,用于存储应用程序与应用程序运行所产生的数据;
音频采集装置,用于采集用户在唤醒所述电子设备前,对所述电子设备输入的语音信息;
所述存储器,还用于存储所述语音信息;
处理器,用于在所述音频采集装置采集用户在唤醒所述电子设备前,对所述电子设备输入语音信息后,判断所述语音信息表征的语义信息是否满足预设条件,所述预设条件为所述电子设备由休眠状态切换至唤醒状态;当所述语音信息表征的语义信息不满足预设条件时,所述存储器存储所述语音信息;还用于当电子设备被唤醒后,运行所述应用程序以基于所述存储的语音信息生成备选唤醒词,所述备选唤醒词用于将所述电子设备由休眠状态切换至唤醒状态;
所述基于所述存储的语音信息生成备选唤醒词包括:
将所述语音信息切分为至少一个待处理信息;
计算每个所述待处理信息与目标唤醒词的相似度;
判断所述待处理信息与所述目标唤醒词的相似度是否大于预设阈值;
当所述待处理信息与所述目标唤醒词的相似度大于预设阈值时,将所述待处理信息确定为所述备选唤醒词。
6.根据权利要求5所述的电子设备,其特征在于,所述处理器在基于所述存储的语音信息生成备选唤醒词时,具体用于:
在所述电子设备唤醒状态下的空闲时段,基于所述存储的语音信息生成备选唤醒词。
7.根据权利要求5所述的电子设备,其特征在于,在所述音频采集装置采集用户在唤醒所述电子设备前,对所述电子设备输入的语音信息后,所述处理器,还用于:
对所述语音信息进行声纹识别;
基于声纹识别特征对所述语音信息进行分类,将具有相同声纹识别特征的语音信息归为一类;
分别基于每一类中的所述语音信息生成备选唤醒词。
CN201810262323.6A 2018-03-28 2018-03-28 一种信息处理方法及电子设备 Active CN108509225B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810262323.6A CN108509225B (zh) 2018-03-28 2018-03-28 一种信息处理方法及电子设备
US16/367,235 US11194378B2 (en) 2018-03-28 2019-03-27 Information processing method and electronic device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810262323.6A CN108509225B (zh) 2018-03-28 2018-03-28 一种信息处理方法及电子设备

Publications (2)

Publication Number Publication Date
CN108509225A CN108509225A (zh) 2018-09-07
CN108509225B true CN108509225B (zh) 2021-07-16

Family

ID=63378877

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810262323.6A Active CN108509225B (zh) 2018-03-28 2018-03-28 一种信息处理方法及电子设备

Country Status (2)

Country Link
US (1) US11194378B2 (zh)
CN (1) CN108509225B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112102821B (zh) * 2019-06-18 2024-01-12 北京京东尚科信息技术有限公司 应用于电子设备的数据处理方法、装置、系统、介质
CN110246495A (zh) * 2019-06-28 2019-09-17 联想(北京)有限公司 信息处理方法和电子设备
CN111767083A (zh) * 2020-02-03 2020-10-13 北京沃东天骏信息技术有限公司 误唤醒音频数据的收集方法、播放设备、电子设备、介质
CN117690423A (zh) * 2022-09-05 2024-03-12 华为技术有限公司 人机交互方法及相关装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1416560A (zh) * 2000-03-08 2003-05-07 西门子公司 由有限的用户圈用语音控制启动可在设备内执行的动作的方法
CN106297777A (zh) * 2016-08-11 2017-01-04 广州视源电子科技股份有限公司 一种唤醒语音服务的方法和装置
CN107147618A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 一种用户注册方法、装置及电子设备

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9142215B2 (en) * 2012-06-15 2015-09-22 Cypress Semiconductor Corporation Power-efficient voice activation
US9275637B1 (en) * 2012-11-06 2016-03-01 Amazon Technologies, Inc. Wake word evaluation
US20140365225A1 (en) * 2013-06-05 2014-12-11 DSP Group Ultra-low-power adaptive, user independent, voice triggering schemes
CN110096253B (zh) * 2013-07-11 2022-08-30 英特尔公司 利用相同的音频输入的设备唤醒和说话者验证
US9548047B2 (en) * 2013-07-31 2017-01-17 Google Technology Holdings LLC Method and apparatus for evaluating trigger phrase enrollment
CN104424290A (zh) * 2013-09-02 2015-03-18 佳能株式会社 基于语音的问答系统和用于交互式语音系统的方法
US8768712B1 (en) * 2013-12-04 2014-07-01 Google Inc. Initiating actions based on partial hotwords
US9697828B1 (en) * 2014-06-20 2017-07-04 Amazon Technologies, Inc. Keyword detection modeling using contextual and environmental information
KR102357321B1 (ko) * 2014-08-27 2022-02-03 삼성전자주식회사 음성 인식이 가능한 디스플레이 장치 및 방법
KR102623272B1 (ko) * 2016-10-12 2024-01-11 삼성전자주식회사 전자 장치 및 이의 제어 방법
EP3561806B1 (en) * 2018-04-23 2020-04-22 Spotify AB Activation trigger processing

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1416560A (zh) * 2000-03-08 2003-05-07 西门子公司 由有限的用户圈用语音控制启动可在设备内执行的动作的方法
CN106297777A (zh) * 2016-08-11 2017-01-04 广州视源电子科技股份有限公司 一种唤醒语音服务的方法和装置
CN107147618A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 一种用户注册方法、装置及电子设备

Also Published As

Publication number Publication date
CN108509225A (zh) 2018-09-07
US11194378B2 (en) 2021-12-07
US20190302869A1 (en) 2019-10-03

Similar Documents

Publication Publication Date Title
CN108509225B (zh) 一种信息处理方法及电子设备
CN107564518B (zh) 智能设备控制方法、装置及计算机设备
CN106782554B (zh) 基于人工智能的语音唤醒方法和装置
CN105632486B (zh) 一种智能硬件的语音唤醒方法和装置
CN111312222B (zh) 一种唤醒、语音识别模型训练方法及装置
CN110070857B (zh) 语音唤醒模型的模型参数调整方法及装置、语音设备
CN110223691A (zh) 语音唤醒识别的切换控制方法和装置
CN111128155B (zh) 一种智能设备的唤醒方法、装置、设备及介质
CN110473536B (zh) 一种唤醒方法、装置和智能设备
CN111968644B (zh) 智能设备唤醒方法、装置及电子设备
CN111199733A (zh) 多级识别语音唤醒方法及装置、计算机存储介质及设备
CN111192590B (zh) 语音唤醒方法、装置、设备及存储介质
CN108595406B (zh) 一种用户状态的提醒方法、装置、电子设备及存储介质
CN113963695A (zh) 一种智能设备的唤醒方法、装置、设备及存储介质
CN111508493A (zh) 语音唤醒方法、装置、电子设备及存储介质
CN111954868A (zh) 一种多语音助手控制方法、装置、系统及计算机可读存储介质
CN111292737A (zh) 语音交互及语音唤醒检测方法、装置、设备及存储介质
CN111192588A (zh) 一种系统唤醒方法及装置
CN111179924B (zh) 一种基于模式切换的唤醒性能优化的方法及系统
CN116386676B (zh) 语音唤醒方法、语音唤醒装置及存储介质
CN113160815A (zh) 语音唤醒的智能控制方法、装置、设备及存储介质
CN111599352A (zh) 语音唤醒方法、装置、计算机设备和存储介质
CN111161745A (zh) 一种智能设备的唤醒方法、装置、设备及介质
CN111028830B (zh) 一种本地热词库更新方法、装置及设备
CN111124512B (zh) 智能设备的唤醒方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant