CN113129884A - 设备唤醒方法、装置及电子设备 - Google Patents
设备唤醒方法、装置及电子设备 Download PDFInfo
- Publication number
- CN113129884A CN113129884A CN201911408594.9A CN201911408594A CN113129884A CN 113129884 A CN113129884 A CN 113129884A CN 201911408594 A CN201911408594 A CN 201911408594A CN 113129884 A CN113129884 A CN 113129884A
- Authority
- CN
- China
- Prior art keywords
- awakening
- wake
- voice
- information
- stage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 230000000694 effects Effects 0.000 claims description 41
- 230000008859 change Effects 0.000 claims description 18
- 238000004891 communication Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 abstract description 27
- 238000004458 analytical method Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000010223 real-time analysis Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000002618 waking effect Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/4401—Bootstrapping
- G06F9/4418—Suspend and resume; Hibernate and awake
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Electric Clocks (AREA)
Abstract
本发明公开了一种设备唤醒方法,应用于唤醒技术领域,主要目的在于解决当前语音唤醒过程中,用户对于智能设备采集和分析唤醒词的实时情况无从了解的问题,本发明主要步骤包括:接收语音唤醒信息,并根据所述语音唤醒信息判断唤醒阶段,所述唤醒阶段是根据所述语音唤醒信息与预设唤醒词匹配程度确定的;根据所述唤醒阶段,确定对应所述唤醒阶段的显示内容;向用户输出所述显示内容,以便用户获知当前语音唤醒信息所达到的唤醒程度。本发明适用于设备的语音唤醒过程。
Description
技术领域
本发明涉及唤醒技术领域,具体涉及一种设备唤醒方法、装置及电子设备。
背景技术
随着智能设备的迅猛发展,通过语音来对智能设备进行控制已经逐步普及,一般情况下,用户都需要使用唤醒词对智能设备进行语音唤醒,并在唤醒后对设备进行基于语音的控制,因此,在语音控制的过程中,对于设备的语音唤醒是首要前提。
目前,在用户进行语音唤醒的过程中,通常需要用户利用唤醒词进行语音的输出。例如,用户可以说出唤醒词“叮当叮当”,并在由智能设备接收到该唤醒词后通过对每个音节进行分析和识别,并在确定用户说出的唤醒词与预先设置的唤醒词相匹配时,执行唤醒操作。然而,在实际应用中,当用户发出语音唤醒词后,都要等待智能设备接收并识别,但在识别的过程中需要对唤醒词的每个音节进行分析识别,而每个音节的识别的过程中一般至少需要几十到一百毫秒的识别时间,若唤醒词存在四个音节时,在智能设备检测到唤醒词第一个音节到第四个音节之间至少需要几百毫秒,而在这个过程中用户往往需要等待,等待过程中用户无法得知智能设备是否已经接收到了用户的语音,或智能设备是否在分析唤醒词,影响用户在语音唤醒过程中的使用体验。
发明内容
有鉴于此,本发明提供了一种设备唤醒方法、装置及电子设备,为了解决当前语音唤醒过程中,用户对于智能设备采集和分析唤醒词的情况无从了解的问题,改善用户使用语音唤醒时的用户体验。
为实现上述发明目的,根据本发明的第一个方面,提供一种设备唤醒方法,包括:
接收语音唤醒信息,并根据所述语音唤醒信息判断唤醒阶段,所述唤醒阶段是根据所述语音唤醒信息与预设唤醒词匹配程度确定的;
根据所述唤醒阶段,确定对应所述唤醒阶段的显示内容;
向用户输出所述显示内容,以便用户获知当前语音唤醒信息所达到的唤醒程度。
可选的,所述预设唤醒词包含有至少一个唤醒分词;
所述接收语音唤醒信息,并根据所述语音唤醒信息判断唤醒阶段,包括:
从外界采集语音唤醒信息;
根据所述语音唤醒信息与所述预设唤醒词包含的唤醒分词进行匹配,并根据预设对应关系确定所匹配的唤醒分词对应的唤醒阶段,所述预设对应关系中包含有每个分词分别对应的所述唤醒阶段。
可选的,所述根据所述语音唤醒信息与所述预设唤醒词包含的唤醒分词进行匹配,并根据预设对应关系确定所匹配的唤醒分词对应的唤醒阶段包括:
当在预置时间段内采集到多个语音唤醒信息时,根据接收顺序将所述多个语音唤醒信息与预设唤醒词中包含的多个唤醒分词分别按照唤醒分词顺序进行匹配,所述接收顺序为所述多个语音唤醒信息的在被采集时的顺序,所述唤醒分词顺序是根据所述预设唤醒词中唤醒分词在录制时的排列顺序确定的;
当根据所述接收顺序将所述多个语音唤醒信息与预设唤醒词中包含的多个唤醒分词分别按照唤醒分词顺序相匹配时,则确定相匹配的多个唤醒词中唤醒分词顺序的排序最后的唤醒分词;
根据所述预设对应关系以及所述排序最后的唤醒分词,确定对应的所述唤醒阶段。
可选的,在根据所述唤醒阶段,确定对应所述唤醒阶段的显示内容之前,所述方法还包括:
设置唤醒显示关系,其中,所述唤醒显示关系中包含有多个唤醒阶段,以及每个唤醒阶段对应的显示内容,每个显示内容的显示效果不同。
可选的,所述根据所述唤醒阶段,确定对应所述唤醒阶段的显示内容包括:
通过所述唤醒显示关系,确定对应所述唤醒阶段的显示内容。
可选的,所述每个显示内容的显示效果随着唤醒阶段的变化而变化,在多个所述唤醒阶段中至少包括初步唤醒阶段与完全唤醒阶段,所述完全唤醒阶段的显示内容的显示效果强于初步唤醒阶段时的显示内容的显示效果。
可选的,当所述不同阶段的显示内容均包含有相同的图形、文字组合时,
所述向用户输出所述显示内容,包括:
当所述唤醒阶段发生变化时,将所述当前显示内容的显示效果进行调整,以便适配唤醒阶段的变化,所述显示效果的调整包括亮度、颜色色温、闪烁频率等至少一种的变化。
根据本发明的第二方面,本发明还提供了一种设备唤醒装置,包括:
接收单元,用于接收语音唤醒信息,并根据所述语音唤醒信息判断唤醒阶段,所述唤醒阶段是根据所述语音唤醒信息与预设唤醒词匹配程度确定的;
确定单元,用于根据所述唤醒阶段,确定对应所述唤醒阶段的显示内容;
输出单元,用于向用户输出所述显示内容,以便用户获知当前语音唤醒信息所达到的唤醒程度。
可选的,所述预设唤醒词包含有至少一个唤醒分词;
所述接收单元,包括:
采集模块,用于从外界采集语音唤醒信息;
确定模块,用于根据所述语音唤醒信息与所述预设唤醒词包含的唤醒分词进行匹配,并根据预设对应关系确定所匹配的唤醒分词对应的唤醒阶段,所述预设对应关系中包含有每个分词分别对应的所述唤醒阶段。
可选的,所述确定模块,包括:
匹配子模块,用于当在预置时间段内采集到多个语音唤醒信息时,根据接收顺序将所述多个语音唤醒信息与预设唤醒词中包含的多个唤醒分词分别按照唤醒分词顺序进行匹配,所述接收顺序为所述多个语音唤醒信息的在被采集时的顺序,所述唤醒分词顺序是根据所述预设唤醒词中唤醒分词在录制时的排列顺序确定的;
第一确定子模块,用于当根据所述接收顺序将所述多个语音唤醒信息与预设唤醒词中包含的多个唤醒分词分别按照唤醒分词顺序相匹配时,则确定相匹配的多个唤醒词中唤醒分词顺序的排序最后的唤醒分词;
第二确定子模块,用于根据所述预设对应关系以及所述排序最后的唤醒分词,确定对应的所述唤醒阶段。
可选的,所述装置还包括:
设置单元,用于设置唤醒显示关系,其中,所述唤醒显示关系中包含有多个唤醒阶段,以及每个唤醒阶段对应的显示内容,每个显示内容的显示效果不同。
可选的,所述确定单元,具体用于通过所述唤醒显示关系,确定对应所述唤醒阶段的显示内容。
可选的,所述每个显示内容的显示效果随着唤醒阶段的变化而变化,在多个所述唤醒阶段中至少包括初步唤醒阶段与完全唤醒阶段,所述完全唤醒阶段的显示内容的显示效果强于初步唤醒阶段时的显示内容的显示效果。
可选的,当所述不同阶段的显示内容均包含有相同的图形、文字组合时,
所述输出单元,具体用于当所述唤醒阶段发生变化时,将所述当前显示内容的显示效果进行调整,以便适配唤醒阶段的变化,所述显示效果的调整包括亮度、颜色色温、闪烁频率等至少一种的变化。
根据本发明第三个方面,提供了一种电子设备,包括存储器、处理器和通讯总线;
所述存储器与所述处理器通过所述通讯总线通讯连接;
所述存储器中存储有计算机可执行指令,所述处理器用于执行所述计算机可执行指令,用于实现本发明第一个方面提供的设备唤醒方法。
根据本发明第四个方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令在被执行时,用于实现本发明第一个方面提供的设备唤醒方法。
本发明提供的一种设备唤醒方法、装置及电子设备,与现有技术中在语音唤醒时,需要用户等待唤醒词的整体分析结果,而无从得知智能设备实时所采集和分析唤醒词的情况相比,本发明首先接收语音唤醒信息,并根据所述语音唤醒信息判断唤醒阶段,然后根据所述唤醒阶段,确定对应所述唤醒阶段的显示内容,最后向用户输出所述显示内容,以便用户获知当前语音唤醒信息所达到的唤醒程度,其中,所述唤醒阶段是根据所述语音唤醒信息与预设唤醒词匹配程度确定的,从而实现设备的语音唤醒过程中能够在用户发出的语音唤醒信息是否为智能设备所采集和识别的实时状态进行输出,解决了目前现有技术无法实时了解用户当前发出的语音唤醒信息的实时分析效果的问题,使得用户能够第一时间获知自己所发出的语音唤醒信息是否被设备接收和识别,以及能够使设备进入到何种唤醒阶段,极大的改善了用户在语音唤醒过程中的用户体验。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。
图1是根据本申请一实施例提供的一种设备唤醒方法的实现流程图;
图2是根据本申请一实施例提供的另一种设备唤醒方法的实现流程图;
图3是根据本申请一实施例提供的一种设备唤醒装置的结构示意图;
图4是根据本申请一实施例提供的另一种设备唤醒装置的结构示意图;
图5是根据本申请一实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明实施例提供了一种设备唤醒方法,所述方法用于在对智能设备的语音唤醒过程中,如图1所示,所述方法包括:
101、接收语音唤醒信息,并根据所述语音唤醒信息判断唤醒阶段。
其中,所述唤醒阶段是根据所述语音唤醒信息与预设唤醒词匹配程度确定的。
在本发明实施例中,基于每个唤醒词都存在一定的音节数量,而用户在发出语音唤醒指令的过程中是需要按照音节顺序一个音节一个音节发出的,因此,在本发明实施例中,所述语音唤醒信息可以理解为用户发出的唤醒词的一部分。这样,当智能设备采集到该语音唤醒信息后,由于当前并不是唤醒词的全部,而是其中的一部分,这样则可以根据本步骤所述的方法来判断当前用户发出的语音唤醒信息与预设唤醒词之间的匹配程度。例如,当预设的唤醒词为“小唯你好”时,且用户发出的语音唤醒信息是唤醒词的前两个字“小唯”时,根据该语音唤醒信息“小唯”与预设唤醒词“小唯你好”的匹配程度为50%时,则可以确定当前时用户发出了50%的语音唤醒词,同时,若预先设置了匹配度为50%时是初步唤醒阶段时,则可以确定当前唤醒阶段为初步唤醒阶段。
102、根据所述唤醒阶段,确定对应所述唤醒阶段的显示内容。
为了解决现有的语音唤醒过程中用户在发出语音唤醒指令时无从得知当前设备是否采集到了语音唤醒指令,以及设备是否能够识别当前的语音唤醒指令的问题。因此,在本发明实施例中,当设备能够在语音唤醒信息确定当前的唤醒阶段后,则可以根据该唤醒阶段确定需要向用户显示的显示内容,以便后续向用户进行提示和响应。其中,在本发明实施例中,当具体实施时所述显示内容可以包含诸如图像、文字、颜色、显示频率等任意一种或多种形式的组合,在此不做限定,可根据实际需要选取,只要确保能够实现对不同的唤醒阶段进行对应的提示的功能即可。
103、向用户输出所述显示内容,以便用户获知当前语音唤醒信息所达到的唤醒程度。
当步骤102确定了对应当前唤醒阶段的显示内容后,为了能够使用户得知当前所发出的语音唤醒信息对设备唤醒情况的情况,在本步骤中可以向用户输出该显示内容,以便用户得知。其中,在进行输出的过程中,可以通过控制显示装置来执行,例如,通过显示屏来进行显示内容的输出。
本实施例提供的一种设备唤醒方法,与现有技术中在语音唤醒时,需要用户等待唤醒词的整体分析结果,而无从得知智能设备实时所采集和分析唤醒词的情况相比,本发明首先接收语音唤醒信息,并根据所述语音唤醒信息判断唤醒阶段,然后根据所述唤醒阶段,确定对应所述唤醒阶段的显示内容,最后向用户输出所述显示内容,以便用户获知当前语音唤醒信息所达到的唤醒程度,其中,所述唤醒阶段是根据所述语音唤醒信息与预设唤醒词匹配程度确定的,从而实现设备的语音唤醒过程中能够在用户发出的语音唤醒信息是否为智能设备所采集和识别的实时状态进行输出,解决了目前现有技术无法实时了解用户当前发出的语音唤醒信息的实时分析效果的问题,使得用户能够第一时间获知自己所发出的语音唤醒信息是否被设备接收和识别,以及能够使设备进入到何种唤醒阶段,极大的改善了用户在语音唤醒过程中的用户体验。
进一步的,依据图1所示的方法,本发明的另一个实施例还提供了一种设备唤醒方法,用以对前述示例的进一步细化和阐述,具体的,如图2所示,所述方法主要包括:
201、接收语音唤醒信息,并根据所述语音唤醒信息判断唤醒阶段。
其中,所述唤醒阶段是根据所述语音唤醒信息与预设唤醒词匹配程度确定的。
具体的,在本发明实施例中,所述预设唤醒词包含有至少一个唤醒分词,该唤醒分词可以理解为唤醒词中的最基本单个词汇。例如,唤醒词中的“小唯你好”中的唤醒分词则可以为“小”、“唯”、“你”、“好”。
基于在唤醒词中存在多个唤醒分词,因此在进行唤醒阶段的判断过程中,其具体可以包括:
首先,从外界采集语音唤醒信息;
然后,根据所述语音唤醒信息与所述预设唤醒词包含的唤醒分词进行匹配,并根据预设对应关系确定所匹配的唤醒分词对应的唤醒阶段,其中所述预设对应关系中包含有每个分词分别对应的所述唤醒阶段。
进一步的,在确定所匹配的唤醒分词对应的唤醒阶段时,其执行方式可以按照下述方式进行:
当在预置时间段内采集到多个语音唤醒信息时,根据接收顺序将所述多个语音唤醒信息与预设唤醒词中包含的多个唤醒分词分别按照唤醒分词顺序进行匹配。在此,该接收顺序可以理解为所述多个语音唤醒信息的在被采集时的顺序,所述唤醒分词顺序是根据所述预设唤醒词中唤醒分词在录制时的排列顺序确定的。
当根据所述接收顺序将所述多个语音唤醒信息与预设唤醒词中包含的多个唤醒分词分别按照唤醒分词顺序相匹配时,则确定相匹配的多个唤醒词中唤醒分词顺序的排序最后的唤醒分词;
根据所述预设对应关系以及所述排序最后的唤醒分词,确定对应的所述唤醒阶段。
例如,当用户发出的先后两个语音唤醒信息为“小”、“唯”时,则设备在接收上述两个语音唤醒信息时的顺序“小”—>“唯”的顺序,且唤醒词为“小唯你好”,唤醒分词的顺序是“小”—>“唯”—>“你”—>“好”时,则按照接收顺序分别将上述两个语音唤醒信息为“小”、“唯”与唤醒分词进行一一匹配,当匹配后确定最后一个匹配的唤醒分词为“唯”时,则根据预设对应关系中保存的每个唤醒分词被正确说出的唤醒阶段来确定当前“唯”对应的阶段作为所述唤醒阶段。
202、设置唤醒显示关系。
其中,所述唤醒显示关系中包含有多个唤醒阶段,以及每个唤醒阶段对应的显示内容,每个显示内容的显示效果不同。
由于为了确保用户得知当前发出的语音信息是否为设备正确接收以确定所发出的语音唤醒信息是否准确,在本步骤中需要提前虚设唤醒显示关系,从而确保当设备采集到语音唤醒信息后,能够基于不同的唤醒阶段显示对应的显示内容。其中,所述唤醒显示关系可以为列表、映射等不同形式,具体的可以根据实际需要选取。
另外,根据实际需要本步骤可以为本发明实施例所述的步骤进行执行,还可以在步骤201之前执行,在此可根据实际需要选取,本示例中的顺序仅为示例性的,只需确保在确定唤醒阶段所对应的显示内容的步骤之前执行即可。
203、根据所述唤醒阶段,确定对应所述唤醒阶段的显示内容。
基于前述步骤设置了包含有每种唤醒阶段对应的显示内容的唤醒显示关系,因此,在本步骤中确定当前唤醒阶段的显示内容时,可具体为:通过所述唤醒显示关系,确定对应所述唤醒阶段的显示内容。
其中,为了确保不同唤醒阶段的提示效果,在本发明实施例中,所述每个显示内容的显示效果可以随着唤醒阶段的变化而变化,在多个所述唤醒阶段中至少包括初步唤醒阶段与完全唤醒阶段,所述完全唤醒阶段的显示内容的显示效果强于初步唤醒阶段时的显示内容的显示效果。
204、向用户输出所述显示内容,以便用户获知当前语音唤醒信息所达到的唤醒程度。
基于不同的唤醒阶段的显示效果是不同的,因此当前述步骤203确定了当前用户的多个语音唤醒信息对应的唤醒阶段之后,则可以向用户输出对应当前唤醒阶段的显示内容,从而实现对用户进行提示的效果。
另外,为实际应用中为了简化输出的内容,并减少预先设置不同唤醒阶段中不同显示内容所带来的工作量,在具体执行时,还可能存在采用相同的图案或者文字的显示内容的情况,即所述不同阶段的显示内容均包含有相同的图形、文字组合时,在此,为了确保相同的显示内容带来不同的显示效果在本发明实施例中可以通过改变显示内容的显示频率、字体或图案的色温颜色等方式来实现对相同显示内容的不同显示效果的功能。
因此,基于上述情况时,本步骤向用户输出所述显示内容的具体过程可以为:当所述唤醒阶段发生变化时,将所述当前显示内容的显示效果进行调整,以便适配唤醒阶段的变化,所述显示效果的调整包括亮度、颜色色温、闪烁频率等至少一种的变化。例如,当设备在初步唤醒阶段的显示内容为淡蓝色的“你好主人”时,则当设备进入到完全唤醒阶段时,其显示的内容则可以通过改变为原显示内容的文字不变,仅将颜色改为亮黄色,这样,通过调整所显示的字体颜色即可实现在显示内容(文字仍为“你好主人”)并未发生变化时仅通过显示文字的颜色变化即可提示唤醒阶段变化的效果。
本发明提供的另一种设备唤醒方法,与现有技术中在语音唤醒时,需要用户等待唤醒词的整体分析结果,而无从得知智能设备实时所采集和分析唤醒词的情况相比,本发明首先接收语音唤醒信息,并根据所述语音唤醒信息判断唤醒阶段,然后根据所述唤醒阶段,确定对应所述唤醒阶段的显示内容,最后向用户输出所述显示内容,以便用户获知当前语音唤醒信息所达到的唤醒程度,其中,所述唤醒阶段是根据所述语音唤醒信息与预设唤醒词匹配程度确定的,从而实现设备的语音唤醒过程中能够在用户发出的语音唤醒信息是否为智能设备所采集和识别的实时状态进行输出,解决了目前现有技术无法实时了解用户当前发出的语音唤醒信息的实时分析效果的问题,使得用户能够第一时间获知自己所发出的语音唤醒信息是否被设备接收和识别,以及能够使设备进入到何种唤醒阶段,极大的改善了用户在语音唤醒过程中的用户体验。
进一步的,依据上述方法实施例,本发明的另一个实施例还提供了一种设备唤醒装置,如图3所示,所述装置包括:
接收单元31,可以用于接收语音唤醒信息,并根据所述语音唤醒信息判断唤醒阶段,所述唤醒阶段是根据所述语音唤醒信息与预设唤醒词匹配程度确定的;
确定单元32,可以用于根据所述接收单元31确定的唤醒阶段,确定对应所述唤醒阶段的显示内容;
输出单元33,可以用于向用户输出所述确定单元32确定的显示内容,以便用户获知当前语音唤醒信息所达到的唤醒程度。
可选的,如图4所示,所述预设唤醒词包含有至少一个唤醒分词;
所述接收单元31,包括:
采集模块311,可以用于从外界采集语音唤醒信息;
确定模块312,可以用于根据所述采集模块311采集的语音唤醒信息与所述预设唤醒词包含的唤醒分词进行匹配,并根据预设对应关系确定所匹配的唤醒分词对应的唤醒阶段,所述预设对应关系中包含有每个分词分别对应的所述唤醒阶段。
可选的,如图4所示,所述确定模块312,包括:
匹配子模块3121,可以用于当在预置时间段内采集到多个语音唤醒信息时,根据接收顺序将所述多个语音唤醒信息与预设唤醒词中包含的多个唤醒分词分别按照唤醒分词顺序进行匹配,所述接收顺序为所述多个语音唤醒信息的在被采集时的顺序,所述唤醒分词顺序是根据所述预设唤醒词中唤醒分词在录制时的排列顺序确定的;
第一确定子模块3122,可以用于匹配子模块3121当根据所述接收顺序将所述多个语音唤醒信息与预设唤醒词中包含的多个唤醒分词分别按照唤醒分词顺序相匹配时,则确定相匹配的多个唤醒词中唤醒分词顺序的排序最后的唤醒分词;
第二确定子模块3123,可以用于根据所述预设对应关系以及所述第一确定子模块3122确定的排序最后的唤醒分词,确定对应的所述唤醒阶段。
可选的,如图4所示,所述装置还包括:
设置单元34,可以用于设置唤醒显示关系,其中,所述唤醒显示关系中包含有多个唤醒阶段,以及每个唤醒阶段对应的显示内容,每个显示内容的显示效果不同。
可选的,如图4所示,所述确定单元32,具体可以用于通过所述设置单元34设置的唤醒显示关系,确定对应所述唤醒阶段的显示内容。
可选的,如图4所示,所述每个显示内容的显示效果随着唤醒阶段的变化而变化,在多个所述唤醒阶段中至少包括初步唤醒阶段与完全唤醒阶段,所述完全唤醒阶段的显示内容的显示效果强于初步唤醒阶段时的显示内容的显示效果。
可选的,如图4所示,当所述不同阶段的显示内容均包含有相同的图形、文字组合时,
所述输出单元33,具体可以用于当所述唤醒阶段发生变化时,将所述当前显示内容的显示效果进行调整,以便适配唤醒阶段的变化,所述显示效果的调整包括亮度、颜色色温、闪烁频率等至少一种的变化。
本发明实施例提供的一种设备唤醒的装置,与现有技术中在语音唤醒时,需要用户等待唤醒词的整体分析结果,而无从得知智能设备实时所采集和分析唤醒词的情况相比,本发明首先接收语音唤醒信息,并根据所述语音唤醒信息判断唤醒阶段,然后根据所述唤醒阶段,确定对应所述唤醒阶段的显示内容,最后向用户输出所述显示内容,以便用户获知当前语音唤醒信息所达到的唤醒程度,其中,所述唤醒阶段是根据所述语音唤醒信息与预设唤醒词匹配程度确定的,从而实现设备的语音唤醒过程中能够在用户发出的语音唤醒信息是否为智能设备所采集和识别的实时状态进行输出,解决了目前现有技术无法实时了解用户当前发出的语音唤醒信息的实时分析效果的问题,使得用户能够第一时间获知自己所发出的语音唤醒信息是否被设备接收和识别,以及能够使设备进入到何种唤醒阶段,极大的改善了用户在语音唤醒过程中的用户体验。
进一步的,依据上述实施例,本发明的另一个实施例还提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行如上所述的设备唤醒的方法。
进一步的,依据上述实施例,如图5所示,本发明的另一个实施例还提供了一种电子设备50如图5所示,其中包括:存储器51、处理器52和通讯总线53;
处理器52可以包括中央处理单元(Central Processing Unit,CPU)、数字信号处理器(digital signal processor,DSP)、微控制器(Microcontroller Unit,MCU)、专用集成电路(Application Specific Integrated Circuit,ASIC)或现场可编程逻辑门阵列(Field-Programmable Gate Array,FPGA)中的至少一个。
存储器51与处理器52通过通讯总线53通讯连接;
存储器51中存储有计算机可执行指令,处理器52用于执行计算机可执行指令,以实现本申请实施例任一可选实施方式提供的设备唤醒方法。
计算机可执行指令可以以软件功能单元的形式实现并能够作为独立的产品销售或使用,存储器51可以是任意形式的计算机可读取存储介质。基于这样的理解,本申请的技术方案的全部或部分可以以软件产品的形式体现出来,包括若干指令用以使得一台计算机设备,具体可以是处理器,来执行本申请各个实施例中终端的全部或部分步骤。而前述的计算机可读存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,本申请提供的移动终端实施例与本申请提供的设备唤醒方法实施例具有相同或类似的效果,本实施例不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,设备和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的一种设备唤醒方法、装置及电子设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者设备程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干设备的单元权利要求中,这些设备中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
Claims (10)
1.一种设备唤醒方法,其特征在于,包括:
接收语音唤醒信息,并根据所述语音唤醒信息判断唤醒阶段,所述唤醒阶段是根据所述语音唤醒信息与预设唤醒词匹配程度确定的;
根据所述唤醒阶段,确定对应所述唤醒阶段的显示内容;
向用户输出所述显示内容,以便用户获知当前语音唤醒信息所达到的唤醒程度。
2.根据权利要求1所述的方法,其特征在于,所述预设唤醒词包含有至少一个唤醒分词;
所述接收语音唤醒信息,并根据所述语音唤醒信息判断唤醒阶段,包括:
从外界采集语音唤醒信息;
根据所述语音唤醒信息与所述预设唤醒词包含的唤醒分词进行匹配,并根据预设对应关系确定所匹配的唤醒分词对应的唤醒阶段,所述预设对应关系中包含有每个分词分别对应的所述唤醒阶段。
3.根据权利要求2所述的方法,其特征在于,所述根据所述语音唤醒信息与所述预设唤醒词包含的唤醒分词进行匹配,并根据预设对应关系确定所匹配的唤醒分词对应的唤醒阶段包括:
当在预置时间段内采集到多个语音唤醒信息时,根据接收顺序将所述多个语音唤醒信息与预设唤醒词中包含的多个唤醒分词分别按照唤醒分词顺序进行匹配,所述接收顺序为所述多个语音唤醒信息的在被采集时的顺序,所述唤醒分词顺序是根据所述预设唤醒词中唤醒分词在录制时的排列顺序确定的;
当根据所述接收顺序将所述多个语音唤醒信息与预设唤醒词中包含的多个唤醒分词分别按照唤醒分词顺序相匹配时,则确定相匹配的多个唤醒词中唤醒分词顺序的排序最后的唤醒分词;
根据所述预设对应关系以及所述排序最后的唤醒分词,确定对应的所述唤醒阶段。
4.根据权利要求1所述的方法,其特征在于,在根据所述唤醒阶段,确定对应所述唤醒阶段的显示内容之前,所述方法还包括:
设置唤醒显示关系,其中,所述唤醒显示关系中包含有多个唤醒阶段,以及每个唤醒阶段对应的显示内容,每个显示内容的显示效果不同。
5.根据权利要求4所述的方法,其特征在于,所述根据所述唤醒阶段,确定对应所述唤醒阶段的显示内容包括:
通过所述唤醒显示关系,确定对应所述唤醒阶段的显示内容。
6.根据权利要求1所述的方法,其特征在于,所述每个显示内容的显示效果随着唤醒阶段的变化而变化,在多个所述唤醒阶段中至少包括初步唤醒阶段与完全唤醒阶段,所述完全唤醒阶段的显示内容的显示效果强于初步唤醒阶段时的显示内容的显示效果。
7.根据权利要求6所述的方法,其特征在于,当所述不同阶段的显示内容均包含有相同的图形、文字组合时,
所述向用户输出所述显示内容,包括:
当所述唤醒阶段发生变化时,将所述当前显示内容的显示效果进行调整,以便适配唤醒阶段的变化,所述显示效果的调整包括亮度、颜色色温、闪烁频率等至少一种的变化。
8.一种设备唤醒装置,其特征在于,包括:
接收单元,用于接收语音唤醒信息,并根据所述语音唤醒信息判断唤醒阶段,所述唤醒阶段是根据所述语音唤醒信息与预设唤醒词匹配程度确定的;
确定单元,用于根据所述唤醒阶段,确定对应所述唤醒阶段的显示内容;
输出单元,用于向用户输出所述显示内容,以便用户获知当前语音唤醒信息所达到的唤醒程度。
9.一种电子设备,其特征在于,包括存储器、处理器和通讯总线;
所述存储器与所述处理器通过所述通讯总线通讯连接;
所述存储器中存储有计算机可执行指令,所述处理器用于执行所述计算机可执行指令,以实现权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令在被执行时,用于实现权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911408594.9A CN113129884A (zh) | 2019-12-31 | 2019-12-31 | 设备唤醒方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911408594.9A CN113129884A (zh) | 2019-12-31 | 2019-12-31 | 设备唤醒方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113129884A true CN113129884A (zh) | 2021-07-16 |
Family
ID=76770550
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911408594.9A Pending CN113129884A (zh) | 2019-12-31 | 2019-12-31 | 设备唤醒方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113129884A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117116263A (zh) * | 2023-09-15 | 2023-11-24 | 广州易云信息技术有限公司 | 一种基于语音识别的智能机器人唤醒方法、装置及存储介质 |
-
2019
- 2019-12-31 CN CN201911408594.9A patent/CN113129884A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117116263A (zh) * | 2023-09-15 | 2023-11-24 | 广州易云信息技术有限公司 | 一种基于语音识别的智能机器人唤醒方法、装置及存储介质 |
CN117116263B (zh) * | 2023-09-15 | 2024-04-12 | 广州易云信息技术有限公司 | 一种基于语音识别的智能机器人唤醒方法、装置及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108874356B (zh) | 语音播报方法、装置、移动终端和存储介质 | |
CN110246512B (zh) | 声音分离方法、装置及计算机可读存储介质 | |
CN106710592B (zh) | 一种智能硬件设备中的语音识别纠错方法和装置 | |
CN107731228B (zh) | 英文语音信息的文本转换方法和装置 | |
CN110148399A (zh) | 一种智能设备的控制方法、装置、设备及介质 | |
US9928831B2 (en) | Speech data recognition method, apparatus, and server for distinguishing regional accent | |
CN105205454A (zh) | 自动捕捉目标物的系统和方法 | |
CN110570873B (zh) | 声纹唤醒方法、装置、计算机设备以及存储介质 | |
CN107357787B (zh) | 语义交互方法、装置及电子设备 | |
CN109840883B (zh) | 一种训练物体识别神经网络的方法、装置及计算设备 | |
CN109215638B (zh) | 一种语音学习方法、装置、语音设备及存储介质 | |
CN108039175B (zh) | 语音识别方法、装置及服务器 | |
CN110111778B (zh) | 一种语音处理方法、装置、存储介质及电子设备 | |
CN109065046A (zh) | 语音唤醒的方法、装置、电子设备及计算机可读存储介质 | |
CN112183488B (zh) | 人脸检测模型训练方法、设备及人脸检测方法 | |
CN109697981A (zh) | 一种语音交互方法、装置、设备及存储介质 | |
CN112667076A (zh) | 一种语音交互的数据处理方法和装置 | |
CN113129884A (zh) | 设备唤醒方法、装置及电子设备 | |
CN112233665A (zh) | 模型训练的方法和装置、电子设备和存储介质 | |
CN112151034A (zh) | 设备的语音控制方法、装置、电子设备及存储介质 | |
CN109872718A (zh) | 语音数据的答案获取方法及装置、存储介质、计算机设备 | |
KR102414783B1 (ko) | 전자 장치 및 이의 제어방법 | |
CN116935288A (zh) | 基于大语言模型控制的视频自动分析方法、装置及介质 | |
CN111161745A (zh) | 一种智能设备的唤醒方法、装置、设备及介质 | |
CN110570838A (zh) | 语音流处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20210716 |