CN110968353A - 中央处理器的唤醒方法、装置、语音处理器以及用户设备 - Google Patents
中央处理器的唤醒方法、装置、语音处理器以及用户设备 Download PDFInfo
- Publication number
- CN110968353A CN110968353A CN201911238105.XA CN201911238105A CN110968353A CN 110968353 A CN110968353 A CN 110968353A CN 201911238105 A CN201911238105 A CN 201911238105A CN 110968353 A CN110968353 A CN 110968353A
- Authority
- CN
- China
- Prior art keywords
- voice
- processor
- speech
- processing unit
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 230000002618 waking effect Effects 0.000 claims description 11
- 230000006870 function Effects 0.000 description 10
- 238000004590 computer program Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 5
- 238000001914 filtration Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000001960 triggered effect Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000005282 brightening Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/4401—Bootstrapping
- G06F9/4418—Suspend and resume; Hibernate and awake
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Security & Cryptography (AREA)
- Life Sciences & Earth Sciences (AREA)
- Telephone Function (AREA)
Abstract
本申请实施例提供了中央处理器的唤醒方法、装置、语音处理器以及用户设备,用于有效降低唤醒机制所需的功耗。本申请实施例中央处理器的唤醒方法应用于用户设备的语音处理器,包括:语音处理器获取麦克风采集的语音信号;语音处理器对语音信号进行语音识别处理,识别语音信号中是否包含预设的唤醒词;当语音信号包含唤醒词时,语音处理器向中央处理器发送触发信号,触发中央处理器从休眠状态切换至工作状态。通过将唤醒处理交由功耗较小的语音处理器执行,由此中央处理器可得到更为深层的休眠状态,避免现有技术中功耗较大的中央处理器需要长时间保留唤醒处理对应线程的功耗,由此可有效减少用户设备的唤醒机制的功耗。
Description
技术领域
本申请涉及用户设备领域,具体涉及中央处理器的唤醒方法、装置、语音处理器以及用户设备。
背景技术
用户设备的休眠状态,指的是用户设备停止大部分的数据处理,使得处于低负荷的工作状态中,以此降低用户设备的功耗;用户设备的唤醒,指的是需要用户设备进行正常工作时,通过唤醒机制将用户设备的休眠状态切换至正常的工作状态。
在现有的唤醒机制中,用户设备对于是否进行唤醒操作需要长时间维持检测状态,以保证有效唤醒以及有效的用户体验,但是该唤醒操作本身却也带来不小的功耗。
发明内容
本申请实施例提供了中央处理器的唤醒方法、装置、语音处理器以及用户设备,用于有效降低唤醒机制所需的功耗。
第一方面,本申请实施例提供了一种中央处理器的唤醒方法,应用于用户设备的语音处理器,方法包括:
语音处理器获取麦克风采集的语音信号;
语音处理器对语音信号进行语音识别处理,识别语音信号中是否包含预设的唤醒词;
当语音信号包含唤醒词时,语音处理器向中央处理器发送触发信号,触发中央处理器从休眠状态切换至工作状态。
结合本申请第一方面,在本申请第一方面第一种可能的实现方式中,语音处理器对语音信号进行语音识别处理,识别语音信号中是否包含预设的唤醒词包括:
语音处理器通过预设的语义识别模型对语音信号进行语义识别处理,其中,语义识别模型由语义训练集训练初始模型得到,语义训练集包括与唤醒词对应的不同语义信息;
语音处理器将语义识别模型输出的语义识别结果与唤醒词输入多层感知机进行匹配打分,得到语义识别结果与预设的唤醒词的匹配值,其中,唤醒词输入多层感知机由匹配打分训练集训练初始多层感知机得到,匹配打分训练集包括不同语音信息对应的不同匹配值;
当匹配值达到阈值时,语音处理器确定语音信号包含唤醒词。
结合本申请第一方面第一种可能的实现方式,在本申请第一方面第二种可能的实现方式中,麦克风至少两个,语音处理器对语音信号进行语音识别处理,识别语音信号中是否包含预设的唤醒词之前,方法还包括:
语音处理器获取至少两个麦克风的空间参数;
语音处理器从语音信号中分离出人声信号;
语音处理器根据空间参数,对语音信号中的人声信号进行声源定位;
语音处理器根据声源定位的定位结果,对人声信号进行语音增强处理;
语音处理器将通过语音增强处理后的人声信号作为语音识别处理的输入信号。
结合本申请第一方面,在本申请第一方面第三种可能的实现方式中,语音处理器获取麦克风采集的语音信号之前,方法还包括:
语音处理器接收中央处理器发送的休眠信号,其中,休眠信号用于指示中央处理器将处于休眠状态;
语音处理器触发对语音信号进行语音识别处理;或者,
语音处理器检测中央处理器是否处于休眠状态;
当检测到中央处理器处于休眠状态时,语音处理器触发对语音信号进行语音识别处理。
结合本申请第一方面,在本申请第一方面第四种可能的实现方式中,当语音信号包含唤醒词时,语音处理器向中央处理器发送触发信号之后,方法还包括:
语音处理器检测中央处理器是否从休眠状态切换至工作状态;
在检测到中央处理器从休眠状态切换至工作状态后,语音处理器停止对语音信号进行语音识别处理。
第二方面,本申请实施例还提供了中央处理器的唤醒装置,唤醒装置包括:
获取单元,用于获取麦克风采集的语音信号;
识别单元,用于对语音信号进行语音识别处理,识别语音信号中是否包含预设的唤醒词,当语音信号包含唤醒词时,触发发送单元;
发送单元,用于语音处理器向中央处理器发送触发信号,触发中央处理器从休眠状态切换至工作状态。
结合本申请第二方面,在本申请第二方面第一种可能的实现方式中,识别单元,具体可用于:
通过预设的语义识别模型对语音信号进行语义识别处理,其中,语义识别模型由语义训练集训练初始模型得到,语义训练集包括与唤醒词对应的不同语义信息;
将语义识别模型输出的语义识别结果与唤醒词输入多层感知机进行匹配打分,得到语义识别结果与预设的唤醒词的匹配值,其中,唤醒词输入多层感知机由匹配打分训练集训练初始多层感知机得到,匹配打分训练集包括不同语音信息对应的不同匹配值;
当匹配值达到阈值时,确定语音信号包含唤醒词。
结合本申请第二方面第一种可能的实现方式,在本申请第二方面第二种可能的实现方式中,麦克风至少两个,唤醒装置还包括预处理单元,用于:
获取至少两个麦克风的空间参数;
从语音信号中分离出人声信号;
根据空间参数,对语音信号中的人声信号进行声源定位;
根据声源定位的定位结果,对人声信号进行语音增强处理;
将通过语音增强处理后的人声信号作为语音识别处理的输入信号。
结合本申请第二方面,在本申请第二方面第三种可能的实现方式中,唤醒装置还包括触发单元,用于:
接收中央处理器发送的休眠信号,其中,休眠信号用于指示中央处理器将处于休眠状态;
触发对语音信号进行语音识别处理;或者,
检测中央处理器是否处于休眠状态;
当检测到中央处理器处于休眠状态时,触发对语音信号进行语音识别处理。
结合本申请第二方面,在本申请第二方面第三种可能的实现方式中,唤醒装置还包括停止单元,用于:
检测中央处理器是否从休眠状态切换至工作状态;
在检测到中央处理器从休眠状态切换至工作状态后,停止对语音信号进行语音识别处理。
第三方面,本申请实施例还提供了一种语音处理器,语音处理器包括本申请第二方面或者第二方面任一种实现方式中的中央处理器的唤醒装置。
第四方面,本申请实施例还提供了一种用户设备,用于设备包括本申请第二方面或者第二方面任一种实现方式中的中央处理器的唤醒装置。
第五方面,本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有多条指令,指令适于语音处理器进行加载,以执行本申请实施例第一方面或者第一方面任一种实现方式中的中央处理器的唤醒方法。
从以上内容可得出,本申请实施例具有以下的有益效果:
通过将唤醒处理交由功耗较小的语音处理器执行,由此中央处理器可得到更为深层的休眠状态,避免现有技术中功耗较大的中央处理器需要长时间保留唤醒处理对应线程的功耗,由此可有效减少用户设备的唤醒机制的功耗。
此外,由于唤醒处理是交由语音处理器执行的,在用户设备的中央处理器不变的情况下方便植入唤醒机制的同时,中央处理器也可得到更为深层的休眠状态,减少休眠状态下中央处理器的工作负荷,后续中央处理器的唤醒仅需由语音处理器触发,进而可提高中央处理器的唤醒效率,可更为快速恢复工作状态。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例中央处理器的唤醒方法的一种流程示意图;
图2是本申请实施例用户设备或者中央处理器的唤醒装置的一种结构示意图;
图3是本申请实施例图1对应实施例步骤S102的一种流程示意图;
图4是本申请实施例中央处理器的唤醒方法的又一种流程示意图;
图5是本申请实施例中央处理器的虚拟装置的一种结构示意图;
图6是本申请实施例用户设备的一种结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在以下的说明中,本申请的具体实施例将参考由一部或多部计算机所执行的步骤及符号来说明,除非另有述明。因此,这些步骤及操作将有数次提到由计算机执行,本文所指的计算机执行包括了由代表了以一结构化型式中的数据的电子信号的计算机处理单元的操作。此操作转换该数据或将其维持在该计算机的内存系统中的位置处,其可重新配置或另外以本领域测试人员所熟知的方式来改变该计算机的运作。该数据所维持的数据结构为该内存的实体位置,其具有由该数据格式所定义的特定特性。但是,本申请原理以上述文字来说明,其并不代表为一种限制,本领域测试人员将可了解到以下所述的多种步骤及操作亦可实施在硬件当中。
本申请的原理使用许多其它泛用性或特定目的运算、通信环境或组态来进行操作。所熟知的适合用于本申请的运算系统、环境与组态的范例可包括(但不限于)手持电话、个人计算机、服务器、多处理器系统、微电脑为主的系统、主架构型计算机、及分布式运算环境,其中包括了任何的上述系统或装置。
本申请中的术语“第一”、“第二”和“第三”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。
首先,在介绍本申请实施例之前,先介绍下本申请关于应用背景的相关内容。
本申请提供的中央处理器的唤醒方法的执行主体可以为中央处理器的唤醒装置,或者集成了该唤醒装置的用户设备(User Equipment,UE),其中,该唤醒装置可以采用硬件或者软件的方式实现,用户设备具体可以为智能手机、平板电脑、智能手表、智能手环、笔记本电脑、掌上电脑或者个人数字助理(Personal Digital Assistant,PDA)等终端设备,包括中央处理器(Central Processing Unit,CPU)以及语音处理器,通过在语音处理器上应用本申请实施例提供的中央处理器的唤醒方法,对处于休眠状态的中央处理器进行唤醒操作,有效降低唤醒机制所需的功耗。
下面,开始介绍本申请提供的中央处理器的唤醒方法。
参阅图1,图1示出了本申请实施例中央处理器的唤醒方法的一种流程示意图,本申请实施例提供的中央处理器的唤醒方法,可通过步骤S101至步骤S103实现,具体详见下述内容:
步骤S101,语音处理器获取麦克风采集的语音信号;
可以理解,用户设备的组成构件中可包括麦克风,用于实现用户设备的语音功能,例如电话通信、应用程序的语音聊天或者虚拟电话通信等。
在本申请实施例中,则可通过语音处理器对接用户设备原有的麦克风,并通过麦克风采集实现本申请实施例中央处理器的唤醒方法所需的语音信号。
其中,如图2示出的本申请实施例用户设备或者中央处理器的唤醒装置的一种结构示意图,语音处理器为与中央处理器互相独立运行的硬件结构,在麦克风的正常工作中,可将采集到的语音信号输出至语音处理器进行相关的语音处理,实现用户设备的语音功能或者实现本申请实施例中的唤醒机制。麦克风、语音处理器以及中央处理器三者可以按照图2所示的分别与电源模块连接,形成独立的供电线路,或者,也可采用其他供电线路部署方案,具体在此不做限定。
在应用本申请提供的中央处理器的唤醒方法时,可以与用户设备原有的语音功能不同的是,语音处理器可以预设麦克风周遭的语音信号采集范围,例如可预设麦克风5m范围的语音信号采集范围,在获取到麦克风采集到的语音信号后,语音处理器即可对该语音信号进行语音识别处理,确定是否唤醒中央处理器。
步骤S102,语音处理器对语音信号进行语音识别处理,识别语音信号中是否包含预设的唤醒词;
语音处理器可调用处理器内部预设的语音识别算法或者语音识别模型,对步骤S101中麦克风采集到的语音信号进行语音识别处理,以识别该语音信号中是否包含预设的唤醒词。
可以理解,唤醒词,可以一个或者多个,例如“唤醒”、“工作”、“开机”、“亮屏”、“解锁”等系统预置或者用户手动设置的关键词,以一场景为例,用户可将个人手机设置为休眠状态并暂时离开家里,待回来时可靠近手机说出“解锁”,语音处理器识别出对应的“解锁”唤醒词,即可唤醒手机的处理器,使其亮屏、解屏幕锁,向用户展示手机的系统桌面页面。
当然,在一些实施例中,步骤S101中麦克风采集到的语音信号中,也可无需直接包含预设的唤醒词,换句话换句话说,可间接包含预设的唤醒词。
对应的,参阅图3实处的本申请实施例步骤S102的一种流程示意图,步骤S102中,具体可包括如下步骤:
步骤S301,语音处理器通过预设的语义识别模型对语音信号进行语义识别处理;
其中,语义识别模型由语义训练集训练初始模型得到,语义训练集包括唤醒词对应的不同语义信息。
可以理解,语音信号可间接包含的唤醒词,可根据不同用户、不同场景、或者其他不同条件下,预设不同的识别方式,进而预设不同的语义信息。
因此,可预先通过不同的语义信息训练得到一语义识别模型,用于识别语音信息中的语义,从而可根据当前识别出的语义识别结果,再判断改语义识别结果中是否间接包含了唤醒词。
步骤S302,语音处理器将语义识别模型输出的语义识别结果与唤醒词输入多层感知机进行匹配打分,得到语义识别结果与预设的唤醒词的匹配值;
其中,唤醒词输入多层感知机由匹配打分训练集训练初始多层感知机得到,匹配打分训练集包括不同语音信息对应的不同匹配值。
在本申请实施例中,可通过匹配值机制判断语音信息中是否间接包含了唤醒词。
具体的,可预设通过不同的语义信息对应的不同匹配值训练唤醒词多层感知机,在通过语义识别模型得到当前语音信息对应的语义识别结果后,语音处理器即可将其与预设的唤醒词输入多层感知机进行匹配打分,得到语义识别结果与预设的唤醒词的匹配值。
步骤S303,当匹配值达到阈值时,语音处理器确定语音信号包含唤醒词。
对于匹配值机制,可预设有阈值,用于根据步骤S302中得到的匹配值判断语音信号中是否包含了唤醒词。
以智能手环为例,用户可预先在智能手环中录入自身的语音特征,当智能手环处于休眠状态时,若采集到用户说出包含“等下出门”的语音信号时,在根据当前语音信号的语音特征确定为用户自身发出时,语音处理器可确认该“等下出门”与“记录步数”达到了80%的匹配值,从而唤醒中央处理器,触发智能手环开始此采集用户的步数等数据。
或者,还是以手机为例,在会议中用户将手机置于休眠状态以避免发出声响影响会议,此时,若采集到手机周遭出现了包含“会议结束”的语音信号,语音处理器可确认该“会议结束”与“查看未读消息”的匹配值达到0.62,从而唤醒中央处理器,供用户及时查看手机的最新收到消息,及时处理相关事项。
上述语音信号是以用户出发的,在实际应用中,环境声音中也可包含唤醒的意思,例如,当语音处理器长时间检测到毫无用户语音的嘈杂声音并且当前又检测到声音突然大幅度消失时,此时语音处理器可确认“环境声音的变化趋势由嘈杂突变为安静”与“拨打电话”的匹配值达到83%,即触发中央处理器,待用户使用手机,拨打电话、查看消息等等。
从上述可看出,本申请实施例中,可设置与唤醒相关的用户语音事件或者环境声音变化事件,实现语音信号可间接包含唤醒词,从而无需用户说出唤醒词,即可唤醒中央处理器,可更加灵活地实现中央处理器的唤醒机制,并且还可避免现有唤醒机制中采集到的用户说的话与预设的唤醒词有所偏差时导致唤醒失败的情况,进一步提高唤醒机制的检测成功率。
当然,在一些实施例中,语音处理器在基于步骤S101获取的语音信号进行语音识别处理之前,还可对该语音信号进行预处理,以提高该语音信号的识别效果。
例如,参阅图4示出的本申请实施例中央处理器的唤醒方法的又一种流程示意图,当用户设备设置至少两个麦克风时,步骤S102之前,本申请实施例中央处理器的唤醒方法还可包括如下内容,进行语音信号的预处理:
步骤S401,语音处理器获取至少两个麦克风的空间参数;
可以理解,当麦克风为多个时,可根据不同空间位置的麦克风所采集到的语音信号之间的差异,在融合语音信号的过程中进行确定目标语音信号的声源位置,并进行目标语音信号的优化。
因此,在基于麦克风的位置或者空间阵列对语音信号进行优化时,可先获取这些麦克风的空间参数。
步骤S402,语音处理器从语音信号中分离出人声信号;
此外,在得到麦克风所采集到的语音信号后,语音处理器还可通过分离算法,从该语音信号中分离出人声部分,可以理解,上述内容中已提及用户可在发出的语音中直接包含或者间接包含了唤醒词,因此,语音处理器可优先考虑语音信号中的人声信号。
步骤S403,语音处理器根据空间参数,对语音信号中的人声信号进行声源定位;
在得到麦克风的空间参数以及语音信号中的人声信号后,语音处理器可结合两者,对该人声信号进行声源定位。
例如,可计算N个麦克风分别采集到的子语音信号两两之间的相关度,以此确定子语音信号两两之间的时延,进而可确定声源方向。
在实际应用中,麦克风的数量优选为2个或者3个,以避免计算冗余以及麦克风数量对于用户设备硬件空间的挤占。
步骤S404,语音处理器根据声源定位的定位结果,对人声信号进行语音增强处理;
在得到声源定位的定位结果后,语音处理器即可将来自该定位结果的人声信号,进行语音增强处理,例如可通过频率补偿、脉冲过滤、自适应宽频滤波、自适应逆向滤波或者立体滤波等方式过滤语音信号中的加性噪声、人声间互相干扰、混响或者回声,以此得到更为纯净的人声信号,避免无效检测。
步骤S405,语音处理器将通过语音增强处理后的人声信号作为语音识别处理的输入信号。
在对人声信号进行语音增强处理后,即可完成语音信号的预处理,语音处理器再将通过语音增强处理后的人声信号作为语音识别处理的输入信号,执行步骤S102,进行语音识别处理,得到更为有效的语音识别结果。
步骤S103,当语音信号包含唤醒词时,语音处理器向中央处理器发送触发信号,触发中央处理器从休眠状态切换至工作状态。
通过上述步骤S102确定语音信号汇总直接包含或者间接包含了唤醒词时时,语音处理器即可唤醒中央处理器,即,向中央处理器发送预设的触发信号,触发中央处理器从休眠状态切换至工作状态,使得用户设备恢复正常的工作状态。
从以上可看出,本申请实施例提供的中央处理器的唤醒方法,通过将唤醒处理交由功耗较小的语音处理器执行,由此中央处理器可得到更为深层的休眠状态,避免现有技术中功耗较大的中央处理器需要长时间保留唤醒处理对应线程的功耗,由此可有效减少用户设备的唤醒机制的功耗。
此外,由于唤醒处理是交由语音处理器执行的,在用户设备的中央处理器不变的情况下方便植入唤醒机制的同时,中央处理器也可得到更为深层的休眠状态,减少休眠状态下中央处理器的工作负荷,后续中央处理器的唤醒仅需由语音处理器触发,进而可提高中央处理器的唤醒效率,可更为快速恢复工作状态。
接着,为便于进一步减少唤醒机制的功耗,还可实现如下实施例。
在一些实施例中,在通过步骤S101获取麦克风采集的语音信号之前,本申请实施例中央处理器的唤醒方法,还可包括:
语音处理器接收中央处理器发送的休眠信号,其中,休眠信号用于指示中央处理器将处于休眠状态;
语音处理器触发对语音信号进行语音识别处理。
可以理解,中央处理器在执行或者计划执行休眠任务时,可向语音处理器发送休眠信号,以触发语音处理器开始对麦克风采集到的语音信号进行语音识别处理,进而判断是否需要唤醒中央处理器。
除了上述的被动触发方式,语音处理器也可采用主动触发方式触发对麦克风采集到的语音信号进行语音识别处理,即,语音处理器可检测中央处理器是否处于休眠状态,当检测到中央处理器处于休眠状态时,语音处理器触发对语音信号进行语音识别处理。
在一些实施例中,在通过步骤S103向中央处理器发送触发信号后,本申请中央处理器的唤醒方法,还可包括:
语音处理器检测中央处理器是否从休眠状态切换至工作状态;
在检测到中央处理器从休眠状态切换至工作状态后,语音处理器停止对语音信号进行语音识别处理。
可以理解,在中央处理器唤醒之后,语音处理器即可停止对麦克风采集到的语音信号进行本申请实施例中的语音识别处理。
从上述两个实施例可看出,可分别设置语音处理器执行本申请实施例中央处理器的唤醒方法的触发条件以及停止条件,从而减少语音处理器执行本申请实施例中央处理器的唤醒方法的功耗。
为便于更好的实施本申请实施例的中央处理器的唤醒方法,本申请实施例还提供了中央处理器的唤醒装置。
请参阅图5,图5为本申请实施例的中央处理器的唤醒装置的一种结构示意图,其中该中央处理器的唤醒装置具体可包括如下结构:
获取单元501,用于获取麦克风采集的语音信号;
识别单元502,用于对语音信号进行语音识别处理,识别语音信号中是否包含预设的唤醒词,当语音信号包含唤醒词时,触发发送单元;
发送单元503,用于语音处理器向中央处理器发送触发信号,触发中央处理器从休眠状态切换至工作状态。
在一些实施例中,识别单元502,具体可用于:
通过预设的语义识别模型对语音信号进行语义识别处理,其中,语义识别模型由语义训练集训练初始模型得到,语义训练集包括与唤醒词对应的不同语义信息;
将语义识别模型输出的语义识别结果与唤醒词输入多层感知机进行匹配打分,得到语义识别结果与预设的唤醒词的匹配值,其中,唤醒词输入多层感知机由匹配打分训练集训练初始多层感知机得到,匹配打分训练集包括不同语音信息对应的不同匹配值;
当匹配值达到阈值时,确定语音信号包含唤醒词。
在一些实施例中,麦克风至少两个,唤醒装置还包括预处理单元504,用于:
获取至少两个麦克风的空间参数;
从语音信号中分离出人声信号;
根据空间参数,对语音信号中的人声信号进行声源定位;
根据声源定位的定位结果,对人声信号进行语音增强处理;
将通过语音增强处理后的人声信号作为语音识别处理的输入信号。
在一些实施例中,唤醒装置还包括触发单元505,用于:
接收中央处理器发送的休眠信号,其中,休眠信号用于指示中央处理器将处于休眠状态;
触发对语音信号进行语音识别处理;或者,
检测中央处理器是否处于休眠状态;
当检测到中央处理器处于休眠状态时,触发对语音信号进行语音识别处理。
在一些实施例中,唤醒装置还包括停止单元506,用于:
检测中央处理器是否从休眠状态切换至工作状态;
在检测到中央处理器从休眠状态切换至工作状态后,停止对语音信号进行语音识别处理。
本申请实施例还提供了语音处理器,语音处理器包括了图5示出的中央处理器的唤醒装置。
本申请实施例还提供了用户设备,参阅图6,图6示出了本申请实施例用户设备的一种结构示意图,具体的,本申请提供的用户设备包括中央处理器601以及语音处理器602,语音处理器602用于执行计算机程序时实现如图1至图4对应任意实施例中中央处理器的唤醒方法的各步骤;或者,中央处理器用于执行计算机程序时实现如图5对应实施例中各单元的功能。
示例性的,计算机程序可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在语音处理器602或者语音处理器602外的存储器603中,并由语音处理器602执行,以完成本申请实施例。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在计算机装置中的执行过程。
用户设备可包括,但不仅限于中央处理器601、语音处理器602以及存储器603。本领域技术人员可以理解,示意仅仅是用户设备的示例,并不构成对用户设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如用户设备还可以包括输入输出设备、网络接入设备、总线等,中央处理器601、语音处理器602、存储器603、输入输出设备以及网络接入设备等通过总线相连。
中央处理器601是用户设备的控制中心,利用各种接口和线路连接整个用户设备的各个部分。
存储器603可用于存储计算机程序和/或模块,语音处理器602可通过运行或执行存储在存储器603内的计算机程序和/或模块,以及调用存储在存储器603内的数据,实现本申请实施例的功能,中央处理器也可通过运行或执行存储在存储器603内的计算机程序和/或模块,以及调用存储在存储器603内的数据,实现其他功能。存储器603可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据用户设备的使用所创建的数据(比如音频数据、视频数据等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的中央处理器的唤醒装置、语音处理器、用户设备及其相应单元的具体工作过程,可以参考如图1至图4对应任意实施例中中央处理器的唤醒方法的说明,具体在此不再赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于计算机可读存储介质中,并由语音处理器进行加载和执行。
为此,本申请实施例提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被语音处理器进行加载,以执行本申请如图1至图4对应任意实施例中中央处理器的唤醒方法中的步骤,具体操作可参考如图1至图4对应任意实施例中中央处理器的唤醒方法的说明,在此不再赘述。
其中,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该计算机可读存储介质中所存储的指令,可以执行本申请如图1至图3对应任意实施例中中央处理器的唤醒方法中的步骤,因此,可以实现本申请如图1至图3对应任意实施例中中央处理器的唤醒方法所能实现的有益效果,详见前面的说明,在此不再赘述。
以上对本申请提供的中央处理器的唤醒方法、装置、语音处理器、用户设备以及计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种中央处理器的唤醒方法,其特征在于,所述方法应用于用户设备的语音处理器,所述方法包括:
所述语音处理器获取麦克风采集的语音信号;
所述语音处理器对所述语音信号进行语音识别处理,识别所述语音信号中是否包含预设的唤醒词;
当所述语音信号包含所述唤醒词时,所述语音处理器向中央处理器发送触发信号,触发所述中央处理器从休眠状态切换至工作状态。
2.根据权利要求1所述的方法,其特征在于,所述语音处理器对所述语音信号进行语音识别处理,识别所述语音信号中是否包含预设的唤醒词包括:
所述语音处理器通过预设的语义识别模型对所述语音信号进行语义识别处理,其中,所述语义识别模型由语义训练集训练初始模型得到,所述语义训练集包括与所述唤醒词对应的不同语义信息;
所述语音处理器将所述语义识别模型输出的语义识别结果与唤醒词输入多层感知机进行匹配打分,得到所述语义识别结果与所述预设的唤醒词的匹配值,其中,所述唤醒词输入多层感知机由匹配打分训练集训练初始多层感知机得到,所述匹配打分训练集包括不同语音信息对应的不同匹配值;
当所述匹配值达到阈值时,所述语音处理器确定所述语音信号包含所述唤醒词。
3.根据权利要求2所述的方法,其特征在于,所述麦克风至少两个,所述语音处理器对所述语音信号进行语音识别处理,识别所述语音信号中是否包含预设的唤醒词之前,所述方法还包括:
所述语音处理器获取至少两个所述麦克风的空间参数;
所述语音处理器从所述语音信号中分离出人声信号;
所述语音处理器根据所述空间参数,对所述语音信号中的人声信号进行声源定位;
所述语音处理器根据所述声源定位的定位结果,对所述人声信号进行语音增强处理;
所述语音处理器将通过所述语音增强处理后的所述人声信号作为所述语音识别处理的输入信号。
4.根据权利要求1所述的方法,其特征在于,所述语音处理器获取麦克风采集的语音信号之前,所述方法还包括:
所述语音处理器接收所述中央处理器发送的休眠信号,其中,所述休眠信号用于指示所述中央处理器将处于休眠状态;
所述语音处理器触发对所述语音信号进行所述语音识别处理;或者,
所述语音处理器检测所述中央处理器是否处于休眠状态;
当检测到所述中央处理器处于休眠状态时,所述语音处理器触发对所述语音信号进行所述语音识别处理。
5.根据权利要求1所述的方法,其特征在于,当所述语音信号包含所述唤醒词时,所述语音处理器向中央处理器发送触发信号之后,所述方法还包括:
所述语音处理器检测所述中央处理器是否从休眠状态切换至工作状态;
在检测到所述中央处理器从休眠状态切换至工作状态后,所述语音处理器停止对所述语音信号进行所述语音识别处理。
6.一种用户设备的唤醒装置,其特征在于,所述唤醒装置包括:
获取单元,用于获取麦克风采集的语音信号;
处理单元,用于对所述语音信号进行语音识别处理,识别所述语音信号中是否包含预设的唤醒词,当所述语音信号包含所述唤醒词时,触发发送单元;
所述发送单元,用于向中央处理器发送触发信号,其中,所述触发信号用于触发所述中央处理器从休眠状态切换至工作状态。
7.根据权利要求6所述的装置,其特征在于,所述处理单元,具体用于:
通过预设的语义识别模型对所述语音信号进行语义识别处理,其中,所述语义识别模型由语义训练集训练初始模型得到,所述语义训练集包括与所述唤醒词对应的不同语义信息;
将所述语义识别模型输出的语义识别结果与唤醒词输入多层感知机进行匹配打分,得到所述语义识别结果与所述预设的唤醒词的匹配值,其中,所述唤醒词输入多层感知机由匹配打分训练集训练初始多层感知机得到,所述匹配打分训练集包括不同语音信息对应的不同匹配值;
当所述匹配值达到阈值时,确定所述语音信号包含所述唤醒词。
8.一种语音处理器,其特征在于,所述语音处理器包括权利要求6或7所述的中央处理器的唤醒装置。
9.一种用户设备,其特征在于,包括中央处理器以及如权利要求8所述的语音处理器。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于语音处理器进行加载,以执行权利要求1至5任一项所述的中央处理器的唤醒方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911238105.XA CN110968353A (zh) | 2019-12-06 | 2019-12-06 | 中央处理器的唤醒方法、装置、语音处理器以及用户设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911238105.XA CN110968353A (zh) | 2019-12-06 | 2019-12-06 | 中央处理器的唤醒方法、装置、语音处理器以及用户设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110968353A true CN110968353A (zh) | 2020-04-07 |
Family
ID=70033115
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911238105.XA Pending CN110968353A (zh) | 2019-12-06 | 2019-12-06 | 中央处理器的唤醒方法、装置、语音处理器以及用户设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110968353A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111831100A (zh) * | 2020-07-06 | 2020-10-27 | Oppo广东移动通信有限公司 | 电子设备的控制方法、装置、存储介质及电子设备 |
CN112256848A (zh) * | 2020-10-12 | 2021-01-22 | 北京海益同展信息科技有限公司 | 一种智能机器人及智能交互方法 |
CN112948006A (zh) * | 2021-02-02 | 2021-06-11 | 深圳市江元科技(集团)有限公司 | 终端设备唤醒方法、装置、终端设备和存储介质 |
CN113516977A (zh) * | 2021-03-15 | 2021-10-19 | 南京每深智能科技有限责任公司 | 关键词识别方法及系统 |
CN113760218A (zh) * | 2020-06-01 | 2021-12-07 | 阿里巴巴集团控股有限公司 | 数据处理方法、装置、电子设备及计算机存储介质 |
CN115235535A (zh) * | 2022-06-10 | 2022-10-25 | 芯海科技(深圳)股份有限公司 | 信号测量装置、方法以及电子设备 |
CN115376545A (zh) * | 2021-05-21 | 2022-11-22 | 漳州立达信光电子科技有限公司 | 一种声音侦测方法、装置、设备及存储介质 |
CN117409779A (zh) * | 2023-12-14 | 2024-01-16 | 四川蜀天信息技术有限公司 | 一种语音唤醒方法、装置、系统及可读介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106157950A (zh) * | 2016-09-29 | 2016-11-23 | 合肥华凌股份有限公司 | 语音控制系统及其唤醒方法、唤醒装置和家电、协处理器 |
CN107277904A (zh) * | 2017-07-03 | 2017-10-20 | 上海斐讯数据通信技术有限公司 | 一种终端及语音唤醒方法 |
CN107360327A (zh) * | 2017-07-19 | 2017-11-17 | 腾讯科技(深圳)有限公司 | 语音识别方法、装置和存储介质 |
CN108717852A (zh) * | 2018-04-28 | 2018-10-30 | 湖南师范大学 | 一种基于白光通信和类脑认知的智能机器人语义交互系统和方法 |
CN108735200A (zh) * | 2018-06-27 | 2018-11-02 | 北京灵伴即时智能科技有限公司 | 一种说话人自动标注方法 |
CN108877805A (zh) * | 2018-06-29 | 2018-11-23 | 上海与德通讯技术有限公司 | 语音处理模组和具有语音功能的终端 |
CN208706231U (zh) * | 2018-06-29 | 2019-04-05 | 上海与德通讯技术有限公司 | 语音处理模组和具有语音功能的终端 |
CN110021307A (zh) * | 2019-04-04 | 2019-07-16 | Oppo广东移动通信有限公司 | 音频校验方法、装置、存储介质及电子设备 |
CN110223687A (zh) * | 2019-06-03 | 2019-09-10 | Oppo广东移动通信有限公司 | 指令执行方法、装置、存储介质及电子设备 |
US10467877B1 (en) * | 2017-07-09 | 2019-11-05 | Dsp Group Ltd. | Monitor and a method for monitoring a baby in a vehicle |
CN110473554A (zh) * | 2019-08-08 | 2019-11-19 | Oppo广东移动通信有限公司 | 音频校验方法、装置、存储介质及电子设备 |
-
2019
- 2019-12-06 CN CN201911238105.XA patent/CN110968353A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106157950A (zh) * | 2016-09-29 | 2016-11-23 | 合肥华凌股份有限公司 | 语音控制系统及其唤醒方法、唤醒装置和家电、协处理器 |
CN107277904A (zh) * | 2017-07-03 | 2017-10-20 | 上海斐讯数据通信技术有限公司 | 一种终端及语音唤醒方法 |
US10467877B1 (en) * | 2017-07-09 | 2019-11-05 | Dsp Group Ltd. | Monitor and a method for monitoring a baby in a vehicle |
CN107360327A (zh) * | 2017-07-19 | 2017-11-17 | 腾讯科技(深圳)有限公司 | 语音识别方法、装置和存储介质 |
CN108717852A (zh) * | 2018-04-28 | 2018-10-30 | 湖南师范大学 | 一种基于白光通信和类脑认知的智能机器人语义交互系统和方法 |
CN108735200A (zh) * | 2018-06-27 | 2018-11-02 | 北京灵伴即时智能科技有限公司 | 一种说话人自动标注方法 |
CN108877805A (zh) * | 2018-06-29 | 2018-11-23 | 上海与德通讯技术有限公司 | 语音处理模组和具有语音功能的终端 |
CN208706231U (zh) * | 2018-06-29 | 2019-04-05 | 上海与德通讯技术有限公司 | 语音处理模组和具有语音功能的终端 |
CN110021307A (zh) * | 2019-04-04 | 2019-07-16 | Oppo广东移动通信有限公司 | 音频校验方法、装置、存储介质及电子设备 |
CN110223687A (zh) * | 2019-06-03 | 2019-09-10 | Oppo广东移动通信有限公司 | 指令执行方法、装置、存储介质及电子设备 |
CN110473554A (zh) * | 2019-08-08 | 2019-11-19 | Oppo广东移动通信有限公司 | 音频校验方法、装置、存储介质及电子设备 |
Non-Patent Citations (6)
Title |
---|
MOUSERELECTRONICS: "声音隔离解锁语音增强技术", 《电子工程世界》 * |
天津滨海迅腾科技集团有限公司: "《走进大数据与人工智能》", 31 August 2018 * |
张有为等: "《人机自然交互》", 30 September 2004, 国防工业出版社 * |
张涛等: "《与信息时代同行 与创新精神共进 北京信息科技大学信息与通信工程学院大学生科技创新与工程实践论文集》", 31 July 2017, 北京邮电大学出版社 * |
贸泽: "关于语音增强技术的介绍和应用", 《电子发烧友》 * |
贸泽: "声音隔离解锁语音增强技术", 《E蜂窝》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113760218A (zh) * | 2020-06-01 | 2021-12-07 | 阿里巴巴集团控股有限公司 | 数据处理方法、装置、电子设备及计算机存储介质 |
CN111831100A (zh) * | 2020-07-06 | 2020-10-27 | Oppo广东移动通信有限公司 | 电子设备的控制方法、装置、存储介质及电子设备 |
CN111831100B (zh) * | 2020-07-06 | 2022-03-22 | Oppo广东移动通信有限公司 | 电子设备的控制方法、装置、存储介质及电子设备 |
CN112256848A (zh) * | 2020-10-12 | 2021-01-22 | 北京海益同展信息科技有限公司 | 一种智能机器人及智能交互方法 |
CN112948006A (zh) * | 2021-02-02 | 2021-06-11 | 深圳市江元科技(集团)有限公司 | 终端设备唤醒方法、装置、终端设备和存储介质 |
CN113516977A (zh) * | 2021-03-15 | 2021-10-19 | 南京每深智能科技有限责任公司 | 关键词识别方法及系统 |
CN115376545A (zh) * | 2021-05-21 | 2022-11-22 | 漳州立达信光电子科技有限公司 | 一种声音侦测方法、装置、设备及存储介质 |
CN115235535A (zh) * | 2022-06-10 | 2022-10-25 | 芯海科技(深圳)股份有限公司 | 信号测量装置、方法以及电子设备 |
CN117409779A (zh) * | 2023-12-14 | 2024-01-16 | 四川蜀天信息技术有限公司 | 一种语音唤醒方法、装置、系统及可读介质 |
CN117409779B (zh) * | 2023-12-14 | 2024-02-23 | 四川蜀天信息技术有限公司 | 一种语音唤醒方法、装置、系统及可读介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110968353A (zh) | 中央处理器的唤醒方法、装置、语音处理器以及用户设备 | |
US9734830B2 (en) | Speech recognition wake-up of a handheld portable electronic device | |
CN105723451B (zh) | 从低功率始终侦听模式到高功率语音识别模式的转换 | |
CN103871408B (zh) | 一种语音识别方法及装置、电子设备 | |
CN108337362A (zh) | 语音交互方法、装置、设备和存储介质 | |
US11587560B2 (en) | Voice interaction method, device, apparatus and server | |
WO2020244257A1 (zh) | 语音唤醒方法、系统、电子设备及计算机可读存储介质 | |
CN112201246A (zh) | 基于语音的智能控制方法、装置、电子设备及存储介质 | |
CN107610698A (zh) | 一种实现语音控制的方法、机器人及计算机可读存储介质 | |
CN110853644B (zh) | 语音唤醒方法、装置、设备及存储介质 | |
CN111128166B (zh) | 连续唤醒识别功能的优化方法和装置 | |
CN112230877A (zh) | 一种语音操作方法、装置、存储介质及电子设备 | |
WO2021008458A1 (en) | Method for voice recognition via earphone and earphone | |
CN112634911B (zh) | 人机对话方法、电子设备及计算机可读存储介质 | |
CN109712623A (zh) | 语音控制方法、装置及计算机可读存储介质 | |
CN112233676B (zh) | 智能设备唤醒方法、装置、电子设备及存储介质 | |
CN111370004A (zh) | 人机交互方法、语音处理方法及设备 | |
CN109040444B (zh) | 一种通话录音方法、终端及计算机可读存储介质 | |
CN115472156A (zh) | 语音控制方法、装置、存储介质及电子设备 | |
CN111862943B (zh) | 语音识别方法和装置、电子设备和存储介质 | |
CN109686372B (zh) | 资源播放控制方法和装置 | |
CN110992953A (zh) | 一种语音数据处理方法、装置、系统及存储介质 | |
CN108093350A (zh) | 麦克风的控制方法和麦克风 | |
CN111739515B (zh) | 语音识别方法、设备、电子设备和服务器、相关系统 | |
CN112669837A (zh) | 智能终端的唤醒方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200407 |