CN111524513A - 一种可穿戴设备及其语音传输的控制方法、装置及介质 - Google Patents

一种可穿戴设备及其语音传输的控制方法、装置及介质 Download PDF

Info

Publication number
CN111524513A
CN111524513A CN202010300876.3A CN202010300876A CN111524513A CN 111524513 A CN111524513 A CN 111524513A CN 202010300876 A CN202010300876 A CN 202010300876A CN 111524513 A CN111524513 A CN 111524513A
Authority
CN
China
Prior art keywords
voice
microphone
sensor
motion data
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010300876.3A
Other languages
English (en)
Inventor
杨宗旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Goertek Techology Co Ltd
Original Assignee
Goertek Techology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Goertek Techology Co Ltd filed Critical Goertek Techology Co Ltd
Priority to CN202010300876.3A priority Critical patent/CN111524513A/zh
Publication of CN111524513A publication Critical patent/CN111524513A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/22Interactive procedures; Man-machine interfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

本申请公开了一种可穿戴设备及其语音传输的控制方法、装置及介质,该方法通过可穿戴设备中开启的传感器获取用户的运动数据,当运动数据满足预设唤醒条件时开启麦克风,开启麦克风以后,通过麦克风采集语音以确定该语音与关键词是否匹配,在匹配后,将目标语音传输至终端设备。由此可见,采用本技术方案,麦克风可以保持关闭,使得可穿戴设备的功耗降低,并且,麦克风关闭后,可以减少无效语音的采集。此外,通过判断与关键词是否匹配,可以降低误触发的风险,并且进一步减少输入至终端设备的无效语音。最后,利用可穿戴设备上的传感器采集的运动数据,不需要硬件结构的改动,成本较低。

Description

一种可穿戴设备及其语音传输的控制方法、装置及介质
技术领域
本申请涉及电子设备技术领域,特别是涉及一种可穿戴设备及其语音传输的控制方法、装置及介质。
背景技术
可穿戴设备,例如手表,手环等,目前已经兼顾了运动检测以及健康医疗检测等相关功能,逐渐成为人们生活中必不可缺的外设性设备。
为了丰富可穿戴设备的功能,其上包含的器件越来越多,例如麦克风,从而实现与终端设备进行语音传输,实现相应的功能。但是由于可穿戴设备需要用户佩戴于身体上的特定部位,因此,其体积和重量有较高的要求,所以电池的体积不能太大。
现有技术中,为了方便进行语音传输,可穿戴设备上的麦克风持续开启,从而严重影响整机的待机时间,并且麦克风在开启过程中很容易采集环境噪声等无用语音,导致终端设备也进行了很多无效操作,也会增加终端设备的功耗。
由此可见,在实现语音传输功能的基础上,如何降低可穿戴设备的功耗和降低采集无效语音是本领域技术人员亟待解决的问题。
发明内容
本申请的目的是提供一种可穿戴设备及其语音传输的控制方法、装置及介质,用于降低可穿戴设备的功耗和降低采集无效语音。
为解决上述技术问题,本申请提供一种语音传输的控制方法,该方法包括:
获取传感器检测到的运动数据,所述传感器为可穿戴设备中用于检测用户运动数据的器件;
当所述运动数据满足预设唤醒条件时,开启麦克风;
对由所述麦克风采集的语音进行关键词匹配;
若匹配成功,获取目标语音,将所述目标语音传输至终端设备。
优选地,在开启所述麦克风时,还包括:
开启定时器;
当超过所述定时器的定时周期,且所述语音未匹配成功时,关闭所述麦克风。
优选地,若匹配成功,还包括:
重置所述定时器;
当超过所述定时器的定时周期,且未检测到所述目标语音时,关闭所述麦克风。
优选地,所述对由所述麦克风采集的语音进行关键词匹配之前,还包括:
比较所述语音对应的音量与阈值的关系;
当所述音量大于所述阈值时,进入所述对由所述麦克风采集的语音进行关键词匹配的步骤;
当所述音量不大于所述阈值时,关闭所述麦克风。
优选地,在开启所述麦克风后,还包括:
对所述语音或所述目标语音进行降噪处理。
优选地,所述麦克风为多颗,在所述对所述语音或所述目标语音进行降噪处理之后,还包括:
对多颗所述麦克风采集的多路所述语音或多路所述目标语音进行波束合成。
优选地,还包括:
接收所述终端设备反馈的反馈信息,并在显示屏幕上显示所述反馈信息。
优选地,所述传感器为加速度传感器,或所述传感器为加速度传感器和角速度传感器。
为解决上述技术问题,本申请还提供一种语音传输的控制装置,包括:
获取模块,用于获取传感器检测到的运动数据,所述传感器为可穿戴设备中用于检测用户运动数据的器件;
唤醒模块,用于当所述运动数据满足预设唤醒条件时,开启麦克风;
关键词匹配模块,用于对由所述麦克风采集的语音进行关键词匹配;
传输模块,用于当匹配成功时,获取目标语音,将所述目标语音传输至终端设备备。
为解决上述技术问题,本申请还提供一种语音传输的控制装置,包括存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如所述的语音传输的控制方法的步骤。
为解决上述技术问题,本申请还提供一种可穿戴设备,包括所述的语音传输的控制装置。
为解决上述技术问题,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如所述的语音传输的控制方法的步骤。
本申请所提供的语音传输的控制方法,通过可穿戴设备中开启的传感器获取用户的运动数据,当运动数据满足预设唤醒条件时开启麦克风,开启麦克风以后,通过麦克风采集语音以确定该语音与关键词是否匹配,在匹配后,将目标语音传输至终端设备。由此可见,采用本技术方案,麦克风可以保持关闭,使得可穿戴设备的功耗降低,并且,麦克风关闭后,可以减少无效语音的采集。此外,通过判断与关键词是否匹配,可以降低误触发的风险,并且进一步减少输入至终端设备的无效语音。最后,利用可穿戴设备上的传感器采集的运动数据,不需要硬件结构的改动,成本较低。
此外,本申请提供的可穿戴设备及其语音传输的控制装置及介质,与上述方法相对应,效果如上。
附图说明
为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施提供的一种语音传输的控制方法的流程图;
图2为本申请实施例提供的一种唤醒动作的示意图;
图3为本申请实施例提供的另一种语音传输的控制方法的流程图;
图4为本申请实施例提供的一种语音传输的控制装置的结构图;
图5为本申请另一实施例提供的语音传输的控制装置的结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本申请保护范围。
本申请的核心是提供一种可穿戴设备及其语音传输的控制方法、装置及介质。
为了使本技术领域的人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。
需要说明的是,本申请中提到的可穿戴设备可以为智能手表、智能手环等。可穿戴设备上设置有传感器,用于检测用户的运动数据,例如,行走步数、手臂移动数据等。由于可穿戴设备中的传感器属于基础器件,用以满足用户的基本需求,所以传感器通常是开启的,换句话说,本申请中的可穿戴设备不仅包括以上传感器,还需要传感器是开启的。另外,本申请中,提到的语音传输的控制方法可以由单独的器件实现,也可以由可穿戴设备中的中央处理器实现,本发明不作限定。作为优选地实施方式,本方法由可穿戴设备中现有的中央处理器实现,所以在硬件结构上改动较小,只需要将相应的程序烧录至存储器中,由中央处理器执行即可。
图1为本申请实施提供的一种语音传输的控制方法的流程图。如图1所示,该方法包括:
S10:获取传感器检测到的运动数据。
可以理解的是,传感器为可穿戴设备中用于检测用户运动数据的器件,在传感器开启的情况下,就可以获取到用户的运动数据。此时,该运动数据不仅可以作为记录用户运动的依据,还可以作为本申请中是否开启麦克风的依据。另外,传感器为加速度传感器,或传感器为加速度传感器和角速度传感器。
图2为本申请实施例提供的一种唤醒动作的示意图。在具体实施中,用户可以执行特定的动作,使得传感器能够检测到运动数据。需要说明的是,用户执行何种动作,本申请不作限定,只要所产生的运动数据满足步骤S11中的预设唤醒条件即可,例如,以智能手表或智能手环为例,如图2所示,用户可以挥动手臂(佩带有智能手表或智能手环的手臂)来实现。
为了保证开启麦克风的时效性,也即保证语音传输的时效性,可以采用实时获取传感器检测到的运动数据的方式,避免长时间等待。
S11:判断运动数据是否满足预设唤醒条件,如果是,则进入S12。
为了防止误触发的风险,本实施例中,需要运动数据满足预设唤醒条件,可以理解的是,预设唤醒条件也不作限定,可以依据运动数据的类型,运动持续时间等参数进行设置。如果运动数据不满足预设唤醒条件,则返回S10。
以传感器为加速度传感器为例,则运动数据为加速度值,预设唤醒条件可以是加速度值大于设定的加速度值,所以当用户以较快的速度抬手臂或落手臂时,则加速度传感器就可以检测到对应的加速度值,此时,该加速度值大于设定的加速度值,所以判断结果为运动数据满足预设唤醒条件。可以理解的是,用户如果正常使用可穿戴设备,虽然有运动数据,但是该运动数据不满足预设唤醒条件,也不会进入S12,即不会开启麦克风,所以也不会产生由麦克风开启而产生的功耗。
在其它实施例中,还可以结合加速度传感器和角速度传感器二者采集的运动数据进行判断,本实施例不再赘述。可以理解的是,预设唤醒条件中涉及到的运动数据的种类越多,则误触发的风险也就越低,但是对于用户的动作要求也会越高。
S12:开启麦克风。
麦克风是设置于可穿戴设备上的语音采集器件,可以理解的是,麦克风的设置位置以及数量不作限定。通常情况下,麦克风的内置于可穿戴设备的壳体内,并在壳体上的相应位置开设有小孔,以便语音的采集。在具体实施中,如果麦克风具有多颗,为了进一步降低功耗,可以先开启一个,当输入的语音与关键词匹配成功时,再开启剩余的麦克风。换句话说,如果麦克风有多颗,则开启方式不作限定,可以全开,也可以先开启部分。
S13:对由麦克风采集的语音进行关键词匹配,并判断是否匹配成功,如果是,则进入S14。如图1所示,在一种具体实施方式中,当匹配不成功时,可以进入S15。
为了区别麦克风采集的语音,本申请中对于匹配成功之前的语音都称之为语音,在匹配成功后的语音称之为目标语音,换句话说,本步骤中的语音是用户为了唤醒可穿戴设备与终端设备的语音传输功能,并不是真正要传输至终端设备的语音,目标语音是用户真正要传输至终端设备的语音。
可以理解的是,关键词如何设置,本实施例不作限定。需要预先建立关键词数据库,当接收到麦克风采集的语音后,通过与关键词数据库中的关键词进行匹配,判断是否匹配成功。在一种具体实施方式中,关键词为:请开启语音传输功能,则只要语音中包含有关键词即可认为匹配成功,例如,输入的语音为:你好,请开启语音传输功能吧;当然也可以是语音与关键词完全相同,例如,只有语音为:请开启语音传输功能,才认为匹配成功。
S14:获取目标语音,将所述目标语音传输至终端设备。
在具体实施中,S14具体包括:将目标语音进行语音编码、按照预先设定的格式要求将目标语音进行格式处理、对通信链路(与终端设备的通信链路)进行配置、最后将格式处理后的结果通过通信链路传输至终端设备。
需要说明的是,本实施例中,并不限定目标语音的类型,可以是包含有命令(需要终端设备反馈)的语音,也可以是不包含有命令的语音。通常情况下,采用前者的场景较多,这是因为受限于体积和重量的限制,可穿戴设备的功能有限,无法安装太多的应用,所以影响与用户的交互体验。但是,由于终端设备可以与可穿戴设备连接,且终端设备的功能较为丰富,可以与云服务器建立远程通信,也可以下载更多的应用,所以通过用户以输入语音的方式输入命令,由终端设备按照该命令进行查询,从而得到对应的反馈信息,那么用户也就能够通过可穿戴设备得到反馈信息,以上这一功能可看作是语音助手功能。在一种具体应用场景中,目标语音中包含有需要终端设备执行的命令,例如,查询天气,通过将该目标语音传输至终端设备就可以使得终端设备解析该语音,通过本地应用或者远程查询的方式得到对应的反馈信息,并反馈该反馈信息。还以查询天气为例,终端设备在得到查询天气的命令后,在本地应用中获取当前的天气数据作为反馈信息。
在具体实施中,可穿戴设备与终端设备的通信方式为蓝牙,但不限定传统蓝牙、低功耗蓝牙或是双模蓝牙。
在未匹配成功之前可穿戴设备虽然可以通过麦克风采集语音,但是所采集的语音并未传输至终端设备,所以无法实现如上提到的语音助手的功能,例如,无法通过语音查询的方式获取终端设备返回的天气数据。
S15:关闭麦克风,并返回S10。
可以理解的是,麦克风是在运动数据满足预设唤醒条件下开启的,这一过程中,不可避免的会出现误触发的问题,如果是用户误触发而造成麦克风开启,则通常情况下,麦克风采集的语音在进行关键词匹配时,不会成功,所以该种情况下,需要关闭麦克风,并重新开始获取运动数据。由此可见,将麦克风关闭,可以防止由于误触发而导致的功耗升高的问题。
本实施例提供的语音传输的控制方法,通过可穿戴设备中开启的传感器获取用户的运动数据,当运动数据满足预设唤醒条件时开启麦克风,开启麦克风以后,通过麦克风采集语音以确定该语音与关键词是否匹配,在匹配后,将目标语音传输至终端设备。由此可见,采用本技术方案,麦克风可以保持关闭,使得可穿戴设备的功耗降低,并且,麦克风关闭后,可以减少无效语音的采集。此外,通过判断与关键词是否匹配,可以降低误触发的风险,并且进一步减少输入至终端设备的无效语音。最后,利用可穿戴设备上的传感器采集的运动数据,不需要硬件结构的改动,成本较低。
图3为本申请实施例提供的另一种语音传输的控制方法的流程图。如图3所示,在上述实施例的基础上,在开启麦克风时,还包括:开启定时器。与图1中相同的步骤不再赘述,请参见上文描述。
S20:开启麦克风和定时器。
S21:对由麦克风采集的语音进行关键词匹配,并判断定时周期内是否匹配成功,如果是,则进入S14,否则,进入S15。
可以理解的是,如果用户误触发,或者在开启麦克风后,又不需要与终端设备进行语音传输,则此时,麦克风已经开启,开始产生功耗。本实施例中,加入定时器,定时器的定时周期不作限定,例如,可以为10S。定时器与麦克风同时开启,如果在定时周期内,由麦克风采集的语音与关键词匹配成功,则进行S14,否则关闭麦克风。由此可见,通过定时器,可以进一步降低由于误触发而带来的功耗。进一步的,当匹配成功时,还包括:重置定时器。
如图3所示,包括:
S22:重置定时器,并判断是否在定时器的定时周期内是否检测到目标语音,如果是,进入S14,否则,进入S15。
在关键词匹配成功后,定时器被重置,也就是说定时器重新开始计时,需要用户在定时器的定时周期内说出目标语音,否则,当超过定时器的定时周期,且未检测到目标语音时,关闭麦克风。
很显然,通过重置定时器,进一步利用定时器的定时功能,防止用户长时间未发出命令而麦克风持续开启的问题。
在上述实施例中,通过加入定时器来控制麦克风是否关闭,以此能够避免用户长时间没有输出语音而麦克风持续开启的问题,从而降低麦克风开启所产生的功耗。本实施例中,是考虑到若用户误触发而导致麦克风开启后所产生的功耗问题。在具体实施中,如果用户误触发而导致麦克风开启,则只要由麦克风采集的语音的音量不大于阈值,则麦克风就会被关闭。具体实现方式为:对由麦克风采集的语音进行关键词匹配之前,还包括:
比较语音对应的音量与阈值的关系;
当音量大于阈值时,进入对由麦克风采集的语音进行关键词匹配的步骤;
当音量不大于阈值时,关闭麦克风。
可以理解的是,以上阈值可以根据实际情况而定,本实施例不作限定。对于用户来说,如果确实要通过可穿戴设备向终端设备传输语音,则需要用比较大的音量输出语音。
在上述实施例的基础上,在开启麦克风后,还包括:
对语音或目标语音进行降噪处理。
为了消除噪声的影响,本实施例中,在得到语音或目标语音后,先对其进行降噪处理,从而改善语音的质量。可以理解的是,降噪处理的算法很多,可以采用自适应滤波器、谱减法、维纳滤波法等,本实施例不作限定。
进一步的,若麦克风为多颗,在对语音或目标语音进行降噪处理之后,还包括:对多颗麦克风采集的多路语音或多路目标语音进行波束合成。通过波束合成实现多路信号的统一,提高语音的质量。
在上述实施例的基础上,还包括:
接收终端设备反馈的反馈信息,并在显示屏幕上显示反馈信息。
本实施例中,可以通过可穿戴设备上的显示屏幕显示反馈信息,用户可以直接观看显示屏幕即可,提高了用户的便捷度和用户体验。
优选地,可穿戴设备中预先存储有各反馈信息对应的显示模板,以及与显示模板对应的数据格式。终端设备在反馈反馈信息时,预先对反馈信息进行格式划分,使得可穿戴设备接收到反馈信息后,依据反馈信息的格式调用对应的显示模板。通过以上方式显示,可以减少终端设备传输的数据,也能够降低显示错误的概率。例如,当目标语音为:今天天气多少度,在得到终端设备返回的反馈信息X后,根据X的数据格式调用对应的显示模板,将X添加至显示模板中。
可以理解的是,通过显示屏幕显示只是其中的一种用户交互方式,在其它实施例中,还可以采用扬声器的方式交互,需要依据可穿戴设备上的硬件类型而定。另外,本申请中,对于终端设备的类型不作限定,可以是手机、平板电脑等,对于终端设备获取反馈信息的方式不作限定,可以是从本地获取也可以通过云服务器获取。
在上述实施例中,对于语音传输的控制方法进行了详细描述,本申请还提供语音传输的控制装置对应的实施例。
图4为本申请实施例提供的一种语音传输的控制装置的结构图。如图4所示,该装置包括:
获取模块10,用于获取传感器检测到的运动数据,传感器为可穿戴设备中用于检测用户运动数据的器件。
唤醒模块11,用于当运动数据满足预设唤醒条件时,开启麦克风。
关键词匹配模块12,用于对由麦克风采集的语音进行关键词匹配。
传输模块13,用于当匹配成功时,获取目标语音,将目标语音传输至终端设备。
作为优选地实施方式,在开启麦克风时,还包括:
开启模块,用于开启定时器;
关闭模块,用于当超过定时器的定时周期,且语音未匹配成功时,关闭麦克风。
作为优选地实施方式,当匹配成功时,还包括:
重置模块,用于重置定时器;
所述关闭模块,还用于当超过定时器的定时周期,且未检测到目标语音时,关闭麦克风。
作为优选地实施方式,对由麦克风采集的语音进行关键词匹配之前,还包括:
比较模块,用于比较语音对应的音量与阈值的关系,当音量大于阈值时,触发关键词匹配模块12,否则触发关闭模块以关闭麦克风。
作为优选地实施方式,在开启麦克风后,还包括:
降噪模块,用于对语音或目标语音进行降噪处理。
作为优选地实施方式,麦克风为多颗,还包括:
波束合成模块,用于在对语音或目标语音进行降噪处理之后,对多颗麦克风采集的多路语音或多路目标语音进行波束合成。
作为优选地实施方式,还包括:
显示模块,用于接收终端设备反馈的反馈信息,并在显示屏幕上显示反馈信息。
由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
本实施例提供的语音传输的控制装置,通过可穿戴设备中开启的传感器获取用户的运动数据,当运动数据满足预设唤醒条件时开启麦克风,开启麦克风以后,通过麦克风采集语音以确定该语音与关键词是否匹配,在匹配后,将目标语音传输至终端设备。由此可见,采用本技术方案,麦克风可以保持关闭,使得可穿戴设备的功耗降低,并且,麦克风关闭后,可以减少无效语音的采集。此外,通过判断与关键词是否匹配,可以降低误触发的风险,并且进一步减少输入至终端设备的无效语音。最后,利用可穿戴设备上的传感器采集的运动数据,不需要硬件结构的改动,成本较低。
图5为本申请另一实施例提供的语音传输的控制装置的结构图,如图5所示,语音传输的控制装置包括:存储器20,用于存储计算机程序;
处理器21,用于执行计算机程序时实现如上述实施例中语音传输的控制方法的步骤。
其中,处理器21可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器21可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器21也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器21可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器21还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器20可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器20还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器20至少用于存储以下计算机程序201,其中,该计算机程序被处理器21加载并执行之后,能够实现前述任一实施例公开的语音传输的控制方法的相关步骤。另外,存储器20所存储的资源还可以包括操作系统202和数据203等,存储方式可以是短暂存储或者永久存储。其中,操作系统202可以包括Windows、Unix、Linux等。数据203可以包括但不限于反馈信息等。
在一些实施例中,语音传输的控制装置还可包括有显示屏22、输入输出接口23、通信接口22、电源25以及通信总线26。
本领域技术人员可以理解,图5中示出的结构并不构成对语音传输的控制方法的限定,可以包括比图示更多或更少的组件。
本申请实施例提供的语音传输的控制装置,包括存储器和处理器,处理器在执行存储器存储的程序时,能够实现如下方法:通过可穿戴设备中开启的传感器获取用户的运动数据,当运动数据满足预设唤醒条件时开启麦克风,开启麦克风以后,通过麦克风采集语音以确定该语音与关键词是否匹配,在匹配后,将目标语音传输至终端设备。由此可见,采用本技术方案,麦克风可以保持关闭,使得可穿戴设备的功耗降低,并且,麦克风关闭后,可以减少无效语音的采集。此外,通过判断与关键词是否匹配,可以降低误触发的风险,并且进一步减少输入至终端设备的无效语音。最后,利用可穿戴设备上的传感器采集的运动数据,不需要硬件结构的改动,成本较低。
此外,本申请还提供一种可穿戴设备,包括上述实施例提到的语音传输的控制装置。可以理解的是,除了上述装置外,可穿戴设备还包括传感器等。
最后,本申请还提供一种计算机可读存储介质对应的实施例。计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述方法实施例中记载的步骤。
可以理解的是,如果上述实施例中的方法以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上对本申请所提供的可穿戴设备及其语音传输的控制方法、装置及介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (11)

1.一种语音传输的控制方法,其特征在于,该方法包括:
获取传感器检测到的运动数据,所述传感器为可穿戴设备中用于检测用户运动数据的器件;
当所述运动数据满足预设唤醒条件时,开启麦克风;
对由所述麦克风采集的语音进行关键词匹配;
若匹配成功,获取目标语音,将所述目标语音传输至终端设备。
2.根据权利要求1所述的控制方法,其特征在于,在开启所述麦克风时,还包括:
开启定时器;
当超过所述定时器的定时周期,且所述语音未匹配成功时,关闭所述麦克风。
3.根据权利要求2所述的控制方法,其特征在于,当匹配成功时,还包括:
重置所述定时器;
当超过所述定时器的定时周期,且未检测到所述目标语音时,关闭所述麦克风。
4.根据权利要求1所述的控制方法,其特征在于,所述对由所述麦克风采集的语音进行关键词匹配之前,还包括:
比较所述语音对应的音量与阈值的关系;
当所述音量大于所述阈值时,进入所述对由所述麦克风采集的语音进行关键词匹配的步骤;
当所述音量不大于所述阈值时,关闭所述麦克风。
5.根据权利要求1所述的控制方法,其特征在于,在开启所述麦克风后,还包括:
对所述语音或所述目标语音进行降噪处理。
6.根据权利要求1-5任意一项所述的控制方法,其特征在于,还包括:
接收所述终端设备反馈的反馈信息,并在显示屏幕上显示所述反馈信息。
7.根据权利要求1-5任意一项所述的控制方法,其特征在于,所述传感器为加速度传感器,或所述传感器为加速度传感器和角速度传感器。
8.一种语音传输的控制装置,其特征在于,包括:
获取模块,用于获取传感器检测到的运动数据,所述传感器为可穿戴设备中用于检测用户运动数据的器件;
唤醒模块,用于当所述运动数据满足预设唤醒条件时,开启麦克风;
关键词匹配模块,用于对由所述麦克风采集的语音进行关键词匹配;
传输模块,用于当匹配成功时,获取目标语音,将所述目标语音传输至终端设备。
9.一种语音传输的控制装置,其特征在于,包括存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述的语音传输的控制方法的步骤。
10.一种可穿戴设备,其特征在于,包括权利要求9所述的语音传输的控制装置。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的语音传输的控制方法的步骤。
CN202010300876.3A 2020-04-16 2020-04-16 一种可穿戴设备及其语音传输的控制方法、装置及介质 Pending CN111524513A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010300876.3A CN111524513A (zh) 2020-04-16 2020-04-16 一种可穿戴设备及其语音传输的控制方法、装置及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010300876.3A CN111524513A (zh) 2020-04-16 2020-04-16 一种可穿戴设备及其语音传输的控制方法、装置及介质

Publications (1)

Publication Number Publication Date
CN111524513A true CN111524513A (zh) 2020-08-11

Family

ID=71912003

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010300876.3A Pending CN111524513A (zh) 2020-04-16 2020-04-16 一种可穿戴设备及其语音传输的控制方法、装置及介质

Country Status (1)

Country Link
CN (1) CN111524513A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112218201A (zh) * 2020-09-30 2021-01-12 珠海格力电器股份有限公司 监听方法、装置、设备及存储介质
CN112216283A (zh) * 2020-09-24 2021-01-12 建信金融科技有限责任公司 一种语音识别方法、装置、设备及存储介质
CN113220073A (zh) * 2021-05-06 2021-08-06 恒玄科技(上海)股份有限公司 一种控制方法、装置以及可穿戴设备
CN113409788A (zh) * 2021-07-15 2021-09-17 深圳市同行者科技有限公司 语音唤醒方法、系统、设备及存储介质

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1115490A (ja) * 1997-06-23 1999-01-22 Hitachi Microcomput Syst Ltd マイクロフォン装置および音声認識システム
US20150032457A1 (en) * 2013-07-25 2015-01-29 Samsung Electronics Co., Ltd. Apparatus and method of controlling voice input in electronic device supporting voice recognition
CN104516500A (zh) * 2013-10-07 2015-04-15 三星电子株式会社 用于输入用户语音的遥控设备和方法
US20150326985A1 (en) * 2014-05-08 2015-11-12 Microsoft Corporation Hand-worn device for surface gesture input
US20150379992A1 (en) * 2014-06-30 2015-12-31 Samsung Electronics Co., Ltd. Operating method for microphones and electronic device supporting the same
US20160148615A1 (en) * 2014-11-26 2016-05-26 Samsung Electronics Co., Ltd. Method and electronic device for voice recognition
US20160154624A1 (en) * 2014-12-01 2016-06-02 Lg Electronics Inc. Mobile terminal and controlling method thereof
CN107403621A (zh) * 2017-08-25 2017-11-28 深圳市沃特沃德股份有限公司 语音唤醒装置及方法
CN107577449A (zh) * 2017-09-04 2018-01-12 百度在线网络技术(北京)有限公司 唤醒语音的拾取方法、装置、设备及存储介质
CN108495212A (zh) * 2018-05-09 2018-09-04 惠州超声音响有限公司 一种与智能音响交互的系统
CN108538305A (zh) * 2018-04-20 2018-09-14 百度在线网络技术(北京)有限公司 语音识别方法、装置、设备及计算机可读存储介质
US20180324518A1 (en) * 2017-05-04 2018-11-08 Apple Inc. Automatic speech recognition triggering system
CN109210703A (zh) * 2017-06-29 2019-01-15 广东美的制冷设备有限公司 空调的语音控制方法和语音控制的空调
CN110265036A (zh) * 2019-06-06 2019-09-20 湖南国声声学科技股份有限公司 语音唤醒方法、系统、电子设备及计算机可读存储介质
CN110312235A (zh) * 2019-05-16 2019-10-08 深圳市豪恩声学股份有限公司 实时语音唤醒的音频设备、运行方法、装置及存储介质
CN110689889A (zh) * 2019-10-11 2020-01-14 深圳追一科技有限公司 人机交互方法、装置、电子设备及存储介质
CN110830866A (zh) * 2019-10-31 2020-02-21 歌尔科技有限公司 一种语音助手唤醒方法、装置及无线耳机和存储介质

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1115490A (ja) * 1997-06-23 1999-01-22 Hitachi Microcomput Syst Ltd マイクロフォン装置および音声認識システム
US20150032457A1 (en) * 2013-07-25 2015-01-29 Samsung Electronics Co., Ltd. Apparatus and method of controlling voice input in electronic device supporting voice recognition
CN104516500A (zh) * 2013-10-07 2015-04-15 三星电子株式会社 用于输入用户语音的遥控设备和方法
US20150326985A1 (en) * 2014-05-08 2015-11-12 Microsoft Corporation Hand-worn device for surface gesture input
US20150379992A1 (en) * 2014-06-30 2015-12-31 Samsung Electronics Co., Ltd. Operating method for microphones and electronic device supporting the same
US20160148615A1 (en) * 2014-11-26 2016-05-26 Samsung Electronics Co., Ltd. Method and electronic device for voice recognition
US20160154624A1 (en) * 2014-12-01 2016-06-02 Lg Electronics Inc. Mobile terminal and controlling method thereof
US20180324518A1 (en) * 2017-05-04 2018-11-08 Apple Inc. Automatic speech recognition triggering system
CN109210703A (zh) * 2017-06-29 2019-01-15 广东美的制冷设备有限公司 空调的语音控制方法和语音控制的空调
CN107403621A (zh) * 2017-08-25 2017-11-28 深圳市沃特沃德股份有限公司 语音唤醒装置及方法
CN107577449A (zh) * 2017-09-04 2018-01-12 百度在线网络技术(北京)有限公司 唤醒语音的拾取方法、装置、设备及存储介质
CN108538305A (zh) * 2018-04-20 2018-09-14 百度在线网络技术(北京)有限公司 语音识别方法、装置、设备及计算机可读存储介质
CN108495212A (zh) * 2018-05-09 2018-09-04 惠州超声音响有限公司 一种与智能音响交互的系统
US20190349663A1 (en) * 2018-05-09 2019-11-14 Tymphany Acoustic Technology (Huizhou) Co., Ltd. System interacting with smart audio device
CN110312235A (zh) * 2019-05-16 2019-10-08 深圳市豪恩声学股份有限公司 实时语音唤醒的音频设备、运行方法、装置及存储介质
CN110265036A (zh) * 2019-06-06 2019-09-20 湖南国声声学科技股份有限公司 语音唤醒方法、系统、电子设备及计算机可读存储介质
CN110689889A (zh) * 2019-10-11 2020-01-14 深圳追一科技有限公司 人机交互方法、装置、电子设备及存储介质
CN110830866A (zh) * 2019-10-31 2020-02-21 歌尔科技有限公司 一种语音助手唤醒方法、装置及无线耳机和存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112216283A (zh) * 2020-09-24 2021-01-12 建信金融科技有限责任公司 一种语音识别方法、装置、设备及存储介质
CN112216283B (zh) * 2020-09-24 2024-02-23 建信金融科技有限责任公司 一种语音识别方法、装置、设备及存储介质
CN112218201A (zh) * 2020-09-30 2021-01-12 珠海格力电器股份有限公司 监听方法、装置、设备及存储介质
CN112218201B (zh) * 2020-09-30 2022-02-11 珠海格力电器股份有限公司 监听方法、装置、设备及存储介质
CN113220073A (zh) * 2021-05-06 2021-08-06 恒玄科技(上海)股份有限公司 一种控制方法、装置以及可穿戴设备
CN113409788A (zh) * 2021-07-15 2021-09-17 深圳市同行者科技有限公司 语音唤醒方法、系统、设备及存储介质

Similar Documents

Publication Publication Date Title
CN111524513A (zh) 一种可穿戴设备及其语音传输的控制方法、装置及介质
US11244672B2 (en) Speech recognition method and apparatus, and storage medium
EP3652734B1 (en) Voice data processing method and electronic device supporting the same
CN108182937B (zh) 关键词识别方法、装置、设备及存储介质
CN110890093B (zh) 一种基于人工智能的智能设备唤醒方法和装置
US10579726B2 (en) Method and device for generating natural language expression by using framework
CN110570840B (zh) 一种基于人工智能的智能设备唤醒方法和装置
US10642820B2 (en) Method for data processing and related products
CN111210021A (zh) 一种音频信号处理方法、模型训练方法以及相关装置
CN108597186B (zh) 一种基于用户行为的溺水报警方法及可穿戴设备
CN110070863A (zh) 一种语音控制方法及装置
CN105224601B (zh) 一种提取时间信息的方法和装置
CN108052195A (zh) 一种麦克风设备的控制方法及终端设备
CN110992953A (zh) 一种语音数据处理方法、装置、系统及存储介质
CN114333774A (zh) 语音识别方法、装置、计算机设备及存储介质
CN114360510A (zh) 一种语音识别方法和相关装置
CN106095566A (zh) 一种响应控制方法及移动终端
CN111522592A (zh) 一种基于人工智能的智能终端唤醒方法和装置
CN106791010B (zh) 一种信息处理的方法、装置和移动终端
CN109086448B (zh) 一种基于性别特征信息的语音搜题方法及家教设备
CN108634497B (zh) 一种可穿戴设备的排水方法及可穿戴设备
CN107154996B (zh) 来电拦截方法、装置、存储介质及终端
CN112219235A (zh) 包括处理用户语音的电子设备和控制电子设备上语音识别的方法的系统
CN114740744A (zh) 一种控制智能家居的方法、装置、可穿戴产品及介质
CN112435441B (zh) 睡眠检测方法和可穿戴电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination