CN109903765A - 语音控制方法及装置 - Google Patents

语音控制方法及装置 Download PDF

Info

Publication number
CN109903765A
CN109903765A CN201910157535.2A CN201910157535A CN109903765A CN 109903765 A CN109903765 A CN 109903765A CN 201910157535 A CN201910157535 A CN 201910157535A CN 109903765 A CN109903765 A CN 109903765A
Authority
CN
China
Prior art keywords
information
acoustic information
matched
acoustic
fisrt feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910157535.2A
Other languages
English (en)
Inventor
李凯文
安凯
邵明绪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XI'AN FENGYU INFORMATION TECHNOLOGY Co.,Ltd.
Original Assignee
Xi'an Jihong World Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xi'an Jihong World Information Technology Co Ltd filed Critical Xi'an Jihong World Information Technology Co Ltd
Priority to CN201910157535.2A priority Critical patent/CN109903765A/zh
Publication of CN109903765A publication Critical patent/CN109903765A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)

Abstract

本公开是关于一种语音控制方法及装置。该方法包括:接收第一蓝牙耳机发送的第一声音信息,所述第一声音信息为所述第一蓝牙耳机采集到的周围环境的声音;确定预设的多个特征信息中是否存在与所述第一声音信息匹配的第一特征信息;若所述预设的多个特征信息中存在与所述第一声音信息匹配的第一特征信息,执行所述第一声音信息对应的操作指令。该技术方案中,终端在接收到蓝牙耳机发送的声音信息之后,可以通过对声音信息与预设声音特征的对比确定是否执行该声音信息对应的操作指令,避免了在环境声音的音量较大时终端由于接收到蓝牙耳机发送的声音信息而误执行操作指令的情况,进而避免了终端资源的浪费,提高了终端的待机时间。

Description

语音控制方法及装置
技术领域
本公开涉及终端控制技术领域,尤其涉及一种语音控制方法及装置。
背景技术
由于对讲机可以在不使用通信网络的情况下进行语音通话,因此广泛应用于位置相对固定且频繁通话的场合。例如,对讲机可以应用于酒店,大型会场,学校安保以及医院安保等场景下。
相关技术中,对讲机可以连接蓝牙耳机,该蓝牙耳机可以根据采集到的声音的音量与预设音量阈值的比较确定是否开启与对讲机之间的语音通路。例如,蓝牙耳机可以实时监测周围的环境声音,若该环境声音的音量大于或等于预设的音量阈值,说明当前可能是用户需要使用蓝牙耳机发送语音信息,因此蓝牙耳机的语音通话功能被触发,即蓝牙耳机可以采集用户的语音信息,并将该语音信息发送给对讲机,以便于对讲机在预设频道上进行广播。
但是用户在使用对讲机时难免会出现周围环境较为嘈杂的情况,例如用户可能会在建筑工地、厂矿企业、KTV和马路上进行使用,在上述场景下与对讲机连接的蓝牙耳机周围的环境声音的音量较大,因此可能会经常出现蓝牙耳机被环境噪音误触发的情况,用户体验不佳。
发明内容
为克服相关技术中存在的对讲机在蓝牙耳机被环境噪音影响时误触发问题,本公开实施例提供一种语音控制方法及装置。所述技术方案如下:
根据本公开实施例的第一方面,提供一种语音控制方法,包括:
接收第一蓝牙耳机发送的第一声音信息,所述第一声音信息为所述第一蓝牙耳机采集到的周围环境的声音;
确定预设的多个特征信息中是否存在与所述第一声音信息匹配的第一特征信息;
若所述预设的多个特征信息中存在与所述第一声音信息匹配的第一特征信息,执行所述第一声音信息对应的操作指令。
本公开的实施例提供的技术方案可以包括以下有益效果:终端在接收到蓝牙耳机发送的声音信息之后,可以通过对声音信息与预设声音特征的对比确定是否执行该声音信息对应的操作指令,避免了在环境声音的音量较大时终端由于接收到蓝牙耳机发送的声音信息而误执行操作指令的情况,进而避免了终端资源的浪费,提高了终端的待机时间。
在一个实施例中,所述若所述预设的多个特征信息中存在与所述第一声音信息匹配的第一特征信息,执行所述第一声音信息对应的操作指令包括:
若所述预设的多个特征信息中存在与所述第一声音信息匹配的第一特征信息,根据预存的特征信息与频率的对应关系,将语音通话的频率切换至与所述第一声音信息匹配的第一特征信息对应的频率。
在一个实施例中,所述方法还包括:
若所述预设的多个特征信息中不存在与所述第一声音信息匹配的第一特征信息,将语音通话的频率切换至预设的公共频率。
在一个实施例中,所述执行所述第一声音信息对应的操作指令包括:
若在接收所述第一蓝牙耳机发送的所述第一声音信息时接收到其他M个蓝牙耳机发送的M个声音信息,分别确定所述预设的多个特征信息中是否存在与所述M个声音信息匹配的特征信息,所述M为大于或等于1的整数;
若所述预设的多个特征信息中存在分别与其中的N个声音信息匹配的N个特征信息,根据预设的优先级规则,分别确定所述第一特征信息和所述N个特征信息的优先级,所述N为小于或等于M的整数;
若所述第一特征信息的优先级高于所述N个特征信息中的任意一个特征信息的优先级,执行所述第一声音信息对应的操作指令。
在一个实施例中,所述方法还包括:
若所述第一特征信息的优先级低于所述N个特征信息中的任意一个特征信息的优先级,丢弃所述第一声音信息。
在一个实施例中,所述方法还包括:
按照所述第一特征信息和所述N个特征信息的优先级的由高到底依次存储与所述第一特征信息和所述N个特征信息匹配的所述第一声音信息和所述N个声音信息;
按照存储顺序依次执行与所述第一声音信息和所述N个声音信息对应的操作指令。
根据本公开实施例的第二方面,提供一种语音控制装置,包括:
接收模块,用于接收第一蓝牙耳机发送的第一声音信息,所述第一声音信息为所述第一蓝牙耳机采集到的周围环境的声音;
确定模块,用于确定预设的多个特征信息中是否存在与所述第一声音信息匹配的第一特征信息;
执行模块,用于若所述预设的多个特征信息中存在与所述第一声音信息匹配的第一特征信息,执行所述第一声音信息对应的操作指令。
在一个实施例中,所述执行模块包括:
频率切换子模块,用于若所述预设的多个特征信息中存在与所述第一声音信息匹配的第一特征信息,根据预存的特征信息与频率的对应关系,将语音通话的频率切换至与所述第一声音信息匹配的第一特征信息对应的频率。
根据本公开实施例的第三方面,提供一种语音控制装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
接收第一蓝牙耳机发送的第一声音信息,所述第一声音信息为所述第一蓝牙耳机采集到的周围环境的声音;
确定预设的多个特征信息中是否存在与所述第一声音信息匹配的第一特征信息;
若所述预设的多个特征信息中存在与所述第一声音信息匹配的第一特征信息,执行所述第一声音信息对应的操作指令。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现第一方面任一实施例所述方法的步骤。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1a是根据一示例性实施例示出的语音控制方法的流程图。
图1b是根据一示例性实施例示出的语音控制方法的应用场景图。
图1c是根据一示例性实施例示出的语音控制方法的流程图。
图2是根据一示例性实施例示出的语音控制方法的交互图。
图3a是根据一示例性实施例示出的语音控制装置的结构示意图。
图3b是根据一示例性实施例示出的语音控制装置的结构示意图。
图3c是根据一示例性实施例示出的语音控制装置的结构示意图。
图3d是根据一示例性实施例示出的语音控制装置的结构示意图。
图3e是根据一示例性实施例示出的语音控制装置的结构示意图。
图3f是根据一示例性实施例示出的语音控制装置的结构示意图。
图4是根据一示例性实施例示出的语音控制装置的结构框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
本公开实施例提供的技术方案涉及终端,该终端可以为对讲机,手机以及其他能够连接蓝牙耳机的设备,本公开实施例对此不作限定。相关技术中,蓝牙耳机采用音量阈值作为开启与终端之间的语音通路的条件,而终端在接收到蓝牙耳机发送的声音信息之后即可开启语音发送功能,因此在环境噪音的音量较大的情况下,容易出现蓝牙耳机被环境噪音影响而误向终端发送声音信息,而终端由于接收到蓝牙耳机误发的声音信息而误触发的情况,用户体验不佳。本公开的实施例提供的技术方案中,蓝牙耳机可以采集周围环境的声音信息并发送给终端,而终端在接收到蓝牙耳机发送的声音信息之后,可以通过对声音信息与预设声音特征的对比确定是否执行该声音信息对应的操作指令,避免了在环境声音的音量较大时终端由于接收到蓝牙耳机发送的声音信息而误执行操作指令的情况,进而避免了终端资源的浪费,提高了终端的待机时间。
图1a是根据一示例性实施例示出的一种语音控制方法的流程图,应用于终端,如图1a所示,该语音控制方法包括以下步骤101至步骤103:
在步骤101中,接收第一蓝牙耳机发送的第一声音信息,该第一声音信息为第一蓝牙耳机采集到的周围环境的声音。
示例的,如图1b所示,终端10a可以连接有多个蓝牙耳机10b,该第一蓝牙耳机10b1可以为该多个蓝牙耳机10b中的任意一个。该第一蓝牙耳机10b1可以采集周围环境的声音,并将采集到的声音生成声音信息发送给终端10a,例如,第一蓝牙耳机10b1可以按照预设周期采集周围环境的声音,并将每个预设周期采集到的持续预设时间段的声音生成声音信息发送给终端10a。或者第一蓝牙耳机10b1可以实时监测周围环境声音的音量,在检测到环境声音的音量大于或等于预设音量阈值时,采集持续预设时间段的周围环境的声音生成声音信息发送给终端10a。或者,第一蓝牙耳机10b1在检测到环境声音的音量大于或等于预设音量阈值时,持续采集周围环境的声音,直至环境声音的音量小于预设音量阈值,并将采集到的声音生成声音信息发送给终端10a。需要说明的是,上述预设周期和预设时间段均可以根据具体情况进行设置,本公开实施例对此不作限定。
在步骤102中,确定预设的多个特征信息中是否存在与第一声音信息匹配的第一特征信息。
初始化时,终端可以预设多个特征信息,该多个特征信息分别对应多个不同的用户,该多个不同用户即为终端的合法用户,终端可以根据用户需求或者预先的配置,为该多个不同用户提供不同的服务。可选的,该特征信息可以为用户的声纹特征。具体的,终端设置有特征输入界面,该特征输入界面显示有声音输入按钮。由于终端可以同时连接多个蓝牙耳机,即允许多个用户同时使用终端,因此终端可以依次存储多个用户的声纹特征。以第一用户为例,在需要预先存储特征信息时,第一用户可以首先指示终端显示特征输入界面,然后点击声音输入按钮并将该声音输入按钮保持在点击状态,即第一用户在采用手指点击声音输入按钮之后将手指一直保持在点击位置,此时第一用户可以采用正常音量述说预设文字,例如,第一用户可以朗读“请录入声音特征”这几个文字,第一用户在述说完成之后,释放该声音输入按钮,即手指离开点击位置。终端在检测到声音输入按钮被点击且一直处于点击状态时,开启麦克风,采集用户述说预设文字时的声音信息;在检测到声音输入按钮被释放时,停止采集,并获取采集到的声音信息的声纹特征,即第一用户的第一声纹特征,然后将该第一声纹特征存储为预设的特征信息。同样的,其他用户也可以按照上述方法在终端中将其声纹特征存储为特征信息。
终端在存储对应多个用户的声纹特征之后,可以接收与其连接的多个蓝牙耳机发送的声音信息,并根据该声音信息与预设的声纹特征的比较,确定当前采用蓝牙耳机使用终端的是否为合法用户。以第一用户使用第一蓝牙耳机为例,终端在接收到第一蓝牙耳机发送的第一声音信息之后,获取该第一声音信息的声纹特征,然后确定预设的多个声纹特征中是否存在与该第一声音信息的声纹特征相同或者相似度大于或等于预设相似度阈值的声纹特征。若存在,说明该预设的多个声纹特征中存在与该第一声音信息匹配的第一声纹特征,该第一声纹特征即为与该第一声音信息的声纹特征相同或者相似度大于或等于预设相似度阈值的声纹特征;若不存在,说明该预设的多个声纹特征中不存在与该第一声音信息匹配的第一声纹特征。
在步骤103中,若预设的多个特征信息中存在与第一声音信息匹配的第一特征信息,执行该第一声音信息对应的操作指令。
示例的,以特征信息为声纹特征为例,终端还设置有个性化选择界面,便于不同的用户选择不同的服务。具体的,终端在存储第一用户输入的声音信息的第一声纹特征之后,可以显示个性化选择界面,该个性化选择界面上显示有多个功能、多种操作或多个可配置选项以及确认按钮,第一用户可以根据自身需求进行选择。假设该终端为对讲机,且该对讲机的个性化选择界面上显示有音量选项、频率选项和确认按钮,第一用户可以根据需要在音量选项中选择第一音量,在频率选项中选择第一频率,并在选择完成之后点击确认按钮。对讲机在检测到该确认按钮被点击时,即可根据该第一用户选择的第一音量和第一频率获取第一音量切换指令和第一频率切换指令,并将该第一音量切换指令和第一频率切换指令保存为第一声音信息对应的操作指令,该第一音量切换指令用于将当前音量切换至第一用户选择的第一音量,该第一频率切换指令用于将当前频率切换至第一用户选择的第一频率。同样的,其他用户也可以按照上述方法在对讲机中存储与其声纹特征对应的操作指令。
对讲机在接收到第一蓝牙耳机发送的第一声音信息,且确定预设的多个声纹特征中存在与该第一声音信息匹配的第一声纹特征时,可以根据预先存储的信息,获取与该第一声纹特征对应的第一操作指令,假设使用该第一蓝牙耳机的为第一用户,则与该第一声纹特征对应的第一操作指令为第一音量切换指令和第一频率切换指令,即该第一声音信息对应的操作指令为第一音量切换指令和第一频率切换指令。此时对讲机即可执行该第一音量切换指令和第一频率切换指令,即将当前音量切换至第一用户选择的第一音量,将当前频率切换至第一用户选择的第一频率,便于第一用户采用之前预设的第一音量和第一频率进行语音通信。
或者,终端在确定预设的多个特征信息中存在与该第一声音信息匹配的第一特征信息时,确认使用该第一蓝牙耳机的用户为合法用户,此时终端可以对该第一声音信息进行语音识别,确定该第一声音信息中包括的语音操作指令,然后执行该语音操作指令,即该语音操作指令即为第一声音信息对应的操作指令。
可选的,以终端为对讲机为例,该对讲机的个性化选择界面可以仅设置有频率选项,不同的用户可以根据需要选择不同的频率。具体的,以第一用户为例,对讲机在存储第一用户输入的声音信息的第一声纹特征之后,可以显示个性化选择界面,该个性化选择界面上显示有频率选项和确认按钮,第一用户可以根据需要在频率选项中选择第一频率,并在选择完成之后点击确认按钮。对讲机在检测到该确认按钮被点击时,可以将该第一频率保存为与该第一声纹特征对应的频率。同样的,其他用户也可以按照上述方法在对讲机中存储与其声纹特征对应的频率,然后对讲机可以根据不同用户选择的不同频率生成声纹特征与频率的对应关系,不同的声纹特征对应不同的频率。
对讲机在确定预设的多个声纹特征中存在与该第一声音信息匹配的第一声纹特征时,确认使用该第一蓝牙耳机的用户为合法用户,此时对讲机可以查询声纹特征与频率的对应关系,获取与该第一声纹特征对应的第一频率,然后将语音通话的频率切换至与该第一声音信息匹配的第一声纹特征对应的频率,此时该第一声音信息对应的操作指令即为将语音通话的频率切换至与该第一声音信息匹配的第一声纹特征对应的频率。
同时,该对讲机还设置有公共频率,该公共频率与声纹特征与频率的对应关系中包括的任意一个频率均不同。若对讲机确定预设的多个声纹特征中不存在与第一声音信息匹配的第一声纹特征,说明使用该第一蓝牙耳机的用户为非合法用户,此时对讲机可以将将语音通话的频率切换至预设的公共频率,仅仅允许该非合法用户使用该对讲机提供的公共频率进行语音通信。
本公开的实施例提供的技术方案中,终端在接收到蓝牙耳机发送的声音信息之后,可以通过对声音信息与预设声音特征的对比确定是否执行该声音信息对应的操作指令,避免了在环境声音的音量较大时终端由于接收到蓝牙耳机发送的声音信息而误执行操作指令的情况,进而避免了终端资源的浪费,提高了终端的待机时间。
在一个实施例中,如图1c所示,在步骤103中,若预设的多个特征信息中存在与第一声音信息匹配的第一特征信息,执行该第一声音信息对应的操作指令,可以通过步骤1031至步骤1033实现:
在步骤1031中,若预设的多个特征信息中存在与第一声音信息匹配的第一特征信息,且在接收第一蓝牙耳机发送的该第一声音信息时接收到其他M个蓝牙耳机发送的M个声音信息,则分别确定预设的多个特征信息中是否存在与该M个声音信息匹配的特征信息。
在步骤1032中,若预设的多个特征信息中存在分别与其中的N个声音信息匹配的N个特征信息,根据预设的优先级规则,分别确定该第一特征信息和该N个特征信息的优先级。
在步骤1033中,若该第一特征信息的优先级高于该N个特征信息中的任意一个特征信息的优先级,执行该第一声音信息对应的操作指令。
其中,该M为大于或等于1的整数。该N为小于或等于M的整数。
示例的,终端可以预先设置优先级规则,该优先级规则用于指示终端存储的多个特征信息中每个特征信息的优先级,根据该多个特征信息中每个特征信息的优先级,确定接收到的多个声音信息的优先级,进而确定执行每个声音信息对应的操作指令的顺序,或者确定需要执行哪个声音信息对应的操作指令。
可选的,该优先级规则可以指示按照特征信息的存储时间设置优先级,存储时间越早的特征信息的优先级越高。或者该优先级规则可以指示按照用户的使用频次设置优先级,使用频次越高的用户对应的特征信息的优先级越高。或者该优先级规则还可以指示按照用户的累计使用时间设置优先级,累计使用时间越长的用户对应的特征信息的优先级越高。
示例的,若终端在接收第一蓝牙耳机发送的第一声音信息时还接收到其他M个蓝牙耳机发送的M个声音信息,则可以在确定预设的多个特征信息中是否存在与第一声音信息匹配的第一特征信息时,分别确定该预设的多个特征信息中是否存在与该M个声音信息匹配的特征信息。
若预设的多个特征信息中存在与该M个声音信息中包括的N个声音信息匹配的N个特征信息,则终端可以根据预设的优先级规则,分别确定该第一特征信息和该N个特征信息的优先级。若该第一特征信息的优先级高于该N个特征信息中的任意一个特征信息的优先级,即该第一特征信息的优先级最高,则终端可以执行与该第一特征信息匹配的第一声音信息对应的操作指令;若该第一特征信息的优先级低于该N个特征信息中的任意一个特征信息的优先级,则终端可以执行与优先级最高的特征信息匹配的声音信息对应的操作指令,并丢弃与其他非最高优先级匹配的声音信息,即与该第一声音信息匹配的第一特征信息的优先级为非最高优先级时,丢弃该第一声音信息。
或者,终端在获取到该第一特征信息和该N个特征信息的优先级之后,可以按照该第一特征信息和该N个特征信息的优先级的由高到底依次存储与该第一特征信息和该N个特征信息匹配的该第一声音信息和该N个声音信息,然后按照存储顺序依次执行与该第一声音信息和该N个声音信息对应的操作指令。例如,假设N为2,即该N个特征信息分别为第二特征信息和第三特征信息,终端可以首先根据预设的优先级规则获取该第一特征信息、第二特征信息和第三特征信息的优先级,若该第二特征信息的优先级最高,第一特征信息的优先级次高,第三特征信息的优先级最低,则终端可以首先存储与该第二特征信息匹配的第二声音信息,然后存储与该第一特征信息匹配的第一声音信息,接着存储与该第三特征信息匹配的第三声音信息。存储完成之后,终端可以按照存储顺序首先执行第二声音信息对应的操作指令,然后执行该第一声音信息对应的操作指令,最后执行第三声音信息对应的操作指令。
本公开的实施例提供的技术方案中,通过预先设定优先级规则,使得一定范围内多个蓝牙耳机可以共享一个终端,降低了多个用户使用终端的成本。
图2是根据一示例性实施例示出的一种语音控制方法的交互图,执行主体为终端和与该终端连接的M个蓝牙耳机,如图2所示,包括以下步骤201至步骤208:
在步骤201中,M个蓝牙耳机均按照预设周期采集周围环境的声音并生成声音信息。
在步骤202中,M个蓝牙耳机均将生成的声音信息发送给终端。
在步骤203中,终端在接收到M个蓝牙耳机发送的M个声音信息时,分别确定预设的多个特征信息中是否存在与该M个声音信息匹配的特征信息;若终端确定预设的多个特征信息中存在分别与其中的N个声音信息匹配的N个特征信息,执行步骤204;若终端确定预设的多个特征信息中不存在与剩余的S个声音信息匹配的特征信息,执行步骤207。
该S与N的和为M。
在步骤204中,根据预设的优先级规则,分别确定该N个特征信息的优先级。
在步骤205中,按照该N个特征信息的优先级的由高到底依次存储与该N个特征信息匹配的N个声音信息。
在步骤206中,按照存储顺序依次将语音通话的频率切换至与该N个第一特征信息匹配的第一特征信息对应的频率,并采用对应的频率依次广播该N个声音信息。
在步骤207中,按照接收时间依次存储该S个声音信息。
在步骤208中,按照存储顺序采用预设的公共频率依次广播该S个声音信息。
本公开的实施例提供一种语音控制方法,该方法可以通过预先设定优先级规则,使得一定范围内多个蓝牙耳机可以共享一个终端,降低了多个用户使用终端的成本。
下述为本公开装置实施例,可以用于执行本公开方法实施例。
图3a是根据一示例性实施例示出的一种语音控制装置30的结构示意图,该装置30可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图3a所示,该语音控制装置30包括接收模块301,确定模块302和执行模块303。
其中,接收模块301,用于接收第一蓝牙耳机发送的第一声音信息,所述第一声音信息为所述第一蓝牙耳机采集到的周围环境的声音。
确定模块302,用于确定预设的多个特征信息中是否存在与所述第一声音信息匹配的第一特征信息。
执行模块303,用于若所述预设的多个特征信息中存在与所述第一声音信息匹配的第一特征信息,执行所述第一声音信息对应的操作指令。
在一个实施例中,如图3b所示,所述执行模块303包括频率切换子模块3031,所述频率切换子模块3031,用于若所述预设的多个特征信息中存在与所述第一声音信息匹配的第一特征信息,根据预存的特征信息与频率的对应关系,将语音通话的频率切换至与所述第一声音信息匹配的第一特征信息对应的频率。
在一个实施例中,如图3c所示,所述装置30还包括公共切换模块304,所述公共切换模块304,用于若所述预设的多个特征信息中不存在与所述第一声音信息匹配的第一特征信息,将语音通话的频率切换至预设的公共频率。
在一个实施例中,如图3d所示,所述执行模块303包括第一确定子模块3032,第二确定子模块3033和第一执行子模块3034。
其中,第一确定子模块3032,用于若在接收所述第一蓝牙耳机发送的所述第一声音信息时接收到其他M个蓝牙耳机发送的M个声音信息,分别确定所述预设的多个特征信息中是否存在与所述M个声音信息匹配的特征信息,所述M为大于或等于1的整数。
第二确定子模块3033,用于若所述预设的多个特征信息中存在分别与其中的N个声音信息匹配的N个特征信息,根据预设的优先级规则,分别确定所述第一特征信息和所述N个特征信息的优先级,所述N为小于或等于M的整数。
第一执行子模块3034,用于若所述第一特征信息的优先级高于所述N个特征信息中的任意一个特征信息的优先级,执行所述第一声音信息对应的操作指令。
在一个实施例中,如图3e所示,所述装置30还包括丢弃模块305,所述丢弃模块305,用于若所述第一特征信息的优先级低于所述N个特征信息中的任意一个特征信息的优先级,丢弃所述第一声音信息。
在一个实施例中,如图3f所示,所述装置30还包括存储模块306和第二执行子模块307。
其中,存储模块306,用于按照所述第一特征信息和所述N个特征信息的优先级的由高到底依次存储与所述第一特征信息和所述N个特征信息匹配的所述第一声音信息和所述N个声音信息。
第二执行子模块307,用于按照存储顺序依次执行与所述第一声音信息和所述N个声音信息对应的操作指令。
本公开的实施例提供一种语音控制装置,该装置在接收到蓝牙耳机发送的声音信息之后,可以通过对声音信息与预设声音特征的对比确定是否执行该声音信息对应的操作指令,避免了在环境声音的音量较大时终端由于接收到蓝牙耳机发送的声音信息而误执行操作指令的情况,进而避免了终端资源的浪费,提高了终端的待机时间。
本公开实施例提供一种语音控制装置,该语音控制装置包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,处理器被配置为:
接收第一蓝牙耳机发送的第一声音信息,所述第一声音信息为所述第一蓝牙耳机采集到的周围环境的声音。
确定预设的多个特征信息中是否存在与所述第一声音信息匹配的第一特征信息。
若所述预设的多个特征信息中存在与所述第一声音信息匹配的第一特征信息,执行所述第一声音信息对应的操作指令。
在一个实施例中,上述处理器还可被配置为:若所述预设的多个特征信息中存在与所述第一声音信息匹配的第一特征信息,根据预存的特征信息与频率的对应关系,将语音通话的频率切换至与所述第一声音信息匹配的第一特征信息对应的频率。
在一个实施例中,上述处理器还可被配置为:若所述预设的多个特征信息中不存在与所述第一声音信息匹配的第一特征信息,将语音通话的频率切换至预设的公共频率。
在一个实施例中,上述处理器还可被配置为:若在接收所述第一蓝牙耳机发送的所述第一声音信息时接收到其他M个蓝牙耳机发送的M个声音信息,分别确定所述预设的多个特征信息中是否存在与所述M个声音信息匹配的特征信息,所述M为大于或等于1的整数;若所述预设的多个特征信息中存在分别与其中的N个声音信息匹配的N个特征信息,根据预设的优先级规则,分别确定所述第一特征信息和所述N个特征信息的优先级,所述N为小于或等于M的整数;若所述第一特征信息的优先级高于所述N个特征信息中的任意一个特征信息的优先级,执行所述第一声音信息对应的操作指令。
在一个实施例中,上述处理器还可被配置为:若所述第一特征信息的优先级低于所述N个特征信息中的任意一个特征信息的优先级,丢弃所述第一声音信息。
在一个实施例中,上述处理器还可被配置为:按照所述第一特征信息和所述N个特征信息的优先级的由高到底依次存储与所述第一特征信息和所述N个特征信息匹配的所述第一声音信息和所述N个声音信息;按照存储顺序依次执行与所述第一声音信息和所述N个声音信息对应的操作指令。
本公开的实施例提供一种语音控制装置,该装置在接收到蓝牙耳机发送的声音信息之后,可以通过对声音信息与预设声音特征的对比确定是否执行该声音信息对应的操作指令,避免了在环境声音的音量较大时终端由于接收到蓝牙耳机发送的声音信息而误执行操作指令的情况,进而避免了终端资源的浪费,提高了终端的待机时间。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图4是根据一示例性实施例示出的一种用于语音控制装置40的结构框图,该装置适用于终端设备。例如,装置40可以是移动电话,计算机,数字广播终端,消息收发设备,对讲机,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
装置40可以包括以下一个或多个组件:处理组件402,存储器404,电源组件406,多媒体组件408,音频组件410,输入/输出(I/O)接口412,传感器组件414,以及通信组件416。
处理组件402通常控制装置40的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件402可以包括一个或多个处理器420来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件402可以包括一个或多个模块,便于处理组件402和其他组件之间的交互。例如,处理组件402可以包括多媒体模块,以方便多媒体组件408和处理组件402之间的交互。
存储器404被配置为存储各种类型的数据以支持在装置40的操作。这些数据的示例包括用于在装置40上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器404可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件406为装置40的各种组件提供电力。电源组件406可以包括电源管理系统,一个或多个电源,及其他与为装置40生成、管理和分配电力相关联的组件。
多媒体组件408包括在所述装置40和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件408包括一个前置摄像头和/或后置摄像头。当装置40处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件410被配置为输出和/或输入音频信号。例如,音频组件410包括一个麦克风(MIC),当装置40处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器404或经由通信组件416发送。在一些实施例中,音频组件410还包括一个扬声器,用于输出音频信号。
输入/输出接口412为处理组件402和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件414包括一个或多个传感器,用于为装置40提供各个方面的状态评估。例如,传感器组件414可以检测到装置40的打开/关闭状态,组件的相对定位,例如所述组件为装置40的显示器和小键盘,传感器组件414还可以检测装置40或装置40一个组件的位置改变,用户与装置40接触的存在或不存在,装置40方位或加速/减速和装置40的温度变化。传感器组件414可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件414还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件414还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件416被配置为便于装置40和其他设备之间有线或无线方式的通信。装置40可以接入基于通信标准的无线网络,如对讲机专网,WiFi,2G,3G,4G或5G,或它们的组合。在一个示例性实施例中,通信组件416经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件416还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置40可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子组件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器404,上述指令可由装置40的处理器420执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本公开实施例提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置40的处理器执行时,使得装置40能够执行上述语音控制方法,所述方法包括:
接收第一蓝牙耳机发送的第一声音信息,所述第一声音信息为所述第一蓝牙耳机采集到的周围环境的声音。
确定预设的多个特征信息中是否存在与所述第一声音信息匹配的第一特征信息。
若所述预设的多个特征信息中存在与所述第一声音信息匹配的第一特征信息,执行所述第一声音信息对应的操作指令。
在一个实施例中,所述若所述预设的多个特征信息中存在与所述第一声音信息匹配的第一特征信息,执行所述第一声音信息对应的操作指令包括:若所述预设的多个特征信息中存在与所述第一声音信息匹配的第一特征信息,根据预存的特征信息与频率的对应关系,将语音通话的频率切换至与所述第一声音信息匹配的第一特征信息对应的频率。
在一个实施例中,所述方法还包括:若所述预设的多个特征信息中不存在与所述第一声音信息匹配的第一特征信息,将语音通话的频率切换至预设的公共频率。
在一个实施例中,所述执行所述第一声音信息对应的操作指令包括:若在接收所述第一蓝牙耳机发送的所述第一声音信息时接收到其他M个蓝牙耳机发送的M个声音信息,分别确定所述预设的多个特征信息中是否存在与所述M个声音信息匹配的特征信息,所述M为大于或等于1的整数;若所述预设的多个特征信息中存在分别与其中的N个声音信息匹配的N个特征信息,根据预设的优先级规则,分别确定所述第一特征信息和所述N个特征信息的优先级,所述N为小于或等于M的整数;若所述第一特征信息的优先级高于所述N个特征信息中的任意一个特征信息的优先级,执行所述第一声音信息对应的操作指令。
在一个实施例中,所述方法还包括:若所述第一特征信息的优先级低于所述N个特征信息中的任意一个特征信息的优先级,丢弃所述第一声音信息。
在一个实施例中,所述方法还包括:按照所述第一特征信息和所述N个特征信息的优先级的由高到底依次存储与所述第一特征信息和所述N个特征信息匹配的所述第一声音信息和所述N个声音信息;按照存储顺序依次执行与所述第一声音信息和所述N个声音信息对应的操作指令。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种语音控制方法,其特征在于,包括:
接收第一蓝牙耳机发送的第一声音信息,所述第一声音信息为所述第一蓝牙耳机采集到的周围环境的声音;
确定预设的多个特征信息中是否存在与所述第一声音信息匹配的第一特征信息;
若所述预设的多个特征信息中存在与所述第一声音信息匹配的第一特征信息,执行所述第一声音信息对应的操作指令。
2.根据权利要求1所述的方法,其特征在于,所述若所述预设的多个特征信息中存在与所述第一声音信息匹配的第一特征信息,执行所述第一声音信息对应的操作指令包括:
若所述预设的多个特征信息中存在与所述第一声音信息匹配的第一特征信息,根据预存的特征信息与频率的对应关系,将语音通话的频率切换至与所述第一声音信息匹配的第一特征信息对应的频率。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
若所述预设的多个特征信息中不存在与所述第一声音信息匹配的第一特征信息,将语音通话的频率切换至预设的公共频率。
4.根据权利要求1至3任意一项权利要求所述的方法,其特征在于,所述执行所述第一声音信息对应的操作指令包括:
若在接收所述第一蓝牙耳机发送的所述第一声音信息时接收到其他M个蓝牙耳机发送的M个声音信息,分别确定所述预设的多个特征信息中是否存在与所述M个声音信息匹配的特征信息,所述M为大于或等于1的整数;
若所述预设的多个特征信息中存在分别与其中的N个声音信息匹配的N个特征信息,根据预设的优先级规则,分别确定所述第一特征信息和所述N个特征信息的优先级,所述N为小于或等于M的整数;
若所述第一特征信息的优先级高于所述N个特征信息中的任意一个特征信息的优先级,执行所述第一声音信息对应的操作指令。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
若所述第一特征信息的优先级低于所述N个特征信息中的任意一个特征信息的优先级,丢弃所述第一声音信息。
6.根据权利要求4所述的方法,其特征在于,所述方法还包括:
按照所述第一特征信息和所述N个特征信息的优先级的由高到底依次存储与所述第一特征信息和所述N个特征信息匹配的所述第一声音信息和所述N个声音信息;
按照存储顺序依次执行与所述第一声音信息和所述N个声音信息对应的操作指令。
7.一种语音控制装置,其特征在于,包括:
接收模块,用于接收第一蓝牙耳机发送的第一声音信息,所述第一声音信息为所述第一蓝牙耳机采集到的周围环境的声音;
确定模块,用于确定预设的多个特征信息中是否存在与所述第一声音信息匹配的第一特征信息;
执行模块,用于若所述预设的多个特征信息中存在与所述第一声音信息匹配的第一特征信息,执行所述第一声音信息对应的操作指令。
8.根据权利要求7所述的装置,其特征在于,所述执行模块包括:
频率切换子模块,用于若所述预设的多个特征信息中存在与所述第一声音信息匹配的第一特征信息,根据预存的特征信息与频率的对应关系,将语音通话的频率切换至与所述第一声音信息匹配的第一特征信息对应的频率。
9.一种语音控制装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
接收第一蓝牙耳机发送的第一声音信息,所述第一声音信息为所述第一蓝牙耳机采集到的周围环境的声音;
确定预设的多个特征信息中是否存在与所述第一声音信息匹配的第一特征信息;
若所述预设的多个特征信息中存在与所述第一声音信息匹配的第一特征信息,执行所述第一声音信息对应的操作指令。
10.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现权利要求1至6任意一项权利要求所述方法的步骤。
CN201910157535.2A 2019-03-01 2019-03-01 语音控制方法及装置 Pending CN109903765A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910157535.2A CN109903765A (zh) 2019-03-01 2019-03-01 语音控制方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910157535.2A CN109903765A (zh) 2019-03-01 2019-03-01 语音控制方法及装置

Publications (1)

Publication Number Publication Date
CN109903765A true CN109903765A (zh) 2019-06-18

Family

ID=66946100

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910157535.2A Pending CN109903765A (zh) 2019-03-01 2019-03-01 语音控制方法及装置

Country Status (1)

Country Link
CN (1) CN109903765A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112954602A (zh) * 2021-04-28 2021-06-11 北京声智科技有限公司 语音控制方法、传输方法、装置、电子设备及存储介质
CN113055831A (zh) * 2019-12-26 2021-06-29 海能达通信股份有限公司 一种语音数据转发处理方法、装置及系统
CN113470661A (zh) * 2021-06-17 2021-10-01 深圳市视晶无线技术有限公司 实现自动ptt的音频对讲开启请求方法、音频对讲方法及存储介质
CN113965864A (zh) * 2021-09-28 2022-01-21 武汉左点科技有限公司 一种助听器智能交互方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012138872A (ja) * 2010-12-28 2012-07-19 Aiphone Co Ltd インターホン装置
CN103730120A (zh) * 2013-12-27 2014-04-16 深圳市亚略特生物识别科技有限公司 电子设备的语音控制方法及系统
CN106231071A (zh) * 2016-07-15 2016-12-14 宇龙计算机通信科技(深圳)有限公司 一种语音输出方法及终端
CN106656274A (zh) * 2016-11-30 2017-05-10 武汉船舶通信研究所 一种语音传输系统
CN107172256A (zh) * 2017-07-27 2017-09-15 广东欧珀移动通信有限公司 耳机通话自适应调整方法、装置、移动终端及存储介质
CN108962260A (zh) * 2018-06-25 2018-12-07 福来宝电子(深圳)有限公司 一种多人命令语音识别方法、系统及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012138872A (ja) * 2010-12-28 2012-07-19 Aiphone Co Ltd インターホン装置
CN103730120A (zh) * 2013-12-27 2014-04-16 深圳市亚略特生物识别科技有限公司 电子设备的语音控制方法及系统
CN106231071A (zh) * 2016-07-15 2016-12-14 宇龙计算机通信科技(深圳)有限公司 一种语音输出方法及终端
CN106656274A (zh) * 2016-11-30 2017-05-10 武汉船舶通信研究所 一种语音传输系统
CN107172256A (zh) * 2017-07-27 2017-09-15 广东欧珀移动通信有限公司 耳机通话自适应调整方法、装置、移动终端及存储介质
CN108962260A (zh) * 2018-06-25 2018-12-07 福来宝电子(深圳)有限公司 一种多人命令语音识别方法、系统及存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113055831A (zh) * 2019-12-26 2021-06-29 海能达通信股份有限公司 一种语音数据转发处理方法、装置及系统
CN113055831B (zh) * 2019-12-26 2022-08-30 海能达通信股份有限公司 一种语音数据转发处理方法、装置及系统
CN112954602A (zh) * 2021-04-28 2021-06-11 北京声智科技有限公司 语音控制方法、传输方法、装置、电子设备及存储介质
CN112954602B (zh) * 2021-04-28 2022-11-29 北京声智科技有限公司 语音控制方法、传输方法、装置、电子设备及存储介质
CN113470661A (zh) * 2021-06-17 2021-10-01 深圳市视晶无线技术有限公司 实现自动ptt的音频对讲开启请求方法、音频对讲方法及存储介质
CN113965864A (zh) * 2021-09-28 2022-01-21 武汉左点科技有限公司 一种助听器智能交互方法及装置

Similar Documents

Publication Publication Date Title
KR101571993B1 (ko) 음성 통화 방법, 음성 재생 방법, 장치, 프로그램 및 기록매체
CN109903765A (zh) 语音控制方法及装置
RU2619083C2 (ru) Способ и устройство для сообщения о запросе на вызов
CN105120122A (zh) 报警方法及装置
CN106791921A (zh) 视频直播的处理方法及装置
CN105515952B (zh) 多媒体消息发送方法及装置
CN105653236A (zh) 音量控制方法、装置和移动终端
CN104767860A (zh) 来电提示方法、装置及终端
CN108270922A (zh) 语音处理方法及装置
CN106101456A (zh) 一种呼叫联系人的方法及装置
CN106101433B (zh) 通知消息显示方法和装置
CN109582400A (zh) 程序调用方法及装置
EP3261324B1 (en) Method and device for application switching
CN106357610B (zh) 通信方法及装置
CN109325337A (zh) 解锁方法及装置
CN105323383B (zh) 手机铃声音量的调整方法和装置
CN105100410B (zh) 聚合第三方电话应用的方法及装置
CN106775646A (zh) 闹钟控制方法及装置
CN106445499A (zh) 快捷键的提示方法及设备
CN107124512B (zh) 音频播放模式的切换方法和装置
CN109243447A (zh) 语音发送触发方法及装置
CN105554297A (zh) 信息提醒方法及装置、终端
CN109521923A (zh) 悬浮窗控制方法、装置及存储介质
CN110121148A (zh) 对讲机组队方法及装置
CN109451135A (zh) 联系人创建方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20211228

Address after: 710077 room 506, zone a, science and technology resources planning center, Xi'an, Shaanxi Province

Applicant after: XI'AN FENGYU INFORMATION TECHNOLOGY Co.,Ltd.

Address before: 505, zone a, science and technology resources co ordination center, high tech Zone, Xi'an City, Shaanxi Province, 710000

Applicant before: XI'AN JIFENGTIANXIA INFORMATION TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20190618

RJ01 Rejection of invention patent application after publication