CN108062464A - 基于声纹识别的终端控制方法及系统 - Google Patents
基于声纹识别的终端控制方法及系统 Download PDFInfo
- Publication number
- CN108062464A CN108062464A CN201711208166.2A CN201711208166A CN108062464A CN 108062464 A CN108062464 A CN 108062464A CN 201711208166 A CN201711208166 A CN 201711208166A CN 108062464 A CN108062464 A CN 108062464A
- Authority
- CN
- China
- Prior art keywords
- voice messaging
- information
- operational order
- user
- voiceprint
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000005540 biological transmission Effects 0.000 claims description 30
- 230000001755 vocal effect Effects 0.000 claims description 29
- 230000002093 peripheral effect Effects 0.000 description 7
- 210000000056 organ Anatomy 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 206010011469 Crying Diseases 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明提供一种基于声纹识别的终端控制方法及系统,方法包括:接收用户发送的语音信息;根据所述语音信息在预先建立的语音信息关系库中获取所述语音信息对应的操作指令,其中,所述语音信息关系库中存储有各语音信息对应的操作指令;根据所述操作指令执行相应操作。通过本发明,能够通过预设的语音信息使终端快速地执行该语音信息对应的操作,从而在提高了终端的使用效率的基础上,提高了用户体验。
Description
技术领域
本发明涉及终端领域,尤其涉及一种基于声纹识别的终端控制方法及系统。
背景技术
随着终端技术的发展,用户对电子终端的应用越来越广泛,通过电子终端可以完成支付、办公、交流等操作,由此可见,电子终端的重要性日渐重要。实际应用中,用户使用电子终端时,一般需要用户手动进行解锁并执行目标应用,因此,过程较为繁琐,造成电子终端使用效率较低,用户体验度不高。
为了解放用户的双手,现有技术提供了多种多样的语音识别及控制技术,从而实现解放用户的双手,使用户无需手动对电子终端进行操作,提高电子终端使用效率的同时提高用户的体验度。
但是,现有的语音控制技术往往存在这样的问题:用户首先需要按住语音按钮,进入语音系统,然后才能发出语音指令,当然,若手机处于关闭状态,则需要先唤醒手机,再按语音按钮进行语音系统。进一步地,电子终端接收用户发送的语音信息,并执行与用户发送的语音信息语意相对应的操作,但是上述操作往往比较容易被其他人听到,从而实现对终端的控制,因此,造成终端的使用效率以及安全性不高。
发明内容
本发明提供一种基于声纹识别的终端控制方法及系统,用于通过预设的语音信息使终端快速地执行该语音信息对应的操作,从而在提高了终端的使用效率的基础上,提高了用户体验。
本发明的第一个方面是提供一种基于声纹识别的终端控制方法,包括:接收用户发送的语音信息;根据所述语音信息在预先建立的语音信息关系库中获取所述语音信息对应的操作指令,其中,所述语音信息关系库中存储有各语音信息对应的操作指令;根据所述操作指令执行相应操作。
本发明的另一个方面是提供一种基于声纹识别的终端控制系统,包括:接收模块,用于接收用户发送的语音信息;获取模块,用于根据所述语音信息在预先建立的语音信息关系库中获取所述语音信息对应的操作指令,其中,所述语音信息关系库中存储有各语音信息对应的操作指令;执行模块,用于根据所述操作指令执行相应操作。
本发明提供的基于声纹识别的终端控制方法与系统,通过根据用户当前发送的语音信息,在预先建立的语音信息关系库中获取与该语音信息对应的目标操作,并执行该目标操作,从而实现了对终端快速有效地控制,进而在提高了终端的使用效率的基础上,提高了用户体验。由于用户发送的语音信息的语意与操作指令不一致,因此,即使用户的电子终端被窃取或盗用,也能保证用户电子终端内文件的安全性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的基于声纹的终端控制方法的流程图;
图2为本发明实施例二提供的基于声纹的终端控制方法的流程图;
图3为本发明实施例三提供的基于声纹的终端控制系统的结构图;
图4为本发明实施例四提供的基于声纹的终端控制系统的结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例所获得的所有其他实施例,都属于本发明保护的范围。
下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。
图1为本发明实施例一提供的基于声纹的终端控制方法的流程图,如图1所示,所述方法包括:
101、接收用户发送的语音信息。
在本实施方式中,电子终端实时接收用户发送的语音信息,具体地,电子终端可以在锁屏的情况下接收语音信息,也可以在解锁的情况下接收用户发送的语音信息。实际应用中,电子终端可以根据自身设置的听筒来接收用户发送的语音信息,此外,为了提高接收语音信息的质量,也可以通过外设的收音设备来接受用户发送额语音信息,如外设的麦克风等,本发明在此不做限制。
102、根据所述语音信息在预先建立的语音信息关系库中获取所述语音信息对应的操作指令,其中,所述语音信息关系库中存储有各语音信息对应的操作指令,所述语音信息包含的语意信息与操作指令不一致。
在本实施方式中,语音信息关系库中可以预先存储用户设置的标准语音信息以及和标准语音信息对应的目标操作指令,接收到用户发送的语音信息之后,可以根据该语音信息在预先建立的语音信息关系库中获取与该语音信息对应的标准语音信息,并将该标准语音信息对应的操作作为用户发送的语音信息对应的目标操作指令。
具体地,为了保护用户终端的安全,用户发送的语音信息中包含的文字语意与获取到的操作指令不一致,从而使其他人即使窃取或盗用用户的电子终端,也无法根据对其进行控制,举例来说,若用户发送的语音信息为你好,则对应的目标操作指令可以为控制电子终端解锁;若用户发送的语音信息为123,则对应的目标操作指令可以为控制电子终端给预设号码发送预设内容的短信。
103、根据所述操作指令执行相应操作。
在本实施方式中,获取到用户语音信息对应的目标操作之后,可以根据该目标操作指令执行对应的操作,承接上例来说,若用户发送的语音信息为你好,则对应的目标操作指令可以为控制电子终端解锁。获取到该操作指令之后,电子终端可以进行解锁。
以实际应用来举例,用户可以预设“救命”的语音信息对应的目标操作指令为获取当前的地理位置信息,并向预设的号码发送携带该地理位置信息的求救短信,具体地,预设的号码可以为110或其他亲人朋友的电话号码。当用户遭遇危险时,发出“救命”的语音信息,则终端接收到该语音信息之后,可以获取当前的地理位置信息并将该地理位置信息与预设的文本信息以短信的方式发送至预设的号码进行求救。
本实施例提供的基于声纹的终端控制方法,通过根据用户当前发送的语音信息,在预先建立的语音信息关系库中获取与该语音信息对应的目标操作,并执行该目标操作,从而实现了对终端快速有效地控制,进而在提高了终端的使用效率的基础上,提高了用户体验。由于用户发送的语音信息的语意与操作指令不一致,因此,即使用户的电子终端被窃取或盗用,也能保证用户电子终端内文件的安全性。
进一步地,在实施例一的基础上,步骤102具体包括:
获取所述语音信息中包含的第一词汇信息;
将所述第一词汇信息与所述语音信息关系库中全部标准语音信息对应的标准词汇信息进行比对;
若所述第一词汇信息与所述标准语音信息关系库中的任一标准词汇信息的相似度超过预设的阈值,则获取所述标准词汇信息对应的标准语音信息对应的操作指令。
在本实施方式中,接收到用户发送的语音信息之后,可以将该语音信息转换为第一词汇信息,将转换后的第一词汇信息与语音信息关系库中全部标准语音信息对应的标准词汇信息进行比对,若该第一词汇信息与语音信息关系库中的任一标准词汇信息的相似度超过预设的阈值,则获取该标准词汇信息对应的标准语音信息对应的操作指令,可选地,若该第一词汇信息与语音信息关系库中的多个标准词汇信息的相似度都超过预设的阈值,则获取相似度最高的标准词汇信息对应的标准语音信息对应的操作指令作为目标操作指令。相应地,若该第一词汇信息与语音信息关系库中的任一标准词汇信息的相似度都没有超过预设的阈值,则不根据该语音信息进行操作,或者,向用户推送是否根据该语音信息设置新的操作指令,以使后续可以根据该语音信息对终端进行控制。
本实施方式提供的基于声纹的终端控制方法,通过识别语音信息中的词汇信息并与语音信息关系库中全部标准语音信息进行比对,并获取与其相似度超过阈值的操作指令,从而能够实现通过语音对终端地精准控制,提高终端的使用效率,进而提高了用户体验。
进一步地,在上述实施例的基础上,步骤102之前,所述方法还包括:
获取所述语音信息对应的第一声纹信息;
将所述第一声纹信息与所述语音信息关系库中全部标准语音信息对应的标准声纹信息进行比对;
若所述第一声纹信息与所述标准语音信息关系库中的任一标准声纹信息的相似度超过预设的阈值,则根据所述语音信息在预先建立的语音信息关系库中获取与所述语音信息对应的操作指令。
在本实施方式中,在获取语音信息中的词汇信息之前,还需要判定用户身份是否合法,若用户身份合法,则执行后续的操作,若用户身份不合法,则不再根据该语音信息执行后续操作。具体地,由于人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,每个人在讲话时使用的发声器官在尺寸和形态方面的差异很大,所以任何两个人的声纹图谱都有差异,因此,可以通过声纹信息来判断用户身份是否合法,具体判断用户身份可以通过一下方式:分析获取语音信息对应的声纹信息,并将用户输入的语音信息对应的第一声纹信息与语音信息关系库中全部标准语音信息对应的标准声纹信息进行比对,若检测到用户输入的语音信息与语音信息关系库中任一标准语音信息对应的标准声纹信息的相似度超过预设的阈值,则可以判定该用户身份合法,则可以执行后续获取词汇信息的步骤。
通过本实施方式提供的基于声纹的终端控制方法,通过比对用户发送的语音对应的声纹信息与语音信息关系库中的标准声纹信息的相似度,从而实现对用户身份的识别,因此在实现对电子终端的语音控制的基础上,提高了语音控制的安全性,能够保护用户的利益不受损失。
可选地,在上述实施例的基础上,所述方法还包括:
若终端当前为锁定状态,且所述第一声纹信息与所述标准语音信息关系库中的任一标准声纹信息的相似度超过预设的阈值,则对所述终端进行解锁。
在本实施方式中,若接收用户发送的语音信息时,用户的电子终端处于锁定状态,则若检测到当前接收的语音信息对应的第一声纹信息与语音信息关系库中的任一标准声纹信息的相似度超过预设的阈值,则此时,可以判断该用户的身份合法,则可以对电子终端进行解锁。
可选地,用户可以设置一个语音信息用于指示电子终端进行解锁操作,例如,电子终端接收到用户发送的“解锁”的语音信息,则若该语音信息与语音信息关系库中的任一标准声纹信息的相似度超过预设的阈值,则对电子终端进行解锁,此外,用户也可以通过发出的任一声音,只要该声音对应的声纹信息能与语音信息关系库中的任一标准声纹信息的相似度超过预设的阈值,也可以对该电子终端进行解锁。
通过本实施方式提供的基于声纹的终端控制方法,若当前用户的电子终端处于锁定状态,则若检测到当前接收的语音信息对应的第一声纹信息与语音信息关系库中的任一标准声纹信息的相似度超过预设的阈值,即可对电子终端进行解锁,从而能够提高终端的解锁效率以及安全性,从而提高了用户体验。
进一步地,为了提高电子终端的安全性,在上述实施例的基础上,所述方法还包括:
若所述第一声纹信息与所述标准语音信息关系库中的任一标准声纹信息的相似度都低于预设的阈值,则不根据所述语音信息在预先建立的语音信息关系库中获取与所述语音信息对应的操作指令。
在本实施方式中,若检测到接收到的语音信息对应的第一声纹信息与标准语音信息关系库中的任一标准声纹信息的相似度都低于预设的阈值,则可以判断该语音信息不合法,为了保证电子终端操作的安全性,不根据该语音信息在预先建立的语音信息关系库中获取与该语音信息对应的操作指令。可选的,电子终端在检测到该语音信息对应的第一声纹信息与标准语音信息关系库中的任一标准声纹信息的相似度都低于预设的阈值之后,还可以向用户推送是否将该语音信息添加至语音信息关系库中;或者对该用户进行用户验证,若验证成功,则可以根据该语音信息进行下一步的操作,需要说明的是,添加之前需要对该用户进行用户验证,具体地,用户验证的方法可以为指纹验证、密码验证等任何可以实现验证的方式,本发明在此不做限制。
本实施方式提供的基于声纹的终端控制方法,为了保证电子终端操作的安全性,若检测到接收到的语音信息与标准语音信息关系库中的任一标准声纹信息的相似度都低于预设的阈值,则不针对该语音信息进行下一步的操作,从而在实现电子终端快速控制的基础上,提高了终端的安全性。
进一步地,为了提高识别的精度,需要对语音信息关系库进行实时更新,在上述实施例的基础上,在步骤102之后,所述方法还包括:
将所述语音信息作为所述标准语音信息并与所述操作指令关联存储至所述语音信息关系库中。
在本实施方式中,若用户发送的语音信息与语音信息关系库中的标准语音信息匹配成功之后,则判定该语音信息与标准语音信息匹配度较高,因此,为了增加后续识别的精度与准确性,则可以将该语音信息作为标准语音信息并与对应的目标操作关联存储至语音信息关系库。
作为一种可实施的方式,由于该语音信息能够与语音信息关系库中的标准语音信息匹配成功,因此为了提高比对的速度,也可以不将该语音信息作为标准语音信息添加至语音信息关系库。相应地,若检测到该语音信息不能够与语音信息关系库中的标准语音信息匹配成功,则可以向用户推送是否将该语音信息作为标准信息进行存储的消息。
本实施方式提供的基于声纹的终端控制方法,通过将与语音信息关系库中的标准语音信息匹配成功的语音信息作为标准语音信息进行存储,从而能够提高声纹识别的精准度,从而进一步地提高对电子终端控制的效率。
图2为本发明实施例二提供的基于声纹的终端控制方法的流程图,如图2所示,在上述实施例的基础上,所述方法包括:
201、接收用户发送的设置标准语音信息的请求。
在本实施方式中,电子终端可以接受用户发送的设置标准语音信息的请求,具体地,用户可以在APP内预设的功能模块发起该请求。接收到该请求之后,为了保证电子终端内文件的安全性,应对发送该请求的用户身份进行验证,具体地,用户验证的方法可以为指纹验证、密码验证等任何可以实现验证的方式,本发明在此不做限制。
202、根据所述请求获取所述用户当前的发送的语音信息。
在本实施方式中,若用户验证通过,则可以根据该请求获取用户当前发送的语音信息。具体地,电子终端可以根据自身设置的听筒来接收用户发送的语音信息,此外,为了提高接收语音信息的质量,也可以通过外设的收音设备来接受用户发送额语音信息,如外设的麦克风等,本发明在此不做限制。相应的,只要用户验证通过,则电子终端可以接收多个用户发送的语音信息。
203、接收用户输入的与所述语音信息对应的操作指令。
在本实施方式中,接收到该语音信息之后,接收用户发送的与该语音信息相对应的操作指令,具体地,可以将用户通过键盘输入的文字信息作为操作指令,也可以将用户发送的语音信息转换为相应的文字信息,作为操作指令,作为一种可实施的方式,电子终端也可以接收并记录用户对终端的具体操作,相应的,操作指令可以电子终端执行记录的具体操作。
需要说明的是,用户发送的语音信息的内容可以与操作指令相匹配,举例来说,用户输入的语音信息为“播放音乐”,对应的操作指令为控制电子终端播放音乐;相应的,用户发送的语音信息的内容也可以与操作指令不匹配,举例来说,用户数据的语音信息为“你好”,而对应的操作指令可以为控制电子终端打开支付软件。
204、将所述语音信息作为标准语音信息并与所述操作指令关联存储至所述语音信息关系库。
在本实施方式中,接收到用户输入的语音信息与对应的操作指令之后,将该语音信息与操作指令关联存储至语音信息关系库,以使用户在输入与该语音信息相匹配的语音信息之后,电子终端可以根据预设的操作指令执行操作。具体地,语音信息关系库中可以存储多个语音信息以及对应的操作指令。
本实施例提供的基于声纹的终端控制方法,通过接收用户输入的语音信息与对应的操作指令,并关联存储,从而能够在后续用户发出相应的语音信息时,根据用户的语音信息执行相应的操作指令,进而提高了电子终端的使用效率。
图3为本发明实施例三提供的基于声纹的终端控制系统的结构图,如图3所示,所述系统包括:
接收模块31,用于接收用户发送的语音信息。
获取模块32,用于根据所述语音信息在预先建立的语音信息关系库中获取所述语音信息对应的操作指令,其中,所述语音信息关系库中存储有各语音信息对应的操作指令。
执行模块33,用于根据所述操作指令执行相应操作。
在本实施方式中,接收模块31实时接收用户发送的语音信息,具体地,电子终端可以在锁屏的情况下接收语音信息,也可以在解锁的情况下接收用户发送的语音信息。实际应用中,电子终端可以根据自身设置的听筒来接收用户发送的语音信息,此外,为了提高接收语音信息的质量,也可以通过外设的收音设备来接受用户发送额语音信息,如外设的麦克风等,本发明在此不做限制。
语音信息关系库中可以预先存储用户设置的标准语音信息以及和标准语音信息对应的目标操作指令,接收到用户发送的语音信息之后,获取模块32可以根据该语音信息在预先建立的语音信息关系库中获取与该语音信息对应的标准语音信息,并将该标准语音信息对应的操作作为用户发送的语音信息对应的目标操作指令。
作为一种可实施的方式,用户发送的语音信息中包含的文字语意可以和具体的操作相对应,举例来说,若用户发送的语音信息为播放歌曲,则对应的目标操作指令可以为控制电子终端打开音乐播放器播放歌曲;若用户发送的语音信息为拨打某一电话,则对应的目标操作指令可以为控制电子终端拨打该电话号码。可选地,用户发送的语音信息中包含的文字语意也可以不和具体的操作相对应,举例来说,若用户发送的语音信息为你好,则对应的目标操作指令可以为控制电子终端解锁;若用户发送的语音信息为123,则对应的目标操作指令可以为控制电子终端给预设号码发送预设内容的短信。
获取到用户语音信息对应的目标操作之后,执行模块33可以根据该目标操作指令执行对应的操作,承接上例来说,若用户发送的语音信息为你好,则对应的目标操作指令可以为控制电子终端解锁。获取到该操作指令之后,电子终端可以进行解锁。
以实际应用来举例,用户可以预设“救命”的语音信息对应的目标操作指令为获取当前的地理位置信息,并向预设的号码发送携带该地理位置信息的求救短信,具体地,预设的号码可以为110或其他亲人朋友的电话号码。当用户遭遇危险时,发出“救命”的语音信息,则终端接收到该语音信息之后,可以获取当前的地理位置信息并将该地理位置信息与预设的文本信息以短信的方式发送至预设的号码进行求救。
本实施例提供的基于声纹的终端控制系统,通过根据用户当前发送的语音信息,在预先建立的语音信息关系库中获取与该语音信息对应的目标操作,并执行该目标操作,从而实现了对终端快速有效地控制,进而在提高了终端的使用效率的基础上,提高了用户体验。
进一步地,在实施例三的基础上,获取模块32具体包括:
获取词汇信息单元,用于获取所述语音信息中包含的第一词汇信息;
第一比对单元,用于将所述第一词汇信息与所述语音信息关系库中全部标准语音信息对应的标准词汇信息进行比对;
第一获取操作指令单元,用于若所述第一词汇信息与所述标准语音信息关系库中的任一标准词汇信息的相似度超过预设的阈值,则获取所述标准词汇信息对应的标准语音信息对应的操作指令。
在本实施方式中,接收到用户发送的语音信息之后,获取词汇信息单元可以将该语音信息转换为第一词汇信息,第一比对单元将转换后的第一词汇信息与语音信息关系库中全部标准语音信息对应的标准词汇信息进行比对,若该第一词汇信息与语音信息关系库中的任一标准词汇信息的相似度超过预设的阈值,则第一获取操作指令单元获取该标准词汇信息对应的标准语音信息对应的操作指令,可选地,若该第一词汇信息与语音信息关系库中的多个标准词汇信息的相似度都超过预设的阈值,则获取相似度最高的标准词汇信息对应的标准语音信息对应的操作指令作为目标操作指令。相应地,若该第一词汇信息与语音信息关系库中的任一标准词汇信息的相似度都没有超过预设的阈值,则不根据该语音信息进行操作,或者,向用户推送是否根据该语音信息设置新的操作指令,以使后续可以根据该语音信息对终端进行控制。
本实施方式提供的基于声纹的终端控制系统,通过识别语音信息中的词汇信息并与语音信息关系库中全部标准语音信息进行比对,并获取与其相似度超过阈值的操作指令,从而能够实现通过语音对终端地精准控制,提高终端的使用效率,进而提高了用户体验。
进一步地,在上述实施例的基础上,所述系统还包括:
获取声纹信息单元,用于获取所述语音信息对应的第一声纹信息;
第二比对单元,用于将所述第一声纹信息与所述语音信息关系库中全部标准语音信息对应的标准声纹信息进行比对;
第二获取操作指令单元,用于若所述第一声纹信息与所述标准语音信息关系库中的任一标准声纹信息的相似度超过预设的阈值,则根据所述语音信息在预先建立的语音信息关系库中获取与所述语音信息对应的操作指令。
在本实施方式中,在获取语音信息中的词汇信息之前,还需要判定用户身份是否合法,若用户身份合法,则执行后续的操作,若用户身份不合法,则不再根据该语音信息执行后续操作。具体地,由于人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,每个人在讲话时使用的发声器官在尺寸和形态方面的差异很大,所以任何两个人的声纹图谱都有差异,因此,可以通过声纹信息来判断用户身份是否合法,具体判断用户身份可以通过一下方式:获取声纹信息单元分析获取语音信息对应的声纹信息,第二比对单元并将用户输入的语音信息对应的第一声纹信息与语音信息关系库中全部标准语音信息对应的标准声纹信息进行比对,若第二获取操作指令单元检测到用户输入的语音信息与语音信息关系库中任一标准语音信息对应的标准声纹信息的相似度超过预设的阈值,则可以判定该用户身份合法,则可以执行后续获取词汇信息的步骤。
通过本实施方式提供的基于声纹的终端控制系统,通过比对用户发送的语音对应的声纹信息与语音信息关系库中的标准声纹信息的相似度,从而实现对用户身份的识别,因此在实现对电子终端的语音控制的基础上,提高了语音控制的安全性,能够保护用户的利益不受损失。
可选地,在上述实施例的基础上,所述系统还包括:
解锁模块,用于若终端当前为锁定状态,且所述第一声纹信息与所述标准语音信息关系库中的任一标准声纹信息的相似度超过预设的阈值,则对所述终端进行解锁。
在本实施方式中,若接收用户发送的语音信息时,用户的电子终端处于锁定状态,则若解锁模块检测到当前接收的语音信息对应的第一声纹信息与语音信息关系库中的任一标准声纹信息的相似度超过预设的阈值,则此时,可以判断该用户的身份合法,则可以对电子终端进行解锁。
可选地,用户可以设置一个语音信息用于指示电子终端进行解锁操作,例如,电子终端接收到用户发送的“解锁”的语音信息,则若该语音信息与语音信息关系库中的任一标准声纹信息的相似度超过预设的阈值,则对电子终端进行解锁,此外,用户也可以通过发出的任一声音,只要该声音对应的声纹信息能与语音信息关系库中的任一标准声纹信息的相似度超过预设的阈值,也可以对该电子终端进行解锁。
通过本实施方式提供的基于声纹的终端控制系统,若当前用户的电子终端处于锁定状态,则若检测到当前接收的语音信息对应的第一声纹信息与语音信息关系库中的任一标准声纹信息的相似度超过预设的阈值,即可对电子终端进行解锁,从而能够提高终端的解锁效率以及安全性,从而提高了用户体验。
进一步地,为了提高电子终端的安全性,在上述实施例的基础上,所述系统还包括:
匹配模块,用于若所述第一声纹信息与所述标准语音信息关系库中的任一标准声纹信息的相似度都低于预设的阈值,则不根据所述语音信息在预先建立的语音信息关系库中获取与所述语音信息对应的操作指令。
在本实施方式中,若匹配模块检测到接收到的语音信息对应的第一声纹信息与标准语音信息关系库中的任一标准声纹信息的相似度都低于预设的阈值,则可以判断该语音信息不合法,为了保证电子终端操作的安全性,不根据该语音信息在预先建立的语音信息关系库中获取与该语音信息对应的操作指令。可选的,电子终端在检测到该语音信息对应的第一声纹信息与标准语音信息关系库中的任一标准声纹信息的相似度都低于预设的阈值之后,还可以向用户推送是否将该语音信息添加至语音信息关系库中;或者对该用户进行用户验证,若验证成功,则可以根据该语音信息进行下一步的操作,需要说明的是,添加之前需要对该用户进行用户验证,具体地,用户验证的方法可以为指纹验证、密码验证等任何可以实现验证的方式,本发明在此不做限制。
本实施方式提供的基于声纹的终端控制系统,为了保证电子终端操作的安全性,若检测到接收到的语音信息与标准语音信息关系库中的任一标准声纹信息的相似度都低于预设的阈值,则不针对该语音信息进行下一步的操作,从而在实现电子终端快速控制的基础上,提高了终端的安全性。
进一步地,为了提高识别的精度,需要对语音信息关系库进行实时更新,在上述实施例的基础上,所述系统还包括:
更新模块,用于将所述语音信息作为所述标准语音信息并与所述操作指令关联存储至所述语音信息关系库中。
在本实施方式中,若用户发送的语音信息与语音信息关系库中的标准语音信息匹配成功之后,则判定该语音信息与标准语音信息匹配度较高,因此,为了增加后续识别的精度与准确性,则更新模块可以将该语音信息作为标准语音信息并与对应的目标操作关联存储至语音信息关系库。
作为一种可实施的方式,由于该语音信息能够与语音信息关系库中的标准语音信息匹配成功,因此为了提高比对的速度,也可以不将该语音信息作为标准语音信息添加至语音信息关系库。相应地,若检测到该语音信息不能够与语音信息关系库中的标准语音信息匹配成功,则可以向用户推送是否将该语音信息作为标准信息进行存储的消息。
本实施方式提供的基于声纹的终端控制系统,通过将与语音信息关系库中的标准语音信息匹配成功的语音信息作为标准语音信息进行存储,从而能够提高声纹识别的精准度,从而进一步地提高对电子终端控制的效率。
图4为本发明实施例四提供的基于声纹的终端控制系统的结构图,如图4所示,在上述实施例的基础上,所述系统包括:
接收设置指令模块41,用于接收用户发送的设置标准语音信息的请求。
获取语音信息模块42,用于根据所述请求获取所述用户当前的发送的语音信息。
接收操作指令模块43,用于接收用户输入的与所述语音信息对应的操作指令。
关联存储模块44,用于将所述语音信息作为标准语音信息并与所述操作指令关联存储至所述语音信息关系库。
在本实施方式中,接收设置指令模块41可以接受用户发送的设置标准语音信息的请求,具体地,用户可以在APP内预设的功能模块发起该请求。接收到该请求之后,为了保证电子终端内文件的安全性,应对发送该请求的用户身份进行验证,具体地,用户验证的方法可以为指纹验证、密码验证等任何可以实现验证的方式,本发明在此不做限制。
若用户验证通过,则获取语音信息模块42可以根据该请求获取用户当前发送的语音信息。具体地,电子终端可以根据自身设置的听筒来接收用户发送的语音信息,此外,为了提高接收语音信息的质量,也可以通过外设的收音设备来接受用户发送额语音信息,如外设的麦克风等,本发明在此不做限制。相应的,只要用户验证通过,则电子终端可以接收多个用户发送的语音信息。
接收到该语音信息之后,接收操作指令模块43接收用户发送的与该语音信息相对应的操作指令,具体地,可以将用户通过键盘输入的文字信息作为操作指令,也可以将用户发送的语音信息转换为相应的文字信息,作为操作指令,作为一种可实施的方式,电子终端也可以接收并记录用户对终端的具体操作,相应的,操作指令可以电子终端执行记录的具体操作。
需要说明的是,用户发送的语音信息的内容可以与操作指令相匹配,举例来说,用户输入的语音信息为“播放音乐”,对应的操作指令为控制电子终端播放音乐;相应的,用户发送的语音信息的内容也可以与操作指令不匹配,举例来说,用户数据的语音信息为“你好”,而对应的操作指令可以为控制电子终端打开支付软件。
接收到用户输入的语音信息与对应的操作指令之后,关联存储模块44将该语音信息与操作指令关联存储至语音信息关系库,以使用户在输入与该语音信息相匹配的语音信息之后,电子终端可以根据预设的操作指令执行操作。具体地,语音信息关系库中可以存储多个语音信息以及对应的操作指令。
本实施例提供的基于声纹的终端控制系统,通过接收用户输入的语音信息与对应的操作指令,并关联存储,从而能够在后续用户发出相应的语音信息时,根据用户的语音信息执行相应的操作指令,进而提高了电子终端的使用效率。
本发明实施例中,还提供了一种基于声纹的终端控制设备,包括处理器;以及用于存储处理器可执行指令的存储器,上述指令可由终端控制装置的处理器执行以完成上述方法。
本发明实施例中,还提供了一种非临时性计算机可读存储介质,当该存储介质中的指令由终端设备的处理器执行时,使得终端设备能够执行上述基于声纹的终端控制方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种基于声纹识别的终端控制方法,其特征在于,包括:
接收用户发送的语音信息;
根据所述语音信息在预先建立的语音信息关系库中获取所述语音信息对应的操作指令,其中,所述语音信息关系库中存储有各语音信息对应的操作指令,所述语音信息包含的语意信息与操作指令不一致;
根据所述操作指令执行相应操作。
2.根据权利要求1所述的方法,其特征在于,所述根据所述语音信息在预先建立的语音信息关系库中获取与所述语音信息对应的操作指令包括:
获取所述语音信息中包含的第一词汇信息;
将所述第一词汇信息与所述语音信息关系库中全部标准语音信息对应的标准词汇信息进行比对;
若所述第一词汇信息与所述标准语音信息关系库中的任一标准词汇信息的相似度超过预设的阈值,则获取所述标准词汇信息对应的标准语音信息对应的操作指令。
3.根据权利要求1所述的方法,其特征在于,所述根据所述语音信息在预先建立的语音信息关系库中获取与所述语音信息对应的操作指令之前,还包括:
获取所述语音信息对应的第一声纹信息;
将所述第一声纹信息与所述语音信息关系库中全部标准语音信息对应的标准声纹信息进行比对;
若所述第一声纹信息与所述标准语音信息关系库中的任一标准声纹信息的相似度超过预设的阈值,则根据所述语音信息在预先建立的语音信息关系库中获取与所述语音信息对应的操作指令。
4.根据权利要求3所述的方法,其特征在于,所述获取所述语音信息对应的第一声纹信息之后,还包括:
若终端当前为锁定状态,且所述第一声纹信息与所述标准语音信息关系库中的任一标准声纹信息的相似度超过预设的阈值,则对所述终端进行解锁。
5.根据权利要求1所述的方法,其特征在于,所述接收用户发送的语音信息之前,还包括:
接收用户发送的设置标准语音信息的请求;
根据所述请求获取所述用户当前的发送的语音信息;
接收用户输入的与所述语音信息对应的操作指令;
将所述语音信息作为标准语音信息并与所述操作指令关联存储至所述语音信息关系库。
6.一种基于声纹识别的终端控制系统,其特征在于,包括:
接收模块,用于接收用户发送的语音信息;
获取模块,用于根据所述语音信息在预先建立的语音信息关系库中获取所述语音信息对应的操作指令,其中,所述语音信息关系库中存储有各语音信息对应的操作指令,所述语音信息包含的语意信息与操作指令不一致;
执行模块,用于根据所述操作指令执行相应操作。
7.根据权利要求6所述的系统,其特征在于,所述获取模块包括:
获取词汇信息单元,用于获取所述语音信息中包含的第一词汇信息;
第一比对单元,用于将所述第一词汇信息与所述语音信息关系库中全部标准语音信息对应的标准词汇信息进行比对;
第一获取操作指令单元,用于若所述第一词汇信息与所述标准语音信息关系库中的任一标准词汇信息的相似度超过预设的阈值,则获取所述标准词汇信息对应的标准语音信息对应的操作指令。
8.根据权利要求6所述的系统,其特征在于,所述系统还包括:
获取声纹信息单元,用于获取所述语音信息对应的第一声纹信息;
第二比对单元,用于将所述第一声纹信息与所述语音信息关系库中全部标准语音信息对应的标准声纹信息进行比对;
第二获取操作指令单元,用于若所述第一声纹信息与所述标准语音信息关系库中的任一标准声纹信息的相似度超过预设的阈值,则根据所述语音信息在预先建立的语音信息关系库中获取与所述语音信息对应的操作指令。
9.根据权利要求8所述的系统,其特征在于,所述系统还包括:
解锁模块,用于若终端当前为锁定状态,且所述第一声纹信息与所述标准语音信息关系库中的任一标准声纹信息的相似度超过预设的阈值,则对所述终端进行解锁。
10.根据权利要求6所述的系统,其特征在于,所述系统还包括:
接收设置指令模块,用于接收用户发送的设置标准语音信息的请求;
获取语音信息模块,用于根据所述请求获取所述用户当前的发送的语音信息;
接收操作指令模块,用于接收用户输入的与所述语音信息对应的操作指令;
关联存储模块,用于将所述语音信息作为标准语音信息并与所述操作指令关联存储至所述语音信息关系库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711208166.2A CN108062464A (zh) | 2017-11-27 | 2017-11-27 | 基于声纹识别的终端控制方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711208166.2A CN108062464A (zh) | 2017-11-27 | 2017-11-27 | 基于声纹识别的终端控制方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108062464A true CN108062464A (zh) | 2018-05-22 |
Family
ID=62134996
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711208166.2A Pending CN108062464A (zh) | 2017-11-27 | 2017-11-27 | 基于声纹识别的终端控制方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108062464A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108804070A (zh) * | 2018-05-30 | 2018-11-13 | Oppo广东移动通信有限公司 | 音乐播放方法、装置、存储介质及电子设备 |
CN108806684A (zh) * | 2018-06-27 | 2018-11-13 | Oppo广东移动通信有限公司 | 位置提示方法、装置、存储介质及电子设备 |
CN108922523A (zh) * | 2018-06-19 | 2018-11-30 | Oppo广东移动通信有限公司 | 位置提示方法、装置、存储介质及电子设备 |
CN109409898A (zh) * | 2018-11-13 | 2019-03-01 | 爱宝达科技(深圳)有限公司 | 一种通过耳机进行游戏充值的方法 |
CN110574103A (zh) * | 2018-06-29 | 2019-12-13 | 华为技术有限公司 | 一种语音控制方法、可穿戴设备及终端 |
CN110610704A (zh) * | 2019-09-09 | 2019-12-24 | 上海赛连信息科技有限公司 | 一种标识展示的方法、介质、装置和计算设备 |
CN110853674A (zh) * | 2018-07-24 | 2020-02-28 | 中兴通讯股份有限公司 | 文本核对方法、设备以及计算机可读存储介质 |
CN110917615A (zh) * | 2019-11-27 | 2020-03-27 | 苏州思酷数字科技有限公司 | 一种基于实体指令传送的终端游戏系统及其工作方法 |
WO2020088483A1 (zh) * | 2018-10-31 | 2020-05-07 | 华为技术有限公司 | 一种音频控制方法及电子设备 |
CN112581961A (zh) * | 2019-09-27 | 2021-03-30 | 百度在线网络技术(北京)有限公司 | 一种语音信息处理方法及装置 |
CN115273517A (zh) * | 2022-08-12 | 2022-11-01 | 润芯微科技(江苏)有限公司 | 一种车载智能显示方法及其显示系统 |
WO2024120022A1 (zh) * | 2022-12-05 | 2024-06-13 | 中兴通讯股份有限公司 | 会议系统的控制方法、服务器和存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103051781A (zh) * | 2012-12-07 | 2013-04-17 | 百度在线网络技术(北京)有限公司 | 语音后台控制方法及移动终端 |
CN103646646A (zh) * | 2013-11-27 | 2014-03-19 | 联想(北京)有限公司 | 一种语音控制方法及电子设备 |
CN103730120A (zh) * | 2013-12-27 | 2014-04-16 | 深圳市亚略特生物识别科技有限公司 | 电子设备的语音控制方法及系统 |
CN104202486A (zh) * | 2014-09-26 | 2014-12-10 | 上海华勤通讯技术有限公司 | 移动终端及其屏幕解锁方法 |
CN104575504A (zh) * | 2014-12-24 | 2015-04-29 | 上海师范大学 | 采用声纹和语音识别进行个性化电视语音唤醒的方法 |
CN105677004A (zh) * | 2014-11-18 | 2016-06-15 | 中兴通讯股份有限公司 | 一种终端的处理方法和终端 |
-
2017
- 2017-11-27 CN CN201711208166.2A patent/CN108062464A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103051781A (zh) * | 2012-12-07 | 2013-04-17 | 百度在线网络技术(北京)有限公司 | 语音后台控制方法及移动终端 |
CN103646646A (zh) * | 2013-11-27 | 2014-03-19 | 联想(北京)有限公司 | 一种语音控制方法及电子设备 |
CN103730120A (zh) * | 2013-12-27 | 2014-04-16 | 深圳市亚略特生物识别科技有限公司 | 电子设备的语音控制方法及系统 |
CN104202486A (zh) * | 2014-09-26 | 2014-12-10 | 上海华勤通讯技术有限公司 | 移动终端及其屏幕解锁方法 |
CN105677004A (zh) * | 2014-11-18 | 2016-06-15 | 中兴通讯股份有限公司 | 一种终端的处理方法和终端 |
CN104575504A (zh) * | 2014-12-24 | 2015-04-29 | 上海师范大学 | 采用声纹和语音识别进行个性化电视语音唤醒的方法 |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108804070A (zh) * | 2018-05-30 | 2018-11-13 | Oppo广东移动通信有限公司 | 音乐播放方法、装置、存储介质及电子设备 |
CN108922523A (zh) * | 2018-06-19 | 2018-11-30 | Oppo广东移动通信有限公司 | 位置提示方法、装置、存储介质及电子设备 |
CN108922523B (zh) * | 2018-06-19 | 2021-06-15 | Oppo广东移动通信有限公司 | 位置提示方法、装置、存储介质及电子设备 |
CN108806684A (zh) * | 2018-06-27 | 2018-11-13 | Oppo广东移动通信有限公司 | 位置提示方法、装置、存储介质及电子设备 |
CN110574103A (zh) * | 2018-06-29 | 2019-12-13 | 华为技术有限公司 | 一种语音控制方法、可穿戴设备及终端 |
CN112420035A (zh) * | 2018-06-29 | 2021-02-26 | 华为技术有限公司 | 一种语音控制方法、可穿戴设备及终端 |
CN110574103B (zh) * | 2018-06-29 | 2020-10-23 | 华为技术有限公司 | 一种语音控制方法、可穿戴设备及终端 |
CN110853674A (zh) * | 2018-07-24 | 2020-02-28 | 中兴通讯股份有限公司 | 文本核对方法、设备以及计算机可读存储介质 |
WO2020088483A1 (zh) * | 2018-10-31 | 2020-05-07 | 华为技术有限公司 | 一种音频控制方法及电子设备 |
CN111131601A (zh) * | 2018-10-31 | 2020-05-08 | 华为技术有限公司 | 一种音频控制方法及电子设备 |
CN111131601B (zh) * | 2018-10-31 | 2021-08-27 | 华为技术有限公司 | 一种音频控制方法、电子设备、芯片及计算机存储介质 |
CN109409898A (zh) * | 2018-11-13 | 2019-03-01 | 爱宝达科技(深圳)有限公司 | 一种通过耳机进行游戏充值的方法 |
CN110610704A (zh) * | 2019-09-09 | 2019-12-24 | 上海赛连信息科技有限公司 | 一种标识展示的方法、介质、装置和计算设备 |
CN112581961A (zh) * | 2019-09-27 | 2021-03-30 | 百度在线网络技术(北京)有限公司 | 一种语音信息处理方法及装置 |
CN110917615A (zh) * | 2019-11-27 | 2020-03-27 | 苏州思酷数字科技有限公司 | 一种基于实体指令传送的终端游戏系统及其工作方法 |
CN115273517A (zh) * | 2022-08-12 | 2022-11-01 | 润芯微科技(江苏)有限公司 | 一种车载智能显示方法及其显示系统 |
WO2024120022A1 (zh) * | 2022-12-05 | 2024-06-13 | 中兴通讯股份有限公司 | 会议系统的控制方法、服务器和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108062464A (zh) | 基于声纹识别的终端控制方法及系统 | |
US20030074201A1 (en) | Continuous authentication of the identity of a speaker | |
US9484037B2 (en) | Device, system, and method of liveness detection utilizing voice biometrics | |
US8812319B2 (en) | Dynamic pass phrase security system (DPSS) | |
JP6096333B2 (ja) | 決済を検証するための方法、装置、およびシステム | |
US8725514B2 (en) | Verifying a user using speaker verification and a multimodal web-based interface | |
US8010367B2 (en) | Spoken free-form passwords for light-weight speaker verification using standard speech recognition engines | |
US8082448B2 (en) | System and method for user authentication using non-language words | |
US8095372B2 (en) | Digital process and arrangement for authenticating a user of a database | |
WO2016110002A1 (zh) | 屏幕界面的解锁方式和屏幕界面的解锁装置 | |
CN105512535A (zh) | 一种用户认证的方法及装置 | |
JP4359887B2 (ja) | 個人認証システム | |
US20100114573A1 (en) | Method and Device for Verifying a User | |
JP2006505021A (ja) | 安全なアプリケーション環境のためのローバスト多要素認証 | |
JP2002312318A (ja) | 電子装置、本人認証方法およびプログラム | |
CN102752453A (zh) | 基于语音识别的手机解锁方法 | |
CN107533598B (zh) | 应用程序的登录密码的输入方法、装置和终端 | |
KR101424962B1 (ko) | 음성 기반 인증시스템 및 방법 | |
KR101181060B1 (ko) | 음성 인식 시스템 및 이를 이용한 화자 인증 방법 | |
CN104571471B (zh) | 一种应用程序的开启方法及开启系统、移动终端 | |
JP3601631B2 (ja) | 話者認識システムおよび話者認識方法 | |
CN108052811A (zh) | 基于面部纹理识别的终端控制方法及系统 | |
CN111598577B (zh) | 资源转移方法、装置、计算机设备和存储介质 | |
CN106850539A (zh) | 一种验证信息获取方法和装置 | |
CN106909818A (zh) | 对应用程序进行控制的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20180830 Address after: 518103 24 Longhua 101, Fuxing community, Fucheng street, Longhua District, Shenzhen, China Applicant after: SHENZHEN TAIHENGNUO TECHNOLOGY Co.,Ltd. Address before: 100085 A1103 11, A block 9, Shang di San Jie, Haidian District, Beijing. Applicant before: BEIJING CHUANJIA TECHNOLOGY Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180522 |
|
RJ01 | Rejection of invention patent application after publication |