CN109040466B - 基于语音的移动终端解锁方法、装置、电子设备以及存储介质 - Google Patents

基于语音的移动终端解锁方法、装置、电子设备以及存储介质 Download PDF

Info

Publication number
CN109040466B
CN109040466B CN201811098586.4A CN201811098586A CN109040466B CN 109040466 B CN109040466 B CN 109040466B CN 201811098586 A CN201811098586 A CN 201811098586A CN 109040466 B CN109040466 B CN 109040466B
Authority
CN
China
Prior art keywords
information
unlocking
voiceprint
mobile terminal
password
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811098586.4A
Other languages
English (en)
Other versions
CN109040466A (zh
Inventor
李庆湧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Tongchuang Technology Co ltd
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201811098586.4A priority Critical patent/CN109040466B/zh
Publication of CN109040466A publication Critical patent/CN109040466A/zh
Application granted granted Critical
Publication of CN109040466B publication Critical patent/CN109040466B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
    • H04M1/72463User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions to restrict the functionality of the device
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/04Training, enrolment or model building
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/66Substation equipment, e.g. for use by subscribers with means for preventing unauthorised or fraudulent calling
    • H04M1/667Preventing unauthorised calls from a telephone set
    • H04M1/67Preventing unauthorised calls from a telephone set by electronic means

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephone Function (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明是关于一种基于语音的移动终端解锁方法、装置、电子设备以及存储介质。方法包括:S120.获取解锁语音信号的口令信息及声纹特征信息;S130.对口令信息进行匹配:若口令信息与第一预存口令匹配,转至步骤S140;若口令信息与第二预存口令匹配,转至步骤S150;否则转至步骤S190;S140.对声纹特征信息进行匹配:若声纹特征信息与预存声纹特征匹配,转至步骤S160;否则转至步骤S180;S150.对声纹特征信息进行匹配:若声纹特征信息与预存声纹特征匹配,转至步骤S170;否则转至步骤S180;S160.对移动终端解锁并进入正常空间模式;S170.对移动终端解锁并进入私密空间模式;S180.对移动终端解锁并进入访客空间模式;S190.保持移动终端处于锁屏状态。本发明操作方便且安全性高。

Description

基于语音的移动终端解锁方法、装置、电子设备以及存储介质
技术领域
本发明涉及语音识别技术领域,具体而言,涉及一种基于语音的移动终端解锁方法、装置、电子设备以及计算机可读存储介质。
背景技术
随着移动终端的内容和应用的不断丰富,移动终端几乎成为人们生活中不可缺少的一部分。目前,移动终端解锁方法可分为基于加密技术的屏幕解锁方法和基于非加密技术的屏幕解锁方法。常用的基于加密技术的屏幕解锁方法主要包括基于非生物识别技术的解锁方法以及基于生物识别技术的解锁方法;常用的基于非生物识别技术的解锁方法主要包括密码及图案等解锁方法,常用的基于生物识别技术的解锁方法主要包括人脸识别、指纹识别以及语音识别等解锁方法。
然而,所有的这些移动终端解锁方法只是简单地设计了是否能够解锁,即要么解锁、要么不解锁,例如,移动终端设置有解锁密码,用户输入的密码正确则解锁成功,移动终端进入正常空间模式,用户可以浏览移动终端中的任何数据,用户输入的密码不正确则解锁失败,这种解锁方式导致如果机主将移动终端借给他人使用并告知密码,则他人可以解锁成功,浏览移动终端中涉及机主隐私的数据如短信、图片、邮件等,所以现有的屏幕解锁方法存在安全等级划分不足的问题。
在现有技术中,围绕屏幕解锁这个主题,现有技术中已经有一些专利申请进行了有益的尝试,比如:
申请号为CN201610849606.1的专利申请公开了一种声纹识别方法。所述声纹识别方法包括:获取麦克风采集到的声音信号,获取声音信号的声纹特征;将声纹特征与存储的样本声纹特征进行匹配,样本声纹特征是终端的合法用户的声纹特征;在声纹特征与存储的样本声纹特征不匹配时,向合法用户设定的被通知方发送提示信息。解决相关技术中由于终端的解锁密码易被非法用户感知并进行破解,导致终端丢失或被盗后无法寻回的技术问题;达到了可以在识别出非法用户时,即时通知到终端的合法用户的技术效果。但该方案并未区分不同安全等级的模块,存在安全性不高的问题。
申请号为CN201711063092.8的专利申请公开了一种登录界面解锁方法。其中该方法包括:显示登录界面,其中所述登录界面包括录音控件和用户名栏;获取用户在所述用户名栏中输入的用户名;若监测到触发所述录音控件的操作,录入声音信息;将所述用户名和声音信息发送至声纹认证系统,其中所述声纹认证系统用于根据所述用户名查找对应的预存声音信息并根据所述预存声音信息对所述声音信息进行声纹认证;若接收到所述声纹认证系统发送的认证成功信息,则根据所述认证成功信息解锁所述登录界面以显示所述用户名对应的终端桌面。该方法同样并未区分不同安全等级的模块,存在安全性不高的问题。
申请号为CN201711242470.9的专利申请公开了一种终端设备的解锁方法。其中,该方法包括:在检测到用户对终端设备进行解锁操作时,获取当前用户的声纹信息以及脸部三维信息,其中所述脸部三维信息是利用结构光获取的;分别依据预设的声纹库及预设的人脸三维信息库,判断所述当前用户是否合法;若合法,则对所述终端设备进行解锁。该方法通过同时对当前用户的声纹信息、脸部三维信息进行识别来验证用户是否为合法用户,只有合法用户才能解锁终端设备,相比仅仅进行声纹解锁或仅仅进行人脸解锁,能够更好地保证终端设备的使用安全性,进而提升用户体验度。但该方案同样存在安全等级划分不足的问题。
因此,需要提供一种移动终端解锁方法,以至少能够解决上述一个或多个技术问题。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明的目的在于提供一种基于语音的移动终端解锁方法、装置、电子设备以及计算机可读存储介质,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。
根据本公开的一个方面,提供一种基于语音的移动终端解锁方法,所述方法包括:
S110.在所述移动终端的锁屏状态下接收一解锁语音信号;
S120.获取所述解锁语音信号的口令信息以及声纹特征信息;
S130.对所述口令信息进行匹配:如果所述口令信息与第一预存口令匹配,则转至步骤S140;如果所述口令信息与第二预存口令匹配,则转至步骤S150;否则,转至步骤S190;
S140.对所述声纹特征信息进行匹配:如果所述声纹特征信息与预存声纹特征匹配,则转至步骤S160;否则,转至步骤S180;
S150.对所述声纹特征信息进行匹配:如果所述声纹特征信息与所述预存声纹特征匹配,则转至步骤S170;否则,转至步骤S180;
S160.对所述移动终端解锁并进入正常空间模式;
S170.对所述移动终端解锁并进入私密空间模式;
S180.对所述移动终端解锁并进入访客空间模式;
S190.保持所述移动终端处于锁屏状态。
在本公开的一种示例性实施例中,所述第一预存口令以及第二预存口令包括:汉字、字母、符号以及数字中的一种或多种。
在本公开的一种示例性实施例中,所述对所述声纹特征信息进行匹配,包括:
对训练语音信号预处理后,提取梅尔频率倒谱系数作为训练特征向量;
利用自适应核模糊C均值聚类算法,对各所述训练特征向量进行聚类分析得到所述预存声纹特征;
对所述解锁语音信号预处理后,提取梅尔频率倒谱系数作为所述声纹特征信息;
计算所述声纹特征信息与预存声纹特征之间的距离,并根据所述距离判断所述声纹特征信息与所述预存声纹特征是否匹配。
在本公开的一种示例性实施例中,所述提取梅尔频率倒谱系数,包括:
对预处理后的语音信号进行快速傅里叶变换,获得频谱分布信息,并对所述频谱取绝对值获得幅度谱;
使所述幅度谱通过包括多个高斯带通滤波器的滤波器组,并计算每个高斯带通滤波器输出的对数能量;
将每个所述高斯带通滤波器的对数能量带入离散余弦变换,提取得到所述梅尔频率倒谱系数。
在本公开的一种示例性实施例中,所述步骤S120还包括:
获取所述解锁语音信号的辅助识别特征信息。
在本公开的一种示例性实施例中,其中:
所述步骤S140具体包括:如果所述声纹特征信息与预存声纹特征匹配且所述辅助识别特征信息与预存辅助识别特征匹配,则转至步骤S160;否则,转至步骤S180;
所述步骤S150具体包括:如果所述声纹特征信息与预存声纹特征匹配且所述辅助识别特征信息与预存辅助识别特征匹配,则转至步骤S170;否则,转至步骤S180。
在本公开的一种示例性实施例中,所述辅助识别特征信息包括语调信息、情感信息、语速信息、语气信息中的一种或多种。
根据本公开的一个方面,提供一种基于语音的移动终端解锁装置,所述装置包括:
语音采集模块,用于在所述移动终端的锁屏状态下接收一解锁语音信号;
语音分析模块,用于获取所述解锁语音信号的口令信息、声纹特征信息;
口令匹配模块,用于对所述口令信息进行匹配:如果所述口令信息与第一预存口令匹配,则输出第一信息;如果所述口令信息与第二预存口令匹配,则输出第二信息;否则,转至锁屏保持模块处理;
声纹匹配模块,用于对所述声纹特征信息进行匹配:如果所述声纹特征信息与预存声纹特征匹配,且接收到所述第一信息则转至第一解锁模块处理;如果所述声纹特征信息与预存声纹特征匹配,且接收到所述第二信息则转至第二解锁模块处理;否则,转至第三解锁模块处理;
第一解锁模块,用于对所述移动终端解锁并进入正常空间模式;
第二解锁模块,用于对所述移动终端解锁并进入私密空间模式;
第三解锁模块,用于对所述移动终端解锁并进入访客空间模式;
锁屏保持模块,用于保持所述移动终端处于锁屏状态。
在本发明的一个方面,提供一种电子设备,包括:
处理器;以及
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现根据上述任意一项所述的方法。
在本发明的一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现根据上述任意一项所述的方法。
本发明的示例性实施例中的基于语音的移动终端解锁方法,首先获取解锁语音信号的口令信息以及声纹特征信息,如果口令信息与第一预存口令匹配且声纹特征信息与预存声纹特征匹配,则进入正常空间模式;如果口令信息与第二预存口令匹配且声纹特征信息与预存声纹特征匹配,则进入私密空间模式;如果仅口令信息与第一预存口令匹配,则进入访客空间模式。在上述方案中,通过语音识别技术和声纹识别技术,能够准确的识别出语音信号的发出者是移动终端机主本人还是移动终端机主本人告知的密码的人,并且结合不同的访问口令,使移动终端正确地做出是否解锁的操作以及移动终端解锁后进入哪一模式的操作,具有操作便捷、安全性能高的优点。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
通过参照附图来详细描述其示例实施例,本发明的上述和其它特征及优点将变得更加明显。
图1示出了根据本发明一示例性实施例的基于语音的移动终端解锁方法的流程图;
图2示出了根据本发明一示例性实施例的声纹特征信息匹配步骤的流程图;
图3示出了根据本发明一示例性实施例的基于语音的移动终端解锁装置的示意框图;
图4示意性示出了根据本发明一示例性实施例的电子设备的框图;以及
图5示意性示出了根据本发明一示例性实施例的计算机可读存储介质的示意图。
具体实施方式
现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本发明将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本发明的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而没有所述特定细节中的一个或更多,或者可以采用其它的方法、组元、材料、装置、步骤等。在其它情况下,不详细示出或描述公知结构、方法、装置、实现、材料或者操作以避免模糊本发明的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个软件硬化的模块中实现这些功能实体或功能实体的一部分,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
在本示例实施例中,首先提供了一种基于语音的移动终端解锁方法,可以应用于移动终端,如手机、笔记本电脑、平板电脑等电子设备;参考图1中所示,该基于语音的移动终端解锁方法可以包括以下步骤:
步骤S110、在所述移动终端的锁屏状态下接收一解锁语音信号;
步骤S120、获取所述解锁语音信号的口令信息、声纹特征信息;
步骤S130、对所述口令信息进行匹配:如果所述口令信息与第一预存口令匹配,则转至步骤S140;如果所述口令信息与第二预存口令匹配,则转至步骤S150;否则,转至步骤S190;
步骤S140、对所述声纹特征信息进行匹配:如果所述声纹特征信息与预存声纹特征匹配,则转至步骤S160;否则,转至步骤S180;
步骤S150、对所述声纹特征信息进行匹配:如果所述声纹特征信息与所述预存声纹特征匹配,则转至步骤S170;否则,转至步骤S180;
步骤S160、对所述移动终端解锁并进入正常空间模式;
步骤S170、对所述移动终端解锁并进入私密空间模式;
步骤S180、对所述移动终端解锁并进入访客空间模式;
步骤S190、保持所述移动终端处于锁屏状态。
根据本示例实施例中的基于语音的移动终端解锁方法,通过语音识别技术和声纹识别技术,能够准确的识别出语音信号的发出者是移动终端机主本人还是移动终端机主本人告知的密码的人,并且结合不同的访问口令,使移动终端正确地做出是否解锁的操作以及移动终端解锁后进入哪一模式的操作,具有操作便捷、安全性能高的优点。
下面,将对本示例实施例中的基于语音的移动终端解锁方法进行进一步的说明。
在步骤S110中,在所述移动终端的锁屏状态下接收一解锁语音信号。
本示例实施方式中,移动终端所有者点亮移动终端的屏幕后,可以发出解锁语音信号,进而所述移动终端可以通过麦克风等音频采集模块获取解锁语音信号。
步骤S120、获取所述解锁语音信号的口令信息、声纹特征信息。此外,在本公开的其他示例性实施例中,还可以获取所述解锁语音信号中的辅助识别特征信息等其他信息。举例而言:
例如用户录入了一段用于解锁的语音“小白兔打开门”,移动终端获取到用于解锁的“小白兔打开门”这段解锁语音信号之后,可以进行语音识别,识别出口令信息“小白兔打开门”这六个字。例如,可以通过深度神经网络模型、隐马尔科夫模型、高斯混合模型中的一种或多种模型,对各所述解锁语音信号进行语音识别,获取对应的文本信息。例如,可以通过隐马尔科夫模型对时序信息进行建模,在给定隐马尔科夫模型的一个状态后,通过最大期望值算法等方法基于高斯混合模型对属于该状态的语音特征向量的概率分布进行建模;在建模成功之后,则可以对解锁语音信号进行语音识别,获取对应的口令信息。
“小白兔打开门”这段解锁语音信号中,声纹特征信息包括音调、振幅、响度等;关于声纹特征信息的提取,将在下述步骤S130中说明。“小白兔打开门”这段解锁语音信号中,用户可控的语音参数信息,即辅助识别特征信息可以包括:语调信息、情感信息、语气信息、语速信息中的至少一种。其中,语调信息包括平调、升调、降调等;情感信息包括高兴、哀伤、平和等;语气信息包括命令的语气、祈求的语气、控诉的语气等;语速信息包括语速快、语速适中、语速慢等。
步骤S130、对所述口令信息进行匹配:如果所述口令信息与第一预存口令匹配,则转至步骤S140;如果所述口令信息与第二预存口令匹配,则转至步骤S150;否则,转至步骤S190。
本示例实施方式中,可以在移动终端中预先配置预存口令。例如,所述第一预存口令可以包括:汉字、字母、符号以及数字中的一种或多种,例如上述的“小白兔开门”等。同样的,所述第二预存口令可以包括:汉字、字母、符号以及数字中的一种或多种,例如“芝麻开门”等。如果所述解锁语音信号的口令信息为第一预存口令,即“小白兔开门”则可以转至步骤S140;如果所述解锁语音信号的口令信息为第二预存口令,即“芝麻开门”则可以转至步骤S150。相反,如果如果所述解锁语音信号的口令信息与第一预存口令以及第二预存口令均不同,则转至步骤S190。
此外,第一预存口令可以有多个,第二预存口令同样也可以有多个,本示例实施方式中对此不做特殊限定。
步骤S140、对所述声纹特征信息进行匹配:如果所述声纹特征信息与预存声纹特征匹配,则转至步骤S160;否则,转至步骤S180。
本示例实施方式中,所述对所述声纹特征信息进行匹配可以包括步骤 S141至步骤S144。其中:
在步骤S141中,对训练语音信号预处理后,提取梅尔频率倒谱系数作为训练特征向量。例如,本示例实施方式中可以首先由用户多次读第一预存口令和第二预存口令,得到训练语音信号,再对训练语音信号进行预加重、分帧、加窗以及端点检测等预处理;接着,对预处理后的训练语音信号进行快速傅里叶变换(例如,对加窗的信号作快速傅里叶变换),获得频谱分布信息,并对所述频谱取绝对值获得幅度谱。使所述幅度谱通过包括多个高斯带通滤波器的滤波器组,并计算每个高斯带通滤波器输出的对数能量;高斯滤波器在两端是逐渐衰减的并且是对称的,可以保留训练语音信号每个子带及其相邻子带的相关信息,减少失真。将每个所述高斯带通滤波器的对数能量带入离散余弦变换,提取得到所述梅尔频率倒谱系数。当然,在本公开的其他示例性实施例中,也可以通过其他方式计算训练语音信号的梅尔频率倒谱系数,本示例性实施例中对此不做特殊限定。
在步骤S142中,利用自适应核模糊C均值聚类算法,对各所述训练特征向量进行聚类分析得到所述预存声纹特征。
本实施例的自适应核模糊C均值聚类算法可以将各所述训练特征向量的集合划分为多个子集;具体而言,通过使用核函数,将用户的语音特征映射到高维特征空间,能够较好地分辨、提取并放大有用的特征,扩大了模式类之间的差异,提高了短时语音的说话人识别性能。同时,根据数据集的离散程度自适应选择高斯核的宽度,不需要通过大量的实验去确定合适的值。而且,在每次的聚类迭代过程中,根据当前聚类中心的分布情况自适应更新高斯核宽度,给特征数据在高维空间中提供了不同的伸缩能力,有利于找到更优的聚类中心,一定程度上避免了陷入局部最优值。
在步骤S143中,对所述解锁语音信号预处理后,提取梅尔频率倒谱系数作为所述声纹特征信息。该步骤与步骤S141类似,同样是对预处理后的解锁语音信号进行快速傅里叶变换,获得频谱分布信息,并对所述频谱取绝对值获得幅度谱;使所述幅度谱通过包括多个高斯带通滤波器的滤波器组,并计算每个高斯带通滤波器输出的对数能量;将每个所述高斯带通滤波器的对数能量带入离散余弦变换,提取得到所述梅尔频率倒谱系数。因此不再赘述。
在步骤S144中,计算所述声纹特征信息与预存声纹特征之间的距离,并根据所述距离判断所述声纹特征信息与所述预存声纹特征是否匹配。
本示例实施方式中,可以在高维特征空间,采用可能性模糊分类器,通过计算出平均量化失真作为声纹特征信息对应的测试向量序列与预存声纹特征对应的向量之间的距离,实现更可靠的判决决策,提高系统的识别率。假设平均量化误差的阈值为TH,在计算得到距离D之后,如果D≤TH,即,如果D小于或等于TH,则确定所述声纹特征信息与所述预存声纹特征匹配,否则,则认为不匹配。当然,在本公开的其他示例性实施例中,也可以通过其他方式计算所述声纹特征信息与预存声纹特征之间的距离,本示例性实施例中对此不做特殊限定。
步骤S150、对所述声纹特征信息进行匹配:如果所述声纹特征信息与所述预存声纹特征匹配,则转至步骤S170;否则,转至步骤S180;该步骤与上述步骤S140类似,因此不再重复赘述。
此外,如果在上述步骤S120中还获取所述解锁语音信号的辅助识别特征信息,则在步骤S140以及步骤S150中,还可以通过辅助识别特征信息辅助进行声纹验证,即所述步骤S140具体包括:如果所述声纹特征信息与预存声纹特征匹配且所述辅助识别特征信息与预存辅助识别特征匹配,则转至步骤S160;否则,转至步骤S180;所述步骤S150具体包括:如果所述声纹特征信息与预存声纹特征匹配且所述辅助识别特征信息与预存辅助识别特征匹配,则转至步骤S170;否则,转至步骤S180。例如,如果预存辅助识别特征包括升调、高兴、命令的语气、适中语速;而辅助识别特征信息同样包括升调、高兴、命令的语气、适中语速,则可以认为其与预存辅助识别特征匹配。通过引入辅助识别特征信息,不但可以提高语音解锁的成功率,还可以进一步保证安全性,提升用户体验。
步骤S160、对所述移动终端解锁并进入正常空间模式。
步骤S170、对所述移动终端解锁并进入私密空间模式。
步骤S180、对所述移动终端解锁并进入访客空间模式。
现有很多移动终端中,具有“平行空间”或者类似的功能,即可以将移动终端切换至不同的状态。一般而言,这些状态可以包括正常空间模式、私密空间模式以及访客空间模式。其中正常空间模式与私密空间模式比较统一,因为都是主要针对机主本人使用的;只是在“私密空间模式”下,有些私密联系人、特殊应用、照片、视频、文件等可以被隐藏。而针对相机和浏览器,“私密空间模式”也可以让拍到的照片在“正常空间模式”下不可见,浏览器的访问历史记录同理。而在“访客空间模式”下,移动终端系统会完全进入一个全新的界面,布局和设置上也跟之前完全不同需要访客自己调整。最重要的是在文件管理当中是看不到任何机主留下的信息和文件的,而比如“钱包”这样涉及个人资金安全的应用也是看不到机主账号和相关信息的。当然,在不同厂商的移动终端中,正常空间模式、私密空间模式以及访客空间模式可能有不同的名称以及不同级别的配置或者不同方式的配置,但这些均属于本公开的保护范围。
步骤S190、保持所述移动终端处于锁屏状态。此外,如果连续多次检测到口令信息不匹配,也可以向用户发出警告或者提醒用户使用其他方式解锁。
需要说明的是,尽管在附图中以特定顺序描述了本发明中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
此外,在本示例实施例中,还提供了一种基于语音的移动终端解锁装置。参照图3所示,该基于语音的移动终端解锁装置300可以包括:语音采集模块310、语音分析模块320、口令匹配模块330、声纹匹配模块340、第一解锁模块350、第二解锁模块360、第三解锁模块370、锁屏保持模块380。其中:
语音采集模块310可以用于在所述移动终端的锁屏状态下接收一解锁语音信号;
语音分析模块320可以用于获取所述解锁语音信号的口令信息、声纹特征信息;
口令匹配模块330可以用于对所述口令信息进行匹配:如果所述口令信息与第一预存口令匹配,则输出第一信息;如果所述口令信息与第二预存口令匹配,则输出第二信息;否则,转至锁屏保持模块处理;
声纹匹配模块340可以用于对所述声纹特征信息进行匹配:如果所述声纹特征信息与预存声纹特征匹配,且接收到所述第一信息则转至第一解锁模块处理;如果所述声纹特征信息与预存声纹特征匹配,且接收到所述第二信息则转至第二解锁模块处理;否则,转至第三解锁模块处理;
第一解锁模块350可以用于对所述移动终端解锁并进入正常空间模式;
第二解锁模块360可以用于对所述移动终端解锁并进入私密空间模式;
第三解锁模块370可以用于对所述移动终端解锁并进入访客空间模式;
锁屏保持模块380可以用于保持所述移动终端处于锁屏状态。
上述中各基于语音的移动终端解锁装置模块的具体细节已经在对应的音频段落识别方法中进行了详细的描述,因此此处不再赘述。
应当注意,尽管在上文详细描述中提及了基于语音的移动终端解锁装置300的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,在本发明的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施例、完全的软件实施例(包括固件、微代码等),或硬件和软件方面结合的实施例,这里可以统称为“电路”、“模块”或“系统”。
下面参照图4来描述根据本发明的这种实施例的电子设备400。图 4显示的电子设备400仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,电子设备400以通用计算设备的形式表现。电子设备 400的组件可以包括但不限于:上述至少一个处理单元410、上述至少一个存储单元420、连接不同系统组件(包括存储单元420和处理单元 410)的总线430、显示单元440。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元410执行,使得所述处理单元410执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施例的步骤。例如,所述处理单元410可以执行如图1中所示的步骤S110至步骤S190。
存储单元420可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)4201和/或高速缓存存储单元4202,还可以进一步包括只读存储单元(ROM)4203。
存储单元420还可以包括具有一组(至少一个)程序模块4205的程序/实用工具4204,这样的程序模块4204包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线430可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备400也可以与一个或多个外部设备470(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备400交互的设备通信,和/或与使得该电子设备400能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口450进行。并且,电子设备400 还可以通过网络适配器460与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器460通过总线430与电子设备400的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备400使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是 CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等) 执行根据本发明实施例的方法。
在本发明的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施例中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施例的步骤。
参考图5所示,描述了根据本发明的实施例的用于实现上述方法的程序产品500,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其他实施例。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限。

Claims (8)

1.一种基于语音的移动终端解锁方法,其特征在于,所述方法包括:
S110.在所述移动终端的锁屏状态下接收一解锁语音信号;通过隐马尔科夫模型对时序信息进行建模并给定隐马尔科夫模型一个状态,通过最大期望值算法基于高斯混合模型对属于该状态的语音特征向量的概率分布进行建模;在建模成功后,对所述解锁语音信号进行语音识别,得到对应的口令信息;
S120.获取所述解锁语音信号的所述口令信息以及声纹特征信息,并获取所述解锁语音信号的辅助识别特征信息,所述辅助识别特征信息为用户可控的语音参数信息;
S130.对所述口令信息进行匹配:如果所述口令信息与第一预存口令匹配,则转至步骤S140;如果所述口令信息与第二预存口令匹配,则转至步骤S150;否则,转至步骤S190;
S140.对所述声纹特征信息进行匹配:如果所述声纹特征信息与预存声纹特征匹配且所述辅助识别特征信息与预存辅助识别特征匹配,则转至步骤S160;否则,转至步骤S180;
S150.对所述声纹特征信息进行匹配:如果所述声纹特征信息与所述预存声纹特征匹配且所述辅助识别特征信息与预存辅助识别特征匹配,则转至步骤S170;否则,转至步骤S180;
S160.对所述移动终端解锁并进入正常空间模式;
S170.对所述移动终端解锁并进入私密空间模式;
S180.对所述移动终端解锁并进入访客空间模式;所述访客空间模式下,系统会完全进入全新的界面,该界面中的布局和设置上与所述正常空间模式中完全不同;
S190.保持所述移动终端处于锁屏状态。
2.根据权利要求1所述的基于语音的移动终端解锁方法,其特征在于,所述第一预存口令以及第二预存口令包括:汉字、字母、符号以及数字中的一种或多种。
3.根据权利要求1所述的基于语音的移动终端解锁方法,其特征在于,所述对所述声纹特征信息进行匹配,包括:
对训练语音信号预处理后,提取梅尔频率倒谱系数作为训练特征向量;
利用自适应核模糊C均值聚类算法,对各所述训练特征向量进行聚类分析得到所述预存声纹特征;
对所述解锁语音信号预处理后,提取梅尔频率倒谱系数作为所述声纹特征信息;
计算所述声纹特征信息与预存声纹特征之间的距离,并根据所述距离判断所述声纹特征信息与所述预存声纹特征是否匹配。
4.根据权利要求3所述的基于语音的移动终端解锁方法,其特征在于,所述提取梅尔频率倒谱系数,包括:
对预处理后的语音信号进行快速傅里叶变换,获得频谱分布信息,并对所述频谱取绝对值获得幅度谱;
使所述幅度谱通过包括多个高斯带通滤波器的滤波器组,并计算每个高斯带通滤波器输出的对数能量;
将每个所述高斯带通滤波器的对数能量带入离散余弦变换,提取得到所述梅尔频率倒谱系数。
5.根据权利要求1所述的基于语音的移动终端解锁方法,其特征在于,所述辅助识别特征信息包括语调信息、情感信息、语速信息、语气信息中的一种或多种。
6.一种基于语音的移动终端解锁装置,其特征在于,所述装置包括:
语音采集模块,用于在所述移动终端的锁屏状态下接收一解锁语音信号;以及通过隐马尔科夫模型对时序信息进行建模并给定隐马尔科夫模型一个状态,通过最大期望值算法基于高斯混合模型对属于该状态的语音特征向量的概率分布进行建模;在建模成功后,对所述解锁语音信号进行语音识别,得到对应的口令信息
语音分析模块,用于获取所述解锁语音信号的所述口令信息、声纹特征信息,并获取所述解锁语音信号的辅助识别特征信息,所述辅助识别特征信息为用户可控的语音参数信息;
口令匹配模块,用于对所述口令信息进行匹配:如果所述口令信息与第一预存口令匹配,则输出第一信息;如果所述口令信息与第二预存口令匹配,则输出第二信息;否则,转至锁屏保持模块处理;
声纹匹配模块,用于对所述声纹特征信息进行匹配:如果所述声纹特征信息与预存声纹特征匹配且所述辅助识别特征信息与预存辅助识别特征匹配,且接收到所述第一信息则转至第一解锁模块处理;如果所述声纹特征信息与预存声纹特征匹配且所述辅助识别特征信息与预存辅助识别特征匹配,且接收到所述第二信息则转至第二解锁模块处理;否则,转至第三解锁模块处理;
第一解锁模块,用于对所述移动终端解锁并进入正常空间模式;
第二解锁模块,用于对所述移动终端解锁并进入私密空间模式;
第三解锁模块,用于对所述移动终端解锁并进入访客空间模式;所述访客空间模式下的,系统会完全进入全新的界面,该界面中的布局和设置上与所述正常空间模式中完全不同;
锁屏保持模块,用于保持所述移动终端处于锁屏状态。
7.一种电子设备,其特征在于,包括:
处理器;以及
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现根据权利要求1至5中任一项所述的方法。
8.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现根据权利要求1至5中任一项所述方法。
CN201811098586.4A 2018-09-20 2018-09-20 基于语音的移动终端解锁方法、装置、电子设备以及存储介质 Active CN109040466B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811098586.4A CN109040466B (zh) 2018-09-20 2018-09-20 基于语音的移动终端解锁方法、装置、电子设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811098586.4A CN109040466B (zh) 2018-09-20 2018-09-20 基于语音的移动终端解锁方法、装置、电子设备以及存储介质

Publications (2)

Publication Number Publication Date
CN109040466A CN109040466A (zh) 2018-12-18
CN109040466B true CN109040466B (zh) 2021-03-26

Family

ID=64617122

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811098586.4A Active CN109040466B (zh) 2018-09-20 2018-09-20 基于语音的移动终端解锁方法、装置、电子设备以及存储介质

Country Status (1)

Country Link
CN (1) CN109040466B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109995946A (zh) * 2019-03-29 2019-07-09 努比亚技术有限公司 移动终端控制方法、移动终端及计算机可读存储介质
CN110197666B (zh) * 2019-05-30 2022-05-10 广东工业大学 一种基于神经网络的语音识别方法、装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104202486A (zh) * 2014-09-26 2014-12-10 上海华勤通讯技术有限公司 移动终端及其屏幕解锁方法
CN105472159A (zh) * 2015-12-17 2016-04-06 青岛海信移动通信技术股份有限公司 一种多用户解锁的方法及装置
CN106161018A (zh) * 2015-03-23 2016-11-23 中兴通讯股份有限公司 一种管理分级密码的方法和装置
CN106340298A (zh) * 2015-07-06 2017-01-18 南京理工大学 融合内容识别和话者识别的声纹解锁方法
CN106653033A (zh) * 2016-10-28 2017-05-10 努比亚技术有限公司 一种语音解锁装置、终端及方法
CN108281146A (zh) * 2017-12-29 2018-07-13 青岛真时科技有限公司 一种短语音说话人识别方法和装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6940540B2 (en) * 2002-06-27 2005-09-06 Microsoft Corporation Speaker detection and tracking using audiovisual data
CN104658533A (zh) * 2013-11-20 2015-05-27 中兴通讯股份有限公司 一种终端解锁的方法、装置及终端
CN105869624B (zh) * 2016-03-29 2019-05-10 腾讯科技(深圳)有限公司 数字语音识别中语音解码网络的构建方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104202486A (zh) * 2014-09-26 2014-12-10 上海华勤通讯技术有限公司 移动终端及其屏幕解锁方法
CN106161018A (zh) * 2015-03-23 2016-11-23 中兴通讯股份有限公司 一种管理分级密码的方法和装置
CN106340298A (zh) * 2015-07-06 2017-01-18 南京理工大学 融合内容识别和话者识别的声纹解锁方法
CN105472159A (zh) * 2015-12-17 2016-04-06 青岛海信移动通信技术股份有限公司 一种多用户解锁的方法及装置
CN106653033A (zh) * 2016-10-28 2017-05-10 努比亚技术有限公司 一种语音解锁装置、终端及方法
CN108281146A (zh) * 2017-12-29 2018-07-13 青岛真时科技有限公司 一种短语音说话人识别方法和装置

Also Published As

Publication number Publication date
CN109040466A (zh) 2018-12-18

Similar Documents

Publication Publication Date Title
Liu et al. An MFCC‐based text‐independent speaker identification system for access control
EP2897076A1 (en) Tamper-resistant element for use in speaker recognition
CN110164455A (zh) 用户身份识别的装置、方法和存储介质
CN109448734A (zh) 基于声纹的终端设备解锁及应用启动方法以及装置
US20150154962A1 (en) Methods and systems for splitting a digital signal
Arif et al. Voice spoofing countermeasure for logical access attacks detection
KR102585231B1 (ko) 화자 인식을 수행하기 위한 음성 신호 처리 방법 및 그에 따른 전자 장치
Duraibi Voice biometric identity authentication model for IoT devices
CN112201254B (zh) 无感语音认证方法、装置、设备及存储介质
CN109040466B (zh) 基于语音的移动终端解锁方法、装置、电子设备以及存储介质
CN111613230A (zh) 声纹验证方法、装置、设备及存储介质
Dimaunahan et al. MFCC and VQ voice recognition based ATM security for the visually disabled
Biagetti et al. Speaker identification in noisy conditions using short sequences of speech frames
Kuznetsov et al. Methods of countering speech synthesis attacks on voice biometric systems in banking
Al-Karawi et al. Using combined features to improve speaker verification in the face of limited reverberant data
KR102604319B1 (ko) 화자 인증 시스템 및 그 방법
Saleema et al. Voice biometrics: the promising future of authentication in the internet of things
Trysnyuk et al. A method for user authenticating to critical infrastructure objects based on voice message identification
Basit et al. SDI: A tool for speech differentiation in user identification
KR20110079161A (ko) 이동 단말기에서 화자 인증 방법 및 장치
Montalvao Filho et al. Multimodal biometric fusion—joint typist (keystroke) and speaker verification
RU2351023C2 (ru) Способ верификации пользователя в системах санкционирования доступа
Saini et al. Speaker Anonymity and Voice Conversion Vulnerability: A Speaker Recognition Analysis
Nguyen et al. Vietnamese speaker authentication using deep models
Boujnah et al. 3-step speaker identification approach in degraded conditions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220623

Address after: 518000 1609, Changhong science and technology building, No. 18, Keji South 12th Road, high tech Zone, Yuehai street, Nanshan District, Shenzhen, Guangdong

Patentee after: Shenzhen Tongchuang Technology Co.,Ltd.

Address before: 518052 Room 201, building A, No. 1, Qian Wan Road, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong (Shenzhen Qianhai business secretary Co., Ltd.)

Patentee before: Li Qingyong

TR01 Transfer of patent right