CN112133314A - 声纹密码的设置和验证的方法、装置、设备和存储介质 - Google Patents

声纹密码的设置和验证的方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN112133314A
CN112133314A CN202011016563.1A CN202011016563A CN112133314A CN 112133314 A CN112133314 A CN 112133314A CN 202011016563 A CN202011016563 A CN 202011016563A CN 112133314 A CN112133314 A CN 112133314A
Authority
CN
China
Prior art keywords
user
voiceprint
voice
information
voice information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011016563.1A
Other languages
English (en)
Inventor
刁珍
华挺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN202011016563.1A priority Critical patent/CN112133314A/zh
Publication of CN112133314A publication Critical patent/CN112133314A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/32Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials
    • H04L9/3226Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials using a predetermined code, e.g. password, passphrase or PIN
    • H04L9/3231Biological data, e.g. fingerprint, voice or retina
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/66Substation equipment, e.g. for use by subscribers with means for preventing unauthorised or fraudulent calling
    • H04M1/667Preventing unauthorised calls from a telephone set
    • H04M1/67Preventing unauthorised calls from a telephone set by electronic means
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Telephone Function (AREA)

Abstract

本发明公开了一种声纹密码的设置和验证方法,包括以下步骤:接收声纹密码设置指令,获取工作状态模式;在所述工作状态模式是无障碍工作模式时,输出语音提示和/或震动,以使用户根据语音提示和/或震动输入用户语音信息进行声纹密码设置;接收用户语音信息,保存录入成功的用户语音信息;接收声纹验证指令,获取所述声纹验证指令对应的验证语音信息;将所述验证语音信息和所述用户语音信息进行比对,输出验证结果。本发明还公开了一种声纹密码的设置和验证装置、设备和存储介质。本发明通过不同的震动模式和/或明确指向的语音提示,方便视觉障碍用户设置和验证声纹密码。

Description

声纹密码的设置和验证的方法、装置、设备和存储介质
技术领域
本发明涉及视障人员辅助技术领域,尤其涉及一种声纹密码的设置和验证的方法、装置、设备和存储介质。
背景技术
随着科学技术的发展,人们的生活方式越来越便捷,各种应用软件层出不穷,为了保证应用软件的操作的安全性,应用软件登录之前进行身份验证变得比较常见。
当前应用软件账户登录的身份验证方式包括:声纹验证、人脸验证、指纹验证等。例如,在终端屏幕提示展示不同的数字或文字,让用户录入固定的数字或文字的声音,以完成声纹的设置,身份验证时需要录入与设置相同的文字或数字,来验证是否为本人操作,这样的身份信息验证方式对于视障用户来说,他们没有办法通过视觉感知屏幕上的信息,无法完成身份验证信息的设置和验证。
发明内容
本发明的主要目的在于提供一种声纹密码的设置和验证的方法、装置、设备和存储介质,旨在解决由于视障用户没有办法通过视觉感知屏幕上的信息,因此无法独自完成身份验证信息的设置和验证的技术问题。
为实现上述目的,本发明提供声纹密码的设置和验证的方法,所述声纹密码的设置和验证的方法包括以下步骤:
接收声纹密码设置指令,获取工作状态模式;
在所述工作状态模式是无障碍工作模式时,输出语音提示和/或震动,以使用户根据语音提示和/或震动输入用户语音信息进行声纹密码设置;
接收用户语音信息,保存录入成功的用户语音信息;
接收声纹验证指令,获取所述声纹验证指令对应的验证语音信息;
将所述验证语音信息和所述用户语音信息进行比对,输出验证结果。
可选地,所述将所述验证语音信息和所述用户语音信息进行比对,输出验证结果的步骤之后,所述方法包括:
统计所述验证结果为验证结果失败的次数,当所述次数超过预设值时,输出语音提示,以提示用户执行人脸识别操作;
开启摄像头,初步采集用户人脸图像,通过图像处理技术处理所述用户人脸图像,获得所述用户人脸图像中头部姿态的偏离程度信息;
输出所述偏离程度信息对应的语音提示,以使用户调整头部姿态,直至采集到符合条件的用户人脸图像;
获取符合条件的用户人脸图像,通过对所述符合条件的用户人脸图像进行人脸识别验证用户身份;
在用户身份验证通过时,启动声纹密码设置界面,再次输出语音提示,提示用户重新执行声纹密码设置操作。
可选地,所述图像处理技术的方法包括:
提取所述用户人脸图像的面部特征;
根据所述面部特征与对应用户的面部特征,计算用户头部姿态对应的俯仰角、偏航角和翻滚角信息,并将所述俯仰角、偏航角和翻滚角信息转换成偏离程度信息。
可选地,所述在所述工作状态模式是无障碍工作模式时,输出语音提示和/或震动,以使用户根据语音提示和/或震动输入用户语音信息进行声纹密码设置的步骤,包括:
在所述工作状态模式是无障碍工作模式时,输出语音提示和/或不同强弱的震动,以使用户调整用户语音信息的采集距离;
当所述采集距离属于预设距离范围内,通过语音提示和震动输出提示信息,以使用户输入用户语音信息进行声纹密码设置。
可选地,所述接收用户语音信息,保存录入成功的用户语音信息的步骤,包括:
接收用户语音信息,在所述用户语音信息的语音录入时间属于预设时间范围时,通过语音和/或震动的方式输出第二次录入提示信息;
采集二次录入的用户语音信息,计算两次录入的用户语音信息的声纹相似度;
若所述相似度大于预设相似度阈值,则将所述用户语音信息和所述用户语音信息的声纹特征录入用户声纹库,并输出声纹密码设置成功的提示;
所述将所述验证语音信息和所述用户语音信息进行比对,输出验证结果的步骤,包括:
提取所述验证语音信息的声纹特征,将所述验证语音信息的声纹特征和所述用户语音信息的声纹特征进行匹配,输出验证结果。
可选地,所述提取所述验证语音信息的声纹特征,将所述验证语音信息的声纹特征和所述用户语音信息的声纹特征进行匹配,输出验证结果的步骤包括:
对所述验证语音信息进行预处理,其中,所述预处理包括语音信号采样,反混叠带通滤波;
提取经过预处理的验证语音信息的声纹特征;
通过将所述验证语音信息的声纹特征与所述用户语音信息的声纹特征数据进行声纹特征匹配,计算匹配度;
根据所述匹配度是否属于预设匹配阈值,输出声纹验证结果。
可选地,所述接收声纹密码设置指令,获取工作状态模式的步骤包括:
采集语音操作信息,通过预设语音识别技术处理所述语音操作信息,获得所述语音操作信息中的关键字;
根据所述关键字确定所述语音操作信息是否为声纹密码设置指令;
若所述语音操作信息是所述声纹密码设置指令,则获取工作状态模式。
此外,为实现上述目的,本发明还提供一种声纹密码的设置和验证装置,所述声纹密码的设置和验证装置包括:
第一接收模块,用于接收声纹密码设置指令,获取工作状态模式;
提示设置模块,用于在所述工作状态模式是无障碍工作模式时,输出语音提示和/或震动,以使用户根据语音提示和/或震动输入用户语音信息进行声纹密码设置;
接收保存模块,用于接收用户语音信息,保存录入成功的用户语音信息;
第二接收模块,用于接收声纹验证指令,获取所述声纹验证指令对应的验证语音信息;
匹配输出模块,用于将所述验证语音信息和所述用户语音信息进行匹配,输出验证结果。
此外,为实现上述目的,本发明还提供一种声纹密码的设置和验证设备;
所述声纹密码的设置和验证设备包括:麦克风、摄像头、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中:
所述麦克风,用于获取用户输入的语音;
所述摄像头,用于获取用户人脸图像;
所述计算机程序被所述处理器执行时实现如上所述的声纹密码的设置和验证方法的步骤。
此外,为实现上述目的,本发明还提供存储介质;
所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的声纹密码的设置和验证方法的步骤。
本发明实施例提出的一种声纹密码的设置和验证的方法、装置、设备和存储介质,终端启动声纹密码设置功能前需要获取工作状态模式;在所述工作状态模式是无障碍工作模式时,输出语音提示和/或震动,以使用户执行声纹密码设置操作;终端接收用户语音信息,保存录入成功的用户语音信息;启动声纹密码验证功能,采集验证语音信息,将所述验证语音信息和所述用户语音信息进行比对,输出验证结果。本发明针对视障,甚至全盲人士,通过语音提醒,和手机振动反馈状态的方式,让他们能够在不需要旁人的协助下,自己完成声纹的录入,并能够在某些场景下更方便地用声纹验证的方式替代密码验证的方式,使得视障人士使用移动终端更加便捷。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的装置结构示意图;
图2为本发明声纹密码的设置和验证方法第一实施例的流程示意图;
图3为图2中声纹密码的设置和验证方法第一实施例中步骤S50之后步骤的流程示意图;
图4为本发明声纹密码的设置和验证控制装置一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的终端(又叫声纹密码的设置和验证设备,其中,声纹密码的设置和验证设备可以是由单独的声纹密码的设置和验证装置构成,也可以是由其他装置与声纹密码的设置和验证装置组合形成)结构示意图。
本发明实施例终端可以固定终端,也可以是移动终端,如,带联网功能的智能电器、智能空调、智能音箱、自动驾驶汽车、PC(personal computer)个人计算机、智能手机、平板电脑、电子书阅读器、便携计算机等。
如图1所示,该终端可以包括:处理器1001,例如,中央处理器Central ProcessingUnit,CPU),网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真WIreless-FIdelity,WIFI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如,磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,终端还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块;输入单元,比显示屏,触摸屏;网络接口可选除无线接口中除WiFi外,蓝牙、探针等等。其中,传感器比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器;当然,移动终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,该计算机软件产品存储在一个存储介质(存储介质:又叫计算机存储介质、计算机介质、可读介质、可读存储介质、计算机可读存储介质或者直接叫介质等,存储介质可以是非易失性可读存储介质,如RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及计算机程序;操作系统是指电视终端中安装的操作系统,例如,安卓系统;网络通信模块是指用于通信连接的网络模块,本实施例中网络通信模块可以与共享终端建立连接;用户接口模块是指用于接收用户输入的模块,例如,用户接口模块用于接收遥控器发送的指令;计算机程序中保存有声纹密码的设置和验证程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的计算机程序,并执行本发明以下实施例提供的声纹密码的设置和验证方法中的步骤。
基于上述硬件结构提出了本发明声纹密码的设置和验证方法实施例。
参照图2,本发明一种声纹密码的设置和验证方法的第一实施例中,所述声纹密码的设置和验证方法包括:
步骤S10,接收声纹密码设置指令,获取工作状态模式。
本发明的一种声纹密码的设置和验证方法可以应用于声纹密码的设置和验证设备,声纹密码的设置和验证设备可以是固定终端,也可以应用于移动终端,适用于视障人士(声纹密码,通过声纹识别进行验密。声纹识别是生物识别技术的一种,也称为说话人识别,包括说话人辨认和说话人确认。声纹识别就是把声信号转换成电信号,再用计算机进行识别)。例如,终端可以是家电设备、或者其他类型的设备。
本发明实施例以移动终端中的手机为例进行说明,手机接收声纹密码设置指令,其中,声纹密码设置指令的触发方式不作具体限定,即,声纹密码设置指令可以是用户主动触发的,例如,用户点击手机的显示界面,触发声纹密码设置指令;此外,声纹密码设置指令还可以是手机自动触发的,例如,用户在手机中预先设置在屏幕电路是自动触发,手机在检测到屏幕点亮时自动触发声纹密码设置指令。
手机接收到声纹密码设置指令之后,手机获取工作状态模式,其中,工作状态模式包括省电模式,正常工作模式、无障碍工作模式(针对视觉障碍人士,开启语音提示和震动模式的工作模式)
为了方便视障人士的操作,在本实施例中步骤S10可以通过语音触发声纹密码设置指令,具体地包括以下步骤:
步骤a1,采集语音操作信息,通过预设语音识别技术处理所述语音操作信息,获得所述语音操作信息中的关键字;
步骤a2,根据所述关键字确定所述语音操作信息是否为声纹密码设置指令;
步骤a3,若所述语音操作信息是所述声纹密码设置指令,则获取工作状态模式;
为了方便理解,本实施例中给出了一种声纹密码的设置和验证方法的具体应用场景,例如,终端是手机,用户打开语音助手,然后手机采集语音操作信息,通过预设语音识别技术(语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列)处理所述语音操作信息,获得所述语音操作信息中的关键字。若所述关键字为“声纹密码”和“设置”,则所述语音操作信息是声纹密码设置指令,然后获取工作状态。若用户准确单击终端屏幕“确定”处,则进入正常工作模式;若用户长按终端屏幕的任何一处,则进入无障碍工作模式,且终端通过振动提示用户成功进入无障碍工作模式。本实施例中通过识别用户语音操作信息,自动进入声纹密码设置界面,有效降低视障用户进入声纹密码设置界面的难度,给视障用户带来更好的体验。
步骤S20,在所述工作状态模式是无障碍工作模式时,输出语音提示和/或震动,以使用户根据语音提示和/或震动输入用户语音信息进行声纹密码设置。
在所述工作状态模式是无障碍工作模式时,手机通过语音的方式输出操作提示,告知用户需要执行的操作。若在预设时间间隔(预设时间间隔表征用户在输出提示信息之后执行操作的时间间隔,预设时间间隔可以根据具体场景设置,例如,此处预设时间间隔设置为60s)内未检测到所述操作语音信息对应的用户操作,手机则重复播报所述操作语音信息。手机统计重复播报所述操作语音信息的次数,当所述次数超过3次时,自动跳出无障碍工作模式,进入正常工作模式。
步骤b1,在所述工作状态模式是无障碍工作模式时,输出语音提示和/或不同强弱的震动,以使用户调整用户语音信息的采集距离;
步骤b2,当所述采集距离属于预设距离范围内,通过语音提示和震动输出提示信息,以使用户输入用户语音信息进行声纹密码设置。
即,在所述工作状态模式是无障碍工作模式时,手机初步采集用户语音信息,并根据用户语音信息判断此时用户与手机的距离。手机可以通过输出语音提示信息(语音提示信息可以是“靠近一点”和“远离一点”)提示用户调整与手机的距离,也可以通过输出不同强弱的震动模式提示用户调整与手机的距离,例如当用户与手机的距离越接近预设距离范围,终端震动幅度就越小,当然,也可以同时通过输出有明确指向的语音信息和不同强弱的震动模式提示用户。
每次声纹密码设置操作完成后,终端会自动跳转到下一个操作界面,并通过输出语音提示信息告知用户录入结果,例如,手机成功录入用户语音信息之后,输出“录入成功”的语音提示信息。
步骤S30,接收用户语音信息,保存录入成功的用户语音信息。
手机在接收用户语音信息之后,需判断用户语音信息质量是否符合要求,保存录入成功的用户语音信息,具体地,包括:
步骤c1,接收用户语音信息,在所述用户语音信息的语音录入时间属于预设时间范围时,通过语音和/或震动的方式输出第二次录入提示信息;
步骤c2,采集二次录入的用户语音信息,计算两次录入的用户语音信息的声纹相似度;
步骤c3,若所述相似度大于预设相似度阈值,则将所述用户语音信息和所述用户语音信息的声纹特征录入用户声纹库,并输出声纹密码设置成功的提示。
即,手机在接收用户语音信息之后,首先获取用户语音信息的语音录入时间,若是所述语音录入时间过长,则会导致用户语音信息中的噪声过多;若是所述语音录入时间过短,则会导致用户语音信息中的有效信息过少;因此需要保证用户语音信息的语音录入时间属于预设时间范围内(预设时间范围表征声语音录入的合理时间范围,预设时间范围可以根据具体场景设置,例如,此处预设时间范围设置为15s~30s)。在用户语音信息的语音录入时间属于预设时间范围时,手机提取用户语音信息的声纹特征,并通过语音和/或震动的方式输出第二次录入提示信息(其中,提示信息可以是“开始二次录入”的语音提示和震动表示终端已进入录入状态)。
手机采集第二次用户语音信息,在第二次用户语音信息录入时间属于预设时间范围时,提取第二次用户语音信息的声纹特征,并与用户声纹库中录入的第一次用户语音信息的声纹特征进行比对,计算两者的声纹相似度。若相似度大于预设相似度阈值(预设相似度阈值表征声纹特征最低相识度,预设相似度阈值可以根据具体场景设置,例如,此处预设相似度阈值设置为95%),则手机将用户语音信息的声纹特征与所述用户进行关联录入用户声纹库,用户声纹库将用于声纹密码的验证;若相似度小于预设相似度阈值,则手机通过语音和/或振动的方式输出录入失败结果,提示用户重新执行声纹密码设置操作。
步骤S40,接收声纹验证指令,获取所述声纹验证指令对应的验证语音信息。
为了方便视障人士的操作,在本实施例中步骤S40可以通过语音触发声纹验证指令,具体地包括以下步骤:
步骤d1,采集语音操作信息,通过预设语音识别技术处理所述语音操作信息,获得所述语音操作信息中的关键字;
步骤d2,根据所述关键字确定所述语音操作信息是否为声纹验证指令;
步骤d3,若所述语音操作信息是所述声纹验证指令,则获取所述声纹验证指令对应的验证语音信息;
手机通过预设语音识别技术处理所述语音操作信息,例如,手机的银行APP需要用户进行身份验证才能授权用户使用转账,支付等功能。此时,用户需要选择身份验证方式,用户开启语音助手,用户输入语音操作信息,获得语音操作信息中的关键字,若关键字为“声纹”和“验证”,则语音操作信息是声纹验证指令。当语音操作信息是声纹验证指令时,手机震动提示用户输入验证语音信息,手机获取验证语音信息。
步骤S50,将所述验证语音信息和所述用户语音信息进行比对,输出验证结果。
手机对所述验证语音信息进行预处理,其中,预处理包括语音信号采样,反混叠带通滤波。手机提取经过预处理的验证语音信息的声纹特征;通过将验证语音信息的声纹特征与用户声纹库中对应用户的声纹特征数据进行声纹特征匹配,计算匹配度。若所匹配度大于预设匹配阈值(预设匹配阈值表征声纹特征的最低匹配度,预设匹配阈值可以根据具体应用场景而定,此处,预设匹配阈值设置为95%),则用户身份验证成功,手机输出“验证成功”的语音提示信息;若所述匹配度小于预设匹配阈值,则用户身份验证失败,手机输出“验证失败”的语音提示信息,需要用户改变录音环境或重新执行声纹密码设置操作。
在本实施例中通过不同的震动模式和/或明确指向的语音提示,方便视障用户能够独立地使用声纹设置与验证功能,在无法或有损地通过视觉感知屏幕信息的情况下,尽可能地通过触觉和听觉两个维度给用户提供协助信息。另外,调整用户语音信息的采集距离和二次采集用户语音信息,有利于提高用户语音信息的质量,并增强声纹密码验证用户身份信息的可靠性和准确性。
进一步的,在本发明第一实施例的基础上,进一步提出了本发明声纹密码的设置和验证方法的第二实施例。
本实施例是第一实施例中步骤S50之后的步骤,所述声纹密码的设置和验证方法包括:
步骤S60,统计所述验证结果为验证结果失败的次数,当所述次数超过预设值时,输出语音提示,以提示用户执行人脸识别操作;
当声纹密码验证失败时,若是由于用户所处环境过于嘈杂,则手机输出语音提示用户移动至安静的环境进行录音。若多次声纹密码验证失败,手机统计验证结果为验证结果失败的次数,当次数超过预设值(预设值为3)时,手机自动进入人脸识别验证界面,手机输出语音提示信息(其中,语音提示信息可以是“3次声纹密码验证失败,请进行人脸识别重新设置声纹密码”),以提示用户执行人脸识别操作。
步骤S70,开启摄像头,初步采集用户人脸图像,通过图像处理技术处理所述用户人脸图像,获得所述用户人脸图像中头部姿态的偏离程度信息;
手机开启摄像头,初步采集用户人脸图像,通过图像处理技术处理用户人脸图像(图像处理技术是用计算机对图像信息进行处理的技术,主要包括图像数字化、图像增强和复原、图像数据编码、图像分割和图像识别等)。
所述图像处理技术的方法包括:
步骤e1:提取所述用户人脸图像的面部特征;
步骤e2:根据所述面部特征与对应用户的面部特征,计算用户头部姿态对应的俯仰角、偏航角和翻滚角信息,并将所述俯仰角、偏航角和翻滚角信息转换成偏离程度信息。
手机基于三维空间右手笛卡尔坐标系(三维空间右手笛卡尔坐标系指的是原点O在标准用户头部质心的位置;X轴是标准用户头部的左右方向,向左为正方向;Y轴是标准用户头部的上下方向,向上为正方向;Z轴是用户头部的前后方向,向前为正方向)计算实际用户头部姿态对应的俯仰角、偏航角和翻滚角。
在三维空间右手笛卡尔坐标系中,俯仰角,指的是实际用户头部在YZ平面上与Y轴的夹角;偏航角,指的是实际用户头部在XY平面上与X轴的夹角;翻滚角,指的是实际用户头部在XZ平面上与Z轴的夹角。
俯仰角信息转换成用户头部俯仰姿态的偏离程度信息,偏航角信息转换成用户头部左右歪斜姿态的偏离程度信息,翻滚角信息转换成用户头部左右两侧姿态的偏离程度信息
步骤S80,输出所述偏离程度信息对应的语音提示,以使用户调整头部姿态,直至采集到符合条件的用户人脸图像;
手机输出偏离程度信息对应的语音提示信息,当俯仰角度大于预设俯仰角度阈值(俯仰角度阈值表征俯仰角度最大可允许的角度,俯仰角度阈值可以根据具体应用场景而定,此处,将俯仰角度阈值设置为±10°)时,手机输出“向下低一点”或“向上抬一点”的语音提示信息;当偏航角度大于预设偏航角度阈值(偏航角度阈值表征偏航角度最大可允许的角度,偏航角度阈值可以根据具体应用场景而定,此处,将偏航角度阈值设置为±10°)时手机输出“向左斜一点”或“向右斜一点”的语音信息;当翻滚角度大于预设翻滚角度阈值(翻滚角度阈值表征翻滚角度最大可允许的角度,翻滚角度阈值可以根据具体应用场景而定,此处,将翻滚角度阈值设置为±10°)时手机输出“向左偏一点”或“向右偏一点”的语音信息;当用户调整到符合条件的头部姿态时,手机输出“滴”的语音提示信息,表示开始录入用户人脸图像。
步骤S90,获取符合条件的用户人脸图像,通过对所述符合条件的用户人脸图像进行人脸识别验证用户身份;
手机获取符合条件的用户人脸图像,提取用户人脸图像的面部特征,与人脸图像库中对应用户的面部特征进行比对,从而验证用户身份。
步骤S100,在用户身份验证通过时,启动声纹密码设置界面,再次输出语音提示,提示用户重新执行声纹密码设置操作。
在用户身份验证通过时,手机启动声纹密码设置界面,再次输出“请重新设置声纹密码”的语音提示,提示用户重新执行声纹密码设置操作。在重新设置声纹密码之前,手机需要通过人脸识别验证用户身份信息,提高了声纹密码设置的严谨性。手机通过输出语音提示信息,使得用户能够在不需要旁人的协助下完成人脸识别,提高了视障人士验证身份信息的便捷性。
此外,参照图4,本发明实施例还提出一种声纹密码的设置和验证装置,所述声纹密码的设置和验证装置包括:
第一接收模块10,用于接收声纹密码设置指令,获取工作状态模式;
提示设置模块20,用于在所述工作状态模式是无障碍工作模式时,输出语音提示和/或震动,以使用户根据语音提示和/或震动输入用户语音信息进行声纹密码设置;
接收保存模块30,用于接收用户语音信息,保存录入成功的用户语音信息;
第二接收模块40,用于接收声纹验证指令,获取所述声纹验证指令对应的验证语音信息;
匹配输出模块50,用于将所述验证语音信息和所述用户语音信息进行匹配,输出验证结果。
在一实施例中,所述声纹密码的设置和验证装置,包括:
计数模块,用于统计所述验证结果为验证结果失败的次数,当所述次数超过预设值时,输出语音提示,以提示用户执行人脸识别操作;
图像采集模块,用于开启摄像头,初步采集用户人脸图像,通过图像处理技术处理所述用户人脸图像,获得所述用户人脸图像中头部姿态的偏离程度信息;
第一提示模块,用于输出所述偏离程度信息对应的语音提示,以使用户调整头部姿态,直至采集到符合条件的用户人脸图像;
人脸识别模块,用于获取符合条件的用户人脸图像,通过对所述符合条件的用户人脸图像进行人脸识别验证用户身份;
第二提示模块,用于在用户身份验证通过时,启动声纹密码设置界面,再次输出语音提示,提示用户重新执行声纹密码设置操作。
在一实施例中,所述图像采集模块,包括:
图像提取单元,用于提取所述用户人脸图像的面部特征;
角度转换单元,用于根据所述面部特征与对应用户的面部特征,计算用户头部姿态对应的俯仰角、偏航角和翻滚角信息,并将所述俯仰角、偏航角和翻滚角信息转换成偏离程度信息。
在一实施例中,所述声纹密码的设置和验证装置,包括:
提示处理模块,用于在所述工作状态模式是无障碍工作模式时,输出语音提示和/或不同强弱的震动,以使用户调整用户语音信息的采集距离;
操作提示模块,用于当所述采集距离属于预设距离范围内,通过语音提示和震动输出提示信息,以使用户输入用户语音信息进行声纹密码设置。
在一实施例中,所述声纹密码的设置和验证装置,包括:
信息提示模块,用于接收用户语音信息,在所述用户语音信息的语音录入时间属于预设时间范围时,通过语音和/或震动的方式输出第二次录入提示信息;
声纹处理模块,用于采集二次录入的用户语音信息,计算两次录入的用户语音信息的声纹相似度;
声纹录入模块,用于若所述相似度大于预设相似度阈值,则将所述用户语音信息和所述用户语音信息的声纹特征录入用户声纹库,并输出声纹密码设置成功的提示;
声纹匹配模块,用于提取所述验证语音信息的声纹特征,将所述验证语音信息的声纹特征和所述用户语音信息的声纹特征进行匹配,输出验证结果。
在一实施例中,所述声纹匹配模块,包括:
预处理单元,用于对所述验证语音信息进行预处理,其中,所述预处理包括语音信号采样,反混叠带通滤波;
特征提取单元,用于提取经过预处理的验证语音信息的声纹特征;
特征匹配单元,用于通过将所述验证语音信息的声纹特征与所述用户语音信息的声纹特征数据进行声纹特征匹配,计算匹配度;
结果输出单元,根据所述匹配度是否属于预设匹配阈值,输出声纹验证结果。
在一实施例中,所述声纹密码的设置和验证装置,包括:
语音采集模块,用于采集语音操作信息,通过预设语音识别技术处理所述语音操作信息,获得所述语音操作信息中的关键字;
指令判断模块,用于根据所述关键字确定所述语音操作信息是否为声纹密码设置指令;
模式开启模块,用于若所述语音操作信息是所述声纹密码设置指令,则获取工作状态模式。
其中,声纹密码的设置和验证装置的各个功能模块实现的步骤可参照本发明声纹密码的设置和验证方法的各个实施例,此处不再赘述。
此外,本发明实施例还提出一种存储介质。
所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例提供的声纹密码的设置和验证方法中的操作。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体/操作/对象与另一个实体/操作/对象区分开来,而不一定要求或者暗示这些实体/操作/对象之间存在任何这种实际的关系或者顺序;术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的。可以根据实际的需要选择中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种声纹密码的设置和验证方法,其特征在于,所述声纹密码的设置和验证方法包括以下步骤:
接收声纹密码设置指令,获取工作状态模式;
在所述工作状态模式是无障碍工作模式时,输出语音提示和/或震动,以使用户根据语音提示和/或震动输入用户语音信息进行声纹密码设置;
接收用户语音信息,保存录入成功的用户语音信息;
接收声纹验证指令,获取所述声纹验证指令对应的验证语音信息;
将所述验证语音信息和所述用户语音信息进行比对,输出验证结果。
2.如权利要求1所述的声纹密码的设置和验证方法,其特征在于,所述将所述验证语音信息和所述用户语音信息进行比对,输出验证结果的步骤之后,所述方法包括:
统计所述验证结果为验证结果失败的次数,当所述次数超过预设值时,输出语音提示,以提示用户执行人脸识别操作;
开启摄像头,初步采集用户人脸图像,通过图像处理技术处理所述用户人脸图像,获得所述用户人脸图像中头部姿态的偏离程度信息;
输出所述偏离程度信息对应的语音提示,以使用户调整头部姿态,直至采集到符合条件的用户人脸图像;
获取符合条件的用户人脸图像,通过对所述符合条件的用户人脸图像进行人脸识别验证用户身份;
在用户身份验证通过时,启动声纹密码设置界面,再次输出语音提示,提示用户重新执行声纹密码设置操作。
3.如权利要求2所述的声纹密码的设置和验证方法,其特征在于,所述图像处理技术的方法包括:
提取所述用户人脸图像的面部特征;
根据所述面部特征与对应用户的面部特征,计算用户头部姿态对应的俯仰角、偏航角和翻滚角信息,并将所述俯仰角、偏航角和翻滚角信息转换成偏离程度信息。
4.如权利要求1所述的声纹密码的设置和验证方法,其特征在于,所述在所述工作状态模式是无障碍工作模式时,输出语音提示和/或震动,以使用户根据语音提示和/或震动输入用户语音信息进行声纹密码设置的步骤,包括:
在所述工作状态模式是无障碍工作模式时,输出语音提示和/或不同强弱的震动,以使用户调整用户语音信息的采集距离;
当所述采集距离属于预设距离范围内,通过语音提示和震动输出提示信息,以使用户输入用户语音信息进行声纹密码设置。
5.如权利要求1所述的声纹密码的设置和验证方法,其特征在于,所述接收用户语音信息,保存录入成功的用户语音信息的步骤,包括:
接收用户语音信息,在所述用户语音信息的语音录入时间属于预设时间范围时,通过语音和/或震动的方式输出第二次录入提示信息;
采集二次录入的用户语音信息,计算两次录入的用户语音信息的声纹相似度;
若所述相似度大于预设相似度阈值,则将所述用户语音信息和所述用户语音信息的声纹特征录入用户声纹库,并输出声纹密码设置成功的提示;
所述将所述验证语音信息和所述用户语音信息进行比对,输出验证结果的步骤,包括:
提取所述验证语音信息的声纹特征,将所述验证语音信息的声纹特征和所述用户语音信息的声纹特征进行匹配,输出验证结果。
6.如权利要求5所述的声纹密码的设置和验证方法,其特征在于,所述提取所述验证语音信息的声纹特征,将所述验证语音信息的声纹特征和所述用户语音信息的声纹特征进行匹配,输出验证结果的步骤包括:
对所述验证语音信息进行预处理,其中,所述预处理包括语音信号采样,反混叠带通滤波;
提取经过预处理的验证语音信息的声纹特征;
通过将所述验证语音信息的声纹特征与所述用户语音信息的声纹特征数据进行声纹特征匹配,计算匹配度;
根据所述匹配度是否属于预设匹配阈值,输出声纹验证结果。
7.如权利要求1-6任意一项所述的声纹密码的设置和验证方法,其特征在于,所述接收声纹密码设置指令,获取工作状态模式的步骤包括:
采集语音操作信息,通过预设语音识别技术处理所述语音操作信息,获得所述语音操作信息中的关键字;
根据所述关键字确定所述语音操作信息是否为声纹密码设置指令;
若所述语音操作信息是所述声纹密码设置指令,则获取工作状态模式。
8.一种声纹密码的设置和验证装置,其特征在于,所述声纹密码的设置和验证装置包括:
第一接收模块,用于接收声纹密码设置指令,获取工作状态模式;
提示设置模块,用于在所述工作状态模式是无障碍工作模式时,输出语音提示和/或震动,以使用户根据语音提示和/或震动输入用户语音信息进行声纹密码设置;
接收保存模块,用于接收用户语音信息,保存录入成功的用户语音信息;
第二接收模块,用于接收声纹验证指令,获取所述声纹验证指令对应的验证语音信息;
匹配输出模块,用于将所述验证语音信息和所述用户语音信息进行匹配,输出验证结果。
9.一种声纹密码的设置和验证设备,其特征在于,所述声纹密码的设置和验证设备包括:麦克风、摄像头、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中:
所述麦克风,用于获取用户输入的语音;
所述摄像头,用于获取用户人脸图像;
所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的声纹密码的设置和验证方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的声纹密码的设置和验证方法的步骤。
CN202011016563.1A 2020-09-24 2020-09-24 声纹密码的设置和验证的方法、装置、设备和存储介质 Pending CN112133314A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011016563.1A CN112133314A (zh) 2020-09-24 2020-09-24 声纹密码的设置和验证的方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011016563.1A CN112133314A (zh) 2020-09-24 2020-09-24 声纹密码的设置和验证的方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN112133314A true CN112133314A (zh) 2020-12-25

Family

ID=73839737

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011016563.1A Pending CN112133314A (zh) 2020-09-24 2020-09-24 声纹密码的设置和验证的方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN112133314A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112926709A (zh) * 2021-03-29 2021-06-08 支付宝(杭州)信息技术有限公司 用户身份的验证方法、装置和电子设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN203812295U (zh) * 2014-01-09 2014-09-03 安徽科大讯飞信息科技股份有限公司 一种基于声纹识别进行锁定解锁的智能语音玩具装置
CN104490570A (zh) * 2014-12-31 2015-04-08 桂林电子科技大学 一种面向盲人的嵌入式声纹识别与发现系统
CN107895576A (zh) * 2017-11-10 2018-04-10 北京康力优蓝机器人科技有限公司 服务机器人的识别启动方法及装置
CN108447159A (zh) * 2018-03-28 2018-08-24 百度在线网络技术(北京)有限公司 人脸图像采集方法、装置和出入口管理系统
CN109031306A (zh) * 2018-06-29 2018-12-18 合肥东恒锐电子科技有限公司 一种用于视障人群的导航方法及系统
CN110647865A (zh) * 2019-09-30 2020-01-03 腾讯科技(深圳)有限公司 人脸姿态的识别方法、装置、设备及存储介质
CN111263204A (zh) * 2018-11-30 2020-06-09 青岛海尔多媒体有限公司 用于多媒体播放设备的控制方法、装置及计算机存储介质
CN111310512A (zh) * 2018-12-11 2020-06-19 杭州海康威视数字技术股份有限公司 用户身份鉴权方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN203812295U (zh) * 2014-01-09 2014-09-03 安徽科大讯飞信息科技股份有限公司 一种基于声纹识别进行锁定解锁的智能语音玩具装置
CN104490570A (zh) * 2014-12-31 2015-04-08 桂林电子科技大学 一种面向盲人的嵌入式声纹识别与发现系统
CN107895576A (zh) * 2017-11-10 2018-04-10 北京康力优蓝机器人科技有限公司 服务机器人的识别启动方法及装置
CN108447159A (zh) * 2018-03-28 2018-08-24 百度在线网络技术(北京)有限公司 人脸图像采集方法、装置和出入口管理系统
CN109031306A (zh) * 2018-06-29 2018-12-18 合肥东恒锐电子科技有限公司 一种用于视障人群的导航方法及系统
CN111263204A (zh) * 2018-11-30 2020-06-09 青岛海尔多媒体有限公司 用于多媒体播放设备的控制方法、装置及计算机存储介质
CN111310512A (zh) * 2018-12-11 2020-06-19 杭州海康威视数字技术股份有限公司 用户身份鉴权方法及装置
CN110647865A (zh) * 2019-09-30 2020-01-03 腾讯科技(深圳)有限公司 人脸姿态的识别方法、装置、设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112926709A (zh) * 2021-03-29 2021-06-08 支付宝(杭州)信息技术有限公司 用户身份的验证方法、装置和电子设备

Similar Documents

Publication Publication Date Title
US10915777B2 (en) Communication terminal, communication system, and image processing method
CN110178179B (zh) 用于向电子设备用户认证的语音签名
CN107544272B (zh) 终端控制方法、装置及存储介质
EP1229496A2 (en) Information terminal apparatus and authenticating system
CN108986245A (zh) 基于人脸识别的考勤方法及终端
US11245707B2 (en) Communication terminal, communication system, communication control method, and recording medium
CN104360736A (zh) 基于手势的终端控制方法和系统
CN107622246B (zh) 人脸识别方法及相关产品
WO2020095350A1 (ja) 情報処理装置、情報処理方法及び記録媒体
CN110647732B (zh) 一种基于生物识别特征的语音交互方法、系统、介质和设备
CN112133314A (zh) 声纹密码的设置和验证的方法、装置、设备和存储介质
CN114299587A (zh) 眼睛状态判定方法及装置、电子设备和存储介质
CN112989937B (zh) 用户身份验证的方法和装置
CN111586074B (zh) 一种通信方法、服务器、物联网系统及可读存储介质
CN113794934A (zh) 防沉迷引导方法、电视和计算机可读存储介质
CN111160157B (zh) 基于dwg图纸的文本提取方法及相关产品
CN109104664A (zh) 智能音箱的控制方法、系统、智能音箱及存储介质
CN108153568B (zh) 一种信息处理方法及电子设备
KR20180052858A (ko) 지능형 인형 및 그 동작 방법
CN110852220A (zh) 人脸表情的智能识别方法、终端和计算机可读存储介质
CN112052711B (zh) 指纹录入方法、身份验证方法及装置
CN113590248A (zh) 车载终端的投屏方法、装置和可读存储介质
CN108875352B (zh) 用户身份的验证方法、装置及移动终端
CN113343788A (zh) 图像采集方法及装置
CN110895601A (zh) 辨识用户的装置及辨识用户的系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201225

RJ01 Rejection of invention patent application after publication