CN109101793A - 一种基于静态文本击键特征的身份识别方法及系统 - Google Patents

一种基于静态文本击键特征的身份识别方法及系统 Download PDF

Info

Publication number
CN109101793A
CN109101793A CN201810763534.8A CN201810763534A CN109101793A CN 109101793 A CN109101793 A CN 109101793A CN 201810763534 A CN201810763534 A CN 201810763534A CN 109101793 A CN109101793 A CN 109101793A
Authority
CN
China
Prior art keywords
characteristic
user
keystroke
behavioural
static text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201810763534.8A
Other languages
English (en)
Inventor
方书田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201810763534.8A priority Critical patent/CN109101793A/zh
Publication of CN109101793A publication Critical patent/CN109101793A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/316User authentication by observing the pattern of computer usage, e.g. typical user behaviour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Social Psychology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Input From Keyboards Or The Like (AREA)

Abstract

本发明公开了一种基于静态文本击键特征的身份识别方法及系统,该方法通过提取用户通过键盘输入预设静态文本的行为特征,利用预设分类算法对包含不同所述用户行为特征的特征变量进行训练和筛选,根据筛选结果建立标识身份的行为特征库,提取待识别用户输入的行为特征,并与所述行为特征库对比,根据比对结果识别所述待识别用户所属的身份。本发明提供的方法提取用户通过键盘输入文本的击键速度、准确率和稳定性的行为特征,并针对提取的击键特征进行筛选,将更能体现用户击键个体差异表征用户身份的行为特征作为行为特征库,使得待识别用户身份的识别率大大得到了提高。

Description

一种基于静态文本击键特征的身份识别方法及系统
技术领域
本发明涉及模式识别领域,具体涉及一种基于静态文本击键特征的身份识别方法及系统。
背景技术
目前,计算机系统中个人身份鉴定通常使用密码验证方式,但是密码有可能被盗或者破解,存在较大的安全隐患。近年来兴起的指纹和瞳孔识别等生物特征认证手段,由于需要硬件支持且成本较高等问题,普及率受到限制,因此急需找到一种能准确方便地根据用户独一无二的行为特征,识别出用户身份的方法。
研究发现,由于每个人的受训练程度不同,用手习惯不同,以及性格的差异使得每个人在进行键盘录入时,其击键特点也互不相同,这些不同主要体现在击键速度、连续敲击两个字符的时间间隔上及使用组合键的方式和时间上等。现有技术对击键特征的提取大部分集中在击键速度,间隔时间的分析等,考虑的特征因素比较少,且不对提取的击键特征进行筛选优化,没有去除不能准确反映用户身份的特征,因而导致识别率不高。
发明内容
因此,本发明提供一种基于静态文本击键特征的身份识别方法及系统,解决了现有技术中基于击键特征的对身份识别准确率不高的不足。
本发明实施例提供的一种基于静态文本击键特征的身份识别方法,包括如下步骤:获取待识别用户通过键盘输入预设静态文本的多个第一行为特征;将所述多个第一行为特征与预设的行为特征库对比,根据比对结果识别所述待识别用户所属的身份。
通过以下步骤建立所述预设的行为特征库:获取样本用户通过键盘输入预设静态文本的多个第二行为特征;根据所述多个第二行为特征整合生成多个不同的特征变量,各所述特征变量中至少包含一个所述第二行为特征;将所述不同的特征变量分别输入预设的分类模型中,得到所述不同的特征变量对应的识别率,将最高的识别率对应的特征变量作为标识用户身份的行为特征库。
优选地,所述第一行为特征和/或第二行为特征为:用以表征用户输入所述静态文本的速度特征的第一击键速度特征,通过以下公式计算所述第一击键速度特征的特征值:
其中,WPM为所述第一击键速度特征的特征值,T为一次测试的总时间,Nrc为输入正确的字符数。
优选地,所述第一行为特征和/或第二行为特征为:用以表征用户输入所述静态文本进行错误调整的特征的第二击键速度特征,通过以下公式计算所述第二击键速度特征的特征值:
其中,WPM'为所述第二击键速度特征的特征值,用户输入正确的字符数Nrc,每个需要a个单位时间,用户输入错误字符数Nec,每个需要b个单位时间,用户改正输入错误字符的数量Net,每个需要c个单位时间,T 为一次测试的总时间。
优选地,所述第一行为特征和/或第二行为特征为:用户输入所述静态文本的速度排名特征的第三击键速度特征,通过以下公式计算所述第三击键速度特征的特征值:
其中,WPM”为所述第三击键速度特征的特征值,WPMi为所述第一击键速度的特征值除以10的整数部分,WPMr为所述第一击键速度的特征值除以10的小数部分,n为[0-14]之间的整数值,Hn为击键速度为(10n-5,10n+5] 区间的用户数量,HWPMi为数值是WPMi所占的所述样本用户数量。
优选地,所述第一行为特征和/或第二行为特征为:用以表征用户输入所述静态文本正确率的特征的准确率特征,通过以下公式计算所述准确率特征的特征值:
其中,Fa为所述准确率特征的特征值,Nrc为用户输入正确的字符数,Nec 为用户输入错误字符数。
优选地,所述第一行为特征和/或第二行为特征为:用以表征用户输入所述静态文本不同错误类型个数的占比特征的错误类型占比特征,通过以下公式计算所述错误类型占比特征的特征值:
其中,Fe为所述错误类型占比特征的特征值,Nebc为第一错误类型的个数,Nebo为第二错误类型的个数,Neo为第三错误类型的个数。
优选地,所述第一行为特征和/或第二行为特征为:用以表征用户输入所述静态文本速度的稳定性特征的速度稳定性特征,通过以下公式计算所述击键速度稳定性特征的特征值:
其中,Fws为用户击键速度的特征值,N为用户输入字符的个数,Wi为用户第i次击键速度,Wu为用户平均击键速度。
优选地,所述第一行为特征和/或第二行为特征为:用以表征用户输入所述静态文本准确率的稳定性特征的准确率稳定性特征,通过以下公式计算所述准确率稳定性特征的特征值:
其中,Fas为用户击键准确率的特征值,Ai为用户第i次击键的准确率, Au为用户击键的平均准确率。
本发明实施例还提供一种基于静态文本击键特征的身份识别系统,包括:待识别用户行为特征提取模块,用于获取待识别用户通过键盘输入预设静态文本的多个第一行为特征;身份识别模块,用于将所述多个第一行为特征与预设的行为特征库对比,根据比对结果识别所述待识别用户所属的身份;通过以下步骤建立所述预设的行为特征库:获取样本用户通过键盘输入预设静态文本的多个第二行为特征;根据所述多个第二行为特征整合生成多个不同的特征变量,各所述特征变量中至少包含一个所述第二行为特征;将所述不同的特征变量分别输入预设的分类模型中,得到所述不同的特征变量对应的识别率,将最高的识别率对应的特征变量作为标识用户身份的行为特征库。
本发明技术方案,具有如下优点:
本发明实施例提供的基于静态文本击键特征的身份识别方法及系统,通过提取样本用户通过键盘输入预设静态文本的行为特征,利用预设分类算法对包含不同所述用户行为特征的特征变量进行训练和筛选,根据筛选结果建立标识身份的行为特征库;然后提取待识别用户输入的行为特征,并所述行为特征库对比,根据比对结果识别所述待识别用户所属的身份。本发明提供的方法提取用户通过键盘输入文本的击键速度、准确率和稳定性的行为特征,并针对提取的击键特征进行筛选,将更能体现用户击键个体差异表征用户身份的行为特征作为行为特征库,使得待识别用户身份的识别率大大得到了提高。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中基于静态文本击键特征的身份识别方法的一个具体实施例的流程图;
图2为本发明实施例中提供建立预设的行为特征库的一个具体示例的流程图;
图3为本发明实施例中提供的反映用户输入静态文本的速度排名的柱状统计图;
图4为本发明实施例中基于静态文本击键特征的身份识别系统的一个具体示例的流程图;
图5为本发明实施例中提供的计算机设备的结构示意图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
实施例1
本发明实施例提供一种基于静态文本击键特征的身份识别方法,如图1 所示,该基于静态文本击键特征的身份识别方法,包括如下步骤:
步骤S1:获取待识别用户通过键盘输入预设静态文本的多个第一行为特征。
步骤S2:将多个第一行为特征与预设的行为特征库对比,根据比对结果识别待识别用户所属的身份。
本发明实施例中,多个第一行为特征与上述预设的行为特征库中标识用户身份的行为特征对应,包括:击键速度、准确率和稳定性等。但是并不限于此,在其他实施例中还可以包括其他行为特征。获知行为特征库中的可以用来识别用户身份的行为特征后,相应的提取待识别用户通过键盘输入行为特征,将获取待识别用户行为特征的特征值与预设行为特征库里的行为特征的特征值做比对,根据比对的结果,确定待识别用户所属的身份。
在一较佳实施例中,如图2所示,通过以下步骤建立预设的行为特征库:
步骤S21:获取样本用户通过键盘输入预设静态文本的多个第二行为特征。
本发明实施例中,根据样本用户在击键时的个体差异性,获取样本用户通过键盘输入预设静态文本的多个第二行为特征,包括:击键速度、准确率和稳定性等。但是并不限于此,在其他实施例中还可以包括其他行为特征。
在一较佳实施例中,上述的击键速度特征可以分为:用以表征用户输入静态文本的速度特征的第一击键速度特征FWPM、用以表征用户输入静态文本进行错误调整的特征的第二击键速度特征FWPM'以及用以表征用户输入静态文本的速度排名特征的第三击键速度特征FWPM”
在一较佳实施例中,通过以下公式(1)计算第一击键速度特征的特征值:
其中,WPM为第一击键速度特征的特征值,T为一次测试的总时间, Nrc为输入正确的字符数。本发明实施例中,设定用户输入的击键速度为每分钟输入正确单词个数,定义每个单词包含5个字符,由于本发明实施例中于预设的静态文本为英文样本,因此WPM表示用户每分钟输入单词的个数。
在一较佳实施例中,通过以下公式(2)计算第二击键速度特征的特征值:
其中,WPM'为第二击键速度特征的特征值,用户输入正确的字符数 Nrc,每个需要a个单位时间,用户输入错误字符数Nec,每个需要b个单位时间,用户改正输入错误字符的数量Net,每个需要c个单位时间,T为一次测试的总时间。
本发明实施例中,假设用户输入正确的字符每个需要1个单位时间,发现错误字符每个需要2个单位时间,改正输入错误字符每个需要2个单位时间。但是并不以此为限,在其他实施例中可以对应设置其他的数值。
在一实施中,当用户输入错误字符数与正确字符数相等时,即当 Nec=Net时,
其中,Ra为精确度,即用户输入错误字符数与正确字符数的比率。
在一较佳实施例中,通过以下公式(3)计算第三击键速度特征的特征值:
其中,WPM”为第三击键速度特征的特征值,WPMi为第一击键速度的特征值除以10的整数部分,WPMr为第一击键速度的特征值除以10的小数值,n为[0-14]之间的整数部分,Hn为击键速度为(10n-5,10n+5]区间的用户数量,HWPMi为数值是WPMi所占的样本用户数量。
在本发明实施例中,如图3所示,WPM”可以用以表示用户输入的文本的击键速度在全网的实际排名(百分制,0%最慢,100%最快),该排名信息能够反映出输入文本的难度特征。图3的横坐标为用户每分钟输入字符的个数WPM,纵坐标为人数分布,总的人数分布概率为1,即通过计算各个击键速度下的柱体面积与总的所用柱体面积的占比表示该击键速度下的人数分布概率。首先通过读取像素的rgb颜色值来捕获图中直方图上所有柱体的坐标:其中,第n个柱体的左上角是(xn1,yn1),右下角坐标是(xn2, yn2),n从左至右,是[0,14]中的一个元素,即击键速度为每分钟输入字符的个数范围为0到140。根据坐标计算柱体的高度,Hn=yn2-yn1+1,第n个柱体对应于WPM的分布是(10*n-5,10*n+5],将WPM除以10的整数部分定义为WPMi,余数部分定义为WPMr。假设第WPMi个柱体中,数据是线性分布的,我们可以根据WPMr和柱体高度HWPMi确定该击键速度在对应柱体的准确位置(即Hwpmi*WPMr/10)。
在一较佳实施例中,上述的准确率特征包括:用以表征用户输入静态文本正确率的特征的准确率特征Fa以及用以表征用户输入静态文本不同错误类型个数的占比特征的错误类型占比特征。
在一较佳实施例中,通过以下公式(4)计算准确率特征的特征值:
其中,Fa为准确率特征的特征值,Nrc为用户输入正确的字符数,Nec 为用户输入错误字符数。
在一较佳实施例中,通过以下公式(5)计算错误类型占比特征的特征值:
其中,Fe为错误类型占比特征的特征值,Nebc为第一错误类型的个数, Nebo为第二错误类型的个数,Neo为第三错误类型的个数。在实际应用中,根据对数据的分析,本发明实施例将其中错误的种类分为以下几种类别:
(1)Bad case:击键错误,比如将“。The”输入成了“。”;
(2)Bad ordering:当输入一串字符时,过早输入某一个字符,例如将“house”输入成“houes”;
(3)Doublet:当敲击一串字符串时,同一个字母敲击两遍,例如将“home”输入成“homee”;
(4)Other:其他类型的敲击错误;
(5)RED:敲击时有明显的错误但却没有修改。
由于实际统计显示,Doublet和Red错误几乎为零,因此,在本发明实施例中,定义Fe为其他三类错误个数占比。因此,上述公式(5)中的Nebc为Bad case的错误个数,Nebo为Badording的错误个数,Neo为Other的错误个数。
在一较佳实施例中,上述的稳定性特征包括:用以表征用户输入静态文本速度的稳定性特征的速度稳定性特征Fσw以及用以表征用户输入静态文本准确率的稳定性特征的准确率稳定性特征Fσa
在一较佳实施例中,通过以下公式(6)计算击键速度稳定性特征的特征值:
其中,Fws为用户击键速度的特征值,即用户输入速度的标准偏差,N 为用户输入字符的个数,Wi为用户第i次击键速度,Wu为用户平均击键速度。
在一较佳实施例中,通过以下公式(7)计算准确率稳定性特征的特征值:
其中,Fas为用户击键准确率的特征值,即用户输入准确率的标准偏差, Ai为用户第i次击键的准确率,Au为用户击键的平均准确率。
步骤S22:根据多个第二行为特征整合生成多个不同的特征变量,各特征变量中至少包含一个第二行为特征。
本发明实施例中,按照预设的顺序分别将上述的第一击键速度特征FWPM、第二击键速度特征FWPM'、第三击键速度特征FWPM”、准确率特征Fa、错误类型占比特征Fe、速度稳定性特征Fσw、准确率稳定性特征Fσa,整合生成多个不同的特征变量。其中,各特征变量中可包含上述多个第二行为特征中的一个或多个。
步骤S23:将不同的特征变量分别输入预设的分类模型中,得到不同的特征变量对应的识别率,将最高的识别率对应的特征变量作为标识用户身份的行为特征库。
本发明实施例中采用的预设的分类模型可为K近邻模型,但是并不限于此,在其他实施中也可以采用其他分类模型,例如是贝叶斯模型,支持向量机模型等。本发明实施例中,样本用户为11位,分别输入预设的8段静态文本,样本总数为88个,80%比例作为训练集,剩余20%比例为测试集。如表 1所示,不同的特征变量,输入到分类模型中,对应得到不同的识别率。
表1
特征变量 识别率
F<sub>WPM</sub>,F<sub>a</sub> 29.5%
F<sub>WPM</sub>,F<sub>a</sub>,F<sub>σw</sub>,F<sub>σa</sub> 88.3%
F<sub>WPM</sub>,F<sub>a</sub>,F<sub>σw</sub>,F<sub>σa</sub>,F<sub>WPM'</sub> 90.2%
F<sub>WPM</sub>,F<sub>a</sub>,F<sub>σw</sub>,F<sub>σa</sub>,F<sub>WPM'</sub>,F<sub>WPM”</sub> 95.2%
F<sub>WPM</sub>,F<sub>a</sub>,F<sub>σw</sub>,F<sub>σa</sub>,F<sub>WPM'</sub>,F<sub>WPM”</sub>,F<sub>e</sub> 95.2%
从上表的训练结果表明,稳定性特征能更准确地反映测试者行为的差异。相反,考虑了表征难易度特征的FWPM’'特征不明显,分析的原因是误差率校正考虑结果了精度和速度的特点,FWPM和Fa的特征密切相关,这与测试者的行为是非常相似的。最终选择FWPM,Fa,Fσw,Fσa,FWPM”和Fe的特征值形成静态文本识别的行为特征库。
本发明实施例提供的基于静态文本击键特征的身份识别方法,通过提取用户通过键盘输入预设静态文本的行为特征,利用预设分类算法对包含不同用户行为特征的特征变量进行训练和筛选,根据筛选结果建立标识身份的行为特征库,提取待识别用户输入的行为特征,并与行为特征库对比,根据比对结果识别待识别用户所属的身份。本发明提供的方法提取用户通过键盘输入文本的击键速度、准确率和稳定性的行为特征,并针对提取的击键特征进行筛选,将更能体现用户击键个体差异表征用户身份的行为特征作为行为特征库,使得待识别用户身份的识别率大大得到了提高。
实施例2
本发明实施例提供一种基于静态文本击键特征的身份识别系统,如图4 所示,该基于静态文本击键特征的身份识别系统包括:
待识别用户行为特征提取模块1,用于获取待识别用户通过键盘输入预设静态文本的多个第一行为特征。此模块具体执行实施例1中步骤S1的方法,在此不再赘述。
身份识别模块2,用于将多个第一行为特征与预设的行为特征库对比,根据比对结果识别待识别用户所属的身份。此模块具体执行实施例1中步骤 S2的方法,在此不再赘述。
本发明实施例中,建立上述预设的行为特征库的方法,参见实施例1 中记录的步骤S21~S23,在此不再赘述。
本发明实施例提供的基于静态文本击键特征的身份识别系统,通过提取用户通过键盘输入预设静态文本的行为特征,利用预设分类算法对包含不同用户行为特征的特征变量进行训练和筛选,根据筛选结果建立标识身份的行为特征库,提取待识别用户输入的行为特征,并与行为特征库对比,根据比对结果识别待识别用户所属的身份。本发明提供的方法提取用户通过键盘输入文本的击键速度、准确率和稳定性的行为特征,并针对提取的击键特征进行筛选,将更能体现用户击键个体差异表征用户身份的行为特征作为行为特征库,使得待识别用户身份的识别率大大得到了提高。
实施例3
本发明实施例提供一种计算机设备,如图5所示,包括:至少一个处理器401,例如CPU(Central Processing Unit,中央处理器),至少一个通信接口403,存储器404,至少一个通信总线402。其中,通信总线402用于实现这些组件之间的连接通信。其中,通信接口403可以包括显示屏 (Display)、键盘(Keyboard),可选通信接口403还可以包括标准的有线接口、无线接口。存储器404可以是高速RAM存储器(Ramdom Access Memory,易挥发性随机存取存储器),也可以是非不稳定的存储器 (non-volatile memory),例如至少一个磁盘存储器。存储器404可选的还可以是至少一个位于远离前述处理器401的存储装置。其中处理器401可以结合图3描述的基于支持向量机的击键特征异常用户识别系统,存储器404 中存储一组程序代码,且处理器401调用存储器404中存储的程序代码,以用于执行基于支持向量机的击键特征异常用户识别方法,即执行实施例1 中提供的基于静态文本击键特征的身份识别方法。
其中,通信总线402可以是外设部件互连标准(peripheral componentinterconnect,简称PCI)总线或扩展工业标准结构(extended industry standardarchitecture,简称EISA)总线等。通信总线402可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器404可以包括易失性存储器(英文:volatile memory),例如随机存取存储器(英文:random-access memory,缩写:RAM);存储器也可以包括非易失性存储器(英文:non-volatile memory),例如快闪存储器(英文:flash memory),硬盘(英文:hard diskdrive,缩写:HDD) 或固态硬盘(英文:solid-state drive,缩写:SSD);存储器404还可以包括上述种类的存储器的组合。
其中,处理器401可以是中央处理器(英文:central processing unit,缩写:CPU),网络处理器(英文:network processor,缩写:NP)或者CPU 和NP的组合。
其中,处理器401还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(英文:application-specific integrated circuit,缩写:ASIC),可编程逻辑器件(英文:programmable logic device,缩写:PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(英文:complex programmable logic device,缩写:CPLD),现场可编程逻辑门阵列(英文:field-programmable gate array,缩写:FPGA),通用阵列逻辑(英文:generic arraylogic,缩写:GAL)或其任意组合。
可选地,存储器404还用于存储程序指令。处理器401可以调用程序指令,实现如本申请实施例1中提供的基于静态文本击键特征的身份识别方法。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的基于静态文本击键特征的身份识别方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(FlashMemory)、硬盘 (Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims (11)

1.一种基于静态文本击键特征的身份识别方法,其特征在于,包括如下步骤:
获取待识别用户通过键盘输入预设静态文本的多个第一行为特征;
将所述多个第一行为特征与预设的行为特征库对比,根据比对结果识别所述待识别用户所属的身份;
通过以下步骤建立所述预设的行为特征库:
获取样本用户通过键盘输入预设静态文本的多个第二行为特征;
根据所述多个第二行为特征整合生成多个不同的特征变量,各所述特征变量中至少包含一个所述第二行为特征;
将所述不同的特征变量分别输入预设的分类模型中,得到所述不同的特征变量对应的识别率,将最高的识别率对应的特征变量作为标识用户身份的行为特征库。
2.根据权利要求1所述的基于静态文本击键特征的身份识别方法,其特征在于,所述第一行为特征和/或第二行为特征为:用以表征用户输入所述静态文本的速度特征的第一击键速度特征,通过以下公式计算所述第一击键速度特征的特征值:
其中,WPM为所述第一击键速度特征的特征值,T为一次测试的总时间,Nrc为输入正确的字符数。
3.根据权利要求1所述的基于静态文本击键特征的身份识别方法,其特征在于,所述第一行为特征和/或第二行为特征为:用以表征用户输入所述静态文本进行错误调整的特征的第二击键速度特征,通过以下公式计算所述第二击键速度特征的特征值:
其中,WPM'为所述第二击键速度特征的特征值,用户输入正确的字符数Nrc,每个需要a个单位时间,用户输入错误字符数Nec需要,每个b个单位时间,用户改正输入错误字符的数量Net,每个需要c个单位时间,T为一次测试的总时间。
4.根据权利要求2所述的基于静态文本击键特征的身份识别方法,其特征在于,所述第一行为特征和/或第二行为特征为:用以表征用户输入所述静态文本的速度排名特征的第三击键速度特征,通过以下公式计算所述第三击键速度特征的特征值:
其中,WPM”为所述第三击键速度特征的特征值,WPMi为所述第一击键速度的特征值除以10的整数部分,WPMr为所述第一击键速度的特征值除以10的小数部分,n为[0-14]之间的整数值,Hn为击键速度为[10n-5,10n+5]区间的用户数量,HWPMi为数值是WPMi所占的所述样本用户数量。
5.根据权利要求1所述的基于静态文本击键特征的身份识别方法,其特征在于,所述第一行为特征和/或第二行为特征为:用以表征用户输入所述静态文本正确率的特征的准确率特征,通过以下公式计算所述准确率特征的特征值:
其中,Fa为所述准确率特征的特征值,Nrc为用户输入正确的字符数,Nec为用户输入错误字符数。
6.根据权利要求1所述的基于静态文本击键特征的身份识别方法,其特征在于,所述第一行为特征和/或第二行为特征为:用以表征用户输入所述静态文本不同错误类型个数的占比特征的错误类型占比特征,通过以下公式计算所述错误类型占比特征的特征值:
其中,Fe为所述错误类型占比特征的特征值,Nebc为第一错误类型的个数,Nebo为第二错误类型的个数,Neo为第三错误类型的个数。
7.根据权利要求1所述的基于静态文本击键特征的身份识别方法,其特征在于,所述第一行为特征和/或第二行为特征为:用以表征用户输入所述静态文本速度的稳定性特征的速度稳定性特征,通过以下公式计算所述击键速度稳定性特征的特征值:
其中,Fws为用户击键速度的特征值,N为用户输入字符的个数,Wi为用户第i次击键速度,Wu为用户平均击键速度。
8.根据权利要求1所述的基于静态文本击键特征的身份识别方法,其特征在于,所述第一行为特征和/或第二行为特征为:用以表征用户输入所述静态文本准确率的稳定性特征的准确率稳定性特征,通过以下公式计算所述准确率稳定性特征的特征值:
其中,Fas为用户击键准确率的特征值,Ai为用户第i次击键的准确率,Au为用户击键的平均准确率。
9.一种基于静态文本击键特征的身份识别系统,其特征在于,包括:
待识别用户行为特征提取模块,用于获取待识别用户通过键盘输入预设静态文本的多个第一行为特征;
身份识别模块,用于将所述多个第一行为特征与预设的行为特征库对比,根据比对结果识别所述待识别用户所属的身份;
通过以下步骤建立所述预设的行为特征库:
获取样本用户通过键盘输入预设静态文本的多个第二行为特征;
根据所述多个第二行为特征整合生成多个不同的特征变量,各所述特征变量中至少包含一个所述第二行为特征;
将所述不同的特征变量分别输入预设的分类模型中,得到所述不同的特征变量对应的识别率,将最高的识别率对应的特征变量作为标识用户身份的行为特征库。
10.一种计算机设备,其特征在于,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行上述权利要求1-8中任一所述的基于静态文本击键特征的身份识别方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行上述权利要求1-8中任一所述的基于静态文本击键特征的身份识别方法。
CN201810763534.8A 2018-07-12 2018-07-12 一种基于静态文本击键特征的身份识别方法及系统 Withdrawn CN109101793A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810763534.8A CN109101793A (zh) 2018-07-12 2018-07-12 一种基于静态文本击键特征的身份识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810763534.8A CN109101793A (zh) 2018-07-12 2018-07-12 一种基于静态文本击键特征的身份识别方法及系统

Publications (1)

Publication Number Publication Date
CN109101793A true CN109101793A (zh) 2018-12-28

Family

ID=64846193

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810763534.8A Withdrawn CN109101793A (zh) 2018-07-12 2018-07-12 一种基于静态文本击键特征的身份识别方法及系统

Country Status (1)

Country Link
CN (1) CN109101793A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111737668A (zh) * 2020-08-18 2020-10-02 广东睿江云计算股份有限公司 一种基于用户输入行为特征的安全认证方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101478401A (zh) * 2009-01-21 2009-07-08 东北大学 一种基于击键特征识别的认证方法及系统
CN105933267A (zh) * 2015-08-21 2016-09-07 中国银联股份有限公司 身份认证方法及装置
CN106570367A (zh) * 2016-11-14 2017-04-19 北京爱知之星科技股份有限公司 基于键盘操作的用户身份识别方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101478401A (zh) * 2009-01-21 2009-07-08 东北大学 一种基于击键特征识别的认证方法及系统
CN105933267A (zh) * 2015-08-21 2016-09-07 中国银联股份有限公司 身份认证方法及装置
CN106570367A (zh) * 2016-11-14 2017-04-19 北京爱知之星科技股份有限公司 基于键盘操作的用户身份识别方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
单鹏飞等: "基于支持向量机的击键特征异常用户识别", 《第26-41页》 *
齐晋: "基于支持向量机的击键辅助认证系统", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111737668A (zh) * 2020-08-18 2020-10-02 广东睿江云计算股份有限公司 一种基于用户输入行为特征的安全认证方法及系统
CN111737668B (zh) * 2020-08-18 2020-12-11 广东睿江云计算股份有限公司 一种基于用户输入行为特征的安全认证方法及系统

Similar Documents

Publication Publication Date Title
US10262233B2 (en) Image processing apparatus, image processing method, program, and storage medium for using learning data
CN111461855B (zh) 基于欠采样的信用卡欺诈检测方法及系统、介质、设备
CN108229130A (zh) 一种验证方法及装置
CN103679160B (zh) 一种人脸识别方法和装置
CN104867225A (zh) 一种纸币的面向识别方法及装置
CN112052813B (zh) 染色体间易位识别方法、装置、电子设备及可读存储介质
CN108959474B (zh) 实体关系提取方法
CN111174370A (zh) 故障检测方法及装置、存储介质、电子装置
CN109242307B (zh) 一种反欺诈策略分析方法、服务器、电子设备及存储介质
CN111625454A (zh) 基于测试用例的数据处理方法及相关设备
CN110348471A (zh) 异常对象识别方法、装置、介质及电子设备
CN111582315A (zh) 样本数据处理方法、装置及电子设备
CN110009012B (zh) 一种风险样本识别方法、装置及电子设备
JP2017068293A (ja) テストdbデータ生成方法及び装置
CN109101793A (zh) 一种基于静态文本击键特征的身份识别方法及系统
JP2014071489A (ja) 採点結果取得方法、プログラム、及び装置
CN113096737A (zh) 一种用于对病原体类型进行自动分析的方法及系统
WO2007132564A1 (ja) データ処理装置及び方法
CN114943674A (zh) 瑕疵检测方法、电子装置及存储介质
CN111863135A (zh) 一种假阳性结构变异过滤方法、存储介质及计算设备
CN110544166A (zh) 样本生成方法、装置及存储介质
CN109145554A (zh) 一种基于支持向量机的击键特征异常用户识别方法及系统
JP2006318013A (ja) 評価装置及びそのコンピュータプログラム
CN115438129A (zh) 结构化数据的分类方法、装置及终端设备
US11244443B2 (en) Examination apparatus, examination method, recording medium storing an examination program, learning apparatus, learning method, and recording medium storing a learning program

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20181228