CN108509790A - 一种基于群体的口令强度评估方法 - Google Patents
一种基于群体的口令强度评估方法 Download PDFInfo
- Publication number
- CN108509790A CN108509790A CN201810207642.7A CN201810207642A CN108509790A CN 108509790 A CN108509790 A CN 108509790A CN 201810207642 A CN201810207642 A CN 201810207642A CN 108509790 A CN108509790 A CN 108509790A
- Authority
- CN
- China
- Prior art keywords
- password
- group
- neural network
- network model
- strength
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000003062 neural network model Methods 0.000 claims abstract description 29
- 238000013528 artificial neural network Methods 0.000 claims abstract description 20
- 238000012549 training Methods 0.000 claims abstract description 19
- 230000000694 effects Effects 0.000 claims abstract description 10
- 230000001537 neural effect Effects 0.000 claims abstract 3
- 230000006835 compression Effects 0.000 claims description 11
- 238000007906 compression Methods 0.000 claims description 11
- 238000004140 cleaning Methods 0.000 claims description 4
- 230000000306 recurrent effect Effects 0.000 claims description 4
- 238000000342 Monte Carlo simulation Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 238000013480 data collection Methods 0.000 claims 3
- 230000015572 biosynthetic process Effects 0.000 claims 1
- 238000003786 synthesis reaction Methods 0.000 claims 1
- 238000002360 preparation method Methods 0.000 abstract description 5
- 238000011156 evaluation Methods 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 8
- 238000007781 pre-processing Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/45—Structures or tools for the administration of authentication
- G06F21/46—Structures or tools for the administration of authentication by designing passwords or checking the strength of passwords
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于群体的口令强度评估方法,包括口令评估准备、神经网络训练、和群体口令强度评估步骤。其中,口令评估准备步骤:确定群体属性特征,根据属性特征构建群体集合,收集口令集,对口令集数据进行清洗,完成口令集数据预处理;神经网络训练步骤:确定神经网络模型,集合预处理结果训练神经网络;群体口令强度评估步骤:通过向训练好神经网络中输入口令,评估口令在已训练群体中的强度。本发明利用神经网络对口令在群体中强度进行评估,将神经网络压缩后可达到即插即用的效果,及时反馈口令强度,一定程度消除群体的弱口令,增强了口令抵抗口令猜测攻击的能力,提高了口令的安全性。
Description
技术领域
本发明属于信息安全技术领域,特别涉及一种基于群体的口令强度评估方法。
背景技术
随着互联网技术不断发展,生活环境信息化、数字化不断推进,网络技术已经渗透到人们的生活方方面面。由于网络安全问题的频发,导致人们增强对网络环境安全情况重视,身份认证技术已经成为保护用户个人信息安全最基本也是最重要手段。在身份认证技术中,由于文本口令其易部署性、低成本性及实现方式简单性,文本口令在短时间甚至更远的将来都仍作为身份认证技术的重要手段。但是用户为了便于记忆,用户使用的口令大多具有关联性,导致口令强度降低,从而导致口令容易遭受猜测攻击。为了提高用户口令的安全强度,一般互联网服务商都会强行执行口令强度评测(Password Strength Metirc,简称PSM)向用户反馈用户口令的强弱程度,并根据评测结果向用户提出构建高强度口令建议。但是目前各个互联网服务商并未统一口令评估方法,导致相同口令在不同环境下得出不同的反馈结果,从而给用户带来困惑,导致用户口令有安全隐患。
由于便记忆性,用户的口令并非是完全随机或者是毫无意义的,通常会采用生日、姓名等有意义的字符,从而降低了口令安全性。此外,通过研究发现,不同群体用户可能由于其职业、地区、姓名等潜在属性,常常会选择具有群体特征的字符作为口令,从而存在潜在的口令安全问题。在信息量爆炸的时代,大数据与人工智能技术的飞速发展,在短时间内从大规划数据中查找潜在关联已经变得比较容易。
发明内容
本发明的目的在于弥补现有口令强度评估技术的不足,将神经网络技术与口令强度评估相结合,提供一种基于群体的口令强度评估方法,在继承了传统口令强度评估方法的效率性和鲁棒性的同时,一定程度消除已训练群体的弱口令,增强了口令抵抗口令猜测攻击的能力,提高了口令的安全性。
实现本发明目的的具体技术方案是:
一种基于群体的口令强度评估方法,该方法包括以下具体步骤:
步骤1:口令评估准备
确定群体属性特征,根据群体属性特征确定群体集合成员,构建群体集合,收集群体集合成员口令集并对口令集数据进行清洗,完成口令数据集预处理;
步骤2:神经网络训练
确定神经网络模型,结合预处理后口令数据集训练神经网络模型;
步骤3:群体口令强度评估
对训练好的神经网络模型进行压缩,对口令在群体集合环境下进行强度评估,并及时反馈口令强度。
本发明步骤1中,所述群体为具有相同属性特征的一类人;
所述属性特征包括但不限于职业、地区或性别。
本发明所述步骤1具体为:
步骤A1:确定群体属性特征;
步骤A2:根据属性特征确定群体成员,构建群体集合;
步骤A3:根据集合成员收集群体口令集;
步骤A4:对收集到的口令集数据进行清洗;
步骤A5:对清洗过后的口令数据集进行预处理;其中:
所述口令集数据清洗包括但不限于对非法字符无效口令进行剔除;
所述口令数据集预处理方法包括但不限于对口令集数据进行one-hot编码。
本发明所述步骤2具体为:
步骤B1:确定神经网络模型;
步骤B2:训练神经网络模型;
步骤B3:通过试验效果对神经网络模型进行参数调整,进行再次训练,直到效果好为止;其中:
所述神经网络模型包括但不限于循环神经网络模型(Recurrent Neural Networks,RNN)及注意力机制(Attention);
所述调整的参数包括但不限于神经网络学习率、步长、训练轮数。
本发明所述步骤3具体为:
步骤C1:对训练效果好的神经网络模型进行模型压缩;
步骤C2:将口令在已训练群体环境中进行口令强度计算及评估;
步骤C3:反馈口令强度;其中:
所述模型压缩方法包括但不限于:轻量化压缩、有损压缩或ZigZag编码;
所述口令强度计算及评估包括但不限于:在已训练群体环境情况中,利用神经网络学习到的口令概率分布,结合蒙特卡洛仿真抽样方法,计算出口令被成功猜测出所需猜测次数,通过将猜测次数与预先设置的强度阈值进行比较,从而得出该口令在已训练群体中强度。
本发明在继承了传统口令强度评估方法的效率性和鲁棒性的同时,一定程度消除已训练群体的弱口令,增强了口令抵抗口令猜测攻击的能力,提高了口令的安全性,保障了用户的信息安全及财产安全。同时,本发明将训练好的神经网络进行压缩,达到了即插即用的效果,能够快速反馈口令强度,帮助用户构建强度较高的口令。此外,本发明利用机器学习方法从海量真实口令数据中找出不同群体使用口令的内在联系,提高强度评估结果的准确性和真实性。
附图说明
图1是本发明的流程图;
图2是网络模型图。
具体实施方式
结合以下具体实施例和附图,对本发明作进一步的详细说明。实施本发明的过程、条件、实验方法等,除以下专门提及的内容之外,均为本领域的普遍知识和公知常识,本发明没有特别限制内容。
本发明中有关的技术术语代表的含义如下:
RNN-循环神经网络(Recurrent neural networks)
LSTM-长短期记忆网络(Long Short-Term Memory)
Attention-注意力机制
群体属性特征:A
以属性A作为群体分类的表示:S = {s1, s2 … sn | A}
口令集:P(S) = {P(s1), P(s2) … P(sn)}
Lr-学习效率(learning rate)
Step-步长
Ep-训练轮数
Count-猜测次数
M-神经网络模型
如图1所示,本发明一种基于群体的口令强度评估方法包括如下三个步骤:
步骤1:口令评估准备:确定群体属性特征A,根据群体属性特征确定群体集合成员s,构建群体集合S,收集群体集合成员口令集P(S)并对口令集数据进行清洗,完成口令数据集预处理;
步骤2:神经网络训练:确定神经网络模型M,结合预处理后口令数据集训练神经网络模型;
步骤3:群体口令强度评估:对训练好的神经网络模型进行压缩,对口令在群体集合环境下进行强度评估,并及时反馈口令强度。
其中,步骤1中群体S为具有相同属性特征的一类人;
属性特征A包括但不限于职业、地区或性别。
其中,步骤1:口令评估准备具体步骤如下:
A1、确定群体属性特征A;
A2、根据属性特征A确定群体成员s,构建群体集合S;
A3、根据评估范围收集群体相关口令集P(S);
A4、对收集到的口令集数据进行清洗;
A5、对清洗过后的口令数据集进行预处理。
其中,步骤A4中对口令集数据P(S)进行清洗的方法包括但不限于对非法字符无效口令进行剔除;
口令数据集预处理方法包括但不限于对口令集数据进行one-hot编码;
其中,步骤2:神经网络训练具体步骤如下:
B1、确定神经网络模型M,如图2所示,将口令数据集预处理送入1一个LSTM进行训练,再将LSTM输出到一个Attention,经过Attentoin计算过后将输出输入另外一个LSTM重复下去,图2模型中共有3层LSTM,2个Attention作为训练编码口令集,2层LSTM作为解码输出口令;
B2、训练神经网络模型;
B3、通过试验效果对神经网络模型进行参数调整,进行再次训练,直到效果较好为止。
其中,神经网络训练阶段步骤B1神经网络模型包括但不限于RNN,LSTM及Attention;步骤B3中参数包括但不限于神经网络学习率lr,步长step和训练轮数ep。
其中,步骤3:群体口令强度评估具体步骤如下:
C1、对训练效果好的神经网络模型M进行模型压缩;
C2、将口令在已训练的群体环境中进行口令强度计算及评估;
C3、反馈口令强度;其中:
步骤C1中神经网络模型压缩的方法包括但不限于:轻量化压缩、有损压缩或ZigZag编码;
其中,口令强度计算及评估方法包括但不限于:在已训练的群体环境中,利用神经网络学习到的口令概率分布,结合蒙特卡洛仿真抽样方法,计算出该户口令被猜测出所需猜测次数count,通过将猜测次数与预先设置的强度阈值{1e3, 1e6, 1e9, 1e12}进行比较,从而得出该口令在已训练群体中强度。
通过向用户反馈口令在已训练群体中口令强度,帮助用户构建强度较高口令,在一定程度上消除了属于该群体中的弱口令,同时也提高了用户口令防止猜测攻击的能力,提高了口令的安全性,保障了用户的信息安全及财产安全。同时,将训练好的神经网络进行压缩,达到了即插即用的效果,能够快速反馈口令强度,帮助用户构建强度较高的口令。此外,利用机器学习方法从海量真实口令数据中找出不同群体使用口令的内在联系,提高强度评估结果的准确性和真实性。
本发明的保护内容不局限于以上实施例。在不背离发明构思的精神和范围下,本领域技术人员能够想到的变化和优点都被包括在本发明中,并且以所附的权利要求书为保护范围。
Claims (5)
1.一种基于群体的口令强度评估方法,其特征在于,该方法包括以下具体步骤:
步骤1:口令评估准备
确定群体属性特征,根据群体属性特征确定群体集合成员,构建群体集合,收集群体集合成员口令集并对口令集数据进行清洗,完成口令数据集预处理;
步骤2:神经网络训练
确定神经网络模型,结合预处理后口令数据集训练神经网络模型;
步骤3:群体口令强度评估
对训练好的神经网络模型进行压缩,对口令在群体集合环境下进行强度评估,并及时反馈口令强度。
2.根据权利要求1所述的口令强度评估方法,其特征在于,步骤1中,所述群体为具有相同属性特征的一类人;
所述属性特征包括但不限于职业、地区或性别。
3.根据权利要求1所述的口令强度评估方法,其特征在于,所述步骤1具体为:
步骤A1:确定群体属性特征;
步骤A2:根据属性特征确定群体成员,构建群体集合;
步骤A3:根据集合成员收集群体口令集;
步骤A4:对收集到的口令集数据进行清洗;
步骤A5:对清洗过后的口令数据集进行预处理;其中:
所述口令集数据清洗包括但不限于对非法字符无效口令进行剔除;
所述口令数据集预处理包括但不限于对口令集数据进行one-hot编码。
4.根据权利要求1所述的口令强度评估方法,其特征在于,所述步骤2具体为:
步骤B1:确定神经网络模型;
步骤B2:训练神经网络模型;
步骤B3:通过试验效果对神经网络模型进行参数调整,进行再次训练,直到效果好为止;其中:
所述神经网络模型包括但不限于循环神经网络模型及注意力机制;
所述调整的参数包括但不限于神经网络学习率、步长和训练轮数。
5.根据权利要求1所述的口令强度评估方法,其特征在于,所述步骤3具体为:
步骤C1:对训练效果好的神经网络模型进行模型压缩;
步骤C2:将口令在已训练群体环境中进行口令强度计算及评估;
步骤C3:反馈口令强度;其中:
所述模型压缩包括但不限于:轻量化压缩、有损压缩或ZigZag编码;
所述口令强度计算及评估包括但不限于:在已训练群体环境情况中,利用神经网络学习到的口令概率分布,结合蒙特卡洛仿真抽样方法,计算出口令被成功猜测出所需猜测次数,通过将猜测次数与预先设置的强度阈值进行比较,从而得出该口令在已训练群体中强度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810207642.7A CN108509790A (zh) | 2018-03-14 | 2018-03-14 | 一种基于群体的口令强度评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810207642.7A CN108509790A (zh) | 2018-03-14 | 2018-03-14 | 一种基于群体的口令强度评估方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108509790A true CN108509790A (zh) | 2018-09-07 |
Family
ID=63376523
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810207642.7A Pending CN108509790A (zh) | 2018-03-14 | 2018-03-14 | 一种基于群体的口令强度评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108509790A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492385A (zh) * | 2018-11-05 | 2019-03-19 | 桂林电子科技大学 | 一种基于深度学习的密码生成方法 |
CN109635530A (zh) * | 2018-11-16 | 2019-04-16 | 华东师范大学 | 一种基于用户群组属性的智能口令猜测方法 |
CN109885829A (zh) * | 2019-01-24 | 2019-06-14 | 北京大学 | 一种基于词的口令强度评价方法 |
CN110162961A (zh) * | 2019-05-13 | 2019-08-23 | 华东师范大学 | 基于集成学习的群体口令强度评价方法 |
CN111353147A (zh) * | 2020-03-11 | 2020-06-30 | 鹏城实验室 | 口令强度评估方法、装置、设备及可读存储介质 |
WO2020206909A1 (zh) * | 2019-04-08 | 2020-10-15 | 平安科技(深圳)有限公司 | 口令强度计算方法、装置及计算机可读存储介质 |
CN112000948A (zh) * | 2020-09-27 | 2020-11-27 | 鹏城实验室 | 基于序列生成对抗神经网络的口令强度评估方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104573142A (zh) * | 2013-10-10 | 2015-04-29 | 无锡市思库瑞科技信息有限公司 | 基于神经网络的口令属性分析方法 |
CN106934275A (zh) * | 2017-01-22 | 2017-07-07 | 华东师范大学 | 一种基于个人信息的口令强度评测方法 |
-
2018
- 2018-03-14 CN CN201810207642.7A patent/CN108509790A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104573142A (zh) * | 2013-10-10 | 2015-04-29 | 无锡市思库瑞科技信息有限公司 | 基于神经网络的口令属性分析方法 |
CN106934275A (zh) * | 2017-01-22 | 2017-07-07 | 华东师范大学 | 一种基于个人信息的口令强度评测方法 |
Non-Patent Citations (1)
Title |
---|
陈锐浩等: "基于神经网络的口令属性分析方法", 《微型电脑应用》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492385A (zh) * | 2018-11-05 | 2019-03-19 | 桂林电子科技大学 | 一种基于深度学习的密码生成方法 |
CN109635530A (zh) * | 2018-11-16 | 2019-04-16 | 华东师范大学 | 一种基于用户群组属性的智能口令猜测方法 |
CN109885829A (zh) * | 2019-01-24 | 2019-06-14 | 北京大学 | 一种基于词的口令强度评价方法 |
CN109885829B (zh) * | 2019-01-24 | 2020-11-03 | 北京大学 | 一种基于词的口令强度评价方法 |
WO2020206909A1 (zh) * | 2019-04-08 | 2020-10-15 | 平安科技(深圳)有限公司 | 口令强度计算方法、装置及计算机可读存储介质 |
CN110162961A (zh) * | 2019-05-13 | 2019-08-23 | 华东师范大学 | 基于集成学习的群体口令强度评价方法 |
CN111353147A (zh) * | 2020-03-11 | 2020-06-30 | 鹏城实验室 | 口令强度评估方法、装置、设备及可读存储介质 |
CN111353147B (zh) * | 2020-03-11 | 2023-03-03 | 鹏城实验室 | 口令强度评估方法、装置、设备及可读存储介质 |
CN112000948A (zh) * | 2020-09-27 | 2020-11-27 | 鹏城实验室 | 基于序列生成对抗神经网络的口令强度评估方法 |
CN112000948B (zh) * | 2020-09-27 | 2024-07-12 | 鹏城实验室 | 基于序列生成对抗神经网络的口令强度评估方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108509790A (zh) | 一种基于群体的口令强度评估方法 | |
Wei et al. | Assessing the brittleness of safety alignment via pruning and low-rank modifications | |
CN110647765A (zh) | 协同学习框架下基于知识迁移的隐私保护方法及系统 | |
CN101478534B (zh) | 一种基于人工免疫原理的网络异常检测方法 | |
CN111966998B (zh) | 基于变分自动编码器的口令生成方法、系统、介质和设备 | |
CN106453416A (zh) | 一种基于深信度网络的分布式攻击入侵的检测方法 | |
CN113378160A (zh) | 一种基于生成式对抗网络的图神经网络模型防御方法及装置 | |
CN110362674A (zh) | 一种基于卷积神经网络的微博新闻摘要抽取式生成方法 | |
CN109784997B (zh) | 一种基于大数据的短视频活跃用户预测方法 | |
Zhou et al. | ICRC-HIT: A deep learning based comment sequence labeling system for answer selection challenge | |
CN106126700A (zh) | 一种微博谣言传播的分析方法 | |
CN111401447A (zh) | 一种基于人工智能的流量作弊识别方法、装置、电子设备 | |
CN101908055B (zh) | 一种信息过滤系统 | |
CN108897732A (zh) | 语句类型识别方法和装置、存储介质及电子装置 | |
CN110135558A (zh) | 基于可变强度组合测试的深度神经网络测试充分性方法 | |
CN104156447A (zh) | 一种智能社交平台广告预警及处理方法 | |
CN113190846A (zh) | 一种基于生成对抗网络模型的恶意域名训练数据生成方法 | |
CN115309813A (zh) | 基于用户语义、属性和邻域信息的社交机器人检测算法 | |
CN104143165A (zh) | 面向抑郁情绪的心理干预方案个性化推荐方法 | |
CN106126607A (zh) | 一种面向社交网络的用户关系分析方法 | |
CN107481135A (zh) | 一种基于bp神经网络的个人信用评价方法及系统 | |
CN114021738A (zh) | 一种基于分布式生成对抗模型的联邦学习方法 | |
Qianzi et al. | Research on the Perception of Cultural Ecosystem Services in Urban Parks via Analyses of Online Comment Data. | |
CN111865947B (zh) | 一种基于迁移学习的电力终端异常数据生成方法 | |
CN110046576A (zh) | 一种训练识别面部表情的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20180907 |