CN117056902A - 物联网密码管理方法及系统 - Google Patents
物联网密码管理方法及系统 Download PDFInfo
- Publication number
- CN117056902A CN117056902A CN202311262939.0A CN202311262939A CN117056902A CN 117056902 A CN117056902 A CN 117056902A CN 202311262939 A CN202311262939 A CN 202311262939A CN 117056902 A CN117056902 A CN 117056902A
- Authority
- CN
- China
- Prior art keywords
- password
- semantic
- historical
- association
- semantic association
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007726 management method Methods 0.000 title claims abstract description 44
- 239000013598 vector Substances 0.000 claims abstract description 115
- 238000012098 association analyses Methods 0.000 claims abstract description 17
- 238000013507 mapping Methods 0.000 claims abstract description 15
- 239000011159 matrix material Substances 0.000 claims description 55
- 238000000034 method Methods 0.000 claims description 23
- 238000013527 convolutional neural network Methods 0.000 claims description 13
- 238000013528 artificial neural network Methods 0.000 claims description 11
- 238000003062 neural network model Methods 0.000 claims description 11
- 238000005457 optimization Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims description 2
- 230000006855 networking Effects 0.000 claims 1
- 230000008569 process Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000009826 distribution Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000013136 deep learning model Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000000547 structure data Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000005336 cracking Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/45—Structures or tools for the administration of authentication
- G06F21/46—Structures or tools for the administration of authentication by designing passwords or checking the strength of passwords
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
公开了一种物联网密码管理方法及系统。其首先获取用户输入的待检测密码数据,以及,所述用户使用过的历史密码数据库,接着,分别对所述历史密码数据库中的各个历史密码数据进行语义编码以得到多个历史密码语义编码特征向量,然后,对所述多个历史密码语义编码特征向量进行语义关联分析以得到历史密码语义关联拓扑特征,接着,对所述用户输入的待检测密码数据进行语义编码以得到输入密码语义理解特征,然后,将所述输入密码语义理解特征映射到所述历史密码语义关联拓扑特征的高维空间中以得到密码语义关联特征,最后,基于所述密码语义关联特征,确定待检测密码数据的语义重复度是否超过预定阈值并生成预警提示。这样,可以提高密码安全性。
Description
技术领域
本申请涉及密码管理领域,且更为具体地,涉及一种物联网密码管理方法及系统。
背景技术
物联网(Internet of Things,IoT)是指通过互联网连接和通信的各种物理设备、传感器、车辆、家电等智能化设备,这些设备可以收集和交换数据,并通过云计算和自动化控制系统进行远程监控和管理。随着物联网的快速发展,越来越多的设备和系统被连接到互联网上,密码管理成为一个重要的安全问题。
在物联网中,设备和系统通常需要使用密码来进行身份验证和数据保护。然而,由于用户数量众多且密码复杂度要求不同,很多用户倾向于使用简单而易于记忆的密码,如常见的字典词汇、生日日期等容易猜测的信息,又或者在多个平台上重复使用相同的密码,这使得密码更容易被破解,给密码安全带来了风险。并且,在传统密码管理系统中,用户往往长时间使用相同的密码,不定期更换密码,这意味着如果密码泄露,攻击者将有更多时间和机会利用密码进行未授权访问。因此,一些物联网密码管理系统要求用户定期更换密码,但是用户为了便于记忆,常常会使用过去使用过的密码来进行设定,这将会导致新设定的密码安全性较低,容易受到攻击,造成用户的损失。
因此,期望一种优化的物联网密码管理方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种物联网密码管理方法及系统。其可以检测用户输入的密码和历史密码之间的语义重复度,从而判断用户输入的密码是否过于简单以及与历史密码的语义重复度是否过高,以帮助用户识别和避免使用易受攻击的密码,提高整体的密码安全性以及物联网系统的安全性。
根据本申请的一个方面,提供了一种物联网密码管理方法,其包括:
获取用户输入的待检测密码数据,以及,所述用户使用过的历史密码数据库;
分别对所述历史密码数据库中的各个历史密码数据进行语义编码以得到多个历史密码语义编码特征向量;
对所述多个历史密码语义编码特征向量进行语义关联分析以得到历史密码语义关联拓扑特征;
对所述用户输入的待检测密码数据进行语义编码以得到输入密码语义理解特征;
将所述输入密码语义理解特征映射到所述历史密码语义关联拓扑特征的高维空间中以得到密码语义关联特征;以及
基于所述密码语义关联特征,确定待检测密码数据的语义重复度是否超过预定阈值并生成预警提示。
根据本申请的另一个方面,提供了一种物联网密码管理系统,其包括:
数据获取模块,用于获取用户输入的待检测密码数据,以及,所述用户使用过的历史密码数据库;
历史数据语义编码模块,用于分别对所述历史密码数据库中的各个历史密码数据进行语义编码以得到多个历史密码语义编码特征向量;
语义关联分析模块,用于对所述多个历史密码语义编码特征向量进行语义关联分析以得到历史密码语义关联拓扑特征;
输入数据语义编码模块,用于对所述用户输入的待检测密码数据进行语义编码以得到输入密码语义理解特征;
映射模块,用于将所述输入密码语义理解特征映射到所述历史密码语义关联拓扑特征的高维空间中以得到密码语义关联特征;以及
预警提示模块,用于基于所述密码语义关联特征,确定待检测密码数据的语义重复度是否超过预定阈值并生成预警提示。
与现有技术相比,本申请提供的物联网密码管理方法及系统,其首先获取用户输入的待检测密码数据,以及,所述用户使用过的历史密码数据库,接着,分别对所述历史密码数据库中的各个历史密码数据进行语义编码以得到多个历史密码语义编码特征向量,然后,对所述多个历史密码语义编码特征向量进行语义关联分析以得到历史密码语义关联拓扑特征,接着,对所述用户输入的待检测密码数据进行语义编码以得到输入密码语义理解特征,然后,将所述输入密码语义理解特征映射到所述历史密码语义关联拓扑特征的高维空间中以得到密码语义关联特征,最后,基于所述密码语义关联特征,确定待检测密码数据的语义重复度是否超过预定阈值并生成预警提示。这样,可以提高密码安全性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,以下附图并未刻意按实际尺寸等比例缩放绘制,重点在于示出本申请的主旨。
图1为根据本申请实施例的物联网密码管理方法的流程图。
图2为根据本申请实施例的物联网密码管理方法的架构示意图。
图3为根据本申请实施例的物联网密码管理方法的子步骤S130的流程图。
图4为根据本申请实施例的物联网密码管理方法的子步骤S160的流程图。
图5为根据本申请实施例的物联网密码管理系统的框图。
图6为根据本申请实施例的物联网密码管理方法的应用场景图。
具体实施方式
下面将结合附图对本申请实施例中的技术方案进行清楚、完整地描述,显而易见地,所描述的实施例仅仅是本申请的部分实施例,而不是全部的实施例。基于本申请实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,也属于本申请保护的范围。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其他的步骤或元素。
虽然本申请对根据本申请的实施例的系统中的某些模块做出了各种引用,然而,任何数量的不同模块可以被使用并运行在用户终端和/或服务器上。所述模块仅是说明性的,并且所述系统和方法的不同方面可以使用不同模块。
本申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是,前面或下面操作不一定按照顺序来精确地执行。相反,根据需要,可以按照倒序或同时处理各种步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
针对上述技术问题,本申请的技术构思为通过采集用户输入的密码数据,并在后端引入数据处理和分析算法对于该用户输入的密码数据和历史使用过的密码数据进行语义关联分析,以此来检测用户输入的密码和历史密码之间的语义重复度,从而判断用户输入的密码是否过于简单以及与历史密码的语义重复度是否过高,以帮助用户识别和避免使用易受攻击的密码,提高整体的密码安全性以及物联网系统的安全性。
图1为根据本申请实施例的物联网密码管理方法的流程图。图2为根据本申请实施例的物联网密码管理方法的架构示意图。如图1和图2所示,根据本申请实施例的物联网密码管理方法,包括步骤:S110,获取用户输入的待检测密码数据,以及,所述用户使用过的历史密码数据库;S120,分别对所述历史密码数据库中的各个历史密码数据进行语义编码以得到多个历史密码语义编码特征向量;S130,对所述多个历史密码语义编码特征向量进行语义关联分析以得到历史密码语义关联拓扑特征;S140,对所述用户输入的待检测密码数据进行语义编码以得到输入密码语义理解特征;S150,将所述输入密码语义理解特征映射到所述历史密码语义关联拓扑特征的高维空间中以得到密码语义关联特征;以及,S160,基于所述密码语义关联特征,确定待检测密码数据的语义重复度是否超过预定阈值并生成预警提示。
具体地,在本申请的技术方案中,首先,获取用户输入的待检测密码数据,以及,所述用户使用过的历史密码数据库。接着,考虑到所述历史密码数据库中的各个历史密码数据都具有着密码语义特征,为了能够对所述各个历史密码数据进行语义关联分析以此来比较历史密码之间的隐藏语义相似性和重复性,从而检测用户是否存在使用相似或重复密码的行为,以便提醒用户避免使用易受攻击的密码,在本申请的技术方案中,需要进一步分别对所述历史密码数据库中的各个历史密码数据进行语义编码以得到多个历史密码语义编码特征向量。特别地,在本申请的一个具体示例中,可以将所述历史密码数据库中的各个历史密码数据通过包含嵌入层的上下文语义编码器中进行语义编码,以此来提取出所述各个历史密码数据的上下文语义特征信息。
然后,为了度量所述各个历史密码数据之间的语义关联程度,以此来更准确地对所述待检测密码数据的语义重复度进行检测评估,在本申请的技术方案中,进一步计算所述多个历史密码语义编码特征向量中任意两个历史密码语义编码特征向量之间的交叉熵以得到历史密码语义关联拓扑矩阵。应可以理解,所述历史密码语义关联拓扑矩阵可以表示所述各个历史密码数据之间的语义关联程度,其中,矩阵中的每个元素代表了两个历史密码之间的关联程度,可以用于判断历史密码是否存在相似性或重复使用的情况。具体来说,较高的交叉熵值表示密码之间的差异性较大,而较低的交叉熵值则表示密码之间的相似性较高。
继而,再将所述历史密码语义关联拓扑矩阵通过基于卷积神经网络模型的拓扑特征提取器中进行特征挖掘,以提取出所述各个历史密码数据之间的语义拓扑关联特征信息,从而得到历史密码语义关联拓扑特征矩阵。
进而,以所述各个历史密码语义编码特征向量作为节点的特征表示,而以所述历史密码语义关联拓扑特征矩阵作为节点与节点之间的边的特征表示,将由所述多个历史密码语义编码特征向量经二维排列得到的历史密码全局语义编码特征矩阵和所述历史密码语义关联拓扑特征矩阵通过图神经网络模型以得到语义关联拓扑历史密码语义编码特征矩阵。具体地,所述图神经网络模型通过可学习的神经网络参数对所述历史密码全局语义编码特征矩阵和所述历史密码语义关联拓扑特征矩阵进行图结构数据编码以得到包含不规则的所述各个历史密码数据之间的语义拓扑关联特征和所述各个历史密码数据的语义特征信息的所述语义关联拓扑历史密码语义编码特征矩阵。
进一步地,对于所述用户输入的待检测密码数据,也需要对其进行语义理解,以便于后续探究其与所述历史密码数据之间的语义关联程度。因此,在本申请的技术方案中,进一步将所述用户输入的待检测密码数据通过包含词嵌入模型和BiLSTM模型的密码语义理解器中进行编码,以提取出所述用户输入的待检测密码数据的上下文语义关联特征信息,从而得到输入密码语义理解特征向量。
接着,再将所述语义关联拓扑历史密码语义编码特征矩阵与所述输入密码语义理解特征向量进行矩阵相乘,以此来将所述用户输入的待检测密码数据的语义理解特征映射到所述各个历史密码数据的全局语义关联特征的高维空间中,从而得到密码语义关联向量。这样,所述密码语义关联向量反映了输入密码与历史密码之间的语义关联程度,以便于检测用户输入的密码和历史密码之间的语义重复度,从而判断用户输入的密码是否过于简单以及与历史密码的语义重复度是否过高。
相应地,如图3所示,对所述多个历史密码语义编码特征向量进行语义关联分析以得到历史密码语义关联拓扑特征,包括:S131,计算所述多个历史密码语义编码特征向量中任意两个历史密码语义编码特征向量之间的交叉熵以得到历史密码语义关联拓扑矩阵;S132,将所述历史密码语义关联拓扑矩阵通过基于卷积神经网络模型的拓扑特征提取器以得到历史密码语义关联拓扑特征矩阵;以及,S133,将所述多个历史密码语义编码特征向量和所述历史密码语义关联拓扑特征矩阵通过图神经网络模型以得到语义关联拓扑历史密码语义编码特征矩阵作为所述历史密码语义关联拓扑特征。应可以理解,在步骤S131中,交叉熵是一种用于衡量两个概率分布之间差异的指标,在这里,将历史密码语义编码特征向量看作概率分布,通过计算它们之间的交叉熵,可以获取它们之间的关联程度,历史密码语义关联拓扑矩阵记录了每对历史密码语义编码特征向量之间的关联程度。在步骤S132中,通过基于卷积神经网络模型的拓扑特征提取器,将历史密码语义关联拓扑矩阵转化为历史密码语义关联拓扑特征矩阵,这一步骤使用卷积神经网络模型来提取拓扑特征,将历史密码语义关联拓扑矩阵中的关联信息转化为更有意义的特征表示,这样可以减少数据维度,并且提取出更有价值的特征。在步骤S133中,通过图神经网络模型,将历史密码语义编码特征向量和历史密码语义关联拓扑特征矩阵结合起来,得到语义关联拓扑历史密码语义编码特征矩阵。图神经网络是一种适用于图结构数据的神经网络模型,它能够有效地处理节点之间的关系和连接。在这里,将历史密码语义编码特征向量和历史密码语义关联拓扑特征矩阵作为图的节点和边的特征,通过图神经网络模型学习它们之间的关联关系,得到更加全面和综合的历史密码语义关联拓扑特征。综合来看,这三个步骤的目的是从历史密码语义编码特征向量中提取出更有意义和全面的语义关联拓扑特征,以用于密码相关的任务或分析中。这些特征可以帮助理解密码之间的关联程度,提取有用的信息,并支持密码安全和密码学研究领域的应用。
值得一提的是,卷积神经网络(Convolutional Neural Network,CNN)是一种深度学习模型,特别适用于处理具有网格结构的数据。卷积神经网络的主要特点是它的层级结构和权值共享机制。它由多个卷积层、池化层和全连接层组成。其中,卷积层通过卷积操作提取输入数据的特征,池化层通过降采样操作减少数据的维度,全连接层将提取到的特征映射到最终的输出。卷积神经网络的优势在于它能够自动学习数据中的特征,并且对于平移、缩放和旋转等变换具有一定的不变性。它通过局部感知野和权值共享的机制,能够有效地处理大规模数据,并且在训练过程中具有一定的参数共享,减少了需要学习的参数数量,提高了模型的训练效率。总而言之,卷积神经网络是一种强大的深度学习模型,能够自动学习数据中的特征,并且在处理具有网格结构的数据时表现出色。
图神经网络(Graph Neural Network,GNN)是一种深度学习模型,专门用于处理图结构数据。与传统的神经网络模型适用于处理向量或矩阵形式的数据不同,图神经网络能够有效地捕捉图中节点之间的关系和连接。图神经网络的主要特点是它能够通过消息传递和聚合的方式对节点和边进行表示学习。它通过迭代地更新节点的表示,将节点的邻居信息融入到节点的表示中,从而获取全局的图结构信息。这使得图神经网络能够处理不同大小和结构的图,并且具有一定的推理和泛化能力。图神经网络可以用于节点分类、链接预测、图生成、图聚类等任务,通过学习图的结构和关系,图神经网络可以提取有关图的全局特征和局部特征,从而帮助理解和分析复杂的图数据,为图数据相关问题提供有效的解决方案。
相应地,在步骤S140中,对所述用户输入的待检测密码数据进行语义编码以得到输入密码语义理解特征,包括:将所述用户输入的待检测密码数据通过包含词嵌入模型和BiLSTM模型的密码语义理解器以得到输入密码语义理解特征向量作为所述输入密码语义理解特征。值得一提的是,词嵌入模型和BiLSTM模型是密码语义理解器中常用的两种模型,用于将输入的密码数据转化为语义理解特征向量。词嵌入模型是一种用于将离散的密码数据(如密码中的字符或单词)映射到连续的向量空间的模型。它能够捕捉密码数据之间的语义关系和相似性,并将它们表示为密集的向量。常用的词嵌入模型包括Word2Vec、GloVe和FastText等。通过使用词嵌入模型,可以将密码数据转化为具有语义信息的向量表示,从而更好地表达密码的含义和特征。BiLSTM模型是一种双向长短期记忆网络(BidirectionalLong Short-Term Memory Network),用于处理序列数据。它由前向和后向两个LSTM网络组成,分别从序列的两个方向进行处理,并将它们的输出进行拼接或合并。BiLSTM模型能够捕捉序列数据中的上下文信息,并且在处理密码数据时能够考虑密码中字符的顺序和依赖关系。通过使用BiLSTM模型,可以将密码数据转化为具有序列信息的特征表示,更好地捕捉密码中的语义和结构。在密码语义理解器中,词嵌入模型和BiLSTM模型通常结合使用,以获取更丰富和准确的密码语义理解特征。首先,词嵌入模型将密码数据映射为密集的向量表示,捕捉密码的语义信息。然后,BiLSTM模型在这些词嵌入向量的基础上进一步处理序列信息,捕捉密码中的上下文和依赖关系。最终,通过将BiLSTM模型的输出作为密码语义理解特征向量,可以用于后续的密码分析、分类或其他任务。换言之,词嵌入模型和BiLSTM模型在密码语义理解器中起着关键作用,能够将输入的密码数据转化为具有语义和序列信息的特征向量,从而更好地理解和表示密码的含义和结构。
相应地,在步骤S150中,将所述输入密码语义理解特征映射到所述历史密码语义关联拓扑特征的高维空间中以得到密码语义关联特征,包括:将所述语义关联拓扑历史密码语义编码特征矩阵与所述输入密码语义理解特征向量进行矩阵相乘以得到密码语义关联向量作为所述密码语义关联特征。应可以理解,将语义关联拓扑历史密码语义编码特征矩阵与输入密码语义理解特征向量进行矩阵相乘的目的是得到密码语义关联向量,用作密码语义关联特征。这一步骤的作用是将历史密码数据中的语义关联信息与当前输入密码的语义理解特征进行结合,从而捕捉密码之间的语义关联和相似性。通过矩阵相乘,可以将历史密码数据中的语义关联信息与当前密码的语义特征进行加权融合,得到密码语义关联向量。密码语义关联向量可以提供密码之间的语义相关程度的度量。它可以帮助判断输入密码与历史密码之间的相似性或关联程度,从而支持密码相关任务的进行,如密码推荐、密码破解和密码强度评估等。通过将密码语义关联向量作为密码语义关联特征,可以提高密码数据的表征能力。
然后,将所述密码语义关联向量通过分类器以得到分类结果,所述分类结果用于表示待检测密码数据的语义重复度是否超过预定阈值。也就是说,利用所述输入的待检测密码数据语义理解特征和所述各个历史密码数据的语义关联特征之间的映射关联特征信息来进行分类处理,以此来检测用户输入的密码和历史密码之间的语义重复度,判断用户输入的待检测密码数据的语义重复度是否超过预定阈值,并基于所述分类结果,生成预警提示。
相应地,如图4所示,基于所述密码语义关联特征,确定待检测密码数据的语义重复度是否超过预定阈值并生成预警提示,包括:S161,对所述密码语义关联向量进行希尔伯特正交空间域表示解耦以得到优化密码语义关联向量;S162,将所述优化密码语义关联向量通过分类器以得到分类结果,所述分类结果用于表示待检测密码数据的语义重复度是否超过预定阈值;以及,S163,基于所述分类结果,生成预警提示。
特别地,在本申请的技术方案中,将所述多个历史密码语义编码特征向量和所述历史密码语义关联拓扑特征矩阵通过图神经网络模型时,所述语义关联拓扑历史密码语义编码特征矩阵可以表达历史密码数据的编码语义在语义分布相似性拓扑下的拓扑关联表示,由此,将所述语义关联拓扑历史密码语义编码特征矩阵与所述输入密码语义理解特征向量进行矩阵相乘后,所述密码语义关联向量除包含所述用户输入的待检测密码数据的近程-远程双向上下文编码语义特征以外,还包括在历史全语义空间下的语义分布拓扑关联表示,从而使得所述密码语义关联向量具有多样化的特征表达。这样,将所述密码语义关联向量通过分类器时,就会影响所述密码语义关联向量作为整体在分类域内的泛化效果,也就是,影响分类结果的准确性。
基于此,本申请的申请人在对所述密码语义关联向量进行分类时,优选地对所述密码语义关联向量,例如记为进行希尔伯特正交空间域表示解耦。
相应地,在一个具体示例中,对所述密码语义关联向量进行希尔伯特正交空间域表示解耦以得到优化密码语义关联向量,包括:以如下优化公式对所述密码语义关联向量进行希尔伯特正交空间域表示解耦以得到所述优化密码语义关联向量;其中,所述优化公式为:
,
其中,是所述密码语义关联向量,/>是所述密码语义关联向量的全局特征均值,是所述密码语义关联向量的二范数,/>是所述密码语义关联向量的长度,且/>是单位向量,/>表示向量减法,/>表示协方差矩阵,/>是所述优化密码语义关联向量。
这里,所述希尔伯特正交空间域表示解耦用于通过强调所述密码语义关联向量的多样化特征表达内的本质域特定(domain-specific)信息,即,通过基于向量自空间度量和向量自内积表示下的希尔伯特空间度量,来从所述密码语义关联向量/>的整体域表示内进行域不变(domain-invariant)表征的正交空间域解耦,以提升所述密码语义关联向量/>在分类域内的域自适应泛化性能,从而提升所述密码语义关联向量通过分类器得到的分类结果的准确性。这样,能够有效检测用户输入的密码和历史密码之间的语义重复度,从而判断用户输入的密码是否过于简单以及与历史密码的语义重复度是否过高,以帮助用户识别和避免使用易受攻击的密码,提高整体的密码安全性以及物联网系统的安全性。
进一步地,在步骤S162中,将所述优化密码语义关联向量通过分类器以得到分类结果,所述分类结果用于表示待检测密码数据的语义重复度是否超过预定阈值,包括:使用所述分类器的全连接层对所述优化密码语义关联向量进行全连接编码以得到编码分类特征向量;以及,将所述编码分类特征向量输入所述分类器的Softmax分类函数以得到所述分类结果。
也就是,在本公开的技术方案中,所述分类器的标签包括待检测密码数据的语义重复度超过预定阈值(第一标签),以及,待检测密码数据的语义重复度未超过预定阈值(第二标签),其中,所述分类器通过软最大值函数来确定所述优化密码语义关联向量属于哪个分类标签。值得注意的是,这里的所述第一标签p1和所述第二标签p2并不包含人为设定的概念,实际上在训练过程当中,计算机模型并没有“待检测密码数据的语义重复度是否超过预定阈值”这种概念,其只是有两种分类标签且输出特征在这两个分类标签下的概率,即p1和p2之和为一。因此,待检测密码数据的语义重复度是否超过预定阈值的分类结果实际上是通过分类标签转化为符合自然规律的二分类的类概率分布,实质上用到的是标签的自然概率分布的物理意义,而不是“待检测密码数据的语义重复度是否超过预定阈值”的语言文本意义。
应可以理解,分类器的作用是利用给定的类别、已知的训练数据来学习分类规则和分类器,然后对未知数据进行分类(或预测)。逻辑回归(logistics)、SVM等常用于解决二分类问题,对于多分类问题(multi-class classification),同样也可以用逻辑回归或SVM,只是需要多个二分类来组成多分类,但这样容易出错且效率不高,常用的多分类方法有Softmax分类函数。
综上,基于本申请实施例的物联网密码管理方法被阐明,其可以检测用户输入的密码和历史密码之间的语义重复度,从而判断用户输入的密码是否过于简单以及与历史密码的语义重复度是否过高,以帮助用户识别和避免使用易受攻击的密码,提高整体的密码安全性以及物联网系统的安全性。
图5为根据本申请实施例的物联网密码管理系统100的框图。如图5所示,根据本申请实施例的物联网密码管理系统100,包括:数据获取模块110,用于获取用户输入的待检测密码数据,以及,所述用户使用过的历史密码数据库;历史数据语义编码模块120,用于分别对所述历史密码数据库中的各个历史密码数据进行语义编码以得到多个历史密码语义编码特征向量;语义关联分析模块130,用于对所述多个历史密码语义编码特征向量进行语义关联分析以得到历史密码语义关联拓扑特征;输入数据语义编码模块140,用于对所述用户输入的待检测密码数据进行语义编码以得到输入密码语义理解特征;映射模块150,用于将所述输入密码语义理解特征映射到所述历史密码语义关联拓扑特征的高维空间中以得到密码语义关联特征;以及,预警提示模块160,用于基于所述密码语义关联特征,确定待检测密码数据的语义重复度是否超过预定阈值并生成预警提示。
在一个示例中,在上述物联网密码管理系统100中,所述语义关联分析模块130,包括:交叉熵计算单元,用于计算所述多个历史密码语义编码特征向量中任意两个历史密码语义编码特征向量之间的交叉熵以得到历史密码语义关联拓扑矩阵;拓扑特征提取单元,用于将所述历史密码语义关联拓扑矩阵通过基于卷积神经网络模型的拓扑特征提取器以得到历史密码语义关联拓扑特征矩阵;以及,图神经网络编码单元,用于将所述多个历史密码语义编码特征向量和所述历史密码语义关联拓扑特征矩阵通过图神经网络模型以得到语义关联拓扑历史密码语义编码特征矩阵作为所述历史密码语义关联拓扑特征。
在一个示例中,在上述物联网密码管理系统100中,所述输入数据语义编码模块140,用于:将所述用户输入的待检测密码数据通过包含词嵌入模型和BiLSTM模型的密码语义理解器以得到输入密码语义理解特征向量作为所述输入密码语义理解特征。
在一个示例中,在上述物联网密码管理系统100中,所述映射模块150,用于:将所述语义关联拓扑历史密码语义编码特征矩阵与所述输入密码语义理解特征向量进行矩阵相乘以得到密码语义关联向量作为所述密码语义关联特征。
这里,本领域技术人员可以理解,上述物联网密码管理系统100中的各个模块的具体功能和操作已经在上面参考图1到图4的物联网密码管理方法的描述中得到了详细介绍,并因此,将省略其重复描述。
如上所述,根据本申请实施例的物联网密码管理系统100可以实现在各种无线终端中,例如具有物联网密码管理算法的服务器等。在一个示例中,根据本申请实施例的物联网密码管理系统100可以作为一个软件模块和/或硬件模块而集成到无线终端中。例如,该物联网密码管理系统100可以是该无线终端的操作系统中的一个软件模块,或者可以是针对于该无线终端所开发的一个应用程序;当然,该物联网密码管理系统100同样可以是该无线终端的众多硬件模块之一。
替换地,在另一示例中,该物联网密码管理系统100与该无线终端也可以是分立的设备,并且该物联网密码管理系统100可以通过有线和/或无线网络连接到该无线终端,并且按照约定的数据格式来传输交互信息。
图6为根据本申请实施例的物联网密码管理方法的应用场景图。如图6所示,在该应用场景中,首先,获取用户输入的待检测密码数据(例如,图6中所示意的D1),以及,所述用户使用过的历史密码数据库(例如,图6中所示意的D2),然后,将所述用户输入的待检测密码数据和所述历史密码数据库输入至部署有物联网密码管理算法的服务器中(例如,图6中所示意的S),其中,所述服务器能够使用所述物联网密码管理算法对所述用户输入的待检测密码数据和所述历史密码数据库进行处理以得到用于表示待检测密码数据的语义重复度是否超过预定阈值的分类结果。
此外,本领域技术人员可以理解,本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
除非另有定义,这里使用的所有术语(包括技术和科学术语)具有与本发明所属领域的普通技术人员共同理解的相同含义。还应当理解,诸如在通常字典里定义的那些术语应当被解释为具有与它们在相关技术的上下文中的含义相一致的含义,而不应用理想化或极度形式化的意义来解释,除非这里明确地这样定义。
上面是对本发明的说明,而不应被认为是对其的限制。尽管描述了本发明的若干示例性实施例,但本领域技术人员将容易地理解,在不背离本发明的新颖教学和优点的前提下可以对示例性实施例进行许多修改。因此,所有这些修改都意图包含在权利要求书所限定的本发明范围内。应当理解,上面是对本发明的说明,而不应被认为是限于所公开的特定实施例,并且对所公开的实施例以及其他实施例的修改意图包含在所附权利要求书的范围内。本发明由权利要求书及其等效物限定。
Claims (10)
1.一种物联网密码管理方法,其特征在于,包括:
获取用户输入的待检测密码数据,以及,所述用户使用过的历史密码数据库;
分别对所述历史密码数据库中的各个历史密码数据进行语义编码以得到多个历史密码语义编码特征向量;
对所述多个历史密码语义编码特征向量进行语义关联分析以得到历史密码语义关联拓扑特征;
对所述用户输入的待检测密码数据进行语义编码以得到输入密码语义理解特征;
将所述输入密码语义理解特征映射到所述历史密码语义关联拓扑特征的高维空间中以得到密码语义关联特征;以及
基于所述密码语义关联特征,确定待检测密码数据的语义重复度是否超过预定阈值并生成预警提示。
2.根据权利要求1所述的物联网密码管理方法,其特征在于,对所述多个历史密码语义编码特征向量进行语义关联分析以得到历史密码语义关联拓扑特征,包括:
计算所述多个历史密码语义编码特征向量中任意两个历史密码语义编码特征向量之间的交叉熵以得到历史密码语义关联拓扑矩阵;
将所述历史密码语义关联拓扑矩阵通过基于卷积神经网络模型的拓扑特征提取器以得到历史密码语义关联拓扑特征矩阵;以及
将所述多个历史密码语义编码特征向量和所述历史密码语义关联拓扑特征矩阵通过图神经网络模型以得到语义关联拓扑历史密码语义编码特征矩阵作为所述历史密码语义关联拓扑特征。
3.根据权利要求2所述的物联网密码管理方法,其特征在于,对所述用户输入的待检测密码数据进行语义编码以得到输入密码语义理解特征,包括:
将所述用户输入的待检测密码数据通过包含词嵌入模型和BiLSTM模型的密码语义理解器以得到输入密码语义理解特征向量作为所述输入密码语义理解特征。
4.根据权利要求3所述的物联网密码管理方法,其特征在于,将所述输入密码语义理解特征映射到所述历史密码语义关联拓扑特征的高维空间中以得到密码语义关联特征,包括:
将所述语义关联拓扑历史密码语义编码特征矩阵与所述输入密码语义理解特征向量进行矩阵相乘以得到密码语义关联向量作为所述密码语义关联特征。
5.根据权利要求4所述的物联网密码管理方法,其特征在于,基于所述密码语义关联特征,确定待检测密码数据的语义重复度是否超过预定阈值并生成预警提示,包括:
对所述密码语义关联向量进行希尔伯特正交空间域表示解耦以得到优化密码语义关联向量;
将所述优化密码语义关联向量通过分类器以得到分类结果,所述分类结果用于表示待检测密码数据的语义重复度是否超过预定阈值;以及
基于所述分类结果,生成预警提示。
6.根据权利要求5所述的物联网密码管理方法,其特征在于,对所述密码语义关联向量进行希尔伯特正交空间域表示解耦以得到优化密码语义关联向量,包括:
以如下优化公式对所述密码语义关联向量进行希尔伯特正交空间域表示解耦以得到所述优化密码语义关联向量;
其中,所述优化公式为:
,
其中,是所述密码语义关联向量,/>是所述密码语义关联向量的全局特征均值,/>是所述密码语义关联向量的二范数,/>是所述密码语义关联向量的长度,且/>是单位向量,表示向量减法,/>表示协方差矩阵,/>是所述优化密码语义关联向量。
7.一种物联网密码管理系统,其特征在于,包括:
数据获取模块,用于获取用户输入的待检测密码数据,以及,所述用户使用过的历史密码数据库;
历史数据语义编码模块,用于分别对所述历史密码数据库中的各个历史密码数据进行语义编码以得到多个历史密码语义编码特征向量;
语义关联分析模块,用于对所述多个历史密码语义编码特征向量进行语义关联分析以得到历史密码语义关联拓扑特征;
输入数据语义编码模块,用于对所述用户输入的待检测密码数据进行语义编码以得到输入密码语义理解特征;
映射模块,用于将所述输入密码语义理解特征映射到所述历史密码语义关联拓扑特征的高维空间中以得到密码语义关联特征;以及
预警提示模块,用于基于所述密码语义关联特征,确定待检测密码数据的语义重复度是否超过预定阈值并生成预警提示。
8.根据权利要求7所述的物联网密码管理系统,其特征在于,所述语义关联分析模块,包括:
交叉熵计算单元,用于计算所述多个历史密码语义编码特征向量中任意两个历史密码语义编码特征向量之间的交叉熵以得到历史密码语义关联拓扑矩阵;
拓扑特征提取单元,用于将所述历史密码语义关联拓扑矩阵通过基于卷积神经网络模型的拓扑特征提取器以得到历史密码语义关联拓扑特征矩阵;以及
图神经网络编码单元,用于将所述多个历史密码语义编码特征向量和所述历史密码语义关联拓扑特征矩阵通过图神经网络模型以得到语义关联拓扑历史密码语义编码特征矩阵作为所述历史密码语义关联拓扑特征。
9.根据权利要求8所述的物联网密码管理系统,其特征在于,所述输入数据语义编码模块,用于:
将所述用户输入的待检测密码数据通过包含词嵌入模型和BiLSTM模型的密码语义理解器以得到输入密码语义理解特征向量作为所述输入密码语义理解特征。
10.根据权利要求9所述的物联网密码管理系统,其特征在于,所述映射模块,用于:
将所述语义关联拓扑历史密码语义编码特征矩阵与所述输入密码语义理解特征向量进行矩阵相乘以得到密码语义关联向量作为所述密码语义关联特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311262939.0A CN117056902A (zh) | 2023-09-27 | 2023-09-27 | 物联网密码管理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311262939.0A CN117056902A (zh) | 2023-09-27 | 2023-09-27 | 物联网密码管理方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117056902A true CN117056902A (zh) | 2023-11-14 |
Family
ID=88657491
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311262939.0A Pending CN117056902A (zh) | 2023-09-27 | 2023-09-27 | 物联网密码管理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117056902A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108399163A (zh) * | 2018-03-21 | 2018-08-14 | 北京理工大学 | 结合词聚合与词组合语义特征的文本相似性度量方法 |
US20220292265A1 (en) * | 2021-03-09 | 2022-09-15 | Beijing Xiaomi Mobile Software Co., Ltd. | Method for determining text similarity, storage medium and electronic device |
US11537708B1 (en) * | 2020-01-21 | 2022-12-27 | Rapid7, Inc. | Password semantic analysis pipeline |
CN116304748A (zh) * | 2023-05-17 | 2023-06-23 | 成都工业学院 | 一种文本相似度计算方法、系统、设备及介质 |
CN116596581A (zh) * | 2023-05-26 | 2023-08-15 | 长春职业技术学院 | Erp管理系统及其方法 |
-
2023
- 2023-09-27 CN CN202311262939.0A patent/CN117056902A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108399163A (zh) * | 2018-03-21 | 2018-08-14 | 北京理工大学 | 结合词聚合与词组合语义特征的文本相似性度量方法 |
US11537708B1 (en) * | 2020-01-21 | 2022-12-27 | Rapid7, Inc. | Password semantic analysis pipeline |
US20220292265A1 (en) * | 2021-03-09 | 2022-09-15 | Beijing Xiaomi Mobile Software Co., Ltd. | Method for determining text similarity, storage medium and electronic device |
CN116304748A (zh) * | 2023-05-17 | 2023-06-23 | 成都工业学院 | 一种文本相似度计算方法、系统、设备及介质 |
CN116596581A (zh) * | 2023-05-26 | 2023-08-15 | 长春职业技术学院 | Erp管理系统及其方法 |
Non-Patent Citations (4)
Title |
---|
MAJID MOHEBBI 等: "Computing semantic similarity of texts based on deep graph learning with ability to use semantic role label information", SCIENTIFIC REPORTS, pages 1 - 11 * |
冯月春: "改进Bi-LSTM的文本相似度计算方法", 计算工程与设计, vol. 43, no. 5, pages 1397 - 1403 * |
初雅莉 等: "基于动态语义编码双向LSTM的中文语义相似度计算", 计算机应用与软件, no. 06, pages 224 - 229 * |
张柯文 等: "一种基于WSD层级记忆网络建模的文档表示方法", 淮阴工学院学报, no. 03, pages 51 - 57 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ganz et al. | Automated semantic knowledge acquisition from sensor data | |
CN113177132B (zh) | 基于联合语义矩阵的深度跨模态哈希的图像检索方法 | |
EP3311311A1 (en) | Automatic entity resolution with rules detection and generation system | |
Zia et al. | Robust fingerprint classification with Bayesian convolutional networks | |
CN116257406A (zh) | 用于智慧城市的网关数据管理方法及其系统 | |
CN117040917A (zh) | 一种具有监测预警功能的智慧型交换机 | |
CN112910859A (zh) | 基于c5.0决策树和时序分析的物联网设备监测预警方法 | |
US20220012538A1 (en) | Compact representation and time series segment retrieval through deep learning | |
CN117041017B (zh) | 数据中心的智能运维管理方法及系统 | |
CN116663568B (zh) | 基于优先级的关键任务识别系统及其方法 | |
Yang et al. | Remaining useful life prediction based on normalizing flow embedded sequence-to-sequence learning | |
CN116247824A (zh) | 电力设备的控制方法及其系统 | |
CN116861924A (zh) | 基于人工智能的项目风险预警方法及系统 | |
CN114881173A (zh) | 基于自注意力机制的简历分类方法和装置 | |
CN109615080B (zh) | 无监督模型评估方法、装置、服务器及可读存储介质 | |
Ali et al. | Fake accounts detection on social media using stack ensemble system | |
CN116930042B (zh) | 建筑防水材料性能检测设备及方法 | |
Batic et al. | Improving knowledge distillation for non-intrusive load monitoring through explainability guided learning | |
CN116402777B (zh) | 基于机器视觉的电力设备检测方法及系统 | |
Charalampous et al. | Sparse deep-learning algorithm for recognition and categorisation | |
CN117033626A (zh) | 一种文本审核方法、装置、设备及存储介质 | |
CN116451139A (zh) | 一种基于人工智能的直播数据快速分析方法 | |
CN117056902A (zh) | 物联网密码管理方法及系统 | |
Lijun et al. | An intuitionistic calculus to complex abnormal event recognition on data streams | |
CN114528908A (zh) | 网络请求数据分类模型训练方法、分类方法及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |