CN116319089B - 一种动态弱密码检测方法、装置、计算机设备及介质 - Google Patents

一种动态弱密码检测方法、装置、计算机设备及介质 Download PDF

Info

Publication number
CN116319089B
CN116319089B CN202310552828.7A CN202310552828A CN116319089B CN 116319089 B CN116319089 B CN 116319089B CN 202310552828 A CN202310552828 A CN 202310552828A CN 116319089 B CN116319089 B CN 116319089B
Authority
CN
China
Prior art keywords
password
information
account
dictionary
weak password
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310552828.7A
Other languages
English (en)
Other versions
CN116319089A (zh
Inventor
李季
梁露露
韩冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yuanbao Technology Co ltd
Original Assignee
Beijing Yuanbao Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yuanbao Technology Co ltd filed Critical Beijing Yuanbao Technology Co ltd
Priority to CN202310552828.7A priority Critical patent/CN116319089B/zh
Publication of CN116319089A publication Critical patent/CN116319089A/zh
Application granted granted Critical
Publication of CN116319089B publication Critical patent/CN116319089B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/083Network architectures or network communication protocols for network security for authentication of entities using passwords
    • H04L63/0838Network architectures or network communication protocols for network security for authentication of entities using passwords using one-time-passwords
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0876Network architectures or network communication protocols for network security for authentication of entities based on the identity of the terminal or configuration, e.g. MAC address, hardware or software configuration or device fingerprint
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/10Network architectures or network communication protocols for network security for controlling access to devices or network resources

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Power Engineering (AREA)
  • Storage Device Security (AREA)

Abstract

本发明实施例提供了一种动态弱密码检测方法、装置、计算机设备及介质,涉及网络安全技术领域,其中,该方法包括以下步骤:对通过可用性验证的目标站点进行密码元素信息动态提取;获取目标站点的用户输入的账号密码;根据密码元素信息生成动态弱密码字典;对账号密码生成弱密码检测任务,使用动态弱密码字典执行弱密码检测任务;获取弱密码检测任务的结果。由于该方案通过对目标站点的信息提取,结合常规密码字典生成动态弱密码字典,对密码字典进行了丰富,提高了密码检测的准确性和检测效率。

Description

一种动态弱密码检测方法、装置、计算机设备及介质
技术领域
本发明涉及网络安全技术领域,特别涉及一种动态弱密码检测方法、装置、计算机设备及介质。
背景技术
随着整个社会的信息化水平越来越高,数字化办公已经是现代企业的重要标志之一。一方面数字化办公让员工可以通过远程登入Web后台的方式,在有互联网连接的区域完成一系列如客户信息管理、企业信息共享、企业办公、企业运维等多种需求,极大的提高了企业员工的效率,员工也可以按照自己的工作习惯来保证工作的效率,避免或减少了非必须的沟通与交流;另一方面,由于数字化办公的大量操作都会基于互联网执行,而企业在安全意识的提高、安全防护设备的加固等等多个方面还远远没有做好准备,员工为了方便,设置易于记忆、但过于简单的登录口令,如:“123456”、“20010901”、“zhongguoyinhang”等,这些口令很容易就被黑客所利用登录,从而造成大量的企业内部信息泄漏,甚至影响了企业的生产与制造,最终影响了企业的声誉与利润。这些会给用户的账户和数据带来安全风险,不建议用户使用的密码为弱密码,一般由简单的数字、字母、人名等命名实体与习惯输入的个人信息、词汇、日期等组成。
除此之外,黑客在尝试登录破解时还可能会利用社会工程学、威胁情报等多种方法,综合猜测或偷取目标站点所可能存在的用户名与密码,如通过发送钓鱼邮箱诱导用户填写其用户名、手机号、身份证等信息。
现有的弱密码发现手段,一方面,主要集中在低交互的Web后台站点,该类站点使用的技术一般较为老旧,采用的认证方式也常基于HTTP authentication的相关定义来进行;另一方面,主要通过给定后的、固态的弱密码字典,该字典一般以静态的方式存储于所属程序的数据库或文件中,一般容量可大可小,检测的方式也以蛮力爆破为主,所含的弱密码主要也是常见的密码组合,在爆破的过程中不会进行密码字典的变更。
现有弱密码检测方法的主要问题:通过蛮力破解的方式,其爆破的整体时间会随着密码字典、用户名字典的增大而成倍增加,同时在爆破的过程中会对目标主机进行无差别爆破,不会利用已有的爆破结果与相关关键信息,且最大的运行时间取决于爆破过程中用户名与密码在字典中的位置,如果命中的用户名排序靠后,则最大可达到的时间复杂度,其中,Nusername表示爆破所使用的用户名在相应字典中的位置,Npassword表示爆破所使用的密码在相应字典中的位置。
发明内容
有鉴于此,本发明实施例提供了一种动态弱密码检测方法,以解决了现有技术中检测弱密码的整体时间会随着密码字典、用户名字典的增大而成倍增加的技术问题。该方法包括:
对通过可用性验证的目标站点进行密码元素信息动态提取;
获取所述目标站点的用户输入的账号密码;
根据所述密码元素信息生成动态弱密码字典;
对所述账号密码生成弱密码检测任务,使用所述动态弱密码字典执行所述弱密码检测任务;
获取所述弱密码检测任务的结果。
本发明实施例还提供了一种动态弱密码检测装置,以解决了现有技术中爆破的整体时间会随着密码字典、用户名字典的增大而成倍增加的技术问题。该装置包括:
信息提取模块,用于对通过可用性验证的目标站点进行密码元素信息动态提取;
账号密码获取模块,用于获取所述目标站点的用户输入的账号密码;
动态弱密码字典生成模块,用于根据所述密码元素信息生成动态弱密码字典;
任务执行模块,用于对所述账号密码生成弱密码检测任务,使用所述动态弱密码字典执行所述弱密码检测任务;
结果获取模块,用于获取所述弱密码检测任务的结果。
本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意的动态弱密码检测方法,以解决了现有技术中检测弱密码的整体时间会随着密码字典、用户名字典的增大而成倍增加的技术问题。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述任意的动态弱密码检测方法的计算机程序,以解决了现有技术中检测弱密码的整体时间会随着密码字典、用户名字典的增大而成倍增加的技术问题。
与现有技术相比,本说明书实施例采用的上述至少一个技术方案能够达到的有益效果至少包括:对通过可用性验证的目标站点进行密码元素信息动态提取;获取目标站点用户输入的账号密码;根据密码元素信息生成动态弱密码字典;对账号密码生成弱密码检测任务,使用动态弱密码字典执行弱密码检测任务;获取弱密码检测任务的结果。通过使用Web站点信息丰富化以及动态字典构造的手段,使密码字典集合了Web站点内相关信息,对于不同的Web站点,密码字典可动态的适应调整,使密码字典内的信息更加丰富,提高了弱密码识别的效率和准确性,有效提高对目标站点的弱密码的发现,为站点拥有者能尽快封堵相关的弱密码安全问题提供数据依据,为避免造成更大的数据泄露等有形或无形资产损失提供数据依据。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例提供的一种动态弱密码检测方法的一个实施例的流程图;
图2是本发明实施例提供的计算机设备的结构框图;
图3是本发明实施例提供的动态弱密码检测装置的结构框图。
具体实施方式
下面结合附图对本申请实施例进行详细描述。
以下通过特定的具体实例说明本申请的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本申请的其他优点与功效。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。本申请还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本申请的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
对本申请的弱密码相关的概念如下:
弱密码,指的是会给用户的账户和数据带来安全风险的构成简单的密码,因此不建议用户使用弱密码。弱密码一般包括简单的数字、字母、人名等命名实体、习惯输入的个人信息、词汇与日期等信息。
Web URL,Web站点的全局统一资源定位符,其形式如:http://example.com:80/abc/123.asp?key1=value1#somewhere,其包括访问的协议、域名、端口、资源路径、请求参数、锚点等信息。
Web后台,指一种互联网运行的网站站点,该站点允许用户使用账号密码或其他的身份验证措施进行登录,登录后可以执行较高的权限操作,一般情况下Web后台只应暴露给需要访问该后台的用户。
Web标题,指Web页面返回的HTML数据中的一个元素,常用来定义一个Web页面所要表述的主题信息。Web标题常常还会作为搜索引擎收录与检索的重要输入信息,一般情况下其整体的长度不会超过100个字符。
Web页面图标,指Web页面在标签页或地址栏上进行展示的图片信息,常常用来展示页面的所属厂商、所使用的开源组件等信息,便于用户快速对页面进行归类和识别。
JS脚本,指JavaScript脚本,JavaScript通常被直接嵌入HTML页面,用来帮助Web页面上实现复杂的功能。
PHP脚本,其英文全称为Hypertext Preprocessor,中文全称为超级文本预处理语言,是一种通用的开源脚本语言,被广泛应用于Web网站的开发,能够嵌入到HTML中使用。
HTML,其英文全称为Hyper Text Markup Language,其中文全称为超文本标记语言,为构建Web页面内容的主要元素。
下面参照附图1对本申请的动态弱密码检测的方法进行详细描述。
在本发明实施例中,提供了一种动态弱密码检测方法,如图1所示,该方法包括:
步骤S11、对通过可用性验证的目标站点进行密码元素信息动态提取;
步骤S12、获取所述目标站点的用户输入的账号密码;
步骤S13、根据所述密码元素信息生成动态弱密码字典;
步骤S14、对所述账号密码生成弱密码检测任务,使用所述动态弱密码字典执行所述弱密码检测任务;
步骤S15、获取所述弱密码检测任务的结果。
在本发明实施例中,通过利用目标站点的信息丰富化和动态弱密码字典构造的手段,提高了弱密码识别的效率,有效提高对目标站点的弱密码类型脆弱性的发现效率,为站点的拥有者尽快封堵相关的弱密码安全问题提供数据依据,为避免造成更大的数据泄露等有形或无形资产损失提供数据依据。
在具体实施时,在步骤S11之前,还包括获取目标站点,具体包括:明确与录入目标爆破的Web站点,可输入Web目录或带有多个目录层级的Web地址。
在一个实施例中,在进行密码元素信息提取前,需要对目标站点进行可用性验证,为了更加详细的说明,在本实施例中,对所述目标站点进行可用性验证具体包括以下步骤:
步骤S01、对所述目标站点的地址进行预处理,所述预处理包括确认所述地址的各个结构的属性信息是否明确。例如,确认协议、路径、端口号等属性信息;通过纠错删除无效空格或占位符,便于提高识别的准确性。
步骤S02、基于所述属性信息判断所述目标站点是否可被访问,若所述属性信息明确且所述目标站点可被访问,则通过可用性验证。
在一个实施例中,通过以下方式判断所述目标站点是否可被访问,也即对对所述目标站点探活:
查看所述目标站点所包括的域名是否已经注册;
查看域名是否有解析记录;
查看域名解析出的IP地址是否为有效的互联网地址;
查看IP地址是否可达;
查看IP地址是否开放端口;
查看IP地址开放端口是否为Web服务。
如果目标站点所包括的域名已经注册、域名有解析记录、域名解析出的IP地址为有效的互联网地址、IP地址可达、IP地址是开放端口、IP地址开放端口是Web服务,则表明目标站点是可被访问的。若所述属性信息明确且所述目标站点可被访问,则目标站点通过可用性验证,可继续执行步骤S11。
在一个实施例中,如果Web站点的地址的各个结构的属性信息已经明确,并且在基于所述属性信息判断所述目标站点是否可被访问之前,还包括对所述目标站点的各个属性信息进行合法性校验,具体包括以下各项检验步骤:
校验协议是否为有效;
校验协议与路径字符的编码是否符合预设编码规则,例如,编码的字符是否为有效编码,字符之间是否存在空格等;
校验协议与路径字符长度是否在合法的范围内;
校验端口号是否在规定的范围内;具体实施时,检验端口号是否处于1-65535范围内。
具体实施时,在步骤S11中,所述目标站点为Web站点,所述对通过可用性验证的所述目标站点进行密码元素信息动态提取,具体包括以下步骤:
步骤S111、获取Web站点信息,包括:启动浏览器、建立Web站点连接、整体页面数据拉取、渲染页面获取页面截图以及获取Web站点图片。其中,整体页面数据拉取包括提取HTTP Body、HTTP Header的相关信息以及获取Web站点资源。
步骤S112、对所述Web站点信息采用机器学习方法识别出密码元素信息,所述密码元素信息包括命名实体、关键信息和Web页面图标,所述关键信息包括预设形式的信息。例如,命名实体包括典型的如人名、公司名、组织名;关键信息包括页面内的邮箱地址、电话联系方式等;Web页面图标可以是公司的logo等。
在一个实施例中,在所述获取Web站点信息之后还包括对获取的Web站点信息进行预处理,预处理包括字符集转换、数据归一化。
为了更加详细的说明步骤S112的对所述Web站点信息采用机器学习方法识别出密码元素信息,在本实施例中,所述机器学习方法包括图像处理方法和自然语言处理方法。
具体的,采用图像处理方法识别出密码元素信息,包括:
对获取的页面截图和获取的Web站点图片进行图片预处理,从预处理后的所述页面截图和所述Web站点图片中识别出所述Web页面图标,所述图片预处理包括图片定位、图片裁减、图片放大、图片旋转、空间颜色提取、空间颜色转换、图像轮廓勾画、图片内文字定位和图片内文字识别。
具体的,采用自然语言处理方法识别出密码元素信息,包括:
从预处理后的所述页面截图和所述Web站点图片中获取第一文字资源,从所述页面数据中获取第二文字资源;
对所述第一文字资源和所述第二文字资源进行语料预处理,并从语料预处理后的所述第一文字资源和所述第二文字资源中识别出所述命名实体和所述关键信息,所述语料预处理包括预设字符过滤、中文切词、中英文纠错、命名实体识别(包括英文命名实体、中文命名实体)、中文命名实体拼音转换、邮箱信息识别和邮箱信息用户名提取。
在一个实施例中,所述获取所述目标站点的用户输入的账号密码,包括:
从所述页面数据中识别出HTML元素的相关参数,根据所述HTML元素的相关参数确认网页中提交账号密码的表单,根据所述表单获取所述用户输入的账号密码;和/或,
从所述页面数据中识别出JS脚本和PHP脚本,从所述JS脚本和所述PHP脚本中确认网页中提交账号密码的所述表单,根据所述表单获取所述用户输入的账号密码。
例如,识别“text、input、password”等HTML关键元素,HTML关键元素一般包括文本元素、表格元素、表单元素、列表元素和功能类元素等。JS脚本和PHP脚本中包含有手机号、邮箱账号等信息。
在一个实施例中,在步骤S13中,根据所述密码元素信息生成动态弱密码字典,具体包括以下步骤:
步骤S131、将所述命名实体、所述关键信息和所述Web页面图标分别编码为字符串;
步骤S132、将每个所述字符串与预设密码字典的每个账号密码组中的账号进行头尾遍历组合,生成所述动态弱密码字典中的账号密码组;将每个所述字符串与预设密码字典的每个账号密码组中的密码进行头尾遍历组合,生成所述动态弱密码字典中的账号密码组,其中,每个账号密码组包括账号和对应的密码。
例如,预设密码字典中包含有两组账号密码,分别为A、B(如A为一组账号密码xiaoming:123456);经过编码后形成的字符串分别为A’、B’;则构造的动态弱密码字典为A’A、AA’、AB’、B’A、B A’、A’B、B B’、B’B。
例如,A为一组账号密码xiaoming:123456,在A’A中,相当于编码后的字符串A’与账号密码组中的账号进行组合,可以是A’xiaoming:123456或者xiaomingA’:123456;在AA’中,相当于编码后的字符串A’与账号密码组中的密码进行组合,可以是xiaoming:123456A’或者xiaoming:A’123456。
在一个具体实施例中,将英文命名实体、中文命名实体转换拼音、邮箱信息用户名获取后,处理为有效编码的字符串,对编码后形成的字符串以及预设密码字典进行头尾遍历组合,构造出动态弱密码字典,所述预设密码字典由用户名和密码构成。因此,动态弱密码字典是采用了基于自然语言处理、图像识别等技术的密码字典动态构造技术,动态弱密码字典中包含了目标Web站点的信息,通过模仿黑客的攻击视角与攻击思路,有效提高弱密码检测的成功效率,帮助相关Web站点所有方快速识别可能存在的身份安全隐患与漏洞。
在具体实施时,步骤S14中的对所述账号密码生成弱密码检测任务,使用所述动态弱密码字典执行所述弱密码检测任务,具体包括以下步骤:
步骤S141、对定位出的提交账号密码的表单,使用构造出的动态弱密码字典,构造HTTP请求并发起HTTP请求,等待Web服务进行响应;
步骤S142、如果Web服务在规定的超时时间内,进行了有效的请求响应,则对HTTP请求的具体结果进行识别,明确是否弱密码检测成功;
步骤S143、如果弱密码检测成功则对相关弱密码检测的请求进行记录,明确检测成功的用户名与对应密码,然后继续进行弱密码检测,直到用户名均已经完成检测;
步骤S144、对检测成功的记录进行脱敏处理,并将脱敏后的信息发送至任务结果报告中进行体现。
在上述实施例中,检测任务结束后,执行步骤S15、汇总弱密码检测任务的结果。
具体实施时,本申请的动态弱密码检测方法,还包括,步骤S16、生成任务报告,分类整理不同目标站点(Web后台)的弱密码情况,组织任务结果信息,并统计整体任务情况,最后生成任务报告。不同目标站点(Web后台)的弱密码情况包括:代码管理后台类型、人事管理后台类型、客户管理后台类型和财务管理后台类型等。生成的任务报告,可以是PDF报告,主要包括:目标Web后台的Web地址、Web后台的类型、Web后台弱密码问题的用户名详情和Web后台弱密码问题的密码详情。
在本实施例中,提供了一种计算机设备,如图2所示,包括存储器301、处理器302及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意的动态弱密码检测方法。
具体的,该计算机设备可以是计算机终端、服务器或者类似的运算装置。
在本实施例中,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述任意的动态弱密码检测方法的计算机程序。
具体的,计算机可读存储介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机可读存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读存储介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
基于同一发明构思,本发明实施例中还提供了一种动态弱密码检测装置,如下面的实施例所述。由于动态弱密码检测装置解决问题的原理与动态弱密码检测方法相似,因此动态弱密码检测装置的实施可以参见动态弱密码检测方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图3是本发明实施例的动态弱密码检测装置的一种结构框图,如图3所示,包括:
信息提取模块401,用于对通过可用性验证的所述目标站点进行密码元素信息动态提取;
账号密码获取模块402,用于获取所述目标站点用户输入的账号密码;
动态弱密码字典生成模块403,用于根据所述密码元素信息生成动态弱密码字典;
任务执行模块404,用于对所述账号密码生成弱密码检测任务,使用所述动态弱密码字典执行所述弱密码检测任务;
结果获取模块405,用于获取所述弱密码检测任务的结果。
在一个实施例中,还包括站点可用性验证模块,站点可用性验证模块具体包括:
预处理模块,用于对所述目标站点的地址进行预处理,所述预处理包括确认所述地址的各个结构的属性信息是否明确;
判断模块,用于基于所述属性信息判断所述目标站点是否可被访问,若所述属性信息明确且所述目标站点可被访问,则通过可用性验证。
在一个实施例中,所述判断模块具体包括:
第一判断子模块,用于查看所述目标站点所包括的域名是否已经注册;
第二判断子模块,用于查看域名是否有解析记录;
第三判断子模块,用于查看域名解析出的IP地址是否为有效的互联网地址;
第四判断子模块,用于查看IP地址是否可达;
第五判断子模块,用于查看IP地址是否开放端口;
第六判断子模块,用于查看IP地址开放端口是否为Web服务。
在一个实施例中,站点可用性验证模块还包括:
合法性校验模块,用于对所述目标站点的各个属性信息进行合法性校验,所述对所述目标站点的各个属性信息进行合法性校验,包括:
校验协议是否为有效;
校验协议与路径字符的编码是否为有效编码;
校验协议与路径字符长度是否在合法的范围内;
校验端口号是否在规定的范围内。
在一个实施例中,信息提取模块401具体包括:
Web站点信息获取模块,用于启动浏览器、建立Web站点连接、整体页面数据拉取、渲染页面获取页面截图以及获取Web站点图片;
密码元素信息识别模块,用于对所述Web站点信息采用机器学习方法识别出密码元素信息,所述密码元素信息包括命名实体、关键信息和Web页面图标,所述关键信息包括预设形式的信息。
在一个实施例中,密码元素信息识别模块包括图像处理模块和自然语言处理模块。
图像处理模块,用于采用图像处理方法识别出密码元素信息,包括:
对获取的页面截图和获取的Web站点图片进行图片预处理,识别出所述Web页面图标,所述图片预处理包括图片定位、图片裁减、图片放大、图片旋转、空间颜色提取、空间颜色转换、图像轮廓勾画、图片内文字定位和图片内文字识别。
自然语言处理模块用于采用自然语言处理方法识别出密码元素信息,包括:
对图片预处理得到的文字,以及对拉取的整体页面数据中的文字资源进行语料预处理,识别出所述命名实体和所述关键信息,所述语料预处理包括特殊字符过滤、中文切词、中英文纠错、英文命名实体识别、中文命名实体拼音转换、邮箱信息识别和邮箱信息用户名提取。
在一个实施例中,账号密码获取模块402,用于对拉取的整体页面数据,识别出HTML元素、JS脚本和PHP脚本,并对所述HTML元素的相关参数进行处理和获取,确认网页中提交账号密码的表单以获取所述用户输入的账号密码。
在一个实施例中,动态弱密码字典生成模块403,包括:
编码模块,用于将所述命名实体、所述关键信息和所述Web页面图标进行编码为字符串;
构建模块,用于将所述字符串与预设密码字典头尾遍历组合,生成动态弱密码字典,所述预设密码字典由用户名和密码构成。
在一个实施例中,动态弱密码检测装置还包括任务报告生成模块,用于分类整理不同的所述目标站点的弱密码情况,组织任务结果信息,并统计整体任务情况,生成任务报告。
本发明实施例实现了如下技术效果:对通过可用性验证的目标站点进行密码元素信息动态提取;获取目标站点用户输入的账号密码;根据密码元素信息生成动态弱密码字典;对账号密码生成弱密码检测任务,使用动态弱密码字典执行弱密码检测任务;获取弱密码检测任务的结果。通过使用Web站点信息丰富化、机器学习、动态字典构造、字典优先级等多种手段,有效提高对目标Web站点的弱密码类型脆弱性的发现,帮助Web站点的拥有者尽快封堵相关的弱密码安全问题,避免造成更大的数据泄露等有形或无形资产损失。
显然,本领域的技术人员应该明白,上述的本发明实施例的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明实施例不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明实施例可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种动态弱密码检测方法,其特征在于,包括:
对通过可用性验证的目标站点进行密码元素信息动态提取,所述目标站点为Web站点,包括:获取Web站点信息,所述Web站点信息包括页面数据、页面截图以及Web站点图片;采用图像处理方法和自然语言处理方法从所述Web站点信息中识别出所述密码元素信息,所述密码元素信息包括命名实体、关键信息和Web页面图标,所述关键信息包括预设形式的信息;
获取所述目标站点的用户输入的账号密码;
根据所述密码元素信息生成动态弱密码字典,包括:将所述命名实体、所述关键信息和所述Web页面图标分别编码为字符串;将每个所述字符串与预设密码字典的每个账号密码组中的账号进行头尾遍历组合,生成所述动态弱密码字典中的账号密码组;将每个所述字符串与预设密码字典的每个账号密码组中的密码进行头尾遍历组合,生成所述动态弱密码字典中的账号密码组,其中,每个账号密码组包括账号和对应的密码;
对所述账号密码生成弱密码检测任务,使用所述动态弱密码字典执行所述弱密码检测任务;
获取所述弱密码检测任务的结果。
2.如权利要求1所述的动态弱密码检测方法,其特征在于,还包括:
对所述目标站点的地址进行预处理,所述预处理包括确认所述地址的各个结构的属性信息是否明确;
基于所述属性信息判断所述目标站点是否可被访问,若所述属性信息明确且所述目标站点可被访问,则判断所述目标站点通过可用性验证;
其中,通过以下方式判断所述目标站点是否可被访问:
查看所述目标站点所包括的域名是否已经注册;
查看域名是否有解析记录;
查看域名解析出的IP地址是否为有效的互联网地址;
查看IP地址是否可达;
查看IP地址是否开放端口;
查看IP地址开放端口是否为Web服务。
3.如权利要求2所述的动态弱密码检测方法,其特征在于,还包括:
在基于所述属性信息判断所述目标站点是否可被访问之前,通过以下各项校验步骤来对所述属性信息进行合法性校验:
校验协议是否为有效;
校验协议与路径字符的编码是否符合预设编码规则;
校验协议与路径字符长度是否在预设长度范围内;
校验端口号是否在预设端口范围内。
4.如权利要求1所述的动态弱密码检测方法,其特征在于,采用图像处理方法和自然语言处理方法从所述Web站点信息中识别出所述密码元素信息,包括:
对所述页面截图和所述Web站点图片进行图片预处理,从预处理后的所述页面截图和所述Web站点图片中识别出所述Web页面图标,所述图片预处理包括图片定位、图片裁减、图片放大、图片旋转、空间颜色提取、空间颜色转换、图像轮廓勾画、图片内文字定位和图片内文字识别;
从预处理后的所述页面截图和所述Web站点图片中获取第一文字资源,从所述页面数据中获取第二文字资源;
对所述第一文字资源和所述第二文字资源进行语料预处理,并从语料预处理后的所述第一文字资源和所述第二文字资源中识别出所述命名实体和所述关键信息,所述语料预处理包括预设字符过滤、中文切词、中英文纠错、英文命名实体识别、中文命名实体拼音转换、邮箱信息识别和邮箱信息用户名提取。
5.如权利要求1所述的动态弱密码检测方法,其特征在于,所述获取所述目标站点的用户输入的账号密码,包括:
从所述页面数据中识别出HTML元素的相关参数,根据所述HTML元素的相关参数确认网页中提交账号密码的表单,根据所述表单获取所述用户输入的账号密码;和/或,
从所述页面数据中识别出JS脚本和PHP脚本,从所述JS脚本和所述PHP脚本中确认网页中提交账号密码的所述表单,根据所述表单获取所述用户输入的账号密码。
6.一种动态弱密码检测装置,其特征在于,包括:
信息提取模块,用于对通过可用性验证的目标站点进行密码元素信息动态提取,所述目标站点为Web站点,包括:获取Web站点信息,所述Web站点信息包括页面数据、页面截图以及Web站点图片;采用图像处理方法和自然语言处理方法从所述Web站点信息中识别出所述密码元素信息,所述密码元素信息包括命名实体、关键信息和Web页面图标,所述关键信息包括预设形式的信息;
账号密码获取模块,用于获取所述目标站点的用户输入的账号密码;
动态弱密码字典生成模块,用于根据所述密码元素信息生成动态弱密码字典,包括:将所述命名实体、所述关键信息和所述Web页面图标分别编码为字符串;将每个所述字符串与预设密码字典的每个账号密码组中的账号进行头尾遍历组合,生成所述动态弱密码字典中的账号密码组;将每个所述字符串与预设密码字典的每个账号密码组中的密码进行头尾遍历组合,生成所述动态弱密码字典中的账号密码组,其中,每个账号密码组包括账号和对应的密码;
任务执行模块,用于对所述账号密码生成弱密码检测任务,使用所述动态弱密码字典执行所述弱密码检测任务;
结果获取模块,用于获取所述弱密码检测任务的结果。
7.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述的动态弱密码检测方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至5中任一项所述的动态弱密码检测方法的计算机程序。
CN202310552828.7A 2023-05-17 2023-05-17 一种动态弱密码检测方法、装置、计算机设备及介质 Active CN116319089B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310552828.7A CN116319089B (zh) 2023-05-17 2023-05-17 一种动态弱密码检测方法、装置、计算机设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310552828.7A CN116319089B (zh) 2023-05-17 2023-05-17 一种动态弱密码检测方法、装置、计算机设备及介质

Publications (2)

Publication Number Publication Date
CN116319089A CN116319089A (zh) 2023-06-23
CN116319089B true CN116319089B (zh) 2023-08-11

Family

ID=86796304

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310552828.7A Active CN116319089B (zh) 2023-05-17 2023-05-17 一种动态弱密码检测方法、装置、计算机设备及介质

Country Status (1)

Country Link
CN (1) CN116319089B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117473485B (zh) * 2023-12-28 2024-04-16 深圳万物安全科技有限公司 密码检测方法、密码检测设备和计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105844140A (zh) * 2016-03-21 2016-08-10 国家电网公司 一种可识别验证码的网站登录暴力破解方法及系统
CN110505213A (zh) * 2019-07-26 2019-11-26 苏州浪潮智能科技有限公司 一种挖掘网站后台弱密码的方法
CN113312610A (zh) * 2021-06-17 2021-08-27 中国电信股份有限公司 弱密码检测方法、装置、介质及电子设备
CN114978752A (zh) * 2022-06-17 2022-08-30 北京安博通金安科技有限公司 弱密码检测方法、装置、电子设备及计算机可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230078849A1 (en) * 2021-09-13 2023-03-16 Cloud Linux Software Inc. Systems and methods for detecting malicious entities using weak passwords for unauthorized access

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105844140A (zh) * 2016-03-21 2016-08-10 国家电网公司 一种可识别验证码的网站登录暴力破解方法及系统
CN110505213A (zh) * 2019-07-26 2019-11-26 苏州浪潮智能科技有限公司 一种挖掘网站后台弱密码的方法
CN113312610A (zh) * 2021-06-17 2021-08-27 中国电信股份有限公司 弱密码检测方法、装置、介质及电子设备
CN114978752A (zh) * 2022-06-17 2022-08-30 北京安博通金安科技有限公司 弱密码检测方法、装置、电子设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN116319089A (zh) 2023-06-23

Similar Documents

Publication Publication Date Title
US11973799B2 (en) Domain name processing systems and methods
CN113098870B (zh) 一种网络诈骗检测方法、装置、电子设备及存储介质
CN103888490B (zh) 一种全自动的web客户端人机识别的方法
Suzuki et al. ShamFinder: An automated framework for detecting IDN homographs
US20230169783A1 (en) Visual domain detection systems and methods
CN103634317A (zh) 基于云安全对恶意网址信息进行安全鉴定的方法及系统
EP3343870A1 (en) System and method for detecting phishing web pages field of technology
US20060005017A1 (en) Method and apparatus for recognition and real time encryption of sensitive terms in documents
CN109831459B (zh) 安全访问的方法、装置、存储介质和终端设备
CN112989348B (zh) 攻击检测方法、模型训练方法、装置、服务器及存储介质
CN116319089B (zh) 一种动态弱密码检测方法、装置、计算机设备及介质
CN116366338B (zh) 一种风险网站识别方法、装置、计算机设备及存储介质
CN112613029A (zh) 一种弱口令检测方法、装置、计算机存储介质以及设备
CN112328936A (zh) 一种网站识别方法、装置、设备及计算机可读存储介质
CN113032655A (zh) 一种暗网电子数据提取固定方法
CN108270754B (zh) 一种钓鱼网站的检测方法及装置
CN112347457A (zh) 异常账户检测方法、装置、计算机设备和存储介质
US10652276B1 (en) System and method for distinguishing authentic and malicious electronic messages
CN113992390A (zh) 一种钓鱼网站的检测方法及装置、存储介质
Park et al. Forensic investigation framework for cryptocurrency wallet in the end device
CN110825976B (zh) 网站页面的检测方法、装置、电子设备及介质
CN109583210A (zh) 一种水平权限漏洞的识别方法、装置及其设备
CN108632050B (zh) 一种记录网站访问日志的方法和装置
CN116150541B (zh) 后台系统的识别方法、装置、设备及存储介质
JP6860156B1 (ja) 不正検知システム、不正検知方法、及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant