CN114124895A - 域名数据处理方法、域名描述方法、电子设备及存储介质 - Google Patents

域名数据处理方法、域名描述方法、电子设备及存储介质 Download PDF

Info

Publication number
CN114124895A
CN114124895A CN202210076293.6A CN202210076293A CN114124895A CN 114124895 A CN114124895 A CN 114124895A CN 202210076293 A CN202210076293 A CN 202210076293A CN 114124895 A CN114124895 A CN 114124895A
Authority
CN
China
Prior art keywords
domain name
attribute
pedigree
domain
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210076293.6A
Other languages
English (en)
Inventor
包正晶
张尼
薛继东
臧文羽
苏马婧
刘红
姚旺君
贾召鹏
刘旭东
孙彻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
6th Research Institute of China Electronics Corp
Original Assignee
6th Research Institute of China Electronics Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 6th Research Institute of China Electronics Corp filed Critical 6th Research Institute of China Electronics Corp
Priority to CN202210076293.6A priority Critical patent/CN114124895A/zh
Priority to CN202210374744.4A priority patent/CN115277633A/zh
Publication of CN114124895A publication Critical patent/CN114124895A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种域名数据处理方法、一种域名描述方法、电子设备及存储介质,涉及网络空间测绘领域。域名数据处理方法包括:获取网络空间的域名集合及与所述域名集合中各域名对应的域名信息;基于与所述域名集合中各域名对应的域名信息,构建域名谱系,所述域名谱系用于表征所述域名集合中各域名之间的关系;基于与所述域名集合中各域名对应的域名信息,获取所述域名集合中各域名对应的时空变化信息。通过域名信息、谱系和时空变化信息,能够对网络空间中的域名进行更为全面的描述,从而使用户掌握域名更为全面的情况,辅助用户获得更为准确的域名评估结果。

Description

域名数据处理方法、域名描述方法、电子设备及存储介质
技术领域
本申请涉及网络空间测绘领域,具体涉及一种域名数据处理方法与一种域名描述方法,电子设备及存储介质。
背景技术
随着网络空间的发展,域名也在发展变化,例如,域名数量在不断增加,域名信息(例如,域名所有者、域名的地理位置)在不断变更。而现有的对域名的描述中,多为对域名单一的静态描述,无法了解到域名的发展与变化情况,包括规模变化情况、域名分布变化情况等,导致对域名的评估不准确的问题及特定类型的域名监测困难的问题。例如,出现对域名的测绘结果不准确、测绘数据无法应用、对域名的评估结果与实际结果偏差过大等问题,甚至部分域名变化后未被及时发现与监测,可能出现安全性问题,例如,恶意域名未被及时发现引发的安全性问题。
发明内容
有鉴于此,本申请旨在提供一种域名数据处理方法与一种域名描述方法,以获取域名较为全面的信息,使用户获知域名发展变化的情况,从而对域名进行准确的判断与评估,及时发现特定类型的域名。
为了实现上述目的,本申请的实施例通过如下方式实现:
第一方面,本申请实施例提供一种域名数据处理方法,包括:获取网络空间的域名集合及与所述域名集合中各域名对应的域名信息;基于与所述域名集合中各域名对应的所述域名信息,构建域名谱系,所述域名谱系用于表征所述域名集合中各域名之间关系的谱系关系;基于与所述域名集合中各域名对应的所述域名信息,获取所述域名集合中各域名对应的时空变化信息。
本申请实施例中,通过获取域名集合与域名集合中各域名对应的域名信息,从而建立表征域名集合中各域名之间关系的域名谱系,使得用户能够从域名谱系中快速查找所需类型的域名,从而实现对域名的监测;通过获取域名的时空变化信息,从而能够快速了解域名的变化情况与发展情况,进而对域名进行准确的评估。由此,通过域名信息、域名谱系和时空变化信息,能够对网络空间中的域名进行更为全面的描述,从而使用户掌握域名更为全面的情况,辅助用户获得更为准确的域名评估结果。
一实施例中,所述域名集合中各域名对应的域名信息包括历史变化信息与IP定位信息,所述时空变化信息包括时间变化信息和空间变化信息,所述基于与所述域名集合中各域名对应的域名信息,获取所述域名集合中各域名对应的时空变化信息,包括:基于所述历史变化信息获取对应域名的所述时间变化信息;基于所述IP定位信息获取对应域名的所述空间变化信息。
本申请实施例中,通过历史变化信息获取域名在时间维度上的变化,通过IP定位信息获取域名在空间维度的变化,由此,可以通过时间与空间维度上的变化信息共同描述域名,使用户可以掌握对域名变化情况与发展情况,进而对域名进行准确的评估。
一实施例中,所述获取网络空间的域名集合及与所述域名集合中各域名对应的域名信息,包括:通过第三方数据获取所述域名集合,和/或主动探测网络空间的域名,以获取所述域名集合;获取与所述域名集合中各域名对应的域名信息包括:针对所述域名集合中的每一域名,主动请求该域名的域名信息。
本申请实施例中,通过第三方数据和/或主动探测获取域名集合,可以使用不同的方式获取域名集合,提高数据获取方式的多样性,然后可以获取域名集合中每一域名对应的域名信息,由此,可以提高对域名描述的准确性,便于用户更为准确的评估域名。
一实施例中,所述获取网络空间的域名集合及与所述域名集合中各域名对应的域名信息,包括:通过设置在所述目标网络空间出口流量探针获取所述域名集合与所述域名集合中各域名对应的域名信息。
本申请实施例中,通过在网络空间流量出口处设置流量探针,从而实现对域名及域名信息的被动探测,可以避免域名的遗漏与降低域名获取的复杂性,有效提高对域名集合及域名信息的获取效率。
一实施例中,所述域名集合中各域名对应的域名信息包括whois 数据所有者字段、域名对应网站证书、域名字符串后缀、域名解析路径,所述基于与所述域名集合中各域名对应的域名信息,构建域名谱系,包括:在确定所述域名集合中任意两域名之间各自的所述whois 数据所有者字段一致性、所述域名对应网站证书一致性、所述域名字符串后缀、所述域名解析路径相似度的四者中的任意一项满足预设比对条件时,建立所述两域名之间的关系。
本申请实施例中,通过比对每两域名whois数据所有者字段一致性、域名对应网站证书一致性、域名字符串后缀、域名解析路径相似度,在满足预设条件时,建立两域名之间的关系,从而构建不同域名之间的关系,便于用户根据特征查找所需的域名,也为用户提供所需域名相关的类型,进而帮助用户评估域名。
第二方面,本申请实施例提供一种域名描述方法,包括:获取目标域名的基础属性和应用属性;获取所述目标域名的谱系属性和时空属性,所述谱系属性用于描述所述目标域名与其他域名的关系,所述时空属性用于描述目标域名在时间维度与空间维度的变化;基于所述基础属性、所述应用属性、所述谱系属性及所述时空属性对预设的域名描述模型进行赋值,以描述所述目标域名。
本申请实施例中,通过所获取的目标域名的基础属性、应用属性、谱系属性和时空属性对预设的域名描述模型进行赋值,从而实现利用预设的域名描述模型对目标域名进行全面的描述,为用户提供目标域名更为全面的信息,实现域名数据的共享。由于描述目标域名的属性包括变化的谱系属性与时空属性,使得域名描述模型能够为用户提供目标域名的变化情况,为能够对域名进行更为准确地评估、测绘。
一实施例中,所述基于所述基础属性、所述应用属性、所述谱系属性及所述时空属性填充预设的域名描述模型之前,所述方法还包括:构建所述预设的域名描述模型,所述预设的域名描述模型包括基础属性条目、应用属性条目、谱系属性条目、时空属性条目。
本申请实施例中,通过构建预设的域名描述模型,在使用时可直接对所获取属性对应的条目进行填充,有效提高对目标域名进行描述的效率,此外,通过不同条目,可以为用户更为清晰地展示目标域名的各类信息,便于用户快速获取所需信息,进而对域名进行评估判断。
一实施例中,所述基于所述基础属性、所述应用属性、所述谱系属性及所述时空属性填充预设的域名描述模型之前,所述方法还包括:基于所述谱系属性,获取所述目标域名的谱系规模、谱系深度及同源关系,所述基于所述基础属性、所述应用属性、所述谱系属性及所述时空属性填充预设的域名描述模型,填充后的所述域名描述模型用于描述所述域名,包括:基于所述谱系规模、所述谱系深度及所述同源关系对所述预设的域名描述模型的谱系属性条目赋值。
本申请实施例中,通过谱系规模、谱系深度及同源关系对目标域名的谱系属性条目进行赋值,使得域名描述模型能够为用户展示目标域名的发展情况,进而对域名所有者进行评估,同时,谱系属性也便于用户根据目标域名的谱系属性中查找所需类型的域名,提高查找效率。
一实施例中,所述时空属性包括时间属性和空间属性,所述获取所述目标域名的时空属性,包括:基于所述谱系规模、谱系深度分别与时间变化的关系,获得所述目标域名的所述时间属性;基于所述基础属性中的IP定位信息与所述时间属性获取所述空间属性。
本申请实施例中,通过谱系属性在时间上的变化获取目标域名的时间属性,从而使得域名描述模型能够描述目标域名的发展情况,通过IP定位信息与时间属性获取空间属性,使得域名描述模型能够描述目标域名在地理位置上的变化情况。由此,通过时间属性和空间属性,较为全面地描述域名的变化情况,通过变化情况可以辅助用户更为准确地评估域名,获取对目标域名更为准确的评估结果。
一实施例中,获取所述基础属性包括:向所述目标域名的域名注册机构发送信息获取请求,以获取所述目标域名的基础属性;获取所述应用属性包括;对所述域名对应的网站进行探测,以获取所述目标域名的应用属性。
本申请实施例中,通过分别向域名的域名注册机构发送请求与向域名对应的网站进行探测,由此分别获取目标域名基础属性与应用属性的相关信息,便于获取与使用目标域名较为准确的信息,以实现对目标域名较为准确的描述,使得域名的测绘数据与域名评估结果更为准确。
第三方面,本申请实施例提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如第一方面所述的域名数据处理方法或实现如第二方面所述域名描述方法装置的功能。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述可读存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行如第一方面所述的域名数据处理方法或实现如第二方面所述域名描述方法装置的功能。
本公开的其他特征和优点将在随后的说明书中阐述,或者,部分特征和优点可以从说明书推知或毫无疑义地确定,或者通过实施本公开的上述技术即可得知。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举本发明较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请一实施例提供的域名数据处理方法的流程图;
图2为本申请一实施例提供的域名描述构建方法的流程图;
图3为本申请一实施例提供的域名描述模型的示意图;
图4为本申请一实施例提供的电子设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
实施例1
请参阅图1,图1为本申请一实施例提供的一种域名数据处理方法的流程图,该域名数据处理方法可以包括以下步骤。
S110,获取网络空间的域名集合及与域名集合中各域名对应的域名信息。
本实施例中,网络空间可以是局域网或广域网,例如,广域网为互联网,局域网可以为某公司的内部网。
一实施例中,获取网络空间的域名集合的方式,可以是主动探测或被动探测,还可以是从第三方数据获取。
本实施例中,主动探测可以是向目标网络空间的IP(Internet ProtocolAddress,互联网协议地址)的发送请求信息,获取网络空间所拥有的域名集合。可以理解的是,现有技术中存在较多的获取域名集合的方式,主动探测获取域名集合的方式可以参考现有技术,例如从网站爬取或通过IP地址全集实现IP对应的网络空间扫描,解析gTLD(Generic top-level domain,通用顶级域)区域文件、顶级域名区域文件、方向DNS(DomainName System,域名系统)记录文件等文件提取文件中的域名集合,在此不再赘述。
本实施例中,第三方数据获取可以使用现有的一些网络空间探测平台,对所需要探测的网络空间进行探测,获取包括域名集合和域名集合中各域名对应的域名信息在内的探测数据。
本实施例中,被动探测还可以是在网络空间的流量出口处设置网络流量探针,收集该网络空间出口处的流量,从所收集的流量中提取域名及域名相关的信息,以获得域名集合。
本实施例中,域名信息可以包括域名对应IP地址、所有者、注册信息、解析路径、证书加密方式、状态信息、到期时间、更新时间、注册链接等基础信息,还可以包括域名主页信息、证书信息、域名的历史变化信息、IP地址对应的定位信息等域名信息。需要说明的是,在目标网络空间为局域网时,无需域名的注册信息和解析路径。
本实施例中,在获取到域名集合之后,还可以通过不同的方式获取域名集合中各域名对应的域名信息。例如,可以是直接利用搜索引擎获取域名集合中各域名对应的域名信息,以及模拟域名请求获取主页信息,由此,获取包括域名的相关链接、应用场景、关键词、对应文本等信息。再例如,获取域名不变的静态信息,可以利用whois数据库查询域名对应的所有者、注册时间、到期时间、状态等信息;可以模拟域名解析过程,以获取域名的解析路径和域名对应IP地址;还可以通过模拟域名访问获取网站证书,包括但不限于证书颁发机构、证书加密方式、证书公钥等信息。还可以理解,获取域名信息的方式可以参考现有技术,在此不再赘述。
本实施例中,对于数据的获取方式,本领域技术人员可以选择一种或多种方式进行。在一些实施例中,域名信息作为描述域名的基础,需尽可能全面的获取网络空间的域名集合及各域名对应的域名信息,因此,可以在获取域名集合及域名信息时,使用多种数据获取方式,丰富数据来源,具体地,数据来源可以包括第三方数据、主动探测及被动探测,以使所获取到的数据更为全面。
本实施例中,在获取到域名集合及域名集合中各域名对应的域名信息之后,可以将域名及对应的域名信息存储数据库中,以便后续能够直接调用所需要的域名信息。
S120,基于与域名集合中各域名对应的域名信息,构建域名谱系,域名谱系用于表征域名集合中各域名之间关系。
本实施例中,域名之间的关系包括父域名、子域名、同源域名,例如,某一域名与其他域名之间的关系,可以是其他域名的父域名,子域名、同源域名。其中,同源域名是指两域名拥有共同的父域名或同属相同的所有者,例如fanyi.baidu.com和ditu.baidu.com为同源域名,拥有共同的父域名baidu.com。再例如,在a.com和b.com两域名均属于同一公司时,a.com和b.com也为同源域名。
一实施例中,基于与所述域名集合中各域名对应的域名信息,构建域名谱系,包括:在确定域名集合中任意两域名之间各自的whois数据所有者字段一致性、域名对应网站证书一致性、域名字符串后缀、域名解析路径相似度的四者中的任意一项满足预设比对条件时,建立两域名之间的关系。
本实施例中,可以通过比对域名之间的whois数据所有者字段一致性、域名对应网站证书一致性、域名字符串后缀、域名解析路径相似度等方式确定域名之间的关系,进而建立域名之间的谱系。
具体地,在两域名的whois数据库中查询到的所有者字段相同时,可以判断两域名属于同一公司,进而可以确定两域名为同源域名。可以理解,通过whois数据库可以查询到域名对应的域名所有者的信息,在所有者字段相同时,则表征两域名同属一个所有者,即可确定两者为同源域名。
在两域名之间的域名字符串后缀相同时,可以确定两域名之间存在关系,例如,fanyi.baidu.com和ditu.baidu.com的后缀相同,均为baidu.com,则可确定两者为同源域名。
进一步地,在一域名后缀与另一域名完全相同时,则可确定两者为父域名与子域名的关系,如域名fanyi.baidu.com的后缀与域名baidu.com相同,可确定域名fanyi.baidu.com为域名baidu.com的子域名。
比对两域名对应的网站证书的一致性,可以是通过比对网站证书中的证书序列号是否相同,在两证书的证书序列号相同时,则可认为两网站证书一致,进而确定两者属于同一所有者,并确定两域名为同源域名。
进一步地,证书还有备用名称,可以通过上述的比对证书域名字符串后缀的方式确定两域名之间的关系。
通过比对域名解析路径相似度确定两域名的方式中,可以是通过对比域名解析路径的最后一跳是否相同,在解析路径最后一跳相同时,可以在一定程度上确定两域名之间存在同源域名的关系。
本实施例中,在构建域名的谱系之后,可以向用户展示域名谱系,以便于用户能够根据谱系中表征的各域名之间的关系,快速发现与所需域名相关的其他域名,进而获取其他域名对应的域名信息,从而提高域名及域名信息的发现与获取效率。
本实施例中,在构建域名集合中各域名的谱系之后,还可以将谱系存入预设的数据库中。
S130,基于与域名集合中各域名对应的域名信息,获取域名集合中各域名对应的时空变化信息。
一实施例中,时空变化信息包括时间变化信息和空间变化信息,基于与域名集合中各域名对应的域名信息,获取域名集合中各域名对应的时空变化信息,包括:基于历史变化信息获取对应域名的时间变化信息;基于IP定位信息获取对应域名的空间变化信息。
本实施例中,针对域名变化情况导致所需域名监管/探测困难的问题,通过对所获取的域名信息进行处理,获取域名在时间维度和空间维度的变化信息,进而便于从变化信息中确定所需要的域名。具体地,在前述获取的与域名集合中各域名对应的域名信息中,包括域名的历史变化信息与IP定位信息。例如,历史变化信息可以包括一父域名下的子域名的各类信息随时间变化的信息,如历年的子域名数量、注册时间等信息。IP定位信息用于对域名分布情况进行确定,例如,域名有对应一个对应IP地址,IP地址的地理位置则可以用于表征域名的地理位置。
具体地,时间变化信息可以是通过对历史变化信息进行时间维度上的处理获得,如可以是提取同一域名在不同时间段的信息,不同域名根据时间进行分类等,例如,同一域名在不同时期的某些信息的变化,可以是所有者、对应IP、注册状态等,再例如,还可以是某一公司所拥有的同源域名的数量随时间的变化情况,具体地,某公司第一年所拥有的域名数量为4个,第二年拥有的域名数量为8个。由于一个域名有一个对应的IP,因此,IP定位信息所表征的地理位置可以用于表征域名的地理位置,进而通过不同域名对应的IP定位信息,可以确定出不同域名的地理位置分布情况。
在这里,对通过时间变化信息与谱系确定特定类型域名的方式进行举例说明,以便于本领域技术人员理解本方案的技术效果。首先,对于部分特定类型的域名,用户可以快速获取。例如,对于包括特定后缀的域名,或目标公司所拥有的域名等,通过域名的谱系均可快速获取所需要的域名。其次,由于所获取的数据为静态信息与动态信息的结合,为用户展示的数据包括静态信息与动态信息,其中,静态信息为域名注册信息、网站证书等不变的信息,动态信息为域名数量、域名规模、域名地址等可以变化的信息,因此,用户可以通过各域名的变化情况,基于历史、地理位置等信息确定出各域名中明显有异常的域名,如域名地理位置与其他同源域名分布异常,注册时间又较短,则可结合注册信息、网站证书等静态信息,判断该域名是否为恶意域名,并进行后续处理。
本申请实施例中,通过获取域名集合与域名集合中各域名对应的域名信息,从而建立表征域名集合中各域名之间关系的谱系,使得用户能够从谱系中快速查找所需类型的域名,通过获取域名的时空变化信息,从而能够快速了解域名的变化情况与发展情况,进而对域名进行准确的评估。由此,通过域名信息、谱系和时空变化信息,能够对网络空间中的域名进行更为全面的描述,从而使用户掌握域名更为全面的情况,辅助用户获得更为准确的域名评估结果。
实施例2
基于同一发明构思,本申请提供了一种域名描述方法,用于从多角度共同构建对单个域名的域名描述,以使用户从域名描述中获取该域名较为全面的域名信息。
请参阅图2,图2为一实施例提供的一种域名描述方法的流程图,域名描述方法包括:
S210,获取目标域名的基础属性和应用属性。
本实施例中,基础属性包括但不限于:域名状态、注册时间、到期时间、更新时间、域名标识符、域名服务器、空间地址、IP地址、域名的所有者、域名邮箱、注册商等。
本实施例中,应用属性包括但不限于:网站主页、主页关键词、主页标题、主页证书及URL(Uniform Resource Locator,统一资源定位器),其中,主页证书可以包括证书版本、序列号、签名算法、颁发者、有效期及使用者等。
本实施例中,获取目标域名的基础属性和应用属性,可以是从预先存储在数据库中的数据进行调取,还可以是向目标域名对应的注册机构或网站进行探测。
一实施例中,获取基础属性包括:向目标域名的域名注册机构发送信息获取请求,以获取目标域名的基础属性。
本实施例中,可以通过搜索引擎查询注册该域名的注册机构,从而确定目标域名的注册机构。通过向目标域名对应的注册机构发送请求,获取注册机构返回的响应信息,对响应信息进行标准化,转换为统一格式的信息,并从统一格式的信息中筛选、提取,获取所需要的字段信息,即基础属性的各种信息。
一实施例中,获取应用属性包括:对目标域名对应的网站进行探测,以获取所述目标域名的应用属性。
本实施例中,通过目标域名,可以确定目标域名对应的网站,通过向目标域名对应的网站进行探测,可以获取网站的主页信息、证书信息等应用属性。通过将所获取的应用属性进行标准化处理,转换为统一的格式,并从中筛选、提取所需要的字段信息。
本实施例中,获取目标域名的基础属性和应用属性的方式,还可以是从实施例1中的数据库调用,也可以是从第三方数据平台获取目标域名的基础属性和应用属性。
S220,获取目标域名的谱系属性和时空属性。
本实施例中,谱系属性包括但不限于目标域名的谱系规模、谱系深度及同源关系等。具体地,谱系属性可以包括目标域名的父域名、同源域名集合、子域名集合、解析路径图及谱系规模。
本实施例中,时空属性包括时间属性与空间属性,其中,时间属性用于表征谱系规模、谱系深度分别与时间变化的关系,空间属性用于表征域名的地理位置。具体地,时空属性可以包括时间戳、解析类型、历史解析结果、地理位置、解析IP地址集合等。
本实施例中,谱系属性和时空属性可以是从预先获取的数据中直接调取,也可以是通过对目标的基础属性和应用属性进行处理获取的。
本实施例中,谱系属性可以是使用上述实施例1中方式构建域名谱系,并获取所构建的域名谱系。时空属性可以是从实施例1中所获取的时空变化信息中,提取与目标域名相关的时空变化信息,从而确定为目标域名的时空属性。
一实施例中,基于谱系属性,可以获取目标域名的谱系规模、谱系深度及同源关系。其中,同源域名、谱系深度、谱系规模都可以用于表征目标域名的发展情况。
本实施例中,在获取目标域名的谱系属性之后,可以通过谱系属性中域名之间的关系,获取目标域名的父域名、子域名集合、同源域名集合,例如,baidu.com,子域名集合包括ditu.baidu.com与fanyi.baidu.com等,同源域名集合中可以包括hao123.com。
同理,根据谱系属性,还可以确定谱系深度,谱系深度可以理解为存在递进关系的域名所形成的关系链的长度,如baidu.com的父域名为com,子域名为ditu. baidu.com,进一步地,ditu. baidu.com的子域名为A.ditu. baidu.com。
根据谱系属性,还可以确定谱系规模可以包括父域名、子域名、同源域名之间的关系及数量,如baidu.com,父域名为com,包括ditu. baidu.com和fanyi.baidu.com等若干个子域名,包括hao123.com等若干个同源域名。
一实施例中,基于谱系规模、谱系深度分别与时间变化的关系,获得目标域名的所述时间属性;基于基础属性中的IP定位信息与时间属性获取空间属性。
本实施例中,目标域名的谱系规模、谱系深度可能是随时间变化的,如因发展需要新注册了域名,注销一些不需要的域名等,因此,可以建立谱系规模与谱系深度随时间的变化的信息,即时间属性。例如,谱系规模随时间的变化可以是同源域名的增加与减少、子域名的增加/减少等;谱系深度随时间的变化可以是在原有谱系深度的基础上,增加了新的子域名,或较少了部分子域名等。
本实施例中,空间属性包括域名的地理位置及地理位置的变化情况。域名与IP存在对应关系,因此,IP的定位信息可以用于确定域名的位置信息,在此基础上,可以基于IP定位信息确定域名的地理位置。进一步地,还可以通过时间IP定位信息确定的地理位置,来确定域名地理位置随时间的变化情况,例如,第一时间的IP定位信息所表征的地方为A地,第二时间的IP定位信息所表征的地方为B地,则可确定域名的地理位置发生变化,从A地变为B地。
S230,基于基础属性、应用属性、谱系属性及时空属性预设的域名描述模型进行赋值,以描述目标域名。
请参阅图3,图3为本申请一实施例提供的域名描述模型的示意图。
本实施例中,在获取到目标域名的基础属性、应用属性、谱系属性及时空属性之后,可以对预先构建的域名描述模型进行赋值,从而使域名描述模型能够对目标域名进行描述。具体地,可以将所提取出的基础属性、应用属性的不同信息的字段对域名描述模型中的相应位置进行赋值,以完成对基础属性及应用属性的填充。
本实施例中,将所获取的谱系属性及时空属性对域名描述模型中的相应位置进行赋值,以完成对谱系属性及时空属性的填充。其中,基于所获取到的谱系规模、谱系深度、同源关系对谱系属性的赋值,基于所获取到的时间属性和空间属性对时空属性进行赋值。
一实施例中,需预先构建的域名描述模型,预设的域名描述模型包括基础属性条目、应用属性条目、谱系属性条目、时空属性条目。
本实施例中,在构建预设的域名描述模型时,分别构建基础属性条目、应用属性条目、谱系属性条目、时空属性条目,在各条目中,还可以分别设置与所属条目属性类型相同类型的子条目,使得在获取到描述域名的基础属性、应用属性、谱系属性、时空属性各类属性时,能够提取所获取属性的字段信息对相应的属性进行赋值,进而构建对目标域名的域名描述模型。
本申请实施例中,通过所获取的基础属性、应用属性、谱系属性和时空属性对预设的域名描述模型进行赋值,从而使赋值后的域名描述模型能够全面的对目标域名进行描述,为用户提供目标域名更为全面的信息,实现域名数据的共享。由于描述目标域名的属性包括变化的谱系属性与时空属性,使得域名描述模型能够为用户提供目标域名的变化情况,为能够对域名进行更为准确地评估、测绘。
上述实施例提供的方法可以实现为一种计算机可读指令的形式,计算机可读指令可以在如图3所示的电子设备上运行。
本申请实施例还提供的一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机可读指令,该处理器执行该程序时实现上述实施例提供的方法。
图4为根据本申请的一个实施例的电子设备的内部结构示意图,电子设备可以为服务器。请参阅图4,该电子设备包括通过系统总线连接的处理器、非易失性存储介质、内存储器、输入装置、显示屏和网络接口。其中,该电子设备的非易失性存储介质可存储操作系统和计算机可读指令,该计算机可读指令被执行时,可使得处理器执行本申请上述实施例提供的方法,该方法的具体实现过程可参考图1、图2的具体内容,在此不再赘述。该电子设备的处理器用于提供计算和控制能力,支撑整个电子设备的运行。该内存储器中可储存有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行上述实施例提供的方法。电子设备的输入装置用于各个参数的输入,电子设备的显示屏用于进行显示,电子设备的网络接口用于进行网络通信。本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
基于同一发明构思,本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序在被运行时执行上述实施例中提供的方法。
该存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如软盘、硬盘、磁带)、光介质(例如DVD)、或者半导体介质(例如固态硬盘Solid State Disk (SSD))等。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种域名数据处理方法,其特征在于,包括:
获取网络空间的域名集合及与所述域名集合中各域名对应的域名信息;
基于与所述域名集合中各域名对应的域名信息,构建域名谱系,所述域名谱系用于表征所述域名集合中各域名之间的关系;
基于与所述域名集合中各域名对应的域名信息,获取所述域名集合中各域名对应的时空变化信息。
2.根据权利要求 1所述的方法,其特征在于,所述域名集合中各域名对应的域名信息包括历史变化信息与IP定位信息,所述时空变化信息包括时间变化信息和空间变化信息,所述基于与所述域名集合中各域名对应的域名信息,获取所述域名集合中各域名对应的时空变化信息,包括:基于所述历史变化信息获取对应域名的所述时间变化信息;基于所述IP定位信息获取对应域名的所述空间变化信息。
3.根据权利要求1所述的方法,其特征在于,所述获取网络空间的域名集合及与所述域名集合中各域名对应的域名信息,包括:通过第三方数据获取所述域名集合,和/或主动探测网络空间的域名,以获取所述域名集合;
获取与所述域名集合中各域名对应的域名信息包括:针对所述域名集合中的每一域名,主动请求该域名的域名信息;
所述获取网络空间的域名集合及与所述域名集合中各域名对应的域名信息,还包括:通过设置在所述网络空间出口流量探针获取所述域名集合与所述域名集合中各域名对应的域名信息。
4.根据权利要求1所述的方法,其特征在于,所述域名集合中各域名对应的域名信息包括whois数据所有者字段、域名对应网站证书、域名字符串后缀、域名解析路径,所述基于与所述域名集合中各域名对应的域名信息,构建域名谱系,包括:在确定所述域名集合中任意两域名之间各自的所述whois数据所有者字段一致性、所述域名对应网站证书一致性、所述域名字符串后缀、所述域名解析路径的相似度的四者中的任意一项满足预设比对条件时,建立所述两域名之间的关系。
5.一种域名描述方法,其特征在于,包括:
获取目标域名的基础属性和应用属性;
获取所述目标域名的谱系属性和时空属性,所述谱系属性用于描述所述目标域名与其他域名的关系,所述时空属性用于描述目标域名在时间维度与空间维度的变化;
基于所述基础属性、所述应用属性、所述谱系属性及所述时空属性对预设的域名描述模型进行赋值,以描述所述目标域名。
6.根据权利要求5所述的方法,其特征在于,所述基于所述基础属性、所述应用属性、所述谱系属性及所述时空属性填充预设的域名描述模型之前,所述方法还包括:构建所述预设的域名描述模型,所述预设的域名描述模型包括基础属性条目、应用属性条目、谱系属性条目、时空属性条目。
7.根据权利要求6所述的方法,其特征在于,所述基于所述基础属性、所述应用属性、所述谱系属性及所述时空属性填充预设的域名描述模型之前,所述方法还包括:基于所述谱系属性,获取所述目标域名的谱系规模、谱系深度及同源关系,
所述基于所述基础属性、所述应用属性、所述谱系属性及所述时空属性填充预设的域名描述模型,填充后的所述域名描述模型用于描述所述域名,包括:基于所述谱系规模、所述谱系深度及所述同源关系对所述预设的域名描述模型的谱系属性条目赋值。
8.根据权利要求7所述的方法,其特征在于,所述时空属性包括时间属性和空间属性,所述获取所述目标域名的时空属性,包括:基于所述谱系规模、谱系深度分别与时间变化的关系,获得所述目标域名的所述时间属性;基于所述基础属性中的IP定位信息与所述时间属性获取所述空间属性。
9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1-4任一项所述的方法或执行如权利要求5-8任一项所述的方法。
10.一种存储介质,一种计算机可读存储介质,其特征在于,所述可读存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行如权利要求1-4任一项所述的方法或执行如权利要求5-8任一项所述的方法。
CN202210076293.6A 2022-01-24 2022-01-24 域名数据处理方法、域名描述方法、电子设备及存储介质 Pending CN114124895A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210076293.6A CN114124895A (zh) 2022-01-24 2022-01-24 域名数据处理方法、域名描述方法、电子设备及存储介质
CN202210374744.4A CN115277633A (zh) 2022-01-24 2022-01-24 域名描述方法、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210076293.6A CN114124895A (zh) 2022-01-24 2022-01-24 域名数据处理方法、域名描述方法、电子设备及存储介质

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202210374744.4A Division CN115277633A (zh) 2022-01-24 2022-01-24 域名描述方法、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN114124895A true CN114124895A (zh) 2022-03-01

Family

ID=80361112

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202210076293.6A Pending CN114124895A (zh) 2022-01-24 2022-01-24 域名数据处理方法、域名描述方法、电子设备及存储介质
CN202210374744.4A Pending CN115277633A (zh) 2022-01-24 2022-01-24 域名描述方法、电子设备及存储介质

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202210374744.4A Pending CN115277633A (zh) 2022-01-24 2022-01-24 域名描述方法、电子设备及存储介质

Country Status (1)

Country Link
CN (2) CN114124895A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115086411A (zh) * 2022-06-16 2022-09-20 京东城市(北京)数字科技有限公司 一种ip定位方法、系统、存储介质及电子设备
CN115277636A (zh) * 2022-09-14 2022-11-01 中国科学院大学 一种泛域名解析方法和系统
CN116723051A (zh) * 2023-08-07 2023-09-08 北京安天网络安全技术有限公司 一种域名情报信息生成方法、装置及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016198635A1 (fr) * 2015-06-11 2016-12-15 Dot Stories Sa Gestion de noms de domaine du reseau internet
CN109165334A (zh) * 2018-09-20 2019-01-08 恒安嘉新(北京)科技股份公司 一种建立cdn厂家基础知识库的方法
CN109241292A (zh) * 2018-08-13 2019-01-18 恒安嘉新(北京)科技股份公司 一种基于主被动数据建立域名服务器体系知识图谱的方法
CN112995361A (zh) * 2021-04-30 2021-06-18 鹏城实验室 域名知识图谱构建方法、装置、设备及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7908281B2 (en) * 2006-11-22 2011-03-15 Architecture Technology Corporation Dynamic assembly of information pedigrees
US9935970B2 (en) * 2015-10-29 2018-04-03 Duo Security, Inc. Methods and systems for implementing a phishing assessment

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016198635A1 (fr) * 2015-06-11 2016-12-15 Dot Stories Sa Gestion de noms de domaine du reseau internet
CN109241292A (zh) * 2018-08-13 2019-01-18 恒安嘉新(北京)科技股份公司 一种基于主被动数据建立域名服务器体系知识图谱的方法
CN109165334A (zh) * 2018-09-20 2019-01-08 恒安嘉新(北京)科技股份公司 一种建立cdn厂家基础知识库的方法
CN112995361A (zh) * 2021-04-30 2021-06-18 鹏城实验室 域名知识图谱构建方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
包正晶等: "域名画像系统的设计与实现", 《信息技术与网络安全》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115086411A (zh) * 2022-06-16 2022-09-20 京东城市(北京)数字科技有限公司 一种ip定位方法、系统、存储介质及电子设备
CN115086411B (zh) * 2022-06-16 2023-12-05 京东城市(北京)数字科技有限公司 一种ip定位方法、系统、存储介质及电子设备
CN115277636A (zh) * 2022-09-14 2022-11-01 中国科学院大学 一种泛域名解析方法和系统
CN115277636B (zh) * 2022-09-14 2023-08-01 中国科学院大学 一种泛域名解析方法和系统
CN116723051A (zh) * 2023-08-07 2023-09-08 北京安天网络安全技术有限公司 一种域名情报信息生成方法、装置及介质
CN116723051B (zh) * 2023-08-07 2023-10-27 北京安天网络安全技术有限公司 一种域名情报信息生成方法、装置及介质

Also Published As

Publication number Publication date
CN115277633A (zh) 2022-11-01

Similar Documents

Publication Publication Date Title
CN114124895A (zh) 域名数据处理方法、域名描述方法、电子设备及存储介质
US10757101B2 (en) Using hash signatures of DOM objects to identify website similarity
US9686283B2 (en) Using hash signatures of DOM objects to identify website similarity
US20210314354A1 (en) Techniques for determining threat intelligence for network infrastructure analysis
US11816161B2 (en) Asset search and discovery system using graph data structures
Chen et al. Web service recommendation via exploiting location and QoS information
US9172591B2 (en) System and method for management of cloud-based systems
US20210194775A1 (en) Internet address structure analysis, and applications thereof
US20100293168A1 (en) Determining configuration parameter dependencies via analysis of configuration data from multi-tiered enterprise applications
US20060224689A1 (en) Methods, systems, and computer program products for providing customized content over a network
CN109165334B (zh) 一种建立cdn厂家基础知识库的方法
CN104468860A (zh) 域名解析服务器危险性的识别方法和装置
EP3913888A1 (en) Detection method for malicious domain name in domain name system and detection device
US20130054782A1 (en) Determination of unauthorized content sources
Shestakov Databases on the web: national web domain survey
CN112751948B (zh) 基于协同过滤的dns缓存推荐方法
Shestakov Sampling the national deep web
Dodge et al. Internet-based measurement
CN113079034B (zh) 互联网基础资源及其关系模型、及模型的构建、应用方法
CN112015910A (zh) 域名知识库的生成方法、装置、计算机设备及存储介质
JP6170001B2 (ja) 通信サービス分類装置、方法及びプログラム
CN111885220B (zh) 一种目标单位ip资产主动获取与验证方法
Harika et al. Extraction of knowledge from web server logs using web usage mining
CN113849576A (zh) 一种基于知识图谱的特定群体分析方法与系统
Ahlers et al. Mapping the Web resources of a developing country

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20220301

RJ01 Rejection of invention patent application after publication