CN112632372B - 一种电子证据信息的上链方法、装置、区块链节点设备 - Google Patents

一种电子证据信息的上链方法、装置、区块链节点设备 Download PDF

Info

Publication number
CN112632372B
CN112632372B CN202011453433.4A CN202011453433A CN112632372B CN 112632372 B CN112632372 B CN 112632372B CN 202011453433 A CN202011453433 A CN 202011453433A CN 112632372 B CN112632372 B CN 112632372B
Authority
CN
China
Prior art keywords
information
resource information
network environment
resource
filtering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011453433.4A
Other languages
English (en)
Other versions
CN112632372A (zh
Inventor
李伟
邱炜伟
匡立中
谢杨洁
张瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Qulian Technology Co Ltd
Original Assignee
Hangzhou Qulian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Qulian Technology Co Ltd filed Critical Hangzhou Qulian Technology Co Ltd
Priority to CN202011453433.4A priority Critical patent/CN112632372B/zh
Priority to PCT/CN2020/138512 priority patent/WO2022120951A1/zh
Publication of CN112632372A publication Critical patent/CN112632372A/zh
Application granted granted Critical
Publication of CN112632372B publication Critical patent/CN112632372B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请提供了一种电子证据信息的上链方法、装置以及区块链节点设备,用于精简化上链的电子证据。方法包括:确定待取证的目标网页;获取目标网页的第一网络环境信息以及第一资源信息,第一资源信息为目标网页中展示的资源信息;对第一网络环境信息以及第一资源信息两者进行过滤处理,得到过滤后的第二网络环境信息以及第二资源信息,其中,过滤处理用于根据预设的信息过滤策略过滤第一网络环境信息以及第一资源信息两者中的无效信息;基于第二网络环境信息以及第二资源信息,提取目标网页的截图信息以及第二资源信息,第二资源信息为目标网页中展示的以及后台的资源信息;将第二网络环境信息、截图信息以及第二资源信息上传至区块链平台。

Description

一种电子证据信息的上链方法、装置、区块链节点设备
技术领域
本申请涉及信息安全领域,具体涉及一种电子证据信息的上链方法、装置、区块链节点设备。
背景技术
电子取证,是指对互联网上公开的网页信息、源码信息,在合法范围内采集形成的电子证据,这些证据可以是图片或者文件,其具备合法性、客观真实性、完整关联性,从采集到存储的过程透明可信和证据的效力程度严格关联。在实际应用中,侵权人在得知权利人发现侵权行为后往往会对侵权证据采取删除、销毁等手段,因此,在第一时间内完整地保存电子证据,是维护当事人合法权益、解决诉讼纷争的保障。
在上述电子取证的背景下,随着区块链技术的不断成熟,现今已出现了基于区块链搭建的电子存证系统,区块链可以理解为是一种去中心化的数据库,通过分布式数据存储、点对点传输、共识机制、加密算法等计算机技术,具有数据不可篡改、数据真实有效的优点,因此基于区块链进行电子存证,具有较强的应用需求。
而在现有的相关技术的研究过程中,发明人发现,现有的基于区块链搭建的电子存证系统,由于系统上电子证据在数据量上的不断暴增,在存储成本以及运算成本上,对于区块链各节点都产生了不少的负担,换句话说,基于区块链搭建的电子存证系统,其系统的维护成本正不断加大。
发明内容
本申请提供了一种电子证据信息的上链方法、装置以及区块链节点设备,用于当通过区块链进行电子存证时,可在一定程度上可精简化上链的电子证据,减轻海量电子证据对区块链平台所造成的负担。
第一方面,本申请提供了一种电子证据信息的上链方法,方法包括:
确定待取证的目标网页;
获取目标网页的第一网络环境信息以及第一资源信息,第一资源信息为目标网页中展示的资源信息;
对第一网络环境信息以及第一资源信息两者进行过滤处理,得到过滤后的第二网络环境信息以及第二资源信息,其中,过滤处理用于根据预设的信息过滤策略过滤第一网络环境信息以及第一资源信息两者中的无效信息;
基于第二网络环境信息以及第二资源信息,提取目标网页的截图信息以及第二资源信息,第二资源信息为目标网页中展示的以及后台的资源信息;
将第二网络环境信息、截图信息以及第二资源信息上传至区块链平台。
结合本申请第一方面,在本申请第一方面第一种可能的实现方式中,获取目标网页的第一资源信息,包括:
访问目标网页;
对目标网页中展示的资源信息进行识别,确定关键资源信息,作为第一资源信息。
结合本申请第一方面,在本申请第一方面第二种可能的实现方式中,信息过滤策略包括:
检测第一网络环境信息是否携带白名单标识或者第一网络环境信息是否包含在白名单中,若否,则进行过滤;
或者,检测第一资源信息所包含内容是否存在文学作品、音乐作品、图片作品、影视作品、网络言论、业务说明或者商品说明的信息,若否,则进行过滤;
或者,检测第一网络环境信息以及第一资源信息中的目标信息是否完整,若否,则进行过滤;
或者,检测第一资源信息中所包含内容是否与目标网页的预设网页内容或者网页类型相匹配,若否,则进行过滤。
结合本申请第一方面,在本申请第一方面第三种可能的实现方式中,将第二网络环境信息、截图信息以及第二资源信息上传至区块链平台之前,方法还包括:
在第二网络环境信息、截图信息以及第二资源信息中,过滤掉与第一网络环境信息以及第一资源信息在数据相似度上超出相似度范围的信息,得到过滤后的第二网络环境信息、过滤后的截图信息以及过滤后的第二资源信息;
将第二网络环境信息、截图信息以及第二资源信息上传至区块链平台,包括:
将过滤后的第二网络环境信息、过滤后的截图信息以及过滤后的第二资源信息上传至区块链平台。
结合本申请第一方面第三种可能的实现方式,在本申请第一方面第四种可能的实现方式中,在第二网络环境信息、第二资源信息以及第二资源信息中,过滤掉与第一网络环境信息以及第一资源信息在数据相似度上超出相似度范围的信息,包括:
在第二网络环境信息、截图信息以及第二资源信息中,过滤掉获取时间点与第一网络环境信息以及第一资源信息的获取时间点之间的时间差超出预设时间差范围的信息。
结合本申请第一方面,在本申请第一方面第五种可能的实现方式中,确定待取证的目标网页包括:
当接收到网页生成提示信息时,将网页生成提示信息所提示的新生成的网页,确定为目标网页;
或者,当监测到预设网页中的网页信息发生更新时,将预设网页确定为目标网页。
结合本申请第一方面,在本申请第一方面第六种可能的实现方式中,第一资源信息包括目标网页中展示的文本或者图像,第二资源信息包括网页媒体资源、网页源码,截图信息为通过全截图方式取得的截图信息。
第二方面,本申请提供了一种电子证据信息的上链装置,装置包括:
确定单元,用于确定待取证的目标网页;
获取单元,用于获取目标网页的第一网络环境信息以及第一资源信息,第一资源信息为目标网页中展示的资源信息;
过滤单元,用于对第一网络环境信息以及第一资源信息两者进行过滤处理,得到过滤后的第二网络环境信息以及第二资源信息,其中,过滤处理用于根据预设的信息过滤策略过滤第一网络环境信息以及第一资源信息两者中的无效信息;
提取单元,用于基于第二网络环境信息以及第二资源信息,提取目标网页的截图信息以及第二资源信息,第二资源信息为目标网页中展示的以及后台的资源信息;
上传单元,用于将第二网络环境信息、截图信息以及第二资源信息上传至区块链平台。
结合本申请第二方面,在本申请第二方面第一种可能的实现方式中,获取单元,具体用于:
访问目标网页;
对目标网页中展示的资源信息进行识别,确定关键信息,作为第一资源信息。
结合本申请第二方面,在本申请第二方面第二种可能的实现方式中,信息过滤策略包括:
检测第一网络环境信息是否携带白名单标识或者第一网络环境信息是否包含在白名单中,若否,则进行过滤;
或者,检测第一资源信息所包含内容是否存在文学作品、音乐作品、图片作品、影视作品、网络言论、业务说明或者商品说明的信息,若否,则进行过滤;
或者,检测第一网络环境信息以及第一资源信息中的目标信息是否完整,若否,则进行过滤;
或者,检测第一资源信息中所包含内容是否与目标网页的预设网页内容或者网页类型相匹配,若否,则进行过滤。
结合本申请第二方面,在本申请第二方面第三种可能的实现方式中,过滤单元,还用于:
在第二网络环境信息、截图信息以及第二资源信息中,过滤掉与第一网络环境信息以及第一资源信息在数据相似度上超出相似度范围的信息,得到过滤后的第二网络环境信息、过滤后的截图信息以及过滤后的第二资源信息;
上传单元,具体用于;
将过滤后的第二网络环境信息、过滤后的截图信息以及过滤后的第二资源信息上传至区块链平台。
结合本申请第二方面第三种可能的实现方式,在本申请第二方面第四种可能的实现方式中,过滤单元,具体用于:
在第二网络环境信息、截图信息以及第二资源信息中,过滤掉获取时间点与第一网络环境信息以及第一资源信息的获取时间点之间的时间差超出预设时间差范围的信息。
结合本申请第二方面,在本申请第二方面第五种可能的实现方式中,确定单元,用于:
当接收到网页生成提示信息时,将网页生成提示信息所提示的新生成的网页,确定为目标网页;
或者,当监测到预设网页中的网页信息发生更新时,将预设网页确定为目标网页。
结合本申请第二方面,在本申请第二方面第六种可能的实现方式中,第一资源信息包括目标网页中展示的文本或者图像,第二资源信息包括网页媒体资源、网页源码,截图信息为通过全截图方式取得的截图信息。
第三方面,本申请还提供了一种区块链节点设备,包括处理器和存储器,存储器中存储有计算机程序,处理器调用存储器中的计算机程序时执行本申请第一方面或者本申请第一方面任一种可能的实现方式提供的方法。
第四方面,本申请还提供了一种计算机可读存储介质,计算机可读存储介质存储有多条指令,指令适于处理器进行加载,以执行本申请第一方面或者本申请第一方面任一种可能的实现方式提供的方法。
从以上内容可得出,本申请具有以下的有益效果:
对于基于区块链搭建的电子存证系统,本申请由区块链节点进行电子取证,在确定待取证的目标网页后,获取该目标网页的第一网络环境信息以及第一资源信息,该第一资源信息为目标网页中展示的资源信息,再对该第一网络环境信息以及第一资源信息两者进行过滤,根据预设的信息过滤策略过滤第一网络环境信息以及第一资源信息两者中的无效信息,再基于过滤得到的第二网络环境信息以及第二资源信息,提取该目标网页的截图信息以及第二资源信息,该第二资源信息为目标网页中展示的以及后台的资源信息,再将第二网络环境信息、截图信息以及第二资源信息上传至区块链平台,完成上链,在该电子取证机制下,由于对初始获取的第一网络环境信息以及第一资源信息进行了有效过滤,因此,即提高了这些数据的有效性,也大大降低了数据规模,后续再进行本身数据量更大的资源信息的提取,如此,可显著降低提取到的资源信息的数据量,因此,从该目标网页获取到的电子证据,相比于现有的电子取证机制所获取到的电子证据,具有较低数据量以及较高有效性的特点,达到精简电子证据的效果,进而上传至区块链平台完成固证时,可显著减少海量电子证据对区块链平台的负担。
附图说明
图1为本申请电子证据信息的上链方法的一种流程示意图;
图2为本申请获取第一资源信息的一种流程示意图;
图3为本申请电子证据信息的上链装置的一种结构示意图;
图4为本申请区块链节点设备的一种结构示意图。
具体实施方式
首先,在介绍本申请之前,先介绍下本申请关于应用背景的相关内容。
本申请提供的电子证据信息的上链方法、装置以及计算机可读存储介质,可应用于区块链节点设备上,用于当通过区块链进行电子存证时,可在一定程度上可精简化上链的电子证据,减轻海量电子证据对区块链平台所造成的负担。
本申请提及的电子证据信息的上链方法,其执行主体可以为信息的上链装置,或者集成了该信息的上链装置的服务器设备、物理主机或者用户设备(User Equipment,UE)等不同类型的区块链节点设备,其中,信息的上链装置可以采用硬件或者软件的方式实现,UE具体可以为智能手机、平板电脑、笔记本电脑、掌上电脑、台式电脑或者个人数字助理(Personal Digital Assistant,PDA)等终端设备,服务器可以为服务器集群的形式设置。
在现有的相关技术中,其由于在进行电子取证时,将海量的电子证据都直接上传至区块链平台进行固证,而这导致了区块链平台上电子证据的数据量上涨迅速,对于组成平台的区块链节点的存储成本以及运算成本造成了不少的负担。
基于现有的相关技术存在的上述缺陷,本申请提供了电子证据信息的上链方法,至少在一定程度上克服现有的相关技术所存在的缺陷,减少电子存证对区块链平台的负担。
下面,开始介绍本申请提供的电子证据信息的上链方法。
参阅图1,图1示出了本申请电子证据信息的上链方法的一种流程示意图,如图1示出的,本申请提供的电子证据信息的上链方法,具体可包括如下步骤:
步骤S101,确定待取证的目标网页;
步骤S102,获取目标网页的第一网络环境信息以及第一资源信息,第一资源信息为目标网页中展示的资源信息;
步骤S103,对第一网络环境信息以及第一资源信息两者进行过滤处理,得到过滤后的第二网络环境信息以及第二资源信息,其中,过滤处理用于根据预设的信息过滤策略过滤第一网络环境信息以及第一资源信息两者中的无效信息;
步骤S104,基于第二网络环境信息以及第二资源信息,提取目标网页的截图信息以及第二资源信息,第二资源信息为目标网页中展示的以及后台的资源信息;
步骤S105,将第二网络环境信息、截图信息以及第二资源信息上传至区块链平台。
从图1所示实施例可看出,对于基于区块链搭建的电子存证系统,本申请由区块链节点进行电子取证,在确定待取证的目标网页后,获取该目标网页的第一网络环境信息以及第一资源信息,该第一资源信息为目标网页中展示的资源信息,再对该第一网络环境信息以及第一资源信息两者进行过滤,根据预设的信息过滤策略过滤第一网络环境信息以及第一资源信息两者中的无效信息,再基于过滤得到的第二网络环境信息以及第二资源信息,提取该目标网页的截图信息以及第二资源信息,该第二资源信息为目标网页中展示的以及后台的资源信息,再将第二网络环境信息、截图信息以及第二资源信息上传至区块链平台,完成上链,在该电子取证机制下,由于对初始获取的第一网络环境信息以及第一资源信息进行了有效过滤,因此,即提高了这些数据的有效性,也大大降低了数据规模,后续再进行本身数据量更大的资源信息的提取,如此,可显著降低提取到的资源信息的数据量,因此,从该目标网页获取到的电子证据,相比于现有的电子取证机制所获取到的电子证据,具有较低数据量以及较高有效性的特点,达到精简电子证据的效果,进而上传至区块链平台完成固证时,可显著减少海量电子证据对区块链平台的负担。
下面,则对上述图1所示实施例中的各步骤以及在实际应用中可能采用的具体实现方式进行详细介绍。
在本申请中,电子取证由区块链节点设备执行。当区块链平台搭建了电子存证系统后,服务器设备、主机设备或者UE,可通过安装该区块链平台的应用程序(Application,APP),并注册账户,当通过平台的验证后,即可加入到平台中,如此,当触发取证并获取到电子证据后,可将证据上传至平台,完成证据的上链,即完成固证。
其中,电子取证,具体可根据不同业务场景的不同配置不同的触发方式。示例性的,电子取证机制可由网络平台配置在自身平台内的区块链节点设备上,例如购物、社交、新闻等网络平台,可对自身平台内的信息对应的目标网页,采取实时或者定时的方式,触发本申请提供的电子证据信息的上链方法,完成电子证据的取证;
例如,在网络平台内部,当接收到网页生成提示信息时,区块链节点设备将网页生成提示信息所提示的新生成的网页,确定为目标网页;
或者,当监测到预设网页中的网页信息发生更新时,区块链节点设备将预设网页确定为目标网页。
当然,在实际应用中,也可在平台、网页的相关工作人员的确认下,将平台外部的网页也配置上述的触发机制,对相关的外部网页执行本申请提供的电子证据信息的上链方法,进行电子取证。
或者,电子取证机制可由电子取证服务提供方向顾客推出的,顾客可通过应用或者浏览器访问电子取证服务提供方的服务器等区块链节点设备,并录入顾客期望执行电子取证的目标网页的网址,如此,电子取证服务提供方的服务器可根据该网址访问目标网页,触发本申请提供的电子证据信息的上链方法,对目标网页进行电子取证。
又或者,该目标网页也可根据取证需求,直接由区块链节点设备的工作人员,通过手动设置方式确定目标网页的网址,对该目标网页进行电子取证。
当然,目标网页的确定方式,除了上述列出的,也可采用其他的确定方式,具体在此不做限定。
针对目标网页采集的第一网络环境信息,具体可以为访问目标网页时涉及的相关网络环境信息,具体的,例如可以包括目标网页自身的互联网协议(Internet Protocol,IP)地址、媒体存取控制位址(Media Access Control Address,MAC)地址、域名系统(Domain Name System,DNS)信息等,进一步的,还可包括访问该目标网页的区块链节点设备本地的相关网络环境信息,例如操作系统信息、系统版本信息、网卡信息、路由信息等,该网络环境信息可用于还原区块链节点设备访问目标网页的访问场景。
针对目标网页采集的第一资源信息,容易理解的,是指区块链节点设备在访问目标网页时,目标网页所展示的资源信息,例如,可以为目标网页所展示的字段和/或图片,可以理解,当访问并打开目标网页时,自然已经对这些展示的资源信息进行了下载以及加载,在本地已有其文件,因此可以直接提取得到,相比于截图等资源二次获取操作,获取已有的目标网页的资源信息,具有轻量级数据处理的优点,大大减少了数据处理量,技术复杂度较低。
在本申请中,针对目标网页配置了两层的信息采集机制,对于初始采集阶段所采集到的第一网络环境信息以及第一资源信息,本申请则配置了过滤策略,当得到第一网络环境信息以及第一资源信息后,则可根据过滤策略预设的过滤规则,对这两者进行过滤,达到在前期提高数据有效性以及降低数据规模的效果,为轻便地电子取证留下基础。
可以理解,采集到第一网络环境信息以及第一资源信息是在访问目标网页的情况下实现的,而若目标网页存在拒绝访问的情况下,例如返回404、403等非正常返回码这类拒绝访问情况时,则难以采集到第一网络环境信息以及第一资源信息。
而当采集到第一网络环境信息以及第一资源信息后,所采用的过滤策略,基础的,可过滤信息中的错误信息,或者说异常反馈信息,例如,若目标网页存在登录限制、账号不一致、反扒策略等因素导致第一环境信息或者第一资源信息的获取结果为访问拒绝等统一回执时,可将这些未包含实际获取结果的第一环境信息以及第一资源信息进行过滤。
对于更为具体的过滤策略,作为一种示例性的实现方式,过滤策略中,具体可包括以下过滤规则:
1)检测第一网络环境信息是否携带白名单标识或者第一网络环境信息是否包含在白名单中,若否,则进行过滤;
可以理解,白名单,用于标识预先确定无需进行电子取证的网页或者标识与目标网页之间的无效访问路径,举例而言,对于具有政府公信力的网页,随时可从网页或者其他公开渠道中采集到所需的公开的电子证据,因此可以进行过滤;对于未具有取证价值的网页,例如未知域名下的部分网页,其网页本身很可能就是非法的,对这类网页的电子取证工未包含在本申请提供的电子取证系统的工作中,因此,也可进行过滤。
对于白名单的应用,具体可通过白名单标识或者在白名单中记录网页的形式,标识出无需进行电子取证的网页。
2)检测第一资源信息所包含内容是否存在文学作品、音乐作品、图片作品、影视作品、网络言论、业务说明或者商品说明的信息,若否,则进行过滤;
可以理解,电子证据背后的纷争,往往所针对的对象为文学作品、音乐作品、图片作品、影视作品、网络言论、业务说明或者商品说明,因此,若资源信息中未能说明目标网页中存在这些信息,则不符合实际取证需求,因此也可进行过滤。
其中,具体可通过光学字符识别(Optical Character Recognition,OCR)技术来识别文学作品、网络言论、音乐作品、业务说明或者商品说明涉及的文本对象,又或者通过神经网络模型来识别图片作品、影视作品涉及的图像对象。
3)检测第一网络环境信息以及第一资源信息中的目标信息是否完整,若否,则进行过滤。
除了可如上述从具体内容类别出发进行过滤,在实际应用中,也可从内容的完整性出发进行过滤。可以理解,在通过电子证据解决纠纷时,电子证据是否完整对于证据的有效性具有不小的贡献,因此,当第一网络环境信息、第一资源信息中的信息项或者信息内容存在缺失时,显然,具有较低的应用价值,因此也可进行过滤。
4)检测第一资源信息中所包含内容是否与目标网页的预设网页内容或者网页类型相匹配,若否,则进行过滤。
示例性的,可比对涉及的网站主体、网站标题、关键字等网页内容是否相符,又例如可比对网页内容是否与网页类型相匹配,例如,若网页内容不是原本设置的电商商品页面,则可进行过滤。
进一步的,在为了降低数据规模的背景下,本申请还可对执行过滤处理前的第一资源信息进行相应的处理。
参阅图2示出的本申请获取第一资源信息的一种流程示意图,在本申请中,第一资源信息的获取处理,在实际应用中,具体可包括:
步骤S201,访问目标网页;
首先的,在进行资源获取之前,区块链节点设备可通过网络,访问确定的目标网页。
步骤S202,对目标网页中展示的资源信息进行识别,确定关键资源信息,作为第一资源信息;
在本申请中,可以理解,在初始采集阶段中采用的资源获取机制,具体可配置局部资源获取机制,以局部资源获取机制代替展示的资源全部获取机制,只对有获取价值的区域进行资源获取,如此从前期直接减少第一资源信息的数据规模。
其中,本申请可将目标网页展示的资源信息中,将其内容与目标网页的网页类型相符合的资源信息识别为关键资源信息,例如电商服务类型的网页可将网页中涉及介绍电商服务的资源信息识别为关键资源信息。
当然,也可配置其他的关键资源信息的识别机制,例如可对目标网页中特定的显示模块,例如广告推送模块、文章推送模块进行资源获取;或者也可对目标网页中的特定展示位置进行资源获取,例如目标网页中的两侧展示区域;或者,也可对目标网页中具有动态展示效果的资源信息进行资源获取,例如动图、闪烁文字等,具体可随实际需要调整所需获取的关键资源信息,在此不做限定。
通过在第一资源信息的采集过程中,根据取证价值配置了关键资源信息的识别机制,可以理解,进一步提高了信息的价值型,同时,应当注意到的是,相比于后续实施的过滤处理,该关键资源信息的识别机制,是从目标网页中展示的轻量级的资源信息中,进行了筛选,剔除的是取证价值较低的资源信息,而不是剔除了无效信息。
举例而言,在本申请中,获取的第一资源信息,包括此处获取的关键资源信息,具体可以为目标网页中展示的文本或者图片。
当对初始采集阶段采集到的第一网络环境信息以及第一资源信息执行过滤处理后,则可进入第二采集阶段。
在第二采集阶段中,区块链节点设备可基于过滤处理得到的第二网络环境信息以及第二资源信息,来提取目标网页的截图信息以及第二资源信息。
可以理解,这些截图信息以及第二资源信息是用于还原目标网页的,如此,当后续目标网页存在网页更新后,也可根据该截图信息以及第二资源信息来还原执行电子取证时的目标网页,反应目标网页在执行电子取证时的网页内容,以便解决纠纷。
举例而言,该截图信息可以为通过全截图方式获取的截图信息,该第二资源文件可包括网页媒体资源(通常可包括上述第一资源信息采集范围内的资源信息)以及网页源码,进一步的,还可形成过程日志,该过程日志用于描述访问目标网页以及从目标网页获取截图信息、第二资源信息(包括网页媒体资源以及网页源码)的过程,以记录取证过程。
进一步的,在第二采集阶段,还可继续引入过滤机制,继续减少数据规模。
此时,考虑到电子取证在实际应用中,有可能是一个长期或者多频次的过程,即第一网络环境信息、第一资源信息、第二网络环境信息、截图信息、第二资源信息中,有可能包括了不同批次执行的大量信息;或者,考虑到每次执行数据处理时受限于客观条件可能随机存在的、一定程度的差异性,本申请则可引入相似度检测机制,以过滤在较长的时间跨度中提起到的前后差异较大的信息。
即,区块链节点设备在第二网络环境信息、截图信息以及第二资源信息中,过滤掉与第一网络环境信息以及第一资源信息在数据相似度上超出相似度范围的信息,得到过滤后的第二网络环境信息、过滤后的截图信息以及过滤后的第二资源信息。
具体的,可根据信息中的文本内容,确定文本语义之间的相似度,或者从信息中的图像内容,确定图像数据对应特征向量之间的距离(相似度)等方面,量化相似度,作为相似度的判断以及比较的基准。
作为一种实用性较高的实现方式,该相似度的参考因素,考虑到数据处理上的简便性需求,则可以时间差的形式存在,即,可提取第一网络环境信息、第一资源信息、第二网络环境信息、截图信息以及第二资源信息中信息所携带的时间点,该时间点容易理解的是,用于指示信息的具体采集时间,接着,可在第二网络环境信息、截图信息以及第二资源信息中,过滤掉获取时间点与第一网络环境信息以及第一资源信息的获取时间点之间的时间差超出预设时间差范围的信息,如此,可以从时间维度出发,极大保证了第二网络环境信息、截图信息以及第二资源信息,与前面的第一网络环境信息、第一资源信息具有较高的相似度。
后续的,则可将获取到的第二网络环境信息(包括过滤后的第二网络环境信息)、截图信息以及第二资源信息(包括过滤后的第一资源信息),作为目标网页取证得到的电子证据,上传至区块链平台进行上链、固证,为后续可能的纠纷提供强有力的数据支持。
在实际应用中发现,本申请在初始采集阶段所所实现的过滤处理,可过滤90%的无效数据,日均千万量级的数据可有效降至日均百万量级,使得网络带宽、CPU计算资源等成本的消耗减少达80%,有利于基于区块链平台搭建的电子取证、固证系统在低成本条件下的正常运行。
以上是本申请提供的电子证据信息的上链方法的说明,为便于更好的实施本申请提供的电子证据信息的上链方法,本申请还提供了电子证据信息的上链装置。
参阅图3,图3为本申请电子证据信息的上链装置的一种结构示意图,在本申请中,电子证据信息的上链装置300具体可包括如下结构:
确定单元301,用于确定待取证的目标网页;
获取单元302,用于获取目标网页的第一网络环境信息以及第一资源信息,第一资源信息为目标网页中展示的资源信息;
过滤单元303,用于对第一网络环境信息以及第一资源信息两者进行过滤处理,得到过滤后的第二网络环境信息以及第二资源信息,其中,过滤处理用于根据预设的信息过滤策略过滤第一网络环境信息以及第一资源信息两者中的无效信息;
提取单元304,用于基于第二网络环境信息以及第二资源信息,提取目标网页的截图信息以及第二资源信息,第二资源信息为目标网页中展示的以及后台的资源信息;
上传单元305,用于将第二网络环境信息、截图信息以及第二资源信息上传至区块链平台。
在一种示例性的实现方式中,获取单元302,具体用于:
访问目标网页;
对目标网页中展示的资源信息进行识别,确定关键信息,作为第一资源信息。
在又一种示例性的实现方式中,信息过滤策略包括:
检测第一网络环境信息是否携带白名单标识或者第一网络环境信息是否包含在白名单中,若否,则进行过滤;
或者,检测第一资源信息所包含内容是否存在文学作品、音乐作品、图片作品、影视作品、网络言论、业务说明或者商品说明的信息,若否,则进行过滤;
或者,检测第一网络环境信息以及第一资源信息中的目标信息是否完整,若否,则进行过滤;
或者,检测第一资源信息中所包含内容是否与目标网页的预设网页内容或者网页类型相匹配,若否,则进行过滤。
在又一种示例性的实现方式中,过滤单元303,还用于:
在第二网络环境信息、截图信息以及第二资源信息中,过滤掉与第一网络环境信息以及第一资源信息在数据相似度上超出相似度范围的信息,得到过滤后的第二网络环境信息、过滤后的截图信息以及过滤后的第二资源信息;
上传单元,具体用于;
将过滤后的第二网络环境信息、过滤后的截图信息以及过滤后的第二资源信息上传至区块链平台。
在又一种示例性的实现方式中,过滤单元303,具体用于:
在第二网络环境信息、截图信息以及第二资源信息中,过滤掉获取时间点与第一网络环境信息以及第一资源信息的获取时间点之间的时间差超出预设时间差范围的信息。
在又一种示例性的实现方式中,确定单元301,用于:
当接收到网页生成提示信息时,将网页生成提示信息所提示的新生成的网页,确定为目标网页;
或者,当监测到预设网页中的网页信息发生更新时,将预设网页确定为目标网页。
在又一种示例性的实现方式中,第一资源信息包括目标网页中展示的文本或者图像,第二资源信息包括网页媒体资源、网页源码,截图信息为通过全截图方式取得的截图信息。
本申请还提供了区块链节点设备,参阅图4,图4示出了本申请区块链节点设备的一种结构示意图,具体的,本申请区块链节点设备包括处理器401、存储器402以及输入输出设备403,处理器401用于执行存储器402中存储的计算机程序时实现如图1及图2对应任意实施例中电子证据信息的上链方法的各步骤;或者,处理器401用于执行存储器402中存储的计算机程序时实现如图3对应实施例中各单元的功能,存储器402用于存储处理器401执行上述图1及图2对应任意实施例中电子证据信息的上链方法所需的计算机程序。
示例性的,计算机程序可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器402中,并由处理器401执行,以完成本申请。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在计算机装置中的执行过程。
区块链节点设备可包括,但不仅限于处理器401、存储器402、输入输出设备403。本领域技术人员可以理解,示意仅仅是区块链节点设备的示例,并不构成对区块链节点设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如区块链节点设备还可以包括网络接入设备、总线等,处理器401、存储器402、输入输出设备403以及网络接入设备等通过总线相连。
处理器401可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,处理器是区块链节点设备的控制中心,利用各种接口和线路连接整个设备的各个部分。
存储器402可用于存储计算机程序和/或模块,处理器401通过运行或执行存储在存储器402内的计算机程序和/或模块,以及调用存储在存储器402内的数据,实现计算机装置的各种功能。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器401用于执行存储器402中存储的计算机程序时,具体可实现以下功能:
确定待取证的目标网页;
获取目标网页的第一网络环境信息以及第一资源信息,第一资源信息为目标网页中展示的资源信息;
对第一网络环境信息以及第一资源信息两者进行过滤处理,得到过滤后的第二网络环境信息以及第二资源信息,其中,过滤处理用于根据预设的信息过滤策略过滤第一网络环境信息以及第一资源信息两者中的无效信息;
基于第二网络环境信息以及第二资源信息,提取目标网页的截图信息以及第二资源信息,第二资源信息为目标网页中展示的以及后台的资源信息;
将第二网络环境信息、截图信息以及第二资源信息上传至区块链平台。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的信息的上链装置、区块链节点设备及其相应单元的具体工作过程,可以参考如图1及图2对应任意实施例中电子证据信息的上链方法的说明,具体在此不再赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请如图1及图2对应任意实施例中电子证据信息的上链方法中的步骤,具体操作可参考如图1及图2对应任意实施例中电子证据信息的上链方法的说明,在此不再赘述。
其中,该计算机可读存储介质可以包括:只读存储器(Read Only Memory,ROM)、随机存取记忆体(Random Access Memory,RAM)、磁盘或光盘等。
由于该计算机可读存储介质中所存储的指令,可以执行本申请如图1及图2对应任意实施例中电子证据信息的上链方法中的步骤,因此,可以实现本申请如图1及图2对应任意实施例中电子证据信息的上链方法所能实现的有益效果,详见前面的说明,在此不再赘述。
以上对本申请提供的电子证据信息的上链方法、装置、区块链节点设备以及计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种电子证据信息的上链方法,其特征在于,所述方法包括:
确定待取证的目标网页;
获取所述目标网页的第一网络环境信息以及第一资源信息,所述第一资源信息为所述目标网页中展示的资源信息;
对所述第一网络环境信息以及所述第一资源信息两者进行过滤处理,得到过滤后的第二网络环境信息以及第二资源信息,其中,所述过滤处理用于根据预设的信息过滤策略过滤所述第一网络环境信息以及所述第一资源信息两者中的无效信息;
基于所述第二网络环境信息以及所述第二资源信息,提取所述目标网页的截图信息以及第二资源信息,所述第二资源信息为所述目标网页中展示的以及后台的资源信息;
将所述第二网络环境信息、所述截图信息以及所述第二资源信息上传至区块链平台。
2.根据权利要求1所述的方法,其特征在于,所述获取所述目标网页的第一资源信息,包括:
访问所述目标网页;
对所述目标网页中展示的资源信息进行识别,确定关键资源信息,作为所述第一资源信息。
3.根据权利要求1所述的方法,其特征在于,所述信息过滤策略包括:
检测所述第一网络环境信息是否携带白名单标识或者所述第一网络环境信息是否包含在白名单中,若否,则进行过滤;
或者,检测所述第一资源信息所包含内容是否存在文学作品、音乐作品、图片作品、影视作品、网络言论、业务说明或者商品说明的信息,若否,则进行过滤;
或者,检测所述第一网络环境信息以及所述第一资源信息中的目标信息是否完整,若否,则进行过滤;
或者,检测所述第一资源信息中所包含内容是否与所述目标网页的预设网页内容或者网页类型相匹配,若否,则进行过滤。
4.根据权利要求1所述的方法,其特征在于,所述将所述第二网络环境信息、所述截图信息以及所述第二资源信息上传至区块链平台之前,所述方法还包括:
在所述第二网络环境信息、所述截图信息以及所述第二资源信息中,过滤掉与所述第一网络环境信息以及所述第一资源信息在数据相似度上超出相似度范围的信息,得到过滤后的所述第二网络环境信息、过滤后的所述截图信息以及过滤后的所述第二资源信息;
将所述第二网络环境信息、所述截图信息以及所述第二资源信息上传至区块链平台,包括:
将过滤后的所述第二网络环境信息、过滤后的所述截图信息以及过滤后的所述第二资源信息上传至区块链平台。
5.根据权利要求4所述的方法,其特征在于,所述在所述第二网络环境信息、所述截图信息以及所述第二资源信息中,过滤掉与所述第一网络环境信息以及所述第一资源信息在数据相似度上超出相似度范围的信息,包括:
在所述第二网络环境信息、所述截图信息以及所述第二资源信息中,过滤掉获取时间点与所述第一网络环境信息以及所述第一资源信息的获取时间点之间的时间差超出预设时间差范围的信息。
6.根据权利要求1所述的方法,其特征在于,所述确定待取证的目标网页包括:
当接收到网页生成提示信息时,所述将所述网页生成提示信息所提示的新生成的网页,确定为所述目标网页;
或者,当监测到预设网页中的网页信息发生更新时,将所述预设网页确定为所述目标网页。
7.根据权利要求1所述的方法,其特征在于,所述第一资源信息包括所述目标网页中展示的文本或者图像,所述第二资源信息包括网页媒体资源、网页源码,所述截图信息为通过全截图方式取得的截图信息。
8.一种电子证据信息的上链装置,其特征在于,所述装置包括:
确定单元,用于确定待取证的目标网页;
获取单元,用于获取所述目标网页的第一网络环境信息以及第一资源信息,所述第一资源信息为所述目标网页中展示的资源信息;
过滤单元,用于对所述第一网络环境信息以及所述第一资源信息两者进行过滤处理,得到过滤后的第二网络环境信息以及第二资源信息,其中,所述过滤处理用于根据预设的信息过滤策略过滤所述第一网络环境信息以及所述第一资源信息两者中的无效信息;
提取单元,用于基于所述第二网络环境信息以及所述第二资源信息,提取所述目标网页的截图信息以及第二资源信息,所述第二资源信息为所述目标网页中展示的以及后台的资源信息;
上传单元,用于将所述第二网络环境信息、所述截图信息以及所述第二资源信息上传至区块链平台。
9.一种区块链节点设备,其特征在于,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时执行如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至7任一项所述的方法。
CN202011453433.4A 2020-12-11 2020-12-11 一种电子证据信息的上链方法、装置、区块链节点设备 Active CN112632372B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011453433.4A CN112632372B (zh) 2020-12-11 2020-12-11 一种电子证据信息的上链方法、装置、区块链节点设备
PCT/CN2020/138512 WO2022120951A1 (zh) 2020-12-11 2020-12-23 一种电子证据信息的上链方法、装置、区块链节点设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011453433.4A CN112632372B (zh) 2020-12-11 2020-12-11 一种电子证据信息的上链方法、装置、区块链节点设备

Publications (2)

Publication Number Publication Date
CN112632372A CN112632372A (zh) 2021-04-09
CN112632372B true CN112632372B (zh) 2022-05-13

Family

ID=75309803

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011453433.4A Active CN112632372B (zh) 2020-12-11 2020-12-11 一种电子证据信息的上链方法、装置、区块链节点设备

Country Status (2)

Country Link
CN (1) CN112632372B (zh)
WO (1) WO2022120951A1 (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110188515A (zh) * 2019-05-16 2019-08-30 中细软集团有限公司 一种区块链网络数字作品登记方法和客户端
CN110232645A (zh) * 2019-06-14 2019-09-13 山东省计算中心(国家超级计算济南中心) 基于内存取证和区块链的电子证据固定和网络取证方法及系统
CN110489676A (zh) * 2019-07-19 2019-11-22 平安科技(深圳)有限公司 基于区块链的网页取证方法、装置、存储介质及服务器
CN110535660A (zh) * 2019-09-03 2019-12-03 杭州趣链科技有限公司 一种基于区块链的取证服务系统
CN110704876A (zh) * 2019-09-02 2020-01-17 杭州趣链科技有限公司 一种基于区块链的网页取证固证方法
CN111355732A (zh) * 2020-02-28 2020-06-30 腾讯科技(深圳)有限公司 链接检测方法、装置、电子设备及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7676501B2 (en) * 2008-03-22 2010-03-09 Wilson Kelce S Document integrity verification
CN106779278A (zh) * 2016-11-09 2017-05-31 北京金股链科技有限公司 资产信息的评价系统及其信息的处理方法和装置
US11743268B2 (en) * 2018-09-14 2023-08-29 Daniel L. Coffing Fact management system

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110188515A (zh) * 2019-05-16 2019-08-30 中细软集团有限公司 一种区块链网络数字作品登记方法和客户端
CN110232645A (zh) * 2019-06-14 2019-09-13 山东省计算中心(国家超级计算济南中心) 基于内存取证和区块链的电子证据固定和网络取证方法及系统
CN110489676A (zh) * 2019-07-19 2019-11-22 平安科技(深圳)有限公司 基于区块链的网页取证方法、装置、存储介质及服务器
CN110704876A (zh) * 2019-09-02 2020-01-17 杭州趣链科技有限公司 一种基于区块链的网页取证固证方法
CN110535660A (zh) * 2019-09-03 2019-12-03 杭州趣链科技有限公司 一种基于区块链的取证服务系统
CN111355732A (zh) * 2020-02-28 2020-06-30 腾讯科技(深圳)有限公司 链接检测方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
WO2022120951A1 (zh) 2022-06-16
CN112632372A (zh) 2021-04-09

Similar Documents

Publication Publication Date Title
CN107852412B (zh) 用于网络钓鱼和品牌保护的系统和方法、计算机可读介质
CN109862003B (zh) 本地威胁情报库的生成方法、装置、系统及存储介质
US20140380477A1 (en) Methods and devices for identifying tampered webpage and inentifying hijacked web address
CN108650260B (zh) 一种恶意网站的识别方法和装置
CN103888490A (zh) 一种全自动的web客户端人机识别的方法
CN106992981B (zh) 一种网站后门检测方法、装置和计算设备
CN111008348A (zh) 反爬虫方法、终端、服务器及计算机可读存储介质
US11792178B2 (en) Techniques for mitigating leakage of user credentials
US11797617B2 (en) Method and apparatus for collecting information regarding dark web
CN114157568B (zh) 一种浏览器安全访问方法、装置、设备及存储介质
CN107786529B (zh) 网站的检测方法、装置及系统
US11423099B2 (en) Classification apparatus, classification method, and classification program
CN112528181B (zh) 二维码管理方法、装置、计算机设备及可读存储介质
CN112632372B (zh) 一种电子证据信息的上链方法、装置、区块链节点设备
CN117113430A (zh) 网页违规图片检测方法和装置、电子设备、存储介质
CN115001724B (zh) 网络威胁情报管理方法、装置、计算设备及计算机可读存储介质
Geethanjali et al. Ipfs-based image sharing using perceptual hash code with digital right management
CN114363039A (zh) 一种诈骗网站的识别方法、装置、设备及存储介质
CN113722646A (zh) 一种面向多个浏览器扩展的多层级指纹识别方法
CN112565298A (zh) 漏洞扫描方法、装置和电子设备
Singh et al. A Study of Implementing a Blockchain-Based Forensic Model Integration (BBFMI) for IoT Devices in Digital Forensics
CN113923193B (zh) 一种网络域名关联方法、装置、存储介质及电子设备
Hu et al. Spark-based real-time proactive image tracking protection model
CN117040805A (zh) 漏洞捕获方法、装置、计算机可读存储介质及电子设备
CN118260728A (zh) 一种自动化web应用程序识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant