CN113326511B - 一种文件修复方法、系统、设备和介质 - Google Patents

一种文件修复方法、系统、设备和介质 Download PDF

Info

Publication number
CN113326511B
CN113326511B CN202110712153.9A CN202110712153A CN113326511B CN 113326511 B CN113326511 B CN 113326511B CN 202110712153 A CN202110712153 A CN 202110712153A CN 113326511 B CN113326511 B CN 113326511B
Authority
CN
China
Prior art keywords
file
target
identity
end equipment
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110712153.9A
Other languages
English (en)
Other versions
CN113326511A (zh
Inventor
吕晓滨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sangfor Technologies Co Ltd
Original Assignee
Sangfor Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sangfor Technologies Co Ltd filed Critical Sangfor Technologies Co Ltd
Priority to CN202110712153.9A priority Critical patent/CN113326511B/zh
Publication of CN113326511A publication Critical patent/CN113326511A/zh
Application granted granted Critical
Publication of CN113326511B publication Critical patent/CN113326511B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/55Detecting local intrusion or implementing counter-measures
    • G06F21/56Computer malware detection or handling, e.g. anti-virus arrangements
    • G06F21/566Dynamic detection, i.e. detection performed at run-time, e.g. emulation, suspicious activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Virology (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种文件修复方法、系统、设备和介质,后端设备接收目标前端设备发送的携带身份标识的文件恢复请求后,向剩余的前端设备发送携带身份标识的文件获取请求。身份标识不受异常文件的影响,前端设备基于身份标识,确定出与身份标识匹配的目标文件,向后端设备发送用于表征目标文件唯一性的响应信息。后端设备基于剩余的前端设备反馈的目标文件的响应信息向目标前端设备发送替换文件,目标前端设备将替换文件代替出现异常的文件,相比于传统方式基于人工提炼的修复方式对异常文件进行修复,从其它前端设备上获取正常的文件来替换异常文件,提升了异常文件的修复效果。

Description

一种文件修复方法、系统、设备和介质
技术领域
本申请涉及安全管理技术领域,特别是涉及一种文件修复方法、系统、设备和计算机可读存储介质。
背景技术
感染型病毒的运行是将自身加入到其它的程序或动态库文件中,从而实现随被感染程序同步运行的功能,进而对感染电脑进行破坏和自身传播。便携式可执行文件(Portable Executable,PE)是Microsoft Windows操作系统上的程序文件。感染型病毒通常以感染PE文件为主,被感染的PE文件内容将发生变化或遭到破坏。被感染型病毒感染的PE文件将成为病毒文件,删除病毒文件会影响程序正常运行,但若不删除病毒文件,将无法清除病毒。
传统技术中对被感染型病毒感染的PE文件通常采用专项修复方式,针对每种病毒家族的感染方式进行分析,再针对性的提炼修复方式,对被感染型病毒感染的PE文件进行修复。目前全球已知的感染型病毒的类型就有近3000多种,对终端厂商来讲,需要维护近千种的病毒感染的修复方式,才能在终端厂商的PE文件被病毒感染时,依赖于维护的修复方式对被感染型病毒感染的PE文件进行修复。对于终端厂商来说需要较大的技术投入,并且人工提炼的修复方式并不是都能将被感染的PE文件修复如初,有可能修复失败或修复不全,导致程序运行不稳,容易出现异常。
可见,如何提升病毒文件的修复效果,是本领域技术人员需要解决的问题。
发明内容
本申请实施例的目的是提供一种文件修复方法、系统、设备和计算机可读存储介质,可以提升病毒文件的修复效果。
为解决上述技术问题,本申请实施例提供一种文件修复方法,包括:
接收携带身份标识的文件获取请求;
基于所述身份标识,确定出与所述身份标识匹配的目标文件;
针对于所述文件获取请求反馈响应信息,以便于基于所述响应信息获取替换文件,以实现对损坏文件的修复;其中,所述响应信息包括目标文件或目标文件的身份标识。
可选地,所述身份标识包括名称信息和版本信息;相应的,所述基于所述身份标识,确定出与所述身份标识匹配的目标文件包括:
根据所述名称信息和所述版本信息,确定出目标文件。
可选地,所述根据所述名称信息和所述版本信息,确定出的目标文件包括:
查询与所述名称信息相同的所有文件;
从所有文件中筛选出与所述版本信息相同的目标文件。
可选地,所述身份标识包括名称信息、版本信息和文件属性信息;相应的,所述基于所述身份标识,确定出与所述身份标识匹配的目标文件包括:
根据所述名称信息、所述版本信息以及所述文件属性信息,确定出目标文件。
可选地,所述根据所述名称信息、所述版本信息以及所述文件属性信息,确定出目标文件包括:
按照设定的权重比例,计算出各文件与所述名称信息、所述版本信息以及所述文件属性信息的综合相似度;
将综合相似度超过预设阈值的文件作为最终的目标文件。
可选地,所述将综合相似度超过预设阈值的文件作为最终的目标文件包括:
在综合相似度超过预设阈值的文件个数为一个的情况下,将所述综合相似度超过预设阈值的文件作为最终的目标文件;
在综合相似度超过预设阈值的文件个数为多个的情况下,将综合相似度最高的一个文件作为最终的目标文件。
可选地,所述针对于所述文件获取请求反馈响应信息包括:
针对于所述文件获取请求反馈所述目标文件,以及所述目标文件对应的综合相似度;
或者针对于所述文件获取请求反馈所述目标文件的目标身份标识,以及所述目标文件对应的综合相似度。
可选地,还包括:
发送携带身份标识的文件恢复请求;
在获取到与所述文件恢复请求对应的替换文件的情况下,将所述替换文件代替损坏文件。
本申请实施例还提供了一种文件修复系统,包括前端设备,
所述前端设备用于接收携带身份标识的文件获取请求;基于所述身份标识,确定出与所述身份标识匹配的目标文件;针对于所述文件获取请求反馈响应信息,以便于基于所述响应信息获取替换文件,以实现对损坏文件的修复;其中,所述响应信息包括目标文件或目标文件的身份标识。
本申请实施例还提供了一种文件修复方法,包括:
发送携带身份标识的文件获取请求;
获取与所述文件获取请求对应的响应信息;
基于所述响应信息获取替换文件,以便于实现对损坏文件的修复;其中,所述响应信息包括目标文件或目标文件的身份标识;所述目标文件为与所述身份标识匹配的目标文件。
可选地,所述发送携带身份标识的文件获取请求包括:
在接收到目标前端设备发送的携带身份标识的文件恢复请求的情况下,向剩余的前端设备发送携带所述身份标识的文件获取请求。
可选地,所述发送携带身份标识的文件获取请求包括:
在接收到目标前端设备发送的携带身份标识的文件恢复请求的情况下,基于预先采集的所有前端设备中文件的初始身份标识,确定出与所述身份标识匹配的目标身份标识,并向所述目标身份标识所属的前端设备发送携带所述目标身份标识的文件获取请求。
可选地,所述响应信息包括所述目标文件的目标身份标识,以及所述目标文件对应的综合相似度的情况下,所述基于所述响应信息获取替换文件包括:
选取出综合相似度最高的目标身份标识;
向所述综合相似度最高的目标身份标识所属的前端设备发送携带所述目标身份标识的文件获取请求;
接收所述目标身份标识所属的前端设备反馈的替换文件;其中,所述替换文件为所述目标身份标识对应的文件。
可选地,所述响应信息包括所述目标文件,以及所述目标文件对应的综合相似度的情况下,所述基于所述响应信息获取替换文件包括:
选取出综合相似度最高的目标文件作为替换文件。
可选地,还包括:
将预设时间段内调用次数大于预设值的替换文件进行缓存。
本申请实施例还提供了一种文件修复系统,包括后端设备;
所述后端设备,用于发送携带身份标识的文件获取请求;获取与所述文件获取请求对应的响应信息;基于所述响应信息获取替换文件,以便于实现对损坏文件的修复;其中,所述响应信息包括目标文件或目标文件的身份标识;所述目标文件为与所述身份标识匹配的目标文件。
本申请实施例还提供了一种文件修复系统,所述系统包括前端设备和后端设备;
所述前端设备,用于接收携带身份标识的文件获取请求;基于所述身份标识,确定出与所述身份标识匹配的目标文件;针对于所述文件获取请求反馈响应信息;其中,所述响应信息包括目标文件或目标文件的身份标识;
所述后端设备,用于发送携带身份标识的文件获取请求;获取与所述文件获取请求对应的响应信息;基于所述响应信息获取替换文件,以便于实现对损坏文件的修复。
本申请实施例还提供了一种文件修复设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以实现如上述任意一项所述文件修复方法的步骤。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任意一项所述文件修复方法的步骤。
由上述技术方案可以看出,当任意一个前端设备即目标前端设备的文件出现异常时,目标前端设备可以向后端设备发送携带该文件身份标识的文件恢复请求。身份标识可以用于区分不同的文件。考虑到分布式存储系统中同一个文件会存储在不同的前端设备上,因此后端设备在接收目标前端设备发送的文件恢复请求的情况下,可以向剩余的前端设备发送携带身份标识的文件获取请求。前端设备接收到后端设备发送的携带身份标识的文件获取请求之后,可以基于身份标识,确定出与身份标识匹配的目标文件,向后端设备发送用于表征目标文件唯一性的响应信息。后端设备基于响应信息向目标前端设备发送替换文件,目标前端设备可以将该替换文件代替出现异常的文件,从效果上实现了对异常文件的修复。考虑到文件出现异常,文件的身份标识不会受到影响,因此前端设备基于文件的身份标识可以快速准确的查找到相匹配的目标文件,当某一前端设备上出现异常文件时,通过后端设备和多个前端设备的交互,可以从其它剩余的前端设备上获取相同的文件,从而替换出现异常的文件,实现异常文件的修复。相比于传统方式基于人工提炼的修复方式对异常文件进行修复,该技术方案通过从其它前端设备上获取正常的文件来替换异常文件,提升了异常文件的修复效果。
附图说明
为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种文件修复的场景示意图;
图2为本申请实施例提供的一种文件修复方法的信令图;
图3为本申请实施例提供的一种适用于后端设备的文件修复方法的流程图;
图4为本申请实施例提供的一种文件修复系统的结构示意图;
图5为本申请实施例提供的一种文件修复设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本申请保护范围。
为了使本技术领域的人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。
传统技术中采用人工设定的修复方式对病毒文件进行修复,但是目前已知的感染型病毒的类型就有近千种,对终端厂商来讲,需要维护近千种的病毒感染的修复方式,才能在终端厂商的文件被病毒感染时,依赖于维护的修复方式对被感染型病毒感染的文件进行修复。并且人工提炼的修复方式并不是都能将被感染的文件修复如初,有可能修复失败或修复不全。
因此,本申请实施例提供了一种文件修复方法、系统、设备和计算机可读存储介质,当某一前端设备上出现异常文件时,通过后端设备和多个前端设备的交互,可以从其它剩余的前端设备上获取相同的文件,从而替换出现异常的文件,实现异常文件的修复。
图1为本申请实施例提供的一种文件修复的场景示意图,图1中以3个前端设备为例,分别为前端设备A、前端设备B和前端设备C,假设,前端设备A检测到自身存储的文件中出现了异常文件,此时前端设备A可以向后端设备传输携带有该异常文件的身份标识的文件恢复请求,后端设备在接收到文件恢复请求,可以向剩余的前端设备B和前端设备C发送携带该身份标识的文件获取请求,前端设备B和前端设备C基于获取的身份标识,可以确定出与身份标识匹配的目标文件;向后端设备反馈响应信息,响应信息可以包括目标文件或目标文件的身份标识的,以便于后端设备基于响应信息向目标前端设备发送替换文件。相比于传统方式基于人工提炼的修复方式对异常文件进行修复,本申请实施例通过从其它前端设备上获取正常的文件来替换异常文件,提升了异常文件的修复效果。
接下来,详细介绍本申请实施例所提供的一种文件修复方法。图2为本申请实施例提供的一种文件修复方法的信令图,该方法包括:
S201:后端设备接收目标前端设备发送的携带身份标识的文件恢复请求。
在本申请实施例中,可以在用户使用的前端设备上部署用于采集文件相关信息的软件程序(agent)。前端设备的数量可以有多个,后端设备可以实现对多个前端设备的统一化管理。
后端设备可以是对一个企业下所有前端设备进行管理的企业平台,也可以是对多个企业平台进行管理的云端。在实际应用中,当无法从一个企业平台所管控的前端设备上获取到替换文件时,可以通过云端实现多个企业平台的交互,从而从其它企业平台所管控的前端设备上获取到替换文件。
文件出现异常的原因有多种,其中病毒感染是常见的一种情况,为了便于后续介绍,均以病毒感染文件造成文件异常为例展开说明。在实际应用中,前端设备通过安装的病毒检测软件,可以检测自身的文件是否被病毒感染。
每个文件有其对应的身份标识,身份标识可以包括名称信息和版本信息。文件被病毒感染往往会造成文件内容的损坏或异常,但是文件的身份标识一般不受影响。因此,在本申请实施例中,可以依据文件的身份标识从其它前端设备上获取具有相同或相近身份标识的文件。
S202:后端设备向剩余的前端设备发送携带身份标识的文件获取请求。
后端设备可以管控多台前端设备,依据分布式存储系统的文件存储特性,一个文件往往会在多台前端设备上存储。因此,当目标前端设备上的文件出现异常时,后端设备可以向剩余的前端设备发送携带异常文件的身份标识的文件获取请求。
剩余的前端设备可以是后端设备所管控的所有前端设备中除目标前端设备外的所有剩余的前端设备,也可以是后端设备所管控的所有前端设备中除目标前端设备外的部分剩余的前端设备。在实际应用中,后端设备可以向除目标前端设备外的所有剩余的前端设备发送文件获取请求;也可以依据其维护的文件类型,向具有相关类型文件的剩余的前端设备发送文件获取请求。
S203:前端设备接收后端设备发送的携带身份标识的文件获取请求,基于身份标识,确定出与身份标识匹配的目标文件。
前端设备在获取到文件获取请求时,可以查询自身是否存储与身份标识相同或相近的文件。为了便于区分,可以将与身份标识相同或相近的文件称作目标文件。
身份标识可以包括名称信息和版本信息,在本申请实施例中,前端设备可以根据名称信息和版本信息,确定出目标文件。为了保证目标文件的可用性,前端设备需要从自身存储的文件中查找到与身份标识中包括的名称信息和版本信息完全一致的文件,将该文件作为目标文件。
在实际应用中,前端设备可以先查询与名称信息相同的所有文件;从所有文件中筛选出与版本信息相同的目标文件。前端设备也可以先查询与版本信息相同的所有文件;从所有文件中筛选出与名称信息相同的目标文件。
其中,名称信息可以包括文件名称和/或产品名称;版本信息可以包括文件版本和/或产品版本。
以先查询名称信息再筛选版本信息为例,在实际应用中,前端设备可以查询与文件名称或产品名称相同的所有文件;从所有文件中筛选出与文件版本或产品版本相同的目标文件。
S204:前端设备针对于文件获取请求向后端设备反馈响应信息。
当前端设备上存在与身份标识相同或相近的目标文件时,前端设备可以向后端设备发送响应信息。
在实际应用中,前端设备可以直接向后端设备反馈目标文件。前端设备也可以先向后端设备反馈目标文件的身份标识,在接收到后端设备下发的文件获取请求时,再向后端设备传输目标文件。因此,在本申请实施例中,响应信息可以包括目标文件或目标文件的身份标识。
S205:后端设备获取与文件获取请求对应的响应信息;基于响应信息获取替换文件,并向目标前端设备发送替换文件。
后端设备可能会接收到多台前端设备发送的响应信息,每个响应信息都会有对应的目标文件,因此,后端设备可以基于响应信息确定出最终向目标前端设备发送的目标文件,可以将该目标文件称作替换文件。
后端设备向目标前端设备发送替换文件,目标前端设备可以将该替换文件代替出现异常的文件,从效果上实现了对异常文件的修复。
由上述技术方案可以看出,当任意一个前端设备即目标前端设备的文件出现异常时,目标前端设备可以向后端设备发送携带该文件身份标识的文件恢复请求。身份标识可以用于区分不同的文件。考虑到分布式存储系统中同一个文件会存储在不同的前端设备上,因此后端设备在接收目标前端设备发送的文件恢复请求的情况下,可以向剩余的前端设备发送携带身份标识的文件获取请求。前端设备接收到后端设备发送的携带身份标识的文件获取请求之后,可以基于身份标识,确定出与身份标识匹配的目标文件,向后端设备发送用于表征目标文件唯一性的响应信息。后端设备基于响应信息向目标前端设备发送替换文件,目标前端设备可以将该替换文件代替出现异常的文件,从效果上实现了对异常文件的修复。考虑到文件出现异常,文件的身份标识不会受到影响,因此前端设备基于文件的身份标识可以快速准确的查找到相匹配的目标文件,当某一前端设备上出现异常文件时,通过后端设备和多个前端设备的交互,可以从其它剩余的前端设备上获取相同的文件,从而替换出现异常的文件,实现异常文件的修复。相比于传统方式基于人工提炼的修复方式对异常文件进行修复,该技术方案通过从其它前端设备上获取正常的文件来替换异常文件,提升了异常文件的修复效果。
在本申请实施例中,为了更加准确的获取与身份标识匹配的目标文件,设定的身份标识可以包含更多的信息类型。身份标识可以包括名称信息、版本信息和文件属性信息。前端设备可以根据名称信息、版本信息以及文件属性信息,确定出目标文件。
在实际应用中,前端设备可以按照设定的权重比例,计算出各文件与名称信息、版本信息以及文件属性信息的综合相似度;将综合相似度超过预设阈值的文件作为最终的目标文件。预设阈值的取值可以根据实际需求设置,在此不做限定。
综合相似度超过预设阈值的文件可能有一个或多个。在综合相似度超过预设阈值的文件个数为一个的情况下,将综合相似度超过预设阈值的文件作为最终的目标文件;在综合相似度超过预设阈值的文件个数为多个的情况下,可以将综合相似度最高的一个文件作为最终的目标文件。
需要说明的是,每个文件都有其对应的身份标识,各文件的身份标识中包含的信息类型相同,仅是具体的信息内容存在差异。在本申请实施例中,为了便于区分,将目标前端设备发送的文件恢复请求中携带身份标识称作身份标识,将前端设备中目标文件的身份标识称作目标身份标识。
文件属性信息可以包括文件路径信息、数字签名、版权、语言和/或原始文件名。
属性信息中包含的信息项目越多,依据身份标识查找到的目标文件越符合实际需求。
为了快速准确的获取所需的文件路径信息,在本申请实施例中,可以按照设定的通配符转义路径格式,获取目标文件的文件路径信息。
在实际应用中,可以按照如下通配符转义路径格式:%ProgramFiles%\EEK获取文件路径信息,其中,ProgramFiles和EEK属于常规的文件目录标识,%所对应的内容代表实际所需的文件路径信息。假设,文件路径信息为:C:\Program Files(x86)\EEK,则采集到的第一个%对应“C”,第二个%对应“x86”。
在本申请实施中,为了计算出各文件与名称信息、版本信息以及文件属性信息的综合相似度,可以针对每种类型的信息设置其对应的权重比例。
举例说明,可以将名称信息的权重比例设置为20%,版本信息的权重比例设置为20%,文件属性信息的权重比例设置为60%。以文件属性信息包括文件路径信息、数字签名、版权、语言和原始文件名为例,可以将文件属性信息的60%的权重比例分配给文件属性信息包含的各信息项目,例如,可以将文件路径信息的权重比例设置为15%,数字签名的权重比例设置为15%,版权的权重比例设置为10%,语言的权重比例设置为10%,原始文件名的权重比例设置为10%。
在实际应用中,可以按照百分值的方式,分别计算目标文件中名称信息与身份标识中名称信息的相似度分值,计算目标文件中版本信息与身份标识中版本信息的相似度分值,计算目标文件中文件属性信息与身份标识中文件属性信息的相似度分值,将各相似度分值按照对应的权重比例进行加权求和,得到综合相似度。
在本申请实施例中,可以对名称信息和版本信息设置一票否定权,如果前端设备的文件的名称信息与身份标识中的名称信息不一致,则说明该文件不是所需的文件,即可以排除该文件;或者是前端设备的文件的版本信息与身份标识中的版本信息不一致,则可以排除该文件。
通过扩展身份标识中包含的信息类型,提升了文件查找的准确性,使得匹配到的目标文件更加符合实际需求。并且对不同信息类型设置不同的权重比例,可以充分考虑不同信息类型对匹配目标文件的影响程度,使得综合相似度的计算更加合理化。
前端设备可以基于各文件对应的综合相似度,选取出一个目标文件向后端设备反馈,但是后端设备可以接收到多个前端设备反馈的目标文件,因此后端设备接收到的目标文件个数可以有多个。
目标文件对应的综合相似度越高,说明其越符合目标前端设备的需求,因此为了选取出最合适的一个目标文件,前端设备向后端设备反馈响应信息可以包括针对于文件获取请求反馈目标文件,以及目标文件对应的综合相似度;或者针对于文件获取请求反馈目标文件的目标身份标识,以及目标文件对应的综合相似度。
前端设备向后端设备发送的响应信息可以包括目标文件及其目标文件对应的综合相似度。相应的,后端设备可以选取出综合相似度最高的目标文件作为替换文件。
前端设备向后端设备发送的响应信息也可以包括目标文件的目标身份标识及其目标文件对应的综合相似度。相应的,后端设备可以选取出综合相似度最高的目标身份标识;向综合相似度最高的目标身份标识所属的前端设备发送携带目标身份标识的文件获取请求;接收目标身份标识所属的前端设备反馈的替换文件;其中,替换文件为目标身份标识对应的文件。
考虑到实际应用中,可能会存在同一个替换文件被频繁调用的情况,因此,在本申请实施例中,后端设备可以将预设时间段内调用次数大于预设值的替换文件进行缓存。
预设时间段以及预设值的具体取值可以根据实际需求设定,在此不做限定。
多次被调用的替换文件,后续被再次调用的机率会较高。后端设备通过缓存多次被调用的替换文件,可以再次需要调用替换文件时,直接向目标前端设备反馈替换文件,无需再与其它前端设备进行交互来获取替换文件,提升了替换文件的反馈效率。
在本申请实施例中,后端设备在接收到目标前端设备发送的携带身份标识的文件恢复请求之后,除了直接向剩余的前端设备发送携带身份标识的文件获取请求外,也可以先对剩余的所有前端设备进行初步筛选,只向筛选出的前端设备发送文件获取请求,具体实现流程可以参见图3。图3为本申请实施例提供的一种文件修复方法,适用于后端设备,方法包括:
S301:预先采集所有前端设备中文件的初始身份标识。
在本申请实施例中,可以由后端设备直接进行身份标识的匹配,减少后端设备与其它前端设备的交互,从而提升后端设备向目标前端设备反馈替换文件的效率。
为了使得后端设备可以直接进行身份标识的匹配,后端设备可以预先采集所有前端设备中文件的初始身份标识。
需要说明的是,文件的初始身份标识即为文件的身份标识,为了和目标前端设备发送的文件恢复请求中携带的身份标识进行区分,将采集的所有前端设备中文件的身份标识称作初始身份标识。
S302:在接收到目标前端设备发送的携带身份标识的文件恢复请求的情况下,基于所有前端设备中文件的初始身份标识,确定出与身份标识匹配的目标身份标识,并向目标身份标识所属的前端设备发送携带目标身份标识的文件获取请求。
身份标识可以包括名称信息和版本信息。初始身份标识与身份标识的匹配过程可以参见S203的实现流程,在此不再赘述。
为了提升匹配的准确性,身份标识还可以包括属性信息,后端设备可以按照设定的权重比例,计算出初始身份标识与身份标识中包括的名称信息、版本信息以及文件属性信息的综合相似度;将综合相似度超过预设阈值的初始身份标识作为目标身份标识。综合相似度的具体计算方式可以参见上述介绍中综合相似度的处理流程,在此不再赘述。
S303:接收目标身份标识所属的前端设备反馈的替换文件,并向目标前端设备发送替换文件。
由上述技术方案可以看出,后端设备可以预先采集所有前端设备中文件的初始身份标识,在接收到目标前端设备发送的携带身份标识的文件恢复请求的情况下,基于初始身份标识,确定出与身份标识匹配的目标身份标识,并向初始身份标识所属的前端设备发送携带初始身份标识的文件获取请求。接收目标身份标识所属的前端设备反馈的替换文件,并向目标前端设备发送替换文件,以便于目标前端设备将该替换文件代替出现异常的文件,从效果上实现了对异常文件的修复。考虑到文件出现异常,文件的身份标识不会受到影响,因此后端设备通过预先采集所有前端设备中文件的初始身份标识,可以当某一前端设备上出现异常文件时,基于初始身份标识快速准确的查找到与身份标识相匹配的目标身份标识,从而从目标身份标识所属的前端设备上获取正常的替换文件,以便于目标前端设备替换出现异常的文件,实现异常文件的修复。相比于传统方式基于人工提炼的修复方式对异常文件进行修复,该技术方案通过从其它前端设备上获取正常的文件来替换异常文件,提升了异常文件的修复效果。
本申请实施例还提供了一种文件修复系统,包括前端设备,
前端设备用于接收携带身份标识的文件获取请求;基于身份标识,确定出与身份标识匹配的目标文件;针对于文件获取请求反馈响应信息,以便于基于响应信息获取替换文件,以实现对损坏文件的修复;其中,响应信息包括目标文件或目标文件的身份标识。
本申请实施例还提供了一种文件修复系统,包括后端设备;
后端设备,用于发送携带身份标识的文件获取请求;获取与文件获取请求对应的响应信息;基于响应信息获取替换文件,以便于实现对损坏文件的修复;其中,响应信息包括目标文件或目标文件的身份标识;目标文件为与身份标识匹配的目标文件。
图4为本申请实施例提供的一种文件修复系统的结构示意图,系统包括前端设备41和后端设备42;
前端设备41,用于接收携带身份标识的文件获取请求;基于身份标识,确定出与身份标识匹配的目标文件;针对于文件获取请求反馈响应信息;其中,响应信息包括目标文件或目标文件的身份标识;
后端设备42,用于发送携带身份标识的文件获取请求;获取与文件获取请求对应的响应信息;基于响应信息获取替换文件,以便于实现对损坏文件的修复。
图4所对应实施例中特征的说明可以参见图2所对应实施例的相关说明,这里不再一一赘述。
由上述技术方案可以看出,当任意一个前端设备即目标前端设备的文件出现异常时,目标前端设备可以向后端设备发送携带该文件身份标识的文件恢复请求。身份标识可以用于区分不同的文件。考虑到分布式存储系统中同一个文件会存储在不同的前端设备上,因此后端设备在接收目标前端设备发送的文件恢复请求的情况下,可以向剩余的前端设备发送携带身份标识的文件获取请求。前端设备接收到后端设备发送的携带身份标识的文件获取请求之后,可以基于身份标识,确定出与身份标识匹配的目标文件,向后端设备发送用于表征目标文件唯一性的响应信息。后端设备基于响应信息向目标前端设备发送替换文件,目标前端设备可以将该替换文件代替出现异常的文件,从效果上实现了对异常文件的修复。考虑到文件出现异常,文件的身份标识不会受到影响,因此前端设备基于文件的身份标识可以快速准确的查找到相匹配的目标文件,当某一前端设备上出现异常文件时,通过后端设备和多个前端设备的交互,可以从其它剩余的前端设备上获取相同的文件,从而替换出现异常的文件,实现异常文件的修复。相比于传统方式基于人工提炼的修复方式对异常文件进行修复,该技术方案通过从其它前端设备上获取正常的文件来替换异常文件,提升了异常文件的修复效果。
图5为本申请实施例提供的一种文件修复设备50的结构示意图,包括:
存储器51,用于存储计算机程序;
处理器52,用于执行计算机程序以实现如上述任意一项实施例的文件修复方法的步骤。
本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述任意实施例的文件修复方法的步骤。
以上对本申请实施例所提供的一种文件修复方法、系统、设备和计算机可读存储介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

Claims (13)

1.一种文件修复方法,其特征在于,包括:
接收携带身份标识的文件获取请求;所述身份标识包括名称信息、版本信息和文件属性信息;基于预先采集的所有前端设备中文件的初始身份标识,确定出与所述身份标识匹配的目标身份标识,并向所述目标身份标识所属的前端设备发送携带所述目标身份标识的文件获取请求;
针对于所述文件获取请求反馈响应信息,以便于基于所述响应信息获取替换文件,以实现对损坏文件的修复;其中,所述响应信息包括目标文件或目标文件的身份标识,确定所述目标文件包括:按照设定的权重比例,计算出各文件与所述名称信息、所述版本信息以及所述文件属性信息的综合相似度,将综合相似度超过预设阈值的文件作为最终的目标文件。
2.根据权利要求1所述的文件修复方法,其特征在于,所述将综合相似度超过预设阈值的文件作为最终的目标文件包括:
在综合相似度超过预设阈值的文件个数为一个的情况下,将所述综合相似度超过预设阈值的文件作为最终的目标文件;
在综合相似度超过预设阈值的文件个数为多个的情况下,将综合相似度最高的一个文件作为最终的目标文件。
3.根据权利要求1所述的文件修复方法,其特征在于,所述针对于所述文件获取请求反馈响应信息包括:
针对于所述文件获取请求反馈所述目标文件,以及所述目标文件对应的综合相似度;
或者针对于所述文件获取请求反馈所述目标文件的目标身份标识,以及所述目标文件对应的综合相似度。
4.根据权利要求1至3任意一项所述的文件修复方法,其特征在于,还包括:
发送携带身份标识的文件恢复请求;
在获取到与所述文件恢复请求对应的替换文件的情况下,将所述替换文件代替损坏文件。
5.一种文件修复系统,其特征在于,包括前端设备,
所述前端设备用于接收携带身份标识的文件获取请求,所述身份标识包括名称信息、版本信息和文件属性信息;基于预先采集的所有前端设备中文件的初始身份标识,确定出与所述身份标识匹配的目标身份标识,并向所述目标身份标识所属的前端设备发送携带所述目标身份标识的文件获取请求;针对于所述文件获取请求反馈响应信息,以便于基于所述响应信息获取替换文件,以实现对损坏文件的修复;其中,所述响应信息包括目标文件或目标文件的身份标识,确定所述目标文件包括:按照设定的权重比例,计算出各文件与所述名称信息、所述版本信息以及所述文件属性信息的综合相似度,将综合相似度超过预设阈值的文件作为最终的目标文件。
6.一种文件修复方法,其特征在于,包括:
在接收到目标前端设备发送的携带身份标识的文件恢复请求的情况下,基于预先采集的所有前端设备中文件的初始身份标识,确定出与所述身份标识匹配的目标身份标识,并向所述目标身份标识所属的前端设备发送携带所述目标身份标识的文件获取请求;所述身份标识包括名称信息、版本信息和文件属性信息;
获取与所述文件获取请求对应的响应信息;
基于所述响应信息获取替换文件,以便于实现对损坏文件的修复;其中,所述响应信息包括目标文件或目标文件的身份标识;所述目标文件为与所述身份标识匹配的目标文件,确定所述目标文件包括:按照设定的权重比例,计算出各文件与所述名称信息、所述版本信息以及所述文件属性信息的综合相似度,将综合相似度超过预设阈值的文件作为最终的目标文件。
7.根据权利要求6所述的文件修复方法,其特征在于,所述响应信息包括所述目标文件的目标身份标识,以及所述目标文件对应的综合相似度的情况下,所述基于所述响应信息获取替换文件包括:
选取出综合相似度最高的目标身份标识;
向所述综合相似度最高的目标身份标识所属的前端设备发送携带所述目标身份标识的文件获取请求;
接收所述目标身份标识所属的前端设备反馈的替换文件;其中,所述替换文件为所述目标身份标识对应的文件。
8.根据权利要求6所述的文件修复方法,其特征在于,所述响应信息包括所述目标文件,以及所述目标文件对应的综合相似度的情况下,所述基于所述响应信息获取替换文件包括:
选取出综合相似度最高的目标文件作为替换文件。
9.根据权利要求6至8任意一项所述的文件修复方法,其特征在于,还包括:
将预设时间段内调用次数大于预设值的替换文件进行缓存。
10.一种文件修复系统,其特征在于,包括后端设备;
所述后端设备,用于在接收到目标前端设备发送的携带身份标识的文件恢复请求的情况下,基于预先采集的所有前端设备中文件的初始身份标识,确定出与所述身份标识匹配的目标身份标识,并向所述目标身份标识所属的前端设备发送携带所述目标身份标识的文件获取请求;所述身份标识包括名称信息、版本信息和文件属性信息;获取与所述文件获取请求对应的响应信息;基于所述响应信息获取替换文件,以便于实现对损坏文件的修复;其中,所述响应信息包括目标文件或目标文件的身份标识;所述目标文件为与所述身份标识匹配的目标文件,确定所述目标文件包括:按照设定的权重比例,计算出各文件与所述名称信息、所述版本信息以及所述文件属性信息的综合相似度,将综合相似度超过预设阈值的文件作为最终的目标文件。
11.一种文件修复系统,其特征在于,所述系统包括前端设备和后端设备;
所述前端设备,用于接收携带身份标识的文件获取请求;基于预先采集的所有前端设备中文件的初始身份标识,确定出与所述身份标识匹配的目标身份标识,并向所述目标身份标识所属的前端设备发送携带所述目标身份标识的文件获取请求;针对于所述文件获取请求反馈响应信息;其中,所述响应信息包括目标文件或目标文件的所述身份标识,确定所述目标文件包括:按照设定的权重比例,计算出各文件与名称信息、版本信息以及文件属性信息的综合相似度,将综合相似度超过预设阈值的文件作为最终的目标文件;所述身份标识包括名称信息、版本信息和文件属性信息;
所述后端设备,用于在接收到目标前端设备发送的携带所述身份标识的文件恢复请求的情况下,基于预先采集的所有前端设备中文件的初始身份标识,确定出与所述身份标识匹配的目标身份标识,并向所述目标身份标识所属的前端设备发送携带所述目标身份标识的文件获取请求;获取与所述文件获取请求对应的响应信息;基于所述响应信息获取替换文件,以便于实现对损坏文件的修复。
12.一种文件修复设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以实现如权利要求1至4任意一项和/或权利要求6至9任意一项所述文件修复方法的步骤。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4任意一项和/或权利要求6至9任意一项所述文件修复方法的步骤。
CN202110712153.9A 2021-06-25 2021-06-25 一种文件修复方法、系统、设备和介质 Active CN113326511B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110712153.9A CN113326511B (zh) 2021-06-25 2021-06-25 一种文件修复方法、系统、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110712153.9A CN113326511B (zh) 2021-06-25 2021-06-25 一种文件修复方法、系统、设备和介质

Publications (2)

Publication Number Publication Date
CN113326511A CN113326511A (zh) 2021-08-31
CN113326511B true CN113326511B (zh) 2024-04-09

Family

ID=77424806

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110712153.9A Active CN113326511B (zh) 2021-06-25 2021-06-25 一种文件修复方法、系统、设备和介质

Country Status (1)

Country Link
CN (1) CN113326511B (zh)

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1513065A1 (en) * 2003-09-04 2005-03-09 Hitachi, Ltd. File system and file transfer method between file sharing devices
CN101246535A (zh) * 2008-03-25 2008-08-20 深圳市迅雷网络技术有限公司 一种修复异常文件的方法、系统和装置
WO2009115029A1 (zh) * 2008-03-18 2009-09-24 华为技术有限公司 一种修复数据的方法、系统和装置
CN102810138A (zh) * 2012-06-19 2012-12-05 北京奇虎科技有限公司 一种用户端文件的修复方法和系统
WO2014040458A1 (en) * 2012-09-17 2014-03-20 Tencent Technology (Shenzhen) Company Limited Systems and methods for repairing system files
US8725702B1 (en) * 2012-03-15 2014-05-13 Symantec Corporation Systems and methods for repairing system files
CN107168699A (zh) * 2017-04-28 2017-09-15 北京五八信息技术有限公司 应用程序修复方法及终端设备
US9792436B1 (en) * 2013-04-29 2017-10-17 Symantec Corporation Techniques for remediating an infected file
CN107741889A (zh) * 2017-09-01 2018-02-27 广州视源电子科技股份有限公司 文档恢复方法、系统、可读存储介质及终端
CN107783857A (zh) * 2017-10-31 2018-03-09 珠海市魅族科技有限公司 一种异常修复方法及装置、计算机装置、可读存储介质
US10162956B1 (en) * 2018-07-23 2018-12-25 Capital One Services, Llc System and apparatus for secure password recovery and identity verification
CN109639794A (zh) * 2018-12-10 2019-04-16 杭州数梦工场科技有限公司 一种有状态集群恢复方法、装置、设备及可读存储介质
CN109684121A (zh) * 2018-12-20 2019-04-26 鸿秦(北京)科技有限公司 一种文件恢复方法及系统
CN110807000A (zh) * 2019-10-25 2020-02-18 北京达佳互联信息技术有限公司 一种文件修复方法、装置、电子设备和存储介质
CN111598901A (zh) * 2020-05-19 2020-08-28 南京佳和牙科技术有限公司 基于深度图像的牙科修复制品的加工进度的估算方法
CN112328422A (zh) * 2020-11-06 2021-02-05 深圳市锐尔觅移动通信有限公司 异常修复方法、装置、电子设备及存储介质
CN112612756A (zh) * 2020-12-21 2021-04-06 北京鸿腾智能科技有限公司 异常文件的修复方法、装置、设备及存储介质

Patent Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1513065A1 (en) * 2003-09-04 2005-03-09 Hitachi, Ltd. File system and file transfer method between file sharing devices
WO2009115029A1 (zh) * 2008-03-18 2009-09-24 华为技术有限公司 一种修复数据的方法、系统和装置
CN101246535A (zh) * 2008-03-25 2008-08-20 深圳市迅雷网络技术有限公司 一种修复异常文件的方法、系统和装置
US8725702B1 (en) * 2012-03-15 2014-05-13 Symantec Corporation Systems and methods for repairing system files
CN102810138A (zh) * 2012-06-19 2012-12-05 北京奇虎科技有限公司 一种用户端文件的修复方法和系统
WO2013189214A1 (zh) * 2012-06-19 2013-12-27 北京奇虎科技有限公司 一种用户端文件的修复方法和系统
WO2014040458A1 (en) * 2012-09-17 2014-03-20 Tencent Technology (Shenzhen) Company Limited Systems and methods for repairing system files
CN103678032A (zh) * 2012-09-17 2014-03-26 腾讯科技(深圳)有限公司 系统文件的修复方法及装置
US9792436B1 (en) * 2013-04-29 2017-10-17 Symantec Corporation Techniques for remediating an infected file
CN107168699A (zh) * 2017-04-28 2017-09-15 北京五八信息技术有限公司 应用程序修复方法及终端设备
CN107741889A (zh) * 2017-09-01 2018-02-27 广州视源电子科技股份有限公司 文档恢复方法、系统、可读存储介质及终端
CN107783857A (zh) * 2017-10-31 2018-03-09 珠海市魅族科技有限公司 一种异常修复方法及装置、计算机装置、可读存储介质
US10162956B1 (en) * 2018-07-23 2018-12-25 Capital One Services, Llc System and apparatus for secure password recovery and identity verification
CN109639794A (zh) * 2018-12-10 2019-04-16 杭州数梦工场科技有限公司 一种有状态集群恢复方法、装置、设备及可读存储介质
CN109684121A (zh) * 2018-12-20 2019-04-26 鸿秦(北京)科技有限公司 一种文件恢复方法及系统
CN110807000A (zh) * 2019-10-25 2020-02-18 北京达佳互联信息技术有限公司 一种文件修复方法、装置、电子设备和存储介质
CN111598901A (zh) * 2020-05-19 2020-08-28 南京佳和牙科技术有限公司 基于深度图像的牙科修复制品的加工进度的估算方法
CN112328422A (zh) * 2020-11-06 2021-02-05 深圳市锐尔觅移动通信有限公司 异常修复方法、装置、电子设备及存储介质
CN112612756A (zh) * 2020-12-21 2021-04-06 北京鸿腾智能科技有限公司 异常文件的修复方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN113326511A (zh) 2021-08-31

Similar Documents

Publication Publication Date Title
RU2551820C2 (ru) Способ и устройство для проверки файловой системы на наличие вирусов
CN106878262B (zh) 报文检测方法及装置、建立本地威胁情报库的方法及装置
CN110502546B (zh) 一种数据处理方法及装置
CN109951477B (zh) 一种基于威胁情报检测网络攻击的方法和装置
US20180357214A1 (en) Log analysis system, log analysis method, and storage medium
US8688659B2 (en) Method for indexed-field based difference detection and correction
CN109495521B (zh) 一种异常流量检测方法及装置
US7913233B2 (en) Performance analyzer
US20140053263A1 (en) System, method and computer program product for sending information extracted from a potentially unwanted data sample to generate a signature
CN112613993B (zh) 交易数据处理方法、装置、计算机设备和存储介质
US20170277887A1 (en) Information processing apparatus, information processing method, and computer readable medium
US20180020014A1 (en) Malicious communication pattern extraction device, malicious communication pattern extraction system, malicious communication pattern extraction method, and malicious communication pattern extraction program
CN107294929B (zh) 规则匹配和管理方法及装置
CN111859399A (zh) 一种基于oval的漏洞检测方法及装置
CN111797104A (zh) 数据变更情况的获取方法、装置及电子设备
CN113326511B (zh) 一种文件修复方法、系统、设备和介质
CN111159708B (zh) 检测服务器中网页木马的装置、方法及存储介质
CN112749125A (zh) 文本的处理方法及装置、文本的处理系统
CN116760571A (zh) 资产识别方法、装置、电子设备及存储介质
CN114968637B (zh) 一种自动驾驶异常分析系统
CN106855888B (zh) 基于Logstash分布式系统的日志监控系统
CN114510717A (zh) 一种elf文件的检测方法、装置、存储介质
CN111881450B (zh) 一种终端文件的病毒检测方法、装置、系统、设备和介质
CN111258788B (zh) 磁盘故障预测方法、装置及计算机可读存储介质
CN114844771A (zh) 微服务系统的监测方法、装置、存储介质、程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant