CN115718733A - 一种基于哈希值对文件分类存储的方法及系统 - Google Patents

一种基于哈希值对文件分类存储的方法及系统 Download PDF

Info

Publication number
CN115718733A
CN115718733A CN202211378802.7A CN202211378802A CN115718733A CN 115718733 A CN115718733 A CN 115718733A CN 202211378802 A CN202211378802 A CN 202211378802A CN 115718733 A CN115718733 A CN 115718733A
Authority
CN
China
Prior art keywords
software
files
file
public
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211378802.7A
Other languages
English (en)
Inventor
刘德建
陈丛亮
李佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujian Tianqing Online Interactive Technology Co Ltd
Original Assignee
Fujian Tianqing Online Interactive Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujian Tianqing Online Interactive Technology Co Ltd filed Critical Fujian Tianqing Online Interactive Technology Co Ltd
Priority to CN202211378802.7A priority Critical patent/CN115718733A/zh
Publication of CN115718733A publication Critical patent/CN115718733A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于哈希值对文件分类存储的方法,该方法为:步骤S1、软件安装时,记录新创建的软件文件及软件目录结构,并记录每个软件文件的sha256哈希值,每个软件文件都属于公开文件;步骤S2、软件启动后,会生成软件数据目录,并获取数据目录下的公开文件;步骤S3、将软件目录和软件数据目录中公开文件上传至服务器端,本地保存公开文件的目录和每个公开文件的sha256哈希值,同时本地删除上传的公开文件;步骤S4、在打开软件时候,通过公开文件的目录和对应的公开文件的sha256哈希值,下载公开文件到本地,下载完毕后,则软件能正常启动;能减少本地的存储空间。

Description

一种基于哈希值对文件分类存储的方法及系统
技术领域
本发明涉及文件处理技术领域,特别是一种基于哈希值对文件分类存储的方法及系统。
背景技术
现有的计算机磁盘很多采用固态硬盘,这样硬盘的存储空间不是很大,在磁盘空间不足的情况下,如果将所有文件进行备份处理,可能担心隐私文件也被上传,导致隐私泄漏。
现有技术是通过采用将文件加密的方法处理文件的隐私,但是加密文件有可能由于密码泄漏,或者随着计算机算力的提高,密码会容易被破解,从而导致已经上传到云端的文件也被解密,导致隐私文件泄漏。本专利的技术是不将隐私文件传到云端进行存储备份,从而避免的文件泄漏。
发明内容
为克服上述问题,本发明的目的是提供一种基于哈希值对文件分类存储的方法,在保护隐私的情况下,既能减少存储空间,又可以避免隐私文件泄漏。
本发明采用以下方案实现:一种基于哈希值对文件分类存储的方法,所述方法包括如下步骤:
步骤S1、软件安装时,记录新创建的软件文件及软件目录结构,并记录每个软件文件的sha256哈希值,每个软件文件都属于公开文件;
步骤S2、软件启动后,会生成软件数据目录,并获取数据目录下的公开文件;
步骤S3、将软件目录和软件数据目录中公开文件上传至服务器端,本地保存公开文件的目录和每个公开文件的sha256哈希值,同时本地删除上传的公开文件;
步骤S4、在打开软件时候,通过公开文件的目录和对应的公开文件的sha256哈希值,下载公开文件到本地,下载完毕后,则软件能正常启动。
进一步的,所述步骤S2进一步具体为:软件启动后,会生成软件数据目录,通过扫描软件数据目录下的数据文件,并生成每个数据文件的sha256哈希值,将生成的数据文件对应的用户id和数据文件的sha256哈希值上传至云端,判断云端记录的数据文件的sha256哈希值的用户id数量是否超过阈值,是,则该数据文件是公开文件,否,则该数据文件是隐私文件,隐私文件保存在本地。
进一步的,所述方法还包括定期将未在运行的软件的公开文件上传到服务器端,并清理本地未在运行的软件的公开文件。
本发明提供了一种基于哈希值对文件分类存储的系统,所述系统包括:软件文件获取模块、数据文件获取模块、公开文件处理模块、以及公开文件加载模块;
所述软件文件获取模块,在软件安装时,记录新创建的软件文件及软件目录结构,并记录每个软件文件的sha256哈希值,每个软件文件都属于公开文件;
所述数据文件获取模块,在软件启动后,会生成软件数据目录,并获取数据目录下的公开文件;
所述公开文件处理模块,将软件目录和软件数据目录中公开文件上传至服务器端,本地保存公开文件的目录和每个公开文件的sha256哈希值,同时本地删除上传的公开文件;
所述公开文件加载模块,在打开软件时候,通过公开文件的目录和对应的公开文件的sha256哈希值,下载公开文件到本地,下载完毕后,则软件能正常启动。
进一步的,所述数据文件获取模块的实现方式进一步具体为:软件启动后,会生成软件数据目录,通过扫描软件数据目录下的数据文件,并生成每个数据文件的sha256哈希值,将生成的数据文件对应的用户id和数据文件的sha256哈希值上传至云端,判断云端记录的数据文件的sha256哈希值的用户id数量是否超过阈值,是,则该数据文件是公开文件,否,则该数据文件是隐私文件,隐私文件保存在本地。
进一步的,所述系统还包括定期将未在运行的软件的公开文件上传到服务器端,并清理本地未在运行的软件的公开文件。
本发明的有益效果在于:本发明的方法在软件安装时,对安装生成的每个软件文件都进行记录sha256哈希值,且该每个软件文件都是公开文件,在软件启动后用户登录会有对应的用户id,则获取数据文件中的公开文件,将隐私文件保存在本地,公开文件上传到服务器端,并删除本地的公开文件,从而对文件分类存储。减少存储空间,同时避免隐私文件泄漏。
附图说明
图1是本发明的方法流程示意图。
图2是本发明的系统原理框图。
具体实施方式
下面结合附图对本发明做进一步说明。
请参阅图1所示,本发明的一种基于哈希值对文件分类存储的方法,所述方法包括如下步骤:
步骤S1、软件安装时,记录新创建的软件文件及软件目录结构,并记录每个软件文件的sha256哈希值,每个软件文件都属于公开文件;
步骤S2、软件启动后,会生成软件数据目录,并获取数据目录下的公开文件;
步骤S3、将软件目录和软件数据目录中公开文件上传至服务器端,本地保存公开文件的目录和每个公开文件的sha256哈希值,同时本地删除上传的公开文件;
步骤S4、在打开软件时候,通过公开文件的目录和对应的公开文件的sha256哈希值,下载公开文件到本地,下载完毕后,则软件能正常启动。
下面结合一具体实施例对本发明作进一步说明:
1.记录公开文件sha256哈希值集合
a)记录软件公开文件:通过在文件安装时,记录新创建的软件文件及软件目录结构,并记录每个软件文件的sha256哈希值,每个软件文件都属于公开文件;
例如:就例如安装qq软件,在QQ目录下C:\QQ\bin\qq.exe就是软件目录,在安装的时候生成的文件,如果只有C:\QQ\bin\qq.exe,就只记录这一个文件。如软件安装包这样,就是在官网可以任意下载,内容已经全部公开的文件,安装了这个安装包后,生成的软件文件都是属于公开文件;
b)记录数据文件公开文件:软件启动后,会生成软件数据目录,通过扫描软件数据目录下的数据文件,并生成每个数据文件的sha256哈希值,将用户id和文件sha256值上传至云端,当云端记录相同sha256值的用户id数超过阈值,则判定这个文件是公开文件。没有超过,则该数据文件是隐私文件,隐私文件保存在本地。
例如:在安装之后,QQ启动,登陆后,会生成数据文件,例如:c:\账号1\
则账号1下会有聊天记录等私有文件,即对应的账号都有用户id,即一个用户id下面会有很多对应的数据文件,
运行后,可能会自动下载升级包文件update1.exe.如果有100人使用本专利的工具,如果10个以上的人都上报了update1.exe这个文件的sha256值都相同,说明这个文件其实每个人都有,说明不是个人的隐私文件,如果是聊天记录文件,每个人生成的SHA256值就不同,所以就会当做是隐私文件,不会上传。
软件目录和数据目录其实都有可能有公开文件和隐私文件,只不过一般情况软件目录存的都是公开文件,数据目录有可能一部分是公开文件例如升级包,通用配置等文件,一部分是隐私文件,例如聊天记录,个人接收附件等。
2.将目录中公开文件上传至服务器端,本地保存公开文件的目录结构和每个公开文件的sha256哈希值,同时本地删除上传的公开文件。
例如将上述判定为公开文件的C:\QQ\bin\qq.exe和C:\QQ\bin\update1.exe文件上传,并删除这两个文件;
3.在打开软件时候,通过公开文件的目录和对应的公开文件的sha256哈希值,下载公开文件到本地,下载完毕后,则软件可以正常启动。
例如:打开QQ时候,则从服务器下载C:\QQ\bin\qq.exe和C:\QQ\bin\update1.exe这两个文件,然后在启动C:\QQ\bin\qq.exe
4.定期将未在运行的软件的公开文件上传到服务器端,并清理本地未在运行的软件的公开文件。
例如:每隔半小时,检测如果C:\QQ\bin\qq.exe已关闭,就执行清理,删除C:\QQ\bin\qq.exe和C:\QQ\bin\update1.exe这两个公开文件。
请参阅图2所示,本发明提供了一种基于哈希值对文件分类存储的系统,所述系统包括:软件文件获取模块、数据文件获取模块、公开文件处理模块、以及公开文件加载模块;
所述软件文件获取模块,在软件安装时,记录新创建的软件文件及软件目录结构,并记录每个软件文件的sha256哈希值,每个软件文件都属于公开文件;
所述数据文件获取模块,在软件启动后,会生成软件数据目录,并获取数据目录下的公开文件;
所述数据文件获取模块的实现方式进一步具体为:软件启动后,会生成软件数据目录,通过扫描软件数据目录下的数据文件,并生成每个数据文件的sha256哈希值,将生成的数据文件对应的用户id和数据文件的sha256哈希值上传至云端,判断云端记录的数据文件的sha256哈希值的用户id数量是否超过阈值,是,则该数据文件是公开文件,否,则该数据文件是隐私文件,隐私文件保存在本地。
所述公开文件处理模块,将软件目录和软件数据目录中公开文件上传至服务器端,本地保存公开文件的目录和每个公开文件的sha256哈希值,同时本地删除上传的公开文件;
所述公开文件加载模块,在打开软件时候,通过公开文件的目录和对应的公开文件的sha256哈希值,下载公开文件到本地,下载完毕后,则软件能正常启动。
所述系统还包括定期将未在运行的软件的公开文件上传到服务器端,并清理本地未在运行的软件的公开文件。
总之,本发明的方法在软件安装时,对安装生成的每个软件文件都进行记录sha256哈希值,且该每个软件文件都是公开文件,在软件启动后用户登录会有对应的用户id,则获取数据文件中的公开文件,将隐私文件保存在本地,公开文件上传到服务器端,并删除本地的公开文件,从而对文件分类存储。减少存储空间,同时避免隐私文件泄漏。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

Claims (6)

1.一种基于哈希值对文件分类存储的方法,其特征在于:所述方法包括如下步骤:
步骤S1、软件安装时,记录新创建的软件文件及软件目录结构,并记录每个软件文件的sha256哈希值,每个软件文件都属于公开文件;
步骤S2、软件启动后,会生成软件数据目录,并获取数据目录下的公开文件;
步骤S3、将软件目录和软件数据目录中公开文件上传至服务器端,本地保存公开文件的目录和每个公开文件的sha256哈希值,同时本地删除上传的公开文件;
步骤S4、在打开软件时候,通过公开文件的目录和对应的公开文件的sha256哈希值,下载公开文件到本地,下载完毕后,则软件能正常启动。
2.根据权利要求1所述的一种基于哈希值对文件分类存储的方法,其特征在于:所述步骤S2进一步具体为:软件启动后,会生成软件数据目录,通过扫描软件数据目录下的数据文件,并生成每个数据文件的sha256哈希值,将生成的数据文件对应的用户id和数据文件的sha256哈希值上传至云端,判断云端记录的数据文件的sha256哈希值的用户id数量是否超过阈值,是,则该数据文件是公开文件,否,则该数据文件是隐私文件,隐私文件保存在本地。
3.根据权利要求1所述的一种基于哈希值对文件分类存储的方法,其特征在于:所述方法还包括定期将未在运行的软件的公开文件上传到服务器端,并清理本地未在运行的软件的公开文件。
4.一种基于哈希值对文件分类存储的系统,其特征在于:所述系统包括:软件文件获取模块、数据文件获取模块、公开文件处理模块、以及公开文件加载模块;
所述软件文件获取模块,在软件安装时,记录新创建的软件文件及软件目录结构,并记录每个软件文件的sha256哈希值,每个软件文件都属于公开文件;
所述数据文件获取模块,在软件启动后,会生成软件数据目录,并获取数据目录下的公开文件;
所述公开文件处理模块,将软件目录和软件数据目录中公开文件上传至服务器端,本地保存公开文件的目录和每个公开文件的sha256哈希值,同时本地删除上传的公开文件;
所述公开文件加载模块,在打开软件时候,通过公开文件的目录和对应的公开文件的sha256哈希值,下载公开文件到本地,下载完毕后,则软件能正常启动。
5.根据权利要求4所述的一种基于哈希值对文件分类存储的系统,其特征在于:所述数据文件获取模块的实现方式进一步具体为:软件启动后,会生成软件数据目录,通过扫描软件数据目录下的数据文件,并生成每个数据文件的sha256哈希值,将生成的数据文件对应的用户id和数据文件的sha256哈希值上传至云端,判断云端记录的数据文件的sha256哈希值的用户id数量是否超过阈值,是,则该数据文件是公开文件,否,则该数据文件是隐私文件,隐私文件保存在本地。
6.根据权利要求4所述的一种基于哈希值对文件分类存储的系统,其特征在于:所述系统还包括定期将未在运行的软件的公开文件上传到服务器端,并清理本地未在运行的软件的公开文件。
CN202211378802.7A 2022-11-04 2022-11-04 一种基于哈希值对文件分类存储的方法及系统 Pending CN115718733A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211378802.7A CN115718733A (zh) 2022-11-04 2022-11-04 一种基于哈希值对文件分类存储的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211378802.7A CN115718733A (zh) 2022-11-04 2022-11-04 一种基于哈希值对文件分类存储的方法及系统

Publications (1)

Publication Number Publication Date
CN115718733A true CN115718733A (zh) 2023-02-28

Family

ID=85254894

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211378802.7A Pending CN115718733A (zh) 2022-11-04 2022-11-04 一种基于哈希值对文件分类存储的方法及系统

Country Status (1)

Country Link
CN (1) CN115718733A (zh)

Similar Documents

Publication Publication Date Title
US20210112114A1 (en) Systems and methods for aggregation of cloud storage
US20230334049A1 (en) Systems and methods for secure file management via an aggregation of cloud storage services
US9935973B2 (en) Systems and methods for automatic detection of malicious activity via common files
US20240015220A1 (en) Aggregation and management among a plurality of storage providers
US10264072B2 (en) Systems and methods for processing-based file distribution in an aggregation of cloud storage services
US20180330088A1 (en) Systems and methods for automatic snapshotting of backups based on malicious modification detection
US8812442B1 (en) Backup service and appliance with single-instance storage of encrypted data
US11182478B2 (en) Systems and methods for tracking and recording events in a network of computing systems
US8549327B2 (en) Background service process for local collection of data in an electronic discovery system
US8776236B2 (en) System and method for providing storage device-based advanced persistent threat (APT) protection
US8484737B1 (en) Techniques for processing backup data for identifying and handling content
US20170331893A1 (en) Systems and methods for third-party policy-based file distribution in an aggregation of cloud storage services
US8429364B1 (en) Systems and methods for identifying the presence of sensitive data in backups
US11120147B2 (en) Operating system garbage-collection with integrated clearing of sensitive data
US8336100B1 (en) Systems and methods for using reputation data to detect packed malware
US8972677B1 (en) Systems and methods for implementing a storage interface specific to an archiving platform
CN108667835A (zh) 一种控制远程设备进行网络取证的方法、系统及存储介质
US10735468B1 (en) Systems and methods for evaluating security services
CN104536792A (zh) 清除应用程序残留文件的方法及装置
US11113152B1 (en) Systems and methods for managing file backup
US9811659B1 (en) Systems and methods for time-shifted detection of security threats
US10318272B1 (en) Systems and methods for managing application updates
CN109766215B (zh) 一种数据处理方法及装置
Sai et al. The forensic process analysis of mobile device
CN113961936A (zh) 可信白名单建设方法、系统、装置和计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination