CN115718733A - 一种基于哈希值对文件分类存储的方法及系统 - Google Patents
一种基于哈希值对文件分类存储的方法及系统 Download PDFInfo
- Publication number
- CN115718733A CN115718733A CN202211378802.7A CN202211378802A CN115718733A CN 115718733 A CN115718733 A CN 115718733A CN 202211378802 A CN202211378802 A CN 202211378802A CN 115718733 A CN115718733 A CN 115718733A
- Authority
- CN
- China
- Prior art keywords
- software
- files
- file
- public
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种基于哈希值对文件分类存储的方法,该方法为:步骤S1、软件安装时,记录新创建的软件文件及软件目录结构,并记录每个软件文件的sha256哈希值,每个软件文件都属于公开文件;步骤S2、软件启动后,会生成软件数据目录,并获取数据目录下的公开文件;步骤S3、将软件目录和软件数据目录中公开文件上传至服务器端,本地保存公开文件的目录和每个公开文件的sha256哈希值,同时本地删除上传的公开文件;步骤S4、在打开软件时候,通过公开文件的目录和对应的公开文件的sha256哈希值,下载公开文件到本地,下载完毕后,则软件能正常启动;能减少本地的存储空间。
Description
技术领域
本发明涉及文件处理技术领域,特别是一种基于哈希值对文件分类存储的方法及系统。
背景技术
现有的计算机磁盘很多采用固态硬盘,这样硬盘的存储空间不是很大,在磁盘空间不足的情况下,如果将所有文件进行备份处理,可能担心隐私文件也被上传,导致隐私泄漏。
现有技术是通过采用将文件加密的方法处理文件的隐私,但是加密文件有可能由于密码泄漏,或者随着计算机算力的提高,密码会容易被破解,从而导致已经上传到云端的文件也被解密,导致隐私文件泄漏。本专利的技术是不将隐私文件传到云端进行存储备份,从而避免的文件泄漏。
发明内容
为克服上述问题,本发明的目的是提供一种基于哈希值对文件分类存储的方法,在保护隐私的情况下,既能减少存储空间,又可以避免隐私文件泄漏。
本发明采用以下方案实现:一种基于哈希值对文件分类存储的方法,所述方法包括如下步骤:
步骤S1、软件安装时,记录新创建的软件文件及软件目录结构,并记录每个软件文件的sha256哈希值,每个软件文件都属于公开文件;
步骤S2、软件启动后,会生成软件数据目录,并获取数据目录下的公开文件;
步骤S3、将软件目录和软件数据目录中公开文件上传至服务器端,本地保存公开文件的目录和每个公开文件的sha256哈希值,同时本地删除上传的公开文件;
步骤S4、在打开软件时候,通过公开文件的目录和对应的公开文件的sha256哈希值,下载公开文件到本地,下载完毕后,则软件能正常启动。
进一步的,所述步骤S2进一步具体为:软件启动后,会生成软件数据目录,通过扫描软件数据目录下的数据文件,并生成每个数据文件的sha256哈希值,将生成的数据文件对应的用户id和数据文件的sha256哈希值上传至云端,判断云端记录的数据文件的sha256哈希值的用户id数量是否超过阈值,是,则该数据文件是公开文件,否,则该数据文件是隐私文件,隐私文件保存在本地。
进一步的,所述方法还包括定期将未在运行的软件的公开文件上传到服务器端,并清理本地未在运行的软件的公开文件。
本发明提供了一种基于哈希值对文件分类存储的系统,所述系统包括:软件文件获取模块、数据文件获取模块、公开文件处理模块、以及公开文件加载模块;
所述软件文件获取模块,在软件安装时,记录新创建的软件文件及软件目录结构,并记录每个软件文件的sha256哈希值,每个软件文件都属于公开文件;
所述数据文件获取模块,在软件启动后,会生成软件数据目录,并获取数据目录下的公开文件;
所述公开文件处理模块,将软件目录和软件数据目录中公开文件上传至服务器端,本地保存公开文件的目录和每个公开文件的sha256哈希值,同时本地删除上传的公开文件;
所述公开文件加载模块,在打开软件时候,通过公开文件的目录和对应的公开文件的sha256哈希值,下载公开文件到本地,下载完毕后,则软件能正常启动。
进一步的,所述数据文件获取模块的实现方式进一步具体为:软件启动后,会生成软件数据目录,通过扫描软件数据目录下的数据文件,并生成每个数据文件的sha256哈希值,将生成的数据文件对应的用户id和数据文件的sha256哈希值上传至云端,判断云端记录的数据文件的sha256哈希值的用户id数量是否超过阈值,是,则该数据文件是公开文件,否,则该数据文件是隐私文件,隐私文件保存在本地。
进一步的,所述系统还包括定期将未在运行的软件的公开文件上传到服务器端,并清理本地未在运行的软件的公开文件。
本发明的有益效果在于:本发明的方法在软件安装时,对安装生成的每个软件文件都进行记录sha256哈希值,且该每个软件文件都是公开文件,在软件启动后用户登录会有对应的用户id,则获取数据文件中的公开文件,将隐私文件保存在本地,公开文件上传到服务器端,并删除本地的公开文件,从而对文件分类存储。减少存储空间,同时避免隐私文件泄漏。
附图说明
图1是本发明的方法流程示意图。
图2是本发明的系统原理框图。
具体实施方式
下面结合附图对本发明做进一步说明。
请参阅图1所示,本发明的一种基于哈希值对文件分类存储的方法,所述方法包括如下步骤:
步骤S1、软件安装时,记录新创建的软件文件及软件目录结构,并记录每个软件文件的sha256哈希值,每个软件文件都属于公开文件;
步骤S2、软件启动后,会生成软件数据目录,并获取数据目录下的公开文件;
步骤S3、将软件目录和软件数据目录中公开文件上传至服务器端,本地保存公开文件的目录和每个公开文件的sha256哈希值,同时本地删除上传的公开文件;
步骤S4、在打开软件时候,通过公开文件的目录和对应的公开文件的sha256哈希值,下载公开文件到本地,下载完毕后,则软件能正常启动。
下面结合一具体实施例对本发明作进一步说明:
1.记录公开文件sha256哈希值集合
a)记录软件公开文件:通过在文件安装时,记录新创建的软件文件及软件目录结构,并记录每个软件文件的sha256哈希值,每个软件文件都属于公开文件;
例如:就例如安装qq软件,在QQ目录下C:\QQ\bin\qq.exe就是软件目录,在安装的时候生成的文件,如果只有C:\QQ\bin\qq.exe,就只记录这一个文件。如软件安装包这样,就是在官网可以任意下载,内容已经全部公开的文件,安装了这个安装包后,生成的软件文件都是属于公开文件;
b)记录数据文件公开文件:软件启动后,会生成软件数据目录,通过扫描软件数据目录下的数据文件,并生成每个数据文件的sha256哈希值,将用户id和文件sha256值上传至云端,当云端记录相同sha256值的用户id数超过阈值,则判定这个文件是公开文件。没有超过,则该数据文件是隐私文件,隐私文件保存在本地。
例如:在安装之后,QQ启动,登陆后,会生成数据文件,例如:c:\账号1\
则账号1下会有聊天记录等私有文件,即对应的账号都有用户id,即一个用户id下面会有很多对应的数据文件,
运行后,可能会自动下载升级包文件update1.exe.如果有100人使用本专利的工具,如果10个以上的人都上报了update1.exe这个文件的sha256值都相同,说明这个文件其实每个人都有,说明不是个人的隐私文件,如果是聊天记录文件,每个人生成的SHA256值就不同,所以就会当做是隐私文件,不会上传。
软件目录和数据目录其实都有可能有公开文件和隐私文件,只不过一般情况软件目录存的都是公开文件,数据目录有可能一部分是公开文件例如升级包,通用配置等文件,一部分是隐私文件,例如聊天记录,个人接收附件等。
2.将目录中公开文件上传至服务器端,本地保存公开文件的目录结构和每个公开文件的sha256哈希值,同时本地删除上传的公开文件。
例如将上述判定为公开文件的C:\QQ\bin\qq.exe和C:\QQ\bin\update1.exe文件上传,并删除这两个文件;
3.在打开软件时候,通过公开文件的目录和对应的公开文件的sha256哈希值,下载公开文件到本地,下载完毕后,则软件可以正常启动。
例如:打开QQ时候,则从服务器下载C:\QQ\bin\qq.exe和C:\QQ\bin\update1.exe这两个文件,然后在启动C:\QQ\bin\qq.exe
4.定期将未在运行的软件的公开文件上传到服务器端,并清理本地未在运行的软件的公开文件。
例如:每隔半小时,检测如果C:\QQ\bin\qq.exe已关闭,就执行清理,删除C:\QQ\bin\qq.exe和C:\QQ\bin\update1.exe这两个公开文件。
请参阅图2所示,本发明提供了一种基于哈希值对文件分类存储的系统,所述系统包括:软件文件获取模块、数据文件获取模块、公开文件处理模块、以及公开文件加载模块;
所述软件文件获取模块,在软件安装时,记录新创建的软件文件及软件目录结构,并记录每个软件文件的sha256哈希值,每个软件文件都属于公开文件;
所述数据文件获取模块,在软件启动后,会生成软件数据目录,并获取数据目录下的公开文件;
所述数据文件获取模块的实现方式进一步具体为:软件启动后,会生成软件数据目录,通过扫描软件数据目录下的数据文件,并生成每个数据文件的sha256哈希值,将生成的数据文件对应的用户id和数据文件的sha256哈希值上传至云端,判断云端记录的数据文件的sha256哈希值的用户id数量是否超过阈值,是,则该数据文件是公开文件,否,则该数据文件是隐私文件,隐私文件保存在本地。
所述公开文件处理模块,将软件目录和软件数据目录中公开文件上传至服务器端,本地保存公开文件的目录和每个公开文件的sha256哈希值,同时本地删除上传的公开文件;
所述公开文件加载模块,在打开软件时候,通过公开文件的目录和对应的公开文件的sha256哈希值,下载公开文件到本地,下载完毕后,则软件能正常启动。
所述系统还包括定期将未在运行的软件的公开文件上传到服务器端,并清理本地未在运行的软件的公开文件。
总之,本发明的方法在软件安装时,对安装生成的每个软件文件都进行记录sha256哈希值,且该每个软件文件都是公开文件,在软件启动后用户登录会有对应的用户id,则获取数据文件中的公开文件,将隐私文件保存在本地,公开文件上传到服务器端,并删除本地的公开文件,从而对文件分类存储。减少存储空间,同时避免隐私文件泄漏。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。
Claims (6)
1.一种基于哈希值对文件分类存储的方法,其特征在于:所述方法包括如下步骤:
步骤S1、软件安装时,记录新创建的软件文件及软件目录结构,并记录每个软件文件的sha256哈希值,每个软件文件都属于公开文件;
步骤S2、软件启动后,会生成软件数据目录,并获取数据目录下的公开文件;
步骤S3、将软件目录和软件数据目录中公开文件上传至服务器端,本地保存公开文件的目录和每个公开文件的sha256哈希值,同时本地删除上传的公开文件;
步骤S4、在打开软件时候,通过公开文件的目录和对应的公开文件的sha256哈希值,下载公开文件到本地,下载完毕后,则软件能正常启动。
2.根据权利要求1所述的一种基于哈希值对文件分类存储的方法,其特征在于:所述步骤S2进一步具体为:软件启动后,会生成软件数据目录,通过扫描软件数据目录下的数据文件,并生成每个数据文件的sha256哈希值,将生成的数据文件对应的用户id和数据文件的sha256哈希值上传至云端,判断云端记录的数据文件的sha256哈希值的用户id数量是否超过阈值,是,则该数据文件是公开文件,否,则该数据文件是隐私文件,隐私文件保存在本地。
3.根据权利要求1所述的一种基于哈希值对文件分类存储的方法,其特征在于:所述方法还包括定期将未在运行的软件的公开文件上传到服务器端,并清理本地未在运行的软件的公开文件。
4.一种基于哈希值对文件分类存储的系统,其特征在于:所述系统包括:软件文件获取模块、数据文件获取模块、公开文件处理模块、以及公开文件加载模块;
所述软件文件获取模块,在软件安装时,记录新创建的软件文件及软件目录结构,并记录每个软件文件的sha256哈希值,每个软件文件都属于公开文件;
所述数据文件获取模块,在软件启动后,会生成软件数据目录,并获取数据目录下的公开文件;
所述公开文件处理模块,将软件目录和软件数据目录中公开文件上传至服务器端,本地保存公开文件的目录和每个公开文件的sha256哈希值,同时本地删除上传的公开文件;
所述公开文件加载模块,在打开软件时候,通过公开文件的目录和对应的公开文件的sha256哈希值,下载公开文件到本地,下载完毕后,则软件能正常启动。
5.根据权利要求4所述的一种基于哈希值对文件分类存储的系统,其特征在于:所述数据文件获取模块的实现方式进一步具体为:软件启动后,会生成软件数据目录,通过扫描软件数据目录下的数据文件,并生成每个数据文件的sha256哈希值,将生成的数据文件对应的用户id和数据文件的sha256哈希值上传至云端,判断云端记录的数据文件的sha256哈希值的用户id数量是否超过阈值,是,则该数据文件是公开文件,否,则该数据文件是隐私文件,隐私文件保存在本地。
6.根据权利要求4所述的一种基于哈希值对文件分类存储的系统,其特征在于:所述系统还包括定期将未在运行的软件的公开文件上传到服务器端,并清理本地未在运行的软件的公开文件。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211378802.7A CN115718733A (zh) | 2022-11-04 | 2022-11-04 | 一种基于哈希值对文件分类存储的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211378802.7A CN115718733A (zh) | 2022-11-04 | 2022-11-04 | 一种基于哈希值对文件分类存储的方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115718733A true CN115718733A (zh) | 2023-02-28 |
Family
ID=85254894
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211378802.7A Pending CN115718733A (zh) | 2022-11-04 | 2022-11-04 | 一种基于哈希值对文件分类存储的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115718733A (zh) |
-
2022
- 2022-11-04 CN CN202211378802.7A patent/CN115718733A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210112114A1 (en) | Systems and methods for aggregation of cloud storage | |
US20230334049A1 (en) | Systems and methods for secure file management via an aggregation of cloud storage services | |
US9935973B2 (en) | Systems and methods for automatic detection of malicious activity via common files | |
US20240015220A1 (en) | Aggregation and management among a plurality of storage providers | |
US10264072B2 (en) | Systems and methods for processing-based file distribution in an aggregation of cloud storage services | |
US20180330088A1 (en) | Systems and methods for automatic snapshotting of backups based on malicious modification detection | |
US8812442B1 (en) | Backup service and appliance with single-instance storage of encrypted data | |
US11182478B2 (en) | Systems and methods for tracking and recording events in a network of computing systems | |
US8549327B2 (en) | Background service process for local collection of data in an electronic discovery system | |
US8776236B2 (en) | System and method for providing storage device-based advanced persistent threat (APT) protection | |
US8484737B1 (en) | Techniques for processing backup data for identifying and handling content | |
US20170331893A1 (en) | Systems and methods for third-party policy-based file distribution in an aggregation of cloud storage services | |
US8429364B1 (en) | Systems and methods for identifying the presence of sensitive data in backups | |
US11120147B2 (en) | Operating system garbage-collection with integrated clearing of sensitive data | |
US8336100B1 (en) | Systems and methods for using reputation data to detect packed malware | |
US8972677B1 (en) | Systems and methods for implementing a storage interface specific to an archiving platform | |
CN108667835A (zh) | 一种控制远程设备进行网络取证的方法、系统及存储介质 | |
US10735468B1 (en) | Systems and methods for evaluating security services | |
CN104536792A (zh) | 清除应用程序残留文件的方法及装置 | |
US11113152B1 (en) | Systems and methods for managing file backup | |
US9811659B1 (en) | Systems and methods for time-shifted detection of security threats | |
US10318272B1 (en) | Systems and methods for managing application updates | |
CN109766215B (zh) | 一种数据处理方法及装置 | |
Sai et al. | The forensic process analysis of mobile device | |
CN113961936A (zh) | 可信白名单建设方法、系统、装置和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |