CN111858548A - 一种存储介质特征数据库的构建及更新方法 - Google Patents

一种存储介质特征数据库的构建及更新方法 Download PDF

Info

Publication number
CN111858548A
CN111858548A CN202010644579.0A CN202010644579A CN111858548A CN 111858548 A CN111858548 A CN 111858548A CN 202010644579 A CN202010644579 A CN 202010644579A CN 111858548 A CN111858548 A CN 111858548A
Authority
CN
China
Prior art keywords
feature
storage medium
model
data
case
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010644579.0A
Other languages
English (en)
Other versions
CN111858548B (zh
Inventor
汤健
王丹丹
周晓钟
罗宏基
王晖
禹明生
韩红桂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN202010644579.0A priority Critical patent/CN111858548B/zh
Publication of CN111858548A publication Critical patent/CN111858548A/zh
Application granted granted Critical
Publication of CN111858548B publication Critical patent/CN111858548B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/219Managing data history or versioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02WCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO WASTEWATER TREATMENT OR WASTE MANAGEMENT
    • Y02W90/00Enabling technologies or technologies with a potential or indirect contribution to greenhouse gas [GHG] emissions mitigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种存储介质特征数据库的构建及更新方法,其包括存储介质特征数据案例构建模块、废旧电子设备硬件扫描及特征识别模块、特征数据比对模块、未知案例提取模块、未知案例更新模块。为了获得相对高效的信息清除方案,采用本发明的技术方案构建存储介质的特征数据库以便为不同类型的存储介质制定差异化的信息清除方案;同时,为适应众多的和不断更新的存储介质类型需要对存储介质特征数据库进行更新。

Description

一种存储介质特征数据库的构建及更新方法
技术领域
本发明属于移动终端技术领域,尤其涉及一种存储介质特征数据库的构建及更新方法。
背景技术
移动终端类设备和电脑等电子产品的更新换代速度逐渐加快。据统计,截至 2015年10月,我国手机用户已达13.02亿,每年产生的废弃手机大约有2亿部,然而其回收率尚不足1%[1],原因之一在于交投用户担心废旧手机内的隐私信息被泄露。通常,这些电子设备自身所带有的信息删除或格式化功能并不能真正地清除存储在这些存储介质上的数据信息,采用专用软件的非专业化处理即可恢复部分或全部数据[2],这对个人隐私乃至国家安全都构成了严重的威胁[3]。
信息清除是指采用各种技术手段将存储设备中的隐私数据予以彻底删除,数据覆写是目前最为有效和经济的方法之一[4]。文献[5]所提出的基于不同安全等级的信息清除策略是国内清除设备/软件的主流解决方案,但其采用的清除策略大多都是固定的,并未考虑存储介质的差异化特性。文献[6]给出了包含前端清除设备、后台服务器的信息清除系统整体设计理念,并提出全盘覆写和穿插区域随机覆写等方式提高清除效率。
目前移动终端类设备和电脑等电子产品都广泛采用NAND闪存,该类型存储器具有较高存储容量和编程/擦写次数,在非易失性大容量存储设备市场上占据主流地位,尤其是在手机、平板等移动终端类设备中。虽然NAND闪存具有体积小、容量大、成本低、擦除次数多以及保存寿命长等优点[7],但其存在SLC(单层式存储)、MLC(多层式存储)、TLC(三层式存储)和QLC(四层式存储)等多种类型[8]。通常存储的层次越多表征着其存储的密度越大,但存储单元的可擦写次数却随着存储密度的提升而降低,如从SLC的10万次降到了QLC的1000次 [9]。目前的3D堆叠技术也进一步则提升了闪存的存储密度。另外,根据存储芯片在封装时运用的技术标准差异,又可将闪存分为多个不同的类型。因此,不同的闪存颗粒以及封装技术,导致存储芯片类型的多样化,进而使得其数据存储与擦除机理具有较大差异性。针对基于闪存的存储介质,文献[10]针对固态存储器进行了信息清除的分析与研究;文献[11]对Android存储系统设计了一款信息恢复与清除软件;文献[12]通过建立基于模型驱动构架的平台无关碎片信息清除模型,统一对不同平台进行碎片信息清除。信息清除的国外专利是先根据待清除区域容量生成覆写序列,再对待清除区域地址进行多次循环执行覆写操作,最后核验每次覆写结果。
此外,闪存还具有写前需要擦除和擦除次数具有上限等特性,必须采用磨损均衡机制尽量均匀地使用闪存中的所有存储块[13],进而提高数据存储的可靠性和存储介质的使用寿命。针对已有NAND Flash磨损均衡机制仅着重于闪存块擦除次数而影响了固态硬盘的整体读写性能的问题,文献[14]提出基于权重堆排序的静态磨损均衡机制,并采用事件驱动型SSDsim模拟器进行算法评估。此外,不同的闪存转换层策略也对闪存的性能具有极大的影响[15]。在实际生产过过程中,厂家为了保证产品的利润空间而对产品硬件架构进行优化,存在同款电子产品在不同批次使用不同类型存储芯片的情况,这使得通过设备的型号以及官方公布的标准硬件配置等数据收集渠道无法准确获取存储介质类类型的相关数据。
综上可知,为了获得相对高效的信息清除方案,有必要构建存储介质的特征数据库以便为不同类型的存储介质而制定差异化的信息清除方案;同时,为适应众多存储介质类型和需要对存储介质特征数据库进行更新。
发明内容
针对不同类型存储介质及其存储方案的差异性,导致简单地采用统一的信息清除策略难以完成对存储介质所存储信息的彻底清除,需要根据存储介质特性等信息构建定制化的信息清除方案。定制化清除方案的生成基于对待清除废旧电子设备的存储介质特性、待清除数据特性等信息的综合分析及优化计算,该过程需要花费大量的计算成本和时间成本。所以,构建存储介质特征数据库存储不同存储介质特征案例,每个案例包括存储介质特征数据和与之对应的信息清除方案参数,可以指导当前信息清除方案的生成。本申请提出了存储介质特征数据库的构建及更新方法,其包括存储介质特征数据案例构建模块、废旧电子设备硬件扫描及特征识别模块、特征数据比对与匹配模块、未知案例提取模块、未知案例更新模块。
首先,基于不同类型的存储器/存储芯片建立存储介质标准特征模型,并利用第三方设备/软件与不同废旧电子设备或存储设备进行硬件连接,通过扫描识别,获取不同存储介质的特征参数信息,结合人工收集生产厂家提供的硬件特征参数信息,将收集到的存储介质特征信息整理并规范化形成特征数据存入存储介质特征数据库中,然后通过实验设计研究针对不同特征数据的信息清除方案参数,将其存储于存储介质特征数据库中对应案例中,由此构建基础的存储介质特征数据库;
然后,通过对待清除废旧电子设备进行硬件扫描,获取待清除废旧电子设备的基础硬件信息和存储介质详细硬件参数;通过基础硬件信息与存储介质特征数据库中的案例进行匹配,得到待清除废旧电子设备的初始特征数据,若无法匹配到相似案例则将其视为未知案例;
接着,对扫描得到的存储介质详细硬件参数进行特征提取后,与初始特征数据进行比对,若比对差异在允许范围内,则将初始特征数据作为该待清除废旧电子设备的特征数据,并输出与该案例对应的信息清除方案参数;若比对差异超出允许范围,则根据提取到的特征数据与存储介质特征数据库中案例进行特征数据匹配,若匹配到相似案例,则将该案例对应的信息清除方案参数输出,若未匹配到相似案例,则视之为未知案例;
接着,依据存储介质特征数据库中不同标准特征集模型分别对未知案例信息进行特征数据提取,并与标准模型对应的案例集进行特征数据校验,选取综合差异值在允许范围内最小的标准特征集模型作为新案例的初始特征集模型,若校验结果均超出允许范围,需将该案例信息提供给后台服务器,进行手动案例添加并建立相应标准特征集模型;
最后,对初始特征集模型进行修正,修正后的特征集模型与其对应的衍生模型进行比对,依据比对结果更新相应衍生特征集模型/添加新的衍生特征集模型,并添加新案例的特征数据至存储介质特征数据库。
附图说明
图1存储介质特征数据库的构建及更新方法总体结构图;
图2存储介质特征数据案例构建模块功能流程图;
图3废旧电子设备硬件扫描及特征识别模块功能流程图;
图4特征数据比对模块功能流程图;
图5未知案例提取模块功能流程图;
图6未知案例更新模块功能流程图。
具体实施方式
本发明提出了一种存储介质特征数据库的构建及更新方法,其包括存储介质特征数据案例构建模块、废旧电子设备硬件扫描及特征识别模块、特征数据比对与匹配模块、未知案例提取模块、未知案例更新模块,如图1所示。
(1)特征数据案例构建模块
该模块的输入为存储介质或现存废旧电子设备,输出为特征集模型和特征数据。依据离线采集的不同类型的存储介质的硬件参数等信息,构建不同的标准特征集模型,并据此进行存储介质特征数据案例的收集与管理,再根据收集到的信息对不同废旧电子设备进行信息清除实验,研究不同存储介质特征对应的信息清除方案参数,以确保信息清除的安全性与高效性,从而构建初始存储介质特征数据库,为信息清除系统存储介质特征识别和案例匹配提供支撑。
(2)废旧电子设备扫描与特征识别模块
该模块的输入为待清除废旧电子设备,输出为待清除废旧电子设备存储介质的初始特征数据与其硬件详细参数,或未知案例信息。对废旧电子设备进行扫描,获取其基本硬件信息和存储介质详细硬件参数,通过基本硬件信息与数据库中案例进行匹配,获取该电子设备存储介质的初始特征数据,为特征数据比对模块中待清除电子设备的存储介质详细参数与其初始特征数据比对提供支撑;若根据设备基本硬件信息未匹配到相似案例,则进入未知案例提取模块建立新的案例。
(3)特征数据比对模块
该模块的输入为待清除废旧电子设备存储介质的初始特征数据与其详细硬件参数,输出为信息清除方案参数或未知特征数据。将扫描得到的待清除废旧电子设备存储介质详细硬件参数与匹配得到的存储介质初始特征数据进行比对分析,若两者差异在允许范围内,则将初始特征数据作为该电子设备的最终特征数据,输出对应特征案例的信息清除方案参数;若两者差异超过允许范围,则初始特征数据不作为该电子设备的最终特征数据,再利用存储介质详细硬件参数提取的特征数据与数据库中案例的特征数据进行匹配,若匹配到相似案例,则将该案例的特征数据作为待清除废旧电子设备的特征数据,并输出该案例对应的信息清除方案参数,若未匹配到相似案例则将该电子设备的存储介质视为未知案例,重新分析并提取其特征数据作为新案例存储,其基本硬件信息与存储介质详细硬件参数作为未知案例提取模块为其提供支撑。
(4)未知案例提取模块
该模块的输入为未知案例信息,包括待清除废旧电子设备基本硬件信息和存储介质详细硬件参数,输出为初始特征集和案例剩余信息。根据该废旧电子设备存储介质的详细硬件信息根据存储介质特征数据库中不同标准特征及模型集进行特征数据提取,并根据数据库中相应案例进行校验以匹配到适用于该未知案例的标准特征集模型,将初始特征集与案例剩余信息输出。若未匹配到标准模型,则将该未知案例信息保存,并向后台服务器发送警告,手动构建标准模型并添加与数据库中。
(5)未知案例更新模块
该模块的输入为未知案例的初始特征集模型和案例剩余信息,输出为新增案例特征集,并对存储介质特征数据库进行更新,然后再向后台服务器发送通知,通过实验设计研究该案例对应的信息清除案例参数,并存储于数据库中,与相应案例对应。
存储介质特征数据案例构建模块的具体过程为:
如图2所示,该模块的实现需要综合自动化手段和人工手段综合实现,构建的存储介质特征数据库用于存储人工收集的存储器/存储芯片生产厂家提供的存储介质硬件信息/参数经标准化后的特征集,特征集包含特征数据和特征项(例:特征项“存储介质类型”对应的特征数据“2”表示“该存储介质属于MLC类型”),特征项的集合称为特征集的模型,它规定了需要收集/提取存储介质的哪些特征数据,存储介质特征数据库中针对不同类型的电子设备应该有不同的特征集模型,在构建存储介质特征数据库的前期需要通过人工构造标准的特征集模型,而随着电子设备的不断更新,标准的特征集模型由数据库维护人员构造并添加,而特征集衍生模型由数据库算法根据标准模型自动修改并添加,存储介质特征数据库用于根据存储器/存储芯片型号确定存储介质的初始特征数据。该模块也可以辅助构建废旧电子设备的硬件信息库,它用于存储市场现有电子设备生产厂家提供的设备型号、存储器/存储芯片等硬件型号信息,用于根据废旧电子设备的型号来简单确定存储器/存储芯片的型号。
该模块的输入为现有废旧电子设备/存储介质,输出为特征集,包含特征集模型和与之对应的特征数据,具体过程如下:
首先,废旧电子设备或单独的存储器/存储芯片通过终端模拟器或相应硬件接口连接到第三方设备,对其进行扫描或访问,获取存储介质的硬件型号信息,根据存储芯片硬件型号人工收集/自动获取其品牌、生产厂家、发布时间、存储介质类型、读写通道、通道工作模式、写周期、擦除周期、容量、页大小和块大小等相关参数;对于废旧电子设备,扫描获取的设备型号、存储介质型号等硬件信息可经过标准化后作为案例添加至废旧电子设备硬件信息库;另外也可根据电子设备或存储介质生产厂家提供的设备信息直接收集所需参数。
接着,从收集的相关参数中提取关键性和信息清除相关性的部分,如存储介质类型、写周期、擦除周期、容量、页大小及块大小等,用于存储器/存储芯片的识别、分析等过程的特征项;
接着,以存储器/存储芯片特征项为基础构建标准的特征集模型,表现形式如:{芯片/设备型号;生产厂家;存储介质类型;写周期;擦除周期;容量;页大小;块大小,等};并基于特征集模型对获取的存储介质相关参数进行整合标准化,生成案例的特征数据集合,如{K9GAG08U0M;3;2;800;1.5;2;(4k+128); (512k+16k);...}(其中,第二项的“3”表示生产厂家为三星,第三项的“2”表示存储介质类型属于MLC,第4~8项的数字分别具有统一的单位:us/block; ms/block;bit;Byte;Byte;)。
最后,根据存储介质特征数据设计信息清除实验研究与之对应的最佳信息清除方案参数,并由存储介质特征数据与相应的信息清除方案参数作为一个案例存储于存储介质特征数据库,案例的特征集包括特征集模型和特征数据。
废旧电子设备硬件扫描及特征识别模块的具体过程为:
如图3所示,该模块的输入为待清除废旧电子设备,输出为待清除废旧电子设备存储介质的初始特征数据和存储介质详细硬件参数,或未知案例信息,具体过程如下:
首先,利用第三方软件/设备访问或扫描待处理废旧电子设备,获取废旧电子设备的基本硬件信息和其存储介质详细硬件参数,其中,废旧电子设备的基本硬件信息如设备型号、存储器/存储芯片型号等,存储介质详细硬件参数如随机读取速度、顺序写入速度等;
接着,如果通过访问或扫描不能够获取到存储器/存储芯片的型号或型号唯一识别信息,则可根据废旧电子设备的型号与废旧电子设备硬件信息库中案例进行匹配获得存储器/存储芯片的型号信息;如果通过识别或匹配获取到存储器/存储芯片的型号信息,则根据该信息与存储介质特征数据库中的案例进行相似性匹配,若匹配到相似案例,则将该案例的特征数据作为待清除废旧电子设备的初始特征集(包括特征集模型和特征数据);如果无法获取存储器/存储芯片型号或未匹配到存储介质特征数据库中的相似案例则将废旧电子设备的基本硬件信息和存储介质详细硬件参数作为未知案例参数输出至未知案例提取模块,进行新案例的建立;
具体地,在访问或扫描废旧电子设备时,需进一步确认待清除的存储区域,以准确的获取存储介质的初始特征数据。如废旧笔记本电脑往往存在不同的存储器(作为主盘的固态硬盘,作为辅盘的机械硬盘,作为扩展的内存条等),另外,固态硬盘上存在多个存储芯片,其硬件参数可能存在差异,所以,需要依据待清除存储空间信息来判断待获取特征数据的存储器/存储芯片。
特征数据比对模块的具体过程为:
如图4所示,该模块通过将废旧电子设备存储介质的初始特征数据与扫描获取的实际特征参数进行比对,以判断初始特征数据的真实性,防止因电子设备存储器配置差异、恶意篡改电子设备存储器识别码等因素造成获取的特征数据不准确、不真实问题。
该模块的输入为待清除废旧电子设备存储介质的初始特征集和存储介质详细硬件参数,输出为信息清除方案参数和未知案例信息,具体过程如下:
首先,根据待清除废旧电子设备的存储介质初始特征集的特征集模型(初始特征集模型可能是相应标准模型的衍生版本,衍生模型可能包含非关键性特征项,如“隐藏存储空间大小”等),建立特征数据提取器,将存储介质详细硬件参数进行归类整理、分析提取形成标准格式的特征数据;具体地,提取不到特征项,将其值设定为默认值。
接着,基于初始特征集对应的标准特征集模型(标准模型包含的特征项都是存储介质必要的关键特征)对提取到的特征数据与匹配到的初始特征数据进行比对,该过程在特征数据比对器中进行。基于标准特征集模型进行特征数据比对是因为,虽然提取到的特征数据与初始特征数据具有相同的特征集模型,但其中可能含有存储介质的非关键特征项、非固有特征项等,这不利于两者进行相似比对。
具体地,根据标准特征集模型提取并构建出进行比对的实际特征数据和案例特征数据,这些特征数据均表现为标准化数据,可直接依据特征数据比对器中规则进行数值比较,特征数据比对器根据各项比对结果及相应规则计算出综合差异值。若该值在允许范围内,则认为匹配到的初始特征数据符合实际存储介质特征,将初始特征数据作为该待清除废旧电子设备的实际特征数据,并将匹配到的案例对应的信息清除方案参数进行输出;若差异值超出允许范围,则认为匹配到的初始特征数据不符合实际存储介质特征,需要依据提取到的特征数据与存储介质特征数据库中的案例进行特征数据匹配。
接着,在特征数据匹配器中,逐一调取存储介质特征数据库中案例,将案例对应的特征集依据标准特征集模型进行简化(标准特征集模型与特征模型提取器中使用的相同),再进行逐一的相似性比对,若可以匹配到差异值在允许范围内的相似案例,选择差异值最小的案例的特征数据作为该待清除废旧电子设备的特征数据,并将该案例对应的信息清除方案参数进行输出;若未匹配到相似案例,则将该电子设备的存储介质特征视为未知案例,需建立新的案例进行描述,所以将包含基本硬件信息、存储介质详细硬件参数、提取到的特征数据等未知案例信息作为输出,进行进一步的未知案例提取。
未知案例提取模块的具体过程为:
如图5所示,该模块结合未知案例更新模块旨在实现信息清除系统在投入使用时,能够自动化的识别、提取、构建新型的和小众的电子设备/存储设备的存储介质特征集。
该模块的输入为未知案例信息,输出为该未知案例的初始特征集(包括临时特征集模型和与之对应的未知特征数据)和案例剩余信息,具体过程如下:
根据存储介质特征数据库中各个案例的特征集模型和特征数据等信息(每个案例的特征数据都对应某个特征集模型,但一个特征集模型可对应多个案例的特征数据),建立未知案例信息的特征数据提取与校验机制。
具体地,需要对未知案例信息进行标准化特征数据提取与校验。从存储介质特征数据库中调取一个标准特征集模型,依据该模型从未知案例信息中提取出相应特征集(无法提取的特征项的值设置为默认值),将该标准模型对应的所有案例依据该模型进行标准型简化,逐一与提取到的特征数据进行比对,最后计算总体的综合差异值。根据以上方法分别对存储介质特征数据库中所有标准特征集模型进行校验,获取相应的差异值。选择在允许范围内差异值最小的标准特征集模型和与之对应已提取的特征数据作为该未知案例的初始特征集,并将其输出至未知案例更新模块进行进一步的模型修改和特征数据提取。若所有的校验结果都超出允许范围,则向后台管理员发出警告,并将该未知案例信息保存,用于人工进行新案例构建或数据库维护。
除了已提取的初始特征数据,未知案例信息中一般仍含有其他有效特征数据 (这些特征数据不能用于存储介质的识别,但影响信息清除过程的安全性和效率,例如“隐藏空间大小”、“坏块大小”等),要进一步的特征集模型修改,所以将案例剩余信息输出至未知案例更新模块。
未知案例更新模块的具体过程为:
如图6所示,该模块的输入为初始特征集和案例剩余信息,输出为新增特征集,包括新增特征集模型和新增特征数据,具体过程如下:
首先,在初始特征集的基础上添加其他特征项。具体地,从存储介质特征数据库中调取未知案例提取模块匹配到的标准模型对应的所有衍生模型的特征项,依据衍生模型的特征项从案例剩余信息中提取对应的特征数据值,并将可提取的特征项添加至初始特征集模型中(例如,依据衍生模型1,为初始模型添加了“特征项1”和“特征项2”,依据衍生模型2,又在模型上添加了“特征项B”,依据衍生模型3,没有为模型添加任何特征项...),由此依据所有衍生模型添加特征项后,可获得修正后的特征集模型,且其对应的特征数据也已经提取完成。经过模型修正后,若还存在其他未被提取的案例剩余信息,则将其整理后存放于数据隔离区,并索引至该新案例,以备数据库维护使用。
接着,将已修正的特征集模型与上述的所有衍生模型进行比较,以确定该案例的最终特征集,指导更新存储介质特征数据库。具体地,用已修正的特征集模型逐一与所有衍生模型进行特征项的比较,确定其包含关系(例如,已修正的特征集模型包含衍生模型1的所有特征项,已修正的特征集模型与衍生模型2的特征项存在交叉),
1)若存在一个衍生模型与已修正的特征集模型的所有特征项相同,则直接将该衍生模型作为该案例的最终特征集模型;
2)若存在一个衍生模型包含已修正的特征集模型的所有特征项,则将该衍生模型作为该案例的最终特征集模型,将未知的特征项的值设定为默认值;
3)若存在一个衍生模型包含于已修正的特征集模型的所有特征项,则依照已修正的特征集模型对存储介质特征数据库中该衍生模型进行修正,数据库中与该衍生模型对应的所有案例的新增特征项的值均设定为默认值(未知特征项的值在识别到相同案例时,有自动补充功能,也可以通过后台管理员人工添加);
4)若所有衍生模型与已修正的特征集模型的特征项都是交叉关系,则将该已修正的特征集模型作为新衍生模型添加至存储介质特征数据库。
最后,通过案例添加/更新机制对存储介质特征数据库实现上述相应操作。
本发明的创新性体现在
1)可以从废旧电子设备的硬件信息中自动地识别、提取其特征数据,并匹配存储介质特征数据库中相似案例;
2)可以根据未知废旧电子设备存储介质的详细硬件参数,构建新的存储介质特征案例,并更新数据库。
[1]周婧.标准化推动我国废旧手机回收产业发展的研究[J].质量与标准化,2018(01):41-43.
[2]尹燕彬,文伟平.计算机数据安全删除和隐私保护[J].信息网络安全,2009(05):55-58.
[3]叶清明.基于MDA的SQLite碎片数据清除技术的研究[D].昆明理工大学,2016.
[4]沈贺磊.漫谈信息消除技术[J].信息安全与通信保密,2009(08):92-94.
[5]杜银霞.安全清除硬盘中残留数据的研究[D].河北科技大学,2012.
[6]刘君;许常乐;耿利达.智能手机上的原有信息进行彻底清除的方法[P].中国专利:CN107277089A,2017-10-20.
7刘航航,李晓颖,杨云刚,薛小乐.NAND Flash存储关键技术[J].弹箭与制导学报,2016,36(01):161-164.
8Micron.Micron QLC NAND SSD.https://www.micron.com/about/
news-and-events/media-relations/media-kits/qlc-nand-media-kit,2018.
9张建权.基于软件定义的闪存存储系统构建及性能优化技术研究[D].华中科技大学,2018.
[10]祁峰,高琪,何蓬.固态存储设备和器件的信息消除方法研究[J].保密科学技术,2011(06):54-59.
[11]孙典.基于Android平台的数据恢复与清除软件的设计与实现[D].北京邮电大学,2014.
[12]叶清明.基于MDA的SQLite碎片数据清除技术的研究[D].昆明理工大学,2016.
13贾鑫,张少平.基于贪婪策略的NAND FLASH存储器的磨损均衡算法研究[J].计算机科学,2017,44(S2):312-316.
14刘彦,徐骥龙,祝磊.基于权重堆排序的NAND Flash静态磨损均衡机制[J].计算机工程与科学,2019,41(02):207-213.
15Wei Q,Chen C,Xue M,et al.Z-MAP:AZone-BasedFlash Translation Layerwith Workload Classification for Solid-State Drive.Acm Transactions onStorage(TOS), 2015,11(1):4:1–33.

Claims (4)

1.一种存储介质特征数据库的构建及更新方法,其特征在于,包括以下步骤:
步骤1、基于不同类型的存储器/存储芯片建立标准化的存储介质硬件信息特征基础模型,并利用第三方设备/软件与不同废旧电子设备或存储设备进行硬件连接,通过扫描识别,获取不同存储介质的特征信息,同时结合获取生产厂家提供的硬件特征参数信息以及针对不同特征数据的信息清除方案参数,构建基础的存储介质特征数据库;
步骤2、通过对待清除废旧电子设备的硬件扫描,获取待清除废旧电子设备的基础硬件信息和存储介质详细硬件参数;通过基础硬件信息与存储介质特征数据库中的案例进行匹配,得到待清除废旧电子设备的初始特征数据,若无法匹配到相似案例则将其视为未知案例;
步骤3、对扫描得到的存储介质详细硬件参数进行特征提取后,与初始特征数据进行比对,若比对差异在允许范围内,则将初始特征数据作为该待清除废旧电子设备的特征数据,并输出与该案例对应的信息清除方案参数;若比对差异超出允许范围,则根据提取到的特征数据与存储介质特征数据库中案例进行特征数据匹配,若匹配到相似案例,则将该案例对应的信息清除方案参数输出,若未匹配到相似案例,则视之为未知案例;
步骤4、依据存储介质特征数据库中不同标准特征集模型分别对未知案例信息进行特征数据提取,并与标准模型对应的案例集进行特征数据校验,选取综合差异值在允许范围内最小的标准特征集模型作为新案例的初始特征集模型,若校验结果均超出允许范围,需将该案例信息提供给后台服务器,进行案例添加并建立相应标准特征集模型;
步骤5、对初始特征集模型进行修正,修正后的特征集模型与其对应的衍生模型进行比对,依据比对结果更新相应衍生特征集模型/添加新的衍生特征集模型,并添加新案例的特征数据至存储介质特征数据库。
2.如权利要求1所述的存储介质特征数据库的构建及更新方法,其特征在于,步骤3具体为:
步骤31、根据待清除废旧电子设备的存储介质初始特征集的特征集模型,建立特征数据提取器,将存储介质详细硬件参数进行归类整理、分析提取形成标准格式的特征数据;
步骤32、基于初始特征集对应的标准特征集模型对提取到的特征数据与匹配到的初始特征数据进行比对;即,根据标准特征集模型提取并构建出进行比对的实际特征数据和案例特征数据,这些特征数据均表现为标准化数据,可直接依据特征数据比对器中规则进行数值比较,特征数据比对器根据各项比对结果及相应规则计算出综合差异值,若该值在允许范围内,则认为匹配到的初始特征数据符合实际存储介质特征,将初始特征数据作为该待清除废旧电子设备的实际特征数据,并将匹配到的案例对应的信息清除方案参数进行输出;若差异值超出允许范围,则认为匹配到的初始特征数据不符合实际存储介质特征,需要依据提取到的特征数据与存储介质特征数据库中的案例进行特征数据匹配;
步骤33、在特征数据匹配器中,逐一调取存储介质特征数据库中案例,将案例对应的特征集依据标准特征集模型进行简化,再进行逐一的相似性比对,若可以匹配到差异值在允许范围内的相似案例,选择差异值最小的案例的特征数据作为该待清除废旧电子设备的特征数据,并将该案例对应的信息清除方案参数进行输出;若未匹配到相似案例,则将该电子设备的存储介质特征视为未知案例,需建立新的案例进行描述,所以将包含基本硬件信息、存储介质详细硬件参数、提取到的特征数据未知案例信息作为输出,进行进一步的未知案例提取。
3.如权利要求1所述的存储介质特征数据库的构建及更新方法,其特征在于,步骤4具体为:
根据存储介质特征数据库中各个案例的特征集模型和特征数据信息,建立未知案例信息的特征数据提取与校验机制;从存储介质特征数据库中调取一个标准特征集模型,依据该模型从未知案例信息中提取出相应特征集,将该标准模型对应的所有案例依据该模型进行标准型简化,逐一与提取到的特征数据进行比对,最后计算总体的综合差异值;根据以上方法分别对存储介质特征数据库中所有标准特征集模型进行校验,获取相应的差异值;选择在允许范围内差异值最小的标准特征集模型和与之对应已提取的特征数据作为该未知案例的初始特征集,并将其输出至未知案例更新模块进行进一步的模型修改和特征数据提取;若所有的校验结果都超出允许范围,则向后台管理员发出警告,并将该未知案例信息保存,用于工进行新案例构建或数据库维护。
4.如权利要求1所述的存储介质特征数据库的构建及更新方法,其特征在于,步骤5具体为:
步骤51、在初始特征集的基础上添加其他特征项;从存储介质特征数据库中调取未知案例提取模块匹配到的标准模型对应的所有衍生模型的特征项,依据衍生模型的特征项从案例剩余信息中提取对应的特征数据值,并将可提取的特征项添加至初始特征集模型中,由此依据所有衍生模型添加特征项后,可获得修正后的特征集模型,且其对应的特征数据也已经提取完成。经过模型修正后,若还存在其他未被提取的案例剩余信息,则将其整理后存放于数据隔离区,并索引至该新案例;
步骤52、将已修正的特征集模型与上述的所有衍生模型进行比较,以确定该案例的最终特征集,指导更新存储介质特征数据库;采用已修正的特征集模型逐一与所有衍生模型进行特征项的比较,确定其包含关系,
1)若存在一个衍生模型与已修正的特征集模型的所有特征项相同,则直接将该衍生模型作为该案例的最终特征集模型;
2)若存在一个衍生模型包含已修正的特征集模型的所有特征项,则将该衍生模型作为该案例的最终特征集模型,将未知的特征项的值设定为默认值;
3)若存在一个衍生模型包含于已修正的特征集模型的所有特征项,则依照已修正的特征集模型对存储介质特征数据库中该衍生模型进行修正,数据库中与该衍生模型对应的所有案例的新增特征项的值均设定为默认值;
4)若所有衍生模型与已修正的特征集模型的特征项都是交叉关系,则将该已修正的特征集模型作为新衍生模型添加至存储介质特征数据库。
步骤53、通过案例添加/更新机制对存储介质特征数据库实现上述相应操作。
CN202010644579.0A 2020-07-07 2020-07-07 一种存储介质特征数据库的构建及更新方法 Active CN111858548B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010644579.0A CN111858548B (zh) 2020-07-07 2020-07-07 一种存储介质特征数据库的构建及更新方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010644579.0A CN111858548B (zh) 2020-07-07 2020-07-07 一种存储介质特征数据库的构建及更新方法

Publications (2)

Publication Number Publication Date
CN111858548A true CN111858548A (zh) 2020-10-30
CN111858548B CN111858548B (zh) 2022-05-17

Family

ID=73152348

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010644579.0A Active CN111858548B (zh) 2020-07-07 2020-07-07 一种存储介质特征数据库的构建及更新方法

Country Status (1)

Country Link
CN (1) CN111858548B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104836227A (zh) * 2015-04-17 2015-08-12 天津大学 基于案例推理的配电网主动电压控制方法
CN110363150A (zh) * 2019-07-16 2019-10-22 深圳市商汤科技有限公司 数据更新方法及装置、电子设备和存储介质
CN110866279A (zh) * 2019-11-15 2020-03-06 北京工业大学 一种基于废旧电子产品特征的信息清除参数获取方法
CN110866291A (zh) * 2019-11-15 2020-03-06 北京工业大学 一种基于双重安全机制的废旧电子产品信息清除方法
CN111221920A (zh) * 2019-11-29 2020-06-02 国网电力科学研究院武汉南瑞有限责任公司 变电设备运维装置的案例库构建方法、装置及计算机存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104836227A (zh) * 2015-04-17 2015-08-12 天津大学 基于案例推理的配电网主动电压控制方法
CN110363150A (zh) * 2019-07-16 2019-10-22 深圳市商汤科技有限公司 数据更新方法及装置、电子设备和存储介质
CN110866279A (zh) * 2019-11-15 2020-03-06 北京工业大学 一种基于废旧电子产品特征的信息清除参数获取方法
CN110866291A (zh) * 2019-11-15 2020-03-06 北京工业大学 一种基于双重安全机制的废旧电子产品信息清除方法
CN111221920A (zh) * 2019-11-29 2020-06-02 国网电力科学研究院武汉南瑞有限责任公司 变电设备运维装置的案例库构建方法、装置及计算机存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
侯玉梅: "基于案例推理法研究综述", 《燕山大学学报》 *

Also Published As

Publication number Publication date
CN111858548B (zh) 2022-05-17

Similar Documents

Publication Publication Date Title
CN100444075C (zh) 用于移动/智能终端的病毒特征提取和检测系统及方法
CN110457302B (zh) 一种结构化数据智能清洗方法
CN104679777A (zh) 一种用于检测欺诈交易的方法及系统
CN104205132B (zh) 在智能卡的非易失性存储器中写入数据
CN106599322A (zh) 数据脱敏的方法及设备
US20100146190A1 (en) Flash memory storage system, and controller and method for anti-falsifying data thereof
CN102609462A (zh) 一种通过提取sql模板对海量sql压缩存储的方法
CN105224600A (zh) 一种样本相似度的检测方法及装置
CN104731977A (zh) 电话号码数据的发现与分类方法
CN116089620B (zh) 一种电子档案数据管理方法和系统
CN108090360A (zh) 一种基于行为特征的安卓恶意应用分类方法及系统
CN102591864A (zh) 比对系统中的数据更新方法及装置
CN111190833B (zh) 敏感数据检测方法、装置、存储介质及设备
CN111858550B (zh) 一种固件系统特征数据库的构建及更新方法
CN108536845A (zh) 残缺数据库文件检验方法
CN111858548B (zh) 一种存储介质特征数据库的构建及更新方法
CN104885060A (zh) 数据漏更新检查装置、数据漏更新检查方法、数据漏更新检查程序
CN106156046B (zh) 一种信息化管理方法、装置、系统及分析设备
CN104517053A (zh) 软件识别方法及装置
CN111221690A (zh) 针对集成电路设计的模型确定方法、装置及终端
US20230214591A1 (en) Methods and devices for generating sensitive text detectors
CN114511330A (zh) 一种基于改进的cnn-rf的以太坊庞氏骗局检测方法及系统
CN114579711A (zh) 诈骗应用程序的识别方法、装置、设备及存储介质
CN103870408B (zh) 数据处理方法、存储器控制器与存储器储存装置
CN112162934A (zh) 存储块异常磨损处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant