CN112668041B - 单证文件的生成方法、装置、计算机设备和存储介质 - Google Patents
单证文件的生成方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN112668041B CN112668041B CN202011496976.4A CN202011496976A CN112668041B CN 112668041 B CN112668041 B CN 112668041B CN 202011496976 A CN202011496976 A CN 202011496976A CN 112668041 B CN112668041 B CN 112668041B
- Authority
- CN
- China
- Prior art keywords
- fields
- desensitization
- information
- preset
- desensitized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及数据处理领域,提供一种单证文件的生成方法、装置、计算机设备和存储介质,方法包括:接收输入的单证文件生成请求;解析出单证文件索引信息和单证填充信息,从预设的单证数据库内筛选出单证文件模板;从单证填充信息筛选出待脱敏字段;从预设的规则库中获取与各待脱敏字段对应的脱敏规则;对各待脱敏字段对应的待填充信息进行脱敏处理,得到脱敏信息;将各脱敏信息以及剩余字段对应的待填充信息填充至单证文件模板内,得到处理后的单证文件模板,并进行转换处理得到相应的目标单证文件。本申请能够有效地保证生成的单证文件中敏感信息的数据安全性。本申请还可以应用于区块链领域,上述目标单证文件等数据可以存储于区块链上。
Description
技术领域
本申请涉及数据处理技术领域,具体涉及一种单证文件的生成方法、装置、计算机设备和存储介质。
背景技术
单证文件是一种需要展示给用户,用于告知用户相关事项或等待用户确认的内容的文件,例如可包括产品说明、服务合同、隐私条款等,单证文件被应用于众多的业务场景中。由于现有的单证文件中会包含有用户各种私人的敏感信息,例如姓名、银行卡号码、身份证等,因而在单证文件的文件流传过程中,用户的敏感信息极易遭受到不发分子的盗取,并利用敏感信息进行牟利从而导致用户受损,现有的单证文件存在数据安全性较低的问题,单证文件内的敏感信息无法得到保护。
发明内容
本申请的主要目的为提供一种单证文件的生成方法、装置、计算机设备和存储介质,旨在解决现有的单证文件存在数据安全性较低的问题,单证文件内的敏感信息无法得到保护的技术问题。
本申请提出一种单证文件的生成方法,所述方法包括步骤:
接收输入的单证文件生成请求,其中,所述单证文件生成请求携带单证文件索引信息与单证填充信息,所述单证填充信息包括待填充字段以及对应的待填充信息;
从所述单证文件生成请求中解析出所述单证文件索引信息和所述单证填充信息,基于所述单证文件索引信息,从预设的单证数据库内筛选出对应的单证文件模板,其中,所述单证文件模板中包括多个预设字段;
基于预设的敏感字段列表,从所述单证填充信息包含的所述待填充字段中筛选出待脱敏字段,其中,所述待脱敏字段包括多个;
从预设的规则库中获取与各所述待脱敏字段分别对应的脱敏规则,调用预设的指定待命脱敏线程对各所述待脱敏字段对应的待填充信息进行相应的脱敏处理,得到处理后的脱敏信息;
从所有所述预设字段中确定出与各所述待脱敏字段一一对应的第一字段,并根据所述待脱敏字段与所述第一字段之间的对应关系,将各所述脱敏信息填充至所述单证文件模板内的第一对应位置处;以及,
基于所述待填充字段中除所述待脱敏字段之外的剩余字段与所述预设字段中的第二字段之间的对应关系,将所述剩余字段对应的待填充信息填充至所述单证文件模板的第二对应位置处,得到处理后的单证文件模板,其中,所述第二字段为所述预设字段中除所述第一字段之外的其他字段;
将所述处理后的单证文件模板转换为预设文件格式,得到目标单证文件。
可选地,所述基于预设的敏感字段列表,从所述单证填充信息包含的所述待填充字段中筛选出待脱敏字段的步骤之前,包括:
获取所述预设字段的第一数量,以及获取所述待填充字段的第二数量;
判断所述第一数量与所述第二数量是否相同;
若所述第一数量与所述第二数量相同,则判断所述待填充字段与所述预设字段之间是否为一一对应的关系;
若所述待填充字段与所述预设字段之间为一一对应的关系,则基于预设的信息填写规范,判断各所述待填充信息是否均符合所述信息填写规范;
若各所述待填充信息均符合所述信息填写规范,则生成基于预设的敏感字段列表,从所述单证填充信息包含的所述待填充字段中筛选出待脱敏字段的筛选指令。
可选地,所述基于预设的敏感字段列表,从所述单证填充信息包含的所述待填充字段中筛选出待脱敏字段的步骤,包括:
获取预设的敏感字段列表,其中,所述敏感字段列表内包含有多个敏感字段;
将指定待填充字段与所述敏感字段列表中所有所述敏感字段分别进行匹配处理,判断所述敏感字段内是否存在与所述指定待填充字段相同的目标字段,其中,所述指定待填充字段为所有所述待填充字段中的任意一个字段;
若所述敏感字段内存在所述目标字段,则将所述指定待填充字段标记为待脱敏字段,并提取出所述待脱敏字段。
可选地,所述基于预设的敏感字段列表,从所述单证填充信息包含的所述待填充字段中筛选出待脱敏字段的步骤之前,包括:
接收预先输入的多个敏感字段,以及与各所述敏感字段分别对应的重要程度描述信息;
基于所述重要程度描述信息生成与各所述敏感字段一一对应的级别标识,其中,所述级别标识包括高级别标识、中级别标识与低级别标识;
为所述敏感字段与所述级别标识建立映射关系,并存储于预设的数据列表内,得到所述敏感字段列表;
将所述敏感字段列表存储于区块链内。
可选地,所述从预设的规则库中获取与各所述待脱敏字段分别对应的脱敏规则,调用预设的指定待命脱敏线程对各所述待脱敏字段对应的待填充信息进行相应的脱敏处理,得到处理后的脱敏信息的步骤之前,包括:
基于所述敏感字段列表,获取指定敏感字段对应的指定级别标识,其中,所述指定敏感字段为所述敏感字段列表包含的所有敏感字段中的任意一个敏感字段;
判断所述指定级别标识是否为所述高级别标识;
若所述指定级别标识为所述高级别标识,则生成与所述指定敏感字段对应的第一脱敏规则,为所述指定敏感字段与所述第一脱敏规则建立映射关系并存储于所述规则库内,其中,所述第一脱敏规则为采用预设加密方式进行数据脱敏;
若所述指定级别标识不为所述高级别标识,则判断所述指定级别标识是否为所述中级别标识;
若所述指定级别标识为所述中级别标识,则生成与所述指定敏感字段对应的第二脱敏规则,为所述指定敏感字段与所述第二脱敏规则建立映射关系并存储于所述规则库内,其中,所述第二脱敏规则为采用替换方式进行数据脱敏;
若所述指定级别标识不为中级别标识,则生成与所述指定敏感字段对应的第三脱敏规则,为所述指定敏感字段与所述第三脱敏规则建立映射关系并存储于所述规则库内,其中,所述第三脱敏规则为采用模糊方式进行数据脱敏。
可选地,所述调用预设的指定待命脱敏线程对各所述待脱敏字段对应的待填充信息进行相应的脱敏处理,得到处理后的脱敏信息的步骤,包括:
获取所述待脱敏字段的第三数量;
判断所述第三数量是否大于预设的数量阈值;
若所述第三数量大于所述数量阈值,并发启动与所述第三数量相同的预先创建的多个指定待命脱敏线程;
基于与各所述待脱敏字段分别对应的脱敏规则,为所述指定待命脱敏线程与所述脱敏规则之间建立一一对应的关系,并将各所述脱敏规则分别发送至对应的各所述指定待命脱敏线程内;
调用各所述指定待命脱敏线程,并行执行内部的脱敏规则,对与所述待脱敏字段对应的待填充信息进行脱敏处理,得到与各所述待脱敏字段分别对应的脱敏信息。
可选地,所述调用预设的指定待命脱敏线程对各所述待脱敏字段对应的待填充信息进行相应的脱敏处理,得到处理后的脱敏信息的步骤之前,包括:
获取系统内核数量;以及,
获取预设的比例数值;
基于所述系统内核数量与所述比例数值,生成对应的目标数量;
创建与所述目标数量对应的多个待命脱敏线程。
本申请还提供一种单证文件的生成装置,包括:
第一接收模块,用于接收输入的单证文件生成请求,其中,所述单证文件生成请求携带单证文件索引信息与单证填充信息,所述单证填充信息包括待填充字段以及对应的待填充信息;
第一筛选模块,用于从所述单证文件生成请求中解析出所述单证文件索引信息和所述单证填充信息,基于所述单证文件索引信息,从预设的单证数据库内筛选出对应的单证文件模板,其中,所述单证文件模板中包括多个预设字段;
第二筛选模块,用于基于预设的敏感字段列表,从所述单证填充信息包含的所述待填充字段中筛选出待脱敏字段,其中,所述待脱敏字段包括多个;
处理模块,用于从预设的规则库中获取与各所述待脱敏字段分别对应的脱敏规则,调用预设的指定待命脱敏线程对各所述待脱敏字段对应的待填充信息进行相应的脱敏处理,得到处理后的脱敏信息;
第一填充模块,用于从所有所述预设字段中确定出与各所述待脱敏字段一一对应的第一字段,并根据所述待脱敏字段与所述第一字段之间的对应关系,将各所述脱敏信息填充至所述单证文件模板内的第一对应位置处;以及,
第二填充模块,用于基于所述待填充字段中除所述待脱敏字段之外的剩余字段与所述预设字段中的第二字段之间的对应关系,将所述剩余字段对应的待填充信息填充至所述单证文件模板的第二对应位置处,得到处理后的单证文件模板,其中,所述第二字段为所述预设字段中除所述第一字段之外的其他字段;
转换模块,用于将所述处理后的单证文件模板转换为预设文件格式,得到目标单证文件。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
本申请中提供的单证文件的生成方法、装置、计算机设备和存储介质,具有以下有益效果:
本申请中提供的单证文件的生成方法、装置、计算机设备和存储介质,在接收到需要进行数据脱敏处理的单证生成请求时,会基于预设敏感字段列表从单证生成请求携带的待填充字段内提取出待脱敏字段,并会基于预设的规则库获取与各所述待脱敏字段分别对应的脱敏规则,以及基于所述脱敏规则,调用预设的指定待命脱敏线程对各所述待脱敏字段对应的待填充信息进行相应的脱敏处理,以得到处理后的脱敏信息,最后利用该脱敏信息以及除脱敏字段外的其他字段对应的待填充信息对单证文件模板进行数据填充处理以生成所需的目标单证文件。通过对目标单证文件内的敏感字段对应的敏感信息进行脱敏处理,有效地保证了目标单证文件内敏感信息的数据安全性,避免了敏感信息泄露的风险。
附图说明
图1是本申请一实施例的单证文件的生成方法的流程示意图;
图2是本申请一实施例的单证文件的生成装置的结构示意图;
图3是本申请一实施例的计算机设备的结构示意图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用于解释本申请,并不用于限定本申请。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
参照图1,本申请一实施例的单证文件的生成方法,包括:
S1:接收输入的单证文件生成请求,其中,所述单证文件生成请求携带单证文件索引信息与单证填充信息,所述单证填充信息包括待填充字段以及对应的待填充信息;
S2:从所述单证文件生成请求中解析出所述单证文件索引信息和所述单证填充信息,基于所述单证文件索引信息,从预设的单证数据库内筛选出对应的单证文件模板,其中,所述单证文件模板中包括多个预设字段;
S3:基于预设的敏感字段列表,从所述单证填充信息包含的所述待填充字段中筛选出待脱敏字段,其中,所述待脱敏字段包括多个;
S4:从预设的规则库中获取与各所述待脱敏字段分别对应的脱敏规则,调用预设的指定待命脱敏线程对各所述待脱敏字段对应的待填充信息进行相应的脱敏处理,得到处理后的脱敏信息;
S5:从所有所述预设字段中确定出与各所述待脱敏字段一一对应的第一字段,并根据所述待脱敏字段与所述第一字段之间的对应关系,将各所述脱敏信息填充至所述单证文件模板内的第一对应位置处;以及,
S6:基于所述待填充字段中除所述待脱敏字段之外的剩余字段与所述预设字段中的第二字段之间的对应关系,将所述剩余字段对应的待填充信息填充至所述单证文件模板的第二对应位置处,得到处理后的单证文件模板,其中,所述第二字段为所述预设字段中除所述第一字段之外的其他字段;
S7:将所述处理后的单证文件模板转换为预设文件格式,得到目标单证文件。
如上述步骤S1至S7所述,本方法实施例的执行主体为一种单证文件的生成装置。在实际应用中,上述单证文件的生成装置可以通过虚拟装置,例如软件代码实现,也可以通过写入或集成有相关执行代码的实体装置实现,且可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。上述单证文件的生成装置具体可为单证生成业务系统,简称系统。本实施例中的单证文件的生成装置,能够通过对单证文件内的敏感字段对应的敏感信息进行脱敏处理,有效地保证了单证文件内敏感信息的数据安全性,避免了敏感信息泄露的风险。具体地,首先接收输入的单证文件生成请求,其中,上述单证文件生成请求携带单证文件索引信息与单证填充信息,上述单证填充信息包括待填充字段以及对应的待填充信息。另外,上述单证生成请求可为用户通过前端发送的用于生成单证文件的指令。上述单证文件索引信息为与需要生成的单证文件对应的所需要用到的单证文件模板的索引号,例如可为单证A。上述单证文件内包括有多个预设字段,以及每一个预设字段对应的字段信息填入区域,通过基于上述单证填充信息来对该单证文件模板进行对应的信息填充后,便能够生成所需的单证文件。上述单证填充信息为生成单证文件所需填入的信息。举例地,待填充字段以及对应的待填充信息可包括:姓名:小明,电话号码:12345678920;银行卡号:1111222233334444,等等。然后从上述单证文件生成请求中解析出上述单证文件索引信息和上述单证填充信息,基于上述单证文件索引信息,从预设的单证数据库内筛选出对应的单证文件模板,其中,上述单证文件模板中包括多个预设字段。其中,在得到了上述单证文件索引信息后,还可先判断上述单证文件索引信息是否存在于预设的单证脱敏列表内,如果该单证文件索引信息存在于上述单证脱敏列表内,后续才会对单证填充信息进行相应的脱敏处理来生成脱敏后的单证文件,从而能够避免对无需进行数据脱敏操作的单证文件进行不必要的脱敏工作而增加系统的损耗。上述单证脱敏列表为预先生成的存储有需要进行数据脱敏处理的重要性较高的单证文件的索引信息的数据列表。单证文件的重要性可根据单证文件制作过程中的实际需求进行设置,在此不作具体限定。具体的,通过将上述单证文件索引信息与上述单证脱敏列表内的所有索引信息进行逐一匹配比较后,进而可以识别出该单证文件索引信息是否存在于预设的单证脱敏列表内。另外,如果在检测出在单证脱敏列表内存在与该单证文件索引信息相同的目标索引信息后,还存在未进行匹配比较处理的指定索引信息,则后续会直接停止对于单证文件索引信息与指定索引信息之间的匹配处理工作,以减少系统的损耗。如果上述单证文件索引信息存在于上述单证脱敏列表内,则从上述单证生成请求中解析出上述单证填充信息,还可进一步对上述单证填充信息进行参数校验,并判断是否校验通过。其中,可以基于检测待填充字段与预设字段的数量是否相同、名称是否相同以及待填充信息是否符合预设的信息填写规范等方式来进行参数校验。如果校验通过,则基于上述单证文件索引信息,从预设的单证数据库内筛选出对应的单证文件模板,其中,上述单证文件模板中包括多个预设字段。另外,上述单证数据库内预先存储有适用于不同的业务类型的多个单证文件模板,且每一个单证文件模板会配置有对应的索引标识,根据索引标识便可查询得到相应的单证文件模板。上述单证文件模板内包括有多个单证字段,以及每一个单证字段对应的字段信息填入区域,通过获取与各单证字段对应的字段填充信息,并将该字段填充信息填入单证文件模板内对应的字段信息填入区域,便能够生成相应的单证文件。此外,在填入字段填充信息之前,还可以进一步对该字段填充信息中的敏感信息,例如姓名、电话号码、身份证号码、银行卡号等信息进行脱敏处理后,再将脱敏后的脱敏信息填入单证文件模板内对应的字段信息填入区域,以生成数据安全性较高的单证文件。之后基于预设的敏感字段列表,从上述单证填充信息包含的上述待填充字段中筛选出待脱敏字段,其中,上述待脱敏字段包括多个。另外,上述敏感字段列表是根据用户输入的敏感字段生成的,该敏感字段为敏感程度较高的信息所对应的字段,且后续在生成单证文件时需要对单证文件内的与该敏感字段对应的字段内容进行数据脱敏处理。在得到了上述待脱敏字段后,基于预设的规则库,获取与各上述待脱敏字段分别对应的脱敏规则。其中,对于敏感字段列表中的敏感字段,会根据各敏感字段的级别标识,为不同的敏感字段分配适配不同的脱敏规则,以生成与敏感字段对应的规则库。以及基于上述脱敏规则,调用预设的指定待命脱敏线程对各上述待脱敏字段对应的待填充信息进行相应的脱敏处理,得到处理后的脱敏信息。其中,待命脱敏线程是系统预先分配的用于进行数据脱敏处理的线程,该待命脱敏线程在工作状态时进行数据脱敏处理,不工作时则会进入休眠状态,无需进行线程的创建和销毁,有助于节省系统损耗。后续从所有上述预设字段中确定出与各上述待脱敏字段一一对应的第一字段,并根据上述待脱敏字段与上述第一字段之间的对应关系,将各上述脱敏信息填充至上述单证文件模板内的第一对应位置处。其中,上述单证文件模板内包含有与上述待脱敏字段相同的第一字段,且对于第一字段还会设置有相应的第一字段信息填入区域,可将与待脱敏字段对应的脱敏信息一一对应地填入单证文件模板内的第一字段信息填入区域,以实现对于单证文件模板的精确的信息填充,且填入的敏感信息是经过对原始的待填入信息进行相应的自动化脱敏处理后生成的,从而可以保证数据安全性。以及基于上述待填充字段中除上述待脱敏字段之外的剩余字段与上述预设字段中的第二字段之间的对应关系,将上述剩余字段对应的待填充信息填充至上述单证文件模板的第二对应位置处,得到处理后的单证文件模板,其中,上述第二字段为上述预设字段中除上述第一字段之外的其他字段。另外,上述单证文件模板内包含有与上述剩余字段相同的第二字段,且对于第二字段还会设置有相应的第二字段信息填入区域,可将与剩余字段对应的待填充信息一一对应地填入单证文件模板内的第二字段信息填入区域,以实现对于单证文件模板的精确的信息填充。最后将上述处理后的单证文件模板转换为预设文件格式,得到目标单证文件。其中,在得到了处理后的单证文件模板后,还可将其转化为预设文件格式以得到与输入的单证生成请求对应的目标单证文件,以便后续能够基于该目标单证文件进行信息传递。另外,对于上述预设文件格式的具体文件格式不作具体限定,例如可为pdf文件格式,并且可采用现有的文件格式转化方法实现将处理后的单证文件模板转化为该预设文件格式,在此不再赘述。本实施例在接收到需要进行数据脱敏处理的单证生成请求时,会基于预设敏感字段列表从单证生成请求携带的待填充字段内提取出待脱敏字段,并会基于预设的规则库获取与各上述待脱敏字段分别对应的脱敏规则,以及基于上述脱敏规则,调用预设的指定待命脱敏线程对各上述待脱敏字段对应的待填充信息进行相应的脱敏处理,以得到处理后的脱敏信息,最后利用该脱敏信息以及除脱敏字段外的其他字段对应的待填充信息对单证文件模板进行数据填充处理以生成所需的目标单证文件。通过对目标单证文件内的敏感字段对应的敏感信息进行脱敏处理,有效地保证了目标单证文件内敏感信息的数据安全性,避免了敏感信息泄露的风险。
进一步地,本申请一实施例中,上述步骤S3中的基于预设的敏感字段列表,从所述单证填充信息包含的所述待填充字段中筛选出待脱敏字段的步骤之前,包括:
S300:获取所述预设字段的第一数量,以及获取所述待填充字段的第二数量;
S301:判断所述第一数量与所述第二数量是否相同;
S302:若所述第一数量与所述第二数量相同,则判断所述待填充字段与所述预设字段之间是否为一一对应的关系;
S303:若所述待填充字段与所述预设字段之间为一一对应的关系,则基于预设的信息填写规范,判断各所述待填充信息是否均符合所述信息填写规范;
S304:若各所述待填充信息均符合所述信息填写规范,则生成基于预设的敏感字段列表,从所述单证填充信息包含的所述待填充字段中筛选出待脱敏字段的筛选指令。
如上述步骤S300至S304所述,在执行上述基于预设的敏感字段列表,从上述单证填充信息包含的上述待填充字段中筛选出待脱敏字段的步骤之前,还可包括对于上述单证填充信息进行参数校验的校验步骤。具体地,首先获取上述预设字段的第一数量,以及获取上述待填充字段的第二数量。然后判断上述第一数量与上述第二数量是否相同。其中,如果第一数量与第二数量不相同,也即预设字段的数量与待填充字段的数量不相同,则会直接生成参数校验不通过的校验结果。如果上述第一数量与上述第二数量相同,则判断上述待填充字段与上述预设字段之间是否为一一对应的关系。其中,上述一一对应关系是指对于所有预设字段中的任意一个指定预设字段,在待填充字段均存在与该指定预设字段相同的字段。如果上述待填充字段与上述预设字段之间为一一对应的关系,则基于预设的信息填写规范,判断各上述待填充信息是否均符合上述信息填写规范。其中,上述信息填写规范可包括与身份证号码信息对应的身份证号码填写规范、与银行卡号信息对应的银行卡号填写规范,等等。判断待填充信息是否均符合上述信息填写规范的过程可包括:检测身份证号码的位数是否正确且是否有效,检测银行卡号是否正确且有效,等等。如果各上述待填充信息均符合上述信息填写规范,则生成基于预设的敏感字段列表,从上述单证填充信息包含的上述待填充字段中筛选出待脱敏字段的筛选指令。而如果各上述待填充信息未均符合上述信息填写规范,则判定校验未通过。其中,如果判定出各上述待填充信息未均符合上述信息填写规范,则会从待填充信息中进一步筛选出不符合规范的异常数据,并返回与该异常数据对应的错误码,以便用户根据该错误码对异常数据进行相应的修改并重新输入正确数据。本实施例通过对输入的单证填充信息进行参数校验处理,只有通过参数校验后才会执行生成基于预设的敏感字段列表,从上述单证填充信息包含的上述待填充字段中筛选出待脱敏字段的步骤,有利于保证后续填充至单证文件模板内的信息的准确性,进而提高了生成的目标单证文件的准确性。
进一步地,本申请一实施例中,上述步骤S3,包括:
S310:获取预设的敏感字段列表,其中,所述敏感字段列表内包含有多个敏感字段;
S311:将指定待填充字段与所述敏感字段列表中所有所述敏感字段分别进行匹配处理,判断所述敏感字段内是否存在与所述指定待填充字段相同的目标字段,其中,所述指定待填充字段为所有所述待填充字段中的任意一个字段;
S312:若所述敏感字段内存在所述目标字段,则将所述指定待填充字段标记为待脱敏字段,并提取出所述待脱敏字段。
如上述步骤S310至S312所述,上述基于预设的敏感字段列表,从上述单证填充信息包含的上述待填充字段中筛选出待脱敏字段的步骤,具体可包括:首先获取预设的敏感字段列表,其中,上述敏感字段列表内包含有多个敏感字段。另外,上述敏感字段列表是根据用户输入的敏感字段生成的,该敏感字段为敏感程度较高的信息所对应的字段,且后续在生成单证文件时需要对单证文件内的与该敏感字段对应的字段内容进行数据脱敏处理。然后将指定待填充字段与上述敏感字段列表中所有上述敏感字段分别进行匹配处理,判断上述敏感字段内是否存在与上述指定待填充字段相同的目标字段,其中,上述指定待填充字段为所有上述待填充字段中的任意一个字段。另外,可基于预设的并行比较指令来进行指定待填充字段与所有上述敏感字段之间的匹配处理,上述并行比较指令具体可为单指令流多数据流(single instruction multiple data,SIMD)指令。通过利用并行比较指令的并行计算能力来同时对上述指定待填充字段与上述所有敏感字段中的每一个敏感字段分别进行数据匹配处理,有效的提高了每一个待填充字段与敏感字段之间的比对处理速率,提高了待脱敏字段的获取速率。如果上述敏感字段内存在上述目标字段,则将上述指定待填充字段标记为待脱敏字段,并提取出上述待脱敏字段。本实施例通过基于敏感字段列表从待填充字段中筛选出敏感程度较高的待脱敏字段,进而只对待填充字段中的待脱敏字段进行脱敏处理,而不会对所有待填充字段进行脱敏处理,有效地减少数据处理中产生的不必要的消耗,提高了数据脱敏处理的智能性。
进一步地,本申请一实施例中,上述步骤S3之前,包括:
S320:接收预先输入的多个敏感字段,以及与各所述敏感字段分别对应的重要程度描述信息;
S321:基于所述重要程度描述信息生成与各所述敏感字段一一对应的级别标识,其中,所述级别标识包括高级别标识、中级别标识与低级别标识;
S322:为所述敏感字段与所述级别标识建立映射关系,并存储于预设的数据列表内,得到所述敏感字段列表;
S323:将所述敏感字段列表存储于区块链内。
如上述步骤S320至S323所述,在执行上述基于预设的敏感字段列表,从上述单证填充信息包含的上述待填充字段中筛选出待脱敏字段的步骤之前,还可包括关于上述敏感字段列表的生成步骤。具体地,首先接收预先输入的多个敏感字段,以及与各上述敏感字段分别对应的重要程度描述信息。其中,上述敏感字段具体可为敏感程度较高的信息所对应的字段,且后续在生成单证文件时需要对单证文件内的与该敏感字段对应的字段内容进行数据脱敏处理。上述敏感字段可根据实际需求进行设置,举例地,敏感程度较高的信息为身份证号码,则其对应的敏感字段可为身份证号码字段。另外,上述重要程度描述信息用于指代敏感字段的重要性程度,用户可根据实际经验为各个敏感字段分别输入相应的重要程度描述信息,重要程度描述信息例如可包括重要性高、重要性中、重要性低。然后基于上述重要程度描述信息生成与各上述敏感字段一一对应的级别标识。其中,上述级别标识包括高级别标识、中级别标识与低级别标识。另外,上述级别标识由重要程度描述信息生成,用于标识敏感字段的敏感性级别,重要性高的敏感字段会生成相应的高级别标识,重要性中的敏感字段会生成相应的中级别标识,重要性低的敏感字段会生成相应的低级别标识。之后为上述敏感字段与上述级别标识建立映射关系,并存储于预设的数据列表内,得到上述敏感字段列表。最后将上述敏感字段列表存储于区块链内。其中,通过使用区块链来对上述敏感字段列表进行存储和管理,能够有效地保证上述目标单证文件的安全性与不可篡改性。本实施例通过将上述敏感字段与上述级别标识建立对应关系,并存储于预设的数据列表内来得到上述敏感字段列表,有利于后续能够根据该敏感字段列表来快速地从上述单证填充信息包含的待填充字段内筛选出待脱敏字段。
进一步地,本申请一实施例中,上述步骤S4之前,包括:
S400:基于所述敏感字段列表,获取指定敏感字段对应的指定级别标识,其中,所述指定敏感字段为所述敏感字段列表包含的所有敏感字段中的任意一个敏感字段;
S401:判断所述指定级别标识是否为所述高级别标识;
S402:若所述指定级别标识为所述高级别标识,则生成与所述指定敏感字段对应的第一脱敏规则,为所述指定敏感字段与所述第一脱敏规则建立映射关系并存储于所述规则库内,其中,所述第一脱敏规则为采用预设加密方式进行数据脱敏;
S403:若所述指定级别标识不为所述高级别标识,则判断所述指定级别标识是否为所述中级别标识;
S404:若所述指定级别标识为所述中级别标识,则生成与所述指定敏感字段对应的第二脱敏规则,为所述指定敏感字段与所述第二脱敏规则建立映射关系并存储于所述规则库内,其中,所述第二脱敏规则为采用替换方式进行数据脱敏;
S405:若所述指定级别标识不为中级别标识,则生成与所述指定敏感字段对应的第三脱敏规则,为所述指定敏感字段与所述第三脱敏规则建立映射关系并存储于所述规则库内,其中,所述第三脱敏规则为采用模糊方式进行数据脱敏。
如上述步骤S400至S405所述,在执行上述从预设的规则库中获取与各上述待脱敏字段分别对应的脱敏规则,调用预设的指定待命脱敏线程对各上述待脱敏字段对应的待填充信息进行相应的脱敏处理,得到处理后的脱敏信息的步骤之前,还可包括关于上述规则库的生成步骤。具体地,首先基于上述敏感字段列表,获取指定敏感字段对应的指定级别标识,其中,上述指定敏感字段为上述敏感字段列表包含的所有敏感字段中的任意一个敏感字段。然后判断上述指定级别标识是否为上述高级别标识。其中,对于级别标识的级别越高的敏感字段会对应采用安全性越高的脱敏方式。如果上述指定级别标识为上述高级别标识,则生成与上述指定敏感字段对应的第一脱敏规则,为上述指定敏感字段与上述第一脱敏规则建立映射关系并存储于上述规则库内,其中,上述第一脱敏规则为采用预设加密方式进行数据脱敏。另外,对于上述预设加密方式不作具体限定,例如可包括哈希加密算法、非对称加密算法等。而如果上述指定级别标识不为上述高级别标识,则进一步判断上述指定级别标识是否为上述中级别标识。如果上述指定级别标识为上述中级别标识,则生成与上述指定敏感字段对应的第二脱敏规则,为上述指定敏感字段与上述第二脱敏规则建立映射关系并存储于上述规则库内,其中,上述第二脱敏规则为采用替换方式进行数据脱敏。另外,上述替换方式可包括预设字符替换与随机字符替换等方式。而如果上述指定级别标识不为中级别标识,则生成与上述指定敏感字段对应的第三脱敏规则,为上述指定敏感字段与上述第三脱敏规则建立映射关系并存储于上述规则库内,其中,上述第三脱敏规则为采用模糊方式进行数据脱敏。另外,上述模糊方式可包括将敏感数据处理为不易查看的模糊状态的方式。本实施例对于敏感字段列表中的敏感字段,会根据各敏感字段的级别标识,为不同的敏感字段分配适配不同的脱敏规则,实现了脱敏规则配置的智能性与合理性,以生成与敏感字段对应的规则库,有利于后续能够方便快捷地从该规则库中获取与上述各上述待脱敏字段分别对应的脱敏规则,进而选取相应的敏感规则分别进行对于各待脱敏字段对应的待填充信息的数据脱敏处理以得到处理后的脱敏信息,保证了生成的脱敏信息的规范性与准确性。
进一步地,本申请一实施例中,上述步骤S4中的调用预设的指定待命脱敏线程对各所述待脱敏字段对应的待填充信息进行相应的脱敏处理,得到处理后的脱敏信息的步骤,包括:
S410:获取所述待脱敏字段的第三数量;
S411:判断所述第三数量是否大于预设的数量阈值;
S412:若所述第三数量大于所述数量阈值,并发启动与所述第三数量相同的预先创建的多个指定待命脱敏线程;
S413:基于与各所述待脱敏字段分别对应的脱敏规则,为所述指定待命脱敏线程与所述脱敏规则之间建立一一对应的关系,并将各所述脱敏规则分别发送至对应的各所述指定待命脱敏线程内;
S414:调用各所述指定待命脱敏线程,并行执行内部的脱敏规则,对与所述待脱敏字段对应的待填充信息进行脱敏处理,得到与各所述待脱敏字段分别对应的脱敏信息。
如上述步骤S410至S414所述,上述调用预设的指定待命脱敏线程对各上述待脱敏字段对应的待填充信息进行相应的脱敏处理,得到处理后的脱敏信息的步骤,具体可包括:首先获取上述待脱敏字段的第三数量。然后判断上述第三数量是否大于预设的数量阈值。其中,对于上述数量阈值不作具体限定,可根据实际需求进行设置,例如可设为2。如果上述第三数量大于上述数量阈值,并发启动与上述第三数量相同的预先创建的多个指定待命脱敏线程。其中,待命脱敏线程是系统预先分配的用于进行数据脱敏处理的线程,该待命脱敏线程在工作状态时进行数据脱敏处理,不工作时则会进入休眠状态,无需进行线程的创建和销毁,有助于节省系统损耗。该待命脱敏线程是基于内部的脱敏规则对待填充信息进行相应的数据脱敏处理,可以保证数据脱敏过程的可行性。另外,可通过触发唤醒指令,并基于上述唤醒指令来并发唤醒线程池中处于休眠状态的第三数量的指定待命脱敏线程。之后基于与各上述待脱敏字段分别对应的脱敏规则,为上述指定待命脱敏线程与上述脱敏规则之间建立一一对应的关系,并将各上述脱敏规则分别发送至对应的各上述指定待命脱敏线程内。最后调用各上述指定待命脱敏线程,并行执行内部的脱敏规则,对与上述待脱敏字段对应的待填充信息进行脱敏处理,得到与各上述待脱敏字段分别对应的脱敏信息。本实施例通过采用与待脱敏字段的数量相同的多个待命脱敏线程来并发执行数据脱敏处理流程,从而能够充分利用系统的CPU和内存性能,发挥多核CPU的优势,降低数据脱敏处理的时延,提高数据脱敏处理的处理效率。另外,由于待命脱敏线程是预先创建的,因而无需等待创建待脱敏线程即可直接对相应的待填充信息进行脱敏处理,以保证对所有的待填充信息分别进行数据脱敏处理的处理效率,节省数据脱敏过程的处理时间。
进一步地,本申请一实施例中,上述步骤S4之前,包括:
S420:获取系统内核数量;以及,
S421:获取预设的比例数值;
S422:基于所述系统内核数量与所述比例数值,生成对应的目标数量;
S423:创建与所述目标数量对应的多个待命脱敏线程。
如上述步骤S420至S423所述,在执行上述调用预设的指定待命脱敏线程对各上述待脱敏字段对应的待填充信息进行相应的脱敏处理,得到处理后的脱敏信息的步骤之前,还可包括提前创建待命脱敏线程的创建步骤。具体地,首先获取系统内核数量;以及获取预设的比例数值。其中,上述系统内核数量具体是指系统中CPU(Central Processing Unit,中央处理器)的内核数量,即处理器的数量,可通过在任务管理器中查看处理器对应的数量来获取上述内核数量,或者还可通过cpu get的操作指令来获取该内核数量。另外,上述比值数值是预先设置的比例范围,例如可以是1.5-3倍。然后基于上述系统内核数量与上述比例数值,生成对应的目标数量。其中,上述目标数量具体可为内核数量与比例数值的乘积。优选地,当目标数量为内核数量的2倍时,即比例数值为2时,系统的CPU中线程切换的代价较少,更有利于降低数据脱敏处理过程中的系统损耗。最后创建与上述目标数量对应的多个待命脱敏线程。本实施例在基于内核数量和比例数值确定目标数量之后,预先会在系统上创建脱敏线程池,该脱敏线程池包括与目标数量同的多个待命脱敏签线程,以便后续利用该待命验签线程并行进行多个数据脱敏处理流程。该待命脱敏线程在工作时进行数据脱敏处理,不工作时进入休眠状态,无需进行线程的创建和销毁,减少对CPU的占用,有助于降低系统损耗。另外,脱敏线程池中的待命脱敏线程的数量与目标数量相匹配,既可最大程度提高数据脱敏处理的处理效率,避免系统资源的浪费,也可避免数量过多的待命脱敏签线程会影响除数据脱敏处理以外的其他工作的处理效率。
本申请实施例中的单证文件的生成方法还可以应用于区块链领域,如将上述目标单证文件等数据存储于区块链上。通过使用区块链来对上述目标单证文件进行存储和管理,能够有效地保证上述目标单证文件的安全性与不可篡改性。
上述区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中,用户管理模块负责所有区块链参与者的身份信息管理,包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等,并且在授权的情况下,监管和审计某些真实身份的交易情况,提供风险控制的规则配置(风控审计);基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提供对合约升级注销的功能;运营监控模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出,例如:告警、监控网络情况、监控节点设备健康状态等。
参照图2,本申请一实施例中还提供了一种单证文件的生成装置,包括:
第一接收模块1,用于接收输入的单证文件生成请求,其中,所述单证文件生成请求携带单证文件索引信息与单证填充信息,所述单证填充信息包括待填充字段以及对应的待填充信息;
第一筛选模块2,用于从所述单证文件生成请求中解析出所述单证文件索引信息和所述单证填充信息,基于所述单证文件索引信息,从预设的单证数据库内筛选出对应的单证文件模板,其中,所述单证文件模板中包括多个预设字段;
第二筛选模块3,用于基于预设的敏感字段列表,从所述单证填充信息包含的所述待填充字段中筛选出待脱敏字段,其中,所述待脱敏字段包括多个;
处理模块4,用于从预设的规则库中获取与各所述待脱敏字段分别对应的脱敏规则,调用预设的指定待命脱敏线程对各所述待脱敏字段对应的待填充信息进行相应的脱敏处理,得到处理后的脱敏信息;
第一填充模块5,用于从所有所述预设字段中确定出与各所述待脱敏字段一一对应的第一字段,并根据所述待脱敏字段与所述第一字段之间的对应关系,将各所述脱敏信息填充至所述单证文件模板内的第一对应位置处;以及,
第二填充模块6,用于基于所述待填充字段中除所述待脱敏字段之外的剩余字段与所述预设字段中的第二字段之间的对应关系,将所述剩余字段对应的待填充信息填充至所述单证文件模板的第二对应位置处,得到处理后的单证文件模板,其中,所述第二字段为所述预设字段中除所述第一字段之外的其他字段;
转换模块7,用于将所述处理后的单证文件模板转换为预设文件格式,得到目标单证文件。
本实施例中,上述单证文件的生成装置中的第一接收模块、第一筛选模块、第二筛选模块、处理模块、第一填充模块、第二填充模块与转换模块的功能和作用的实现过程具体详见上述单证文件的生成方法中对应步骤S1至S7的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述单证文件的生成装置,包括:
第一获取模块,用于获取所述预设字段的第一数量,以及获取所述待填充字段的第二数量;
第一判断模块,用于判断所述第一数量与所述第二数量是否相同;
第二判断模块,用于若所述第一数量与所述第二数量相同,则判断所述待填充字段与所述预设字段之间是否为一一对应的关系;
第三判断模块,用于若所述待填充字段与所述预设字段之间为一一对应的关系,则基于预设的信息填写规范,判断各所述待填充信息是否均符合所述信息填写规范;
第一生成模块,用于若各所述待填充信息均符合所述信息填写规范,则生成基于预设的敏感字段列表,从所述单证填充信息包含的所述待填充字段中筛选出待脱敏字段的筛选指令。
本实施例中,上述单证文件的生成装置中的第一获取模块、第一判断模块、第二判断模块、第三判断模块与第一生成模块的功能和作用的实现过程具体详见上述单证文件的生成方法中对应步骤S300至S304的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述第二筛选模块,包括:
第一获取单元,用于获取预设的敏感字段列表,其中,所述敏感字段列表内包含有多个敏感字段;
第一判断单元,用于将指定待填充字段与所述敏感字段列表中所有所述敏感字段分别进行匹配处理,判断所述敏感字段内是否存在与所述指定待填充字段相同的目标字段,其中,所述指定待填充字段为所有所述待填充字段中的任意一个字段;
提取单元,用于若所述敏感字段内存在所述目标字段,则将所述指定待填充字段标记为待脱敏字段,并提取出所述待脱敏字段。
本实施例中,上述单证文件的生成装置中的第一获取单元、第一判断单元与提取单元的功能和作用的实现过程具体详见上述单证文件的生成方法中对应步骤S310至S312的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述单证文件的生成装置,包括:
第二接收模块,用于接收预先输入的多个敏感字段,以及与各所述敏感字段分别对应的重要程度描述信息;
第二生成模块,用于基于所述重要程度描述信息生成与各所述敏感字段一一对应的级别标识,其中,所述级别标识包括高级别标识、中级别标识与低级别标识;
第一存储模块,用于为所述敏感字段与所述级别标识建立映射关系,并存储于预设的数据列表内,得到所述敏感字段列表;
第二存储模块,用于将所述敏感字段列表存储于区块链内。
本实施例中,上述单证文件的生成装置中的第二接收模块、第二生成模块、第一存储模块与第二存储模块的功能和作用的实现过程具体详见上述单证文件的生成方法中对应步骤S320至S323的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述单证文件的生成装置,包括:
第二获取模块,用于基于所述敏感字段列表,获取指定敏感字段对应的指定级别标识,其中,所述指定敏感字段为所述敏感字段列表包含的所有敏感字段中的任意一个敏感字段;
第四判断模块,用于判断所述指定级别标识是否为所述高级别标识;
第三生成模块,用于若所述指定级别标识为所述高级别标识,则生成与所述指定敏感字段对应的第一脱敏规则,为所述指定敏感字段与所述第一脱敏规则建立映射关系并存储于所述规则库内,其中,所述第一脱敏规则为采用预设加密方式进行数据脱敏;
第五判断模块,用于若所述指定级别标识不为所述高级别标识,则判断所述指定级别标识是否为所述中级别标识;
第四生成模块,用于若所述指定级别标识为所述中级别标识,则生成与所述指定敏感字段对应的第二脱敏规则,为所述指定敏感字段与所述第二脱敏规则建立映射关系并存储于所述规则库内,其中,所述第二脱敏规则为采用替换方式进行数据脱敏;
第五生成模块,用于若所述指定级别标识不为中级别标识,则生成与所述指定敏感字段对应的第三脱敏规则,为所述指定敏感字段与所述第三脱敏规则建立映射关系并存储于所述规则库内,其中,所述第三脱敏规则为采用模糊方式进行数据脱敏。
本实施例中,上述单证文件的生成装置中的第二获取模块、第四判断模块、第三生成模块、第五判断模块、第四生成模块与第五生成模块的功能和作用的实现过程具体详见上述单证文件的生成方法中对应步骤S400至S405的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述处理模块,包括:
第二获取单元,用于获取所述待脱敏字段的第三数量;
第二判断单元,用于判断所述第三数量是否大于预设的数量阈值;
启动单元,用于若所述第三数量大于所述数量阈值,并发启动与所述第三数量相同的预先创建的多个指定待命脱敏线程;
发送单元,用于基于与各所述待脱敏字段分别对应的脱敏规则,为所述指定待命脱敏线程与所述脱敏规则之间建立一一对应的关系,并将各所述脱敏规则分别发送至对应的各所述指定待命脱敏线程内;
执行单元,用于调用各所述指定待命脱敏线程,并行执行内部的脱敏规则,对与所述待脱敏字段对应的待填充信息进行脱敏处理,得到与各所述待脱敏字段分别对应的脱敏信息。
本实施例中,上述单证文件的生成装置中的第二获取单元、第二判断单元、启动单元、发送单元与执行单元的功能和作用的实现过程具体详见上述单证文件的生成方法中对应步骤S410至S414的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述单证文件的生成装置,包括:
第三获取模块,用于获取系统内核数量;以及,
第四获取模块,用于获取预设的比例数值;
第六生成模块,用于基于所述系统内核数量与所述比例数值,生成对应的目标数量;
创建模块,用于创建与所述目标数量对应的多个待命脱敏线程。
本实施例中,上述单证文件的生成装置中的第三获取模块、第四获取模块、第六生成模块与创建模块的功能和作用的实现过程具体详见上述单证文件的生成方法中对应步骤S420至S423的实现过程,在此不再赘述。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏、输入装置和数据库。其中,该计算机设备设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括存储介质、内存储器。该存储介质存储有操作系统、计算机程序和数据库。该内存储器为存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储单证文件索引信息、单证填充信息、单证脱敏列表、单证文件模板、敏感字段列表、待脱敏字段、脱敏规则、脱敏信息以及目标单证文件。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机设备的显示屏是计算机中必不可少的一种图文输出设备,用于将数字信号转换为光信号,使文字与图形在显示屏的屏幕上显示出来。该计算机设备的输入装置是计算机与用户或其他设备之间进行信息交换的主要装置,用于把数据、指令及某些标志信息等输送到计算机中去。该计算机程序被处理器执行时以实现一种单证文件的生成方法。
上述处理器执行上述单证文件的生成方法的步骤:
接收输入的单证文件生成请求,其中,所述单证文件生成请求携带单证文件索引信息与单证填充信息,所述单证填充信息包括待填充字段以及对应的待填充信息;
从所述单证文件生成请求中解析出所述单证文件索引信息和所述单证填充信息,基于所述单证文件索引信息,从预设的单证数据库内筛选出对应的单证文件模板,其中,所述单证文件模板中包括多个预设字段;
基于预设的敏感字段列表,从所述单证填充信息包含的所述待填充字段中筛选出待脱敏字段,其中,所述待脱敏字段包括多个;
从预设的规则库中获取与各所述待脱敏字段分别对应的脱敏规则,调用预设的指定待命脱敏线程对各所述待脱敏字段对应的待填充信息进行相应的脱敏处理,得到处理后的脱敏信息;
从所有所述预设字段中确定出与各所述待脱敏字段一一对应的第一字段,并根据所述待脱敏字段与所述第一字段之间的对应关系,将各所述脱敏信息填充至所述单证文件模板内的第一对应位置处;以及,
基于所述待填充字段中除所述待脱敏字段之外的剩余字段与所述预设字段中的第二字段之间的对应关系,将所述剩余字段对应的待填充信息填充至所述单证文件模板的第二对应位置处,得到处理后的单证文件模板,其中,所述第二字段为所述预设字段中除所述第一字段之外的其他字段;
将所述处理后的单证文件模板转换为预设文件格式,得到目标单证文件。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的装置、计算机设备的限定。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种单证文件的生成方法,具体为:
接收输入的单证文件生成请求,其中,所述单证文件生成请求携带单证文件索引信息与单证填充信息,所述单证填充信息包括待填充字段以及对应的待填充信息;
从所述单证文件生成请求中解析出所述单证文件索引信息和所述单证填充信息,基于所述单证文件索引信息,从预设的单证数据库内筛选出对应的单证文件模板,其中,所述单证文件模板中包括多个预设字段;
基于预设的敏感字段列表,从所述单证填充信息包含的所述待填充字段中筛选出待脱敏字段,其中,所述待脱敏字段包括多个;
从预设的规则库中获取与各所述待脱敏字段分别对应的脱敏规则,调用预设的指定待命脱敏线程对各所述待脱敏字段对应的待填充信息进行相应的脱敏处理,得到处理后的脱敏信息;
从所有所述预设字段中确定出与各所述待脱敏字段一一对应的第一字段,并根据所述待脱敏字段与所述第一字段之间的对应关系,将各所述脱敏信息填充至所述单证文件模板内的第一对应位置处;以及,
基于所述待填充字段中除所述待脱敏字段之外的剩余字段与所述预设字段中的第二字段之间的对应关系,将所述剩余字段对应的待填充信息填充至所述单证文件模板的第二对应位置处,得到处理后的单证文件模板,其中,所述第二字段为所述预设字段中除所述第一字段之外的其他字段;
将所述处理后的单证文件模板转换为预设文件格式,得到目标单证文件。
综上所述,本申请实施例中提供的单证文件的生成方法、装置、计算机设备和存储介质,在接收到需要进行数据脱敏处理的单证生成请求时,会基于预设敏感字段列表从单证生成请求携带的待填充字段内提取出待脱敏字段,并会基于预设的规则库获取与各所述待脱敏字段分别对应的脱敏规则,以及基于所述脱敏规则,调用预设的指定待命脱敏线程对各所述待脱敏字段对应的待填充信息进行相应的脱敏处理,以得到处理后的脱敏信息,最后利用该脱敏信息以及除脱敏字段外的其他字段对应的待填充信息对单证文件模板进行数据填充处理以生成所需的目标单证文件。通过对目标单证文件内的敏感字段对应的敏感信息进行脱敏处理,有效地保证了目标单证文件内敏感信息的数据安全性,避免了敏感信息泄露的风险。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM通过多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (6)
1.一种单证文件的生成方法,其特征在于,包括:
接收输入的单证文件生成请求,其中,所述单证文件生成请求携带单证文件索引信息与单证填充信息,所述单证填充信息包括待填充字段以及对应的待填充信息;
从所述单证文件生成请求中解析出所述单证文件索引信息和所述单证填充信息,基于所述单证文件索引信息,从预设的单证数据库内筛选出对应的单证文件模板,其中,所述单证文件模板中包括多个预设字段;
基于预设的敏感字段列表,从所述单证填充信息包含的所述待填充字段中筛选出待脱敏字段,其中,所述待脱敏字段包括多个;
从预设的规则库中获取与各所述待脱敏字段分别对应的脱敏规则,调用预设的指定待命脱敏线程对各所述待脱敏字段对应的待填充信息进行相应的脱敏处理,得到处理后的脱敏信息;
从所有所述预设字段中确定出与各所述待脱敏字段一一对应的第一字段,并根据所述待脱敏字段与所述第一字段之间的对应关系,将各所述脱敏信息填充至所述单证文件模板内的第一对应位置处;以及,
基于所述待填充字段中除所述待脱敏字段之外的剩余字段与所述预设字段中的第二字段之间的对应关系,将所述剩余字段对应的待填充信息填充至所述单证文件模板的第二对应位置处,得到处理后的单证文件模板,其中,所述第二字段为所述预设字段中除所述第一字段之外的其他字段;
将所述处理后的单证文件模板转换为预设文件格式,得到目标单证文件;
所述基于预设的敏感字段列表,从所述单证填充信息包含的所述待填充字段中筛选出待脱敏字段的步骤之前,包括:
获取所述预设字段的第一数量,以及获取所述待填充字段的第二数量;
判断所述第一数量与所述第二数量是否相同;
若所述第一数量与所述第二数量相同,则判断所述待填充字段与所述预设字段之间是否为一一对应的关系;
若所述待填充字段与所述预设字段之间为一一对应的关系,则基于预设的信息填写规范,判断各所述待填充信息是否均符合所述信息填写规范;
若各所述待填充信息均符合所述信息填写规范,则生成基于预设的敏感字段列表,从所述单证填充信息包含的所述待填充字段中筛选出待脱敏字段的筛选指令;
所述基于预设的敏感字段列表,从所述单证填充信息包含的所述待填充字段中筛选出待脱敏字段的步骤之前,包括:
接收预先输入的多个敏感字段,以及与各所述敏感字段分别对应的重要程度描述信息;
基于所述重要程度描述信息生成与各所述敏感字段一一对应的级别标识,其中,所述级别标识包括高级别标识、中级别标识与低级别标识;
为所述敏感字段与所述级别标识建立映射关系,并存储于预设的数据列表内,得到所述敏感字段列表;
将所述敏感字段列表存储于区块链内;
所述从预设的规则库中获取与各所述待脱敏字段分别对应的脱敏规则,调用预设的指定待命脱敏线程对各所述待脱敏字段对应的待填充信息进行相应的脱敏处理,得到处理后的脱敏信息的步骤之前,包括:
基于所述敏感字段列表,获取指定敏感字段对应的指定级别标识,其中,所述指定敏感字段为所述敏感字段列表包含的所有敏感字段中的任意一个敏感字段;
判断所述指定级别标识是否为所述高级别标识;
若所述指定级别标识为所述高级别标识,则生成与所述指定敏感字段对应的第一脱敏规则,为所述指定敏感字段与所述第一脱敏规则建立映射关系并存储于所述规则库内,其中,所述第一脱敏规则为采用预设加密方式进行数据脱敏;
若所述指定级别标识不为所述高级别标识,则判断所述指定级别标识是否为所述中级别标识;
若所述指定级别标识为所述中级别标识,则生成与所述指定敏感字段对应的第二脱敏规则,为所述指定敏感字段与所述第二脱敏规则建立映射关系并存储于所述规则库内,其中,所述第二脱敏规则为采用替换方式进行数据脱敏;
若所述指定级别标识不为中级别标识,则生成与所述指定敏感字段对应的第三脱敏规则,为所述指定敏感字段与所述第三脱敏规则建立映射关系并存储于所述规则库内,其中,所述第三脱敏规则为采用模糊方式进行数据脱敏;
所述调用预设的指定待命脱敏线程对各所述待脱敏字段对应的待填充信息进行相应的脱敏处理,得到处理后的脱敏信息的步骤,包括:
获取所述待脱敏字段的第三数量;
判断所述第三数量是否大于预设的数量阈值;
若所述第三数量大于所述数量阈值,并发启动与所述第三数量相同的预先创建的多个指定待命脱敏线程;
基于与各所述待脱敏字段分别对应的脱敏规则,为所述指定待命脱敏线程与所述脱敏规则之间建立一一对应的关系,并将各所述脱敏规则分别发送至对应的各所述指定待命脱敏线程内;
调用各所述指定待命脱敏线程,并行执行内部的脱敏规则,对与所述待脱敏字段对应的待填充信息进行脱敏处理,得到与各所述待脱敏字段分别对应的脱敏信息。
2.根据权利要求1所述的单证文件的生成方法,其特征在于,所述基于预设的敏感字段列表,从所述单证填充信息包含的所述待填充字段中筛选出待脱敏字段的步骤,包括:
获取预设的敏感字段列表,其中,所述敏感字段列表内包含有多个敏感字段;
将指定待填充字段与所述敏感字段列表中所有所述敏感字段分别进行匹配处理,判断所述敏感字段内是否存在与所述指定待填充字段相同的目标字段,其中,所述指定待填充字段为所有所述待填充字段中的任意一个字段;
若所述敏感字段内存在所述目标字段,则将所述指定待填充字段标记为待脱敏字段,并提取出所述待脱敏字段。
3.根据权利要求1所述的单证文件的生成方法,其特征在于,所述调用预设的指定待命脱敏线程对各所述待脱敏字段对应的待填充信息进行相应的脱敏处理,得到处理后的脱敏信息的步骤之前,包括:
获取系统内核数量;以及,
获取预设的比例数值;
基于所述系统内核数量与所述比例数值,生成对应的目标数量;
创建与所述目标数量对应的多个待命脱敏线程。
4.一种单证文件的生成装置,用于实现权利要求1至3中任一项所述的方法,其特征在于,包括:
第一接收模块,用于接收输入的单证文件生成请求,其中,所述单证文件生成请求携带单证文件索引信息与单证填充信息,所述单证填充信息包括待填充字段以及对应的待填充信息;
第一筛选模块,用于从所述单证文件生成请求中解析出所述单证文件索引信息和所述单证填充信息,基于所述单证文件索引信息,从预设的单证数据库内筛选出对应的单证文件模板,其中,所述单证文件模板中包括多个预设字段;
第二筛选模块,用于基于预设的敏感字段列表,从所述单证填充信息包含的所述待填充字段中筛选出待脱敏字段,其中,所述待脱敏字段包括多个;
处理模块,用于从预设的规则库中获取与各所述待脱敏字段分别对应的脱敏规则,调用预设的指定待命脱敏线程对各所述待脱敏字段对应的待填充信息进行相应的脱敏处理,得到处理后的脱敏信息;
第一填充模块,用于从所有所述预设字段中确定出与各所述待脱敏字段一一对应的第一字段,并根据所述待脱敏字段与所述第一字段之间的对应关系,将各所述脱敏信息填充至所述单证文件模板内的第一对应位置处;以及,
第二填充模块,用于基于所述待填充字段中除所述待脱敏字段之外的剩余字段与所述预设字段中的第二字段之间的对应关系,将所述剩余字段对应的待填充信息填充至所述单证文件模板的第二对应位置处,得到处理后的单证文件模板,其中,所述第二字段为所述预设字段中除所述第一字段之外的其他字段;
转换模块,用于将所述处理后的单证文件模板转换为预设文件格式,得到目标单证文件。
5.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至3中任一项所述方法的步骤。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至3中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011496976.4A CN112668041B (zh) | 2020-12-17 | 2020-12-17 | 单证文件的生成方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011496976.4A CN112668041B (zh) | 2020-12-17 | 2020-12-17 | 单证文件的生成方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112668041A CN112668041A (zh) | 2021-04-16 |
CN112668041B true CN112668041B (zh) | 2023-07-04 |
Family
ID=75404859
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011496976.4A Active CN112668041B (zh) | 2020-12-17 | 2020-12-17 | 单证文件的生成方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112668041B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113191456A (zh) * | 2021-05-26 | 2021-07-30 | 平安信托有限责任公司 | 基于文本识别技术的单证生成方法、装置、设备及介质 |
CN113592571A (zh) * | 2021-07-27 | 2021-11-02 | 北京沃东天骏信息技术有限公司 | 一种票据开具预警方法、装置、设备及计算机可读介质 |
CN113642039B (zh) * | 2021-08-09 | 2024-05-28 | 平安科技(深圳)有限公司 | 单证模板的配置方法、装置、计算机设备和存储介质 |
CN115174555A (zh) * | 2022-06-28 | 2022-10-11 | 平安科技(深圳)有限公司 | 文件传输方法、装置、电子设备及存储介质 |
CN115080827B (zh) * | 2022-07-01 | 2024-05-24 | 中银金融科技有限公司 | 一种敏感数据处理方法及装置 |
CN116561795B (zh) * | 2023-04-26 | 2024-04-16 | 合芯科技(苏州)有限公司 | 一种数据并行脱敏处理方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107679442A (zh) * | 2017-06-23 | 2018-02-09 | 平安科技(深圳)有限公司 | 单证信息录入的方法、装置、计算机设备及存储介质 |
CN109388612A (zh) * | 2018-09-14 | 2019-02-26 | 中国科学院光电研究院 | 一种数据汇总文档生成的方法、设备、系统及介质 |
CN111191281A (zh) * | 2019-12-25 | 2020-05-22 | 平安信托有限责任公司 | 数据脱敏处理方法、装置、计算机设备及存储介质 |
CN111737963A (zh) * | 2020-07-21 | 2020-10-02 | 平安国际智慧城市科技股份有限公司 | 基于配置文件的表单填写方法、装置和计算机设备 |
CN112000986A (zh) * | 2020-08-27 | 2020-11-27 | 中国平安财产保险股份有限公司 | 数据脱敏方法、装置、设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070041041A1 (en) * | 2004-12-08 | 2007-02-22 | Werner Engbrocks | Method and computer program product for conversion of an input document data stream with one or more documents into a structured data file, and computer program product as well as method for generation of a rule set for such a method |
-
2020
- 2020-12-17 CN CN202011496976.4A patent/CN112668041B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107679442A (zh) * | 2017-06-23 | 2018-02-09 | 平安科技(深圳)有限公司 | 单证信息录入的方法、装置、计算机设备及存储介质 |
CN109388612A (zh) * | 2018-09-14 | 2019-02-26 | 中国科学院光电研究院 | 一种数据汇总文档生成的方法、设备、系统及介质 |
CN111191281A (zh) * | 2019-12-25 | 2020-05-22 | 平安信托有限责任公司 | 数据脱敏处理方法、装置、计算机设备及存储介质 |
CN111737963A (zh) * | 2020-07-21 | 2020-10-02 | 平安国际智慧城市科技股份有限公司 | 基于配置文件的表单填写方法、装置和计算机设备 |
CN112000986A (zh) * | 2020-08-27 | 2020-11-27 | 中国平安财产保险股份有限公司 | 数据脱敏方法、装置、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
数据脱敏在政府数据治理及开放服务中的应用;王毛路;华跃;;电子政务(第05期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112668041A (zh) | 2021-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112668041B (zh) | 单证文件的生成方法、装置、计算机设备和存储介质 | |
CN113642039B (zh) | 单证模板的配置方法、装置、计算机设备和存储介质 | |
CN112540811B (zh) | 缓存数据的检测方法、装置、计算机设备和存储介质 | |
CN111625809B (zh) | 数据授权方法及装置、电子设备、存储介质 | |
CN112667592B (zh) | 数据存储方法、装置、计算机设备和存储介质 | |
CN112187931A (zh) | 会话管理方法、装置、计算机设备和存储介质 | |
CN113742776B (zh) | 基于生物识别技术的数据校验方法、装置和计算机设备 | |
CN111797351A (zh) | 页面数据管理方法、装置、电子设备及介质 | |
CN112328486A (zh) | 接口自动化测试方法、装置、计算机设备及存储介质 | |
CN113282514B (zh) | 问题数据的处理方法、装置、计算机设备和存储介质 | |
CN111339141B (zh) | 一种数据传输的方法、区块链节点设备以及介质 | |
CN112131002A (zh) | 数据管理方法及装置 | |
CN113641517B (zh) | 业务数据的发送方法、装置、计算机设备和存储介质 | |
CN113672654B (zh) | 数据查询方法、装置、计算机设备和存储介质 | |
CN110674516B (zh) | 电子票据管理系统权限配置方法、装置和计算机设备 | |
CN112650659B (zh) | 埋点设置方法、装置、计算机设备和存储介质 | |
CN113515444B (zh) | 测试用例生成方法、装置、计算机设备和存储介质 | |
CN114281707A (zh) | 造数方法、业务应用测试方法及其相关设备 | |
CN113435990B (zh) | 基于规则引擎的凭证生成方法、装置和计算机设备 | |
CN117251228A (zh) | 功能管理方法、装置、计算机设备及存储介质 | |
CN112581257A (zh) | 支持不同卡组织的争议业务管理方法、系统、设备及介质 | |
CN113535260B (zh) | 基于模拟器的数据处理方法、装置、设备及存储介质 | |
CN112632634B (zh) | 签名数据的处理方法、装置、计算机设备和存储介质 | |
CN110134387A (zh) | 贷款业务中的单证模板数据处理方法、装置及计算机设备 | |
CN114511200A (zh) | 作业数据的生成方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |