CN111444538A - 一种信息脱敏方法、装置、电子设备及存储介质 - Google Patents

一种信息脱敏方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111444538A
CN111444538A CN202010218275.8A CN202010218275A CN111444538A CN 111444538 A CN111444538 A CN 111444538A CN 202010218275 A CN202010218275 A CN 202010218275A CN 111444538 A CN111444538 A CN 111444538A
Authority
CN
China
Prior art keywords
data
node
type
preset
desensitized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010218275.8A
Other languages
English (en)
Other versions
CN111444538B (zh
Inventor
董学辉
董峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN202010218275.8A priority Critical patent/CN111444538B/zh
Publication of CN111444538A publication Critical patent/CN111444538A/zh
Application granted granted Critical
Publication of CN111444538B publication Critical patent/CN111444538B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/58Random or pseudo-random number generators

Abstract

本发明实施例提供的一种信息脱敏方法、装置、电子设备及存储介质,通过获取待脱敏模型;查找待脱敏模型中的各节点数据,并识别各节点的类型;当节点为常类型的节点时,判断常类型的节点是否存在于预设修改数据列表中;若常类型的节点存在于预设修改数据列表中,将常类型的节点所对应的节点数据替换为指定数据。通过对模型中的数据节点进行分类,然后通过预设的修改数据列表进行待脱敏数据的判断,并对需要脱敏的数据通过数据替换的方式进行脱敏处理,无需人工进行待脱敏数据的识别,从而可以减低人工成本,减少数据脱敏所需的时间,提高数据脱敏的效率。

Description

一种信息脱敏方法、装置、电子设备及存储介质
技术领域
本发明涉及信息技术领域,特别是涉及一种信息脱敏方法、装置、电子设备及存储介质。
背景技术
目前,随着人工神经网络技术的快速发展,通过网络模型进行数据分析、图像分类等,已经得到了广泛的应用。而在模型服务的部署时,常常需要占用大量GPU资源,因此在模型服务上线前,一般需要交付模型给硬件厂商进行调试优化,而这容易导致模型的相关信息的泄露。
传统的模型的数据脱敏,一般通过人工的方式,查找模型中的重要数据,对其中的数据进行修改或替换,不但人工成本较高,而且数据脱敏时所需的时间也较长,模型数据脱敏的效率低下。
发明内容
本发明实施例的目的在于提供一种信息脱敏方法、装置、电子设备及存储介质,以实现提高模型数据脱敏效率的目的。具体技术方案如下:
在本发明实施的第一方面,首先提供了一种信息脱敏方法,包括:
获取待脱敏模型;
查找待脱敏模型中的各节点数据,并识别各节点的类型;
当节点为常类型的节点时,判断常类型的节点是否存在于预设修改数据列表中;
若常类型的节点存在于预设修改数据列表中,将常类型的节点所对应的节点数据替换为指定数据。
在本发明实施的第二方面,提供了一种信息脱敏装置,包括:
模型获取模块,用于获取待脱敏模型;
数据查找模块,用于查找待脱敏模型中的各节点数据,并识别各节点的类型;
修改列表模块,用于当节点为常类型的节点时,判断常类型的节点是否存在于预设修改数据列表中;
数据替换模块,用于若常类型的节点存在于预设修改数据列表中,将常类型的节点所对应的节点数据替换为指定数据。
在本发明实施的第三方面,还提供了一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器、通信接口、存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的计算机程序时,实现上述任一信息脱敏方法。
在本发明实施的第四方面,还提供了一种计算机可读存储介质,其特征在于,计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述任一信息脱敏方法。
本发明实施例提供的一种信息脱敏方法、装置、电子设备及存储介质,通过获取待脱敏模型;查找待脱敏模型中的各节点数据,并识别各节点的类型;当节点为常类型的节点时,判断常类型的节点是否存在于预设修改数据列表中;若常类型的节点存在于预设修改数据列表中,将常类型的节点所对应的节点数据替换为指定数据。可以对模型中的数据节点进行分类,然后通过预设的修改数据列表进行待脱敏数据的判断,并对需要脱敏的数据通过数据替换的方式进行脱敏处理,无需人工进行待脱敏数据的识别,从而可以减低人工成本,减少数据脱敏所需的时间,提高数据脱敏的效率。当然,实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施的一种信息脱敏方法的一种流程图。
图2为本发明实施的一种常类型的节点数据的处理的第一种流程图。
图3为本发明实施的一种常类型的节点数据的处理的第二种流程图。
图4为本发明实施的一种常类型的节点数据的处理的第三种流程图。
图5为本发明实施的一种常类型的节点数据的处理的第四种流程图。
图6为本发明实施的一种常类型的节点数据的处理的第五种流程图。
图7为本发明实施的一种常类型的节点数据的处理的第六种流程图。
图8为本发明实施的一种非常类型的节点数据的处理的第一种流程图。
图9为本发明实施的一种非常类型的节点数据的处理的第二种流程图。
图10为本发明实施的一种信息脱敏方法的一种实例图。
图11为本发明实施的一种信息脱敏装置的示意图。
图12为本发明实施的一种常类型的节点数据的处理的第一种装置的示意图。
图13为本发明实施的一种常类型的节点数据的处理的第二种装置的示意图。
图14为本发明实施的一种常类型的节点数据的处理的第三种装置的示意图。
图15为本发明实施的一种常类型的节点数据的处理的第四种装置的示意图。
图16为本发明实施的一种常类型的节点数据的处理的第五种装置的示意图。
图17为本发明实施的一种常类型的节点数据的处理的第六种装置的示意图。
图18为本发明实施的一种非常类型的节点数据的处理的第一种装置的示意图。
图19为本发明实施的一种非常类型的节点数据的处理的第二种装置的示意图。
图20为本发明实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施的提供了一种信息脱敏方法,包括:
获取待脱敏模型;
查找待脱敏模型中的各节点数据,并识别各节点的类型;
当节点为常类型的节点时,判断常类型的节点是否存在于预设修改数据列表中;
若常类型的节点存在于预设修改数据列表中,将常类型的节点所对应的节点数据替换为指定数据。
可见,通过本发明实施例提供的一种信息脱敏方法,可以通过对模型中的数据节点进行分类,然后通过预设的修改数据列表进行待脱敏数据的判断,并对需要脱敏的数据通过数据替换的方式进行脱敏处理,无需人工进行待脱敏数据的识别,从而可以减低人工成本,减少数据脱敏所需的时间,提高数据脱敏的效率。
以下进行详细说明,参见图1,图1为本发明实施的一种信息脱敏方法的一种流程图,包括:
步骤S11,获取待脱敏模型。
其中,上述待脱敏模型可以为任一网络模型,例如,由开发团队开发后交付给硬件厂商进行调试优化时,发送给硬件厂商的网络模型,由于网络模型中可能包含需要保密的数据,因此需进行脱敏处理。
本发明实施例的信息脱敏方法针对的是智能终端设备中的模型,因此可以通过智能终端设备执行,具体的,该智能终端设备可以为电脑或服务器等。
步骤S12,查找待脱敏模型中的各节点数据,并识别各节点的类型。
其中,查找待脱敏模型中的各节点数据,可以通过预先训练好的网络模型查找待脱敏模型中的各节点数据,其中,模型中的各节点数据可以包括模型的结构参数等数据。识别各节点的类型,可以根据模型的定义文件中预先标明的属性判断各节点的类型。其中节点的类型可以为const(常类型)或非const。
步骤S13,当节点为常类型的节点时,判断常类型的节点是否存在于预设修改数据列表中。
其中,当节点为常类型的节点时,判断常类型的节点是否存在于预设修改数据列表中。例如,通过预先建立的replace list(修改数据列表),当节点为常类型的节点时,判断常类型的节点是否存在于预设修改数据列表中。其中,修改数据列表可以为只包括需要进行修改的节点的信息,也可以为包括所需替换的指定数据的信息。其中,修改数据列表可以依据预先预先设定的需要修改的数据建立,例如,涉及模型的核心参数等不宜公开的敏感性数据建立,或将影响模型正常工作的结构性参数以外的,非结构行参数数据均确定为敏感性数据,加入修改数据列表。
步骤S14,若常类型的节点存在于预设修改数据列表中,将常类型的节点所对应的节点数据替换为指定数据。
其中,上述指定数据可以为任意数据,在实际使用过程中,可以将上述常类型的节点所对应的节点数据替换为随机生成的数据。
可见,通过本发明实施例的方法,可以通过对模型中的数据节点进行分类,然后通过预设的修改数据列表进行待脱敏数据的判断,并对需要脱敏的数据通过数据替换的方式进行脱敏处理,无需人工进行待脱敏数据的识别,从而可以减低人工成本,减少数据脱敏所需的时间,提高数据脱敏的效率。
可选的,参见图2,在步骤S12查找待脱敏模型中的各节点数据,并识别各节点的类型之后,上述方法还包括:
步骤S21,判断常类型的节点数据中是否存在tensor_content类型的数据。
其中,判断常类型的节点数据中是否存在tensor_content类型的数据,可以根据模型文件中预先储存的数据类型字段的记录进行数据类型的判断。
步骤S22,当常类型的节点为存在tensor_content类型的数据的节点时,判断tensor_content类型的数据的数据类型为浮点型float还是整型int。
其中,判断tensor_content类型的数据的数据类型为浮点型float还是整型int,可以根据模型文件中预先储存的数据类型字段的记录进行判断。
步骤S23,当tensor_content类型的数据的数据类型为float时,判断常类型的节点是否存在于预设修改数据列表中。
其中,预设修改数据列表可以为预先设定的需进行脱敏处理的数据组成的列表,例如,由涉及模型核心数据等敏感数据所组成的数据列表。因此对于修改数据列表中对应的数据必须进行脱敏处理。
步骤S24,若存在于预设修改数据列表中,将常类型的节点的操作、数字和名称写入修改文件。
其中,当常类型的节点是存在于预设修改数据列表中时,则常类型的节点的数据中包括敏感性数据,因此必须对常类型节点的数据进行脱敏处理。通过将常类型的节点的操作、数字和名称写入修改文件,可以通过对文件夹中的数据进行数据替换,达到脱敏的目的。
步骤S25,根据预设修改数据列表,将修改文件中的数据替换为指定数据。
其中,指定数据可以为任意数据,在实际使用中可以将上述修改文件中的数据替换为随机生成的数据。
通过将常类型的节点的操作、数字和名称写入修改文件,根据预设修改数据列表,将修改文件中的数据替换为指定数据,从而可以实现对常类型的节点的数据进行脱敏的目的。
可选的,参见图3,在步骤S22当常类型的节点为存在tensor_content类型的数据的节点时,判断tensor_content类型的数据的数据类型为float还是int之后,上述方法还包括:
步骤S26,当tensor_content类型的数据的数据类型为int时,判断常类型的节点是否存在于预设忽略数据列表中。
其中,预设忽略数据列表可以为非敏感性数据、以及涉及模型正常工作的数据组成的列表,如模型结构参数,当进行模型结构参数修改后,可能会影响模型的正常工作。因此对于预设忽略数据列表所对应的数据不进行脱敏处理。
步骤S27,若存在,则将节点数据写入忽略文件。
其中,由于对于预设忽略数据列表所对应的数据不进行脱敏处理,因此,将节点数据写入忽略文件,可以对忽略文件中的数据不进行脱敏处理。
步骤S28,若不存在,则将int类型的数据写入待脱敏文件中,待脱敏文件中的数据通过其他方式进行脱敏。
其中,当无法通过预设忽略数据列表判断是否对int类型的数据进行脱敏处理时,将int类型的数据写入待脱敏文件中。其中,将int类型的数据写入待脱敏文件中之后,可以输出待脱敏文件以供后续进行检查,并可以通过待脱敏文件的检查,根据实际情况判断是否进行脱敏处理。例如,可以通过人工对上述数据进行浏览,判断是否进行脱敏处理,并可以通过人工进行数据替换的方式,进行脱敏处理。
可选的,参见图4,在步骤S21判断常类型的节点数据中是否存在tensor_content类型的数据之后,上述方法还包括:
步骤S29,当常类型的节点为不存在tensor_content类型的数据的节点时,判断节点数据中是否存在整型函数int_val或浮点型函数float_val类型的数据。
其中,判断节点数据中是否存在整型函数int_val或浮点型函数float_val类型的数据,可以根据模型文件中预先储存的数据类型字段的记录进行判断。
步骤S30,在节点数据中是存在int_val或float_val类型的数据时,判断以当前节点作为输入节点的节点是否存在于预设忽略数据列表中。
步骤S31,若存在于预设忽略数据列表中,将节点数据写入忽略文件中。
其中,预设忽略数据列表可以为非敏感性数据,或结构参数等涉及模型正常工作的数据组成的列表。因此,上述若存在于预设忽略数据列表中,将节点数据写入忽略文件中,可以对上述节点数据不进行脱敏处理。
可选的,参见图5,在步骤S14若常类型的节点存在于预设修改数据列表中,将常类型的节点所对应的节点数据替换为指定数据,包括:
步骤S141,若常类型的节点不存在于预设忽略数据列表中,判断常类型的节点是否存在于预设修改数据列表中。
其中,上述预设修改数据列表可以为预先设定的需进行脱敏处理的数据组成的列表,例如,由涉及模型核心参数等不宜公开的数据所组成的数据列表。判断节点数据是否存在于预设修改数据列表中,可以将上述节点数据与预设忽略数据列表进行对比,判断节点数据是否存在于预设修改数据列表中。
步骤S142,若存在于预设修改数据列表中,将常类型的节点的操作、数字和名称写入修改文件。
其中,将常类型的节点的操作、数字和名称写入修改文件,可以将修改文件中的数据替换为指定数据,其中,指定数据可以为任意数据,例如,在实际使用过程中可以将修改文件中的数据替换为随机生成的数据。
步骤S143,根据预设修改数据列表,将修改文件中的数据替换为指定数据。
其中,预设修改数据列表可以为涉及敏感数据组成的数据列表,必须进行脱敏处理。因此当常类型的节点存在于预设修改数据列表中时,通过将节点的操作、数字、名字,写入修改文件,然后将修改文件中的数据替换为指定数据,从而实现对敏感数据的脱敏处理。
可选的,参见图6,在步骤S141若常类型的节点不存在于预设忽略数据列表中,判断节点数据是否存在于预设修改数据列表中之后,上述方法还包括:
步骤S15,若常类型的节点不存在于预设修改数据列表中,将节点的操作、数字、名字,写入待脱敏文件。
其中,当节点数据不存在于上述预设修改数据列表与预设忽略数据列表中时,无法通过预设修改数据列表与预设忽略数据列表判断是否对节点数据进行脱敏处理,可以将节点的操作、数字、名字,写入待脱敏文件。从而可以输出待脱敏文件以供后续进行检查,并可以根据实际情况判断是否进行脱敏处理。例如,通过人工的方式进行待脱敏文件的检查,并根据实际情况判断是否需进行脱敏处理,及如何进行脱敏处理。
可选的,参见图7,在步骤S29当常类型的节点为不存在tensor_content类型的数据的节点时,判断节点数据中是否存在int_val或float_val类型的数据之后,上述方法还包括:
步骤S32,当常类型的节点为不存在tensor_content类型的数据且不存在int_val或float_val类型的数据的节点,将节点的操作、数字、名字,写入待脱敏文件。
其中,当常类型的节点为不存在tensor_content类型的数据且不存在int_val或float_val类型的数据的节点时,即无法通过上述步骤进行是否脱敏的判断,可以将节点的操作、数字、名字,写入待脱敏文件,从而可以通过人工的方式进行是否脱敏的判断和如何进行脱敏处理,根据实际情况判断是否需进行脱敏处理,及如何进行脱敏处理。
可选的,参见图8,在步骤S12查找待脱敏模型中的各节点数据,判断各节点的类型之后,上述方法还包括:
步骤S33,当节点为非常类型的节点时,判断非常类型的节点所对应的节点数据中是否存在数字类型的数据。
其中,当节点为非常类型的节点时,判断非常类型的节点的节点数据中是否存在数字。可以根据模型文件中预先储存的数据类型字段的记录进行数据类型的判断。
步骤S34,若非常类型的节点所对应的节点数据中不存在数字类型的数据,将非常类型的节点所对应的节点数据写入无数字文件,无数字文件中的数据不进行脱敏。
其中,若非常类型的节点所对应的节点数据中不存在数字类型的数据,节点数据只是用于对操作进行定义而不包含参数等敏感性数据,例如乘方的操作,因此可以对上述无数字文件中的数据不进行脱敏处理。
可选的,参见图9,在步骤S33当节点为非常类型的节点时,判断非常类型的节点所对应的节点数据中是否存在数字类型的数据之后,上述方法还包括:
步骤S35,若非常类型的节点所对应的节点数据中存在数字类型的数据时,判断非常类型的节点是否存在于预设忽略数据列表中。
其中,预设忽略数据列表可以为非敏感性数据,或结构参数等涉及模型正常工作的数据组成的列表,可以不进行脱敏处理。
步骤S36,若非常类型的节点存在于预设忽略数据列表中,将非常类型的节点所对应的节点数据写入忽略文件,忽略文件中的数据不进行脱敏。
其中,由于忽略数据列表有非敏感性数据组成,因此可以对写入忽略文件中的节点数据不进行脱敏处理。
步骤S37,若非常类型的节点不存在于预设忽略数据列表中,将非常类型的节点所对应的节点数据写入待脱敏文件中,待脱敏文件中的数据通过其他方式进行脱敏。
其中,当非常类型的节点不存在于预设忽略数据列表中与预设忽略数据列表中时,可以将非常类型的节点所对应的节点数据写入待脱敏文件后,通过人工的方式,根据实际情况判断是否需进行脱敏处理,及如何进行脱敏处理。
可选的,参见图10,图10为本发明实施的一种信息脱敏方法的一种实例图,包括:
步骤S90,导入待脱敏模型。
步骤S91,导入脱敏规则列表。
可以包括忽略数据列表和替换数据列表的导入。
步骤S92,判断节点类型。
判断节点为const类型节点还是非const类型节点,当节点为const类型节点时执行步骤S93,当为非const类型节点时执行步骤S96。
步骤S93,生成随机数据对节点中tensor_content内容进行替换。
当常类型的节点数据中存在tensor_content类型的数据时,通过随机生成的数据对节点中tensor_content类型内容进行替换。
步骤S94,生成随机数据对节点中int_val内容进行替换。
当常类型的节点数据中存在int_val类型的数据时,通过随机生成的数据对节点中int_val类型的内容进行替换。
步骤S95,生成随机数据对节点中float_val内容进行替换。
当常类型的节点数据中存在float_val类型的数据时,通过随机生成的数据对节点中float_val类型的内容进行替换。
步骤S96,当节点中没有数字类型的数据时,不进行修改。
当非常类型的节点中没有数字类型的数据时,不进行修改。
步骤S97,当节点中存在数字类型数据时,通过人工方式进行修改。
当非常类型的节点中存在数字类型的数据时,通过人工方式进行修改。
参见图11,图11为本发明实施的一种信息脱敏装置的一种示意图,包括:
模型获取模块101,用于获取待脱敏模型;
数据查找模块102,用于查找待脱敏模型中的各节点数据,并识别各节点的类型;
修改列表模块103,用于当节点为常类型的节点时,判断常类型的节点是否存在于预设修改数据列表中;
数据替换模块104,用于若常类型的节点存在于预设修改数据列表中,将常类型的节点所对应的节点数据替换为指定数据。
可选的,参见图12,上述装置还包括:
数据判断模块105,用于判断常类型的节点数据中是否存在张量文本tensor_content类型的数据;
类型判断模块106,用于当常类型的节点为存在tensor_content类型的数据的节点时,判断tensor_content类型的数据的数据类型为浮点型float还是整型int;
写入判断模块107,用于当tensor_content类型的数据的数据类型为float时,判断常类型的节点是否存在于预设修改数据列表中;
文件写入模块108,用于若存在于预设修改数据列表中,将常类型的节点的操作、数字和名称写入修改文件;
替换写入模块109,用于根据预设修改数据列表,将修改文件中的数据替换为指定数据。
可选的,参见图13,上述装置还包括:
存在判断模块110,用于当tensor_content类型的数据的数据类型为int时,判断常类型的节点是否存在于预设忽略数据列表中;
忽略文件模块111,用于若存在,则将节点数据写入忽略文件;
待脱敏文件模块112,用于若不存在,则将int类型的数据写入待脱敏文件中,待脱敏文件中的数据通过其他方式进行脱敏。
可选的,参见图14,上述装置还包括:
常类型判断模块113,用于当常类型的节点为不存在tensor_content类型的数据的节点时,判断节点数据中是否存在整型函数int_val或浮点型函数float_val类型的数据;
忽略列表模块114,用于在节点数据中是存在int_val或float_val类型的数据时,判断以当前节点作为输入节点的节点是否存在于预设忽略数据列表中;
忽略写入模块115,用于若存在于预设忽略数据列表中,将节点数据写入忽略文件中。
可选的,参见图15,上述装置还包括:
常类型忽略模块116,用于若常类型的节点不存在于预设忽略数据列表中,判断常类型的节点是否存在于预设修改数据列表中;
常类型修改模块117,用于若存在于预设修改数据列表中,将常类型的节点的操作、数字和名称写入修改文件;
常类型替换模块118,用于根据预设修改数据列表,将修改文件中的数据替换为指定数据。
可选的,参见图16,上述装置还包括:
常类型节点模块119,用于若常类型的节点不存在于预设修改数据列表中,将节点的操作、数字、名字,写入待脱敏文件。
可选的,参见图17,上述装置还包括:
常类型数据模块120,用于当常类型的节点为不存在tensor_content类型的数据且不存在int_val或float_val类型的数据的节点,将节点的操作、数字、名字,写入待脱敏文件。
可选的,参见图18,上述装置还包括:
数字判断模块121,用于当节点为非常类型的节点时,判断非常类型的节点所对应的节点数据中是否存在数字类型的数据;
无数字模块122,用于若非常类型的节点所对应的节点数据中不存在数字类型的数据,将非常类型的节点所对应的节点数据写入无数字文件,无数字文件中的数据不进行脱敏。
可选的,参见图19,上述装置还包括:
非常节点模块123,用于若非常类型的节点所对应的节点数据中存在数字类型的数据时,判断非常类型的节点是否存在于预设忽略数据列表中;
节点忽略模块124,用于若非常类型的节点存在于预设忽略数据列表中,将非常类型的节点所对应的节点数据写入忽略文件,忽略文件中的数据不进行脱敏;
节点脱敏模块125,用于若非常类型的节点不存在于预设忽略数据列表中,将非常类型的节点所对应的节点数据写入待脱敏文件中,待脱敏文件中的数据通过其他方式进行脱敏。
可见,通过本发明实施例提供的一种信息脱敏装置,可以通过对模型中的数据节点进行分类,然后预设的修改数据列表进行待脱敏数据的判断,并对需要脱敏的数据通过数据替换的方式进行脱敏处理,无需人工进行待脱敏数据的识别,从而可以减低人工成本,减少数据脱敏所需的时间,提高数据脱敏的效率。
本发明实施例还提供了一种电子设备,如图20所示,包括处理器201、通信接口202、存储器203和通信总线204,其中,处理器201,通信接口202,存储器203通过通信总线204完成相互间的通信,
存储器203,用于存放计算机程序;
处理器201,用于执行存储器203上所存放的程序时,实现如下步骤:
获取待脱敏模型;
查找待脱敏模型中的各节点数据,并识别各节点的类型;
当节点为常类型的节点时,判断常类型的节点是否存在于预设修改数据列表中;
若常类型的节点存在于预设修改数据列表中,将常类型的节点所对应的节点数据替换为指定数据。
可选的,上述处理器,用于执行存储器上所存放的程序时,实现如上述任一信息脱敏方法。
上述电子设备提到的通信总线可以是PCI(Peripheral ComponentInterconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括RAM(Random Access Memory,随机存取存储器),也可以包括NVM(Non-Volatile Memory,非易失性存储器),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括CPU(Central Processing Unit,中央处理器)、NP(Network Processor,网络处理器)等;还可以是DSP(Digital Signal Processor,数字信号处理器)、ASIC(Application Specific Integrated Circuit,专用集成电路)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一信息脱敏方法。
在本申请提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一信息脱敏方法。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (12)

1.一种信息脱敏方法,其特征在于,包括:
获取待脱敏模型;
查找所述待脱敏模型中的各节点数据,并识别各节点的类型;
当所述节点为常类型的节点时,判断所述常类型的节点是否存在于预设修改数据列表中;
若所述常类型的节点存在于所述预设修改数据列表中,将所述常类型的节点所对应的节点数据替换为指定数据。
2.根据权利要求1所述的方法,其特征在于,所述查找所述待脱敏模型中的各节点数据,并识别各节点的类型之后,所述方法还包括:
判断所述常类型的节点数据中是否存在张量文本tensor_content类型的数据;
当所述常类型的节点为存在tensor_content类型的数据的节点时,判断所述tensor_content类型的数据的数据类型为浮点型float还是整型int;
当所述tensor_content类型的数据的数据类型为float时,判断所述常类型的节点是否存在于预设修改数据列表中;
若存在于所述预设修改数据列表中,将所述常类型的节点的操作、数字和名称写入修改文件;
根据所述预设修改数据列表,将所述修改文件中的数据替换为预设数据。
3.根据权利要求2所述的方法,其特征在于,在当所述常类型的节点为存在tensor_content类型的数据的节点时,判断所述tensor_content类型的数据的数据类型为float还是int之后,所述方法还包括:
当所述tensor_content类型的数据的数据类型为int时,判断所述常类型的节点是否存在于所述预设忽略数据列表中;
若存在,则将所述节点数据写入忽略文件;
若不存在,则将所述int类型的数据写入待脱敏文件中,所述待脱敏文件中的数据通过其他方式进行脱敏。
4.根据权利要求2所述的方法,其特征在于,在所述判断所述常类型的节点数据中是否存在tensor_content类型的数据之后,所述方法还包括:
当所述常类型的节点为不存在tensor_content类型的数据的节点时,判断所述节点数据中是否存在整型函数int_val或浮点型函数float_val类型的数据;
在所述节点数据中是存在int_val或float_val类型的数据时,判断以当前节点作为输入节点的节点是否存在于所述预设忽略数据列表中;
若存在于所述预设忽略数据列表中,将所述节点数据写入忽略文件中。
5.根据权利要求4所述的方法,其特征在于,所述若所述常类型的节点存在于所述预设修改数据列表中,将所述常类型的节点所对应的节点数据替换为指定数据,包括:
若所述常类型的节点不存在于所述预设忽略数据列表中,判断所述常类型的节点是否存在于所述预设修改数据列表中;
若存在于所述预设修改数据列表中,将所述常类型的节点的操作、数字和名称写入修改文件;
根据所述所述预设修改数据列表,将所述修改文件中的数据替换为指定数据。
6.根据权利要求5所述的方法,其特征在于,在所述若所述常类型的节点不存在于所述预设忽略数据列表中,判断所述节点数据是否存在于所述预设修改数据列表中之后,所述方法还包括:
若所述常类型的节点不存在于所述预设修改数据列表中,将所述节点的操作、数字、名字,写入待脱敏文件。
7.根据权利要求4所述的方法,其特征在于,在所述当所述常类型的节点为不存在tensor_content类型的数据的节点时,判断所述节点数据中是否存在int_val或float_val类型的数据之后,所述方法还包括:
当所述常类型的节点为不存在tensor_content类型的数据且不存在int_val或float_val类型的数据的节点,将所述节点的操作、数字、名字,写入待脱敏文件。
8.根据权利要求1所述的方法,其特征在于,所述查找所述待脱敏模型中的各节点数据,判断各节点的类型之后,所述方法还包括:
当所述节点为非常类型的节点时,判断非常类型的节点所对应的节点数据中是否存在数字类型的数据;
若所述非常类型的节点所对应的节点数据中不存在数字类型的数据,将所述非常类型的节点所对应的节点数据写入无数字文件,所述无数字文件中的数据不进行脱敏。
9.根据权利要求8所述的方法,其特征在于,所述当所述节点为非常类型的节点时,判断非常类型的节点所对应的节点数据中是否存在数字类型的数据之后,所述方法还包括:
若所述非常类型的节点所对应的节点数据中存在数字类型的数据时,判断所述非常类型的节点是否存在于预设忽略数据列表中;
若所述非常类型的节点存在于所述预设忽略数据列表中,将所述非常类型的节点所对应的节点数据写入忽略文件,所述忽略文件中的数据不进行脱敏;
若所述非常类型的节点不存在于所述预设忽略数据列表中,将所述非常类型的节点所对应的节点数据写入待脱敏文件中,所述待脱敏文件中的数据通过其他方式进行脱敏。
10.一种信息脱敏装置,其特征在于,包括:
模型获取模块,用于获取待脱敏模型;
数据查找模块,用于查找所述待脱敏模型中的各节点数据,并识别各节点的类型;
修改列表模块,用于当所述节点为常类型的节点时,判断所述常类型的节点是否存在于预设修改数据列表中;
数据替换模块,用于若所述常类型的节点存在于所述预设修改数据列表中,将所述常类型的节点所对应的节点数据替换为指定数据。
11.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口、所述存储器通过所述通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的所述计算机程序时,实现权利要求1-9任一所述的方法步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-9任一所述的方法步骤。
CN202010218275.8A 2020-03-25 2020-03-25 一种信息脱敏方法、装置、电子设备及存储介质 Active CN111444538B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010218275.8A CN111444538B (zh) 2020-03-25 2020-03-25 一种信息脱敏方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010218275.8A CN111444538B (zh) 2020-03-25 2020-03-25 一种信息脱敏方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN111444538A true CN111444538A (zh) 2020-07-24
CN111444538B CN111444538B (zh) 2024-04-23

Family

ID=71650808

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010218275.8A Active CN111444538B (zh) 2020-03-25 2020-03-25 一种信息脱敏方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111444538B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112130807A (zh) * 2020-11-25 2020-12-25 上海燧原科技有限公司 张量浮点数据处理方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080270370A1 (en) * 2007-04-30 2008-10-30 Castellanos Maria G Desensitizing database information
CN109614816A (zh) * 2018-11-19 2019-04-12 平安科技(深圳)有限公司 数据脱敏方法、装置及存储介质
CN110110543A (zh) * 2019-03-14 2019-08-09 深圳壹账通智能科技有限公司 数据处理方法、装置、服务器及存储介质
CN110472434A (zh) * 2019-07-12 2019-11-19 北京字节跳动网络技术有限公司 数据脱敏方法、系统、介质和电子设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080270370A1 (en) * 2007-04-30 2008-10-30 Castellanos Maria G Desensitizing database information
CN109614816A (zh) * 2018-11-19 2019-04-12 平安科技(深圳)有限公司 数据脱敏方法、装置及存储介质
CN110110543A (zh) * 2019-03-14 2019-08-09 深圳壹账通智能科技有限公司 数据处理方法、装置、服务器及存储介质
CN110472434A (zh) * 2019-07-12 2019-11-19 北京字节跳动网络技术有限公司 数据脱敏方法、系统、介质和电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112130807A (zh) * 2020-11-25 2020-12-25 上海燧原科技有限公司 张量浮点数据处理方法、装置、设备及存储介质
CN112130807B (zh) * 2020-11-25 2021-02-26 上海燧原科技有限公司 张量浮点数据处理方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN111444538B (zh) 2024-04-23

Similar Documents

Publication Publication Date Title
CN108459954B (zh) 应用程序漏洞检测方法和装置
CN112052172B (zh) 第三方通道的快速测试方法、装置和电子设备
CN111552632B (zh) 一种接口测试方法及装置
CN113127347B (zh) 一种接口测试方法、装置、设备及可读存储介质
CN109783346B (zh) 基于关键字驱动的自动化测试方法、装置及终端设备
CN110879781A (zh) 程序调试方法、装置、电子设备及计算机可读存储介质
CN112882933A (zh) 脚本录制方法、装置、设备及存储介质
CN112328499A (zh) 一种测试数据生成方法、装置、设备及介质
CN111444538A (zh) 一种信息脱敏方法、装置、电子设备及存储介质
CN114510425A (zh) 一种测试用例生成方法及装置
CN114116801A (zh) 数据清单核查方法及装置
CN111767218B (zh) 一种用于持续集成的自动化测试方法、设备及存储介质
CN113516251A (zh) 一种机器学习系统及模型训练方法
CN115576834A (zh) 支撑故障还原的软件测试复用方法、系统、终端及介质
CN114661615A (zh) 一种fpga软件测试方法和设备
CN109374038B (zh) 一种基于应用样机的核安全级仪控产品的变更测试方法
CN110297854B (zh) 一种app域名核验方法与系统
CN110032624B (zh) 一种样本筛选方法及装置
CN107682224B (zh) 一种网络web页面的测试方法及装置
CN114880637B (zh) 账户风险的验证方法、装置、计算机设备和存储介质
CN117724986B (zh) 一种在用例执行中自动操作kafka的方法及装置
TWI778634B (zh) 故障分類方法、電子設備及儲存介質
CN110798385B (zh) 广域网访问设置功能的测试方法、装置、设备及介质
CN115129355B (zh) 页面修复方法及其系统、计算机设备
US20050288913A1 (en) Circuit design simulation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant