CN107704769A - 一种基于标记化文件的数据迁移方法及装置 - Google Patents

一种基于标记化文件的数据迁移方法及装置 Download PDF

Info

Publication number
CN107704769A
CN107704769A CN201710861504.6A CN201710861504A CN107704769A CN 107704769 A CN107704769 A CN 107704769A CN 201710861504 A CN201710861504 A CN 201710861504A CN 107704769 A CN107704769 A CN 107704769A
Authority
CN
China
Prior art keywords
file
content
marking
field
multimedia
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710861504.6A
Other languages
English (en)
Inventor
周帅奇
白敏�
吕玉超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qianxin Technology Co Ltd
Original Assignee
Beijing Qianxin Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qianxin Technology Co Ltd filed Critical Beijing Qianxin Technology Co Ltd
Priority to CN201710861504.6A priority Critical patent/CN107704769A/zh
Publication of CN107704769A publication Critical patent/CN107704769A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • G06F21/6254Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/12Applying verification of the received information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/563Data redirection of data network streams

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioethics (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Storage Device Security (AREA)

Abstract

本发明实施例提供的基于标记化文件的数据迁移方法及装置,所述方法包括:获取从云服务器导出的文件,所述文件包括第一类型文件;根据所述第一类型文件和第一预设规则,获取所述第一类型文件中的内容所属的字段类型、以及与所述字段类型对应的字段标记策略;根据所述字段标记策略和第二预设规则,获取第一标记化文件,以供所述云服务器导入所述第一标记化文件,其中,所述第一标记化文件是对所述第一类型文件中的部分内容进行屏蔽处理后的文件。所述装置执行上述方法。本发明实施例提供的基于标记化文件的数据迁移方法及装置,通过将第一标记化文件导入云服务器,有效屏蔽了用户的真实信息,从而保证了用户信息的安全。

Description

一种基于标记化文件的数据迁移方法及装置
技术领域
本发明实施例涉及网络信息安全技术领域,具体涉及一种基于标记化文件的数据迁移方法及装置。
背景技术
随着计算机技术的高速发展,越来越多的计算机应用程序部署在云服务器,极大地方便了用户使用各种计算机应用程序。
但是,大量的用户信息(涉及用户个人隐私信息)也被云服务器获取,给不法分子窃取云服务器中的用户信息提供了可乘之机,给使用云端计算机应用程序的用户的自身安全带来了严重的隐患。
因此,如何保护用户信息不被非法获取,进而保证用户安全地使用部署在云服务器中的计算机应用程序,成为亟须解决的问题。
发明内容
针对现有技术存在的问题,本发明实施例提供一种基于标记化文件的数据迁移方法及装置。
第一方面,本发明实施例提供一种基于标记化文件的数据迁移方法,所述方法包括:
获取从云服务器导出的文件,所述文件包括第一类型文件;
根据所述第一类型文件和第一预设规则,获取所述第一类型文件中的内容所属的字段类型、以及与所述字段类型对应的字段标记策略;
根据所述字段标记策略和第二预设规则,获取第一标记化文件,以供所述云服务器导入所述第一标记化文件,其中,所述第一标记化文件是对所述第一类型文件中的部分内容进行屏蔽处理后的文件。
第二方面,本发明实施例提供一种基于标记化文件的数据迁移装置,所述装置包括:
第一获取单元,用于获取从云服务器导出的文件,所述文件包括第一类型文件;
第二获取单元,用于根据所述第一类型文件和第一预设规则,获取所述第一类型文件中的内容所属的字段类型、以及与所述字段类型对应的字段标记策略;
第三获取单元,用于根据所述字段标记策略和第二预设规则,获取第一标记化文件,以供所述云服务器导入所述第一标记化文件,其中,所述第一标记化文件是对所述第一类型文件中的部分内容进行屏蔽处理后的文件。
第三方面,本发明实施例提供一种电子设备,包括:处理器、存储器和总线,其中,
所述处理器和所述存储器通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如下方法:
获取从云服务器导出的文件,所述文件包括第一类型文件;
根据所述第一类型文件和第一预设规则,获取所述第一类型文件中的内容所属的字段类型、以及与所述字段类型对应的字段标记策略;
根据所述字段标记策略和第二预设规则,获取第一标记化文件,以供所述云服务器导入所述第一标记化文件,其中,所述第一标记化文件是对所述第一类型文件中的部分内容进行屏蔽处理后的文件。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,包括:
所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如下方法:
获取从云服务器导出的文件,所述文件包括第一类型文件;
根据所述第一类型文件和第一预设规则,获取所述第一类型文件中的内容所属的字段类型、以及与所述字段类型对应的字段标记策略;
根据所述字段标记策略和第二预设规则,获取第一标记化文件,以供所述云服务器导入所述第一标记化文件,其中,所述第一标记化文件是对所述第一类型文件中的部分内容进行屏蔽处理后的文件。
本发明实施例提供的基于标记化文件的数据迁移方法及装置,通过将第一标记化文件导入云服务器,有效屏蔽了用户的真实信息,从而保证了用户信息的安全。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例基于标记化文件的数据迁移方法流程示意图;
图2为本发明实施例获取第一标记化文件的方法流程图;
图3为本发明实施例获取第一去标记化文件的方法流程图;
图4为本发明实施例基于标记化文件的数据迁移装置结构示意图;
图5为本发明实施例提供的电子设备实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例基于标记化文件的数据迁移方法流程示意图,如图1所示,本发明实施例提供的一种基于标记化文件的数据迁移方法,包括以下步骤:
S1:获取从云服务器导出的文件,所述文件包括第一类型文件。
具体的,装置获取从云服务器导出的文件,所述文件包括第一类型文件。第一类型文件可以是文档类型文件,文件还可以包括第二类型文件,第二类型文件可以是附件类型文件。
S2:根据所述第一类型文件和第一预设规则,获取所述第一类型文件中的内容所属的字段类型、以及与所述字段类型对应的字段标记策略。
具体的,装置根据所述第一类型文件和第一预设规则,获取所述第一类型文件中的内容所属的字段类型、以及与所述字段类型对应的字段标记策略。第一类型文件中的内容所属的字段类型可以包括用户姓名、手机号码和邮箱等;第一类型文件中的内容可以是用户姓名对应的具体姓名(张某、李某)、对应的具体手机号码和对应的具体邮箱等。每种字段类型有对应的字段标记策略,举例说明如下:对于用户姓名中的“姓”可以用标记“%”和数字的组合标记、用户姓名中的“名”中的每一个字可以用标记“&”和数字的组合标记,例如:姓名赵三可以用标记“Z0otb98CCC”、姓名王二小可以用标记“Z0osj77CBD”,同理,对于手机号码和邮箱等不再赘述。通常采用数据表格的形式存储第一类型文件的内容,第一行作为该第一类型文件的第一表头字段,第一表头字段可以用于标记第一类型文件中的内容所属的字段类型。图2为本发明实施例获取第一标记化文件的方法流程图,如图2所示,具体的获取字段类型、和与字段类型对应的字段标记策略可以通过如下方式:
逐行读取第一类型文件的每一行。
如果读取的是第一行,通过解析第一行的内容,以获取第一表头字段,该第一表头字段可以标记该第一类型文件的字段类型。
根据字段类型和预设字段标记策略,获取与字段类型对应的字段标记策略。预设字段标记策略可以根据实际情况自主设置,参照上述举例,可以理解为对于字段类型用户姓名,预设字段标记策略为A、获取的用户姓名字段类型对应的字段标记策略为A,同理,对于字段类型手机号码,预设字段标记策略为B、获取的手机号码字段类型对应的字段标记策略为B。
S3:根据所述字段标记策略和第二预设规则,获取第一标记化文件,以供所述云服务器导入所述第一标记化文件,其中,所述第一标记化文件是对所述第一类型文件中的部分内容进行屏蔽处理后的文件。
具体的,装置根据所述字段标记策略和第二预设规则,获取第一标记化文件,以供所述云服务器导入所述第一标记化文件,其中,所述第一标记化文件是对所述第一类型文件中的部分内容进行屏蔽处理后的文件。字段标记策略、以及对第一类型文件中的部分内容进行屏蔽处理可以参照上述说明。可以理解的是:屏蔽处理后的内容即使被非法用户获取到,非法用户也无法获取用户的真实信息,从而能够有效地保护用户信息的安全。继续参照图2,对获取第一标记化文件进行说明:
根据字段标记策略,对第一类型文件中的第2(i=2)行内容进行标记化处理(对不同字段类型的不同标记化处理参照上述说明)。
将标记化处理后的第2行内容追加写入(在上述写入的第一行之后)至临时文件CSV2(第一类型文件可记为CSV1),再重复执行逐行读取第3行…第4行,直到完成所有行(i=N)标记化处理,并将此时的临时文件作为第一标记化文件。N为第一类型文件的总行数。需要说明的是:为了保证第一标记化文件中数据的合理性,还可以对其中的数据进行校验,还可以进行存储,以便对数据进行管理。
本发明实施例提供的基于标记化文件的数据迁移的方法,通过将第一标记化文件导入云服务器,有效屏蔽了用户的真实信息,从而保证了用户信息的安全。
在上述实施例的基础上,所述根据所述第一类型文件和第一预设规则,获取所述第一类型文件中的内容所属的字段类型、以及与所述字段类型对应的字段标记策略,包括:
逐行读取所述第一类型文件中的每一行文件内容。
具体的,装置逐行读取所述第一类型文件中的每一行文件内容。可参照上述实施例,不再赘述。
若读取的是所述第一类型文件中的第一行文件内容,解析所述第一行文件内容,以获取所述第一类型文件的第一表头字段,所述第一表头字段标记所述第一类型文件中的内容所属的字段类型。
具体的,装置若读取的是所述第一类型文件中的第一行文件内容,解析所述第一行文件内容,以获取所述第一类型文件的第一表头字段,所述第一表头字段标记所述第一类型文件中的内容所属的字段类型。可参照上述实施例,不再赘述。
根据所述字段类型和预设字段标记策略,获取所述字段标记策略。
具体的,装置根据所述字段类型和预设字段标记策略,获取所述字段标记策略。可参照上述实施例,不再赘述。
将所述字段标记策略写入用于临时存储所述第一类型文件的临时文件,并跳转所述逐行读取所述第一类型文件中的每一行文件内容的步骤。
具体的,装置将所述字段标记策略写入用于临时存储所述第一类型文件的临时文件,并跳转所述逐行读取所述第一类型文件中的每一行文件内容的步骤。可参照上述实施例,不再赘述。
本发明实施例提供的基于标记化文件的数据迁移方法,通过为不同的字段类型匹配不同的字段标记策略,更好地屏蔽了用户的真实信息,有效地保证了用户信息的安全。
在上述实施例的基础上,所述方法还包括:
若读取的不是所述第一类型文件中的第一行文件内容,跳转到所述根据所述字段标记策略和第二预设规则,获取第一标记化文件的步骤。
具体的,装置若读取的不是所述第一类型文件中的第一行文件内容,跳转到所述根据所述字段标记策略和第二预设规则,获取第一标记化文件的步骤。可参照上述实施例,不再赘述。
本发明实施例提供的基于标记化文件的数据迁移方法,通过先获取字段类型对应的字段标记策略,再获取第一标记化文件,能够高效地屏蔽了用户的真实信息,保证了用户信息的安全。
在上述实施例的基础上,所述根据所述字段标记策略和第二预设规则,获取第一标记化文件,包括:
根据所述字段标记策略,对所述第一类型文件中的第i行内容进行标记化处理,其中,2≤i≤N,N为所述第一类型文件的总行数。
具体的,装置根据所述字段标记策略,对所述第一类型文件中的第i行内容进行标记化处理,其中,2≤i≤N,N为所述第一类型文件的总行数。可参照上述实施例,不再赘述。
将标记化处理后的第i行内容追加写入至所述临时文件,并跳转到所述逐行读取所述第一类型文件中的每一行文件内容的步骤。
具体的,装置将标记化处理后的第i行内容追加写入至所述临时文件,并跳转到所述逐行读取所述第一类型文件中的每一行文件内容的步骤。可参照上述实施例,不再赘述。
待将标记化处理后的第N行内容追加写入至所述临时文件时,将此时的临时文件作为所述标记化文件。
具体的,装置待将标记化处理后的第N行内容追加写入至所述临时文件时,将此时的临时文件作为所述标记化文件。可参照上述实施例,不再赘述。
本发明实施例提供的基于标记化文件的数据迁移方法,通过将第一标记化文件导入云服务器,有效屏蔽了用户的真实信息,从而保证了用户信息的安全。
在上述实施例的基础上,所述方法还包括:
根据所述字段标记策略和第三预设规则,获取第一去标记化文件,以供所述云服务器导入所述第一去标记化文件,其中,所述第一去标记化文件是对所述第一标记化文件中屏蔽处理的部分内容进行还原处理的文件。
具体的,装置根据所述字段标记策略和第三预设规则,获取第一去标记化文件,以供所述云服务器导入所述第一去标记化文件,其中,所述第一去标记化文件是对所述第一标记化文件中屏蔽处理的部分内容进行还原处理的文件。继续参照上述举例说明去标记化的过程:例如:“Z0otb98CCC”去标记化为赵三;“Z0osj77CBD”去标记化为王二小,同理,对于手机号码和邮箱等不再赘述。图3为本发明实施例获取第一去标记化文件的方法流程图,如图3所示,与图2的区别在于:步骤“对第i行进行去标记化处理”,其余可参照上述图2的说明,这里不再赘述。
本发明实施例提供的基于标记化文件的数据迁移方法,通过将第一标记化文件还原成初始状态,能够灵活地对用户信息进行管理。
在上述实施例的基础上,所述方法还包括:
对所述第一标记化文件或所述第一去标记化文件进行数据校验,存储通过数据校验的第一标记化文件或所述第一去标记化文件。
具体的,装置对所述第一标记化文件或所述第一去标记化文件进行数据校验,存储通过数据校验的第一标记化文件或所述第一去标记化文件。对第一去标记化文件的说明可参照上述第一标记化文件的说明。这里不再赘述。
本发明实施例提供的基于标记化文件的数据迁移方法,通过对第一标记化文件进行数据校验,从而保证了第一标记化文件中数据的有效性。
在上述实施例的基础上,所述文件还包括第二类型文件,相应的;所述方法还包括:
解析所述第二类型文件,以获取所述第二类型文件的第二表头字段,所述第二表头字段包括文件体内容,所述文件体内容是多媒体内容对应的编码。
具体的,装置解析所述第二类型文件,以获取所述第二类型文件的第二表头字段,所述第二表头字段包括文件体内容,所述文件体内容是多媒体内容对应的编码。第二表头字段可以理解为不仅包括上述第一表头字段,还包括文件体内容,其中的文件体内容为body,body是用在网页中的一种HTML标签,标签是用在网页中的一种HTML标签,表示网页的主体部分,也就是用户可以看到的内容,可以包含文本、图片、音频、视频等各种内容。其中的多媒体内容可以包括上述的文本、图片、音频、视频等,多媒体内容对应的编码说明可参照如下的表1,表1中的BODY(body)中的内容中的编码(由于太长不作具体引用)对应的多媒体内容为PDF文件。
表1
解码所述文件体内容,以将所述编码还原成所述多媒体内容。
具体的,装置解码所述文件体内容,以将所述编码还原成所述多媒体内容。可以通过base64解码该文件体内容,参照上述举例,可以将上述表1中的BODY(body)中的内容中的编码还原成PDF文件。
加密所述多媒体内容,并存储加密后的多媒体内容。
具体的,装置加密所述多媒体内容,并存储加密后的多媒体内容。具体的加密方法不在本发明实施例的讨论范围之内。
将加密后的多媒体内容的存储路径写入所述第二类型文件对应的第二标记化文件。
具体的,装置将加密后的多媒体内容的存储路径写入所述第二类型文件对应的第二标记化文件。第二类型文件对应的第二标记化文件的获取方法,可参照上述第一类型文件对应的第一标记化文件的获取方法,不再赘述。
本发明实施例提供的基于标记化文件的数据迁移方法,通过将第二标记化文件导入云服务器,有效屏蔽附件类型的文件中用户的真实信息,从而保证了用户信息的安全。
在上述实施例的基础上,所述方法还包括:
根据写入存储路径的第二标记化文件,读取所述存储路径,以获取加密的多媒体内容。
具体的,装置根据写入存储路径的第二标记化文件,读取所述存储路径,以获取加密的多媒体内容。通过读取存储路径可以查找到加密的多媒体内容。
对所述加密的多媒体内容进行解密。
具体的,装置对所述加密的多媒体内容进行解密。具体的解密方法不在本发明实施例的讨论范围之内。
对解密后的多媒体内容进行编码,以获取解密后的多媒体内容对应的编码。
具体的,装置对解密后的多媒体内容进行编码,以获取解密后的多媒体内容对应的编码。具体的编码\解码技术为本领域成熟技术,本发明实施例不再赘述。
将解密后的编码写入所述第二表头字段中的文件体内容,以还原所述第二类型文件。
具体的,装置将解密后的编码写入所述第二表头字段中的文件体内容,以还原所述第二类型文件。还原后的第二类型文件可以理解为未经过标记化处理的第二类型文件。
本发明实施例提供的基于标记化文件的数据迁移方法,通过将第二标记化文件还原成初始状态,进一步能够灵活地对用户信息进行管理。
需要说明的是:本发明实施例中的装置可以是master设备(作为HA主备模式中的主设备),可以将上述标记化的第一类型文件和标记化的第二类型文件同时在HA主备模式中的备用设备中进行备份,以防止主设备出现故障等问题,切换到的备用设备中也存储有上述标记化的第一类型文件和标记化的第二类型文件,从而最大限度的保证业务不会由于设备故障中断。
图4为本发明实施例基于标记化文件的数据迁移装置结构示意图,如图4所示,本发明实施例提供了一种基于标记化文件的数据迁移装置,包括第一获取单元1、第二获取单元2和第三获取单元3,其中:
第一获取单元1用于获取从云服务器导出的文件,所述文件包括第一类型文件;第二获取单元2用于根据所述第一类型文件和第一预设规则,获取所述第一类型文件中的内容所属的字段类型、以及与所述字段类型对应的字段标记策略;第三获取单元3用于根据所述字段标记策略和第二预设规则,获取第一标记化文件,以供所述云服务器导入所述第一标记化文件,其中,所述第一标记化文件是对所述第一类型文件中的部分内容进行屏蔽处理后的文件。
具体的,第一获取单元1用于获取从云服务器导出的文件,所述文件包括第一类型文件;第二获取单元2用于根据所述第一类型文件和第一预设规则,获取所述第一类型文件中的内容所属的字段类型、以及与所述字段类型对应的字段标记策略;第三获取单元3用于根据所述字段标记策略和第二预设规则,获取第一标记化文件,以供所述云服务器导入所述第一标记化文件,其中,所述第一标记化文件是对所述第一类型文件中的部分内容进行屏蔽处理后的文件。
本发明实施例提供的基于标记化文件的数据迁移装置,通过将第一标记化文件导入云服务器,有效屏蔽了用户的真实信息,从而保证了用户信息的安全。
在上述实施例的基础上,所述第二获取单元2具体用于:
逐行读取所述第一类型文件中的每一行文件内容;若读取的是所述第一类型文件中的第一行文件内容,解析所述第一行文件内容,以获取所述第一类型文件的第一表头字段,所述第一表头字段标记所述第一类型文件中的内容所属的字段类型;根据所述字段类型和预设字段标记策略,获取所述字段标记策略;将所述字段标记策略写入用于临时存储所述第一类型文件的临时文件,并执行所述第二获取单元2中的逐行读取所述第一类型文件中的每一行文件内容。
具体的,所述第二获取单元2具体用于:
逐行读取所述第一类型文件中的每一行文件内容;若读取的是所述第一类型文件中的第一行文件内容,解析所述第一行文件内容,以获取所述第一类型文件的第一表头字段,所述第一表头字段标记所述第一类型文件中的内容所属的字段类型;根据所述字段类型和预设字段标记策略,获取所述字段标记策略;将所述字段标记策略写入用于临时存储所述第一类型文件的临时文件,并执行所述第二获取单元2中的逐行读取所述第一类型文件中的每一行文件内容。
本发明实施例提供的基于标记化文件的数据迁移装置,通过为不同的字段类型匹配不同的字段标记策略,更好地屏蔽了用户的真实信息,有效地保证了用户信息的安全。
在上述实施例的基础上,所述装置还用于:
若读取的不是所述第一类型文件中的第一行文件内容,执行所述第三获取单元3。
具体的,所述装置还用于:
若读取的不是所述第一类型文件中的第一行文件内容,执行所述第三获取单元3。
本发明实施例提供的基于标记化文件的数据迁移装置,通过先获取字段类型对应的字段标记策略,再获取第一标记化文件,能够高效地屏蔽了用户的真实信息,保证了用户信息的安全。
在上述实施例的基础上,所述第三获取单元3具体用于:
根据所述字段标记策略,对所述第一类型文件中的第i行内容进行标记化处理,其中,2≤i≤N,N为所述第一类型文件的总行数;将标记化处理后的第i行内容追加写入至所述临时文件,并执行所述第二获取单元2中的逐行读取所述第一类型文件中的每一行文件内容;待将标记化处理后的第N行内容追加写入至所述临时文件时,将此时的临时文件作为所述标记化文件。
具体的,所述第三获取单元3具体用于:
根据所述字段标记策略,对所述第一类型文件中的第i行内容进行标记化处理,其中,2≤i≤N,N为所述第一类型文件的总行数;将标记化处理后的第i行内容追加写入至所述临时文件,并执行所述第二获取单元2中的逐行读取所述第一类型文件中的每一行文件内容;待将标记化处理后的第N行内容追加写入至所述临时文件时,将此时的临时文件作为所述标记化文件。
本发明实施例提供的基于标记化文件的数据迁移装置,通过将第一标记化文件导入云服务器,有效屏蔽了用户的真实信息,从而保证了用户信息的安全。
在上述实施例的基础上,所述装置还用于:
根据所述字段标记策略和第三预设规则,获取第一去标记化文件,以供所述云服务器导入所述第一去标记化文件,其中,所述第一去标记化文件是对所述第一标记化文件中屏蔽处理的部分内容进行还原处理的文件。
具体的,所述装置还用于:
根据所述字段标记策略和第三预设规则,获取第一去标记化文件,以供所述云服务器导入所述第一去标记化文件,其中,所述第一去标记化文件是对所述第一标记化文件中屏蔽处理的部分内容进行还原处理的文件。
本发明实施例提供的基于标记化文件的数据迁移装置,通过将第一标记化文件还原成初始状态,能够灵活地对用户信息进行管理。
在上述实施例的基础上,所述装置还用于:
对所述第一标记化文件或所述第一去标记化文件进行数据校验,存储通过数据校验的第一标记化文件或所述第一去标记化文件。
具体的,所述装置还用于:
对所述第一标记化文件或所述第一去标记化文件进行数据校验,存储通过数据校验的第一标记化文件或所述第一去标记化文件。
本发明实施例提供的基于标记化文件的数据迁移装置,通过对第一标记化文件进行数据校验,从而保证了第一标记化文件中数据的有效性。
在上述实施例的基础上,所述文件还包括第二类型文件,相应的;所述装置还用于:
解析所述第二类型文件,以获取所述第二类型文件的第二表头字段,所述第二表头字段包括文件体内容,所述文件体内容是多媒体内容对应的编码;解码所述文件体内容,以将所述编码还原成所述多媒体内容;加密所述多媒体内容,并存储加密后的多媒体内容;将加密后的多媒体内容的存储路径写入所述第二类型文件对应的第二标记化文件。
具体的,所述装置还用于:
解析所述第二类型文件,以获取所述第二类型文件的第二表头字段,所述第二表头字段包括文件体内容,所述文件体内容是多媒体内容对应的编码;解码所述文件体内容,以将所述编码还原成所述多媒体内容;加密所述多媒体内容,并存储加密后的多媒体内容;将加密后的多媒体内容的存储路径写入所述第二类型文件对应的第二标记化文件。
本发明实施例提供的基于标记化文件的数据迁移装置,通过将第二标记化文件导入云服务器,有效屏蔽附件类型的文件中用户的真实信息,从而保证了用户信息的安全。
在上述实施例的基础上,所述装置还用于:
根据写入存储路径的第二标记化文件,读取所述存储路径,以获取加密的多媒体内容;对所述加密的多媒体内容进行解密;对解密后的多媒体内容进行编码,以获取解密后的多媒体内容对应的编码;将解密后的编码写入所述第二表头字段中的文件体内容,以还原所述第二类型文件。
具体的,所述装置还用于:
根据写入存储路径的第二标记化文件,读取所述存储路径,以获取加密的多媒体内容;对所述加密的多媒体内容进行解密;对解密后的多媒体内容进行编码,以获取解密后的多媒体内容对应的编码;将解密后的编码写入所述第二表头字段中的文件体内容,以还原所述第二类型文件。
本发明实施例提供的基于标记化文件的数据迁移装置,通过将第二标记化文件还原成初始状态,进一步能够灵活地对用户信息进行管理。
本发明实施例提供的基于标记化文件的数据迁移装置可以用于执行上述各方法实施例的处理流程,其功能在此不再赘述,可以参照上述方法实施例的详细描述。
图5为本发明实施例提供的电子设备实体结构示意图,如图5所示,所述电子设备包括:处理器(processor)501、存储器(memory)502和总线503;
其中,所述处理器501、存储器502通过总线503完成相互间的通信;
所述处理器501用于调用所述存储器502中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:获取从云服务器导出的文件,所述文件包括第一类型文件;根据所述第一类型文件和第一预设规则,获取所述第一类型文件中的内容所属的字段类型、以及与所述字段类型对应的字段标记策略;根据所述字段标记策略和第二预设规则,获取第一标记化文件,以供所述云服务器导入所述第一标记化文件,其中,所述第一标记化文件是对所述第一类型文件中的部分内容进行屏蔽处理后的文件。
本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:获取从云服务器导出的文件,所述文件包括第一类型文件;根据所述第一类型文件和第一预设规则,获取所述第一类型文件中的内容所属的字段类型、以及与所述字段类型对应的字段标记策略;根据所述字段标记策略和第二预设规则,获取第一标记化文件,以供所述云服务器导入所述第一标记化文件,其中,所述第一标记化文件是对所述第一类型文件中的部分内容进行屏蔽处理后的文件。
本实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:获取从云服务器导出的文件,所述文件包括第一类型文件;根据所述第一类型文件和第一预设规则,获取所述第一类型文件中的内容所属的字段类型、以及与所述字段类型对应的字段标记策略;根据所述字段标记策略和第二预设规则,获取第一标记化文件,以供所述云服务器导入所述第一标记化文件,其中,所述第一标记化文件是对所述第一类型文件中的部分内容进行屏蔽处理后的文件。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的电子设备等实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如RoM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上各实施例仅用以说明本发明的实施例的技术方案,而非对其限制;尽管参照前述各实施例对本发明的实施例进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明的实施例各实施例技术方案的范围。

Claims (18)

1.一种基于标记化文件的数据迁移方法,其特征在于,包括:
获取从云服务器导出的文件,所述文件包括第一类型文件;
根据所述第一类型文件和第一预设规则,获取所述第一类型文件中的内容所属的字段类型、以及与所述字段类型对应的字段标记策略;
根据所述字段标记策略和第二预设规则,获取第一标记化文件,以供所述云服务器导入所述第一标记化文件,其中,所述第一标记化文件是对所述第一类型文件中的部分内容进行屏蔽处理后的文件。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一类型文件和第一预设规则,获取所述第一类型文件中的内容所属的字段类型、以及与所述字段类型对应的字段标记策略,包括:
逐行读取所述第一类型文件中的每一行文件内容;
若读取的是所述第一类型文件中的第一行文件内容,解析所述第一行文件内容,以获取所述第一类型文件的第一表头字段,所述第一表头字段标记所述第一类型文件中的内容所属的字段类型;
根据所述字段类型和预设字段标记策略,获取所述字段标记策略;
将所述字段标记策略写入用于临时存储所述第一类型文件的临时文件,并跳转到所述逐行读取所述第一类型文件中的每一行文件内容的步骤。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
若读取的不是所述第一类型文件中的第一行文件内容,跳转到所述根据所述字段标记策略和第二预设规则,获取第一标记化文件的步骤。
4.根据权利要求2所述的方法,其特征在于,所述根据所述字段标记策略和第二预设规则,获取第一标记化文件,包括:
根据所述字段标记策略,对所述第一类型文件中的第i行内容进行标记化处理,其中,2≤i≤N,N为所述第一类型文件的总行数;
将标记化处理后的第i行内容追加写入至所述临时文件,并跳转到所述逐行读取所述第一类型文件中的每一行文件内容的步骤;
待将标记化处理后的第N行内容追加写入至所述临时文件时,将此时的临时文件作为所述标记化文件。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述字段标记策略和第三预设规则,获取第一去标记化文件,以供所述云服务器导入所述第一去标记化文件,其中,所述第一去标记化文件是对所述第一标记化文件中屏蔽处理的部分内容进行还原处理的文件。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
对所述第一标记化文件或所述第一去标记化文件进行数据校验,存储通过数据校验的第一标记化文件或所述第一去标记化文件。
7.根据权利要求1-6任一所述的方法,其特征在于,所述文件还包括第二类型文件,相应的;所述方法还包括:
解析所述第二类型文件,以获取所述第二类型文件的第二表头字段,所述第二表头字段包括文件体内容,所述文件体内容是多媒体内容对应的编码;
解码所述文件体内容,以将所述编码还原成所述多媒体内容;
加密所述多媒体内容,并存储加密后的多媒体内容;
将加密后的多媒体内容的存储路径写入所述第二类型文件对应的第二标记化文件。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
根据写入存储路径的第二标记化文件,读取所述存储路径,以获取加密的多媒体内容;
对所述加密的多媒体内容进行解密;
对解密后的多媒体内容进行编码,以获取解密后的多媒体内容对应的编码;
将解密后的编码写入所述第二表头字段中的文件体内容,以还原所述第二类型文件。
9.一种基于标记化文件的数据迁移的装置,其特征在于,包括:
第一获取单元,用于获取从云服务器导出的文件,所述文件包括第一类型文件;
第二获取单元,用于根据所述第一类型文件和第一预设规则,获取所述第一类型文件中的内容所属的字段类型、以及与所述字段类型对应的字段标记策略;
第三获取单元,用于根据所述字段标记策略和第二预设规则,获取第一标记化文件,以供所述云服务器导入所述第一标记化文件,其中,所述第一标记化文件是对所述第一类型文件中的部分内容进行屏蔽处理后的文件。
10.根据权利要求9所述的装置,其特征在于,所述第二获取单元具体用于:
逐行读取所述第一类型文件中的每一行文件内容;
若读取的是所述第一类型文件中的第一行文件内容,解析所述第一行文件内容,以获取所述第一类型文件的第一表头字段,所述第一表头字段标记所述第一类型文件中的内容所属的字段类型;
根据所述字段类型和预设字段标记策略,获取所述字段标记策略;
将所述字段标记策略写入用于临时存储所述第一类型文件的临时文件,并执行所述第二获取单元中的逐行读取所述第一类型文件中的每一行文件内容。
11.根据权利要求10所述的装置,其特征在于,所述装置还用于:
若读取的不是所述第一类型文件中的第一行文件内容,执行所述第三获取单元。
12.根据权利要求10所述的装置,其特征在于,所述第三获取单元具体用于:
根据所述字段标记策略,对所述第一类型文件中的第i行内容进行标记化处理,其中,2≤i≤N,N为所述第一类型文件的总行数;
将标记化处理后的第i行内容追加写入至所述临时文件,并执行所述第二获取单元中的逐行读取所述第一类型文件中的每一行文件内容;
待将标记化处理后的第N行内容追加写入至所述临时文件时,将此时的临时文件作为所述标记化文件。
13.根据权利要求9所述的装置,其特征在于,所述装置还用于:
根据所述字段标记策略和第三预设规则,获取第一去标记化文件,以供所述云服务器导入所述第一去标记化文件,其中,所述第一去标记化文件是对所述第一标记化文件中屏蔽处理的部分内容进行还原处理的文件。
14.根据权利要求13所述的装置,其特征在于,所述装置还用于:
对所述第一标记化文件或所述第一去标记化文件进行数据校验,存储通过数据校验的第一标记化文件或所述第一去标记化文件。
15.根据权利要求9-14任一所述的装置,其特征在于,所述文件还包括第二类型文件,相应的;所述装置还用于:
解析所述第二类型文件,以获取所述第二类型文件的第二表头字段,所述第二表头字段包括文件体内容,所述文件体内容是多媒体内容对应的编码;
解码所述文件体内容,以将所述编码还原成所述多媒体内容;
加密所述多媒体内容,并存储加密后的多媒体内容;
将加密后的多媒体内容的存储路径写入所述第二类型文件对应的第二标记化文件。
16.根据权利要求15所述的装置,其特征在于,所述装置还用于:
根据写入存储路径的第二标记化文件,读取所述存储路径,以获取加密的多媒体内容;
对所述加密的多媒体内容进行解密;
对解密后的多媒体内容进行编码,以获取解密后的多媒体内容对应的编码;
将解密后的编码写入所述第二表头字段中的文件体内容,以还原所述第二类型文件。
17.一种电子设备,其特征在于,包括:处理器、存储器和总线,其中,
所述处理器和所述存储器通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至8任一所述的方法。
18.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至8任一所述的方法。
CN201710861504.6A 2017-09-21 2017-09-21 一种基于标记化文件的数据迁移方法及装置 Pending CN107704769A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710861504.6A CN107704769A (zh) 2017-09-21 2017-09-21 一种基于标记化文件的数据迁移方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710861504.6A CN107704769A (zh) 2017-09-21 2017-09-21 一种基于标记化文件的数据迁移方法及装置

Publications (1)

Publication Number Publication Date
CN107704769A true CN107704769A (zh) 2018-02-16

Family

ID=61173226

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710861504.6A Pending CN107704769A (zh) 2017-09-21 2017-09-21 一种基于标记化文件的数据迁移方法及装置

Country Status (1)

Country Link
CN (1) CN107704769A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109063091A (zh) * 2018-07-26 2018-12-21 成都大学 混合编码的数据迁移方法、数据迁移装置和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104468664A (zh) * 2013-09-18 2015-03-25 中兴通讯股份有限公司 一种上传文件到云存储系统的方法、下载方法及装置
CN105678185A (zh) * 2015-12-31 2016-06-15 深圳市科漫达智能管理科技有限公司 一种数据安全保护方法以及智能终端管理系统
CN105721392A (zh) * 2014-12-02 2016-06-29 中国移动通信集团江苏有限公司 一种推荐应用的方法、装置及系统
CN106295367A (zh) * 2016-08-15 2017-01-04 北京奇虎科技有限公司 数据加密方法及装置
CN106529329A (zh) * 2016-10-11 2017-03-22 中国电子科技网络信息安全有限公司 一种用于大数据的脱敏系统及脱敏方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104468664A (zh) * 2013-09-18 2015-03-25 中兴通讯股份有限公司 一种上传文件到云存储系统的方法、下载方法及装置
CN105721392A (zh) * 2014-12-02 2016-06-29 中国移动通信集团江苏有限公司 一种推荐应用的方法、装置及系统
CN105678185A (zh) * 2015-12-31 2016-06-15 深圳市科漫达智能管理科技有限公司 一种数据安全保护方法以及智能终端管理系统
CN106295367A (zh) * 2016-08-15 2017-01-04 北京奇虎科技有限公司 数据加密方法及装置
CN106529329A (zh) * 2016-10-11 2017-03-22 中国电子科技网络信息安全有限公司 一种用于大数据的脱敏系统及脱敏方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109063091A (zh) * 2018-07-26 2018-12-21 成都大学 混合编码的数据迁移方法、数据迁移装置和存储介质

Similar Documents

Publication Publication Date Title
CN105577684B (zh) 防爬虫抓取的方法、服务端、客户端和系统
CN103150493B (zh) 一种JavaScript代码的混淆方法和装置
US20120169762A1 (en) Protecting screen information
CN101917513B (zh) 一种实现隐私信息分级显示的方法及装置
CN109409030A (zh) 一种数字版权生成方法及装置
CN107609418A (zh) 文本数据的脱敏方法、装置、存储设备以及计算机设备
CN107147616A (zh) 数据加密方法及装置
CN110033261A (zh) 区块链数据处理方法、装置及系统
CN106599629A (zh) 一种安卓应用程序加固方法及装置
CN106202945A (zh) 一种高安全性的医患信息管理系统
CN103678962A (zh) 管理个人信息的方法、装置及终端
CN107846418A (zh) 防火墙主动防护系统及防护方法
CN108777685A (zh) 用于处理信息的方法和装置
CN109446761A (zh) 一种信息安全处理方法、存储介质以及终端设备
CN108510327A (zh) 优惠券生成方法和系统
CN108133147A (zh) 可执行代码的保护方法、设备及可读存储介质
US20120191983A1 (en) Managing information in a document serialization
CN107704769A (zh) 一种基于标记化文件的数据迁移方法及装置
CN107358071A (zh) 防止Flash应用程序中函数非法调用的方法及装置
CN106709380A (zh) 一种针对磁盘数据存储区的加解密方法及系统
CN108256342B (zh) Shader文件的加密方法、装置及解密方法、装置
CN109299611A (zh) 文件加密方法、装置、设备/终端/服务器及计算机可读存储介质
CN103501292B (zh) 利用备用手机实现保护数据安全的方法及系统
CN104375993B (zh) 一种数据处理的方法及装置
CN105678185B (zh) 一种数据安全保护方法以及智能终端管理系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180216