CN114003929A - 数据处理方法、装置、服务器及存储介质 - Google Patents

数据处理方法、装置、服务器及存储介质 Download PDF

Info

Publication number
CN114003929A
CN114003929A CN202111256884.3A CN202111256884A CN114003929A CN 114003929 A CN114003929 A CN 114003929A CN 202111256884 A CN202111256884 A CN 202111256884A CN 114003929 A CN114003929 A CN 114003929A
Authority
CN
China
Prior art keywords
text
segmentation
access
segment
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111256884.3A
Other languages
English (en)
Inventor
时彪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Ping An Smart Healthcare Technology Co ltd
Original Assignee
Ping An International Smart City Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An International Smart City Technology Co Ltd filed Critical Ping An International Smart City Technology Co Ltd
Priority to CN202111256884.3A priority Critical patent/CN114003929A/zh
Publication of CN114003929A publication Critical patent/CN114003929A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/604Tools and structures for managing or administering access control systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Bioethics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Automation & Control Theory (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Storage Device Security (AREA)

Abstract

本申请适用于人工智能技术领域,提供了一种数据处理方法、装置、服务器及存储介质,该方法包括:接收目标账户对应的用户终端发送的数据访问请求,以及获取目标账户的访问权限等级,数据访问请求包括访问需求描述信息,目标账户被预先分配有访问权限等级,其中,访问权限等级与所访问内容的敏感等级相对应;从区块链中存储的至少一个标注文本中,查找与访问需求描述信息匹配的标注文本;从查找到的标注文本中,对敏感等级与目标账户的访问权限等级不适配的文本片段执行权限管控操作,得到访问文本,以及将访问文本向用户终端发送。本申请可以向用户返回符合用户对应的访问权限等级的数据内容,可以保障数据安全。

Description

数据处理方法、装置、服务器及存储介质
技术领域
本申请涉及人工智能技术领域,尤其涉及一种数据处理方法、装置、服务器及存储介质。
背景技术
近年来,随着大数据技术的不断发展,大数据技术为各行各业的企业和用户都带来了巨大的便利。举例来说,在医疗行业,医生可以根据大数据分析结果对病人病情变化进行分析,以实现更好地做好相关的回访工作。实际应用中,大数据在给人们带来便利的同时,也可能带来一些问题,如,隐私数据泄露的问题等。
相关技术中,通常是直接将用户访问的数据内容返回给用户,容易造成隐私数据被泄露,导致数据安全性不高。
发明内容
有鉴于此,本申请实施例提供了一种数据处理方法、装置、服务器及存储介质,以解决相关技术中,直接将用户访问的数据内容返回给用户,容易造成隐私数据被泄露,导致数据安全性不高的问题。
本申请实施例的第一方面提供了一种数据处理方法,包括:
接收目标账户对应的用户终端发送的数据访问请求,以及获取目标账户的访问权限等级,数据访问请求包括访问需求描述信息,目标账户被预先分配有访问权限等级,其中,访问权限等级与所访问内容的敏感等级相对应;
从区块链中存储的至少一个标注文本中,查找与访问需求描述信息匹配的标注文本,其中,标注文本中的各文本片段标注有敏感等级;
从查找到的标注文本中,对敏感等级与目标账户的访问权限等级不适配的文本片段执行权限管控操作,得到访问文本,以及将访问文本向用户终端发送,权限管控操作用于管控以下权限中的至少一种:编辑权限、可见权限。
进一步地,方法还包括:
获取原始医疗数据,对原始医疗数据进行格式转换,得到文本格式的目标文本;
将目标文本切分成多个文本片段,以及根据各文本片段的内容,确定相应文本片段的片段类型和对应的敏感等级;
根据各文本片段的敏感等级,对目标文本执行信息标注处理,得到标注文本,以及将标注文本存入区块链。
进一步地,将目标文本切分成多个文本片段,以及根据各文本片段的内容,确定相应文本片段的片段类型和对应的敏感等级,包括:
对目标文本进行分词处理,得到多个切分词及各切分词在目标文本中的分词位置信息;
根据预设关键词集,确定各切分词的分词类型,以及根据各切分词的分词类型,将目标文本切分成多个文本片段,其中,预设关键词集中的预设关键词对应有关键词类型;
根据各文本片段中包括的切分词的分词类型和分词位置信息,确定相应文本片段的片段类型及相应文本片段在目标文本中的片段位置信息,以及根据各文本片段的片段类型,确定相应文本片段的敏感等级。
进一步地,根据预设关键词集,确定各切分词的分词类型,包括:
针对每个切分词,计算该切分词与预设关键词集中的各预设关键词之间的相似程度,将预设关键词集中的、对应相似程度满足预设相似条件的预设关键词,确定为与该切分词匹配的预设关键词,以及将与该切分词匹配的预设关键词对应的关键词类型,确定为该切分词的分词类型。
进一步地,根据各切分词的分词类型,将目标文本切分成多个文本片段,包括:
遍历目标文本中的各切分词,若当前访问的切分词的分词类型与上一切分词的分词类型一致,则将当前访问的切分词划分为上一切分词所属的文本片段;
若当前访问的切分词的分词类型与上一切分词的分词类型不一致,则将当前访问的切分词划分为与上一切分词所属的文本片段不同的新文本片段,以此类推,直至对各切分词完成文本片段划分,得到多个文本片段。
进一步地,将标注文本存入区块链,包括:
生成针对标注文本的第一秘钥对,其中,第一秘钥对包括第一私钥和第一公钥;
根据第一私钥对标注文本进行加密处理,以及将加密后的标注文本存入区块链;
根据目标账户的账户信息,生成第二秘钥对,第二秘钥对包括第二私钥和第二公钥;
根据第二公钥对第一私钥进行加密,以及存储加密后的第一私钥。
进一步地,从区块链中存储的至少一个标注文本中,查找与访问需求描述信息匹配的标注文本,包括:
若访问需求描述信息包括文本标识,则查找与文本标识对应的加密的第一私钥,以及从区块链中存储的至少一个加密标注文本中,查找与文本标识对应的加密标注文本;
根据目标账户的第二公钥对加密的第一私钥进行解密,得到第一私钥,以及根据得到的第一私钥对查找到的加密标注文本进行解密,得到与访问需求描述信息匹配的标注文本。
本申请实施例的第二方面提供了一种数据处理装置,包括:
请求接收单元,用于接收目标账户对应的用户终端发送的数据访问请求,以及获取目标账户的访问权限等级,数据访问请求包括访问需求描述信息,目标账户被预先分配有访问权限等级,其中,访问权限等级与所访问内容的敏感等级相对应;
文本查找单元,用于从区块链中存储的至少一个标注文本中,查找与访问需求描述信息匹配的标注文本,其中,标注文本中的各文本片段标注有敏感等级;
数据管控单元,用于从查找到的标注文本中,对敏感等级与目标账户的访问权限等级不适配的文本片段执行权限管控操作,得到访问文本,以及将访问文本向用户终端发送,权限管控操作用于管控以下权限中的至少一种:编辑权限、可见权限。
进一步地,装置还包括文本存储单元。其中,文本存储单元包括格式转换模块、等级确定模块和存储执行模块。
格式转换模块,用于获取原始医疗数据,对原始医疗数据进行格式转换,得到文本格式的目标文本;
等级确定模块,用于等级确定模块将目标文本切分成多个文本片段,以及根据各文本片段的内容,确定相应文本片段的片段类型和对应的敏感等级;
存储执行模块,用于根据各文本片段的敏感等级,对目标文本执行信息标注处理,得到标注文本,以及将标注文本存入区块链。
进一步地,等级确定模块,具体用于:
对目标文本进行分词处理,得到多个切分词及各切分词在目标文本中的分词位置信息;
根据预设关键词集,确定各切分词的分词类型,以及根据各切分词的分词类型,将目标文本切分成多个文本片段,其中,预设关键词集中的预设关键词对应有关键词类型;
根据各文本片段中包括的切分词的分词类型和分词位置信息,确定相应文本片段的片段类型及相应文本片段在目标文本中的片段位置信息,以及根据各文本片段的片段类型,确定相应文本片段的敏感等级。
进一步地,等级确定模块中,根据预设关键词集,确定各切分词的分词类型,包括:
针对每个切分词,计算该切分词与预设关键词集中的各预设关键词之间的相似程度,将预设关键词集中的、对应相似程度满足预设相似条件的预设关键词,确定为与该切分词匹配的预设关键词,以及将与该切分词匹配的预设关键词对应的关键词类型,确定为该切分词的分词类型。
进一步地,等级确定模块中,根据各切分词的分词类型,将目标文本切分成多个文本片段,包括:
遍历目标文本中的各切分词,若当前访问的切分词的分词类型与上一切分词的分词类型一致,则将当前访问的切分词划分为上一切分词所属的文本片段;
若当前访问的切分词的分词类型与上一切分词的分词类型不一致,则将当前访问的切分词划分为与上一切分词所属的文本片段不同的新文本片段,以此类推,直至对各切分词完成文本片段划分,得到多个文本片段。
进一步地,存储执行模块中,将标注文本存入区块链,包括:
生成针对标注文本的第一秘钥对,其中,第一秘钥对包括第一私钥和第一公钥;
根据第一私钥对标注文本进行加密处理,以及将加密后的标注文本存入区块链;
根据目标账户的账户信息,生成第二秘钥对,第二秘钥对包括第二私钥和第二公钥;
根据第二公钥对第一私钥进行加密,以及存储加密后的第一私钥。
进一步地,文本查找单元,具体用于:
若访问需求描述信息包括文本标识,则查找与文本标识对应的加密的第一私钥,以及从区块链中存储的至少一个加密标注文本中,查找与文本标识对应的加密标注文本;
根据目标账户的第二公钥对加密的第一私钥进行解密,得到第一私钥,以及根据得到的第一私钥对查找到的加密标注文本进行解密,得到与访问需求描述信息匹配的标注文本。
本申请实施例的第三方面提供了一种服务器,包括存储器、处理器以及存储在存储器中并可在服务器上运行的计算机程序,处理器执行计算机程序时实现第一方面提供的数据处理方法的各步骤。
本申请实施例的第四方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现第一方面提供的数据处理方法的各步骤。
实施本申请实施例提供的一种数据处理方法、装置、服务器及存储介质具有以下有益效果:通过预先给各目标账户分配访问权限等级,实现在用户通过用户终端登录目标账户以访问所存储的标注文本时,能够向该用户返回符合访问权限等级的部分内容,可以保障数据安全。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种数据处理方法的实现流程图;
图2是本申请实施例提供的另一种数据处理方法的实现流程图;
图3是本申请实施例提供的一种将标注文本存入区块链的实现流程图;
图4是本申请实施例提供的一种数据处理装置的结构框图;
图5是本申请实施例提供的一种服务器的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本申请实施例中,基于人工智能技术,以实现向用户返回符合用户访问权限等级的数据内容,以保障数据安全。
本申请实施例所涉及的数据处理方法,可以由服务器执行。数据处理方法由服务器执行时,执行主体为服务器。
需要指出的是,上述服务器可以包括但不限于服务器、手机、平板或可穿戴智能设备等。另外,上述服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDelivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
请参阅图1,图1示出了本申请实施例提供的一种数据处理方法的实现流程图,包括:
步骤101,接收目标账户对应的用户终端发送的数据访问请求,以及获取目标账户的访问权限等级。
其中,数据访问请求包括访问需求描述信息,目标账户被预先分配有访问权限等级。其中,访问权限等级与所访问内容的敏感等级相对应。上述目标账户通常是已注册账户。
实践中,访问需求描述信息可以为标注文本的文本标识,如,可以为“C001”,也可以为标注文本的标题。
其中,上述访问权限等级通常是用于指示具体访问权限的信息。一个访问权限等级可以对应多个敏感等级也可以对应一个敏感等级。举例来说,若访问权限等级为A级,对应的敏感等级可以为1级、2级和3级。
这里,用户终端可以向上述执行主体发送数据访问请求。这样,上述执行主体可以接收到该数据访问请求,以及可以采用用户终端所登录的目标账户的账户信息,从预先存储的账户信息-访问权限等级对应关系中,查找到目标账户的访问权限等级。
实践中,在上述步骤101之前,上述数据处理方法还可以包括如下步骤:响应于满足预设权限分配条件,给目标账户分配访问权限等级。
其中,上述预设权限分配条件,通常是预先设定的、用于触发分配访问权限等级的条件。
实践中,预设权限分配条件可以包括但不限于以下三项中的至少一项。
第一项,检测到新的目标账户注册成功。这里,在新的目标账户注册成功时,可以给该新的目标账户分配访问权限等级。
第二项,接收到目标账户对应的目标终端发送的权限变更请求。其中,上述权限变更请求通常是用于请求变更访问权限等级的信息。如,可以请求将访问权限等级从A级变更为B级。上述目标账户对应的目标终端,通常是指登录目标账户的终端设备。这里,在接收到目标终端发送的权限变更请求时,上述执行主体可以将目标账户对应的访问权限等级变更为与权限变更请求所请求的等级相符。
第三项,接收到管理终端发送的权限变更请求。这里,管理终端通常是管理人员的终端。上述执行主体可以在接收到管理终端发送的权限变更请求后,将目标账户对应的访问权限等级变更为与权限变更请求所请求的等级相符。
实践中,在当前满足预设权限分配条件时,上述执行主体可以给目标账户分配访问权限等级。如,可以给医生的账户分配访问权限等级为A级,可以给采用医疗数据进行研发的技术人员的账户分配访问权限等级为B级。
步骤102,从区块链中存储的至少一个标注文本中,查找与访问需求描述信息匹配的标注文本。
其中,标注文本中的各文本片段标注有敏感等级。标注文本通常是指所包括的各文本片段标注有敏感等级的文本。敏感等级通常是用于指示文本片段的内容的敏感程度的信息。如,可以为1级。实践中,标注文本中通常具有多个文本片段,针对每个文本片段,可以标注有敏感等级。
这里,上述执行主体可以采用访问需求描述信息,从所存储的至少一个标注文本中,找到与访问需求描述信息相匹配的标注文本。举例来说,若访问需求描述信息包括标注文本的标题,则上述执行主体可以采用访问需求描述信息所包括的标题,从区块链中查找到与该标题相对应的标注文本。
步骤103,从查找到的标注文本中,对敏感等级与目标账户的访问权限等级不适配的文本片段执行权限管控操作,得到访问文本,以及将访问文本向用户终端发送。
其中,权限管控操作用于管控以下权限中的至少一种:编辑权限、可见权限。
其中,上述与目标账户的访问权限等级不适配的文本片段,通常是指对应敏感等级不属于目标账户的访问权限等级对应敏感等级的文本片段。举例来说,若目标账户甲的访问权限等级为A级,A级对应的敏感等级为1级、2级和3级。若标注文本中存在3个文本片段,分别为X、Y和Z,且X对应的敏感等级为1级,Y对应的敏感等级为2级,Z对应的敏感等级为4级,此时,标注文本中与目标账户的访问权限等级不适配的文本片段为文本片段Z。
实践中,若权限管控操作用于管控编辑权限,则权限管控操作可以包括:删除敏感等级与目标账户的访问权限等级不适配的文本片段。若权限管控操作用于管控可见权限,则权限管控操作可以包括:将敏感等级与目标账户的访问权限等级不适配的文本片段的编辑状态设置为不可编辑状态。
这里,上述执行主体可以对查找到的标注文本进行权限管控操作,以实现对相应文本片段的内容进行处理。
本实施例提供的方法,通过预先给各目标账户分配访问权限等级,实现在用户通过用户终端登录目标账户以访问所存储的标注文本时,能够向该用户返回符合访问权限等级的部分内容,可以保障数据安全。
请参阅图2,图2是本申请实施例提供的一种数据处理方法的实现流程图。本实施例提供的数据处理方法,可以包括以下步骤:
步骤201,获取原始医疗数据,对原始医疗数据进行格式转换,得到文本格式的目标文本。
其中,原始医疗数据通常是医疗过程中发生的数据。原始医疗数据可以具有语音部分,也可以具有文本部分。
其中,目标文本通常是文本形式的原始医疗数据。
这里,上述执行主体可以从本地获取原始医疗数据,也可以从通信连接的其它设备获取原始医疗数据。然后,将所获取的原始医疗数据转换成文本格式,以得到目标文本。
步骤202,将目标文本切分成多个文本片段,以及根据各文本片段的内容,确定相应文本片段的片段类型和对应的敏感等级。
这里,上述执行主体可以基于目标文本中的分段,将目标文本切分成多个文本片段。实践中,由于文本中的每一个段落通常表达的主题相同,因此,上述执行主体可以将每一个段落作为一个文本片段。然后,针对每个文本片段,上述执行主体可以对该文本片段进行分析,如语义分析,以确定该文本片段的片段类型,以及从预先存储的片段类型-敏感等级对应关系表中,找到对应的敏感等级。
需要指出的是,针对医疗数据领域,片段类型通常比较固定,比如,可以是姓名类型、性别类型、身份证号类型、诊断结果类型等。
步骤203,根据各文本片段的敏感等级,对目标文本执行信息标注处理,得到标注文本,以及将标注文本存入区块链。
其中,信息标注处理通常用于将文本片段的敏感等级标注在对应文本片段位置处,这样,可以实现快速查找到标注文本中的、与敏感等级对应的文本片段,有助于提高数据处理效率。
这里,上述执行主体可以将文本片段对应的敏感等级,标注在文本片段位置,得到标注后的目标文本,记作标注文本。然后,可以将标注文本存入区块链中。需要指出的是,由于区块链具有防篡改特性,将标注文本存入区块链中,可以保证所保存数据的安全可靠性。
步骤204,接收目标账户对应的用户终端发送的数据访问请求,以及获取目标账户的访问权限等级。
其中,数据访问请求包括访问需求描述信息,目标账户被预先分配有访问权限等级,其中,访问权限等级与所访问内容的敏感等级相对应。
步骤205,从区块链中存储的至少一个标注文本中,查找与访问需求描述信息匹配的标注文本。
其中,标注文本中的各文本片段标注有敏感等级。
步骤206,从查找到的标注文本中,对敏感等级与目标账户的访问权限等级不适配的文本片段执行权限管控操作,得到访问文本,以及将访问文本向用户终端发送。
其中,权限管控操作用于管控以下权限中的至少一种:编辑权限、可见权限。
在本实施例中,步骤204-206的具体操作与图1所示的实施例中步骤101-103的操作基本相同,在此不再赘述。
本实施例可以将原始医疗数据进行处理,以得到对应的标注文本,以及将所得到的标注文本存入区块链中。由于区块链具有防篡改特性,将标注文本存入区块链中,可以保证所保存数据的安全可靠性。
在本实施例的一些可选的实现方式中,将目标文本切分成多个文本片段,以及根据各文本片段的内容,确定相应文本片段的片段类型和对应的敏感等级,可以包括如下步骤一至步骤三。
步骤一,对目标文本进行分词处理,得到多个切分词及各切分词在目标文本中的分词位置信息。
这里,上述执行主体可以采用多种分词方式对目标文本进行分词处理。例如,执行主体可以采用最短路径分词法(N-Short Path)对目标文本进行分词处理。再例如,执行主体也可以采用最大概率分词法(Maximum Probability)对目标文本进行分词处理。再例如,执行主体还可以采用最大匹配法(Maximum Matching)对目标文本进行分词处理。这里,执行主体对目标文本进行分词处理之后,可以得到目标文本中的至少一个切分词。其中,上述切分词为对目标文本进行分词处理后得到的词。
实践中,上述执行主体通常将目标文本输入预先训练的分词模型,得到多个切分词及各切分词在目标文本中的位置信息,记作分词位置信息。其中,分词模型用于表征目标文本与切分词及切分词在目标文本中的位置信息之间的对应关系。作为示例,分词模型可以是基于训练样本,利用机器学习方法,对初始模型(例如卷积神经网络(ConvolutionalNeural Network,CNN)、残差网络(ResNet)等)进行训练后得到的模型。
步骤二,根据预设关键词集,确定各切分词的分词类型,以及根据各切分词的分词类型,将目标文本切分成多个文本片段。
其中,预设关键词集中的预设关键词对应有关键词类型。
这里,针对每个切分词,上述执行主体可以从预设关键词集中找出与之相同的预设关键词,然后,将找到的预设关键词对应的关键词类型,确定为该切分词的分词类型。然后,上述执行主体可以将目标文本中的、对应分词类型相同的连续的多个切分词的组合作为一个文本片段,从而得到多个文本片段。
可选地,上述根据预设关键词集,确定各切分词的分词类型,可以包括:针对每个切分词,计算该切分词与预设关键词集中的各预设关键词之间的相似程度,将预设关键词集中的、对应相似程度满足预设相似条件的预设关键词,确定为与该切分词匹配的预设关键词,以及将与该切分词匹配的预设关键词对应的关键词类型,确定为该切分词的分词类型。
其中,上述预设相似条件通常是预先设定的条件。如,预设相似条件可以是相似程度大于80%,也可以是相似程度最大。
这里,针对每个切分词,上述执行主体可以从预设关键词集中找出与该切分词相似程度较高的预设关键词,然后,将找到的预设关键词对应的关键词类型,确定为该切分词的分词类型。
可选地,上述根据各切分词的分词类型,将目标文本切分成多个文本片段,可以包括:首先,遍历目标文本中的各切分词,若当前访问的切分词的分词类型与上一切分词的分词类型一致,则将当前访问的切分词划分为上一切分词所属的文本片段。然后,若当前访问的切分词的分词类型与上一切分词的分词类型不一致,则将当前访问的切分词划分为与上一切分词所属的文本片段不同的新文本片段,以此类推,直至对各切分词完成文本片段划分,得到多个文本片段。
这里,上述执行主体可以以对应分词类型相异的两个相邻切分词作为分隔点,将目标文本分隔成多个文本片段,可以实现将对应分词类型相同的各相邻切分词切分为同一文本片段。
步骤三,根据各文本片段中包括的切分词的分词类型和分词位置信息,确定相应文本片段的片段类型及相应文本片段在目标文本中的片段位置信息,以及根据各文本片段的片段类型,确定相应文本片段的敏感等级。
这里,可以将文本片段中的出现最多的分词类型确定为文本片段的片段类型。以及将文本片段中包括的第一个切分词的位置与最后一个切分词的位置所形成的位置区间,确定为文本片段的位置。这里,可以从预先存储的片段类型-敏感等级对应关系表中,查找到的文本片段的敏感等级。
请参阅图3,图3是本申请实施例提供的一种将标注文本存入区块链的实现流程图,可以包括以下步骤:
步骤301,生成针对标注文本的第一秘钥对。
其中,第一秘钥对包括第一私钥和第一公钥。
这里,上述执行主体可以采用秘钥生成算法,生成针对标注文本的第一秘钥对。
步骤302,根据第一私钥对标注文本进行加密处理,以及将加密后的标注文本存入区块链。
这里,上述执行主体可以采用第一秘钥对中的第一私钥,对标注文本进行加密,以及将加密后的标注文本存入区块链。
步骤303,根据目标账户的账户信息,生成第二秘钥对。
其中,第二秘钥对包括第二私钥和第二公钥。
这里,上述执行主体可以采用秘钥生成算法,生成针对目标账户的第二秘钥对。
步骤304,根据第二公钥对第一私钥进行加密,以及存储加密后的第一私钥。
这里,上述执行主体可以采用目标账户的第二公钥,对标注文本的第一私钥进行加密,得到加密后的第一私钥。
需要指出的是,采用用户的公钥对标注文本的私钥进行加密,可以实现对标注文本进行访问时,采用用户的私钥对标注文本的私钥进行解密,以得到标注文本的私钥。然后,采用标注文本的私钥解密标注文本。实现对所存储的标注数据进一步保密,有助于进一步提高数据安全。
在一些可选的实现方式中,从区块链中存储的至少一个标注文本中,查找与访问需求描述信息匹配的标注文本,可以包括:
首先,若访问需求描述信息包括文本标识,则查找与文本标识对应的加密的第一私钥,以及从区块链中存储的至少一个加密标注文本中,查找与文本标识对应的加密标注文本。
这里,在访问需求描述信息包括文本标识时,上述执行主体可以采用文本标识,从预先存储的文本标识-加密的第一私钥之间的对应关系中,找到与文本标识对应的加密的第一私钥。然后,上述执行主体可以从区块链中存储的多个加密标注文本中,找到文本标识对应的加密标注文本。需要指出的是,文本标识-加密的第一私钥之间的对应关系可以是存储在区块链中,也可以存储在本地,还可以存储在与执行主体通信连接的其它设备。
然后,根据目标账户的第二公钥对加密的第一私钥进行解密,得到第一私钥,以及根据得到的第一私钥对查找到的加密标注文本进行解密,得到与访问需求描述信息匹配的标注文本。
这里,上述执行主体可以采用目标账户的第二公钥,对所得到的加密的第一私钥进行解密,得到第一私钥。然后,上述执行主体可以采用所得到的第一私钥对所得到的加密标注文本进行解密,得到用户所需的解密后的标注文本。
需要指出的是,用户访问标注文本时,采用用户的私钥对标注文本的私钥进行解密,可以得到标注文本的私钥,然后,采用标注文本的私钥解密标注文本。可以进一步提高数据安全。
请参阅图4,图4是本申请实施例提供的一种数据处理装置400的结构框图。本实施例中该数据处理装置包括的各单元用于执行图1-图3对应的实施例中的各步骤。具体请参阅图1-图3以及图1-图3所对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图4,数据处理装置400包括:
请求接收单元401,用于接收目标账户对应的用户终端发送的数据访问请求,以及获取目标账户的访问权限等级,数据访问请求包括访问需求描述信息,目标账户被预先分配有访问权限等级,其中,访问权限等级与所访问内容的敏感等级相对应;
文本查找单元402,用于从区块链中存储的至少一个标注文本中,查找与访问需求描述信息匹配的标注文本,其中,标注文本中的各文本片段标注有敏感等级;
数据管控单元403,用于从查找到的标注文本中,对敏感等级与目标账户的访问权限等级不适配的文本片段执行权限管控操作,得到访问文本,以及将访问文本向用户终端发送,权限管控操作用于管控以下权限中的至少一种:编辑权限、可见权限。
作为本申请一实施例,装置还包括文本存储单元(图中未示出)。其中,文本存储单元包括格式转换模块、等级确定模块和存储执行模块。
格式转换模块,用于获取原始医疗数据,对原始医疗数据进行格式转换,得到文本格式的目标文本;
等级确定模块,用于等级确定模块将目标文本切分成多个文本片段,以及根据各文本片段的内容,确定相应文本片段的片段类型和对应的敏感等级;
存储执行模块,用于根据各文本片段的敏感等级,对目标文本执行信息标注处理,得到标注文本,以及将标注文本存入区块链。
作为本申请一实施例,等级确定模块,具体用于:
对目标文本进行分词处理,得到多个切分词及各切分词在目标文本中的分词位置信息;
根据预设关键词集,确定各切分词的分词类型,以及根据各切分词的分词类型,将目标文本切分成多个文本片段,其中,预设关键词集中的预设关键词对应有关键词类型;
根据各文本片段中包括的切分词的分词类型和分词位置信息,确定相应文本片段的片段类型及相应文本片段在目标文本中的片段位置信息,以及根据各文本片段的片段类型,确定相应文本片段的敏感等级。
作为本申请一实施例,等级确定模块中,根据预设关键词集,确定各切分词的分词类型,包括:
针对每个切分词,计算该切分词与预设关键词集中的各预设关键词之间的相似程度,将预设关键词集中的、对应相似程度满足预设相似条件的预设关键词,确定为与该切分词匹配的预设关键词,以及将与该切分词匹配的预设关键词对应的关键词类型,确定为该切分词的分词类型。
作为本申请一实施例,等级确定模块中,根据各切分词的分词类型,将目标文本切分成多个文本片段,包括:
遍历目标文本中的各切分词,若当前访问的切分词的分词类型与上一切分词的分词类型一致,则将当前访问的切分词划分为上一切分词所属的文本片段;
若当前访问的切分词的分词类型与上一切分词的分词类型不一致,则将当前访问的切分词划分为与上一切分词所属的文本片段不同的新文本片段,以此类推,直至对各切分词完成文本片段划分,得到多个文本片段。
作为本申请一实施例,存储执行模块中,将标注文本存入区块链,包括:
生成针对标注文本的第一秘钥对,其中,第一秘钥对包括第一私钥和第一公钥;
根据第一私钥对标注文本进行加密处理,以及将加密后的标注文本存入区块链;
根据目标账户的账户信息,生成第二秘钥对,第二秘钥对包括第二私钥和第二公钥;
根据第二公钥对第一私钥进行加密,以及存储加密后的第一私钥。
作为本申请一实施例,文本查找单元402,具体用于:
若访问需求描述信息包括文本标识,则查找与文本标识对应的加密的第一私钥,以及从区块链中存储的至少一个加密标注文本中,查找与文本标识对应的加密标注文本;
根据目标账户的第二公钥对加密的第一私钥进行解密,得到第一私钥,以及根据得到的第一私钥对查找到的加密标注文本进行解密,得到与访问需求描述信息匹配的标注文本。
本实施例提供的装置,通过预先给各目标账户分配访问权限等级,实现在用户通过用户终端登录目标账户以访问所存储的标注文本时,能够向该用户返回符合访问权限等级的部分内容,可以保障数据安全。
应当理解的是,图4示出的数据处理装置的结构框图中,各单元用于执行图1-图3对应的实施例中的各步骤,而对于图1-图3对应的实施例中的各步骤已在上述实施例中进行详细解释,具体请参阅图1-图3以及图1-图3所对应的实施例中的相关描述,此处不再赘述。
图5是本申请另一实施例提供的一种服务器的结构框图。如图5所示,该实施例的服务器500包括:处理器501、存储器502以及存储在存储器502中并可在处理器501上运行的计算机程序503,例如数据处理方法的程序。处理器501执行计算机程序503时实现上述各个数据处理方法各实施例中的步骤,例如图1所示的步骤101至步骤103。或者,处理器501执行计算机程序503时实现上述图4对应的实施例中各单元的功能,例如,图4所示的单元401至403的功能,具体请参阅图4对应的实施例中的相关描述,此处不赘述。
示例性的,计算机程序503可以被分割成一个或多个单元,一个或者多个单元被存储在存储器502中,并由处理器501执行,以完成本申请。一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序503在服务器500中的执行过程。例如,计算机程序503可以被分割成请求接收单元,文本查找单元,数据管控单元,各单元具体功能如上。
服务器可以包括,但不仅限于,处理器501、存储器502。本领域技术人员可以理解,图5仅仅是服务器500的示例,并不构成对服务器500的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如转台设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器501可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器502可以是服务器500的内部存储单元,例如服务器500的硬盘或内存。存储器502也可以是服务器500的外部存储设备,例如服务器500上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器502还可以既包括服务器500的内部存储单元也包括外部存储设备。存储器502用于存储计算机程序以及转台设备所需的其他程序和数据。存储器502还可以用于暂时地存储已经输出或者将要输出的数据。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。其中,计算机可读存储介质可以是非易失性的,也可以是易失性的。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读存储介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读存储介质不包括电载波信号和电信信号。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种数据处理方法,其特征在于,所述方法包括:
接收目标账户对应的用户终端发送的数据访问请求,以及获取所述目标账户的访问权限等级,所述数据访问请求包括访问需求描述信息,所述目标账户被预先分配有访问权限等级,其中,所述访问权限等级与所访问内容的敏感等级相对应;
从区块链中存储的至少一个标注文本中,查找与所述访问需求描述信息匹配的标注文本,其中,标注文本中的各文本片段标注有敏感等级;
从查找到的标注文本中,对敏感等级与所述目标账户的访问权限等级不适配的文本片段执行权限管控操作,得到访问文本,以及将所述访问文本向所述用户终端发送,所述权限管控操作用于管控以下权限中的至少一种:编辑权限、可见权限。
2.根据权利要求1所述的数据处理方法,其特征在于,所述方法还包括:
获取原始医疗数据,对所述原始医疗数据进行格式转换,得到文本格式的目标文本;
将所述目标文本切分成多个文本片段,以及根据各文本片段的内容,确定相应文本片段的片段类型和对应的敏感等级;
根据各文本片段的敏感等级,对所述目标文本执行信息标注处理,得到标注文本,以及将所述标注文本存入区块链。
3.根据权利要求2所述的数据处理方法,其特征在于,所述将所述目标文本切分成多个文本片段,以及根据各文本片段的内容,确定相应文本片段的片段类型和对应的敏感等级,包括:
对所述目标文本进行分词处理,得到多个切分词及各切分词在所述目标文本中的分词位置信息;
根据预设关键词集,确定各切分词的分词类型,以及根据各切分词的分词类型,将所述目标文本切分成多个文本片段,其中,预设关键词集中的预设关键词对应有关键词类型;
根据各文本片段中包括的切分词的分词类型和分词位置信息,确定相应文本片段的片段类型及相应文本片段在所述目标文本中的片段位置信息,以及根据各文本片段的片段类型,确定相应文本片段的敏感等级。
4.根据权利要求3所述的数据处理方法,其特征在于,所述根据预设关键词集,确定各切分词的分词类型,包括:
针对每个切分词,计算该切分词与预设关键词集中的各预设关键词之间的相似程度,将所述预设关键词集中的、对应相似程度满足预设相似条件的预设关键词,确定为与该切分词匹配的预设关键词,以及将与该切分词匹配的预设关键词对应的关键词类型,确定为该切分词的分词类型。
5.根据权利要求3所述的数据处理方法,其特征在于,所述根据各切分词的分词类型,将所述目标文本切分成多个文本片段,包括:
遍历所述目标文本中的各切分词,若当前访问的切分词的分词类型与上一切分词的分词类型一致,则将当前访问的切分词划分为上一切分词所属的文本片段;
若当前访问的切分词的分词类型与上一切分词的分词类型不一致,则将当前访问的切分词划分为与上一切分词所属的文本片段不同的新文本片段,以此类推,直至对各切分词完成文本片段划分,得到多个文本片段。
6.根据权利要求2-5中任一项所述的数据处理方法,其特征在于,所述将所述标注文本存入区块链,包括:
生成针对所述标注文本的第一秘钥对,其中,所述第一秘钥对包括第一私钥和第一公钥;
根据所述第一私钥对所述标注文本进行加密处理,以及将加密后的所述标注文本存入所述区块链;
根据所述目标账户的账户信息,生成第二秘钥对,所述第二秘钥对包括第二私钥和第二公钥;
根据所述第二公钥对所述第一私钥进行加密,以及存储加密后的所述第一私钥。
7.根据权利要求6所述的数据处理方法,其特征在于,所述从区块链中存储的至少一个标注文本中,查找与所述访问需求描述信息匹配的标注文本,包括:
若所述访问需求描述信息包括文本标识,则查找与所述文本标识对应的加密的第一私钥,以及从所述区块链中存储的至少一个加密标注文本中,查找与所述文本标识对应的加密标注文本;
根据所述目标账户的第二公钥对所述加密的第一私钥进行解密,得到第一私钥,以及根据得到的第一私钥对查找到的加密标注文本进行解密,得到与所述访问需求描述信息匹配的标注文本。
8.一种数据处理装置,其特征在于,所述装置包括:
请求接收单元,用于接收目标账户对应的用户终端发送的数据访问请求,以及获取所述目标账户的访问权限等级,所述数据访问请求包括访问需求描述信息,所述目标账户被预先分配有访问权限等级,其中,所述访问权限等级与所访问内容的敏感等级相对应;
文本查找单元,用于从区块链中存储的至少一个标注文本中,查找与所述访问需求描述信息匹配的标注文本,其中,标注文本中的各文本片段标注有敏感等级;
数据管控单元,用于从查找到的标注文本中,对敏感等级与所述目标账户的访问权限等级不适配的文本片段执行权限管控操作,得到访问文本,以及将所述访问文本向所述用户终端发送,所述权限管控操作用于管控以下权限中的至少一种:编辑权限、可见权限。
9.一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。
CN202111256884.3A 2021-10-27 2021-10-27 数据处理方法、装置、服务器及存储介质 Pending CN114003929A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111256884.3A CN114003929A (zh) 2021-10-27 2021-10-27 数据处理方法、装置、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111256884.3A CN114003929A (zh) 2021-10-27 2021-10-27 数据处理方法、装置、服务器及存储介质

Publications (1)

Publication Number Publication Date
CN114003929A true CN114003929A (zh) 2022-02-01

Family

ID=79924425

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111256884.3A Pending CN114003929A (zh) 2021-10-27 2021-10-27 数据处理方法、装置、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN114003929A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114221824A (zh) * 2022-02-22 2022-03-22 北京悦游信息技术有限公司 一种私域网络的安全访问控制方法、系统和可读存储介质
CN114422265A (zh) * 2022-02-28 2022-04-29 海信集团控股股份有限公司 数据访问方法及服务器
CN115033918A (zh) * 2022-06-09 2022-09-09 易顺云(深圳)科技有限公司 企业一体化信息管理方法及系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114221824A (zh) * 2022-02-22 2022-03-22 北京悦游信息技术有限公司 一种私域网络的安全访问控制方法、系统和可读存储介质
CN114221824B (zh) * 2022-02-22 2022-05-17 北京悦游信息技术有限公司 一种私域网络的安全访问控制方法、系统和可读存储介质
CN114422265A (zh) * 2022-02-28 2022-04-29 海信集团控股股份有限公司 数据访问方法及服务器
CN114422265B (zh) * 2022-02-28 2024-05-03 海信集团控股股份有限公司 数据访问方法及服务器
CN115033918A (zh) * 2022-06-09 2022-09-09 易顺云(深圳)科技有限公司 企业一体化信息管理方法及系统

Similar Documents

Publication Publication Date Title
US11632238B2 (en) Traceability of edits to digital documents via distributed ledgers
CN114003929A (zh) 数据处理方法、装置、服务器及存储介质
KR102430649B1 (ko) 익명화를 위해 속성들을 자동으로 식별하기 위한 컴퓨터 구현 시스템 및 방법
US20190268340A1 (en) Method and apparatus generating and applying security labels to sensitive data
US20220075900A1 (en) Tracing objects across different parties
US11347891B2 (en) Detecting and obfuscating sensitive data in unstructured text
CN111694840A (zh) 数据同步方法、装置、服务器及存储介质
CN111638908A (zh) 接口文档生成方法、装置、电子设备及介质
CN111797351A (zh) 页面数据管理方法、装置、电子设备及介质
CN113656547B (zh) 文本匹配方法、装置、设备及存储介质
US11295027B2 (en) System and method for protecting electronic documents containing confidential information from unauthorized access
CN106547791A (zh) 一种数据访问方法及系统
CN110990877A (zh) 一种基于greenplum的医疗影像文件分段加解密系统及方法
CN110995670B (zh) 基于区块链的数字身份信息管理方法及系统
CN112434506A (zh) 电子协议签订处理方法、装置、计算机设备及介质
CN112199494A (zh) 医疗信息搜索方法、装置、电子设备及存储介质
US20240152630A1 (en) Security system and method for real-time encryption or decryption of data using key management server
CN116070185A (zh) 用生物测定数据匹配处理数据主体权限请求的系统和方法
CN113283677B (zh) 指标数据处理方法、装置、设备及存储介质
CN114942749A (zh) 审批系统开发方法、装置、设备及存储介质
CN113961609A (zh) 数据查询方法、装置、服务器及存储介质
CN111933241B (zh) 医疗数据解析方法、装置、电子设备及存储介质
CN114783557A (zh) 肿瘤患者数据的处理方法和装置、存储介质及处理器
US20210295956A1 (en) Systems and Methods for Hashing-Based Assessment of Electronic Clinical Trial Outcomes
CN114124586A (zh) 一种网络威胁检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20221008

Address after: Room 2601 (Unit 07), Qianhai Free Trade Building, No. 3048, Xinghai Avenue, Nanshan Street, Qianhai Shenzhen-Hong Kong Cooperation Zone, Shenzhen, Guangdong 518000

Applicant after: Shenzhen Ping An Smart Healthcare Technology Co.,Ltd.

Address before: 1-34 / F, Qianhai free trade building, 3048 Xinghai Avenue, Mawan, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong 518000

Applicant before: Ping An International Smart City Technology Co.,Ltd.

TA01 Transfer of patent application right