CN113961609A - 数据查询方法、装置、服务器及存储介质 - Google Patents

数据查询方法、装置、服务器及存储介质 Download PDF

Info

Publication number
CN113961609A
CN113961609A CN202111256883.9A CN202111256883A CN113961609A CN 113961609 A CN113961609 A CN 113961609A CN 202111256883 A CN202111256883 A CN 202111256883A CN 113961609 A CN113961609 A CN 113961609A
Authority
CN
China
Prior art keywords
data
output
type
item
data item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111256883.9A
Other languages
English (en)
Inventor
赵斌年
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Ping An Smart Healthcare Technology Co ltd
Original Assignee
Ping An International Smart City Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An International Smart City Technology Co Ltd filed Critical Ping An International Smart City Technology Co Ltd
Priority to CN202111256883.9A priority Critical patent/CN113961609A/zh
Publication of CN113961609A publication Critical patent/CN113961609A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioethics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Storage Device Security (AREA)

Abstract

本申请适用于人工智能技术领域,提供了一种数据查询方法、装置、服务器及存储介质,该方法包括:获取数据请求信息;对数据描述信息进行实体提取,当所提取的实体中包括目标实体时,将预先设定的对应于目标实体的数据类型,确定为待输出数据的数据类型;根据待输出数据的数据类型,对待输出数据进行数据项识别处理,识别得到待输出数据中所包括的多个数据项;根据预先设定的目标用户端的权限等级,从多个数据项中确定出敏感数据项,对待输出数据中的敏感数据项执行预设脱敏处理步骤,以及向目标用户端发送脱敏处理后的待输出数据。本申请可以防止数据泄露,提高数据安全。

Description

数据查询方法、装置、服务器及存储介质
技术领域
本申请涉及人工智能技术领域,尤其涉及一种数据查询方法、装置、服务器及存储介质。
背景技术
大数据时代,数据的安全成为了国家、政府、企业的命脉。随着大数据技术的成熟应用与推广,拥有重要数据资产的企业或政府部门,对大数据发展理念日渐认同,数据成为继现金和技术之后又一核心价值资产。保障数据的隐私性、可视化安全性十分重要,敏感数据,如政务数据、个人隐私数据、商业机密数据等一旦被泄露,容易造成意想不到的问题,甚至可能影响社会安全、国家稳定发展。
相关技术中,用户对数据库中的数据进行访问时,若直接将用户访问的数据内容返回给用户,容易导致隐私数据被泄露等问题,导致数据安全性不高。
发明内容
有鉴于此,本申请实施例提供了一种数据查询方法、装置、服务器及存储介质,以解决相关技术中,用户对数据库中的数据进行访问时,若直接将用户访问的数据内容返回给用户,容易导致隐私数据被泄露等问题,导致数据安全性不高的问题。
本申请实施例的第一方面提供了一种数据查询方法,包括:
获取数据请求信息,其中,数据请求信息用于请求待输出数据,且数据请求信息包括用于描述待输出数据的数据描述信息;
对数据描述信息进行实体提取,当所提取的实体中包括目标实体时,将预先设定的对应于目标实体的数据类型,确定为待输出数据的数据类型,其中,待输出数据的数据类型包括以下至少一种:图像类型、数据表类型、文本类型;
根据待输出数据的数据类型,对待输出数据进行数据项识别处理,识别得到待输出数据中所包括的多个数据项;
根据预先设定的目标用户端的权限等级,从多个数据项中确定出敏感数据项,对待输出数据中的敏感数据项执行预设脱敏处理步骤,以及向目标用户端发送脱敏处理后的待输出数据。
进一步地,预设脱敏处理步骤,包括:
根据预设关键词集,确定敏感数据项的隐私等级,其中,预设关键词集中的预设关键词对应有隐私等级,隐私等级包括用于指示单个信息或多个信息的组合可确定用户身份的第一隐私等级和用于指示不可篡改的第二隐私等级;
若敏感数据项的隐私等级为第一隐私等级,则将敏感数据项的可见状态设置为不可见的状态;
若敏感数据项的隐私等级为第二隐私等级,则将敏感数据项的编辑状态设置为不可编辑的状态。
进一步地,将敏感数据项的可见状态设置为不可见的状态,包括:
若待输出数据的数据类型为数据表类型和文本类型中的至少一种,则删除敏感数据项;
若待输出数据的数据类型为图像类型,则采用目标图像遮挡敏感数据项。
进一步地,根据待输出数据的数据类型,对待输出数据进行数据项识别处理,识别得到待输出数据中所包括的多个数据项,包括:
确定待输出数据中的数据类型的种类数,根据种类数及各种类的数据类型,对待输出数据进行数据项识别处理,识别得到待输出数据中所包括的多个数据项。
进一步地,根据种类数及各种类的数据类型,对待输出数据进行数据项识别处理,识别得到待输出数据中所包括的多个数据项,包括:
若种类数为一种,且为图像类型,则将待输出数据输入预先训练的图像内容识别模型,识别得到待输出数据中的各数据项;
其中,图像内容识别模型用于表征输入图像与输入图像中的数据项之间的对应关系。
进一步地,根据种类数及各种类的数据类型,对待输出数据进行数据项识别处理,识别得到待输出数据中所包括的多个数据项,包括:
若种类数为三种,且为图像类型、数据表类型和文本类型,则将待输出数据的图像部分输入预先训练的图像内容识别模型,识别得到待输出数据中图像部分的各数据项,将待输出数据的文本部分输入预先训练的文本内容识别模型,识别得到待输出数据中的文本部分的各数据项,以及提取待输出数据的数据表部分的各字段,将所提取的字段及字段对应的内容作为数据项;
其中,待输出数据中所包括的多个数据项包括图像部分的各数据项、文本部分的各数据项和数据表部分的各数据项。
进一步地,根据预先设定的目标用户端的权限等级,从多个数据项中确定出敏感数据项,包括:
若权限等级对应有禁止访问的数据项类别组,则确定各数据项的数据项类别,以及从多个数据项中,选取对应数据项类别属于数据项类别组的数据项,记作敏感数据项,其中,数据项类别包括身份证号类别、家庭住址类别。
本申请实施例的第二方面提供了一种数据查询装置,包括:
信息获取单元,用于获取数据请求信息,其中,数据请求信息用于请求待输出数据,且数据请求信息包括用于描述待输出数据的数据描述信息;
类型确定单元,用于对数据描述信息进行实体提取,当所提取的实体中包括目标实体时,将预先设定的对应于目标实体的数据类型,确定为待输出数据的数据类型,其中,待输出数据的数据类型包括以下至少一种:图像类型、数据表类型、文本类型;
数据识别单元,用于根据待输出数据的数据类型,对待输出数据进行数据项识别处理,识别得到待输出数据中所包括的多个数据项;
数据脱敏单元,用于根据预先设定的目标用户端的权限等级,从多个数据项中确定出敏感数据项,对待输出数据中的敏感数据项执行预设脱敏处理步骤,以及向目标用户端发送脱敏处理后的待输出数据。
进一步地,数据脱敏单元中,预设脱敏处理步骤,包括:
根据预设关键词集,确定敏感数据项的隐私等级,其中,预设关键词集中的预设关键词对应有隐私等级,隐私等级包括用于指示单个信息或多个信息的组合可确定用户身份的第一隐私等级和用于指示不可篡改的第二隐私等级;
若敏感数据项的隐私等级为第一隐私等级,则将敏感数据项的可见状态设置为不可见的状态;
若敏感数据项的隐私等级为第二隐私等级,则将敏感数据项的编辑状态设置为不可编辑的状态。
进一步地,将敏感数据项的可见状态设置为不可见的状态,包括:若待输出数据的数据类型为数据表类型和文本类型中的至少一种,则删除敏感数据项;若待输出数据的数据类型为图像类型,则采用目标图像遮挡敏感数据项。
进一步地,数据识别单元,具体用于:确定待输出数据中的数据类型的种类数,根据种类数及各种类的数据类型,对待输出数据进行数据项识别处理,识别得到待输出数据中所包括的多个数据项。
进一步地,数据识别单元,具体还用于:若种类数为一种,且为图像类型,则将待输出数据输入预先训练的图像内容识别模型,识别得到待输出数据中的各数据项;
其中,图像内容识别模型用于表征输入图像与输入图像中的数据项之间的对应关系。
进一步地,数据识别单元,具体还用于:若种类数为三种,且为图像类型、数据表类型和文本类型,则将待输出数据的图像部分输入预先训练的图像内容识别模型,识别得到待输出数据中图像部分的各数据项,将待输出数据的文本部分输入预先训练的文本内容识别模型,识别得到待输出数据中的文本部分的各数据项,以及提取待输出数据的数据表部分的各字段,将所提取的字段及字段对应的内容作为数据项;
其中,待输出数据中所包括的多个数据项包括图像部分的各数据项、文本部分的各数据项和数据表部分的各数据项。
进一步地,数据脱敏单元中,根据预先设定的目标用户端的权限等级,从多个数据项中确定出敏感数据项,包括:
若权限等级对应有禁止访问的数据项类别组,则确定各数据项的数据项类别,以及从多个数据项中,选取对应数据项类别属于数据项类别组的数据项,记作敏感数据项,其中,数据项类别包括身份证号类别、家庭住址类别。
本申请实施例的第三方面提供了一种服务器,包括存储器、处理器以及存储在存储器中并可在服务器上运行的计算机程序,处理器执行计算机程序时实现第一方面提供的数据查询方法的各步骤。
本申请实施例的第四方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现第一方面提供的数据查询方法的各步骤。
实施本申请实施例提供的一种数据查询方法、装置、服务器及存储介质具有以下有益效果:通过对用户所需访问的待输出数据的数据描述信息进行实体分析,得到待输出数据的数据类型,然后,基于数据类型,从待输出数据中识别得到多个数据项,之后,从所得到的多个数据项中确定出与权限等级适配的敏感数据项,以及对待输出数据中的敏感数据项进行脱敏处理后,输出脱敏处理后的待输出数据。在所请求的待输出数据相同时,可以实现针对不同用户权限的用户,输出不同的数据内容,可以防止数据泄露,有助于提高数据安全。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种数据查询方法的实现流程图;
图2是本申请实施例提供的一种数据查询装置的结构框图;
图3是本申请实施例提供的一种服务器的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据查询技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本申请实施例中,基于人工智能技术,以实现保障用户所访问数据的数据安全。
本申请实施例所涉及的数据查询方法,可以由服务器执行。数据查询方法由服务器执行时,执行主体为服务器。
需要指出的是,上述服务器可以包括但不限于服务器、手机、平板或可穿戴智能设备等。另外,上述服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDelivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
请参阅图1,图1示出了本申请实施例提供的一种数据查询方法的实现流程图,包括:
步骤101,获取数据请求信息。
其中,数据请求信息用于请求待输出数据,且数据请求信息包括用于描述待输出数据的数据描述信息。上述数据描述信息通常是用于描述待输出数据的信息。本实施例对数据描述信息的具体形式不做限定。
实践中,上述执行主体可以获取目标用户端发送的数据请求信息。其中,上述目标用户端通常是登录目标账户的终端。目标账户通常是已注册账户。
这里,目标用户端可以通过网络将数据请求信息发送至上述执行主体,这样,上述执行主体可以接收到该数据请求信息。
步骤102,对数据描述信息进行实体提取,当所提取的实体中包括目标实体时,将预先设定的对应于目标实体的数据类型,确定为待输出数据的数据类型。
其中,待输出数据的数据类型包括以下至少一种:图像类型、数据表类型、文本类型。其中,上述目标实体通常是预先设定的实体,如,可以是“超声图”、“影像图”、“病历”、“处方”、“档案”、“统计表”等。实践中,目标实体可以有一个也可以有多个,每个目标实体对应有数据类型。
作为一个示例,上述执行主体可以将数据描述信息输入预先训练的实体提取模型,以实现对数据描述信息进行实体提取。其中,上述实体提取模型可以用于分析信息与信息中的实体之间的对应关系。具体的,实体提取模型可以是基于训练样本,利用机器学习方法,对初始模型(例如卷积神经网络(Convolutional Neural Network,CNN)、残差网络(ResNet)等)进行训练后得到的模型。在该示例中,针对所提取的每个实体,上述执行主体可以采用该实体与各个目标实体进行比较,若存在与该实体相同或相似的目标实体,则认为所提取的实体中包括该目标实体,反之,若不存在与该实体相同或相似的目标实体,则认为所提取的实体中不包括该目标实体。这样,可以得到所提取的实体中包括的所有目标实体。
作为另一个示例,上述执行主体也可以采用目标实体与数据描述信息中的文字进行逐一比较,以提取出数据描述信息中的、与目标实体相同的实体。在该示例中,提取得到的实体即为目标实体,若能提取到实体,则可以确定所提取的实体包括目标实体。
这里,对数据描述信息进行实体提取,可以提取得到一个或多个实体。在所提取的实体中包括目标实体时,上述执行主体可以将目标实体对应的数据类型,确定为待输出数据的数据类型。实践中,数据描述信息中可以包括一个目标实体,也可以包括多个目标实体。待输出数据的数据类型可以有一种也可以有多种。
步骤103,根据待输出数据的数据类型,对待输出数据进行数据项识别处理,识别得到待输出数据中所包括的多个数据项。
其中,上述数据项,通常包括数据和数据的属性。如,数据项可以为:(年龄,25),也可以为:(家庭住址,XX市YY区ZZ小区)。
实践中,每种数据类型可以对应有数据识别步骤。上述数据识别步骤通常是用于从待输出数据中识别数据项的步骤。如,若数据类型为图像类型,则数据识别步骤可以为:将待输出数据的图像部分输入预先训练的图像内容识别模型,识别得到待输出数据中图像部分的各数据项。
这里,上述执行主体可以采用数据描述信息,从数据库中提取得到与数据描述信息适配的待输出数据。然后,上述执行主体可以采用数据类型,对待输出数据进行数据项识别处理,从而从待输出数据中识别得到多个数据项。
实践中,每种数据类型对应有数据识别步骤。待输出数据中可以具有一种数据类型的数据,也可以具有多种数据类型的数据部分。若待输出数据中具有多种数据类型的数据部分,则上述执行主体可以针对每种数据类型的数据部分执行相应的数据识别步骤,以实现得到各部分的数据项。
在本实施例的可选的实现方式中,根据待输出数据的数据类型,对待输出数据进行数据项识别处理,识别得到待输出数据中所包括的多个数据项,可以包括:首先,确定待输出数据中的数据类型的种类数。然后,根据种类数及各种类的数据类型,对待输出数据进行数据项识别处理,识别得到待输出数据中所包括的多个数据项。
这里,上述执行主体可以直接采用提取得到的目标实体,确定得到待输出数据中的数据类型的种类数。然后,上述执行主体可以采用种类数和具体的数据类型,对待输出数据进行数据项识别处理,从而识别得到待输出数据中所包括的多个数据项。
在一些可选的实现方式中,上述根据种类数及各种类的数据类型,对待输出数据进行数据项识别处理,识别得到待输出数据中所包括的多个数据项,可以通过如下第一种方式至第三种方式中的一种或多种方式实现。
第一种方式,若数据类型为图像类型,则将待输出数据的图像部分输入预先训练的图像内容识别模型,识别得到待输出数据中图像部分的各数据项。
其中,图像内容识别模型用于表征输入图像与输入图像中的数据项之间的对应关系。
实践中,上述图像内容识别模型可以是基于样本图像,利用机器学习方法,对初始模型(例如CNN、ResNet等)进行训练后得到的模型。在医学应用场景中,对图像内容识别模型进行训练的样本图像可以为医学影像,样本图像包含的对象所属类型为病灶,即机体上发生病变的部分。医学影像是指为了医疗或医学研究,以非侵入方式取得的内部组织,例如,胃部、腹部、心脏、膝盖、脑部的影像,比如,CT(Computed Tomography,电子计算机断层扫描)、MRI(Magnetic Resonance Imaging,磁共振成像)、US(ultrasonic,超声)、X光图像、脑电图以及光学摄影灯由医学仪器生成的图像。
这里,针对待输出数据中的数据类型为图像类型的数据部分,为了便于描述,这里记作图像部分,上述执行主体可以将图像部分输入预先训练的图像内容识别模型,以得到图像部分的各数据项。
第二种方式,若数据类型为文本类型,则将待输出数据的文本部分输入预先训练的文本内容识别模型,识别得到待输出数据中的文本部分的各数据项。
其中,文本内容识别模型用于表征输入文本与输入文本中的数据项之间的对应关系。
实践中,上述文本内容识别模型可以是基于样本文本,利用机器学习方法,对初始模型(例如CNN、ResNet等)进行训练后得到的模型。在医学应用场景中,对文本内容识别模型进行训练的样本文本可以为医疗文本,医疗文本可以是个人健康档案、处方、检查报告等一系列具备保存备查价值的电子化记录。
这里,针对待输出数据中的数据类型为文本类型的数据部分,为了便于描述,这里记作文本部分,上述执行主体可以将文本部分输入预先训练的文本内容识别模型,以得到文本部分的各数据项。
第三种方式,若数据类型为数据表类型,则提取待输出数据的数据表部分的各字段,以及将所提取的字段及字段对应的内容作为数据项。
这里,针对待输出数据中的数据类型为数据表类型的数据部分,为了便于描述,这里记作数据表部分,上述执行主体可以将数据表部分的字段及字段对应的数据内容作为数据项,从而得到数据表部分的各数据项。
需要指出的是,在待输出数据中的数据类型的种类数为一种时,整个待输出数据所包括的数据类型单一,如,只有图像类型,或者只有文本类型。具体地,在待输出数据中的数据类型的种类数为一种且为图像类型时,上述待输出数据的图像部分,即为待输出数据本身,此时,上述执行主体通常是直接将待输出数据输入预先训练的图像内容识别模型,识别得到待输出数据中的各数据项。
同理地,针对待输出数据中的数据类型的种类数为一种且为文本类型的情形,上述待输出数据的文本部分,即为待输出数据本身。以及针对待输出数据中的数据类型的种类数为一种且为数据表类型的情形,上述待输出数据的数据表部分,即为待输出数据本身。
另外,针对待输出数据中的数据类型的种类数为三种,且为图像类型、数据表类型和文本类型的情形,待输出数据中所包括的多个数据项包括图像部分的各数据项、文本部分的各数据项和数据表部分的各数据项。
本实施例可以实现对各种数据类型的待输出数据进行数据项识别,且在待输出数据中包括不同数据类型的数据部分时,可以针对每种数据类型的数据部分进行独立处理,以提取得到各数据部分的数据项,从而提取得到整个待输出数据中的数据项,实用性更高,有助于实现从待输出数据中更加全面准确地提取得到用户所需的数据项。
步骤104,根据预先设定的目标用户端的权限等级,从多个数据项中确定出敏感数据项,对待输出数据中的敏感数据项执行预设脱敏处理步骤,以及向目标用户端发送脱敏处理后的待输出数据。
其中,上述脱敏处理步骤,通常是用于对数据项进行脱敏处理的操作步骤。实践中,预设脱敏处理步骤可以用于对敏感数据项的状态进行调整,且所调整的状态可以包括但不限于以下至少一项:编辑状态、可见状态。
其中,上述敏感数据项通常是涉及到用户隐私的数据项。如,敏感数据项可以包括身份证号数据项、家庭住址数据项等。需要指出的是,同一待输出数据情形下,若查询者对应的权限等级不同,所得到的敏感数据项也不同。
这里,上述执行主体可以预先针对每个目标账户设置权限等级。其中,目标账户通常是已注册完成的账户。另外,还可以针对每种权限等级,预先设定该权限等级可见的一个或多个属性。这样,由于数据项包括数据和数据的属性,故,上述执行主体可以采用目标用户端对应的目标账户的权限等级,从提取得到的所有数据项中,确定出当前查询者不可见的数据项,该不可见的数据项,可以记作敏感数据项。之后,上述执行主体可以对敏感数据项执行脱敏处理步骤,如,可以将敏感数据项的可见状态设置为不可见的状态。最后,上述执行主体可以将脱敏处理后的待输出数据发送至目标用户端。
本实施例提供的方法,通过对用户所需访问的待输出数据的数据描述信息进行实体分析,得到待输出数据的数据类型,然后,基于数据类型,从待输出数据中识别得到多个数据项,之后,从所得到的多个数据项中确定出与权限等级适配的敏感数据项,以及对待输出数据中的敏感数据项进行脱敏处理后,输出脱敏处理后的待输出数据。在所请求的待输出数据相同时,可以实现针对不同用户权限的用户,输出不同的数据内容,可以防止数据泄露,有助于提高数据安全。
在本申请的各个实施例的可选的实现方式中,上述预设脱敏处理步骤,可以包括:
首先,根据预设关键词集,确定敏感数据项的隐私等级。
其中,预设关键词集中的预设关键词对应有隐私等级,隐私等级包括用于指示单个信息或多个信息的组合可确定用户身份的第一隐私等级和用于指示不可篡改的第二隐私等级。其中,单个信息可确定用户身份通常是指仅凭一个信息可以定位到个人,如,身份证号。多个信息的组合可确定用户身份是指多个信息的组合可以定位到个人,如,姓名+家庭住址。上述不可篡改通常是指对应信息不可篡改,如,疾病诊断结果信息不可篡改。
上述预设关键词集中的预设关键词通常是预先设定的关键词。如,可以为“家庭住址”、“身份证号”、“疾病诊断结果”等。
这里,针对每个敏感数据项,上述执行主体可以将该敏感数据项的属性与预设关键词集中的各预设关键词进行匹配运算,计算得到与该敏感数据项最匹配的预设关键词,以及将该最匹配的预设关键词对应的隐私等级,确定为该敏感数据项的隐私等级。
然后,若敏感数据项的隐私等级为第一隐私等级,则将敏感数据项的可见状态设置为不可见的状态。
这里,针对任一敏感数据项,若该敏感数据项的隐私等级为第一隐私等级,则上述执行主体可以将该敏感数据项的可见状态设置为不可见的状态。需要指出的是,在缺省情况下,各敏感数据项的可见状态为可见的状态。
可选地,上述将敏感数据项的可见状态设置为不可见的状态,可以包括:若待输出数据的数据类型为数据表类型和文本类型中的至少一种,则删除敏感数据项。若待输出数据的数据类型为图像类型,则采用目标图像遮挡敏感数据项。
其中,上述图标图像,可以是预先设定的图像。如,可以是马赛克图,也可以是笑脸图,还可以是大猩猩图等。
作为示例,若敏感数据项的隐私等级为第一隐私等级,且敏感数据项提取自待输出数据的数据表部分或者是文本部分,则可以删除待输出数据中的该敏感数据项。作为另一示例,若敏感数据项的隐私等级为第一隐私等级,且敏感数据项提取自待输出数据的图像部分,则可以将待输出数据中的该敏感数据项采用马赛克图像遮挡住。
这里,可以实现针对不同类型的数据项采用不同的方式将该数据项设置为不可见的状态。
最后,若敏感数据项的隐私等级为第二隐私等级,则将敏感数据项的编辑状态设置为不可编辑的状态。
这里,针对任一敏感数据项,若该敏感数据项的隐私等级为第二隐私等级,则上述执行主体可以将待输出数据中的、该敏感数据项的编辑状态设置为不可编辑的状态。
实践中,针对不同隐私等级的敏感数据项,可以实现采用合适的脱敏方式对各隐私等级的敏感数据项进行脱敏处理。有助于实现对各敏感数据项进行灵活准确脱敏。
在本申请的各个实施例的可选的实现方式中,根据预先设定的目标用户端的权限等级,从多个数据项中确定出敏感数据项,包括:
若权限等级对应有禁止访问的数据项类别组,则确定各数据项的数据项类别,以及从多个数据项中,选取对应数据项类别属于数据项类别组的数据项,记作敏感数据项,其中,数据项类别包括身份证号类别、家庭住址类别。
其中,上述数据项类别通常是用于描述数据项的类别的信息。如,可以是身份证类别,姓名类别等。
这里,针对每一个权限等级,可以设置有禁止访问的数据项类别组。举例来说,若待输出数据为医疗数据,可以给医生的账户分配权限等级为A级,A级可以访问完整数据,即,A级对应的禁止访问的数据项类别组为空,或者说没有禁止访问的数据项类别。另外,可以给采用医疗数据进行研发的技术人员分配权限等级为B级,B级对应的禁止访问的数据项类别组中可以包括身份证号数据项类别、家庭住址数据项类别等。
这里,上述执行主体可以首先针对提取得到的每个数据项,采用该数据项的属性确定该数据项的数据项类别。然后,从提取到的所有数据项中选取对应数据项类别属于目标用户端的权限等级对应的数据项类别组的数据项,选取得到的数据项,可以记作敏感数据项。
在本申请的各个实施例的可选的实现方式中,上述数据查询方法还可以包括:响应于满足预设权限分配条件,给目标用户端对应的账户分配权限等级。
其中,上述预设权限分配条件,通常是预先设定的、用于触发分配权限等级的条件。实践中,预设权限分配条件,可以包括但不限于以下至少一项:检测到目标用户端对应的账户注册完成,接收到目标用户端发送的权限变更请求,接收到预设管理终端发送的权限变更请求。
其中,上述权限变更请求通常是用于请求变更权限等级的信息。如,可以请求将权限等级从A级变更为B级。这里,在接收到目标终端发送的权限变更请求时,上述执行主体可以将目标账户对应的权限等级变更为与权限变更请求所请求的等级相符。
这里,上述执行主体可以在目标用户端对应的账户被注册成功时,给目标账户分配权限等级。也可以在接收到目标用户端发送的权限变更请求时,将目标账户对应的权限等级变更为与权限变更请求所请求的等级相符。还可以在接收到管理终端发送的权限变更请求时,将目标账户对应的权限等级变更为与权限变更请求所请求的等级相符。
需要指出的是,在满足预设权限分配条件时,给目标用户端对应的目标账户分配权限等级,可以实现针对不同权限等级的用户,输出不同的内容,可以提高数据安全。
请参阅图2,图2是本申请实施例提供的一种数据查询装置200的结构框图。本实施例中该数据查询装置包括的各单元用于执行图1对应的实施例中的各步骤。具体请参阅图1以及图1所对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图2,数据查询装置200包括:
信息获取单元201,用于获取数据请求信息,其中,数据请求信息用于请求待输出数据,且数据请求信息包括用于描述待输出数据的数据描述信息;
类型确定单元202,用于对数据描述信息进行实体提取,当所提取的实体中包括目标实体时,将预先设定的对应于目标实体的数据类型,确定为待输出数据的数据类型,其中,待输出数据的数据类型包括以下至少一种:图像类型、数据表类型、文本类型;
数据识别单元203,用于根据待输出数据的数据类型,对待输出数据进行数据项识别处理,识别得到待输出数据中所包括的多个数据项;
数据脱敏单元204,用于根据预先设定的目标用户端的权限等级,从多个数据项中确定出敏感数据项,对待输出数据中的敏感数据项执行预设脱敏处理步骤,以及向目标用户端发送脱敏处理后的待输出数据。
作为本申请一实施例,数据脱敏单元204中,预设脱敏处理步骤,包括:
根据预设关键词集,确定敏感数据项的隐私等级,其中,预设关键词集中的预设关键词对应有隐私等级,隐私等级包括用于指示单个信息或多个信息的组合可确定用户身份的第一隐私等级和用于指示不可篡改的第二隐私等级;
若敏感数据项的隐私等级为第一隐私等级,则将敏感数据项的可见状态设置为不可见的状态;
若敏感数据项的隐私等级为第二隐私等级,则将敏感数据项的编辑状态设置为不可编辑的状态。
作为本申请一实施例,上述将敏感数据项的可见状态设置为不可见的状态,包括:若待输出数据的数据类型为数据表类型和文本类型中的至少一种,则删除敏感数据项;若待输出数据的数据类型为图像类型,则采用目标图像遮挡敏感数据项。
作为本申请一实施例,数据识别单元203,具体用于:确定待输出数据中的数据类型的种类数,根据种类数及各种类的数据类型,对待输出数据进行数据项识别处理,识别得到待输出数据中所包括的多个数据项。
作为本申请一实施例,数据识别单元203,具体还用于:若种类数为一种,且为图像类型,则将待输出数据输入预先训练的图像内容识别模型,识别得到待输出数据中的各数据项;
其中,图像内容识别模型用于表征输入图像与输入图像中的数据项之间的对应关系。
作为本申请一实施例,数据识别单元203,具体还用于:若种类数为三种,且为图像类型、数据表类型和文本类型,则将待输出数据的图像部分输入预先训练的图像内容识别模型,识别得到待输出数据中图像部分的各数据项,将待输出数据的文本部分输入预先训练的文本内容识别模型,识别得到待输出数据中的文本部分的各数据项,以及提取待输出数据的数据表部分的各字段,将所提取的字段及字段对应的内容作为数据项;
其中,待输出数据中所包括的多个数据项包括图像部分的各数据项、文本部分的各数据项和数据表部分的各数据项。
作为本申请一实施例,数据脱敏单元204中,根据预先设定的目标用户端的权限等级,从多个数据项中确定出敏感数据项,包括:
若权限等级对应有禁止访问的数据项类别组,则确定各数据项的数据项类别,以及从多个数据项中,选取对应数据项类别属于数据项类别组的数据项,记作敏感数据项,其中,数据项类别包括身份证号类别、家庭住址类别。
本实施例提供的装置,通过对用户所需访问的待输出数据的数据描述信息进行实体分析,得到待输出数据的数据类型,然后,基于数据类型,从待输出数据中识别得到多个数据项,之后,从所得到的多个数据项中确定出与权限等级适配的敏感数据项,以及对待输出数据中的敏感数据项进行脱敏处理后,输出脱敏处理后的待输出数据。在所请求的待输出数据相同时,可以实现针对不同用户权限的用户,输出不同的数据内容,可以防止数据泄露,有助于提高数据安全。
应当理解的是,图2示出的数据查询装置的结构框图中,各单元用于执行图1对应的实施例中的各步骤,而对于图1对应的实施例中的各步骤已在上述实施例中进行详细解释,具体请参阅图1以及图1所对应的实施例中的相关描述,此处不再赘述。
图3是本申请另一实施例提供的一种服务器的结构框图。如图3所示,该实施例的服务器300包括:处理器301、存储器302以及存储在存储器302中并可在处理器301上运行的计算机程序303,例如数据查询方法的程序。处理器301执行计算机程序303时实现上述各个数据查询方法各实施例中的步骤,例如图1所示的步骤101至步骤104。或者,处理器301执行计算机程序303时实现上述图2对应的实施例中各单元的功能,例如,图2所示的单元201至204的功能,具体请参阅图2对应的实施例中的相关描述,此处不赘述。
示例性的,计算机程序303可以被分割成一个或多个单元,一个或者多个单元被存储在存储器302中,并由处理器301执行,以完成本申请。一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序303在服务器300中的执行过程。例如,计算机程序303可以被分割成信息获取单元,类型确定单元,数据识别单元,数据脱敏单元,各单元具体功能如上。
服务器可以包括,但不仅限于,处理器301、存储器302。本领域技术人员可以理解,图3仅仅是服务器300的示例,并不构成对服务器300的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如转台设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器301可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器302可以是服务器300的内部存储单元,例如服务器300的硬盘或内存。存储器302也可以是服务器300的外部存储设备,例如服务器300上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器302还可以既包括服务器300的内部存储单元也包括外部存储设备。存储器302用于存储计算机程序以及转台设备所需的其他程序和数据。存储器302还可以用于暂时地存储已经输出或者将要输出的数据。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。其中,计算机可读存储介质可以是非易失性的,也可以是易失性的。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读存储介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读存储介质不包括电载波信号和电信信号。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种数据查询方法,其特征在于,所述方法包括:
获取数据请求信息,其中,所述数据请求信息用于请求待输出数据,且所述数据请求信息包括用于描述所述待输出数据的数据描述信息;
对所述数据描述信息进行实体提取,当所提取的实体中包括目标实体时,将预先设定的对应于所述目标实体的数据类型,确定为所述待输出数据的数据类型,其中,所述待输出数据的数据类型包括以下至少一种:图像类型、数据表类型、文本类型;
根据所述待输出数据的数据类型,对所述待输出数据进行数据项识别处理,识别得到所述待输出数据中所包括的多个数据项;
根据预先设定的目标用户端的权限等级,从所述多个数据项中确定出敏感数据项,对所述待输出数据中的所述敏感数据项执行预设脱敏处理步骤,以及向所述目标用户端发送脱敏处理后的待输出数据。
2.根据权利要求1所述的数据查询方法,其特征在于,所述预设脱敏处理步骤,包括:
根据预设关键词集,确定所述敏感数据项的隐私等级,其中,所述预设关键词集中的预设关键词对应有隐私等级,所述隐私等级包括用于指示单个信息或多个信息的组合可确定用户身份的第一隐私等级和用于指示不可篡改的第二隐私等级;
若所述敏感数据项的隐私等级为第一隐私等级,则将所述敏感数据项的可见状态设置为不可见的状态;
若所述敏感数据项的隐私等级为第二隐私等级,则将所述敏感数据项的编辑状态设置为不可编辑的状态。
3.根据权利要求2所述的数据查询方法,其特征在于,所述将所述敏感数据项的可见状态设置为不可见的状态,包括:
若所述待输出数据的数据类型为数据表类型和文本类型中的至少一种,则删除所述敏感数据项;
若所述待输出数据的数据类型为图像类型,则采用目标图像遮挡所述敏感数据项。
4.根据权利要求1所述的数据查询方法,其特征在于,所述根据所述待输出数据的数据类型,对所述待输出数据进行数据项识别处理,识别得到所述待输出数据中所包括的多个数据项,包括:
确定所述待输出数据中的数据类型的种类数,根据所述种类数及各种类的数据类型,对所述待输出数据进行数据项识别处理,识别得到所述待输出数据中所包括的多个数据项。
5.根据权利要求4所述的数据查询方法,其特征在于,所述根据所述种类数及各种类的数据类型,对所述待输出数据进行数据项识别处理,识别得到所述待输出数据中所包括的多个数据项,包括:
若所述种类数为一种,且为图像类型,则将所述待输出数据输入预先训练的图像内容识别模型,识别得到所述待输出数据中的各数据项;
其中,所述图像内容识别模型用于表征输入图像与输入图像中的数据项之间的对应关系。
6.根据权利要求4所述的数据查询方法,其特征在于,所述根据所述种类数及各种类的数据类型,对所述待输出数据进行数据项识别处理,识别得到所述待输出数据中所包括的多个数据项,包括:
若所述种类数为三种,且为图像类型、数据表类型和文本类型,则将所述待输出数据的图像部分输入预先训练的图像内容识别模型,识别得到所述待输出数据中图像部分的各数据项,将所述待输出数据的文本部分输入预先训练的文本内容识别模型,识别得到所述待输出数据中的文本部分的各数据项,以及提取所述待输出数据的数据表部分的各字段,将所提取的字段及字段对应的内容作为数据项;
其中,所述待输出数据中所包括的多个数据项包括图像部分的各数据项、文本部分的各数据项和数据表部分的各数据项。
7.根据权利要求1-6中任一项所述的数据查询方法,其特征在于,所述根据预先设定的目标用户端的权限等级,从所述多个数据项中确定出敏感数据项,包括:
若所述权限等级对应有禁止访问的数据项类别组,则确定各数据项的数据项类别,以及从所述多个数据项中,选取对应数据项类别属于所述数据项类别组的数据项,记作敏感数据项,其中,数据项类别包括身份证号类别、家庭住址类别。
8.一种数据查询装置,其特征在于,所述装置包括:
信息获取单元,用于获取数据请求信息,其中,所述数据请求信息用于请求待输出数据,且所述数据请求信息包括用于描述所述待输出数据的数据描述信息;
类型确定单元,用于对所述数据描述信息进行实体提取,当所提取的实体中包括目标实体时,将预先设定的对应于所述目标实体的数据类型,确定为所述待输出数据的数据类型,其中,所述待输出数据的数据类型包括以下至少一种:图像类型、数据表类型、文本类型;
数据识别单元,用于根据所述待输出数据的数据类型,对所述待输出数据进行数据项识别处理,识别得到所述待输出数据中所包括的多个数据项;
数据脱敏单元,用于根据预先设定的目标用户端的权限等级,从所述多个数据项中确定出敏感数据项,对所述待输出数据中的所述敏感数据项执行预设脱敏处理步骤,以及向所述目标用户端发送脱敏处理后的待输出数据。
9.一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。
CN202111256883.9A 2021-10-27 2021-10-27 数据查询方法、装置、服务器及存储介质 Pending CN113961609A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111256883.9A CN113961609A (zh) 2021-10-27 2021-10-27 数据查询方法、装置、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111256883.9A CN113961609A (zh) 2021-10-27 2021-10-27 数据查询方法、装置、服务器及存储介质

Publications (1)

Publication Number Publication Date
CN113961609A true CN113961609A (zh) 2022-01-21

Family

ID=79467622

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111256883.9A Pending CN113961609A (zh) 2021-10-27 2021-10-27 数据查询方法、装置、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN113961609A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116070196A (zh) * 2023-03-28 2023-05-05 苏州阿基米德网络科技有限公司 一种医疗系统的访问权限分配方法、系统及电子设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116070196A (zh) * 2023-03-28 2023-05-05 苏州阿基米德网络科技有限公司 一种医疗系统的访问权限分配方法、系统及电子设备

Similar Documents

Publication Publication Date Title
Rotemberg et al. A patient-centric dataset of images and metadata for identifying melanomas using clinical context
US20190122753A1 (en) Method, apparatus and system for rendering and displaying medical images
US20190043611A1 (en) Anonymizing data
KR102113806B1 (ko) 개인의료정보데이터 관리방법 및 시스템
CN102612696A (zh) 具有报告验证器和报告增强器的医学信息系统
US20190236310A1 (en) Self-contained system for de-identifying unstructured data in healthcare records
CN109448811B (zh) 处方审核改进方法、装置、电子设备及存储介质
US20110125646A1 (en) Methods and systems for managing personal health records by individuals
US11562810B2 (en) Electronic data document for use in clinical trial verification system and method
CN117238458A (zh) 基于云计算的重症护理跨机构协同平台系统
CN114003929A (zh) 数据处理方法、装置、服务器及存储介质
KR102000745B1 (ko) 개인의료정보데이터 관리방법 및 시스템
CN109817297B (zh) 医疗报告的生成方法、装置、计算机设备及计算机存储介质
CN113961609A (zh) 数据查询方法、装置、服务器及存储介质
US11164309B2 (en) Image analysis and annotation
US20210398633A1 (en) Systems and methods for transacting prescriptions using a mobile device
KR20180131888A (ko) 웹기반으로 임상시험 의료영상을 관리하는 시스템, 방법 및 프로그램
CN113870973A (zh) 基于人工智能的信息输出方法、装置、计算机设备及介质
US10623380B1 (en) Secure transfer of medical records to third-party applications
Savoska et al. Integration of heterogeneous medical and biological data with electronic personal health records
KR102510599B1 (ko) 익명화된 의료정보에 대한 2차적 의학 소견의 생성 및 관리를 위한 클라우드 컴퓨팅 환경기반 네트워크 서비스 시스템 및 방법
US20240119175A1 (en) Machine learning for data anonymization
US10521552B2 (en) Method and computing device for implementing multiple matching strategies
CN116451087B (zh) 性格匹配方法、装置、终端及存储介质
CN117874144B (zh) 基于区块链的医疗数据共享方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20221008

Address after: Room 2601 (Unit 07), Qianhai Free Trade Building, No. 3048, Xinghai Avenue, Nanshan Street, Qianhai Shenzhen-Hong Kong Cooperation Zone, Shenzhen, Guangdong 518000

Applicant after: Shenzhen Ping An Smart Healthcare Technology Co.,Ltd.

Address before: 1-34 / F, Qianhai free trade building, 3048 Xinghai Avenue, Mawan, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong 518000

Applicant before: Ping An International Smart City Technology Co.,Ltd.

TA01 Transfer of patent application right