CN117436132B - 一种融合区块链技术与人工智能的数据隐私保护方法 - Google Patents

一种融合区块链技术与人工智能的数据隐私保护方法 Download PDF

Info

Publication number
CN117436132B
CN117436132B CN202311765926.5A CN202311765926A CN117436132B CN 117436132 B CN117436132 B CN 117436132B CN 202311765926 A CN202311765926 A CN 202311765926A CN 117436132 B CN117436132 B CN 117436132B
Authority
CN
China
Prior art keywords
data
word
patient
key
access
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311765926.5A
Other languages
English (en)
Other versions
CN117436132A (zh
Inventor
魏文斌
魏良峰
廖俞华
许毅忠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujian Kexing Thai Data Technology Co ltd
Original Assignee
Fujian Kexing Thai Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujian Kexing Thai Data Technology Co ltd filed Critical Fujian Kexing Thai Data Technology Co ltd
Priority to CN202311765926.5A priority Critical patent/CN117436132B/zh
Publication of CN117436132A publication Critical patent/CN117436132A/zh
Application granted granted Critical
Publication of CN117436132B publication Critical patent/CN117436132B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/766Arrangements for image or video recognition or understanding using pattern recognition or machine learning using regression, e.g. by projecting features on hyperplanes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computer Security & Cryptography (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Bioethics (AREA)
  • Biophysics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及一种融合区块链技术与人工智能的数据隐私保护方法,步骤S1:基于区块链技术构建医疗检验区块链,并构建数据接入系统,将实时的检验数据与区块链进行集成;步骤S2获取病人的医疗检验单的图像数据,并基于多模态信息抽取模型进行特征提取;步骤S3:数据接入系统将提取的多模态特征K作为密钥对检验结果数据加密;步骤S4:将加密后检验结果数据存储于区块链中对应的病人节点;步骤S5:需要访问和解密数据时,需要获得相应的权限和密钥才能访问和解密数据;步骤S6:使用密钥来解密数据,并进行访问和管理数据,在智能合约中记录数据的访问和操作记录。本发明可以有效保护数据隐私,确保数据的完整性和可信度,实现安全的数据共享和访问控制。

Description

一种融合区块链技术与人工智能的数据隐私保护方法
技术领域
本发明涉及区块链技术领域,尤其涉及一种融合区块链技术与人工智能的数据隐私保护方法。
背景技术
医疗保健信息技术的应用已经在各个领域取得了显著进展。传统的医疗检验数据处理方式受限于传统的纸质记录和手工操作,存在着数据获取和共享困难、信息交流低效等问题。为了克服这些问题,基于互联网的医疗检验数据处理方法及系统应运而生,利用互联网和医疗保健信息技术的优势,将医疗检验数据数字化、网络化,并应用于数据处理和信息管理。它可以实现医疗数据的快速获取、准确存储和便捷共享,为医生、患者和研究人员提供更高效、更全面的医疗信息支持。
发明内容
为了解决上述问题,本发明的目的在于提供一种融合区块链技术与人工智能的数据隐私保护方法,将检验单多模态数据作为密钥对病人检测结果数据进行加密,并存储于区块链,可以有效保护数据隐私,确保数据的完整性和可信度,实现安全的数据共享和访问控制,同时防止数据丢失,为医疗健康领域的数据管理和安全性提供了新的解决方案。
为实现上述目的,本发明采用以下技术方案:
一种融合区块链技术与人工智能的数据隐私保护方法,包括以下步骤:
步骤S1:基于区块链技术构建医疗检验区块链,并构建数据接入系统,将实时的检验数据与区块链进行集成;
步骤S2获取病人的医疗检验单的图像数据,并基于多模态信息抽取模型进行特征提取,得到多模态特征K;
步骤S3:数据接入系统将提取的多模态特征K作为密钥对检验结果数据加密,并通过权威机构管理密钥和访问权限;
权威机构生成SM9公私钥对;
将多模态特征K作为密钥对检验结果进行AES加密;
选择一个随机数r,并使用SM9公钥生成临时公钥/>
计算密文C,其中,其中G是SM9椭圆曲线的生成点,H是哈希函数,/>表示异或操作;
将加密后的密钥K存储于权威机构;
步骤S4:将加密后检验结果数据存储于区块链中对应的病人节点;
步骤S5:当病人或授权的医疗机构需要访问和解密数据时,需要获得相应的权限和密钥才能访问和解密数据,病人通过身份验证流程获得访问自己数据的权限和密钥,而医疗机构通过权威机构的授权流程获得访问特定病人数据的权限和密钥;
步骤S6:病人或医疗机构使用密钥来解密数据,并进行访问和管理数据,在智能合约中记录数据的访问和操作记录。
进一步的,所述步骤S1具体为:定义检验数据的数据结构,包括病人名称、身份证号、检测项目、检测结果、检测时间字段;定义一个区块链上的智能合约,用于存储和管理检验数据;智能合约会将每次上传的数据以交易的形式存储到区块链上,并确保数据的不可篡改性和透明性;数据接入系统,将实时的检验数据与区块链上对应病人的节点进行集成。
进一步的,所述步骤S2具体为:
基于OCR技术获取医疗检验单中的文本数据,并对医疗检验单中的文本数据进行预处理,得到了一个由词语组成的序列:[ w1, w2, w3, ..., wn ],其中w1, w2, w3,..., wn表示各个词语;
使用词嵌入模型将每个词语映射为一个高维实数向量:[ v1, v2, v3, ..., vn ],其中 v1, v2, v3, ..., vn表示对应词语映射的高维实数向量;
使用循环神经网络长短时记忆网络模型对词向量序列进行建模,以捕捉词语之间的语义关系和上下文信息,得到了文本特征表示h ;
使用全局池化操作,对输出的文本特征表示h进行处理,得到最终的文本特征表示h’;
基于Faster-RCNN构建图像特征提取模型,将图像送入图像特征提取模型,引入自适应池化层将输出转换为宽度W和高度H固定的特征图,将特征图展平为视觉序列V,并将视觉序列V作为一个视觉标记,使用线性层将每个视觉标记投影到与文本嵌入相同的维度,得到最终的图像特征表示T;
采用拼接的方式将文本特征和图像特征进行融合,得到整合的多模态特征表示:K= [h’, T] 。
进一步的,所述预处理包括分词、去除停用词和词干化,具体如下:首先对基于OCR技术获取医疗检验单中的文本数据进行分词,将其拆分成词语的序列;然后去除停用词,将词语转化为其词干或原型,得到了一个由词语组成的序列:[ w1, w2, w3, ..., wn ]。
进一步的,所述使用词嵌入模型将每个词语映射为一个高维实数向量,具体如下:对于其中的每个词语w,使用Skip-gram模型计算其词嵌入向量,Skip-gram模型的目标是最大化每个词语与其上下文词语的条件概率,即对于一个中心词w和它的上下文词语c,最大化条件概率:
其中: 表示词语w的词嵌入向量; />表示上下文词语c的词嵌入向量,V 是词汇表中所有词语的集合;
损失函数:
其中:L 是词语序列的长度,c 是上下文窗口的大小,l表示第l个中心词编号,为给定的第l个中心词,/>为/>对应的上下文词;
最终,通过反向传播算法来训练Skip-gram模型,得到每个词语的词嵌入向量。
进一步的,所述图像特征提取模型包括一个卷积神经网络用于提取图像特征,并且还包括一个区域候选网络RPN和一个用于目标检测的分类和回归网络,用来检测和提取图像中的物体和区域;
在得到图像特征后,引入自适应池化层,将不同大小的特征图转换为宽度为W和高度为H的固定大小的特征图;
将自适应池化层得到的特征图展平为一个视觉序列V,这个序列V包含了图像中的特征信息,并将视觉序列V作为一个视觉标记;
使用一个线性层将每个视觉标记投影到与文本嵌入相同的维度,最终得到的图像特征表示T就是经过线性层处理后的结果。
进一步的,所述步骤S5具体为:
病人访问自己的数据:
病人登录医疗数据管理系统,并进行身份验证,使用生物特征识别或双因素身份验证来确认身份;
一旦身份验证成功,系统将向病人分发一个访问自己数据的权限令牌,同时向权威机构发送请求以获取加密后的密钥 K,权威机构验证病人的身份,确认其有权访问自己的数据,并向系统返回相应的私钥SKA
病人使用获得的权限令牌、私钥SKA 来访问和解密自己的检验结果数据;
医疗机构访问特定病人数据:
医疗机构向权威机构提交访问特定病人数据的请求,同时提供相应的授权证明和身份验证信息,权威机构审查请求,确认医疗机构有权访问特定病人的数据,并向其分发相应的访问权限令牌、私钥SKA
医疗机构使用获得的权限令牌、私钥SKA 来访问和解密特定病人的检验结果数据。
进一步的,所述解密过程,具体如下:
基于权威机构获取的私钥SKA进行解密,根据密文C中的和/>,使用私钥SKA计算出临时公钥/>
解密得到密钥K,使用解密得到的密钥K对加密的数据进行解密,得到检验结果数据。
本发明具有如下有益效果:
1、本发明将检验单多模态数据作为密钥对病人检测结果数据进行加密,并存储于区块链,可以有效保护数据隐私,确保数据的完整性和可信度,实现安全的数据共享和访问控制,同时防止数据丢失,为医疗健康领域的数据管理和安全性提供了新的解决方案;
2、本发明使用多模态数据作为密钥进行加密,由于多模态数据通常包含了丰富的信息,将其作为密钥可以增加加密的复杂度,使得破解变得更加困难,从而有效保护病人的个人隐私和敏感数据。
附图说明
图1为本发明方法流程图。
具体实施方式
以下结合附图和具体实施例对本发明做进一步详细说明:
参考图1,在本实施例中,提供一种融合区块链技术与人工智能的数据隐私保护方法,包括以下步骤:
步骤S1:基于区块链技术构建医疗检验区块链,并构建数据接入系统,将实时的检验数据与区块链进行集成;
步骤S2获取病人的医疗检验单的图像数据,并基于多模态信息抽取模型进行特征提取,得到多模态特征K;
步骤S3:数据接入系统将提取的多模态特征K作为密钥对检验结果数据加密,并通过权威机构管理密钥和访问权限;
权威机构生成SM9公私钥对;
将多模态特征K作为密钥对检验结果进行AES加密;
选择一个随机数r,并使用SM9公钥生成临时公钥/>
计算密文C,其中,其中G是SM9椭圆曲线的生成点,H是哈希函数,/>表示异或操作;
将加密后的密钥K存储于权威机构;
步骤S4:将加密后检验结果数据存储于区块链中对应的病人节点;
步骤S5:当病人或授权的医疗机构需要访问和解密数据时,需要获得相应的权限和密钥才能访问和解密数据,病人通过身份验证流程获得访问自己数据的权限和密钥,而医疗机构通过权威机构的授权流程获得访问特定病人数据的权限和密钥;
步骤S6:病人或医疗机构使用密钥来解密数据,并进行访问和管理数据,在智能合约中记录数据的访问和操作记录。
在本实施例中,步骤S1具体为:定义检验数据的数据结构,包括病人名称、身份证号、检测项目、检测结果、检测时间字段;定义一个区块链上的智能合约,用于存储和管理检验数据;智能合约会将每次上传的数据以交易的形式存储到区块链上,并确保数据的不可篡改性和透明性;数据接入系统,将实时的检验数据与区块链上对应病人的节点进行集成。
优选的,在本实施例中,通过智能合约管理哪些用户或实体有权访问和管理病人的数据,通过以下方式实现:
定义角色:可以定义不同的角色,例如病人、医生、医疗机构管理员等。每个角色可以拥有不同的权限和访问级别。
定义权限:可以为每个角色定义相应的权限,例如读取、写入、更新、删除等。根据具体的业务需求和安全要求来定义权限。
定义访问控制:在智能合约中,可以定义访问控制规则,以确保只有授权的用户或实体才能访问和管理病人的数据,定义只有医生和医疗机构管理员才能访问和管理病人的数据,而病人本人只能读取自己的数据。
在本实施例中,步骤S2具体为:
基于OCR技术获取医疗检验单中的文本数据,并对医疗检验单中的文本数据进行预处理,得到了一个由词语组成的序列:[ w1, w2, w3, ..., wn ],其中w1, w2, w3,..., wn表示各个词语;
使用词嵌入模型将每个词语映射为一个高维实数向量:[ v1, v2, v3, ..., vn ],其中 v1, v2, v3, ..., vn表示对应词语映射的高维实数向量;
使用循环神经网络长短时记忆网络模型对词向量序列进行建模,以捕捉词语之间的语义关系和上下文信息,得到了文本特征表示h ;
使用全局池化操作,对输出的文本特征表示h进行处理,得到最终的文本特征表示h’;
基于Faster-RCNN构建图像特征提取模型,将图像送入图像特征提取模型,引入自适应池化层将输出转换为宽度W和高度H固定的特征图,将特征图展平为视觉序列V,并将视觉序列V作为一个视觉标记,使用线性层将每个视觉标记投影到与文本嵌入相同的维度,得到最终的图像特征表示T;
采用拼接的方式将文本特征和图像特征进行融合,得到整合的多模态特征表示:K= [h’, T] 。
在本实施例中,预处理包括分词、去除停用词和词干化,具体如下:首先对基于OCR技术获取医疗检验单中的文本数据进行分词,将其拆分成词语的序列;然后去除停用词,将词语转化为其词干或原型,得到了一个由词语组成的序列:[ w1, w2, w3, ..., wn ]。以下是一个具体的实例:
设我们有以下医疗检验单文本数据:
"患者姓名:张三
年龄:45岁
化验项目:血常规
白细胞计数:6.8
红细胞计数:4.5
血红蛋白:140
……(其他文本内容)"
首先,对文本数据进行分词,将其拆分成词语的序列。在这个例子中,我们可以将文本数据分词为以下词语序列:
["患者", "姓名", "张三", "年龄", "45岁", "化验", "项目", "血常规", "白细胞", "计数", "6.8", "红细胞", "计数", "4.5", "血红蛋白", "140", "其他", "文本", "内容"、"是"、"的"、"在"]
去除一些常见的停用词例如“的”、“是”、“在”等。得到如下词语序列:
["患者", "姓名", "张三", "年龄", "45岁", "化验", "项目", "血常规", "白细胞", "计数", "6.8", "红细胞", "计数", "4.5", "血红蛋白", "140", "文本", "内容"]
然后对词语进行词干化处理,将词语转化为其词干或原型的过程,以减少词语的变体对文本特征表示的影响,得到如下词语序列:
["患者", "姓名", "张三", "年龄", "45岁", "化验", "项目", "血常规", "白细胞", "计数", "6.8", "红细胞", "计数", "4.5", "血红蛋白", "140"]。
在本实施例中,使用词嵌入模型将每个词语映射为一个高维实数向量,具体如下:对于其中的每个词语w,使用Skip-gram模型计算其词嵌入向量,Skip-gram模型的目标是最大化每个词语与其上下文词语的条件概率,即对于一个中心词w和它的上下文词语c,最大化条件概率:
其中: 表示词语w的词嵌入向量; />表示上下文词语c的词嵌入向量,V 是词汇表中所有词语的集合;
损失函数:
其中:L 是词语序列的长度,c 是上下文窗口的大小,l表示第l个中心词编号,为给定的第l个中心词,/>为/>对应的上下文词;
最终,通过反向传播算法来训练Skip-gram模型,得到每个词语的词嵌入向量。
在本实施例中,图像特征提取模型包括一个卷积神经网络用于提取图像特征,并且还包括一个区域候选网络RPN和一个用于目标检测的分类和回归网络,用来检测和提取图像中的物体和区域;
在得到图像特征后,引入自适应池化层,将不同大小的特征图转换为宽度为W和高度为H的固定大小的特征图;
将自适应池化层得到的特征图展平为一个视觉序列V,这个序列V包含了图像中的特征信息,并将视觉序列V作为一个视觉标记;
使用一个线性层将每个视觉标记投影到与文本嵌入相同的维度,最终得到的图像特征表示T就是经过线性层处理后的结果。
在本实施例中,步骤S5具体为:
病人访问自己的数据:
病人登录医疗数据管理系统,并进行身份验证,使用生物特征识别或双因素身份验证来确认身份;
一旦身份验证成功,系统将向病人分发一个访问自己数据的权限令牌,同时向权威机构发送请求以获取加密后的密钥 K,权威机构验证病人的身份,确认其有权访问自己的数据,并向系统返回相应的私钥SKA
病人使用获得的权限令牌、私钥SKA 来访问和解密自己的检验结果数据;
医疗机构访问特定病人数据:
医疗机构向权威机构提交访问特定病人数据的请求,同时提供相应的授权证明和身份验证信息,权威机构审查请求,确认医疗机构有权访问特定病人的数据,并向其分发相应的访问权限令牌、私钥SKA
医疗机构使用获得的权限令牌、私钥SKA 来访问和解密特定病人的检验结果数据。
在本实施例中,解密过程,具体如下:
基于权威机构获取的私钥SKA进行解密,根据密文C中的和/>,使用私钥SKA计算出临时公钥/>
解密得到密钥K,使用解密得到的密钥K对加密的数据进行解密,得到检验结果数据。
在本实施例中,步骤S6具体为:
在智能合约中,编写逻辑来记录数据的访问和操作,当病人或医疗机构访问数据时,智能合约会记录下访问者的身份、访问时间、访问的数据内容等信息。同样地,当病人或医疗机构对数据进行操作时(如修改、删除等),智能合约也会记录下操作者的身份、操作时间、操作类型、操作的数据内容等信息。
区块链存储:记录的数据访问和操作记录可以被写入区块链中,确保其不可篡改性和透明性。每一次记录都将成为区块链上的一个区块,连接成一个不断增长的链条,确保记录的永久保存。区块链上的记录可以被所有参与者查看,从而确保数据访问和操作的透明和合规性。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作其它形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例。但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。

Claims (5)

1.一种融合区块链技术与人工智能的数据隐私保护方法,其特征在于,包括以下步骤:
步骤S1:基于区块链技术构建医疗检验区块链,并构建数据接入系统,将实时的检验数据与区块链进行集成;
步骤S2获取病人的医疗检验单的图像数据,并基于多模态信息抽取模型进行特征提取,得到多模态特征K;
步骤S3:数据接入系统将提取的多模态特征K作为密钥对检验结果数据加密,并通过权威机构管理密钥和访问权限;
权威机构生成SM9公私钥对;
将多模态特征K作为密钥对检验结果进行AES加密;
选择一个随机数r,并使用SM9公钥生成临时公钥/>
计算密文C,其中,其中G是SM9椭圆曲线的生成点,H是哈希函数,/>表示异或操作;
将加密后的密钥K存储于权威机构;
步骤S4:将加密后检验结果数据存储于区块链中对应的病人节点;
步骤S5:当病人或授权的医疗机构需要访问和解密数据时,需要获得相应的权限和密钥才能访问和解密数据,病人通过身份验证流程获得访问自己数据的权限和密钥,而医疗机构通过权威机构的授权流程获得访问特定病人数据的权限和密钥;
步骤S6:病人或医疗机构使用密钥来解密数据,并进行访问和管理数据,在智能合约中记录数据的访问和操作记录;
所述步骤S1具体为:定义检验数据的数据结构,包括病人名称、身份证号、检测项目、检测结果和检测时间字段;定义一个区块链上的智能合约,用于存储和管理检验数据;智能合约会将每次上传的数据以交易的形式存储到区块链上,并确保数据的不可篡改性和透明性;数据接入系统,将实时的检验数据与区块链上对应病人的节点进行集成;
所述步骤S2具体为:
基于OCR技术获取医疗检验单中的文本数据,并对医疗检验单中的文本数据进行预处理,得到了一个由词语组成的序列:[ w1, w2, w3, ..., wn ],其中w1, w2, w3, ..., wn表示各个词语;
使用词嵌入模型将每个词语映射为一个高维实数向量:[ v1, v2, v3, ..., vn ],其中 v1, v2, v3, ..., vn表示对应词语映射的高维实数向量;
使用循环神经网络长短时记忆网络模型对词向量序列进行建模,以捕捉词语之间的语义关系和上下文信息,得到了文本特征表示h ;
使用全局池化操作,对输出的文本特征表示h进行处理,得到最终的文本特征表示h’;
基于Faster-RCNN构建图像特征提取模型,将图像送入图像特征提取模型,引入自适应池化层将输出转换为宽度W和高度H固定的特征图,将特征图展平为视觉序列V,并将视觉序列V作为一个视觉标记,使用线性层将每个视觉标记投影到与文本嵌入相同的维度,得到最终的图像特征表示T;
采用拼接的方式将文本特征和图像特征进行融合,得到整合的多模态特征表示:K =[h’, T] ;
所述使用词嵌入模型将每个词语映射为一个高维实数向量,具体如下:对于其中的每个词语w,使用Skip-gram模型计算其词嵌入向量,Skip-gram模型的目标是最大化每个词语与其上下文词语的条件概率,即对于一个中心词w和它的上下文词语c,最大化条件概率:
其中: 表示词语w的词嵌入向量 ;/>表示上下文词语c的词嵌入向量,V 是词汇表中所有词语的集合;
损失函数:
其中:L 是词语序列的长度,ck是上下文窗口的大小,l表示第l个中心词编号,为给定的第l个中心词,/>为/>对应的上下文词;
最终,通过反向传播算法来训练Skip-gram模型,得到每个词语的词嵌入向量。
2.根据权利要求1所述的一种融合区块链技术与人工智能的数据隐私保护方法,其特征在于,所述预处理包括分词、去除停用词和词干化,具体如下:首先对基于OCR技术获取医疗检验单中的文本数据进行分词,将其拆分成词语的序列;然后去除停用词,将词语转化为其词干或原型,得到了一个由词语组成的序列:[ w1, w2, w3, ..., wn ]。
3.根据权利要求1所述的一种融合区块链技术与人工智能的数据隐私保护方法,其特征在于,所述图像特征提取模型包括一个卷积神经网络用于提取图像特征,并且还包括一个区域候选网络RPN和一个用于目标检测的分类和回归网络,用来检测和提取图像中的物体和区域;
在得到图像特征后,引入自适应池化层,将不同大小的特征图转换为宽度为W和高度为H的固定大小的特征图;
将自适应池化层得到的特征图展平为一个视觉序列V,这个序列V包含了图像中的特征信息,并将视觉序列V作为一个视觉标记;
使用一个线性层将每个视觉标记投影到与文本嵌入相同的维度,最终得到的图像特征表示T就是经过线性层处理后的结果。
4.根据权利要求1所述的一种融合区块链技术与人工智能的数据隐私保护方法,其特征在于,所述步骤S5具体为:
病人访问自己的数据:
病人登录医疗数据管理系统,并进行身份验证,使用生物特征识别或双因素身份验证来确认身份;
一旦身份验证成功,系统将向病人分发一个访问自己数据的权限令牌,同时向权威机构发送请求以获取加密后的密钥 K,权威机构验证病人的身份,确认其有权访问自己的数据,并向系统返回相应的私钥SKA
病人使用获得的权限令牌、私钥SKA 来访问和解密自己的检验结果数据;
医疗机构访问特定病人数据:
医疗机构向权威机构提交访问特定病人数据的请求,同时提供相应的授权证明和身份验证信息,权威机构审查请求,确认医疗机构有权访问特定病人的数据,并向其分发相应的访问权限令牌、私钥SKA
医疗机构使用获得的权限令牌、私钥SKA 来访问和解密特定病人的检验结果数据。
5.根据权利要求4所述的一种融合区块链技术与人工智能的数据隐私保护方法,其特征在于,所述解密过程,具体如下:
基于权威机构获取的私钥SKA进行解密,根据密文C中的和/>,使用私钥SKA计算出临时公钥/>
解密得到密钥K,使用解密得到的密钥K对加密的数据进行解密,得到检验结果数据。
CN202311765926.5A 2023-12-21 2023-12-21 一种融合区块链技术与人工智能的数据隐私保护方法 Active CN117436132B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311765926.5A CN117436132B (zh) 2023-12-21 2023-12-21 一种融合区块链技术与人工智能的数据隐私保护方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311765926.5A CN117436132B (zh) 2023-12-21 2023-12-21 一种融合区块链技术与人工智能的数据隐私保护方法

Publications (2)

Publication Number Publication Date
CN117436132A CN117436132A (zh) 2024-01-23
CN117436132B true CN117436132B (zh) 2024-03-05

Family

ID=89555724

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311765926.5A Active CN117436132B (zh) 2023-12-21 2023-12-21 一种融合区块链技术与人工智能的数据隐私保护方法

Country Status (1)

Country Link
CN (1) CN117436132B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU753707B2 (en) * 1998-09-09 2002-10-24 Yeong Kuang Oon Automation oriented healthcare delivery system based on medical scripting language
CN109741803A (zh) * 2019-01-14 2019-05-10 南京大学 基于区块链的医疗数据安全协作系统
CN113242137A (zh) * 2021-07-12 2021-08-10 广州天鹏计算机科技有限公司 一种电子病历数据处理方法和系统
CN113409928A (zh) * 2021-06-29 2021-09-17 中国人民解放军总医院第一医学中心 一种医疗信息共享系统
CN113536359A (zh) * 2021-08-06 2021-10-22 东北大学 基于区块链的个人健康记录隐私保护和访问系统及方法
CN116779084A (zh) * 2023-05-12 2023-09-19 石家庄铁道大学 基于区块链的电子病例隐私保护方法
CN116861485A (zh) * 2023-07-26 2023-10-10 嘉兴职业技术学院 一种基于深度学习融合的学生信息隐私保护方法
CN116912847A (zh) * 2023-07-11 2023-10-20 平安科技(深圳)有限公司 一种医学文本识别方法、装置、计算机设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU753707B2 (en) * 1998-09-09 2002-10-24 Yeong Kuang Oon Automation oriented healthcare delivery system based on medical scripting language
CN109741803A (zh) * 2019-01-14 2019-05-10 南京大学 基于区块链的医疗数据安全协作系统
CN113409928A (zh) * 2021-06-29 2021-09-17 中国人民解放军总医院第一医学中心 一种医疗信息共享系统
CN113242137A (zh) * 2021-07-12 2021-08-10 广州天鹏计算机科技有限公司 一种电子病历数据处理方法和系统
CN113536359A (zh) * 2021-08-06 2021-10-22 东北大学 基于区块链的个人健康记录隐私保护和访问系统及方法
CN116779084A (zh) * 2023-05-12 2023-09-19 石家庄铁道大学 基于区块链的电子病例隐私保护方法
CN116912847A (zh) * 2023-07-11 2023-10-20 平安科技(深圳)有限公司 一种医学文本识别方法、装置、计算机设备及存储介质
CN116861485A (zh) * 2023-07-26 2023-10-10 嘉兴职业技术学院 一种基于深度学习融合的学生信息隐私保护方法

Also Published As

Publication number Publication date
CN117436132A (zh) 2024-01-23

Similar Documents

Publication Publication Date Title
CN110414203B (zh) 一种基于区块链技术的互联网医疗身份认证方法
US9268990B2 (en) Apparatus and method for producing an identification device
CN101098232B (zh) 一种动态口令与多生物特征结合的身份认证方法
DK2272021T3 (en) SECURE DATACACHE
KR100800371B1 (ko) 데이터 처리 방법 및 컴퓨터 판독 가능 매체
US20130318361A1 (en) Encrypting and storing biometric information on a storage device
McAteer et al. Integration of biometrics and steganography: a comprehensive review
CN110175441A (zh) 基于生物识别的数据管理方法、装置、设备及存储介质
Ali et al. A secure and efficient multi-factor authentication algorithm for mobile money applications
US10893027B2 (en) Secure access to individual information
TW202022666A (zh) 健康資訊之存取系統、存取裝置及存取方法
Cavoukian et al. Advances in biometric encryption: Taking privacy by design from academic research to deployment
Barra et al. Cloud-based biometrics (biometrics as a service) for smart cities, nations, and beyond
JP2006262333A (ja) 生体認証システム
Dinca et al. User-centric key entropy: Study of biometric key derivation subject to spoofing attacks
Maltoni et al. Securing fingerprint systems
Bradish et al. Covichain: A blockchain based covid-19 vaccination passport
CN107231240A (zh) 一种安全性较高的双重身份识别方法
CN112600886B (zh) 端云结合的隐私保护方法、装置以及设备
CN110535630A (zh) 密钥生成方法、装置及存储介质
CN109039650A (zh) 一种融合生物特征加密技术在线信息托管的方法及其系统
CN117436132B (zh) 一种融合区块链技术与人工智能的数据隐私保护方法
JP2007179500A (ja) 匿名化識別情報生成システム、及び、プログラム。
CN114866223A (zh) 一种基于唇码验证的文件加密及解密方法
CN115708135A (zh) 人脸识别模型的处理方法、人脸识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant