CN111326214A - 基于负数据库的基因数据上安全的相似患者查询方法及系统 - Google Patents
基于负数据库的基因数据上安全的相似患者查询方法及系统 Download PDFInfo
- Publication number
- CN111326214A CN111326214A CN202010067402.9A CN202010067402A CN111326214A CN 111326214 A CN111326214 A CN 111326214A CN 202010067402 A CN202010067402 A CN 202010067402A CN 111326214 A CN111326214 A CN 111326214A
- Authority
- CN
- China
- Prior art keywords
- database
- negative database
- negative
- gene sequence
- bit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
Landscapes
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biophysics (AREA)
- Medical Informatics (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开了一种基于负数据库的基因数据上安全的相似患者查询方法及系统,包括以下步骤:将作为典型样本患者的基因序列转化为二进制串,并生成负数据库,并作为样本负数据库存储到服务器的基因序列总数据库中,同时存储与相应患者的医疗数据;将待查询的基因序列数据转化为二进制串,并生成相应的待查询基因序列负数据库,并上传服务器;计算待查询基因序列负数据库与基因序列总数据库中所有样本负数据库之间的编辑距离;找出编辑距离最小的样本负数据库,并返回相应患者的医疗数据。本发明可以在满足隐私保护的前提下,安全地计算基因序列间的编辑距离,由此比较基因序列间的相似性,用于基因医疗和疾病诊断。
Description
技术领域
本发明属于生物特征数据隐私保护领域,具体涉及一种基于负数据库的 基因序列间编辑距离估算方法及系统。
背景技术
随着基因测序技术的进步,基因数据相关的研究和应用也在快速发展, 例如比较基因序列的相似性,用于基因医疗和疾病诊断等,医生可以通过比 较自己病人的基因序列与数据库中其他患者的基因序列数据,找出最为相似 的那些患者,参考他们的医疗信息,从而为自己的病人提供好的诊断。近年 来有许多比较基因序列相似性的算法被提出,在各项比较指标中,编辑距离 是其中最为重要的相似性测量指标之一,常被用于生物医学研究中对疾病的 诊断。
然而一个人的基因数据是唯一且不变的,一旦被泄露则会给个人造成终 身的隐私安全问题。目前为了能够在不公开基因数据的前提下安全地比较两 个基因序列间的相似性,通常采用的方法是先对原始的基因数据进行加密, 然后在加密的数据上进行安全的编辑距离计算。但是基于加密的算法一般为 了降低自己的时间复杂度和通信开销,在算法的精度上会有一定的妥协,如 果要达到完全精确,在算法效率上又无法让人接受。
发明内容
本发明要解决的技术问题在于针对现有技术中的上述缺陷,提供一种基 于负数据库的基因数据上安全的相似患者查询方法及系统。
本发明解决其技术问题所采用的技术方案是:
提供一种基于负数据库的基因数据上安全的相似患者查询方法,包括以 下步骤:
步骤1,将作为典型样本患者的基因序列转化为二进制串,并生成负数据 库,并作为样本负数据库存储到服务器的基因序列总数据库中,同时存储与 相应患者的医疗数据;
步骤2,将待查询的基因序列数据转化为二进制串,并生成相应的待查询 基因序列负数据库,并上传服务器;
步骤3,计算待查询基因序列负数据库与基因序列总数据库中所有样本负 数据库之间的编辑距离;
步骤4,找出编辑距离最小的样本负数据库,并返回相应患者的医疗数据。
接上述技术方案,步骤1、2中,对于由碱基A,T,G和C组成的一段基因 序列,分别使用00,01,10和11来代替A,T,G和C,并将其转化为长度是原 来两倍的二进制串形式,使用负数据库生成算法K-hidden将二进制串生成对 应的负数据库形式。
其中edit[i][j]为编辑距离计算公式,对于两个基因序列s1和s2,edit[i][j] 表示s1的前i位子串与s2的前j位子串之间的编辑距离,设s1和s2的长度分 别是len1和len2,那么由edit[0][0]逐步计算到edit[len1][len2]就得到了s1与 s2间的编辑距离;设由s1和s2生成的负数据库为NDBb1和NDBb2,通过统计 NDBb1和NDBb2分别在第2i,2i+1位和第2j,2j+1位上‘0’和‘1’的个数, 估算出它们所隐藏的二进制串b1和b2在对应位上为‘0’的概率 和而它们又分别对应s1和s2的第i位和第j 位,因此进一步计算出s1和s2分别在第i位和第j位取值相等的概率
本发明还提供了一种基于负数据库的基因数据上安全的相似患者查询系 统,包括客户端和服务器,其中,
客户端包括:
样本负数据库转换模块,用于将作为典型样本患者的基因序列转化为二 进制串,并生成负数据库,并作为样本负数据库存储到服务器的基因序列总 数据库中,同时存储与相应患者的医疗数据;以及
待查询负数据库转换模块,用于将待查询的基因序列数据转化为二进制 串,并生成相应的待查询基因序列负数据库,并上传服务器;
服务器包括:
编辑距离计算模块,用于计算待查询基因序列负数据库与基因序列总数 据库中所有样本负数据库之间的编辑距离;以及
医疗数据返回模块,用于找出编辑距离最小的样本负数据库,并返回相 应患者的医疗数据给客户端。
接上述技术方案,样本负数据库转换模块具体将碱基A,T,G和C组成的一 段基因序列,分别使用00,01,10和11来代替A,T,G和C,并将其转化为长 度是原来两倍的二进制串形式,使用负数据库生成算法K-hidden将二进制串 生成对应的负数据库形式。
接上述技术方案,待查询负数据库转换模块具体将碱基A,T,G和C组成的 一段基因序列,分别使用00,01,10和11来代替A,T,G和C,并将其转化为 长度是原来两倍的二进制串形式,使用负数据库生成算法K-hidden将二进制 串生成对应的负数据库形式。
其中edit[i][j]为编辑距离计算公式,对于两个基因序列s1和s2,edit[i][j] 表示s1的前i位子串与s2的前j位子串之间的编辑距离,设s1和s2的长度分 别是len1和len2,那么由edit[0][0]逐步计算到edit[len1][len2]就得到了s1与 s2间的编辑距离;设由s1和s2生成的负数据库为NDBb1和NDBb2,通过统计 NDBb1和NDBb2分别在第2i,2i+1位和第2j,2j+1位上‘0’和‘1’的个数, 估算出它们所隐藏的二进制串b1和b2在对应位上为‘0’的概率 和而它们又分别对应s1和s2的第i位和第j 位,因此进一步计算出s1和s2分别在第i位和第j位取值相等的概率
本发明还提供了一种计算机存储介质,其内存储有可被处理器执行的计 算机程序,该计算机程序执行如上述技术方案所述的基于负数据库的基因数 据上安全的相似患者查询方法。
本发明产生的有益效果是:本发明能够在不泄露原始基因数据的前提下 安全地计算它们之间的编辑距离,用于查询者从基因数据库中找到与自己具 有相似基因数据的人的医疗信息,为医疗诊断提供参考。使用负数据库作为 隐私保护的方法,相对于已有的无法很好平衡效率与精度的基于加密的算法, 本发明能够保证好的效率,并达到100%的精度。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明实施例基于负数据库的基因数据上安全的相似患者查询方 法的流程图;
图2是本发明另一实施例基于负数据库的基因数据上安全的相似患者查 询方法的具体步骤;
图3是本发明实施例通过负数据库来估算隐藏串b对应的基因序列s在 每一位上取值的概率;
图4是本发明实施例基于负数据库的基因数据上安全的相似患者查询系 统结构示意图一;
图5是本发明实施例基于负数据库的基因数据上安全的相似患者查询系 统结构示意图二。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及 实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施 例仅用以解释本发明,并不用于限定本发明。
如图1所示,本发明实施例基于负数据库的基因数据上安全的相似患者 查询方法包括以下步骤:
S1、将作为典型样本患者的基因序列转化为二进制串,并生成负数据库, 并作为样本负数据库存储到服务器的基因序列总数据库中,同时存储与相应 患者的医疗数据;
S2、将待查询的基因序列数据转化为二进制串,并生成相应的待查询基 因序列负数据库,并上传服务器;
S3、计算待查询基因序列负数据库与基因序列总数据库中所有样本负数 据库之间的编辑距离;
S4、找出编辑距离最小的样本负数据库,并返回相应患者的医疗数据。
步骤1中,对于由碱基A,T,G和C组成的一段基因序列s,分别使用00, 01,10和11来代替A,T,G和C将其转化为长度是原来两倍的二进制串形式b, 使用负数据库生成算法K-hidden将b生成对应的负数据库形式NDBb。
其中edit[i][j]为编辑距离计算公式,对于两个基因序列s1和s2,edit[i][j] 表示s1的前i位子串与s2的前j位子串之间的编辑距离,设s1和s2的长度分 别是len1和len2,那么由edit[0][0]逐步计算到edit[len1][len2]就得到了s1与 s2间的编辑距离。设由s1和s2生成的负数据库为NDBb1和NDBb2,通过统计 NDBb1和NDBb2分别在第2i,2i+1位和第2j,2j+1位上‘0’和‘1’的个数, 估算出它们所隐藏的二进制串b1和b2在对应位上为‘0’的概率 和而它们又分别对应s1和s2的第i位和第j 位,因此可进一步计算出s1和s2分别在第i位和第j位取值相等的概率
查询者和数据拥有者在本地将自己的基因序列转化为负数据库的形式上 传给服务器,服务器使用推导的NDB-ED算法,就可以安全地估算原始基因 序列间的编辑距离,用于比较基因序列间的相似性,将数据拥有者的数据库 中,与查询者基因序列相似的患者信息返回给查询者。
下面结合图2,图3和图4对本发明进行详细的描述,本实施例另一实施 例基于负数据库的基因数据上安全的相似患者查询方法的具体步骤包括:
步骤1,查询者和数据拥有者在本地将自己的基因序列数据生成为负数据 库。
因为基因序列数据是由4中碱基A,T,G和C组成的字符串,所以使用2个 bit刚好4种组合00,01,10和11来代替这4个字符,将原始的基因序列转 化为二进制串,如图2中将基因序列s(m个字符)转化为b(长度为2m)。 接着,使用K-hidden算法将基因序列转化后的二进制串b生成相应的负数据 库NDBb,其中一共有2m x r条记录,每条记录长度为2m,如图2中b到NDBb的转化。
步骤2,推导负数据库间的编辑距离估算公式,2个负数据库间的编辑距 离计算公式为:
其中
这里edit[i][j]表示的是,对于两个负数据库NDB1和NDB2,它们所隐藏的 原始串分别是s1和s2,将s1的前i位的子串编辑成s2的前j位的子串所需的最 小编辑操作。公式中表示s1的第i位与s2的第j位取值相等的概率, b1和b2分别表示s1和s2对应的二进制形式。对于pr可以通过对负数据库上0 和1数量的统计以及负数据库的生产参数,使用贝叶斯概率公式来求解。
如图3中,由负数据库NDBb可以估算出隐藏串b上第1位和第2位为‘0’ 的概率,分别表示为pr1和pr2,于是二进制串b所对应的原始基因序列s的 第一位取‘A’,‘G’,‘T’或‘C’的概率可分别通过pr1和pr2求出。这样我 们就可以通过负数据库来估算它对应的基因序列s在每一位上取值的概率,用 于负数据库间的编辑距离计算。
步骤3,在各方将原始基因序列转化为负数据库后,上传给服务器。一般 上传者包括查询者和数据拥有者,查询者想获得与自己基因序列相似的其他 基因数据,数据拥有者有大量的基因数据如医院或者相关研究机构。服务器 来安全地计算收到的负数据库间的编辑距离,并将与查询者提供的负数据库 相似的一个或多个负数据库数据及相应的医疗信息返还给查询方。
上述实施例中使用的基因数据集为iDASH competition 2016中提供的SNPs 序列,使用我们的方法进行安全的编辑距离计算返回的查询结果,与不采取 任何安全策略直接计算编辑距离得到的查询结果相比,我们的结果精度可达 到100%,效率上需要1.7倍的计算时间,说明了我们的方法可以在保证基因 序列数据安全的前提下,以合适的效率,达到最好的查询精度。
如图5所示,本发明实施例基于负数据库的基因数据上安全的相似患者 查询系统,包括客户端和服务器,其中,
客户端包括:
样本负数据库转换模块,用于将作为典型样本患者的基因序列转化为二 进制串,并生成负数据库,并作为样本负数据库存储到服务器的基因序列总 数据库中,同时存储与相应患者的医疗数据;以及
待查询负数据库转换模块,用于将待查询的基因序列数据转化为二进制 串,并生成相应的待查询基因序列负数据库,并上传服务器;
服务器包括:
编辑距离计算模块,用于计算待查询基因序列负数据库与基因序列总数 据库中所有样本负数据库之间的编辑距离;以及
医疗数据返回模块,用于找出编辑距离最小的样本负数据库,并返回相 应患者的医疗数据给客户端。
上述系统主要用于实现上述方法实施例的每个步骤,相同部分在此不赘 述。
本发明还保护一种计算机存储介质,其内存储有可被处理器执行的计算 机程序,该计算机程序执行上述实施例的基于负数据库的基因数据上安全的 相似患者查询方法。
综上,本发明可以在满足隐私保护的前提下,安全地计算基因序列间的 编辑距离,由此比较基因序列间的相似性,用于基因医疗和疾病诊断,如在 大量患者中找出与查询者基因序列相似的患者信息,为查询者的诊断提供参 考,并且全过程不泄露任何人的基因数据。
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改 进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。
Claims (8)
1.一种基于负数据库的基因数据上安全的相似患者查询方法,其特征在于,包括以下步骤:
步骤1,将作为典型样本患者的基因序列转化为二进制串,并生成负数据库,并作为样本负数据库存储到服务器的基因序列总数据库中,同时存储与相应患者的医疗数据;
步骤2,将待查询的基因序列数据转化为二进制串,并生成相应的待查询基因序列负数据库,并上传服务器;
步骤3,计算待查询基因序列负数据库与基因序列总数据库中所有样本负数据库之间的编辑距离;
步骤4,找出编辑距离最小的样本负数据库,并返回相应患者的医疗数据。
2.根据权利要求1所述的基于负数据库的基因数据上安全的相似患者查询方法,其特征在于,步骤1、2中,对于由碱基A,T,G和C组成的一段基因序列,分别使用00,01,10和11来代替A,T,G和C,并将其转化为长度是原来两倍的二进制串形式,使用负数据库生成算法K-hidden将二进制串生成对应的负数据库形式。
3.根据权利要求1所述的基于负数据库的基因数据上安全的相似患者查询方法,其特征在于:步骤3中,由负数据库NDBb中某一位上‘0’和‘1’的个数,来估算其隐藏的二进制串b在对应位上值为0的概率结合经典的编辑距离公式,得到负数据库间编辑距离估算公式NDB-ED:
其中edit[i][j]为编辑距离计算公式,对于两个基因序列s1和s2,edit[i][j]表示s1的前i位子串与s2的前j位子串之间的编辑距离,设s1和s2的长度分别是len1和len2,那么由edit[0][0]逐步计算到edit[len1][len2]就得到了s1与s2间的编辑距离;设由s1和s2生成的负数据库为NDBb1和NDBb2,通过统计NDBb1和NDBb2分别在第2i,2i+1位和第2j,2j+1位上‘0’和‘1’的个数,估算出它们所隐藏的二进制串b1和b2在对应位上为‘0’的概率 和而它们又分别对应s1和s2的第i位和第j位,因此进一步计算出s1和s2分别在第i位和第j位取值相等的概率
4.一种基于负数据库的基因数据上安全的相似患者查询系统,其特征在于,包括客户端和服务器,其中,
客户端包括:
样本负数据库转换模块,用于将作为典型样本患者的基因序列转化为二进制串,并生成负数据库,并作为样本负数据库存储到服务器的基因序列总数据库中,同时存储与相应患者的医疗数据;以及
待查询负数据库转换模块,用于将待查询的基因序列数据转化为二进制串,并生成相应的待查询基因序列负数据库,并上传服务器;
服务器包括:
编辑距离计算模块,用于计算待查询基因序列负数据库与基因序列总数据库中所有样本负数据库之间的编辑距离;以及
医疗数据返回模块,用于找出编辑距离最小的样本负数据库,并返回相应患者的医疗数据给客户端。
5.根据权利要求4所述的基于负数据库的基因数据上安全的相似患者查询系统,其特征在于,样本负数据库转换模块具体将碱基A,T,G和C组成的一段基因序列,分别使用00,01,10和11来代替A,T,G和C,并将其转化为长度是原来两倍的二进制串形式,使用负数据库生成算法K-hidden将二进制串生成对应的负数据库形式。
6.根据权利要求4所述的基于负数据库的基因数据上安全的相似患者查询系统,其特征在于,待查询负数据库转换模块具体将碱基A,T,G和C组成的一段基因序列,分别使用00,01,10和11来代替A,T,G和C,并将其转化为长度是原来两倍的二进制串形式,使用负数据库生成算法K-hidden将二进制串生成对应的负数据库形式。
7.根据权利要求4所述的基于负数据库的基因数据上安全的相似患者查询方法,其特征在于:编辑距离计算模块具体用于:由负数据库中某一位上‘0’和‘1’的个数,来估算其隐藏的二进制串在对应位上值为0的概率结合经典的编辑距离公式,得到负数据库间编辑距离估算公式NDB-ED:
其中edit[i][j]为编辑距离计算公式,对于两个基因序列s1和s2,edit[i][j]表示s1的前i位子串与s2的前j位子串之间的编辑距离,设s1和s2的长度分别是len1和len2,那么由edit[0][0]逐步计算到edit[len1][len2]就得到了s1与s2间的编辑距离;设由s1和s2生成的负数据库为NDBb1和NDBb2,通过统计NDBb1和NDBb2分别在第2i,2i+1位和第2j,2j+1位上‘0’和‘1’的个数,估算出它们所隐藏的二进制串b1和b2在对应位上为‘0’的概率 和而它们又分别对应s1和s2的第i位和第j位,因此进一步计算出s1和s2分别在第i位和第j位取值相等的概率
8.一种计算机存储介质,其特征在于,其内存储有可被处理器执行的计算机程序,该计算机程序执行如权利要求1-4中任一项所述的基于负数据库的基因数据上安全的相似患者查询方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010067402.9A CN111326214B (zh) | 2020-01-20 | 2020-01-20 | 基于负数据库的相似患者查询方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010067402.9A CN111326214B (zh) | 2020-01-20 | 2020-01-20 | 基于负数据库的相似患者查询方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111326214A true CN111326214A (zh) | 2020-06-23 |
CN111326214B CN111326214B (zh) | 2022-07-08 |
Family
ID=71171240
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010067402.9A Active CN111326214B (zh) | 2020-01-20 | 2020-01-20 | 基于负数据库的相似患者查询方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111326214B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113378623A (zh) * | 2021-04-08 | 2021-09-10 | 武汉理工大学 | 基于负数据库算法加密的人脸识别方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090240624A1 (en) * | 2008-03-20 | 2009-09-24 | Modasolutions Corporation | Risk detection and assessment of cash payment for electronic purchase transactions |
US20170103194A1 (en) * | 2014-05-30 | 2017-04-13 | Pcms Holdings, Inc. | Systems and methods for active authentication |
CN107798048A (zh) * | 2017-07-28 | 2018-03-13 | 昆明理工大学 | 一种用于射电日像仪海量数据管理的负数据库管理方法 |
CN108154185A (zh) * | 2017-12-27 | 2018-06-12 | 武汉理工大学 | 一种隐私保护的k-means聚类方法 |
-
2020
- 2020-01-20 CN CN202010067402.9A patent/CN111326214B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090240624A1 (en) * | 2008-03-20 | 2009-09-24 | Modasolutions Corporation | Risk detection and assessment of cash payment for electronic purchase transactions |
US20170103194A1 (en) * | 2014-05-30 | 2017-04-13 | Pcms Holdings, Inc. | Systems and methods for active authentication |
CN107798048A (zh) * | 2017-07-28 | 2018-03-13 | 昆明理工大学 | 一种用于射电日像仪海量数据管理的负数据库管理方法 |
CN108154185A (zh) * | 2017-12-27 | 2018-06-12 | 武汉理工大学 | 一种隐私保护的k-means聚类方法 |
Non-Patent Citations (1)
Title |
---|
石聪明 等: "《MUSER的负数据库接口设计与实现》", 《天文研究与技术》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113378623A (zh) * | 2021-04-08 | 2021-09-10 | 武汉理工大学 | 基于负数据库算法加密的人脸识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111326214B (zh) | 2022-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Taylor et al. | Dating divergences in the Fungal Tree of Life: review and new analyses | |
CN110444259B (zh) | 基于实体关系标注策略的中医电子病历实体关系提取方法 | |
EP2320229A2 (en) | System and process for validating, aligning and reordering one or more genetic sequence maps using at least one ordered restriction map | |
Shan | Exact statistical inference for categorical data | |
CN113836341B (zh) | 基于无监督转换器平衡哈希的遥感图像检索方法 | |
CN108154185B (zh) | 一种隐私保护的k-means聚类方法 | |
US20170193197A1 (en) | System and method for automatic unstructured data analysis from medical records | |
CN111326214B (zh) | 基于负数据库的相似患者查询方法及系统 | |
Spathis et al. | The first step is the hardest: Pitfalls of representing and tokenizing temporal data for large language models | |
CN108154914B (zh) | 一种准确匿名化存储和检索医疗图像的方法 | |
Qin et al. | A new measure of word semantic similarity based on wordnet hierarchy and dag theory | |
CN117094308A (zh) | 一种结直肠癌病理文本关系抽取方法 | |
CN116719840A (zh) | 一种基于病历后结构化处理的医疗信息推送方法 | |
Excoffier et al. | Local explanation-based method for healthcare risk stratification | |
CN114334125A (zh) | 诊断预测方法及相关装置、电子设备和存储介质 | |
CN113434692A (zh) | 图神经网络模型构建、诊疗方案推荐方法、系统及设备 | |
CN112883848A (zh) | 人脸识别方法、装置及计算机可读存储介质 | |
CN115527612B (zh) | 基于数值特征表达的基因组二四代融合组装方法及系统 | |
CN117609434B (zh) | 一种肺炎相似病例检索方法及系统 | |
Albert | Parsimony and phylogenetics in the genomic age | |
Patil et al. | Enhancing the Efficiency of Computational Genetic Epidemiology using Advanced Method | |
Angelova et al. | InterCriteria Analysis Approach for Comparison of Simple and Multi-population Genetic Algorithms | |
CN118094028A (zh) | 一种疾病搜索排序方法、系统、终端及存储介质 | |
CN117174285A (zh) | 基于循证医学的第二诊疗意见生成系统及方法 | |
Sharabiani et al. | Predictive and Explainable Analysis of Post-operative Acute Kidney Injury in Children undergoing Cardiopulmonary Bypass: An Application of Large Language Models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |