CN116580841A - 基于多组学数据的疾病诊断设备、装置及存储介质 - Google Patents
基于多组学数据的疾病诊断设备、装置及存储介质 Download PDFInfo
- Publication number
- CN116580841A CN116580841A CN202310851585.7A CN202310851585A CN116580841A CN 116580841 A CN116580841 A CN 116580841A CN 202310851585 A CN202310851585 A CN 202310851585A CN 116580841 A CN116580841 A CN 116580841A
- Authority
- CN
- China
- Prior art keywords
- gene
- diagnosed
- data
- features
- fusion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 201000010099 disease Diseases 0.000 title claims abstract description 75
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 75
- 238000003745 diagnosis Methods 0.000 title claims abstract description 49
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 163
- 230000004927 fusion Effects 0.000 claims abstract description 120
- 238000000605 extraction Methods 0.000 claims abstract description 104
- 230000014509 gene expression Effects 0.000 claims abstract description 51
- 206010028980 Neoplasm Diseases 0.000 claims abstract description 31
- 201000011510 cancer Diseases 0.000 claims abstract description 30
- 239000000126 substance Substances 0.000 claims abstract description 25
- 238000012216 screening Methods 0.000 claims abstract description 21
- 230000001575 pathological effect Effects 0.000 claims description 43
- 238000001914 filtration Methods 0.000 claims description 29
- 230000007170 pathology Effects 0.000 claims description 23
- 238000012360 testing method Methods 0.000 claims description 15
- 230000000120 cytopathologic effect Effects 0.000 claims description 14
- 238000006073 displacement reaction Methods 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 12
- 238000005070 sampling Methods 0.000 claims description 11
- 230000002159 abnormal effect Effects 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 10
- 230000002068 genetic effect Effects 0.000 claims description 8
- 230000007246 mechanism Effects 0.000 claims description 8
- 230000009467 reduction Effects 0.000 claims description 8
- 230000009977 dual effect Effects 0.000 claims description 7
- 230000004547 gene signature Effects 0.000 claims description 7
- 238000012952 Resampling Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 238000013527 convolutional neural network Methods 0.000 claims description 4
- 238000012353 t test Methods 0.000 claims description 4
- 230000036541 health Effects 0.000 claims description 3
- 230000007762 localization of cell Effects 0.000 claims description 2
- 238000004590 computer program Methods 0.000 abstract 1
- 210000004027 cell Anatomy 0.000 description 30
- 238000000034 method Methods 0.000 description 27
- 238000010586 diagram Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 8
- 102000004169 proteins and genes Human genes 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000011176 pooling Methods 0.000 description 5
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000007499 fusion processing Methods 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 108010088751 Albumins Proteins 0.000 description 2
- 102000009027 Albumins Human genes 0.000 description 2
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 2
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 2
- 102000004877 Insulin Human genes 0.000 description 2
- 108090001061 Insulin Proteins 0.000 description 2
- 210000003719 b-lymphocyte Anatomy 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000009274 differential gene expression Effects 0.000 description 2
- 230000002449 erythroblastic effect Effects 0.000 description 2
- 230000002440 hepatic effect Effects 0.000 description 2
- 238000010832 independent-sample T-test Methods 0.000 description 2
- 229940125396 insulin Drugs 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 210000004738 parenchymal cell Anatomy 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 206010008342 Cervix carcinoma Diseases 0.000 description 1
- 108010026552 Proteome Proteins 0.000 description 1
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 201000010881 cervical cancer Diseases 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000004195 computer-aided diagnosis Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000001558 permutation test Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Abstract
本发明公开一种基于多组学数据的疾病诊断设备、装置及存储介质,该设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,用于实现:获取同一患者的待诊断基因数据和细胞病理图像;基于待诊断基因数据筛选出差异表达基因,并提取差异表达基因的基因特征;通过预设特征提取模型对细胞病理图像进行特征提取,获得细胞病理图像特征,其中预设特征提取模型包括基于DenseNet网络的特征提取模块和基于双注意力的多尺度特征融合模块;将细胞病理图像特征与基因特征进行特征融合,并根据融合后的特征确定患者的疾病类型。本发明通过融合患者的细胞病理图像特征和基因特征,提高了对癌症患者疾病类型诊断的准确性和效率。
Description
技术领域
本发明涉及癌症患者分类的技术领域,尤其涉及一种基于多组学数据的疾病诊断设备、装置及存储介质。
背景技术
病理学检查是癌症诊断和治疗的基础,但是病理医生通过镜下阅片得到诊断结果,由于受到医生主观因素影响,不同医生的诊断结果和对结果的解释存在较强的不一致性,且人工阅片过程耗时耗力,对于大量批次的阅片无论在诊断的准确度上还是效率上都存在一定的问题。近年来,病理学标本大都以全景数字切片图像(全幻灯片图像,WSIs)的形式存储,对此可以通过计算机辅助诊断的方法,提高病理诊断准确性和效率。目前许多研究使用深度学习算法对WSIs进行辅助诊断,但由于算法的问题其泛化能力受限,实际难以达到理想的效果。因此,亟待对相关的算法进行研究,给出诊断准确度更高、泛化能力更好的自动诊断方法。
目前,随着新一代基因测序技术的发展,各类组学测序成本急剧下降,大量组学数据得以生成。传统疾病诊断系统中常对单个组学数据进行统计分析,但单个组学无法全方位描述疾病,因而同时考虑多种组学数据是疾病诊断的新趋势,例如,将患者的影像数据与基因数据的结合可以帮助我们获得一个更好的诊断结果,目前主要有分别对各个数据进行诊断并在结果层面投票整合、将影像特征与基因特征拼接并做诊断等方法。但不同组学间存在异构且互补的信息,因此如何基于多组学数据进行疾病诊断,提高患者疾病类型诊断的准确性和效率是亟待解决的一个课题。
发明内容
本发明的主要目的在于提供了一种基于多组学数据的疾病诊断设备、装置及存储介质,旨在解决如何提高患者疾病类型诊断的准确性和效率的技术问题。
为实现上述目的,本发明提供了一种基于多组学数据的疾病诊断设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于多组学数据的疾病诊断程序,所述基于多组学数据的疾病诊断程序被所述处理器执行时实现以下步骤:
获取同一患者的待诊断基因数据和待诊断病理图像,所述待诊断病理图像为细胞病理图像;
基于所述待诊断基因数据筛选出差异表达基因,并提取所述差异表达基因的基因特征;
通过预设特征提取模型对所述细胞病理图像进行特征提取,获得细胞病理图像特征,所述预设预设特征提取模型包括基于DenseNet网络的特征提取模块和基于双注意力的多尺度特征融合模块;
将所述细胞病理图像特征与所述基因特征进行特征融合,获得待诊断融合特征,并根据所述待诊断融合特征确定所述患者的疾病类型。
可选地,所述获取同一患者的待诊断基因数据和待诊断病理图像,所述待诊断病理图像为细胞病理图像的步骤之前,包括:
获取多组学中影像组学数据,所述影像组学数据包括癌症患者病理图数据;
对所述癌症患者病理图数据进行随机重抽样,获得多个病理图数据集;
将所述病理图数据集输入至第一训练模型中进行训练,获得预设特征提取模型,所述第一训练模型为基于注意力机制的卷积神经网络模型。
可选地,所述基于DenseNet网络的特征提取模块包括四组卷积组和1x1卷积层;
所述卷积组,用于在特征提取过程中根据预设规则缩小所述细胞病理图像的尺度,并输出所述细胞病理图像进行特征提取后的第一特征;
所述1x1卷积层,用于将所述各卷积组输出的所述第一特征进行1x1非线性卷积运算,将所述第一特征的特征通道数变换至预设通道数,获得多尺度特征。
可选地,所述基于双注意力的多尺度特征融合模块包括通道注意力运算子模块、空间注意力运算子模块和特征融合子模块;
所述通道注意力运算子模块,用于基于所述多尺度特征进行空间信息降维,通过Sigmoid函数输出通道注意力权重,并根据所述通道注意力权重获得第一过滤特征;
所述空间注意力运算子模块,用于对所述第一过滤特征进行通道信息降维,通过所述Sigmoid函数输出空间注意力权重,并根据所述空间注意力权重获得第二过滤特征;
特征融合子模块,用于根据所述第二过滤特征进行特征融合,获得细胞病理图像特征。
可选地,所述特征融合子模块包括过滤特征融合单元和异常细胞定位单元;
所述过滤特征融合单元,用于对所述多尺度特征进行上采样运算,获得上采样结果,并将所述上采样结果与所述第二过滤特征进行逐元素相加,获得融合特征;
所述异常细胞定位单元,用于将所述融合特征输入RPN 网络和Faster RCNN网络进行异常细胞定位获得定位结果,并将所述定位结果作为细胞病理图像特征。
可选地,所述基于所述待诊断基因数据筛选出差异表达基因的步骤,包括:
获取多例正常人健康对照的基因表达谱数据和所述待诊断基因数据中基因表达谱数据中的基因;
对所述基因进行基于两独立样本t检验的置换检验,获得置换检验结果,并根据所述置换检验结果筛选出差异表达基因。
可选地,所述提取所述差异表达基因的基因特征的步骤,具体包括:
通过基于注意力的基因特征提取网络提取所述差异表达基因的基因特征,所述基于注意力的基因特征提取网络包括注意力机制层和全连接层。
可选地,所述通过预设特征提取模型对所述细胞病理图像进行特征提取,获得细胞病理图像特征的步骤之前,还包括:
将所述对所述细胞病理图像进行数据增强处理。
此外,为实现上述目的,本发明还提出一种基于多组学数据的疾病诊断装置,所述装置包括:
数据获取模块,用于获取同一患者的待诊断基因数据和待诊断病理图像,所述待诊断病理图像为细胞病理图像;
基因特征提取模块,用于基于所述待诊断基因数据筛选出差异表达基因,并提取所述差异表达基因的基因特征;
图像特征提取模块,用于通过预设特征提取模型对所述细胞病理图像进行特征提取,获得细胞病理图像特征,所述预设预设特征提取模型包括基于DenseNet算法的特征提取模块和基于双注意力的多尺度特征融合模块;
特征融合模块,用于将所述细胞病理图像特征与所述基因特征进行特征融合,获得待诊断融合特征,并根据所述待诊断融合特征确定所述患者的疾病类型。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有基于多组学数据的疾病诊断程序,所述基于多组学数据的疾病诊断程序被处理器执行时实现以下步骤:
获取同一患者的待诊断基因数据和待诊断病理图像,所述待诊断病理图像为细胞病理图像;
基于所述待诊断基因数据筛选出差异表达基因,并提取所述差异表达基因的基因特征;
通过预设特征提取模型对所述细胞病理图像进行特征提取,获得细胞病理图像特征,所述预设预设特征提取模型包括基于DenseNet算法的特征提取模块和基于双注意力的多尺度特征融合模块;
将所述细胞病理图像特征与所述基因特征进行特征融合,获得待诊断融合特征,并根据所述待诊断融合特征确定所述患者的疾病类型。
本发明通过获取同一患者的待诊断基因数据和待诊断病理图像,所述待诊断病理图像为细胞病理图像;基于所述待诊断基因数据筛选出差异表达基因,并提取所述差异表达基因的基因特征;通过预设特征提取模型对所述细胞病理图像进行特征提取,获得细胞病理图像特征,所述预设预设特征提取模型包括基于DenseNet网络的特征提取模块和基于双注意力的多尺度特征融合模块;将所述细胞病理图像特征与所述基因特征进行特征融合,获得待诊断融合特征,并根据所述待诊断融合特征确定所述患者的疾病类型块。本发明通过引入基于DenseNet网络的特征提取模块和基于双注意力的多尺度特征融合模块对细胞病理图像进行特征提取,获得细胞病理图像特征,然后将细胞病理图像特征与提取的基因特征进行特征融合,再根据特征融合的结果确定癌症患者的患病类型,相比于现有技术,本发明有效提高了对癌症患者疾病类型诊断的准确性和效率。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的基于多组学数据的疾病诊断设备的结构示意图;
图2为本发明基于多组学数据的疾病诊断设备第一实施例的流程示意图;
图3为本发明基于多组学数据的疾病诊断设备中预设特征提取模型的结构示意图;
图4为本发明基于多组学数据的疾病诊断设备中基于双注意力的多尺度特征融合模块的结构示意图;
图5为本发明基于多组学数据的疾病诊断设备第二实施例的流程示意图;
图6为本发明基于多组学数据的疾病诊断设备第三实施例的流程示意图;
图7为本发明基于多组学数据的疾病诊断装置第一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的基于多组学数据的疾病诊断设备结构示意图。
如图1所示,该基于多组学数据的疾病诊断设备可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(Wireless-Fidelity,WI-FI)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM),也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对基于多组学数据的疾病诊断设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于多组学数据的疾病诊断程序。
在图1所示的基于多组学数据的疾病诊断设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明基于多组学数据的疾病诊断设备中的处理器1001、存储器1005可以设置在基于多组学数据的疾病诊断设备中,所述基于多组学数据的疾病诊断设备通过处理器1001调用存储器1005中存储的基于多组学数据的疾病诊断程序,并在所述处理器1001上运行的基于多组学数据的疾病诊断程序。
本发明实施例提供了一种基于多组学数据的疾病诊断设备,参照图2,图2为本发明基于多组学数据的疾病诊断设备第一实施例的流程示意图。
本实施例中,所述基于多组学数据的疾病诊断设备包括:存储器、处理器及存储在所述存储器上并在所述处理器上运行的基于多组学数据的疾病诊断程序,所述基于多组学数据的疾病诊断程序被所述处理器执行时实现以下步骤:
步骤S10:获取同一患者的待诊断基因数据和待诊断病理图像,所述待诊断病理图像为细胞病理图像。
需要说明的是,多组学数据包括转录组数据、基因组数据、蛋白组数据和影像组数据等。在人工智能背景下,机器学习技术可以通过融合患者的病理图像与基因数据帮助医生确定患者的癌症类型或肿瘤的亚型分类。
需要解释的是,细胞病理图像取自细胞病理检查,由大量形态、大小、颜色不一的细胞组成。
可理解的是,将患者的病理图像与基因数据的结合可以帮助我们获得一个更好的诊断结果,目前主要有分别对各个数据进行诊断并在结果层面投票整合、将影像特征与基因特征拼接并做诊断等方法。
但是将患者的病理图像与基因数据结合分析,需要考虑基因数据特征的高维性、病理图像中非感兴趣区域的存在以及病理图像特征与基因特征融合后带来的冗余性等问题,因此需要对基因数据的特征和病理图像特征进行提取。
步骤S20:基于所述待诊断基因数据筛选出差异表达基因,并提取所述差异表达基因的基因特征。
可理解的是,基于所述待诊断基因数据筛选出差异表达基因之前,需要先分别获取癌症患者的基因表达值和正常人的基因表达值,可以从特定的数据库或者网络中获取癌症患者和正常人的基因表达谱数据,然后根据基因表达谱数据测得癌症患者和正常人的基因表达值。
进一步地,根据根据基因表达谱数据测得癌症患者和正常人的基因表达值确定癌症患者和正常人的差异表达基因。
需要解释的是,差异表达基因是指在不同的细胞或同一细胞的不同发育阶段,细胞表达的特定的基因,因而产生了特定的蛋白质,从而导致细胞在形态、结构和功能上的差异。基因差异表达的结果使不同细胞产生了特有的蛋白质,例如:奢侈蛋白(luxuryprotein),如成红细胞的β珠蛋白、胰岛B-细胞中的胰岛素、肝实质细胞的白蛋白等。
可理解的是,提取差异表达基因的基因特征可以通过基于注意力的基因特征提取网络提取所述差异表达基因的基因特征,所述基于注意力的基因特征提取网络包括注意力机制层和全连接层,全连接层表示的是全连接神经网络。
步骤S30:通过预设特征提取模型对所述细胞病理图像进行特征提取,获得细胞病理图像特征,所述预设预设特征提取模型包括基于DenseNet网络的特征提取模块和基于双注意力的多尺度特征融合模块。
需要说明的是,为了降低过拟合风险,可以对细胞病理图像进行了数据增强,具体包括图像随机水平翻转、垂直翻转、旋转、亮度变化和高斯模糊,这些仿射变换有助于模型更好地适应图像的各种变异情况,因此通过预设特征提取模型对所述细胞病理图像进行特征提取,获得细胞病理图像特征的步骤之前,还包括:将所述对所述细胞病理图像进行数据增强处理。
需要说明的是,上述基于DenseNet网络的特征提取模块包括四组卷积组和1x1卷积层;
所述卷积组,用于在特征提取过程中根据预设规则缩小所述细胞病理图像的尺度,并输出所述细胞病理图像进行特征提取后的第一特征;
所述1x1卷积层,用于将所述各卷积组输出的所述第一特征进行1x1非线性卷积运算,将所述第一特征的特征通道数变换至预设通道数,获得多尺度特征。
参考图3,图3为本发明基于多组学数据的疾病诊断设备中预设特征提取模型的结构示意图;
在具体实现中,输入的细胞病理图像在特征提取的过程中尺度每次缩小2倍,使得特征信息更抽象,将每个卷积组输出的特征分别记为C2、C3、C4和C5即第一特征,然后进过1×1conv即1×1非线性卷积运算变换特征通道数至256,以降低计算量,获得多尺度特征、、/>和/>。
需要说明的是的,上述基于双注意力的多尺度特征融合模块包括通道注意力运算子模块、空间注意力运算子模块和特征融合子模块;
所述通道注意力运算子模块,用于基于所述多尺度特征进行空间信息降维,通过Sigmoid函数输出通道注意力权重,并根据所述通道注意力权重获得第一过滤特征;
所述空间注意力运算子模块,用于对所述第一过滤特征进行通道信息降维,通过所述Sigmoid函数输出空间注意力权重,并根据所述空间注意力权重获得第二过滤特征;
特征融合子模块,用于根据所述第二过滤特征进行特征融合,获得细胞病理图像特征。
所述特征融合子模块包括过滤特征融合单元和异常细胞定位单元;
所述过滤特征融合单元,用于对所述多尺度特征进行上采样运算,获得上采样结果,并将所述上采样结果与所述第二过滤特征进行逐元素相加,获得融合特征;
所述异常细胞定位单元,用于将所述融合特征输入RPN 网络和Faster RCNN网络进行异常细胞定位获得定位结果,并将所述定位结果作为细胞病理图像特征。
参考图4,图4为本发明基于多组学数据的疾病诊断设备中基于双注意力的多尺度特征融合模块的结构示意图;
图3中的注意力模块即图4中基于双注意力的多尺度特征融合模块是自上而下的特征融合过程,通过注意力模块从通道注意力和空间注意力两个维度对特征进行过滤,并将融合后的特征向下传递参与下层特征融合过程,从而由特征得到融合后的特征/>,具体运算过程如下:
式中,分别表示逐元素相乘与逐元素相加,/>(i=2,3,4,5,6)为基于双注意力的多尺度特征融合模块(以下简称注意力模块)融合后得到的特征图,并将所述定位结果作为细胞病理图像特征,maxpool是窗宽为2的最大池化运算,/>为上采样运算,/>和/>分别是注意力模块中通道注意力运算子模块和空间注意力运算子模块生成的通道注意力权重和空间注意力权重,/>和/>分别是根据通道注意力权重获得第一过滤特征和根据空间注意力权重获得第二过滤特征。
在具体实现中,通过基于所述通道注意力和空间注意力过滤后的第二过滤特征得到感兴趣区域;将所述通道注意力和空间注意力过滤后的第二过滤特征输入至RPN 网络进行感兴趣区域对齐,得到感兴趣区域特征;将感兴趣区域特征输入至Faster RCNN网络进行异常细胞定位获得定位结果,并将所述定位结果作为细胞病理图像特征。
需要说明的是,所述感兴趣区域对齐可以是将大小不同的感兴趣区域的大小进行统一的操作。
需要说明的是,所述感兴趣区域特征可以是进行了感兴趣区域对齐后得到的特征信息。
需要解释的是,通道注意力运算子模块的运算过程如下:
式中,maxpool()与avgpool(/>)表示对上层特征/>沿空间维度分别进行最大池化和平均池化运算。
需要说明的是,池化的窗宽与尺寸一致,对/>进行空间信息降维,保留每个通道特征的主要信息,即/>和/>,然后将/>和/>输入至一个权值共享的两层全连接神经网络增强特征的非线性表达能力,/>和/>为权重参数,/>表示Sigmoid函数,/>为ReLU激活函数,/>为通道注意力权重,并根据所述通道注意力权重获得第一过滤特征/>(i=2,3,4)。
进一步地,空间注意力运算子模块的运算过程如下:
式中,maxpool()与avgpool(/>)表示对特征第一过滤特征/>沿通道维度分别进行最大池化和平均池化运算、对第一过滤特征/>进行通道信息降维,保留特征空间维度的主要信息,concat是拼接函数,/>表示Sigmoid函数,/>表示卷积核大小为7×7的卷积运算,/>表示空间注意力权重。
步骤S40:将所述细胞病理图像特征与所述基因特征进行特征融合,获得待诊断融合特征,并根据所述待诊断融合特征确定所述患者的疾病类型。
需要解释的是,将所述细胞病理图像特征与所述基因特征进行特征融合,获得待诊断融合特征,可以通过特定的算法实现将细胞病理图像特征与基因特征进行特征融合,以获得待诊断融合特征,也可以先获得细胞病理图像特征的诊断结果和基因特征的诊断结果,然后结和二者的诊断结果确定癌症患者的患病类型,也可以通过其他方式实现,本实施例对此不加以限制。
本实施例通过获取同一患者的待诊断基因数据和待诊断病理图像,所述待诊断病理图像为细胞病理图像;基于所述待诊断基因数据筛选出差异表达基因,并提取所述差异表达基因的基因特征;通过预设特征提取模型对所述细胞病理图像进行特征提取,获得细胞病理图像特征,所述预设预设特征提取模型包括基于DenseNet网络的特征提取模块和基于双注意力的多尺度特征融合模块;将所述细胞病理图像特征与所述基因特征进行特征融合,获得待诊断融合特征,并根据所述待诊断融合特征确定所述患者的疾病类型块。本发明通过引入基于DenseNet网络的特征提取模块和基于双注意力的多尺度特征融合模块对细胞病理图像进行特征提取,获得细胞病理图像特征,然后将细胞病理图像特征与提取的基因特征进行特征融合,再根据特征融合的结果确定癌症患者的患病类型,相比于现有技术,本发明有效提高了对癌症患者疾病类型诊断的准确性和效率。
参考图5,图5为本发明基于多组学数据的疾病诊断设备第二实施例的流程示意图。
基于上述第一实施例,在本实施例中,所述步骤S10之前,还包括:
步骤S01:获取多组学中影像组学数据,所述影像组学数据包括癌症患者病理图数据。
可理解的是,癌症患者病理图数据包括细胞病理图像和组织病理图像,本实施例获取的是癌症患者病理图数据中的细胞病理图像,细胞病理图像取自细胞病理检查,由大量形态、大小、颜色不一的细胞组成。以宫颈癌筛查过程中所使用的宫颈细胞病理图像为例,细胞稀疏程度各异,或呈杂乱分散排布,或呈重叠团簇状分布;癌前病变细胞和正常细胞之间的形态学差异不明显,因此需要提取细胞病理图像的特征,已实现癌症患者的分类。
步骤S02:对所述癌症患者病理图数据进行随机重抽样,获得多个病理图数据集。
应理解的是,随机重抽样是根据随机性原则,从总体单位中抽取部分单位作为样本进行调查,以其结果推断总体有关指标的一种抽样方法。通过对所述癌症患者病理图数据进行随机重抽样可以减少随机误差,提高预设特征提取模型的准确率。
步骤S03:将所述病理图数据集输入至第一训练模型中进行训练,获得预设特征提取模型,所述第一训练模型为基于注意力机制的卷积神经网络模型。
本实施例通过获取多组学中影像组学数据,所述影像组学数据包括癌症患者病理图数据;对所述癌症患者病理图数据进行随机重抽样,获得多个病理图数据集;将所述病理图数据集输入至第一训练模型中进行训练,获得预设特征提取模型,其中,第一训练模型为基于注意力机制的卷积神经网络模型,然后再获取同一患者的待诊断基因数据和待诊断病理图像,所述待诊断病理图像为细胞病理图像;基于所述待诊断基因数据筛选出差异表达基因,并提取所述差异表达基因的基因特征;通过预设特征提取模型对所述细胞病理图像进行特征提取,获得细胞病理图像特征,所述预设预设特征提取模型包括基于DenseNet网络的特征提取模块和基于双注意力的多尺度特征融合模块;将所述细胞病理图像特征与所述基因特征进行特征融合,获得待诊断融合特征,并根据所述待诊断融合特征确定所述患者的疾病类型块。本发明通过引入基于DenseNet网络的特征提取模块和基于双注意力的多尺度特征融合模块对细胞病理图像进行特征提取,获得细胞病理图像特征,然后将细胞病理图像特征与提取的基因特征进行特征融合,再根据特征融合的结果确定癌症患者的患病类型,相比于现有技术,本发明通过对所述癌症患者病理图数据进行随机重抽样减少随机误差,有效提高了对癌症患者疾病类型诊断的准确性。
参考图6,图6为本发明基于多组学数据的疾病诊断设备第三实施例的流程示意图。
基于上述各实施例,在本实施例中,所述步骤S20,包括:
步骤S201:获取多例正常人健康对照的基因表达谱数据和所述待诊断基因数据中基因表达谱数据中的基因。
需要说明的是,基因表达谱代表了细胞中基因表达的状况。通过比较癌细胞和相应正常组织细胞的基因表达谱所获得的信息,就可获得在癌细胞和正常细胞中差异表达基因。
可理解的是,差异表达基因是指在不同的细胞或同一细胞的不同发育阶段,细胞表达的特定的基因,因而产生了特定的蛋白质,从而导致细胞在形态、结构和功能上的差异。基因差异表达的结果使不同细胞产生了特有的蛋白质,例如:奢侈蛋白(luxuryprotein),如成红细胞的β珠蛋白、胰岛B-细胞中的胰岛素、肝实质细胞的白蛋白等。
步骤S202:对所述基因进行基于两独立样本t检验的置换检验,获得置换检验结果,并根据所述置换检验结果筛选出差异表达基因,并提取所述差异表达基因的基因特征。
可理解的是,基于两独立样本t检验的置换检验是指在两个样本相互独立的前提下,检验两个样本的总体均数。
在具体实现中,可以对基因表达谱获取的基因使用基于两独立样本t检验的置换检验,进行1000次置换,根据置换检验的结果筛选出符合预设条件的差异表达基因,然后通过基于注意力的基因特征提取网络提取所述差异表达基因的基因特征,所述基于注意力的基因特征提取网络包括注意力机制层和全连接层,全连接层表示全连接神经网络。
本实施例通过获取同一患者的待诊断基因数据和待诊断病理图像,所述待诊断病理图像为细胞病理图像;获取多例正常人健康对照的基因表达谱数据和所述待诊断基因数据中基因表达谱数据中的基因;对所述基因进行基于两独立样本t检验的置换检验,获得置换检验结果,并根据所述置换检验结果筛选出差异表达基因,并提取所述差异表达基因的基因特征;然后通过预设特征提取模型对所述细胞病理图像进行特征提取,获得细胞病理图像特征,所述预设预设特征提取模型包括基于DenseNet网络的特征提取模块和基于双注意力的多尺度特征融合模块;将所述细胞病理图像特征与所述基因特征进行特征融合,获得待诊断融合特征,并根据所述待诊断融合特征确定所述患者的疾病类型块。本发明通过引入基于DenseNet网络的特征提取模块和基于双注意力的多尺度特征融合模块对细胞病理图像进行特征提取,获得细胞病理图像特征,然后将细胞病理图像特征与提取的基因特征进行特征融合,再根据特征融合的结果确定癌症患者的患病类型,相比于现有技术,本发明基于基因表达谱数据中的基因基于两独立样本t检验的置换检验,获得差异表达基因后,再筛选基因特征,有效避免了数据冗余,进行有效提高了对癌症患者疾病类型诊断的准确性和效率。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有基于多组学数据的疾病诊断程序,所述基于多组学数据的疾病诊断程序被处理器执行时实现以下步骤:
获取同一患者的待诊断基因数据和待诊断病理图像,所述待诊断病理图像为细胞病理图像;
基于所述待诊断基因数据筛选出差异表达基因,并提取所述差异表达基因的基因特征;
通过预设特征提取模型对所述细胞病理图像进行特征提取,获得细胞病理图像特征,所述预设预设特征提取模型包括基于DenseNet算法的特征提取模块和基于双注意力的多尺度特征融合模块;
将所述细胞病理图像特征与所述基因特征进行特征融合,获得待诊断融合特征,并根据所述待诊断融合特征确定所述患者的疾病类型。
本发明通过获取同一患者的待诊断基因数据和待诊断病理图像,所述待诊断病理图像为细胞病理图像;基于所述待诊断基因数据筛选出差异表达基因,并提取所述差异表达基因的基因特征;通过预设特征提取模型对所述细胞病理图像进行特征提取,获得细胞病理图像特征,所述预设预设特征提取模型包括基于DenseNet网络的特征提取模块和基于双注意力的多尺度特征融合模块;将所述细胞病理图像特征与所述基因特征进行特征融合,获得待诊断融合特征,并根据所述待诊断融合特征确定所述患者的疾病类型块。本发明通过引入基于DenseNet网络的特征提取模块和基于双注意力的多尺度特征融合模块对细胞病理图像进行特征提取,获得细胞病理图像特征,然后将细胞病理图像特征与提取的基因特征进行特征融合,再根据特征融合的结果确定癌症患者的患病类型,相比于现有技术,本发明有效提高了对癌症患者疾病类型诊断的准确性和效率。
参照图7,图7为本发明基于多组学数据的疾病诊断装置第一实施例的结构框图。
如图7所示,本发明实施例提出的基于多组学数据的疾病诊断装置包括:数据获取模块701、基因特征提取模块702、图像特征提取模块703和特征融合模块704。
所述数据获取模块701,用于获取同一患者的待诊断基因数据和待诊断病理图像,所述待诊断病理图像为细胞病理图像;
所述基因特征提取模块702,用于基于所述待诊断基因数据筛选出差异表达基因,并提取所述差异表达基因的基因特征;
所述图像特征提取模块703,用于通过预设特征提取模型对所述细胞病理图像进行特征提取,获得细胞病理图像特征,所述预设预设特征提取模型包括基于DenseNet算法的特征提取模块和基于双注意力的多尺度特征融合模块;
所述特征融合模块704,用于将所述细胞病理图像特征与所述基因特征进行特征融合,获得待诊断融合特征,并根据所述待诊断融合特征确定所述患者的疾病类型。
所述图像特征提取模块703,还用于将所述对所述细胞病理图像进行数据增强处理。
所述图像特征提取模块703,还用于在特征提取过程中根据预设规则缩小所述细胞病理图像的尺度,并输出所述细胞病理图像进行特征提取后的第一特征;将所述各卷积组输出的所述第一特征进行1x1非线性卷积运算,将所述第一特征的特征通道数变换至预设通道数,获得多尺度特征。
本实施例通过获取同一患者的待诊断基因数据和待诊断病理图像,所述待诊断病理图像为细胞病理图像;基于所述待诊断基因数据筛选出差异表达基因,并提取所述差异表达基因的基因特征;通过预设特征提取模型对所述细胞病理图像进行特征提取,获得细胞病理图像特征,所述预设预设特征提取模型包括基于DenseNet网络的特征提取模块和基于双注意力的多尺度特征融合模块;将所述细胞病理图像特征与所述基因特征进行特征融合,获得待诊断融合特征,并根据所述待诊断融合特征确定所述患者的疾病类型块。本发明通过引入基于DenseNet网络的特征提取模块和基于双注意力的多尺度特征融合模块对细胞病理图像进行特征提取,获得细胞病理图像特征,然后将细胞病理图像特征与提取的基因特征进行特征融合,再根据特征融合的结果确定癌症患者的患病类型,相比于现有技术,本发明有效提高了对癌症患者疾病类型诊断的准确性和效率。
本发明基于多组学数据的疾病诊断装置的其他实施例或具体实现方式可参照上述各方法实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器/随机存取存储器、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种基于多组学数据的疾病诊断设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并在所述处理器上运行的基于多组学数据的疾病诊断程序,所述基于多组学数据的疾病诊断程序被所述处理器执行时实现以下步骤:
获取同一患者的待诊断基因数据和待诊断病理图像,所述待诊断病理图像为细胞病理图像;
基于所述待诊断基因数据筛选出差异表达基因,并提取所述差异表达基因的基因特征;
通过预设特征提取模型对所述细胞病理图像进行特征提取,获得细胞病理图像特征,所述预设预设特征提取模型包括基于DenseNet网络的特征提取模块和基于双注意力的多尺度特征融合模块;
将所述细胞病理图像特征与所述基因特征进行特征融合,获得待诊断融合特征,并根据所述待诊断融合特征确定所述患者的疾病类型。
2.如权利要求1所述的设备,其特征在于,所述获取同一患者的待诊断基因数据和待诊断病理图像,所述待诊断病理图像为细胞病理图像的步骤之前,包括:
获取多组学中影像组学数据,所述影像组学数据包括癌症患者病理图数据;
对所述癌症患者病理图数据进行随机重抽样,获得多个病理图数据集;
将所述病理图数据集输入至第一训练模型中进行训练,获得预设特征提取模型,所述第一训练模型为基于注意力机制的卷积神经网络模型。
3.如权利要求1所述的设备,其特征在于,所述基于DenseNet网络的特征提取模块包括四组卷积组和1x1卷积层;
所述卷积组,用于在特征提取过程中根据预设规则缩小所述细胞病理图像的尺度,并输出所述细胞病理图像进行特征提取后的第一特征;
所述1x1卷积层,用于将所述各卷积组输出的所述第一特征进行1x1非线性卷积运算,将所述第一特征的特征通道数变换至预设通道数,获得多尺度特征。
4.如权利要求3所述的设备,其特征在于,所述基于双注意力的多尺度特征融合模块包括通道注意力运算子模块、空间注意力运算子模块和特征融合子模块;
所述通道注意力运算子模块,用于基于所述多尺度特征进行空间信息降维,通过Sigmoid函数输出通道注意力权重,并根据所述通道注意力权重获得第一过滤特征;
所述空间注意力运算子模块,用于对所述第一过滤特征进行通道信息降维,通过所述Sigmoid函数输出空间注意力权重,并根据所述空间注意力权重获得第二过滤特征;
特征融合子模块,用于根据所述第二过滤特征进行特征融合,获得细胞病理图像特征。
5.如权利要求4所述的设备,其特征在于,所述特征融合子模块包括过滤特征融合单元和异常细胞定位单元;
所述过滤特征融合单元,用于对所述多尺度特征进行上采样运算,获得上采样结果,并将所述上采样结果与所述第二过滤特征进行逐元素相加,获得融合特征;
所述异常细胞定位单元,用于将所述融合特征输入RPN 网络和Faster RCNN网络进行异常细胞定位获得定位结果,并将所述定位结果作为细胞病理图像特征。
6.如权利要求1所述的设备,其特征在于,所述基于所述待诊断基因数据筛选出差异表达基因的步骤,包括:
获取多例正常人健康对照的基因表达谱数据和所述待诊断基因数据中基因表达谱数据中的基因;
对所述基因进行基于两独立样本t检验的置换检验,获得置换检验结果,并根据所述置换检验结果筛选出差异表达基因。
7.如权利要求6所述的设备,其特征在于,所述提取所述差异表达基因的基因特征的步骤,具体包括:
通过基于注意力的基因特征提取网络提取所述差异表达基因的基因特征,所述基于注意力的基因特征提取网络包括注意力机制层和全连接层。
8.如权利要求1至7任一项所述的设备,其特征在于,所述通过预设特征提取模型对所述细胞病理图像进行特征提取,获得细胞病理图像特征的步骤之前,还包括:
将所述对所述细胞病理图像进行数据增强处理。
9.一种基于多组学数据的疾病诊断装置,其特征在于,所述装置包括:
数据获取模块,用于获取同一患者的待诊断基因数据和待诊断病理图像,所述待诊断病理图像为细胞病理图像;
基因特征提取模块,用于基于所述待诊断基因数据筛选出差异表达基因,并提取所述差异表达基因的基因特征;
图像特征提取模块,用于通过预设特征提取模型对所述细胞病理图像进行特征提取,获得细胞病理图像特征,所述预设预设特征提取模型包括基于DenseNet算法的特征提取模块和基于双注意力的多尺度特征融合模块;
特征融合模块,用于将所述细胞病理图像特征与所述基因特征进行特征融合,获得待诊断融合特征,并根据所述待诊断融合特征确定所述患者的疾病类型。
10.一种存储介质,其特征在于,所述存储介质上存储有基于多组学数据的疾病诊断程序,所述基于多组学数据的疾病诊断程序被处理器执行时实现以下步骤:
获取同一患者的待诊断基因数据和待诊断病理图像,所述待诊断病理图像为细胞病理图像;
基于所述待诊断基因数据筛选出差异表达基因,并提取所述差异表达基因的基因特征;
通过预设特征提取模型对所述细胞病理图像进行特征提取,获得细胞病理图像特征,所述预设预设特征提取模型包括基于DenseNet算法的特征提取模块和基于双注意力的多尺度特征融合模块;
将所述细胞病理图像特征与所述基因特征进行特征融合,获得待诊断融合特征,并根据所述待诊断融合特征确定所述患者的疾病类型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310851585.7A CN116580841B (zh) | 2023-07-12 | 2023-07-12 | 基于多组学数据的疾病诊断设备、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310851585.7A CN116580841B (zh) | 2023-07-12 | 2023-07-12 | 基于多组学数据的疾病诊断设备、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116580841A true CN116580841A (zh) | 2023-08-11 |
CN116580841B CN116580841B (zh) | 2023-11-10 |
Family
ID=87536373
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310851585.7A Active CN116580841B (zh) | 2023-07-12 | 2023-07-12 | 基于多组学数据的疾病诊断设备、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116580841B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112215117A (zh) * | 2020-09-30 | 2021-01-12 | 北京博雅智康科技有限公司 | 一种基于宫颈细胞学图像的异常细胞识别方法及系统 |
CN112820403A (zh) * | 2021-02-25 | 2021-05-18 | 中山大学 | 一种基于多组学数据预测癌症患者预后风险的深度学习方法 |
CN113228194A (zh) * | 2018-10-12 | 2021-08-06 | 人类长寿公司 | 用于癌症基因组和临床数据综合分析的多组学搜索引擎 |
CN113362893A (zh) * | 2020-03-06 | 2021-09-07 | 福建和瑞基因科技有限公司 | 肿瘤筛查模型的构建方法及应用 |
WO2022198050A1 (en) * | 2021-03-19 | 2022-09-22 | Cedars-Sinai Medical Center | Convolutional long short-term memory networks for rapid medical image segmentation |
CN115497623A (zh) * | 2022-09-27 | 2022-12-20 | 山东第一医科大学(山东省医学科学院) | 一种基于影像、病理和基因多组学的肺癌预后预测系统 |
CN115641957A (zh) * | 2022-11-11 | 2023-01-24 | 广州大学 | 一种基于影像基因组学的新辅助化疗疗效预测方法及系统 |
-
2023
- 2023-07-12 CN CN202310851585.7A patent/CN116580841B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113228194A (zh) * | 2018-10-12 | 2021-08-06 | 人类长寿公司 | 用于癌症基因组和临床数据综合分析的多组学搜索引擎 |
US20210319907A1 (en) * | 2018-10-12 | 2021-10-14 | Human Longevity, Inc. | Multi-omic search engine for integrative analysis of cancer genomic and clinical data |
CN113362893A (zh) * | 2020-03-06 | 2021-09-07 | 福建和瑞基因科技有限公司 | 肿瘤筛查模型的构建方法及应用 |
CN112215117A (zh) * | 2020-09-30 | 2021-01-12 | 北京博雅智康科技有限公司 | 一种基于宫颈细胞学图像的异常细胞识别方法及系统 |
CN112820403A (zh) * | 2021-02-25 | 2021-05-18 | 中山大学 | 一种基于多组学数据预测癌症患者预后风险的深度学习方法 |
WO2022198050A1 (en) * | 2021-03-19 | 2022-09-22 | Cedars-Sinai Medical Center | Convolutional long short-term memory networks for rapid medical image segmentation |
CN115497623A (zh) * | 2022-09-27 | 2022-12-20 | 山东第一医科大学(山东省医学科学院) | 一种基于影像、病理和基因多组学的肺癌预后预测系统 |
CN115641957A (zh) * | 2022-11-11 | 2023-01-24 | 广州大学 | 一种基于影像基因组学的新辅助化疗疗效预测方法及系统 |
Non-Patent Citations (1)
Title |
---|
丁其川 等: "融合长距离信道注意力与病理特征的肺结节分类", 《东北大学学报》, vol. 44, no. 04, pages 476 - 485 * |
Also Published As
Publication number | Publication date |
---|---|
CN116580841B (zh) | 2023-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101857624B1 (ko) | 임상 정보를 반영한 의료 진단 방법 및 이를 이용하는 장치 | |
US10650520B1 (en) | Systems and methods for training a statistical model to predict tissue characteristics for a pathology image | |
Zeiser et al. | Segmentation of masses on mammograms using data augmentation and deep learning | |
US8543519B2 (en) | System and method for remote melanoma screening | |
CN112101451B (zh) | 一种基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法 | |
US11189029B2 (en) | 3D radiomic platform for imaging biomarker development | |
CN112088394A (zh) | 生物组织的计算机分类 | |
CN110246109B (zh) | 融合ct影像和个性化信息的分析系统、方法、装置及介质 | |
CN108615236A (zh) | 一种图像处理方法及电子设备 | |
CN107665491A (zh) | 病理图像的识别方法及系统 | |
WO2011087807A2 (en) | System and method for remote melanoma screening | |
CN111488921A (zh) | 一种全景数字病理图像智能分析系统及方法 | |
CN112348785B (zh) | 一种癫痫病灶定位方法及系统 | |
CN111028223A (zh) | 一种微卫星不稳定肠癌能谱ct碘水图影像组学特征处理方法 | |
CN110674773A (zh) | 一种痴呆症的识别系统、装置及存储介质 | |
CN114445356A (zh) | 基于多分辨率的全视野病理切片图像肿瘤快速定位方法 | |
CN114332132A (zh) | 图像分割方法、装置和计算机设备 | |
CN116597985A (zh) | 生存率预测模型训练方法、生存期预测方法及装置、设备 | |
Prakash et al. | Meningioma brain tumor detection and classification using hybrid CNN method and RIDGELET transform | |
CN114005514A (zh) | 医学影像诊断方法、系统及装置 | |
CN107590806B (zh) | 一种基于大脑医学成像的检测方法和系统 | |
CN113627483A (zh) | 基于自监督纹理对比学习的宫颈oct图像分类方法及设备 | |
CN116580841B (zh) | 基于多组学数据的疾病诊断设备、装置及存储介质 | |
CN113705595A (zh) | 异常细胞转移程度的预测方法、装置和存储介质 | |
US20230316510A1 (en) | Systems and methods for generating biomarker activation maps |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |