CN115690109B - 基于计算生物的肿瘤细胞检测设备及其方法 - Google Patents

基于计算生物的肿瘤细胞检测设备及其方法 Download PDF

Info

Publication number
CN115690109B
CN115690109B CN202310005470.6A CN202310005470A CN115690109B CN 115690109 B CN115690109 B CN 115690109B CN 202310005470 A CN202310005470 A CN 202310005470A CN 115690109 B CN115690109 B CN 115690109B
Authority
CN
China
Prior art keywords
electrical property
matrix
blood sample
feature
sample electrical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310005470.6A
Other languages
English (en)
Other versions
CN115690109A (zh
Inventor
张开山
郭志敏
马宁
高阳
饶浪晴
李超
刘艳省
赵丹
田华
吴乐中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HANGZHOU WATSON BIOTECH Inc
Original Assignee
HANGZHOU WATSON BIOTECH Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HANGZHOU WATSON BIOTECH Inc filed Critical HANGZHOU WATSON BIOTECH Inc
Priority to CN202310005470.6A priority Critical patent/CN115690109B/zh
Publication of CN115690109A publication Critical patent/CN115690109A/zh
Application granted granted Critical
Publication of CN115690109B publication Critical patent/CN115690109B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)

Abstract

公开了一种基于计算生物的肿瘤细胞检测设备及其方法,其采用基于深度学习的人工智能技术来分别提取待检测患者的血液样本和尿液样本的电学性质检测数据的各个数据项之间基于全局的上下文高维语义关联特征信息,并以所述待检测患者的血液样本和尿液样本中的电学性质检测数据的各个数据项在高维特征空间中的相似性特征来优化电学性质特征的表达,进一步再计算这两者之间的转移矩阵来表示所述血液样本和所述尿液样本中关于电学性质特征的关联性特征分布信息,并以此进行所述待检测患者是否含有循环肿瘤细胞的检测。这样,能够智能地对于循环肿瘤细胞进行精准检测。

Description

基于计算生物的肿瘤细胞检测设备及其方法
技术领域
本申请涉及生物医药技术领域,且更为具体地,涉及一种基于计算生物的肿瘤细胞检测设备及其方法。
背景技术
癌细胞侵袭人体,可能会出现在肿瘤发展的早期。因此早期发现,早期全身治疗,将会降低癌症的死亡率。癌细胞从原发肿瘤到远处重要器官的转移是导致癌症死亡的首要原因。早期传播到淋巴结,骨髓或外周血中的肿瘤细胞被称为循环肿瘤细胞(CTC)。即使在切除原发肿瘤后,CTC可能仍然存在于病人的外周血中。
CTC对于转移的建立是非常关键的,对CTC的检测是用于评估特定肿瘤的侵略性及在远处器官生长的可能性的一种重要方法。对CTC特异敏感的检测可以用于确定癌症的发展状况、转移状态、存活的可能性及对治疗反应的评估。
随着近年来对CTC越来越多的研究,其重要性备受推崇。然而,CTC在血液中的存在量大约是十亿分之一到百亿分之一的水平。现有技术用于分离和识别CTC一方面需要大量人力并且价格昂贵,另一方面缺乏准确性和可靠性。
因此,期望一种优化的肿瘤细胞检测设备。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于计算生物的肿瘤细胞检测设备及其方法,其采用基于深度学习的人工智能技术来分别提取待检测患者的血液样本和尿液样本的电学性质检测数据的各个数据项之间基于全局的上下文高维语义关联特征信息,并以所述待检测患者的血液样本和尿液样本中的电学性质检测数据的各个数据项在高维特征空间中的相似性特征来优化电学性质特征的表达,进一步再计算这两者之间的转移矩阵来表示所述血液样本和所述尿液样本中关于电学性质特征的关联性特征分布信息,并以此进行所述待检测患者是否含有循环肿瘤细胞的检测。这样,能够智能地对于循环肿瘤细胞进行精准检测。
相应地,根据本申请的一个方面,提供了一种基于计算生物的肿瘤细胞检测设备,其包括:
检测数据采集模块,用于获取待检测患者的血液样本的电学性质检测数据和所述待检测患者的尿液样本的电学性质检测数据;
血液样本电学性质数据编码模块,用于将所述待检测患者的血液样本的电学性质检测数据中各个数据项通过基于转换器的上下文编码器以得到多个血液样本电学性质特征向量;
度量模块,用于计算所述多个血液样本电学性质特征向量中每两个血液样本电学性质特征向量之间的距离以得到相似度度量矩阵;
相似拓扑特征提取模块,用于将所述相似度度量矩阵通过作为特征提取器的卷积神经网络模型以得到相似度度量特征矩阵;
矩阵化模块,用于将所述多个血液样本电学性质特征向量二维排列为血液样本电学性质特征矩阵;
图网络编码模块,用于将所述相似度度量特征矩阵和所述血液样本电学性质特征矩阵通过图神经网络以得到图结构血液样本电学性质特征矩阵;
尿液样本电学性质数据特征提取模块,用于通过所述基于转换器的上下文编码器、所述作为特征提取器的卷积神经网络模型和所述图神经网络模型,从所述待检测患者的尿液样本的电学性质检测数据得到图结构尿液样本电学性质特征矩阵;
关联模块,用于计算所述图结构血液样本电学性质特征矩阵相对于所述图结构尿液样本电学性质特征矩阵的转移矩阵作为分类特征矩阵;
特征分布校正模块,用于对所述分类特征矩阵进行特征分布校正以得到校正后分类特征矩阵;以及
检测结果生成模块,用于将所述校正后分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示是否含有循环肿瘤细胞。
在上述基于计算生物的肿瘤细胞检测设备中,所述血液样本电学性质数据编码模块,包括:独热编码单元,用于对所述待检测患者的血液样本的电学性质检测数据中各个数据项进行独热编码以得到多个血液样本电学性质向量;以及,上下文语义编码单元,用于将所述多个血液样本电学性质向量输入所述基于转换器的上下文编码器以得到所述多个血液样本电学性质特征向量。
在上述基于计算生物的肿瘤细胞检测设备中,所述上下文语义编码单元,进一步用于:将所述多个血液样本电学性质向量排列为输入向量;将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及,将所述自注意力特征矩阵与以所述多个血液样本电学性质向量中各个血液样本电学性质向量作为值向量分别进行相乘以得到所述多个血液样本电学性质特征向量。
在上述基于计算生物的肿瘤细胞检测设备中,所述度量模块,包括:相似度计算单元,用于以如下公式来计算所述多个血液样本电学性质特征向量中每两个血液样本电学性质特征向量之间的距离以得到多个相似度;其中,所述公式为:
Figure 825653DEST_PATH_IMAGE001
其中
Figure 740520DEST_PATH_IMAGE002
分别表示所述多个血液样本电学性质特征向量中每两个血液样本电学 性质特征向量,
Figure 136866DEST_PATH_IMAGE003
分别表示所述多个血液样本电学性质特征向量中每两个血液样本 电学性质特征向量的各个位置的特征值,
Figure 243100DEST_PATH_IMAGE004
表示所述多个血液样本电学性质特征向 量中每两个血液样本电学性质特征向量之间的所述相似度;以及,二维排列单元,用于将所 述多个相似度进行二维排列以得到所述相似度度量矩阵。
在上述基于计算生物的肿瘤细胞检测设备中,所述相似拓扑特征提取模块,进一步用于:使用所述卷积神经网络模型的各层在层的正向传递中分别进行:对输入数据进行卷积处理以得到卷积特征图;对所述卷积特征图进行基于局部特征矩阵的均值池化以得到池化特征图;以及,对所述池化特征图进行非线性激活以得到激活特征图;其中,所述卷积神经网络模型的最后一层的输出为所述相似度度量特征矩阵,所述卷积神经网络模型的第一层的输入为所述相似度度量矩阵。
在上述基于计算生物的肿瘤细胞检测设备中,所述图网络编码模块,进一步用于:所述图神经网络通过可学习的权重参数对所述相似度度量特征矩阵和所述血液样本电学性质特征矩阵进行图结构数据编码以得到包含全局拓扑空间相似特征和电学性质关联特征的所述图结构血液样本电学性质特征矩阵。
在上述基于计算生物的肿瘤细胞检测设备中,所述关联模块,进一步用于:以如下公式计算所述图结构血液样本电学性质特征矩阵相对于所述图结构尿液样本电学性质特征矩阵的转移矩阵作为分类特征矩阵;其中,所述公式为:
Figure 295370DEST_PATH_IMAGE005
=
Figure 13927DEST_PATH_IMAGE006
其中
Figure 468042DEST_PATH_IMAGE005
表示所述图结构血液样本电学性质特征矩阵,
Figure 981063DEST_PATH_IMAGE007
表示所述图结构尿液样 本电学性质特征矩阵,
Figure 520629DEST_PATH_IMAGE008
表示所述转移矩阵,
Figure 42877DEST_PATH_IMAGE009
表示矩阵相乘。
在上述基于计算生物的肿瘤细胞检测设备中,所述特征分布校正模块,包括:校正因子计算单元,用于采用全正投影非线性重加权的方式以如下公式计算所述图结构血液样本电学性质特征矩阵和所述图结构尿液样本电学性质特征矩阵之间的权重矩阵;其中,所述公式为:
Figure 148236DEST_PATH_IMAGE010
其中,
Figure 97738DEST_PATH_IMAGE011
Figure 360485DEST_PATH_IMAGE012
分别为所述图结构血液样本电学性质特征矩阵和所述图结构尿液 样本电学性质特征矩阵通过线性转换得到的对角矩阵,
Figure 686424DEST_PATH_IMAGE013
是所述权重矩阵,
Figure 583973DEST_PATH_IMAGE014
表示
Figure 704376DEST_PATH_IMAGE015
激活函数,
Figure 218534DEST_PATH_IMAGE009
表示矩阵相乘,且分子矩阵和分母矩阵之间的除法为矩阵特征值的按位 置相除,
Figure 82585DEST_PATH_IMAGE016
表示矩阵的指数运算,所述矩阵的指数运算表示计算以矩阵中各个位置的特 征值为幂的自然指数函数值;以及,加权校正单元,用于以所述权重矩阵对所述分类特征矩 阵进行点乘以得到所述校正后分类特征矩阵。
在上述基于计算生物的肿瘤细胞检测设备中,所述检测结果生成模块,包括:展开单元,用于将所述校正后分类特征矩阵按照行向量或者列向量展开为分类特征向量;全连接编码单元,用于使用所述分类器的全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量;以及,分类结果生成单元,用于将所述编码分类特征向量输入所述分类器的Softmax分类函数以得到所述分类结果。
根据本申请的另一方面,还提供了一种基于计算生物的肿瘤细胞检测方法,其包括:
获取待检测患者的血液样本的电学性质检测数据和所述待检测患者的尿液样本的电学性质检测数据;
将所述待检测患者的血液样本的电学性质检测数据中各个数据项通过基于转换器的上下文编码器以得到多个血液样本电学性质特征向量;
计算所述多个血液样本电学性质特征向量中每两个血液样本电学性质特征向量之间的距离以得到相似度度量矩阵;
将所述相似度度量矩阵通过作为特征提取器的卷积神经网络模型以得到相似度度量特征矩阵;
将所述多个血液样本电学性质特征向量二维排列为血液样本电学性质特征矩阵;
将所述相似度度量特征矩阵和所述血液样本电学性质特征矩阵通过图神经网络以得到图结构血液样本电学性质特征矩阵;
通过所述基于转换器的上下文编码器、所述作为特征提取器的卷积神经网络模型和所述图神经网络模型,从所述待检测患者的尿液样本的电学性质检测数据得到图结构尿液样本电学性质特征矩阵;
计算所述图结构血液样本电学性质特征矩阵相对于所述图结构尿液样本电学性质特征矩阵的转移矩阵作为分类特征矩阵;
对所述分类特征矩阵进行特征分布校正以得到校正后分类特征矩阵;以及
将所述校正后分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示是否含有循环肿瘤细胞。
在上述基于计算生物的肿瘤细胞检测方法中,所述将所述待检测患者的血液样本的电学性质检测数据中各个数据项通过基于转换器的上下文编码器以得到多个血液样本电学性质特征向量,包括:对所述待检测患者的血液样本的电学性质检测数据中各个数据项进行独热编码以得到多个血液样本电学性质向量;以及,将所述多个血液样本电学性质向量输入所述基于转换器的上下文编码器以得到所述多个血液样本电学性质特征向量。
在上述基于计算生物的肿瘤细胞检测方法中,所述将所述多个血液样本电学性质向量输入所述基于转换器的上下文编码器以得到所述多个血液样本电学性质特征向量,包括:将所述多个血液样本电学性质向量排列为输入向量;将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及,将所述自注意力特征矩阵与以所述多个血液样本电学性质向量中各个血液样本电学性质向量作为值向量分别进行相乘以得到所述多个血液样本电学性质特征向量。
在上述基于计算生物的肿瘤细胞检测方法中,所述计算所述多个血液样本电学性质特征向量中每两个血液样本电学性质特征向量之间的距离以得到相似度度量矩阵,包括:以如下公式来计算所述多个血液样本电学性质特征向量中每两个血液样本电学性质特征向量之间的距离以得到多个相似度;其中,所述公式为:
Figure 100219DEST_PATH_IMAGE001
其中
Figure 657102DEST_PATH_IMAGE002
分别表示所述多个血液样本电学性质特征向量中每两个血液样本电学 性质特征向量,
Figure 189715DEST_PATH_IMAGE003
分别表示所述多个血液样本电学性质特征向量中每两个血液样本电 学性质特征向量的各个位置的特征值,
Figure 90413DEST_PATH_IMAGE004
表示所述多个血液样本电学性质特征向量中 每两个血液样本电学性质特征向量之间的所述相似度;以及,将所述多个相似度进行二维 排列以得到所述相似度度量矩阵。
在上述基于计算生物的肿瘤细胞检测方法中,所述将所述相似度度量矩阵通过作为特征提取器的卷积神经网络模型以得到相似度度量特征矩阵,包括:使用所述卷积神经网络模型的各层在层的正向传递中分别进行:对输入数据进行卷积处理以得到卷积特征图;对所述卷积特征图进行基于局部特征矩阵的均值池化以得到池化特征图;以及,对所述池化特征图进行非线性激活以得到激活特征图;其中,所述卷积神经网络模型的最后一层的输出为所述相似度度量特征矩阵,所述卷积神经网络模型的第一层的输入为所述相似度度量矩阵。
在上述基于计算生物的肿瘤细胞检测方法中,所述将所述相似度度量特征矩阵和所述血液样本电学性质特征矩阵通过图神经网络以得到图结构血液样本电学性质特征矩阵,包括:所述图神经网络通过可学习的权重参数对所述相似度度量特征矩阵和所述血液样本电学性质特征矩阵进行图结构数据编码以得到包含全局拓扑空间相似特征和电学性质关联特征的所述图结构血液样本电学性质特征矩阵。
在上述基于计算生物的肿瘤细胞检测方法中,所述计算所述图结构血液样本电学性质特征矩阵相对于所述图结构尿液样本电学性质特征矩阵的转移矩阵作为分类特征矩阵,包括:以如下公式计算所述图结构血液样本电学性质特征矩阵相对于所述图结构尿液样本电学性质特征矩阵的转移矩阵作为分类特征矩阵;其中,所述公式为:
Figure 228133DEST_PATH_IMAGE005
=
Figure 955917DEST_PATH_IMAGE006
其中
Figure 913509DEST_PATH_IMAGE005
表示所述图结构血液样本电学性质特征矩阵,
Figure 119363DEST_PATH_IMAGE007
表示所述图结构尿液样 本电学性质特征矩阵,
Figure 111589DEST_PATH_IMAGE008
表示所述转移矩阵,
Figure 744696DEST_PATH_IMAGE009
表示矩阵相乘。
在上述基于计算生物的肿瘤细胞检测方法中,所述对所述分类特征矩阵进行特征分布校正以得到校正后分类特征矩阵,包括:采用全正投影非线性重加权的方式以如下公式计算所述图结构血液样本电学性质特征矩阵和所述图结构尿液样本电学性质特征矩阵之间的权重矩阵;其中,所述公式为:
Figure 455163DEST_PATH_IMAGE010
其中,
Figure 220033DEST_PATH_IMAGE011
Figure 801187DEST_PATH_IMAGE012
分别为所述图结构血液样本电学性质特征矩阵和所述图结构尿液 样本电学性质特征矩阵通过线性转换得到的对角矩阵,
Figure 870774DEST_PATH_IMAGE013
是所述权重矩阵,
Figure 802958DEST_PATH_IMAGE014
表示
Figure 616193DEST_PATH_IMAGE015
激活函数,
Figure 583012DEST_PATH_IMAGE009
表示矩阵相乘,且分子矩阵和分母矩阵之间的除法为矩阵特征值的按位 置相除,
Figure 823501DEST_PATH_IMAGE016
表示矩阵的指数运算,所述矩阵的指数运算表示计算以矩阵中各个位置的特 征值为幂的自然指数函数值;以及,以所述权重矩阵对所述分类特征矩阵进行点乘以得到 所述校正后分类特征矩阵。
在上述基于计算生物的肿瘤细胞检测方法中,所述将所述校正后分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示是否含有循环肿瘤细胞,包括:将所述校正后分类特征矩阵按照行向量或者列向量展开为分类特征向量;使用所述分类器的全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量;以及,将所述编码分类特征向量输入所述分类器的Softmax分类函数以得到所述分类结果。
与现有技术相比,本申请提供的基于计算生物的肿瘤细胞检测设备及其方法,其采用基于深度学习的人工智能技术来分别提取待检测患者的血液样本和尿液样本的电学性质检测数据的各个数据项之间基于全局的上下文高维语义关联特征信息,并以所述待检测患者的血液样本和尿液样本中的电学性质检测数据的各个数据项在高维特征空间中的相似性特征来优化电学性质特征的表达,进一步再计算这两者之间的转移矩阵来表示所述血液样本和所述尿液样本中关于电学性质特征的关联性特征分布信息,并以此进行所述待检测患者是否含有循环肿瘤细胞的检测。这样,能够智能地对于循环肿瘤细胞进行精准检测。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1为根据本申请实施例的基于计算生物的肿瘤细胞检测设备的框图。
图2为根据本申请实施例的基于计算生物的肿瘤细胞检测设备的架构示意图。
图3为根据本申请实施例的基于计算生物的肿瘤细胞检测设备中血液样本电学性质数据编码模块的框图。
图4为根据本申请实施例的基于计算生物的肿瘤细胞检测设备中检测结果生成模块的框图。
图5为根据本申请实施例的基于计算生物的肿瘤细胞检测方法的流程图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
申请概述
如上述背景技术所言,随着近年来对CTC越来越多的研究,其重要性备受推崇。然而,CTC在血液中的存在量大约是十亿分之一到百亿分之一的水平。现有技术用于分离和识别CTC一方面需要大量人力并且价格昂贵,另一方面缺乏准确性和可靠性。因此,期望一种优化的肿瘤细胞检测设备。
目前,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、语音信号处理等领域。此外,深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域,也展现出了接近甚至超越人类的水平。
近年来,深度学习以及神经网络的发展为肿瘤细胞的智能检测提供了新的解决思路和方案。
相应地,为了能够提高对于肿瘤细胞检测的精准度,期望利用被检测患者的不同样本的检测特征之间的关联,以此来判断患者体内是否含有CTC。例如,通过血液样本的电学特性,以及,尿液样本的电学特征,并融合两者特征来进行智能判断。具体地,在本申请的技术方案中,采用基于深度学习的人工智能技术来分别提取待检测患者的血液样本和尿液样本的电学性质检测数据的各个数据项之间基于全局的上下文高维语义关联特征信息,并以所述待检测患者的血液样本和尿液样本中的电学性质检测数据的各个数据项在高维特征空间中的相似性特征来优化电学性质特征的表达,进一步再计算这两者之间的转移矩阵来表示所述血液样本和所述尿液样本中关于电学性质特征的关联性特征分布信息,并以此进行所述待检测患者是否含有循环肿瘤细胞的检测。也就是,将人工智能技术与生物医药技术相结合以构建用于CTC细胞检测的计算生物方案。这样,能够智能地对于循环肿瘤细胞进行精准检测。
具体地,在本申请的技术方案中,首先,获取待检测患者的血液样本的电学性质检测数据和所述待检测患者的尿液样本的电学性质检测数据。特别地,这里,所述电学性质检测数据包括:表面电荷,表面电位,静息电位,电流,电场分布,表面电荷分布,细胞电学性质,细胞表面电学性质,电学性质的动态变化,细胞电学性质的动态变化,细胞表面电学性质的动态变化,表面电学性质的动态变化,细胞膜的电学性质,膜表面的电学性质的动态变化,细胞膜电学性质的动态变化,电偶极子,双电偶极子,电信号的振荡(例如,在离子振荡,电场脉冲,表面电荷脉冲,电压脉冲),电流,电容,三维电子或电荷云分布,端粒DNA和染色体,电容或阻抗的电性质。
接着,对于所述待检测患者的血液样本的电学性质来说,由于所述血液样本的电学性质中含有多个数据项,并且这些数据项之间具有着关联性的特征信息,因此,进一步将所述待检测患者的血液样本的电学性质检测数据中各个数据项通过基于转换器的上下文编码器中进行编码,以提取所述电学性质检测数据中各个数据项的以所述数据项全局为上下文背景的高维语义关联信息,从而得到多个血液样本电学性质特征向量。
然后,还考虑到在对于所述血液样本的电学性质检测数据中的各个数据项进行关联特征提取时,由于所述各个数据项中的不同数据项间具有着不同的相似性特征,若能够利用这些相似性特征分布信息来进行所述血液样本的电学性质特征增强,显然能够提高对于循环肿瘤细胞检测的准确度。基于此,在本申请的技术方案中,进一步计算所述多个血液样本电学性质特征向量中每两个血液样本电学性质特征向量之间的距离以得到相似度度量矩阵。接着,将所述相似度度量矩阵通过作为特征提取器的卷积神经网络模型中进行特征挖掘,以提取出所述血液样本的电学性质检测数据中的各个数据项间的相似度关联特征分布信息,从而得到相似度度量特征矩阵。
进一步地,以所述多个血液样本电学性质特征向量中的各个血液样本电学性质特征向量作为节点的特征表示,而以所述血液样本电学性质特征矩阵作为节点与节点之间的边的特征表示,将由所述多个血液样本电学性质特征向量经二维排列得到的血液样本电学性质特征矩阵和所述血液样本电学性质特征矩阵通过图神经网络以得到图结构血液样本电学性质特征矩阵。具体地,所述图神经网络通过可学习的神经网络参数对所述相似度度量特征矩阵和所述血液样本电学性质特征矩阵进行图结构数据编码以得到包含全局拓扑空间相似特征和电学性质关联特征信息的所述图结构血液样本电学性质特征矩阵。也就是,以所述血液样本的电学性质检测数据的各个数据项的高维特征表示为节点,而以所述电学性质检测数据的各个数据项的特征表示之间的距离表示节点与节点之间的边,以此来提取包含全局拓扑空间相似信息的关于血液样本的电学性质特征表示,从而得到图结构血液样本电学性质特征矩阵。
相应地,对于所述待检测患者的尿液样本的电学性质检测数据特征挖掘过程中,发现所述尿液样本的电学性质检测数据特征与所述血液样本的电学性质检测数据特征之间具有着相似的特征分布信息。因此,在本申请的技术方案中,通过所述基于转换器的上下文编码器、所述作为特征提取器的卷积神经网络模型和所述图神经网络模型,从所述待检测患者的尿液样本的电学性质检测数据得到包含全局拓扑空间相似信息的关于尿液样本的电学性质特征表示的图结构尿液样本电学性质特征矩阵。
然后,再计算所述图结构血液样本电学性质特征矩阵相对于所述图结构尿液样本电学性质特征矩阵的转移矩阵,以所述转移矩阵来表示所述血液样本的电学性质特征表示与所述尿液样本的电学性质特征表示之间的关联性特征分布信息,并以此作为分类特征矩阵通过分类器中进行分类处理以得到用于表示是否含有循环肿瘤细胞的分类结果。这样,能够准确地对于循环肿瘤细胞进行检测。
特别地,在本申请的技术方案中,在计算所述图结构血液样本电学性质特征矩阵和所述图结构尿液样本电学性质特征矩阵之间的转移矩阵作为所述分类特征矩阵时,由于所述图结构血液样本电学性质特征矩阵用于表达血液样本的各项电学性质的全局相似度拓扑关联,而所述图结构尿液样本电学性质特征矩阵用于表达尿液样本的各项电学性质的全局相似度拓扑关联,因此其不一定能够保持完全同相分布,也就是,其间可能存在负相关关系,从而导致计算所述图结构血液样本电学性质特征矩阵和所述图结构尿液样本电学性质特征矩阵之间的转移矩阵得到的所述分类特征矩阵中存在负相关关系,影响所述分类特征矩阵的分类准确性。
因此,本申请的申请人采用全正投影非线性重加权的方式计算所述图结构血液样本电学性质特征矩阵和所述图结构尿液样本电学性质特征矩阵之间的权重矩阵,表示为:
Figure 242981DEST_PATH_IMAGE010
Figure 92863DEST_PATH_IMAGE011
Figure 914188DEST_PATH_IMAGE012
分别为所述图结构血液样本电学性质特征矩阵和所述图结构尿液样本电 学性质特征矩阵通过线性转换得到的对角矩阵,
Figure 59999DEST_PATH_IMAGE017
是所述权重矩阵,且分子矩阵和分母矩 阵之间的除法为矩阵特征值的按位置相除。
这里,所述全正投影非线性重加权通过
Figure 966775DEST_PATH_IMAGE015
函数来保证投影的全正以避免聚合负 相关的信息,并同时引入非线性重加权机制来相对于彼此聚集所述图结构血液样本电学性 质特征矩阵和所述图结构尿液样本电学性质特征矩阵的特征值分布,以使得所述权重矩阵 的内在结构能够惩罚远距离连接而加强局部性耦合。这样,通过以所述权重矩阵对所述分 类特征矩阵进行点乘以进行按位置加权,就实现了所述分类特征矩阵在高维特征空间内的 与全正投影重加权对应的空间特征变换(feature transform)的协同效果,也就提升了所 述分类特征矩阵的分类准确性。这样,能够智能地对于循环肿瘤细胞进行精准检测。
基于此,本申请提供了一种基于计算生物的肿瘤细胞检测设备,其包括:检测数据采集模块,用于获取待检测患者的血液样本的电学性质检测数据和所述待检测患者的尿液样本的电学性质检测数据;血液样本电学性质数据编码模块,用于将所述待检测患者的血液样本的电学性质检测数据中各个数据项通过基于转换器的上下文编码器以得到多个血液样本电学性质特征向量;度量模块,用于计算所述多个血液样本电学性质特征向量中每两个血液样本电学性质特征向量之间的距离以得到相似度度量矩阵;相似拓扑特征提取模块,用于将所述相似度度量矩阵通过作为特征提取器的卷积神经网络模型以得到相似度度量特征矩阵;矩阵化模块,用于将所述多个血液样本电学性质特征向量二维排列为血液样本电学性质特征矩阵;图网络编码模块,用于将所述相似度度量特征矩阵和所述血液样本电学性质特征矩阵通过图神经网络以得到图结构血液样本电学性质特征矩阵;尿液样本电学性质数据特征提取模块,用于通过所述基于转换器的上下文编码器、所述作为特征提取器的卷积神经网络模型和所述图神经网络模型,从所述待检测患者的尿液样本的电学性质检测数据得到图结构尿液样本电学性质特征矩阵;关联模块,用于计算所述图结构血液样本电学性质特征矩阵相对于所述图结构尿液样本电学性质特征矩阵的转移矩阵作为分类特征矩阵;特征分布校正模块,用于对所述分类特征矩阵进行特征分布校正以得到校正后分类特征矩阵;以及,检测结果生成模块,用于将所述校正后分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示是否含有循环肿瘤细胞。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
示例性系统
图1为根据本申请实施例的基于计算生物的肿瘤细胞检测设备的框图。如图1所示,根据本申请实施例的基于计算生物的肿瘤细胞检测设备100,包括:检测数据采集模块110,用于获取待检测患者的血液样本的电学性质检测数据和所述待检测患者的尿液样本的电学性质检测数据;血液样本电学性质数据编码模块120,用于将所述待检测患者的血液样本的电学性质检测数据中各个数据项通过基于转换器的上下文编码器以得到多个血液样本电学性质特征向量;度量模块130,用于计算所述多个血液样本电学性质特征向量中每两个血液样本电学性质特征向量之间的距离以得到相似度度量矩阵;相似拓扑特征提取模块140,用于将所述相似度度量矩阵通过作为特征提取器的卷积神经网络模型以得到相似度度量特征矩阵;矩阵化模块150,用于将所述多个血液样本电学性质特征向量二维排列为血液样本电学性质特征矩阵;图网络编码模块160,用于将所述相似度度量特征矩阵和所述血液样本电学性质特征矩阵通过图神经网络以得到图结构血液样本电学性质特征矩阵;尿液样本电学性质数据特征提取模块170,用于通过所述基于转换器的上下文编码器、所述作为特征提取器的卷积神经网络模型和所述图神经网络模型,从所述待检测患者的尿液样本的电学性质检测数据得到图结构尿液样本电学性质特征矩阵;关联模块180,用于计算所述图结构血液样本电学性质特征矩阵相对于所述图结构尿液样本电学性质特征矩阵的转移矩阵作为分类特征矩阵;特征分布校正模块190,用于对所述分类特征矩阵进行特征分布校正以得到校正后分类特征矩阵;以及,检测结果生成模块200,用于将所述校正后分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示是否含有循环肿瘤细胞。
图2为根据本申请实施例的基于计算生物的肿瘤细胞检测设备的架构示意图。如图2所示,首先,获取待检测患者的血液样本的电学性质检测数据和所述待检测患者的尿液样本的电学性质检测数据。接着,将所述待检测患者的血液样本的电学性质检测数据中各个数据项通过基于转换器的上下文编码器以得到多个血液样本电学性质特征向量。然后,计算所述多个血液样本电学性质特征向量中每两个血液样本电学性质特征向量之间的距离以得到相似度度量矩阵。进而,将所述相似度度量矩阵通过作为特征提取器的卷积神经网络模型以得到相似度度量特征矩阵。接着,将所述多个血液样本电学性质特征向量二维排列为血液样本电学性质特征矩阵。然后,将所述相似度度量特征矩阵和所述血液样本电学性质特征矩阵通过图神经网络以得到图结构血液样本电学性质特征矩阵,与此同时,通过所述基于转换器的上下文编码器、所述作为特征提取器的卷积神经网络模型和所述图神经网络模型,从所述待检测患者的尿液样本的电学性质检测数据得到图结构尿液样本电学性质特征矩阵。接着,计算所述图结构血液样本电学性质特征矩阵相对于所述图结构尿液样本电学性质特征矩阵的转移矩阵作为分类特征矩阵。然后,对所述分类特征矩阵进行特征分布校正以得到校正后分类特征矩阵。进而,将所述校正后分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示是否含有循环肿瘤细胞。
在上述基于计算生物的肿瘤细胞检测设备100中,所述检测数据采集模块110,用于获取待检测患者的血液样本的电学性质检测数据和所述待检测患者的尿液样本的电学性质检测数据。如上述背景技术所言,随着近年来对CTC越来越多的研究,其重要性备受推崇。然而,CTC在血液中的存在量大约是十亿分之一到百亿分之一的水平。现有技术用于分离和识别CTC一方面需要大量人力并且价格昂贵,另一方面缺乏准确性和可靠性。因此,期望一种优化的肿瘤细胞检测设备。
相应地,为了能够提高对于肿瘤细胞检测的精准度,期望利用被检测患者的不同样本的检测特征之间的关联,以此来判断患者体内是否含有CTC。例如,通过血液样本的电学特性,以及,尿液样本的电学特征,并融合两者特征来进行智能判断。具体地,在本申请的技术方案中,采用基于深度学习的人工智能技术来分别提取待检测患者的血液样本和尿液样本的电学性质检测数据的各个数据项之间基于全局的上下文高维语义关联特征信息,并以所述待检测患者的血液样本和尿液样本中的电学性质检测数据的各个数据项在高维特征空间中的相似性特征来优化电学性质特征的表达,进一步再计算这两者之间的转移矩阵来表示所述血液样本和所述尿液样本中关于电学性质特征的关联性特征分布信息,并以此进行所述待检测患者是否含有循环肿瘤细胞的检测。也就是,将人工智能技术与生物医药技术相结合以构建用于CTC细胞检测的计算生物方案。这样,能够智能地对于循环肿瘤细胞进行精准检测。
具体地,在本申请的技术方案中,首先,获取待检测患者的血液样本的电学性质检测数据和所述待检测患者的尿液样本的电学性质检测数据。特别地,这里,所述电学性质检测数据包括:表面电荷,表面电位,静息电位,电流,电场分布,表面电荷分布,细胞电学性质,细胞表面电学性质,电学性质的动态变化,细胞电学性质的动态变化,细胞表面电学性质的动态变化,表面电学性质的动态变化,细胞膜的电学性质,膜表面的电学性质的动态变化,细胞膜电学性质的动态变化,电偶极子,双电偶极子,电信号的振荡(例如,在离子振荡,电场脉冲,表面电荷脉冲,电压脉冲),电流,电容,三维电子或电荷云分布,端粒DNA和染色体,电容或阻抗的电性质。
在上述基于计算生物的肿瘤细胞检测设备100中,所述血液样本电学性质数据编码模块120,用于将所述待检测患者的血液样本的电学性质检测数据中各个数据项通过基于转换器的上下文编码器以得到多个血液样本电学性质特征向量。对于所述待检测患者的血液样本的电学性质来说,由于所述血液样本的电学性质中含有多个数据项,并且这些数据项之间具有着关联性的特征信息,因此,进一步将所述待检测患者的血液样本的电学性质检测数据中各个数据项通过基于转换器的上下文编码器中进行编码,以提取所述电学性质检测数据中各个数据项的以所述数据项全局为上下文背景的高维语义关联信息,从而得到多个血液样本电学性质特征向量。
图3为根据本申请实施例的基于计算生物的肿瘤细胞检测设备中血液样本电学性质数据编码模块的框图。如图3所示,所述血液样本电学性质数据编码模块120,包括:独热编码单元121,用于对所述待检测患者的血液样本的电学性质检测数据中各个数据项进行独热编码以得到多个血液样本电学性质向量;以及,上下文语义编码单元122,用于将所述多个血液样本电学性质向量输入所述基于转换器的上下文编码器以得到所述多个血液样本电学性质特征向量。这里,所述独热编码(One-Hot Encoding),又称一位有效编码,其方法是使用N位数值来对N个状态进行编码,并且在任意时候,其中只有一位有效。即,只有一位是1,其余都是零值。也就是,独热编码是利用0和1表示一些参数,使用N位数值来对N个状态进行编码。应可以理解,在这里使用独热编码对所述血液样本电学性质检测数据中各个数据项进行编码的目的是使其结构化,进而使得所述基于转换器的上下文编码器可以对其进行数据处理与分析。
具体地,在本申请实施例中,所述上下文语义编码单元122,进一步用于:将所述多个血液样本电学性质向量排列为输入向量;将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及,将所述自注意力特征矩阵与以所述多个血液样本电学性质向量中各个血液样本电学性质向量作为值向量分别进行相乘以得到所述多个血液样本电学性质特征向量。
在上述基于计算生物的肿瘤细胞检测设备100中,所述度量模块130,用于计算所述多个血液样本电学性质特征向量中每两个血液样本电学性质特征向量之间的距离以得到相似度度量矩阵。考虑到在对于所述血液样本的电学性质检测数据中的各个数据项进行关联特征提取时,由于所述各个数据项中的不同数据项间具有着不同的相似性特征,若能够利用这些相似性特征分布信息来进行所述血液样本的电学性质特征增强,显然能够提高对于循环肿瘤细胞检测的准确度。基于此,在本申请的技术方案中,进一步计算所述多个血液样本电学性质特征向量中每两个血液样本电学性质特征向量之间的距离以得到相似度度量矩阵。
具体地,在本申请实施例中,所述度量模块130,包括:相似度计算单元,用于以如下公式来计算所述多个血液样本电学性质特征向量中每两个血液样本电学性质特征向量之间的距离以得到多个相似度;其中,所述公式为:
Figure 121813DEST_PATH_IMAGE001
其中
Figure 797645DEST_PATH_IMAGE002
分别表示所述多个血液样本电学性质特征向量中每两个血液样本电学 性质特征向量,
Figure 379936DEST_PATH_IMAGE003
分别表示所述多个血液样本电学性质特征向量中每两个血液样本电 学性质特征向量的各个位置的特征值,
Figure 774008DEST_PATH_IMAGE018
表示所述多个血液样本电学性质特征向量中 每两个血液样本电学性质特征向量之间的所述相似度;以及,二维排列单元,用于将所述多 个相似度进行二维排列以得到所述相似度度量矩阵。
在上述基于计算生物的肿瘤细胞检测设备100中,所述相似拓扑特征提取模块140,用于将所述相似度度量矩阵通过作为特征提取器的卷积神经网络模型以得到相似度度量特征矩阵。也就是,在得到所述相似度度量矩阵之后,将其通过作为特征提取器的卷积神经网络模型中进行特征挖掘,以提取出所述血液样本的电学性质检测数据中的各个数据项间的相似度关联特征分布信息,从而得到相似度度量特征矩阵。
具体地,在本申请实施例中,所述相似拓扑特征提取模块140,进一步用于:使用所述卷积神经网络模型的各层在层的正向传递中分别进行:对输入数据进行卷积处理以得到卷积特征图;对所述卷积特征图进行基于局部特征矩阵的均值池化以得到池化特征图;以及,对所述池化特征图进行非线性激活以得到激活特征图;其中,所述卷积神经网络模型的最后一层的输出为所述相似度度量特征矩阵,所述卷积神经网络模型的第一层的输入为所述相似度度量矩阵。
在上述基于计算生物的肿瘤细胞检测设备100中,所述矩阵化模块150,用于将所述多个血液样本电学性质特征向量二维排列为血液样本电学性质特征矩阵。这里,将所述多个血液样本电学性质特征向量进行二维排列以进行维度统一,进而便于后续模型的计算。
在上述基于计算生物的肿瘤细胞检测设备100中,所述图网络编码模块160,用于将所述相似度度量特征矩阵和所述血液样本电学性质特征矩阵通过图神经网络以得到图结构血液样本电学性质特征矩阵。也就是,以所述多个血液样本电学性质特征向量中的各个血液样本电学性质特征向量作为节点的特征表示,而以所述血液样本电学性质特征矩阵作为节点与节点之间的边的特征表示,将由所述多个血液样本电学性质特征向量经二维排列得到的血液样本电学性质特征矩阵和所述血液样本电学性质特征矩阵通过图神经网络以得到图结构血液样本电学性质特征矩阵。
具体地,所述图神经网络通过可学习的神经网络参数对所述相似度度量特征矩阵和所述血液样本电学性质特征矩阵进行图结构数据编码以得到包含全局拓扑空间相似特征和电学性质关联特征信息的所述图结构血液样本电学性质特征矩阵。也就是,以所述血液样本的电学性质检测数据的各个数据项的高维特征表示为节点,而以所述电学性质检测数据的各个数据项的特征表示之间的距离表示节点与节点之间的边,以此来提取包含全局拓扑空间相似信息的关于血液样本的电学性质特征表示,从而得到图结构血液样本电学性质特征矩阵。
在上述基于计算生物的肿瘤细胞检测设备100中,所述尿液样本电学性质数据特征提取模块170,用于通过所述基于转换器的上下文编码器、所述作为特征提取器的卷积神经网络模型和所述图神经网络模型,从所述待检测患者的尿液样本的电学性质检测数据得到图结构尿液样本电学性质特征矩阵。相应地,对于所述待检测患者的尿液样本的电学性质检测数据特征挖掘过程中,发现所述尿液样本的电学性质检测数据特征与所述血液样本的电学性质检测数据特征之间具有着相似的特征分布信息。因此,在本申请的技术方案中,同样地,通过所述基于转换器的上下文编码器、所述作为特征提取器的卷积神经网络模型和所述图神经网络模型,从所述待检测患者的尿液样本的电学性质检测数据得到包含全局拓扑空间相似信息的关于尿液样本的电学性质特征表示的图结构尿液样本电学性质特征矩阵。
在上述基于计算生物的肿瘤细胞检测设备100中,所述关联模块180,用于计算所述图结构血液样本电学性质特征矩阵相对于所述图结构尿液样本电学性质特征矩阵的转移矩阵作为分类特征矩阵。也就是,计算所述图结构血液样本电学性质特征矩阵相对于所述图结构尿液样本电学性质特征矩阵的转移矩阵,以所述转移矩阵来表示所述血液样本的电学性质特征表示与所述尿液样本的电学性质特征表示之间的关联性特征分布信息,并以此作为分类特征矩阵。
具体地,在本申请实施例中,所述关联模块180,进一步用于:以如下公式计算所述图结构血液样本电学性质特征矩阵相对于所述图结构尿液样本电学性质特征矩阵的转移矩阵作为分类特征矩阵;其中,所述公式为:
Figure 234201DEST_PATH_IMAGE005
=
Figure 30119DEST_PATH_IMAGE006
其中
Figure 783311DEST_PATH_IMAGE005
表示所述图结构血液样本电学性质特征矩阵,
Figure 399101DEST_PATH_IMAGE007
表示所述图结构尿液样 本电学性质特征矩阵,
Figure 895941DEST_PATH_IMAGE008
表示所述转移矩阵,
Figure 546365DEST_PATH_IMAGE009
表示矩阵相乘。
在上述基于计算生物的肿瘤细胞检测设备100中,所述特征分布校正模块190,用于对所述分类特征矩阵进行特征分布校正以得到校正后分类特征矩阵。特别地,在本申请的技术方案中,在计算所述图结构血液样本电学性质特征矩阵和所述图结构尿液样本电学性质特征矩阵之间的转移矩阵作为所述分类特征矩阵时,由于所述图结构血液样本电学性质特征矩阵用于表达血液样本的各项电学性质的全局相似度拓扑关联,而所述图结构尿液样本电学性质特征矩阵用于表达尿液样本的各项电学性质的全局相似度拓扑关联,因此其不一定能够保持完全同相分布,也就是,其间可能存在负相关关系,从而导致计算所述图结构血液样本电学性质特征矩阵和所述图结构尿液样本电学性质特征矩阵之间的转移矩阵得到的所述分类特征矩阵中存在负相关关系,影响所述分类特征矩阵的分类准确性。因此,本申请的申请人采用全正投影非线性重加权的方式计算所述图结构血液样本电学性质特征矩阵和所述图结构尿液样本电学性质特征矩阵之间的权重矩阵。
具体地,在本申请实施例中,所述特征分布校正模块190,包括:校正因子计算单元,用于采用全正投影非线性重加权的方式以如下公式计算所述图结构血液样本电学性质特征矩阵和所述图结构尿液样本电学性质特征矩阵之间的权重矩阵;其中,所述公式为:
Figure 470459DEST_PATH_IMAGE010
其中,
Figure 839123DEST_PATH_IMAGE011
Figure 372611DEST_PATH_IMAGE012
分别为所述图结构血液样本电学性质特征矩阵和所述图结构尿液 样本电学性质特征矩阵通过线性转换得到的对角矩阵,
Figure 877541DEST_PATH_IMAGE013
是所述权重矩阵,
Figure 175799DEST_PATH_IMAGE014
表示
Figure 766180DEST_PATH_IMAGE015
激活函数,
Figure 604823DEST_PATH_IMAGE009
表示矩阵相乘,且分子矩阵和分母矩阵之间的除法为矩阵特征值的按位 置相除,
Figure 229839DEST_PATH_IMAGE016
表示矩阵的指数运算,所述矩阵的指数运算表示计算以矩阵中各个位置的特 征值为幂的自然指数函数值;以及,加权校正单元,用于以所述权重矩阵对所述分类特征矩 阵进行点乘以得到所述校正后分类特征矩阵。
这里,所述全正投影非线性重加权通过
Figure 495736DEST_PATH_IMAGE015
函数来保证投影的全正以避免聚合负 相关的信息,并同时引入非线性重加权机制来相对于彼此聚集所述图结构血液样本电学性 质特征矩阵和所述图结构尿液样本电学性质特征矩阵的特征值分布,以使得所述权重矩阵 的内在结构能够惩罚远距离连接而加强局部性耦合。这样,通过以所述权重矩阵对所述分 类特征矩阵进行点乘以进行按位置加权,就实现了所述分类特征矩阵在高维特征空间内的 与全正投影重加权对应的空间特征变换(feature transform)的协同效果,也就提升了所 述分类特征矩阵的分类准确性。
在上述基于计算生物的肿瘤细胞检测设备100中,所述检测结果生成模块200,用于将所述校正后分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示是否含有循环肿瘤细胞。也就是,通过所述分类器来判断所述校正后分类特征矩阵是归属于含有循环肿瘤细胞(第一标签),还是归属于不含有循环肿瘤细胞(第二标签),即,通过所述分类器来实现二分类问题。这样,能够智能地对于循环肿瘤细胞进行精准检测。
图4为根据本申请实施例的基于计算生物的肿瘤细胞检测设备中检测结果生成模块的框图。如图4所示,所述检测结果生成模块200,包括:展开单元201,用于将所述校正后分类特征矩阵按照行向量或者列向量展开为分类特征向量;全连接编码单元202,用于使用所述分类器的全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量;以及,分类结果生成单元203,用于将所述编码分类特征向量输入所述分类器的Softmax分类函数以得到所述分类结果。
综上,基于本申请实施例的基于计算生物的肿瘤细胞检测设备100被阐明,其采用基于深度学习的人工智能技术来分别提取待检测患者的血液样本和尿液样本的电学性质检测数据的各个数据项之间基于全局的上下文高维语义关联特征信息,并以所述待检测患者的血液样本和尿液样本中的电学性质检测数据的各个数据项在高维特征空间中的相似性特征来优化电学性质特征的表达,进一步再计算这两者之间的转移矩阵来表示所述血液样本和所述尿液样本中关于电学性质特征的关联性特征分布信息,并以此进行所述待检测患者是否含有循环肿瘤细胞的检测。这样,能够智能地对于循环肿瘤细胞进行精准检测。
示例性方法
图5为根据本申请实施例的基于计算生物的肿瘤细胞检测方法的流程图。如图5所示,根据本申请实施例的基于计算生物的肿瘤细胞检测方法,包括:S110,获取待检测患者的血液样本的电学性质检测数据和所述待检测患者的尿液样本的电学性质检测数据;S120,将所述待检测患者的血液样本的电学性质检测数据中各个数据项通过基于转换器的上下文编码器以得到多个血液样本电学性质特征向量;S130,计算所述多个血液样本电学性质特征向量中每两个血液样本电学性质特征向量之间的距离以得到相似度度量矩阵;S140,将所述相似度度量矩阵通过作为特征提取器的卷积神经网络模型以得到相似度度量特征矩阵;S150,将所述多个血液样本电学性质特征向量二维排列为血液样本电学性质特征矩阵;S160,将所述相似度度量特征矩阵和所述血液样本电学性质特征矩阵通过图神经网络以得到图结构血液样本电学性质特征矩阵;S170,通过所述基于转换器的上下文编码器、所述作为特征提取器的卷积神经网络模型和所述图神经网络模型,从所述待检测患者的尿液样本的电学性质检测数据得到图结构尿液样本电学性质特征矩阵;S180,计算所述图结构血液样本电学性质特征矩阵相对于所述图结构尿液样本电学性质特征矩阵的转移矩阵作为分类特征矩阵;S190,对所述分类特征矩阵进行特征分布校正以得到校正后分类特征矩阵;以及,S200,将所述校正后分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示是否含有循环肿瘤细胞。
在一个示例中,在上述基于计算生物的肿瘤细胞检测方法中,所述将所述待检测患者的血液样本的电学性质检测数据中各个数据项通过基于转换器的上下文编码器以得到多个血液样本电学性质特征向量,包括:对所述待检测患者的血液样本的电学性质检测数据中各个数据项进行独热编码以得到多个血液样本电学性质向量;以及,将所述多个血液样本电学性质向量输入所述基于转换器的上下文编码器以得到所述多个血液样本电学性质特征向量。
在一个示例中,在上述基于计算生物的肿瘤细胞检测方法中,所述将所述多个血液样本电学性质向量输入所述基于转换器的上下文编码器以得到所述多个血液样本电学性质特征向量,包括:将所述多个血液样本电学性质向量排列为输入向量;将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及,将所述自注意力特征矩阵与以所述多个血液样本电学性质向量中各个血液样本电学性质向量作为值向量分别进行相乘以得到所述多个血液样本电学性质特征向量。
在一个示例中,在上述基于计算生物的肿瘤细胞检测方法中,所述计算所述多个血液样本电学性质特征向量中每两个血液样本电学性质特征向量之间的距离以得到相似度度量矩阵,包括:以如下公式来计算所述多个血液样本电学性质特征向量中每两个血液样本电学性质特征向量之间的距离以得到多个相似度;其中,所述公式为:
Figure 340457DEST_PATH_IMAGE001
其中
Figure 717212DEST_PATH_IMAGE002
分别表示所述多个血液样本电学性质特征向量中每两个血液样本电学 性质特征向量,
Figure 196735DEST_PATH_IMAGE003
分别表示所述多个血液样本电学性质特征向量中每两个血液样本电 学性质特征向量的各个位置的特征值,
Figure 633532DEST_PATH_IMAGE004
表示所述多个血液样本电学性质特征向量中 每两个血液样本电学性质特征向量之间的所述相似度;以及,将所述多个相似度进行二维 排列以得到所述相似度度量矩阵。
在一个示例中,在上述基于计算生物的肿瘤细胞检测方法中,所述将所述相似度度量矩阵通过作为特征提取器的卷积神经网络模型以得到相似度度量特征矩阵,包括:使用所述卷积神经网络模型的各层在层的正向传递中分别进行:对输入数据进行卷积处理以得到卷积特征图;对所述卷积特征图进行基于局部特征矩阵的均值池化以得到池化特征图;以及,对所述池化特征图进行非线性激活以得到激活特征图;其中,所述卷积神经网络模型的最后一层的输出为所述相似度度量特征矩阵,所述卷积神经网络模型的第一层的输入为所述相似度度量矩阵。
在一个示例中,在上述基于计算生物的肿瘤细胞检测方法中,所述将所述相似度度量特征矩阵和所述血液样本电学性质特征矩阵通过图神经网络以得到图结构血液样本电学性质特征矩阵,包括:所述图神经网络通过可学习的权重参数对所述相似度度量特征矩阵和所述血液样本电学性质特征矩阵进行图结构数据编码以得到包含全局拓扑空间相似特征和电学性质关联特征的所述图结构血液样本电学性质特征矩阵。
在一个示例中,在上述基于计算生物的肿瘤细胞检测方法中,所述计算所述图结构血液样本电学性质特征矩阵相对于所述图结构尿液样本电学性质特征矩阵的转移矩阵作为分类特征矩阵,包括:以如下公式计算所述图结构血液样本电学性质特征矩阵相对于所述图结构尿液样本电学性质特征矩阵的转移矩阵作为分类特征矩阵;其中,所述公式为:
Figure 198506DEST_PATH_IMAGE005
=
Figure 582214DEST_PATH_IMAGE006
其中
Figure 978560DEST_PATH_IMAGE005
表示所述图结构血液样本电学性质特征矩阵,
Figure 288056DEST_PATH_IMAGE007
表示所述图结构尿液样 本电学性质特征矩阵,
Figure 74747DEST_PATH_IMAGE008
表示所述转移矩阵,
Figure 324462DEST_PATH_IMAGE009
表示矩阵相乘。
在一个示例中,在上述基于计算生物的肿瘤细胞检测方法中,所述对所述分类特征矩阵进行特征分布校正以得到校正后分类特征矩阵,包括:采用全正投影非线性重加权的方式以如下公式计算所述图结构血液样本电学性质特征矩阵和所述图结构尿液样本电学性质特征矩阵之间的权重矩阵;其中,所述公式为:
Figure 778578DEST_PATH_IMAGE010
其中,
Figure 557178DEST_PATH_IMAGE011
Figure 831164DEST_PATH_IMAGE012
分别为所述图结构血液样本电学性质特征矩阵和所述图结构尿液 样本电学性质特征矩阵通过线性转换得到的对角矩阵,
Figure 353412DEST_PATH_IMAGE013
是所述权重矩阵,
Figure 662034DEST_PATH_IMAGE014
表示
Figure 113000DEST_PATH_IMAGE015
激活函数,
Figure 139862DEST_PATH_IMAGE009
表示矩阵相乘,且分子矩阵和分母矩阵之间的除法为矩阵特征值的按位 置相除,
Figure 934643DEST_PATH_IMAGE016
表示矩阵的指数运算,所述矩阵的指数运算表示计算以矩阵中各个位置的特 征值为幂的自然指数函数值;以及,以所述权重矩阵对所述分类特征矩阵进行点乘以得到 所述校正后分类特征矩阵。
在一个示例中,在上述基于计算生物的肿瘤细胞检测方法中,所述将所述校正后分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示是否含有循环肿瘤细胞,包括:将所述校正后分类特征矩阵按照行向量或者列向量展开为分类特征向量;使用所述分类器的全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量;以及,将所述编码分类特征向量输入所述分类器的Softmax分类函数以得到所述分类结果。
综上,本申请实施例的基于计算生物的肿瘤细胞检测方法被阐明,其采用基于深度学习的人工智能技术来分别提取待检测患者的血液样本和尿液样本的电学性质检测数据的各个数据项之间基于全局的上下文高维语义关联特征信息,并以所述待检测患者的血液样本和尿液样本中的电学性质检测数据的各个数据项在高维特征空间中的相似性特征来优化电学性质特征的表达,进一步再计算这两者之间的转移矩阵来表示所述血液样本和所述尿液样本中关于电学性质特征的关联性特征分布信息,并以此进行所述待检测患者是否含有循环肿瘤细胞的检测。这样,能够智能地对于循环肿瘤细胞进行精准检测。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (7)

1.一种基于计算生物的肿瘤细胞检测设备,其特征在于,包括:
检测数据采集模块,用于获取待检测患者的血液样本的电学性质检测数据和所述待检测患者的尿液样本的电学性质检测数据;
血液样本电学性质数据编码模块,用于将所述待检测患者的血液样本的电学性质检测数据中各个数据项通过基于转换器的上下文编码器以得到多个血液样本电学性质特征向量;
度量模块,用于计算所述多个血液样本电学性质特征向量中每两个血液样本电学性质特征向量之间的距离以得到相似度度量矩阵;
相似拓扑特征提取模块,用于将所述相似度度量矩阵通过作为特征提取器的卷积神经网络模型以得到相似度度量特征矩阵;
矩阵化模块,用于将所述多个血液样本电学性质特征向量二维排列为血液样本电学性质特征矩阵;
图网络编码模块,用于将所述相似度度量特征矩阵和所述血液样本电学性质特征矩阵通过图神经网络以得到图结构血液样本电学性质特征矩阵;
尿液样本电学性质数据特征提取模块,用于通过所述基于转换器的上下文编码器、所述作为特征提取器的卷积神经网络模型和所述图神经网络模型,从所述待检测患者的尿液样本的电学性质检测数据得到图结构尿液样本电学性质特征矩阵;
关联模块,用于计算所述图结构血液样本电学性质特征矩阵相对于所述图结构尿液样本电学性质特征矩阵的转移矩阵作为分类特征矩阵;
特征分布校正模块,用于对所述分类特征矩阵进行特征分布校正以得到校正后分类特征矩阵;以及
检测结果生成模块,用于将所述校正后分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示是否含有循环肿瘤细胞;
其中,所述关联模块,用于:
以如下公式计算所述图结构血液样本电学性质特征矩阵相对于所述图结构尿液样本电学性质特征矩阵的转移矩阵作为分类特征矩阵;
其中,所述公式为:
Figure QLYQS_1
=
Figure QLYQS_2
其中
Figure QLYQS_3
表示所述图结构血液样本电学性质特征矩阵,
Figure QLYQS_4
表示所述图结构尿液样本电学性质特征矩阵,
Figure QLYQS_5
表示所述转移矩阵,
Figure QLYQS_6
表示矩阵相乘;
其中,所述特征分布校正模块,包括:
校正因子计算单元,用于采用全正投影非线性重加权的方式以如下公式计算所述图结构血液样本电学性质特征矩阵和所述图结构尿液样本电学性质特征矩阵之间的权重矩阵;
其中,所述公式为:
Figure QLYQS_7
其中,
Figure QLYQS_8
Figure QLYQS_9
分别为所述图结构血液样本电学性质特征矩阵和所述图结构尿液样本电学性质特征矩阵通过线性转换得到的对角矩阵,
Figure QLYQS_10
是所述权重矩阵,
Figure QLYQS_11
表示
Figure QLYQS_12
激活函数,
Figure QLYQS_13
表示矩阵相乘,且分子矩阵和分母矩阵之间的除法为矩阵特征值的按位置相除,
Figure QLYQS_14
表示矩阵的指数运算,所述矩阵的指数运算表示计算以矩阵中各个位置的特征值为幂的自然指数函数值;以及
加权校正单元,用于以所述权重矩阵对所述分类特征矩阵进行点乘以得到所述校正后分类特征矩阵。
2. 根据权利要求1所述的基于计算生物的肿瘤细胞检测设备,其特征在于,所述血液样本电学性质数据编码模块,包括:
独热编码单元,用于对所述待检测患者的血液样本的电学性质检测数据中各个数据项进行独热编码以得到多个血液样本电学性质向量;以及
上下文语义编码单元,用于将所述多个血液样本电学性质向量输入所述基于转换器的上下文编码器以得到所述多个血液样本电学性质特征向量。
3.根据权利要求2所述的基于计算生物的肿瘤细胞检测设备,其特征在于,所述上下文语义编码单元,进一步用于:
将所述多个血液样本电学性质向量排列为输入向量;
将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;
计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;
对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;
将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及
将所述自注意力特征矩阵与以所述多个血液样本电学性质向量中各个血液样本电学性质向量作为值向量分别进行相乘以得到所述多个血液样本电学性质特征向量。
4.根据权利要求3所述的基于计算生物的肿瘤细胞检测设备,其特征在于,所述度量模块,包括:
相似度计算单元,用于以如下公式来计算所述多个血液样本电学性质特征向量中每两个血液样本电学性质特征向量之间的距离以得到多个相似度;
其中,所述公式为:
Figure QLYQS_15
其中
Figure QLYQS_16
分别表示所述多个血液样本电学性质特征向量中每两个血液样本电学性质特征向量,
Figure QLYQS_17
分别表示所述多个血液样本电学性质特征向量中每两个血液样本电学性质特征向量的各个位置的特征值,
Figure QLYQS_18
表示所述多个血液样本电学性质特征向量中每两个血液样本电学性质特征向量之间的所述相似度;以及
二维排列单元,用于将所述多个相似度进行二维排列以得到所述相似度度量矩阵。
5.根据权利要求4所述的基于计算生物的肿瘤细胞检测设备,其特征在于,所述相似拓扑特征提取模块,进一步用于:
使用所述卷积神经网络模型的各层在层的正向传递中分别进行:
对输入数据进行卷积处理以得到卷积特征图;
对所述卷积特征图进行基于局部特征矩阵的均值池化以得到池化特征图;以及
对所述池化特征图进行非线性激活以得到激活特征图;
其中,所述卷积神经网络模型的最后一层的输出为所述相似度度量特征矩阵,所述卷积神经网络模型的第一层的输入为所述相似度度量矩阵。
6.根据权利要求5所述的基于计算生物的肿瘤细胞检测设备,其特征在于,所述图网络编码模块,进一步用于:所述图神经网络通过可学习的权重参数对所述相似度度量特征矩阵和所述血液样本电学性质特征矩阵进行图结构数据编码以得到包含全局拓扑空间相似特征和电学性质关联特征的所述图结构血液样本电学性质特征矩阵。
7.根据权利要求6所述的基于计算生物的肿瘤细胞检测设备,其特征在于,所述检测结果生成模块,包括:
展开单元,用于将所述校正后分类特征矩阵按照行向量或者列向量展开为分类特征向量;
全连接编码单元,用于使用所述分类器的全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量;以及
分类结果生成单元,用于将所述编码分类特征向量输入所述分类器的Softmax分类函数以得到所述分类结果。
CN202310005470.6A 2023-01-04 2023-01-04 基于计算生物的肿瘤细胞检测设备及其方法 Active CN115690109B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310005470.6A CN115690109B (zh) 2023-01-04 2023-01-04 基于计算生物的肿瘤细胞检测设备及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310005470.6A CN115690109B (zh) 2023-01-04 2023-01-04 基于计算生物的肿瘤细胞检测设备及其方法

Publications (2)

Publication Number Publication Date
CN115690109A CN115690109A (zh) 2023-02-03
CN115690109B true CN115690109B (zh) 2023-03-14

Family

ID=85057053

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310005470.6A Active CN115690109B (zh) 2023-01-04 2023-01-04 基于计算生物的肿瘤细胞检测设备及其方法

Country Status (1)

Country Link
CN (1) CN115690109B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115791640B (zh) * 2023-02-06 2023-06-02 杭州华得森生物技术有限公司 基于分光光谱的肿瘤细胞检测设备及其方法
CN116309543B (zh) * 2023-05-10 2023-08-11 北京航空航天大学杭州创新研究院 基于图像的循环肿瘤细胞检测设备
CN116309595B (zh) * 2023-05-23 2023-08-01 杭州华得森生物技术有限公司 Ctc智能全自动检测一体机及其方法
CN116434226B (zh) * 2023-06-08 2024-03-19 杭州华得森生物技术有限公司 循环肿瘤细胞分析仪

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115409844A (zh) * 2022-11-02 2022-11-29 杭州华得森生物技术有限公司 循环肿瘤细胞检测设备及其方法
CN115406815A (zh) * 2022-11-02 2022-11-29 杭州华得森生物技术有限公司 基于多源数据融合的肿瘤细胞检测设备及其方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107034132A (zh) * 2011-05-05 2017-08-11 安派科生物医学科技有限公司 肿瘤细胞检测仪
JP2021519607A (ja) * 2018-02-27 2021-08-12 コーネル・ユニバーシティーCornell University ゲノムワイド統合による循環腫瘍dnaの超音波感受性検出
SG11202007871RA (en) * 2018-02-27 2020-09-29 Univ Cornell Systems and methods for detection of residual disease
CN112292697A (zh) * 2018-04-13 2021-01-29 弗里诺姆控股股份有限公司 用于生物样品的多分析物测定的机器学习实施方式
CN110010248B (zh) * 2019-04-17 2023-01-10 电子科技大学 一种基于代价敏感集成学习模型的再入院风险预测方法
KR20220100854A (ko) * 2019-09-13 2022-07-18 아이킬리 바이오시스템스, 아이엔씨. 인공 지능 기반 세포 분석을 위한 시스템 및 방법
US20210087638A1 (en) * 2019-09-23 2021-03-25 Dana-Farber Cancer Institute, Inc. Next-generation sequencing assay for genomic characterization and minimal residual disease detection in the bone marrow, peripheral blood, and urine of multiple myeloma and smoldering myeloma patients
CN114092934A (zh) * 2020-07-31 2022-02-25 骏实生物科技(上海)有限公司 循环肿瘤细胞的分类方法
CN114444543A (zh) * 2022-01-19 2022-05-06 深圳大学 一种光谱数据处理方法、装置、存储介质及电子设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115409844A (zh) * 2022-11-02 2022-11-29 杭州华得森生物技术有限公司 循环肿瘤细胞检测设备及其方法
CN115406815A (zh) * 2022-11-02 2022-11-29 杭州华得森生物技术有限公司 基于多源数据融合的肿瘤细胞检测设备及其方法

Also Published As

Publication number Publication date
CN115690109A (zh) 2023-02-03

Similar Documents

Publication Publication Date Title
CN115690109B (zh) 基于计算生物的肿瘤细胞检测设备及其方法
CN115409844B (zh) 循环肿瘤细胞检测设备及其方法
CN115791640B (zh) 基于分光光谱的肿瘤细胞检测设备及其方法
CN115406815B (zh) 基于多源数据融合的肿瘤细胞检测设备及其方法
Costa et al. Geodesic entropic graphs for dimension and entropy estimation in manifold learning
He et al. A two-stage genetic algorithm for automatic clustering
Lu et al. Visual language pretrained multiple instance zero-shot transfer for histopathology images
CN111564183B (zh) 融合基因本体和神经网络的单细胞测序数据降维方法
Bedoui et al. Electronic nose system and principal component analysis technique for gases identification
CN110146642A (zh) 一种气味分析方法及装置
Mukhopadhyay Multivariate statistical analysis
CN112215259B (zh) 基因选择方法和装置
CN115147655A (zh) 油气集输监控系统及其方法
Li et al. Graphadapter: Tuning vision-language models with dual knowledge graph
CN112233798A (zh) 基于病理模式与注意力机制的可解释疾病风险分析系统
CN107301643A (zh) 基于鲁棒稀疏表示与拉普拉斯正则项的显著目标检测方法
CN112908414A (zh) 一种大规模单细胞分型方法、系统及存储介质
Ferdous et al. LCDEiT: A linear complexity data-efficient image transformer for MRI brain tumor classification
CN115688028A (zh) 肿瘤细胞生长状态检测设备
CN110988631B (zh) 局部放电定位检测方法、装置、可读存储介质及电气设备
CN115408351A (zh) 军工科研生产数据管理方法及系统
CN110378262B (zh) 基于加性高斯核的核非负矩阵分解人脸识别方法、装置、系统及存储介质
CN114023395A (zh) 一种预测肾移植患者霉酚酸药物暴露方法和装置
Rani et al. A combined clustering and ranking based gene selection algorithm for microarray data classification
CN112242200A (zh) 一种基于流行性感冒智能认知模型的系统及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant