CN115409844B - 循环肿瘤细胞检测设备及其方法 - Google Patents

循环肿瘤细胞检测设备及其方法 Download PDF

Info

Publication number
CN115409844B
CN115409844B CN202211359933.0A CN202211359933A CN115409844B CN 115409844 B CN115409844 B CN 115409844B CN 202211359933 A CN202211359933 A CN 202211359933A CN 115409844 B CN115409844 B CN 115409844B
Authority
CN
China
Prior art keywords
electrical property
electrical
detected
sample
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211359933.0A
Other languages
English (en)
Other versions
CN115409844A (zh
Inventor
张开山
高阳
刘艳省
李超
于杰
赵丹
饶浪睛
田华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Huadesen Biotechnology Co.,Ltd.
Original Assignee
HANGZHOU WATSON BIOTECH Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HANGZHOU WATSON BIOTECH Inc filed Critical HANGZHOU WATSON BIOTECH Inc
Priority to CN202211359933.0A priority Critical patent/CN115409844B/zh
Publication of CN115409844A publication Critical patent/CN115409844A/zh
Application granted granted Critical
Publication of CN115409844B publication Critical patent/CN115409844B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Radiology & Medical Imaging (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Image Analysis (AREA)

Abstract

公开了一种循环肿瘤细胞检测设备及其方法,其将基于深度学习的人工智能技术应用于生物检测领域,以构建计算生物方案。具体地,其通过基于深度神经网络模型的特征提取器来提取参考样本和待检测样本的电学性质检测数据的特征表示,并通过两者在高维特征空间中的差异特征来判断待检测样本中是否含有CTC细胞。这样,可以对于所述待检测样本中是否存在CTC细胞进行准确地检测。

Description

循环肿瘤细胞检测设备及其方法
技术领域
本申请涉及智能检测技术领域,且更为具体地,涉及一种循环肿瘤细胞检测设备及其方法。
背景技术
癌细胞侵袭人体,可能会出现在肿瘤发展的早期。因此早期发现,早期全身治疗,将会降低癌症的死亡率。癌细胞从原发肿瘤到远处重要器官的转移是导致癌症死亡的首要原因。早期传播到淋巴结,骨髓或外周血中的肿瘤细胞被称为循环肿瘤细胞(CTC)。即使在切除原发肿瘤后,CTC可能仍然存在于病人的外周血中。
CTC对于转移的建立是非常关键的,对CTC的检测是用于评估特定肿瘤的侵略性及在远处器官生长的可能性的一种重要方法。对CTC特异敏感的检测可以用于确定癌症的发展状况、转移状态、存活的可能性及对治疗反应的评估。
随着近年来对CTC越来越多的研究,其重要性备受推崇。然而,CTC在血液中的存在量大约是十亿分之一到百亿分之一的水平。现有技术用于分离和识别CTC一方面需要大量人力并且价格昂贵,另一方面缺乏准确性和可靠性。
因此,期待一种优化的循环肿瘤细胞检测设备,能够对于样本中的CTC细胞进行准确有效地检测。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种循环肿瘤细胞检测设备及其方法,其通过基于转换器的上下文编码器来分别提取参考样本和待检测样本的电学性质检测数据中各个数据项相对于其他数据项的全局上下文语义特征信息;然后,通过包含第一卷积神经网络模型和第二卷积神经网络模型的孪生网络分别提取参考样本和待检测样本的电学性质检测数据中的各个数据项的上下文全局特征之间的隐含关联特征以得到参考电学深度特征向量和检测电学深度特征向量;接着计算两个特征向量之间的差异特征向量并以此来进行分类,最后得到用于表示待检测样本中是否含有CTC细胞的分类结果。这样,可以对于所述待检测样本中是否存在CTC细胞进行准确地检测,以降低癌症的死亡率。
根据本申请的一个方面,提供了一种循环肿瘤细胞检测设备,其包括:
样本数据采集模块,用于获取待检测样本的电学性质检测数据和参考样本的电学性质检测数据;
参考样本数据编码模块,用于将所述参考样本的电学性质检测数据中的所有数据项通过基于转换器的上下文编码器以得到多个参考电学性质特征向量;
检测样本数据编码模块,用于将所述待检测样本的电学性质检测数据中的所有数据项通过所述基于转换器的上下文编码器以得到多个检测电学性质特征向量;
二维结构化模块,用于将所述多个参考电学性质特征向量和所述多个检测电学性质特征向量分别进行二维排列以得到参考电学性质特征矩阵和检测电学性质特征矩阵;
孪生网络模块,用于将所述参考电学性质特征矩阵和所述检测电学性质特征矩阵输入包含第一卷积神经网络模型和第二卷积神经网络模型的孪生网络以得到参考电学深度特征向量和检测电学深度特征向量;
差异化模块,用于计算所述参考电学深度特征向量和所述检测电学深度特征向量之间的差异特征向量;
特征分布校正模块,用于基于所述差异特征向量中所有位置的特征值集合的统计特征,对所述差异特征向量中各个位置的特征值进行自适应校正以得到校正后差异特征向量;以及
检测结果生成模块,用于将所述校正后差异特征向量输入分类器以得到分类结果,所述分类结果用于表示待检测样本中是否含有CTC细胞。
在上述循环肿瘤细胞检测设备中,所述电学性质检测数据,包括:表面电荷,表面电位,静息电位,电流,电场分布,表面电荷分布,细胞电学性质,细胞表面电学性质,电学性质的动态变化,细胞电学性质的动态变化,细胞表面电学性质的动态变化,表面电学性质的动态变化,细胞膜的电学性质,膜表面的电学性质的动态变化,细胞膜电学性质的动态变化,电偶极子,双电偶极子,电信号的振荡,电流,电容,三维电子或电荷云分布,端粒DNA和染色体,电容或阻抗的电性质。
在上述循环肿瘤细胞检测设备中,所述参考样本数据编码模块,包括:
第一独热编码单元,用于分别将所述参考样本的电学性质检测数据中的所有数据项中各个数据项进行独热编码,以将所述参考样本的电学性质检测数据中的各个数据项分别转化为参考输入向量以获得参考输入向量的序列;以及,第一上下文语义编码单元,用于使用所述基于转换器的上下文编码器的转换器对所述参考输入向量的序列进行基于全局的上下文语义编码以获得所述多个参考电学性质特征向量。
在上述循环肿瘤细胞检测设备中,所述检测样本数据编码模块,包括:
第二独热编码单元,用于分别将所述待检测样本的电学性质检测数据中的所有数据项中各个数据项进行独热编码,以将所述待检测样本的电学性质检测数据中的各个数据项分别转化为检测输入向量以获得检测输入向量的序列;以及,第二上下文语义编码单元,用于使用所述基于转换器的上下文编码器的转换器对所述检测输入向量的序列进行基于全局的上下文语义编码以获得所述多个检测电学性质特征向量。
在上述循环肿瘤细胞检测设备中,所述孪生网络模块,包括:第一卷积编码单元,用于使用所述孪生网络的第一卷积神经网络模型的各层在层的正向传递中分别对输入数据进行卷积处理、基于特征矩阵的池化处理和非线性激活处理以由所述第一卷积神经网络模型的最后一层输出所述参考电学深度特征向量;以及,第二卷积编码单元,用于使用所述孪生网络的第二卷积神经网络模型的各层在层的正向传递中分别对输入数据进行卷积处理、基于特征矩阵的池化处理和非线性激活处理以由所述第二卷积神经网络模型的最后一层输出所述检测电学深度特征向量。
在上述循环肿瘤细胞检测设备中,所述孪生网络的第一卷积神经网络模型和第二卷积神经网络模型具有相同的网络结构。
在上述循环肿瘤细胞检测设备中,所述差异化模块,进一步用于:以如下公式计算所述参考电学深度特征向量和所述检测电学深度特征向量之间的所述差异特征向量;其中,所述公式为:
Figure 26583DEST_PATH_IMAGE001
其中
Figure 396384DEST_PATH_IMAGE002
表示所述参考电学深度特征向量,
Figure 942772DEST_PATH_IMAGE003
表示所述检测电学深度特征向量,
Figure 5406DEST_PATH_IMAGE004
表 示所述差异特征向量,
Figure 879821DEST_PATH_IMAGE005
表示按位置减法。
在上述循环肿瘤细胞检测设备中,所述特征分布校正模块,进一步用于:基于所述差异特征向量中所有位置的特征值集合的统计特征,以如下公式对所述差异特征向量中各个位置的特征值进行自适应校正以得到所述校正后差异特征向量;其中,所述公式为:
Figure 318892DEST_PATH_IMAGE006
其中
Figure 470519DEST_PATH_IMAGE007
表示所述差异特征向量中各个位置的特征值,
Figure 704054DEST_PATH_IMAGE008
Figure 331345DEST_PATH_IMAGE009
分别表示所述差异特征 向量中所有位置的特征值集合的均值和方差,且
Figure 777370DEST_PATH_IMAGE010
是所述差异特征向量的长度,
Figure 799815DEST_PATH_IMAGE011
表示以2 为底的对数函数,
Figure 469830DEST_PATH_IMAGE012
是加权超参数。
在上述循环肿瘤细胞检测设备中,所述检测结果生成模块,进一步用于:使用所述 分类器以如下公式对所述校正后差异特征向量进行处理以生成分类结果,其中,所述公式 为:
Figure 53258DEST_PATH_IMAGE013
,其中X表示所述校正后差异特征向量,
Figure 568553DEST_PATH_IMAGE014
Figure 960352DEST_PATH_IMAGE015
为各 层全连接层的权重矩阵,
Figure 535689DEST_PATH_IMAGE016
Figure 871993DEST_PATH_IMAGE017
表示各层全连接层的偏置向量。
根据本申请的另一方面,提供了一种循环肿瘤细胞检测方法,其包括:
获取待检测样本的电学性质检测数据和参考样本的电学性质检测数据;
将所述参考样本的电学性质检测数据中的所有数据项通过基于转换器的上下文编码器以得到多个参考电学性质特征向量;
将所述待检测样本的电学性质检测数据中的所有数据项通过所述基于转换器的上下文编码器以得到多个检测电学性质特征向量;
将所述多个参考电学性质特征向量和所述多个检测电学性质特征向量分别进行二维排列以得到参考电学性质特征矩阵和检测电学性质特征矩阵;
将所述参考电学性质特征矩阵和所述检测电学性质特征矩阵输入包含第一卷积神经网络模型和第二卷积神经网络模型的孪生网络以得到参考电学深度特征向量和检测电学深度特征向量;
计算所述参考电学深度特征向量和所述检测电学深度特征向量之间的差异特征向量;
基于所述差异特征向量中所有位置的特征值集合的统计特征,对所述差异特征向量中各个位置的特征值进行自适应校正以得到校正后差异特征向量;以及
将所述校正后差异特征向量输入分类器以得到分类结果,所述分类结果用于表示待检测样本中是否含有CTC细胞。
在上述循环肿瘤细胞检测方法中,所述电学性质检测数据,包括:表面电荷,表面电位,静息电位,电流,电场分布,表面电荷分布,细胞电学性质,细胞表面电学性质,电学性质的动态变化,细胞电学性质的动态变化,细胞表面电学性质的动态变化,表面电学性质的动态变化,细胞膜的电学性质,膜表面的电学性质的动态变化,细胞膜电学性质的动态变化,电偶极子,双电偶极子,电信号的振荡,电流,电容,三维电子或电荷云分布,端粒DNA和染色体,电容或阻抗的电性质。
在上述循环肿瘤细胞检测方法中,所述将所述参考样本的电学性质检测数据中的所有数据项通过基于转换器的上下文编码器以得到多个参考电学性质特征向量,包括:分别将所述参考样本的电学性质检测数据中的所有数据项中各个数据项进行独热编码,以将所述参考样本的电学性质检测数据中的各个数据项分别转化为参考输入向量以获得参考输入向量的序列;以及,使用所述基于转换器的上下文编码器的转换器对所述参考输入向量的序列进行基于全局的上下文语义编码以获得所述多个参考电学性质特征向量。
在上述循环肿瘤细胞检测方法中,所述将所述待检测样本的电学性质检测数据中的所有数据项通过所述基于转换器的上下文编码器以得到多个检测电学性质特征向量,包括:分别将所述待检测样本的电学性质检测数据中的所有数据项中各个数据项进行独热编码,以将所述待检测样本的电学性质检测数据中的各个数据项分别转化为检测输入向量以获得检测输入向量的序列;以及,使用所述基于转换器的上下文编码器的转换器对所述检测输入向量的序列进行基于全局的上下文语义编码以获得所述多个检测电学性质特征向量。
在上述循环肿瘤细胞检测方法中,所述将所述参考电学性质特征矩阵和所述检测电学性质特征矩阵输入包含第一卷积神经网络模型和第二卷积神经网络模型的孪生网络以得到参考电学深度特征向量和检测电学深度特征向量,包括:使用所述孪生网络的第一卷积神经网络模型的各层在层的正向传递中分别对输入数据进行卷积处理、基于特征矩阵的池化处理和非线性激活处理以由所述第一卷积神经网络模型的最后一层输出所述参考电学深度特征向量;以及,使用所述孪生网络的第二卷积神经网络模型的各层在层的正向传递中分别对输入数据进行卷积处理、基于特征矩阵的池化处理和非线性激活处理以由所述第二卷积神经网络模型的最后一层输出所述检测电学深度特征向量。
在上述循环肿瘤细胞检测方法中,所述孪生网络的第一卷积神经网络模型和第二卷积神经网络模型具有相同的网络结构。
在上述循环肿瘤细胞检测方法中,所述计算所述参考电学深度特征向量和所述检测电学深度特征向量之间的差异特征向量,进一步包括:以如下公式计算所述参考电学深度特征向量和所述检测电学深度特征向量之间的所述差异特征向量;其中,所述公式为:
Figure 315613DEST_PATH_IMAGE001
其中
Figure 420972DEST_PATH_IMAGE002
表示所述参考电学深度特征向量,
Figure 432790DEST_PATH_IMAGE003
表示所述检测电学深度特征向量,
Figure 866177DEST_PATH_IMAGE004
表 示所述差异特征向量,
Figure 723274DEST_PATH_IMAGE005
表示按位置减法。
在上述循环肿瘤细胞检测方法中,所述基于所述差异特征向量中所有位置的特征值集合的统计特征,对所述差异特征向量中各个位置的特征值进行自适应校正以得到校正后差异特征向量,进一步包括:基于所述差异特征向量中所有位置的特征值集合的统计特征,以如下公式对所述差异特征向量中各个位置的特征值进行自适应校正以得到所述校正后差异特征向量;其中,所述公式为:
Figure 948719DEST_PATH_IMAGE006
其中
Figure 865860DEST_PATH_IMAGE007
表示所述差异特征向量中各个位置的特征值,
Figure 805784DEST_PATH_IMAGE008
Figure 466572DEST_PATH_IMAGE009
分别表示所述差异特征 向量中所有位置的特征值集合的均值和方差,且
Figure 280944DEST_PATH_IMAGE010
是所述差异特征向量的长度,
Figure 634565DEST_PATH_IMAGE011
表示以2 为底的对数函数,
Figure 42544DEST_PATH_IMAGE012
是加权超参数。
在上述循环肿瘤细胞检测方法中,所述将所述校正后差异特征向量输入分类器以得到分类结果,所述分类结果用于表示待检测样本中是否含有CTC细胞,进一步包括:使用所述分类器以如下公式对所述校正后差异特征向量进行处理以生成分类结果,其中,所述公式为:
Figure 241444DEST_PATH_IMAGE013
,其中X表示所述校正后差异特征向量,
Figure 175902DEST_PATH_IMAGE014
Figure 700424DEST_PATH_IMAGE015
为各层全连接层的权重矩阵,
Figure 579387DEST_PATH_IMAGE016
Figure 847558DEST_PATH_IMAGE017
表示各层全连接层的偏置向量。
与现有技术相比,本申请提供的一种循环肿瘤细胞检测设备及其方法,其通过基于转换器的上下文编码器来分别提取参考样本和待检测样本的电学性质检测数据中各个数据项相对于其他数据项的全局上下文语义特征信息;然后,通过包含第一卷积神经网络模型和第二卷积神经网络模型的孪生网络分别提取参考样本和待检测样本的电学性质检测数据中的各个数据项的上下文全局特征之间的隐含关联特征以得到参考电学深度特征向量和检测电学深度特征向量;接着计算两个特征向量之间的差异特征向量并以此来进行分类,最后得到用于表示待检测样本中是否含有CTC细胞的分类结果。这样,可以对于所述待检测样本中是否存在CTC细胞进行准确地检测,以降低癌症的死亡率。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1图示了根据本申请实施例的循环肿瘤细胞检测设备的应用场景图。
图2图示了根据本申请实施例的循环肿瘤细胞检测设备的框图。
图3图示了根据本申请实施例的循环肿瘤细胞检测设备中所述参考样本数据编码模块的框图。
图4图示了根据本申请实施例的循环肿瘤细胞检测设备中所述检测样本数据编码模块的框图。
图5图示了根据本申请实施例的循环肿瘤细胞检测设备中所述孪生网络模块的框图。
图6图示了根据本申请实施例的循环肿瘤细胞检测方法的流程图。
图7图示了根据本申请实施例的循环肿瘤细胞检测方法的架构示意图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
场景概述
如上所述,随着近年来对CTC越来越多的研究,其重要性备受推崇。然而,CTC在血液中的存在量大约是十亿分之一到百亿分之一的水平。现有技术用于分离和识别CTC一方面需要大量人力并且价格昂贵,另一方面缺乏准确性和可靠性。因此,期待一种优化的循环肿瘤细胞检测设备,能够对于样本中的CTC细胞进行准确有效地检测。
目前,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、语音信号处理等领域。此外,深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域,也展现出了接近甚至超越人类的水平。
近年来,深度学习以及神经网络的发展为循环肿瘤细胞的检测提供了新的解决思路和方案。
具体地,在本申请的技术方案中,将基于深度学习的人工智能技术来提取待检测样品和没有疾病的样品(参考样本)之间特征差异,以此作为来判断所述待检测样品内是否存在CTC细胞。也就是,将人工智能技术与生物医药技术相结合以构建用于CTC细胞检测的计算生物方案。
具体地,在本申请的技术方案中,首先,获取待检测样本的电学性质检测数据和参考样本的电学性质检测数据。这里,所述电学性质检测数据包括:表面电荷,表面电位,静息电位,电流,电场分布,表面电荷分布,细胞电学性质,细胞表面电学性质,电学性质的动态变化,细胞电学性质的动态变化,细胞表面电学性质的动态变化,表面电学性质的动态变化,细胞膜的电学性质,膜表面的电学性质的动态变化,细胞膜电学性质的动态变化,电偶极子,双电偶极子,电信号的振荡(例如,在离子振荡,电场脉冲,表面电荷脉冲,电压脉冲),电流,电容,三维电子或电荷云分布,端粒DNA和染色体,电容或阻抗的电性质。
对于所述参考样本的电学性质检测数据和所述待检测样本的电学性质检测数据中的所有数据项,考虑到所述各个数据项之间具有着关联性的语义特征,因此,使用基于转换器的上下文编码器来分别提取所述参考样本和所述待检测样本的电学性质检测数据中各个数据项相对于其他数据项的全局上下文语义特征信息,以更适于表征所述电学性质的本质特征,从而得到多个参考电学性质特征向量和多个检测电学性质特征向量。接着,将所述多个参考电学性质特征向量和所述多个检测电学性质特征向量分别进行二维排列以整合所述电学性质检测数据中的各个数据项的全局高维语义特征,从而得到参考电学性质特征矩阵和检测电学性质特征矩阵。
进一步地,为了能够分别提取出所述待检测样本和所述参考样本的电学性质检测数据的各个数据项的电学性质全局语义特征之间的深层隐含关联特征信息,进一步使用在局部隐含关联特征提取方面具有优异表现的卷积神经网络模型来作为特征提取器以进行深层隐含关联特征挖掘。也就是,具体地,在本申请的技术方案中,将所述参考电学性质特征矩阵和所述检测电学性质特征矩阵输入包含第一卷积神经网络模型和第二卷积神经网络模型的孪生网络中进行处理以得到参考电学深度特征向量和检测电学深度特征向量。这里,所述孪生网络使用所述第一卷积神经网络模型来对于所述参考电学性质特征矩阵进行特征挖掘,以提取出所述参考样本的电学性质检测数据中的各个数据项的上下文全局特征之间的隐含关联特征,所述孪生网络使用所述第二卷积神经网络模型来对于所述检测电学性质特征矩阵进行特征挖掘,以提取出所述待检测样本的电学性质检测数据中的各个数据项的上下文全局特征之间的隐含关联特征。特别地,所述孪生网络的第一卷积神经网络模型和第二卷积神经网络模型具有相同的网络结构。
然后,进一步计算所述参考电学深度特征向量和所述检测电学深度特征向量之间的差异特征向量,进而以所述孪生网络模型来度量所述待检测电学性质特征矩阵和所述参考电学性质特征矩阵的深度特征表达之间的差异性,并以此来进行分类,以确定所述待检测样本中是否含有CTC细胞。
特别地,在本申请的技术方案中,这里,在计算所述参考电学深度特征向量和所述检测电学深度特征向量之间的差异特征值以得到差异特征向量时,由于所述参考电学深度特征向量和所述检测电学深度特征向量之间可能存在的特征分布差异,会使得所述差异特征向量具有影响分类回归的异常值。
基于此,对于所述差异特征向量进行自适应实例的信息统计归一化,具体为:
Figure 636522DEST_PATH_IMAGE006
Figure 207312DEST_PATH_IMAGE008
Figure 714517DEST_PATH_IMAGE009
是特征集合
Figure 520799DEST_PATH_IMAGE018
的均值和方差,
Figure 164270DEST_PATH_IMAGE007
是所述差异特征向量
Figure 656693DEST_PATH_IMAGE019
的特征值,且
Figure 385615DEST_PATH_IMAGE010
是所 述差异特征向量
Figure 995588DEST_PATH_IMAGE019
的长度,
Figure 759144DEST_PATH_IMAGE011
表示以2为底的对数,且
Figure 671737DEST_PATH_IMAGE012
是加权超参数。
这里,通过将所述差异特征向量的特征集合作为自适应实例,利用所述集合的统计特征的本质内在先验信息,来对集合内的单个值,也就是,每个特征值进行动态生成式的信息归一化,同时以特征集合的归一化模长信息作为偏置来作为集合分布域内的不变性描述,这可以实现尽可能屏蔽特殊实例的扰动分布的特征优化,从而提升所述差异特征向量的分类准确性。进而,能够对于所述待检测样本中是否存在CTC细胞进行准确有效地检测,以便于准确地确定癌症的发展状况来进行相应地治疗,降低癌症的死亡率。
基于此,本申请提出了一种循环肿瘤细胞检测设备,其包括:样本数据采集模块,用于获取待检测样本的电学性质检测数据和参考样本的电学性质检测数据;参考样本数据编码模块,用于将所述参考样本的电学性质检测数据中的所有数据项通过基于转换器的上下文编码器以得到多个参考电学性质特征向量;检测样本数据编码模块,用于将所述待检测样本的电学性质检测数据中的所有数据项通过所述基于转换器的上下文编码器以得到多个检测电学性质特征向量;二维结构化模块,用于将所述多个参考电学性质特征向量和所述多个检测电学性质特征向量分别进行二维排列以得到参考电学性质特征矩阵和检测电学性质特征矩阵;孪生网络模块,用于将所述参考电学性质特征矩阵和所述检测电学性质特征矩阵输入包含第一卷积神经网络模型和第二卷积神经网络模型的孪生网络以得到参考电学深度特征向量和检测电学深度特征向量;差异化模块,用于计算所述参考电学深度特征向量和所述检测电学深度特征向量之间的差异特征向量;特征分布校正模块,用于基于所述差异特征向量中所有位置的特征值集合的统计特征,对所述差异特征向量中各个位置的特征值进行自适应校正以得到校正后差异特征向量;以及,检测结果生成模块,用于将所述校正后差异特征向量输入分类器以得到分类结果,所述分类结果用于表示待检测样本中是否含有CTC细胞。
图1图示了根据本申请实施例的循环肿瘤细胞检测设备的应用场景图。如图1所示,在该应用场景中,首先获取待检测样本的电学性质检测数据(例如,如图1中所示意的T)和参考样本的电学性质检测数据(例如,如图1中所示意的M);然后将获取的待检测样本的电学性质检测数据和参考样本的电学性质检测数据分别输入至部署有循环肿瘤细胞检测的服务器(例如,如图1所示意的S)中,其中,所述服务器以循环肿瘤细胞检测算法对所述待检测样本的电学性质检测数据和所述参考样本的电学性质检测数据进行处理,以生成用于表示待检测样本中是否含有CTC细胞的分类结果。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
示例性设备
图2图示了根据本申请实施例的循环肿瘤细胞检测设备的框图。如图2所示,根据本申请实施例的一种循环肿瘤细胞检测设备100,包括:样本数据采集模块110,用于获取待检测样本的电学性质检测数据和参考样本的电学性质检测数据;参考样本数据编码模块120,用于将所述参考样本的电学性质检测数据中的所有数据项通过基于转换器的上下文编码器以得到多个参考电学性质特征向量;检测样本数据编码模块130,用于将所述待检测样本的电学性质检测数据中的所有数据项通过所述基于转换器的上下文编码器以得到多个检测电学性质特征向量;二维结构化模块140,用于将所述多个参考电学性质特征向量和所述多个检测电学性质特征向量分别进行二维排列以得到参考电学性质特征矩阵和检测电学性质特征矩阵;孪生网络模块150,用于将所述参考电学性质特征矩阵和所述检测电学性质特征矩阵输入包含第一卷积神经网络模型和第二卷积神经网络模型的孪生网络以得到参考电学深度特征向量和检测电学深度特征向量;差异化模块160,用于计算所述参考电学深度特征向量和所述检测电学深度特征向量之间的差异特征向量;特征分布校正模块170,用于基于所述差异特征向量中所有位置的特征值集合的统计特征,对所述差异特征向量中各个位置的特征值进行自适应校正以得到校正后差异特征向量;以及,检测结果生成模块180,用于将所述校正后差异特征向量输入分类器以得到分类结果,所述分类结果用于表示待检测样本中是否含有CTC细胞。
具体地,在本申请实施例中,所述样本数据采集模块110,用于获取待检测样本的电学性质检测数据和参考样本的电学性质检测数据。如前所述,随着近年来对CTC越来越多的研究,其重要性备受推崇。然而,CTC在血液中的存在量大约是十亿分之一到百亿分之一的水平。现有技术用于分离和识别CTC一方面需要大量人力并且价格昂贵,另一方面缺乏准确性和可靠性。因此,期待一种优化的循环肿瘤细胞检测设备,能够对于样本中的CTC细胞进行准确有效地检测。
目前,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、语音信号处理等领域。此外,深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域,也展现出了接近甚至超越人类的水平。
近年来,深度学习以及神经网络的发展为循环肿瘤细胞的检测提供了新的解决思路和方案。
具体地,在本申请的技术方案中,将基于深度学习的人工智能技术来提取待检测样品和没有疾病的样品(参考样本)之间特征差异,以此作为来判断所述待检测样品内是否存在CTC细胞。也就是,将人工智能技术与生物医药技术相结合以构建用于CTC细胞检测的计算生物方案。
具体地,在本申请的技术方案中,首先,获取待检测样本的电学性质检测数据和参考样本的电学性质检测数据。这里,所述电学性质检测数据包括:表面电荷,表面电位,静息电位,电流,电场分布,表面电荷分布,细胞电学性质,细胞表面电学性质,电学性质的动态变化,细胞电学性质的动态变化,细胞表面电学性质的动态变化,表面电学性质的动态变化,细胞膜的电学性质,膜表面的电学性质的动态变化,细胞膜电学性质的动态变化,电偶极子,双电偶极子,电信号的振荡(例如,在离子振荡,电场脉冲,表面电荷脉冲,电压脉冲),电流,电容,三维电子或电荷云分布,端粒DNA和染色体,电容或阻抗的电性质。
具体地,在本申请实施例中,所述参考样本数据编码模块120和所述检测样本数据编码模块130,用于将所述参考样本的电学性质检测数据中的所有数据项通过基于转换器的上下文编码器以得到多个参考电学性质特征向量,以及,用于将所述待检测样本的电学性质检测数据中的所有数据项通过所述基于转换器的上下文编码器以得到多个检测电学性质特征向量。
对于所述参考样本的电学性质检测数据和所述待检测样本的电学性质检测数据中的所有数据项,考虑到所述各个数据项之间具有着关联性的语义特征,因此,使用基于转换器的上下文编码器来分别提取所述参考样本和所述待检测样本的电学性质检测数据中各个数据项相对于其他数据项的全局上下文语义特征信息,以更适于表征所述电学性质的本质特征,从而得到多个参考电学性质特征向量和多个检测电学性质特征向量。
进一步地,在本申请实施例中,图3图示了根据本申请实施例的循环肿瘤细胞检测设备中所述参考样本数据编码模块的框图,如图3所示,所述参考样本数据编码模块120,包括:第一独热编码单元210,用于分别将所述参考样本的电学性质检测数据中的所有数据项中各个数据项进行独热编码,以将所述参考样本的电学性质检测数据中的各个数据项分别转化为参考输入向量以获得参考输入向量的序列;以及,第一上下文语义编码单元220,用于使用所述基于转换器的上下文编码器的转换器对所述参考输入向量的序列进行基于全局的上下文语义编码以获得所述多个参考电学性质特征向量。
更进一步地,在本申请实施例中,图4图示了根据本申请实施例的循环肿瘤细胞检测设备中所述检测样本数据编码模块的框图,如图4所示,所述检测样本数据编码模块130,包括:第二独热编码单元310,用于分别将所述待检测样本的电学性质检测数据中的所有数据项中各个数据项进行独热编码,以将所述待检测样本的电学性质检测数据中的各个数据项分别转化为检测输入向量以获得检测输入向量的序列;以及,第二上下文语义编码单元320,用于使用所述基于转换器的上下文编码器的转换器对所述检测输入向量的序列进行基于全局的上下文语义编码以获得所述多个检测电学性质特征向量。
在本申请一具体示例中,所述基于转换器的上下文编码器使用基于转换器的Bert模型对所述待检测样本的电学性质检测数据中的所有数据项和所述参考样本的电学性质检测数据中的所有数据项进行基于全局的上下文语义编码,以得到所述多个检测电学性质特征向量和所述多个参考电学性质特征向量。
具体地,在本申请实施例中,所述二维结构化模块140,用于将所述多个参考电学性质特征向量和所述多个检测电学性质特征向量分别进行二维排列以得到参考电学性质特征矩阵和检测电学性质特征矩阵。
也就是,在得到所述多个参考电学性质特征向量和所述多个检测电学性质特征向量后,接着,将所述多个参考电学性质特征向量和所述多个检测电学性质特征向量分别进行二维排列以整合所述电学性质检测数据中的各个数据项的全局高维语义特征,从而得到参考电学性质特征矩阵和检测电学性质特征矩阵。
具体地,在本申请实施例中,所述孪生网络模块150,用于将所述参考电学性质特征矩阵和所述检测电学性质特征矩阵输入包含第一卷积神经网络模型和第二卷积神经网络模型的孪生网络以得到参考电学深度特征向量和检测电学深度特征向量。应可以理解,为了能够分别提取出所述待检测样本和所述参考样本的电学性质检测数据的各个数据项的电学性质全局语义特征之间的深层隐含关联特征信息,进一步使用在局部隐含关联特征提取方面具有优异表现的卷积神经网络模型来作为特征提取器以进行深层隐含关联特征挖掘。
也就是,具体地,在本申请的技术方案中,将所述参考电学性质特征矩阵和所述检测电学性质特征矩阵输入包含第一卷积神经网络模型和第二卷积神经网络模型的孪生网络中进行处理以得到参考电学深度特征向量和检测电学深度特征向量。这里,所述孪生网络使用所述第一卷积神经网络模型来对于所述参考电学性质特征矩阵进行特征挖掘,以提取出所述参考样本的电学性质检测数据中的各个数据项的上下文全局特征之间的隐含关联特征,所述孪生网络使用所述第二卷积神经网络模型来对于所述检测电学性质特征矩阵进行特征挖掘,以提取出所述待检测样本的电学性质检测数据中的各个数据项的上下文全局特征之间的隐含关联特征。
更具体地,在本申请实施例中,图5图示了根据本申请实施例的循环肿瘤细胞检测设备中所述孪生网络模块的框图,如图5所示,所述孪生网络模块150,包括:第一卷积编码单元410,用于使用所述孪生网络的第一卷积神经网络模型的各层在层的正向传递中分别对输入数据进行卷积处理、基于特征矩阵的池化处理和非线性激活处理以由所述第一卷积神经网络模型的最后一层输出所述参考电学深度特征向量;以及,第二卷积编码单元420,用于使用所述孪生网络的第二卷积神经网络模型的各层在层的正向传递中分别对输入数据进行卷积处理、基于特征矩阵的池化处理和非线性激活处理以由所述第二卷积神经网络模型的最后一层输出所述检测电学深度特征向量。
特别地,在本申请一具体示例中,所述孪生网络的第一卷积神经网络模型和第二卷积神经网络模型具有相同的网络结构。
具体地,在本申请实施例中,所述差异化模块160,用于计算所述参考电学深度特征向量和所述检测电学深度特征向量之间的差异特征向量。也就是,进一步计算所述参考电学深度特征向量和所述检测电学深度特征向量之间的差异特征向量,进而以所述孪生网络模型来度量所述待检测电学性质特征矩阵和所述参考电学性质特征矩阵的深度特征表达之间的差异性,并以此来进行分类,以确定所述待检测样本中是否含有CTC细胞。
进一步地,在本申请实施例中,以如下公式计算所述参考电学深度特征向量和所述检测电学深度特征向量之间的所述差异特征向量;其中,所述公式为:
Figure 153534DEST_PATH_IMAGE001
其中
Figure 301618DEST_PATH_IMAGE002
表示所述参考电学深度特征向量,
Figure 44315DEST_PATH_IMAGE003
表示所述检测电学深度特征向量,
Figure 986863DEST_PATH_IMAGE004
表 示所述差异特征向量,
Figure 955956DEST_PATH_IMAGE005
表示按位置减法。
具体地,在本申请实施例中,所述特征分布校正模块170,用于基于所述差异特征向量中所有位置的特征值集合的统计特征,对所述差异特征向量中各个位置的特征值进行自适应校正以得到校正后差异特征向量。特别地,在本申请的技术方案中,在计算所述参考电学深度特征向量和所述检测电学深度特征向量之间的差异特征值以得到差异特征向量时,由于所述参考电学深度特征向量和所述检测电学深度特征向量之间可能存在的特征分布差异,会使得所述差异特征向量具有影响分类回归的异常值。
基于此,对于所述差异特征向量进行自适应实例的信息统计归一化,也就是,基于所述差异特征向量中所有位置的特征值集合的统计特征,以如下公式对所述差异特征向量中各个位置的特征值进行自适应校正以得到所述校正后差异特征向量;其中,所述公式为:
Figure 783098DEST_PATH_IMAGE006
其中
Figure 255668DEST_PATH_IMAGE007
表示所述差异特征向量中各个位置的特征值,
Figure 634696DEST_PATH_IMAGE008
Figure 825506DEST_PATH_IMAGE009
分别表示所述差异特征 向量中所有位置的特征值集合的均值和方差,且
Figure 204142DEST_PATH_IMAGE010
是所述差异特征向量的长度,
Figure 796797DEST_PATH_IMAGE011
表示以2 为底的对数函数,
Figure 487672DEST_PATH_IMAGE012
是加权超参数。
这里,通过将所述差异特征向量的特征集合作为自适应实例,利用所述集合的统计特征的本质内在先验信息,来对集合内的单个值,也就是,每个特征值进行动态生成式的信息归一化,同时以特征集合的归一化模长信息作为偏置来作为集合分布域内的不变性描述,这可以实现尽可能屏蔽特殊实例的扰动分布的特征优化,从而提升所述差异特征向量的分类准确性。进而,能够对于所述待检测样本中是否存在CTC细胞进行准确有效地检测,以便于准确地确定癌症的发展状况来进行相应地治疗,降低癌症的死亡率。
具体地,在本申请实施例中,所述检测结果生成模块180,用于将所述校正后差异特征向量输入分类器以得到分类结果,所述分类结果用于表示待检测样本中是否含有CTC细胞。也就是,将所述校正后差异特征向量输入分类函数以获得分类函数值,其中,所述分类函数值为所述分类结果,所述分类结果用于表示待检测样本中是否含有CTC细胞。
进一步地,使用所述分类器以如下公式对所述校正后差异特征向量进行处理以生成分类结果,其中,所述公式为:
Figure 900199DEST_PATH_IMAGE013
,其中X表示所述校正后差异特征向量,
Figure 193777DEST_PATH_IMAGE014
Figure 640939DEST_PATH_IMAGE015
为各层全连接层的权重矩阵,
Figure 486404DEST_PATH_IMAGE016
Figure 651806DEST_PATH_IMAGE017
表示各层全连接层的偏置向量。
综上,基于本申请实施例的循环肿瘤细胞检测设备100被阐明,其通过基于转换器的上下文编码器来分别提取参考样本和待检测样本的电学性质检测数据中各个数据项相对于其他数据项的全局上下文语义特征信息;然后,通过包含第一卷积神经网络模型和第二卷积神经网络模型的孪生网络分别提取参考样本和待检测样本的电学性质检测数据中的各个数据项的上下文全局特征之间的隐含关联特征以得到参考电学深度特征向量和检测电学深度特征向量;接着计算两个特征向量之间的差异特征向量并以此来进行分类,最后得到用于表示待检测样本中是否含有CTC细胞的分类结果。这样,可以对于所述待检测样本中是否存在CTC细胞进行准确地检测,以降低癌症的死亡率。
示例性方法
图6图示了根据本申请实施例的循环肿瘤细胞检测方法的流程图。如图6所示,根据本申请实施例的循环肿瘤细胞检测方法,包括:S110,获取待检测样本的电学性质检测数据和参考样本的电学性质检测数据;S120,将所述参考样本的电学性质检测数据中的所有数据项通过基于转换器的上下文编码器以得到多个参考电学性质特征向量;S130,将所述待检测样本的电学性质检测数据中的所有数据项通过所述基于转换器的上下文编码器以得到多个检测电学性质特征向量;S140,将所述多个参考电学性质特征向量和所述多个检测电学性质特征向量分别进行二维排列以得到参考电学性质特征矩阵和检测电学性质特征矩阵;S150,将所述参考电学性质特征矩阵和所述检测电学性质特征矩阵输入包含第一卷积神经网络模型和第二卷积神经网络模型的孪生网络以得到参考电学深度特征向量和检测电学深度特征向量;
S160,计算所述参考电学深度特征向量和所述检测电学深度特征向量之间的差异特征向量;S170,基于所述差异特征向量中所有位置的特征值集合的统计特征,对所述差异特征向量中各个位置的特征值进行自适应校正以得到校正后差异特征向量;以及,S180,将所述校正后差异特征向量输入分类器以得到分类结果,所述分类结果用于表示待检测样本中是否含有CTC细胞。
图7图示了根据本申请实施例的循环肿瘤细胞检测方法的架构示意图。如图7所示,在所述循环肿瘤细胞检测方法的网络架构中,首先,获取待检测样本的电学性质检测数据和参考样本的电学性质检测数据;然后,将所述参考样本的电学性质检测数据中的所有数据项通过基于转换器的上下文编码器以得到多个参考电学性质特征向量;接着,将所述待检测样本的电学性质检测数据中的所有数据项通过所述基于转换器的上下文编码器以得到多个检测电学性质特征向量;然后,将所述多个参考电学性质特征向量和所述多个检测电学性质特征向量分别进行二维排列以得到参考电学性质特征矩阵和检测电学性质特征矩阵;接着,将所述参考电学性质特征矩阵和所述检测电学性质特征矩阵输入包含第一卷积神经网络模型和第二卷积神经网络模型的孪生网络以得到参考电学深度特征向量和检测电学深度特征向量;
然后,计算所述参考电学深度特征向量和所述检测电学深度特征向量之间的差异特征向量;接着,基于所述差异特征向量中所有位置的特征值集合的统计特征,对所述差异特征向量中各个位置的特征值进行自适应校正以得到校正后差异特征向量;以及,最后,将所述校正后差异特征向量输入分类器以得到分类结果,所述分类结果用于表示待检测样本中是否含有CTC细胞。
在本申请的一个实施例中,在上述循环肿瘤细胞检测方法中,所述电学性质检测数据,包括:表面电荷,表面电位,静息电位,电流,电场分布,表面电荷分布,细胞电学性质,细胞表面电学性质,电学性质的动态变化,细胞电学性质的动态变化,细胞表面电学性质的动态变化,表面电学性质的动态变化,细胞膜的电学性质,膜表面的电学性质的动态变化,细胞膜电学性质的动态变化,电偶极子,双电偶极子,电信号的振荡,电流,电容,三维电子或电荷云分布,端粒DNA和染色体,电容或阻抗的电性质。
在本申请的一个实施例中,在上述循环肿瘤细胞检测方法中,所述将所述参考样本的电学性质检测数据中的所有数据项通过基于转换器的上下文编码器以得到多个参考电学性质特征向量,包括:分别将所述参考样本的电学性质检测数据中的所有数据项中各个数据项进行独热编码,以将所述参考样本的电学性质检测数据中的各个数据项分别转化为参考输入向量以获得参考输入向量的序列;以及,使用所述基于转换器的上下文编码器的转换器对所述参考输入向量的序列进行基于全局的上下文语义编码以获得所述多个参考电学性质特征向量。
在本申请的一个实施例中,在上述循环肿瘤细胞检测方法中,所述将所述待检测样本的电学性质检测数据中的所有数据项通过所述基于转换器的上下文编码器以得到多个检测电学性质特征向量,包括:分别将所述待检测样本的电学性质检测数据中的所有数据项中各个数据项进行独热编码,以将所述待检测样本的电学性质检测数据中的各个数据项分别转化为检测输入向量以获得检测输入向量的序列;以及,使用所述基于转换器的上下文编码器的转换器对所述检测输入向量的序列进行基于全局的上下文语义编码以获得所述多个检测电学性质特征向量。
应可以理解,对于所述参考样本的电学性质检测数据和所述待检测样本的电学性质检测数据中的所有数据项,考虑到所述各个数据项之间具有着关联性的语义特征,因此,使用基于转换器的上下文编码器来分别提取所述参考样本和所述待检测样本的电学性质检测数据中各个数据项相对于其他数据项的全局上下文语义特征信息,以更适于表征所述电学性质的本质特征,从而得到多个参考电学性质特征向量和多个检测电学性质特征向量。
在本申请的一个实施例中,在上述循环肿瘤细胞检测方法中,所述将所述参考电学性质特征矩阵和所述检测电学性质特征矩阵输入包含第一卷积神经网络模型和第二卷积神经网络模型的孪生网络以得到参考电学深度特征向量和检测电学深度特征向量,包括:使用所述孪生网络的第一卷积神经网络模型的各层在层的正向传递中分别对输入数据进行卷积处理、基于特征矩阵的池化处理和非线性激活处理以由所述第一卷积神经网络模型的最后一层输出所述参考电学深度特征向量;以及,使用所述孪生网络的第二卷积神经网络模型的各层在层的正向传递中分别对输入数据进行卷积处理、基于特征矩阵的池化处理和非线性激活处理以由所述第二卷积神经网络模型的最后一层输出所述检测电学深度特征向量。
为了能够分别提取出所述待检测样本和所述参考样本的电学性质检测数据的各个数据项的电学性质全局语义特征之间的深层隐含关联特征信息,进一步使用在局部隐含关联特征提取方面具有优异表现的卷积神经网络模型来作为特征提取器以进行深层隐含关联特征挖掘。也就是,具体地,在本申请的技术方案中,将所述参考电学性质特征矩阵和所述检测电学性质特征矩阵输入包含第一卷积神经网络模型和第二卷积神经网络模型的孪生网络中进行处理以得到参考电学深度特征向量和检测电学深度特征向量。这里,所述孪生网络使用所述第一卷积神经网络模型来对于所述参考电学性质特征矩阵进行特征挖掘,以提取出所述参考样本的电学性质检测数据中的各个数据项的上下文全局特征之间的隐含关联特征,所述孪生网络使用所述第二卷积神经网络模型来对于所述检测电学性质特征矩阵进行特征挖掘,以提取出所述待检测样本的电学性质检测数据中的各个数据项的上下文全局特征之间的隐含关联特征。
在本申请的一个实施例中,在上述循环肿瘤细胞检测方法中,所述孪生网络的第一卷积神经网络模型和第二卷积神经网络模型具有相同的网络结构。
在本申请的一个实施例中,在上述循环肿瘤细胞检测方法中,所述计算所述参考电学深度特征向量和所述检测电学深度特征向量之间的差异特征向量,进一步包括:以如下公式计算所述参考电学深度特征向量和所述检测电学深度特征向量之间的所述差异特征向量;其中,所述公式为:
Figure 483496DEST_PATH_IMAGE001
其中
Figure 926110DEST_PATH_IMAGE002
表示所述参考电学深度特征向量,
Figure 817843DEST_PATH_IMAGE003
表示所述检测电学深度特征向量,
Figure 204962DEST_PATH_IMAGE004
表 示所述差异特征向量,
Figure 840342DEST_PATH_IMAGE005
表示按位置减法。
在本申请的一个实施例中,在上述循环肿瘤细胞检测方法中,所述基于所述差异特征向量中所有位置的特征值集合的统计特征,对所述差异特征向量中各个位置的特征值进行自适应校正以得到校正后差异特征向量,进一步包括:基于所述差异特征向量中所有位置的特征值集合的统计特征,以如下公式对所述差异特征向量中各个位置的特征值进行自适应校正以得到所述校正后差异特征向量;其中,所述公式为:
Figure 888195DEST_PATH_IMAGE006
其中
Figure 950829DEST_PATH_IMAGE007
表示所述差异特征向量中各个位置的特征值,
Figure 825244DEST_PATH_IMAGE008
Figure 139682DEST_PATH_IMAGE009
分别表示所述差异特征 向量中所有位置的特征值集合的均值和方差,且
Figure 415942DEST_PATH_IMAGE010
是所述差异特征向量的长度,
Figure 649478DEST_PATH_IMAGE011
表示以2 为底的对数函数,
Figure 401402DEST_PATH_IMAGE012
是加权超参数。
这里,通过将所述差异特征向量的特征集合作为自适应实例,利用所述集合的统计特征的本质内在先验信息,来对集合内的单个值,也就是,每个特征值进行动态生成式的信息归一化,同时以特征集合的归一化模长信息作为偏置来作为集合分布域内的不变性描述,这可以实现尽可能屏蔽特殊实例的扰动分布的特征优化,从而提升所述差异特征向量的分类准确性。进而,能够对于所述待检测样本中是否存在CTC细胞进行准确有效地检测,以便于准确地确定癌症的发展状况来进行相应地治疗,降低癌症的死亡率。
在本申请的一个实施例中,在上述循环肿瘤细胞检测方法中,所述将所述校正后 差异特征向量输入分类器以得到分类结果,所述分类结果用于表示待检测样本中是否含有 CTC细胞,进一步包括:使用所述分类器以如下公式对所述校正后差异特征向量进行处理以 生成分类结果,其中,所述公式为:
Figure 378585DEST_PATH_IMAGE013
,其中X表示所述校 正后差异特征向量,
Figure 774931DEST_PATH_IMAGE014
Figure 179368DEST_PATH_IMAGE015
为各层全连接层的权重矩阵,
Figure 638162DEST_PATH_IMAGE016
Figure 419036DEST_PATH_IMAGE017
表示各层全连接层的偏置 向量。
这里,本领域技术人员可以理解,上述循环肿瘤细胞检测方法中的具体功能和操作已经在上面参考图1到图5的循环肿瘤细胞检测设备描述中得到了详细介绍,并因此,将省略其重复描述。

Claims (8)

1.一种循环肿瘤细胞检测设备,其特征在于,包括:
样本数据采集模块,用于获取待检测样本的电学性质检测数据和参考样本的电学性质检测数据;
参考样本数据编码模块,用于将所述参考样本的电学性质检测数据中的所有数据项通过基于转换器的上下文编码器以得到多个参考电学性质特征向量;
检测样本数据编码模块,用于将所述待检测样本的电学性质检测数据中的所有数据项通过所述基于转换器的上下文编码器以得到多个检测电学性质特征向量;
二维结构化模块,用于将所述多个参考电学性质特征向量和所述多个检测电学性质特征向量分别进行二维排列以得到参考电学性质特征矩阵和检测电学性质特征矩阵;
孪生网络模块,用于将所述参考电学性质特征矩阵和所述检测电学性质特征矩阵输入包含第一卷积神经网络模型和第二卷积神经网络模型的孪生网络以得到参考电学深度特征向量和检测电学深度特征向量;
差异化模块,用于计算所述参考电学深度特征向量和所述检测电学深度特征向量之间的差异特征向量;
特征分布校正模块,用于基于所述差异特征向量中所有位置的特征值集合的统计特征,对所述差异特征向量中各个位置的特征值进行自适应校正以得到校正后差异特征向量;以及
检测结果生成模块,用于将所述校正后差异特征向量输入分类器以得到分类结果,所述分类结果用于表示待检测样本中是否含有CTC细胞;
其中,所述特征分布校正模块,进一步用于:基于所述差异特征向量中所有位置的特征值集合的统计特征,以如下公式对所述差异特征向量中各个位置的特征值进行自适应校正以得到所述校正后差异特征向量;
其中,所述公式为:
Figure 779725DEST_PATH_IMAGE001
其中
Figure 505105DEST_PATH_IMAGE002
表示所述差异特征向量中各个位置的特征值,
Figure 499605DEST_PATH_IMAGE003
Figure 843999DEST_PATH_IMAGE004
分别表示所述差异特征向量 中所有位置的特征值集合的均值和方差,且
Figure 341977DEST_PATH_IMAGE005
是所述差异特征向量的长度,
Figure 520148DEST_PATH_IMAGE006
表示以2为底 的对数函数,
Figure 470787DEST_PATH_IMAGE007
是加权超参数。
2.根据权利要求1所述的循环肿瘤细胞检测设备,其特征在于,所述电学性质检测数据,包括:表面电荷,表面电位,静息电位,电流,电场分布,表面电荷分布,细胞电学性质,细胞表面电学性质,电学性质的动态变化,细胞电学性质的动态变化,细胞表面电学性质的动态变化,表面电学性质的动态变化,细胞膜的电学性质,膜表面的电学性质的动态变化,细胞膜电学性质的动态变化,电偶极子,双电偶极子,电信号的振荡,电容,端粒DNA,染色体。
3.根据权利要求2所述的循环肿瘤细胞检测设备,其特征在于,所述参考样本数据编码模块,包括:
第一独热编码单元,用于分别将所述参考样本的电学性质检测数据中的所有数据项中各个数据项进行独热编码,以将所述参考样本的电学性质检测数据中的各个数据项分别转化为参考输入向量以获得参考输入向量的序列;以及
第一上下文语义编码单元,用于使用所述基于转换器的上下文编码器的转换器对所述参考输入向量的序列进行基于全局的上下文语义编码以获得所述多个参考电学性质特征向量。
4.根据权利要求3所述的循环肿瘤细胞检测设备,其特征在于,所述检测样本数据编码模块,包括:
第二独热编码单元,用于分别将所述待检测样本的电学性质检测数据中的所有数据项中各个数据项进行独热编码,以将所述待检测样本的电学性质检测数据中的各个数据项分别转化为检测输入向量以获得检测输入向量的序列;以及
第二上下文语义编码单元,用于使用所述基于转换器的上下文编码器的转换器对所述检测输入向量的序列进行基于全局的上下文语义编码以获得所述多个检测电学性质特征向量。
5.根据权利要求4所述的循环肿瘤细胞检测设备,其特征在于,所述孪生网络模块,包括:
第一卷积编码单元,用于使用所述孪生网络的第一卷积神经网络模型的各层在层的正向传递中分别对输入数据进行卷积处理、基于特征矩阵的池化处理和非线性激活处理以由所述第一卷积神经网络模型的最后一层输出所述参考电学深度特征向量;以及
第二卷积编码单元,用于使用所述孪生网络的第二卷积神经网络模型的各层在层的正向传递中分别对输入数据进行卷积处理、基于特征矩阵的池化处理和非线性激活处理以由所述第二卷积神经网络模型的最后一层输出所述检测电学深度特征向量。
6.根据权利要求5所述的循环肿瘤细胞检测设备,其特征在于,所述孪生网络的第一卷积神经网络模型和第二卷积神经网络模型具有相同的网络结构。
7.根据权利要求6所述的循环肿瘤细胞检测设备,其特征在于,所述差异化模块,进一步用于:以如下公式计算所述参考电学深度特征向量和所述检测电学深度特征向量之间的所述差异特征向量;
其中,所述公式为:
Figure 618871DEST_PATH_IMAGE008
其中
Figure 236934DEST_PATH_IMAGE009
表示所述参考电学深度特征向量,
Figure 445062DEST_PATH_IMAGE010
表示所述检测电学深度特征向量,
Figure 273209DEST_PATH_IMAGE011
表示所 述差异特征向量,
Figure 959406DEST_PATH_IMAGE012
表示按位置减法。
8.根据权利要求7所述的循环肿瘤细胞检测设备,其特征在于,所述检测结果生成模 块,进一步用于:使用所述分类器以如下公式对所述校正后差异特征向量进行处理以生成 分类结果,其中,所述公式为:
Figure 697555DEST_PATH_IMAGE013
,其中X表示所述校正后 差异特征向量,
Figure 811004DEST_PATH_IMAGE014
Figure 1814DEST_PATH_IMAGE015
为各层全连接层的权重矩阵,
Figure 367067DEST_PATH_IMAGE016
Figure 694143DEST_PATH_IMAGE017
表示各层全连接层的偏置向 量。
CN202211359933.0A 2022-11-02 2022-11-02 循环肿瘤细胞检测设备及其方法 Active CN115409844B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211359933.0A CN115409844B (zh) 2022-11-02 2022-11-02 循环肿瘤细胞检测设备及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211359933.0A CN115409844B (zh) 2022-11-02 2022-11-02 循环肿瘤细胞检测设备及其方法

Publications (2)

Publication Number Publication Date
CN115409844A CN115409844A (zh) 2022-11-29
CN115409844B true CN115409844B (zh) 2023-02-03

Family

ID=84169181

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211359933.0A Active CN115409844B (zh) 2022-11-02 2022-11-02 循环肿瘤细胞检测设备及其方法

Country Status (1)

Country Link
CN (1) CN115409844B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115690109B (zh) * 2023-01-04 2023-03-14 杭州华得森生物技术有限公司 基于计算生物的肿瘤细胞检测设备及其方法
CN115688028B (zh) * 2023-01-05 2023-08-01 杭州华得森生物技术有限公司 肿瘤细胞生长状态检测设备
CN116309543B (zh) * 2023-05-10 2023-08-11 北京航空航天大学杭州创新研究院 基于图像的循环肿瘤细胞检测设备
CN116287138B (zh) * 2023-05-23 2023-08-11 杭州华得森生物技术有限公司 基于fish的细胞检测系统及其方法
CN116309595B (zh) * 2023-05-23 2023-08-01 杭州华得森生物技术有限公司 Ctc智能全自动检测一体机及其方法
CN116309596B (zh) * 2023-05-23 2023-08-04 杭州华得森生物技术有限公司 基于微流控芯片的ctc细胞检测方法及其系统
CN116434226B (zh) * 2023-06-08 2024-03-19 杭州华得森生物技术有限公司 循环肿瘤细胞分析仪

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114037661A (zh) * 2021-10-26 2022-02-11 同济大学 基于yolo算法的循环肿瘤细胞识别系统
CN114119525A (zh) * 2021-11-19 2022-03-01 重庆大学 一种细胞医学图像分割的方法和系统
CN114140830A (zh) * 2021-12-09 2022-03-04 广东亿云付科技有限公司 一种基于循环肿瘤细胞图像的重复识别抑制方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3135289A1 (en) * 2019-03-28 2020-10-01 Board Of Regents Of The University Of Texas System Computerized system and method for antigen-independent de novo prediction of cancer-associated tcr repertoire
CN110533630A (zh) * 2019-07-11 2019-12-03 上海大学 一种基于神经网络的膀胱癌检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114037661A (zh) * 2021-10-26 2022-02-11 同济大学 基于yolo算法的循环肿瘤细胞识别系统
CN114119525A (zh) * 2021-11-19 2022-03-01 重庆大学 一种细胞医学图像分割的方法和系统
CN114140830A (zh) * 2021-12-09 2022-03-04 广东亿云付科技有限公司 一种基于循环肿瘤细胞图像的重复识别抑制方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Computational Study ofMethods for Determining the Elasticity of Red Blood Cells Using Machine Learning;Samuel Molˇcan et al.;《symmetry》;20220819;全文 *
基于卷积神经网络的循环肿瘤细胞智能辨识平台的研制;黎斌;《知网》;20200615;全文 *

Also Published As

Publication number Publication date
CN115409844A (zh) 2022-11-29

Similar Documents

Publication Publication Date Title
CN115409844B (zh) 循环肿瘤细胞检测设备及其方法
CN108960140B (zh) 基于多区域特征提取和融合的行人再识别方法
CN113255733B (zh) 多模态数据缺失下的无监督异常检测方法
CN115791640B (zh) 基于分光光谱的肿瘤细胞检测设备及其方法
CN115406815B (zh) 基于多源数据融合的肿瘤细胞检测设备及其方法
CN115690109B (zh) 基于计算生物的肿瘤细胞检测设备及其方法
CN111443165B (zh) 一种基于气体传感器与深度学习的气味识别方法
CN112580590A (zh) 一种基于多语义特征融合网络的指静脉识别方法
CN110796199B (zh) 一种图像处理方法、装置以及电子医疗设备
CN112233798B (zh) 基于病理模式与注意力机制的可解释疾病风险分析系统
CN111914919A (zh) 基于深度学习的开放集辐射源个体识别方法
CN115013298B (zh) 污水泵的实时性能在线监测系统及其监测方法
CN111598167A (zh) 基于图学习的小样本图像识别方法及系统
Singh et al. Unsupervised change detection from remote sensing images using hybrid genetic FCM
CN112749633A (zh) 分离与重构的个体辐射源识别方法
CN113705645B (zh) 一种针对脑电信号的自适应联合模型半监督学习分类方法
CN114119532A (zh) 一种基于遥感影像与孪生神经网络的建筑物变化检测方法
CN108496174A (zh) 用于面部识别的方法和系统
Guan et al. Automatic cell region detection by k-means with weighted entropy
CN116779176A (zh) 基于神经网络深度特征的移植术后慢性肾病样本增广方法
Jarchi et al. Transition detection and activity classification from wearable sensors using singular spectrum analysis
CN109697474A (zh) 基于迭代贝叶斯的合成孔径雷达影像变化检测方法
CN114882007A (zh) 一种基于记忆网络的图像异常检测方法
CN115510900A (zh) 电路故障自动诊断方法及其诊断系统
CN113449751B (zh) 基于对称性和群论的物体-属性组合图像识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20231120

Address after: Room 1303, 13th Floor, No. 888 Fuxian Road, Yinhu Street, Hangzhou City, Zhejiang Province, 311400

Patentee after: Zhejiang Huadesen Biotechnology Co.,Ltd.

Address before: 3 / F, building 4, 88 Jiangling Road, Binjiang District, Hangzhou, Zhejiang 310000

Patentee before: HANGZHOU WATSON BIOTECH Inc.