CN116704500A - 基于机器学习的细胞识别方法和系统 - Google Patents
基于机器学习的细胞识别方法和系统 Download PDFInfo
- Publication number
- CN116704500A CN116704500A CN202310581002.3A CN202310581002A CN116704500A CN 116704500 A CN116704500 A CN 116704500A CN 202310581002 A CN202310581002 A CN 202310581002A CN 116704500 A CN116704500 A CN 116704500A
- Authority
- CN
- China
- Prior art keywords
- cell
- cells
- nanotube
- detected
- fingerprint
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000010801 machine learning Methods 0.000 title claims abstract description 34
- 238000012549 training Methods 0.000 claims abstract description 21
- 238000012360 testing method Methods 0.000 claims abstract description 15
- 238000013528 artificial neural network Methods 0.000 claims abstract description 11
- 238000012545 processing Methods 0.000 claims abstract description 5
- 210000004027 cell Anatomy 0.000 claims description 170
- 239000002071 nanotube Substances 0.000 claims description 40
- 230000006870 function Effects 0.000 claims description 32
- 239000008151 electrolyte solution Substances 0.000 claims description 24
- 230000004913 activation Effects 0.000 claims description 20
- 150000002500 ions Chemical class 0.000 claims description 18
- 210000004881 tumor cell Anatomy 0.000 claims description 18
- 230000005859 cell recognition Effects 0.000 claims description 13
- 230000009471 action Effects 0.000 claims description 8
- 230000005684 electric field Effects 0.000 claims description 8
- 238000001228 spectrum Methods 0.000 claims description 6
- 208000005443 Circulating Neoplastic Cells Diseases 0.000 claims description 5
- 238000004519 manufacturing process Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 239000000523 sample Substances 0.000 description 14
- 238000001514 detection method Methods 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 7
- 238000000605 extraction Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000013507 mapping Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 108090000623 proteins and genes Proteins 0.000 description 4
- 229910021607 Silver chloride Inorganic materials 0.000 description 3
- 210000000601 blood cell Anatomy 0.000 description 3
- 238000000684 flow cytometry Methods 0.000 description 3
- 239000011521 glass Substances 0.000 description 3
- 238000003364 immunohistochemistry Methods 0.000 description 3
- 238000007901 in situ hybridization Methods 0.000 description 3
- HKZLPVFGJNLROG-UHFFFAOYSA-M silver monochloride Chemical compound [Cl-].[Ag+] HKZLPVFGJNLROG-UHFFFAOYSA-M 0.000 description 3
- 238000003759 clinical diagnosis Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 239000002953 phosphate buffered saline Substances 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 230000035899 viability Effects 0.000 description 2
- 241000700605 Viruses Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 210000003050 axon Anatomy 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000005388 borosilicate glass Substances 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000004720 dielectrophoresis Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000005370 electroosmosis Methods 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 238000012151 immunohistochemical method Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000011246 intracellular protein detection Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 238000001819 mass spectrum Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012634 optical imaging Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 238000001878 scanning electron micrograph Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/69—Microscopic objects, e.g. biological cells or cellular parts
- G06V20/698—Matching; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E60/00—Enabling technologies; Technologies with a potential or indirect contribution to GHG emissions mitigation
- Y02E60/30—Hydrogen technology
- Y02E60/50—Fuel cells
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明涉及生物技术领域,具体涉及基于机器学习的细胞识别方法和系统。该方法通过获取并分析待测细胞的指纹图谱,提取特征参数,利用基于神经网络的机器学习算法构建细胞识别模型并进行训练,实现细胞种类的识别;该细胞识别系统包括数据采集及处理模块、模型训练模块以及模型测试模块,通过本发明提供的细胞识别方法和系统可实现便捷、高效、无损伤地识别单细胞类型。
Description
技术领域
本发明涉及生物技术领域,具体地,本发明涉及基于机器学习的细胞识别方法和系统。
背景技术
细胞识别鉴定是生物医学和临床诊断研究领域的一个重要目标,引起了人们的广泛关注。许多方法包括免疫组化、流式细胞术、定量(实时)逆转录PCR(qRT-PCR)、原位杂交和基因测序,已经被开发用于识别细胞,特别是循环肿瘤细胞(CTCs)。其中,免疫组化被认为是循环肿瘤细胞预富集后区分肿瘤细胞和血细胞的“金标准”,然而细胞必须经过固定和穿透,降低了细胞的活力和完整性。qRT-PCR和原位杂交依赖于正常血细胞中低水平表达的靶基因,容易导致假阳性结果。此外,复杂的实验步骤不利于不同研究结果的比较。基因测序具有较高的灵敏度和选择性,但需要昂贵的设备、较长的周期和特殊的操作技术。因此,开发高选择性、高灵敏度、快速、低成本和无标签的血清/血液细胞鉴别方法是临床诊断的关键。
长期以来,人们建立起各种单细胞分析方法在医药、生命科学、临床诊断等领域的研究做出巨大的突破。传统的单细胞检测手段例如:流式细胞术,通常需要对细胞进行标记处理,并且对于原位活细胞检测仍面临有较大挑战。近几年其他的单细胞分析技术将流式细胞术与光谱、质谱、光学成像等技术结合,使得单细胞分析手段具有更高的通量、时空分辨率。然而,这些方法往往需要对细胞进行前处理,并且耗时较长,同时需要复杂昂贵的仪器,这也是传统的单细胞分析技术急需解决的问题。
近年来,纳米孔技术的发展极大地丰富了纳米生物大分子和颗粒(如DNA、蛋白质、病毒和胞外囊泡)的生物传感和鉴定方法。纳米孔传感基于瞬态离子电流减少峰值来测量这些生物目标,这是由生物目标物体在电泳下穿过纳米限制传感区域的运输引起的。单电流瞬态特征揭示了单个物体的物理化学性质,如体积、表面电荷、形状、序列等,可用于识别相应的生物目标。然而,目前基于纳米孔/移液管的细胞分析主要集中在细胞内检测,需要将纳米管插入单个细胞中,降低了细胞的生存能力。因此,目前针对单细胞的分析方法仍有待研究。
因此,亟需提供一种简易、高效、无损伤的单细胞分析方法和系统。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明提供一种基于机器学习的细胞识别方法和系统。该方法和系统将不同种类细胞对应的特征峰型图案作为细胞的电化学指纹图谱,基于神经网络的机器学习方法分类识别该指纹图谱,以达到数字化识别细胞的功能。
为此,本发明第一方面提供一种基于机器学习的细胞识别方法,所述细胞识别方法包括:
获取待测细胞的指纹图谱;
分析所述指纹图谱,提取特征参数;
将提取的特征参数作为训练集和测试集,采用基于神经网络的机器学习算法构建细胞识别模型并进行训练,实现细胞种类的识别,
其中,获取待测细胞的指纹图谱的方法包括:
S1,将纳米管浸入含有待测细胞的电解质溶液中,所述纳米管内含有与纳米管外相同的电解质溶液;
S2,在所述纳米管和纳米管外的电解质溶液中分别插入电极,并于两电极间施加电压,形成离子电流通路;
S3,实时记录电流值,所述待测细胞在电场作用下依次经过所述纳米管管口,阻碍电解质溶液中的离子流过所述管口,形成相应电流降信号,获得所述待测细胞的指纹图谱。
发明人发现,细胞会在电场力作用下向纳米管管口移动,但当靠近管口时会因电渗流(粘性应力)和介电泳力作用使得细胞远离管口,该动力学过程会通过电流信号反映出来,即在细胞接近管口时造成离子阻塞会产生电流下降信号,而细胞离开后电流信号又上升。同时由于不同细胞表面膜电荷与膜结构的差异,不同种类细胞会所产生不同的的电流降信号,因而其又称为细胞的指纹图谱,可据此实现无损伤的识别单细胞类型。通过将不同种类细胞对应的特征峰型图案作为细胞的电化学指纹图谱,并利用机器学习算法分类识别该指纹图谱,可实现简易、高效、无损伤地识别肿瘤细胞。
根据本发明的实施例,所述纳米管的内径约为200nm。由此可实现单细胞水平的分析。
根据本发明的实施例,所述待测细胞样本为肿瘤细胞样本。
根据本发明的实施例,所述肿瘤细胞包括选自循环肿瘤细胞。
根据本发明的实施例,所述肿瘤细胞包括选自HeLa细胞、MCF-7细胞、A549细胞、A375细胞、4T1细胞、SiHa细胞中的至少一种。
根据本发明的实施例,所述特征参数包括单峰个数、整体峰延迟时间、单峰延迟时间、单峰电流降、单峰下降角度。其中,单峰个数为在一组指纹图谱中出现的小振幅的峰个数;整体峰延迟时间为从电流开始下降的时刻到离子电流上升到基线时的间隔时间;单峰延迟时间为单个峰电流开始下降到上升会基线时的时间间隔;单峰电流降为每个峰开始时电流与峰电流最低值的差值;单峰下降角度为每个峰电流降与电流基线的夹角。由此,基于利用机器学习的方法来分析待测细胞指纹图谱中的这5种参数从而达到高效、准确地识别细胞的目的。
根据本发明的实施例,所述机器学习算法包括输入层,隐藏层和输出层。其中,输入层用于将提取的5种特征参数馈送到隐藏层和输出层,隐藏层和输出层将5种特征参数通过函数训练,与目标集建立映射关系,实现根据细胞参数去分类识别细胞的功能。
根据本发明的实施例,所述隐藏层使用非线性激活函数。
根据本发明的实施例,所述非线性激活函数为Sigmoid非线性激活函数。
根据本发明的实施例,所述输出层使用线性激活函数。
其中,非线性激活函数和线性激活函数可作为前馈网络很好地适应多维映射问题。
本发明第二方面提供一种基于机器学习的细胞识别系统,所述细胞识别系统包括:
数据采集及处理模块:用于获取待测细胞的特征参数,制作成训练集和测试集;
模型训练模块:利用基于神经网络的机器学习算法构建细胞识别模型,并将所述训练集输入到所述细胞识别模型中进行训练,更新模型参数以准确判断细胞种类;
模型测试模块:将所述测试集输入到所述细胞识别模型中,输出待测细胞的识别结果;
其中,所述待测细胞的特征参数从指纹图谱提取得到,所述指纹图谱的获取方法包括:
S1,将纳米管浸入含有待测细胞的电解质溶液中,所述纳米管内含有与纳米管外相同的电解质溶液;
S2,在所述纳米管和纳米管外的电解质溶液中分别插入电极,并于两电极间施加电压,形成离子电流通路;
S3,实时记录电流值,所述待测细胞在电场作用下依次经过所述纳米管管口,阻碍电解质溶液中的离子流过所述管口,形成相应电流降信号,获得所述待测细胞的指纹图谱。
本发明提供的细胞识别系统将每种细胞的特征参数作为输入端数据输入细胞识别模型中,通过函数训练,与目标集建立映射关系。所用函数可以根据Levenberg-Marquardt优化来更新“权重”和“偏差”的值,从而给出输入端和输出端数据之间最优的函数关系。该系统最终以细胞种类作为输出端,实现根据细胞参数去分类识别细胞的功能。
根据本发明的实施例,所述特征参数包括单峰个数、整体峰延迟时间、单峰延迟时间、单峰电流降、单峰下降角度。
根据本发明的实施例,所述机器学习算法包括输入层、隐藏层和输出层。
根据本发明的实施例,所述隐藏层使用非线性激活函数。
根据本发明的实施例,所述非线性激活函数为Sigmoid非线性激活函数。
根据本发明的实施例,输出层使用线性激活函数。
其中,非线性激活函数和线性激活函数可作为前馈网络很好地适应多维映射问题。
根据本发明的实施例,所述更新模型参数进一步包括获得算法回归函数。
根据本发明的实施例,所述更新模型参数进一步包括采用Levenberg-Marquardt优化算法回归函数。由此更新“权重”和“偏差”的值,从而给出输入端和输出端数据之间最优的函数关系。
根据本发明的实施例,所述细胞识别系统用于实施第一方面所述的细胞识别方法。
本发明相对于现有技术具有以下有益效果:
(1)操作简便。和免疫组化、qRT-PCR和原位杂交等细胞识别鉴定方法相比,本发明提供的基于机器学习的细胞识别方法无需复杂的实验步骤,以及昂贵的实验设备、较长的周期或是特殊的操作技术;
(2)高效识别。本发明利用纳米孔技术获得待测细胞的指纹图谱,并基于指纹图谱提取特征参数,采用机器学习算法实现数字化地识别待测样品中的细胞种类,一次检测时间通常为1000s;
(3)对细胞无损伤。不同于需要固定和穿透细胞的免疫组化方法,本发明提供的基于机器学习的细胞识别方法无需对细胞进行预处理,便可实现对活细胞的检测和识别。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1显示了本发明实施例1中玻璃纳米管探针的SEM电镜图;
图2-4分别显示了本发明实施例1中实验装置示意图;
图5显示了本发明实施例1中指纹图谱提取参数标准方式的示意图;
图6显示了本发明实施例1中基于机器学习数字化识别细胞指纹图谱示意图。
具体实施方式
下面详细描述本发明的实施例。下面描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
需要说明的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。进一步地,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
在本文中所披露的范围的端点和任何值都不限于该精确的范围或值,这些范围或值应当理解为包含接近这些范围或值的值。对于数值范围来说,各个范围的端点值之间、各个范围的端点值和单独的点值之间,以及单独的点值之间可以彼此组合而得到一个或多个新的数值范围,这些数值范围应被视为在本文中具体公开。
为了更容易理解本发明,以下具体定义了某些技术和科学术语。除显而易见在本文件中的它处另有明确定义,否则本文中使用的所有其它技术和科学术语都具有本发明所属领域的一般技术人员通常理解的含义。
在本文中,术语“包含”或“包括”为开放式表达,即包括本发明所指明的内容,但并不排除其他方面的内容。
在本文中,术语“任选地”、“任选的”或“任选”通常是指随后所述的事件或状况可以但未必发生,并且该描述包括其中发生该事件或状况的情况,以及其中未发生该事件或状况的情况。
根据本发明的实施例,本发明第一方面提供了一种基于机器学习的细胞识别方法,所述细胞识别方法包括获取待测细胞的指纹图谱,并利用基于神经网络的机器学习算法分类识别从指纹图谱中提取的5个参数(分别为:i.单峰个数;ii.整体峰延迟时间;iii.单峰延迟时间;vi.单峰电流降;v.单峰下降角度),以达到数字化识别肿瘤细胞的功能。其中,获取待测细胞的指纹图谱的方法包括:
S1,将纳米管浸入含有待测细胞样本的电解质溶液中,所述纳米管内含有与纳米管外相同的电解质溶液;
S2,在所述纳米管和纳米管外的电解质溶液中分别插入电极,并于两电极间施加电压,形成离子电流通路;
S3,实时记录电流值,所述待测细胞在电场作用下依次经过所述纳米管管口,阻碍电解质溶液中的离子流过所述管口,形成相应电流降信号,获得所述待测细胞的指纹图谱。
根据本发明的一个具体的实施例,所述获取细胞指纹图谱的方法具体可为:首先制备玻璃纳米管作为该方法的检测探针,采用Ag/AgCl作为工作电极与对电极,在其两端施加电压以构成获取细胞指纹图谱的实验装置。该方法利用电流时间曲线记录管外的单细胞事件,通过分析细胞接近管口时造成离子阻塞形成的电流降对单个细胞进行检测。一次检测时间通常为1000s,待测肿瘤细胞在电场的作用下依次经过所述纳米管管口,短暂阻塞离子流过管口,形成相应的电流降信号,该电流降信号即为该种细胞的指纹性电流图谱。对于不同种类的肿瘤细胞,单细胞事件所产生的峰信号,表现出不同的峰型图案。在本方法中将这些不同种类细胞对应的特征峰型图案作为细胞的电化学指纹图谱,可用于肿瘤细胞的识别。所述肿瘤细胞包括但不限于HeLa细胞、MCF-7细胞、A549细胞、A375细胞、4T1细胞、SiHa细胞。
根据本发明的实施例,本发明第二方面提供了一种基于机器学习的细胞识别系统,所述系统包括数据采集及处理模块、模型训练模块和模型测试模块。其中,数据采集及处理模块用于获取待测细胞的特征参数,制作成训练集和测试集;模型训练模块利用基于神经网络的机器学习算法构建细胞识别模型,并将所述训练集输入到所述细胞识别模型中进行训练,更新模型参数以准确判断细胞种类;模型测试模块用于将所述测试集输入到所述细胞识别模型中,输出待测细胞的识别结果。
根据本发明的一个具体的实施例,每种细胞的特征参数作为输入端数据输入细胞识别模型,通过函数训练,与目标集建立映射关系,输出端为细胞种类代码。经过反复学习,细胞识别模型对指纹图谱库中的不同细胞参数有很好的识别能力。随机输入一组未知的细胞指纹图谱参数,通过机器学习识别模式,会得出该组数据属于细胞种类的可能性概率值。随后选取概率值最高的细胞种类,作为该组数据的识别结果。基于此,在实验中对于混合的细胞样品,将实验所得电化学指纹图谱代入细胞识别模型,可以实现数字化的识别混合样品中的细胞种类。
根据本发明的一个具体的实施例,当采用该细胞识别系统对肿瘤细胞进行识别,输出端数据为各种肿瘤细胞种类的数据代码,例如HeLa细胞的输出端数据可表示为1,0,0,0,0,0。
下面将结合实施例对本公开的方案进行解释。本领域技术人员将会理解,下面的实施例仅用于说明本公开,而不应视为限定本公开的范围。实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。
实施例1
1、实验装置的搭建
利用外径1.50m,内径1.1mm的硼硅酸盐玻璃经CO2激光拉制仪(P-2000,Sutter仪器有限公司)拉制而成管径约为200nm的纳米玻璃管作为本方法的检测探针。纳米管探针SEM表征图如图1所示。
具体实验装置图可参见图2-4。将一根Ag/AgCl电极作为工作电极插入注有电解质溶液的纳米管内,另外一根Ag/AgCl电极为对电极,浸入管外电解质溶液中。管内外的电解质溶液相同为磷酸缓冲溶液(PBS)。在两个电极之间施加电压形成离子电流的通路。电压的施加与离子电流的记录均由Axopatch 200B膜片钳记录系统完成。
2、细胞检测与电化学指纹图谱参数提取
利用上述实验装置检测单细胞。首先将待测细胞样品加入管外电解质溶液中,并用移液枪反复吹打搅匀,形成细胞悬浮液。在管两端施加200mV电压,细胞会受到电场力向纳米管口运动,阻塞离子传输,形成峰形的电流降信号,数据的采集和分析采用AxonDigidata 1440A Series数模转换器和pCLAMP 10电生理软件完成。对于不同种类细胞来说,电信号的峰形均有差异,因此将每种细胞所产生的电信号作为该种细胞的对每个峰形信号进行参数提取。分别选取5种参数,分别为:i.单峰个数ii.整体峰延迟时间iii.单峰延迟时间vi.单峰电流降v.单峰下降角度(图5)。i.单峰个数为在一组指纹图谱中出现的小振幅的峰个数;ii.整体峰延迟时间为从电流开始下降的时刻到离子电流上升到基线时的间隔时间;iii.单峰延迟时间为单个峰电流开始下降到上升会基线时的时间间隔;vi.单峰电流降为每个峰开始时电流与峰电流最低值的差值;v.单峰下降角度为每个峰电流降与电流基线的夹角。
3、基于机器学习数字化识别分类电化学指纹图谱
将上述参数数据作为不同种细胞的指纹图谱库,带入MATLAB的神经网络中进行深度学习(图6),输入端为5种参数,输出端为细胞种类代码。经过反复几次学习,神经网络对指纹图谱库中的不同细胞参数有很好的识别能力。随机输入一组未知的细胞指纹图谱参数,通过机器学习识别模式,会得出该组数据属于细胞种类的可能性概率值。随后选取概率值最高的细胞种类,作为该组数据的识别结果。例如,从一个HeLa细胞的指纹图谱中提取5种参数,分别为:峰时间525.9ms,峰个数11,单峰时间28.5ms,单峰电流17.4pA,θ=74.54。将该组参数带入机器学习算法进行种类识别,得到识别为各类细胞的概率:HeLa=0.982,MCF-7=0.009,4T1=0,A375=0,A549=0.009。通过代码将识别概率最高的细胞种类作为结果输出为1,其余种类为0。最终得到识别结果的细胞代码HeLa=1,0,0,0,0。基于此,在实验中对于混合的细胞样品,将实验所得电化学指纹图谱代入神经网络,可以实现数字化的识别混合样品中的细胞种类。
对比例1
以现有技术中从肿瘤细胞的指纹图谱中提取4种参数,分别为:i.单峰个数ii.整体峰延迟时间iii.单峰延迟时间vi.单峰电流降,通过机器学习算法进行细胞识别作为对比例进行对比实验,结果如表1-2所示。
表1现有技术提取4种参数和本发明提取5种参数进行单一细胞样本识别实验的准确率对比
表2现有技术提取4种参数和本发明提取5种参数进行混合细胞样本识别实验的准确率对比
实验结果证明,与现有技术相比,本发明提供的细胞识别方法整体性能更优,在多数单一细胞样本检测上具有更高的准确率,在混合细胞样本检测上均具有更高的准确率。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、“一些实施方案”或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种基于机器学习的细胞识别方法,其特征在于,所述细胞识别方法包括:
获取待测细胞的指纹图谱;
分析所述指纹图谱,提取特征参数;
将提取的特征参数作为训练集和测试集,采用基于神经网络的机器学习算法构建细胞识别模型并进行训练,实现细胞种类的识别;
其中,获取待测细胞的指纹图谱的方法包括:
S1,将纳米管浸入含有待测细胞的电解质溶液中,所述纳米管内含有与纳米管外相同的电解质溶液;
S2,在所述纳米管和纳米管外的电解质溶液中分别插入电极,并于两电极间施加电压,形成离子电流通路;
S3,实时记录电流值,所述待测细胞在电场作用下依次经过所述纳米管管口,阻碍电解质溶液中的离子流过所述管口,形成相应电流降信号,获得所述待测细胞的指纹图谱。
2.根据权利要求1所述的细胞识别方法,其特征在于,所述纳米管的内径约为200nm。
3.根据权利要求1所述的细胞识别方法,其特征在于,所述待测细胞为肿瘤细胞样本;
任选地,所述肿瘤细胞包括选自循环肿瘤细胞;
任选地,所述肿瘤细胞包括选自HeLa细胞、MCF-7细胞、A549细胞、A375细胞、4T1细胞、SiHa细胞中的至少一种。
4.根据权利要求1所述的细胞识别方法,其特征在于,所述特征参数包括单峰个数、整体峰延迟时间、单峰延迟时间、单峰电流降、单峰下降角度。
5.根据权利要求1所述的细胞识别方法,其特征在于,所述机器学习算法包括输入层,隐藏层和输出层;
任选地,所述隐藏层使用非线性激活函数;
任选地,所述非线性激活函数为Sigmoid非线性激活函数;
任选地,所述输出层使用线性激活函数。
6.一种基于机器学习的细胞识别系统,其特征在于,所述细胞识别系统包括:
数据采集及处理模块:用于获取待测细胞的特征参数,制作成训练集和测试集;
模型训练模块:利用基于神经网络的机器学习算法构建细胞识别模型,并将所述训练集输入到所述细胞识别模型中进行训练,更新模型参数以准确判断细胞种类;
模型测试模块:将所述测试集输入到所述细胞识别模型中,输出待测细胞的识别结果;
其中,所述待测细胞的特征参数从指纹图谱提取得到,所述指纹图谱的获取方法包括:
S1,将纳米管浸入含有待测细胞的电解质溶液中,所述纳米管内含有与纳米管外相同的电解质溶液;
S2,在所述纳米管和纳米管外的电解质溶液中分别插入电极,并于两电极间施加电压,形成离子电流通路;
S3,实时记录电流值,所述待测细胞在电场作用下依次经过所述纳米管管口,阻碍电解质溶液中的离子流过所述管口,形成相应电流降信号,获得所述待测细胞的指纹图谱。
7.根据权利要求6所述的细胞识别系统,其特征在于,所述特征参数包括单峰个数、整体峰延迟时间、单峰延迟时间、单峰电流降、单峰下降角度。
8.根据权利要求6所述的细胞识别系统,其特征在于,所述机器学习算法包括输入层、隐藏层和输出层;
任选地,所述隐藏层使用非线性激活函数;
任选地,所述非线性激活函数为Sigmoid非线性激活函数;
任选地,输出层使用线性激活函数。
9.根据权利要求6所述的细胞识别系统,其特征在于,所述更新模型参数进一步包括获得算法回归函数;
任选地,所述更新模型参数进一步包括采用Levenberg-Marquardt优化算法回归函数。
10.根据权利要求6所述的细胞识别系统,其特征在于,所述细胞识别系统用于实施权利要求1-5中任一项所述的细胞识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310581002.3A CN116704500A (zh) | 2023-05-22 | 2023-05-22 | 基于机器学习的细胞识别方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310581002.3A CN116704500A (zh) | 2023-05-22 | 2023-05-22 | 基于机器学习的细胞识别方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116704500A true CN116704500A (zh) | 2023-09-05 |
Family
ID=87836577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310581002.3A Pending CN116704500A (zh) | 2023-05-22 | 2023-05-22 | 基于机器学习的细胞识别方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116704500A (zh) |
-
2023
- 2023-05-22 CN CN202310581002.3A patent/CN116704500A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110720034B (zh) | 识别方法、分类分析方法、识别装置、分类分析装置及记录介质 | |
Feng et al. | A microfluidic device integrating impedance flow cytometry and electric impedance spectroscopy for high-efficiency single-cell electrical property measurement | |
Honrado et al. | A neural network approach for real-time particle/cell characterization in microfluidic impedance cytometry | |
Vaclavek et al. | Resistive pulse sensing as particle counting and sizing method in microfluidic systems: Designs and applications review | |
CN112578106B (zh) | 一种纳米孔道单分子蛋白质测序仪 | |
Xie et al. | Particle self-aligning, focusing, and electric impedance microcytometer device for label-free single cell morphology discrimination and yeast budding analysis | |
CN112268934B (zh) | 一种针对循环肿瘤细胞的检测芯片及其检测方法 | |
Lu et al. | Dynamic chemistry interactions: Controlled single-entity electrochemistry | |
CN113567326A (zh) | 一种高通量实时单细胞电学本征参数测量系统及方法 | |
Das et al. | Signal processing for single biomolecule identification using nanopores: a review | |
Sui et al. | Aerolysin nanopore identification of single nucleotides using the AdaBoost model | |
Tang et al. | A review on intelligent impedance cytometry systems: Development, applications and advances | |
CN116704500A (zh) | 基于机器学习的细胞识别方法和系统 | |
Tu et al. | EasyNanopore: A ready-to-use processing software for translocation events in nanopore translocation experiments | |
CN115656134B (zh) | 基于微流控芯片的细胞检测方法、设备、存储介质及装置 | |
CN113945623A (zh) | 单细胞分析方法和系统 | |
US20230073771A1 (en) | System and method for label-free single molecule detection | |
CN114746737A (zh) | 形状分析设备 | |
Chen et al. | Pulley Effect in the Capture of DNA Translocation through Solid-State Nanopores | |
WO2023106342A1 (ja) | 微粒子の検出、識別、および定量のための方法、装置 | |
CN218811788U (zh) | 微流体芯片及系统 | |
US20230268032A1 (en) | Method for generating trained model, method for determining base sequence of biomolecule, and biomolecule measurement device | |
Zhu et al. | Monitoring Single S. cerevisiae Cells with Multifrequency Electrical Impedance Spectroscopy in an Electrode-Integrated Microfluidic Device | |
US20230296491A1 (en) | Device and method for determining a mechanical property of a particle | |
US20220184621A1 (en) | Integrated microfluidic chip for cell imaging and biochemical detection and method using the same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |