CN113052086A - 一种白细胞分类方法、装置、计算机设备和存储介质 - Google Patents
一种白细胞分类方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN113052086A CN113052086A CN202110331860.3A CN202110331860A CN113052086A CN 113052086 A CN113052086 A CN 113052086A CN 202110331860 A CN202110331860 A CN 202110331860A CN 113052086 A CN113052086 A CN 113052086A
- Authority
- CN
- China
- Prior art keywords
- scatter
- point
- dimensional
- coordinates
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 210000000265 leukocyte Anatomy 0.000 title claims abstract description 93
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000010586 diagram Methods 0.000 claims abstract description 58
- 239000000203 mixture Substances 0.000 claims abstract description 41
- 230000006870 function Effects 0.000 claims description 45
- 238000009826 distribution Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 11
- 230000007812 deficiency Effects 0.000 claims description 2
- 238000004422 calculation algorithm Methods 0.000 description 6
- 210000000440 neutrophil Anatomy 0.000 description 6
- 210000004027 cell Anatomy 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 4
- 210000003979 eosinophil Anatomy 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 210000004698 lymphocyte Anatomy 0.000 description 2
- 210000001616 monocyte Anatomy 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 210000003714 granulocyte Anatomy 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/69—Microscopic objects, e.g. biological cells or cellular parts
- G06V20/698—Matching; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明实施例公开了一种白细胞分类方法、装置、计算机设备和存储介质。该方法包括:获取白细胞的脉冲数据;根据脉冲数据生成二维散点图,二维散点图包括多个散点和与散点对应的散点坐标,每个散点表示一个白细胞;根据二维散点图确定局部区域的数量和每个局部区域的中心点坐标,每个局部区域对应一个白细胞的分类种类;根据局部区域的数量建立高斯混合模型,高斯混合模型用于根据散点坐标和中心点坐标确定每个散点属于各个分类种类的目标概率;将每个散点最大的目标概率对应的分类种类作为散点的目标分类种类。本发明实施例实现了在保证白细胞分类精度的前提下能对多种类型的白细胞样本进行分类。
Description
技术领域
本发明涉及细胞分类技术领域,尤其涉及一种白细胞分类方法、装置、计算机设备和存储介质。
背景技术
在对白细胞进行分类时,若血球仪系统比较理想时,算法只需要简单分团即可实现分类,但是在实际情况下,粒子团之间可能存在黏连,简单分团已经无法满足分类的精度需求。为了满足分类的精度需求,现有的方案采用了模板匹配和基于K-means(K均值聚类)算法的分类。
但是在使用模板匹配的方法时,需要对所有白细胞样本进行分类,每类样本对应一个模板,由于样本类型比较多,模板匹配算法所能容纳的最大模板数可能满足不了所有的白细胞样本。而使用K-means算法分类时,需要初始化聚类中心,且当白细胞样本异常时,比如粒子团之间黏连,该分类算法的效果并不好,分类精度不高,因此如何同时消去上述两种分类方案的不足成为了亟待解决的问题。
发明内容
基于此,有必要针对上述问题,提出了一种白细胞分类方法、装置、计算机设备和存储介质。
第一方面,本发明实施例提供一种白细胞分类方法,所述方法包括:
获取白细胞的脉冲数据;
根据所述脉冲数据生成二维散点图,所述二维散点图包括多个散点和与所述散点对应的散点坐标,每个所述散点表示一个白细胞;
根据所述二维散点图确定局部区域的数量和每个所述局部区域的中心点坐标,每个所述局部区域对应一个白细胞的分类种类;
根据所述局部区域的数量建立高斯混合模型,所述高斯混合模型用于根据所述散点坐标和中心点坐标确定每个所述散点属于各个所述分类种类的目标概率;
将每个所述散点最大的目标概率对应的分类种类作为所述散点的目标分类种类。
第二方面,本发明实施例提供一种白细胞分类装置,所述装置包括:
数据获取模块,用于获取白细胞的脉冲数据;
图像生成模块,用于根据所述脉冲数据生成二维散点图,所述二维散点图包括多个散点和与所述散点对应的散点坐标,每个所述散点表示一个白细胞;
坐标确定模块,用于根据所述二维散点图确定局部区域的数量和每个所述局部区域的中心点坐标,每个所述局部区域对应一个白细胞的分类种类;
模型建立模块,用于根据所述局部区域的数量建立高斯混合模型,所述高斯混合模型用于根据所述散点坐标和中心点坐标确定每个所述散点属于各个所述分类种类的目标概率;
散点分类模块,用于将每个所述散点最大的目标概率对应的分类种类作为所述散点的目标分类种类。
第三方面,本发明实施例提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:
获取白细胞的脉冲数据;
根据所述脉冲数据生成二维散点图,所述二维散点图包括多个散点和与所述散点对应的散点坐标,每个所述散点表示一个白细胞;
根据所述二维散点图确定局部区域的数量和每个所述局部区域的中心点坐标,每个所述局部区域对应一个白细胞的分类种类;
根据所述局部区域的数量建立高斯混合模型,所述高斯混合模型用于根据所述散点坐标和中心点坐标确定每个所述散点属于各个所述分类种类的目标概率;
将每个所述散点最大的目标概率对应的分类种类作为所述散点的目标分类种类。
第四方面,本发明实施例提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:
获取白细胞的脉冲数据;
根据所述脉冲数据生成二维散点图,所述二维散点图包括多个散点和与所述散点对应的散点坐标,每个所述散点表示一个白细胞;
根据所述二维散点图确定局部区域的数量和每个所述局部区域的中心点坐标,每个所述局部区域对应一个白细胞的分类种类;
根据所述局部区域的数量建立高斯混合模型,所述高斯混合模型用于根据所述散点坐标和中心点坐标确定每个所述散点属于各个所述分类种类的目标概率;
将每个所述散点最大的目标概率对应的分类种类作为所述散点的目标分类种类。
本发明实施例通过白细胞样本生成的二维散点图,根据二维散点图建立高斯混合模型,最后根据高斯混合模型确定二维散点图中每个散点对应的分类,在二维散点图中可以体现多个类型的白细胞样本,使用高斯混合模型保证了分类的精度,解决了对白细胞分类时支持的白细胞样本类型少和分类精度不高的问题,获得了在保证白细胞分类精度的前提下能对多种类型的白细胞样本进行分类的有益效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1为一个实施例中白细胞分类方法的流程图;
图2为一个实施例中二维散点图的示意图;
图3为一个实施例中二维散点图的示意图;
图4为一个实施例中使用高斯混合模型的流程图;
图5为一个实施例中白细胞分类方法的步骤S130的具体流程图;
图6为一个实施例中三维密度图的示意图;
图7为一个实施例中白细胞分类方法的步骤S320的具体流程图;
图8为一个实施例中部分二维散点图的示意图;
图9为一个实施例中旋转后的部分二维散点图的示意图;
图10为一个实施例中直方图的示意图;
图11为一个实施例中白细胞分类方法的步骤S130的具体流程图;
图12为一个实施例中白细胞分类方法的步骤S520的具体流程图;
图13为一个实施例中三维密度图的示意图;
图14为一个实施例中白细胞分类方法的步骤S120的具体流程图;
图15为一个实施例中三维密度图的示意图;
图16为一个实施例中白细胞分类装置的结构框图;
图17为一个实施例中计算机设备的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,在一个实施例中,提供了一种白细胞分类方法。该方法既可以应用于终端,也可以应用于服务器,本实施例以应用于终端举例说明。该白细胞分类方法具体包括如下步骤:
S110、获取白细胞的脉冲数据。
S120、根据所述脉冲数据生成二维散点图,所述二维散点图包括多个散点和与所述散点对应的散点坐标,每个所述散点表示一个白细胞。
本实施例中,首先通过预设的FPGA(Field Programmable Gate Array,现场可编程逻辑门阵列)芯片采集需要对其进行分类的样本白细胞的脉冲数据,通过具有三路光路的光学信号系统可以得到三路信号,分别为低角信号、中角信号和高角信号,每路信号的值最大为4096,其中低角信号表示白细胞的细胞体积,中角信号表示白细胞的细胞核复杂程度,高角信号表示白细胞的胞浆颗粒信息,其中每两路信号可以生成一个二维散点图,如图2所示,由此根据脉冲数据生成二维散点图,在二维散点图中,包括多个散点,每个散点对应一个散点坐标,每个散点表示一个白细胞。
S130、根据所述二维散点图确定局部区域的数量和每个所述局部区域的中心点坐标,每个所述局部区域对应一个白细胞的分类种类。
本实施例中,在获得二维散点图后,需要确定局部区域的数量和每个局部区域的中心点坐标,示例性的,因同一个分类种类的白细胞在二维散点图中会在同一个区域分布,用椭圆将每个局部区域划分出来,一并参照图3,可以看出散点,即白细胞分布在多个局部区域,由此得到局部区域的数量为7个,即白细胞的分类种类有7种,此外,样本白细胞的每个分类种类之间的相对位置是确定的,因此还可以同时确定每个局部区域具体为哪种分类种类,包括血影细胞(GHOST)、淋巴细胞(LYM)、嗜酸性粒细胞(EOS)、中性粒细胞(NEU)、单核细胞(MON)、未成熟粒细胞(LIC)和异型淋巴细胞(ATYLYM)。然后获取每个局部区域的中心点坐标,即获取每个椭圆的中心点的坐标,作为中心点坐标。
S140、根据所述局部区域的数量建立高斯混合模型,所述高斯混合模型用于根据所述散点坐标和中心点坐标确定每个所述散点属于各个所述分类种类的目标概率。
S150、将每个所述散点最大的目标概率对应的分类种类作为所述散点的目标分类种类。
本实施例中,得到局部区域的数量后,根据局部区域的数量建立高斯混合模型,将二维散点图中每个散点的散点坐标和得到的每个中心点坐标输入至高斯混合模型,就可以得到每个散点属于各个分类种类的目标概率,最后将每个散点最大的目标概率对应的分类种类作为该散点的目标分类种类。
本发明实施例通过白细胞样本生成的二维散点图,根据二维散点图建立高斯混合模型,最后根据高斯混合模型确定二维散点图中每个散点对应的分类,在二维散点图中可以体现多个类型的白细胞样本,使用高斯混合模型保证了分类的精度,解决了对白细胞分类时支持的白细胞样本类型少和分类精度不高的问题,获得了在保证白细胞分类精度的前提下能对多种类型的白细胞样本进行分类的有益效果。
如图4所示,在一个实施例中,高斯混合模型具体用于执行以下步骤:
S210、获取所述高斯混合模型对应的高斯分布密度函数、初始方差和初始类别概率,并将所述中心点坐标作为初始期望,所述初始类别概率为各个所述分类种类对应的初始概率。
S220、根据所述初始期望、所述初始方差、所述高斯分布密度函数、所述初始类别概率、散点坐标确定每个所述散点属于各个所述分类种类的概率函数。
本实施例中,高斯混合模型可以看成由K个高斯分布组成的混合模型,高斯混合模型的概率分布为:
其中,k表示细胞被划分的分类种类中的第k类,k=1,2,3…K,αk为类别概率,即全部散点属于第k个分类种类的概率,也可以认为是每个分类种类被分类的概率,αk≥0,为第k个分类种类的高斯分布密度函数,即单高斯分布的概率密度函数,具体为:
其中μ为数据均值,即位置的期望,∑为协方差,即某一分类种类的分布离散程度,D为数据维度,因本实施例中使用的是二维散点图,则D=2,然后结合之前得到的每个局部区域的大小,基于K-means算法给定初始的αk,即初始类别概率,并根据经验值给定初始的∑,即初始方差,然后将之前得到的中心点坐标作为初始期望,将初始期望和初始方差代入高斯分布密度函数,根据代入初始期望和初始方差后的高斯分布密度函数和初始类别概率就可以得到初始的高斯混合模型。然后根据初始期望、初始方差、高斯分布密度函数、初始类别概率、散点坐标确定每个散点属于各个分类种类的概率函数,相当于根据初始的高斯混合模型确定每个散点属于各个分类种类的概率函数,该概率函数具体为:
其中,xj表示第j个散点的数据,j=1,2,3…N,k=1,2,3…K。
S230、根据所述概率函数为极大值时的期望、方差和类别概率,更新所述初始期望、所述初始方差和所述初始类别概率,进入所述根据所述初始期望、所述初始方差、所述高斯分布密度函数、所述初始类别概率、散点坐标确定每个所述散点属于各个所述分类种类的概率函数的步骤,直到更新后的初始期望、初始方差和初始类别概率满足预设条件时停止更新,将最后得到的概率函数作为目标概率函数。
S240、根据所述目标概率函数确定每个所述散点属于各个所述分类种类的目标概率。
本实施例中,使用EM算法对概率函数γjk进行迭代,具体的,求概率函数γjk的极大值,获取概率函数γjk为极大值时的期望、方差和类别概率,其中期望为:
方差为:
类别概率为:
然后使用概率函数为极大值时的期望、方差和类别概率更新初始期望、初始方差和初始类别概率,然后使用更新后的初始期望、初始方差和初始类别概率更新概率函数,并继续求概率函数为极大值时的期望、方差和类别概率,重复迭代,此时需要设定一个参数θi=(μk,∑k,αk),当||θi+1-θi||<ε时,将此时得到的概率函数作为目标概率函数,其中ε是一个很小的正数,可以为0.0001,得到目标概率函数后,将每个散点代入目标概率函数就可以确定每个散点属于各个分类种类的目标概率。
本发明实施例通过将高斯混合模型应用至白细胞的分类,大大提高了白细胞分类的准确性。
如图5所示,在一个实施例中,所述二维散点图包括坐标信息,所述坐标信息包括密度信息,所述密度信息为所述坐标信息对应的散点数量,步骤S130具体包括如下步骤:
S310、根据所述密度信息将所述二维散点图转换为三维密度图,所述三维密度图包括多个凸起。
S320、根据所述三维密度图的凸起的数量确定局部区域的数量。
本实施例中,为了更准确的确定局部区域的数量,需要将二维散点图转换为三维密度图,具体的,因二维散点图中包括了坐标信息,即二维散点图包括了多个坐标点,而每个坐标点的都包括该坐标点的密度信息,密度信息为坐标信息对应的散点数量,即每个散点位于该坐标点的数量信息,每个散点的数据就是该散点所处坐标点的密度信息。
具体的,一并参照图6,将二维散点图转换为三维密度图,三维密度图中的第三维为每个坐标点的密度信息,从而可以看出三维密度图包括了多个凸起,将每个凸起视为一个局部区域,由此根据三维密度图的凸起的数量确定局部区域的数量,示例性的,图中包括4个凸起,则确定局部区域有4个。
本发明实施例通过将二维散点图转换为三维密度图,大大提高了局部区域确定的准确性,进而提高了白细胞分类的准确性。
如图7所示,在一个实施例中,步骤S320具体包括如下步骤:
S410、根据所述三维密度图的凸起的数量判断是否存在分类种类的缺失。
S420、当所述在分类种类缺失时,根据缺失的分类种类对所述二维散点图中的散点进行旋转。
S430、根据所述散点旋转后的散点坐标对应的密度信息生成直方图,所述直方图包括波谷。
S440、根据所述三维密度图的凸起的数量和所述波谷的数量确定局部区域的数量。
本实施例中,正常情况下,因样本白细胞的分类种类是确定的,因此在获取三维密度图的凸起的数量后,可以判断分类种类是否缺失,例如确定该样本白细胞有7种分类种类,但是三维密度图的凸起的数量只有4个,则可以确定可能存在3种分类种类的散点数过少,没有单独形成明显的凸起,因此需要根据缺失的分类种类对散点进行旋转,然后根据散点旋转后的散点坐标对应的密度信息生成直方图,其中直方图包括波谷,最后根据三维密度图的凸起的数量和波谷的数量确定局部区域的数量。
示例性的,一并参照图8,发现缺失了嗜酸性粒细胞,而嗜酸性粒细胞与中性粒细胞距离很近,则将当前中性粒细胞对应的局部区域内的散点进行旋转,得到如图9所示的旋转后的二维散点图,根据当前的散点坐标对应的密度信息生成如图10所示的直方图,发现直方图中存在一个波谷,则确定中性粒细胞对应的局部区域的数量为2,即包括嗜酸性粒细胞的局部区域和中性粒细胞的局部区域,三维密度图的凸起的数量和波谷的数量之和就是局部区域的数量,找到全部缺失的分类种类后,就可以确定局部区域的数量,以及每个局部区域对应的分类种类,找到了每个分类种类在二维散点图中对应的局部区域。
本发明实施例通过根据所述三维密度图的凸起的数量判断是否存在分类种类的缺失;当所述在分类种类缺失时,根据缺失的分类种类对所述二维散点图中的散点进行旋转;根据所述散点旋转后的散点坐标对应的密度信息生成直方图,所述直方图包括波谷;根据所述三维密度图的凸起的数量和所述波谷的数量确定局部区域的数量,进一步提高了局部区域确定的准确性,进而提高了白细胞分类的准确性。
如图11所示,在一个实施例中,步骤S130具体还包括如下步骤:
S510、基于多个预设的卷积模板对所述二维散点图中每个坐标信息对应的密度信息进行卷积,得到多个卷积结果。
S520、当所述多个卷积结果中的最小值大于零时,将所述坐标信息作为所述局部区域的中心点坐标。
本实施例中,在确定局部区域的中心点坐标时,可以使用预先训练好的卷积神经网络模型,将二维散点图的每个坐标信息代入卷积神经网络模型,得到多个卷积结果,具体的在卷积神经网络模型中,对于目标坐标点A5来说,采用目标坐标点的周围坐标点组成卷积模块,如表1所示。
A1 | A2 | A3 |
A4 | A5 | A6 |
A7 | A8 | A9A |
表1
其中目标坐标点A5的坐标为(x,y),作为卷积模板中心点,然后进行梯度幅值的计算:
G(x,y)=min(px-1,y-1,px-1,y,px-1,y+1,px,y-1,px,y+1,px+1,y-1,px+1,y+1,px+1,y)=min(A5-A1,A5-A2,A5-A3,A5-A4,A5-A6,A5-A7,A5-A8,A5-A9)
其中,每个坐标点的值为对应的密度信息,即求每个卷积结果中的最小值,最后求得G(x,y)>0时,将该目标坐标点A5作为该局部区域的中心点坐标,即三维密度图的凸起的顶点。然后依此获得每个局部区域的中心点坐标。
本实施例中,通过卷积神经网络模型获取局部区域的的中心点坐标,大大提高了局部区域的中心点坐标确定的准确性,进而提高了白细胞分类的准确性。
如图12所示,在一个实施例中,步骤S520具体包括如下步骤:
S610、当所述多个卷积结果中的最小值大于零时,将所述坐标信息作为峰值点。
S620、获取所述峰值点的第一密度信息。
S630、剔除所述第一密度信息小于第一阈值的峰值点,得到修正峰值点。
S640、根据所述修正峰值点的第一密度信息生成第一密度范围。
S650、基于所述修正峰值点获取第一散点,所述第一散点对应的密度信息属于所述第一密度范围。
S660、根据所述第一散点的散点坐标确定基于所述修正峰值点的局部区域。
S670、确定每个所述局部区域内散点坐标的均值,得到所述局部区域的平均坐标,作为中心点坐标。
本实施例中,通过卷积的方法获取每个局部区域的中心点坐标时,可能将突变点也作为中心点坐标,为了更准确的确定局部区域的中心点坐标,剔除突变点,在多个卷积结果中的最小值大于零时,将当前的坐标信息作为峰值点,然后根据峰值点确定局部区域。
具体的,获取峰值点的第一密度信息,即峰值点对应的密度信息,然后剔除第一密度信息小于第一阈值的峰值点,得到修正峰值点,然后根据修正峰值点的第一密度信息生成第一密度范围,并基于所述修正峰值点获取第一散点,其中第一散点对应的密度信息属于第一密度范围。最后根据第一散点的散点坐标确定基于修正峰值点的局部区域。示例性的,将全部的峰值点按照密度信息的值从小到大排序,将在第一密度范围[Pi-1,Pi]内的密度信息的值变为Pi-1,并剔除Pi-1<0的峰值点,得到修正峰值点,此时的三维密度图一并参照图13,然后以修正峰值点为卷积模板的中心,获取每个修正峰值点附近密度信息的值为Pi-1的区域,作为修正峰值点的局部区域M
最后确定每个局部区域内散点坐标的均值,得到所述局部区域的平均坐标,作为中心点坐标。示例性的:
本发明实施例通过剔除中心点坐标中的突变点,进一步提高了局部区域的中心点坐标确定的准确性,进而提高了白细胞分类的准确性。
如图14所示,在一个实施例中,步骤S120具体包括如下步骤:
S810、根据所述脉冲数据生成原始二维散点图。
S820、对所述原始二维散点图进行压缩和高斯滤波后得到二维散点图。
本发明实施例中,根据脉冲数据生成原始二维散点图后,还可以对原始二维散点图进行压缩,使二维散点图中的特征更加明显,处理速度更快,示例性的,将4096×4096的二维散点图进行压缩比例为64的压缩,得到64×64的二维散点图。进一步的,由于样本白细胞类似于高斯分布,还可以对二维散点图进行高斯滤波处理,从而过渡均匀平滑、去除细节并过滤掉噪声,一并参照图15,可以得到更加平缓的三维密度图,方便观察和处理。
本发明实施例通过对原始二维散点图进行预处理,得到了更适合计算和观察的二维散点图和三维密度图,进而提高了白细胞分类的准确性。
如图16所示,在一个实施例中,提供了一种白细胞分类装置,该实施例提供的白细胞分类装置可执行本发明任意实施例所提供的白细胞分类方法,具备执行方法相应的功能模块和有益效果。该白细胞分类装置包括数据获取模块100、图像生成模块200、坐标确定模块300、模型建立模块400和散点分类模块500。
具体的,数据获取模块100用于获取白细胞的脉冲数据;图像生成模块200用于根据所述脉冲数据生成二维散点图,所述二维散点图包括多个散点和与所述散点对应的散点坐标,每个所述散点表示一个白细胞;坐标确定模块300用于根据所述二维散点图确定局部区域的数量和每个所述局部区域的中心点坐标,每个所述局部区域对应一个白细胞的分类种类;模型建立模块400用于根据所述局部区域的数量建立高斯混合模型,所述高斯混合模型用于根据所述散点坐标和中心点坐标确定每个所述散点属于各个所述分类种类的目标概率;散点分类模块500用于将每个所述散点最大的目标概率对应的分类种类作为所述散点的目标分类种类。
在一个实施例中,模型建立模块400具体用于获取所述高斯混合模型对应的高斯分布密度函数、初始方差和初始类别概率,并将所述中心点坐标作为初始期望,所述初始类别概率为各个所述分类种类对应的初始概率;根据所述初始期望、所述初始方差、所述高斯分布密度函数、所述初始类别概率、散点坐标确定每个所述散点属于各个所述分类种类的概率函数;根据所述概率函数为极大值时的期望、方差和类别概率,更新所述初始期望、所述初始方差和所述初始类别概率,进入所述根据所述初始期望、所述初始方差、所述高斯分布密度函数、所述初始类别概率、散点坐标确定每个所述散点属于各个所述分类种类的概率函数的步骤,直到更新后的初始期望、初始方差和初始类别概率满足预设条件时停止更新,将最后得到的概率函数作为目标概率函数;根据所述目标概率函数确定每个所述散点属于各个所述分类种类的目标概率。
在一个实施例中,所述二维散点图包括坐标信息,所述坐标信息包括密度信息,所述密度信息为所述坐标信息对应的散点数量,坐标确定模块300具体用于根据所述密度信息将所述二维散点图转换为三维密度图,所述三维密度图包括多个凸起;根据所述三维密度图的凸起的数量确定局部区域的数量。
在一个实施例中,坐标确定模块300具体还用于根据所述三维密度图的凸起的数量判断是否存在分类种类的缺失;当所述在分类种类缺失时,根据缺失的分类种类对所述二维散点图中的散点进行旋转;根据所述散点旋转后的散点坐标对应的密度信息生成直方图,所述直方图包括波谷;根据所述三维密度图的凸起的数量和所述波谷的数量确定局部区域的数量。
在一个实施例中,坐标确定模块300具体还用于基于多个预设的卷积模板对所述二维散点图中每个坐标信息对应的密度信息进行卷积,得到多个卷积结果;当所述多个卷积结果中的最小值大于零时,将所述坐标信息作为所述局部区域的中心点坐标。
在一个实施例中,坐标确定模块300具体还用于当所述多个卷积结果中的最小值大于零时,将所述坐标信息作为峰值点;根据所述峰值点确定局部区域;确定每个所述局部区域内散点坐标的均值,得到所述局部区域的平均坐标,作为中心点坐标。
在一个实施例中,坐标确定模块300具体还用于获取所述峰值点的第一密度信息;剔除所述第一密度信息小于第一阈值的峰值点,得到修正峰值点;根据所述修正峰值点的第一密度信息生成第一密度范围;基于所述修正峰值点获取第一散点,所述第一散点对应的密度信息属于所述第一密度范围;根据所述第一散点的散点坐标确定基于所述修正峰值点的局部区域。
在一个实施例中,图像生成模块200具体用于根据所述脉冲数据生成原始二维散点图;对所述原始二维散点图进行压缩和高斯滤波后得到二维散点图。
图17示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是终端,也可以是服务器。如图17所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现白细胞分类方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行白细胞分类方法。本领域技术人员可以理解,图17中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:
获取白细胞的脉冲数据;
根据所述脉冲数据生成二维散点图,所述二维散点图包括多个散点和与所述散点对应的散点坐标,每个所述散点表示一个白细胞;
根据所述二维散点图确定局部区域的数量和每个所述局部区域的中心点坐标,每个所述局部区域对应一个白细胞的分类种类;
根据所述局部区域的数量建立高斯混合模型,所述高斯混合模型用于根据所述散点坐标和中心点坐标确定每个所述散点属于各个所述分类种类的目标概率;
将每个所述散点最大的目标概率对应的分类种类作为所述散点的目标分类种类。
在一个实施例中,提出了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:
获取白细胞的脉冲数据;
根据所述脉冲数据生成二维散点图,所述二维散点图包括多个散点和与所述散点对应的散点坐标,每个所述散点表示一个白细胞;
根据所述二维散点图确定局部区域的数量和每个所述局部区域的中心点坐标,每个所述局部区域对应一个白细胞的分类种类;
根据所述局部区域的数量建立高斯混合模型,所述高斯混合模型用于根据所述散点坐标和中心点坐标确定每个所述散点属于各个所述分类种类的目标概率;
将每个所述散点最大的目标概率对应的分类种类作为所述散点的目标分类种类。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种白细胞分类方法,其特征在于,所述方法包括:
获取白细胞的脉冲数据;
根据所述脉冲数据生成二维散点图,所述二维散点图包括多个散点和与所述散点对应的散点坐标,每个所述散点表示一个白细胞;
根据所述二维散点图确定局部区域的数量和每个所述局部区域的中心点坐标,每个所述局部区域对应一个白细胞的分类种类;
根据所述局部区域的数量建立高斯混合模型,所述高斯混合模型用于根据所述散点坐标和中心点坐标确定每个所述散点属于各个所述分类种类的目标概率;
将每个所述散点最大的目标概率对应的分类种类作为所述散点的目标分类种类。
2.根据权利要求1所述的方法,其特征在于,所述根据所述散点坐标和中心点坐标确定每个所述散点属于各个所述分类种类的目标概率包括:
获取所述高斯混合模型对应的高斯分布密度函数、初始方差和初始类别概率,并将所述中心点坐标作为初始期望,所述初始类别概率为各个所述分类种类对应的初始概率;
根据所述初始期望、所述初始方差、所述高斯分布密度函数、所述初始类别概率、散点坐标确定每个所述散点属于各个所述分类种类的概率函数;
根据所述概率函数为极大值时的期望、方差和类别概率,更新所述初始期望、所述初始方差和所述初始类别概率,进入所述根据所述初始期望、所述初始方差、所述高斯分布密度函数、所述初始类别概率、散点坐标确定每个所述散点属于各个所述分类种类的概率函数的步骤,直到更新后的初始期望、初始方差和初始类别概率满足预设条件时停止更新,将最后得到的概率函数作为目标概率函数;
根据所述目标概率函数确定每个所述散点属于各个所述分类种类的目标概率。
3.根据权利要求1所述的方法,其特征在于,所述二维散点图包括坐标信息,所述坐标信息包括密度信息,所述密度信息为所述坐标信息对应的散点数量,所述根据所述二维散点图确定局部区域的数量包括:
根据所述密度信息将所述二维散点图转换为三维密度图,所述三维密度图包括多个凸起;
根据所述三维密度图的凸起的数量确定局部区域的数量。
4.根据权利要求3所述的方法,其特征在于,所述根据所述三维密度图的凸起的数量确定局部区域的数量包括:
根据所述三维密度图的凸起的数量判断是否存在分类种类的缺失;
当所述在分类种类缺失时,根据缺失的分类种类对所述二维散点图中的散点进行旋转;
根据所述散点旋转后的散点坐标对应的密度信息生成直方图,所述直方图包括波谷;
根据所述三维密度图的凸起的数量和所述波谷的数量确定局部区域的数量。
5.根据权利要求3所述的方法,其特征在于,所述根据所述二维散点图确定每个所述局部区域的中心点坐标包括:
基于多个预设的卷积模板对所述二维散点图中每个坐标信息对应的密度信息进行卷积,得到多个卷积结果;
当所述多个卷积结果中的最小值大于零时,将所述坐标信息作为所述局部区域的中心点坐标。
6.根据权利要求5所述的方法,其特征在于,所述当所述多个卷积结果中的最小值大于零时,将所述坐标信息作为所述局部区域的中心点坐标包括:
当所述多个卷积结果中的最小值大于零时,将所述坐标信息作为峰值点;
根据所述峰值点确定局部区域;
确定每个所述局部区域内散点坐标的均值,得到所述局部区域的平均坐标,作为中心点坐标。
7.根据权利要求6所述的方法,其特征在于,所述根据所述峰值点确定局部区域包括:
获取所述峰值点的第一密度信息;
剔除所述第一密度信息小于第一阈值的峰值点,得到修正峰值点;
根据所述修正峰值点的第一密度信息生成第一密度范围;
基于所述修正峰值点获取第一散点,所述第一散点对应的密度信息属于所述第一密度范围;
根据所述第一散点的散点坐标确定基于所述修正峰值点的局部区域。
8.一种白细胞分类装置,其特征在于,所述装置包括:
数据获取模块,用于获取白细胞的脉冲数据;
图像生成模块,用于根据所述脉冲数据生成二维散点图,所述二维散点图包括多个散点和与所述散点对应的散点坐标,每个所述散点表示一个白细胞;
坐标确定模块,用于根据所述二维散点图确定局部区域的数量和每个所述局部区域的中心点坐标,每个所述局部区域对应一个白细胞的分类种类;
模型建立模块,用于根据所述局部区域的数量建立高斯混合模型,所述高斯混合模型用于根据所述散点坐标和中心点坐标确定每个所述散点属于各个所述分类种类的目标概率;
散点分类模块,用于将每个所述散点最大的目标概率对应的分类种类作为所述散点的目标分类种类。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110331860.3A CN113052086B (zh) | 2021-03-29 | 2021-03-29 | 一种白细胞分类方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110331860.3A CN113052086B (zh) | 2021-03-29 | 2021-03-29 | 一种白细胞分类方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113052086A true CN113052086A (zh) | 2021-06-29 |
CN113052086B CN113052086B (zh) | 2024-02-27 |
Family
ID=76516314
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110331860.3A Active CN113052086B (zh) | 2021-03-29 | 2021-03-29 | 一种白细胞分类方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113052086B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114252384A (zh) * | 2021-12-02 | 2022-03-29 | 中元汇吉生物技术股份有限公司 | 网织红细胞计数方法、装置、系统与计算机可读存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005119564A2 (de) * | 2004-06-04 | 2005-12-15 | Bayer Healthcare Ag | Verfahren zur anwendung von auf markerwerten basierenden dichtekarten bei der diagnose von patienten mit krankheiten insbesondere von tumoren |
CN101071506A (zh) * | 2006-01-25 | 2007-11-14 | 美国西门子医疗解决公司 | 用于局部肺结构分类以进行计算机辅助结节检测的系统和方法 |
US20130004043A1 (en) * | 2011-07-01 | 2013-01-03 | The Regents Of The University Of Michigan | Pixel and Voxel-Based Analysis of Registered Medical Images for Assessing Bone Integrity |
CN104359821A (zh) * | 2014-11-04 | 2015-02-18 | 深圳市帝迈生物技术有限公司 | 一种散点图的粒子分类统计方法和系统及血液细胞分析仪 |
CN104568844A (zh) * | 2013-10-29 | 2015-04-29 | 希森美康株式会社 | 尿样本分析装置及尿样本分析方法 |
CN105203446A (zh) * | 2015-09-14 | 2015-12-30 | 广州埃克森生物科技有限公司 | 基于概率分布细胞分类统计方法 |
CN112070067A (zh) * | 2020-10-12 | 2020-12-11 | 乐普(北京)医疗器械股份有限公司 | 一种光体积描计信号的散点图分类方法和装置 |
CN112557281A (zh) * | 2020-11-23 | 2021-03-26 | 深圳市科曼医疗设备有限公司 | 血液细胞分析仪的plt粒子检测方法和装置 |
-
2021
- 2021-03-29 CN CN202110331860.3A patent/CN113052086B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005119564A2 (de) * | 2004-06-04 | 2005-12-15 | Bayer Healthcare Ag | Verfahren zur anwendung von auf markerwerten basierenden dichtekarten bei der diagnose von patienten mit krankheiten insbesondere von tumoren |
CN101071506A (zh) * | 2006-01-25 | 2007-11-14 | 美国西门子医疗解决公司 | 用于局部肺结构分类以进行计算机辅助结节检测的系统和方法 |
US20130004043A1 (en) * | 2011-07-01 | 2013-01-03 | The Regents Of The University Of Michigan | Pixel and Voxel-Based Analysis of Registered Medical Images for Assessing Bone Integrity |
CN104568844A (zh) * | 2013-10-29 | 2015-04-29 | 希森美康株式会社 | 尿样本分析装置及尿样本分析方法 |
CN104359821A (zh) * | 2014-11-04 | 2015-02-18 | 深圳市帝迈生物技术有限公司 | 一种散点图的粒子分类统计方法和系统及血液细胞分析仪 |
CN105203446A (zh) * | 2015-09-14 | 2015-12-30 | 广州埃克森生物科技有限公司 | 基于概率分布细胞分类统计方法 |
CN112070067A (zh) * | 2020-10-12 | 2020-12-11 | 乐普(北京)医疗器械股份有限公司 | 一种光体积描计信号的散点图分类方法和装置 |
CN112557281A (zh) * | 2020-11-23 | 2021-03-26 | 深圳市科曼医疗设备有限公司 | 血液细胞分析仪的plt粒子检测方法和装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114252384A (zh) * | 2021-12-02 | 2022-03-29 | 中元汇吉生物技术股份有限公司 | 网织红细胞计数方法、装置、系统与计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113052086B (zh) | 2024-02-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111950656B (zh) | 图像识别模型生成方法、装置、计算机设备和存储介质 | |
CN112560968B (zh) | 一种基于卷积和残差网络的her2图像分类方法及系统 | |
CN110111113B (zh) | 一种异常交易节点的检测方法及装置 | |
CN111275044A (zh) | 基于样本选择和自适应难例挖掘的弱监督目标检测方法 | |
CN111986183B (zh) | 一种染色体散型图像自动分割识别系统及装置 | |
CN109871855B (zh) | 一种自适应的深度多核学习方法 | |
WO2021189830A1 (zh) | 样本数据优化方法、装置、设备及存储介质 | |
CN113052086A (zh) | 一种白细胞分类方法、装置、计算机设备和存储介质 | |
CN111652264B (zh) | 基于最大均值差异的负迁移样本筛选方法 | |
CN112036384B (zh) | 精子头部形态识别方法、装置及设备 | |
CN113449802A (zh) | 基于多粒度互信息最大化的图分类方法及装置 | |
CN112507991A (zh) | 流式细胞仪数据的设门方法、系统、存储介质及电子设备 | |
WO2011162589A1 (en) | Method and apparatus for adaptive data clustering | |
CN111507396B (zh) | 缓解神经网络对未知类样本产生错误分类的方法及装置 | |
CN114241227A (zh) | 一种基于vlad的图像识别方法及装置 | |
Lerner et al. | Human chromosome classification using multilayer perceptron neural network | |
CN112613521A (zh) | 基于数据转换的多层次数据分析系统及方法 | |
Yusof et al. | Non-wood anatomy image detector for tropical wood recognition system | |
CN111126444A (zh) | 分类器集成方法 | |
CN117152543B (zh) | 一种图像分类方法、装置、设备及存储介质 | |
CN113569920B (zh) | 基于自动编码的第二近邻异常检测方法 | |
CN111639716A (zh) | 基于密度偏差抽样的数据样本选择方法及装置 | |
CN113159957B (zh) | 一种交易处理方法及装置 | |
Xie et al. | Improving Data Explainability in Analysis of Designed Computer Simulation Experiments | |
Marroquín et al. | Nonlinear image analysis for fuzzy classification of breast cancer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |