CN113139405A - 一种基于多峰拟合解析的细胞分类结果校正方法 - Google Patents

一种基于多峰拟合解析的细胞分类结果校正方法 Download PDF

Info

Publication number
CN113139405A
CN113139405A CN202010057525.4A CN202010057525A CN113139405A CN 113139405 A CN113139405 A CN 113139405A CN 202010057525 A CN202010057525 A CN 202010057525A CN 113139405 A CN113139405 A CN 113139405A
Authority
CN
China
Prior art keywords
cell
fitting
characteristic
histogram
peak
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010057525.4A
Other languages
English (en)
Other versions
CN113139405B (zh
Inventor
韦笑
王梦龙
秦鑫龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Urit Medical Electronic Co Ltd
Original Assignee
Urit Medical Electronic Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Urit Medical Electronic Co Ltd filed Critical Urit Medical Electronic Co Ltd
Priority to CN202010057525.4A priority Critical patent/CN113139405B/zh
Publication of CN113139405A publication Critical patent/CN113139405A/zh
Application granted granted Critical
Publication of CN113139405B publication Critical patent/CN113139405B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/698Matching; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Abstract

本发明公开了一种基于多峰拟合解析的细胞分类结果校正方法,包括根据细胞分析仪采集到的样本细胞特征,使用自动分类算法对各类细胞进行分类;根据自动分类的结果,提取出重叠细胞分类的特征直方图,提取过程可用步长3或5的高斯滤波消除采样所得的噪声信号;根据细胞分布估计高斯分布参数,对各波峰分别执行粗高斯分布拟合;以粗拟合结果为基础,执行重叠高斯分布拟合,得到各细胞峰的分布参数;将各细胞峰的重叠区域选出,计算该部分面积比,完成细胞含量校正,提高分类准确程度。

Description

一种基于多峰拟合解析的细胞分类结果校正方法
技术领域
本发明涉及医学诊断领域,尤其涉及一种细胞分类结果校正方法。
背景技术
血常规是医学临床检验中三大常规项目之一,通过分析人体血液中不同细胞的含量,对比正常人血各类细胞含量范围,可以为医生提供疾病诊断的依据,是判断人体健康情况的重要依据。
通常使用细胞分析仪来检测血常规,现有的细胞分析仪通常计数被测样本内的上万个细胞,同时提取各个细胞的体积、复杂度、屈光度等特征信号,得到计数样本的一维直方图或二维、三维散点图。通过在直方图或散点图中设置分界范围,将特征信号值落于同一范围内的细胞归为同一类,可统计出各类细胞的总数与百分比,进而为医生的诊断提供依据。
目前大部分细胞分析仪都是通过分析细胞团特征计算出细胞分割线,从而得到分界范围。当样本内的两类或多类细胞特征相近时,自动分类算法通过计算分割线的分类方法准确度不高,无法精确分出两类细胞。
发明内容
本发明的目的在于提供一种基于多峰拟合解析的细胞分类结果校正方法,旨在解决样本内的两类或多类细胞特征相近时,自动分类算法无法精确分出两类细胞导致结果精确度低的问题。
为实现上述目的,本发明提供了一种基于多峰拟合解析的细胞分类结果校正方法,
包括:根据自动分类算法对细胞分析仪采集得到的样本细胞特征数据进行分类,提取样本细胞的特征直方图;
对所述特征直方图中的特征波峰进行拟合寻优,解析出所述特征波峰的描述参数,得到波峰拟合函数;
根据每类细胞所属的所述波峰拟合函数,解析出波峰间特征重叠区域内各类细胞的占比,得到各类细胞占比数据;
根据波峰间特征重叠区域的所述各类细胞占比数据,加上所述细胞分析仪自动分类算法的分类结果,得出各类细胞的实际比例。
其中,所述用细胞分析仪对细胞群进行分析获取特征数据,包括,
获取采集的特征数据;
基于高斯滤波消除所述特征数据的噪声信号,得到特征直方图。
其中,所述特征波峰进行拟合寻优包括:
为各个波峰选择一个拟合目标函数模型;
根据各波形特征估计拟合目标函数的初始参数;
使用粗精度与估计出的初始参数对各波峰分别进行快速粗拟合;
使用细精度与粗拟合结果对总体直方图进行精细拟合;
计算拟合直方图与原始直方图的相关性和相对误差,误差满足要求时得到拟合结果。
其中,所述解析出波峰间特征重叠区域内各类细胞的占比包括:
根据每种细胞特征波峰的所述拟合结果,在所述波形重叠区域范围内计算积分,得到每种细胞的面积占比;
用原特征波峰函数在所述波形重叠区域范围内计算积分,得到所有细胞的总面积;
用所述每种细胞的面积占比除以所述所有细胞的总面积,得到各类细胞的占比。
本发明的一种基于多峰拟合解析的细胞分类结果校正方法,通过对细胞分析仪中得到的分类结果,通过高斯分布函数对每种细胞的特征峰曲线进行粗拟合和精拟合后,计算出重叠区域各种细胞的占比,提高了细胞分类的精确度,从而解决样本内的两类或多类细胞特征相近时,自动分类算法无法精确分出两类细胞导致结果精确度低的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的一种基于多峰拟合解析的细胞分类结果校正方法的流程图;
图2是本发明的一种基于多峰拟合解析的细胞分类结果校正方法的白细胞五分类自动分类算法分类结果散点图;
图3是本发明的经过滤波处理后的中性、单核细胞特征直方图;
图4是本发明的单核特征峰的初始A、μ值示意图;
图5是本发明的k—σ关系经验曲线图;
图6是本发明的特征峰粗拟合结果图;
图7是本发明的最终拟合结果与重叠区域划分图。
1-中性粒细胞、2-单核细胞、3-淋巴细胞、4-嗜酸性粒细胞、5-嗜碱性粒细胞、6-单核细胞特征波峰、7-中性细胞特征波峰。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,术语“长度”、“宽度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
实施例
如图1所示,本发明公开了一种基于多峰拟合解析的细胞分类结果校正方法。
S101、根据自动分类算法对细胞分析仪采集得到的样本细胞特征数据进行分类,提取样本细胞的特征直方图,并获得每类细胞所属的特征波峰函数。
以白细胞五分类为例,细胞分析仪采集所得白细胞特征数据分类,散点图经自动分类算法得到如图2所示。图中所示分别为中性粒细胞1、单核细胞2、淋巴细胞3、嗜酸性粒细胞4、嗜碱性粒细胞5。以中性粒细胞1与单核细胞2之间的重叠部分校正为例,计算其分类特征主方向直方图。对所述分类特征主方向直方图执行一次步长为3的中值滤波,然后再执行一次步长为5的高斯滤波得到样本细胞的特征直方图,如图3所示。
S102、对所述特征直方图中的特征波峰进行拟合寻优,解析出所述特征波峰函数的描述参数,得到波峰拟合函数。
其具体过程如下:
设单个细胞特征峰为f*(x),高斯模型描述的单个细胞特征峰形如:
Figure BDA0002373327250000041
设近似公式为f(x),此处修改待拟合的模型公式为:
Figure BDA0002373327250000042
其中σ参数指示特征峰的爬升的平缓程度,A参数对应特征峰的最高值,μ参数对应特征峰最高处对应的x值,三者皆需通过拟合求解。
设误差函数为:
Figure BDA0002373327250000043
于是,实际特征峰的最佳拟合函数为误差函数E取到最小值时所对应的f(x),此问题转为确定函数E的极小值问题,此处使用迭代法逼近函数E的最小值。
首先给参数A、μ、σ赋初值,三个参数中A参数对应特征峰的最高值,μ参数对应特征峰最高处对应的x值,二值都可以直接观测直方图得出,如图4所示。
σ值难以直接求出,本发明根据经验规律,先计算波峰半高高度与宽度的比值k后通过经验公式估计σ的初始值。根据图4,k=h/w,将k带入图5中经验公式σ=43.554k-1.136,即可得到σ的初始值估计。
对函数E关于A、μ、σ分别求偏导,并根据偏导结果,以α=0.1的学习率更新参数A、μ、σ,迭代调整公式如下:
Figure BDA0002373327250000051
Figure BDA0002373327250000052
Figure BDA0002373327250000053
上式中下标i表示迭代次数,α为学习率,上述迭代过程执行1000次或误差函数E小于10时停止。
完成单核特征峰的粗拟合后,取中性特征峰重复上述过程,完成对两个特征峰的粗拟合,得到两组拟合参数(A1',μ1',σ1'),(A2',μ2',σ2'),拟合出粗拟合曲线f1'(x)、f2'(x)。
图6为粗拟合结果,粗拟合后原始直方图g*(x)与拟合结果f1'(x)+f2'(x)误差仍然存在,设精准拟合函数为g(x),特征峰精准拟合函数为f1(x)、f2(x):
g(x)=f1(x)+f2(x)
选用高斯模型代入得:
Figure BDA0002373327250000054
设误差函数为:
Figure BDA0002373327250000055
以粗拟合结果(A1',μ1',σ1'),(A2',μ2',σ2')为参数初始值,对函数E关于A1',μ1',σ1',A2',μ2',σ2'迭代求导,每次迭代都根据偏导结果,以α=0.01的学习率迭代调整参数A1',μ1',σ1',A2',μ2',σ2',当迭代次数超过5000次或误差函数E小于1时结束迭代,迭代过程于步骤3类似,最终可得到两个高斯分布的最终拟合函数f1(x)、f2(x)。
计算g*(x)、g(x)在区间[μ12]相关性p和相对误差re,公式为:
Figure BDA0002373327250000056
Figure BDA0002373327250000061
当p>0.9且re<0.05时,认为拟合有效,并接受拟合结果,否则结束校正流程。
S103、根据每类细胞所属的所述波峰拟合函数,解析出波峰间特征重叠区域内各类细胞的占比,得到各类细胞占比数据。
根据图7,将直方图划分为A1、A2、A3三个区域,它们的面积分别为
Figure BDA0002373327250000062
Figure BDA0002373327250000063
特征直方图中只有区间(b,c)之间的A2区域为两峰重叠区域,且A2区域面积
Figure BDA0002373327250000064
为两个细胞特征峰叠加所成,根据拟合结果可以拆分出
Figure BDA0002373327250000065
中的叠加成分。于是可得:
Figure BDA0002373327250000066
Figure BDA0002373327250000067
Figure BDA0002373327250000068
Figure BDA0002373327250000069
S1=SA1+SA2*P
S2=SA3+SA2*(1-P)
式中,P为A2区域内中性细胞的占比,S1为特征直方图中单核细胞特征峰面积,S2特征直方图中为中性细胞面积。
S104、根据波峰间特征重叠区域的所述各类细胞占比数据和所述细胞分析仪自动分类算法的分类结果,得出各类细胞的实际比例。
设中性细胞在白细胞内的占比为NEU%*,修正后占比为NEU%,单核细胞在白细胞内的占比为MON%*,修正后占比为MON%,则有:
Figure BDA00023733272500000610
Figure BDA00023733272500000611
按照上述过程得到的各种细胞占比与自动分类算法结果、人工镜检结果的对比如表1所示,其中镜检的准确度最高。可见,经过本发明的方法校正后,分类准确性得到了很好的改善。
自动分类算法结果 本发明校正结果 镜检结果
白细胞内淋巴细胞占比 11.13% 11.33% 11.3%
白细胞内单核细胞占比 20.15% 18.03% 17.6%
白细胞内中性细胞占比 67.9% 69.82% 70.2%
表1
上述实施过程是针对五分类细胞分析仪的较优实践,可以理解的是,本发明可推广到其他流式细胞计数仪器中,例如若把S101中由散点图生成的直方图替换为三分类阻抗法直方图,则本发明可以用于白细胞三分群的计数校正。本实施中拟合模型为一元高斯模型,若将该模型替换为多元高斯模型,则可以将本发明方法推广至高维空间,应用到多特征空间的样本分类自动校正中。
本实施中为举例方便,只选择了中性粒细胞1与单核细胞2两个波峰重叠的情况进行拟合校正,在实际运用中可在S103动态增减拟合的波峰数量,实现剩余细胞特征重合时的分类结果校正,从而可以对多种细胞的重叠进行校正。

Claims (4)

1.一种基于多峰拟合解析的细胞分类结果校正方法,其特征在于,
包括:根据自动分类算法对细胞分析仪采集得到的样本细胞特征数据进行分类,提取样本细胞的特征直方图;
对所述特征直方图中的特征波峰进行拟合寻优,解析出所述特征波峰函数的描述参数,得到波峰拟合函数;
根据每类细胞所属的所述波峰拟合函数,解析出波峰间特征重叠区域内各类细胞的占比,得到各类细胞占比数据;
根据波峰间特征重叠区域的所述各类细胞占比数据和细胞分析仪自动分类算法的分类结果,得出各类细胞的实际比例。
2.如权利要求1所述的一种基于多峰拟合解析的细胞分类结果校正方法,其特征在于,
所述根据自动分类算法对细胞分析仪采集得到的样本细胞特征数据进行分类,提取样本细胞的特征直方图,包括:
获取采集的特征数据;
基于高斯滤波消除所述特征数据的噪声信号,得到特征直方图。
3.如权利要求1所述的一种基于多峰拟合解析的细胞分类结果校正方法,其特征在于,
对所述特征直方图中的特征波峰进行拟合寻优,包括:
为各个波峰选择一个拟合目标函数模型;
根据各波形特征估计拟合目标函数的初始参数;
使用粗精度与估计出的初始参数对各波峰分别进行快速粗拟合;
使用细精度与粗拟合结果对总体直方图进行精细拟合;
计算拟合直方图与原始直方图的相关性和相对误差,误差满足预设条件时得到拟合结果。
4.如权利要求3所述的一种基于多峰拟合解析的细胞分类结果校正方法,其特征在于,
解析出波峰间特征重叠区域内各类细胞的占比,包括:
根据每种细胞特征波峰的所述拟合结果,在所述波形重叠区域范围内计算积分,得到每种细胞的面积占比;
用原特征波峰函数在所述波形重叠区域范围内计算积分,得到所有细胞的总面积;
用所述每种细胞的面积占比除以所述所有细胞的总面积,得到各类细胞的占比。
CN202010057525.4A 2020-01-19 2020-01-19 一种基于多峰拟合解析的细胞分类结果校正方法 Active CN113139405B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010057525.4A CN113139405B (zh) 2020-01-19 2020-01-19 一种基于多峰拟合解析的细胞分类结果校正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010057525.4A CN113139405B (zh) 2020-01-19 2020-01-19 一种基于多峰拟合解析的细胞分类结果校正方法

Publications (2)

Publication Number Publication Date
CN113139405A true CN113139405A (zh) 2021-07-20
CN113139405B CN113139405B (zh) 2024-03-05

Family

ID=76809530

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010057525.4A Active CN113139405B (zh) 2020-01-19 2020-01-19 一种基于多峰拟合解析的细胞分类结果校正方法

Country Status (1)

Country Link
CN (1) CN113139405B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114324124A (zh) * 2021-12-21 2022-04-12 桂林优利特医疗电子有限公司 一种基于概率密度估计的散点样本数据扩充方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5040112A (en) * 1988-12-07 1991-08-13 Serono-Baker Diagnostics, Inc. Method of separating the three major types of blood cells from a white blood cell histogram
US20030170703A1 (en) * 2002-01-15 2003-09-11 Vysis, Inc., A Corporation Of The State Of Delaware Method and/or system for analyzing biological samples using a computer system
CN101493400A (zh) * 2008-01-25 2009-07-29 深圳迈瑞生物医疗电子股份有限公司 一种基于形状特征的自动分类校正的方法
CN102279146A (zh) * 2011-03-11 2011-12-14 桂林优利特医疗电子有限公司 基于激光鞘流技术的血液细胞五分类方法
CN102331393A (zh) * 2011-07-08 2012-01-25 无锡荣兴科技有限公司 一种对人体血液中细胞进行自动分类计算的方法
CN105203446A (zh) * 2015-09-14 2015-12-30 广州埃克森生物科技有限公司 基于概率分布细胞分类统计方法
CN108021903A (zh) * 2017-12-19 2018-05-11 南京大学 基于神经网络的人工标注白细胞的误差校准方法及装置
WO2018140014A1 (en) * 2017-01-25 2018-08-02 Athelas, Inc. Classifying biological samples using automated image analysis
CN108961208A (zh) * 2018-05-21 2018-12-07 江苏康尚生物医疗科技有限公司 一种聚集白细胞分割计数系统及方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5040112A (en) * 1988-12-07 1991-08-13 Serono-Baker Diagnostics, Inc. Method of separating the three major types of blood cells from a white blood cell histogram
US20030170703A1 (en) * 2002-01-15 2003-09-11 Vysis, Inc., A Corporation Of The State Of Delaware Method and/or system for analyzing biological samples using a computer system
CN101493400A (zh) * 2008-01-25 2009-07-29 深圳迈瑞生物医疗电子股份有限公司 一种基于形状特征的自动分类校正的方法
CN102279146A (zh) * 2011-03-11 2011-12-14 桂林优利特医疗电子有限公司 基于激光鞘流技术的血液细胞五分类方法
CN102331393A (zh) * 2011-07-08 2012-01-25 无锡荣兴科技有限公司 一种对人体血液中细胞进行自动分类计算的方法
CN105203446A (zh) * 2015-09-14 2015-12-30 广州埃克森生物科技有限公司 基于概率分布细胞分类统计方法
WO2018140014A1 (en) * 2017-01-25 2018-08-02 Athelas, Inc. Classifying biological samples using automated image analysis
CN108021903A (zh) * 2017-12-19 2018-05-11 南京大学 基于神经网络的人工标注白细胞的误差校准方法及装置
CN108961208A (zh) * 2018-05-21 2018-12-07 江苏康尚生物医疗科技有限公司 一种聚集白细胞分割计数系统及方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114324124A (zh) * 2021-12-21 2022-04-12 桂林优利特医疗电子有限公司 一种基于概率密度估计的散点样本数据扩充方法

Also Published As

Publication number Publication date
CN113139405B (zh) 2024-03-05

Similar Documents

Publication Publication Date Title
US20180106787A1 (en) System, method, and article for detecting abnormal cells using multi-dimensional analysis
AU2009212193B2 (en) Method and system for analysis of flow cytometry data using support vector machines
CN102507417B (zh) 一种粒子自动分类方法
CN108511055B (zh) 基于分类器融合及诊断规则的室性早搏识别系统及方法
CN107389536B (zh) 基于密度-距离中心算法的流式细胞粒子分类计数方法
CN112464902B (zh) 基于多通道多维特征优化的脑电眨眼伪迹检测方法
EP3340107B9 (en) Method of digital information classification
CN113139405B (zh) 一种基于多峰拟合解析的细胞分类结果校正方法
CN114707608B (zh) 医疗质控数据处理方法、装置、设备、介质及程序产品
JP4200176B2 (ja) 階級重みを使用する流体サンプル分析
CN109875548A (zh) 一种基于多导联综合分析的心电图特征波形聚类方法
CN113593697A (zh) 一种基于呼吸气味判断疾病的系统、设备及介质
EP2440920B1 (de) Lokalisierung eines validen bereiches eines blutausstriches
CN111274949B (zh) 一种基于结构分析的血液病白细胞散点图相似度分析方法
CN112036482A (zh) 一种基于电子鼻传感器数据的中药材分类方法
CN110974220A (zh) 一种脑电波骨髓细胞分类计数系统及方法
CN111134634A (zh) 一种基于聚类分析的光电容积脉搏波分析处理方法
US10274412B2 (en) Flow cytometry data segmentation result evaluation systems and methods
EP0012418B1 (de) Anordnung zur Klassierung von in einer Blutprobe enthaltenen Teilchen
CN112789503A (zh) 分析有核红细胞的方法、血液细胞分析仪和存储介质
Usson et al. A method for automatic classification of large and small myelinated fibre populations in peripheral nerves
CN116504314B (zh) 基于细胞动态分化的基因调控网络构建方法
CN111257558A (zh) 基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法
KR102434188B1 (ko) 머신러닝을 이용한 손상된 망막에서 측정된 망막전위도검사(erg) 신호의 분류 방법 및 이를 이용한 손상된 망막에서 측정된 망막전위도검사(erg) 신호의 분류 시스템
Abate et al. Tomography system to acquire 3D images of cells in laminar flow: software architecture

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant