发明内容
本发明的目的在于提供一种基于形状特征的自动分类校正的方法,解决的主要技术问题为:根据自动分类算法的分类结果寻找类别形状特征,并把这些特征转换成参数,根据这些特征参数判断自动分类算法分类结果的有效性,若分类结果无效则进行报警提示。
本发明的技术方案包括:
一种基于形状特征的自动分类校正的方法,用于流式细胞分析仪器的分析处理,其包括以下步骤:
A、根据流式细胞分析的散点图数据,进行数据分类及图像处理,并获得每类细胞的边界曲线;
B、对每类细胞边界曲线进行曲线拟合,并获得拟合曲线;
C、计算所述拟合曲线的曲线参数;
D、将所获得的曲线参数与预设范围进行比较,如果所述曲线参数超出预设范围,则表明此次分类结果不正确。
其中,所述步骤D之后还包括:如果分类结果不正确,则对所述散点图数据的分类进行至少一次校正处理,并在每一次校正处理后重复执行步骤B至D;若经多次校正处理后所获得的曲线参数依然超出所述预设范围时,则提示此次分类结果无效。
其中,所述步骤A中,以自动分类算法的分类结果为依据,把原来的散点图数据按照类别分成多个数据集合后,进行图像处理。
其中,所述步骤D中,所述校正处理按照以下方式进行:调用自动分类算法,按照预设的校正规则对原来的散点图数据再次进行分类计算,并根据此次分类计算的结果进行数据分类及图像处理后获得每类细胞的边界曲线。
其中,所述步骤A中的图像处理包括以下步骤:
A1、利用分类处理的结果,依次对图像进行除噪、分割处理并进行图像二值化处理,得到各类别的二值图像;
A2、对所述各类别的二值图像进行填充处理;
A3、对填充后的图像进行边界提取。
其中,所述图像处理中的步骤A3包括以下步骤:
A31、通过计算每一类别内各象素点的邻域内的背景点的个数,来确定每类细胞的边界点,其中为大于等于1的自然数;
A32、提取连续的且宽度总是为1个象素点的边界,来构成每类细胞的边界曲线。
其中,所述步骤B中采用椭圆曲线模型对每类细胞边界曲线进行曲线拟合。
其中,所述步骤B中采用抛物线曲线模型对每类细胞边界曲线进行曲线拟合。
其中,所述步骤B中,按照一预设曲线模型对每类细胞边界曲线进行曲线拟合的过程,按照以下步骤进行:
B1、选取待拟合曲线的一般曲线模型;
B2、选择某一类细胞的边界曲线作为待拟合曲线,进行曲线拟合,并定义所述一般曲线模型相对于所述待拟合曲线的误差函数;
B3、求取所述误差函数关于所述一般曲线模型系数的偏导函数,并根据误差函数取最小值的曲线拟合标准建立方程组;
B4、通过求解所述方程组获得所述一般曲线模型的系数;
B5、根据所获得的一般曲线模型的系数,判断其是否符合预设曲线模型的判别式;若是,则执行步骤C。其中,所述一般曲线模型采用二元二次方程式。
其中,若所述步骤B中按照一预设曲线模型对每类细胞边界曲线进行曲线拟合,并获得拟合曲线,则所述步骤C按照以下步骤进行处理:
C1、计算标准的预设曲线模型在某一中心点处旋转一预设角度后,所获得的旋转方程模型;
C2、将所述旋转方程模型与所述拟合曲线进行比较,建立关于所述拟合曲线参数的方程组;
C3、通过求解所述方程组,计算所述拟合曲线的曲线参数。
其中,所述步骤C中的曲线参数为所述拟合曲线的特征参数和经验参数中的一种或两种的结合。
其中,所述步骤D中的预设范围是依据理论和经验对每类细胞在散点图上的分布趋势进行分析所获得的的经验值。其中,所述步骤A中,以粗分散点图算法的分类结果为依据,把原来的散点图数据按照类别分成多个数据集合后,再进行图像处理。
本发明所提供的一种基于形状特征的自动分类校正的方法,由于采用了拟合曲线参数的判断方式来与预先统计的参数经验范围进行比对校正,方便了在流式细胞检测过程中对细胞检测数据的统计和图示处理,其处理结果更为准确,且方便了对错误检测结果的排除和报警处理。
具体实施方式
以下结合附图,将对本发明的各较佳实施例进行更为详细的说明。
本发明的一种基于形状特征的自动分类校正和报警方法,主要应用在一细胞分析仪中,依据自动分类算法完成分类后的血细胞散点图数据,对每类血细胞数据分别进行除噪、二值化、间断点填充、边缘提取等处理,得到每类血细胞的分布形状;即每类血细胞的边界曲线;然后使用椭圆曲线模型对边界曲线进行拟合,得到一条与边界曲线最相似的椭圆曲线;计算此椭圆曲线的一些标准参数:倾角、中心位置、长轴、短轴等;判断这些标准参数是否在正常范围内,超出正常范围则进行分类或报警提示。
但显然上述处理过程中并不仅限于细胞分析仪的检测,还可以应用予其他体液如尿液的成份分析过程中。
本发明通过对分类后的形状特征进行分析,实现对自动分类算法分类结果的校正和报警。本发明的一个实施例如图2所示,主要包含以下步骤:
A.根据流式细胞分析的散点图数据,以自动分类算法分类结果为依据,进行数据分类及图像处理,获得每类细胞的边界曲线;
B.采用椭圆模型对边界曲线进行拟合,并获得拟合曲线;
C.计算所述拟合曲线的曲线参数,如椭圆曲线的标准参数,其包括长短轴,旋转角度,中心位置等参数;
D.将所获得的曲线参数与预设范围进行比较,用于判断分类算法结果是否需要校正或报警。这一步骤中,如果所述曲线参数超出预设范围,则表明此次分类结果不正确,需要进行后续处理提高测量精度,并判断是否需要报警;如果所述曲线参数没有超出预设范围,则表明此次分类结果正确,输出分类结果即可。这里的预设范围是依据理论和经验对每类细胞在散点图上的分布趋势进行分析所获得的的经验值。
如图2所示,在所述步骤D之后还包括:如果分类结果不正确,则对所述散点图数据的分类进行至少一次校正处理,并在每一次校正处理后重复执行上述步骤B至D;若经多次校正处理后所获得的曲线参数依然超出所述预设范围时,则报警,并提示此次分类结果无效。这里的校正处理是采用以下过程进行的:调用自动分类算法,按照预设的校正规则对原来的散点图数据再次进行分类计算,并根据此次分类计算的结果进行数据分类及图像处理后获得每类细胞的边界曲线。上述校正规则是根据设计人员的需要修改自动分离算法中相应的参数值,从而起到修改分类结果的目的。
上述过程步骤A中,采用如下过程进行处理
A1、首先以自动分类算法分类结果为依据,把原来的散点图数据按照类别分成多个数据集合,然后再进行以下步骤的图像处理。
这里多个数据集合可分别记为:
S1={(xi,yi,ni)|i=1,2,.....,N1},
S2={(xi,yi,ni)|i=1,2,.....,N2},
S3={(xi,yi,ni)|i=1,2,.....,N3},
S4={(xi,yi,ni)|i=1,2,.....,N4},
S5={(xi,yi,ni)|i=1,2,.....,N5},
其中N1,N2,N3,N4,N5表示集合中点的个数;(xi,yi,ni)表示散点图上坐标为(xi,yi)处有ni个血细胞,如图3所示;
A2、对上述图像数据进行除噪声处理,即计算每类血细胞中每个点的平均血细胞个数,并按照平均血细胞个数选取不同参数对数据集合除噪;若某类的平均血细胞个数小于2,则此类将不再参与后面步骤的运算,如图4所示;
A3、把除噪后的图进行图像分割和二值化处理,即不再记录每个点上的血细胞个数,得到一幅包含不同类血细胞的二值图像,如图5所示;
A4、把二值图像进行填充处理,得到一个实心的图像,如图6所示;
A5、对填充后的图像进行边界提取,即,首先通过计算每一类别内各象素点的δ邻域内的背景点的个数,来确定每类细胞的边界点,其中δ为大于等于1的自然数;然后,提取连续的且宽度总是为1个象素点的边界,来构成每类细胞的边界曲线。在本实施例的具体操作时,这一步骤中的δ值最优取8来进行边界处理,即,首先去除实心图像中8邻域内非背景点之个数为8的象素点,保留8邻域内非背景点之个数小于8的所有点,便可得到每类血细胞主要分布的边界曲线,如图7所示。所谓8邻域是指图像某区域内包括上下左右以及对角线相邻区域共8个邻域,如果在实心图像的中间区域内,8邻域都是非背景点,而在实心图像边界上的区域则其非背景点个数小于8的区域;这些区域的最小单位是像素点,即可以对像素点进行判断,以获得实心图像的边界曲线。经过上述步骤处理后获得的每类血细胞分布的边界要能代表此类细胞的主要分布特征。
本发明方法的步骤B通过以下步骤实现,如图8所示,此处采用椭圆曲线模型对每类细胞边界曲线进行曲线拟合,具体计算过程如下:
B1、选取待拟合曲线的一般曲线模型,这里选择二元二次方程式为一般曲线模型,即:
f(x,y)=Ax2+Bxy+Cy2+Dx+Ey-1=0
B2、选择某一类细胞的边界曲线作为待拟合曲线,进行曲线拟合,并定义所述一般曲线模型相对于所述待拟合曲线的误差函数,这里假设误差函数为:
即:
其中,(xi,yi)表示某类血细胞边界曲线上的一点。
B3、欲使曲线f(x,y)与待拟合数据集形成的曲线最接近,则应该使误差取最小值。所以,这里需要求取所述误差函数Er关于所述一般曲线模型系数(A、B、C、D、E)的偏导函数,并根据误差函数Er取最小值的曲线拟合标准建立方程组,即下列式子成立:
说明:理想情况下,当待拟合数据集中的所有点都位于曲线f(x,y)上时,则有
B4、整理步骤B3中的5个等式,并建立方程组,并令:
X=[A B C D E]T
其中,n表示此类血细胞参与曲线拟合的点的个数。
B5、通过求解所述方程组获得所述一般曲线模型的系数A,B,C,D,E。在求解上述方程组的过程中,若|P|≠0,则X=P-1X0,即可得到拟合曲线的5个系数:A,B,C,D,E。若|P|=0,则表明上述方程组无解,需要报警提示本次分类结果无效。
B6、根据上述所获得的一般曲线模型的系数A、B、C、D、E,判断其是否符合预设曲线模型的判别式;若是,则执行上述步骤C;若否,则需要报警提示本次分类结果无效。这里,本发明采用椭圆曲线模型进行拟合,所以,当B2-4AC≥0,则提示本次分类结果无效;若B2-4AC<0,则继续执行上述步骤C进行计算,直到得到所有类别的拟合曲线参数。
所述步骤B中可采用任意的曲线模型进行曲线拟合处理,只要能反应真实情况即可,例如:可以采用椭圆曲线模型,抛物线曲线模型等对每类细胞边界曲线进行曲线拟合。
本发明方法的步骤C通过以下步骤实现,如图9、图10所示:
C1、计算标准的预设曲线模型在某一中心点处旋转一预设角度后,所获得的旋转方程模型。比如,如果步骤B中采用椭圆曲线模型进行拟合,则把一个长轴为a,短轴为b的标准椭圆平移到中心点(X0,Y0)后再按逆时针方向旋转θ角度后得到的方程为:
其整理后可得:
C2、将所述旋转方程模型与所述拟合曲线进行比较,建立关于所述拟合曲线参数的方程组,即把步骤C1中的方程与所述步骤B中所获得的椭圆的一般方程(即步骤B所获的拟合曲线)进行比较:
Ax2+Bxy+Cy2+Dx+Ey-1=0
可得如下方程组:
C3、整理步骤C2中的方程组,可得:
同理可得另外4个参数长轴a,短轴b、中心点横坐标X0、中心点纵坐标Y0,由此可确定全部各参数。当然,本发明还可以采用其他的曲线模型进行曲线拟合,所以,这里所要计算的曲线参数可以为:根据上述步骤B所获得的拟合曲线的特征参数和经验参数中的一种或两种的结合。
综上所述,本发明基于形状特征的自动分类校正和报警方法,提取自动分类后的每类血细胞的分布形状的基本特征,并检查这些参数,若在正常范围内则输出分类结果,若在正常范围外则进行报警提示。
本发明方法的主要优点在于从不同血细胞在散点图上形态分布具有不同特征的角度出发对任何自动分类算法的分类结果的合理性进行验证,从而保证自动分类算法结果的可靠性和准确性;在分类结果异常时可得到有效报警提示。
若把如图2所示流程图中的自动分类算法模块替换成一个粗分散点图算法模块,修改本发明方法的参数判别规则后,还可实现一种散点图分类算法,其中粗分散点图算法模块可以是任何一种能实现对散点图进行简单分类的方法,此分类算法的流程示意图如图11所示。
本发明所公开的方法适用于流式细胞分析仪、基于流式细胞术的尿液分析仪、血液细胞分析仪、及其他粒子分析仪等等各种分类装置,可以实现基于自动分类方法的分类结果的校正和报警。本发明不仅可使用在二维散点图上,若选取的拟合曲线(或曲面)模型变为三维或更高维时,还可推广应用到三维或更高维的散点图的自动分类校正和报警中。
本发明方法也适用于验证图像识别技术中那些具有固定形状的图像分割的正确性和合理性,并以此为基础提高图像分割算法的自适应性。
应当理解的是,上述针对本发明较佳实施例的描述较为详细和具体,并不能因此而理解为对本发明专利保护范围的限制,本发明的专利保护范围应以所附权利要求为准。