CN116385443A - 基于图像的样本质量确定方法和装置 - Google Patents

基于图像的样本质量确定方法和装置 Download PDF

Info

Publication number
CN116385443A
CN116385443A CN202310658614.8A CN202310658614A CN116385443A CN 116385443 A CN116385443 A CN 116385443A CN 202310658614 A CN202310658614 A CN 202310658614A CN 116385443 A CN116385443 A CN 116385443A
Authority
CN
China
Prior art keywords
visual field
sample
image
field image
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310658614.8A
Other languages
English (en)
Other versions
CN116385443B (zh
Inventor
叶莘
范献军
周燕玲
陈鑫
陈成苑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Hengqin Shengao Yunzhi Technology Co ltd
Original Assignee
Zhuhai Hengqin Shengao Yunzhi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Hengqin Shengao Yunzhi Technology Co ltd filed Critical Zhuhai Hengqin Shengao Yunzhi Technology Co ltd
Priority to CN202310658614.8A priority Critical patent/CN116385443B/zh
Publication of CN116385443A publication Critical patent/CN116385443A/zh
Application granted granted Critical
Publication of CN116385443B publication Critical patent/CN116385443B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/698Matching; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection

Abstract

本申请提供一种基于图像的样本质量确定方法和装置,其中方法包括:获取当前细胞样本对应的样本视野图像集合,并确定样本视野图像集合中各样本视野图像对应的目标特征变量集合;将各样本视野图像对应的目标特征变量集合输入训练好的视野分类模型,输出与各样本视野图像对应的视野分类结果;视野分类结果包括视野类别,视野类别包括正常视野和异常视野,若视野类别为异常视野,视野分类结果还包括视野对应的问题类型;基于各样本视野图像对应的视野分类结果确定当前细胞样本的质量是否达标;其中,视野分类模型是基于多个样本视野图像对应的目标特征变量集合及预先确定的视野分类结果标签进行训练后得到的,能保证样本质量检测的准确和高效性。

Description

基于图像的样本质量确定方法和装置
技术领域
本申请涉及医学图像处理技术领域,尤其涉及一种基于图像的样本质量确定方法和装置。
背景技术
在基于FISH(Fluorescence in situ hybridization,荧光原位杂交技术)的异常肿瘤细胞检测过程中,为保证后续检测的效率和准确性,需要先判断样本的质量是否合格,即样本视野图像是否存在问题。常见的样本视野图像问题包括:视野虚焦、挤压细胞、盖玻片污染、细胞分层、视野抖动、细胞冻融和分叶核占比多等等。
目前检测样本质量通常采用人工阅览样本视野图像,并根据经验判断样本是否能够进行后续检测,这将导致样本质量检测的主观性大,进而导致检测准确率过低,同时检测效率也过低。
发明内容
本申请提供一种基于图像的样本质量确定方法和装置,以用于实现样本质量的准确高效检测。
本申请提供一种基于图像的样本质量确定方法,包括:
获取当前细胞样本对应的样本视野图像集合,并确定所述样本视野图像集合中各样本视野图像对应的目标特征变量集合;
将各样本视野图像对应的目标特征变量集合输入训练好的视野分类模型,输出与各样本视野图像对应的视野分类结果;所述视野分类结果包括视野类别,所述视野类别包括正常视野和异常视野,在所述视野类别为异常视野的情况下,所述视野分类结果还包括视野对应的问题类型;
基于各样本视野图像对应的视野分类结果,确定当前细胞样本的质量是否达标;
其中,所述视野分类模型是基于多个样本视野图像对应的目标特征变量集合以及预先确定的视野分类结果标签进行训练后得到的。
根据本申请提供的一种基于图像的样本质量确定方法,所述方法还包括:
基于预先确定的视野分类关联变量集合确定目标特征变量集合;
所述视野分类关联变量集合中包括关联变量A-H;其中,关联变量A为样本视野图像中轮廓长度大于预设值的细胞数量;关联变量B为样本视野图像阈值分割后的平均细胞面积;关联变量C为样本视野图像阈值分割后平均细胞面积的信号强度;关联变量D为样本视野图像总体平均信号强度;关联变量E-H分别为样本视野图像中信号强度为第一至第四区间的像素点的比例。
根据本申请提供的一种基于图像的样本质量确定方法,所述第一至第四区间的范围是基于当前细胞样本对应的样本视野图像的曝光参数和染色效果确定的。
根据本申请提供的一种基于图像的样本质量确定方法,所述关联变量B的计算公式为:
Figure SMS_1
所述关联变量C的计算公式为:
Figure SMS_2
所述关联变量D的计算公式为:
Figure SMS_3
其中,imbin1为基于第一分割阈值对样本视野图像进行二值化处理后对应的细胞总面积;imbin2为基于第二分割阈值对样本视野图像进行二值化处理后对应的细胞总面积;cellnumber为基于第三分割阈值对样本视野图像进行二值化处理后对应的细胞数;img_orin为样本视野图像对应的矩阵;img_orin_sum为样本视野图像对应的矩阵中各元素的和;所述第二分割阈值大于所述第一分割阈值。
根据本申请提供的一种基于图像的样本质量确定方法,所述基于预先确定的视野分类关联变量集合确定目标特征变量集合,具体包括:
对关联变量A-H做相关性分析,并基于相关性分析结果确定目标特征变量集合。
根据本申请提供的一种基于图像的样本质量确定方法,所述方法还包括:
步骤S1,基于预设的阈值分割算法确定第三分割阈值,并基于所述第三分割阈值对目标样本视野图像进行二值化处理以得到第一样本视野图像;
步骤S2,基于所述第三分割阈值及所述第一样本视野图像中的细胞数确定第一分割阈值和第二分割阈值的初始值;
步骤S3,基于第一分割阈值和第二分割阈值的当前值分别对不同问题类型的样本视野图像进行二值化处理;
步骤S4,确定不同问题类型的样本视野图像对应的关联变量B与关联变量C的当前差值,判断各问题类型的样本视野图像对应的关联变量B与关联变量C的当前差值是否均为最大,若否,更新所述第一分割阈值和第二分割阈值并跳转执行步骤S3;若是,执行步骤S5;
步骤S5,将第一分割阈值和第二分割阈值的当前值作为第一分割阈值和第二分割阈值的最优值;
其中,所述问题类型包括:视野虚焦、挤压细胞、盖玻片污染、细胞分层、视野抖动、细胞冻融和分叶核占比多。
根据本申请提供的一种基于图像的样本质量确定方法,所述基于各样本视野图像对应的视野分类结果,确定当前细胞样本的质量是否达标,具体包括:
基于各样本视野图像对应的视野分类结果,确定当前细胞样本对应的正常视野比例;
若当前细胞样本对应的正常视野比例大于第一比例阈值,判断当前细胞样本的质量达标;
若当前细胞样本对应的正常视野比例小于第二比例阈值,判断当前细胞样本的质量不达标;
若当前细胞样本对应的正常视野比例在所述第二比例阈值和第一比例阈值之间,基于异常视野对应的样本视野图像中异常细胞的比例确定当前细胞样本的质量是否达标。
本申请还提供一种基于图像的样本质量确定装置,包括:
目标特征变量集合确定模块,用于获取当前细胞样本对应的样本视野图像集合,并确定所述样本视野图像集合中各样本视野图像对应的目标特征变量集合;
视野分类模块,用于将各样本视野图像对应的目标特征变量集合输入训练好的视野分类模型,输出与各样本视野图像对应的视野分类结果;所述视野分类结果包括视野类别,所述视野类别包括正常视野和异常视野,在所述视野类别为异常视野的情况下,所述视野分类结果还包括视野对应的问题类型;
样本质量确定模块,用于基于各样本视野图像对应的视野分类结果,确定当前细胞样本的质量是否达标;
其中,所述视野分类模型是基于多个样本视野图像对应的目标特征变量集合以及预先确定的视野分类结果标签进行训练后得到的。
本申请还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述基于图像的样本质量确定方法的步骤。
本申请还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述基于图像的样本质量确定方法的步骤。
本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述基于图像的样本质量确定方法的步骤。
本申请提供的基于图像的样本质量确定方法和装置,获取当前细胞样本对应的样本视野图像集合,并确定所述样本视野图像集合中各样本视野图像对应的目标特征变量集合;将各样本视野图像对应的目标特征变量集合输入训练好的视野分类模型,输出与各样本视野图像对应的视野分类结果;所述视野分类结果包括正常视野和异常视野,在所述视野类别为异常视野的情况下,所述视野分类结果还包括视野对应的问题类型;基于各样本视野图像对应的视野分类结果,确定当前细胞样本的质量是否达标;其中,所述视野分类模型是基于多个样本视野图像对应的目标特征变量集合以及预先确定的视野分类结果标签进行训练后得到的,能够基于各样本视野图像对应的目标特征变量集合及训练好的视野分类模型进行高效准确的视野分类,并基于各样本视野图像对应的视野分类结果快速确定当前细胞样本的质量是否达标,保证了样本质量检测的准确性和高效性。
附图说明
为了更清楚地说明本申请或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请提供的基于图像的样本质量确定方法的流程示意图;
图2A是本申请提供的正常视野中细胞及细胞信号强度曲线示意图;
图2B是本申请提供的虚焦视野中细胞及细胞信号强度曲线示意图;
图2C是本申请提供的抖动视野中细胞及细胞信号强度曲线示意图;
图2D是本申请提供的细胞冻融视野中细胞及细胞信号强度曲线示意图;
图2E是本申请提供的细胞分层视野中细胞及细胞信号强度曲线示意图;
图2F是本申请提供的挤压细胞视野中细胞及细胞信号强度曲线示意图;
图2G是本申请提供的盖玻片污染视野中细胞及细胞信号强度曲线示意图;
图2H是本申请提供的分叶核多视野中细胞及细胞信号强度曲线示意图;
图3A是本申请提供的正常视野分别进行单阈值和双阈值分割的效果示意图;
图3B是本申请提供的虚焦视野分别进行单阈值和双阈值分割的效果示意图;
图3C是本申请提供的抖动视野分别进行单阈值和双阈值分割的效果示意图;
图3D是本申请提供的细胞冻融视野分别进行单阈值和双阈值分割的效果示意图;
图3E是本申请提供的细胞分层视野分别进行单阈值和双阈值分割的效果示意图;
图3F是本申请提供的挤压细胞视野分别进行单阈值和双阈值分割的效果示意图;
图3G是本申请提供的盖玻片污染视野分别进行单阈值和双阈值分割的效果示意图;
图3H是本申请提供的分叶核多视野分别进行单阈值和双阈值分割的效果示意图;
图4是本申请提供的分割阈值的确定流程示意图;
图5是本申请提供的基于图像的样本质量确定装置的结构示意图;
图6是本申请提供的电子设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1是本申请提供的基于图像的样本质量确定方法的流程示意图,如图1所示,该方法包括:
步骤110,获取当前细胞样本对应的样本视野图像集合,并确定所述样本视野图像集合中各样本视野图像对应的目标特征变量集合。
具体地,在步骤110之前,所述方法还包括:
基于预先确定的视野分类关联变量集合确定目标特征变量集合;
所述视野分类关联变量集合中包括关联变量A-H;其中,关联变量A为样本视野图像中轮廓长度大于预设值的细胞数量;关联变量B为样本视野图像阈值分割后的平均细胞面积;关联变量C为样本视野图像阈值分割后平均细胞面积的信号强度;关联变量D为样本视野图像总体平均信号强度;关联变量E-H分别为样本视野图像中信号强度为第一至第四区间的像素点的比例。
其中,所述第一至第四区间的范围是基于当前细胞样本对应的样本视野图像的曝光参数和染色效果确定的,例如第一区间为100-150,第二区间为150-200,第三区间为200-255,第四区间为255。基于上述内容可以理解的是,对于不同的细胞样本,所述第一至第四区间的范围可能相同,也可能不同,本申请实施例对此不作具体限定。
所述关联变量B的计算公式为:
Figure SMS_4
所述关联变量C的计算公式为:
Figure SMS_5
所述关联变量D的计算公式为:
Figure SMS_6
其中,imbin1为基于第一分割阈值对样本视野图像进行二值化处理后对应的细胞总面积;imbin2为基于第二分割阈值对样本视野图像进行二值化处理后对应的细胞总面积;cellnumber为基于第三分割阈值对样本视野图像进行二值化处理后对应的细胞数;img_orin为样本视野图像对应的矩阵;img_orin_sum为样本视野图像对应的矩阵中各元素的和;所述第二分割阈值大于所述第一分割阈值。
可以理解的是,轮廓长度即为细胞周长,通过细胞轮廓上像素点的数量计量,对应的预设值可以通过经验得到,本申请实施例的预设值优先为1000。同时,前述细胞面积也是基于像素点的数量计量。
基于前述内容可知,常见的样本视野图像问题包括:视野虚焦、挤压细胞、盖玻片污染、细胞分层、视野抖动、细胞冻融和分叶核占比多。基于此,本申请通过观察存在问题的视野与不存在问题的视野对应的样本视野图像之间的差异发现,对于不同问题类型的异常视野中的问题细胞,在穿过问题细胞中心点的一条直线上的信号强度变化曲线趋势也有所区别。图2A-2H是本申请提供的不同视野中细胞及细胞信号强度曲线示意图,其中,图2A为正常视野中细胞及细胞信号强度曲线示意图,图2B为虚焦视野中细胞及细胞信号强度曲线示意图;图2C为抖动视野中细胞及细胞信号强度曲线示意图;图2D为细胞冻融视野中细胞及细胞信号强度曲线示意图;图2E为细胞分层视野中细胞及细胞信号强度曲线示意图;图2F为挤压细胞视野中细胞及细胞信号强度曲线示意图;图2G为盖玻片污染视野中细胞及细胞信号强度曲线示意图;图2H为分叶核多视野中细胞及细胞信号强度曲线示意图。通过对图2中不同视野中细胞信号强度曲线进行比对,本申请实施例发现可以对样本视野图像中细胞的信号强度进行处理以得到相应的变量(即前述关联变量)以对视野进行区分。图2A-2H中,左侧为细胞示意图,其横纵坐标均为像素位置,右侧为穿过细胞中心点的一条直线上的信号强度变化曲线示意图,其横坐标为像素位置,纵坐标为信号强度(即像素值)。结合图2A-2H可知,对于不同问题类型的异常视野中的问题细胞,在穿过问题细胞中心点的一条直线上的信号强度变化曲线存在明显差异。
在此基础上,本申请实施例进一步引入阈值处理和阈值分割方法,阈值处理为设定一个阈值(即前述第三阈值,选取范围为0-255),将样本视野图像上所有小于这个阈值的像素点设为0,大于这个阈值的像素点设为255。阈值分割为设定两个阈值(即前述第一分割阈值和第二分割阈值),将样本视野图像基于不同阈值分割后得到的图像相减。图3A-3H是本申请提供的不同视野分别进行单阈值(对应于前述阈值处理)和双阈值(对应于前述阈值分割)分割的效果示意图,其中,图3A为正常视野分别进行单阈值和双阈值分割的效果示意图(左侧为单阈值分割,右侧为双阈值分割,后续示意图与此同理),图3B为虚焦视野分别进行单阈值和双阈值分割的效果示意图;图3C为抖动视野分别进行单阈值和双阈值分割的效果示意图;图3D为细胞冻融视野分别进行单阈值和双阈值分割的效果示意图;图3E为细胞分层视野分别进行单阈值和双阈值分割的效果示意图;图3F为挤压细胞视野分别进行单阈值和双阈值分割的效果示意图;图3G为盖玻片污染视野分别进行单阈值和双阈值分割的效果示意图;图3H为分叶核多视野分别进行单阈值和双阈值分割的效果示意图。结合图3A-3H可知,异常视野和正常视野在阈值处理和阈值分割后的差异较大,于是通过对处理后的图像进行数学运算来得到准确的关联变量(即前述关联变量A-H)来描述视野信息。
进一步的,为了保证视野分类的效率,所述基于预先确定的视野分类关联变量集合确定目标特征变量集合,具体包括:
对关联变量A-H做相关性分析,并基于相关性分析结果确定目标特征变量集合。
具体地,对关联变量A-H做相关性分析可以采用现有的任意相关性分析方法,本申请实施例对此不作具体限定。以相关性分析方法采用卡方检验为例,其具体实现方式如下:对关联变量做卡方检验,以确定各关联变量独立的概率,以此来筛选与因变量相关性低的特征(即目标特征变量),结果如下表1所示:
表1 关联变量卡方检验结果汇总表
Figure SMS_7
可以理解的是,P值即为独立的概率,本申请实施例对P值小于0.05的关联变量进行分析,基于随机森林模型将关联变量对模型的贡献度进行排序,最终确定目标特征变量集合中的关联变量为A-D。
同时,为了进一步保证样本质量检测结果的准确性,本申请实施例通过迭代的方式确定最优的第一分割阈值和第二分割阈值,具体的,图4是本申请提供的分割阈值的确定流程示意图,如图4所示,所述方法还包括:
步骤S1,基于预设的阈值分割算法确定第三分割阈值,并基于所述第三分割阈值对目标样本视野图像进行二值化处理以得到第一样本视野图像;
步骤S2,基于所述第三分割阈值及所述第一样本视野图像中的细胞数确定第一分割阈值和第二分割阈值的初始值;
步骤S3,基于第一分割阈值和第二分割阈值的当前值分别对不同问题类型的样本视野图像进行二值化处理;
步骤S4,确定不同问题类型的样本视野图像对应的关联变量B与关联变量C的当前差值,判断各问题类型的样本视野图像对应的关联变量B与关联变量C的当前差值是否均为最大,若否,更新所述第一分割阈值和第二分割阈值并跳转执行步骤S3;若是,执行步骤S5;
步骤S5,将第一分割阈值和第二分割阈值的当前值作为第一分割阈值和第二分割阈值的最优值;
其中,所述问题类型包括:视野虚焦、挤压细胞、盖玻片污染、细胞分层、视野抖动、细胞冻融和分叶核占比多。
可以理解的是,所述预设的阈值分割算法可以采用任一现有的阈值分割算法,本申请实施例对此不作具体限定。还可以理解的是,当各问题类型的样本视野图像对应的关联变量B与关联变量C的当前差值均为最大时,最容易进行正常视野及异常视野的区分,即视野分类的准确性最高。还可以理解的是,步骤110中确定的样本视野图像集合中各样本视野图像对应的目标特征变量集合中的关联变量B-D均是基于上述第一分割阈值和第二分割阈值的最优值对样本视野图像进行处理后得到的。
步骤120,将各样本视野图像对应的目标特征变量集合输入训练好的视野分类模型,输出与各样本视野图像对应的视野分类结果;所述视野分类结果包括视野类别,所述视野类别包括正常视野和异常视野,在所述视野类别为异常视野的情况下,所述视野分类结果还包括视野对应的问题类型。
具体地,基于前述内容可知,通过样本视野图像对应的目标特征变量集合即可实现视野的准确分类,基于此,本申请实施例预先基于多个样本视野图像对应的目标特征变量集合以及预先确定的视野分类结果标签进行训练得到准确的视野分类模型。可以理解的是,所述视野分类模型可以采用决策树、随机森林、SVM和逻辑回归等。本申请实施例通过将多个样本视野图像对应的目标特征变量集合以及预先确定的视野分类结果标签按70%的训练集和30%的测试集进行划分,基于训练集的数据完成不同类型视野分类模型的构建,并对不同类型视野分类模型进行准确率和AUC的验证。最终准确率最高的模型类型为随机森林,模型准确为85.875%,AUC=0.9511>0.5,模型有效。
步骤130,基于各样本视野图像对应的视野分类结果,确定当前细胞样本的质量是否达标;
其中,所述视野分类模型是基于多个样本视野图像对应的目标特征变量集合以及预先确定的视野分类结果标签进行训练后得到的。
具体地,所述基于各样本视野图像对应的视野分类结果,确定当前细胞样本的质量是否达标,具体包括:
基于各样本视野图像对应的视野分类结果,确定当前细胞样本对应的正常视野比例;
若当前细胞样本对应的正常视野比例大于第一比例阈值,判断当前细胞样本的质量达标;
若当前细胞样本对应的正常视野比例小于第二比例阈值,判断当前细胞样本的质量不达标;
若当前细胞样本对应的正常视野比例在所述第二比例阈值和第一比例阈值之间,基于异常视野对应的样本视野图像中异常细胞的比例确定当前细胞样本的质量是否达标。
其中,所述第一比例阈值优选为90%,所述第二比例阈值优选为70%。相应的,若当前细胞样本对应的正常视野比例在所述第二比例阈值和第一比例阈值之间,本申请实施例进一步基于异常视野对应的样本视野图像中异常细胞(即前述问题细胞)的比例确定当前细胞样本的质量是否达标,若异常细胞的比例大于10%,则判断当前细胞样本的质量不达标,否则判断当前细胞样本的质量达标。可以理解的是,对于异常细胞的数量统计可以采用现有的任意细胞计数方法,本申请实施例对此不作具体限定。
本申请实施例提供的方法,获取当前细胞样本对应的样本视野图像集合,并确定所述样本视野图像集合中各样本视野图像对应的目标特征变量集合;将各样本视野图像对应的目标特征变量集合输入训练好的视野分类模型,输出与各样本视野图像对应的视野分类结果;所述视野分类结果包括正常视野和异常视野,在所述视野类别为异常视野的情况下,所述视野分类结果还包括视野对应的问题类型;基于各样本视野图像对应的视野分类结果,确定当前细胞样本的质量是否达标;其中,所述视野分类模型是基于多个样本视野图像对应的目标特征变量集合以及预先确定的视野分类结果标签进行训练后得到的,能够基于各样本视野图像对应的目标特征变量集合及训练好的视野分类模型进行高效准确的视野分类,并基于各样本视野图像对应的视野分类结果快速确定当前细胞样本的质量是否达标,保证了样本质量检测的准确性和高效性。
下面对本申请提供的基于图像的样本质量确定装置进行描述,下文描述的基于图像的样本质量确定装置与上文描述的基于图像的样本质量确定方法可相互对应参照。
基于上述任一实施例,图5是本申请提供的基于图像的样本质量确定装置的结构示意图,如图5所示,该装置包括:
目标特征变量集合确定模块210,用于获取当前细胞样本对应的样本视野图像集合,并确定所述样本视野图像集合中各样本视野图像对应的目标特征变量集合;
视野分类模块220,用于将各样本视野图像对应的目标特征变量集合输入训练好的视野分类模型,输出与各样本视野图像对应的视野分类结果;所述视野分类结果包括正常视野和异常视野,在所述视野类别为异常视野的情况下,所述视野分类结果还包括视野对应的问题类型;
样本质量确定模块230,用于基于各样本视野图像对应的视野分类结果,确定当前细胞样本的质量是否达标;
其中,所述视野分类模型是基于多个样本视野图像对应的目标特征变量集合以及预先确定的视野分类结果标签进行训练后得到的。
本申请实施例提供的装置,目标特征变量集合确定模块210获取当前细胞样本对应的样本视野图像集合,并确定所述样本视野图像集合中各样本视野图像对应的目标特征变量集合;视野分类模块220将各样本视野图像对应的目标特征变量集合输入训练好的视野分类模型,输出与各样本视野图像对应的视野分类结果;所述视野分类结果包括正常视野和异常视野,在所述视野类别为异常视野的情况下,所述视野分类结果还包括视野对应的问题类型;样本质量确定模块230基于各样本视野图像对应的视野分类结果,确定当前细胞样本的质量是否达标;其中,所述视野分类模型是基于多个样本视野图像对应的目标特征变量集合以及预先确定的视野分类结果标签进行训练后得到的,能够基于各样本视野图像对应的目标特征变量集合及训练好的视野分类模型进行高效准确的视野分类,并基于各样本视野图像对应的视野分类结果快速确定当前细胞样本的质量是否达标,保证了样本质量检测的准确性和高效性。
基于上述实施例,所述装置还包括目标特征变量筛选模块,
所述目标特征变量筛选模块具体用于:
基于预先确定的视野分类关联变量集合确定目标特征变量集合;
所述视野分类关联变量集合中包括关联变量A-H;其中,关联变量A为样本视野图像中轮廓长度大于预设值的细胞数量;关联变量B为样本视野图像阈值分割后的平均细胞面积;关联变量C为样本视野图像阈值分割后平均细胞面积的信号强度;关联变量D为样本视野图像总体平均信号强度;关联变量E-H分别为样本视野图像中信号强度为第一至第四区间的像素点的比例。
基于上述任一实施例,所述第一至第四区间的范围是基于当前细胞样本对应的样本视野图像的曝光参数和染色效果确定的。
基于上述任一实施例,所述关联变量B的计算公式为:
Figure SMS_8
所述关联变量C的计算公式为:
Figure SMS_9
所述关联变量D的计算公式为:
Figure SMS_10
其中,imbin1为基于第一分割阈值对样本视野图像进行二值化处理后对应的细胞总面积;imbin2为基于第二分割阈值对样本视野图像进行二值化处理后对应的细胞总面积;cellnumber为基于第三分割阈值对样本视野图像进行二值化处理后对应的细胞数;img_orin为样本视野图像对应的矩阵;img_orin_sum为样本视野图像对应的矩阵中各元素的和;所述第二分割阈值大于所述第一分割阈值。
基于上述任一实施例,所述基于预先确定的视野分类关联变量集合确定目标特征变量集合,具体包括:
对关联变量A-H做相关性分析,并基于相关性分析结果确定目标特征变量集合。
基于上述任一实施例,所述装置还包括分割阈值确定模块,所述分割阈值确定模块具体用于执行以下操作:
步骤S1,基于预设的阈值分割算法确定第三分割阈值,并基于所述第三分割阈值对目标样本视野图像进行二值化处理以得到第一样本视野图像;
步骤S2,基于所述第三分割阈值及所述第一样本视野图像中的细胞数确定第一分割阈值和第二分割阈值的初始值;
步骤S3,基于第一分割阈值和第二分割阈值的当前值分别对不同问题类型的样本视野图像进行二值化处理;
步骤S4,确定不同问题类型的样本视野图像对应的关联变量B与关联变量C的当前差值,判断各问题类型的样本视野图像对应的关联变量B与关联变量C的当前差值是否均为最大,若否,更新所述第一分割阈值和第二分割阈值并跳转执行步骤S3;若是,执行步骤S5;
步骤S5,将第一分割阈值和第二分割阈值的当前值作为第一分割阈值和第二分割阈值的最优值;
其中,所述问题类型包括:视野虚焦、挤压细胞、盖玻片污染、细胞分层、视野抖动、细胞冻融和分叶核占比多。
基于上述任一实施例,所述基于各样本视野图像对应的视野分类结果,确定当前细胞样本的质量是否达标,具体包括:
基于各样本视野图像对应的视野分类结果,确定当前细胞样本对应的正常视野比例;
若当前细胞样本对应的正常视野比例大于第一比例阈值,判断当前细胞样本的质量达标;
若当前细胞样本对应的正常视野比例小于第二比例阈值,判断当前细胞样本的质量不达标;
若当前细胞样本对应的正常视野比例在所述第二比例阈值和第一比例阈值之间,基于异常视野对应的样本视野图像中异常细胞的比例确定当前细胞样本的质量是否达标。
图6示例了一种电子设备的实体结构示意图,如图6所示,该电子设备可以包括:处理器310、通信接口320、存储器330和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑指令,以执行基于图像的样本质量确定方法,该方法包括:获取当前细胞样本对应的样本视野图像集合,并确定所述样本视野图像集合中各样本视野图像对应的目标特征变量集合;将各样本视野图像对应的目标特征变量集合输入训练好的视野分类模型,输出与各样本视野图像对应的视野分类结果;所述视野分类结果包括视野类别,所述视野类别包括正常视野和异常视野,在所述视野类别为异常视野的情况下,所述视野分类结果还包括视野对应的问题类型;基于各样本视野图像对应的视野分类结果,确定当前细胞样本的质量是否达标;其中,所述视野分类模型是基于多个样本视野图像对应的目标特征变量集合以及预先确定的视野分类结果标签进行训练后得到的。
此外,上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本申请还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的基于图像的样本质量确定方法,该方法包括:获取当前细胞样本对应的样本视野图像集合,并确定所述样本视野图像集合中各样本视野图像对应的目标特征变量集合;将各样本视野图像对应的目标特征变量集合输入训练好的视野分类模型,输出与各样本视野图像对应的视野分类结果;所述视野分类结果包括视野类别,所述视野类别包括正常视野和异常视野,在所述视野类别为异常视野的情况下,所述视野分类结果还包括视野对应的问题类型;基于各样本视野图像对应的视野分类结果,确定当前细胞样本的质量是否达标;其中,所述视野分类模型是基于多个样本视野图像对应的目标特征变量集合以及预先确定的视野分类结果标签进行训练后得到的。
又一方面,本申请还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的基于图像的样本质量确定方法,该方法包括:获取当前细胞样本对应的样本视野图像集合,并确定所述样本视野图像集合中各样本视野图像对应的目标特征变量集合;将各样本视野图像对应的目标特征变量集合输入训练好的视野分类模型,输出与各样本视野图像对应的视野分类结果;所述视野分类结果包括视野类别,所述视野类别包括正常视野和异常视野,在所述视野类别为异常视野的情况下,所述视野分类结果还包括视野对应的问题类型;基于各样本视野图像对应的视野分类结果,确定当前细胞样本的质量是否达标;其中,所述视野分类模型是基于多个样本视野图像对应的目标特征变量集合以及预先确定的视野分类结果标签进行训练后得到的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种基于图像的样本质量确定方法,其特征在于,包括:
获取当前细胞样本对应的样本视野图像集合,并确定所述样本视野图像集合中各样本视野图像对应的目标特征变量集合;
将各样本视野图像对应的目标特征变量集合输入训练好的视野分类模型,输出与各样本视野图像对应的视野分类结果;所述视野分类结果包括视野类别,所述视野类别包括正常视野和异常视野,在所述视野类别为异常视野的情况下,所述视野分类结果还包括视野对应的问题类型;
基于各样本视野图像对应的视野分类结果,确定当前细胞样本的质量是否达标;
其中,所述视野分类模型是基于多个样本视野图像对应的目标特征变量集合以及预先确定的视野分类结果标签进行训练后得到的。
2.根据权利要求1所述的基于图像的样本质量确定方法,其特征在于,所述方法还包括:
基于预先确定的视野分类关联变量集合确定目标特征变量集合;
所述视野分类关联变量集合中包括关联变量A-H;其中,关联变量A为样本视野图像中轮廓长度大于预设值的细胞数量;关联变量B为样本视野图像阈值分割后的平均细胞面积;关联变量C为样本视野图像阈值分割后平均细胞面积的信号强度;关联变量D为样本视野图像总体平均信号强度;关联变量E-H分别为样本视野图像中信号强度为第一至第四区间的像素点的比例。
3.根据权利要求2所述的基于图像的样本质量确定方法,其特征在于,所述第一至第四区间的范围是基于当前细胞样本对应的样本视野图像的曝光参数和染色效果确定的。
4.根据权利要求2所述的基于图像的样本质量确定方法,其特征在于,所述关联变量B的计算公式为:
Figure QLYQS_1
所述关联变量C的计算公式为:
Figure QLYQS_2
所述关联变量D的计算公式为:
Figure QLYQS_3
其中,imbin1为基于第一分割阈值对样本视野图像进行二值化处理后对应的细胞总面积;imbin2为基于第二分割阈值对样本视野图像进行二值化处理后对应的细胞总面积;cellnumber为基于第三分割阈值对样本视野图像进行二值化处理后对应的细胞数;img_orin为样本视野图像对应的矩阵;img_orin_sum为样本视野图像对应的矩阵中各元素的和;所述第二分割阈值大于所述第一分割阈值。
5.根据权利要求2所述的基于图像的样本质量确定方法,其特征在于,所述基于预先确定的视野分类关联变量集合确定目标特征变量集合,具体包括:
对关联变量A-H做相关性分析,并基于相关性分析结果确定目标特征变量集合。
6.根据权利要求4所述的基于图像的样本质量确定方法,其特征在于,所述方法还包括:
步骤S1,基于预设的阈值分割算法确定第三分割阈值,并基于所述第三分割阈值对目标样本视野图像进行二值化处理以得到第一样本视野图像;
步骤S2,基于所述第三分割阈值及所述第一样本视野图像中的细胞数确定第一分割阈值和第二分割阈值的初始值;
步骤S3,基于第一分割阈值和第二分割阈值的当前值分别对不同问题类型的样本视野图像进行二值化处理;
步骤S4,确定不同问题类型的样本视野图像对应的关联变量B与关联变量C的当前差值,判断各问题类型的样本视野图像对应的关联变量B与关联变量C的当前差值是否均为最大,若否,更新所述第一分割阈值和第二分割阈值并跳转执行步骤S3;若是,执行步骤S5;
步骤S5,将第一分割阈值和第二分割阈值的当前值作为第一分割阈值和第二分割阈值的最优值;
其中,所述问题类型包括:视野虚焦、挤压细胞、盖玻片污染、细胞分层、视野抖动、细胞冻融和分叶核占比多。
7.根据权利要求1所述的基于图像的样本质量确定方法,其特征在于,所述基于各样本视野图像对应的视野分类结果,确定当前细胞样本的质量是否达标,具体包括:
基于各样本视野图像对应的视野分类结果,确定当前细胞样本对应的正常视野比例;
若当前细胞样本对应的正常视野比例大于第一比例阈值,判断当前细胞样本的质量达标;
若当前细胞样本对应的正常视野比例小于第二比例阈值,判断当前细胞样本的质量不达标;
若当前细胞样本对应的正常视野比例在所述第二比例阈值和第一比例阈值之间,基于异常视野对应的样本视野图像中异常细胞的比例确定当前细胞样本的质量是否达标。
8.一种基于图像的样本质量确定装置,其特征在于,包括:
目标特征变量集合确定模块,用于获取当前细胞样本对应的样本视野图像集合,并确定所述样本视野图像集合中各样本视野图像对应的目标特征变量集合;
视野分类模块,用于将各样本视野图像对应的目标特征变量集合输入训练好的视野分类模型,输出与各样本视野图像对应的视野分类结果;所述视野分类结果包括视野类别,所述视野类别包括正常视野和异常视野,在所述视野类别为异常视野的情况下,所述视野分类结果还包括视野对应的问题类型;
样本质量确定模块,用于基于各样本视野图像对应的视野分类结果,确定当前细胞样本的质量是否达标;
其中,所述视野分类模型是基于多个样本视野图像对应的目标特征变量集合以及预先确定的视野分类结果标签进行训练后得到的。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述基于图像的样本质量确定方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于图像的样本质量确定方法的步骤。
CN202310658614.8A 2023-06-06 2023-06-06 基于图像的样本质量确定方法和装置 Active CN116385443B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310658614.8A CN116385443B (zh) 2023-06-06 2023-06-06 基于图像的样本质量确定方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310658614.8A CN116385443B (zh) 2023-06-06 2023-06-06 基于图像的样本质量确定方法和装置

Publications (2)

Publication Number Publication Date
CN116385443A true CN116385443A (zh) 2023-07-04
CN116385443B CN116385443B (zh) 2023-08-11

Family

ID=86967908

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310658614.8A Active CN116385443B (zh) 2023-06-06 2023-06-06 基于图像的样本质量确定方法和装置

Country Status (1)

Country Link
CN (1) CN116385443B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117218139A (zh) * 2023-09-12 2023-12-12 珠海横琴圣澳云智科技有限公司 样本细胞密度的确定方法和装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104834914A (zh) * 2015-05-15 2015-08-12 广西师范大学 宫颈细胞图像特征识别方法及宫颈细胞特征识别装置
CN106226247A (zh) * 2016-07-15 2016-12-14 暨南大学 一种基于高光谱显微成像技术的细胞检测方法
WO2020024227A1 (zh) * 2018-08-02 2020-02-06 深圳迈瑞生物医疗电子股份有限公司 一种细胞分析方法、细胞分析装置及存储介质
CN111144488A (zh) * 2019-12-27 2020-05-12 之江实验室 一种基于邻近共同预测的病理切片视野分类提升方法
CN112200793A (zh) * 2020-10-21 2021-01-08 湖南国科智瞳科技有限公司 数字病理切片质量的实时监控方法及系统、计算机设备
CN114419359A (zh) * 2021-11-05 2022-04-29 江西农业大学 一种基于atp酶染色的肌纤维细胞图像分类识别方法及系统
CN114419619A (zh) * 2022-03-29 2022-04-29 北京小蝇科技有限责任公司 红细胞检测分类方法、装置、计算机存储介质及电子设备
CN115130543A (zh) * 2022-04-29 2022-09-30 腾讯科技(深圳)有限公司 图像识别方法和装置、存储介质及电子设备
CN115170503A (zh) * 2022-07-01 2022-10-11 上海市第一人民医院 基于决策规则和深度神经网络的眼底图像视野分类方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104834914A (zh) * 2015-05-15 2015-08-12 广西师范大学 宫颈细胞图像特征识别方法及宫颈细胞特征识别装置
CN106226247A (zh) * 2016-07-15 2016-12-14 暨南大学 一种基于高光谱显微成像技术的细胞检测方法
WO2020024227A1 (zh) * 2018-08-02 2020-02-06 深圳迈瑞生物医疗电子股份有限公司 一种细胞分析方法、细胞分析装置及存储介质
CN111144488A (zh) * 2019-12-27 2020-05-12 之江实验室 一种基于邻近共同预测的病理切片视野分类提升方法
CN112200793A (zh) * 2020-10-21 2021-01-08 湖南国科智瞳科技有限公司 数字病理切片质量的实时监控方法及系统、计算机设备
CN114419359A (zh) * 2021-11-05 2022-04-29 江西农业大学 一种基于atp酶染色的肌纤维细胞图像分类识别方法及系统
CN114419619A (zh) * 2022-03-29 2022-04-29 北京小蝇科技有限责任公司 红细胞检测分类方法、装置、计算机存储介质及电子设备
CN115130543A (zh) * 2022-04-29 2022-09-30 腾讯科技(深圳)有限公司 图像识别方法和装置、存储介质及电子设备
CN115170503A (zh) * 2022-07-01 2022-10-11 上海市第一人民医院 基于决策规则和深度神经网络的眼底图像视野分类方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117218139A (zh) * 2023-09-12 2023-12-12 珠海横琴圣澳云智科技有限公司 样本细胞密度的确定方法和装置

Also Published As

Publication number Publication date
CN116385443B (zh) 2023-08-11

Similar Documents

Publication Publication Date Title
CN111259982B (zh) 一种基于注意力机制的早产儿视网膜图像分类方法和装置
CN106776842B (zh) 多媒体数据检测方法及装置
WO2021139258A1 (zh) 基于图像识别的细胞识别计数方法、装置和计算机设备
CN111814902A (zh) 目标检测模型训练方法、目标识别方法、装置和介质
CN109903282B (zh) 一种细胞计数方法、系统、装置和存储介质
CN114463609B (zh) 细胞显微图像中荧光杂点的确定方法和装置
US20080071711A1 (en) Method and System for Object Detection Using Probabilistic Boosting Cascade Tree
CN111369523B (zh) 显微图像中细胞堆叠的检测方法、系统、设备及介质
CN111986183B (zh) 一种染色体散型图像自动分割识别系统及装置
CN116385443B (zh) 基于图像的样本质量确定方法和装置
CN115035518B (zh) 细胞核图像中荧光染色信号点的识别方法和装置
CN110956628B (zh) 图片等级分类方法、装置、计算机设备和存储介质
US20060257017A1 (en) Classification methods, classifier determination methods, classifiers, classifier determination devices, and articles of manufacture
CN115082994A (zh) 人脸活体检测方法、活体检测网络模型的训练方法及装置
CN113674292A (zh) 一种基于部分实例标注的半监督骨髓瘤细胞实例分割方法
CN114445356A (zh) 基于多分辨率的全视野病理切片图像肿瘤快速定位方法
CN115760858A (zh) 基于深度学习的肾脏病理切片细胞识别方法及系统
CN115690752A (zh) 一种驾驶员行为检测方法及装置
CN114037868B (zh) 图像识别模型的生成方法及装置
CN114511523A (zh) 基于自监督学习的胃癌分子亚型分类方法及装置
US10146042B2 (en) Image processing apparatus, storage medium, and image processing method
CN114387451A (zh) 异常图像检测模型的训练方法、装置及介质
CN115187789A (zh) 基于卷积层激活差异的对抗图像检测方法及装置
Bai et al. A convolutional neural network combined with color deconvolution for mitosis detection
CN113537253A (zh) 一种红外图像目标检测方法、装置、计算设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant