CN110415212A - 异常细胞检测方法、装置及计算机可读存储介质 - Google Patents

异常细胞检测方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN110415212A
CN110415212A CN201910529319.6A CN201910529319A CN110415212A CN 110415212 A CN110415212 A CN 110415212A CN 201910529319 A CN201910529319 A CN 201910529319A CN 110415212 A CN110415212 A CN 110415212A
Authority
CN
China
Prior art keywords
cell
collection
abnormal cell
abnormal
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910529319.6A
Other languages
English (en)
Inventor
王佳平
郭冰雪
谢魏玮
王季勇
楼文杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910529319.6A priority Critical patent/CN110415212A/zh
Publication of CN110415212A publication Critical patent/CN110415212A/zh
Priority to PCT/CN2020/093548 priority patent/WO2020253508A1/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/695Preprocessing, e.g. image segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/698Matching; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Radiology & Medical Imaging (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Medical Informatics (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种人工智能技术,揭露了一种异常细胞检测方法,包括:获取包括正样本集与负样本集的原始细胞集与标签集,对所述原始细胞集进行高斯模糊、灰度化和索贝尔算子运算得到初步数据集,对所述初步数据集进行包括二值化、闭操作和取细胞操作得到细胞集,利用伽马矫正对所述细胞集进行对比度增强处理得到训练集,将所述训练集和所述标签集输入至预先构建的异常细胞检测模型训练,接收用户输入的待测细胞集,并将所述待测细胞集输入至训练后的所述异常细胞检测模型中检测所述待测细胞集中是否包含异常细胞,并输出检测结果。本发明还提出一种异常细胞检测装置以及一种计算机可读存储介质。本发明可以实现精准的异常细胞检测功能。

Description

异常细胞检测方法、装置及计算机可读存储介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种接收用户输入的细胞图片或视频,检测所述细胞图片或视频是否有异常细胞的方法、装置及计算机可读存储介质。
背景技术
异常细胞,如癌细胞、骨髓纤维化细胞、红斑狼疮细胞等,往往是人类产生重大病情的导火索,据调查显示,全世界每年有50万新发病例和27.4万死亡病例,其中85%的新发病例是由于前期识别异常细胞的识别率低下的原因。特别地,宫颈癌是目前唯一可以早发现并治愈的癌症,因此早期识别对于病情的治疗相当关键。细胞液检查方法是目前最常用的异常细胞识别方法,但在中国由于缺乏病理医生和细胞检测设备,对异常的识别率很低;另外有各种人工辅助识别的设备系统,但多数辅助识别系统一般基于传统方法,所述传统方法依靠细胞质或者细胞核的精确分割和传统图像处理算法进行特征提取与选择,因此识别的前期处理繁琐,且识别率并不高。
发明内容
本发明提供一种异常细胞检测方法、装置及计算机可读存储介质,其主要目的在于当用户输入细胞图片或视频时,精确快速的检测所述细胞图片或视频是否具有异常细胞并输出检测结果。
为实现上述目的,本发明提供的一种异常细胞检测方法,包括:
获取包括正样本集与负样本集的原始细胞集与标签集,对所述原始细胞集进行包括高斯模糊、灰度化和索贝尔算子运算得到初步数据集;
对所述初步数据集进行包括二值化、闭操作和取细胞操作得到细胞集;
利用伽马矫正对所述细胞集进行对比度增强处理得到训练集;
将所述训练集和所述标签集输入至预先构建的异常细胞检测模型,对所述异常细胞检测模型进行训练并得到输出值,判断所述输出值与所述标签集内的值是否相同,并得到相同准确率,直至所述相同准确率小于预设阈值时,所述异常细胞检测模型退出训练;
接收用户输入的待测细胞集,并将所述待测细胞集输入至训练后的所述异常细胞检测模型中检测所述待测细胞集中是否包含异常细胞,并输出检测结果。
可选地,所述正样本集包括彩色的健康细胞图片集,所述负样本集包括彩色的异常细胞图片集,所述标签集记录所述原始细胞集内的图片是健康细胞图片还是异常细胞图片。
可选地,所述高斯模糊处理包括:
依次遍历所述原始细胞集内细胞图片集的每个像素;
计算所述每个像素相邻八个像素的像素值的和值,并将所述和值除以八得到平均像素值;
将所述平均像素值代替所述每个像素。
可选地,所述伽马矫正为:
Vout=Vinγ,V:R,G,B
其中,V:R,G,B为所述伽马矫正所需处理的三个颜色通道,所述三个颜色通道分别为R,G,B,Vin是所述细胞集内每个像素值,Vout是所述训练集每个像素值,γ为小于1的伽马矫正系数。
可选地,所述异常细胞检测模型是一种神经网络模型,包括随机分割操作、卷积操作;
所述随机分割操作接收所述训练集并随机生成若干个细胞候选区域;
将所述若干个细胞候选区域进行所述卷积操作,所述卷积操作为:
其中ω’为输出数据,ω为所述卷积操作的输入数据,k为卷积核的大小,s为所述卷积操作的步幅,p为数据补零矩阵。
此外,为实现上述目的,本发明还提供一种异常细胞检测装置,该装置包括存储器和处理器,所述存储器中存储有可在所述处理器上运行的异常细胞检测程序,所述异常细胞检测程序被所述处理器执行时实现如下步骤:
获取包括正样本集与负样本集的原始细胞集与标签集,对所述原始细胞集进行包括高斯模糊、灰度化和索贝尔算子运算得到初步数据集;
对所述初步数据集进行包括二值化、闭操作和取细胞操作得到细胞集;
利用伽马矫正对所述细胞集进行对比度增强处理得到训练集;
将所述训练集和所述标签集输入至预先构建的异常细胞检测模型,对所述异常细胞检测模型进行训练并得到输出值,判断所述输出值与所述标签集内的值是否相同,并得到相同准确率,直至所述相同准确率小于预设阈值时,所述异常细胞检测模型退出训练;
接收用户输入的待测细胞集,并将所述待测细胞集输入至训练后的所述异常细胞检测模型中检测所述待测细胞集中是否包含异常细胞,并输出检测结果。
可选地,所述正样本集包括彩色的健康细胞图片集,所述负样本集包括彩色的异常细胞图片集,所述标签集记录所述原始细胞集内的图片是健康细胞图片还是异常细胞图片。
可选地,所述高斯模糊处理包括:
依次遍历所述原始细胞集内细胞图片集的每个像素;
计算所述每个像素相邻八个像素的像素值的和值,并将所述和值除以八得到平均像素值;
将所述平均像素值代替所述每个像素。
可选地,所述伽马矫正为:
Vout=Vin γ,V:R,G,B
其中,V:R,G,B为所述伽马矫正所需处理的三个颜色通道,所述三个颜色通道分别为R,G,B,Vin是所述细胞集内每个像素值,Vout是所述训练集每个像素值,γ为小于1的伽马矫正系数。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有异常细胞检测程序,所述异常细胞检测程序可被一个或者多个处理器执行,以实现如上所述的异常细胞检测方法的步骤。
本发明提出的异常细胞检测方法、装置及计算机可读存储介质,采用高斯模糊、灰度化和索贝尔算子运算进行处理,减少噪声对数据集的影响,同时,基于伽马矫正扩大正常细胞与异常细胞的对比度,更进一步的有利于后期模型的判断识别,同时对所述模型进行多次训练,并通过多次训练的过程中使所述模型可以具有更优异的自动提取数据的深层特征能力,从而大大提高对异常细胞的识别判断能力,因此本发明可以实现精准的异常细胞检测功能。
附图说明
图1为本发明一实施例提供的异常细胞检测方法的流程示意图;
图2为本发明一实施例提供的高斯模糊处理的示意图;
图3为本发明一实施例提供的索贝尔算子运算过程示意图;
图4为本发明一实施例提供的闭操作中膨胀处理示意图;
图5为本发明一实施例提供的闭操作中腐蚀处理示意图;
图6为本发明一实施例提供的异常细胞检测装置的内部结构示意图;
图7为本发明一实施例提供的异常细胞检测装置中异常细胞检测程序的模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种异常细胞检测方法。参照图1所示,为本发明一实施例提供的异常细胞检测方法的流程示意图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。
在本实施例中,异常细胞检测方法包括:
S1、获取包括正样本集与负样本集的原始细胞集与标签集,对所述原始细胞集进行包括高斯模糊、灰度化和索贝尔算子运算得到初步数据集。
本发明较佳实施例从网络或者预设数据库中获取彩色细胞照片集,所述彩色细胞照片集包括大量的细胞,即细胞群。进一步地,所述细胞群包括健康的细胞群,也包括异常细胞群,所述异常细胞如宫颈癌细胞、淋巴病变细胞等。若所述彩色细胞照片中只包括健康细胞群,则称为正样本集,若所述彩色细胞照片中包括了异常细胞群,则称为负样本集,所述正样本集和所述负样本集统称为原始细胞集。
进一步地,由于获取到的原始细胞集内的细胞群具有大量噪点,且健康细胞与健康细胞、异常细胞与健康细胞、异常细胞与异常细胞之间连接紧密盘桓交错,因此将各个细胞分割出来具有较大难度,先需要对所述原始细胞集进行包括高斯模糊、灰度化和索贝尔算子运算从而得到初步数据集。
本发明较佳地,所述高斯模糊用来处理所述原始细胞集的图像噪声,所述高斯模糊是依次遍历所述原始细胞集内细胞图片集内的每个像素,计算与所述每个像素相邻的八个像素的像素值的和值,并将所述和值除以八得到平均像素值,将所述平均像素值代替所述每个像素。具体地,当所述原始细胞集内细胞的像素点如说明书附图2所述,其中所述说明书附图2左图部分中心数字2是所述原始细胞集细胞的噪点,对所述中心数字2做高斯模糊处理是计算所述中心数字2周边所有像素的平均值,所述中心数字2周边所有像素的平均值为1,即高斯模糊处理后,所述中心数字2的结果变为1。
进一地,为了减少整个过程的计算量,可以将所述原始细胞集从彩色图像转换为灰度图。本发明运用的是各比例法,即设当前像素的三分量分别为R,G,B,然后利用如下公式得到转换后的像素分量值:0.30*R+0.59*G+0.11*B,由此得到了彩色图像的灰度图。
较佳地,所述索贝尔算子运算是使用卷积模板对所述灰度图求一阶的水平与垂直方向导数,根据所述导数增强细胞边缘的像素值,达到细胞与细胞之间分割更明显的目的。进一步地,所述一阶的水平与垂直方向导数是使用像素点进行周边值的加权和。如说明书附图3中左边为所述卷积模板,中间为原始图像,右边是卷积后的图像。例如,所述原始图像中间的像素点原本是5,经过与卷积模板的卷积计算(-1*3-2*3-1*4+1*2+2*7+1*6=9)后,所述中间的像素点的值变成了9,由于像素点由5变成了9,所以与周围像素点的像素差更大。
本发明将所述灰度图进行所述索贝尔算子运算得到初步数据集,所述初步数据集内的细胞与细胞之间像素差更明显。
S2、对所述初步数据集进行包括二值化、闭操作和取细胞操作得到细胞集。
在所述初步数据集中,每个像素的值是0-255之间的数字,代表灰暗的程度。本发明较佳实施例,预设一个阈值T,当所述初步数据集内图像的像素值大于所述阈值T时像素变为1,当所述初步数据集内图像的像素值小于所述阈值T时变为0,完成二值化操作。
较佳地,当完成所述二值化操作后,对所述初步数据集采用形态学操作,以达到可以将所述初步数据集内的细胞群切分为单个细胞的目的。在图像处理技术中,有些操作技术会对图像的形态发生改变,这些操作称为所述形态学操作,其中闭操作就是所述形态学操作的一种。所述闭操作先对所述初步数据集进行膨胀处理,然后再进行腐蚀处理,所述闭操作的结果可将许多连接紧密的细胞分割为一个个无突起的单个细胞,即将所述细胞群切分为所述单个细胞。
进一步地,所述膨胀处理是使用一个宽m1、高n1的矩形作为矩形模板A,对所述初步数据集中的每一个像素X做最大化处理。所述最大化处理是当像素X至于所述矩形模板A的中心时,根据所述矩形模版A的宽m1、高n1,遍历所有被所述矩形模板A覆盖的其他像素的像素值,修改像素X的像素值为所述其他像素中最大的像素值。假设对字母j做所述膨胀处理后,则所述字母j的形状发生了缩小,如说明书附图4所示。
较佳地,本发明对所述初步数据集的细胞群内每个细胞做所述膨胀处理,则每个细胞体积变小,因此细胞与细胞之间的距离更大,因此可方便分割出单个细胞得到单个细胞集。
基于已分割完成的单个细胞做腐蚀处理,使得体积变小的细胞恢复回原来的大小。所述腐蚀处理是使用一个宽m2、高n2的矩形作为矩形模板B,对图像中的每一个像素X做最小化处理,所述最小化处理是当像素X至于所述矩形模板B的中心时,根据所述矩形模版B的宽m2、高n2,遍历所有被所述矩形模板B覆盖的其他像素,修改像素X的值为所有像素中最小的值。假设对字母j做所述腐蚀处理后,则所述字母j的体积变大,如说明书附图5所述。
较佳地,本发明对所述单个细胞集做所述腐蚀处理,则每个细胞体积恢复回原来的体积,通过反二值化操作,将所述单个细胞集都恢复回原来的灰度值,得到细胞集。
S3、利用伽马矫正对所述细胞集进行对比度增强处理得到训练集。
本发明较佳实施例中,所述伽马矫正可以去除输入辐射量和量化的像素值之间的非线性映射,即对图像的像素值进行编辑,检出图像信号中的深色部分和浅色部分,并使两者比例增大,从而提高图像对比度效果。
进一步地,所述伽马矫正为:
Vout=Vin γ,V:R,G,B
其中,V:R,G,B为所述伽马矫正所需处理的三个颜色通道,所述三个颜色通道分别为R,G,B,Vin是所述细胞集内每个像素值,Vout是所述训练集每个像素值,γ为小于1的伽马矫正系数。
S4、将所述训练集和所述标签集输入至预先构建的异常细胞检测模型,对所述异常细胞检测模型进行训练并得到输出值,判断所述输出值与所述标签集内的值是否相同,并得到相同准确率,直至所述相同准确率小于预设阈值时,所述异常细胞检测模型退出训练。
本发明较佳实施例,所述异常细胞检测模型是一种神经网络模型,包括随机分割操作、卷积操作、激活操作。
所述随机分割操作接收所述训练集并随机生成若干个细胞候选区域,如接受一张包括细胞集的图片,所述随机分割操作在所述图片中随机生成若干个大小不一样的矩形框架;
本发明将所述若干个细胞候选区域进行所述卷积操作,所述卷积操作为:
其中ω’为输出数据,ω为所述卷积操作的输入数据,k为卷积核的大小,s为所述卷积操作的步幅,p为数据补零矩阵;
较佳地,本发明将所述ω’进行所述激活操作,所述激活操作为:
其中y为输出值,e为无限不循环小数。
进一步,本发明判断所述输出值与所述标签集内的值是否相同,并计算最终的相同准确率,若所述相同准确率大于预设阈值时,所述异常细胞检测模型退出训练,若所述相同准确率小于预设阈值时,所述异常细胞检测模型重新进行所述随机分割操作。
S5、接收用户输入的待测细胞集,并输入至训练后的所述异常细胞检测模型中检测所述待测细胞集中是否包含异常细胞,并输出检测结果。
本发明较佳地,如接受一张包括大量细胞的图片,所述异常细胞检测模可自动检测出所述图片是否有异常细胞,若有异常细胞,可将所述异常细胞标记出来,完成检测结果。
发明还提供一种异常细胞检测装置。参照图6所示,为本发明一实施例提供的异常细胞检测装置的内部结构示意图。
在本实施例中,所述异常细胞检测装置1可以是PC(Personal Computer,个人电脑),或者是智能手机、平板电脑、便携计算机等终端设备,也可以是一种服务器等。该异常细胞检测装置1至少包括存储器11、处理器12,通信总线13,以及网络接口14。
其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是异常细胞检测装置1的内部存储单元,例如该异常细胞检测装置1的硬盘。存储器11在另一些实施例中也可以是异常细胞检测装置1的外部存储设备,例如异常细胞检测装置1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器11还可以既包括异常细胞检测装置1的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于异常细胞检测装置1的应用软件及各类数据,例如异常细胞检测程序01的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行异常细胞检测程序01等。
通信总线13用于实现这些组件之间的连接通信。
网络接口14可选的可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在该装置1与其他电子设备之间建立通信连接。
可选地,该装置1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在异常细胞检测装置1中处理的信息以及用于显示可视化的用户界面。
图6仅示出了具有组件11-14以及异常细胞检测程序01的异常细胞检测装置1,本领域技术人员可以理解的是,图1示出的结构并不构成对异常细胞检测装置1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
在图6所示的装置1实施例中,存储器11中存储有异常细胞检测程序01;处理器12执行存储器11中存储的异常细胞检测程序01时实现如下步骤:
步骤一、获取包括正样本集与负样本集的原始细胞集与标签集,对所述原始细胞集进行包括高斯模糊、灰度化和索贝尔算子运算得到初步数据集。
本发明较佳实施例从网络或者预设数据库中获取彩色细胞照片集,所述彩色细胞照片集包括大量的细胞,即细胞群。进一步地,所述细胞群包括健康的细胞群,也包括异常细胞群,所述异常细胞如宫颈癌细胞、淋巴病变细胞等。若所述彩色细胞照片中只包括健康细胞群,则称为正样本集,若所述彩色细胞照片中包括了异常细胞群,则称为负样本集,所述正样本集和所述负样本集统称为原始细胞集。
进一步地,由于获取到的原始细胞集内的细胞群具有大量噪点,且健康细胞与健康细胞、异常细胞与健康细胞、异常细胞与异常细胞之间连接紧密盘桓交错,因此将各个细胞分割出来具有较大难度,先需要对所述原始细胞集进行包括高斯模糊、灰度化和索贝尔算子运算从而得到初步数据集。
本发明较佳地,所述高斯模糊用来处理所述原始细胞集的图像噪声,所述高斯模糊是依次遍历所述原始细胞集内细胞图片集内的每个像素,计算与所述每个像素相邻的八个像素的像素值的和值,并将所述和值除以八得到平均像素值,将所述平均像素值代替所述每个像素。具体地,当所述原始细胞集内细胞的像素点如说明书附图2所述,其中所述说明书附图2左图部分中心数字2是所述原始细胞集细胞的噪点,对所述中心数字2做高斯模糊处理是计算所述中心数字2周边所有像素的平均值,所述中心数字2周边所有像素的平均值为1,即高斯模糊处理后,所述中心数字2的结果变为1。
进一地,为了减少整个过程的计算量,可以将所述原始细胞集从彩色图像转换为灰度图。本发明运用的是各比例法,即设当前像素的三分量分别为R,G,B,然后利用如下公式得到转换后的像素分量值:0.30*R+0.59*G+0.11*B,由此得到了彩色图像的灰度图。
较佳地,所述索贝尔算子运算是使用卷积模板对所述灰度图求一阶的水平与垂直方向导数,根据所述导数增强细胞边缘的像素值,达到细胞与细胞之间分割更明显的目的。进一步地,所述一阶的水平与垂直方向导数是使用像素点进行周边值的加权和。如说明书附图3中左边为所述卷积模板,中间为原始图像,右边是卷积后的图像。例如,所述原始图像中间的像素点原本是5,经过与卷积模板的卷积计算(-1*3-2*3-1*4+1*2+2*7+1*6=9)后,所述中间的像素点的值变成了9,由于像素点由5变成了9,所以与周围像素点的像素差更大。
本发明将所述灰度图进行所述索贝尔算子运算得到初步数据集,所述初步数据集内的细胞与细胞之间像素差更明显。
步骤二、对所述初步数据集进行包括二值化、闭操作和取细胞操作得到细胞集。
在所述初步数据集中,每个像素的值是0-255之间的数字,代表灰暗的程度。本发明较佳实施例,预设一个阈值T,当所述初步数据集内图像的像素值大于所述阈值T时像素变为1,当所述初步数据集内图像的像素值小于所述阈值T时变为0,完成二值化操作。
较佳地,当完成所述二值化操作后,对所述初步数据集采用形态学操作,以达到可以将所述初步数据集内的细胞群切分为单个细胞的目的。在图像处理技术中,有些操作技术会对图像的形态发生改变,这些操作称为所述形态学操作,其中闭操作就是所述形态学操作的一种。所述闭操作先对所述初步数据集进行膨胀处理,然后再进行腐蚀处理,所述闭操作的结果可将许多连接紧密的细胞分割为一个个无突起的单个细胞,即将所述细胞群切分为所述单个细胞。
进一步地,所述膨胀处理是使用一个宽m1、高n1的矩形作为矩形模板A,对所述初步数据集中的每一个像素X做最大化处理。所述最大化处理是当像素X至于所述矩形模板A的中心时,根据所述矩形模版A的宽m1、高n1,遍历所有被所述矩形模板A覆盖的其他像素的像素值,修改像素X的像素值为所述其他像素中最大的像素值。假设对字母j做所述膨胀处理后,则所述字母j的形状发生了缩小,如说明书附图4所示。
较佳地,本发明对所述初步数据集的细胞群内每个细胞做所述膨胀处理,则每个细胞体积变小,因此细胞与细胞之间的距离更大,因此可方便分割出单个细胞得到单个细胞集。
基于已分割完成的单个细胞做腐蚀处理,使得体积变小的细胞恢复回原来的大小。所述腐蚀处理是使用一个宽m2、高n2的矩形作为矩形模板B,对图像中的每一个像素X做最小化处理,所述最小化处理是当像素X至于所述矩形模板B的中心时,根据所述矩形模版B的宽m2、高n2,遍历所有被所述矩形模板B覆盖的其他像素,修改像素X的值为所有像素中最小的值。假设对字母j做所述腐蚀处理后,则所述字母j的体积变大,如说明书附图5所述。
较佳地,本发明对所述单个细胞集做所述腐蚀处理,则每个细胞体积恢复回原来的体积,通过反二值化操作,将所述单个细胞集都恢复回原来的灰度值,得到细胞集。
步骤三、利用伽马矫正对所述细胞集进行对比度增强处理得到训练集。
本发明较佳实施例中,所述伽马矫正可以去除输入辐射量和量化的像素值之间的非线性映射,即对图像的像素值进行编辑,检出图像信号中的深色部分和浅色部分,并使两者比例增大,从而提高图像对比度效果。
进一步地,所述伽马矫正为:
Vout=Vin γ,V:R,G,S
其中,V:R,G,B为所述伽马矫正所需处理的三个颜色通道,所述三个颜色通道分别为R,G,B,Vin是所述细胞集内每个像素值,Vout是所述训练集每个像素值,γ为小于1的伽马矫正系数。
步骤四、将所述训练集和所述标签集输入至预先构建的异常细胞检测模型,对所述异常细胞检测模型进行训练并得到输出值,判断所述输出值与所述标签集内的值是否相同,并得到相同准确率,直至所述相同准确率小于预设阈值时,所述异常细胞检测模型退出训练。
本发明较佳实施例,所述异常细胞检测模型是一种神经网络模型,包括随机分割操作、卷积操作、激活操作。
所述随机分割操作接收所述训练集并随机生成若干个细胞候选区域,如接受一张包括细胞集的图片,所述随机分割操作在所述图片中随机生成若干个大小不一样的矩形框架;
本发明将所述若干个细胞候选区域进行所述卷积操作,所述卷积操作为:
其中ω’为输出数据,ω为所述卷积操作的输入数据,k为卷积核的大小,s为所述卷积操作的步幅,p为数据补零矩阵;
较佳地,本发明将所述ω’进行所述激活操作,所述激活操作为:
其中y为输出值,e为无限不循环小数。
进一步,本发明判断所述输出值与所述标签集内的值是否相同,并计算最终的相同准确率,若所述相同准确率大于预设阈值时,所述异常细胞检测模型退出训练,若所述相同准确率小于预设阈值时,所述异常细胞检测模型重新进行所述随机分割操作。
步骤五、接收用户输入的待测细胞集,并输入至训练后的所述异常细胞检测模型中检测所述待测细胞集中是否包含异常细胞,并输出检测结果。
本发明较佳地,如接受一张包括大量细胞的图片,所述异常细胞检测模可自动检测出所述图片是否有异常细胞,若有异常细胞,可将所述异常细胞标记出来,完成检测结果。
可选地,在其他实施例中,异常细胞检测程序还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器(本实施例为处理器12)所执行以完成本发明,本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段,用于描述异常细胞检测程序在异常细胞检测装置中的执行过程。
例如,参照图7所示,为本发明异常细胞检测装置一实施例中的异常细胞检测程序的程序模块示意图,该实施例中,所述异常细胞检测程序可以被分割为数据接收模块10、数据处理模块20、模型训练模块30、异常细胞检测输出模块40示例性地:
所述数据接收模块10用于:获取包括正样本集与负样本集的原始细胞集与标签集,对所述原始细胞集进行包括高斯模糊、灰度化和索贝尔算子运算得到初步数据集。
所述数据处理模块20用于:对所述初步数据集进行包括二值化、闭操作和取细胞操作得到细胞集。
所述模型训练模块30用于:利用伽马矫正对所述细胞集进行对比度增强处理得到训练集。
所述异常细胞检测输出模块40用于:接收用户输入的待测细胞集,并将所述待测细胞集输入至训练后的所述异常细胞检测模型中检测所述待测细胞集中是否包含异常细胞,并输出检测结果。
上述数据接收模块10、数据处理模块20、模型训练模块30、异常细胞检测输出模块40等程序模块被执行时所实现的功能或操作步骤与上述实施例大体相同,在此不再赘述。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有异常细胞检测程序,所述异常细胞检测程序可被一个或多个处理器执行,以实现如下操作:
获取包括正样本集与负样本集的原始细胞集与标签集,对所述原始细胞集进行包括高斯模糊、灰度化和索贝尔算子运算得到初步数据集;
对所述初步数据集进行包括二值化、闭操作和取细胞操作得到细胞集;
利用伽马矫正对所述细胞集进行对比度增强处理得到训练集;
将所述训练集和所述标签集输入至预先构建的异常细胞检测模型,对所述异常细胞检测模型进行训练并得到输出值,判断所述输出值与所述标签集内的值是否相同,并得到相同准确率,直至所述相同准确率小于预设阈值时,所述异常细胞检测模型退出训练;
接收用户输入的待测细胞集,并将所述待测细胞集输入至训练后的所述异常细胞检测模型中检测所述待测细胞集中是否包含异常细胞,并输出检测结果。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种异常细胞检测方法,其特征在于,所述方法包括:
获取包括正样本集与负样本集的原始细胞集与标签集,对所述原始细胞集进行包括高斯模糊、灰度化和索贝尔算子运算得到初步数据集;
对所述初步数据集进行包括二值化、闭操作和取细胞操作得到细胞集;
利用伽马矫正对所述细胞集进行对比度增强处理得到训练集;
将所述训练集和所述标签集输入至预先构建的异常细胞检测模型,对所述异常细胞检测模型进行训练并得到输出值,判断所述输出值与所述标签集内的值是否相同,并得到相同准确率,直至所述相同准确率小于预设阈值时,所述异常细胞检测模型退出训练;
接收用户输入的待测细胞集,并将所述待测细胞集输入至训练后的所述异常细胞检测模型中检测所述待测细胞集中是否包含异常细胞,并输出检测结果。
2.如权利要求1所述的异常细胞检测方法,其特征在于,所述正样本集包括彩色的健康细胞图片集,所述负样本集包括彩色的异常细胞图片集,所述标签集包括所述原始细胞集内的图片是健康细胞图片还是异常细胞图片的标注。
3.如权利要求2所述的异常细胞检测方法,其特征在于,所述高斯模糊处理包括:
依次遍历所述原始细胞集内细胞图片集的每个像素;
计算所述每个像素相邻八个像素的像素值的和值,并将所述和值除以八得到平均像素值;
将所述平均像素值代替所述每个像素。
4.如权利要求3中的异常细胞检测方法,其特征在于,所述伽马矫正为:
Vout=Vin γ,V:R,G,B
其中,V:R,G,B为所述伽马矫正所需处理的三个颜色通道,所述三个颜色通道分别为R,G,B,Vin是所述细胞集内每个像素值,Vout是所述训练集每个像素值,γ为小于1的伽马矫正系数。
5.如权利要求4所述的异常细胞检测方法,其特征在于,所述异常细胞检测模型包括随机分割操作和卷积操作;
其中,所述随机分割操作接收所述训练集并随机生成若干个细胞候选区域;
所述卷积操作对所述若干个细胞候选区域执行如下运算:
其中ω’为所述卷积操作的输出数据,ω为所述卷积操作的输入数据,k为卷积核的大小,s为所述卷积操作的步幅,p为数据补零矩阵。
6.一种异常细胞检测装置,其特征在于,所述装置包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的异常细胞检测程序,所述异常细胞检测程序被所述处理器执行时实现如下步骤:
获取包括正样本集与负样本集的原始细胞集与标签集,对所述原始细胞集进行包括高斯模糊、灰度化和索贝尔算子运算得到初步数据集;
对所述初步数据集进行包括二值化、闭操作和取细胞操作得到细胞集;
利用伽马矫正对所述细胞集进行对比度增强处理得到训练集;
将所述训练集和所述标签集输入至预先构建的异常细胞检测模型,对所述异常细胞检测模型进行训练并得到输出值,判断所述输出值与所述标签集内的值是否相同,并得到相同准确率,直至所述相同准确率小于预设阈值时,所述异常细胞检测模型退出训练;
接收用户输入的待测细胞集,并将所述待测细胞集输入至训练后的所述异常细胞检测模型中检测所述待测细胞集中是否包含异常细胞,并输出检测结果。
7.如权利要求6所述的异常细胞检测装置,其特征在于,所述正样本集包括彩色的健康细胞图片集,所述负样本集包括彩色的异常细胞图片集,所述标签集记录所述原始细胞集内的图片是健康细胞图片还是异常细胞图片。
8.如权利要求7所述的异常细胞检测装置,其特征在于,所述高斯模糊处理包括:
依次遍历所述原始细胞集内细胞图片集的每个像素;
计算所述每个像素相邻八个像素的像素值的和值,并将所述和值除以八得到平均像素值;
将所述平均像素值代替所述每个像素。
9.如权利要求8所述的异常细胞检测装置,其特征在于,述伽马矫正为:
Vout=Vin γ,V:R,G,B
其中,V:R,G,B为所述伽马矫正所需处理的三个颜色通道,所述三个颜色通道分别为R,G,B,Vin是所述细胞集内每个像素值,Vout是所述训练集每个像素值,γ为小于1的伽马矫正系数。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有异常细胞检测程序,所述异常细胞检测程序可被一个或者多个处理器执行,以实现如权利要求1至5中任一项所述的异常细胞检测方法的步骤。
CN201910529319.6A 2019-06-18 2019-06-18 异常细胞检测方法、装置及计算机可读存储介质 Pending CN110415212A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910529319.6A CN110415212A (zh) 2019-06-18 2019-06-18 异常细胞检测方法、装置及计算机可读存储介质
PCT/CN2020/093548 WO2020253508A1 (zh) 2019-06-18 2020-05-29 异常细胞检测方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910529319.6A CN110415212A (zh) 2019-06-18 2019-06-18 异常细胞检测方法、装置及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN110415212A true CN110415212A (zh) 2019-11-05

Family

ID=68359294

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910529319.6A Pending CN110415212A (zh) 2019-06-18 2019-06-18 异常细胞检测方法、装置及计算机可读存储介质

Country Status (2)

Country Link
CN (1) CN110415212A (zh)
WO (1) WO2020253508A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020253508A1 (zh) * 2019-06-18 2020-12-24 平安科技(深圳)有限公司 异常细胞检测方法、装置及计算机可读存储介质
CN112184733A (zh) * 2020-09-30 2021-01-05 平安科技(深圳)有限公司 一种宫颈异常细胞检测装置及方法
WO2021139258A1 (zh) * 2020-06-19 2021-07-15 平安科技(深圳)有限公司 基于图像识别的细胞识别计数方法、装置和计算机设备
WO2021217851A1 (zh) * 2020-04-27 2021-11-04 平安科技(深圳)有限公司 异常细胞自动标注方法、装置、电子设备及存储介质
CN114998647A (zh) * 2022-05-16 2022-09-02 大连民族大学 基于注意力多实例学习的乳腺癌全尺寸病理图像分类方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113130049A (zh) * 2021-04-15 2021-07-16 黑龙江机智通智能科技有限公司 基于云服务的智能病理图像诊断系统
CN115564776B (zh) * 2022-12-05 2023-03-10 珠海圣美生物诊断技术有限公司 基于机器学习的异常细胞样本检测方法和装置

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793709A (zh) * 2012-10-26 2014-05-14 西门子医疗保健诊断公司 细胞识别方法和装置、以及尿液分析仪
US20140233826A1 (en) * 2011-09-27 2014-08-21 Board Of Regents Of The University Of Texas System Systems and methods for automated screening and prognosis of cancer from whole-slide biopsy images
CN104156951A (zh) * 2014-07-30 2014-11-19 电子科技大学 一种针对支气管肺泡灌洗涂片的白细胞检测方法
CN104933711A (zh) * 2015-06-10 2015-09-23 南通大学 一种肿瘤病理图像自动快速分割方法
CN106097283A (zh) * 2016-07-20 2016-11-09 南京邮电大学 一种基于人类视觉系统特性的多尺度x线图像增强方法
CN106408001A (zh) * 2016-08-26 2017-02-15 西安电子科技大学 基于深度核哈希的感兴趣区域快速检测方法
US20180211380A1 (en) * 2017-01-25 2018-07-26 Athelas Inc. Classifying biological samples using automated image analysis
CN108564114A (zh) * 2018-03-28 2018-09-21 电子科技大学 一种基于机器学习的人体粪便白细胞自动识别方法
CN109190567A (zh) * 2018-09-10 2019-01-11 哈尔滨理工大学 基于深度卷积神经网络的异常宫颈细胞自动检测方法
CN109614900A (zh) * 2018-11-29 2019-04-12 深圳和而泰数据资源与云技术有限公司 图像检测方法及装置
CN109635637A (zh) * 2018-10-30 2019-04-16 深圳市航天华拓科技有限公司 一种车牌识别方法、装置和计算设备
CN109886928A (zh) * 2019-01-24 2019-06-14 平安科技(深圳)有限公司 一种目标细胞标记方法、装置、存储介质及终端设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110009050A (zh) * 2019-04-10 2019-07-12 杭州智团信息技术有限公司 一种细胞的分类方法及装置
CN110363747A (zh) * 2019-06-14 2019-10-22 平安科技(深圳)有限公司 智能化异常细胞判断方法、装置及计算机可读存储介质
CN110415212A (zh) * 2019-06-18 2019-11-05 平安科技(深圳)有限公司 异常细胞检测方法、装置及计算机可读存储介质
CN110992303B (zh) * 2019-10-29 2023-12-22 平安科技(深圳)有限公司 一种异常细胞筛选方法、装置、电子设备和存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140233826A1 (en) * 2011-09-27 2014-08-21 Board Of Regents Of The University Of Texas System Systems and methods for automated screening and prognosis of cancer from whole-slide biopsy images
CN103793709A (zh) * 2012-10-26 2014-05-14 西门子医疗保健诊断公司 细胞识别方法和装置、以及尿液分析仪
CN104156951A (zh) * 2014-07-30 2014-11-19 电子科技大学 一种针对支气管肺泡灌洗涂片的白细胞检测方法
CN104933711A (zh) * 2015-06-10 2015-09-23 南通大学 一种肿瘤病理图像自动快速分割方法
CN106097283A (zh) * 2016-07-20 2016-11-09 南京邮电大学 一种基于人类视觉系统特性的多尺度x线图像增强方法
CN106408001A (zh) * 2016-08-26 2017-02-15 西安电子科技大学 基于深度核哈希的感兴趣区域快速检测方法
US20180211380A1 (en) * 2017-01-25 2018-07-26 Athelas Inc. Classifying biological samples using automated image analysis
CN108564114A (zh) * 2018-03-28 2018-09-21 电子科技大学 一种基于机器学习的人体粪便白细胞自动识别方法
CN109190567A (zh) * 2018-09-10 2019-01-11 哈尔滨理工大学 基于深度卷积神经网络的异常宫颈细胞自动检测方法
CN109635637A (zh) * 2018-10-30 2019-04-16 深圳市航天华拓科技有限公司 一种车牌识别方法、装置和计算设备
CN109614900A (zh) * 2018-11-29 2019-04-12 深圳和而泰数据资源与云技术有限公司 图像检测方法及装置
CN109886928A (zh) * 2019-01-24 2019-06-14 平安科技(深圳)有限公司 一种目标细胞标记方法、装置、存储介质及终端设备

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020253508A1 (zh) * 2019-06-18 2020-12-24 平安科技(深圳)有限公司 异常细胞检测方法、装置及计算机可读存储介质
WO2021217851A1 (zh) * 2020-04-27 2021-11-04 平安科技(深圳)有限公司 异常细胞自动标注方法、装置、电子设备及存储介质
WO2021139258A1 (zh) * 2020-06-19 2021-07-15 平安科技(深圳)有限公司 基于图像识别的细胞识别计数方法、装置和计算机设备
CN112184733A (zh) * 2020-09-30 2021-01-05 平安科技(深圳)有限公司 一种宫颈异常细胞检测装置及方法
CN114998647A (zh) * 2022-05-16 2022-09-02 大连民族大学 基于注意力多实例学习的乳腺癌全尺寸病理图像分类方法
CN114998647B (zh) * 2022-05-16 2024-05-07 大连民族大学 基于注意力多实例学习的乳腺癌全尺寸病理图像分类方法

Also Published As

Publication number Publication date
WO2020253508A1 (zh) 2020-12-24

Similar Documents

Publication Publication Date Title
CN110415212A (zh) 异常细胞检测方法、装置及计算机可读存储介质
CN108229509B (zh) 用于识别物体类别的方法及装置、电子设备
US10726244B2 (en) Method and apparatus detecting a target
WO2020199468A1 (zh) 图像分类方法、装置及计算机可读存储介质
CN109284733B (zh) 一种基于yolo和多任务卷积神经网络的导购消极行为监控方法
US20190050641A1 (en) Methods and apparatus for capturing, processing, training, and detecting patterns using pattern recognition classifiers
CN108629306B (zh) 人体姿态识别方法及装置、电子设备、存储介质
US20190362193A1 (en) Eyeglass positioning method, apparatus and storage medium
EP3101594A1 (en) Saliency information acquisition device and saliency information acquisition method
CN110517246B (zh) 一种图像处理方法、装置、电子设备及存储介质
CN113159147B (zh) 基于神经网络的图像识别方法、装置、电子设备
CN113283446B (zh) 图像中目标物识别方法、装置、电子设备及存储介质
CN111461165A (zh) 图像识别方法、识别模型的训练方法及相关装置、设备
CN109637664A (zh) 一种bmi评测方法、装置及计算机可读存储介质
WO2020248848A1 (zh) 智能化异常细胞判断方法、装置及计算机可读存储介质
CN103544504B (zh) 一种基于多尺度图匹配核的场景字符识别方法
CN114937232B (zh) 医废处理人员防护用具穿戴检测方法、系统和设备
EP4047509A1 (en) Facial parsing method and related devices
CN110781980B (zh) 目标检测模型的训练方法、目标检测方法及装置
CN107368806A (zh) 图像矫正方法、装置、计算机可读存储介质和计算机设备
CN110795975B (zh) 人脸误检优化方法及装置
CN109255768A (zh) 图像补全方法、装置、终端及计算机可读存储介质
CN114841974A (zh) 一种水果内部结构无损检测方法、系统、电子设备及介质
CN110414522A (zh) 一种字符识别方法及装置
CN116797864B (zh) 基于智能镜子的辅助化妆方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191105