CN107492084A - 基于随机性的典型成团细胞核图像合成方法 - Google Patents
基于随机性的典型成团细胞核图像合成方法 Download PDFInfo
- Publication number
- CN107492084A CN107492084A CN201710544900.6A CN201710544900A CN107492084A CN 107492084 A CN107492084 A CN 107492084A CN 201710544900 A CN201710544900 A CN 201710544900A CN 107492084 A CN107492084 A CN 107492084A
- Authority
- CN
- China
- Prior art keywords
- cell
- image
- point
- sample
- background
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 23
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 23
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 3
- 230000003287 optical effect Effects 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000012946 outsourcing Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 4
- 238000005192 partition Methods 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 claims description 4
- 230000000052 comparative effect Effects 0.000 claims description 3
- 238000007873 sieving Methods 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 2
- 230000002380 cytological effect Effects 0.000 claims description 2
- 238000012217 deletion Methods 0.000 claims 1
- 230000037430 deletion Effects 0.000 claims 1
- 238000012549 training Methods 0.000 abstract description 18
- 238000005516 engineering process Methods 0.000 abstract description 10
- 238000004458 analytical method Methods 0.000 abstract description 3
- 230000007423 decrease Effects 0.000 abstract 1
- 238000010827 pathological analysis Methods 0.000 abstract 1
- 210000004027 cell Anatomy 0.000 description 65
- 210000002919 epithelial cell Anatomy 0.000 description 8
- 230000001413 cellular effect Effects 0.000 description 4
- 244000287680 Garcinia dulcis Species 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 208000019065 cervical carcinoma Diseases 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 210000003714 granulocyte Anatomy 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 108020004414 DNA Proteins 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 239000000592 Artificial Cell Substances 0.000 description 1
- 108091093105 Nuclear DNA Proteins 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 208000003464 asthenopia Diseases 0.000 description 1
- 230000005859 cell recognition Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 230000002488 pyknotic effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Image Analysis (AREA)
Abstract
基于随机性的成团细胞核图像合成方法,本发明涉及DNA倍体分析技术中,由于成团细胞核图像稀少导致细胞分类正确率急剧下降的问题。细胞DNA倍体分析技术是一种自动化的病理诊断技术,准确识别各类细胞图像是这一技术的关键。然而,重叠细胞核的训练样本稀少(训练集失衡)导致重叠细胞核图片的识别率较低。为解决这一问题,本发明提出了一种合成重叠细胞图像的方法。该方法采用样本选择使合成的样本更具有代表性;引入随机性控制合成源图像的随机旋转角度和随机重叠程度;根据朗伯比尔定律重构重叠部分的像素,使合成的样本更接近真实样本;最后将合成的样本用于模型训练。本发明应用于解决重叠细胞核的训练样本稀少(训练集失衡)问题。
Description
技术领域
本发明设计基于随机性的典型成团细胞核图像合成方法。
背景技术
近年来全球范围内宫颈癌的发病率呈逐年上升趋势,已经成为威胁妇女生命的社会问题。然而大多数宫颈病变可以在早期发现,因此早诊断早治疗是应对宫颈癌的有效途径。细胞涂片检查是目前宫颈癌筛查的主流方法。一方面需要耗费大量的人力物力;另一方面医生镜下观察具有主观性,容易因为视觉疲劳产生人为误差。因此自动化的阅片技术变得越来越重要。
DNA倍体分析技术是近年来迅速发展起来的自动阅片技术。有效的将病理学专家的诊断经验与计算机的精确计算和快速处理能力结合起来,实现对宫颈细胞图像的识别和诊断。该技术只对细胞核染色,在软件的控制下自动聚焦扫描,拍摄镜下图片,并在识别的基础上准确测量细胞核内DNA的相对含量。最后将异常的细胞罗列出来,辅助医生诊断。然而细胞核重叠的情况无法避免,且其中出现异常细胞可能性较大。因此,对重叠细胞核(成团细胞核)的分析就显得非常必要。准确识别重叠细胞是进一步做图像分割和测量的前提。样本缺乏会严重影响倍体分析系统的识别性能。
由于标本中重叠细胞核种类繁多(细胞个数和重叠方式),收集大量重叠细胞核费时费力,难以获得足够的训练样本。这使得成团细胞核的训练图片数量远远少于其他类别的图片数量,在细胞分类方面面临着训练数据类别不平衡问题。现有的大多数学习算法和评价准测偏重于大类样本,忽略了小样本,这使分类器的性能降低。现有的大多数学习算法和评价准测偏重于大类样本,忽略了小样本,这使分类器的在失衡数据集上的性能降低。在不增加新样本的前提下,解决这一问题有两种策略。第一种立足于用现有的样本产生新的样本,增加训练数据不足类别的样本数量,代表性的方法有样本重采样和特征选择。第二种改进模型训练算法,提升少样本类别的重要性,典型的有代价敏感学习方法和单类学习方法。因此,本文采用过采样(over-sampling)技术合成大量训练样本,使不平衡的训练样本变得相对平衡。
目前很多增加小类样本的过采样方法主要有合成少数类过采样技术(SMOTE),Borderlin-SMOTE算法,MSYN算法,基于k-means算法和遗传算法的过采样技术,基于进化聚类的过采样集成方法等等。目前的方法主要立足于在特征域学习小样本类别的概率分布,以此作为先验来产生新的样本特征值,并将这些数据用于模型训练。由于重叠细胞是由单细胞重叠而成,我们又拥有大量的单细胞图像。如果能在图像数据域真实地模拟重叠过程,则可以产生足够且真实的重叠细胞图像用于特征提取和模型训练。因此,本发明提出利用单细胞图片合成成团细胞图像的方法,利用形成重叠细胞核图像的先验知识,模拟重叠细胞形成的真实过程。为了使合成的细胞尽可能地接近真实,我们考虑了三个方面的问题。为了确保合成的细胞具有代表性,我们对单细胞进行筛选,获得典型的单细胞图像用于合成。为了避免合成的数据偏向固定的分布,在细胞的旋转角度和重叠程度两个方面引入和随机性。为使重叠部分真实,根据朗伯比尔定律重构重叠部分的像素。实验表明,向小类样本加入合成数据后,在人工神经网络(mlp)、支持向量机(svm)、混合高斯模型(gmm)三种分类器上都取得了识别率的提升。
发明内容
本发明的目的是为了解决重叠细胞核图片稀少导致模型训练不充分,DNA倍体系统对细胞识别率不高的问题,而提出的一种基于随机性的典型成团细胞核图像合成方法,
本发明主要技术方案如下:
步骤一、对选择合成的源图像进行选择并筛选:
利用样本在特征空间的欧式距离筛选用来合成的样本,欧式距离公式如下:
其中,n为细胞图像的特征维数,d为样本ai和aj的欧式距离,(x11,x12,...,x1n)(x21,x22,...,x2n)分别为两张细胞图片的特征向量;
步骤二、对细胞核图片进行随机角度旋转:
对两张源图像分别旋转随机角度,目的就是引入随机性,让两个细胞团重叠的区域随机生成,产生的图片更具多样性;
步骤三、对细胞核图像进行分割并提取细胞轮廓:
首先,采用灰度单阀值分割出细胞图像,根据比较结果进行分割如公式(2):
其中,T是分割阀值,f(x,y)是原图像中像素的灰度值,F(x,y)是分割后图像中像素的灰度值;
步骤四、消除两张细胞核图片的背景:
首先将步骤三方法提取的主细胞区域的轮廓保存下来构成轮廓的点序列,然后多种形式的图片组合操作去除背景区域,得到背景为白色的细胞图像;
步骤五、将背景为白色的两张细胞核图片进行合成:
提取轮廓后可以分别得到两张图片的细胞轮廓的中心点,第一张图的ROI沿着两个中心点的连线向右靠近第二张图的ROI,当第一个图的细胞核最右边的边缘点在第二个ROI左侧边界的右边时,两个ROI的细胞核区域开始重叠;
步骤六、确定细胞核重叠区域:
重构像素需要找到细胞核重叠区域,具体步骤为:(1)分别得到两个轮廓的最小外外包矩形,并找到两个矩形的相交部分,如附图中图6中的,点为两个矩形的相交点;(2)以,点分别向外扩2个像素点的距离为宽,最大外包矩形的高为长,构造一个搜索区域;(3)在非白色部分得搜索区域遍历每一个像素点,若这个点在第一个轮廓内并且在第二个轮廓内,或者在第一个轮廓上或在第二个轮廓上,判断此点属于重叠区域;(4)搜索出所有属于重叠区域的点构成重叠区域;
步骤七、重叠部分像素重构:
找到重叠部分根据朗伯比尔定律推断出重叠部分像素点的值,转换过程如式(3)-(4):
其中,I0为背景的灰度值,I1,I2分别为重叠部分一个位置对应点分别在两个源图的灰度值,A1,A2分别为这个位置对应的光密度值;
那么重叠部分的像素点的新的灰度值推断公式如(5):
其中,A为重叠部分一个位置对应的点的新的光密度值,Is则为这个点重构后的新的灰度值。Is的值转换为灰度值的计算如(6):
根据坐标转换将重叠部分的像素值全部按照公式(6)计算赋值,最后得到处理后的细胞核图像;
步骤八、还原背景:给合成的成团细胞核图片的白色背景换成细胞背景图。
发明效果
本发明提供了一种基于随机性的典型成团细胞核图像合成方法。实际中的多重叠细胞团情况多样,为了让合成的数据更接近现实情况,在整个合成过程中引入了随机性。在三个方面引用了随机性:一是选择源图片进行合成时,是随机选择的。二是细胞旋转随机性,合成之前,源细胞旋转多个角度,这些角度都随机生成。三是细胞交叠的随机性,两个细胞团在合成时,交叠的长度随机生成。该方法的第一步是要对细胞源图像筛选,以获得高质量的源数据。然后随机选择两张筛选后的源图像,分别旋转随机角度。实际中的多重叠细胞团情况多样,为了让合成的数据更接近现实情况,在整个合成过程中引入了随机性。旋转的角度随机,那么新成团细胞的重叠区域就是随机的。再通过分割提取轮廓等操作得到两张只有细胞区域,背景区域为白色的细胞图像。提取轮廓后可以分别得到两张图片的细胞轮廓的中心点,第一张图的ROI沿着两个中心点的连线向右靠近第二张图的ROI,当第一个图的细胞核最右边的边缘点在第二个ROI左侧边界的右边时,两个ROI的细胞核区域开始重叠。最后将两个细胞区域按中心靠近的方式合成一个重叠细胞团,并对重叠部分用朗波尔定律重构像素,得到新的多重叠细胞团图像。实验数据采用人工神经网络(MLP)、支持向量机(SVM)、混合高斯模型(GMM)三种分类器进行对比。实验过程中对各种情况的数据进行了训练并计算了识别率,为了让训练样本与测试样本满足独立分布,实验中的训练数据与测试数据是按一定比例抽取的不同的数据。没有加入合成样本的数据,此时的正确识别率用三种分类器训练得到的识别率都是最低的,然后向各类小样本(即第3、4、5、6、8类)加入每类对应的合成的细胞团图片,不平衡比依次降低,正确识别率依次升高。当不平衡比为1时,即各类样本达到数据平衡状态,正确识别率较高,最高达到83.87%。由此可见,向小类样本添加合成细胞团数据对提高分类器的识别率有较大提升。
附图说明
图1是各类细胞分类图,总共分为8类,分别是分别是:单个典型上皮细胞,单个非典型上皮细胞,两个上皮细胞,3个上皮细胞,4个及以上上皮细胞,淋巴细胞和固缩核,单个中心粒细胞,两个及以上中心粒细胞;
图2是重叠细胞核图片合成过程。两张细胞核图片演示合成细胞团图片的过程;
图3是消除细胞背景过程图,提取主细胞区域的轮廓并保存下来构成轮廓的点序列,然后多种形式的图片组合操作去除背景区域;
图4是细胞区域靠近过程图,让第一张图靠近第二张图的ROI区域,设定随机的重叠距离,将两个细胞核区域合成;
图5是细胞核重叠部分说明图,要找到细胞核重叠区域的所有点,根据朗伯比尔定律来推断出重叠部分像素点的值;
图6是坐标转换示意图,将两张图片重新放在一张背景图上操作的,所以在点背景图上的位置与点在源图的位置需要一个坐标转换;
图7是细胞核重叠部分处理前后对比图,可以看到重叠部分处理后比处理前效果更好;
图8是恢复细胞背景过程图,将白色背景置为源图像的背景;
图9是数据不平衡到平衡识别率变化折线图;
图10是类别3(2个上皮细胞)召回率变化折线图;
图11是类别4(3个上皮细胞)召回率变化折线图;
图12是类别5(4个及以上的上皮细胞)召回率变化折线图;
图13是类别8(两个及以上中心粒细胞)召回率变化折线图;
图14是平衡前后各类召回率对比柱状图;
图15是本发明流程图。
具体方法
具体方法:结合图15说明本实施方式,本实施方式是基于随机性的典型成团细胞核图像合成方法,具体是按照以下步骤完成的:
步骤一、对细胞源图像筛选,以获得高质量的源数据:
为了使合成样本更具有代表性,需要对源细胞图像进行样本选择;步骤如下:
1)假设原始样本集合为P={a1,a2,...an},设定一个空集合为Q,从P集合中随机选取一个样本ak,加入到Q集合;
2)在集合P中选择一个样本am,利用欧式距离分别计算样本am与Q中每个样本在特征空间的距离,最小距离为dmin,若dmin的值小于设定的阀值D,从集合P中删除样本am,否则,将am加入到集合Q中,并在集合P中删除am,欧式距离公式如下:
其中,n为细胞图像的特征维数,d为样本ai和aj的欧式距离,(x11,x12,...,x1n)(x21,x22,...,x2n)分别为两张细胞图片的特征向量;
3)继续在集合P中选择一个样本,循环步骤2),直到样本选择结束;
步骤二、对随机选择的两张源图像进行旋转:
图像旋转的实质目的就是引入随机性,让两个细胞团重叠的区域随机生成,产生的图片更具多样性;旋转后细胞图像的大小、形状、光密度、颜色等特征都不会改变,只是在某种程度上增加了成团细胞的种类;旋转的角度随机,那么新成团细胞的重叠区域就是随机的。
步骤三、对两张细胞核图片分别分割并提取轮廓:
在分割细胞与背景时,小于阀值的灰度点构成细胞核区域,而大于阀值的灰度点构成细胞背景区域;将图像中的每个像素的灰度值都与阀值比较,根据比较结果进行分割:
其中,T是分割阀值,f(x,y)是原图像中像素的灰度值,F(x,y)是分割后图像中像素的灰度值;取直方图的谷点作为初始阀值;
步骤四、多种形式的图片组合操作去除背景区域:
具体的方法是(附图中图3):
1)创建一张细胞轮廓区域为白色,背景为黑色的图a;
2)创建一张细胞轮廓区域为白色,背景为黑色的图b;
3)将黑色背景白色轮廓的图a与源细胞图c相与操作,得到图d;
4)将黑色轮廓白色背景图与图d相加操作,得到图e,即所需的白色背景细胞图。
步骤五、细胞核的合成过程:
提取轮廓后可以分别得到两张图片的细胞轮廓的中心点,第一张图的ROI沿着两个中心点的连线向右靠近第二张图的ROI,当第一个图的细胞核最右边的边缘点在第二个ROI左侧边界的右边时,两个ROI的细胞核区域开始重叠;
判断边缘点是否在第二个ROI区域左侧线段右边,用公式(9)判断:
其中,p1、p2分别为第二个ROI区域左侧线段的两个端点,p3为第一个图细胞核最右边的一个边缘点,(x1,y1)(x2,y2)(x3,y3)分别为p1、p2、p3的坐标,f(p1,p2,p3)≤0时,p3位于线段线段p1、p2的右侧或之上。
步骤六、确定细胞核重叠区域:
首先要找到细胞核重叠区域的所有点;具体步骤为:
1)分别得到两个轮廓的最小外外包矩形,并找到两个矩形的相交部分,如图6中的a,b点为两个矩形的相交点;
2)以a,b点分别向外扩2个像素点的距离为宽,最大外包矩形的高为长,构造一个搜索区域;
3)在非白色部分得搜索区域遍历每一个像素点,若这个点在第一个轮廓内并且在第二个轮廓内,或者在第一个轮廓上或在第二个轮廓上,判断此点属于重叠区域;
4)搜索出所有属于重叠区域的点构成重叠区域。
步骤七、重叠部分区域像素重构:
a.由于是将两张图片重新放在一张背景图上操作的,所以在点背景图上的位置与点在源图的位置需要一个坐标转换,如图6,假设大背景图为矩形B,源图为矩形A,点P大背景图B上的位置为(X,Y),A在B上的左上角坐标为(a,b),那么点P在源图A上地位置(x,y)计算如公式(10):
由上式可以得到重叠区域的点位置在源图的坐标,然后可以得到每个重叠区域位置的点分别在源图的位置对应的像素值,最终可以换算出新的像素值;
b.根据朗伯比尔定律来推断出重叠部分像素点的值,首先将某一点的灰度值转为光密度值,用光密度进行累加,最后将光密度又转换为灰度值。转换过程如式(11)-(12):
其中,I0为背景的灰度值,I1,I2分别为重叠部分一个位置对应点分别在两个源图的灰度值,A1,A2分别为这个位置对应的光密度值;
那么重叠部分的像素点的新的灰度值推断公式如(13):
其中,为重叠部分一个位置对应的点的新的光密度值,Is则为这个点重构后的新的灰度值,Is的值转换为灰度值的计算如(14):
步骤八、还原背景:
为了让合成后的图像与现有的细胞团图像更为接近,需要将白色背景置为源图像的背景,与消除背景方法类似;首先创建一张背景为源细胞背景,轮廓区域为白色的图,然后将此图与合成后的图像相与,即可得到带有背景的细胞团图像;
整个过程如图15所示:
本发明还可有其它多种图像合成方法,在不背离本发明精神及其实质的情况下,本领域技术人员当可根据本发明做出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
Claims (7)
1.基于随机性的典型成团细胞核图像合成方法,此方法首先筛选源细胞图,然后经过旋转,分割后等处理,用两张图片图合成新的成团细胞核图片;为了使合成的细胞接近真实数据,我们在细胞旋转和重叠长度等方面引入随机性,可生成N重叠细胞,并根据朗伯比尔定律定律重构细胞核重叠部分的灰度值。
2.基于随机性的典型成团细胞核图像合成方法主要是按照以下步骤进行的:
步骤一、对细胞源图像筛选:
为了使合成样本更具有代表性,需要对源细胞图像进行样本选择;步骤如下:
1)假设原始样本集合为P={a1,a2,...an},设定一个空集合为Q,从P集合中随机选取一个样本ak,加入到Q集合;
2)在集合P中选择一个样本am,利用欧式距离分别计算样本am与Q中每个样本在特征空间的距离,最小距离为dmin,若dmin的值小于设定的阀值D,从集合P中删除样本am,否则,将am加入到集合Q中,并在集合P中删除am,欧式距离公式如下:
其中,n为细胞图像的特征维数,d为样本ai和aj的欧式距离,(x11,x12,...,x1n)(x21,x22,...,x2n)分别为两张细胞图片的特征向量;
3)继续在集合P中选择一个样本,循环步骤2),直到样本选择结束;
步骤二、对随机选择的两张源图像进行旋转:
对两张源图像分别旋转随机角度,目的就是引入随机性,让两个细胞团重叠的区域随机生成,产生的图片更具多样性;旋转后细胞图像的大小、形状、光密度、颜色等特征都不会改变,只是在某种程度上增加了成团细胞的种类,旋转的角度随机,那么新成团细胞的重叠区域就是随机的。
3.步骤三、对两张细胞核图片分别分割并提取轮廓:
a.将图像中的每个像素的灰度值都与阀值比较,根据比较结果进行分割:
(2)
其中,T是分割阀值,f(x,y)是原图像中像素的灰度值,F(x,y)是分割后图像中像素的灰度值;
b.根据直方图确定分割阀值,取直方图的谷点作为初始阀值;
c.然后用掏空内部点的方法进行轮廓提取;
步骤四、多种形式的图片组合操作去除图片背景:
具体的方法是(见附图中图3):
创建一张细胞轮廓区域为白色,背景为黑色的图a;
创建一张细胞轮廓区域为白色,背景为黑色的图b;
将黑色背景白色轮廓的图a与源细胞图c相与操作,得到图d,公式如(3):
(3)
d.将黑色轮廓白色背景图与图d相加操作,得到图e,即所需的白色背景细胞图,公式如(4):
(4)
在公式(3)和(4)中,p1(x,y)、p2(x,y)分别表示两张输入图像在(x,y)位置处的像素值,p(x,y)表示输出图像在(x,y)位置处的像素值。
4.步骤五、细胞合成过程:
提取轮廓后可以分别得到两张图片的细胞轮廓的中心点,第一张图的ROI沿着两个中心点的连线向右靠近第二张图的ROI,当第一个图的细胞核最右边的边缘点在第二个ROI左侧边界的右边时,两个ROI的细胞核区域开始重叠;
判断边缘点是否在第二个ROI区域左侧线段右边,用公式(5)判断:
(5)
其中,p1、p2分别为第二个ROI区域左侧线段的两个端点,p3为第一个图细胞核最右边的一个边缘点,(x1,y1)(x2,y2)(x3,y3)分别为p1、p2、p3的坐标,f(p1,p2,p3)≤0时,p3位于线段线段p1、p2的右侧或之上。
5.步骤六、确定细胞核重叠区域:
重构像素需要找到细胞核重叠区域,具体步骤为:(1)分别得到两个轮廓的最小外外包矩形,并找到两个矩形的相交部分,如图5中的a,b点为两个矩形的相交点;(2)以a,b点分别向外扩2个像素点的距离为宽,最大外包矩形的高为长,构造一个搜索区域;(3)在非白色部分得搜索区域遍历每一个像素点,若这个点在第一个轮廓内并且在第二个轮廓内,或者在第一个轮廓上或在第二个轮廓上,判断此点属于重叠区域;(4)搜索出所有属于重叠区域的点构成重叠区域。
6.步骤七、重叠部分区域像素重构:
a.由于是将两张图片重新放在一张背景图上操作的,所以在点背景图上的位置与点在源图的位置需要一个坐标转换,如图6,假设大背景图为矩形,源图为矩形,点P大背景图B上的位置为(X,Y),在上的左上角坐标为(a,b),那么点在源图上地位置(x,y)计算如公式(6):
(6)
由上式可以得到重叠区域的点位置在源图的坐标,然后可以得到每个重叠区域位置的点分别在源图的位置对应的像素值,最终可以换算出新的像素值;
b.根据朗伯比尔定律来推断出重叠部分像素点的值,首先将某一点的灰度值转为光密度值,用光密度进行累加,最后将光密度又转换为灰度值,转换过程如式(7)-(8):
(7)
(8)
其中,I0为背景的灰度值,I1,I2分别为重叠部分一个位置对应点分别在两个源图的灰度值,A1,A2分别为这个位置对应的光密度值;
那么重叠部分的像素点的新的灰度值推断公式如(9):
(9)
其中,为重叠部分一个位置对应的点的新的光密度值,Is则为这个点重构后的新的灰度值,Is的值转换为灰度值的计算如(10):
(10)
根据坐标转换将重叠部分的像素值全部按照公式(10)计算赋值,最后得到处理后的细胞核图像。
7.步骤八、还原背景:
为了让合成后的图像与现有的细胞团图像更为接近,需要将白色背景置为源图像的背景,过程如附图中图8,与消除背景方法类似,首先创建一张背景为源细胞背景,轮廓区域为白色的图,然后将此图与合成后的图像相与,即可得到带有背景的细胞团图像;
至此,重叠细胞核图片合成完毕。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710544900.6A CN107492084B (zh) | 2017-07-06 | 2017-07-06 | 基于随机性的典型成团细胞核图像合成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710544900.6A CN107492084B (zh) | 2017-07-06 | 2017-07-06 | 基于随机性的典型成团细胞核图像合成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107492084A true CN107492084A (zh) | 2017-12-19 |
CN107492084B CN107492084B (zh) | 2021-06-25 |
Family
ID=60644585
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710544900.6A Active CN107492084B (zh) | 2017-07-06 | 2017-07-06 | 基于随机性的典型成团细胞核图像合成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107492084B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109035216A (zh) * | 2018-07-06 | 2018-12-18 | 北京羽医甘蓝信息技术有限公司 | 处理宫颈细胞切片图像的方法及装置 |
CN109493330A (zh) * | 2018-11-06 | 2019-03-19 | 电子科技大学 | 一种基于多任务学习的细胞核实例分割方法 |
CN111860586A (zh) * | 2020-06-12 | 2020-10-30 | 南通大学 | 一种细粒度宫颈细胞图像三阶段识别方法 |
WO2021027152A1 (zh) * | 2019-08-12 | 2021-02-18 | 平安科技(深圳)有限公司 | 基于条件生成对抗网络合成图像的方法及相关设备 |
CN113421248A (zh) * | 2021-06-30 | 2021-09-21 | 上海申瑞继保电气有限公司 | 变电站设备旋转图像数值处理方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002354468A (ja) * | 2001-05-30 | 2002-12-06 | Clarion Co Ltd | 画像合成方法及び装置並び車両周囲状況モニタ装置 |
WO2006011255A1 (ja) * | 2004-07-28 | 2006-02-02 | Matsushita Electric Industrial Co., Ltd. | パノラマ画像合成方法および物体検出方法、パノラマ画像合成装置、撮像装置、物体検出装置、並びにパノラマ画像合成プログラム |
JP2007114924A (ja) * | 2005-10-19 | 2007-05-10 | Matsushita Electric Ind Co Ltd | 多重描画装置 |
JP2010033246A (ja) * | 2008-07-28 | 2010-02-12 | Fujifilm Corp | 画像合成装置および方法ならびにプログラム |
CN105718942A (zh) * | 2016-01-19 | 2016-06-29 | 重庆邮电大学 | 基于均值漂移和过采样的高光谱图像不平衡分类方法 |
CN106204433A (zh) * | 2015-05-27 | 2016-12-07 | 三星电子株式会社 | 用于显示医学图像的方法和设备 |
-
2017
- 2017-07-06 CN CN201710544900.6A patent/CN107492084B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002354468A (ja) * | 2001-05-30 | 2002-12-06 | Clarion Co Ltd | 画像合成方法及び装置並び車両周囲状況モニタ装置 |
WO2006011255A1 (ja) * | 2004-07-28 | 2006-02-02 | Matsushita Electric Industrial Co., Ltd. | パノラマ画像合成方法および物体検出方法、パノラマ画像合成装置、撮像装置、物体検出装置、並びにパノラマ画像合成プログラム |
JP2007114924A (ja) * | 2005-10-19 | 2007-05-10 | Matsushita Electric Ind Co Ltd | 多重描画装置 |
JP2010033246A (ja) * | 2008-07-28 | 2010-02-12 | Fujifilm Corp | 画像合成装置および方法ならびにプログラム |
CN106204433A (zh) * | 2015-05-27 | 2016-12-07 | 三星电子株式会社 | 用于显示医学图像的方法和设备 |
CN105718942A (zh) * | 2016-01-19 | 2016-06-29 | 重庆邮电大学 | 基于均值漂移和过采样的高光谱图像不平衡分类方法 |
Non-Patent Citations (4)
Title |
---|
GU QIONG 等: "An Improved SMOTE Algorithm Based on Genetic Algorithm for Imbalanced Data Classification", 《JOURNAL OF DIGITAL INFORMATION MANAGEMENT》 * |
NITESH V.CHAWLA 等: "SMOTE:Synthetic Minority Over-Sampling Technique", 《JOURNAL OF ARTIFICIAL INTELLIGENCE RESEARCH》 * |
ROZITA JAMILI OSKOUEI 等: "Over-Sampling via Under-Sampling in Strongly Imbalanced Data", 《INTERNATIONAL JOURNAL OF ADVANCED INTELLIGENCE PARADIGMS》 * |
黄青山 等: "高重叠椭圆形气泡群的图像法研究", 《2015年中国化工学会年会论文集》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109035216A (zh) * | 2018-07-06 | 2018-12-18 | 北京羽医甘蓝信息技术有限公司 | 处理宫颈细胞切片图像的方法及装置 |
CN109493330A (zh) * | 2018-11-06 | 2019-03-19 | 电子科技大学 | 一种基于多任务学习的细胞核实例分割方法 |
WO2021027152A1 (zh) * | 2019-08-12 | 2021-02-18 | 平安科技(深圳)有限公司 | 基于条件生成对抗网络合成图像的方法及相关设备 |
JP2022500728A (ja) * | 2019-08-12 | 2022-01-04 | 平安科技(深▲せん▼)有限公司Ping An Technology (Shenzhen) Co., Ltd. | 条件付き敵対的生成ネットワークに基づいて画像を合成する方法および関連機器 |
US11636695B2 (en) | 2019-08-12 | 2023-04-25 | Ping An Technology (Shenzhen) Co., Ltd. | Method for synthesizing image based on conditional generative adversarial network and related device |
CN111860586A (zh) * | 2020-06-12 | 2020-10-30 | 南通大学 | 一种细粒度宫颈细胞图像三阶段识别方法 |
CN113421248A (zh) * | 2021-06-30 | 2021-09-21 | 上海申瑞继保电气有限公司 | 变电站设备旋转图像数值处理方法 |
CN113421248B (zh) * | 2021-06-30 | 2024-02-09 | 上海申瑞继保电气有限公司 | 变电站设备旋转图像数值处理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107492084B (zh) | 2021-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107492084A (zh) | 基于随机性的典型成团细胞核图像合成方法 | |
CN110348319B (zh) | 一种基于人脸深度信息和边缘图像融合的人脸防伪方法 | |
CN109447998B (zh) | 基于PCANet深度学习模型下的自动分割方法 | |
CN104424466B (zh) | 对象检测方法、对象检测设备及图像拾取设备 | |
CN108765465B (zh) | 一种无监督sar图像变化检测方法 | |
CN109977943A (zh) | 一种基于yolo的图像目标识别方法、系统和存储介质 | |
CN109154978A (zh) | 用于检测植物疾病的系统和方法 | |
CN110060237A (zh) | 一种故障检测方法、装置、设备及系统 | |
CN109711288A (zh) | 基于特征金字塔和距离约束fcn的遥感船舶检测方法 | |
CN109102014A (zh) | 基于深度卷积神经网络的类别不平衡的图像分类方法 | |
Romano et al. | Enhanced deep learning approach for predicting invasive ductal carcinoma from histopathology images | |
CN105069774B (zh) | 基于多示例学习与图割优化的目标分割方法 | |
JP2011527055A (ja) | 有糸分裂像検出装置および計数システム、および有糸分裂像を検出して計数する方法 | |
CN110059586A (zh) | 一种基于空洞残差注意力结构的虹膜定位分割系统 | |
CN109635812B (zh) | 图像的实例分割方法及装置 | |
CN109977994A (zh) | 一种基于多示例主动学习的代表性图像选取方法 | |
CN103295243B (zh) | 图像处理方法和设备以及物体检测方法和系统 | |
CN107944403A (zh) | 一种图像中的行人属性检测方法及装置 | |
CN110321968A (zh) | 一种超声图像分类装置 | |
CN103984954B (zh) | 基于多特征融合的图像合成方法 | |
CN110163250A (zh) | 基于分布式调度的图像脱敏处理系统、方法以及装置 | |
CN108764302A (zh) | 一种基于颜色特征和词袋特征的票据图像分类方法 | |
CN109671055A (zh) | 肺结节检测方法及装置 | |
CN107292346A (zh) | 一种基于局部子空间学习的mr图像海马体分割算法 | |
CN109949200A (zh) | 基于滤波器子集选择和cnn的隐写分析框架构建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |