CN109670518A - 一种测量图片中目标物的边界的方法 - Google Patents
一种测量图片中目标物的边界的方法 Download PDFInfo
- Publication number
- CN109670518A CN109670518A CN201811591440.3A CN201811591440A CN109670518A CN 109670518 A CN109670518 A CN 109670518A CN 201811591440 A CN201811591440 A CN 201811591440A CN 109670518 A CN109670518 A CN 109670518A
- Authority
- CN
- China
- Prior art keywords
- boundary
- pixel
- picture
- target photo
- coordinate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Image Processing (AREA)
- Apparatus For Radiation Diagnosis (AREA)
Abstract
本发明提供了一种测量图片中目标物的边界的方法,包括以下步骤:S1、将原始灰度图输入训练好的FasterRCNN网络中,获得含有目标物的目标图片和目标图片的坐标[x,y,w,h],其中:x为所述目标图片的中心点的横坐标,y为所述目标图片的中心点的纵坐标,w为所述目标图片的宽度,h为所述目标图片的高度;根据所述坐标[x,y,w,h]将目标图片从原始灰度图中切割出来,这种测量图片中目标物的边界的方法首先通过FasterRCNN网络将包含目标物的区域切割出来,然后对图片进行增强和二值化处理,得到二值化图片,最后利用360°辐射的射线来检测目标物的边界,可以自动忽略和过滤所有边界外的干扰物,得到清晰、准确的目标物图片。
Description
技术领域
本发明涉及图片识别技术领域,尤其涉及一种测量图片中目标物的边界的方法。
背景技术
在很多情况中,需要识别图片中的目标物的类别、位置和边界,对于类别和位置的识别目前已经存在较为成熟的方法,但是对于边界的测量,现有的方法依赖于交互操作,或者计算上复杂。例如磨玻璃肺结节和近胸膜或近血管肺结节就难以处理。现有技术中已经提出了许多分割肺结节的方法,这些方法虽然可以在实际中使用,但它们仍然存在一些缺点。由于肺结节并不总是独立出现,有些可以附着在肺壁或血管上,这些方法不能立即正确分割结节,而且还存在一种非常特殊的结节,即磨玻璃结节,其边缘模糊不清,许多方法在这些特殊情况下表现不佳。
发明内容
本发明要解决的技术问题是:为了解决现有技术中对于目标物的边界检测的方法较为复杂,在处理边界不是很清楚的物体或者物体附近存在其它干扰物体时得到的物体边界并不准确的问题,本发明提供了一种测量图片中目标物的边界的方法来解决上述问题。
本发明解决其技术问题所采用的技术方案是:一种测量图片中目标物的边界的方法,包括以下步骤:
S1、将原始灰度图输入训练好的FasterRCNN网络中,获得含有目标物的目标图片和目标图片的坐标[x,y,w,h],其中:x为所述目标图片的中心点的横坐标,y为所述目标图片的中心点的纵坐标,w为所述目标图片的宽度,h为所述目标图片的高度;根据所述坐标[x,y,w,h]将目标图片从原始灰度图中切割出来;
S2、通过3*3*1的卷积核对所述目标图片进行卷积,步数为1,补零后得到m*n*1的特征图;
S3、通过以下公式增强所述特征图中每个像素点的像素值xij,得到增强特征图:
其中,xij表示所述特征图中第i行第j列的像素值,r为增强次数,xi′j表示增强特征图中第i行第j列的像素值,Xmax为所述特征图中最大的像素值;
S4、对所述增强特征图进行二值化,得到二值化图片:
设定阈值将增强特征图中每个像素点的像素值xi′j与阈值thresh进行比较,将大于或等于阈值thresh的像素点的像素值设置为255,将小于阈值thresh的像素点的像素值设置为0;
S5、以所述二值化图片的中心点为端点并且360°辐射的发射若干条射线,所述射线延长的过程中持续检测所述射线经过的像素点的像素值,记录每条射线首次遇到像素值为0的边界像素点的坐标;
S6、对所有边界像素点的坐标进行后处理,得到目标物的边界并填充边界内的区域,得到目标物图片。
在一些实施例中,在步骤S6中,丢弃所有边界外的像素点,依次连接所有的边界像素点,得到目标物的边界并填充边界内的区域,得到目标物图片。
在一些实施例中,在步骤S6中,丢弃所有边界外的像素点,椭圆拟合所有的边界像素点,得到椭圆形的中心、长短轴和偏转角,绘制椭圆形的目标物的边界并填充边界内的区域,得到目标物图片。
在一些实施例中,在步骤S6中,分别计算每个边界像素点与中心点之间的欧氏距离,计算所有欧氏距离的平均值,将长度大于平均值的射线截短成平均值并记录截断点的坐标值,长度小于平均值的保留边界像素点,依次连接截断点和边界像素点,得到目标物的边界并填充边界内的区域,得到目标物图片。
作为优选,所述射线生成的方法为:
射线的倾斜角度为0°~45°、315°~360°以及135°~225°时,x轴坐标为自变量,y轴坐标为因变量;
射线的倾斜角度为45°~135°和225°~315°时,y轴坐标为自变量,x轴坐标为因变量。
本发明的有益效果是,这种测量图片中目标物的边界的方法首先通过FasterRCNN网络将包含目标物的区域切割出来,然后对图片进行增强和二值化处理,得到二值化图片,最后利用360°辐射的射线来检测目标物的边界,可以自动忽略和过滤所有边界外的干扰物,得到清晰、准确的目标物图片。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1是一种测量图片中目标物的边界的方法的实施例的流程图。
图2是二值化图片和目标物图片的对比效果图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
如图1所示,一种测量图片中目标物的边界的方法的实施例,包括以下步骤:
S1、首先将CT图转换成jpg或者png格式的原始灰度图,然后输入到FasterRCNN网络中,FasterRCNN网络包括:
1)、Conv layers:
将原始灰度图的尺寸限定为1000*600,使用一组基础的conv+relu+pooling层提取原始灰度图的特征图,特征图的大小为60*40,数量为512;
2)、RPN(Region Proposal Networks):
RPN网络主要用于生成region proposals,首先生成一堆Anchor box,对其进行裁剪过滤后通过softmax判断anchors属于前景(foreground)或者后景(background),即是物体or不是物体,所以这是一个二分类;同时,另一分支bounding box regression修正anchor box,形成较精确的proposal;
3)、Roi Pooling:
该层利用RPN生成的proposals和Conv layers最后得到的特征图,得到固定大小的特征图,进入到后面可利用全连接操作来进行目标识别和定位;
4)、Classifier:
将Roi Pooling层形成固定大小的特征图进行全连接操作,利用Softmax进行具体类别的分类,同时完成bounding box regression回归操作获得物体的精确位置。获得含有目标物的目标图片和目标图片的坐标[x,y,w,h],其中:x为目标图片的中心点的横坐标,y为目标图片的中心点的纵坐标,w为目标图片的宽度,h为目标图片的高度;根据坐标[x,y,w,h]将目标图片从原始灰度图中切割出来;
S2、通过3*3*1的卷积核对目标图片进行卷积,步数为1,补零后得到m*n*1的特征图;
S3、通过以下公式增强上述特征图中每个像素点的像素值xij,得到增强特征图:
其中,xij表示特征图中第i行第j列的像素值,r为增强次数,此实例中r=3,xi′j表示增强特征图中第i行第j列的像素值,Xmax为特征图中最大的像素值;
S4、对增强特征图进行二值化,得到二值化图片:
设定阈值将增强特征图中每个像素点的像素值xi′j与阈值thresh进行比较,将大于或等于阈值thresh的像素点的像素值设置为255,将小于阈值thresh的像素点的像素值设置为0;
S5、以二值化图片的中心点为端点并且360°辐射的发射若干条射线,射线延长的过程中持续检测射线经过的像素点的像素值,记录每条射线首次遇到像素值为0的边界像素点的坐标;
S6、对所有边界像素点的坐标进行后处理,得到目标物的边界并填充边界内的区域,得到目标物图片。
对于边界像素点的坐标的后处理有三种方式:
在一个实施例中,丢弃所有边界外的像素点,依次连接所有的边界像素点,得到目标物的边界并填充边界内的区域,得到目标物图片。
在另一个实施例中,丢弃所有边界外的像素点,椭圆拟合所有的边界像素点,得到椭圆的中心、长短轴和偏转角,绘制椭圆形的目标物的边界并填充边界内的区域,得到目标物图片。
在另一个实施例中,分别计算每个边界像素点与中心点之间的欧氏距离,计算所有欧氏距离的平均值,将长度大于平均值的射线截短成平均值并记录截断点的坐标值,长度小于平均值的保留边界像素点,依次连接截断点和边界像素点,得到目标物的边界并填充边界内的区域,得到目标物图片。
为了更准确的检测到边界,射线生成的方法为:
射线的倾斜角度为0°~45°、315°~360°以及135°~225°时,x轴坐标为自变量,y轴坐标为因变量;
射线的倾斜角度为45°~135°和225°~315°时,y轴坐标为自变量,x轴坐标为因变量。
图2中左边的图示二值化图片,可以看出在目标物体周围有很多白色的干扰物,通过上述实施例处理之后得到邮编的目标物图片,将干扰物全部排除过滤掉,得到清晰的目标物的图片。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对所述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。
Claims (5)
1.一种测量图片中目标物的边界的方法,其特征在于,包括以下步骤:
S1、将原始灰度图输入训练好的FasterRCNN网络中,获得含有目标物的目标图片和目标图片的坐标[x,y,w,h],其中:x为所述目标图片的中心点的横坐标,y为所述目标图片的中心点的纵坐标,w为所述目标图片的宽度,h为所述目标图片的高度;根据所述坐标[x,y,w,h]将目标图片从原始灰度图中切割出来;
S2、通过3*3*1的卷积核对所述目标图片进行卷积,步数为1,补零后得到m*n*1的特征图;
S3、通过以下公式增强所述特征图中每个像素点的像素值xij,得到增强特征图:
其中,xij表示所述特征图中第i行第j列的像素值,r为增强次数,x′ij表示增强特征图中第i行第j列的像素值,Xmax为所述特征图中最大的像素值;
S4、对所述增强特征图进行二值化,得到二值化图片:
设定阈值将增强特征图中每个像素点的像素值x′ij与阈值thresh进行比较,将大于或等于阈值thresh的像素点的像素值设置为255,将小于阈值thresh的像素点的像素值设置为0;
S5、以所述二值化图片的中心点为端点并且360°辐射的发射若干条射线,所述射线延长的过程中持续检测所述射线经过的像素点的像素值,记录每条射线首次遇到像素值为0的边界像素点的坐标;
S6、对所有边界像素点的坐标进行后处理,得到目标物的边界并填充边界内的区域,得到目标物图片。
2.如权利要求1所述的一种测量图片中目标物的边界的方法,其特征在于:在步骤S6中,丢弃所有边界外的像素点,依次连接所有的边界像素点,得到目标物的边界并填充边界内的区域,得到目标物图片。
3.如权利要求1所述的一种测量图片中目标物的边界的方法,其特征在于:在步骤S6中,丢弃所有边界外的像素点,椭圆拟合所有的边界像素点,得到椭圆形的中心、长短轴和偏转角,绘制椭圆形的目标物的边界并填充边界内的区域,得到目标物图片。
4.如权利要求1所述的一种测量图片中目标物的边界的方法,其特征在于:在步骤S6中,分别计算每个边界像素点与中心点之间的欧氏距离,计算所有欧氏距离的平均值,将长度大于平均值的射线截短成平均值并记录截断点的坐标值,长度小于平均值的保留边界像素点,依次连接截断点和边界像素点,得到目标物的边界并填充边界内的区域,得到目标物图片。
5.如权利要求1~4任一项所述的一种测量图片中目标物的边界的方法,其特征在于,所述射线生成的方法为:
射线的倾斜角度为0°~45°、315°~360°以及135°~225°时,x轴坐标为自变量,y轴坐标为因变量;
射线的倾斜角度为45°~135°和225°~315°时,y轴坐标为自变量,x轴坐标为因变量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811591440.3A CN109670518B (zh) | 2018-12-25 | 2018-12-25 | 一种测量图片中目标物的边界的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811591440.3A CN109670518B (zh) | 2018-12-25 | 2018-12-25 | 一种测量图片中目标物的边界的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109670518A true CN109670518A (zh) | 2019-04-23 |
CN109670518B CN109670518B (zh) | 2022-09-23 |
Family
ID=66146113
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811591440.3A Active CN109670518B (zh) | 2018-12-25 | 2018-12-25 | 一种测量图片中目标物的边界的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109670518B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112672173A (zh) * | 2020-12-09 | 2021-04-16 | 上海东方传媒技术有限公司 | 一种电视直播信号中特定内容的遮挡方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5647027A (en) * | 1994-10-28 | 1997-07-08 | Lucent Technologies Inc. | Method of image enhancement using convolution kernels |
CN101520890A (zh) * | 2008-12-31 | 2009-09-02 | 广东威创视讯科技股份有限公司 | 一种基于灰度特征图像的粘连染色体自动分割方法 |
CN106875381A (zh) * | 2017-01-17 | 2017-06-20 | 同济大学 | 一种基于深度学习的手机外壳缺陷检测方法 |
CN107330465A (zh) * | 2017-06-30 | 2017-11-07 | 清华大学深圳研究生院 | 一种图像目标识别方法及装置 |
CN107657639A (zh) * | 2017-08-09 | 2018-02-02 | 武汉高德智感科技有限公司 | 一种快速定位目标的方法和装置 |
-
2018
- 2018-12-25 CN CN201811591440.3A patent/CN109670518B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5647027A (en) * | 1994-10-28 | 1997-07-08 | Lucent Technologies Inc. | Method of image enhancement using convolution kernels |
CN101520890A (zh) * | 2008-12-31 | 2009-09-02 | 广东威创视讯科技股份有限公司 | 一种基于灰度特征图像的粘连染色体自动分割方法 |
CN106875381A (zh) * | 2017-01-17 | 2017-06-20 | 同济大学 | 一种基于深度学习的手机外壳缺陷检测方法 |
CN107330465A (zh) * | 2017-06-30 | 2017-11-07 | 清华大学深圳研究生院 | 一种图像目标识别方法及装置 |
CN107657639A (zh) * | 2017-08-09 | 2018-02-02 | 武汉高德智感科技有限公司 | 一种快速定位目标的方法和装置 |
Non-Patent Citations (1)
Title |
---|
范彦斌等: "发动机叶片ICT数字切片图像特征边界的提取", 《西北大学学报(自然科学版)》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112672173A (zh) * | 2020-12-09 | 2021-04-16 | 上海东方传媒技术有限公司 | 一种电视直播信号中特定内容的遮挡方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109670518B (zh) | 2022-09-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111557665B (zh) | 用于医学成像中的患者定位的根据相机数据的密集身体标记估计 | |
CN109886179A (zh) | 基于Mask-RCNN的子宫颈细胞涂片的图像分割方法和系统 | |
CN106846344A (zh) | 一种基于边缘完备度的图像分割最优识别方法 | |
US20110028843A1 (en) | Providing a 2-dimensional ct image corresponding to a 2-dimensional ultrasound image | |
KR101913976B1 (ko) | 검출영역을 선택하는 방법 및 장치 및 탄성 검출 시스템 | |
CN103300856B (zh) | Mri图像的颈椎椎体轴线及相关组织的定位方法与装置 | |
CN106940876A (zh) | 一种基于surf的快速无人机航拍图像拼接算法 | |
CN104463138B (zh) | 基于视觉结构属性的文本定位方法及系统 | |
CN106951905A (zh) | 一种基于tof相机的树上苹果识别与定位方法 | |
CN107451982A (zh) | 一种基于无人机影像的高郁闭度林分树冠面积获取方法 | |
CN102968783B (zh) | 从腹部图像数据中自动分割骨骼的方法及系统 | |
CN108491786A (zh) | 一种基于分级网络和聚类合并的人脸检测方法 | |
JP6853419B2 (ja) | 情報処理装置、情報処理方法、コンピュータプログラム | |
CN106846484A (zh) | 一种基于双视图三维重建的食物体积估计方法 | |
CN101976436A (zh) | 一种基于差分图修正的像素级多聚焦图像融合方法 | |
CN110310323A (zh) | 基于Hessian矩阵和二维高斯拟合的视网膜血管管径测量方法 | |
CN112365498B (zh) | 一种针对二维图像序列中多尺度多形态目标的自动检测方法 | |
CN107886507A (zh) | 一种基于图像背景和空间位置的显著区域检测方法 | |
CN109190458A (zh) | 一种基于深度学习的小人头检测方法 | |
CN103345746A (zh) | 基于ct-pet的医学影像诊断方法 | |
CN109670518A (zh) | 一种测量图片中目标物的边界的方法 | |
CN109410282A (zh) | 一种输液杆的检测跟踪方法和装置 | |
CN109410233A (zh) | 一种边缘特征约束的高分辨率图像道路精准提取方法 | |
JP2008503294A6 (ja) | 識別方法、コンピュータプログラム及びコンピュータプログラム装置 | |
JP2008503294A (ja) | 識別方法、コンピュータプログラム及びコンピュータプログラム装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |