CN112766181B - 一种提高线图识别准确率的方法 - Google Patents

一种提高线图识别准确率的方法 Download PDF

Info

Publication number
CN112766181B
CN112766181B CN202110088787.1A CN202110088787A CN112766181B CN 112766181 B CN112766181 B CN 112766181B CN 202110088787 A CN202110088787 A CN 202110088787A CN 112766181 B CN112766181 B CN 112766181B
Authority
CN
China
Prior art keywords
candidate frame
real
frame
slope
broken line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110088787.1A
Other languages
English (en)
Other versions
CN112766181A (zh
Inventor
周尔强
顾昕
曹黛
罗纪杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202110088787.1A priority Critical patent/CN112766181B/zh
Publication of CN112766181A publication Critical patent/CN112766181A/zh
Application granted granted Critical
Publication of CN112766181B publication Critical patent/CN112766181B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及线图识别技术领域,具体地说,涉及一种提高线图识别准确率的方法,其包括以下步骤:一、判断候选框的位置信息,确定与该候选框的交并比最大的两个真实框;二、分别计算候选框和两个真实框顶点连线的斜率;三、根据斜率判断候选框中是否存在目标。本发明以计算与真实框斜率比值的方式来判别正负样本,提升这类真实框正被选为正样本的概率,提高召回率。

Description

一种提高线图识别准确率的方法
技术领域
本发明涉及线图识别技术领域,具体地说,涉及一种提高线图识别准确率的方法。
背景技术
图表理解,是计算机通过对数据集中的图片和给定的标注进行一定的处理,研究图像中各目标的性质及其相互关系,并得出对图像内容含义的理解以及对原来客观场景的解释,进而完成下游任务的过程。其中视觉问答任务是图表理解的一种应用,向视觉问答系统提供一张图像并给出关于这张图像的自然语言问题,任务是提供一个准确的自然语言答案。
在进行图表理解任务时,需要对图像本身进行一定的处理来为后续阶段的任务提供足够的信息,普遍的方法同时也是本发明涉及的方法即对图片进行目标检测,检测出图片中有效目标对象,例如线图。
数学图表包括常见的图形类型,它们同时对连续和分类信息进行建模,例如直线、点线、垂直和水平条形图、饼图。问题类型可能包括大小、最大值、最小值、中位数、曲线下面积、平滑度和交点等。
对图片的处理,需要先对图片进行标注,目前主流的标注格式是将存在的目标的通过矩形框出来,取中心锚点坐标(x,y)确定矩形框的位置信息,取矩形框的宽度w和高度h确定矩形框的大小,即标注中的(x,y,w,h)。
接着对图片进行目标检测。首先判断候选框中是否存在有效的目标,以及判断具体属于哪一类的目标。对候选框的判断,即对大量的候选框进行筛选,候选框与真实框重叠的部分是否达到设定的阈值,如果达到阈值即判定候选框内存在有效的目标对象。再对目标检测结果进行分类,具有相同标签的检测框代表属于同一对象,此时我们得到不同对象的一系列目标检测框,采用框的中心点线图的关键点,这步操作将目标检测框映射到线图的关键点。
在目标检测过程中,需要从大量候选锚点中选出指定少量的锚点进行二分类,为二分类概率预测提供真实值。对于设定好的每一个真实边框,选择与它重叠度最高的锚点作为正样本;对于剩下的锚点,从中选择和任意一个真实边框重叠度超过阈值(0.7)的锚点,作为正样本;随机选择和真实框重叠度小于(1-阈值=0.3)的锚点作为负样本。正负样本分别为前景或背景,实现二分类。
在处理视觉问答的折线图时,目前普遍使用的方法是计算候选框与真实框的交并比,若计算值超过设定的阈值,则看作真实框。即利用区域生成网络的思想,输入图片有大量候选框,根据候选框与真实框重叠度大小,若大于某一值,则认定该框中存在目标,即存在线的一部分,进入下一步通过目标检测得出线图的类别,即颜色;反之则认为不存在线。
现在使用的方法中,如果有一个存在目标的候选框,位于两个真实框之间,但与两个真实框的重叠度都达不到阈值,则不会被判为是正样本,被认定为不存在目标。如图2所示,两个旁边的框为设定的真实框,中间的框肉眼识别会被认为正样本,但使用计算重叠度的方式则不会被认为是正样本的候选框。
针对这种类似情况,提出新的判别方式,提升这类正样本被选中的概率,提高召回率。
发明内容
本发明的内容是提供一种提高线图识别准确率的方法,其能够克服现有技术的某种或某些缺陷。
根据本发明的一种提高线图识别准确率的方法,其包括以下步骤:
一、判断候选框的位置信息,确定与该候选框的交并比最大的两个真实框;
二、分别计算候选框和两个真实框顶点连线的斜率;
三、根据斜率判断候选框中是否存在目标。
作为优选,步骤一中,两个真实框与候选框预测概率最高的标签信息均相同,即真实框中包含的目标类别与候选框包含的目标类别相同。
作为优选,步骤二中,斜率的计算方法如下:
设真实框坐标分别为(x1,y1,w1,h1)和(x2,y2,w2,h2),候选框坐标为(x0,y0,w0,h0);
(1)、计算折线的斜率判断折线为上升或下降,
Figure GDA0003780844700000031
若k>0,则折线为上升趋势,反之为下降趋势;
(2)、若折线为下降趋势,则分别利用三个框的坐标,求出三个框的左上坐标作为第(4)步计算变量;
Figure GDA0003780844700000032
其中,
Figure GDA0003780844700000033
(3)、若折线为上升趋势,则使用左下顶点作为第(4)步计算变量;
Figure GDA0003780844700000034
其中,
Figure GDA0003780844700000035
(4)、分别计算候选框与两个真实框之间顶点连线的斜率;
Figure GDA0003780844700000036
作为优选,步骤三中,是否存在目标的判断方法为:
Figure GDA0003780844700000037
其中ε为设定的阈值,则认为该候选框中存在目标,即存在折线;反之,则不存在。
本发明以计算与真实框斜率比值的方式来判别正负样本,提升这类真实框正被选为正样本的概率,提高召回率。
附图说明
图1为实施例1中一种提高线图识别准确率的方法的流程图;
图2为背景技术中真实框和候选框的示意图;
图3为实施例1中下降趋势的折线示意图;
图4为实施例1中上升趋势的折线示意图;
图5为实施例1中不存在折线的示意图。
具体实施方式
为进一步了解本发明的内容,结合附图和实施例对本发明作详细描述。应当理解的是,实施例仅仅是对本发明进行解释而并非限定。
实施例1
一种提高线图识别准确率的方法,其包括以下步骤:
一、判断候选框的位置信息,确定与该候选框的交并比最大的两个真实框;两个真实框与候选框预测概率最高的标签信息均相同,即真实框中包含的目标类别与候选框最可能包含的目标类别相同;
二、分别计算候选框和两个真实框顶点连线的斜率;计算方法如下:
每个框的位置由(x,y,w,h)来确定,其中(x,y)为其锚点即中心点坐标。由锚点坐标可得到分别得到框的四个顶点的坐标,同时,折线可分为上升(折线斜率大于0)和下降(折线斜率小于0)两种,计算候选框和真实框顶点连线斜率分为两个阶段:
设真实框坐标分别为(x1,y1,w1,h1)和(x2,y2,w2,h2),候选框坐标为(x0,y0,w0,h0);
(1)、计算折线的斜率判断折线为上升或下降,
Figure GDA0003780844700000041
若k>0,则折线为上升趋势,反之为下降趋势;
(2)、若折线为下降趋势,如图3所示,则分别利用三个框的坐标,求出三个框的左上坐标作为第(4)步计算变量;
Figure GDA0003780844700000051
其中,
Figure GDA0003780844700000052
(3)、若折线为上升趋势,如图4所示,则使用左下顶点作为第(4)步计算变量;
Figure GDA0003780844700000053
其中,
Figure GDA0003780844700000054
(4)、分别计算候选框与两个真实框之间顶点连线的斜率;
Figure GDA0003780844700000055
三、根据斜率判断候选框中是否存在目标;
Figure GDA0003780844700000056
其中ε为设定的阈值,则认为该候选框中存在目标,即存在折线;反之,如图5所示,则不存在。
本实施例以计算与真实框斜率比值的方式来判别正负样本,提升这类真实框正被选为正样本的概率,提高召回率。
以上示意性的对本发明及其实施方式进行了描述,该描述没有限制性,附图中所示的也只是本发明的实施方式之一,实际的结构并不局限于此。所以,如果本领域的普通技术人员受其启示,在不脱离本发明创造宗旨的情况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本发明的保护范围。

Claims (2)

1.一种提高线图识别准确率的方法,其特征在于:包括以下步骤:
一、判断候选框的位置信息,确定与该候选框的交并比最大的两个真实框;
二、分别计算候选框和两个真实框顶点连线的斜率;
三、根据斜率判断候选框中是否存在目标;
步骤二中,斜率的计算方法如下:
设真实框坐标分别为(x1,y1,w1,h1)和(x2,y2,w2,h2),候选框坐标为(x0,y0,w0,h0);
(1)、计算折线的斜率判断折线为上升或下降,
Figure FDA0003780844690000011
若k>0,则折线为上升趋势,反之为下降趋势;
(2)、若折线为下降趋势,则分别利用三个框的坐标,求出三个框的左上坐标作为第(4)步计算变量;
Figure FDA0003780844690000012
其中,
Figure FDA0003780844690000013
(3)、若折线为上升趋势,则使用左下顶点作为第(4)步计算变量;
Figure FDA0003780844690000014
其中,
Figure FDA0003780844690000015
(4)、分别计算候选框与两个真实框之间顶点连线的斜率;
Figure FDA0003780844690000016
步骤三中,是否存在目标的判断方法为:
Figure FDA0003780844690000017
其中ε为设定的阈值,则认为该候选框中存在目标,即存在折线;反之,则不存在。
2.根据权利要求1所述的一种提高线图识别准确率的方法,其特征在于:步骤一中,两个真实框与候选框预测概率最高的标签信息均相同,即真实框中包含的目标类别与候选框包含的目标类别相同。
CN202110088787.1A 2021-01-22 2021-01-22 一种提高线图识别准确率的方法 Active CN112766181B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110088787.1A CN112766181B (zh) 2021-01-22 2021-01-22 一种提高线图识别准确率的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110088787.1A CN112766181B (zh) 2021-01-22 2021-01-22 一种提高线图识别准确率的方法

Publications (2)

Publication Number Publication Date
CN112766181A CN112766181A (zh) 2021-05-07
CN112766181B true CN112766181B (zh) 2022-09-23

Family

ID=75705766

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110088787.1A Active CN112766181B (zh) 2021-01-22 2021-01-22 一种提高线图识别准确率的方法

Country Status (1)

Country Link
CN (1) CN112766181B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109558902A (zh) * 2018-11-20 2019-04-02 成都通甲优博科技有限责任公司 一种快速目标检测方法
CN109671060A (zh) * 2018-12-06 2019-04-23 西安电子科技大学 基于选择性搜索和cnn的计算机辅助乳腺肿块检测方法
CN111368878A (zh) * 2020-02-14 2020-07-03 北京电子工程总体研究所 一种基于ssd目标检测的优化方法、计算机设备和介质
CN112131983A (zh) * 2020-09-11 2020-12-25 桂林理工大学 一种基于改进YOLOv3网络的安全帽佩戴检测方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040044724A1 (en) * 2002-08-27 2004-03-04 Bell Cynthia S. Apparatus and methods to exchange menu information among processor-based devices
AU2019101142A4 (en) * 2019-09-30 2019-10-31 Dong, Qirui MR A pedestrian detection method with lightweight backbone based on yolov3 network
CN111723660A (zh) * 2020-05-18 2020-09-29 天津大学 一种用于长形地面目标检测网络的检测方法
CN112101430B (zh) * 2020-08-28 2022-05-03 电子科技大学 用于图像目标检测处理的锚框生成方法及轻量级目标检测方法
CN112070759B (zh) * 2020-09-16 2023-10-24 浙江光珀智能科技有限公司 一种叉车托盘检测与定位方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109558902A (zh) * 2018-11-20 2019-04-02 成都通甲优博科技有限责任公司 一种快速目标检测方法
CN109671060A (zh) * 2018-12-06 2019-04-23 西安电子科技大学 基于选择性搜索和cnn的计算机辅助乳腺肿块检测方法
CN111368878A (zh) * 2020-02-14 2020-07-03 北京电子工程总体研究所 一种基于ssd目标检测的优化方法、计算机设备和介质
CN112131983A (zh) * 2020-09-11 2020-12-25 桂林理工大学 一种基于改进YOLOv3网络的安全帽佩戴检测方法

Also Published As

Publication number Publication date
CN112766181A (zh) 2021-05-07

Similar Documents

Publication Publication Date Title
CN108830285B (zh) 一种基于Faster-RCNN的加强学习的目标检测方法
WO2019114036A1 (zh) 人脸检测方法及装置、计算机装置和计算机可读存储介质
CN108596055B (zh) 一种复杂背景下高分辨遥感图像的机场目标检测方法
EP2087456B1 (en) Face-based image clustering
CN104408449B (zh) 智能移动终端场景文字处理方法
CN109255350B (zh) 一种基于视频监控的新能源车牌检测方法
CN106446896A (zh) 一种字符分割方法、装置及电子设备
CN104077577A (zh) 一种基于卷积神经网络的商标检测方法
CN111242899B (zh) 基于图像的瑕疵检测方法及计算机可读存储介质
CN110598698B (zh) 基于自适应区域建议网络的自然场景文本检测方法和系统
CN112307919B (zh) 一种基于改进YOLOv3的单证图像中数字信息区域识别方法
Zheng et al. Improvement of grayscale image 2D maximum entropy threshold segmentation method
CN115272652A (zh) 基于多元回归和自适应焦点损失的密集物体图像检测方法
CN110929746A (zh) 一种基于深度神经网络的电子卷宗标题定位提取与分类方法
CN113221956A (zh) 基于改进的多尺度深度模型的目标识别方法及装置
CN111611933A (zh) 文档图像的信息提取方法及系统
CN111612747A (zh) 产品表面裂缝快速检测方法及检测系统
CN110414505A (zh) 图像的处理方法、处理系统及计算机可读存储介质
CN114283431B (zh) 一种基于可微分二值化的文本检测方法
CN116385374A (zh) 基于卷积神经网络的细胞计数方法
CN113838099A (zh) 一种基于孪生神经网络的单目标跟踪方法
CN114359917A (zh) 一种手写汉字检测识别及字形评估方法
CN111832497B (zh) 一种基于几何特征的文本检测后处理方法
CN110728214B (zh) 一种基于尺度匹配的弱小人物目标检测方法
CN111274891B (zh) 一种面向简谱图像的音高及对应歌词提取方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant