CN110543624B - 一种pdf文档中复选框的识别方法、装置及电子设备 - Google Patents

一种pdf文档中复选框的识别方法、装置及电子设备 Download PDF

Info

Publication number
CN110543624B
CN110543624B CN201810525228.0A CN201810525228A CN110543624B CN 110543624 B CN110543624 B CN 110543624B CN 201810525228 A CN201810525228 A CN 201810525228A CN 110543624 B CN110543624 B CN 110543624B
Authority
CN
China
Prior art keywords
point
candidate boundary
boundary point
current center
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810525228.0A
Other languages
English (en)
Other versions
CN110543624A (zh
Inventor
邓斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Guangzhou Kingsoft Mobile Technology Co Ltd
Original Assignee
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Guangzhou Kingsoft Mobile Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Office Software Inc, Zhuhai Kingsoft Office Software Co Ltd, Guangzhou Kingsoft Mobile Technology Co Ltd filed Critical Beijing Kingsoft Office Software Inc
Priority to CN201810525228.0A priority Critical patent/CN110543624B/zh
Publication of CN110543624A publication Critical patent/CN110543624A/zh
Application granted granted Critical
Publication of CN110543624B publication Critical patent/CN110543624B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例提供了一种PDF文档中复选框的识别方法、装置及电子设备,涉及图像识别技术领域,所述方法包括:获取用户在显示的PDF文档中点击的位置;所述点击的位置为用户目测的复选框中的空白位置;以所述点击的位置为起点,在预设范围内,向四个方向搜索候选边界点,所述四个方向为上、下、左和右方向;如果在所述预设范围内搜索到候选边界点,则记录各个候选边界点的显示坐标;判断所述各个候选边界点的坐标围成的图形是否为正方形,如果是正方形则候选边界点的坐标围成的图形为复选框。采用本发明可以识别出PDF文档中图片形式的复选框。

Description

一种PDF文档中复选框的识别方法、装置及电子设备
技术领域
本发明涉及图像识别技术领域,特别是涉及一种PDF文档中复选框的识别方法、装置及电子设备。
背景技术
可移植文档格式(Portable Document Format,PDF)是一种独特的跨平台文件格式。它可把文档的文本、格式、字体、颜色、分辨率、链接及图形图像、声音、动态影像等所有的信息封装在一个特殊的整合文件中。PDF文档最终能显示在屏幕上,都是把文件内容渲染成图像,再输出到屏幕上。PDF文档中常有许多表格和图片,这些表格和图片往往带有复选框,用户需要利用复选框对相应内容进行选择。
然而,发明人在实现本发明的过程中发现,现有技术中PDF文档中对复选框的识别仅限于当复选框是一种注释对象时的识别,而当PDF文档中的复选框是以图片的形式存在时,则无法识别。
可见,现有技术的PDF文档中图片形式的复选框无法被识别。用户无法对PDF文档中图片形式的复选框进行操作,使用不够方便。
发明内容
本发明实施例的目的在于提供一种PDF文档中复选框的识别方法、装置及电子设备,以能够识别出PDF文档中图片形式的复选框。具体技术方案如下:
第一方面,提供了一种PDF文档中复选框的识别方法,所述方法包括:
获取用户在显示的PDF文档中点击的位置;所述点击的位置为用户目测的复选框中的空白位置;
以所述点击的位置为起点,在预设范围内,向四个方向搜索候选边界点,所述四个方向为上、下、左和右方向;
如果在所述预设范围内搜索到候选边界点,则记录各个候选边界点的显示坐标;
判断所述各个候选边界点的坐标围成的图形是否为正方形,如果是正方形则候选边界点的坐标围成的图形为复选框。
可选的,所述以所述点击的位置为起点,在预设范围内,向四个方向搜索候选边界点的步骤,包括:
采用深度优先遍历算法,以所述点击的位置为起点,在预设范围内,向四个方向搜索被作为候选边界点的黑色像素点。
可选的,所述采用深度优先遍历算法,以所述点击的位置为起点,在预设范围内,向四个方向搜索被作为候选边界点的黑色像素点的步骤,包括:
将所述位于所述点击的位置的像素点确定为当前中心点;
将与当前中心点相邻的四个像素点作为待确定像素点;
分别判断各个待确定像素点是否为黑色像素点;
若各个待确定像素点中有黑色像素点,则将该黑色像素点确定为候选边界点;
将各个待确定像素点中的非黑色像素点,逐一确定为当前中心点;
判断当前中心点是否在预设范围内;
如果当前中心点是在所述预设范围内,则返回所述将与当前中心点相邻的四个像素点作为待确定像素点的步骤;
如果当前中心点不在所述预设范围内,则将下一个待确定像素点中的非黑色像素点确定为当前中心点;
返回所述判断当前中心点是否在预设范围内的步骤。
可选的,所述判断所述各个候选边界点的坐标围成的图形是否为正方形的步骤,包括:
获得记录的各个候选边界点的显示坐标;
选择出横坐标最小的第一候选边界点和横坐标最大的第二候选边界点;
计算第二候选边界点与第一候选边界点的横坐标的第一差值;
选择出纵坐标最小的第三候选边界点和纵坐标最大的第四候选边界点;
计算第四候选边界点与第三候选边界点的纵坐标的第二差值;
判断第一差值和第二差值的差是否均小于预设阈值,若均小于预设阈值,则所述边界点围城的图形为正方形。
第二方面,提供了一种PDF文档中复选框的识别装置,所述装置包括:
获取模块,用于获取用户在显示的PDF文档中点击的位置;所述点击的位置为用户目测的复选框中的空白位置;
搜索模块,用于以所述点击的位置为起点,在预设范围内,向四个方向搜索候选边界点,所述四个方向为上、下、左和右方向;
记录模块,用于如果在所述预设范围内搜索到候选边界点,则记录各个候选边界点的显示坐标;
判断模块,用于判断所述各个候选边界点的坐标围成的图形是否为正方形,如果是正方形则候选边界点的坐标围成的图形为复选框。
可选的,所述搜索模块,具体用于:
采用深度优先遍历算法,以所述点击的位置为起点,在预设范围内,向四个方向搜索被作为候选边界点的黑色像素点。
可选的,所述搜索模块,包括:第一当前中心点确定单元、待确定像素点确定单元、待确定像素点判断单元、候选边界点确定单元、第二当前中心点确定单元、范围判断单元、第一返回单元、第三当前中心点确定单元和第二返回单元;
第一当前中心点确定单元,用于将所述位于所述点击的位置的像素点确定为当前中心点;
待确定像素点确定单元,用于将与当前中心点相邻的四个像素点作为待确定像素点;
待确定像素点判断单元,用于分别判断各个待确定像素点是否为黑色像素点;
候选边界点确定单元,用于若各个待确定像素点中有黑色像素点,则将该黑色像素点确定为候选边界点;
第二当前中心点确定单元,用于将各个待确定像素点中的非黑色像素点,逐一确定为当前中心点;
范围判断单元,判断当前中心点是否在预设范围内;
第一返回单元,用于如果当前中心点是在所述预设范围内,则返回所述将与当前中心点相邻的四个像素点作为待确定像素点的步骤;
第三当前中心点确定单元,用于如果当前中心点不在所述预设范围内,则将下一个待确定像素点中的非黑色像素点确定为当前中心点;
第二返回单元,用于返回所述判断当前中心点是否在预设范围内的步骤。
可选的,所述判断模块,包括:显示坐标获得单元、第一边界点选择单元、第一差值计算单元、第二边界点选择单元、第二差值计算单元和差值判断单元;
显示坐标获得单元,用于获得记录的各个候选边界点的显示坐标;
第一边界点选择单元,用于选择出横坐标最小的第一候选边界点和横坐标最大的第二候选边界点;
第一差值计算单元,用于计算第二候选边界点与第一候选边界点的横坐标的第一差值;
第二边界点选择单元,用于选择出纵坐标最小的第三候选边界点和纵坐标最大的第四候选边界点;
第二差值计算单元,用于计算第四候选边界点与第三候选边界点的纵坐标的第二差值;
差值判断单元,用于判断第一差值和第二差值的差是否均小于预设阈值,若均小于预设阈值,则所述边界点围城的图形为正方形。
第三方面,提供了一种电子设备,所述电子设备包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-4任一所述的方法步骤。
在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的PDF文档中复选框的识别方法。
在本发明实施的又一方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的PDF文档中复选框的识别方法。
本发明实施例提供的一种PDF文档中复选框的识别方法、装置及电子设备,可以识别出PDF文件中图片形式的复选框。可见,应用本发明实施例可以根据搜索到的黑色像素点判断其围成的图形是否为复选框,因此既能够识别出注释对象形式的复选框,又能够识别出图片形式的复选框。
当然,实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例的一种PDF文档中复选框的识别方法流程图;
图2为图1所示实施例中步骤102的一种具体流程图;
图3为图1所述实施例中步骤104的一种具体流程图;
图4为本发明实施例的一种PDF文档中复选框的识别装置结构示意图;
图5为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种PDF文档中复选框的识别方法,该方法可以由电子设备实现。
本发明实施例中,电子设备可以是电脑、手机、平板电脑等可以处理PDF格式文件的任何电子设备。
如图1所示,该方法可以包括以下步骤:
步骤101,获取用户在显示的PDF文档中点击的位置,所述点击的位置为用户目测的复选框中的空白位置。
一种实现方式中,用户在目测的复选框中的任意空白位置点击,由终端获取用户点击的位置。
步骤102,以所述点击的位置为起点,在预设范围内,向四个方向搜索候选边界点,所述四个方向为上、下、左和右方向。
一种实现方式中,可以将预设范围可以确定为100*100pixel。
一种实现方式中,已完成搜索到的黑色像素点不再向四个方向进行搜索。
步骤103,如果在所述预设范围内搜索到候选边界点,则记录各个候选边界点的显示坐标。
一种实现方式中,每搜索到一个候选边界点就记录该点的显示坐标,每个像素点在显示文档中都有显示坐标记录在电子设备内存中,由电子设备获取并记录各个候选边界点的显示坐标。
步骤104,判断所述各个候选边界点的坐标围成的图形是否为正方形,如果是正方形则候选边界点的坐标围成的图形为复选框。
本发明实施例提供的一种PDF文档中复选框的识别方法,可以识别出PDF文件中图片形式的复选框。可见,应用本发明实施例可以根据搜索到的黑色像素点判断其围成的图形是否为复选框,因此既能够识别出注释对象形式的复选框,又能够识别出图片形式的复选框。
具体的,图1所示实施例中的步骤102,可以采用深度优先遍历算法,以所述点击的位置为起点,在预设范围内,向四个方向搜索被作为候选边界点的黑色像素点。
参见图2,图1所示实施例中的步骤102,具体可以包括如下步骤:
步骤201,将所述位于所述点击的位置的像素点确定为当前中心点。
步骤202,将与当前中心点相邻的四个像素点作为待确定像素点。
一种实现方式中,将中心点相邻的上下左右四个像素点作为待确定像素点。
步骤203,分别判断各个待确定像素点是否为黑色像素点。
步骤204,若各个待确定像素点中有黑色像素点,则将该黑色像素点确定为候选边界点;
一种实现方式中,黑色像素点不再进行搜索操作,即不再判断黑色像素点的上下左右四个点是否为黑色像素点。
步骤205,将各个待确定像素点中的非黑色像素点,逐一确定为当前中心点。
一种实现方式中,若待确定的像素点为非黑色像素点,则需要进行逐一判断其是否在预设范围内,且相邻的上下左右四个像素点是否为黑色像素点。
步骤206,判断当前中心点是否在预设范围内。
一种实现方式中,预设范围可根据实际情况设置,一般范围可设置为100*100pixel。
步骤207,如果当前中心点是在所述预设范围内,则返回所述将与当前中心点相邻的四个像素点作为待确定像素点的步骤。
步骤208,如果当前中心点不在所述预设范围内,则将下一个待确定像素点中的非黑色像素点确定为当前中心点。
步骤209,返回所述判断当前中心点是否在预设范围内的步骤。
一种实现方式中,为避免程序进入死循环,已完成搜索的像素点,不再进行搜索操作,即已经判断过上下左右四个像素点是否为黑色像素点的中心点,不再判断此中心点的上下左右四个像素点是否为黑色像素点。
本实施例中,采用了深度优先遍历算法,以所述点击的位置为起点,在预设范围内,向四个方向搜索被作为候选边界点的黑色像素点。因此,本实施例能够快速地搜索到候选边界点,从而加快了识别复选框的速度。
参见图3,图1所示实施例中的步骤104,具体可以包括如下步骤:
步骤301,获得记录的各个候选边界点的显示坐标。
步骤302,选择出横坐标最小的第一候选边界点和横坐标最大的第二候选边界点。
一种实现方式中,横坐标为水平方向的坐标。
步骤303,计算第二候选边界点与第一候选边界点的横坐标的第一差值。
一种实现方式中,第一差值为第二候选边界点与第一候选边界点的差的绝对值。
步骤304,选择出纵坐标最小的第三候选边界点和纵坐标最大的第四候选边界点。
一种实现方式中,纵坐标为竖直方向的坐标,与横坐标相互垂直。
步骤305,计算第四候选边界点与第三候选边界点的纵坐标的第二差值。
一种实现方式中,第二差值为第四候选边界点与第三候选边界点的差的绝对值。
步骤306,判断第一差值和第二差值的差是否均小于预设阈值,若均小于预设阈值,则所述边界点围城的图形为正方形。
一种实现方式中,第一差值和第二差值的差取绝对值再与预设阈值进行判断。
例如,可以将预设阈值设置为5pixel;
第一候选坐标点为(100,100),第二候选坐标点为(130,110),第三候选边界点为(110,103),第四候选边界点为(130,130);
第一差值为:130-100=30pixel;
第二差值为:130-103=27pixel;
30-27=3pixel,3pixel<5pixel,所以边界点围成的图形为正方形。
本实施例中,通过计算横坐标的差值和纵坐标的差值来判断是否为正方形。因此,本实施例能够快速地确定是否为复选框,从而进一步加快了识别复选框的速度。
由于相同的技术构思,相应于图1所示方法实施例,本发明实施例还提供了一种PDF文档中复选框的识别装置,如图4所示,该装置包括:
获取模块401,用于获取用户在显示的PDF文档中点击的位置;所述点击的位置为用户目测的复选框中的空白位置;
搜索模块402,用于以所述点击的位置为起点,在预设范围内,向四个方向搜索候选边界点,所述四个方向为上、下、左和右方向;
记录模块403,用于如果在所述预设范围内搜索到候选边界点,则记录各个候选边界点的显示坐标;
判断模块404,用于判断所述各个候选边界点的坐标围成的图形是否为正方形,如果是正方形则候选边界点的坐标围成的图形为复选框。
具体的,所述搜索模块,具体用于:
采用深度优先遍历算法,以所述点击的位置为起点,在预设范围内,向四个方向搜索被作为候选边界点的黑色像素点。
具体的,所述搜索模块,包括:第一当前中心点确定单元、待确定像素点确定单元、待确定像素点判断单元、候选边界点确定单元、第二当前中心点确定单元、范围判断单元、第一返回单元、第三当前中心点确定单元和第二返回单元;
第一当前中心点确定单元,用于将所述位于所述点击的位置的像素点确定为当前中心点;
待确定像素点确定单元,用于将与当前中心点相邻的四个像素点作为待确定像素点;
待确定像素点判断单元,用于分别判断各个待确定像素点是否为黑色像素点;
候选边界点确定单元,用于若各个待确定像素点中有黑色像素点,则将该黑色像素点确定为候选边界点;
第二当前中心点确定单元,用于将各个待确定像素点中的非黑色像素点,逐一确定为当前中心点;
范围判断单元,判断当前中心点是否在预设范围内;
第一返回单元,用于如果当前中心点是在所述预设范围内,则返回所述将与当前中心点相邻的四个像素点作为待确定像素点的步骤;
第三当前中心点确定单元,用于如果当前中心点不在所述预设范围内,则将下一个待确定像素点中的非黑色像素点确定为当前中心点;
第二返回单元,用于返回所述判断当前中心点是否在预设范围内的步骤。
具体的,所述判断模块,包括:显示坐标获得单元、第一边界点选择单元、第一差值计算单元、第二边界点选择单元、第二差值计算单元和差值判断单元;
显示坐标获得单元,用于获得记录的各个候选边界点的显示坐标;
第一边界点选择单元,用于选择出横坐标最小的第一候选边界点和横坐标最大的第二候选边界点;
第一差值计算单元,用于计算第二候选边界点与第一候选边界点的横坐标的第一差值;
第二边界点选择单元,用于选择出纵坐标最小的第三候选边界点和纵坐标最大的第四候选边界点;
第二差值计算单元,用于计算第四候选边界点与第三候选边界点的纵坐标的第二差值;
差值判断单元,用于判断第一差值和第二差值的差是否均小于预设阈值,若均小于预设阈值,则所述边界点围城的图形为正方形。
可见,应用本发明实施例提供的方法,可以基于图像识别,由电子设备自动识别出PDF文档中图像形式的复选框,为后续操作奠定基础,例如当用户点击复选框后,程序在复选框中打个勾。
本发明实施例还提供了一种电子设备,如图5所示,包括处理器501、通信接口502、存储器503和通信总线504,其中,处理器501,通信接口502,存储器503通过通信总线504完成相互间的通信,
存储器503,用于存放计算机程序;
处理器501,用于执行存储器503上所存放的程序时,实现如下步骤:
获取用户在显示的PDF文档中点击的位置;所述点击的位置为用户目测的复选框中的空白位置;
以所述点击的位置为起点,在预设范围内,向四个方向搜索候选边界点,所述四个方向为上、下、左和右方向;
如果在所述预设范围内搜索到候选边界点,则记录各个候选边界点的显示坐标;
判断所述各个候选边界点的坐标围成的图形是否为正方形,如果是正方形则候选边界点的坐标围成的图形为复选框。
本发明实施例提供的一种PDF文档中复选框的识别电子设备,可以识别出PDF文件中图片形式的复选框。可见,应用本发明实施例可以根据搜索到的黑色像素点判断其围成的图形是否为复选框,因此既能够识别出注释对象形式的复选框,又能够识别出图片形式的复选框。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的PDF文档中复选框的识别方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的PDF文档中复选框的识别方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备等实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (5)

1.一种可移植文档格式PDF文档中复选框的识别方法,其特征在于,包括:
获取用户在显示的PDF文档中点击的位置;所述点击的位置为用户目测的复选框中的空白位置;
将位于所述点击的位置的像素点确定为当前中心点;
将与当前中心点相邻的四个像素点作为待确定像素点;
分别判断各个待确定像素点是否为黑色像素点;
若各个待确定像素点中有黑色像素点,则将该黑色像素点确定为候选边界点;
将各个待确定像素点中的非黑色像素点,逐一确定为当前中心点;
判断当前中心点是否在预设范围内;
如果当前中心点是在所述预设范围内,则返回所述将与当前中心点相邻的四个像素点作为待确定像素点的步骤;
如果当前中心点不在所述预设范围内,则将下一个待确定像素点中的非黑色像素点确定为当前中心点;
返回所述判断当前中心点是否在预设范围内的步骤;
如果在所述预设范围内搜索到候选边界点,则记录各个候选边界点的显示坐标;
判断所述各个候选边界点的坐标围成的图形是否为正方形,如果是正方形则候选边界点的坐标围成的图形为复选框。
2.根据权利要求1所述的方法,其特征在于,所述判断所述各个候选边界点的坐标围成的图形是否为正方形的步骤,包括:
获得记录的各个候选边界点的显示坐标;
选择出横坐标最小的第一候选边界点和横坐标最大的第二候选边界点;
计算第二候选边界点与第一候选边界点的横坐标的第一差值;
选择出纵坐标最小的第三候选边界点和纵坐标最大的第四候选边界点;
计算第四候选边界点与第三候选边界点的纵坐标的第二差值;
判断第一差值和第二差值的差是否均小于预设阈值,若均小于预设阈值,则所述边界点围成的图形为正方形。
3.一种PDF文档中复选框的识别装置,其特征在于,包括:
获取模块,用于获取用户在显示的PDF文档中点击的位置;所述点击的位置为用户目测的复选框中的空白位置;
第一当前中心点确定单元,用于将位于所述点击的位置的像素点确定为当前中心点;
待确定像素点确定单元,用于将与当前中心点相邻的四个像素点作为待确定像素点;
待确定像素点判断单元,用于分别判断各个待确定像素点是否为黑色像素点;
候选边界点确定单元,用于若各个待确定像素点中有黑色像素点,则将该黑色像素点确定为候选边界点;
第二当前中心点确定单元,用于将各个待确定像素点中的非黑色像素点,逐一确定为当前中心点;
范围判断单元,判断当前中心点是否在预设范围内;
第一返回单元,用于如果当前中心点是在所述预设范围内,则返回所述将与当前中心点相邻的四个像素点作为待确定像素点的步骤;
第三当前中心点确定单元,用于如果当前中心点不在所述预设范围内,则将下一个待确定像素点中的非黑色像素点确定为当前中心点;
第二返回单元,用于返回所述判断当前中心点是否在预设范围内的步骤;
记录模块,用于如果在所述预设范围内搜索到候选边界点,则记录各个候选边界点的显示坐标;
判断模块,用于判断所述各个候选边界点的坐标围成的图形是否为正方形,如果是正方形则候选边界点的坐标围成的图形为复选框。
4.根据权利要求3所述的装置,其特征在于,所述判断模块,包括:显示坐标获得单元、第一边界点选择单元、第一差值计算单元、第二边界点选择单元、第二差值计算单元和差值判断单元;
显示坐标获得单元,用于获得记录的各个候选边界点的显示坐标;
第一边界点选择单元,用于选择出横坐标最小的第一候选边界点和横坐标最大的第二候选边界点;
第一差值计算单元,用于计算第二候选边界点与第一候选边界点的横坐标的第一差值;
第二边界点选择单元,用于选择出纵坐标最小的第三候选边界点和纵坐标最大的第四候选边界点;
第二差值计算单元,用于计算第四候选边界点与第三候选边界点的纵坐标的第二差值;
差值判断单元,用于判断第一差值和第二差值的差是否均小于预设阈值,若均小于预设阈值,则所述边界点围成的图形为正方形。
5.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-2任一所述的方法步骤。
CN201810525228.0A 2018-05-28 2018-05-28 一种pdf文档中复选框的识别方法、装置及电子设备 Active CN110543624B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810525228.0A CN110543624B (zh) 2018-05-28 2018-05-28 一种pdf文档中复选框的识别方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810525228.0A CN110543624B (zh) 2018-05-28 2018-05-28 一种pdf文档中复选框的识别方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN110543624A CN110543624A (zh) 2019-12-06
CN110543624B true CN110543624B (zh) 2023-06-23

Family

ID=68701218

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810525228.0A Active CN110543624B (zh) 2018-05-28 2018-05-28 一种pdf文档中复选框的识别方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN110543624B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997010565A1 (fr) * 1995-09-13 1997-03-20 Moussette Jean Pierre Dispositif de signes et procede de lecture optique
US5815595A (en) * 1995-12-29 1998-09-29 Seiko Epson Corporation Method and apparatus for identifying text fields and checkboxes in digitized images
CN105744260A (zh) * 2014-12-09 2016-07-06 深圳艾科创新微电子有限公司 一种条形图案检测方法与装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3995185B2 (ja) * 2000-07-28 2007-10-24 株式会社リコー 枠認識装置及び記録媒体
CA2805329C (en) * 2011-03-30 2016-09-06 Rakuten, Inc. Information provision device, information provision method, information provision program, information display device, information display method, information display program, information retrieval system, and recording medium
CN105389165B (zh) * 2015-10-21 2019-04-30 广州视睿电子科技有限公司 一种文档图片显示方法、装置及终端
US10002291B2 (en) * 2016-05-25 2018-06-19 Xerox Corporation Method and system of identifying fillable fields of an electronic form

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997010565A1 (fr) * 1995-09-13 1997-03-20 Moussette Jean Pierre Dispositif de signes et procede de lecture optique
US5815595A (en) * 1995-12-29 1998-09-29 Seiko Epson Corporation Method and apparatus for identifying text fields and checkboxes in digitized images
CN105744260A (zh) * 2014-12-09 2016-07-06 深圳艾科创新微电子有限公司 一种条形图案检测方法与装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
复选框图形元素的图像分割方法研究;牛连强 等;小型微型计算机系统;第27卷(第08期);第1563-1566页 *

Also Published As

Publication number Publication date
CN110543624A (zh) 2019-12-06

Similar Documents

Publication Publication Date Title
CN109685055B (zh) 一种图像中文本区域的检测方法及装置
CN108664364B (zh) 一种终端测试方法及装置
CN110502985B (zh) 表格识别方法、装置及表格识别设备
CN109697414B (zh) 一种文本定位方法及装置
CN111291661B (zh) 一种屏幕中图标的文本内容的识别方法及设备
CN111309618B (zh) 页面元素定位方法、页面测试方法及相关装置
CN109977337B (zh) 一种网页设计对比方法、装置、设备及可读存储介质
CN111444750B (zh) 一种pdf文档识别方法、装置及电子设备
CN115861400B (zh) 目标对象检测方法、训练方法、装置以及电子设备
CN110879780A (zh) 页面异常检测方法、装置、电子设备及可读存储介质
CN111460355B (zh) 一种页面解析方法和装置
CN113076961B (zh) 一种图像特征库更新方法、图像检测方法和装置
CN109978044B (zh) 训练数据生成方法和装置、以及模型的训练方法和装置
CN115357155A (zh) 窗口识别方法、装置、设备及计算机可读存储介质
CN111738252B (zh) 图像中的文本行检测方法、装置及计算机系统
CN116682130A (zh) 图签信息的提取方法、装置、设备及可读存储介质
CN114445844A (zh) 板构件识别方法、装置、设备及存储介质
CN110929647B (zh) 一种文本检测方法、装置、设备及存储介质
CN113051235A (zh) 文档加载方法、装置、终端和存储介质
CN110543624B (zh) 一种pdf文档中复选框的识别方法、装置及电子设备
CN115756461A (zh) 标注模板生成方法、图像识别方法、装置和电子设备
CN110619597A (zh) 一种半透明水印去除方法、装置、电子设备及存储介质
CN115018783A (zh) 一种视频水印检测方法和装置、电子设备和存储介质
CN115661851A (zh) 获取样本数据及构件识别方法及电子设备
CN110837789B (zh) 一种检测物体的方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant