CN110377640A - 一种基于深度学习投票统计方法 - Google Patents
一种基于深度学习投票统计方法 Download PDFInfo
- Publication number
- CN110377640A CN110377640A CN201910664122.3A CN201910664122A CN110377640A CN 110377640 A CN110377640 A CN 110377640A CN 201910664122 A CN201910664122 A CN 201910664122A CN 110377640 A CN110377640 A CN 110377640A
- Authority
- CN
- China
- Prior art keywords
- ballot
- operator
- label
- line segment
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013135 deep learning Methods 0.000 title claims abstract description 14
- 238000007619 statistical method Methods 0.000 title claims abstract description 14
- 238000000034 method Methods 0.000 claims abstract description 27
- 238000001514 detection method Methods 0.000 claims abstract description 20
- 238000012545 processing Methods 0.000 claims abstract description 14
- 238000013461 design Methods 0.000 claims abstract description 5
- 238000012360 testing method Methods 0.000 claims abstract description 5
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 239000000284 extract Substances 0.000 claims description 5
- 230000001186 cumulative effect Effects 0.000 claims description 3
- 230000000717 retained effect Effects 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 238000011282 treatment Methods 0.000 claims description 2
- 238000007689 inspection Methods 0.000 claims 2
- 238000012937 correction Methods 0.000 claims 1
- 239000003086 colorant Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000010339 dilation Effects 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07C—TIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
- G07C13/00—Voting apparatus
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Fuzzy Systems (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于数字图像处理领域,涉及一种基于深度学习的投票统计方法,所述的统计方法包括以下步骤:第一步,票型设计。第二步,图像预处理:对采集的得到的选票图片进行预处理。第三步,表格检测:检测图片中表格最外侧的两条直线,检测图片中表格的四个角点;检测图片中表格内部的线段,包括垂直方向与水平方向的线段,检测结果为线段两端的坐标。第四步,根据第三步得到的表格线段信息对表格单元格进行分割。第五步,标记分类。第六步,投票统计。本发明实施简单、操作难度低,能够实时处理投票数据,大大节约计票时间,准确率高,识别率高达99.99%,结果可信度高,能够应对多种颜色的选票背景以及多种票型,算法具有普适性。
Description
技术领域
本发明属于数字图像处理领域,涉及一种基于深度学习的投票统计方法。
背景技术
目前投票是一种常用的群体决策方法,常出现在选举工作中。
但随着候选人数的增多以及投票数的增多,使得人工计票这一环节的时间成本急剧增长。此外由于生理因素的影响,大量的人工计票工作也会带来统计的误差。
随着深度学习方法的不断发展,其在目标分类、检测和分割领域的表现越来越突出。基于深度学习的分类检测算法准确率高,适应性好,在某些分类任务上的能力甚至超过人类本身。
发明内容
为了解决现有技术问题,本发明提供一种基于深度学习的投票统计方法,用计算机来代替人工,以人工计票费时费力和准确率得不到保证的问题。
一种基于深度学习投票统计方法,包括以下步骤:
第一步,选票票型设计:为了提升投票的处理速度以及系统的稳定性,本发明采用表格样式的选票票型设计方案,票样如图1所示。表格样式的票型设计要求如下:
1.1表格样式:采用二维表格,即不允许表中嵌表,以此降低算法复杂度以及检测难度。候选人信息按照一定格式罗列在表格中。
1.2标记:在表格中做出可分辨标记;可采用〇表示选中改候选人,空白、 X、不做标记涂改视作不选。
第二步,图像预处理:对采集的得到的选票图片进行预处理,预处理的步骤包括:
2.1将选票图片进行灰度化处理:考虑到选票会使用到不同颜色作为背景(常用的有粉色、青绿色、蓝色等)。使用灰度化可以解决选票颜色背景不统一的问题。
2.2使用大津算法OSTU对灰度化处理后的图片进行图像二值化处理。由于 OSTU通过统计整个图像的直方图特性来实现全局阈值的选取,可以避免手工选取阈值,因此可以很好的应对不同颜色选票灰度化结果差异的问题。由于表格线条以及投票标记均用黑色记号,因此在使用OSTU后对像素点进行反转操作。
2.3对二值化处理后的图片进行膨胀:由于选票在发放、填写、扫描过程中造成的表格像素点的丢失,这会导致接下来的表格检测的不稳定性。使用形态学膨胀方法可以带来加粗线条的作用,在一定程度上可以降低表格线像素点丢失的问题。
第三步,表格检测:由于简单二维表格构造特性,对膨胀处理后的图片采用投影法与区域增长法来进行表格检测,检测结果的输出为一系列直线(直线用两点式表示)。
3.1检测图片中表格最外侧的两条直线,具体的采用滑动窗体的形式检测垂直线段的边缘,由此得到两条竖直方向的线。
3.2检测图片中表格的四个角点,具体做法为以直线两点式的进行区域增长,最终可以得到表格框的四个角点,这四个点用于确定表格最外侧的四条线段。
3.3检测图片中表格内部的线段,包括垂直方向与水平方向的线段,检测结果为线段两端的坐标。具体做法为基于区域增长的投影方法,以及K-Mean聚类算法。选票在打印与扫描过程中会出现一定角度的旋转以及表格内包含的文字信息,如果采用直接投影的方法会导致检测失败。由于在上一步骤种已经检测到表格的四个角点,因此能得到水平与垂直方向的线段的斜率,根据对应的斜率进行区域增长,然后再投影就能得到表格线段的端点。
第四步,标记提取:
根据第三步得到的表格线段信息对表格单元格进行分割,根据表格信息摆放的先验知识可以提取标记所在的单元格。
选票表格信息摆放的先验知识,包括标记所在的列或行、标记与候选人的对应关系、最多投票数(统计废票用)、候选人的数量(统计额外候选人用),表格主体在纸张中的大体位置。
第五步,标记分类:
由于选票标记特征相对简单,本发明使用改进的VGG16作为标记的分类器, VGG16架构能够很好的应对复杂的标记信息如涂改、模糊等。本发明的采用改进的VGG16主体架构不变,将VGG16网络的通道数从[64,128,256,512,512] 降至[4,8,32,64,128]。这样做保留了VGG16的特征提取能力的同时极大的加速了分类运行的速度并且降低算法运行的硬件资源需求。
第六步,投票统计:
对于每一张选票统计其中的选票信息,最终输出每个候选人的得票数、废票张数、以及详细的识别结果。
本发明的有益效果:
本发明实施简单、操作难度低,能够实时处理投票数据,大大节约计票时间,准确率高,识别率高达99.99%,结果可信度高,能够应对多种颜色的选票背景以及多种票型,算法具有普适性。
附图说明
图1为本发明实施例公开的一种投票统计方法流程图。
图2为本发明实施例公开的一种纸质选票票样一。
图3为本发明实施例公开的一种纸质选票票样二。
图4为本发明实例公开的一种表格检测方法流程图。
图5为本发明实例公开的VGG16架构图。
具体实施方式
下面将结合本发明实例中的附图,对本发明实例中的技术方案进行清楚完整地描述,本实例描述的仅是本发明的一部分实例不是全部的实例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
一种基于深度学习投票统计方法,计票流程图如图1所示,包括:
步骤1,选票的设定;
为了降低计票流程的复杂度,本发明对选票样式进行了一定程度的限制。本发明的两种选票票样如图2和图3所示。首先选票表格的为简单的二维表格,候选人信息按照一定格式罗列在表格中。本投票系统需要选票的先验知识,包括标记所在的列(或行)、标记与候选人的对应关系、最多投票数(统计废票用)、候选人的数量(统计额外候选人用),表格主体在纸张中的大体位置。
步骤2,图像预处理;
选票的自动统计需要电子扫描版的选票,格式为jpg。如本例使用A4纸作打印选票,电子扫描的长边与短边的长度分别为(3500,2560)。
选票图像的预处理步骤包括灰度化、OSTU二值化和形态学膨胀操作。
步骤2,表格的检测。
表格检测的步骤如图4所示。该步骤需要的先验知识为表格在A4纸上的大致位置比例(用百分比表示)、表格竖直方向线段数量以及表格水平方向线段数量,利用这些先验知识可以帮助快速定位表格。
首先使用累加滑动窗算子定位表格两侧的垂线段。该滑动窗算子为一维列向量长度为N,用于检测垂线段。如检测表格左侧线段,将该算子从左至右滑动,滑动过程中将算子与窗口中的列向量进行或运算,然后将得到的结果保留在算子中,接着求和算子并将结果除以N,得到百分比β,若β大于一定的阈值 (设为thresh)则认定检测到垂直线段上的一个点(一般的设N=50,thresh=0.95)。用同样的方法可以检测到线段上的另一个点,由此便确定了一条垂线段。例如图2所示票样,若表格垂直方向3500像素点,垂直方向所占区间为[1300,2560],那么该表格垂直区间为[0.37,0.73]。为了应对打印扫描过程中表格移位与倾斜的情况,将算子的竖直方向滑动起点设置在0.45与0.65处。这样便可检测到表格左侧的线段上的两个点,同样的方法可以检测到表格右侧的线段上的两个点。
然后利用区域增长法来检测表格的四个角点。根据直线方程对上一步中得到的点进行区域增长,由此可以得到表格的四个角点。
最后检测表格内部的线段。如果表格单元格是均匀划分,那么利用上一步骤得到表格的四个角点就可以方便的划分出表格的内部线段(如表格单元格水平方向线段)。对于非均匀划分的情况(如表格单元格垂直方向线段)可以根据先验知识来进行划分,例如事先得到各个单元格的偏移量。这种方法速度快,但是需要先验输入较多,很难适应票样的变化。本发明采用投影+区域增长+K 均值聚类的方法来解决单元格划分。利用表格的四个角点和简单表格内部线段平行的特性,可以实施以直线方程为策略的区域增长算法。例如用此方法可以求出表格顶部水平线段与表格上所有垂直的线段的交点。为了消除表格中文字与断点对于交点检测的干扰,区域增长到一定步长无法在继续增长后便停止增长。用此方法可以得到表格最外围的交点坐标,这些交点坐标确定了该表格的线段。
步骤3,标记提取与分类;
步骤2得到的表格信息加上标记所在列的信息,便可以将标记提取出来。为了方便分类网络分类,在提取标记单元格时保留单元格的边框线。提取示例如图1步骤4所示。提取的过程中保留与相应候选人的对应关系。截取后的单元格统一归一化到64x64像素大小。
标记的分类网络采用VGG16架构,该架构能够很好的应对复杂的标记信息如涂改、模糊等。其分类网络架构图如图5所示,主体架构不变,将网络的通道数从[64,128,256,512,512]降至[4,8,32,64,128]。
步骤4,票数统计。
对于每张选票,在对票内标记分类之后,将选票结果加至对应的候选人上。
Claims (5)
1.一种基于深度学习投票统计方法,其特征在于,包括以下步骤:
第一步,选票票型设计:
1.1表格样式:采用二维表格,即不允许表中嵌表;
1.2标记:在表格中做出可分辨标记;
第二步,图像预处理:对采集的得到的选票图片进行预处理,预处理的步骤包括:
2.1将选票图片进行灰度化处理;
2.2使用大津算法OSTU对灰度化处理后的图片进行图像二值化处理,并对像素点进行反转操作;
2.3对二值化处理后的图片进行膨胀处理;
第三步,表格检测:
3.1检测图片中表格最外侧的两条直线,具体的采用滑动窗体的形式检测垂直线段的边缘,由此得到两条竖直方向的线;
3.2检测图片中表格的四个角点,具体做法为以直线两点式的进行区域增长,最终可以得到表格框的四个角点,这四个点用于确定表格最外侧的四条线段;
3.3检测图片中表格内部的线段,包括垂直方向与水平方向的线段,检测结果为线段两端的坐标;具体做法为基于区域增长的投影方法,以及K-Mean聚类算法;
第四步,标记提取:
根据第三步得到的表格线段信息对表格单元格进行分割,根据表格信息摆放的先验知识可以提取标记所在的单元格;
选票表格信息摆放的先验知识,包括标记所在的列或行、标记与候选人的对应关系、最多投票数和候选人的数量;
第五步,标记分类:
使用VGG16架构作为标记的分类器进行标记分类;
第六步,投票统计:
对于每一张选票统计其中的选票信息,最终输出每个候选人的得票数、废票张数、以及详细的识别结果。
2.如权利要求1所述的一种基于深度学习投票统计方法,其特征在于,第五步中,标记分类采用改进的VGG16作为标记的分类器,所述改进的VGG16主体架构不变,将VGG16网络的通道数从[64,128,256,512,512]降至[4,8,32,64,128]。
3.如权利要求1或2所述的一种基于深度学习投票统计方法,其特征在于,步骤1.2中,分辨标记可采用〇表示选中改候选人,空白、X、不做标记涂改视作不选。
4.如权利要求1或2所述的一种基于深度学习投票统计方法,其特征在于,步骤3.1中,采用滑动窗体的形式检测垂直线段的边缘,具体操作步骤如下:累加滑动窗算子定位表格两侧的垂线段;该滑动窗算子为一维列向量长度为N,用于检测垂线段;检测表格左侧线段,将该算子从左至右滑动,滑动过程中将算子与窗口中的列向量进行或运算,然后将得到的结果保留在算子中,接着求和算子并将结果除以N,得到百分比β,若β大于一定的阈值,则认定检测到垂直线段上的一个点。
5.如权利要求3所述的一种基于深度学习投票统计方法,其特征在于,步骤3.1中,采用滑动窗体的形式检测垂直线段的边缘,具体操作步骤如下:累加滑动窗算子定位表格两侧的垂线段;该滑动窗算子为一维列向量长度为N,用于检测垂线段;检测表格左侧线段,将该算子从左至右滑动,滑动过程中将算子与窗口中的列向量进行或运算,然后将得到的结果保留在算子中,接着求和算子并将结果除以N,得到百分比β,若β大于一定的阈值,则认定检测到垂直线段上的一个点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910664122.3A CN110377640A (zh) | 2019-07-23 | 2019-07-23 | 一种基于深度学习投票统计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910664122.3A CN110377640A (zh) | 2019-07-23 | 2019-07-23 | 一种基于深度学习投票统计方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110377640A true CN110377640A (zh) | 2019-10-25 |
Family
ID=68254962
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910664122.3A Pending CN110377640A (zh) | 2019-07-23 | 2019-07-23 | 一种基于深度学习投票统计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110377640A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111753706A (zh) * | 2020-06-19 | 2020-10-09 | 西安工业大学 | 一种基于图像统计学的复杂表格交点聚类提取方法 |
CN114900195A (zh) * | 2022-07-11 | 2022-08-12 | 山东嘉通专用汽车制造有限公司 | 一种用于粉罐车的安全状态监测系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101447017A (zh) * | 2008-11-27 | 2009-06-03 | 浙江工业大学 | 一种基于版面分析的选票快速识别统计方法及系统 |
CN105740857A (zh) * | 2016-01-31 | 2016-07-06 | 华南理工大学 | 一种基于ocr的快速纸笔投票结果自动采集与识别系统 |
CN105844629A (zh) * | 2016-03-21 | 2016-08-10 | 河南理工大学 | 一种大场景城市建筑物立面点云自动分割方法 |
CN107274423A (zh) * | 2017-05-26 | 2017-10-20 | 中北大学 | 一种基于协方差矩阵和投影映射的点云特征曲线提取方法 |
CN109460720A (zh) * | 2018-10-25 | 2019-03-12 | 中科院成都信息技术股份有限公司 | 基于卷积神经网络的选票识别方法 |
-
2019
- 2019-07-23 CN CN201910664122.3A patent/CN110377640A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101447017A (zh) * | 2008-11-27 | 2009-06-03 | 浙江工业大学 | 一种基于版面分析的选票快速识别统计方法及系统 |
CN105740857A (zh) * | 2016-01-31 | 2016-07-06 | 华南理工大学 | 一种基于ocr的快速纸笔投票结果自动采集与识别系统 |
CN105844629A (zh) * | 2016-03-21 | 2016-08-10 | 河南理工大学 | 一种大场景城市建筑物立面点云自动分割方法 |
CN107274423A (zh) * | 2017-05-26 | 2017-10-20 | 中北大学 | 一种基于协方差矩阵和投影映射的点云特征曲线提取方法 |
CN109460720A (zh) * | 2018-10-25 | 2019-03-12 | 中科院成都信息技术股份有限公司 | 基于卷积神经网络的选票识别方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111753706A (zh) * | 2020-06-19 | 2020-10-09 | 西安工业大学 | 一种基于图像统计学的复杂表格交点聚类提取方法 |
CN111753706B (zh) * | 2020-06-19 | 2024-02-02 | 西安工业大学 | 一种基于图像统计学的复杂表格交点聚类提取方法 |
CN114900195A (zh) * | 2022-07-11 | 2022-08-12 | 山东嘉通专用汽车制造有限公司 | 一种用于粉罐车的安全状态监测系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111325203B (zh) | 一种基于图像校正的美式车牌识别方法及系统 | |
US20210110194A1 (en) | Method for automatic extraction of data from graph | |
CN102704215B (zh) | 基于dst文件解析与机器视觉结合的绣布自动切割方法 | |
CN103310211B (zh) | 一种基于图像处理的填注标记识别方法 | |
JP5379085B2 (ja) | スキャンされた文書画像内の前景画素群の連結グループをマーキング種類に基づき分類する方法及びシステム | |
CN102629322B (zh) | 一种基于边界点笔画形状的字符特征提取方法及应用 | |
CN101576956B (zh) | 基于机器视觉的在线字符检测方法和系统 | |
CN103034848B (zh) | 一种表单类型的识别方法 | |
CN104778470B (zh) | 基于组件树和霍夫森林的文字检测和识别方法 | |
CN101923643A (zh) | 通用表格识别方法 | |
CN105046200B (zh) | 基于直线检测的电子阅卷方法 | |
CN109886954B (zh) | 一种印刷品缺陷检测方法 | |
CN102360419A (zh) | 计算机扫描阅读管理方法及系统 | |
CN111444964B (zh) | 一种基于自适应roi划分的多目标快速图像匹配方法 | |
CN110334760B (zh) | 一种基于resUnet的光学元器件损伤检测方法及系统 | |
CN115131348B (zh) | 一种纺织品表面缺陷的检测方法及系统 | |
CN112734729B (zh) | 适用于夜间补光条件的水尺水位线图像检测方法、装置及存储介质 | |
CN110377640A (zh) | 一种基于深度学习投票统计方法 | |
CN116704516B (zh) | 一种用于水溶肥料包装的视觉检测方法 | |
CN103488965A (zh) | 运单信息录入和彩色色块编码解码系统 | |
CN115170518A (zh) | 基于深度学习和机器视觉的细胞检测方法及系统 | |
Zahour et al. | Overlapping and multi-touching text-line segmentation by Block Covering analysis | |
CN113657339A (zh) | 一种基于机器视觉的仪表指针计数读取方法及介质 | |
CN103473518A (zh) | 运单信息录入和黑白色块编码解码系统 | |
CN116994269A (zh) | 一种图像文档中印章相似度比对方法及对比系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191025 |
|
RJ01 | Rejection of invention patent application after publication |