CN108985287B - 笔记本纸张和分类图标识别方法 - Google Patents

笔记本纸张和分类图标识别方法 Download PDF

Info

Publication number
CN108985287B
CN108985287B CN201810762543.5A CN201810762543A CN108985287B CN 108985287 B CN108985287 B CN 108985287B CN 201810762543 A CN201810762543 A CN 201810762543A CN 108985287 B CN108985287 B CN 108985287B
Authority
CN
China
Prior art keywords
paper
classification
area
image
notebook
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810762543.5A
Other languages
English (en)
Other versions
CN108985287A (zh
Inventor
雷亭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Sangular Software Co ltd
Original Assignee
Hangzhou Sangular Software Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Sangular Software Co ltd filed Critical Hangzhou Sangular Software Co ltd
Priority to CN201810762543.5A priority Critical patent/CN108985287B/zh
Publication of CN108985287A publication Critical patent/CN108985287A/zh
Application granted granted Critical
Publication of CN108985287B publication Critical patent/CN108985287B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/225Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/245Aligning, centring, orientation detection or correction of the image by locating a pattern; Special marks for positioning

Abstract

笔记本纸张和分类图标识别方法,它包含如下步骤:笔记本采用可拆卸式纸张,每页纸张上设有至少3mm宽的黑色边缘;每页纸张背景主色调为白色,白色背景上设有纸张线条及分类图标;二、纸张识别:先输入图像,进行图像预处理,然后进行图像中纸张轮廓外接矩形的提取,最后输出纸张外接矩形四个角在拍摄设备中的坐标;三、分类图标识别:按比例截取到分类图标所在区域,根据分类图标宽度,等比例遍历该区域中,像素值为0的像素最多的区域即为用户所标定的分类区域,从而确定分类;更加智能快速的归类,极大提高了使用者工作效率。

Description

笔记本纸张和分类图标识别方法
技术领域
本发明涉及图像识别技术领域,具体涉及一种笔记本纸张和分类图标识别方法。
背景技术
目前人们为了保证自己的手写笔记不会随着时间的推移而遗失或者损坏,更多的是使用手机拍摄当前纸张页面并传到电脑或网上,然后再一一手动分类自己的这些手写笔记。这就会面临三个问题:
一、拍摄期间,很容易将笔记本纸张以外的大面积背景拍摄进去,在一定程度上造成照片中纸张内容阅读的障碍,而且也不美观;
二、当拍摄的照片不理想时,为了仅仅保留下照片中的纸张区域,还需要对照片裁剪、加工,需要耗费大量的时间、精力;
三、纸张照片处理好后,人们很喜欢为自己的这些照片归类,此时需要手动一张张的放到不同分类之下,这一过程又会造成人们时间、精力上的浪费。
为此,迫切需要一项创新的技术来帮人们解决以上问题,从而极大的提高工作效率。
发明内容
本发明的目的在于针对现有技术的缺陷和不足,提供一种笔记本纸张和分类图标识别方法。
为实现上述目的,本发明所述的笔记本纸张和分类图标识别方法,包含如下步骤:
一、采用定制的笔记本:笔记本采用可拆卸式纸张,每页纸张上设有至少3mm宽的黑色边缘,黑色边缘的颜色值为#000000;左右两页纸张之间设有至少2cm黑色区域,黑色区域的颜色值为#000000;每页纸张背景主色调为白色,白色背景的颜色值为#FFFFFF;白色背景上设有纸张线条及分类图标,纸张线条及分类图标的颜色值为#F5F5F5;分类图标间隔均匀排列在纸张最下方;
二、纸张识别:
1)图像预处理:先灰度处理,根据纸张主色调,取反图像中的颜色值,使图像中属于纸张范围的区域的颜色值将趋于0之后,使用OTSU算法对图像进行二值化处理,小于阈值T的被初步认为是纸张区域;再使用腐蚀处理,除去干扰因子;最后,使用轮廓提取技术,提取出当前二值图像中所有的轮廓;
2)提取纸张外接矩形:遍历所有的轮廓,找到其外接矩形面积和当前轮廓面积比在0.9-1.1范围之间的最大的轮廓,输出该轮廓外接矩形四个角的坐标,这些坐标就是最终定位到的纸张四个角的坐标;
三、分类图标识别:
1)由于分类图标颜色过浅,在图像二值化时,就会被过滤掉,最终保留下来的只有用户标识过的区域;
2)按比例截取到分类图标所在区域,根据分类图标宽度,等比例遍历该区域中,判断每块图像矩阵中,哪块像素值为0的像素最多,最多的即为用户所标定的分类区域,从而确定分类。
进一步地,笔记本中纸张上左侧装订边的黑色边缘的宽度大于其他三边的黑色边缘的宽度;
进一步地,步骤二中使用OTSU算法对图像进行二值化处理后,阈值T=10。
采用上述方案后,本发明所述的笔记本纸张和分类图标识别方法具有以下优点:
1)通过笔记本的黑色边框,在图像处理阶段,可以很稳定的将图像区域分为内外两种区域.再结合外接矩形同轮廓的面积比,可以很准确的定位出纸张的范围,真正实现纸张识别自动化,免去了用户手动定位纸张区域,手动截取纸张区域的时间和精力。
2)使用极其浅色的图标作为分类图标,当用户在该图标上进行标记时候,此时该分类图标所在区域二值化后,会仅仅保留下用户的标记,从而只比较像素多少就可以判断当前纸张属于哪个分类;计算复杂度低,运行效率高,同时也解决了用户手动归类的麻烦。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是纸张的样式示意图。
附图标记说明:
1、白色背景;2、左侧装订边上的黑色边缘;3、其他三边的黑色边缘;4、纸张线条;5、分类图标。
具体实施方式
下面结合附图,对本发明作进一步的说明。
实施例:笔记本纸张和分类图标识别方法包含如下步骤:
一、采用定制的笔记本:笔记本的纸张样式参看图1所示,每页纸张上设有至少3mm宽的黑色边缘,黑色边缘的颜色值为#000000,左侧装订边上的黑色边缘2的宽度大于其他三边的黑色边缘3的宽度,以便打开后和左方的纸张页面区分;左右两页纸张之间设有至少2cm黑色区域,黑色区域的颜色值为#000000;每页纸张背景主色调为白色,白色背景1的颜色值为#FFFFFF,可以保证更准确的识别智障区域;白色背景1上设有纸张线条4及分类图标5,纸张线条4及分类图标5的颜色值为#F5F5F5;分类图标5间隔均匀排列在纸张最下方;
二、纸张识别:
纸张识别的主流程为:先输入图像,进行图像预处理,然后进行图像中纸张轮廓外接矩形的提取,最后输出纸张外接矩形四个角在拍摄设备中的坐标;
主流程中包含两个子流程,子流程一为图像预处理,子流程二为图像中纸张轮廓外接矩形的提取;
图像预处理流程:先灰度处理,根据纸张主色调,主色调颜色值为#FFFFFF,取反图像中的颜色值,使图像中属于纸张范围的区域的颜色值将趋于0之后,使用OTSU算法对图像进行二值化处理,小于阈值10的像素区域被初步认为是纸张区域;再使用3*3腐蚀处理,除去干扰因子;最后,使用轮廓提取技术,提取出当前二值图像中所有的轮廓;
提取纸张外接矩形的流程:遍历所有的轮廓,找到其外接矩形面积和当前轮廓面积比在0.9-1.1范围之间的最大的轮廓,输出该轮廓外接矩形四个角的坐标,这些坐标就是最终定位到的纸张四个角的坐标;
三、分类图标识别:
由于分类图标颜色过浅,在图像二值化时,就会被过滤掉,最终保留下来的只有用户标识过的区域;
按比例截取到分类图标所在区域,根据分类图标宽度,等比例遍历该区域中,判断每块图像矩阵中,哪块像素值为0的像素最多,最多的即为用户所标定的分类区域,从而确定分类。
本实施例使用移动设备(如Android、IOS手机)在应用层APP中展示,识别出来的纸张并分类后,保存在移动设备中,通过APP,可以将这些图像分类信息传递到云端永久保存,或者进行快速邮件发送。
本实施例具有以下优点:
1、采用定制的笔记本,每页纸张上标有多个不同分类的图标,使用者可根据当前页面内容,可以在当前页面某一分类图标上做标记;
2、拍摄时,自动定位并准确拍摄出图像中纸张区域,省去了用户手动定位拍摄并裁剪照片的时间;
3、识别出图像纸张中被使用者标记过的分类图标,从而将当前图像归类,更加智能快速的归类,极大提高了使用者工作效率。
以上所述,仅用以说明本发明的技术方案而非限制,本领域普通技术人员对本发明的技术方案所做的其它修改或者等同替换,只要不脱离本发明技术方案的精神和范围,均应涵盖在本发明的权利要求范围当中。

Claims (3)

1.笔记本纸张和分类图标识别方法,其特征在于包含如下步骤:
一、采用定制的笔记本:笔记本采用可拆卸式纸张,每页纸张上设有至少3mm宽的黑色边缘,黑色边缘的颜色值为#000000;左右两页纸张之间设有至少2cm黑色区域,黑色区域的颜色值为#000000;每页纸张背景主色调为白色,白色背景的颜色值为#FFFFFF;白色背景上设有纸张线条及分类图标,纸张线条及分类图标的颜色值为#F5F5F5;分类图标间隔均匀排列在纸张最下方;
二、纸张识别:
1)图像预处理:先灰度处理,根据纸张主色调,取反图像中的颜色值,使图像中属于纸张范围的区域的颜色值趋于0之后,使用OTSU算法对图像进行二值化处理,小于阈值T的被初步认为是纸张区域;再使用腐蚀处理,除去干扰因子;最后,使用轮廓提取技术,提取出当前二值图像中所有的轮廓;
2)提取纸张外接矩形:遍历所有的轮廓,找到其外接矩形面积和当前轮廓面积比在0.9-1.1范围之间的最大的轮廓,该轮廓外接矩形四个角的坐标,这些坐标就是最终定位到的纸张四个角的坐标;
三、分类图标识别:
1)由于分类图标颜色过浅,在图像二值化时,就会被过滤掉,最终保留下来的只有用户标识过的区域;
2)按比例截取到分类图标所在区域,根据分类图标宽度,等比例遍历该区域,判断每块图像矩阵中,哪块像素值为0的像素最多,最多的即为用户所标定的分类区域,从而确定分类。
2.根据权利要求1所述的笔记本纸张和分类图标识别方法,其特征在于笔记本中纸张上左侧装订边的黑色边缘的宽度大于其他三边的黑色边缘的宽度。
3.根据权利要求1所述的笔记本纸张和分类图标识别方法,其特征在于步骤二中使用OTSU算法对图像进行二值化处理后,阈值T=10。
CN201810762543.5A 2018-07-09 2018-07-09 笔记本纸张和分类图标识别方法 Active CN108985287B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810762543.5A CN108985287B (zh) 2018-07-09 2018-07-09 笔记本纸张和分类图标识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810762543.5A CN108985287B (zh) 2018-07-09 2018-07-09 笔记本纸张和分类图标识别方法

Publications (2)

Publication Number Publication Date
CN108985287A CN108985287A (zh) 2018-12-11
CN108985287B true CN108985287B (zh) 2021-05-25

Family

ID=64537852

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810762543.5A Active CN108985287B (zh) 2018-07-09 2018-07-09 笔记本纸张和分类图标识别方法

Country Status (1)

Country Link
CN (1) CN108985287B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111414223B (zh) * 2020-03-26 2023-09-05 西安蜂语信息科技有限公司 桌面管理方法及装置
JP2022054040A (ja) * 2020-09-25 2022-04-06 セイコーエプソン株式会社 分別装置、及び分別方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102799886A (zh) * 2012-06-14 2012-11-28 陕西科技大学 一种纸张水印边界定位及品质识别方法
CN103295001A (zh) * 2013-06-03 2013-09-11 哈尔滨理工大学 应用于手持设备的发票信息识别设备及发票信息识别方法
CN104573073A (zh) * 2015-01-27 2015-04-29 江苏汉德天坤数字技术有限公司 一种二维码文档自动分类方法
CN105160297A (zh) * 2015-07-27 2015-12-16 华南理工大学 基于肤色特征的蒙面人事件自动检测方法
CN105426844A (zh) * 2015-11-20 2016-03-23 广州未名中智教育科技有限公司 一种答题卡识别方法
CN105528614A (zh) * 2015-12-02 2016-04-27 北京大学 一种漫画图像版面的识别方法和自动识别系统
CN106156768A (zh) * 2016-07-01 2016-11-23 屈桢深 基于视觉的机动车行驶证检测方法
CN107194400A (zh) * 2017-05-31 2017-09-22 北京天宇星空科技有限公司 一种财务报销全票据图片识别处理方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9152858B2 (en) * 2013-06-30 2015-10-06 Google Inc. Extracting card data from multiple cards

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102799886A (zh) * 2012-06-14 2012-11-28 陕西科技大学 一种纸张水印边界定位及品质识别方法
CN103295001A (zh) * 2013-06-03 2013-09-11 哈尔滨理工大学 应用于手持设备的发票信息识别设备及发票信息识别方法
CN104573073A (zh) * 2015-01-27 2015-04-29 江苏汉德天坤数字技术有限公司 一种二维码文档自动分类方法
CN105160297A (zh) * 2015-07-27 2015-12-16 华南理工大学 基于肤色特征的蒙面人事件自动检测方法
CN105426844A (zh) * 2015-11-20 2016-03-23 广州未名中智教育科技有限公司 一种答题卡识别方法
CN105528614A (zh) * 2015-12-02 2016-04-27 北京大学 一种漫画图像版面的识别方法和自动识别系统
CN106156768A (zh) * 2016-07-01 2016-11-23 屈桢深 基于视觉的机动车行驶证检测方法
CN107194400A (zh) * 2017-05-31 2017-09-22 北京天宇星空科技有限公司 一种财务报销全票据图片识别处理方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LDA based paper currency recognition system using edge histogram descriptor;Shafin Rahman等;《2014 17th International Conference on Computer and Information Technology (ICCIT)》;20150402;326-331 *
票据中手写数字识别的研究;宋婉娟;《中国优秀硕士学位论文全文数据库 信息科技辑》;20070915;第2007年卷(第3期);I138-1202 *
纸质文档的信息化加工过程管理与系统实现;陈晶晶;《中国优秀硕士学位论文全文数据库 信息科技辑》;20111215;第2011年卷(第12期);I138-98 *

Also Published As

Publication number Publication date
CN108985287A (zh) 2018-12-11

Similar Documents

Publication Publication Date Title
CN109409355B (zh) 一种新型变压器铭牌识别的方法及装置
CN105184787A (zh) 一种自动对人像进行抠图的证照相机及方法
CN107705301B (zh) 一种基于无人机航拍公路图像的公路标线破损检测方法
CN107945194A (zh) 基于OpenCV技术的票据分割方法
CN110119741A (zh) 一种有背景的卡证图像信息识别方法
CN107766854B (zh) 一种基于模板匹配实现快速页码识别的方法
CN108985287B (zh) 笔记本纸张和分类图标识别方法
CN102819728A (zh) 一种基于分类模板匹配的交通标志检测方法
CN105447489B (zh) 一种图片ocr识别系统的字符与背景粘连噪声消除方法
CN107195069A (zh) 一种人民币冠字号自动识别方法
CN111259891B (zh) 一种自然场景下身份证识别方法、装置、设备和介质
CN103295013A (zh) 一种基于成对区域的单幅图像阴影检测方法
CN112115948A (zh) 一种基于深度学习的芯片表面字符识别方法
CN105335744A (zh) 一种基于图像骨干抽取条带分布特征的一维码区域定位
CN112307824A (zh) 识别票据号码区域的篡改的方法、装置、系统及可读介质
CN105741272A (zh) 去除文档图像背面渗透字迹的方法
CN107977648B (zh) 一种基于人脸识别的身份证清晰度的判别方法和系统
CN111401364A (zh) 一种基于颜色特征和模板匹配相结合的车牌定位算法
CN110378337B (zh) 金属切削刀具图纸标识信息视觉输入方法及系统
CN111814778A (zh) 文本行区域定位方法、版面分析方法及字符识别方法
CN111738979A (zh) 证件图像质量自动检查方法及系统
CN111583156B (zh) 文档图像底纹去除方法及系统
CN101894255A (zh) 一种基于小波变换的集装箱号码定位方法
CN114627463A (zh) 一种基于机器识别的非接触式配电数据识别方法
CN113591849A (zh) 基于签章识别的文件评审方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant