CN104766198A - 一种快速识别邮件附件的方法 - Google Patents

一种快速识别邮件附件的方法 Download PDF

Info

Publication number
CN104766198A
CN104766198A CN201510092726.7A CN201510092726A CN104766198A CN 104766198 A CN104766198 A CN 104766198A CN 201510092726 A CN201510092726 A CN 201510092726A CN 104766198 A CN104766198 A CN 104766198A
Authority
CN
China
Prior art keywords
byte
email attachment
mapped
mail
fast
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510092726.7A
Other languages
English (en)
Inventor
包敬海
吴国辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201510092726.7A priority Critical patent/CN104766198A/zh
Publication of CN104766198A publication Critical patent/CN104766198A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种快速识别邮件附件的方法,利用模板比较、忽略浅色背景、GB合并映射单字节、提取15个特征点的方法,实现快速识别邮件附件,为海量邮件附件全自动下载提供了强有力的保障;采用图像识别技术,无需获取用户的邮箱名、邮箱密码,具有较高的安全性,而且采用快速识别技术,具有很强的实用性。本发明采用了海量邮件附件下载器,识别速度约2毫秒,后台热键工作,实现全自动识别和下载,运行效果良好。此外,本发明针对现有邮件系统、OA系统缺少的功能和邮件管理工具的安全隐患,弥补了现有系统和工具存在的缺陷,为海量邮件附件全自动下载提供了强有力的保障。

Description

一种快速识别邮件附件的方法
技术领域
本发明属于电子邮件技术领域,尤其涉及一种快速识别邮件附件的方法。
背景技术
绿色节能、低碳环保、减少森林砍伐、加强无纸化是世界各国的共识和发展大潮。因此,传统的纸张办公、纸张作业等正快速转向电子版的邮件方式。例如,高校教师往往过了一两个星期,就能看到几百封未读邮件的附件要下载。
目前的邮件系统基本上没有提供自动识别和下载所有未读邮件附件的功能,OA系统的附件管理也差不多;Foxmail等邮件管理工具需要将所有邮件下载到本地,管理不够方便;针对邮件附件进行处理的工具,目前国外的有MailAttachment Downloader,但是它要获取用户的邮箱名、邮箱密码,存在较大的安全隐患。
当前的邮件系统、OA系统基本上没有提供自动识别和下载所有未读邮件附件的功能;Foxmail等邮件管理工具需要将所有邮件下载到本地,管理不够方便;其他邮件附件处理的工具需要用户输入邮箱名、邮箱密码,存在较大的安全隐患。
发明内容
本发明的目的在于提供一种快速识别邮件附件的方法,旨在解决现有邮件系统、OA系统缺少的功能和邮件管理工具存在的安全隐患问题。
本发明是这样实现的,一种快速识别邮件附件的方法,该快速识别邮件附件的方法包括以下步骤:
步骤一,略浅色背景,GB映射为单字节,默认的图像含有红色、绿色、蓝色三原色的单字节;
步骤二,提取特征点,方法为:提取左上角、右上角、左下角、左下角这4个角的像素、再随机提取11个不重复的像素,共计15个特征点。
进一步,步骤一的具体实现方法包括:
第一步,将偏白色的背景去除;采用红色>100&&绿色>100&&蓝色>100的方法,将背景颜色全部去除,极大减小对比的工作量;
第二步,将绿色、蓝色合并映射为单字节,某像素的RGB三原色分别为33、85、148,则合并映射为单字节的数值为(85/16)<<4+(148/16)=5<<4+9=0x59=89。
进一步,在步骤一之前需要准备模板图片,用户事先通过Windows的截图工具截取、保存为模板图片。
进一步,截图采用Rectangle类、Graphics类来实现;在模拟鼠标、键盘移动页面屏幕、点击下载、点击下一封的操作方面,采用MouseEventFlag类、SendKeysAPI函数来实现;在后台热键方面,采用调用RegisterHotKey、UnregisterHotKeyDLL来实现。
进一步,在步骤二后需要采用模板图片与大图对比、匹配的方法来实现图像识别。
进一步,全局变量实现自定义截取大图,再对大图进行忽略浅色背景、GB合并映射为单字节的方法进行预处理;然后将模板图片的特征点与大图进行比较匹配;命中则自动的逐个点击下载,没有附件则自动进入下一封未读邮件进行匹配。
本发明提供的快速识别邮件附件的方法,利用模板比较、忽略浅色背景、GB合并映射单字节、提取15个特征点的方法,实现快速识别邮件附件,为海量邮件附件全自动下载提供了强有力的保障;采用图像识别技术,无需获取用户的邮箱名、邮箱密码,具有较高的安全性,而且采用快速识别技术,具有很强的实用性。本发明采用了海量邮件附件下载器,识别速度约2毫秒,后台热键工作,实现全自动识别和下载,运行效果良好。此外,本发明针对现有邮件系统、OA系统缺少的功能和邮件管理工具的安全隐患,弥补了现有系统和工具存在的缺陷,为海量邮件附件全自动下载提供了强有力的保障。
附图说明
图1是本发明实施例提供的快速识别邮件附件的方法流程图;
图2是本发明实施例提供的快速识别邮件附件的方法实施例1的流程图;
图3是本发明实施例提供的去除背景、GB合并映射为单字节的结果示意图;
图4是本发明实施例提供的模板图片提取特征点的某次结果示意图;
图5是本发明实施例提供的截图大图与模板图片特征点对比示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
下面结合附图及具体实施例对本发明的应用原理作进一步描述。
如图1所示,本发明实施例的快速识别邮件附件的方法包括以下步骤:
S101:准备模板图片,用户事先通过Windows的截图工具截取、保存为模板图片;
S102:忽略浅色背景,GB映射为单字节,默认的图像含有Red(红色)、Green(绿色)、Blue(蓝色)三原色的单字节;
S103:提取特征点,方法为:提取左上角、右上角、左下角、左下角这4个角的像素、再随机提取11个不重复的像素,共计15个特征点;
S104:图像识别多采用模板图片与大图对比、匹配的方法来实现。
在步骤S102中:
首先,将偏白色的背景去除;采用(Red>100)&&(Green>100)&&(Blue>100)的方法,将背景颜色全部去除,极大减小对比的工作量;
其次,将Green、Blue合并映射为单字节,某像素的RGB三原色分别为33、85、148,则合并映射为单字节的数值为(85/16)<<4+(148/16)=5<<4+9=0x59=89;
在步骤S104中,设置了全局变量(存储于绿色版的Access数据库)实现自定义截取大图,再对大图进行忽略浅色背景、GB合并映射为单字节的方法进行预处理;然后将模板图片的特征点与大图进行比较匹配;如果命中则自动的逐个点击下载,如果没有附件则自动进入下一封未读邮件进行匹配;由于特征点很少,每个点一般对比1~2次即可排除,速度很快;
在截图方面,主要采用Rectangle类、Graphics类来实现;在模拟鼠标、键盘移动页面屏幕、点击“下载”、点击“下一封”的操作方面,主要采用MouseEventFlag类、SendKeys等API函数来实现;在后台热键方面,主要采用调用RegisterHotKey、UnregisterHotKey等DLL来实现。
本发明的具体实施例:
要避免记录用户的邮箱、邮箱密码所带来的安全隐患,就需要用户自行打开邮箱,并采用图像识别技术来识别邮件附件并进行全自动下载;因此,该技术方案需要解决两个问题:准确识别出邮件附件的所在位置;快速识别以保证实用性;
第一步,准备模板图片
不同的邮箱系统的界面不一样,因此,需要需要用户事先通过Windows的截图工具截取、保存为模板图片,这样才能保证后面的图片对比、匹配定位的工作;
例如,某邮箱的附件模板图片为下载,命名为“down.bmp”;
第二步,忽略浅色背景,GB映射为单字节:
默认的图像含有Red(红色)、Green(绿色)、Blue(蓝色)三原色的单字节(8位)数组;如果每个像素都对RGB三原色进行分别对比,则识别速度太慢;如果采用灰度模式,则精度较低难以满足准确匹配的要求;
经研究发现,当前的邮箱系统中默认的页面基本上为白色或偏浅色;而对于附件下载中的“下载”链接具有深色的特点,也就是Red分量较小,Green、Blue分量相当;通过忽略浅色背景并把G、B映射为单字节,能够保证较高精度和速度;
首先,将偏白色的背景去除;采用(Red>100)&&(Green>100)&&(Blue>100)的方法,将背景颜色全部去除,极大减小对比的工作量;
其次,将Green、Blue合并映射为单字节,原理如表1所示;
表1 RGB合并映射为单字节
例如,某像素的RGB三原色分别为33、85、148,则合并映射为单字节的数值为(85/16)<<4+(148/16)=5<<4+9=0x59=89;与传统0.3*Red+0.59*Green+0.11*Blue的传统灰度计算相比,本发明避免了浮点数的繁琐计算和无用的Red分量的影响,速度更快,精度更高,完全能够满足本发明图像识别的需要;
经过上面的处理,模板图片的背景颜色被设置为黑色(数值为0),相当于被屏蔽,不会再进行对比;图3为某邮箱处理后的结果;
第三步,提取特征点
本发明提取特征点的方法为:提取左上角、右上角、左下角、左下角这4个角的像素、再随机提取11个不重复的像素,共计15个特征点;对于邮件附件的“下载”二字,这15个不重复的特征点完全够用,而且数量较少识别更快;某次计算结果如图4所示;
第四步,与大图匹配
图像识别多采用模板图片与大图对比、匹配的方法来实现;本发明设置了全局变量(存储于绿色版的Access数据库)实现自定义截取大图,再对大图进行忽略浅色背景、GB合并映射为单字节的方法进行预处理;然后将模板图片的特征点与大图进行比较匹配;如果命中则自动的逐个点击下载,如果没有附件则自动进入下一封未读邮件进行匹配;由于特征点很少,每个点一般对比1~2次即可排除,速度很快;如图5所示;
在截图方面,主要采用Rectangle类、Graphics类来实现;在模拟鼠标、键盘移动页面屏幕、点击“下载”、点击“下一封”的操作方面,主要采用MouseEventFlag类、SendKeys等API函数来实现;在后台热键方面,主要采用调用RegisterHotKey、UnregisterHotKey等DLL来实现;
通过快速识别邮件附件的方法,配合截图、模拟键鼠操作、后台热键的技术,就可以设计出完善的海量邮件附件全自动下载工具。
如果没有采用截图控制、去除背景、GB合并映射为单字节、提取15个模板图片特征点的方法,以1366*768分辨率的屏幕截图、25*15分辨率模板图片、RGB三原色的传统方法进行遍历,则最大遍历次数就超过了35亿次(1366*768*3*25*15*3=3,540,672,000次)。而采用本发明方案,一般只需要2万到3万次。以2010年的Thinkpad E40(老奔腾P6100、2G内存)笔记本测试为例,识别速度在2毫秒左右。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种快速识别邮件附件的方法,其特征在于,该快速识别邮件附件的方法包括以下步骤:
步骤一,略浅色背景,GB映射为单字节,默认的图像含有红色、绿色、蓝色三原色的单字节;
步骤二,提取特征点,方法为:提取左上角、右上角、左下角、左下角这4个角的像素、再随机提取11个不重复的像素,共计15个特征点。
2.如权利要求1所述的快速识别邮件附件的方法,其特征在于,步骤一的具体实现方法包括:
第一步,将偏白色的背景去除;采用红色>100&&绿色>100&&蓝色>100的方法,将背景颜色全部去除,极大减小对比的工作量;
第二步,将绿色、蓝色合并映射为单字节,某像素的RGB三原色分别为33、85、148,则合并映射为单字节的数值为:
(85/16)<<4+(148/16)=5<<4+9=0x59=89。
3.如权利要求1所述的快速识别邮件附件的方法,其特征在于,在步骤一之前需要准备模板图片,用户事先通过Windows的截图工具截取、保存为模板图片。
4.如权利要求3所述的快速识别邮件附件的方法,其特征在于,截图采用Rectangle类、Graphics类来实现;在模拟鼠标、键盘移动页面屏幕、点击下载、点击下一封的操作方面,采用MouseEventFlag类、SendKeysAPI函数来实现;在后台热键方面,采用调用RegisterHotKey、UnregisterHotKeyDLL来实现。
5.如权利要求1所述的快速识别邮件附件的方法,其特征在于,在步骤二后需要采用模板图片与大图对比、匹配的方法来实现图像识别。
6.如权利要求5所述的快速识别邮件附件的方法,其特征在于,全局变量实现自定义截取大图,再对大图进行忽略浅色背景、GB合并映射为单字节的方法进行预处理;然后将模板图片的特征点与大图进行比较匹配;命中则自动的逐个点击下载,没有附件则自动进入下一封未读邮件进行匹配。
CN201510092726.7A 2015-03-03 2015-03-03 一种快速识别邮件附件的方法 Pending CN104766198A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510092726.7A CN104766198A (zh) 2015-03-03 2015-03-03 一种快速识别邮件附件的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510092726.7A CN104766198A (zh) 2015-03-03 2015-03-03 一种快速识别邮件附件的方法

Publications (1)

Publication Number Publication Date
CN104766198A true CN104766198A (zh) 2015-07-08

Family

ID=53648012

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510092726.7A Pending CN104766198A (zh) 2015-03-03 2015-03-03 一种快速识别邮件附件的方法

Country Status (1)

Country Link
CN (1) CN104766198A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105630375A (zh) * 2015-12-18 2016-06-01 北京帮你玩科技有限公司 基于图形界面的信息输入的辅助实现方法和系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102075449A (zh) * 2009-11-25 2011-05-25 联想(北京)有限公司 电子邮件管理方法、装置和终端设备
CN102830958A (zh) * 2011-06-16 2012-12-19 奇智软件(北京)有限公司 一种获取界面控件信息的方法及系统
CN103136094A (zh) * 2011-11-25 2013-06-05 阿里巴巴集团控股有限公司 一种页面测试方法及装置
CN103257879A (zh) * 2013-05-24 2013-08-21 安徽易众网络科技有限公司 利用屏幕截图安装软件和配置软件的方法
CN103823758A (zh) * 2014-03-13 2014-05-28 北京金山网络科技有限公司 一种浏览器测试方法及装置
CN104516812A (zh) * 2013-09-27 2015-04-15 腾讯科技(深圳)有限公司 一种软件测试方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102075449A (zh) * 2009-11-25 2011-05-25 联想(北京)有限公司 电子邮件管理方法、装置和终端设备
CN102830958A (zh) * 2011-06-16 2012-12-19 奇智软件(北京)有限公司 一种获取界面控件信息的方法及系统
CN103136094A (zh) * 2011-11-25 2013-06-05 阿里巴巴集团控股有限公司 一种页面测试方法及装置
CN103257879A (zh) * 2013-05-24 2013-08-21 安徽易众网络科技有限公司 利用屏幕截图安装软件和配置软件的方法
CN104516812A (zh) * 2013-09-27 2015-04-15 腾讯科技(深圳)有限公司 一种软件测试方法和装置
CN103823758A (zh) * 2014-03-13 2014-05-28 北京金山网络科技有限公司 一种浏览器测试方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105630375A (zh) * 2015-12-18 2016-06-01 北京帮你玩科技有限公司 基于图形界面的信息输入的辅助实现方法和系统

Similar Documents

Publication Publication Date Title
CN102830958B (zh) 一种获取界面控件信息的方法及系统
US7623710B2 (en) Document content and structure conversion
CN107633239B (zh) 基于深度学习和ocr的票据分类及票据字段提取方法
CN108415887B (zh) 一种pdf文件向ofd文件转化的方法
CN103049750B (zh) 字符识别方法
CN108090423B (zh) 一种基于热力图和关键点回归的深度车牌检测方法
KR102595704B1 (ko) 영상 검측 방법, 장치, 전자 기기, 저장 매체 및 프로그램
CN102750541B (zh) 一种文档图像分类识别方法及装置
CN108761451B (zh) 一种基于多时相遥感影像的土地利用变化智能理解方法
WO2021189870A1 (zh) 违法建筑识别方法、装置、设备及存储介质
CN101295359B (zh) 图像处理装置及图像处理方法
CN101859225B (zh) 通过数字描红实现文字和表格快速录入的方法
CN104778470B (zh) 基于组件树和霍夫森林的文字检测和识别方法
CN106960208A (zh) 一种仪表液晶数字自动切分和识别的方法及系统
KR102634484B1 (ko) 정보 추출 방법, 장치, 기기 및 저장 매체
CN109934227A (zh) 图像文字识别系统和方法
CN111833303A (zh) 产品的检测方法、装置、电子设备及存储介质
CN104376260A (zh) 一种基于香农信息熵的恶意代码可视化分析方法
CN103500457A (zh) 一种视频图像偏色检测的方法
CN104766198A (zh) 一种快速识别邮件附件的方法
CN106940804A (zh) 建筑工程物料管理系统表单数据自动录入方法
CN110263784A (zh) 智能的英语试卷成绩识别录入方法
CN104035661B (zh) 一种超高分辨率拼接墙的光标显示方法及装置
CN112822393B (zh) 图像处理方法、装置及电子设备
CN108536495B (zh) 一种Excel软件操作信息获取方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150708

WD01 Invention patent application deemed withdrawn after publication