CN102622592B - 一种基于云技术的名片识别方法 - Google Patents

一种基于云技术的名片识别方法 Download PDF

Info

Publication number
CN102622592B
CN102622592B CN201210018293.7A CN201210018293A CN102622592B CN 102622592 B CN102622592 B CN 102622592B CN 201210018293 A CN201210018293 A CN 201210018293A CN 102622592 B CN102622592 B CN 102622592B
Authority
CN
China
Prior art keywords
business card
digital
name card
terminal
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210018293.7A
Other languages
English (en)
Other versions
CN102622592A (zh
Inventor
朱胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Micro network (Beijing) Technology Development Co.,Ltd.
Micro-blog talent (Beijing) Technology Development Co.,Ltd.
Very excellent (Beijing) Technology Development Co.,Ltd.
Original Assignee
Beijing Youlu On-Line Science & Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Youlu On-Line Science & Technology Development Co Ltd filed Critical Beijing Youlu On-Line Science & Technology Development Co Ltd
Priority to CN201210018293.7A priority Critical patent/CN102622592B/zh
Publication of CN102622592A publication Critical patent/CN102622592A/zh
Application granted granted Critical
Publication of CN102622592B publication Critical patent/CN102622592B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种基于云技术的名片识别方法,属于信息技术领域。本方法为:1)名片识别终端采集名片的图片,并将其上传到云端数据服务器;2)数据服务器将该名片图片转发至OCR识别服务器,重建一数字名片;3)识别服务器将识别后的数据发送给数据服务器;数据服务器在通过审核数字名片中查找匹配的名片,标记该数字名片中与匹配名片不一致的属性;4)审核终端对该数字名片进行审核,判断是否与对应名片图片内容符合;如果符合,则标记为通过审核;如果不符合,则发送成功信息给录入终端;如果无法识别,则发送失败信息给识别终端;5)录入终端修改该数字名片的识别信息后,将其发送给数据服务器。本发明大大提高名片识别的准确性和效率。

Description

一种基于云技术的名片识别方法
技术领域
本发明涉及一种基于云技术的名片识别方法,结合OCR(Optical Character Recognition,光学字符识别)识别高效性和人工审核准确性,并通过云技术将识别结果快速地返回给识别终端。本发明属于信息技术处理领域。
背景技术
名片在日常的商务活动、社交活动有着重要的作用,名片识别也因此成为非常实用的功能。目前主要的名片识别方法依赖OCR技术,使用OCR对名片中的文字进行识别,然后根据名片的文字信息重新组建一个数字化名片。然而由于光照、背景、图片质量等因素,OCR并不能达到一个十分理想的效果,即使是电话或者邮箱中错一个字符,也会导致用户通信失败。OCR识别的结果需要用户手动矫正名片识别结果,这影响了名片识别的效率。
云计算,是一种基于互联网的计算方式,通过这种方式,共享资源和信息可以按需提供给计算机和其他设备。
发明内容
针对现有现有名片识别技术中存在的技术问题,本发明提出一种准确高效的名片识别方法,本发明使用云技术对名片进行识别,实现准确性和录入效率的最优结合。
本发明的技术方案为:
一种基于云技术的名片识别方法,其步骤为:
1)名片识别终端采集名片的图片,并将其上传到云端数据服务器;
2)数据服务器将该名片图片转发至OCR识别服务器;OCR识别服务器识别该名片图片中的文字,重建一数字名片,并将图片名片的保存路径、该数字名片及数字名片中每一属性的准确度存储到数据库中;
3)OCR识别服务器将识别后的数据发送给数据服务器;数据服务器在存储的通过审核数字名片中查找与该数字名片匹配的名片并进行比较,标记该数字名片中与匹配名片不一致的属性;
4)审核终端对该数字名片进行审核,判断是否与对应名片图片内容符合;如果符合,则将该数字名片标记为通过审核并发送给识别终端;如果不符合,则将该数字名片标记为重新识别并标明出错的原因后发送给录入终端进行人工录入;如果名片图片无法识别,则将该数字名片标记为识别失败并发送给识别终端;
5)录入终端根据该数字名片对应的名片图片修改该数字名片的识别信息后,将其发送给数据服务器。
进一步的,所述名片识别终端对该采集的图片进行切分提取出名片,得到一矩形的灰度的名片图片。
进一步的,所述数据服务器根据邮箱、和/或电话、和/或姓名识别信息在存储的通过审核数字名片中查找与该数字名片匹配的名片并进行比较,标记不一致属性。
进一步的,所述数据服务器对待审核的名片按照时间顺序和识别的准确度排序,审核终端按照排序对数字名片进行审核。
进一步的,所述录入终端根据该数字名片中的电话或者邮箱识别信息从数据服务器存储的通过审核数字名片数据库中查找匹配的数字名片,如果有,则将匹配的数字名片信息填充到该数字名片的录入属性中,供录入终端修改。
进一步的,OCR识别服务器识别文字同时获取文字的准确度。
与现有技术相比,本发明的积极效果为:
1)结合OCR文字技术和基于云技术人工审核,最优地发挥自动化识别的效率与人工识别的准确性。OCR识别能够批量高效识别名片中的文字,然而准确性不高。人工录入名片准确可靠,但效率不高。本发明使用云技术将OCR识别,人工录入,人工审核有效的结合起来,达到效率和准确性的最优结合。
2)名片录入时首先录入名片中易于输入的属性(如电话,邮箱),从现有数字名片数据库中查询名片,使用已经录入的数字名片提高名片录入的效率。要识别的名片中可能会有大量重复的名片,录入人员重新录入这些名片不仅浪费时间,而且还可能出现差错。从现有数字名片数据库中检索出这些名片,自动将属性填充到录入界面,录入人员只用编辑那些不一致部分。日常生活中,邮箱具有很高的唯一性,电话号码虽然不唯一但是易于输入,通过电话号码或者邮箱检索数字名片可以有效提高录入效率。
3)OCR识别后的数字名片与通过审核的数字名片进行比较来提醒审核人员需要关注的属性。OCR识别是不可靠的,使用OCR识别的文字也是基于统计的结果。OCR识别的结果与现有通过审核的名片不一致的地方,往往是OCR识别发生错误的地方,或者将要识别的名片中改动的地方,标记这些属性可以方便审核人员快速发现识别中错误。
附图说明
附图为本发明的方法流程图。
具体实施方式
下面结合附图对本发明的实施方式进行进一步的描述:
1.拍摄名片。名片识别终端使用摄像头拍摄名片的图片。
2.名片切分。使用参考文献[http://research.microsoft.com/en-us/um/people/zhang/Papers/WhiteboardRectification.pdf]提供的算法识别并切分名片。名片切分后,得到一个矩形的灰度的名片图片。切分后的名片方便OCR识别,提高OCR识别的成功率,同时减少上传数据的大小。
3.上传图片。将提取的名片图片上传到数据服务器(云端),数据服务器将图片转发至OCR识别服务器。
4.OCR识别。OCR识别服务器使用OCR引擎识别名片图片中的文字,根据文字内容和版式重建数字名片,OCR识别文字的同时获取该文字识别的准确度,将其保存到数字名片的属性中。将数字名片、属性的准确度和图片名片的保存路径存储到数据库中。
名片中包含姓名、公司、职位、地址、邮编、电话(移动电话,固定电话)、电子邮箱、传真、公司网址等信息。部分属性会出现明确的属性名称,如电话、邮箱、传真,这些属性可以根据属性名称确定。而姓名、公司、职位、地址、邮编等字段没有属性名,可以根据名片的文字内容、版式进行区分。例如姓名往往是字号最大的字体,公司名中会经常出现“公司”字样,地址中会出现“省”、“市”,邮编紧跟在地址后面等等。准确度用来给审核人员指出重点审核部分。准确度为0表示OCR识别失败。OCR失败的名片图片由录入人员进行人工录入。
5.初步校验。数据服务器收到OCR识别后的数据(数字名片和识别准确度)后,根据邮箱,和/或电话,和/或姓名字段为唯一标识在现有数据库中通过审核的名片查找匹配的名片并进行比较,标记提交数字名片不一致的属性。
6.审核。审核人员登录审核终端,通过审核终端查看需要审核的名片。审核终端可以是网页,也可以是独立的审核客户端程序,其中网页的兼容性做好。审核终端显示OCR识别的准确度和步骤5标记的不一致属性,作为重点审核属性。根据数字名片的准确性做如下处理:
a)数字名片与名片图片内容符合。审核人员将名片标记为通过审核,该数字名片将作为名片识别的结果由数字服务器下发到识别终端。
b)数字名片与名片图片内容不符合,数字名片中出现错误或者遗漏。审核人员将名片标记为重新识别,并标明出错的原因。该名片将会由录入人员进行人工录入。
c)名片图片本身不是名片,或者看不清楚。审核人员将名片标记为识别失败。最终识别终端将会收到失败的信息,并提示给用户。
此外,待审核的名片按照时间顺序和识别准确度排序,以保证名片按照上传的顺序从易到难被审核。
7.录入。录入人员登录录入终端(网页或者录入客户端程序),查看标记为重新识别的数字名片,即需要人工录入的名片。参考数字名片对应的名片图片,录入人员可以修改现有数字名片的属性,也可以添加遗漏的名片属性。修改完成的数字名片将会被提交给数据服务器,由审核人员重新审核。如果名片图片不是名片,或者看不清楚,录入人员将名片标记为识别失败。
录入人员开始录入时,首先输入名片中的电话号码(或邮箱,如果没有电话号码)。录入终端根据输入电话号码或者邮箱从数据服务器现有数字名片数据库中查询保存的数字名片。如果找到数字名片,录入终端将数据库中找到的数字名片填充到录入属性中,供录入人员修改,以提高录入的效率。
8.返回识别结果。数据服务器将通过审核的数字名片和识别失败的名片下发给识别终端,识别终端将识别结果提示给用户并保存到用户的通讯录中。

Claims (5)

1.一种基于云技术的数字名片构建方法,其步骤为:
1)名片识别终端采集名片的图片,并将其上传到云端数据服务器;
2)数据服务器将该名片图片转发至OCR识别服务器;OCR识别服务器识别该名片图片中的文字,重建一数字名片,并将图片名片的保存路径、该数字名片及数字名片中每一属性的准确度存储到数据库中;
3)OCR识别服务器将识别后的数据发送给数据服务器;数据服务器在存储的通过审核数字名片中查找与该数字名片匹配的名片并进行比较,标记该数字名片中与匹配名片不一致的属性;
4)所述数据服务器对待审核的名片按照时间顺序和识别的准确度排序,审核终端按照排序对该数字名片进行审核,判断是否与对应名片图片内容符合;如果符合,则将该数字名片标记为通过审核并发送给识别终端;如果不符合,则将该数字名片标记为重新识别并标明出错的原因后发送给录入终端进行人工录入;如果名片图片无法识别,则将该数字名片标记为识别失败并发送给识别终端;
5)录入终端根据该数字名片对应的名片图片修改该数字名片的识别信息后,将其发送给数据服务器。
2.如权利要求1所述的方法,其特征在于所述名片识别终端对该采集的图片进行切分提取出名片,得到一矩形的灰度的名片图片。
3.如权利要求1所述的方法,其特征在于所述数据服务器根据邮箱、和/或电话、和/或姓名识别信息在存储的通过审核数字名片中查找与该数字名片匹配的名片并进行比较,标记不一致属性。
4.如权利要求1所述的方法,其特征在于所述录入终端根据该数字名片中的电话或者邮箱识别信息从数据服务器存储的通过审核数字名片数据库中查找匹配的数字名片,如果有,则将匹配的数字名片信息填充到该数字名片的录入属性中,供录入终端修改。
5.如权利要求1所述的方法,其特征在于OCR识别服务器识别文字同时获取文字的准确度。
CN201210018293.7A 2012-01-19 2012-01-19 一种基于云技术的名片识别方法 Expired - Fee Related CN102622592B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210018293.7A CN102622592B (zh) 2012-01-19 2012-01-19 一种基于云技术的名片识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210018293.7A CN102622592B (zh) 2012-01-19 2012-01-19 一种基于云技术的名片识别方法

Publications (2)

Publication Number Publication Date
CN102622592A CN102622592A (zh) 2012-08-01
CN102622592B true CN102622592B (zh) 2015-04-22

Family

ID=46562502

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210018293.7A Expired - Fee Related CN102622592B (zh) 2012-01-19 2012-01-19 一种基于云技术的名片识别方法

Country Status (1)

Country Link
CN (1) CN102622592B (zh)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020119A (zh) * 2012-11-16 2013-04-03 北京北森测评技术有限公司 将纸版简历转化为电子版的转化方法、装置与系统
CN103020593A (zh) * 2012-11-30 2013-04-03 深圳市络道科技有限公司 从大客户速递邮件中识别出拼凑邮件的方法及系统
CN103942212B (zh) * 2013-01-21 2018-01-09 腾讯科技(深圳)有限公司 一种用户界面的文字检测方法及装置
CN103136660A (zh) * 2013-03-13 2013-06-05 上海合合信息科技发展有限公司 扩展名片信息的方法及系统
CN103235946A (zh) * 2013-04-08 2013-08-07 上海合合信息科技发展有限公司 人工识别名片信息的防泄密处理方法
CN103297500B (zh) * 2013-05-02 2017-06-20 前锦网络信息技术(上海)有限公司 通过软体跳转的联系人添加方法及系统
CN103297421A (zh) * 2013-05-02 2013-09-11 觅林网络科技(上海)有限公司 通过应用跳转的联系人添加方法及系统
CN103279743A (zh) * 2013-05-28 2013-09-04 深圳市中兴移动通信有限公司 一种名片识别的方法和装置
CN103354559A (zh) * 2013-06-25 2013-10-16 觅林网络科技(上海)有限公司 通过封装sdk的联系人添加方法及系统
CN103399842A (zh) * 2013-07-03 2013-11-20 惠州Tcl移动通信有限公司 一种无线通讯设备中文档处理的方法及系统
CN103533169A (zh) * 2013-10-17 2014-01-22 林高敏 一种基于移动终端电子名片的字段定位链接方法
CN103617422B (zh) * 2013-10-29 2017-01-11 浙江工业大学 一种基于名片识别的社交关系管理方法
CN111062256B (zh) * 2013-12-03 2024-03-01 中兴通讯股份有限公司 一种数据提取、录入方法及装置
CN104915428B (zh) * 2015-06-15 2018-08-17 广东小天才科技有限公司 一种智能腕带设备信息查询、推送的方法、装置及智能腕带设备
CN105335344B (zh) * 2015-09-30 2018-10-19 北京橙鑫数据科技有限公司 电子名片的校核处理方法、云服务器及用户设备
CN105354536A (zh) * 2015-09-30 2016-02-24 北京橙鑫数据科技有限公司 电子名片的处理方法和装置
CN105787028A (zh) * 2016-02-24 2016-07-20 北京橙鑫数据科技有限公司 一种名片校对方法及系统
TWI612480B (zh) * 2016-05-09 2018-01-21 有無科技股份有限公司 文字影像辨識系統及操作文字影像辨識系統的方法
CN106709488A (zh) * 2016-12-20 2017-05-24 深圳市深信服电子科技有限公司 名片识别方法及装置
CN106650722A (zh) * 2017-01-03 2017-05-10 北京航星永志科技有限公司 信息校核方法及装置
CN108696477A (zh) * 2017-04-06 2018-10-23 上海安继行信息技术股份有限公司 在线注册登记方法及系统
CN107122987B (zh) * 2017-06-20 2020-05-08 深圳安巽科技有限公司 一种通缉令诈骗的预警系统及方法
CN107403140A (zh) * 2017-07-04 2017-11-28 南京律智诚专利技术开发有限公司 一种名片信息识别和名片图像匹配管理方法
CN109858014A (zh) * 2018-12-10 2019-06-07 西南石油大学 语言信息主动校对系统及其主动校对方法
CN115086470B (zh) * 2022-05-31 2024-03-29 广东二进制科技有限公司 一种通过手机实现面对面传输名片的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1329323A (zh) * 2001-07-31 2002-01-02 郭根龙 证件自动扫描识别与管理方法及其系统
CN101882227A (zh) * 2010-07-13 2010-11-10 上海合合信息科技发展有限公司 基于图像匹配和网络查询的识别方法及系统
CN101916258A (zh) * 2010-07-13 2010-12-15 上海合合信息科技发展有限公司 通过网络查询自动校正识别结果的方法及系统
CN102231188A (zh) * 2011-07-05 2011-11-02 上海合合信息科技发展有限公司 结合文字识别和图像匹配的名片识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102082818B (zh) * 2010-12-01 2014-05-14 黄启明 基于云存储的图形化和结构化数据存储及管理方法和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1329323A (zh) * 2001-07-31 2002-01-02 郭根龙 证件自动扫描识别与管理方法及其系统
CN101882227A (zh) * 2010-07-13 2010-11-10 上海合合信息科技发展有限公司 基于图像匹配和网络查询的识别方法及系统
CN101916258A (zh) * 2010-07-13 2010-12-15 上海合合信息科技发展有限公司 通过网络查询自动校正识别结果的方法及系统
CN102231188A (zh) * 2011-07-05 2011-11-02 上海合合信息科技发展有限公司 结合文字识别和图像匹配的名片识别方法

Also Published As

Publication number Publication date
CN102622592A (zh) 2012-08-01

Similar Documents

Publication Publication Date Title
CN102622592B (zh) 一种基于云技术的名片识别方法
CN109858453B (zh) 一种通用的多引擎票据识别系统及方法
US10031927B2 (en) Facial recognition with social network aiding
CN110362372B (zh) 页面转译方法、装置、介质及电子设备
CN103368992B (zh) 一种信息推送方法及装置
CN101000623A (zh) 通过手机拍照进行图像识别搜索的方法及采用该方法的装置
US10528626B2 (en) Document processing
CN101882227B (zh) 基于图像匹配和网络查询的识别方法及系统
US20170324691A1 (en) Electronic mail data management systems and methods for generating a dataset for such systems
CN103473289A (zh) 一种通信地址补全的装置及方法
US8752204B2 (en) Identifying and redacting privileged information
US20150278248A1 (en) Personal Information Management Service System
US10216837B1 (en) Selecting pattern matching segments for electronic communication clustering
CN103533169A (zh) 一种基于移动终端电子名片的字段定位链接方法
CN108897862A (zh) 一种基于政府公文图片检索方法及系统
CN107403140A (zh) 一种名片信息识别和名片图像匹配管理方法
JP2012059083A (ja) システム
CN111191153A (zh) 一种信息技术咨询服务展示装置
CN105049341A (zh) 给新增即时通讯号码自动添加备注信息的方法及装置
CN109214362B (zh) 单据处理方法及相关设备
CN101980156A (zh) 自动提取电子邮件地址并新建电子邮件的方法
CA2850883A1 (en) Image processing
CN112417195A (zh) 基于移动端的商标查询系统、方法及存储介质
TWI688868B (zh) 用於提取訊息並使用所述訊息擷取聯絡人訊息的系統、非暫時性電腦可讀媒體和方法
KR20100071765A (ko) 온라인 망을 이용한 맞춤형 정보 제공 시스템 및 그 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 100081 Beijing city Haidian District Zizhuyuan Road No. 5 Guangyuan Guangyuan Gate Building 3 room 321B

Patentee after: Very excellent (Beijing) Technology Development Co.,Ltd.

Address before: 100081 Beijing city Haidian District Zizhuyuan Road No. 5 Guangyuan Guangyuan Gate Building 3 room 321B

Patentee before: Micro-blog talent (Beijing) Technology Development Co.,Ltd.

Address after: 100081 Beijing city Haidian District Zizhuyuan Road No. 5 Guangyuan Guangyuan Gate Building 3 room 321B

Patentee after: Micro-blog talent (Beijing) Technology Development Co.,Ltd.

Address before: 100081 Beijing city Haidian District Zizhuyuan Road No. 5 Guangyuan Guangyuan Gate Building 3 room 321B

Patentee before: Micro network (Beijing) Technology Development Co.,Ltd.

CP03 Change of name, title or address

Address after: 100081 Beijing city Haidian District Zizhuyuan Road No. 5 Guangyuan Guangyuan Gate Building 3 room 321B

Patentee after: Micro network (Beijing) Technology Development Co.,Ltd.

Address before: 100027, Dongcheng District, Beijing new West 13 boulder building, west five

Patentee before: BEIJING YOULU ONLINE TECHNOLOGIES DEVELOPMENT Co.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150422

Termination date: 20170119