CN101339618A - 手机名片识别装置 - Google Patents
手机名片识别装置 Download PDFInfo
- Publication number
- CN101339618A CN101339618A CNA2007100435412A CN200710043541A CN101339618A CN 101339618 A CN101339618 A CN 101339618A CN A2007100435412 A CNA2007100435412 A CN A2007100435412A CN 200710043541 A CN200710043541 A CN 200710043541A CN 101339618 A CN101339618 A CN 101339618A
- Authority
- CN
- China
- Prior art keywords
- unit
- engine
- interface
- image
- business card
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
本发明公开了一种手机名片识别装置,包括:电话簿,其特征在于还有一个拍照设备单元;一个UI单元;一个字符特征图像识别引擎(OCR engine)单元;一个适配器接口单元。本发明具有实用性强,输入方便,效率高的优点。
Description
技术领域
本发明涉及数字图像处理领域、模式识别领域及嵌入式设备领域,特别涉及一种手机名片识别装置。
背景技术
随着手持设备的发展和普及,手机已经越来越成为人们日常生活必不可少的联系工具,而名片是商务人士简明美观的信息载体,如何使繁忙的商务人士从繁复的手动名片输入解放出来,手机名片识别的实现将满足了商务人士快速录入名片内容的需求,嵌入式平台系统所具有的内存运行空间小、运行速度慢以及系统平台多样化特点也对名片识别系统开发的系统结构建造和系统的移植能力提出了挑战。而如何使用更低配置(最低104MHZ主频arm处理器)的手机实现名片拍照识别的功能,独立于照相机和名片扫描管理,在嵌入式的手机平台上实现通过手机上的数码摄相机(带有近拍功能)识别拍摄进来的整张名片图像,手动操作来实现名片的扫描输入、识别、分类到手机通讯录。
发明内容
本发明的目的是提供一种名片识别装置。
本发明的目的是通过以下技术方案实现的:
一种手机的名片识别装置,包括电话簿,其特征在于,还有:图像识别(OCR)引擎单元,用于将名片数字图像中的字符转换成字符标准内码;
一个适配器单元,用于连接不同OCR引擎的接口,从而实现多OCR引擎产品的快速整合;
一个至少具有130万像素且具有微距功能的拍摄单元,用于拍摄获取名片的数字图像;
一个图像预处理单元,用于将拍摄的图像转换成OCR引擎所能识别的图像格式,通过二值化方式将图像压缩,用于提升识别速度;
一个用户界面单元,用于与用户交互,向导用户使用该用户界面;以及
一个储存管理单元,用于显示储存管理识别结果。
其中,该OCR引擎单元包括:
引擎库单元,用于存储字符特征向量;
引擎设置单元,用于设置运行模式或数字图像参数;
引擎启动单元,用于分配运行空间、将引擎库装载入内存,启动该引擎启动单元为可执行状态;
引擎版面分析单元,用于划分版面,分割各区域,将可识别字符用连通区域框定;
引擎识别单元,用于识别连通区内的数字图像,根据数字图像直观形象提取特征进行识别;
引擎关闭单元,释放内存空间,关闭所述各引擎单元。
该适配器单元包括:
初始化接口单元;识别名片接口单元;图像载入接口单元;版面分析接口单元;引擎退出接口单元。它们用于传递界面向OCR引擎的请求,以及引擎向界面传递结果的统一接口。
该图像预处理单元:从照相设备单元获取数字图像,该图像分辨率在1280×960以上,Jpg图像经过硬件解码转为16位rgb图像,从16位rgb图像转化为8位灰度bmp格式图像,然后对图像进行二值化处理。
二值图像是指整幅图像画面内仅黑(灰度值为0)白(灰度值为1)二值的图像,在它们上面不呈现出灰度的变化。在数字图像处理中,二值图像占有非常重要的地位。这是因为在实用的图像处理系统中,要求处理的速度高、成本低,信息量大的浓淡图像处理花销太大,不是上策。而且二值化后的图像能够用几何学中的概念进行分析和特征描述,比起灰度图像来说方便得多。因而二值图像处理目前已成为图像处理中的一个独立的、重要分支而获得广泛的应用。
设表示像素在(i,j)位置的灰度值,二值化处理为下式所示。
这里t为二值化阈值(Threshold)。像素的8-邻域(8-Neighbor),除去d-近邻的像素外,余下的对角线上的4个像素,称为(i,j)的非直接邻域,符号是:i-近邻。某个像素的连接数可以用这个像素的8-邻域值f(x0)…f(x7)来计算。
当xk=x8时,令x8=x0
对于一个像素的8-邻域的所有可能存在的值,按照上式进行计算,其连接数总是取0-4之间的值。文字的自动识别过程中,需要把二值图像进行细化,还可以大大减少冗余的信息。
二值化图像 细化图像
用户界面单元包括:预览界面,版面分析界面,条目选择界面,名片储存管理界面。
本发明的优点是:1、实用性强,满足了商务人士快速录入名片的需求;2、使用低配置,由手机实现名片拍摄,独立于照相机和名片扫描管理,由手动操作来实现名片的扫描输入、识别、分类到手机通讯录、效率高、操作方便。
附图说明
图1为本发明实施例的结构框图;
图2为本发明实施例的流程示意图;
图3为本发明实施例的engine流程示意图。
图4-1~图4-4为本发明实施例的用户界面单元的操作流程示意图。
具体实施方式
下面根据图1~图4-4给出本发明一个较好实施例,并予以详细描述,使本技术领域的技术人员能更易于理解本发明的结构特征和功能特色,而不是用来限定本发明的范围。
请参阅图1所示,本发明的手机名片识别装置包括由图像识别(OCR)引擎5,用于将名片数字图像中的字符转换成字符标准内码;适配器接口单元1,用于连接不同OCR引擎产品的接口,用以实现多OCR引擎产品的快速整合;用户界面2,用于与用户交互,向导用户使用该功能界面;图像预处理单元3,用于将拍摄的图像转换成OCR引擎与所能识别的图像格式,通过将图像二值化压缩,以提升识别速度;照相设备(即拍摄单元4),用于拍摄获取名片的数字图像,其至少具有130万像素且具有微距功能;以及电话簿6。
所述的适配器接口单元1,其包括引擎初始化单元11、图像载入单元12、版面分析单元13、选择名片条目14、识别名片单元15、和引擎退出单元16。
所述的用户界面2包括预览界面21、提示界面22、设置界面23、版面分析界面24、条目选择界面25、退出界面26。
所述的照相设备4包括相机预览41、相机调节42、相机拍照43和相机退出43。
所述的OCR引擎5包括引擎设置51、名片版面分析52、识别名片条目53、字符识别54和引擎关闭55。
请参阅图2所示,本发明装置的运行流程100,其步骤包括:
S1000,处于退出状态;
S1001,初始化,包括OCR引擎初始化和相机初始化,如果初始化失败则退回S1000,
S1002,名片预览,包括相机预览和相机调节,若对预览不满意,执行S1000,
S1003,名片拍摄,包括相机拍摄和图像转换,若拍摄失败,则返回S1002。
S1004,版面分析,包括可识别区域显示与框定,若无可识别区域,则返回执行S1002。
S1005,选择识别,包括选取识别区域、选择区域条目类别,OCR引擎字符识别和名片内容显示编辑,若不能进行名片内容显示编辑,则返回执行S1004;
S1006,名片结果,包括将结果存入电话簿、若此步骤还要继续下去,则跳回执行S1002;若步骤结束,则跳回执行S1000、处于退出状态。
请参阅图3所示,其示出OCR引擎的运行流程200,如图所示:
S2000,启动操作;
S2001,启动名片识别引擎;
S2002,设置名片引擎属性;
S2003,名片图像处理;
S2004,名片输出,
S2005,判断是否还有名片输出?若还有输出,则返回执行S2003,若没有名片输出,则执行S2006;
S2006,关闭名片识别引擎;
S2007,程序200运行结束。
请参阅图4-1~图4-4,其示出了本发明的用户界面单元的操作流程,如图所示,具体流程为:1′、拍摄名片,预览名片图像。2′、点击“识别”,几秒钟后,名片上出现栏目画框;例如,通过键盘或触笔选择了“中国上海西姆通科技有限公司”栏目。3′、弹出备选栏目名菜单;例如选择“公司”,则刚才选择的名片图象上的“中国上海西姆通科技有限公司”栏内容就被识别入该条通讯录的“公司”字段栏目中。4′、重复执行“继续”+“识别”操作后,完成对整张名片图象上各栏目内容归类,点击“完成”来结束识别过程,“完成”后显示所有识别结果编辑界面,点击“保存”存入系统通讯录中。
Claims (4)
1、一种手机名片识别装置,包括电话簿,其特征在于,还有
一OCR引擎单元,用于将名片数字图像中的字符转换成字符标准内码;
一适配器单元,用于连接不同OCR引擎接口,以实现多个OCR引擎产品的快速整合;
一拍摄单元,用于拍摄获取名片的数字图像,其至少具有130万像素且具有微距功能;
一图像预处理单元,用于将拍摄的图像转换成OCR引擎所能识别的图像格式并将图像进行二值化压缩,以提升识别速度;
一用户识别单元,用于与用户交互,向导用户使用该界面;
一储存管理单元,用于显示储存管理识别结果。
2、根据权利要求1所述的名片识别装置,其特征在于,所述OCR引擎单元包括:
引擎库单元,用于存储字符特征向量;
引擎设置单元,用于设置运行模式或数字图像参数;
引擎启动单元,用于分配运行空间,将引擎库装载入内存,启动该引擎启动单元为可执行状态;
引擎版面分析单元,用于划分版面,分割各区域,将可识别字符用连通区域框定;
引擎识别单元,用于识别连通区内的数字图像,根据数字图像直观形象提取特征进行识别;
引擎关闭单元,释放内存空间,关闭所述各引擎单元。
3、根据权利要求1所述的名片识别装置,其特征在于,所述的适配器单元包括:初始化接口单元、图像载入接口单元、版面分析接口单元、引擎退出接口单元。
4、根据权利要求1所述的名片识别装置,其特征在于,所述的用户界面单元,包括预览界面、版面分析界面、条目选择界面和名片储存管理界面。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2007100435412A CN101339618A (zh) | 2007-07-06 | 2007-07-06 | 手机名片识别装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2007100435412A CN101339618A (zh) | 2007-07-06 | 2007-07-06 | 手机名片识别装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101339618A true CN101339618A (zh) | 2009-01-07 |
Family
ID=40213683
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2007100435412A Pending CN101339618A (zh) | 2007-07-06 | 2007-07-06 | 手机名片识别装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101339618A (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102298651A (zh) * | 2010-06-23 | 2011-12-28 | 株式会社锦宫事务 | 卡片信息管理装置 |
CN103209254A (zh) * | 2013-02-26 | 2013-07-17 | 广东欧珀移动通信有限公司 | 一种利用纸质便签进行手机事务管理的方法及装置 |
CN103679117A (zh) * | 2012-09-07 | 2014-03-26 | 北京蒙恬科技有限公司 | 一种名片识别方法与装置 |
CN103716505A (zh) * | 2012-09-28 | 2014-04-09 | 北京蒙恬科技有限公司 | 图像识别系统及方法 |
WO2014086287A1 (zh) * | 2012-12-05 | 2014-06-12 | 上海合合信息科技发展有限公司 | 文本图像自动切分方法及装置,自动切分手写条目的方法 |
CN104020847A (zh) * | 2014-05-15 | 2014-09-03 | 上海合合信息科技发展有限公司 | 字符输入方法及装置 |
CN104376281A (zh) * | 2014-10-29 | 2015-02-25 | 上海天涛智能科技有限公司 | 基于移动网络的面单识别系统 |
CN104700286A (zh) * | 2013-12-09 | 2015-06-10 | 郑锦聪 | 客户自动化管理及行销系统 |
CN105868974A (zh) * | 2015-12-07 | 2016-08-17 | 乐视移动智能信息技术(北京)有限公司 | 资源处理方法及装置 |
CN106708247A (zh) * | 2016-12-31 | 2017-05-24 | 南京仁光电子科技有限公司 | 识别电子设备的智能交互系统及其交互方法 |
CN106709496A (zh) * | 2016-12-31 | 2017-05-24 | 南京仁光电子科技有限公司 | 识别文字信息的智能交互系统及其交互方法 |
CN106708396A (zh) * | 2016-12-31 | 2017-05-24 | 南京仁光电子科技有限公司 | 识别文字信息的智能交互系统及其识别文字信息的方法 |
CN106815561A (zh) * | 2016-12-22 | 2017-06-09 | 北京五八信息技术有限公司 | 营业执照版面分析方法及装置 |
CN108090488A (zh) * | 2017-12-18 | 2018-05-29 | 广东广业开元科技有限公司 | 一种基于大数据ocr物联网的人工智能工会信息录入系统 |
CN111143213A (zh) * | 2019-12-24 | 2020-05-12 | 北京数衍科技有限公司 | 软件自动化测试方法和装置及电子设备 |
-
2007
- 2007-07-06 CN CNA2007100435412A patent/CN101339618A/zh active Pending
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102298651A (zh) * | 2010-06-23 | 2011-12-28 | 株式会社锦宫事务 | 卡片信息管理装置 |
CN103679117A (zh) * | 2012-09-07 | 2014-03-26 | 北京蒙恬科技有限公司 | 一种名片识别方法与装置 |
CN103679117B (zh) * | 2012-09-07 | 2016-09-07 | 北京蒙恬科技有限公司 | 一种名片识别方法与装置 |
CN103716505A (zh) * | 2012-09-28 | 2014-04-09 | 北京蒙恬科技有限公司 | 图像识别系统及方法 |
WO2014086287A1 (zh) * | 2012-12-05 | 2014-06-12 | 上海合合信息科技发展有限公司 | 文本图像自动切分方法及装置,自动切分手写条目的方法 |
CN103209254A (zh) * | 2013-02-26 | 2013-07-17 | 广东欧珀移动通信有限公司 | 一种利用纸质便签进行手机事务管理的方法及装置 |
CN103209254B (zh) * | 2013-02-26 | 2015-01-21 | 广东欧珀移动通信有限公司 | 一种利用纸质便签进行手机事务管理的方法及装置 |
CN104700286A (zh) * | 2013-12-09 | 2015-06-10 | 郑锦聪 | 客户自动化管理及行销系统 |
CN104020847A (zh) * | 2014-05-15 | 2014-09-03 | 上海合合信息科技发展有限公司 | 字符输入方法及装置 |
CN104376281A (zh) * | 2014-10-29 | 2015-02-25 | 上海天涛智能科技有限公司 | 基于移动网络的面单识别系统 |
CN104376281B (zh) * | 2014-10-29 | 2019-03-12 | 上海天涛智能科技有限公司 | 基于移动网络的面单识别系统 |
CN105868974A (zh) * | 2015-12-07 | 2016-08-17 | 乐视移动智能信息技术(北京)有限公司 | 资源处理方法及装置 |
CN106815561A (zh) * | 2016-12-22 | 2017-06-09 | 北京五八信息技术有限公司 | 营业执照版面分析方法及装置 |
CN106708247A (zh) * | 2016-12-31 | 2017-05-24 | 南京仁光电子科技有限公司 | 识别电子设备的智能交互系统及其交互方法 |
CN106709496A (zh) * | 2016-12-31 | 2017-05-24 | 南京仁光电子科技有限公司 | 识别文字信息的智能交互系统及其交互方法 |
CN106708396A (zh) * | 2016-12-31 | 2017-05-24 | 南京仁光电子科技有限公司 | 识别文字信息的智能交互系统及其识别文字信息的方法 |
CN106709496B (zh) * | 2016-12-31 | 2022-01-21 | 南京仁光电子科技有限公司 | 识别文字信息的智能交互系统及其交互方法 |
CN108090488A (zh) * | 2017-12-18 | 2018-05-29 | 广东广业开元科技有限公司 | 一种基于大数据ocr物联网的人工智能工会信息录入系统 |
CN111143213A (zh) * | 2019-12-24 | 2020-05-12 | 北京数衍科技有限公司 | 软件自动化测试方法和装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101339618A (zh) | 手机名片识别装置 | |
CN1278533C (zh) | 可自动录入文字、图像的手机及其录入与处理方法 | |
KR100664421B1 (ko) | 구비된 카메라를 이용한 명함 인식을 위한 휴대용 단말기및 명함 인식 방법 | |
CN101339617A (zh) | 手机拍照翻译装置 | |
US20060103893A1 (en) | Cellular telephone based document scanner | |
US7623742B2 (en) | Method for processing document image captured by camera | |
CN102193771B (zh) | 会议系统、信息处理装置以及显示方法 | |
US8917275B2 (en) | Automated contrast verifications | |
JPWO2004015619A1 (ja) | 文字認識処理装置及び文字認識処理方法、並びに携帯端末装置 | |
JP2002366941A (ja) | パームオフィスアシスタント | |
CN103440247A (zh) | 发送照片的方法及其设备 | |
CN103678260A (zh) | 一种便携式电子名片簿及处理方法 | |
CN101976265A (zh) | 自动判断电话号码并添加联系人的方法 | |
CN103327182A (zh) | 快速发送图片的方法及其移动终端 | |
CN101889429A (zh) | 用于将影像与数据相关联的方法和装置 | |
US20060008156A1 (en) | Method and apparatus for generating electronic document by continuously photographing document in moving picture | |
KR20050017316A (ko) | 카메라를 구비한 휴대용 단말기에서의 주소록 관리 장치및 방법 | |
CN102073847A (zh) | 一种扫描装置和扫描方法 | |
CN101764898B (zh) | 快捷拨号方法、客户端及系统 | |
KR101451562B1 (ko) | 휴대용 단말기의 데이터 저장 방법 및 장치 | |
CN1313716A (zh) | 便携式信息终端装置和信息通信系统 | |
CN1988564A (zh) | 一种利用姓氏分类查找通信录的方法 | |
JP2001148004A (ja) | 情報処理装置及びその方法、コンピュータ可読メモリ | |
CN101872344A (zh) | 一种图像扫描的控制方法 | |
CN101373403A (zh) | 一种通过名片识别技术在地址簿中自动生成并添加图标的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20090107 |