CN101668071A - 具备扫描功能的移动通信终端及其实现方法 - Google Patents

具备扫描功能的移动通信终端及其实现方法 Download PDF

Info

Publication number
CN101668071A
CN101668071A CN200910109319A CN200910109319A CN101668071A CN 101668071 A CN101668071 A CN 101668071A CN 200910109319 A CN200910109319 A CN 200910109319A CN 200910109319 A CN200910109319 A CN 200910109319A CN 101668071 A CN101668071 A CN 101668071A
Authority
CN
China
Prior art keywords
mobile communication
communication terminal
literal
image
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200910109319A
Other languages
English (en)
Inventor
刘蒽蒽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huizhou TCL Mobile Communication Co Ltd
Original Assignee
Huizhou TCL Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huizhou TCL Mobile Communication Co Ltd filed Critical Huizhou TCL Mobile Communication Co Ltd
Priority to CN200910109319A priority Critical patent/CN101668071A/zh
Publication of CN101668071A publication Critical patent/CN101668071A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明适用于移动通信终端,提供了一种具备扫描功能的移动通信终端及其实现方法,所述的方法包括:a.移动通信终端的摄像头拍摄扫描对象,采集所述扫描对象的图像;b.对采集的图像进行处理,从中提取出字形;c.将提取的字形与所述移动通信终端存储的字库匹配,识别所述字形对应的文字。本发明提供的技术方案可以在几乎不增加硬件成本的基础上扩展移动通信终端的功能,使得移动通信终端可以作为便携式扫描设备使用,显著提升了产品的性价比,满足了用户需求。

Description

具备扫描功能的移动通信终端及其实现方法
技术领域
本发明属于移动通信技术领域,尤其涉及一种具备扫描功能的移动通信终端及其实现方法。
背景技术
移动通信终端,如手机等,其普及程度越来越高,同时移动通信终端的配置也越来越全。这些配置除了用来满足基本的通信需求外,还能满足用户多方面的需求,如现有的移动通通信终端中,摄像头(camera)都已成为基本配置,并且摄像头的分辨率越来越高,用来供用户即时拍摄感兴趣的场景或者人物。但是,由于消费人群的年龄层次或者使用习惯的不同,对于部分消费者,移动通信终端的拍照功能在生活中的使用并不多,摄像头对一些用户来说,基本就是闲置的配置。
对很多用户来说,经常需要将纸质文件扫描成电子文档,以方便在电脑中存储或者通过网络传递,因此需要扫描设备,尤其是轻巧便携的扫描设备。而移动通信终端对用户来说,基本都是随身携带,而如何充分利用移动通信终端的已有硬件,将其摄像头作为图像采集设备,实现对纸质文件的文字扫描及识别功能,将移动通信终端作为便携式扫描设备,是现有技术尚未解决的问题。
发明内容
本发明的目的在于提供一种具备扫描功能的移动通信终端及其实现方法,旨在解决通过移动通信终端对文件进行扫描的问题。
本发明是这样实现的,一种移动通信终端实现扫描的方法,所述的方法包括:
a、移动通信终端的摄像头拍摄扫描对象,采集所述扫描对象的图像;
b、对采集的图像进行处理,从中提取出字形;
c、将提取的字形与所述移动通信终端存储的字库匹配,识别所述字形对应的文字。
其中步骤b具体包括:
b1、对采集的图像进行预处理,经过图像分割及特征提取,从中提取出字形。
其中步骤c之后还包括:
将识别出的文字显示在所述移动通信终端的显示屏上。
其中步骤c之后还包括:
将识别出的文字存储在所述移动通信终端的存储空间。
其中步骤c之后还包括:
将识别出的文字与所述移动通信终端存储的语音库匹配,查找所述文字对应的语音数据,通过所述移动通信终端的扬声器播放匹配到的语音。
本发明还提供了一种具备扫描功能的移动通信终端,所述的移动通信终端包括摄像头、图像预处理模块、字形提取模块、文字识别模块和存储器,其中:
所述摄像头用来对扫描对象进行图像采集,将采集所得图像传输到所述图像预处理模块;
所述图像预处理模块用来对所述摄像头采集的图像进行预处理,将处理后的图像传输到所述字形提取模块;
所述字形提取模块用来从所述图像预处理模块传输的图像中提取出字形,将提取出的字形传输到所述文字识别模块;
所述文字识别模块用来将提取的字形与存储器中存储的字库匹配,识别所述图像中的文字;
所述存储器用来存储所述字库。
所述字形提取模块用来对所述图像预处理模块传输的图像进行图像分割及特征提取,从中提取出字形。
其还包括显示处理模块和显示屏,所述显示处理模块用来接收所述文字识别模块传输的文字,对所述文字进行显示处理,将处理后的文字信息传输到所述显示屏,所述显示屏用来显示所述文字。
所述文字识别模块还用来将识别出的文字传输到所述存储器,所述存储器用来以电子文档形式存储所述文字。
其还包括语音匹配模块、声音处理模块和扬声器,所述存储器还用来存储语音库,所述语音匹配模块用来接收所述文字识别模块识别出的文字,将识别出的文字与所述语音库进行匹配,查找所述文字对应的语音数据,将所述语音数据传输到所述声音处理模块,所述声音处理模块用来对所述语音数据进行处理,将处理后的语音信息传输到所述扬声器,所述扬声器用来播放所述语音数据对应的语音。
本发明克服现有技术的不足,利用移动通信终端的摄像头对纸质文件进行扫描,对扫描所得图像进行预处理及特征提取,获取扫描图像中的字形,将所获得的字形与存储的字库进行匹配,识别出扫描图像中的文字。本发明提供的技术方案可以在几乎不增加硬件成本的基础上扩展移动通信终端的功能,使得移动通信终端可以作为便携式扫描设备使用,显著提升了产品的性价比,满足了用户需求。
附图说明
图1是本发明实施例流程图;
图2是本发明实施例提供的移动通信终端原理框图。
具体实施方式
本发明提供的技术方案是:利用移动通信终端的摄像头对纸质文件进行扫描,对扫描所得图像进行预处理及特征提取,获取扫描图像中的字形,将所获得的字形与存储的字库进行匹配,识别出扫描图像中的文字。
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
具体实现本发明提供的技术方案时,可以在移动通信终端的功能菜单中设置一个“扫描”选项,用户通过开启该选项来启动移动通信终端的文字扫描及识别功能。当移动通信终端的文字扫描及识别功能被启动后,系统自动将摄像头的拍摄模式设置为黑白,只获取纯灰度照片。此后用户可以采用拍照方式对需要扫描的纸质文件(本发明中称扫描对象)进行图像采集,移动通信终端对采集所得的图像进行去噪等预处理,进而经由图像分割(二值化)及特征提取等步骤,获得图像中最重要的信息——字形。然后系统将获取的字形与其存储的字库进行匹配,对文字进行识别。
移动通信终端识别出扫描对象中的文字之后,可以采用两种处理方式进行后续处理,分别满足用户的不同需求:一种是根据识别结果生成文件,如word格式的文件,将生成的文件传输到移动通信终端的显示屏显示,以方便用户阅读,还可以将生成的文件存储到移动通信终端的存储空间,以方便用户将纸质文档转换为电子文档;另一种是将识别出的文字与存储的语音库进行匹配,查找对应的语音数据,通过其扬声器播放匹配得到的语音数据。
具体来说,摄像头扫描所得的图像中可能包括字型文字,如汉字,也可能包括字母文字,如英文字母,甚至可能包括字型文字和字母文字的混合。这样,系统进行文字识别时,对于字母文字,需要区分单个的字母与多个字母组合的单词,对于字型文字,则需要结合上下文信息进行识别,以提高识别的精度。
此外,虽然移动通信终端的存储空间越来越大,但为避免字库或者语音库占用过大的存储空间,字库和语音库可以利用移动通信终端本身即具有的字库和语音库,对于移动通信终端所不支持的文字种类,可以根据需要适当添加,存储到其存储空间内。
本发明实施例流程图如图1所示,具体包括如下的步骤:
1、调用移动通信终端功能菜单,通过该菜单中的“扫描”选项启动文字扫描及识别功能;
2、利用移动通信终端的摄像头对扫描对象进行图像采集;
3、移动通信终端对采集所得的图像进行去噪等预处理;
4、经过图像分割及特征提取,获得采集所得的图像中字形;
5、将获取的字形与存储的字库进行匹配,对文字进行识别;
6、根据识别结果生成文件,将生成的文件通过移动通信终端的显示屏显示;或者,将识别出的文字与存储的语音库进行匹配,通过扬声器播放查找到的语音数据。
本发明实施例提供的移动通信终端原理框图如图2所示,包括摄像头、图像预处理模块、字形提取模块、文字识别模块、语音匹配模块、显示处理模块、显示屏、声音处理模块、扬声器和存储器。
其中,摄像头与图像预处理模块相连,用来对扫描对象进行图像采集,将采集所得图像传输到图像预处理模块;
图像预处理模块与字形提取模块相连,用来对摄像头采集的图像进行预处理,如去噪等,将处理后的图像传输到字形提取模块;
字形提取模块与文字识别模块相连,用来对图像预处理模块传输的图像进行图像分割(二值化)及特征提取,从中提取出字形,将提取出的字形传输到文字识别模块;
文字识别模块与存储器、显示处理模块和语音匹配模块相连,用来将提取的字形与存储器中存储的字库匹配,识别采集图像中的文字,并将识别出的文字传输到显示处理模块和语音匹配模块,也可以将识别出的文字传输到存储器中存储,形成电子文档;
显示处理模块与显示屏相连,用来对文字识别模块传输的文字进行显示处理,将处理后的文字信息送显示屏显示;
显示屏用来显示采集图像中的文字;
语音匹配模块与存储器和声音处理模块相连,用来将文字识别模块传输的文字与存储器中存储的语音数据进行匹配,查找对应的语音数据,并将查找到的语音数据传输到声音处理模块;
声音处理模块与扬声器相连,用来对语音匹配模块传输的语音数据进行处理,将处理后的语音信息传输到扬声器播放;
扬声器用来播放采集图像中文字对应的语音;
所述存储器用来存储所述字库、语音库,以及以电子文档形式存储文字识别模块传输的文字。
上述的摄像头、图像预处理模块、显示处理模块、显示屏、声音处理模块、扬声器和存储器,以及存储器中存储的字库和语音库等,都可以利用移动通信终端的已有配置,本发明提供的技术方案可以在几乎不增加硬件成本的基础上扩展移动通信终端的功能,显著提升了产品的性价比。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1、一种移动通信终端实现扫描的方法,所述的方法包括:
a、移动通信终端的摄像头拍摄扫描对象,采集所述扫描对象的图像;
b、对采集的图像进行处理,从中提取出字形;
c、将提取的字形与所述移动通信终端存储的字库匹配,识别所述字形对应的文字。
2、根据权利要求1所述的方法,其特征在于,其中步骤b具体包括:
b1、对采集的图像进行预处理,经过图像分割及特征提取,从中提取出字形。
3、根据权利要求1所述的方法,其特征在于,其中步骤c之后还包括:
将识别出的文字显示在所述移动通信终端的显示屏上。
4、根据权利要求1所述的方法,其特征在于,其中步骤c之后还包括:
将识别出的文字存储在所述移动通信终端的存储空间。
5、根据权利要求1所述的方法,其特征在于,其中步骤c之后还包括:
将识别出的文字与所述移动通信终端存储的语音库匹配,查找所述文字对应的语音数据,通过所述移动通信终端的扬声器播放匹配到的语音。
6、一种具备扫描功能的移动通信终端,其特征在于,所述的移动通信终端包括摄像头、图像预处理模块、字形提取模块、文字识别模块和存储器,其中:
所述摄像头用来对扫描对象进行图像采集,将采集所得图像传输到所述图像预处理模块;
所述图像预处理模块用来对所述摄像头采集的图像进行预处理,将处理后的图像传输到所述字形提取模块;
所述字形提取模块用来从所述图像预处理模块传输的图像中提取出字形,将提取出的字形传输到所述文字识别模块;
所述文字识别模块用来将提取的字形与存储器中存储的字库匹配,识别所述图像中的文字;
所述存储器用来存储所述字库。
7、根据权利要求6所述的移动通信终端,其特征在于,所述字形提取模块用来对所述图像预处理模块传输的图像进行图像分割及特征提取,从中提取出字形。
8、根据权利要求6所述的移动通信终端,其特征在于,其还包括显示处理模块和显示屏,所述显示处理模块用来接收所述文字识别模块传输的文字,对所述文字进行显示处理,将处理后的文字信息传输到所述显示屏,所述显示屏用来显示所述文字。
9、根据权利要求6所述的移动通信终端,其特征在于,所述文字识别模块还用来将识别出的文字传输到所述存储器,所述存储器用来以电子文档形式存储所述文字。
10、根据权利要求6所述的移动通信终端,其特征在于,其还包括语音匹配模块、声音处理模块和扬声器,所述存储器还用来存储语音库,所述语音匹配模块用来接收所述文字识别模块识别出的文字,将识别出的文字与所述语音库进行匹配,查找所述文字对应的语音数据,将所述语音数据传输到所述声音处理模块,所述声音处理模块用来对所述语音数据进行处理,将处理后的语音信息传输到所述扬声器,所述扬声器用来播放所述语音数据对应的语音。
CN200910109319A 2009-08-14 2009-08-14 具备扫描功能的移动通信终端及其实现方法 Pending CN101668071A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910109319A CN101668071A (zh) 2009-08-14 2009-08-14 具备扫描功能的移动通信终端及其实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910109319A CN101668071A (zh) 2009-08-14 2009-08-14 具备扫描功能的移动通信终端及其实现方法

Publications (1)

Publication Number Publication Date
CN101668071A true CN101668071A (zh) 2010-03-10

Family

ID=41804503

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910109319A Pending CN101668071A (zh) 2009-08-14 2009-08-14 具备扫描功能的移动通信终端及其实现方法

Country Status (1)

Country Link
CN (1) CN101668071A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105338386A (zh) * 2015-10-22 2016-02-17 深圳创想未来机器人有限公司 基于图像处理和语音处理的视频设备控制装置及方法
CN106815581A (zh) * 2017-01-19 2017-06-09 珠海格力电器股份有限公司 一种文档录入方法、系统及电子设备
CN108055462A (zh) * 2017-12-21 2018-05-18 广东小天才科技有限公司 一种数据录入方法及装置
CN108733687A (zh) * 2017-04-18 2018-11-02 陈伯妤 一种基于文字识别的信息检索方法和系统
CN110781900A (zh) * 2019-10-25 2020-02-11 李东洋 一种基于模式识别的汉字识别系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105338386A (zh) * 2015-10-22 2016-02-17 深圳创想未来机器人有限公司 基于图像处理和语音处理的视频设备控制装置及方法
CN105338386B (zh) * 2015-10-22 2019-03-26 深圳创想未来机器人有限公司 基于图像处理和语音处理的视频设备控制装置及方法
CN106815581A (zh) * 2017-01-19 2017-06-09 珠海格力电器股份有限公司 一种文档录入方法、系统及电子设备
CN108733687A (zh) * 2017-04-18 2018-11-02 陈伯妤 一种基于文字识别的信息检索方法和系统
CN108055462A (zh) * 2017-12-21 2018-05-18 广东小天才科技有限公司 一种数据录入方法及装置
CN110781900A (zh) * 2019-10-25 2020-02-11 李东洋 一种基于模式识别的汉字识别系统

Similar Documents

Publication Publication Date Title
CN108885614B (zh) 一种文本和语音信息的处理方法以及终端
KR101220709B1 (ko) 한글 및 한자가 혼용된 문서에 대한 전자 사전 검색 장치 및 방법
CN101287214A (zh) 通过移动终端获取信息并应用的方法和系统
CN105094760A (zh) 一种图片标记方法及装置
US10360455B2 (en) Grouping captured images based on features of the images
CN104468959A (zh) 移动终端通话过程中显示图像的方法、装置及移动终端
CN101976265A (zh) 自动判断电话号码并添加联系人的方法
CN104021398A (zh) 一种可穿戴智能设备及辅助身份识别的方法
CN101017613A (zh) 移动无线广用型阅读笔超媒体系统与方法
CN107330040B (zh) 一种学习题目搜索方法及其系统
KR20100120753A (ko) 문자인식을 위한 이미지 센서 및 이미지 센싱 방법
CN101668071A (zh) 具备扫描功能的移动通信终端及其实现方法
KR100547738B1 (ko) 카메라를 구비한 휴대용 단말기에서의 주소록 관리 장치및 방법
CN1486115A (zh) 便携式电话机
CN105631461A (zh) 一种图像识别系统及方法
JP2007018166A (ja) 情報検索装置、情報検索システム、情報検索方法及び情報検索プログラム
JP4668345B1 (ja) 情報処理装置、および情報処理装置の制御方法
CN103546613A (zh) 联系人记录方法、装置和移动终端
CN101373403B (zh) 一种通过名片识别技术在地址簿中自动生成并添加图标的方法
CN101872344A (zh) 一种图像扫描的控制方法
KR20060031769A (ko) 촬영문자를 음성 변환하는 기능을 갖는 이동통신 단말기및 그 방법
CN201741167U (zh) 图像采集及识别系统
CN202798887U (zh) 一种智能终端及系统
JP2005135210A (ja) 文字認識機能を有する携帯機器
CN104123391A (zh) 一种通过识别手机文件内容中的联系人信息实现快捷通讯的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20100310