CN109271993A - 一种文件扫描系统、计算机设备及可读存储介质 - Google Patents

一种文件扫描系统、计算机设备及可读存储介质 Download PDF

Info

Publication number
CN109271993A
CN109271993A CN201811136499.3A CN201811136499A CN109271993A CN 109271993 A CN109271993 A CN 109271993A CN 201811136499 A CN201811136499 A CN 201811136499A CN 109271993 A CN109271993 A CN 109271993A
Authority
CN
China
Prior art keywords
image
document scanning
scanning system
processor
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201811136499.3A
Other languages
English (en)
Inventor
徐常柏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201811136499.3A priority Critical patent/CN109271993A/zh
Publication of CN109271993A publication Critical patent/CN109271993A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)

Abstract

公开了一种文件扫描系统、计算机设备及可读存储介质,包括图像采集单元,使用所述使用终端的摄像头进行图像采集;处理器,处理器用于接收所述图形采集单元采集的文件图像,并执行以下处理:对所述图像进行预处理;利用OCR框架进行字符识别;输出识别结果作为手机文件扫描结果;生成扫描文件。本发明通过终端设备的实时扫描,基于实时采集的文件图像,获得文本文件识别结果,以文本文件形式生成,实现文件扫描实时获取。

Description

一种文件扫描系统、计算机设备及可读存储介质
技术领域
本发明涉及文件扫描领域,更具体地,涉及一种文件扫描系统、计算机设备及可读存储介质。
背景技术
字符是人类文明发展历史的产物,是人类沟通的工具。字符识别是一个模板识别领域的大多数主题都可以满足最基本的问题。字符识别是一个利用计算机和图像处理技术在各个领域起着重要的作用。工业使用字符识别是非常重要的,它的发展水平已经吸引到了图像界的关注,原因在于:一方面,字符识别技术的发展是非常困难的,难度不仅在于字符图像识别系统,在于实际应用的复杂性和应用部门成本承受能力;另一方面,图像识别发展的效益非常显著,其实际应用系统将产生巨大的经济效益和社会效益。例如,车牌号码识别、手写字符识别,字符识别技术已广泛应用于电脑、手机。
就目前而言,越来越多的情况需要人们利用便携式终端进行实时的文件扫描,获得扫描后的文本文件,进而对文本文件进行编辑。因此,有必要开发一种文件扫描系统、计算机设备及可读存储介质。
公开于本发明背景技术部分的信息仅仅旨在加深对本发明的一般背景技术的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。
发明内容
本发明提出了一种文件扫描系统、计算机设备及可读存储介质,其能够通过终端设备的实时扫描,获得文本文件识别结果,基于获得的扫描结果再进行其他文件操作。
根据本发明的第一方面,提出了一种文件扫描系统,其应用于使用人的使用终端。所述文件扫描系统包括:
图像采集单元,使用所述使用终端的摄像头进行图像采集;
处理器,所述处理器用于接收所述图形采集单元采集的文件图像,并执行以下处理步骤:
1)对所述图像进行预处理;
2)利用OCR框架进行字符识别;
3)输出识别结果作为手机文件扫描结果;
4)生成扫描文件。
优选地,在步骤1)中,所述图像预处理包括图像二值化处理。
优选地,在步骤1)中,所述预处理包括图像锐化处理。
优选地,在步骤1)中,所述预处理包括图像中值滤波处理。
优选地,在步骤1)中,所述预处理包括线性灰度变换。
优选地,在步骤1)中,所述预处理还包括黑白图转换。
优选地,在步骤2)中,所述OCR框架处理包括:
2-1)提取字符图像特征;
2-2)将所述字符图像特征与样本库特征进行匹配;
2-3)基于特征匹配识别字符。
优选地,在步骤2-1)中,通过以下方式进行特征提取:
2-1-1)搜索字符区域,找出字符区域的上、下、左、右边界;
2-1-2)将字符区域平均分成n*n的小区域;
2-1-2)计算每个区域中像素的所占比例,获得特征结果。
根据本发明的第二方面,提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机可执行指令,其特征在于,所述处理器执行所述计算机可执行指令时第一方面任一项所述的文件扫描系统。
根据本发明的第三方面,提出了一种可读存储介质,其特征在于,所述可读存储介质上存储有指令,所述指令被处理器执行以完成第一方面任一项所述的文件扫描系统。
本发明的有益效果在于,基于实时采集的文件图像,获得图像识别结果,以文本文件形式生成,实现文件扫描实时获取。
本发明具有其它的特性和优点,这些特性和优点从并入本文中的附图和随后的具体实施方式中将是显而易见的,或者将在并入本文中的附图和随后的具体实施方式中进行详细陈述,这些附图和具体实施方式共同用于解释本发明的特定原理。
附图说明
通过结合附图对本发明示例性实施例进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显,其中,在本发明示例性实施例中,相同的参考标号通常代表相同部件。
图1示出了根据本发明的示例性实施例的处理器执行处理的步骤的流程图;
图2示出了中值滤波算法原理示意图。
具体实施方式
下面将参照附图更详细地描述本发明。虽然附图中显示了本发明的优选实施例,然而应该理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本发明更加透彻和完整,并且能够将本发明的范围完整地传达给本领域的技术人员。
根据本发明的第一方面,提出了一种文件扫描系统,其应用于使用人的使用终端。所述文件扫描系统包括:
图像采集单元,使用所述使用终端的摄像头进行图像采集;
处理器,处理器用于接收所述图形采集单元采集的文件图像,并执行如图1所示的处理步骤:
步骤1:对所述图像进行预处理;
步骤2:利用OCR框架进行字符识别;
步骤3:输出识别结果作为手机文件扫描结果;
步骤4:生成文本扫描文件。
在一个示例中,图像预处理包括图像二值化处理。
具体地,图像二值化处理的图像灰度设置为0或255,或整个图像黑白效果明显。大约256个亮度等级的灰度图像通过适当的阈值选择和可以反映整体形象和地方特色的二进制图像。为了得到理想的二进制图像,一般不使用封闭的边界和连接定义重叠区域。所有灰度等于或大于阈值的像素被归类为属于一个特定的对象,灰度值是255,否则,说这些像素被排除在区域灰度值是0,表示背景或异常对象区域。
在一个示例中,预处理包括图像锐化处理。
具体地,图像的平滑往往是在图像的模糊边界,为了减少这种负面影响的影响,这需要使用图像锐化技术,使图像的边缘是明确的。图像锐化处理,使图像的边缘、轮廓和细节的目的是图像的清晰,平滑的图像模糊的根本原因是图像收到平均或积分操作,因此在逆操作(如微分操作)可以使图像清晰。图像频域考虑,因为高频分量的衰减的本质是模糊,因此高通滤波器可以使图像清晰。
在一个示例中,预处理包括图像中值滤波处理。
具体地,值滤波是基于排序统计理论的一种能有效抑制噪声的非线性信号处理技术,中值滤波的基本原理是把数字图像或数字序列中一点的值用该点的一个邻域中各点值的中值代替,让周围的像素值接近的真实值,从而消除孤立的噪声点。方法是用某种结构的二维滑动模板,将板内像素按照像素值的大小进行排序,生成单调上升(或下降)的为二维数据序列。二维中值滤波输出为g(x,y)=med{f(x-k,y-l),(k,l∈W)},其中,f(x,y),g(x,y)分别为原始图像和处理后图像。W为二维模板,通常为3*3,5*5区域,也可以是不同的的形状,如线状,圆形,十字形,圆环形等。
本发明采用的中值滤波算法原理如图2所示,通过从图像中的某个采样窗口取出奇数个数据进行排序,用排序后的中值取代所有要进行处理的数据。
在一个示例中,预处理包括线性灰度变换。
具体地,灰度的线性变换就是将图像中所有的点按照线性灰度变换函数进行变换。该线性灰度变换函数f(x)是一个一维线性函数:
f(x)=fA*x+fB
灰度变换方程为:
D2=f(D1)=fA*D+fB
式中参数fA为线性函数的斜率,fB为线性函数的在y轴上的截距,D1为输入图像的灰度,D2为输出的图像灰度。当fA>1时,输出的图像的对比度增大;当fA<1时,输出图像的对比度将减小;当fA=1且fB!=0时,操作仅仅使所有像素的灰度值上移或下移,其效果是使整个图像更亮或更暗;特殊情况下,如果fA=1,fB=0时,输出图像和输入图像相同;当fA=-1,fB=255时,输出图像的灰度正好反转。
在一个示例中,预处理还包括黑白图转换。
具体地,所述黑白图转换采用java已经封装好的算法进行转换,所述算法函数为grayFilter()。
在一个示例中,OCR框架处理包括:
2-1)提取字符图像特征;
2-2)将所述字符图像特征与样本库特征进行匹配;
2-3)基于特征匹配识别字符。
在一个示例中,通过以下方式进行特征提取:
2-1-1)搜索字符区域,找出字符区域的上、下、左、右边界;
2-1-2)将字符区域平均分成n*n的小区域;
2-1-2)计算每个区域中像素的所占比例,获得特征结果。
具体地,通过以下公式计算每个区域中像素所占比例:
其中,图片的行为x,列为y,hi为第i个区域像素为0的参数。
根据根据本发明的另一方面,提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机可执行指令,其特征在于,所述处理器执行所述计算机可执行指令时第一方面任一项所述的文件扫描系统。
根据本发明的再一方面,提出了一种可读存储介质,其特征在于,所述可读存储介质上存储有指令,所述指令被处理器执行以完成第一方面任一项所述的文件扫描系统。
综上所述,本发明通过其能够通过终端设备的实时扫描,基于实时采集的文件图像,获得文本文件识别结果,以文本文件形式生成,实现文件扫描实时获取。
本领域技术人员应理解,上面对本发明的实施例的描述的目的仅为了示例性地说明本发明的实施例的有益效果,并不意在将本发明的实施例限制于所给出的任何示例。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。

Claims (10)

1.一种文件扫描系统,其应用于使用人的使用终端,其特征在于,包括:
图像采集单元,使用所述使用终端的摄像头进行图像采集;
处理器,所述处理器用于接收所述图形采集单元采集的文件图像,并执行以下处理步骤:
1)对所述图像进行预处理;
2)利用OCR框架进行字符识别;
3)输出识别结果作为手机文件扫描结果;
4)生成扫描文件。
2.根据权利要求1所述的文件扫描系统,其特征在于,在步骤1)中,所述图像预处理包括图像二值化处理。
3.根据权利要求1所述的所述的文件扫描系统,其特征在于,在步骤1)中,所述预处理包括图像锐化处理。
4.根据权利要求1所述的所述的文件扫描系统,其特征在于,在步骤1)中,所述预处理包括图像中值滤波处理。
5.根据权利要求1所述的所述的文件扫描系统,其特征在于,在步骤1)中,所述预处理包括线性灰度变换。
6.根据权利要求1所述的所述的文件扫描系统,其特征在于,在步骤1)中,所述预处理还包括黑白图转换。
7.根据权利要求1所述的所述的文件扫描系统,其特征在于,在步骤2)中,所述OCR框架处理包括:
2-1)提取字符图像特征;
2-2)将所述字符图像特征与样本库特征进行匹配;
2-3)基于特征匹配识别字符。
8.根据权利要求7所述的所述的文件扫描系统,其特征在于,在步骤2-1)中,通过以下方式进行特征提取:
2-1-1)搜索字符区域,找出字符区域的上、下、左、右边界;
2-1-2)将字符区域平均分成n*n的小区域;
2-1-2)计算每个区域中像素的所占比例,获得特征结果。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机可执行指令,其特征在于,所述处理器执行所述计算机可执行指令时实现权利要求1-8任一项所述的文件扫描系统。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有指令,所述指令被处理器执行以完成权利要求1-8任一项所述的文件扫描系统。
CN201811136499.3A 2018-09-28 2018-09-28 一种文件扫描系统、计算机设备及可读存储介质 Withdrawn CN109271993A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811136499.3A CN109271993A (zh) 2018-09-28 2018-09-28 一种文件扫描系统、计算机设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811136499.3A CN109271993A (zh) 2018-09-28 2018-09-28 一种文件扫描系统、计算机设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN109271993A true CN109271993A (zh) 2019-01-25

Family

ID=65198049

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811136499.3A Withdrawn CN109271993A (zh) 2018-09-28 2018-09-28 一种文件扫描系统、计算机设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN109271993A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117475453A (zh) * 2023-12-25 2024-01-30 欣诚信息技术有限公司 一种基于ocr的文书检测方法、装置及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101789080A (zh) * 2010-01-21 2010-07-28 上海交通大学 车辆车牌实时定位字符分割的检测方法
CN102693431A (zh) * 2012-05-31 2012-09-26 信帧电子技术(北京)有限公司 一种白色车牌类型的识别方法及装置
CN103065146A (zh) * 2012-12-24 2013-04-24 广东电网公司电力调度控制中心 用于电力通信机房哑设备标识牌的文字识别方法
CN104268814A (zh) * 2014-10-11 2015-01-07 北京网秦天下科技有限公司 生成电子病历的方法和装置
CN107220640A (zh) * 2017-05-23 2017-09-29 广州绿怡信息科技有限公司 字符识别方法、装置、计算机设备和计算机可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101789080A (zh) * 2010-01-21 2010-07-28 上海交通大学 车辆车牌实时定位字符分割的检测方法
CN102693431A (zh) * 2012-05-31 2012-09-26 信帧电子技术(北京)有限公司 一种白色车牌类型的识别方法及装置
CN103065146A (zh) * 2012-12-24 2013-04-24 广东电网公司电力调度控制中心 用于电力通信机房哑设备标识牌的文字识别方法
CN104268814A (zh) * 2014-10-11 2015-01-07 北京网秦天下科技有限公司 生成电子病历的方法和装置
CN107220640A (zh) * 2017-05-23 2017-09-29 广州绿怡信息科技有限公司 字符识别方法、装置、计算机设备和计算机可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
TONG WU: "An Improved Descriptor for Chinese Character Recognition", 《2009 THIRD INTERNATIONAL SYMPOSIUM ON INTELLIGENT INFORMATION TECHNOLOGY APPLICATION》 *
胡提坤: "基于OCR快递单据识别的研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117475453A (zh) * 2023-12-25 2024-01-30 欣诚信息技术有限公司 一种基于ocr的文书检测方法、装置及电子设备
CN117475453B (zh) * 2023-12-25 2024-02-27 欣诚信息技术有限公司 一种基于ocr的文书检测方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN111401372B (zh) 一种扫描文档图文信息提取与鉴别的方法
Mohammad et al. Optical character recognition implementation using pattern matching
CN105426829B (zh) 基于人脸图像的视频分类方法和装置
CN110738203B (zh) 字段结构化输出方法、装置及计算机可读存储介质
Sarawat Anam et al. Face recognition using genetic algorithm and back propagation neural network
Singh et al. Adaptive binarization of severely degraded and non-uniformly illuminated documents
Demilew et al. Ancient Geez script recognition using deep learning
CN109271993A (zh) 一种文件扫描系统、计算机设备及可读存储介质
Amin et al. A binarization algorithm for historical arabic manuscript images using a neutrosophic approach
CN111445402B (zh) 一种图像去噪方法及装置
CN106295478A (zh) 一种图像特征提取方法和装置
CN109344826A (zh) 一种字符识别方法及系统
JP3906221B2 (ja) 画像処理方法及び画像処理装置
Liang et al. Robust table recognition for printed document images
CN110929561B (zh) 表格文本智能过滤方法、装置及计算机可读存储介质
Krupiński et al. Improved two-step binarization of degraded document images based on Gaussian mixture model
Subramani et al. A novel binarization method for degraded tamil palm leaf images
CN110717516B (zh) 票据图像分类方法、装置及计算机可读存储介质
CN108596280A (zh) 用于文献搜索的图片识别方法
Boiangiu et al. Bitonal image creation for automatic content conversion
Yang OCR oriented binarization method of document image
Divya et al. Edge detection technique by fuzzy logic CLA and canny edge detector using fuzzy image processing
Kieri Context dependent thresholding and filter selection for optical character recognition
WO2015044187A1 (en) Document image processing
Singh et al. Noise Removal Technique for Document Images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20190125

WW01 Invention patent application withdrawn after publication