CN107657230A - 一种银行自助机器人文字识别装置 - Google Patents

一种银行自助机器人文字识别装置 Download PDF

Info

Publication number
CN107657230A
CN107657230A CN201710889548.XA CN201710889548A CN107657230A CN 107657230 A CN107657230 A CN 107657230A CN 201710889548 A CN201710889548 A CN 201710889548A CN 107657230 A CN107657230 A CN 107657230A
Authority
CN
China
Prior art keywords
module
segmentation
word
recognition device
character image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710889548.XA
Other languages
English (en)
Inventor
王冬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Shuo Wei Intelligent Technology Co Ltd
Original Assignee
Anhui Shuo Wei Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Shuo Wei Intelligent Technology Co Ltd filed Critical Anhui Shuo Wei Intelligent Technology Co Ltd
Priority to CN201710889548.XA priority Critical patent/CN107657230A/zh
Publication of CN107657230A publication Critical patent/CN107657230A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种银行自助机器人文字识别装置,包括控制处理器、文字图像撷取模块、文字图像分割模块、文字识别模块、数据库、语音提醒模块、手写输入模块和便捷修改模块,所述控制处理器分别与所述文字图像撷取模块、文字图像分割模块、文字识别模块、数据库、文字显示模块、语音提醒模块、手写输入模块和便捷修改模块电性连接。本发明通过采用局部阈值法与动态阈值法结合的方法进行图像的二值化,以及采用基于边缘检测分割与基于区域的分割结合的方法进行模块分割,提高了文字从图像中提取的精准度,提高了文字识别正确率,且通过便捷修改模块修正文字识别出现的误差,既方便又防止出错。

Description

一种银行自助机器人文字识别装置
技术领域
本发明涉及文字识别技术领域,具体为一种银行自助机器人文字识别装置。
背景技术
随着人数字识别技术和图像识别技术的快速发展,图像文字识别技术给人们带来越来越实惠的便利。现有专利CN103310210A提供了一种提供文字识别装置,为了提高文字识别的精度,对不同大小的多个输入图像进行归一化,以使在同一文字间的形状的偏差变小。根据输入图像执行用于降低干扰因素的预处理,提取执行了上述预处理后的图像的轮廓,将执行了预处理后的图像和提取到的轮廓的图像合成,以合成出的图像的重心的像接近规定尺寸的范围的中心并且合成出的图像的像素扩展的范围的像接近规定尺寸的范围的方式,生成合成出的图像向规定尺寸的归一化后的图像的映射,根据所生成的映射对执行了预处理后的图像进行归一化,将归一化后的图像变换为矢量空间上的矢量值,基于存储装置中存储的识别字典判定矢量值是哪一种文字,输出判定的结果。
虽然现有专利CN103310210A对多个图像进行归一化处理,使同一文字偏差变小,但是实际上图像文字识别的图像预处理了模块更为关键,大多数时候图像文字识别过程中因为文字目标和背景不能区别清楚以及图像分割处理不合理导致文字识别的基础出现偏差,进而不能有效的进行文字识别。
发明内容
本发明的目的在于提供一种银行自助机器人识别装置,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种银行自助机器人文字识别装置,包括:
控制处理器、文字图像撷取模块、文字图像分割模块、文字识别模块、数据库、语音提醒模块、手写输入模块和便捷修改模块;所述控制处理器分别与所述文字图像撷取模块、文字图像分割模块、文字识别模块、数据库、文字显示模块、语音提醒模块、手写输入模块和便捷修改模块电性连接,所述数据库与所述文字识别模块电性连接,所述书写输入模块与所述便捷修改模块电性连接,用于修改识别错误的文字。
优选的,所述文字图像撷取模块有一个摄像头用于图像撷取输入,且其中包括聚类分析模块、灰度化模块、图像滤波模块、二值化模块、倾斜校正模块。
优选的,所述文字图像分割模块包括模块分割模块和字符分割模块。
优选的,所述文字识别模块采用建立类神经网络数据库和比对的方法识别文字。
优选的,所述手写输入模块包含有一个电容式手写板和一个手写笔,用于手写输入。
优选的,所述便捷修改模块包含有一块触屏式显示屏,用于显示识别文字结果和客户对比定位识别错误的文字。
优选的,所述聚类分析模块采用K-means算法进行颜色聚类,所述二值化模块采用局部阈值法与动态阈值法结合的方法,用于提高目标与背景的区分能力。
优选的,所述模块分割模块采用基于边缘检测分割与基于区域的分割结合的方法,通过亮度差和相似像素综合判断区域划分,用于精细模块的分割。
与现有技术相比,本发明的有益效果是:
本发明通过采用局部阈值法与动态阈值法结合的方法进行图像的二值化,以及采用基于边缘检测分割与基于区域的分割结合的方法进行模块分割,提高了文字从图像中提取的精准度,提高了文字识别正确率,且通过便捷修改模块修正文字识别出现的误差,既方便又防止出错。
附图说明
图1为发明银行自助机器人文字识别装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明提供一种技术方案:
一种银行自助机器人文字识别装置,包括:
控制处理器、文字图像撷取模块、文字图像分割模块、文字识别模块、数据库、语音提醒模块、手写输入模块和便捷修改模块;控制处理器分别与文字图像撷取模块、文字图像分割模块、文字识别模块、数据库、文字显示模块、语音提醒模块、手写输入模块和便捷修改模块电性连接,数据库与文字识别模块电性连接,书写输入模块与便捷修改模块电性连接,用于修改识别错误的文字。文字图像撷取模块有一个摄像头用于图像撷取输入,且其中包括聚类分析模块、灰度化模块、图像滤波模块、二值化模块、倾斜校正模块。文字图像分割模块包括模块分割模块和字符分割模块,文字识别模块采用建立类神经网络数据库和比对的方法识别文字,手写输入模块包含有一个电容式手写板和一个手写笔,用于手写输入。便捷修改模块包含有一块触屏式显示屏,用于显示识别文字结果和客户对比定位识别错误的文字,聚类分析模块采用K-means算法进行颜色聚类,所述二值化模块采用局部阈值法与动态阈值法结合的方法,用于提高目标与背景的区分能力。模块分割模块采用基于边缘检测分割与基于区域的分割结合的方法,通过亮度差和相似像素综合判断区域划分,用于精细模块的分割。
当文字图像撷取模块的摄像头将文字图像摄取后,对图像依次进行聚类分析、灰度化、图像滤波、二值化、倾斜校正处理,其中二值化处理过程先对文字图像进行局部阈值法处理再对处理后的每一部分进行动态阈值法处理。处理后的文字图像在文字图像分割模块进行分割,分割处理过程采用先对文字图像进行基于区域的分割再对分割后的每一区域进行基于边缘检测的分割,对分割后的文字图像在字符分割模块中进行字符分割,字符分割后控制处理器经分割后的字符传送给文字识别模块,文字识别模块采用建立类神经网络数据库和比对的方法识别文字,识别出的文字经控制处理器传送给便捷修改模块,并在触屏式显示屏中显示出文字,同时通过语音提醒模块提醒客户人工校正,若识别文字无误,则不进行修改,若文字有误,则通过触屏时显示屏确定文字,通过手写输入板记性便捷修改。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (8)

1.一种银行自助机器人文字识别装置,其特征在于包括:
控制处理器、文字图像撷取模块、文字图像分割模块、文字识别模块、数据库、语音提醒模块、手写输入模块和便捷修改模块;所述控制处理器分别与所述文字图像撷取模块、文字图像分割模块、文字识别模块、数据库、文字显示模块、语音提醒模块、手写输入模块和便捷修改模块电性连接,所述数据库与所述文字识别模块电性连接,所述书写输入模块与所述便捷修改模块电性连接,用于修改识别错误的文字。
2.根据权利要求1所述的一种银行自助机器人文字识别装置,其特征在于,所述文字图像撷取模块有一个摄像头用于图像撷取输入,且其中包括聚类分析模块、灰度化模块、图像滤波模块、二值化模块、倾斜校正模块。
3.根据权利要求1所述的一种银行自助机器人文字识别装置,其特征在于,所述文字图像分割模块包括模块分割模块和字符分割模块。
4.根据权利要求1所述的一种银行自助机器人文字识别装置,其特征在于,所述文字识别模块采用建立类神经网络数据库和比对的方法识别文字。
5.根据权利要求1所述的一种银行自助机器人文字识别装置,其特征在于,所述手写输入模块包含有一个电容式手写板和一个手写笔,用于手写输入。
6.根据权利要求1所述的一种银行自助机器人文字识别装置,其特征在于,所述便捷修改模块包含有一块触屏式显示屏,用于显示识别文字结果和客户对比定位识别错误的文字。
7.根据权利要求2所述的文字图像撷取模块,其特征在于,所述聚类分析模块采用K-means算法进行颜色聚类,所述二值化模块采用局部阈值法与动态阈值法结合的方法,用于提高目标与背景的区分能力。
8.根据权利要求3所述的文字图像分割模块,其特征在于,所述模块分割模块采用基于边缘检测分割与基于区域的分割结合的方法,通过亮度差和相似像素综合判断区域划分,用于精细模块的分割。
CN201710889548.XA 2017-09-27 2017-09-27 一种银行自助机器人文字识别装置 Pending CN107657230A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710889548.XA CN107657230A (zh) 2017-09-27 2017-09-27 一种银行自助机器人文字识别装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710889548.XA CN107657230A (zh) 2017-09-27 2017-09-27 一种银行自助机器人文字识别装置

Publications (1)

Publication Number Publication Date
CN107657230A true CN107657230A (zh) 2018-02-02

Family

ID=61116924

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710889548.XA Pending CN107657230A (zh) 2017-09-27 2017-09-27 一种银行自助机器人文字识别装置

Country Status (1)

Country Link
CN (1) CN107657230A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108596097A (zh) * 2018-04-24 2018-09-28 广东中烟工业有限责任公司 一种烟包外箱包装带识别系统
CN108984777A (zh) * 2018-07-25 2018-12-11 北京京东尚科信息技术有限公司 客户服务方法、装置和计算机可读存储介质
CN110895696A (zh) * 2019-11-05 2020-03-20 泰康保险集团股份有限公司 一种图像信息提取方法和装置
CN112116611A (zh) * 2020-09-02 2020-12-22 吉林大学 一种书脊分割与文字识别系统及方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101051254A (zh) * 2007-05-18 2007-10-10 中国工商银行股份有限公司 自助服务终端的字符输入方法及其自助服务终端
CN101122952A (zh) * 2007-09-21 2008-02-13 北京大学 一种图片文字检测的方法
CN101315664A (zh) * 2008-05-27 2008-12-03 昆明理工大学 用于文字识别的文本图像预处理方法
CN101515325A (zh) * 2009-04-08 2009-08-26 北京邮电大学 基于字符切分和颜色聚类的数字视频中的字符提取方法
CN101520851A (zh) * 2008-02-29 2009-09-02 富士通株式会社 字符信息识别装置和方法
CN101576783A (zh) * 2008-05-09 2009-11-11 诺基亚公司 用于手写输入的用户接口、设备和方法
CN202134062U (zh) * 2011-07-13 2012-02-01 沈阳联华触摸显示技术有限公司 具有手写功能的银行自助表单输入设备及其后台服务系统
CN105893968A (zh) * 2016-03-31 2016-08-24 华南理工大学 基于深度学习的文本无关的端到端的笔迹识别方法
CN106408039A (zh) * 2016-09-14 2017-02-15 华南理工大学 一种基于形变方法进行数据扩展的脱机手写汉字识别方法
CN106407980A (zh) * 2016-11-03 2017-02-15 贺江涛 一种基于图像处理的银行卡号码识别方法
CN106599895A (zh) * 2016-10-14 2017-04-26 上海新同惠自动化系统有限公司 一种提高英文在线手写草书识别速率的分割方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101051254A (zh) * 2007-05-18 2007-10-10 中国工商银行股份有限公司 自助服务终端的字符输入方法及其自助服务终端
CN101122952A (zh) * 2007-09-21 2008-02-13 北京大学 一种图片文字检测的方法
CN101520851A (zh) * 2008-02-29 2009-09-02 富士通株式会社 字符信息识别装置和方法
CN101576783A (zh) * 2008-05-09 2009-11-11 诺基亚公司 用于手写输入的用户接口、设备和方法
CN101315664A (zh) * 2008-05-27 2008-12-03 昆明理工大学 用于文字识别的文本图像预处理方法
CN101515325A (zh) * 2009-04-08 2009-08-26 北京邮电大学 基于字符切分和颜色聚类的数字视频中的字符提取方法
CN202134062U (zh) * 2011-07-13 2012-02-01 沈阳联华触摸显示技术有限公司 具有手写功能的银行自助表单输入设备及其后台服务系统
CN105893968A (zh) * 2016-03-31 2016-08-24 华南理工大学 基于深度学习的文本无关的端到端的笔迹识别方法
CN106408039A (zh) * 2016-09-14 2017-02-15 华南理工大学 一种基于形变方法进行数据扩展的脱机手写汉字识别方法
CN106599895A (zh) * 2016-10-14 2017-04-26 上海新同惠自动化系统有限公司 一种提高英文在线手写草书识别速率的分割方法
CN106407980A (zh) * 2016-11-03 2017-02-15 贺江涛 一种基于图像处理的银行卡号码识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
严国莉等: "基于局部动态阈值的矾花图像分割", 《计算机应用与软件》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108596097A (zh) * 2018-04-24 2018-09-28 广东中烟工业有限责任公司 一种烟包外箱包装带识别系统
CN108984777A (zh) * 2018-07-25 2018-12-11 北京京东尚科信息技术有限公司 客户服务方法、装置和计算机可读存储介质
CN108984777B (zh) * 2018-07-25 2021-04-30 北京京东尚科信息技术有限公司 客户服务方法、装置和计算机可读存储介质
CN110895696A (zh) * 2019-11-05 2020-03-20 泰康保险集团股份有限公司 一种图像信息提取方法和装置
CN112116611A (zh) * 2020-09-02 2020-12-22 吉林大学 一种书脊分割与文字识别系统及方法

Similar Documents

Publication Publication Date Title
CN108898610B (zh) 一种基于mask-RCNN的物体轮廓提取方法
CN107657230A (zh) 一种银行自助机器人文字识别装置
Rajam et al. Recognition of Tamil sign language alphabet using image processing to aid deaf-dumb people
CN104751142B (zh) 一种基于笔划特征的自然场景文本检测方法
US10572713B2 (en) Fingerprint identification method and terminal
CN110008909B (zh) 一种基于ai的实名制业务实时稽核系统
CN103679147A (zh) 手机型号的识别方法与装置
CN105303173A (zh) 一种降低误识别率的方法和装置
CN103218605A (zh) 一种基于积分投影与边缘检测的快速人眼定位方法
CN106991380A (zh) 一种基于掌静脉图像的预处理方法
WO2023103372A1 (zh) 一种人脸口罩佩戴状态下的识别方法
CN110276279B (zh) 一种基于图像分割的任意形状场景文本探测方法
CN104484652A (zh) 一种指纹识别方法
CN105426890A (zh) 一种字符扭曲粘连的图形验证码识别方法
CN107977648B (zh) 一种基于人脸识别的身份证清晰度的判别方法和系统
CN109724988A (zh) 一种基于多模板匹配的pcb板缺陷定位方法
CN101661612A (zh) 基于伪细节点单形的指纹图像修复方法
CN111445386A (zh) 基于文本内容四点检测的图像校正方法
CN108021921A (zh) 图像特征点提取系统及其应用
US8879805B2 (en) Automated image identification method
CN106909880A (zh) 人脸识别中的人脸图像预处理方法
Jiang et al. Robust one-shot facial expression recognition with sunglasses
CN108564020B (zh) 基于全景3d图像的微手势识别方法
CN110991501A (zh) 一种基于Hessian矩阵的改进ORB特征点匹配方法
CN103366376B (zh) 一种基于邻域尺度变化的图像特征提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Room 803, room F1, two, innovation industrial park, No. 2800, new avenue of innovation, Hefei high tech Zone, Anhui

Applicant after: Anhui Shuo Wei Intelligent Technology Co., Ltd.

Address before: 230088, H2, building 374, two innovation industrial park, 2800 innovation Avenue, Hefei hi tech Zone, Anhui

Applicant before: Anhui Shuo Wei Intelligent Technology Co., Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180202