CN111091124B - 一种书脊文字识别方法 - Google Patents

一种书脊文字识别方法 Download PDF

Info

Publication number
CN111091124B
CN111091124B CN201911228322.0A CN201911228322A CN111091124B CN 111091124 B CN111091124 B CN 111091124B CN 201911228322 A CN201911228322 A CN 201911228322A CN 111091124 B CN111091124 B CN 111091124B
Authority
CN
China
Prior art keywords
character
image
characters
spine
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911228322.0A
Other languages
English (en)
Other versions
CN111091124A (zh
Inventor
孙大洋
许文巍
刘丹
万达禹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN201911228322.0A priority Critical patent/CN111091124B/zh
Publication of CN111091124A publication Critical patent/CN111091124A/zh
Application granted granted Critical
Publication of CN111091124B publication Critical patent/CN111091124B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/242Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Character Input (AREA)

Abstract

本发明提出一种书脊文字识别方法,包括:利用图像获取装置获取文本图像,使用卷积神经网络识别书脊区域,进一步识别该书脊区域中的所有文字区域;对图像进行二值化处理,对二值化后的图像进行降噪处理并倾斜校正;图像特征提取及特征匹配,判断文字区域的排列方向和横排还是竖排,根据判断结果分别给出识别方法,进行识别后与字典匹配的文字;根据对书脊区域识别出来的各区域文字,保存为文字串格式,再与数据库信息进行智能化匹配,进行检索操作。

Description

一种书脊文字识别方法
技术领域
本发明专利属于图书馆馆藏书目管理领域,具体涉及一种书脊文字识别方法。
背景技术
为了积极响应全民阅读的重要举措,如今大部分图书馆都采用大量流通、大规模借阅、全面开放的开架借阅的管理方式不仅大大提高了借阅的方便性,也更加充分发挥了图书的价值。但是,由于大部分读者并没有受到专门的借阅训练,不熟悉图书馆的借阅规定,再加上图书馆藏书众多,而且普遍存在书架设置不合理的问题,图书馆藏书的错架、乱架问题随之产生。
图书馆普遍采用传统的人力整理的方法解决这一问题。这种方法不仅耗时耗力,需要大量的人员投入,而且书籍整理归纳不及时的问题依然存在,严重影响读者借阅,同时也不利于图书管理。而基于深度学习的书脊信息识别系统为解决这一问题提供了新的思路。通过检测识别书脊信息,并定位当前位置,与图书馆系统内部存储的信息进行比对,及时报错,方便管理员发现并处理错架乱架问题。本文主要解决的是检测识别书脊信息的问题。
计算机视觉是指利用摄像头和处理器对对象特征进行识别,提取和跟踪,最终,经过人性化处理获得所需的图像信息。而近几年来,作为机器学习中发展最为迅速的一个领域,深度学习为计算机视觉带来了更加广阔的应用和发展前景。图像处理是深度学习最早尝试应用的领域。它通过建立起与大脑神经网络相似的分层模型,逐层提取输入图像信息的特征映射,建立起从低级数据信息到高级语义的对应关系,最终实现了对图像的智能化处理。
现已广泛应用在手写识别,证件信息审核、车牌识别等领域,其核心任务是文字检测和文字识别。而书脊检测的主要问题是文字的组织方式是竖排的,使用传统的横排文字检测方式准确率不高,书脊区域的识别分割,书脊上不同区域的识别分割,其效果将直接影响到最终的文字识别效果。因此文本区域的检测和提取以及文字的准确识别是书脊文字识别的重点和难点。
传统方法文字识别主要针对横排文字进行识别,竖排文字识别的准确率不高,而由于书脊上的文字排列比较复杂,文字有横排的和竖排的,因此我们对这些复杂情况做了一些处理,使用图像切割、旋转、拼接的方式将每一种情况转换为横排文字,再用传统文字识别方法进行文字识别,识别结果是文字串,用来在数据库中进行检索。
发明内容
本发明针对上述现有技术中存在的诸多技术问题,提出如下改进:
1.将书脊上文字进行区域切割,按照文字方向,排版方式做详细区分,分别给出识别方案;
2.竖排文字,使用文字切割,旋转,组装的方式转换为横排文字,可应用最先进的横排文字识别方法进行文字识别。
本发明的有益效果
现有技术还没有能够直接应用于书脊识别的有效方法,对书脊直接使用文字识别方法,或者不对书脊进行区域切割,其识别准确率很低。本发明可以将书脊识别的准确率提升为现有文字识别准确率水平。
本发明的具体发明内容如下:
本发明公开一种书脊文字识别方法,包括:
步骤一,利用图像获取装置获取文本图像,使用卷积神经网络识别书脊区域,进一步识别该书脊区域中的所有文字区域;
步骤二,图像处理,对图像进行二值化处理,对二值化后的图像进行降噪处理并倾斜校正;
步骤三,图像特征提取及特征匹配,判断文字区域的排列方向是横排还是竖排,根据判断结果分别给出识别方法;当排列方向为竖排时,进一步判断单个文字是横向放置或是竖向放置或是整体横向放置;
当单个文字是竖向放置时,不旋转文字,将从上到下的文字顺序,改为从左到右的文字顺序,进行文字图像拼接,对拼接后的文字区域进行与字典匹配的文字识别;
当单个文字是横向放置时,需对每个字符进行正或负90度的选择,使其变成竖文字后,改为从左到右的文字顺序,进行文字图像拼接,对拼接后的文字区域进行与字典匹配的文字识别;
当整体横向放置时,先将整体竖区域进行正或负90度旋转,使其变成横区域的文字,再进行识别与字典匹配的文字识别;
步骤四,根据对书脊区域识别出来的各区域文字,保存为文字串格式,再与数据库信息进行智能化匹配,进行检索操作。
进一步地,采用区域字符的平均识别准确率所属范围来确定该区域字符是横向还是竖向,当区域字符的平均识别准确率低于75%时,则判断该字符为横向放置,当区域字符的平均识别准确率大于等于75%时,则判断该字符为竖向放置。
进一步地,对图像进行二值化处理,包括将文字的笔画信息从复杂的背景中分离出来,抛去掉无关信息,获得便于后续处理的二值图像,对二值化后的图像进行降噪处理,包括尽可能保留图像的主要特征的同时,去掉影响后续处理的无用噪声信息。
进一步地,对于竖向放置的文字,对单个字符的上下界进行搜索,以切分出单个汉字和其他符号,对已标记的文本行进行水平投影,将字与字之间的空隙引起的投影空白之间的距离进行排序,取距离排序中值与投影空白进行匹配对各个字符加以分割,并进行标记。
进一步地,对于横向放置的文字,在同样的进行字切割的步骤后,需对每个字符进行正或负90度的选择,使其变成竖文字后,改为从左到右的文字顺序,进行文字图像拼接,对拼接后的文字区域使用已有文字识别方法进行与字典匹配的文字识别。
进一步地,所述卷积神经网络使用了共享权值和局部互连的方式,提取文字图像的形状、颜色、纹理和拓扑结构;并能对文字图像的旋转、位移、缩放及扭曲进行精确识别。
进一步地,与字典匹配的过程为:通过卷积神经网络对书籍文字图像进行低维特征提取,将得到的低维特征向量与存储在字典数据库中的文本进行搜索并匹配,得到多个相似的匹配结果后,再通过卷积神经网络对书籍文字图像进行高维特征提取,将获得的高维特征向量再次与所述多个相似的匹配结果进行对比后,确定最终的匹配结果。
附图说明
附图1为书脊文字为竖区域且单个字符为竖向;
附图2为书脊文字为竖区域且单个字符为横向;
附图3为书脊文字为整体竖区域;
具体实施方式
书脊文字识别方法,包括:
步骤一、利用图像获取装置获取文本图像,使用卷积神经网络识别书脊区域,进一步识别该书脊区域中的所有文字区域;
步骤二、图像处理,首先,对图像进行二值化处理,将文字的笔画信息从复杂的背景中分离出来,抛去掉无关信息,获得便于后续处理的二值图像。其次,对二值化后的图像进行降噪处理,尽可能保留图像的主要特征的同时,去掉影响后续处理的无用噪声信息。因此,降噪处理是进行后续字符分割和文本方向检测的必须步骤;然后,进行倾斜校正,在用图像采集设备得到图像时,样张除了有可能放置颠倒,还有可能略微的倾斜,这种情况也会影响识别。倾斜可能是整个版面都存在问题,也可能是局部的文本块存在问题。当倾斜角度不大时,不影响识别过程,可以忽略不计。若倾斜角过大,就影响了识别准确性。对图像中所有的直线进行倾斜检测,然后取直线数目最多的方向作为整个图像的倾斜方向,求出倾斜角度;求得图像的倾斜角度后,就可以根据倾斜角度对图像进行旋转校正。旋转后,图像的大小一般会改变。我们可以把转出显示区域的图像截去,也可扩大图像范围显示所有图像。
步骤三、图像特征提取及特征匹配:文本排版分为横排和竖排两种,根据字符分割可以将文本图像分割成单个字符区域。根据分割的单个字符自身的特征以及字符之间的特征关系判断出文本的方向并校正。判断出文字区域的排列方向,即横排还是竖排,并进行不同排列方向的区域切割,按照文字方向,排版方式做详细区分,分别给出识别方法;
步骤3.1横区域的文字采用现有技术中的文字识别方法进行识别;
步骤3.2.竖区域的文字的识别方法:
竖区域文字还存在三种排列方式,即单个文字是横向放置还是竖向放置,连通区域的文字是否是整体横向放置。具体地,采用区域字符的平均识别准确率所属范围来确定该区域字符是横向还是竖向,当区域字符的平均识别准确率低于75%时,则判断该字符为横向放置,当区域字符的平均识别准确率大于等于75%时,则判断该字符为竖向放置;
对于竖向放置的文字(如图1框选区域文字),对单个字符的上下界进行搜索,以切分出单个汉字和其他符号,对已标记的文本行进行水平投影,将字与字之间的空隙引起的投影空白之间的距离进行排序,取距离排序中值与投影空白进行匹配对各个字符加以分割,并进行标记。在不旋转文字的情况下将从上到下的文字顺序,改为从左到右的文字顺序,进行文字图像拼接,对拼接后的文字区域使用已有文字识别方法进行识别,无需旋转即可进行与字典匹配的文字识别;
对于横向放置的文字(如图2框选区域文字),在同样的进行字切割的步骤后,需对每个字符进行正或负90度的选择,使其变成竖文字后,改为从左到右的文字顺序,进行文字图像拼接,对拼接后的文字区域使用已有文字识别方法进行与字典匹配的文字识别;
对整体竖区域(如图3框选区域文字),先将整体竖区域进行正或负90度旋转,使其变成横区域的文字,再使用已有文字识别方法进行识别;
步骤四,根据对书脊区域识别出来的各区域文字,保存为文字串格式,再与数据库信息进行智能化匹配,进行检索等操作。
本发明中的卷积神经网络突出的优点在于使用了共享权值和局部互连的方式。通过这种方式不仅避免了过拟合风险,还有效减少了权值的数目,便于网络优化,这种特点使得卷积神经网络在图像分类方面效果显著。卷积神经网络能主动提取出形状、颜色、纹理和拓扑结构等图像特征;对于输入的二维图像,网络能对图像形变如:旋转、位移、缩放及其它方式的扭曲进行精确识别。当输入是多维图像时,CNN可以将原始多维图像作为网络的输入,自主提取特征,从而克服了在传统识别算法中对复杂图像提取特征不精确和数据重建复杂等问题。
本发明中的与字典匹配的过程为:通过卷积神经网络对书籍文字图像进行低维特征提取,将得到的低维特征向量与存储在字典数据库中的文本进行搜索并匹配,得到多个相似的匹配结果后,再通过卷积神经网络对书籍文字图像进行高维特征提取,将获得的高维特征向量再次与所述多个相似的匹配结果进行对比后,确定最终的匹配结果。所述低维特征是指一组少而精的分类特征,即获取特征数目少且分类错误概率小的特征向量。低维特征提取的内容包括特殊点(如角点)、线、边界、区域等数值或符号的描述;所述高维特征提取是根据被识别的对象产生出一组基本特征,当识别对象是文字图像时,原始测量就是各点灰度值,或是经过计算产生原始特征。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (7)

1.一种书脊文字识别方法,其特征在于,包括:
步骤一,利用图像获取装置获取文本图像,使用卷积神经网络识别书脊区域,进一步识别该书脊区域中的所有文字区域;
步骤二,图像处理,对图像进行二值化处理,对二值化后的图像进行降噪处理并倾斜校正;
步骤三,图像特征提取及特征匹配,判断文字区域的排列方向是横排还是竖排,根据判断结果分别给出识别方法;当排列方向为竖排时,进一步判断单个文字是横向放置或是竖向放置或是整体横向放置;当单个文字是竖向放置时,不旋转文字,将从上到下的文字顺序,改为从左到右的文字顺序,进行文字图像拼接,对拼接后的文字区域进行与字典匹配的文字识别;当单个文字是横向放置时,需对每个字符进行正或负90度的选择,使其变成竖文字后,改为从左到右的文字顺序,进行文字图像拼接,对拼接后的文字区域进行与字典匹配的文字识别;当整体横向放置时,先将整体竖区域进行正或负90度旋转,使其变成横区域的文字,再进行与字典匹配的文字识别;
步骤四,根据对书脊区域识别出来的各区域文字,保存为文字串格式,再与数据库信息进行智能化匹配,进行检索操作。
2.根据权利要求1所述的书脊文字识别方法,其特征在于:采用区域字符的平均识别准确率所属范围来确定该区域字符是横向还是竖向,当区域字符的平均识别准确率低于75%时,则判断该字符为横向放置,当区域字符的平均识别准确率大于等于75%时,则判断该字符为竖向放置。
3.根据权利要求1所述的书脊文字识别方法,其特征在于:对图像进行二值化处理,包括将文字的笔画信息从复杂的背景中分离出来,抛去掉无关信息,获得便于后续处理的二值图像,对二值化后的图像进行降噪处理,包括保留图像的主要特征的同时,去掉影响后续处理的无用噪声信息。
4.根据权利要求2所述的书脊文字识别方法,其特征在于:对于竖向放置的文字,对单个字符的上下界进行搜索,以切分出单个汉字和其他符号,对已标记的文本行进行水平投影,将字与字之间的空隙引起的投影空白之间的距离进行排序,取距离排序中值与投影空白进行匹配对各个字符加以分割,并进行标记。
5.根据权利要求2所述的书脊文字识别方法,其特征在于:对于横向放置的文字,在同样的进行字切割的步骤后,需对每个字符进行正或负90度的选择,使其变成竖文字后,改为从左到右的文字顺序,进行文字图像拼接,对拼接后的文字区域使用已有文字识别方法进行与字典匹配的文字识别。
6.根据权利要求1所述的书脊文字识别方法,其特征在于:所述卷积神经网络使用了共享权值和局部互连的方式,提取文字图像的形状、颜色、纹理和拓扑结构;并能对文字图像的旋转、位移、缩放及扭曲进行精确识别。
7.根据权利要求1所述的书脊文字识别方法,其特征在于:与字典匹配的过程为:通过卷积神经网络对书籍文字图像进行低维特征提取,将得到的低维特征向量与存储在字典数据库中的文本进行搜索并匹配,得到多个相似的匹配结果后,再通过卷积神经网络对书籍文字图像进行高维特征提取,将获得的高维特征向量再次与所述多个相似的匹配结果进行对比后,确定最终的匹配结果。
CN201911228322.0A 2019-12-04 2019-12-04 一种书脊文字识别方法 Active CN111091124B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911228322.0A CN111091124B (zh) 2019-12-04 2019-12-04 一种书脊文字识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911228322.0A CN111091124B (zh) 2019-12-04 2019-12-04 一种书脊文字识别方法

Publications (2)

Publication Number Publication Date
CN111091124A CN111091124A (zh) 2020-05-01
CN111091124B true CN111091124B (zh) 2022-06-03

Family

ID=70394655

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911228322.0A Active CN111091124B (zh) 2019-12-04 2019-12-04 一种书脊文字识别方法

Country Status (1)

Country Link
CN (1) CN111091124B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111275043B (zh) * 2020-01-22 2021-08-20 西北师范大学 一种基于pcnn处理的纸质简谱电子化播放装置
CN112116611B (zh) * 2020-09-02 2022-07-05 吉林大学 一种书脊分割与文字识别系统及方法
CN112101317B (zh) * 2020-11-17 2021-02-19 深圳壹账通智能科技有限公司 页面方向识别方法、装置、设备及计算机可读存储介质
CN112651323B (zh) * 2020-12-22 2022-12-13 山东山大鸥玛软件股份有限公司 一种基于文本行检测的中文手写体识别方法及系统
CN112668580A (zh) * 2020-12-28 2021-04-16 南京航天数智科技有限公司 一种文本识别方法、文本识别装置及终端设备
CN113011132B (zh) * 2021-04-22 2023-07-21 中国平安人寿保险股份有限公司 竖排文字识别方法、装置、计算机设备和存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101460937A (zh) * 2006-03-02 2009-06-17 计算机连接管理中心公司 基于模型的去扭曲方法和设备
CN102332096A (zh) * 2011-10-17 2012-01-25 中国科学院自动化研究所 一种视频字幕文本提取和识别的方法
CN102592124A (zh) * 2011-01-13 2012-07-18 汉王科技股份有限公司 文本图像的几何校正方法、装置和双目立体视觉系统
CN104966081A (zh) * 2015-06-04 2015-10-07 广州美读信息技术有限公司 书脊图像识别方法
CN106407976A (zh) * 2016-08-30 2017-02-15 百度在线网络技术(北京)有限公司 图像字符识别模型生成和竖列字符图像识别方法和装置
CN109241374A (zh) * 2018-06-07 2019-01-18 广东数相智能科技有限公司 一种图书信息库更新方法及图书馆书籍定位方法
CN109919147A (zh) * 2019-03-04 2019-06-21 上海宝尊电子商务有限公司 服装吊牌图像中文本识别的方法
CN110223340A (zh) * 2019-06-11 2019-09-10 广西财经学院 一种机器人识别图书所在架位的方法、装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8175388B1 (en) * 2009-01-30 2012-05-08 Adobe Systems Incorporated Recognizing text at multiple orientations
US20160092854A1 (en) * 2014-09-26 2016-03-31 Kobo Inc. System and method for using book recognition to facilitate a user's acquisition of e-books

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101460937A (zh) * 2006-03-02 2009-06-17 计算机连接管理中心公司 基于模型的去扭曲方法和设备
CN102592124A (zh) * 2011-01-13 2012-07-18 汉王科技股份有限公司 文本图像的几何校正方法、装置和双目立体视觉系统
CN102332096A (zh) * 2011-10-17 2012-01-25 中国科学院自动化研究所 一种视频字幕文本提取和识别的方法
CN104966081A (zh) * 2015-06-04 2015-10-07 广州美读信息技术有限公司 书脊图像识别方法
CN106407976A (zh) * 2016-08-30 2017-02-15 百度在线网络技术(北京)有限公司 图像字符识别模型生成和竖列字符图像识别方法和装置
CN109241374A (zh) * 2018-06-07 2019-01-18 广东数相智能科技有限公司 一种图书信息库更新方法及图书馆书籍定位方法
CN109919147A (zh) * 2019-03-04 2019-06-21 上海宝尊电子商务有限公司 服装吊牌图像中文本识别的方法
CN110223340A (zh) * 2019-06-11 2019-09-10 广西财经学院 一种机器人识别图书所在架位的方法、装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Automatic Book Spine Extraction and Recognition for Library Inventory Management;M.P.Nevetha and A.Baskar;《WCI"15:Proceedings of the Third International Symposium on Women in Computing and Informatics》;20150810;第44-48页 *
Mohammad Imrul Jubair and Prianka Banik.A Technique to Detect BookBookshelf Images from Library.《ICCC 2013 •IEEE 9th International Conference on Computational Cybernetics》.2013,第359-363页. *
基于版面分析的文档图像检索算法研究;赵慧;《中国优秀硕士学位论文全文数据库 信息科技辑》;20110815(第8期);第I138-309页 *
基于视觉的错序在架图书检测系统;康洪雷等;《软件工程》;20180430;第21卷(第4期);第18-22页 *

Also Published As

Publication number Publication date
CN111091124A (zh) 2020-05-01

Similar Documents

Publication Publication Date Title
CN111091124B (zh) 一种书脊文字识别方法
CN109308476B (zh) 票据信息处理方法、系统及计算机可读存储介质
EP1598770B1 (en) Low resolution optical character recognition for camera acquired documents
CN108805076B (zh) 环境影响评估报告书表格文字的提取方法及系统
CN113158808B (zh) 中文古籍字符识别、组段与版面重建方法、介质和设备
CN107491730A (zh) 一种基于图像处理的化验单识别方法
US6917708B2 (en) Handwriting recognition by word separation into silhouette bar codes and other feature extraction
CN106203539B (zh) 识别集装箱箱号的方法和装置
CN110458158B (zh) 一种针对盲人辅助阅读的文本检测与识别方法
CN106874901B (zh) 一种行驶证识别方法及装置
Chamchong et al. Character segmentation from ancient palm leaf manuscripts in Thailand
CN108154132A (zh) 一种身份证文字提取方法、系统及设备和存储介质
CN116704490B (zh) 车牌识别方法、装置和计算机设备
CN114463767A (zh) 信用证识别方法、装置、计算机设备和存储介质
CN116824608A (zh) 基于目标检测技术的答题卡版面分析方法
CN116912865A (zh) 表格图像识别方法、装置、设备及介质
CN111832497B (zh) 一种基于几何特征的文本检测后处理方法
CN111612045B (zh) 一种获取目标检测数据集的通用方法
CN110378337B (zh) 金属切削刀具图纸标识信息视觉输入方法及系统
Shakunthala et al. Enhanced text line segmentation and skew estimation for handwritten Kannada document
CN117076455A (zh) 一种基于智能识别的保单结构化存储方法、介质及系统
CN111814801A (zh) 一种机械图中标注串的提取方法
CN116363655A (zh) 一种财务票据识别方法及系统
CN114926842A (zh) 东巴象形文字识别方法及装置
CN114155296A (zh) 一种确定手掌图像中心区域的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Sun Dayang

Inventor after: Xu Wenwei

Inventor after: Liu Dan

Inventor after: Wan Dayu

Inventor before: Sun Dayang

Inventor before: Xu Wenwei

Inventor before: Liu Dan

Inventor before: Wan Dayu

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant