CN112116611A - 一种书脊分割与文字识别系统及方法 - Google Patents
一种书脊分割与文字识别系统及方法 Download PDFInfo
- Publication number
- CN112116611A CN112116611A CN202010910143.1A CN202010910143A CN112116611A CN 112116611 A CN112116611 A CN 112116611A CN 202010910143 A CN202010910143 A CN 202010910143A CN 112116611 A CN112116611 A CN 112116611A
- Authority
- CN
- China
- Prior art keywords
- line
- spine
- image
- img
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/12—Edge-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformation in the plane of the image
- G06T3/60—Rotation of a whole image or part thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration by the use of local operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/181—Segmentation; Edge detection involving edge growing; involving edge linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20024—Filtering details
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Abstract
本发明提出了一种书脊分割与文字识别方法,包括:步骤一、利用图像采集系统获取书脊图像image;步骤二、将书脊图像image传入神经网络框架DarkNet中进行书脊分割,得到N个单书脊图像img1,img2…imgN;使用快速线检测算法对分割后的单书脊图像imgi进行拟合,对单个书脊图像和直线组进行透射旋转变换;使用卷积递归神经网络CRNN对旋转书脊图像rotated_imgi进行文字检测得到文字区域和文字内容;使用文字区域对旋转直线组进行滤波,去除与文字区域相交的直线;保留识别结果;步骤三、对书脊的文字识别结果进行数据库匹配;步骤四、存储识别结果,按标记显示书脊图像。
Description
技术领域
本发明专利属于图书馆馆藏书目管理领域,具体涉及一种书脊区域分割与文字识别系统及方法。
背景技术
计算机视觉是指利用摄像头和处理器对对象特征进行识别,提取和跟踪,最终,经过人性化处理获得所需的图像信息。而近几年来,作为机器学习中发展最为迅速的一个领域,深度学习为计算机视觉带来了更加广阔的应用和发展前景。图像处理是深度学习最早尝试应用的领域。它通过建立起与大脑神经网络相似的分层模型,逐层提取输入图像信息的特征映射,建立起从低级数据信息到高级语义的对应关系,最终实现了对图像的智能化处理。现已广泛应用在手写识别,证件信息审核、车牌识别等领域,其核心任务是文字检测和文字识别。
在现有图书馆书籍管理系统中,图书管理还是大量依赖于人工,而基于深度学习的整体书籍管理解决方案目前还没有人提出,书脊分割与文字识别的主要问题是如何快速准确地对书脊进行分割,对于图书馆场景中的各种复杂情况,书脊分割需要有较好的稳定性,采用深度学习的方式可以快速地进行书脊分割,然而由于照片拍摄的透射效果使得即使是摆正的书脊,也会出现一定的倾斜角度,导致深度学习的书脊分割结果会包含临近书脊的文字信息,对文字识别产生噪声影响,而采用传统方式进行书脊分割,速度与稳定性方面不尽如人意。因此如何快速准确地进行书脊分割是书脊文字识别的重点和难点。
发明内容:
本发明针对上述现有技术中存在的诸多技术问题,对书脊文本的检测进行了系统的设计,真正达到了书脊文本检测的应用标准。本发明旨在提供一套高效且易于维护的书脊识别系统,提高图书管理的智能化管理水平。
书脊分割与文字识别方法,包括:
步骤一、利用图像采集系统获取书脊图像image;
步骤二、将书脊图像image传入神经网络框架DarkNet中进行书脊分割,得到N个单书脊图像img1,img2…imgN;对每一个单书脊图像imgi执行如下步骤:(1)使用快速线检测算法对分割后的单书脊图像imgi进行直线检测得到直线组lines;(2)使用线拼接算法对直线组lines进行拟合,得到长度大于阈值的拟合直线组fitted_lines;(3)计算拟合直线组fitted_lines所有直线的角度平均值rotation_angle,并使用该平均值对单个书脊图像和直线组进行透射旋转变换得到旋转书脊图像rotated_imgi和旋转直线组rotated_lines;(4)使用卷积递归神经网络CRNN对旋转书脊图像rotated_imgi进行文字检测得到文字区域和文字内容;(5)使用文字区域对旋转直线组rotated_lines进行滤波,去除与文字区域相交的直线;(6)在滤波后的旋转直线组rotated_lines中找到距离旋转书脊图像rotated_imgi中心左侧最近的直线line1,距离旋转书脊图像rotated_imgi中心右侧最近的直线line2,并使用line1,line2对旋转书脊图像rotated_imgi进行裁剪;(7)使用直线line1和直线line2对文字区域与文字内容滤波,保留位置包含在line1,line2之间的文字识别结果;
步骤三、对书脊的文字识别结果进行数据库匹配;
步骤四、存储识别结果,按标记显示书脊图像。
进一步地,所述使用线拼接算法对直线组lines进行拟合,得到长度大于阈值的拟合直线组fitted_lines的具体步骤如下:
步骤1:调用快速线检测得到线检测结果lines;
步骤2:使用线长阈值MinLength与角度阈值slantAngle对线检测结果lines进行滤波得到滤波线组sortedlines,滤除长度小于线长阈值MinLength,角度小于角度阈值slantAngle的线;
步骤3:对滤波线组sortedlines按照线段首点的横坐标排序;
步骤4:对滤波线组sortedlines中所有未进行线拟合的线linei进行如下操作:
a)以线linei初始化拟合线段linetmp,标记线linei为已拟合;
b)遍历与线linei距离相差小于10*MinLength的线linej,如果线linej两端点与拟合线段linetmp的距离均小于DisThreshold,则将线linej与线linei进行拟合,取线linej与线linej的最远端点更新拟合线段linetmp,标记线linej为已拟合;
c)如果拟合线段长度大于LineLength,将线拟合结果linetmp加入到拟合线段列表中;
步骤5:返回拟合线段列表。
一种书脊区域分割与文字识别系统,实现所述的书脊分割与文字识别方法,该系统包括:
图像采集系统,用于采集图书的书脊图像,并将采集到的书脊图像传输给图像分析系统;
图像分析系统,用于分析和处理图书的书脊图像,利用神经网络DarkNet框架进行书脊分割、记录坐标并保存分割的图像以及按照识别结果类型进行不同颜色的书脊框选显示;
文字识别系统,利用卷积递归神经网络CRNN对分割后的书脊进行文字区域识别及文字检测;
数据库交互系统,用于将图像分析系统得到的图像位置数据以及文字识别系统识别的数据与图书馆数据库做比对,并将比对结果恢复为可交互图像,存入数据库供管理员进行图书管理。
附图说明
附图1为本系统的总体流程;
附图2为书脊摆正、裁剪、文字识别的详细流程图;
附图3为线拟合流程;
附图4为书脊图像;
附图5为书脊分割结果;
附图6a和6b为书脊的文字识别结果;
附图7为数据库比对及图像恢复结果;
具体实施方式
书脊分割与文字识别方法,包括:步骤一、利用图像采集系统获取书脊图像image;步骤二、将书脊图像image传入神经网络框架DarkNet中进行书脊分割,得到N个单书脊图像img1,img2…imgN;对每一个单书脊图像imgi执行如下步骤:(1)使用快速线检测算法对分割后的单书脊图像imgi进行直线检测得到直线组lines;(2)使用线拼接算法对直线组lines进行拟合,得到长度大于阈值的拟合直线组fitted_lines;(3)计算拟合直线组fitted_lines所有直线的角度平均值rotation_angle,并使用该平均值对单个书脊图像和直线组进行透射旋转变换得到旋转书脊图像rotated_imgi和旋转直线组rotated_lines;(4)使用卷积递归神经网络CRNN对旋转书脊图像rotated_imgi进行文字检测得到文字区域和文字内容;(5)使用文字区域对旋转直线组rotated_lines进行滤波,去除与文字区域相交的直线;(6)在滤波后的旋转直线组rotated_lines中找到距离旋转书脊图像rotated_imgi中心左侧最近的直线line1,距离旋转书脊图像rotated_imgi中心右侧最近的直线line2,并使用line1,line2对旋转书脊图像rotated_imgi进行裁剪;(7)使用直线line1和直线line2对文字区域与文字内容滤波,保留位置包含在line1,line2之间的文字识别结果。步骤三、对书脊的文字识别结果进行数据库匹配;步骤四、存储识别结果,按标记显示书脊图像。
其中关于线拟合算法:由于快速线检测算法得到的线段往往是许多短线,并不能很好地标识书脊边界,因此我们用线拟合算法使书脊边界特征上的短线拟合成一条长直线,详细步骤如下:
2.调用快速线检测得到线检测结果lines;
3.使用线长阈值MinLength与角度阈值slantAngle对线检测结果lines进行滤波得到sortedlines,滤除长度小于MinLength,角度小于slantAngle的线;实际系统中,优选地,MinLength取3个像素,slantAngle取65度;
4.对sortedlines按照线段首点的横坐标排序;
5.对sortedlines中所有未进行线拟合的线linei:
a)以linei初始化拟合线段linetmp,标记linei为已拟合;
b)遍历与linei距离相差小于10*MinLength的线linej,如果linej两端点与拟合线段linetmp的距离均小于拟合线距门限DisThreshold(系统中优选取值为3个像素),则将linej与linei进行拟合,取linej与linej的最远端点更新拟合线段linetmp,标记linej为已拟合;
c)如果拟合线段长度大于线长门限LineLength(系统中优选取值为图像高度的1/4),将线拟合结果linetmp加入到拟合线段列表中;
6.返回拟合线段列表
对于实现上述书脊分割与文字识别方法的系统(以下简称“本系统“):是基于神经网络框架DarkNet开源深度学习框架及卷积递归神经网络CRNN实现书脊分割与文字识别功能,本系统分为4个部分,分别为图像采集系统、图像分析系统、文字识别系统和数据库交互系统。
图像采集系统,用于采集图书的书脊图像,并将采集到的书脊图像传输给图像分析系统;图像分析系统,用于分析和处理图书图像,利用神经网络框架DarkNet进行书脊分割;文字识别系统,利用卷积递归神经网络CRNN对分割后的书脊进行文字区域识别及文字检测;数据库交互系统,用于将图像分析系统得到的图像位置数据以及文字识别系统识别的数据与图书馆数据库做比对,并将比对结果恢复为可交互图像,存入数据库供管理员进行图书管理。
本系统的有益效果为:可板载、可依赖手机APP实现,具有较强的可移植性,管理维护成本低。对于现有的图书管理系统,图书管理基本依靠人工进行,管理效率低,管理成本高,对于一些大规模图书馆,每天对所有图书进行一次管理的成本是无法接受的,本发明旨在提出一种高效简洁的图书管理方法,利用深度学习的技术自自动对图书进行识别和分类,在此基础上实现几乎实时的图书管理,这样可大大减少图书管理员的维护时间。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (3)
1.一种书脊分割与文字识别方法,其特征在于:包括:
步骤一、利用图像采集系统获取书脊图像image;
步骤二、将书脊图像image传入神经网络框架DarkNet中进行书脊分割,得到N个单书脊图像img1,img2…imgN;对每一个单书脊图像imgi执行如下步骤:(1)使用快速线检测算法对分割后的单书脊图像imgi进行直线检测得到直线组lines;(2)使用线拼接算法对直线组lines进行拟合,得到长度大于阈值的拟合直线组fitted_lines;(3)计算拟合直线组fitted_lines所有直线的角度平均值rotation_angle,并使用该平均值对单个书脊图像和直线组进行透射旋转变换得到旋转书脊图像rotated_imgi和旋转直线组rotated_lines;(4)使用卷积递归神经网络CRNN对旋转书脊图像rotated_imgi进行文字检测得到文字区域和文字内容;(5)使用文字区域对旋转直线组rotated_lines进行滤波,去除与文字区域相交的直线;(6)在滤波后的旋转直线组rotated_lines中找到距离旋转书脊图像rotated_imgi中心左侧最近的直线line1,距离旋转书脊图像rotated_imgi中心右侧最近的直线line2,并使用line1,line2对旋转书脊图像rotated_imgi进行裁剪;(7)使用直线line1和直线line2对文字区域与文字内容滤波,保留位置包含在line1,line2之间的文字识别结果;
步骤三、对书脊的文字识别结果进行数据库匹配;
步骤四、存储识别结果,按标记显示书脊图像。
2.根据权利1所述的书脊分割与文字识别方法,其特征在于:所述使用线拼接算法对直线组lines进行拟合,得到长度大于阈值的拟合直线组fitted_lines的具体步骤如下:
步骤1:调用快速线检测得到线检测结果lines;
步骤1:使用线长阈值MinLength与角度阈值slantAngle对线检测结果lines进行滤波得到滤波线组sortedlines,滤除长度小于线长阈值MinLength,角度小于角度阈值slantAngle的线;
步骤3:对滤波线组sortedlines按照线段首点的横坐标排序;
步骤4:对滤波线组sortedlines中所有未进行线拟合的线linei进行如下操作:
a)以线linei初始化拟合线段linetmp,标记线linei为已拟合;
b)遍历与线linei距离相差小于10*MinLength的线linej,如果线linej两端点与拟合线段linetmp的距离均小于拟合线距门限DisThreshold,则将线linej与线linei进行拟合,取线linej与线linej的最远端点更新拟合线段linetmp,标记线linej为已拟合;
c)如果拟合线段长度大于线长门限LineLength,将线拟合结果linetmp加入到拟合线段列表中;
步骤5:返回拟合线段列表。
3.一种书脊区域分割与文字识别系统,实现权利要求1或2所述的书脊分割与文字识别方法,其特征在于,该系统包括:
图像采集系统,用于采集图书的书脊图像,并将采集到的书脊图像传输给图像分析系统;
图像分析系统,用于分析和处理图书的书脊图像,利用神经网络DarkNet框架进行书脊分割、记录坐标并保存分割的图像以及按照识别结果类型进行不同颜色的书脊框选显示;
文字识别系统,利用卷积递归神经网络CRNN对分割后的书脊进行文字区域识别及文字检测;
数据库交互系统,用于将图像分析系统得到的图像位置数据以及文字识别系统识别的数据与图书馆数据库做比对,并将比对结果恢复为可交互图像,存入数据库供管理员进行图书管理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010910143.1A CN112116611B (zh) | 2020-09-02 | 2020-09-02 | 一种书脊分割与文字识别系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010910143.1A CN112116611B (zh) | 2020-09-02 | 2020-09-02 | 一种书脊分割与文字识别系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112116611A true CN112116611A (zh) | 2020-12-22 |
CN112116611B CN112116611B (zh) | 2022-07-05 |
Family
ID=73803864
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010910143.1A Active CN112116611B (zh) | 2020-09-02 | 2020-09-02 | 一种书脊分割与文字识别系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112116611B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5841905A (en) * | 1996-10-25 | 1998-11-24 | Eastman Kodak Company | Business form image identification using projected profiles of graphical lines and text string lines |
WO2001055965A2 (en) * | 2000-01-27 | 2001-08-02 | Koninklijke Philips Electronics N.V. | Method and system for extracting spine geometrical data |
CN102076068A (zh) * | 2010-12-31 | 2011-05-25 | 吉林大学 | 一种基于空时调整的ZigBee节能方法 |
CN102622593A (zh) * | 2012-02-10 | 2012-08-01 | 北方工业大学 | 一种文本识别方法及系统 |
CN105701349A (zh) * | 2016-01-13 | 2016-06-22 | 河海大学 | 非均匀颗粒离散单元快速线性接触检测方法 |
CN107220638A (zh) * | 2017-07-03 | 2017-09-29 | 深圳市唯特视科技有限公司 | 一种基于深度学习卷积神经网络的车牌检测识别方法 |
CN107657230A (zh) * | 2017-09-27 | 2018-02-02 | 安徽硕威智能科技有限公司 | 一种银行自助机器人文字识别装置 |
CN109241374A (zh) * | 2018-06-07 | 2019-01-18 | 广东数相智能科技有限公司 | 一种图书信息库更新方法及图书馆书籍定位方法 |
CN111091124A (zh) * | 2019-12-04 | 2020-05-01 | 吉林大学 | 一种书脊文字识别方法 |
CN111310688A (zh) * | 2020-02-25 | 2020-06-19 | 重庆大学 | 一种基于多角度成像的手指静脉识别方法 |
CN111368856A (zh) * | 2020-03-16 | 2020-07-03 | 广东技术师范大学 | 一种基于视觉的图书盘点系统的书脊提取方法及装置 |
-
2020
- 2020-09-02 CN CN202010910143.1A patent/CN112116611B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5841905A (en) * | 1996-10-25 | 1998-11-24 | Eastman Kodak Company | Business form image identification using projected profiles of graphical lines and text string lines |
WO2001055965A2 (en) * | 2000-01-27 | 2001-08-02 | Koninklijke Philips Electronics N.V. | Method and system for extracting spine geometrical data |
CN102076068A (zh) * | 2010-12-31 | 2011-05-25 | 吉林大学 | 一种基于空时调整的ZigBee节能方法 |
CN102622593A (zh) * | 2012-02-10 | 2012-08-01 | 北方工业大学 | 一种文本识别方法及系统 |
CN105701349A (zh) * | 2016-01-13 | 2016-06-22 | 河海大学 | 非均匀颗粒离散单元快速线性接触检测方法 |
CN107220638A (zh) * | 2017-07-03 | 2017-09-29 | 深圳市唯特视科技有限公司 | 一种基于深度学习卷积神经网络的车牌检测识别方法 |
CN107657230A (zh) * | 2017-09-27 | 2018-02-02 | 安徽硕威智能科技有限公司 | 一种银行自助机器人文字识别装置 |
CN109241374A (zh) * | 2018-06-07 | 2019-01-18 | 广东数相智能科技有限公司 | 一种图书信息库更新方法及图书馆书籍定位方法 |
CN111091124A (zh) * | 2019-12-04 | 2020-05-01 | 吉林大学 | 一种书脊文字识别方法 |
CN111310688A (zh) * | 2020-02-25 | 2020-06-19 | 重庆大学 | 一种基于多角度成像的手指静脉识别方法 |
CN111368856A (zh) * | 2020-03-16 | 2020-07-03 | 广东技术师范大学 | 一种基于视觉的图书盘点系统的书脊提取方法及装置 |
Non-Patent Citations (4)
Title |
---|
M.P.NEVTHA .ETC: "Automatic book spine extraction and recognition for library inventory management", 《PROCEEDINGS OF THE THIRD INTERNATIONAL SYMPOSIUM ON WOMEN IN COMPUTING AND INFORMATICS》 * |
SEN ZHANG .ETC: "An Improved Vehicle-license Plate Recognition Based on Color Clues and Coding Rules", 《2019 IEEE 4TH INTERNATIONAL CONFERENCE ON IMAGE, VISION AND COMPUTING (ICIVC)》 * |
崔晨: "基于图像的书脊检测与识别关键技术研究与实现", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 * |
曾凡锋等: "一种快速文本图像倾斜校正方法", 《计算机应用与软件》 * |
Also Published As
Publication number | Publication date |
---|---|
CN112116611B (zh) | 2022-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111178236B (zh) | 一种基于深度学习的车位检测方法 | |
CN106156761B (zh) | 面向移动终端拍摄的图像表格检测与识别方法 | |
Saxena | Niblack’s binarization method and its modifications to real-time applications: a review | |
KR101589711B1 (ko) | 비디오 데이터의 처리 방법 및 시스템 | |
CN103208004A (zh) | 票据信息区域自动识别和提取方法及设备 | |
CN104299009B (zh) | 基于多特征融合的车牌字符识别方法 | |
CN108805076A (zh) | 环境影响评估报告书表格文字的提取方法及系统 | |
CN110659644B (zh) | 书法单字的笔画自动提取方法 | |
CN111079571A (zh) | 证卡信息识别及其边缘检测模型训练方法、装置 | |
CN113158977B (zh) | 改进FANnet生成网络的图像字符编辑方法 | |
CN112651293B (zh) | 一种公路违法设摊事件视频检测方法 | |
CN116030396B (zh) | 一种用于视频结构化提取的精确分割方法 | |
CN108537143B (zh) | 一种基于重点区域特征比对的人脸识别方法与系统 | |
CN110647824B (zh) | 基于计算机视觉技术的增值税发票版面提取方法 | |
Li et al. | Pixel-level recognition of pavement distresses based on U-Net | |
CN106778777B (zh) | 一种车辆匹配方法及系统 | |
CN112508000B (zh) | 一种用于ocr图像识别模型训练数据生成的方法及设备 | |
WO2022121021A1 (zh) | 一种身份证号码检测方法、装置、可读存储介质和终端 | |
CN117119253B (zh) | 一种针对目标对象的高质量视频抽帧方法 | |
CN112116611B (zh) | 一种书脊分割与文字识别系统及方法 | |
CN110634222B (zh) | 一种银行票据信息识别方法 | |
CN112836699A (zh) | 一种基于长时多目标跟踪的泊位出入场事件分析方法 | |
CN117076455A (zh) | 一种基于智能识别的保单结构化存储方法、介质及系统 | |
CN109325487B (zh) | 一种基于目标检测的全种类车牌识别方法 | |
CN116363655A (zh) | 一种财务票据识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |