CN116758559B - 一种图文文字转换识别系统及方法 - Google Patents
一种图文文字转换识别系统及方法 Download PDFInfo
- Publication number
- CN116758559B CN116758559B CN202311022810.2A CN202311022810A CN116758559B CN 116758559 B CN116758559 B CN 116758559B CN 202311022810 A CN202311022810 A CN 202311022810A CN 116758559 B CN116758559 B CN 116758559B
- Authority
- CN
- China
- Prior art keywords
- image
- character
- text
- module
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 239000013598 vector Substances 0.000 claims abstract description 81
- 238000000605 extraction Methods 0.000 claims abstract description 71
- 238000004458 analytical method Methods 0.000 claims abstract description 55
- 238000006243 chemical reaction Methods 0.000 claims abstract description 40
- 238000004364 calculation method Methods 0.000 claims abstract description 32
- 238000005457 optimization Methods 0.000 claims abstract description 12
- 238000000638 solvent extraction Methods 0.000 claims description 16
- 238000005192 partition Methods 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 description 4
- 241001270131 Agaricus moelleri Species 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/19007—Matching; Proximity measures
- G06V30/19093—Proximity measures, i.e. similarity or distance measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/162—Quantising the image signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Abstract
本发明涉及一种图文文字转换识别系统及方法,尤其涉及图文识别技术领域,包括,图像获取模块,用以获取文字图像;特征提取模块,用以对文字图像进行特征提取,以得到图像特征向量;提取调整模块,用以根据文字线宽对文字图像的特征提取过程进行调整;特征分析模块,用以根据图像特征向量对文字图像进行识别;判断模块,用以根据识别文字的数量对文字操作方式进行判断;输出模块,用以对识别文字进行输出;调整优化模块,根据识别文字数量对文字线宽的计算过程进行优化,还用以根据识别文字数量对文字图像特征提取过程进行调整。本发明实现了对文字图像中文字的识别,解决了图文转换别效率低,识别文字的准确率低的问题。
Description
技术领域
本发明涉及图文识别技术领域,尤其涉及一种图文文字转换识别系统及方法。
背景技术
光学文字识别技术是目前常用的一种进行图文转换的技术,可通过对图像的转化、分析和识别操作将图像中的文字信息识别输出,提高了人们的办公效率,使得提高光学文字识别技术的识别效率和准确性成为了目前的关键课题。
中国专利公开号:CN102982330B公开了一种文字图像中字符识别方法和识别装置,包括对文字图像中切割出的字符,以设定单位进行划分;对所述设定单位内的每个字符进行特征提取和特征匹配后,确定每个字符的候选字;针对所述设定单位内的每个字符,确定该字符的每个候选字的相似度、以及该字符的每个候选字与该字符相邻的字符的候选字之间的转移概率;根据确定出的相似度和转移概率,确定出所述设定单位内的字符的识别结果。该发明实现了对图文识别中各字符的匹配分析,在对各字符的相似度分析时,对字符的结构匹配精度低,存在对图文转换识别效率低,识别文字的准确率低的问题。
发明内容
为此,本发明提供一种图文文字转换识别系统及方法,用以克服现有技术中图文转换识别效率低,识别文字的准确率低的问题。
为实现上述目的,本发明提供一种图文文字转换识别系统,包括:
图像获取模块,用以获取文字图像;
特征提取模块,用以对文字图像进行特征提取,以得到图像特征向量;
提取调整模块,用以根据文字图像对文字线宽进行分析,并根据文字线宽对文字图像的特征提取过程进行调整;
特征分析模块,用以根据图像特征向量对文字图像进行识别,以得到识别文字;
判断模块,用以根据识别文字的数量对文字操作方式进行判断;
输出模块,用以在文字操作方式为输出操作时,对识别文字进行输出;
调整优化模块,用以在文字操作方式为优化操作时,根据识别文字数量对文字线宽的计算过程进行优化,所述调整优化模块还用以根据识别文字数量对文字图像特征提取过程进行调整;
所述特征提取模块包括:
图像处理单元,用以根据文字图像灰度对文字图像进行二化值处理,以得到黑白图像;
图像旋转单元,用以对黑白图像进行旋转处理,以得到旋转图像;
图像分区单元,用以对黑白图像进行分区处理,以得到多个黑白图像区域,用以对旋转图像进行分区处理,以得到多个旋转图像区域;
特征提取单元,用以对各黑白图像区域进行特征提取,以得到标准特征向量,还用以对各旋转图像区域进行特征提取,以得到旋转特征向量;
所述特征分析模块包括:
特征分析单元,用以计算标准特征向量与旋转特征向量的相似度,并根据相似度对文字图像对应的字符集进行判断;
文字识别单元,用以根据标准特征向量和文字图像对应的字符集对文字图像进行识别,以得到识别文字。
进一步地,所述图像处理单元以文字图像中心点为坐标原点,平行于文字图像上下边界的轴为x轴,平行于文字图像左右边界的轴为y轴,建立平面直角坐标系,x轴从左向右依次增大,y轴从下向上依次增大,用坐标表示文字图像中的每一个像素点;
所述图像处理单元将文字图像的各像素点灰度与灰度阈值进行比对,并根据比对结果对文字图像像素点灰度进行修改,其中:
当G(x,y)≤g时,所述图像处理单元对文字图像像素点灰度进行修改,修改后的文字图像像素点灰度为G'(x,y),设定G'(x,y)=0;
当G(x,y)>g时,所述图像处理单元对文字图像像素点灰度进行修改,修改后的文字图像像素点灰度为G"(x,y),设定G"(x,y)=255;
其中,G(x,y)表示文字图像像素点灰度,g表示灰度阈值,其取值范围为0<g<255。
进一步地,所述特征提取单元根据黑白图像区域和旋转图像区域的像素点灰度值对黑白图像区域和旋转图像区域进行特征提取,将黑白图像区域和旋转图像区域的像素点灰度值与样本平均灰度进行作差,得到灰度变化量,所述特征提取单元将黑白图像区域内像素点的灰度变化量作为标准特征向量,将旋转图像区域内像素点的灰度变化量作为旋转特征向量,所述特征提取单元设有灰度变化量计算公式如下:
b(x,y)=G(x,y)-G1(x,y)
G1(x,y)=[G(x-i,y+i)+G(x-i+1,y+i)+...+G(x+i,y-i)]/(2×i+1)2
其中,b(x,y)表示灰度变化量,G1(x,y)表示样本平均灰度,i表示样本参数,其取值范围为i={2≤i≤6,i∈N+}。
进一步地,所述提取调整模块根据文字图像灰度通过线宽计算公式计算文字线宽,所述提取调整模块设有线宽计算公式如下:
D=G0/(2×ymax)
其中,D表示文字线宽,D向下取整,G0表示文字图像中灰度为0的像素点数量;
所述提取调整模块根据文字线宽对样本平均灰度进行调整,调整后的样本平均灰度为G1'(x,y),设定G1'(x,y)=G1(x,y)×i/D。
进一步地,所述特征分析单元通过相似度计算公式分别计算标准特征向量与第一旋转特征向量和第二旋转特征向量的相似度,得到第一相似度和第二相似度,所述特征分析单元设有相似度计算公式如下:
Qj=B01/Bj1×B01×Bj2×B02/Bj2×B02×Bj3×..×B0k/Bjk×B0k×Bjk+1
其中,Qj表示相似度,Bj表示旋转特征向量,j表示旋转特征向量编号,其取值范围为:j={1,2},B0表示标准特征向量,k表示区域编号,其取值范围为:k={1,2,3,4|当k=4时,k+1=1}。
进一步地,所述特征分析单元分别将第一相似度和第二相似度与相似度阈值进行比对,并根据比对结果对文字图像对应的字符集进行判断,其中:
当Q1≥α且Q2≥α时,所述特征分析单元判定文字图像对应的字符集为第一字符集;
当Q1<α且Q2≥α时,所述特征分析单元判定文字图像对应的字符集为第二字符集;
当Q1<α且Q2<α时,所述特征分析单元判定文字图像对应的字符集为第三字符集;
其中,α表示相似度阈值,其取值范围为0.5<α<1。
进一步地,所述文字识别单元计算标准特征向量与文字图像对应的字符集中的字符特征向量的比值,将比值与识别阈值进行比对,并根据比对结果对识别文字进行判断,其中:
当B0/M(n)≥β时,所述文字识别单元判定字符集中当前文字为识别文字;
当B0/M(n)<β时,所述文字识别单元判定字符集中当前文字非识别文字;
其中M(n)表示字符集中文字的字符特征向量,n表示字符集中的文字,β表示识别阈值,其取值范围为0.8≤β<1。
进一步地,所述判断模块根据识别文字数量对文字操作方式进行判断,其中:
当S≤1时,所述判断模块判定文字操作方式为输出操作;
当S>1时,所述判断模块判定文字操作方式为调整操作;
其中,S表示识别文字数量;
所述输出模块在文字操作方式为输出操作时,对识别文字进行输出。
进一步地,所述调整优化模块根据识别文字数量对文字线宽的计算过程进行优化,优化后的文字线宽为D',设定D'=G0×S/[(2+S)/2×ymax];
所述调整优化模块根据识别文字数量对灰度阈值进行调整,调整后的灰度阈值为g',设定g'=g/S×1.5。
另一方面,本实施例还提供一种图文文字转换识别方法,包括:
步骤S1,获取文字图像;
步骤S2,对文字图像进行二化值处理、旋转处理和分区处理,以得到黑白图像区域和旋转图像区域;
步骤S3,对各黑白图像区域和旋转图像区域进行特征提取,以得到标准特征向量和旋转特征向量;
步骤S4,根据文字图像对文字线宽进行分析,并根据文字线宽对文字图像的特征提取过程进行调整;
步骤S5,计算标准特征向量与旋转特征向量的相似度,并根据相似度对文字图像对应的字符集进行判断;
步骤S6,根据标准特征向量和文字图像对应的字符集对文字图像进行识别,以得到识别文字;
步骤S7,根据识别文字的数量对文字操作方式进行判断;
步骤S8,在文字操作方式为输出操作时,对识别文字进行输出;
步骤S9,在文字操作方式为优化操作时,根据识别文字数量对文字线宽的计算过程进行优化和对文字图像特征提取过程进行调整。
与现有技术相比,本发明的有益效果在于,通过所述图像获取模块对文字图像的获取,以提高获取到的文字图像的清晰度,从而提高系统对文字图像的分析效率,进而提高系统对文字图像转换的识别效率和准确度,通过所述特征提取模块对文字图像的特征提取,以得到图像特征向量,从而提高系统对文字图像的分析效率,进而提高系统对文字图像转换的识别效率和准确度,通过所述提取调整模块对文字线宽的分析,以对文字图像的特征提取过程进行调整,从而提高图像特征向量的准确度,进而提高系统对文字图像转换的识别效率和准确度,通过所述特征分析模块对图像特征向量的分析,以对文字图像进行识别,得到识别文字,从而提高系统对文字图像转换的识别效率和准确度,通过所述判断模块对识别文字数量的分析,以判断文字操作方式,从而提高系统对文字图像转换的识别效率和准确度,通过所述输出模块对文字操作方式的分析,以对识别文字进行输出,从而提高系统对文字图像转换的识别效率和准确度,通过所述调整优化模块对识别文字数量的分析,以对文字图像的特征分析过程进行调整并对文字线宽的计算过程进行优化优化,从而提高系统对文字图像转换的识别效率和准确度。
附图说明
图1为本实施例图文文字转换识别系统的结构框图;
图2为本实施例特征提取模块的结构框图;
图3为本实施例特征分析模块的结构框图;
图4为本实施例图文文字转换识别方法的流程框图。
具体实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
此外,还需要说明的是,在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可根据具体情况理解上述术语在本发明中的具体含义。
请参阅图1所示,其为本实施例一种图文文字转换识别系统,包括:
图像获取模块,用以获取文字图像,所述文字图像的获取方式包括图像扫描仪扫描、摄像装置拍摄和传真机扫描等;
特征提取模块,用以对文字图像进行特征提取,以得到图像特征向量,特征提取模块与所述图像获取模块连接,所述图像特征向量包括标准特征向量和旋转特征向量;
提取调整模块,用以根据文字图像对文字线宽进行分析,并根据文字线宽对文字图像的特征提取过程进行调整,调整模块所述特征提取模块连接;
特征分析模块,用以根据图像特征向量对文字图像进行识别,以得到识别文字,特征分析模块与所述特征提取模块连接;
判断模块,用以根据识别文字的数量对文字操作方式进行判断,判断模块与所述特征分析模块连接,所述文字操作方式包括优化操作和输出操作;
输出模块,用以在文字操作方式为输出操作时,对识别文字进行输出,输出模块与所述判断模块连接;
调整优化模块,用以在文字操作方式为优化操作时,根据识别文字数量对文字线宽的计算过程进行优化,所述调整优化模块还用以根据识别文字数量对文字图像特征提取过程进行调整,调整优化模块与所述判断模块连接。
请参阅图2所示,所述特征提取模块包括:
图像处理单元,用以根据文字图像灰度对文字图像进行二化值处理,以得到黑白图像;
图像旋转单元,用以对黑白图像进行旋转处理,以得到旋转图像,图像旋转单元与所述图像处理单元连接;
图像分区单元,用以对黑白图像进行分区处理,以得到多个黑白图像区域,所述图像分区单元还用以对旋转图像进行分区处理,以得到多个旋转图像区域,图像分区单元与所述图像旋转单元连接;
特征提取单元,用以对各黑白图像区域进行特征提取,以得到标准特征向量,所述特征提取单元还用以对各旋转图像区域进行特征提取,以得到旋转特征向量,特征提取单元与所述图像分区单元连接。
请参阅图3所示,所述特征分析模块包括:
特征分析单元,用以计算标准特征向量与旋转特征向量的相似度,并根据相似度对文字图像对应的字符集进行判断;
文字识别单元,用以根据标准特征向量和文字图像对应的字符集对文字图像进行识别,以得到识别文字,文字识别单元与所述特征分析单元连接。
具体而言,本实施例应用于基于光学文字识别技术的图文转换识别系统中,以提高对图像中文字信息的识别效率与准确度,通过所述图像获取模块对文字图像的获取,以提高获取到的文字图像的清晰度,从而提高系统对文字图像的分析效率,进而提高系统对文字图像转换的识别效率和准确度,通过所述特征提取模块对文字图像的特征提取,以得到图像特征向量,从而提高系统对文字图像的分析效率,进而提高系统对文字图像转换的识别效率和准确度,通过所述提取调整模块对文字线宽的分析,以对文字图像的特征提取过程进行调整,从而提高图像特征向量的准确度,进而提高系统对文字图像转换的识别效率和准确度,通过所述特征分析模块对图像特征向量的分析,以对文字图像进行识别,得到识别文字,从而提高系统对文字图像转换的识别效率和准确度,通过所述判断模块对识别文字数量的分析,以判断文字操作方式,从而提高系统对文字图像转换的识别效率和准确度,通过所述输出模块对文字操作方式的分析,以对识别文字进行输出,从而提高系统对文字图像转换的识别效率和准确度,通过所述调整优化模块对识别文字数量的分析,以对文字图像的特征分析过程进行调整并对文字线宽的计算过程进行优化优化,从而提高系统对文字图像转换的识别效率和准确度。
具体而言,本实施例中所述图像处理单元以文字图像中心点为坐标原点,平行于文字图像上下边界的轴为x轴,平行于文字图像左右边界的轴为y轴,建立平面直角坐标系,x轴从左向右依次增大,y轴从下向上依次增大,用坐标表示文字图像中的每一个像素点。
具体而言,本实施例中所述图像处理单元将文字图像的各像素点灰度与灰度阈值进行比对,并根据比对结果对文字图像像素点灰度进行修改,其中:
当G(x,y)≤g时,所述图像处理单元对文字图像像素点灰度进行修改,修改后的文字图像像素点灰度为G'(x,y),设定G'(x,y)=0;
当G(x,y)>g时,所述图像处理单元对文字图像像素点灰度进行修改,修改后的文字图像像素点灰度为G"(x,y),设定G"(x,y)=255;
其中,G(x,y)表示文字图像像素点灰度,g表示灰度阈值,其取值范围为0<g<255。可以理解的是,本实施例中不对灰度阈值的取值作具体限定,本领域技术人员可自由设置,只需满足对文字图像的二化值处理即可,灰度阈值的最佳取值为:g=100。
具体而言,本实施例中通过所述图像处理单元通过对文字图像的分析,以建立平面直角坐标系,从而更加直观的表示文字图像中的各像素点,进而提高系统对文字图像转换的识别效率和准确度,通过所述图像处理单元对文字图像灰度的分析,以对文字图像进行二化值处理,从而得到黑白图像,进而提高系统对文字图像转换的识别效率和准确度。
具体而言,本实施例中所述图像旋转单元以文字图像坐标原点为转轴对黑白图像进行旋转处理,旋转后的坐标系方向不变,所述图像旋转单元将黑白图像顺时针旋转90°,得到第一旋转图像,所述图像旋转单元将黑白图像顺时针旋转180°,得到第二旋转图像。
具体而言,本实施例中通过所述图像旋转单元对文字图像进行旋转处理,以得到多个旋转图像,从而增加系统分析图像数据的数量,增加系统多样性,进而提高系统对文字图像转换的识别效率和准确度。
具体而言,本实施例中所述图像分区单元将黑白图像和旋转图像的横纵坐标与预设坐标进行比对,并根据比对结果对黑白图像和旋转图像进行分区处理,其中:
当x≤X且y≥Y时,所述图像分区单元将该像素点划分为第一区域;
当x>X且y≥Y时,所述图像分区单元将该像素点划分为第二区域;
当x≤X且y<Y时,所述图像分区单元将该像素点划分为第三区域;
当x>X且y<Y时,所述图像分区单元将该像素点划分为第四区域;
其中,x表示像素点横坐标,y表示像素点纵坐标,X表示预设坐标的横坐标,Y表示预设坐标的纵坐标,本实施例中预设坐标设置数量为1个,预设坐标为(0,0)。可以理解的是,本实施例中不对预设坐标和预设坐标设置数量作具体限定,本领域技术人员可自由设置,增加预设坐标数量可以提高系统对文字图像分析的准确度,如预设坐标数量还可设置为5个,其分别为(xmin/2,ymax/2)、(xmax/2,ymax/2)、(0,0),(xmin/2,ymin/2),(xmax/2,ymin/2),其中,xmin表示像素点最小横坐标大小,xmax表示像素点最大横坐标大小,ymin表示像素点最小纵坐标大小,ymax表示像素点最大纵坐标大小,只需满足对黑白图像和旋转图像的分区处理即可。
具体而言,本实施例中通过所述图像分区单元对黑白图像和选择图像的分区处理,以限定系统对文字图像的分析区域,从而增加系统对文字图像的分析比对数量,进而提高系统对文字图像转换的准确度。
具体而言,本实施例中所述特征提取单元根据黑白图像区域和旋转图像区域的像素点灰度值对黑白图像区域和旋转图像区域进行特征提取,将黑白图像区域和旋转图像区域的像素点灰度值与样本平均灰度进行作差,得到灰度变化量,所述特征提取单元将黑白图像区域内像素点的灰度变化量作为标准特征向量,将旋转图像区域内像素点的灰度变化量作为旋转特征向量,所述特征提取单元设有灰度变化量计算公式如下:
b(x,y)=G(x,y)-G1(x,y)
G1(x,y)=[G(x-i,y+i)+G(x-i+1,y+i)+...+G(x+i,y-i)]/(2×i+1)2
其中,b(x,y)表示灰度变化量,G1(x,y)表示样本平均灰度,i表示样本参数,其取值范围为i={2≤i≤6,i∈N+}。可以理解的是,本实施例中不对样本参数的取值作具体限定,本领域技术人员可自由设置,只需满足对样本平均灰度的计算即可,样本参数的最佳取值为:i=3。
具体而言,本实施例中通过所述特征提取单元对各图像区域的特征提取,以得到多组图像特征向量,从而提高系统对文字图像转换的分析效率和准确度,通过所述特征提取单元对样本平均灰度的计算,以实现各像素点的灰度变化量与周围像素点的灰度平均值相关,实现对样本平均灰度的动态调整,从而使计算的灰度变化量更加准确,进而提高系统对文字图像的分析效率和准确度。
具体而言,本实施例中所述提取调整模块根据文字图像灰度通过线宽计算公式计算文字线宽,所述提取调整模块设有线宽计算公式如下:
D=G0/(2×ymax)
其中,D表示文字线宽,D向下取整,G0表示文字图像中灰度为0的像素点数量。
具体而言,本实施例中所述提取调整模块根据文字线宽对样本平均灰度进行调整,调整后的样本平均灰度为G1'(x,y),设定G1'(x,y)=G1(x,y)×i/D。
具体而言,本实施例中通过所述提取调整模块对文字图像的分析,以计算文字线宽,从而对样本平均灰度的计算过程进行调整,进而提高系统对文字图像的分析效率,提高系统分析的准确度,通过所述提取调整模块对文字线宽公式的设定,以提高降低系统对文字线宽的分析时间,从而提高系统对文字图像的分析效率,通过所述提取调整模块对样本平均灰度的调整,以使降低样本平均灰度大小,增大灰度变化量,从而使图像特征向量更加明显,进而提高系统对文字图像识别的准确度。
具体而言,本实施例中所述特征分析单元通过相似度计算公式分别计算标准特征向量与第一旋转特征向量和第二旋转特征向量的相似度,得到第一相似度和第二相似度,所述特征分析单元设有相似度计算公式如下:
Qj=B01/Bj1×B01×Bj2×B02/Bj2×B02×Bj3×..×B0k/Bjk×B0k×Bjk+1
其中,Qj表示相似度,Bj表示旋转特征向量,j表示旋转特征向量编号,其取值范围为:j={1,2},B0表示标准特征向量,k表示区域编号,其取值范围为:k={1,2,3,4|当k=4时,k+1=1}。
具体而言,本实施例中通过所述特征分析单元对相似度计算公式的设定,以使相似度与受当前区域旋转后的旋转特征向量相关,从而提高相似度计算的准确性,进而提高系统对文字图像识别的准确度。
具体而言,本实施例中所述特征分析单元分别将第一相似度和第二相似度与相似度阈值进行比对,并根据比对结果对文字图像对应的字符集进行判断,其中:
当Q1≥α且Q2≥α时,所述特征分析单元判定文字图像对应的字符集为第一字符集;
当Q1<α且Q2≥α时,所述特征分析单元判定文字图像对应的字符集为第二字符集;
当Q1<α且Q2<α时,所述特征分析单元判定文字图像对应的字符集为第三字符集;
其中,α表示相似度阈值,其取值范围为0.5<α<1。可以理解的是,本实施例中不对相似度阈值的取值作具体限定,本领域技术人员可自由设置,只需满足对文字图像对应的字符集的判断即可,相似度阈值的最佳取值为:α=0.8。
值得注意的是,本实施例中所述第一字符集为近似中心对称的字符,如口 、回、田等,所述第二字符集为近似左右对称的字符,如一、目、申等,所述第三字符集为较为复杂的字符,如旋、转、集等。可以理解的是,本实施例中不对相似度阈值的设置数量作具体限定,本领域技术人员可自由设置,通过增加阈值数量可增设更多字符集,以减少后续对文字的匹配数量,提高识别效率。
具体而言,本实施例中通过所述特征分析单元对相似度阈值的设定,以匹配各文字图像对应的字符集,从而减少对识别文字的匹配数量,进而提高系统对文字图像的识别效率,提高识别准确度。
具体而言,本实施例中所述文字识别单元计算标准特征向量与文字图像对应的字符集中的字符特征向量的比值,将比值与识别阈值进行比对,并根据比对结果对识别文字进行判断,其中:
当B0/M(n)≥β时,所述文字识别单元判定字符集中当前文字为识别文字;
当B0/M(n)<β时,所述文字识别单元判定字符集中当前文字非识别文字;
其中M(n)表示字符集中文字的字符特征向量,n表示字符集中的文字,β表示识别阈值,其取值范围为0.8≤β<1。可以理解的是,本实施例中不对识别阈值的取值作具体限定,本领域技术人员可自由设置,只需满足对文字的识别即可,识别阈值的最佳取值为:β=0.95。
具体而言,本实施例中通过所述文字识别单元对标准特征向量的分析,以对字符集中的文字进行识别匹配,从而提高系统对文字图像的识别效率,提高系统对文字识别准确度。
具体而言,本实施例中所述判断模块根据识别文字数量对文字操作方式进行判断,其中:
当S≤1时,所述判断模块判定文字操作方式为输出操作;
当S>1时,所述判断模块判定文字操作方式为调整操作;
其中,S表示识别文字数量。
具体而言,本实施例中所述调整优化模块根据识别文字数量对文字线宽的计算过程进行优化,优化后的文字线宽为D',设定D'=G0×S/[(2+S)/2×ymax]。
具体而言,本实施例中通过所述调整优化模块对文字线宽计算的优化,以使文字线宽随文字数量的增加而增大,降低样本平均灰度大小,增大灰度变化量,从而使图像特征向量更加明显,进而提高系统对文字图像识别的准确度。
具体而言,本实施例中所述调整优化模块根据识别文字数量对灰度阈值进行调整,调整后的灰度阈值为g',设定g'=g/S×1.5。
具体而言,本实施例中通过所述调整优化模块对灰度阈值的调整,以使灰度阈值随识别文字数量的增加而减小,从而增加黑白图像中灰度为255的像素点,进而对文字线宽进行调整,进而提高系统对文字图像识别的准确度。
请参阅图4所示,其为本实施例一种图文文字转换识别系方法,包括:
步骤S1,获取文字图像;
步骤S2,对文字图像进行二化值处理、旋转处理和分区处理,以得到黑白图像区域和旋转图像区域;
步骤S3,对各黑白图像区域和旋转图像区域进行特征提取,以得到标准特征向量和旋转特征向量;
步骤S4,根据文字图像对文字线宽进行分析,并根据文字线宽对文字图像的特征提取过程进行调整;
步骤S5,计算标准特征向量与旋转特征向量的相似度,并根据相似度对文字图像对应的字符集进行判断;
步骤S6,根据标准特征向量和文字图像对应的字符集对文字图像进行识别,以得到识别文字;
步骤S7,根据识别文字的数量对文字操作方式进行判断;
步骤S8,在文字操作方式为输出操作时,对识别文字进行输出;
步骤S9,在文字操作方式为优化操作时,根据识别文字数量对文字线宽的计算过程进行优化和对文字图像特征提取过程进行调整。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
Claims (5)
1.一种图文文字转换识别系统,其特征在于,包括:
图像获取模块,用以获取文字图像;
特征提取模块,用以对文字图像进行特征提取,以得到图像特征向量;
提取调整模块,用以根据文字图像对文字线宽进行分析,并根据文字线宽对文字图像的特征提取过程进行调整;
特征分析模块,用以根据图像特征向量对文字图像进行识别,以得到识别文字;
判断模块,用以根据识别文字的数量对文字操作方式进行判断;
输出模块,用以在文字操作方式为输出操作时,对识别文字进行输出;
调整优化模块,用以在文字操作方式为优化操作时,根据识别文字数量对文字线宽的计算过程进行优化,所述调整优化模块还用以根据识别文字数量对文字图像特征提取过程进行调整;
所述特征提取模块包括:
图像处理单元,用以根据文字图像灰度对文字图像进行二值化处理,以得到黑白图像;
图像旋转单元,用以对黑白图像进行旋转处理,以得到旋转图像;
图像分区单元,用以对黑白图像进行分区处理,以得到多个黑白图像区域,用以对旋转图像进行分区处理,以得到多个旋转图像区域;
特征提取单元,用以对各黑白图像区域进行特征提取,以得到标准特征向量,还用以对各旋转图像区域进行特征提取,以得到旋转特征向量;
所述特征分析模块包括:
特征分析单元,用以计算标准特征向量与旋转特征向量的相似度,并根据相似度对文字图像对应的字符集进行判断;
文字识别单元,用以根据标准特征向量和文字图像对应的字符集对文字图像进行识别,以得到识别文字;
所述特征分析单元通过相似度计算公式分别计算标准特征向量与第一旋转特征向量和第二旋转特征向量的相似度,得到第一相似度和第二相似度,所述特征分析单元设有相似度计算公式如下:
Qj=B01/Bj1×B01×Bj2×B02/Bj2×B02×Bj3×..×B0k/Bjk×B0k×Bjk+1
其中,Qj表示相似度,Bj表示旋转特征向量,j表示旋转特征向量编号,其取值范围为:j={1,2},B0表示标准特征向量,k表示区域编号,其取值范围为:k={1,2,3,4|当k=4时,k+1=1};
所述特征分析单元分别将第一相似度和第二相似度与相似度阈值进行比对,并根据比对结果对文字图像对应的字符集进行判断,其中:
当Q1≥α且Q2≥α时,所述特征分析单元判定文字图像对应的字符集为第一字符集;
当Q1<α且Q2≥α时,所述特征分析单元判定文字图像对应的字符集为第二字符集;
当Q1<α且Q2<α时,所述特征分析单元判定文字图像对应的字符集为第三字符集;
其中,α表示相似度阈值,其取值范围为0.5<α<1;
所述文字识别单元计算标准特征向量与文字图像对应的字符集中的字符特征向量的比值,将比值与识别阈值进行比对,并根据比对结果对识别文字进行判断,其中:
当B0/M(n)≥β时,所述文字识别单元判定字符集中当前文字为识别文字;
当B0/M(n)<β时,所述文字识别单元判定字符集中当前文字非识别文字;
其中M(n)表示字符集中文字的字符特征向量,n表示字符集中的文字,β表示识别阈值,其取值范围为0.8≤β<1;
所述判断模块根据识别文字数量对文字操作方式进行判断,其中:
当S≤1时,所述判断模块判定文字操作方式为输出操作;
当S>1时,所述判断模块判定文字操作方式为调整操作;
其中,S表示识别文字数量;
所述输出模块在文字操作方式为输出操作时,对识别文字进行输出;
所述调整优化模块根据识别文字数量对文字线宽的计算过程进行优化,优化后的文字线宽为D',设定D'=G0×S/[(2+S)/2×ymax];
所述调整优化模块根据识别文字数量对灰度阈值进行调整,调整后的灰度阈值为g',设定g'=g/S×1.5。
2.根据权利要求1所述的图文文字转换识别系统,其特征在于,包括,所述图像处理单元以文字图像中心点为坐标原点,平行于文字图像上下边界的轴为x轴,平行于文字图像左右边界的轴为y轴,建立平面直角坐标系,x轴从左向右依次增大,y轴从下向上依次增大,用坐标表示文字图像中的每一个像素点;
所述图像处理单元将文字图像的各像素点灰度与灰度阈值进行比对,并根据比对结果对文字图像像素点灰度进行修改,其中:
当G(x,y)≤g时,所述图像处理单元对文字图像像素点灰度进行修改,修改后的文字图像像素点灰度为G'(x,y),设定G'(x,y)=0;
当G(x,y)>g时,所述图像处理单元对文字图像像素点灰度进行修改,修改后的文字图像像素点灰度为G"(x,y),设定G"(x,y)=255;
其中,G(x,y)表示文字图像像素点灰度,g表示灰度阈值,其取值范围为0<g<255。
3.根据权利要求1所述的图文文字转换识别系统,其特征在于,包括,所述特征提取单元根据黑白图像区域和旋转图像区域的像素点灰度值对黑白图像区域和旋转图像区域进行特征提取,将黑白图像区域和旋转图像区域的像素点灰度值与样本平均灰度进行作差,得到灰度变化量,所述特征提取单元将黑白图像区域内像素点的灰度变化量作为标准特征向量,将旋转图像区域内像素点的灰度变化量作为旋转特征向量,所述特征提取单元设有灰度变化量计算公式如下:
b(x,y)=G(x,y)-G1(x,y)
G1(x,y)=[G(x-i,y+i)+G(x-i+1,y+i)+...+G(x+i,y-i)]/(2×i+1)2
其中,b(x,y)表示灰度变化量,G1(x,y)表示样本平均灰度,i表示样本参数,其取值范围为i={2≤i≤6,i∈N+}。
4.根据权利要求1所述的图文文字转换识别系统,其特征在于,包括,所述提取调整模块根据文字图像灰度通过线宽计算公式计算文字线宽,所述提取调整模块设有线宽计算公式如下:
D=G0/(2×ymax)
其中,D表示文字线宽,D向下取整,G0表示文字图像中灰度为0的像素点数量;
所述提取调整模块根据文字线宽对样本平均灰度进行调整,调整后的样本平均灰度为G1'(x,y),设定G1'(x,y)=G1(x,y)×i/D。
5.一种图文文字转换识别方法,应用于如权利要求1-4任一项所述的图文文字转换识别系统,其特征在于,包括:
步骤S1,获取文字图像;
步骤S2,对文字图像进行二值化处理、旋转处理和分区处理,以得到黑白图像区域和旋转图像区域;
步骤S3,对各黑白图像区域和旋转图像区域进行特征提取,以得到标准特征向量和旋转特征向量;
步骤S4,根据文字图像对文字线宽进行分析,并根据文字线宽对文字图像的特征提取过程进行调整;
步骤S5,计算标准特征向量与旋转特征向量的相似度,并根据相似度对文字图像对应的字符集进行判断;
步骤S6,根据标准特征向量和文字图像对应的字符集对文字图像进行识别,以得到识别文字;
步骤S7,根据识别文字的数量对文字操作方式进行判断;
步骤S8,在文字操作方式为输出操作时,对识别文字进行输出;
步骤S9,在文字操作方式为优化操作时,根据识别文字数量对文字线宽的计算过程进行优化和对文字图像特征提取过程进行调整。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311022810.2A CN116758559B (zh) | 2023-08-15 | 2023-08-15 | 一种图文文字转换识别系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311022810.2A CN116758559B (zh) | 2023-08-15 | 2023-08-15 | 一种图文文字转换识别系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116758559A CN116758559A (zh) | 2023-09-15 |
CN116758559B true CN116758559B (zh) | 2023-11-07 |
Family
ID=87951768
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311022810.2A Active CN116758559B (zh) | 2023-08-15 | 2023-08-15 | 一种图文文字转换识别系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116758559B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008282327A (ja) * | 2007-05-14 | 2008-11-20 | Sharp Corp | 文字対称性判定方法及び文字対称性判定装置 |
CN102982330A (zh) * | 2012-11-21 | 2013-03-20 | 新浪网技术(中国)有限公司 | 文字图像中字符识别方法和识别装置 |
CN108229470A (zh) * | 2017-12-22 | 2018-06-29 | 北京市商汤科技开发有限公司 | 文字图像处理方法、装置、设备及存储介质 |
CN108256493A (zh) * | 2018-01-26 | 2018-07-06 | 中国电子科技集团公司第三十八研究所 | 一种基于车载视频的交通场景文字识别系统及识别方法 |
CN109961068A (zh) * | 2017-12-26 | 2019-07-02 | 阿里巴巴集团控股有限公司 | 图像识别、训练、搜索方法和装置及设备、介质 |
CN111539415A (zh) * | 2020-04-26 | 2020-08-14 | 梁华智能科技(上海)有限公司 | 一种ocr图像识别的图像处理方法及系统 |
CN112132151A (zh) * | 2020-09-19 | 2020-12-25 | 娄忠富 | 基于循环神经网络识别算法的图像文字识别系统及方法 |
CN115457565A (zh) * | 2022-09-13 | 2022-12-09 | 北京中电汇智科技有限公司 | 一种ocr文字识别方法、电子设备及存储介质 |
-
2023
- 2023-08-15 CN CN202311022810.2A patent/CN116758559B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008282327A (ja) * | 2007-05-14 | 2008-11-20 | Sharp Corp | 文字対称性判定方法及び文字対称性判定装置 |
CN102982330A (zh) * | 2012-11-21 | 2013-03-20 | 新浪网技术(中国)有限公司 | 文字图像中字符识别方法和识别装置 |
CN108229470A (zh) * | 2017-12-22 | 2018-06-29 | 北京市商汤科技开发有限公司 | 文字图像处理方法、装置、设备及存储介质 |
CN109961068A (zh) * | 2017-12-26 | 2019-07-02 | 阿里巴巴集团控股有限公司 | 图像识别、训练、搜索方法和装置及设备、介质 |
CN108256493A (zh) * | 2018-01-26 | 2018-07-06 | 中国电子科技集团公司第三十八研究所 | 一种基于车载视频的交通场景文字识别系统及识别方法 |
CN111539415A (zh) * | 2020-04-26 | 2020-08-14 | 梁华智能科技(上海)有限公司 | 一种ocr图像识别的图像处理方法及系统 |
CN112132151A (zh) * | 2020-09-19 | 2020-12-25 | 娄忠富 | 基于循环神经网络识别算法的图像文字识别系统及方法 |
CN115457565A (zh) * | 2022-09-13 | 2022-12-09 | 北京中电汇智科技有限公司 | 一种ocr文字识别方法、电子设备及存储介质 |
Non-Patent Citations (3)
Title |
---|
Statistical and Similarity Features Based Recognition of Offline Characters;Verma, Deval .et;《2020 GLOBAL CONFERENCE ON WIRELESS AND OPTICAL TECHNOLOGIES (GCWOT)》;全文 * |
基于Tesseract文字识别系统的研究与实现;曾悦;《中国优秀硕士学位论文全文数据库(信息科技辑)》;全文 * |
基于多特征提取的识别算法数学建模优化研究;李华平;;哈尔滨师范大学自然科学学报(04);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116758559A (zh) | 2023-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7853086B2 (en) | Face detection method, device and program | |
JP5188334B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
US7801337B2 (en) | Face detection method, device and program | |
US7233697B2 (en) | Character recognition device and a method therefor | |
JP3353968B2 (ja) | 画像処理装置 | |
EP0649113B1 (en) | Multifont optical character recognition using a box connectivity approach | |
KR101606469B1 (ko) | 이미지 분석방법, 특히 이동 단말기용 이미지 분석방법 | |
KR20100072772A (ko) | 스테레오 비전을 이용한 실시간 얼굴 검출 시스템 및 그 방법 | |
CN106408025B (zh) | 基于图像处理的航拍图像绝缘子分类识别方法 | |
Yin et al. | Robust vanishing point detection for mobilecam-based documents | |
CN109800659B (zh) | 一种动作识别方法及装置 | |
CN112132151A (zh) | 基于循环神经网络识别算法的图像文字识别系统及方法 | |
US20230059499A1 (en) | Image processing system, image processing method, and non-transitory computer readable medium | |
CN113963041A (zh) | 一种图像纹理识别方法及系统 | |
CN113255706B (zh) | 一种基于卷积神经网络算法的目标识别方法及系统 | |
US7620246B2 (en) | Method and apparatus for image processing | |
CN116628533A (zh) | 基于K-Shape的时间序列大数据聚类算法 | |
CN115620321A (zh) | 表格识别方法及装置、电子设备和存储介质 | |
JPH11213160A (ja) | 画像処理方法及び装置及びその記憶媒体 | |
CN116758559B (zh) | 一种图文文字转换识别系统及方法 | |
KR100943595B1 (ko) | 영상신호의 블러링 판단장치 및 방법 | |
CN113723410B (zh) | 一种数码管数字识别方法及装置 | |
JP2011170890A (ja) | 顔検出方法および装置並びにプログラム | |
Chu et al. | Text detection in manga by deep region proposal, classification, and regression | |
JP4795737B2 (ja) | 顔検出方法および装置並びにプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |