CN112818983B - 一种利用图片相识度判断字符倒置的方法 - Google Patents
一种利用图片相识度判断字符倒置的方法 Download PDFInfo
- Publication number
- CN112818983B CN112818983B CN202110089346.3A CN202110089346A CN112818983B CN 112818983 B CN112818983 B CN 112818983B CN 202110089346 A CN202110089346 A CN 202110089346A CN 112818983 B CN112818983 B CN 112818983B
- Authority
- CN
- China
- Prior art keywords
- picture
- sample
- character
- acquaintance
- pictures
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000004364 calculation method Methods 0.000 claims description 35
- 238000010586 diagram Methods 0.000 claims description 4
- 230000008447 perception Effects 0.000 claims description 3
- 238000003672 processing method Methods 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 11
- 239000013598 vector Substances 0.000 description 6
- 238000012935 Averaging Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000003707 image sharpening Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012015 optical character recognition Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/242—Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/06—Recognition of objects for industrial automation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Abstract
本发明公开了一种利用图片相识度判断字符倒置的方法,属于图像处理技术领域,包括选取基准图片,正常图片,倒置图片;将新的图片与基准图片进行相识度比较;采用多种相识度比较的方法得到结果,进行投票,解决了自动识别图片中的文字是否倒置的技术问题,通过根据已有图像推断目标图像的字符情况,特别适用在自动化产线上快速识别领域,其具有方便快捷、准确性高的优点。
Description
技术领域
本发明属于图像处理技术领域,涉及一种利用图片相识度判断字符倒置的方法。
背景技术
光学字符识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。
在应用中,采集到的字符可能会出现倒置的状况,识别的时候会因为字符倒置,从而识别结果会有很大的误差。因此,需要研究出一种新的方法来判断字符是否倒置。
发明内容
本发明的目的是提供一种利用图片相识度判断字符倒置的方法,解决了自动识别图片中的文字是否倒置的技术问题。
为实现上述目的,本发明采用如下技术方案:
一种利用图片相识度判断字符倒置的方法,包括如下步骤:
步骤1:建立图片采集模块和图片处理服务器;图片采集模块与图片处理服务器之间通过互联网相互通信;
步骤2:图片采集模块采集待处理图片,并将待处理图片发送给图片处理服务器;图片处理服务器建立待处理图片集,用于收集带处理图片;
步骤3:图片处理服务器从待处理图片集中选取数张待处理图片作为样本图片,建立样本图片集;
步骤4:图片处理服务器对样本图片集中的所有样本图片进行预处理,即,裁剪出每张样本图片上的字符区域,并对字符进行识别,得到每张样本图片中的字符;
步骤5:图片处理服务器从样本图片集中选择出两张样本图片作为基准图片,设定一张为正常图片、另一张为字符倒置图片;
步骤6:图片处理服务器再从样本图片集中选择一张图片作为未知图片,未知图片为基准图片之外的样本图片;
图片处理服务器对未知图片按照步骤4的方法进行预处理;
步骤7:利用三种相识度算法,将未知图片分别与正常图片和字符倒置图片进行相似度计算,得出与正常图片的相似度结果和与字符倒置图片的相似度结果;
步骤8:将步骤7中得出的与正常图片的相似度结果和与字符倒置图片的相似度结果进行比较,得出最终判定结果。
优选的,所述待处理图片为正常的图片或倒置的图片。
优选的,在执行步骤4时,具体包括如下步骤:
步骤A1:将样本图片进行灰度化处理,突出字符特征,生成灰度图,具体灰度化调整公式如下:
f(i,j)=a*R(i,j)+b*G(i,j)+c*B(i,j);
其中,R、G和B分别为图片的红色通道、绿色通道和蓝色通道,(i,j)代表图像在坐标(i,j)处像素值大小,a代表R通道的权重,b代表G通道权重,c代表蓝色通道权重;
步骤A2:采用矩形轮廓拟合,对灰度图中的字符特征进行选取,定位出获得包围字符的最小的矩形轮廓和字符在待识别的图片中的位置,将字符提取出来;
步骤A3:将包围字符的最小的矩形轮廓从图片中提取出来,得到所述字符区域。
优选的,在执行步骤S5时,具体包括如下步骤:
步骤B1:根据样本图片的类型,对样本图片进行分类;
步骤B2:计算类型相同的所有样本图片的hash值,取出任意一张样本图片,将其与其他类型相同的样本图片分别进行距离计算,得到距离值,并对距离值进行平均计算,得到距离平均值Lx,x代表图片的编号,取值为正整数,L代表距离平均值;
步骤B3:重复执行步骤B2,最终得到距离平均值集合{L1,L2,……,Ln},其中n为正整数,取值小于等于x,从距离平均值集合中找出最小值,将最小值对应的样本图片作为基准图片;
步骤B4:根据步骤B1到步骤B3的方法找出两个基准图片,一个作为所述正常图片、另一张作为所述字符倒置图片。
优选的,在执行步骤6时,未知图片和步骤4中的所述样本图片是在自同一环境下拍摄的;未知图片和步骤4中的所述样本图片采用相同的处理方法进行预处理和裁剪,所选用的参数也相同。
优选的,在执行步骤7时,相识度算法包括相识度计算方法有均值哈希算法、差值哈希算法和感知哈希算法;
待判定的未知图片与基准图片进行相识度计算得到结果为:与正常图片进行三种相识度计算的结果A[y1,y2,y3],其中,y1,y2,y3分别代表三种相识度计算的结果;与字符倒置图片进行三种相识度计算的结果B[z1,z2,z3],其中z1,z2,z3分别代表三种相识度计算的结果。
优选的,在执行步骤8时,根据步骤7中得出的结果A[y1,y2,y3]和B[z1,z2,z3],分别比较y1与z1、y2与z2,y3与z3的大小,如果A[y1,y2,y3]中有两个参数或三个参数小于B[z1,z2,z3]中的参数,则判定未知图片为字符正常的图片,反之,则判定未知图片为字符倒置的图片。
优选的,所述图像采集模块为扫描仪或数码相机。
本发明所述的一种利用图片相识度判断字符倒置的方法,解决了自动识别图片中的文字是否倒置的技术问题,通过根据已有图像推断目标图像的字符情况,特别适用在自动化产线上快速识别领域,其具有方便快捷、准确性高的优点。
附图说明
图1为字符正常情况下基准图片;
图2为字符倒置情况下基准图片;
图3为需要判定的图片;
图4为本发明基于相似度的倒置字符判定的工作流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1-图4所示的一种利用图片相识度判断字符倒置的方法,包括如下步骤:
步骤1:建立图片采集模块和图片处理服务器;图片采集模块与图片处理服务器之间通过互联网相互通信;
步骤2:图片采集模块采集待处理图片,并将待处理图片发送给图片处理服务器;图片处理服务器建立待处理图片集,用于收集带处理图片;
步骤3:图片处理服务器从待处理图片集中选取数张待处理图片作为样本图片,建立样本图片集;
本实施例中,图片采集模块一次采集几十张待处理图片,图片采集的环境需要保持一致,环境包括相机的型号、位置、周围的光照等相一致,有助于判定的准确率。
步骤4:图片处理服务器对样本图片集中的所有样本图片进行预处理,即,裁剪出每张样本图片上的字符区域,并对字符进行识别,得到每张样本图片中的字符;
在本实施例中所述预处理方法包括:灰度化,二值化,图像锐化,卷积,去噪等操作。所述裁剪方法包括:掩模操作,透视变换,投影变换等操作。
样本图片可能非常大,而字符是其中一小部分,需要通过各种方法进行定位和分割。本实施例中的定位的方法包括Blob分析,利用识别区域的特征,如形状,大小,颜色等各种信息来选中目标区域。得到目标区域后,可通过矩形拟合,矩形拟合的方法可以通过OpenCV中的函数来实现;从而得到矩形的四个角点的坐标,再根据角点坐标进行透视变换,可以得到需要识别的区域。也可使用深度学习技术比如CPTN等方法,回归区域的四个顶点。
步骤5:图片处理服务器从样本图片集中选择出两张样本图片作为基准图片,设定一张为正常图片、另一张为字符倒置图片;
本实施例中,通过计算所有同一类型图像的哈希值,取出其中一个与剩余同类型图像分别进行汉明距离计算。
哈希值通过哈希函数计算,哈希函数是指一种从任何一种数据中创建小的数字“指纹”的方法。散列函数把消息或数据压缩成摘要,使得数据量变小,将数据的格式固定下来。该函数将数据打乱混合,重新创建一个叫做散列值的指纹。散列值通常用一个短的随机字母和数字组成的字符串来代表。
汉明距离是用来计算两个向量的相似度;即通过比较向量每一位是否相同,若不同则汉明距离加1,这样得到汉明距离。向量相似度越高,对应的汉明距离越小。如10001001和10110001有3位不同。
本发明也可使用其他距离公式替代,例如欧氏距离、曼哈顿距离、切比雪夫距离等等其他距离公式。
步骤6:图片处理服务器再从样本图片集中选择一张图片作为未知图片,未知图片为基准图片之外的样本图片;
图片处理服务器对未知图片按照步骤4的方法进行预处理;
未知图片需要与基准图片的来源相一致,采集时的环境包括:光线强度,位置,采集的对象也要相一致,未知图片按照步骤4中的相同方法进行处理,以便保证判别的准确性。
步骤7:利用三种相识度算法,将未知图片分别与正常图片和字符倒置图片进行相似度计算,得出与正常图片的相似度结果和与字符倒置图片的相似度结果;
本实施例中,相识度计算包括如下两个步骤:
步骤S1:哈希计算:哈希函数是指一种从任何一种数据中创建小的数字“指纹”的方法。散列函数把消息或数据压缩成摘要,使得数据量变小,将数据的格式固定下来。该函数将数据打乱混合,重新创建一个叫做散列值(hash values,hash codes,hash sums,或hashes)的指纹。散列值通常用一个短的随机字母和数字组成的字符串来代表。这里采用的算法包括:均值哈希算法、差值哈希算法和感知哈希算法。但不仅限于这几种哈希算法,也有其他方法例如:直方图;
步骤S2:距离计算:这里采用的是汉明距离用来计算两个向量的相似度;即通过比较向量每一位是否相同,若不同则汉明距离加1,这样得到汉明距离。向量相似度越高,对应的汉明距离越小。如10001001和10110001有3位不同。但不仅限于汉明距离计算方法,例如欧式距离等等。
步骤8:将步骤7中得出的与正常图片的相似度结果和与字符倒置图片的相似度结果进行比较,得出最终判定结果。
优选的,所述待处理图片为正常的图片或倒置的图片。
优选的,在执行步骤4时,具体包括如下步骤:
步骤A1:将样本图片进行灰度化处理,突出字符特征,生成灰度图,具体灰度化调整公式如下:
f(i,j)=a*R(i,j)+b*G(i,j)+c*B(i,j);
其中,R、G和B分别为图片的红色通道、绿色通道和蓝色通道,(i,j)代表图像在坐标(i,j)处像素值大小,a代表R通道的权重,b代表G通道权重,c代表蓝色通道权重;
本实施例中,首先对灰度化之后得到的灰度图,选择合适的阈值进行二值化,然后通过Blob分析寻找到目标区域,再然后通过Blob分析寻找到目标区域,再然后通过矩形拟合对目标区域进行选中,最后根据矩形拟合得出的矩形坐标点,进行图像分割,截取到想要的部分。
步骤A2:采用矩形轮廓拟合,对灰度图中的字符特征进行选取,定位出获得包围字符的最小的矩形轮廓和字符在待识别的图片中的位置,将字符提取出来;
步骤A3:将包围字符的最小的矩形轮廓从图片中提取出来,得到所述字符区域。
优选的,在执行步骤S5时,具体包括如下步骤:
步骤B1:根据样本图片的类型,对样本图片进行分类;
步骤B2:计算类型相同的所有样本图片的hash值,取出任意一张样本图片,将其与其他类型相同的样本图片分别进行距离计算,得到距离值,并对距离值进行平均计算,得到距离平均值Lx,x代表图片的编号,取值为正整数,L代表距离平均值;
步骤B3:重复执行步骤B2,最终得到距离平均值集合{L1,L2,……,Ln},其中n为正整数,取值小于等于x,从距离平均值集合中找出最小值,将最小值对应的样本图片作为基准图片;
步骤B4:根据步骤B1到步骤B3的方法找出两个基准图片,一个作为所述正常图片、另一张作为所述字符倒置图片。
优选的,在执行步骤6时,未知图片和步骤4中的所述样本图片是在自同一环境下拍摄的;未知图片和步骤4中的所述样本图片采用相同的处理方法进行预处理和裁剪,所选用的参数也相同,即,所需要的二值化阈值需要相同。
优选的,在执行步骤7时,相识度算法包括相识度计算方法有均值哈希算法、差值哈希算法和感知哈希算法;
待判定的未知图片与基准图片进行相识度计算得到结果为:与正常图片进行三种相识度计算的结果A[y1,y2,y3],其中,y1,y2,y3分别代表三种相识度计算的结果;与字符倒置图片进行三种相识度计算的结果B[z1,z2,z3],其中z1,z2,z3分别代表三种相识度计算的结果。
感知哈希算法(perceptual hash algorithm)包括如下步骤:
步骤C1:缩放:图片缩放为32*32,保留结构,出去细节;
步骤C2:灰度化:转换为256阶灰度图;
步骤C3:对图片进行离散余弦变换(DCT),转换频域;
步骤C4:取频域左上角8*8大小(图片的能量都集中在低频部分,低频位于左上角);
步骤C5:求平均值,并根据平均值将每一个像素二值化(大于均值为1小于均值为0);
步骤C6:对比指纹:将两幅图的指纹对比,计算汉明距离,即两个64位的hash值有多少位是不一样的,不相同位数越少,图片越相似。
均值哈希算法包括如下步骤:
步骤D1:缩放:图片缩放为8*8,保留结构,出去细节;
步骤D2:灰度化:转换为256阶灰度图;
步骤D3:求平均值:计算灰度图所有像素的平均值;
步骤D4:比较:像素值大于平均值记作1,相反记作0,总共64位;
步骤D5:生成hash:将上述步骤生成的1和0按顺序组合起来既是图片的指纹(hash);顺序不固定。但是比较时候必须是相同的顺序;
步骤D6:对比指纹:将两幅图的指纹对比,计算汉明距离,即两个64位的hash值有多少位是不一样的,不相同位数越少,图片越相似;
差值哈希算法包括如下步骤:
步骤E1:缩放:图片缩放为8*9,保留结构,出去细节;
步骤E2:灰度化:转换为256阶灰度图;
步骤E3:求平均值:计算灰度图所有像素的平均值;
步骤E4:比较:像素值大于后一个像素值记作1,相反记作0;本行不与下一行对比,每行9个像素,八个差值,有8行,总共64位;
步骤E5:生成hash:将上述步骤生成的1和0按顺序组合起来既是图片的指纹(hash);顺序不固定。但是比较时候必须是相同的顺序;
步骤E6:对比指纹:将两幅图的指纹对比,计算汉明距离,即两个64位的hash值有多少位是不一样的,不相同位数越少,图片越相似。
优选的,在执行步骤8时,根据步骤7中得出的结果A[y1,y2,y3]和B[z1,z2,z3],分别比较y1与z1、y2与z2,y3与z3的大小,如果A[y1,y2,y3]中有两个参数或三个参数小于B[z1,z2,z3]中的参数,则判定未知图片为字符正常的图片,反之,则判定未知图片为字符倒置的图片。
优选的,所述图像采集模块为扫描仪或数码相机。
本发明所述的一种利用图片相识度判断字符倒置的方法,解决了自动识别图片中的文字是否倒置的技术问题,通过根据已有图像推断目标图像的字符情况,特别适用在自动化产线上快速识别领域,其具有方便快捷、准确性高的优点。
本发明首先选取基准图片,通过比较字符正常的基准图片和字符倒置的基准图片的相识度来判断。本发明通过相识度比较的方法来判断图片中字符的情况,所述相识度比较包括:均值哈希算法、差值哈希算法和感知哈希算法等,经过哈希计算后,进行距离计算,距离计算方法包括汉明距离、欧氏距离、曼哈顿距离、切比雪夫距离等等其他距离计算公式。本发明选用三个相识度比较方法,保证整个判断的准确性,也可选用更多个相识度比较方法。本发明为后续字符识别提供了预处理操作,使后续识别更加准确。
在本发明中,流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (8)
1.一种利用图片相识度判断字符倒置的方法,其特征在于:包括如下步骤:
步骤1:建立图片采集模块和图片处理服务器;图片采集模块与图片处理服务器之间通过互联网相互通信;
步骤2:图片采集模块采集待处理图片,并将待处理图片发送给图片处理服务器;图片处理服务器建立待处理图片集,用于收集待处理图片;
步骤3:图片处理服务器从待处理图片集中选取数张待处理图片作为样本图片,建立样本图片集;
步骤4:图片处理服务器对样本图片集中的所有样本图片进行预处理,即,裁剪出每张样本图片上的字符区域,并对字符进行识别,得到每张样本图片中的字符;
步骤5:图片处理服务器从样本图片集中选择出两张样本图片作为基准图片,设定一张为正常图片、另一张为字符倒置图片;
步骤6:图片处理服务器再从样本图片集中选择一张图片作为未知图片,未知图片为基准图片之外的样本图片;
图片处理服务器对未知图片按照步骤4的方法进行预处理;
步骤7:利用三种相识度算法,将未知图片分别与正常图片和字符倒置图片进行相似度计算,得出与正常图片的相似度结果和与字符倒置图片的相似度结果;
步骤8:将步骤7中得出的与正常图片的相似度结果和与字符倒置图片的相似度结果进行比较,得出最终判定结果。
2.如权利要求1所述的一种利用图片相识度判断字符倒置的方法,其特征在于:所述待处理图片为正常的图片或倒置的图片。
3.如权利要求1所述的一种利用图片相识度判断字符倒置的方法,其特征在于:在执行步骤4时,具体包括如下步骤:
步骤A1:将样本图片进行灰度化处理,突出字符特征,生成灰度图,具体灰度化调整公式如下:
f(i,j)=a*R(i,j)+b*G(i,j)+c*B(i,j);
其中,R、G和B分别为图片的红色通道、绿色通道和蓝色通道,其中,R、G和B分别为图片的红色通道、绿色通道和蓝色通道,
(i,j)代表图像在坐标(i,j)处像素值大小,a代表R通道的权重,b代表G通道权重,c代表蓝色通道权重;
步骤A2:采用矩形轮廓拟合,对灰度图中的字符特征进行选取,定位出获得包围字符的最小的矩形轮廓和字符在待识别的图片中的位置,将字符提取出来;
步骤A3:将包围字符的最小的矩形轮廓从图片中提取出来,得到所述字符区域。
4.如权利要求1所述的一种利用图片相识度判断字符倒置的方法,其特征在于:在执行步骤S5时,具体包括如下步骤:
步骤B1:根据样本图片的类型,对样本图片进行分类;
步骤B2:计算类型相同的所有样本图片的hash值,取出任意一张样本图片,将其与其他类型相同的样本图片分别进行距离计算,得到距离值,并对距离值进行平均计算,得到距离平均值Lx,x代表图片的编号,取值为正整数,L代表距离平均值;
步骤B3:重复执行步骤B2,最终得到距离平均值集合{L1,L2,……,Ln},其中n为正整数,取值小于等于x,从距离平均值集合中找出最小值,将最小值对应的样本图片作为基准图片;
步骤B4:根据步骤B1到步骤B3的方法找出两个基准图片,一个作为所述正常图片、另一张作为所述字符倒置图片。
5.如权利要求1所述的一种利用图片相识度判断字符倒置的方法,其特征在于:在执行步骤6时,未知图片和步骤4中的所述样本图片是在自同一环境下拍摄的;未知图片和步骤4中的所述样本图片采用相同的处理方法进行预处理和裁剪,所选用的参数也相同。
6.如权利要求1所述的一种利用图片相识度判断字符倒置的方法,其特征在于:在执行步骤7时,相识度算法包括相识度计算方法有均值哈希算法、差值哈希算法和感知哈希算法;
待判定的未知图片与基准图片进行相识度计算得到结果为:与正常图片进行三种相识度计算的结果A[y1,y2,y3],其中,y1,y2,y3分别代表三种相识度计算的结果;与字符倒置图片进行三种相识度计算的结果B[z1,z2,z3],其中z1,z2,z3分别代表三种相识度计算的结果。
7.如权利要求6所述的一种利用图片相识度判断字符倒置的方法,其特征在于:在执行步骤8时,根据步骤7中得出的结果A[y1,y2,y3]和B[z1,z2,z3],分别比较y1与z1、y2与z2,y3与z3的大小,如果A[y1,y2,y3]中有两个参数或三个参数小于B[z1,z2,z3]中的参数,则判定未知图片为字符正常的图片,反之,则判定未知图片为字符倒置的图片。
8.如权利要求1所述的一种利用图片相识度判断字符倒置的方法,其特征在于:所述图片采集模块为扫描仪或数码相机。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110089346.3A CN112818983B (zh) | 2021-01-22 | 2021-01-22 | 一种利用图片相识度判断字符倒置的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110089346.3A CN112818983B (zh) | 2021-01-22 | 2021-01-22 | 一种利用图片相识度判断字符倒置的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112818983A CN112818983A (zh) | 2021-05-18 |
CN112818983B true CN112818983B (zh) | 2024-08-02 |
Family
ID=75858899
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110089346.3A Active CN112818983B (zh) | 2021-01-22 | 2021-01-22 | 一种利用图片相识度判断字符倒置的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112818983B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113822249B (zh) * | 2021-11-23 | 2022-05-17 | 山东信通电子股份有限公司 | 一种监测架空线路隐患位置的方法、设备 |
CN114529918A (zh) * | 2022-02-10 | 2022-05-24 | 珠海读书郎软件科技有限公司 | 一种试卷倒置识别方法、装置及介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101833648A (zh) * | 2009-03-13 | 2010-09-15 | 汉王科技股份有限公司 | 文本图像的校正方法 |
CN109145907A (zh) * | 2018-09-11 | 2019-01-04 | 上海中信信息发展股份有限公司 | 基于常用字字频统计的文本图像倒置检测方法及装置 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06195503A (ja) * | 1992-02-28 | 1994-07-15 | Ricoh Co Ltd | 画像方向認識方法および画像方向認識装置 |
JPH06259597A (ja) * | 1993-03-09 | 1994-09-16 | Ricoh Co Ltd | ドキュメントイメージ処理方法並びに文字認識システムおよびドキュメントイメージ処理装置 |
DE19507059B9 (de) * | 1995-03-01 | 2005-02-17 | Wevelsiep, Klaus, Prof. Dipl.-Ing. Dr. | Verfahren zur omnidirektionalen Erfassung von OCR-Klarschrift auf Etiketten oder ähnlichen Datenträgern durch zufallsgesteuerte Suche und Dekodierung mit einem neuronalen Netzwerk |
JP2001043310A (ja) * | 1999-07-30 | 2001-02-16 | Fujitsu Ltd | 文書画像補正装置および補正方法 |
CN100578530C (zh) * | 2006-03-14 | 2010-01-06 | 株式会社理光 | 图像处理设备和图像方向判定方法 |
JP2008154216A (ja) * | 2006-11-20 | 2008-07-03 | Sharp Corp | 画像処理方法、画像処理装置、画像形成装置、原稿読取装置、コンピュータプログラム及び記録媒体 |
CN103679191B (zh) * | 2013-09-04 | 2017-02-22 | 西交利物浦大学 | 基于静态图片的自动套牌车检测方法 |
CN105894441A (zh) * | 2015-12-29 | 2016-08-24 | 乐视云计算有限公司 | 一种图像匹配方法及装置 |
CN106650758B (zh) * | 2016-06-29 | 2019-03-29 | 汉寿县公安局 | 基于图片切割技术的身份证信息解析方法 |
CN107169489B (zh) * | 2017-05-08 | 2020-03-31 | 北京京东金融科技控股有限公司 | 倾斜图像校正的方法和装置 |
CN107609482B (zh) * | 2017-08-15 | 2021-02-19 | 天津大学 | 一种基于汉字笔画特征的中文文本图像倒置判别方法 |
CN109034165B (zh) * | 2018-07-06 | 2022-03-01 | 北京中安未来科技有限公司 | 一种证件图像的裁切方法、装置、系统及存储介质 |
CN109886265B (zh) * | 2019-01-11 | 2022-08-16 | 南京邮电大学 | 一种基于Adaboost和模板匹配的车门限位器检测方法 |
WO2020223859A1 (zh) * | 2019-05-05 | 2020-11-12 | 华为技术有限公司 | 一种检测倾斜文字的方法、装置及设备 |
CN110647882A (zh) * | 2019-09-20 | 2020-01-03 | 上海眼控科技股份有限公司 | 图像校正方法、装置、设备及存储介质 |
CN112001383B (zh) * | 2020-08-10 | 2024-09-10 | 长沙奇巧匠人软件有限公司 | 一种基于卷积神经网络技术的水表码智能识别方法 |
CN112052849A (zh) * | 2020-08-26 | 2020-12-08 | 中国建设银行股份有限公司 | Ocr中判断文件图像方向的方法、装置、设备及存储介质 |
-
2021
- 2021-01-22 CN CN202110089346.3A patent/CN112818983B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101833648A (zh) * | 2009-03-13 | 2010-09-15 | 汉王科技股份有限公司 | 文本图像的校正方法 |
CN109145907A (zh) * | 2018-09-11 | 2019-01-04 | 上海中信信息发展股份有限公司 | 基于常用字字频统计的文本图像倒置检测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112818983A (zh) | 2021-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5844783B2 (ja) | テキスト領域を含むグレースケール文書画像を処理する方法、グレースケール文書画像の少なくともテキスト領域を二値化する方法、グレースケール文書画像においてグリッドを形成するテーブルの抽出方法及びプログラム | |
JP5047005B2 (ja) | 画像処理方法、パターン検出方法、パターン認識方法及び画像処理装置 | |
US8611662B2 (en) | Text detection using multi-layer connected components with histograms | |
TW201437925A (zh) | 物體識別裝置、方法及電腦程式產品 | |
US20080193020A1 (en) | Method for Facial Features Detection | |
EP2645305A2 (en) | A system and method for processing image for identifying alphanumeric characters present in a series | |
JP2005523530A (ja) | 取り込み画像データから文字列を識別して抜出するシステムおよび方法 | |
JP2000105829A (ja) | 顔パーツ検出方法及びその装置 | |
CN112818983B (zh) | 一种利用图片相识度判断字符倒置的方法 | |
CN112101058B (zh) | 一种试卷条码自动识别方法及装置 | |
CN118275449A (zh) | 铜带表面缺陷检测方法、装置及设备 | |
JP3814353B2 (ja) | 画像分割方法および画像分割装置 | |
CN117218672A (zh) | 一种基于深度学习的病案文字识别方法及系统 | |
JP3416058B2 (ja) | 濃淡画像の文字抽出方法及びそのプログラムを記録した記録媒体 | |
JP3906221B2 (ja) | 画像処理方法及び画像処理装置 | |
Valiente et al. | A process for text recognition of generic identification documents over cloud computing | |
CN115376139A (zh) | 基于ocr高速图像识别的标签采集分析系统 | |
CN111931689B (zh) | 一种在线提取视频卫星数据鉴别特征的方法 | |
Kaur et al. | Text Extraction from Natural Scene using PCA. | |
JP2005250786A (ja) | 画像認識方法 | |
JP2002245404A (ja) | 領域切り出しプログラムおよび装置 | |
CN118071831B (zh) | 图像粗定位方法、设备及计算机可读存储介质 | |
CN117576416B (zh) | 工件边缘区域的检测方法、设备及存储介质 | |
CN117474916B (zh) | 一种图像检测方法、电子设备及存储介质 | |
CN112862802B (zh) | 基于边缘外观序列匹配的地点识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |