CN112801098B - 一种基于轮廓技术的数学符号识别方法 - Google Patents

一种基于轮廓技术的数学符号识别方法 Download PDF

Info

Publication number
CN112801098B
CN112801098B CN201911113457.2A CN201911113457A CN112801098B CN 112801098 B CN112801098 B CN 112801098B CN 201911113457 A CN201911113457 A CN 201911113457A CN 112801098 B CN112801098 B CN 112801098B
Authority
CN
China
Prior art keywords
value
image
contour
shape
approximate value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911113457.2A
Other languages
English (en)
Other versions
CN112801098A (zh
Inventor
张金刚
甘尼什库玛
基兰戈达
库木达
吕玉茂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Linyi Infotop Network Co ltd
Original Assignee
Linyi Infotop Network Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Linyi Infotop Network Co ltd filed Critical Linyi Infotop Network Co ltd
Priority to CN201911113457.2A priority Critical patent/CN112801098B/zh
Publication of CN112801098A publication Critical patent/CN112801098A/zh
Application granted granted Critical
Publication of CN112801098B publication Critical patent/CN112801098B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于轮廓技术的数学符号识别方法,包括以下步骤,S1、提取图片,读取大量的图片;S2、调整图像尺寸、阈值、轮廓,使用opencv2 bilateralFilter方法对图片进行处理;S3、数值输入轮廓循环函数,计算近似值;S4、近似值的计算,将近似值与轮廓值进行比较;S5、循环计算,未能得到准确的近似值,则重复步骤S3的计算;本发明技术非常新颖,方便理解,复杂度底,容易实现;数学符号识别非常有效,且本方法也可识别较低像素值图像;方法简单需求较低,对用户友好,可有效提高效率;且编程技术简单易懂,成本较低,无需训练和测试流程,流程的复杂性较低,内存及资源需求较小,各步骤流程容易识别,准确性更是达到了100%。

Description

一种基于轮廓技术的数学符号识别方法
技术领域
本发明涉及计算机科学技术领域,具体为一种基于轮廓技术的数学符号识别方法。
背景技术
在编程语言中,对指定图像中的对象进行辨认的过程称为识别、数学符号识别,是一种根据对象轮廓识别对象符号的程序,用于识别给定图像中印刷体的数学符号。
现有技术基于Tensorflow的自定义对象数学符号检测模型的训练是通过输入带有数学符号、字母和数字的数据集,利用TensorFlow对象检测技术,进行反复的训练,直到准确率达到100%,将结果集存储起来,并作为输入,从而创建出一个新模型,即数学符号识别模型,但该模型获取的准确度不超过65%。需手动收集不同的手写符号,并对收集到的的符号进行训练和测试,这需用到高速处理器及更多内存,来提高准确率。这个过程相当复杂。要利用复杂的神经网络技术,以及复杂的内部操作。
故引入一项新技术,这种新兴技术用于识别或检测图像中印刷体的数学符号,它是一种改进的形状检测技术,本方案所使用的编程技术简单易懂,成本较低。无需训练和测试流程。与现有技术相比,流程的复杂性较低,内存及资源需求较小,各步骤流程容易识别,准确性更是达到了100%。
发明内容
本发明的目的在于提供一种基于轮廓技术的数学符号识别方法,具有编程技术简单易懂,成本较低,无需训练和测试流程,流程的复杂性较低,内存及资源需求较小,各步骤流程容易识别,准确性更是达到了100%等优点,用以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于轮廓技术的数学符号识别方法,包括如下步骤:
S1、提取图片,首先利用Tensorflow软件读取大量的图片,并且这些图片中会包含有大量的数学符号、包含字母符号及包含数字符号;
S2、调整图像尺寸、阈值、轮廓,使用opencv2bilateralFilter方法对图片进行处理,首先找出图像中符号的边缘;接下来的任务是确定形状、对象是否属于闭合型;然后使用轮廓技术确定图像中的形状或对象为加减乘除及平方根等数学符号;再将输入的图像转换为灰度模式,最后将灰度图像作为阈值函数的第一个输入参数;
S3、数值输入轮廓循环函数,计算近似值,源图像作为阈值函数的第一个输入参数,源图像即为灰度图像,像素值分类阈值作为阈值函数的第二个输入的参数,maxVal作为阈值函数的第三个输入的参数;
S4、近似值的计算,通过阀值函数内输入的各种参数,计算出阀值函数的近似值,并且将近似值与轮廓值进行比较,如果近似值等于轮廓值,符号被识别,给出准确率,并停止程序;如果近似值不等于轮廓值,则直接终止程序;
S5、循环计算,如果在计算的时候未能得到准确的近似值,则重复步骤S3的计算,直至得到准确的近似值,然后对近似值进行判断,得出结果,停止程序体的运行。
所述步骤S2中先使用opencv2bilateralFilter方法去除图片中的噪点,找出图像中符号的边缘,然后确定形状、对象是否属于闭合型。
所述确定图片边缘是否属于闭合型需要形状的边缘上标记像素,根据链式码、相邻像素的概念,按照像素连接的方向移动;如果结束点与起始点重合,则可以推断形状为闭合型,如果结束点与起始点不重合,则可以推断形状为开合型。
所述步骤S2中使用opencv2imread方法读取图像,并将输入的图像转换为灰度模式;灰度模式下图像的像素值亮度范围为0到255;将彩色图像转换为灰度图像即将RGB色彩值24位或3-D转换为灰度值8位或2-D。
所述步骤S2中运用了基础的阈值技术,使用的函数是cv.threshold,若像素值大于阈值,则为其分配一个值255代表白色,否则分配一个值0代表黑色。
所述步骤S2中第三参数maxVal表示当像素值大于或小于阈值时所赋的值;在opencv2提供多种类型阈值。
所述步骤S2中的轮廓是连接外缘所有相同颜色或密度节点的曲线,轮廓可以用来识别形状;轮廓对形状分析和物体检测识别非常有用;为提高准确性,确定轮廓之前先使用阈值进行边缘检测。
所述轮廓的确定使用到轮廓查找法,轮廓查找法可修改源图像,识别形状,轮廓查找法可从已识别边缘的中间绘制弧度值;轮廓查找法还可利用近似法提取图像轮廓的近似值;要确定符号的形状,需找到带有近似值的边界矩形,它会给出矩形左上角及长宽的值,之后,使用矩形长宽比分数,确认形状的弧度值,识别形状的轮廓,根据弧度的大小和形状的边角,识别出符号的形状;计算每个弧度和边角的度,得出准确的符号。
与现有技术相比,本发明的有益效果是:
本发明技术非常新颖,与传统的手写数学表达识别和自定义对象检测技术相比,本技术方便理解,复杂度底,容易实现;数学符号识别技术对给定数学表达式中符号的识别非常有效,本发明对单个符号、多个符号、含数字符号,含字母符号都进行了测试;且本方法也可识别较低像素值图像;与现有技术相比,本技术提供的方法简单需求较低,对用户友好,可有效提高效率,并给出更高的准确率,是一种更好的解决方案;且编程技术简单易懂,成本较低,无需训练和测试流程,流程的复杂性较低,内存及资源需求较小,各步骤流程容易识别,准确性更是达到了100%。
附图说明
图1为本发明的方法流程示意框图。
具体实施方式
下面将结合本发明实例中的附图,对本发明实例中的技术方案进行清楚、完整地描述。所描述的实例仅仅是本发明的一部分实例,而不是全部的实例。基于本发明中的实例,本领域其他人员在没有做出创造性改变前提下所获得的所有其他实例,都属于本发明保护的范围。
请参阅图1,本发明提供一种技术方案:一种基于轮廓技术的数学符号识别方法,包括如下步骤:
S1、提取图片,首先利用Tensorflow软件读取大量的图片,并且这些图片中会包含有大量的数学符号、包含字母符号及包含数字符号;
S2、调整图像尺寸、阈值、轮廓,使用opencv2bilateralFilter方法对图片进行处理,首先找出图像中符号的边缘;接下来的任务是确定形状、对象是否属于闭合型;然后使用轮廓技术确定图像中的形状或对象为加减乘除及平方根等数学符号;再将输入的图像转换为灰度模式,最后将灰度图像作为阈值函数的第一个输入参数;
S3、数值输入轮廓循环函数,计算近似值,源图像作为阈值函数的第一个输入参数,源图像即为灰度图像,像素值分类阈值作为阈值函数的第二个输入的参数,maxVal作为阈值函数的第三个输入的参数;
S4、近似值的计算,通过阀值函数内输入的各种参数,计算出阀值函数的近似值,并且将近似值与轮廓值进行比较,如果近似值等于轮廓值,符号被识别,给出准确率,并停止程序;如果近似值不等于轮廓值,则直接终止程序;
S5、循环计算,如果在计算的时候未能得到准确的近似值,则重复步骤S3的计算,直至得到准确的近似值,然后对近似值进行判断,得出结果,停止程序体的运行。
所述步骤S2中先使用opencv2bilateralFilter方法去除图片中的噪点,找出图像中符号的边缘,然后确定形状、对象是否属于闭合型,该处对图片进行除燥,将图片转化成清晰整洁,便于对图片中的对象进行检测是否是闭合型。
所述确定图片边缘是否属于闭合型需要形状的边缘上标记像素,根据链式码、相邻像素的概念,按照像素连接的方向移动;如果结束点与起始点重合,则可以推断形状为闭合型,如果结束点与起始点不重合,则可以推断形状为开合型,通过标记像素,实现对图片中对象的描述,并且通过链式码或相邻像素的概念,对图片中的对象进行推断是否是闭合型。
所述步骤S2中使用opencv2imread方法读取图像,并将输入的图像转换为灰度模式;灰度模式下图像的像素值亮度范围为0到255;将彩色图像转换为灰度图像即将RGB色彩值24位或3-D转换为灰度值8位或2-D,在对图像进行处理之前需要对图像进行灰度的转换,尤其是对与彩色图像的转换,方便对图片的灰度值进行提取。
所述步骤S2中运用了基础的阈值技术,使用的函数是cv.threshold,若像素值大于阈值,则为其分配一个值255代表白色,否则分配一个值0代表黑色,该处的使用函数是cv.threshold对像素值进行分配,进而将图片转化成灰度图像。
所述步骤S2中第三参数maxVal表示当像素值大于或小于阈值时所赋的值;在opencv2提供多种类型阈值,该处的阀值确定maxVal的值,然后通过函数进行计算近似值。
所述步骤S2中的轮廓是连接外缘所有相同颜色或密度节点的曲线,轮廓可以用来识别形状;轮廓对形状分析和物体检测识别非常有用;为提高准确性,确定轮廓之前先使用阈值进行边缘检测,所述轮廓的确定使用到轮廓查找法,轮廓查找法可修改源图像,识别形状,轮廓查找法可从已识别边缘的中间绘制弧度值;轮廓查找法还可利用近似法提取图像轮廓的近似值;要确定符号的形状,需找到带有近似值的边界矩形,它会给出矩形左上角及长宽的值,之后,使用矩形长宽比分数,确认形状的弧度值,识别形状的轮廓,根据弧度的大小和形状的边角,识别出符号的形状;计算每个弧度和边角的度,得出准确的符号,该处的通过轮廓来确定图片的轮廓值,并且将轮廓值与近似值进行比较,确定图片中对象的符号。
工作步骤:
第一步、提取图片,首先利用Tensorflow软件读取大量的图片,并且这些图片中会包含有大量的数学符号、包含字母符号及包含数字符号;
第二步、调整图像尺寸、阈值、轮廓,使用opencv2bilateralFilter方法对图片进行处理,首先使用opencv2bilateralFilter方法去除图片中的噪点,找出图像中符号的边缘;接下来的任务是确定形状、对象是否属于闭合型;然后使用轮廓技术计算矩形长宽比分数,确认形状的弧度值,识别形状的轮廓,根据弧度的大小和形状的边角,确定图像中的形状或对象为加减乘除及平方根等数学符号;再将输入的图像通过函数cv.threshold转换为灰度模式,最后将灰度图像作为阈值函数的第一个输入参数;
第三步、数值输入轮廓循环函数,计算近似值,源图像作为阈值函数的第一个输入参数,源图像即为灰度图像,像素值分类阈值作为阈值函数的第二个输入的参数,maxVal作为阈值函数的第三个输入的参数;
第四步、近似值的计算,通过阀值函数内输入的各种参数,计算出阀值函数的近似值,并且将近似值与轮廓值进行比较,如果近似值等于轮廓值,符号被识别,给出准确率,并停止程序;如果近似值不等于轮廓值,则直接终止程序;
第五步、循环计算,如果在计算的时候未能得到准确的近似值,则重复步骤S3的计算,直至得到准确的近似值,然后对近似值进行判断,得出结果,停止程序体的运行。
尽管已经显示和描述了本发明的实例,对于本领域的其他技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (1)

1.一种基于轮廓技术的数学符号识别方法,其特征在于:包括如下步骤:
S1、提取图片,首先利用Tensorflow软件读取大量的图片,并且这些图片中会包含有大量的数学符号、包含字母符号及包含数字符号;
S2、调整图像尺寸、阈值、轮廓,使用opencv2 bilateralFilter方法对图片进行处理,首先找出图像中符号的边缘;接下来的任务是确定形状、对象是否属于闭合型;然后使用轮廓技术确定图像中的形状或对象为加减乘除及平方根等数学符号;再将输入的图像转换为灰度模式,最后将灰度图像作为阈值函数的第一个输入参数;
S3、数值输入轮廓循环函数,计算近似值,源图像作为阈值函数的第一个输入参数,源图像即为灰度图像,像素值分类阈值作为阈值函数的第二个输入的参数,maxVal作为阈值函数的第三个输入的参数;
S4、近似值的计算,通过阀值函数内输入的各种参数,计算出阀值函数的近似值,并且将近似值与轮廓值进行比较,如果近似值等于轮廓值,符号被识别,给出准确率,并停止程序;如果近似值不等于轮廓值,则直接终止程序;
S5、循环计算,如果在计算的时候未能得到准确的近似值,则重复步骤S3的计算,直至得到准确的近似值,然后对近似值进行判断,得出结果,停止程序体的运行;
所述步骤S2中先使用opencv2 bilateralFilter方法去除图片中的噪点,找出图像中符号的边缘,然后确定形状、对象是否属于闭合型;
所述确定图片边缘是否属于闭合型需要形状的边缘上标记像素,根据链式码、相邻像素的概念,按照像素连接的方向移动;如果结束点与起始点重合,则可以推断形状为闭合型,如果结束点与起始点不重合,则可以推断形状为开合型;
所述步骤S2中使用opencv2 imread方法读取图像,并将输入的图像转换为灰度模式;灰度模式下图像的像素值亮度范围为0到255;将彩色图像转换为灰度图像即将RGB色彩值24位或3-D转换为灰度值8位或2-D;
所述步骤S2中运用了基础的阈值技术,使用的函数是cv.threshold,若像素值大于阈值,则为其分配一个值255代表白色,否则分配一个值0代表黑色;
所述步骤S2中第三参数maxVal表示当像素值大于或小于阈值时所赋的值;在opencv2提供多种类型阈值;
所述步骤S2中的轮廓是连接外缘所有相同颜色或密度节点的曲线,轮廓可以用来识别形状;轮廓对形状分析和物体检测识别非常有用;为提高准确性,确定轮廓之前先使用阈值进行边缘检测;
所述轮廓的确定使用到轮廓查找法,轮廓查找法可修改源图像,识别形状,轮廓查找法可从已识别边缘的中间绘制弧度值;轮廓查找法还可利用近似法提取图像轮廓的近似值;要确定符号的形状,需找到带有近似值的边界矩形,它会给出矩形左上角及长宽的值,之后,使用矩形长宽比分数,确认形状的弧度值,识别形状的轮廓,根据弧度的大小和形状的边角,识别出符号的形状;计算每个弧度和边角的度,得出准确的符号。
CN201911113457.2A 2019-11-14 2019-11-14 一种基于轮廓技术的数学符号识别方法 Active CN112801098B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911113457.2A CN112801098B (zh) 2019-11-14 2019-11-14 一种基于轮廓技术的数学符号识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911113457.2A CN112801098B (zh) 2019-11-14 2019-11-14 一种基于轮廓技术的数学符号识别方法

Publications (2)

Publication Number Publication Date
CN112801098A CN112801098A (zh) 2021-05-14
CN112801098B true CN112801098B (zh) 2023-01-10

Family

ID=75803764

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911113457.2A Active CN112801098B (zh) 2019-11-14 2019-11-14 一种基于轮廓技术的数学符号识别方法

Country Status (1)

Country Link
CN (1) CN112801098B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104616021A (zh) * 2014-12-24 2015-05-13 深圳市腾讯计算机系统有限公司 交通标志图像处理方法及装置
CN106203440A (zh) * 2016-06-28 2016-12-07 合肥酷睿网络科技有限公司 一种基于复杂网络的灰度图像识别方法
CN106815851A (zh) * 2017-01-24 2017-06-09 电子科技大学 一种基于视觉测量的栅格圆形油位计自动读数方法
CN107818323A (zh) * 2017-11-21 2018-03-20 北京百度网讯科技有限公司 用于处理图像的方法和装置
CN107945194A (zh) * 2017-10-31 2018-04-20 四川长虹电器股份有限公司 基于OpenCV技术的票据分割方法
CN108108735A (zh) * 2017-12-22 2018-06-01 大连运明自动化技术有限公司 一种汽车车牌号自动识别方法
CN109190473A (zh) * 2018-07-29 2019-01-11 国网上海市电力公司 一种“机器视觉理解”在电力远程监控中的应用
CN109325493A (zh) * 2018-08-23 2019-02-12 厦门理工学院 一种基于人形机器人的文字识别方法及人形机器人
CN109684971A (zh) * 2018-12-18 2019-04-26 北京理工大学珠海学院 解魔方机器人算法执行方法
CN109740603A (zh) * 2019-01-21 2019-05-10 闽江学院 基于cnn卷积神经网络下的车辆字符识别方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104616021A (zh) * 2014-12-24 2015-05-13 深圳市腾讯计算机系统有限公司 交通标志图像处理方法及装置
CN106203440A (zh) * 2016-06-28 2016-12-07 合肥酷睿网络科技有限公司 一种基于复杂网络的灰度图像识别方法
CN106815851A (zh) * 2017-01-24 2017-06-09 电子科技大学 一种基于视觉测量的栅格圆形油位计自动读数方法
CN107945194A (zh) * 2017-10-31 2018-04-20 四川长虹电器股份有限公司 基于OpenCV技术的票据分割方法
CN107818323A (zh) * 2017-11-21 2018-03-20 北京百度网讯科技有限公司 用于处理图像的方法和装置
CN108108735A (zh) * 2017-12-22 2018-06-01 大连运明自动化技术有限公司 一种汽车车牌号自动识别方法
CN109190473A (zh) * 2018-07-29 2019-01-11 国网上海市电力公司 一种“机器视觉理解”在电力远程监控中的应用
CN109325493A (zh) * 2018-08-23 2019-02-12 厦门理工学院 一种基于人形机器人的文字识别方法及人形机器人
CN109684971A (zh) * 2018-12-18 2019-04-26 北京理工大学珠海学院 解魔方机器人算法执行方法
CN109740603A (zh) * 2019-01-21 2019-05-10 闽江学院 基于cnn卷积神经网络下的车辆字符识别方法

Also Published As

Publication number Publication date
CN112801098A (zh) 2021-05-14

Similar Documents

Publication Publication Date Title
US10817741B2 (en) Word segmentation system, method and device
CN105046252B (zh) 一种人民币冠字码识别方法
CN101561866B (zh) 基于sift特征与灰度差值直方图特征的文字识别方法
CN111611643A (zh) 户型矢量化数据获得方法、装置、电子设备及存储介质
CN111539330B (zh) 一种基于双svm多分类器的变电站数显仪表识别方法
CN110309806B (zh) 一种基于视频图像处理的手势识别系统及其方法
CN106709524B (zh) 一种电气工程图中的元件符号检测与识别方法
CN110838126A (zh) 细胞图像分割方法、装置、计算机设备和存储介质
Reel et al. Image processing based heuristic analysis for enhanced currency recognition
CN109784342A (zh) 一种基于深度学习模型的ocr识别方法及终端
CN112818952B (zh) 煤岩分界线的识别方法、装置及电子设备
CN109344820A (zh) 基于计算机视觉和深度学习的数字式电表读数识别方法
CN107766854A (zh) 一种基于模板匹配实现快速页码识别的方法
CN111126383A (zh) 车牌检测方法、系统、装置及存储介质
CN113159045A (zh) 一种结合图像预处理与卷积神经网络的验证码识别方法
CN110795955A (zh) 一种快速识别多条码的系统及其方法
CN107330434A (zh) 一种基于phog特征的电路图中电气符号识别方法
CN105373798B (zh) 一种基于k近邻抠图和数学形态学的书法字提取方法
CN112801098B (zh) 一种基于轮廓技术的数学符号识别方法
CN110175257B (zh) 一种线稿图像匹配方法、电子设备、存储介质
Patil et al. Multi font and size optical character recognition using template matching
CN113643290B (zh) 一种基于图像处理的吸管计数方法、装置及存储介质
CN113743360A (zh) 智能化印章解析的方法和装置
Singh et al. BGR to HSV based Text Extraction from Manuscripts Using Slidebars
CN118587717B (zh) 一种图像字符分割方法、系统、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant