CN109101973B - 文字识别方法、电子设备、存储介质 - Google Patents
文字识别方法、电子设备、存储介质 Download PDFInfo
- Publication number
- CN109101973B CN109101973B CN201810884966.4A CN201810884966A CN109101973B CN 109101973 B CN109101973 B CN 109101973B CN 201810884966 A CN201810884966 A CN 201810884966A CN 109101973 B CN109101973 B CN 109101973B
- Authority
- CN
- China
- Prior art keywords
- character
- characters
- information
- segment data
- line segment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Character Discrimination (AREA)
Abstract
本发明公开了一种文字识别方法、电子设备、存储介质,其方法包括:获取包含第一文字的图片;提取图片中第一文字的笔画信息;根据笔画信息,获取第一文字的线段数据集;将第一文字的线段数据集与预设数据库中的多个文字的线段数据集进行比对,查找与第一文字的线段数据集的重合度大于预设阈值的预设数据库中的第二文字,作为第一文字的识别结果。提取第一文字的笔画信息,将图片文字拆分为具体的直线信息或曲线信息,得到第一文字具体的线段数据集,实现将文字转化为数据集。通过将第一文字的线段数据集与预设数据库中的线段数据集比对,计算数据集间的重合度,直观的根据数据信息,得到的第一文字的识别结果更加准确,提高文字识别率。
Description
技术领域
本发明涉及电子书领域,具体涉及一种文字识别方法、电子设备、存储介质。
背景技术
电子书与纸质书籍相比,更方便用户随时随地阅读,且可以减轻用户携带纸质书籍的重量。电子书可以通过扫描纸质书籍等方式进行制作,如扫描纸质书籍得到的图片,根据图片制作电子书。但直接根据图片制作电子书,不能对图片中的内容进行编辑、排版、校对等处理,得到的电子书质量较差,影响用户阅读体验效果。因此,在制作电子书时,还需要对图片中包含的文字等内容进行识别,以便更好的对其进行编辑、排版、校对等处理,方便制作得到的电子书显示效果更佳,更符合用户的阅读习惯。因此,需要一种对图片中包含的文字进行识别的方法,以便可以准确地识别出文字,进而对文字进行编辑、排版、校对等处理,制作出显示效果更佳的电子书。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的文字识别方法、电子设备、存储介质。
根据本发明的一个方面,提供了一种文字识别方法,其包括:
获取包含第一文字的图片;
提取图片中第一文字的笔画信息,笔画信息包含直线信息和/或曲线信息;
根据笔画信息,获取第一文字的线段数据集;
将第一文字的线段数据集与预设数据库中的多个文字的线段数据集进行比对,查找与第一文字的线段数据集的重合度大于预设阈值的预设数据库中的第二文字,作为第一文字的识别结果。
根据本发明的另一方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;
存储器用于存放至少一可执行指令,可执行指令使处理器执行以下操作:
获取包含第一文字的图片;
提取图片中第一文字的笔画信息,笔画信息包含直线信息和/或曲线信息;
根据笔画信息,获取第一文字的线段数据集;
将第一文字的线段数据集与预设数据库中的多个文字的线段数据集进行比对,查找与第一文字的线段数据集的重合度大于预设阈值的预设数据库中的第二文字,作为第一文字的识别结果。
根据本发明的又一方面,提供了一种计算机存储介质,存储介质中存储有至少一可执行指令,可执行指令使处理器执行以下操作:
获取包含第一文字的图片;
提取图片中第一文字的笔画信息,笔画信息包含直线信息和/或曲线信息;
根据笔画信息,获取第一文字的线段数据集;
将第一文字的线段数据集与预设数据库中的多个文字的线段数据集进行比对,查找与第一文字的线段数据集的重合度大于预设阈值的预设数据库中的第二文字,作为第一文字的识别结果。
根据本发明提供的文字识别方法、电子设备、存储介质,获取包含第一文字的图片;提取图片中第一文字的笔画信息,笔画信息包含直线信息和/或曲线信息;根据笔画信息,获取第一文字的线段数据集;将第一文字的线段数据集与预设数据库中的多个文字的线段数据集进行比对,查找与第一文字的线段数据集的重合度大于预设阈值的预设数据库中的第二文字,作为第一文字的识别结果。提取图片中第一文字的笔画信息,对其各笔画线段精准定位,将图片文字拆分为具体的直线信息或曲线信息,得到第一文字各笔画对应的具体的线段数据集,实现将文字转化为数据集。通过将第一文字的线段数据集与预设数据库中多个文字的线段数据集比对,计算数据集间的重合度,利用直观的数据信息,得到的第一文字的识别结果更加准确,提高文字识别率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明实施例一的文字识别方法的流程图;
图2示出了根据本发明实施例二的文字识别方法的流程图;
图3示出了根据本发明实施例四的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
实施例一
图1示出了根据本发明实施例一的文字识别方法的流程图,如图1所示,文字识别方法具体包括如下步骤:
步骤S101,获取包含第一文字的图片。
在本实施例中,为取得准确地识别效果,第一文字以印刷体文字为例进行说明,但第一文字可以不限定仅印刷体,规范字体也可适用于本实施例。
在获取图片时,为方便识别第一文字,可以限定获取的一张图片中对应的包含一个第一文字,减少识别时的其他干扰信息。若图片中包含除一个第一文字外的其他内容时,如非文字内容的标点、符号,多余的空白内容等,可以对图片进行切割处理,去除第一文字之外的其他内容,使其仅包含一个第一文字,方便进行识别。
步骤S102,提取图片中第一文字的笔画信息。
本实施例中对文字的识别基于第一文字的笔画信息。笔画信息包含直线信息和/或曲线信息,其是将第一文字具体的笔画进一步抽象为笔画信息,将图片中的第一文字具体化为准确的数据,以便识别时更准确。如第一文字“十”,其笔画包括横和竖,抽象为笔画信息包含两条直线信息,分别为从左到右的一条直线信息和从上到下的一条直线信息;第一文字“九”,其笔画包括横弯钩和撇,抽象为笔画信息包含直线信息和曲线信息,分别为从左到右的一条直线信息、从上到下的两条曲线信息。
在提取图片中的笔画信息时,需要提取出图片中各笔画对应的线条。线条包括独立线条、交叉线条等。对独立线条的提取,可以对图片中的线条进行细化处理,从图片中获取线条的轮廓,提取得到独立线条;对交叉线条的提取,可以根据图片中各线条轮廓,获取各线条轮廓的特征点,确定线条的拐点、走向等;再根据各线条交叉点对线条进行拆分、合并等处理,得到交叉线条等。根据提取的线条得到对应的笔画信息。以上均为举例说明,具体提取方式可根据实施情况设置,此处不作限定。
步骤S103,根据笔画信息,获取第一文字的线段数据集。
在提取得到笔画信息后,对具体的各个直线信息、曲线信息进一步细化,得到具体的线段数据。根据直线信息获取第一文字的第一线段数据子集,根据曲线信息进行拟合处理获取第一文字的第二线段数据子集,将第一线段数据集和/或第二线段数据集进行合并得到第一文字的线段数据集。
其中,在获取线段数据集时,需要对图片建立坐标系,如以图片左上角为坐标原点,横向向右建立x轴,纵向向下建立y轴,根据坐标系可以得到整个图片的所有坐标信息。
对于第一线段数据子集,其主要获取包含各个直线的端点位置信息(直线两个端点的坐标信息)和倾斜角度信息的第一线段数据子集。端点位置信息根据直线两端的点位置坐标信息,得到两个端点的坐标信息,如一条直线的端点位置信息为(5,3)和(4,10);倾斜角度信息即横向直线或直线延长线与x轴的夹角信息,或纵向直线或直线延长线与y轴的夹角信息;如倾斜角度信息为与x轴成-5度夹角。
对于第二线段数据子集,由于曲线信息存在拐点,不能仅根据端点位置信息确定,需要对曲线进行拟合处理,如将其按照曲线拐点或曲线弯曲度等数据进行分段处理,得到多个线段。多个线段优选为直线线段。对多个线段分别获取其各个线段的端点位置信息和倾斜角度信息,得到包含各个线段的端点位置信息和倾斜角度信息的第二线段数据子集。
步骤S104,将第一文字的线段数据集与预设数据库中的多个文字的线段数据集进行比对,查找与第一文字的线段数据集的重合度大于预设阈值的预设数据库中的第二文字,作为第一文字的识别结果。
预设数据库中预先存储多个文字,以及文字对应的线段数据集。其中,文字对应的线段数据集的获取方式与第一文字的线段数据集获取方式相同。
将第一文字的线段数据集与预设数据库中的多个文字的线段数据集进行比对,先查找到预设数据库中与第一文字的线段数据集中线段个数相同的线段数据集,再进一步从这些线段数据集中查找其中与第一文字的线段数据集中端点位置信息和/或倾斜角度信息的重合度大于预设阈值的线段数据集。如第一文字的线段数据集中线段个数为1,端点位置信息为(5,3)和(4,10),倾斜角度信息为与x轴成-5度夹角。先从预设数据库中查找线段个数为1的线段数据集。再将查找到的线段数据集中的端点位置信息、倾斜角度信息与第一文字的线段数据集中的端点位置信息、倾斜角度信息进行重合度比对。重合度比对可以根据各个线段的端点位置信息、倾斜角度信息计算其对应的线段的重合度,统计所有线段重合度,计算得到线段数据集的重合度。如查找到的某线段数据集的文字为“一”,线段数据集中的端点位置信息为(5,2)和(4,9),倾斜角度信息为与x轴成-5.2度夹角,其与第一文字的线段数据集重合度为95%,大于预设阈值(如90%),确定该线段数据集的文字“一”为第一文字的识别结果,即第一文字为“一”。
根据本发明提供的文字识别方法,获取包含第一文字的图片;提取图片中第一文字的笔画信息,笔画信息包含直线信息和/或曲线信息;根据笔画信息,获取第一文字的线段数据集;将第一文字的线段数据集与预设数据库中的多个文字的线段数据集进行比对,查找与第一文字的线段数据集的重合度大于预设阈值的预设数据库中的第二文字,作为第一文字的识别结果。提取图片中第一文字的笔画信息,对其各笔画线段精准定位,将图片文字拆分为具体的直线信息或曲线信息,得到第一文字各笔画对应的具体的线段数据集,实现将文字转化为数据集。通过将第一文字的线段数据集与预设数据库中多个文字的线段数据集比对,计算数据集间的重合度,利用直观的数据信息,得到的第一文字的识别结果更加准确,提高文字识别率。
实施例二
图2示出了根据本发明实施例二的文字识别方法的流程图,如图2所示,文字识别方法包括如下步骤:
步骤S201,获取包含第一文字的图片。
在获取一张图片,对图片中的第一文字进行识别时,按照图片中各个第一文字的轮廓,对图片进行分割处理,得到多个包含一个第一文字的图片。依次对一张包含一个第一文字的图片进行处理,识别其包含的第一文字。
步骤S202,对包含第一文字的图片进行图像处理。
为使识别更准确,对图片进一步进行图像处理。如灰度化处理,一般获取到的包含第一文字的图片通常为彩色图片,其会夹杂一些干扰信息,通过灰度化处理将原本由三维描述的像素点,映射为一维描述的像素点,从而可以滤除干扰信息,减少识别时收到的干扰。灰度化处理可以采用现有的转换方式和规则,此处不做展开处理。进一步,还可以对图片进行二值化处理,将第一文字与图片的背景进一步分离开,将图片中的灰度值(或者彩色值)图像信号转化成只有黑和白的二值图像信号,将第一文字的笔画更好地凸显。二值化处理可以采用局部阈值二值化或整体阈值二值化处理方式,此处不做限定。边缘细化处理是将图片中第一文字的各笔画线条等进一步细化,方便后续提取笔画信息,并可以准确的识别为线段数据集。
通过对图片的进一步图像处理,提高后续对第一文字的识别准确率。
步骤S203,提取图片中第一文字的笔画信息。
步骤S204,根据笔画信息,获取第一文字的线段数据集。
步骤S205,将第一文字的线段数据集与预设数据库中的多个文字的线段数据集进行比对,查找与第一文字的线段数据集的重合度大于预设阈值的预设数据库中的第二文字。
以上步骤参照实施例一中步骤S102-S104的描述,在此不再赘述。
当步骤S205查找到的第二文字为多个时,为确定准确的识别结果,还需要执行以下步骤S206或步骤S207(任选其一执行,或均执行,结合两个步骤的结果进行确定),或者将多个第二文字发送给人工审核,由人工确定对应的第二文字作为第一文字的识别结果。
步骤S206,对第一文字进行语义分析,结合第一文字的语义分析结果,确定对应的第二文字作为第一文字的识别结果。
查找到多个第二文字后,将该第一文字与其相邻的已识别的文字一起进行语义分析,如对第一文字和与其相邻的已识别的文字进行分词处理,结合上下文结构,得到第一文字的语义分析结果。根据语义分析结果,可以确定对应的第二文字,将其作为第一文字的识别结果。如根据第一文字的线段数据集,查找到的第二文字有“己”和“已”,将该第一文字和相邻的已识别的文字“经”一起进行语义分析,可以确定将第二文字“已”作为第一文字的识别结果,即第一文字识别为“已”。
步骤S207,将包含第一文字的图片分别与包含第二文字的多张图片进行比对,确定图片相似度最高的第二文字作为第一文字的识别结果。
查找到多个第二文字后,获取包含第二文字的多张图片(每张图片包含一个第二文字),将包含第一文字的图片分别与包含第二文字的多张图片进行比对,比对时主要对图片中第一文字与第二文字的笔画、线条等文字内容进行比对,忽略各图片背景等内容(可以参照步骤S202,对包含第二文字的多张图片进行图像处理),计算包含第一文字的图片与包含第二文字的多张图片的相似度,将图片相似度最高的第二文字作为第一文字的识别结果。如第二文字为“人”和“入”,将包含第一文字的图片和包含第二文字“人”的图片及包含第二文字“入”的图片比对,分别计算图片相似度,图片相似度最高的为第二文字“入”的图片,确定将第二文字“入”作为第一文字的识别结果,即第一文字识别为“入”。图片相似度算法可以采用现有的直方图距离计算方法、平均哈希算法等算法,此处不做限定。
步骤S208,根据第二文字的字体信息,确定第一文字的字体信息。
在确定了第二文字作为第一文字的识别结果后,还可以根据第二文字的字体信息,确定第一文字的字体信息,如预设数据库中存储的第二文字的字体信息为楷体,相应地可以确定第一文字的字体信息为楷体。
步骤S209,将识别得到的第一文字,以及第一文字的线段数据集和/或包含第一文字的图片保存在预设数据库中。
可选地,在识别第一文字后,还可以将识别得到的第一文字以及得到的第一文字的线段数据集、包含第一文字的图片等保存在预设数据库中,方便增加预设数据库的信息积累,提高后续利用预设数据库识别文字的速度、准确率等。进一步,还可以将第一文字的识别信息,如第一文字的字体信息等信息也保存在预设数据库中,方便之后再利用预设数据库时,可以更快更好的识别文字。
根据本发明提供的文字识别方法,为提高识别的准确度,可以对包含第一文字的图片进行图像处理,滤除图片中的干扰信息,将第一文字与图片背景进行分离,并细化第一文字的笔画线条,方便提取笔画信息。进一步,当第二文字为多个时,通过对第一文字进行语义分析、图片相似度对比等方式,识别正确的第二文字作为第一文字的识别结果。同时,根据第二文字的字体信息,可以确定第一文字的字体信息,做到对第一文字的全面识别。在识别第一文字后,将识别的第一文字以及得到的第一文字的线段数据集、包含第一文字的图片等保存在预设数据库中,增加预设数据库的积累,提高后续利用预设数据库识别文字的速度、准确率等。
实施例三
本申请实施例三提供了一种非易失性计算机存储介质,计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的文字识别方法。
可执行指令具体可以用于使得处理器执行以下操作:
获取包含第一文字的图片;提取图片中第一文字的笔画信息,笔画信息包含直线信息和/或曲线信息;根据笔画信息,获取第一文字的线段数据集;将第一文字的线段数据集与预设数据库中的多个文字的线段数据集进行比对,查找与第一文字的线段数据集的重合度大于预设阈值的预设数据库中的第二文字,作为第一文字的识别结果。
在一种可选的实施方式中,可执行指令进一步使处理器执行以下操作:根据直线信息获取第一文字的第一线段数据子集,和/或,根据曲线信息进行拟合处理获取第一文字的第二线段数据子集;将第一线段数据集和/或第二线段数据集进行合并得到第一文字的线段数据集。
在一种可选的实施方式中,可执行指令进一步使处理器执行以下操作:根据直线信息,获取包含直线的端点位置信息和倾斜角度信息的第一线段数据子集;和/或,根据曲线信息,将对应的曲线进行拟合处理,得到多个线段;根据多个线段获取包含各个线段的端点位置信息和倾斜角度信息的第二线段数据子集。
在一种可选的实施方式中,可执行指令进一步使处理器执行以下操作:查找预设数据库中与第一文字的线段数据集中线段个数相同,且根据端点位置信息和/或倾斜角度信息计算得到的重合度大于预设阈值的预设数据库中的第二文字,作为第一文字的识别结果。
在一种可选的实施方式中,可执行指令进一步使处理器执行以下操作:根据第二文字的字体信息,确定第一文字的字体信息。
在一种可选的实施方式中,第二文字为多个时,可执行指令进一步使处理器执行以下操作:对第一文字进行语义分析,结合第一文字的语义分析结果,确定对应的第二文字作为第一文字的识别结果。
在一种可选的实施方式中,第二文字为多个时,可执行指令进一步使处理器执行以下操作:将包含第一文字的图片分别与包含第二文字的多张图片进行比对,确定图片相似度最高的第二文字作为第一文字的识别结果。
在一种可选的实施方式中,可执行指令进一步使处理器执行以下操作:对包含第一文字的图片进行图像处理;其中,图像处理包括灰度化处理、二值化处理和/或边缘细化处理。
在一种可选的实施方式中,可执行指令进一步使处理器执行以下操作:将识别得到的第一文字,以及第一文字的线段数据集和/或包含第一文字的图片保存在预设数据库中。
实施例四
图3示出了根据本发明实施例四的一种电子设备的结构示意图,本发明具体实施例并不对电子设备的具体实现做限定。
如图3所示,该电子设备可以包括:处理器(processor)302、通信接口(Communications Interface)304、存储器(memory)306、以及通信总线308。
其中:
处理器302、通信接口304、以及存储器306通过通信总线308完成相互间的通信。
通信接口304,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器302,用于执行程序310,具体可以执行上述文字识别方法实施例中的相关步骤。
具体地,程序310可以包括程序代码,该程序代码包括计算机操作指令。
处理器302可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。服务器包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器306,用于存放程序310。存储器306可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序310具体可以用于使得处理器302执行以下操作:
在一种可选的实施方式中,程序310用于使得处理器302获取包含第一文字的图片;提取图片中第一文字的笔画信息,笔画信息包含直线信息和/或曲线信息;根据笔画信息,获取第一文字的线段数据集;将第一文字的线段数据集与预设数据库中的多个文字的线段数据集进行比对,查找与第一文字的线段数据集的重合度大于预设阈值的预设数据库中的第二文字,作为第一文字的识别结果。
在一种可选的实施方式中,程序310用于使得处理器302根据直线信息获取第一文字的第一线段数据子集,和/或,根据曲线信息进行拟合处理获取第一文字的第二线段数据子集;将第一线段数据集和/或第二线段数据集进行合并得到第一文字的线段数据集。
在一种可选的实施方式中,程序310用于使得处理器302根据直线信息,获取包含直线的端点位置信息和倾斜角度信息的第一线段数据子集;和/或,根据曲线信息,将对应的曲线进行拟合处理,得到多个线段;根据多个线段获取包含各个线段的端点位置信息和倾斜角度信息的第二线段数据子集。
在一种可选的实施方式中,程序310用于使得处理器302查找预设数据库中与第一文字的线段数据集中线段个数相同,且根据端点位置信息和/或倾斜角度信息计算得到的重合度大于预设阈值的预设数据库中的第二文字,作为第一文字的识别结果。
在一种可选的实施方式中,程序310用于使得处理器302根据第二文字的字体信息,确定第一文字的字体信息。
在一种可选的实施方式中,第二文字为多个时,程序310用于使得处理器302对第一文字进行语义分析,结合第一文字的语义分析结果,确定对应的第二文字作为第一文字的识别结果。
在一种可选的实施方式中,第二文字为多个时,程序310用于使得处理器302将包含第一文字的图片分别与包含第二文字的多张图片进行比对,确定图片相似度最高的第二文字作为第一文字的识别结果。
在一种可选的实施方式中,程序310用于使得处理器302对包含第一文字的图片进行图像处理;其中,图像处理包括灰度化处理、二值化处理和/或边缘细化处理。
在一种可选的实施方式中,程序310用于使得处理器302将识别得到的第一文字,以及第一文字的线段数据集和/或包含第一文字的图片保存在预设数据库中。
程序310中各步骤的具体实现可以参见上述文字识别实施例中的相应步骤中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
通过本实施例提供的方案,获取包含第一文字的图片;提取图片中第一文字的笔画信息,笔画信息包含直线信息和/或曲线信息;根据笔画信息,获取第一文字的线段数据集;将第一文字的线段数据集与预设数据库中的多个文字的线段数据集进行比对,查找与第一文字的线段数据集的重合度大于预设阈值的预设数据库中的第二文字,作为第一文字的识别结果。提取图片中第一文字的笔画信息,对其各笔画线段精准定位,将图片文字拆分为具体的直线信息或曲线信息,得到第一文字各笔画对应的具体的线段数据集,实现将文字转化为数据集。通过将第一文字的线段数据集与预设数据库中多个文字的线段数据集比对,计算数据集间的重合度,利用直观的数据信息,得到的第一文字的识别结果更加准确,提高文字识别率。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
Claims (18)
1.一种文字识别方法,其包括:
获取包含第一文字的图片;
提取所述图片中第一文字各笔画对应的线条,根据提取的线条得到对应的笔画信息,所述笔画信息包含直线信息和曲线信息;
根据所述直线信息,获取包含直线的端点位置信息和倾斜角度信息的第一线段数据子集;根据所述曲线信息,将对应的曲线进行拟合处理,得到多个线段,根据多个线段获取包含各个线段的端点位置信息和倾斜角度信息的第二线段数据子集;
将所述第一线段数据子集和所述第二线段数据子集进行合并得到所述第一文字的线段数据集;
查找预设数据库中与所述第一文字的线段数据集中线段个数相同,且根据端点位置信息和/或倾斜角度信息计算得到的重合度大于预设阈值的预设数据库中的第二文字,作为所述第一文字的识别结果。
2.根据权利要求1所述的方法,其中,所述方法还包括:
根据第二文字的字体信息,确定所述第一文字的字体信息。
3.根据权利要求1所述的方法,其中,所述第二文字为多个时,所述方法还包括:
对第一文字进行语义分析,结合第一文字的语义分析结果,确定对应的第二文字作为第一文字的识别结果。
4.根据权利要求1所述的方法,其中,所述第二文字为多个时,所述方法还包括:
将包含第一文字的图片分别与包含第二文字的多张图片进行比对,确定图片相似度最高的第二文字作为所述第一文字的识别结果。
5.根据权利要求1所述的方法,其中,在所述提取所述图片中第一文字各笔画对应的线条,根据提取的线条得到对应的笔画信息之前,所述方法还包括:
对包含第一文字的图片进行图像处理;其中,所述图像处理包括灰度化处理、二值化处理和/或边缘细化处理。
6.根据权利要求1所述的方法,其中,所述方法还包括:
将识别得到的第一文字,以及第一文字的线段数据集和/或包含第一文字的图片保存在预设数据库中。
7.一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行以下操作:
获取包含第一文字的图片;
提取所述图片中第一文字各笔画对应的线条,根据提取的线条得到对应的笔画信息,所述笔画信息包含直线信息和曲线信息;
根据所述直线信息,获取包含直线的端点位置信息和倾斜角度信息的第一线段数据子集;根据所述曲线信息,将对应的曲线进行拟合处理,得到多个线段,根据多个线段获取包含各个线段的端点位置信息和倾斜角度信息的第二线段数据子集;
将所述第一线段数据子集和所述第二线段数据子集进行合并得到所述第一文字的线段数据集;
查找预设数据库中与所述第一文字的线段数据集中线段个数相同,且根据端点位置信息和/或倾斜角度信息计算得到的重合度大于预设阈值的预设数据库中的第二文字,作为所述第一文字的识别结果。
8.根据权利要求7所述的电子设备,所述可执行指令进一步使所述处理器执行以下操作:
根据第二文字的字体信息,确定所述第一文字的字体信息。
9.根据权利要求7所述的电子设备,所述第二文字为多个时,所述可执行指令进一步使所述处理器执行以下操作:
对第一文字进行语义分析,结合第一文字的语义分析结果,确定对应的第二文字作为第一文字的识别结果。
10.根据权利要求7所述的电子设备,所述第二文字为多个时,所述可执行指令进一步使所述处理器执行以下操作:
将包含第一文字的图片分别与包含第二文字的多张图片进行比对,确定图片相似度最高的第二文字作为所述第一文字的识别结果。
11.根据权利要求7所述的电子设备,所述可执行指令进一步使所述处理器执行以下操作:
对包含第一文字的图片进行图像处理;其中,所述图像处理包括灰度化处理、二值化处理和/或边缘细化处理。
12.根据权利要求7所述的电子设备,所述可执行指令进一步使所述处理器执行以下操作:
将识别得到的第一文字,以及第一文字的线段数据集和/或包含第一文字的图片保存在预设数据库中。
13.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行以下操作:
获取包含第一文字的图片;
提取所述图片中第一文字各笔画对应的线条,根据提取的线条得到对应的笔画信息,所述笔画信息包含直线信息和曲线信息;
根据所述直线信息,获取包含直线的端点位置信息和倾斜角度信息的第一线段数据子集;根据所述曲线信息,将对应的曲线进行拟合处理,得到多个线段,根据多个线段获取包含各个线段的端点位置信息和倾斜角度信息的第二线段数据子集;
将所述第一线段数据子集和所述第二线段数据子集进行合并得到所述第一文字的线段数据集;
查找预设数据库中与所述第一文字的线段数据集中线段个数相同,且根据端点位置信息和/或倾斜角度信息计算得到的重合度大于预设阈值的预设数据库中的第二文字,作为所述第一文字的识别结果。
14.根据权利要求13所述的计算机存储介质,所述可执行指令进一步使所述处理器执行以下操作:
根据第二文字的字体信息,确定所述第一文字的字体信息。
15.根据权利要求13所述的计算机存储介质,所述第二文字为多个时,所述可执行指令进一步使所述处理器执行以下操作:
对第一文字进行语义分析,结合第一文字的语义分析结果,确定对应的第二文字作为第一文字的识别结果。
16.根据权利要求13所述的计算机存储介质,所述第二文字为多个时,所述可执行指令进一步使所述处理器执行以下操作:
将包含第一文字的图片分别与包含第二文字的多张图片进行比对,确定图片相似度最高的第二文字作为所述第一文字的识别结果。
17.根据权利要求13所述的计算机存储介质,所述可执行指令进一步使所述处理器执行以下操作:
对包含第一文字的图片进行图像处理;其中,所述图像处理包括灰度化处理、二值化处理和/或边缘细化处理。
18.根据权利要求13所述的计算机存储介质,所述可执行指令进一步使所述处理器执行以下操作:
将识别得到的第一文字,以及第一文字的线段数据集和/或包含第一文字的图片保存在预设数据库中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810884966.4A CN109101973B (zh) | 2018-08-06 | 2018-08-06 | 文字识别方法、电子设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810884966.4A CN109101973B (zh) | 2018-08-06 | 2018-08-06 | 文字识别方法、电子设备、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109101973A CN109101973A (zh) | 2018-12-28 |
CN109101973B true CN109101973B (zh) | 2019-12-10 |
Family
ID=64848840
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810884966.4A Active CN109101973B (zh) | 2018-08-06 | 2018-08-06 | 文字识别方法、电子设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109101973B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110909914A (zh) * | 2019-10-12 | 2020-03-24 | 中国平安财产保险股份有限公司 | 诉讼成功率预测方法、装置、计算机设备和存储介质 |
CN111931672A (zh) * | 2020-08-17 | 2020-11-13 | 珠海大横琴科技发展有限公司 | 字迹识别方法、装置、计算机设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1201207A (zh) * | 1997-03-04 | 1998-12-09 | 三菱电机株式会社 | 在线文字识别装置 |
CN101859382A (zh) * | 2010-06-03 | 2010-10-13 | 复旦大学 | 一种基于最大稳定极值区域的车牌检测与识别的方法 |
CN102591477A (zh) * | 2012-01-18 | 2012-07-18 | 邓晓波 | 一种短句录入的选字方法及装置 |
CN102982330A (zh) * | 2012-11-21 | 2013-03-20 | 新浪网技术(中国)有限公司 | 文字图像中字符识别方法和识别装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8290274B2 (en) * | 2005-02-15 | 2012-10-16 | Kite Image Technologies Inc. | Method for handwritten character recognition, system for handwritten character recognition, program for handwritten character recognition and storing medium |
CN100594469C (zh) * | 2007-05-11 | 2010-03-17 | 陈新伟 | 汉字笔码输入法 |
CN101763516B (zh) * | 2010-01-15 | 2012-02-29 | 南京航空航天大学 | 一种基于拟合函数的文字识别方法 |
CN102750556A (zh) * | 2012-06-01 | 2012-10-24 | 山东大学 | 一种脱机手写体汉字识别方法 |
US20140232667A1 (en) * | 2013-02-15 | 2014-08-21 | Kabushiki Kaisha Toshiba | Electronic device and method |
-
2018
- 2018-08-06 CN CN201810884966.4A patent/CN109101973B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1201207A (zh) * | 1997-03-04 | 1998-12-09 | 三菱电机株式会社 | 在线文字识别装置 |
CN101859382A (zh) * | 2010-06-03 | 2010-10-13 | 复旦大学 | 一种基于最大稳定极值区域的车牌检测与识别的方法 |
CN102591477A (zh) * | 2012-01-18 | 2012-07-18 | 邓晓波 | 一种短句录入的选字方法及装置 |
CN102982330A (zh) * | 2012-11-21 | 2013-03-20 | 新浪网技术(中国)有限公司 | 文字图像中字符识别方法和识别装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109101973A (zh) | 2018-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2014321165B2 (en) | Image searching method and apparatus | |
WO2017202232A1 (zh) | 名片内容识别方法、电子设备和存储介质 | |
US10643094B2 (en) | Method for line and word segmentation for handwritten text images | |
CN112016551B (zh) | 文本检测方法、装置、电子设备及计算机存储介质 | |
CN110503682B (zh) | 矩形控件识别方法、装置、终端及存储介质 | |
CN109389115B (zh) | 文本识别方法、装置、存储介质和计算机设备 | |
US20150131912A1 (en) | Systems and methods for offline character recognition | |
CN108154132A (zh) | 一种身份证文字提取方法、系统及设备和存储介质 | |
CN114463767A (zh) | 信用证识别方法、装置、计算机设备和存储介质 | |
CN114005126A (zh) | 表格重构方法、装置、计算机设备及可读存储介质 | |
CN109101973B (zh) | 文字识别方法、电子设备、存储介质 | |
CN114170423B (zh) | 一种图像文档版面识别方法、装置及其系统 | |
RU2597163C2 (ru) | Сравнение документов с использованием достоверного источника | |
CN114494751A (zh) | 证照信息识别方法、装置、设备及介质 | |
CN113887375A (zh) | 一种文本识别方法、装置、设备及存储介质 | |
CN113780116A (zh) | 发票分类方法、装置、计算机设备和存储介质 | |
CN108664945B (zh) | 图像文本及形音义特征识别方法和装置 | |
US9152876B1 (en) | Methods and systems for efficient handwritten character segmentation | |
CN112560849B (zh) | 基于神经网络算法的文理分割方法及系统 | |
CN115050025A (zh) | 基于公式识别的知识点抽取方法及装置 | |
CN115393865A (zh) | 文字检索方法、设备以及计算机可读存储介质 | |
CN112100978B (zh) | 基于电子书的排版处理方法、电子设备及存储介质 | |
Höhn | Detecting arbitrarily oriented text labels in early maps | |
CN114387600A (zh) | 文本特征识别方法、装置、计算机设备和存储介质 | |
CN113077410A (zh) | 图像检测方法、装置方法、芯片及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |