CN109784330A - 招牌内容识别方法、装置及设备 - Google Patents

招牌内容识别方法、装置及设备 Download PDF

Info

Publication number
CN109784330A
CN109784330A CN201910003495.6A CN201910003495A CN109784330A CN 109784330 A CN109784330 A CN 109784330A CN 201910003495 A CN201910003495 A CN 201910003495A CN 109784330 A CN109784330 A CN 109784330A
Authority
CN
China
Prior art keywords
image data
signboard
type
text image
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910003495.6A
Other languages
English (en)
Other versions
CN109784330B (zh
Inventor
刘慧�
吴云鹏
王洪志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910003495.6A priority Critical patent/CN109784330B/zh
Publication of CN109784330A publication Critical patent/CN109784330A/zh
Application granted granted Critical
Publication of CN109784330B publication Critical patent/CN109784330B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

本发明提出了一种招牌内容识别方法、装置及设备,其中,方法包括:获取招牌内容,并根据招牌内容提取文字图像数据;将文字图像数据输入到分类模型中进行处理,获取文字图像数据的字体类型;当文字图像数据的字体类型为第一类型时,将文字图像数据输入到转换模型中进行处理,获取第二类型的文字图像数据;对第二类型的文字图像数据进行光学字符识别,生成识别结果。由此,解决了相关技术中OCR识别对于招牌文字中的象形字、艺术字等字体识别准确率较低的问题,降低了招牌文字识别难度,提高了招牌文字识别准确率。

Description

招牌内容识别方法、装置及设备
技术领域
本发明涉及文字识别技术领域,尤其涉及一种招牌内容识别方法、装置及设备。
背景技术
目前,商家设计的招牌内容多种多样,例如,考虑到大众审美与辨识度,商家通常会在招牌内容中加入艺术字等,以吸引用户。招牌内容识别是数据自动化生成中必不可少的环节。
相关技术中,通常通过OCR(Optical Character Recognition,光学字符识别)识别招牌内容,而针对招牌中的部分象形字或艺术字,OCR识别准确率低。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种招牌内容识别方法,解决了相关技术中OCR识别对于招牌文字中的象形字、艺术字等字体识别准确率较低的问题,降低了招牌文字识别难度,提高了招牌文字识别准确率。
本发明的第二个目的在于提出一种招牌内容识别装置。
本发明的第三个目的在于提出一种计算机设备。
本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
本发明第一方面实施例提出了一种招牌内容识别方法,包括:
获取招牌内容,并根据所述招牌内容提取文字图像数据;
将所述文字图像数据输入到分类模型中进行处理,获取所述文字图像数据的字体类型;
当所述文字图像数据的字体类型为第一类型时,将所述文字图像数据输入到转换模型中进行处理,获取第二类型的文字图像数据;
对所述第二类型的文字图像数据进行光学字符识别,生成识别结果。
本发明实施例的招牌内容识别方法,通过获取招牌内容,并根据招牌内容提取文字图像数据。进而将文字图像数据输入到分类模型中进行处理,获取文字图像数据的字体类型,当文字图像数据的字体类型为第一类型时,将文字图像数据输入到转换模型中进行处理,获取第二类型的文字图像数据。进一步对第二类型的文字图像数据进行光学字符识别,生成识别结果,由此,通过分类模型对文字图像数据进行分类,并将第一类型的文字图像数据输入到转换模型中,以生成OCR识别准确率较高的第二类型的文字图像数据,实现了字体类型的转换,解决了相关技术中OCR识别对于招牌文字中的象形字、艺术字等字体识别准确率较低的问题,降低了招牌文字识别难度,提高了招牌文字识别准确率。
另外,根据本发明上述实施例的招牌内容识别方法还可以具有如下附加技术特征:
可选地,所述第一类型包括象形字类型和/或艺术体类型,所述第二类型包括印刷体类型。
可选地,在将所述文字图像数据输入到分类模型中进行处理之前,还包括:获取文字图像训练数据与对应的字体类型的训练集;根据所述训练集训练预设模型的参数,生成所述分类模型。
可选地,在将第一类型的文字图像数据输入到转换模型中进行处理之前,还包括:获取所述第一类型的文字图像训练数据与对应的所述第二类型的文字图像训练数据的训练集;根据所述训练集训练预设模型的参数,生成所述转换模型。
可选地,在获取所述文字图像数据的字体类型之后,还包括:当所述文字图像数据的字体类型为所述第二类型时,对所述文字图像数据进行光学字符识别,生成识别结果。
可选地,所述根据所述招牌内容提取文字图像数据,包括:基于视觉算法对所述招牌内容进行分割,生成多个所述文字图像数据;在生成识别结果之后,还包括:对多个所述识别结果进行合并。
本发明第二方面实施例提出了一种招牌内容识别装置,包括:
获取模块,用于获取招牌内容,并根据所述招牌内容提取文字图像数据;
分类模块,用于将所述文字图像数据输入到分类模型中进行处理,获取所述文字图像数据的字体类型;
转换模块,用于当所述文字图像数据的字体类型为第一类型时,将所述文字图像数据输入到转换模型中进行处理,获取第二类型的文字图像数据;
识别模块,用于对所述第二类型的文字图像数据进行光学字符识别,生成识别结果。
本发明实施例的招牌内容识别装置,通过获取招牌内容,并根据招牌内容提取文字图像数据。进而将文字图像数据输入到分类模型中进行处理,获取文字图像数据的字体类型,当文字图像数据的字体类型为第一类型时,将文字图像数据输入到转换模型中进行处理,获取第二类型的文字图像数据。进一步对第二类型的文字图像数据进行光学字符识别,生成识别结果,由此,解决了相关技术中OCR识别对于招牌文字中的象形字、艺术字等字体识别准确率较低的问题,降低了招牌文字识别难度,提高了招牌文字识别准确率。
另外,根据本发明上述实施例的招牌内容识别装置还可以具有如下附加技术特征:
可选地,所述的装置,还包括:第一训练模块,用于获取文字图像训练数据与对应的字体类型的训练集;根据所述训练集训练预设模型的参数,生成所述分类模型。
可选地,所述的装置,还包括:第二训练模块,用于获取所述第一类型的文字图像训练数据与对应的所述第二类型的文字图像训练数据的训练集;根据所述训练集训练预设模型的参数,生成所述转换模型。
可选地,所述识别模块还用于:当所述文字图像数据的字体类型为所述第二类型时,对所述文字图像数据进行光学字符识别,生成识别结果。
可选地,所述获取模块具体用于:基于视觉算法对所述招牌内容进行分割,生成多个所述文字图像数据;所述识别模块还用于对多个所述识别结果进行合并。
本发明第三方面实施例提出了一种计算机设备,包括处理器和存储器;其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如第一方面实施例所述的招牌内容识别方法。
本发明第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如第一方面实施例所述的招牌内容识别方法。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
图1为本发明实施例所提供的一种招牌内容识别方法的流程示意图;
图2为本发明实施例所提供的一种训练分类模型的流程示意图;
图3为本发明实施例所提供的一种训练转换模型的流程示意图;
图4为本发明实施例所提供的另一种招牌内容识别方法的流程示意图;
图5为本发明实施例所提供的一种应用场景流程示意图;
图6为本发明实施例所提供的一种招牌内容识别装置的结构示意图;
图7为本发明实施例所提供的另一种招牌内容识别装置的结构示意图;
图8示出了适于用来实现本发明实施例的示例性计算机设备的框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的招牌内容识别方法、装置及设备。
图1为本发明实施例所提供的一种招牌内容识别方法的流程示意图,如图1所示,该方法包括:
步骤101,获取招牌内容,并根据招牌内容提取文字图像数据。
本实施例中,在进行招牌内容识别时,可以先获取招牌内容。例如,可以通过拍照设备拍摄招牌的图像。再例如,可以通过互联网下载招牌的图像。进而,可以根据招牌内容提取文字图像数据。
作为一种示例,招牌内容为“XX牛肉面”,可以基于视觉算法对招牌图像进行分割,生成分别包括“X”“X”“牛”“肉”“面”的图像。
需要说明的是,上述根据招牌内容提取文字图像数据的实现方式仅是一种示例,此处不作具体限制。
步骤102,将文字图像数据输入到分类模型中进行处理,获取文字图像数据的字体类型。
在本发明的一个实施例中,可以预先获取文字图像训练数据与对应的字体类型的训练集,根据训练集训练预设模型的参数,生成分类模型。进而,将文字图像数据输入到分类模型中进行处理,从而获取该文字图像数据对应的字体类型。
其中,字体类型包括但不限于象形字类型、艺术体类型、印刷体类型等,文字图像训练数据可以为预先收集的招牌中文字的图像。
作为一种示例,将象形字“牛”的图像数据输入到分类模型中,获取对应的字体类型为象形字类型,将印刷体文字“肉”“面”的图像数据输入到分类模型中,获取对应的字体类型为印刷体类型。
步骤103,当文字图像数据的字体类型为第一类型时,将文字图像数据输入到转换模型中进行处理,获取第二类型的文字图像数据。
在本发明的一个实施例中,可以预先获取第一类型的文字图像训练数据与对应的第二类型的文字图像训练数据的训练集,根据训练集训练预设模型的参数,生成转换模型。进而,将第一类型的文字图像数据输入到转换模型中进行处理,从而获取对应的第二类型的文字图像数据。
作为一种可能的实现方式,第一类型可以包括象形字类型、艺术体类型,第二类型可以包括印刷体类型。
作为一种示例,将象形字“牛”的图像数据输入到转换模型中,生成印刷体文字“牛”的图像数据。
步骤104,对第二类型的文字图像数据进行光学字符识别,生成识别结果。
在本发明的一个实施例中,可以通过OCR(Optical Character Recognition,光学字符识别)识别算法对第二类型的文字图像数据进行识别,生成文字识别结果。例如,对印刷体文字“牛”的图像数据进行OCR识别,获取文字识别结果为“牛”。
可以理解,相关技术中OCR识别对于象形字、艺术字等字体类型的文字的图像识别准确率较低。本实施例中,通过分类模型对文字图像数据进行分类,并将第一类型的文字图像数据输入到转换模型中,以生成OCR识别准确率较高的第二类型的文字图像数据,实现了字体类型的转换,降低了招牌文字识别难度,提高了招牌文字识别准确率。
本发明实施例的招牌内容识别方法,通过获取招牌内容,并根据招牌内容提取文字图像数据。进而将文字图像数据输入到分类模型中进行处理,获取文字图像数据的字体类型,当文字图像数据的字体类型为第一类型时,将文字图像数据输入到转换模型中进行处理,获取第二类型的文字图像数据。进一步对第二类型的文字图像数据进行光学字符识别,生成识别结果,由此,解决了相关技术中OCR识别对于招牌文字中的象形字、艺术字等字体识别准确率较低的问题,降低了招牌文字识别难度,提高了招牌文字识别准确率。
基于上述实施例,进一步地,本发明实施例的招牌内容识别方法,还可以获取训练集对预设模型进行训练。
图2为本发明实施例所提供的一种训练分类模型的流程示意图,如图2所示,包括:
步骤201,获取文字图像训练数据与对应的字体类型的训练集。
在本发明的一个实施例中,可以预先收集招牌中文字的图像,并标注相应的字体类型,其中,字体类型包括但不限于象形字类型、艺术体类型、印刷体类型等。进而,根据包括该文字的图像数据与相应的字体类型生成训练集。例如,可以将包括印刷体文字“超市”的图像数据与对应的印刷体类型作为训练数据,由多组训练数据生成训练集。
步骤202,根据训练集训练预设模型的参数,生成分类模型。
本实施例中,可以通过训练集训练预设模型的参数,生成分类模型,以使分类模型输入为文字图像数据,输出为对应的字体类型。
作为一种可能的实现方式,可以基于ResNet基础网络,并将该网络最后一层改为2类,作为预设模型。
在本发明的一个实施例中,还可以收集招牌中文字的图像,并标注相应的字体类型,以生成验证集和测试集。进而,根据验证集与测试集测试分类模型的准确率,当准确率大于预设阈值时,判断分类模型满足要求;当准确率小于等于预设阈值时,继续训练分类模型。其中,预设阈值可以根据大量实验数据确定,也可以根据实际需要自行设置,此处不作限制。
图3为本发明实施例所提供的一种训练转换模型的流程示意图,如图3所示,包括:
步骤301,获取第一类型的文字图像训练数据与对应的第二类型的文字图像训练数据的训练集。
在本发明的一个实施例中,可以预先获取第一类型的文字图像训练数据与对应的第二类型的文字图像训练数据的训练集,根据训练集训练预设模型的参数,生成转换模型。其中,第一类型可以包括象形字类型、艺术体类型,第二类型可以包括印刷体类型。
作为一种示例,可以将艺术体文字“超市”的图像数据与印刷体文字“超市”的图像数据作为训练数据,由多组训练数据生成训练集。
其中,获取第一类型的文字图像训练数据与对应的第二类型的文字图像训练数据的实现方式有多种。
作为一种可能的实现方式,可以预先收集招牌文字是艺术体和/或象形字类型的招牌文字图像。进而通过相关算法将招牌中艺术体和/或象形字替换成对应的印刷体文字,并通过贴图生成新的图像,从而生成与预先收集的招牌文字图像对应的印刷体文字图像。
步骤302,根据训练集训练预设模型的参数,生成转换模型。
本实施例中,可以通过训练集训练预设模型的参数,生成转换模型,以使转换模型输入为第一类型的文字图像数据,输出为对应的第二类型的文字图像数据。
作为一种可能的实现方式,可以基于生成式网络结构训练转换模型。
在本发明的一个实施例中,还可以收集招牌文字是艺术体和/或象形字类型的招牌文字图像,并获取对应的印刷体文字图像,以生成验证集和测试集。进而,根据验证集与测试集测试转换模型的效果,例如测试转换后图像的清晰度、准确率等,当清晰度、准确率满足要求时,停止训练转换模型。
本发明实施例的招牌内容识别方法,通过训练分类模型和转换模型,实现了获取招牌文字图像数据的字体类型以及字体转换,以便于通过OCR识别准确率较高的字体类型对应的文字图像,降低了招牌文字识别难度,提高了招牌文字识别准确率。
基于上述实施例,图4为本发明实施例所提供的另一种招牌内容识别方法的流程示意图,如图4所示,该方法包括:
步骤401,获取招牌内容,基于视觉算法对招牌内容进行分割,生成多个文字图像数据。
作为一种可能的实现方式,可以基于视觉算法对招牌内容进行分割,生成招牌内容中每个文字的图像。其中,视觉算法包括但不限于基于边缘的分割方法、基于区域的分割方法等。
步骤402,将文字图像数据输入到分类模型中进行处理,获取文字图像数据的字体类型。
前述实施例对步骤102的解释说明同样适用于本实施例中的步骤402,此处不再赘述。
步骤403,当文字图像数据的字体类型为第二类型时,对文字图像数据进行光学字符识别,生成识别结果。
本实施例中,第二类型包括印刷体类型。
在本发明的一个实施例中,当文字图像数据的字体类型为第二类型时,可以通过OCR识别算法对该文字图像数据进行识别,生成文字识别结果。例如,对印刷体文字“店”的图像数据进行OCR识别,获取文字识别结果为“店”。
可以理解,当确定文字图像的字体类型为OCR识别准确率较高的字体类型时,可以直接通过OCR识别算法对该文字图像数据进行识别,生成文字识别结果。
在本发明的一些实施例中,在基于视觉算法对招牌内容进行分割生成多个文字图像数据时,还可以记录多个文字图像数据的位置。进而,在生成识别结果之后,还可以根据预先记录的位置对多个识别结果进行合并,以生成招牌内容。作为一种示例,招牌内容为“A超市”,分割生成“A”“超”“市”图像,并记录对应的位置。进而,在生成对应的文字识别结果后,根据记录的位置合并为文字识别结果“A超市”。
本发明实施例的招牌内容识别方法,当文字图像数据的字体类型为第二类型时,对文字图像数据进行光学字符识别,生成识别结果。并且,还可以对多个识别结果进行合并,以生成完整的招牌内容。
图5为本发明实施例所提供的一种应用场景流程示意图。
参照图5,首先获取招牌图像,并通过视觉算法检测分割出所有招牌文字图像。进而,通过预先训练的分类模型获取招牌文字图像的字体类型,将招牌文字图像分类成印刷体文字、非印刷体文字两类。进一步,针对印刷体文字直接进行OCR识别,生成识别结果;针对非印刷体文字,先通过转换模型将招牌文字图像转换成印刷体文字图像,再进行OCR识别生成识别结果。最后将识别结果合并,得到招牌内容识别结果。由此,降低了招牌文字识别难度,提高了招牌文字识别准确率。
为了实现上述实施例,本发明还提出一种招牌内容识别装置。
图6为本发明实施例所提供的一种招牌内容识别装置的结构示意图,如图6所示,该装置包括:获取模块100,分类模块200,转换模块300,识别模块400。
其中,获取模块100,用于获取招牌内容,并根据招牌内容提取文字图像数据。
分类模块200,用于将文字图像数据输入到分类模型中进行处理,获取文字图像数据的字体类型。
转换模块300,用于当文字图像数据的字体类型为第一类型时,将文字图像数据输入到转换模型中进行处理,获取第二类型的文字图像数据。
识别模块400,用于对第二类型的文字图像数据进行光学字符识别,生成识别结果。
在图6的基础上,图7所示的招牌内容识别装置还包括:第一训练模块500,第二训练模块600。
其中,第一训练模块500,用于获取文字图像训练数据与对应的字体类型的训练集;根据训练集训练预设模型的参数,生成分类模型。
第二训练模块600,用于获取第一类型的文字图像训练数据与对应的第二类型的文字图像训练数据的训练集;根据训练集训练预设模型的参数,生成转换模型。
进一步地,识别模块400还用于:当文字图像数据的字体类型为第二类型时,对文字图像数据进行光学字符识别,生成识别结果。
获取模块100具体用于:基于视觉算法对招牌内容进行分割,生成多个文字图像数据;识别模块400还用于对多个识别结果进行合并。
需要说明的是,前述实施例对招牌内容识别方法的解释说明同样适用于本实施例的招牌内容识别装置,此处不再赘述。
本发明实施例的招牌内容识别装置,通过获取招牌内容,并根据招牌内容提取文字图像数据。进而将文字图像数据输入到分类模型中进行处理,获取文字图像数据的字体类型,当文字图像数据的字体类型为第一类型时,将文字图像数据输入到转换模型中进行处理,获取第二类型的文字图像数据。进一步对第二类型的文字图像数据进行光学字符识别,生成识别结果,由此,解决了相关技术中OCR识别对于招牌文字中的象形字、艺术字等字体识别准确率较低的问题,降低了招牌文字识别难度,提高了招牌文字识别准确率。
为了实现上述实施例,本发明还提出一种计算机设备,包括处理器和存储器;其中,处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于实现如前述任一实施例所述的招牌内容识别方法。
为了实现上述实施例,本发明还提出一种计算机程序产品,当计算机程序产品中的指令被处理器执行时实现如前述任一实施例所述的招牌内容识别方法。
为了实现上述实施例,本发明还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如前述任一实施例所述的招牌内容识别方法。
图8示出了适于用来实现本发明实施例的示例性计算机设备的框图。图8显示的计算机设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图8未显示,通常称为“硬盘驱动器”)。尽管图8中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc ReadOnlyMemory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc ReadOnlyMemory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本申请所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信,和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LocalAreaNetwork;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现前述实施例中提及的方法。
在本发明的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (13)

1.一种招牌内容识别方法,其特征在于,包括:
获取招牌内容,并根据所述招牌内容提取文字图像数据;
将所述文字图像数据输入到分类模型中进行处理,获取所述文字图像数据的字体类型;
当所述文字图像数据的字体类型为第一类型时,将所述文字图像数据输入到转换模型中进行处理,获取第二类型的文字图像数据;
对所述第二类型的文字图像数据进行光学字符识别,生成识别结果。
2.如权利要求1所述的招牌内容识别方法,其特征在于,所述第一类型包括象形字类型和/或艺术体类型,所述第二类型包括印刷体类型。
3.如权利要求1所述的招牌内容识别方法,其特征在于,在将所述文字图像数据输入到分类模型中进行处理之前,还包括:
获取文字图像训练数据与对应的字体类型的训练集;
根据所述训练集训练预设模型的参数,生成所述分类模型。
4.如权利要求1所述的招牌内容识别方法,其特征在于,在将第一类型的文字图像数据输入到转换模型中进行处理之前,还包括:
获取所述第一类型的文字图像训练数据与对应的所述第二类型的文字图像训练数据的训练集;
根据所述训练集训练预设模型的参数,生成所述转换模型。
5.如权利要求1所述的招牌内容识别方法,其特征在于,在获取所述文字图像数据的字体类型之后,还包括:
当所述文字图像数据的字体类型为所述第二类型时,对所述文字图像数据进行光学字符识别,生成识别结果。
6.如权利要求1所述的招牌内容识别方法,其特征在于,所述根据所述招牌内容提取文字图像数据,包括:
基于视觉算法对所述招牌内容进行分割,生成多个所述文字图像数据;
在生成识别结果之后,还包括:
对多个所述识别结果进行合并。
7.一种招牌内容识别装置,其特征在于,包括:
获取模块,用于获取招牌内容,并根据所述招牌内容提取文字图像数据;
分类模块,用于将所述文字图像数据输入到分类模型中进行处理,获取所述文字图像数据的字体类型;
转换模块,用于当所述文字图像数据的字体类型为第一类型时,将所述文字图像数据输入到转换模型中进行处理,获取第二类型的文字图像数据;
识别模块,用于对所述第二类型的文字图像数据进行光学字符识别,生成识别结果。
8.如权利要求7所述的招牌内容识别装置,其特征在于,还包括:
第一训练模块,用于获取文字图像训练数据与对应的字体类型的训练集;
根据所述训练集训练预设模型的参数,生成所述分类模型。
9.如权利要求7所述的招牌内容识别装置,其特征在于,还包括:
第二训练模块,用于获取所述第一类型的文字图像训练数据与对应的所述第二类型的文字图像训练数据的训练集;
根据所述训练集训练预设模型的参数,生成所述转换模型。
10.如权利要求7所述的招牌内容识别装置,其特征在于,所述识别模块还用于:
当所述文字图像数据的字体类型为所述第二类型时,对所述文字图像数据进行光学字符识别,生成识别结果。
11.如权利要求7所述的招牌内容识别装置,其特征在于,所述获取模块具体用于:
基于视觉算法对所述招牌内容进行分割,生成多个所述文字图像数据;
所述识别模块还用于对多个所述识别结果进行合并。
12.一种计算机设备,其特征在于,包括处理器和存储器;
其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如权利要求1-6中任一项所述的招牌内容识别方法。
13.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一项所述的招牌内容识别方法。
CN201910003495.6A 2019-01-03 2019-01-03 招牌内容识别方法、装置及设备 Active CN109784330B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910003495.6A CN109784330B (zh) 2019-01-03 2019-01-03 招牌内容识别方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910003495.6A CN109784330B (zh) 2019-01-03 2019-01-03 招牌内容识别方法、装置及设备

Publications (2)

Publication Number Publication Date
CN109784330A true CN109784330A (zh) 2019-05-21
CN109784330B CN109784330B (zh) 2021-03-23

Family

ID=66499887

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910003495.6A Active CN109784330B (zh) 2019-01-03 2019-01-03 招牌内容识别方法、装置及设备

Country Status (1)

Country Link
CN (1) CN109784330B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110889414A (zh) * 2019-11-27 2020-03-17 中国银行股份有限公司 光学字符识别方法及装置
CN111325207A (zh) * 2020-03-05 2020-06-23 中国银行股份有限公司 基于预处理的票据识别方法及装置
CN111860516A (zh) * 2020-06-23 2020-10-30 北京三快在线科技有限公司 商家名称确定方法、装置、服务器及存储介质
CN115035360A (zh) * 2021-11-22 2022-09-09 荣耀终端有限公司 图像的文字识别方法、电子设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101331476A (zh) * 2005-12-19 2008-12-24 微软公司 用于手写字符识别的基于书写变体的书写者自适应
WO2010087886A1 (en) * 2009-01-27 2010-08-05 Gannon Technologies Group Llc Systems and methods for graph-based pattern recognition technology applied to the automated identification of fingerprints
US8452108B2 (en) * 2008-06-25 2013-05-28 Gannon Technologies Group Llc Systems and methods for image recognition using graph-based pattern matching
US20150371399A1 (en) * 2014-06-19 2015-12-24 Kabushiki Kaisha Toshiba Character Detection Apparatus and Method
CN106156794A (zh) * 2016-07-01 2016-11-23 北京旷视科技有限公司 基于文字风格识别的文字识别方法及装置
CN108804397A (zh) * 2018-06-12 2018-11-13 华南理工大学 一种基于少量目标字体的汉字字体转换生成的方法
CN109117478A (zh) * 2018-07-27 2019-01-01 北京城市网邻信息技术有限公司 联系方式的识别方法、装置、设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101331476A (zh) * 2005-12-19 2008-12-24 微软公司 用于手写字符识别的基于书写变体的书写者自适应
US8452108B2 (en) * 2008-06-25 2013-05-28 Gannon Technologies Group Llc Systems and methods for image recognition using graph-based pattern matching
WO2010087886A1 (en) * 2009-01-27 2010-08-05 Gannon Technologies Group Llc Systems and methods for graph-based pattern recognition technology applied to the automated identification of fingerprints
US20150371399A1 (en) * 2014-06-19 2015-12-24 Kabushiki Kaisha Toshiba Character Detection Apparatus and Method
CN106156794A (zh) * 2016-07-01 2016-11-23 北京旷视科技有限公司 基于文字风格识别的文字识别方法及装置
CN108804397A (zh) * 2018-06-12 2018-11-13 华南理工大学 一种基于少量目标字体的汉字字体转换生成的方法
CN109117478A (zh) * 2018-07-27 2019-01-01 北京城市网邻信息技术有限公司 联系方式的识别方法、装置、设备及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110889414A (zh) * 2019-11-27 2020-03-17 中国银行股份有限公司 光学字符识别方法及装置
CN111325207A (zh) * 2020-03-05 2020-06-23 中国银行股份有限公司 基于预处理的票据识别方法及装置
CN111860516A (zh) * 2020-06-23 2020-10-30 北京三快在线科技有限公司 商家名称确定方法、装置、服务器及存储介质
CN115035360A (zh) * 2021-11-22 2022-09-09 荣耀终端有限公司 图像的文字识别方法、电子设备及存储介质
CN115035360B (zh) * 2021-11-22 2023-04-07 荣耀终端有限公司 图像的文字识别方法、电子设备及存储介质

Also Published As

Publication number Publication date
CN109784330B (zh) 2021-03-23

Similar Documents

Publication Publication Date Title
CN109784330A (zh) 招牌内容识别方法、装置及设备
CN108829894B (zh) 口语词识别和语义识别方法及其装置
CN108009293A (zh) 视频标签生成方法、装置、计算机设备和存储介质
Rossetto et al. Deep learning-based concept detection in vitrivr
CN109948542A (zh) 手势识别方法、装置、电子设备和存储介质
Joshi et al. Comparing random forest approaches to segmenting and classifying gestures
CN108537867A (zh) 根据用户肢体运动的视频渲染方法和装置
CN109348275A (zh) 视频处理方法和装置
CN110287854A (zh) 表格的提取方法、装置、计算机设备和存储介质
CN109472234B (zh) 一种手写输入智能识别的方法
CN107545271B (zh) 图像识别方法、装置和系统
CN108460098A (zh) 信息推荐方法、装置和计算机设备
CN109977826A (zh) 物体的类别识别方法和装置
CN110188303A (zh) 页面错误识别方法和装置
CN108846091A (zh) 资讯推荐方法、装置及设备
CN110175335A (zh) 翻译模型的训练方法和装置
CN108170806A (zh) 敏感词检测过滤方法、装置和计算机设备
CN110293554A (zh) 机器人的控制方法、装置和系统
CN108632641A (zh) 视频处理方法及装置
CN109388725A (zh) 通过视频内容进行搜索的方法及装置
CN106067019A (zh) 针对图像进行文字识别的方法及装置
CN109670190A (zh) 翻译模型构建方法和装置
CN109101228A (zh) 应用程序的执行方法和装置
CN112434555B (zh) 键值对区域识别方法、装置、存储介质和电子设备
CN108647273A (zh) 交友推荐方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant