CN109784146B - 一种字体种类识别方法、电子设备、存储介质 - Google Patents
一种字体种类识别方法、电子设备、存储介质 Download PDFInfo
- Publication number
- CN109784146B CN109784146B CN201811480978.7A CN201811480978A CN109784146B CN 109784146 B CN109784146 B CN 109784146B CN 201811480978 A CN201811480978 A CN 201811480978A CN 109784146 B CN109784146 B CN 109784146B
- Authority
- CN
- China
- Prior art keywords
- stroke
- character
- image
- database
- font
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000012545 processing Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 3
- 239000000470 constituent Substances 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 244000025254 Cannabis sativa Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
本发明提供一种字体种类识别方法,包括步骤:采集若干字体种类的笔画图像,将笔画图像分类至所属的字体种类,建立字体种类笔画数据库;接收用户在终端上传的文字图像;对文字图像进行识别,得到图像文字,将图像文字的每个组成笔画与字体种类笔画数据库进行比对,得到相似度最高的数据库笔画,将相似度最高的数据库笔画对应的字体种类判定为图像文字的字体种类。本发明涉及电子设备与可读存储介质,用于执行一种字体种类识别方法。本发明基于字体种类以及字体笔画,实现对文字图像边拆边识别的效果,能够快速、准确识别字体种类,打破以往需要将文字转换成所有字体种类才能识别字体种类的局限,节省识别时间。
Description
技术领域
本发明涉及图像检索技术领域,尤其涉及一种字体种类识别方法、电子设备、存储介质。
背景技术
商标是用来区别一个经营者和其他经营者品牌或服务的标记,由文字、图形、字母、数字、三维标志、声音、颜色组合等要素组成,或上述要素任意组合。其中,文字商标是指仅用文字构成的商标,其凭借便于传播、表达意思明确以及注册成功率高的特点成为最常注册商标之一。
随着我国市场经济的快速发展,商标需求量不断增加。而基于分类码以及大量人力为代价的传统检索方法已不能解决当前商标注册的矛盾。随之,基于内容的商标检索技术应运而生,以计算机视觉技术为基础,结合模式识别等相关计算机辅助知识,为解决当前商标注册问题提供了一个很好途径。但该技术由于特征维数高、运算复杂度高,尽管从提高检索精度或分类正确率角度考虑,将所有提取的特征都能用于检索或分类也是不可行的,难以在商标检索中普及。
发明内容
为了克服现有技术的不足,本发明的目的在于提供一种字体种类识别方法,解决了现有基于内容的商标检索技术由于特征维数高、运算复杂度高,尽管从提高检索精度或分类正确率角度考虑,将所有提取的特征都能用于检索或分类也是不可行的,难以在商标检索中普及的问题。
本发明提供一种字体种类识别方法,包括以下步骤:
建立笔画数据库,采集若干字体种类的笔画图像,将所述笔画图像分类至所属的字体种类,建立字体种类笔画数据库;
接收文字图像,接收用户在终端上传的文字图像;
识别字体种类,对所述文字图像进行识别,得到图像文字,将所述图像文字的每个组成笔画与所述字体种类笔画数据库进行比对,得到相似度最高的数据库笔画,将所述相似度最高的数据库笔画对应的字体种类判定为所述图像文字的字体种类。
进一步地,所述建立笔画数据库步骤中,一张所述笔画图像对应一种字体种类的一个笔画。
进一步地,所述建立笔画数据库步骤还包括对所述笔画图像进行灰度处理,得到灰度图,将所述灰度图分类至所属的字体种类,并进行存储。
进一步地,所述识别字体种类步骤还包括对所述文字图像进行灰度处理,得到灰度文字图像,识别所述灰度文字图像的文字。
进一步地,所述识别字体种类步骤还包括判断文字识别是否成功,是则将所述图像文字的每个组成笔画与所述字体种类笔画数据库进行比对,否则将所述图像文字拆分为若干组成部分,若所述组成部分不是由若干笔画组成,则将所述组成部分标记为独立组成部分,若所述组成部分是由若干笔画组成,则将所述组成部分标记为组合组成部分,并将所述组合组成部分拆分为若干组成笔画,将所述组成笔画与所述字体种类笔画数据库进行比对,得到相似度最高的数据库笔画,将所述独立组成部分和所述组成笔画与所述字体种类笔画数据库再次进行比对,得到相似度最高的数据库笔画。
进一步地,所述识别字体种类步骤还包括判断所述相似度最高的数据库笔画对应的字体种类是否覆盖所述图像文字的所有组成笔画,若是则将相似度最高的数据库笔画对应的字体种类判定为所述图像文字的字体种类,并通过终端对所述字体种类进行显示。
一种电子设备,包括:处理器;
存储器;以及程序,其中所述程序被存储在所述存储器中,并且被配置成由处理器执行,所述程序包括用于执行上述一种字体种类识别方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行上述一种字体种类识别方法。
相比现有技术,本发明的有益效果在于:
本发明提供一种字体种类识别方法,包括以下步骤:建立笔画数据库,采集若干字体种类的笔画图像,将笔画图像分类至所属的字体种类,建立字体种类笔画数据库;接收文字图像,接收用户在终端上传的文字图像;识别字体种类,对文字图像进行识别,得到图像文字,将图像文字的每个组成笔画与字体种类笔画数据库进行比对,得到相似度最高的数据库笔画,将相似度最高的数据库笔画对应的字体种类判定为图像文字的字体种类。本发明涉及电子设备与可读存储介质,用于执行一种字体种类识别方法。本发明基于字体种类以及字体笔画,实现对文字图像边拆边识别的效果,对文字商标实现快速、准确的字体种类识别,实现原理简单,打破以往需要将文字转换成所有字体种类才能识别字体种类的局限,节省识别时间,能有效避免商家发生字体侵权而导致巨额赔偿以及产品夭折的情况发生,同时减轻计算机运算负荷,提高工作效率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。本发明的具体实施方式由以下实施例及其附图详细给出。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明的一种字体种类识别方法流程图。
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。
一种字体种类识别方法,如图1所示,包括以下步骤:
建立笔画数据库,采集若干字体种类的笔画图像,如通过字体素材网站收集所有字体种类的基本笔画静态图像,优选的,一张笔画图像对应一种字体种类的一个笔画。如:宋体的撇、黑体的点,字体种类包括仿宋、黑体、微软雅黑、方正姚体等字体类型,笔画包括点(丶)、横(一)、竖(丨)、撇(丿)、捺提/>折(乛)、钩(亅)等传统基本笔画。不同字体种类的同一笔画的显示样式不同。优选的,对收集的笔画图像进行灰度处理,使图像呈现黑白灰状态。其中,灰度处理不会影响图像的纹理特征信息,将图像RGB三个分量变成一个分量,提高图像处理效率,节省计算机存储空间。笔画图像经过灰度处理,变成灰度图。以字体种类为单位,将笔画图像逐一分类到所属字体种类,均存储在本地服务器上,字体种类笔画数据库建立完毕。每种字体种类都包含相同的笔画。
接收文字图像,接收系统或者用户在终端上传的文字图像;本实施例中,文字图像为文字商标图像;终端为用户日常普遍使用的手机、电脑、触控屏、笔记本等硬件设备。
识别字体种类,系统接收终端上传的文字图像,并对文字图像进行灰度处理,得到灰度文字图像,通过现有文字识别软件识别灰度文字图像的文字,得到图像文字,判断文字识别是否成功,若成功识别文字则将图像文字的每个组成笔画与字体种类笔画数据库进行比对,分别找出相似度最高的数据库笔画,并判断相似度最高的数据库笔画所属字体种类是否全覆盖图像文字所有组成笔画,若是则视为图像文字的字体种类;如:成功识别文字“丁”,其组成笔画分别是:横(一)、竖钩(亅),将上述组成笔画与字体种类笔画数据库所有字体种类所属笔画比对,分别找出相似度最高的数据库笔画,若找出的数据库笔画横(一)所属字体种类是“宋体”,竖钩(亅)所属字体种类也是“宋体”,即宋体的所属笔画全覆盖识别文字“丁”所有组成笔画,在识别文字“丁”的字体种类是“宋体”。若未成功识别文字则根据线条连通法将图像文字拆分为若干组成部分,若组成部分不是由若干笔画组成,则将组成部分标记为独立组成部分,若组成部分是由若干笔画组成,则将组成部分标记为组合组成部分,并将组合组成部分拆分为若干组成笔画,将组成笔画与字体种类笔画数据库进行比对,得到相似度最高的数据库笔画,将独立组成部分和组成笔画与字体种类笔画数据库再次进行比对,得到相似度最高的数据库笔画,判断相似度最高的数据库笔画对应的字体种类是否覆盖图像文字的所有组成笔画,若是则将相似度最高的数据库笔画对应的字体种类判定为图像文字的字体种类,并通过终端对字体种类进行显示。如:识别失败文字“利”,根据线条连通法,将文字拆分成3个组成部分,分别是:禾、〡、亅。而“〡”、“亅”组成部分不是由若干笔画组成的,则将“〡”、“亅”是独立组成部分,“禾”组成部分是由多个组成笔画组成的,则“禾”是组合组成部分,将其继续拆分成多个独立的组成笔画,分别是:撇(丿)、横(一)、竖(丨)、撇(丿)、捺将上述组成笔画与字体种类笔画数据库所有字体种类所属笔画进行一次比对,分别找出该组成部分相似度最高的数据库笔画,将文字“利”的各独立组成部分及由组合组成部分拆分得到的独立的组成笔画,即:撇(丿)、横(一)、竖(丨)、撇(丿)、捺/>竖(丨)、竖钩(亅),与字体种类笔画数据库进行二次比对,分别找出相似度最高的数据库笔画,并判断该找出笔画所属字体种类是否全覆盖文字“利”所有组成笔画;若是,则视为文字“利”的字体种类。
一种电子设备,包括:处理器;
存储器;以及程序,其中程序被存储在存储器中,并且被配置成由处理器执行,程序包括用于执行上述一种字体种类识别方法。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行上述一种字体种类识别方法。
本发明提供一种字体种类识别方法,包括以下步骤:建立笔画数据库,采集若干字体种类的笔画图像,将笔画图像分类至所属的字体种类,建立字体种类笔画数据库;接收文字图像,接收用户在终端上传的文字图像;识别字体种类,对文字图像进行识别,得到图像文字,将图像文字的每个组成笔画与字体种类笔画数据库进行比对,得到相似度最高的数据库笔画,将相似度最高的数据库笔画对应的字体种类判定为图像文字的字体种类。本发明涉及电子设备与可读存储介质,用于执行一种字体种类识别方法。本发明基于字体种类以及字体笔画,实现对文字图像边拆边识别的效果,对文字商标实现快速、准确的字体种类识别,实现原理简单,打破以往需要将文字转换成所有字体种类才能识别字体种类的局限,节省识别时间,能有效避免商家发生字体侵权而导致巨额赔偿以及产品夭折的情况发生,同时减轻计算机运算负荷,提高工作效率。
以上,仅为本发明的较佳实施例而已,并非对本发明作任何形式上的限制;凡本行业的普通技术人员均可按说明书附图所示和以上而顺畅地实施本发明;但是,凡熟悉本专业的技术人员在不脱离本发明技术方案范围内,利用以上所揭示的技术内容而做出的些许更动、修饰与演变的等同变化,均为本发明的等效实施例;同时,凡依据本发明的实质技术对以上实施例所作的任何等同变化的更动、修饰与演变等,均仍属于本发明的技术方案的保护范围之内。
Claims (6)
1.一种字体种类识别方法,其特征在于包括以下步骤:
建立笔画数据库,采集若干字体种类的笔画图像,将所述笔画图像分类至所属的字体种类,建立字体种类笔画数据库;
接收文字图像,接收用户在终端上传的文字图像;
识别字体种类,对所述文字图像进行识别,得到图像文字,判断文字识别是否成功,是则将所述图像文字的每个组成笔画与所述字体种类笔画数据库进行比对,否则将所述图像文字拆分为若干组成部分,若所述组成部分不是由若干笔画组成,则将所述组成部分标记为独立组成部分,若所述组成部分是由若干笔画组成,则将所述组成部分标记为组合组成部分,并将所述组合组成部分拆分为若干组成笔画,将所述组成笔画与所述字体种类笔画数据库进行比对,得到相似度最高的数据库笔画,将所述独立组成部分和所述组成笔画与所述字体种类笔画数据库再次进行比对,得到相似度最高的数据库笔画; 判断所述相似度最高的数据库笔画对应的字体种类是否覆盖所述图像文字的所有组成笔画,若是则将相似度最高的数据库笔画对应的字体种类判定为所述图像文字的字体种类,并通过终端对所述字体种类进行显示。
2.如权利要求1所述的一种字体种类识别方法,其特征在于:所述建立笔画数据库步骤中,一张所述笔画图像对应一种字体种类的一个笔画。
3.如权利要求2所述的一种字体种类识别方法,其特征在于:所述建立笔画数据库步骤还包括对所述笔画图像进行灰度处理,得到灰度图,将所述灰度图分类至所属的字体种类,并进行存储。
4.如权利要求3所述的一种字体种类识别方法,其特征在于:所述识别字体种类步骤还包括对所述文字图像进行灰度处理,得到灰度文字图像,识别所述灰度文字图像的文字。
5.一种电子设备,其特征在于包括:处理器;
存储器;以及程序,其中所述程序被存储在所述存储器中,并且被配置成由处理器执行,所述程序包括用于执行权利要求1-4任意一项所述的方法。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行如权利要求1-4任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811480978.7A CN109784146B (zh) | 2018-12-05 | 2018-12-05 | 一种字体种类识别方法、电子设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811480978.7A CN109784146B (zh) | 2018-12-05 | 2018-12-05 | 一种字体种类识别方法、电子设备、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109784146A CN109784146A (zh) | 2019-05-21 |
CN109784146B true CN109784146B (zh) | 2023-11-07 |
Family
ID=66496639
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811480978.7A Active CN109784146B (zh) | 2018-12-05 | 2018-12-05 | 一种字体种类识别方法、电子设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109784146B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112052647B (zh) * | 2019-06-05 | 2024-07-26 | 珠海金山办公软件有限公司 | 一种文档编辑方法、装置、电子设备和可读存储介质 |
CN110570720B (zh) * | 2019-09-17 | 2022-05-03 | 安徽博文风雅文化科技有限公司 | 书法教学系统及教学方法 |
CN112633428A (zh) * | 2019-10-09 | 2021-04-09 | 北京方正手迹数字技术有限公司 | 笔画骨架信息提取方法、装置、电子设备及存储介质 |
CN111539409B (zh) * | 2020-04-09 | 2022-10-14 | 武汉大学 | 一种基于高光谱遥感技术的古墓题记文字识别方法 |
CN111931672A (zh) * | 2020-08-17 | 2020-11-13 | 珠海大横琴科技发展有限公司 | 字迹识别方法、装置、计算机设备及存储介质 |
CN113011412B (zh) * | 2021-04-15 | 2024-07-16 | 深圳市鹰硕云科技有限公司 | 基于笔顺及ocr文字识别方法、装置、设备及存储介质 |
CN114092938B (zh) * | 2022-01-19 | 2022-04-19 | 腾讯科技(深圳)有限公司 | 图像的识别处理方法、装置、电子设备及存储介质 |
CN115063808B (zh) * | 2022-08-18 | 2022-11-15 | 京华信息科技股份有限公司 | 一种基于聚类特征提取的ocr字体识别方法及系统 |
CN116049461B (zh) * | 2023-03-29 | 2023-05-30 | 北京思想天下教育科技有限公司 | 一种基于大数据云平台的题目转化系统 |
CN116524529B (zh) * | 2023-07-04 | 2023-10-27 | 青岛海信信息科技股份有限公司 | 一种基于图形嵌套关系的图层识别新方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09319830A (ja) * | 1996-05-29 | 1997-12-12 | Ricoh Co Ltd | フォント識別方法 |
JPH1055411A (ja) * | 1996-08-09 | 1998-02-24 | Ricoh Co Ltd | フォント識別装置 |
JPH10124614A (ja) * | 1996-10-16 | 1998-05-15 | Ricoh Co Ltd | 書体識別装置および書体識別方法および情報記憶媒体 |
CN1188944A (zh) * | 1996-12-24 | 1998-07-29 | 株式会社理光 | 字体识别装置、字体识别方法及信息记录媒体 |
JPH1185905A (ja) * | 1997-07-15 | 1999-03-30 | Ricoh Co Ltd | 書体識別装置および書体識別方法および情報記憶媒体 |
WO2015183015A1 (ko) * | 2014-05-30 | 2015-12-03 | 삼성에스디에스 주식회사 | 문자 인식 방법 및 그 장치 |
CN106570538A (zh) * | 2015-10-10 | 2017-04-19 | 北大方正集团有限公司 | 字符图片处理方法和装置 |
-
2018
- 2018-12-05 CN CN201811480978.7A patent/CN109784146B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09319830A (ja) * | 1996-05-29 | 1997-12-12 | Ricoh Co Ltd | フォント識別方法 |
JPH1055411A (ja) * | 1996-08-09 | 1998-02-24 | Ricoh Co Ltd | フォント識別装置 |
JPH10124614A (ja) * | 1996-10-16 | 1998-05-15 | Ricoh Co Ltd | 書体識別装置および書体識別方法および情報記憶媒体 |
CN1188944A (zh) * | 1996-12-24 | 1998-07-29 | 株式会社理光 | 字体识别装置、字体识别方法及信息记录媒体 |
JPH1185905A (ja) * | 1997-07-15 | 1999-03-30 | Ricoh Co Ltd | 書体識別装置および書体識別方法および情報記憶媒体 |
WO2015183015A1 (ko) * | 2014-05-30 | 2015-12-03 | 삼성에스디에스 주식회사 | 문자 인식 방법 및 그 장치 |
CN106570538A (zh) * | 2015-10-10 | 2017-04-19 | 北大方正集团有限公司 | 字符图片处理方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109784146A (zh) | 2019-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109784146B (zh) | 一种字体种类识别方法、电子设备、存储介质 | |
CN111476227B (zh) | 基于ocr的目标字段识别方法、装置及存储介质 | |
CN110390269B (zh) | Pdf文档表格提取方法、装置、设备及计算机可读存储介质 | |
CN110659346B (zh) | 表格提取方法、装置、终端及计算机可读存储介质 | |
EP2164009A2 (en) | Architecture for mixed media reality retrieval of locations and registration of images | |
CN108491866B (zh) | 色情图片鉴定方法、电子装置及可读存储介质 | |
CN102831200A (zh) | 一种基于图像文字识别的商品推送方法和装置 | |
CN108427959A (zh) | 基于图像识别的机台状态采集方法及系统 | |
CN110197238B (zh) | 一种字体类别的识别方法、系统及终端设备 | |
CN109740417B (zh) | 发票类型识别方法、装置、存储介质和计算机设备 | |
US20220301334A1 (en) | Table generating method and apparatus, electronic device, storage medium and product | |
CN111753120B (zh) | 一种搜题的方法、装置、电子设备和存储介质 | |
CN104915664B (zh) | 联系对象标识获取方法和装置 | |
CN111507324A (zh) | 卡片边框识别方法、装置、设备和计算机存储介质 | |
CN111310750B (zh) | 一种信息处理方法、装置、计算设备及介质 | |
CN112784220B (zh) | 一种纸质合同防篡改校验方法及系统 | |
CN110291527A (zh) | 信息处理方法、系统、云处理设备以及计算机程序产品 | |
CN107992872B (zh) | 一种对图片进行文本识别的方法及移动终端 | |
CN113780116A (zh) | 发票分类方法、装置、计算机设备和存储介质 | |
CN116343237A (zh) | 基于深度学习和知识图谱的票据识别方法 | |
CN112613367A (zh) | 票据信息文本框获取方法、系统、设备及存储介质 | |
CN111832497A (zh) | 一种基于几何特征的文本检测后处理方法 | |
CN108334602B (zh) | 数据标注方法和装置、电子设备、计算机存储介质 | |
CN110728240A (zh) | 一种对电子卷宗的标题自动识别的方法及装置 | |
CN115525761A (zh) | 一种文章关键词筛选类别的方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |