CN110135530B - 转换图像中汉字字体的方法及系统、计算机设备及介质 - Google Patents

转换图像中汉字字体的方法及系统、计算机设备及介质 Download PDF

Info

Publication number
CN110135530B
CN110135530B CN201910405777.9A CN201910405777A CN110135530B CN 110135530 B CN110135530 B CN 110135530B CN 201910405777 A CN201910405777 A CN 201910405777A CN 110135530 B CN110135530 B CN 110135530B
Authority
CN
China
Prior art keywords
converted
strokes
chinese character
image
font
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910405777.9A
Other languages
English (en)
Other versions
CN110135530A (zh
Inventor
张丽杰
陈冠男
刘瀚文
朱丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BOE Technology Group Co Ltd
Original Assignee
BOE Technology Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BOE Technology Group Co Ltd filed Critical BOE Technology Group Co Ltd
Priority to CN201910405777.9A priority Critical patent/CN110135530B/zh
Publication of CN110135530A publication Critical patent/CN110135530A/zh
Priority to US17/044,275 priority patent/US11587343B2/en
Priority to PCT/CN2020/085696 priority patent/WO2020228493A1/zh
Application granted granted Critical
Publication of CN110135530B publication Critical patent/CN110135530B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • G06V30/245Font recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • G06V30/347Sampling; Contour coding; Stroke extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/293Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of characters other than Kanji, Hiragana or Katakana

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Document Processing Apparatus (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)

Abstract

本发明公开一种转换图像中汉字字体的方法及系统、计算机设备及介质。该方法的一具体实施方式包括:获取待转换图像中待转换汉字的笔画及笔画的空间分布信息;根据待转换汉字的笔画、笔画的空间分布信息及指定字体的标准笔画信息,在待转换图像中生成对应待转换汉字的指定字体汉字,以替代待转换汉字。该实施方式可实现个性化的字体定制。

Description

转换图像中汉字字体的方法及系统、计算机设备及介质
技术领域
本发明涉及图像处理技术领域。更具体地,涉及一种转换图像中汉字字体的方法及系统、计算机设备及介质。
背景技术
文字是文化知识传播与积累的基石。随着社会的进步,越来越多个性化、自我化、定制化的字体需要被设计出来,尤其是在平面设计、广告等行业中。然而对于汉字而言,由于文字数量的繁多,设计一套完整的新字体需要大量的人力及时间成本。
因此,需要提供一种转换图像中汉字字体的方法及系统、计算机设备及介质。
发明内容
本发明的目的在于提供一种转换图像中汉字字体的方法及系统、计算机设备及介质,以解决现有技术存在的问题中的至少一个。
为达到上述目的,本发明采用下述技术方案:
本发明第一方面提供了一种转换图像中汉字字体的方法,包括:
获取待转换图像中待转换汉字的笔画及所述笔画的空间分布信息;
根据所述待转换汉字的笔画、所述笔画的空间分布信息及指定字体的标准笔画信息,在待转换图像中生成对应待转换汉字的指定字体汉字,以替代所述待转换汉字。
本发明第一方面提供的方法,可通过对待转换图像中待转换汉字的字体结构分析获取其笔画及笔画的空间分布信息,再根据预先设计得到的指定字体的标准笔画信息,在待转换图像中生成对应待转换汉字的指定字体汉字,自动实现对待转换图像中汉字的字体转换,可将待转换图像中的汉字转换为个性化的新字体的汉字,字体转换的及时性高且有效性高,可大幅节约获得个性化的新字体的汉字的人力及时间成本。
可选地,该方法还包括:
利用深度学习网络生成包含指定字体的标准笔画信息的图像,以获取指定字体的标准笔画信息。
采用此可选方式,可通过深度学习网络快速简便地获取指定字体的标准笔画信息。
可选地,所述获取待转换图像中待转换汉字的笔画及所述笔画的空间分布信息进一步包括:
按标准字体的标准笔画的复杂程度由高至低,依次计算待转换图像中各区域与标准字体的标准笔画的相关度,根据所述相关度匹配识别待转换图像中待转换汉字的笔画及所述笔画的空间分布信息,其中,在识别当前笔画时将上一次识别的笔画对应的区域的像素值置零。
采用此可选方式,可通过基于相关度的与标准字体的标准笔画的匹配,快速精确地获取待转换图像中待转换汉字的笔画及所述笔画的空间分布信息。
可选地,所述依次计算待转换图像中各区域与标准字体的标准笔画的相关度进一步包括:依次根据按照不同的旋转角度、不同尺寸的图像块计算待转换图像中各区域与标准字体的标准笔画的相关度。
可选地,所述根据所述待转换汉字的笔画、所述笔画的空间分布信息及指定字体的标准笔画信息,在待转换图像中生成对应待转换汉字的指定字体汉字进一步包括:
根据所述待转换汉字的笔画及所述笔画的数量和匹配识别顺序,从指定字体的标准笔画信息中选择对应的笔画,并根据所述笔画的空间分布信息在待转换图像中生成对应待转换汉字的指定字体汉字。
可选地,所述笔画的空间分布信息包括笔画的起始点坐标信息、尺寸信息及方向信息。
可选地,在获取待转换图像中待转换汉字的笔画及所述笔画的空间分布信息之后,该方法还包括:
将所述待转换汉字以二维向量表示,其中,所述待转换汉字的笔画及笔画的空间分布信息作为所述待转换汉字的第一维向量,所述待转换汉字的笔画的数量和匹配识别顺序作为所述待转换汉字的第二维向量。
可选地,在所述获取待转换图像中待转换汉字的笔画及所述笔画的空间分布信息之前,该方法还包括:
将待转换图像中的待转换汉字转换为标准字体的待转换汉字。
可通过此可选方式处理待转换图像中的待转换汉字为特殊字体的情况,以避免由于原始待转换图像中待转换汉字为特殊字体而带来获取笔画及所述笔画的空间分布信息时精度可能会有所下降的情况,进而提升本发明第一方面提供的方法的普适性。
可选地,所述利用深度学习网络生成包含指定字体的标准笔画信息的图像进一步包括:
利用多个包含指定字体的不同汉字的图像作为训练样本,得到所述深度学习网络;
将包含标准字体的汉字的图像输入所述深度学习网络,得到包含指定字体的标准笔画信息的图像。
采用此可选方式,通过训练少量的训练样本即可得到深度学习网络,实现了快速简便地获取指定字体的标准笔画信息。
可选地,所述深度学习网络为生成对抗网络。生成对抗网络适用于图像的风格迁移,在图像领域,已经能够创造出足够以假乱真的图像。
本发明第二方面提供了一种执行本发明第一方面提供的方法的转换图像中汉字字体的系统,包括:
文字结构获取模块,用于获取待转换图像中待转换汉字的笔画及所述笔画的空间分布信息;
字体转换模块,用于根据所述待转换汉字的笔画、所述笔画的空间分布信息及指定字体的标准笔画信息,在待转换图像中生成对应待转换汉字的指定字体汉字,以替代所述待转换汉字。
本发明第三方面提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现本发明第一方面提供的方法。
本发明第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明第一方面提供的方法。
本发明的有益效果如下:
本发明所述技术方案可实现个性化的字体定制,字体转换的及时性高且有效性高,可大幅节约获得个性化的新字体的汉字的人力及时间成本。
附图说明
下面结合附图对本发明的具体实施方式作进一步详细的说明;
图1示出本发明实施例提供的转换图像中汉字字体的方法的流程图。
图2中,2-a示出包含待转换汉字的图像示例,2-b示出字体转换后的图像示例。
图3示出获取待转换图像中待转换汉字的笔画及笔画的空间分布信息的流程图。
图4示出本发明实施例提供的转换图像中汉字字体的系统的示意图。
图5示出本发明实施例提供的计算机系统的结构示意图。
具体实施方式
为了更清楚地说明本发明,下面结合优选实施例和附图对本发明做进一步的说明。附图中相似的部件以相同的附图标记进行表示。本领域技术人员应当理解,下面所具体描述的内容是说明性的而非限制性的,不应以此限制本发明的保护范围。
如图1所示,本发明的一个实施例提供了一种转换图像中汉字字体的方法,包括:
S1、获取待转换图像中待转换汉字的笔画及笔画的空间分布信息,即,获取待转换汉字由哪些笔画构成及这些笔画在待转换图像中的位置分布及尺寸等信息;
S2、根据待转换汉字的笔画、笔画的空间分布信息及指定字体的标准笔画信息,在待转换图像中生成对应待转换汉字的指定字体汉字,以替代待转换汉字。
本实施例提供的方法,可通过对待转换图像中待转换汉字的字体结构分析获取其笔画及笔画的空间分布信息,再根据预先设计得到的指定字体的标准笔画信息,在待转换图像中生成对应待转换汉字的指定字体汉字,自动实现待转换图像中汉字的字体转换,可将待转换图像中的汉字转换为个性化的新字体的汉字,字体转换的及时性高且有效性高,可大幅节约获得个性化的新字体的汉字的人力及时间成本。
在一个具体示例中,如图2所示,2-a示出包含待转换汉字的待转换图像,待转换汉字的字体为标准字体中的正楷字体,2-b示出进行字体转换后的图像。进行字体转换后,各汉字在图像中的空间分布保持不变,具体而言,每个汉字各笔画的起始点坐标、尺寸和方向等基本保持不变,但可能会随着字体的不同略有差异。
在本实施例的一些可选的实现方式中,该方法还包括:
利用深度学习网络生成包含指定字体的标准笔画信息的图像,以获取指定字体的标准笔画信息。
采用此实现方式,可通过深度学习网络快速简便地获取指定字体的标准笔画信息。
在本实施例的一些可选的实现方式中,利用深度学习网络生成包含指定字体的标准笔画信息的图像进一步包括:
利用多个包含指定字体的不同汉字的图像作为训练样本,得到深度学习网络;
将包含标准字体的汉字的图像输入深度学习网络,得到包含指定字体的标准笔画信息的图像。
采用此实现方式,通过训练少量的训练样本即可得到用于字体学习的深度学习网络,实现了快速简便地获取指定字体的标准笔画信息。
在本实施例的一些可选的实现方式中,深度学习网络为生成对抗网络。生成对抗网络适用于图像的风格迁移,在图像领域,已经能够创造出足够以假乱真的图像。
在一个具体示例中,本实施例以标准正楷字体作为文字结构分析的基准,基于少量的几个包含指定字体的不同汉字的图像中的汉字作为目标字体风格的基准,利用深度学习中风格迁移的方法学习指定字体的特性,然后利用训练好的深度学习网络(或者说风格迁移网络),以包含正楷字体的汉字的图像作为深度学习网络的输入,或者说,是以包含正楷字体的汉字的图像包含的正楷字体的标准笔画作为深度学习网络的输入,生成包含指定字体的标准笔画信息的图像,以获取指定字体的标准笔画信息,以将其用于在后续步骤中重新构建出对应待转换汉字的指定字体的汉字。
具体而言,由于汉字是“形、音、义”的结合体,汉字的一个重要特点是其具有字形特征,所有汉字都是由点、横、竖、撇、捺等基础笔画构成的。因此,通常知道构成汉字的基础笔画的分割以及文字的结构构成,就可以生成指定的汉字。然而仅仅是这些笔画很难让用户能够直观的选择该类字体是否自己希望选择的字体。因此,本实施例选择了以字体的文字风格作为字体选择的基准。通过少量的指定风格的文字样例(即少量的几个包含指定字体的不同汉字的图像)作为训练样本,通过深度学习的方法训练出能够表示该深度学习网络,类似于在深度学习网络在艺术图像合成领域的应用。训练后得到的深度学习网络将具备将标准字体的汉字所包含的标准字体的标准笔画转换为期望风格的指定字体的标准笔画的特性。随后将包含标准字体(正楷字体)的汉字的图像输入深度学习网络,即可生成包含指定字体的标准笔画信息的图像。
在本实施例的一些可选的实现方式中,获取待转换图像中待转换汉字的笔画及笔画的空间分布信息进一步包括:
按标准字体的标准笔画的复杂程度由高至低,依次计算待转换图像中各区域与标准字体的标准笔画的相关度,根据相关度匹配识别待转换图像中待转换汉字的笔画及笔画的空间分布信息,其中,在识别当前笔画时将上一次识别的笔画对应的区域的像素值置零。
采用此实现方式,可通过基于相关度的与标准字体的标准笔画的匹配,快速精确地获取待转换图像中待转换汉字的笔画及笔画的空间分布信息。
在本实施例的一些可选的实现方式中,依次计算待转换图像中各区域与标准字体的标准笔画的相关度进一步包括:依次根据按照不同的旋转角度、不同尺寸的图像块计算待转换图像中各区域与标准字体的标准笔画的相关度。
在一个具体示例中,文字的结构关系固然可以通过人工方式手动建立,然而由于汉字的数量极其庞大,手动建立的方式需要耗费大量的人力及时间成本。因而本实施例采用基于图像匹配的方式分析文字构成的空间关系。可理解的是,相同笔画可能形状也不一定完全一致,例如笔画“横”,就可能有长横、短横等不同的尺度。因而本实施例在文字笔画结构分析时采用不同尺度进行。另外,由于有些较复杂的基础笔画可能是由一些简单的基础笔画构成,例如“横折”由“横”和“竖”两个基础笔画构成。因而本实施例在分析文字结构信息时首先从较复杂的基础笔画结构开始进行图像匹配识别,只有复杂基础笔画图像匹配不成功时才逐次匹配较简单的基础笔画。如图3所示,整个匹配识别过程采用对整个待转换图像的文字区域的不同子区域,按照不同的旋转角度(优选设置为<30°)和尺度计算图像块和基础笔画的相关度,当相关度大于预设阈值时就认为获得了匹配的笔画,这时,记录该笔画的坐标、尺度、方向等空间分布信息。随后将该笔画对应区域的像素值置零(类似于擦除该笔画),利用以上步骤不断循环迭代直到整个待转换图像的文字区域的像素值接近等于零,则说明整个待转换汉字已经由所有的基础笔画表示,获取了待转换汉字的所有笔画及所有笔画的空间分布信息。
在本实施例的一些可选的实现方式中,根据待转换汉字的笔画、笔画的空间分布信息及指定字体的标准笔画信息,在待转换图像中生成对应待转换汉字的指定字体汉字进一步包括:
根据待转换汉字的笔画(或者说笔画名称)及笔画的数量和匹配识别顺序,从指定字体的标准笔画信息中选择对应的笔画,并根据笔画的空间分布信息在待转换图像中生成对应待转换汉字的指定字体汉字。
在本实施例的一些可选的实现方式中,笔画的空间分布信息包括笔画的起始点坐标信息、尺寸信息及方向信息。
在本实施例的一些可选的实现方式中,在获取待转换图像中待转换汉字的笔画及笔画的空间分布信息之后,该方法还包括:
将待转换汉字以二维向量表示,其中,待转换汉字的笔画及笔画的空间分布信息作为待转换汉字的第一维向量,待转换汉字的笔画的数量和匹配识别顺序作为待转换汉字的第二维向量。
在一个具体示例中,通过前面的步骤,已经提取到了待转换汉字的笔画表示,同时也获得了指定字体的标准笔画信息。此步骤中,待转换汉字的笔画及笔画的空间分布信息后将待转换汉字以二维向量表示,第一维向量第一个维度是笔画属性,包括笔画(或者说笔画名称)及笔画的空间分布信息;第二维向量包括笔画的数量和匹配识别顺序,其中,不同文字的笔画数量可能存在不同,所以该二维向量的第二维向量的长度并不固定。之后可按照上述第二维向量中匹配识别顺序,根据第一维向量包含的笔画名称从指定字体的标准笔画信息中选择对应的笔画,再根据第一维向量包含的笔画的空间分布信息在待转换图像中生成对应的笔画,最终得到了以指定字体的汉字代替原字体的待转换汉字的图像。
在本实施例的一些可选的实现方式中,在获取待转换图像中待转换汉字的笔画及笔画的空间分布信息之前,该方法还包括:
将待转换图像中的待转换汉字转换为标准字体的待转换汉字。
可通过此实现方式处理待转换图像中的待转换汉字为特殊字体的情况,以避免由于原始待转换图像中待转换汉字为特殊字体而带来获取笔画及所述笔画的空间分布信息时精度可能会有所下降的情况,进而提升本实施例提供的方法的普适性。
在一个具体示例中,将待转换图像中的待转换汉字转换为标准字体的待转换汉字可基于现有的图像识别技术结合自然语言处理技术实现。
如图4所示,本发明的另一个实施例提供了一种执行上述方法的转换图像中汉字字体的系统,包括:
文字结构获取模块,用于获取待转换图像中待转换汉字的笔画及笔画的空间分布信息;
字体转换模块,用于根据待转换汉字的笔画、笔画的空间分布信息及指定字体的标准笔画信息,在待转换图像中生成对应待转换汉字的指定字体汉字,以替代待转换汉字。
需要说明的是,本实施例提供的转换图像中汉字字体的系统的原理及工作流程与上述转换图像中汉字字体的方法相似,相关之处可以参照上述说明,在此不再赘述。
如图5所示,适于用来实现本实施例提供的转换图像中汉字字体的系统的计算机系统,包括中央处理模块(CPU),其可以根据存储在只读存储器(ROM)中的程序或者从存储部分加载到随机访问存储器(RAM)中的程序而执行各种适当的动作和处理。在RAM中,还存储有计算机系统操作所需的各种程序和数据。CPU、ROM以及RAM通过总线被此相连。输入/输入(I/O)接口也连接至总线。
以下部件连接至I/O接口:包括键盘、鼠标等的输入部分;包括诸如液晶显示器(LCD)等以及扬声器等的输出部分;包括硬盘等的存储部分;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分。通信部分经由诸如因特网的网络执行通信处理。驱动器也根据需要连接至I/O接口。可拆卸介质,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器上,以便于从其上读出的计算机程序根据需要被安装入存储部分。
特别地,根据本实施例,上文流程图描述的过程可以被实现为计算机软件程序。例如,本实施例包括一种计算机程序产品,其包括有形地包含在计算机可读介质上的计算机程序,上述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。
附图中的流程图和示意图,图示了本实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或示意图中的每个方框可以代表一个模块、程序段或代码的一部分,上述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,示意图和/或流程图中的每个方框、以及示意和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器,包括文字结构获取模块和字体转换模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定。例如,字体转换模块还可以被描述为“指定字体合成模块”。
作为另一方面,本实施例还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中上述装置中所包含的非易失性计算机存储介质,也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当上述一个或者多个程序被一个设备执行时,使得上述设备:获取待转换图像中待转换汉字的笔画及所述笔画的空间分布信息;根据所述待转换汉字的笔画、所述笔画的空间分布信息及指定字体的标准笔画信息,在待转换图像中生成对应待转换汉字的指定字体汉字,以替代所述待转换汉字。
需要说明的是,在本发明的描述中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定,对于本领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动,这里无法对所有的实施方式予以穷举,凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。

Claims (12)

1.一种转换图像中汉字字体的方法,其特征在于,包括:
获取待转换图像中待转换汉字的笔画及所述笔画的空间分布信息;
根据所述待转换汉字的笔画、所述笔画的空间分布信息及指定字体的标准笔画信息,在待转换图像中生成对应待转换汉字的指定字体汉字,以替代所述待转换汉字;
所述获取待转换图像中待转换汉字的笔画及所述笔画的空间分布信息进一步包括:
按标准字体的标准笔画的复杂程度由高至低,依次计算待转换图像中各区域与标准字体的标准笔画的相关度,根据所述相关度匹配识别待转换图像中待转换汉字的笔画及所述笔画的空间分布信息,其中,在识别当前笔画时将上一次识别的笔画对应的区域的像素值置零。
2.根据权利要求1所述的方法,其特征在于,该方法还包括:
利用深度学习网络生成包含指定字体的标准笔画信息的图像,以获取指定字体的标准笔画信息。
3.根据权利要求1所述的方法,其特征在于,所述依次计算待转换图像中各区域与标准字体的标准笔画的相关度进一步包括:依次根据按照不同的旋转角度、不同尺寸的图像块计算待转换图像中各区域与标准字体的标准笔画的相关度。
4.根据权利要求1所述的方法,其特征在于,所述根据所述待转换汉字的笔画、所述笔画的空间分布信息及指定字体的标准笔画信息,在待转换图像中生成对应待转换汉字的指定字体汉字进一步包括:
根据所述待转换汉字的笔画及所述笔画的数量和匹配识别顺序,从指定字体的标准笔画信息中选择对应的笔画,并根据所述笔画的空间分布信息在待转换图像中生成对应待转换汉字的指定字体汉字。
5.根据权利要求4所述的方法,其特征在于,所述笔画的空间分布信息包括笔画的起始点坐标信息、尺寸信息及方向信息。
6.根据权利要求5所述的方法,其特征在于,在获取待转换图像中待转换汉字的笔画及所述笔画的空间分布信息之后,该方法还包括:
将所述待转换汉字以二维向量表示,其中,所述待转换汉字的笔画及笔画的空间分布信息作为所述待转换汉字的第一维向量,所述待转换汉字的笔画的数量和匹配识别顺序作为所述待转换汉字的第二维向量。
7.根据权利要求1所述的方法,其特征在于,在所述获取待转换图像中待转换汉字的笔画及所述笔画的空间分布信息之前,该方法还包括:
将待转换图像中的待转换汉字转换为标准字体的待转换汉字。
8.根据权利要求2所述的方法,其特征在于,所述利用深度学习网络生成包含指定字体的标准笔画信息的图像进一步包括:
利用多个包含指定字体的不同汉字的图像作为训练样本,得到所述深度学习网络;
将包含标准字体的汉字的图像输入所述深度学习网络,得到包含指定字体的标准笔画信息的图像。
9.根据权利要求2所述的方法,其特征在于,所述深度学习网络为生成对抗网络。
10.一种执行如权利要求1-9中任一项所述方法的转换图像中汉字字体的系统,其特征在于,包括:
文字结构获取模块,用于获取待转换图像中待转换汉字的笔画及所述笔画的空间分布信息;
字体转换模块,用于根据所述待转换汉字的笔画、所述笔画的空间分布信息及指定字体的标准笔画信息,在待转换图像中生成对应待转换汉字的指定字体汉字,以替代所述待转换汉字。
11.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-9中任一项所述的方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-9中任一项所述的方法。
CN201910405777.9A 2019-05-16 2019-05-16 转换图像中汉字字体的方法及系统、计算机设备及介质 Active CN110135530B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201910405777.9A CN110135530B (zh) 2019-05-16 2019-05-16 转换图像中汉字字体的方法及系统、计算机设备及介质
US17/044,275 US11587343B2 (en) 2019-05-16 2020-04-20 Method and system for converting font of Chinese character in image, computer device and medium
PCT/CN2020/085696 WO2020228493A1 (zh) 2019-05-16 2020-04-20 转换图像中汉字字体的方法及系统、计算机设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910405777.9A CN110135530B (zh) 2019-05-16 2019-05-16 转换图像中汉字字体的方法及系统、计算机设备及介质

Publications (2)

Publication Number Publication Date
CN110135530A CN110135530A (zh) 2019-08-16
CN110135530B true CN110135530B (zh) 2021-08-13

Family

ID=67574436

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910405777.9A Active CN110135530B (zh) 2019-05-16 2019-05-16 转换图像中汉字字体的方法及系统、计算机设备及介质

Country Status (3)

Country Link
US (1) US11587343B2 (zh)
CN (1) CN110135530B (zh)
WO (1) WO2020228493A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110135530B (zh) * 2019-05-16 2021-08-13 京东方科技集团股份有限公司 转换图像中汉字字体的方法及系统、计算机设备及介质
CN111046631A (zh) * 2019-10-16 2020-04-21 平安科技(深圳)有限公司 基于字符转换的姓名存储方法、装置、计算机设备
CN110956678B (zh) * 2019-12-16 2022-02-22 北大方正集团有限公司 字形的处理方法和装置
CN112070658B (zh) * 2020-08-25 2024-04-16 西安理工大学 一种基于深度学习的汉字字体风格迁移方法
CN114495118B (zh) * 2022-04-15 2022-08-09 华南理工大学 基于对抗解耦的个性化手写文字生成方法
CN114842485B (zh) * 2022-04-26 2023-06-27 北京百度网讯科技有限公司 一种字幕去除方法、装置及电子设备
CN115310405B (zh) * 2022-07-21 2024-07-26 北京汉仪创新科技股份有限公司 基于对抗生成网络的字体替换方法、系统、设备和介质
CN117649672B (zh) * 2024-01-30 2024-04-26 湖南大学 基于主动学习与迁移学习的字体类别视觉检测方法和系统

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0457534B1 (en) * 1990-05-14 2001-10-31 Canon Kabushiki Kaisha Image processing method and apparatus
CN101551724B (zh) * 2008-03-31 2014-03-12 联想(北京)有限公司 在触摸屏上书写文字的方法与装置
CN101308578B (zh) 2008-06-20 2010-09-01 华南理工大学 一种手写汉字美化方法
CN101819683A (zh) * 2009-10-26 2010-09-01 杨光祥 一种汉字字体的重构方法
CN102346558A (zh) * 2010-07-26 2012-02-08 夏普株式会社 笔画结构输入方法和系统
CN105247540B (zh) * 2013-06-09 2018-10-16 苹果公司 管理实时手写识别
CN105718965A (zh) * 2014-12-02 2016-06-29 北京汉仪科印信息技术有限公司 一种汉字书写字形识别方法及装置
CN107292936B (zh) 2017-05-18 2020-08-11 湖南大学 一种汉字字体矢量化方法
CN107577651B (zh) * 2017-08-25 2020-11-10 上海媒智科技有限公司 基于对抗网络的汉字字体迁移系统
CN107644006B (zh) * 2017-09-29 2020-04-03 北京大学 一种基于深度神经网络的手写体中文字库自动生成方法
CN109784325A (zh) * 2017-11-10 2019-05-21 富士通株式会社 开集识别方法和设备及计算机可读存储介质
CN108170649B (zh) * 2018-01-26 2021-06-01 广东工业大学 一种基于dcgan深度网络的汉字字库生成方法及装置
CN108764054B (zh) 2018-04-27 2021-04-13 厦门大学 基于生成式对抗网络的机器人书写书法的方法
CN108804397B (zh) * 2018-06-12 2021-07-20 华南理工大学 一种基于少量目标字体的汉字字体转换生成的方法
CN109064522A (zh) * 2018-08-03 2018-12-21 厦门大学 基于条件生成对抗网络的汉字字体生成方法
CN109190722B (zh) * 2018-08-06 2021-05-04 大连民族大学 基于满文字符图片的字体风格迁移变换方法
CN109635883B (zh) * 2018-11-19 2023-04-18 北京大学 基于深度堆叠网络的结构信息指导的中文字库生成方法
CN110135530B (zh) 2019-05-16 2021-08-13 京东方科技集团股份有限公司 转换图像中汉字字体的方法及系统、计算机设备及介质

Also Published As

Publication number Publication date
CN110135530A (zh) 2019-08-16
US20210271939A1 (en) 2021-09-02
US11587343B2 (en) 2023-02-21
WO2020228493A1 (zh) 2020-11-19

Similar Documents

Publication Publication Date Title
CN110135530B (zh) 转换图像中汉字字体的方法及系统、计算机设备及介质
RU2691214C1 (ru) Распознавание текста с использованием искусственного интеллекта
CN109285111B (zh) 一种字体转换的方法、装置、设备及计算机可读存储介质
US20190197154A1 (en) Question answering for data visualizations
US9697583B2 (en) Image processing apparatus, image processing method, and computer-readable recording medium
CN110880000B (zh) 图片文字定位方法、装置、计算机设备和存储介质
CN115063875B (zh) 模型训练方法、图像处理方法、装置和电子设备
CN114120299B (zh) 信息获取方法、装置、存储介质及设备
CN112329751A (zh) 一种基于深度学习的多尺度遥感影像目标识别系统及方法
CN111915618B (zh) 基于峰值响应增强的实例分割算法、计算设备
CN115393872B (zh) 一种训练文本分类模型的方法、装置、设备及存储介质
CN110414523A (zh) 一种身份证识别方法、装置、设备及存储介质
CN107256378A (zh) 语种识别方法及装置
CN112580666A (zh) 图像特征的提取方法、训练方法、装置、电子设备及介质
CN112633428A (zh) 笔画骨架信息提取方法、装置、电子设备及存储介质
Godfrey et al. An adaptable approach for generating vector features from scanned historical thematic maps using image enhancement and remote sensing techniques in a geographic information system
CN114120333B (zh) 一种基于深度学习的自然场景古汉字识别方法及系统
CN116361502B (zh) 一种图像检索方法、装置、计算机设备及存储介质
CN117392698A (zh) 手绘电路图的识别方法、装置、设备和存储介质
CN114399782B (zh) 文本图像处理方法、装置、设备、存储介质及程序产品
WO2023284670A1 (zh) 图形码提取模型构建方法、识别方法、装置、设备和介质
CN117523219A (zh) 图像处理方法及装置、电子设备、存储介质
CN116931900A (zh) 一种可视化页面配置方法及装置
CN113569834A (zh) 营业执照识别方法、装置、电子设备及存储介质
CN115455227B (zh) 图形界面的元素搜索方法及电子设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant