CN112347288B - 一种字图的矢量化方法 - Google Patents
一种字图的矢量化方法 Download PDFInfo
- Publication number
- CN112347288B CN112347288B CN202011245375.6A CN202011245375A CN112347288B CN 112347288 B CN112347288 B CN 112347288B CN 202011245375 A CN202011245375 A CN 202011245375A CN 112347288 B CN112347288 B CN 112347288B
- Authority
- CN
- China
- Prior art keywords
- curve
- vectorized
- word graph
- smooth
- outline
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 106
- 238000003062 neural network model Methods 0.000 claims description 66
- 238000012549 training Methods 0.000 claims description 47
- 238000001514 detection method Methods 0.000 claims description 30
- 238000012545 processing Methods 0.000 claims description 24
- 238000013528 artificial neural network Methods 0.000 claims description 21
- 238000003860 storage Methods 0.000 claims description 9
- 238000009499 grossing Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 16
- 230000008569 process Effects 0.000 abstract description 15
- 238000004519 manufacturing process Methods 0.000 abstract description 5
- 238000005516 engineering process Methods 0.000 abstract description 4
- 238000006243 chemical reaction Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 24
- 238000011161 development Methods 0.000 description 20
- 238000004891 communication Methods 0.000 description 9
- 238000013461 design Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000003416 augmentation Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000007639 printing Methods 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 238000012827 research and development Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 235000017166 Bambusa arundinacea Nutrition 0.000 description 1
- 235000017491 Bambusa tulda Nutrition 0.000 description 1
- 241001330002 Bambuseae Species 0.000 description 1
- 235000015334 Phyllostachys viridis Nutrition 0.000 description 1
- 239000011425 bamboo Substances 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/56—Information retrieval; Database structures therefor; File system structures therefor of still image data having vectorial format
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/109—Font handling; Temporal or kinetic typography
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Databases & Information Systems (AREA)
- Image Generation (AREA)
- Controls And Circuits For Display Device (AREA)
Abstract
本申请提供一种字图的矢量化方法及装置,该方法包括:提取待矢量化字图的轮廓;从待矢量化字图的轮廓中确定出待矢量化字图的直线、待矢量化字图的曲线的平滑端点以及待矢量化字图的曲线的非平滑端点;根据曲线的平滑端点和曲线的非平滑端点,对待矢量化字图的轮廓进行分段,获取至少一个轮廓段;根据矢量曲线库对至少一个轮廓段中的曲线轮廓段进行矢量化;根据矢量化后的曲线轮廓段以及至少一个轮廓段中的直线轮廓段,确定字图的矢量化数据。本申请有效处理图像生成技术难以用于精品字库开发的尴尬局面,大幅增强图像到矢量数据的转换效果,提升字库开发制作的工作效率。
Description
技术领域
本发明涉及图像处理、计算机视觉及字库处理技术,尤其涉及一种字图的矢量化方法及装置。
背景技术
字库是书法与设计高度集成的商业艺术产品,随着社会的进步与文化水平的提高,目前字库在平面设计与广告宣传过程中作用举足轻重,各类字库产品也如雨后春笋般层出不穷。将文字与艺术结合,是弘扬中华文化、提升文化自信的重要途径。中文字库包含大量字符,以基础字符集(GB2312)为例,包含6763个字形各异的中文字符,与西文字库相比而言,中文字库的开发包含更多非艺术创作而是枯燥乏味的制作工作,开发周期过大且浪费大量人力物力。
目前诸多提升字库开发效率的方法被学术界和工业界探索。基于传统方法的笔画部件拼接复用方案,由于效果不佳且普适性差,无法应用到实际开发之中。随着人工智能的快速发展,生成对抗网络等方法被广泛引入到字库开发流程,人工设计部分字符,然后利用深度网络训练生成剩余字符。该方案在制作低质量要求的字库时基本实现自动化,而对于用于出版印刷及屏幕显示的高质量精品字库,这种方法仍然无法用于实际开发,因为该类方法均采用图像作为处理对象,虽然生成字形图像与原始字形字体风格完全一致,但欲生成商业字库必须经历矢量化步骤,精品字库的矢量数据由直线与曲线组成,不包含任何冗余点,且每条曲线端点位置设定都严格要求。
但是,若为每款字体专门设计矢量化算法,需要专业人士花费大量的研究与开发时间,通用的矢量化方法又无法满足特定精品字库矢量化的高质量要求,另外精品字库对于曲线的设计与端点位置的摆放都非常考究,通用矢量化方法无法解决上述问题。因此,现有的技术方案中字库的开发效率低。
发明内容
本申请提供一种字图的矢量化方法及装置,以解决现有技术中字库的开发效率低的问题。
本申请的第一方面提供一种字图的矢量化方法,包括:
提取待矢量化字图的轮廓;
从所述待矢量化字图的轮廓中确定出所述待矢量化字图的直线、所述待矢量化字图的曲线的平滑端点以及所述待矢量化字图的曲线的非平滑端点;
根据所述曲线的平滑端点和所述曲线的非平滑端点,对所述待矢量化字图的轮廓进行分段,获取至少一个轮廓段;
根据矢量曲线库对所述至少一个轮廓段中的曲线轮廓段进行矢量化;
根据矢量化后的曲线轮廓段以及所述至少一个轮廓段中的直线轮廓段,确定所述字图的矢量化数据。
在一种可选的实施方式中,所述从所述待矢量化字图的轮廓中确定出所述待矢量化字图的直线、所述待矢量化字图的曲线的平滑端点以及所述待矢量化字图的曲线的非平滑端点,包括:
将所述待矢量化字图的轮廓输入第一神经网络模型,并获取所述第一神经网络输出的所述待矢量化字图的直线,所述第一神经网络模型是通过标注有直线像素点的样本字图训练后生成的;
将所述待矢量化字图的轮廓输入第二神经网络模型,并获取所述第二神经网络输出的所述待矢量化字图的曲线的平滑端点,所述第二神经网络模型是通过标注有曲线的平滑端点像素点的样本字图训练后生成的;
将所述待矢量化字图的轮廓输入第三神经网络模型,并获取所述第三神经网络输出的所述待矢量化字图的曲线的非平滑端点,所述第三神经网络模型是通过标注有曲线的非平滑端点像素点的样本字图训练后生成的。
在一种可选的实施方式中,所述根据矢量曲线库对所述至少一个轮廓段中的曲线轮廓段进行矢量化,包括:
确定所述矢量曲线库中是否存在与所述曲线轮廓段匹配的矢量曲线;
若是,则使用所述与所述曲线轮廓段匹配的矢量曲线替换所述曲线轮廓段。
在一种可选的实施方式中,在所述确定所述矢量曲线库中是否存在与所述曲线轮廓段匹配的矢量曲线之后,所述方法还包括:
若否,则使用最小二乘法对所述曲线轮廓段进行拟合,获取所述曲线轮廓段的矢量化数据。
在一种可选的实施方式中,在所述根据矢量曲线库对所述至少一个轮廓段中的曲线轮廓段进行矢量化之前,所述方法还包括:
对样本字图的曲线进行聚类,获取矢量曲线库。
在一种可选的实施方式中,在所述确定所述字图的矢量化数据之后,所述方法还包括:
对所述字图的矢量化数据进行平滑处理。
本申请的第二方面提供一种字图的矢量化装置,所述装置包括:
提取模块,用于提取待矢量化字图的轮廓;
检测模块,用于从所述待矢量化字图的轮廓中确定出所述待矢量化字图的直线、所述待矢量化字图的曲线的平滑端点以及所述待矢量化字图的曲线的非平滑端点;
处理模块,用于根据所述曲线的平滑端点和所述曲线的非平滑端点,对所述待矢量化字图的轮廓进行分段,获取至少一个轮廓段;根据矢量曲线库对所述至少一个轮廓段中的曲线轮廓段进行矢量化;根据矢量化后的曲线轮廓段以及所述至少一个轮廓段中的直线轮廓段,确定所述字图的矢量化数据。
在一种可选的实施方式中,所述检测模块,还用于将所述待矢量化字图的轮廓输入第一神经网络模型,并获取所述第一神经网络输出的所述待矢量化字图的直线,所述第一神经网络模型是通过标注有直线像素点的样本字图训练后生成的;将所述待矢量化字图的轮廓输入第二神经网络模型,并获取所述第二神经网络输出的所述待矢量化字图的曲线的平滑端点,所述第二神经网络模型是通过标注有曲线的平滑端点像素点的样本字图训练后生成的;将所述待矢量化字图的轮廓输入第三神经网络模型,并获取所述第三神经网络输出的所述待矢量化字图的曲线的非平滑端点,所述第三神经网络模型是通过标注有曲线的非平滑端点像素点的样本字图训练后生成的。
在一种可选的实施方式中,所述处理模块,还用于确定所述矢量曲线库中是否存在与所述曲线轮廓段匹配的矢量曲线;若是,则使用所述与所述曲线轮廓段匹配的矢量曲线替换所述曲线轮廓段。
在一种可选的实施方式中,所述处理模块,还用于若否,则使用最小二乘法对所述曲线轮廓段进行拟合,获取所述曲线轮廓段的矢量化数据。
在一种可选的实施方式中,所述处理模块,还用于对样本字图的曲线进行聚类,获取矢量曲线库。
在一种可选的实施方式中,所述处理模块,还用于对所述字图的矢量化数据进行平滑处理。
本申请的第三方面提供一种电子设备,包括:
存储器与处理器;
所述存储器,用于存储所述处理器的可执行指令;
所述处理器配置为经由执行所述可执行指令来执行权利要求1-6任一所述的方法。
本申请的第四方面提供一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-6中任一项所述的方法。
本申请实施例提供的字图的矢量化方法及装置,首先提取待矢量化字图的轮廓,然后从待矢量化字图的轮廓中确定出待矢量化字图的直线、待矢量化字图的曲线的平滑端点以及待矢量化字图的曲线的非平滑端点,随后根据曲线的平滑端点和曲线的非平滑端点,对待矢量化字图的轮廓进行分段,获取至少一个轮廓段,根据矢量曲线库对至少一个轮廓段中的曲线轮廓段进行矢量化,最后根据矢量化后的曲线轮廓段以及至少一个轮廓段中的直线轮廓段,确定字图的矢量化数据。与现有技术相比,根据已有字形矢量数据,统计由图像到矢量结果的数据特征分布规律,然后分析待矢量化图像数据,并结合传统方法将图像数据转换为满足质量需求的矢量数据,将图像技术与字图矢量技术紧密结合,大幅提升精品字库字图的矢量效果,从而提高了字库的开发效率。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种矢量字形的直线曲线表示、平滑端点和非平滑端点的展示图;
图2a-2d为本申请实施例提供的一种矢量化方法处理精品字库对应的图像的效果对比图;
图3为本申请实施例提供的一种字图的矢量化方法的应用场景示意图;
图4为本申请实施例提供的一种字图的矢量化方法的流程示意图;
图5a-5c为本申请实施例提供一种如何训练生成第一神经网络模型、第二神经网络模型和第三神经网络模型的示意图;
图6为本申请实施例提供的一种矢量数据特征统计分析的组成示意图;
图7为本申请实施例提供的一种矢量数据特征分析中曲线库建立的示意图;
图8为本申请实施例提供的一种字图的矢量化方法的示意图;
图9为本申请实施例提供的另一种字图的矢量化方法的流程示意图;
图10为本申请实施例提供的一种对字图进行矢量化的示意图;
图11a-11e为本申请实施例提供的一种字图的矢量化的对比示意图;
图12为本申请提供的一种字图的矢量化装置的结构示意图;
图13为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
字库是书法与设计高度集成的商业艺术产品,中文字库的开发包含更多非艺术创作而是枯燥乏味的制作工作,开发周期过大且浪费大量人力物力。图1为本申请实施例提供的一种矢量字形的直线曲线表示、平滑端点和非平滑端点的展示图,如图1所示,粗实线为直线,细实线为贝塞尔曲线,圆形空心点为平滑端点,方形空心点为非平滑端点。图2a-2d为本申请实施例提供的一种矢量化方法处理精品字库对应的图像的效果对比图,其中图2a为原始字形图像,图2b为位图矢量化算法(Potrace)矢量化效果,图2c为本发明提供方法矢量化效果图,图2d为该字体已有矢量数据对应的矢量字形。
目前,学术界和工业界一直在探索提升字库开发效率的方法。随着人工智能的快速发展,生成对抗网络等方法被广泛引入到字库开发流程,该方案在制作低质量要求的字库时基本实现自动化,而对于用于出版印刷及屏幕显示的高质量精品字库,这种方法仍然无法用于实际开发。因为该类方法均采用图像作为处理对象,虽然生成字形图像与原始字形字体风格完全一致,但欲生成商业字库必须经历矢量化步骤,精品字库的矢量数据由直线与曲线组成,不包含任何冗余点,且每条曲线端点位置设定都严格要求,如图2d所示为该字体已有矢量数据对应的矢量字形。
但是,若为每款字体专门设计矢量化算法,需要专业人士花费大量的研究与开发时间,通用的矢量化方法又无法满足特定精品字库矢量化的高质量要求,尤其是无法处理曲线平滑端点的问题,如图1所示圆形空心点为平滑端点,在精品字库中,平滑位置可能是曲线端点,另外精品字库对于曲线的设计与端点位置的摆放都非常考究,通用矢量化方法无法解决上述问题。如图2所示为本申请实施例提供的一种矢量化方法处理精品字库对应的图像的效果对比图,其中图2a为原始字形图像,图2b为位图矢量化算法(Potrace)矢量化效果,图2d为该字体已有矢量数据对应的矢量字形。因此,现有的矢量化方法存在开发效率低的问题。
为解决上述问题,本申请实施例提供一种字图的矢量化方法及装置,以解决现有技术中字库的开发制作的效率低的问题。本申请的发明构思是:统计已有矢量字库数据,将待矢量化图像自动转换为与已有矢量字库质量相当的矢量数据,大幅提升精品字库字图的矢量效果,从而提高了字库的开发效率。
下面对本申请的应用场景进行说明。
图3为本申请实施例提供的一种字图的矢量化方法的应用场景示意图。如图3所示,包括:终端001、服务器002。终端001获取字形图像数据发送给服务器002,服务器002对字形图像数据进行处理和存储字库文件。
其中,终端可以是手机(mobile phone)、平板电脑(pad)、工业控制(industrialcontrol)中的无线终端、带无线收发功能的电脑、虚拟现实(virtual reality,VR)终端设备、增强现实(augmented reality,AR)终端设备、远程手术(remote medical surgery)中的无线终端、智能电网(smart grid)中的无线终端、智慧家庭(smart home)中的无线终端等。
本申请实施例中,用于实现终端的功能的装置可以是终端设备,也可以是能够支持终端实现该功能的装置,例如芯片系统,该装置可以被安装在终端设备中。本申请实施例中,芯片系统可以由芯片构成,也可以包括芯片和其他分立器件。
需要说明的是,本申请技术方案的应用场景可以是图3中的场景,但并不限于此,还可以应用于其他需要进行字图的矢量化的场景。
可以理解,上述字图的矢量化方法可以通过本申请实施例提供的字图的矢量化装置实现,字图的矢量化装置可以是某个设备的部分或全部,例如为上述终端设备或终端设备的芯片。
下面以具体地实施例对本申请实施例的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图4为本申请实施例提供的一种字图的矢量化方法的流程示意图,本实施例涉及的是字图矢量化的具体过程。本申请的执行主体为服务器。如图4所示,该方法包括:
S101、获取待矢量化字图的轮廓。
本申请实施例对于服务器获取待矢量化字图的方式不做限制,示例性的,可以获取待矢量化字图的图像,或者获取待矢量化字图的轮廓数据。
其中,待矢量化字图的轮廓根据已有字库的已有矢量字形数据的特征规律提取,字库矢量数据主要由贝塞尔曲线与直线组合而成,贝塞尔曲线由端点与控制点调节,直线由端点确定。因此矢量字形特征规律主要包括三个方面:直线与曲线端点位置、曲线控制点位置及直曲线的分类。
此外,轮廓的提取需要考虑轮廓点的顺时针与逆时针排列方向,以保证在转为字库的过程中不会产生渲染失败的问题。
本申请对于图像轮廓的提取的方法不做限制,示例性的,可以采用传统的索贝尔(Sobel operator,Sobel)算子、Canny算子、自定义滤波器及深度神经网络等方法。
其中,提取图像轮廓后,提取轮廓中的轮廓点(Contour)并进行序列化,得到有序的轮廓点序列(ContourPointSet)。
S102、从待矢量化字图的轮廓中确定出待矢量化字图的直线、待矢量化字图的曲线的平滑端点以及待矢量化字图的曲线的非平滑端点。
在本步骤中,当服务器获取待矢量化字图的轮廓后,从待矢量化字图的轮廓中确定出待矢量化字图的直线、待矢量化字图的曲线的平滑端点以及待矢量化字图的曲线的非平滑端点。
本申请提供的字图的矢量化方法主要包括两方面:基于已有字库的字形矢量数据特征统计及对新字形图像进行分析与矢量化。分析与矢量化根据字形矢量数据特征统计的字体特征对待矢量化字图进行处理。
其中,字形矢量数据特征统计的矢量数据特性包括直曲线、曲线端点及曲线控制点三个部分,其中曲线端点分为平滑端点与非平滑端点两类,如图1中空心圆形所示为平滑端点,空心正方形所示为非平滑端点,平滑端点在矢量化过程中需要维持曲线平滑性;曲线控制点为贝塞尔曲线特有参数,仅对非直线适用。
其中,待矢量化字图的直线、待矢量化字图的曲线的平滑端点以及待矢量化字图的曲线的非平滑端点是根据已有字库的已有矢量字形数据特征的统计结果确定的。
具体的,本申请在对待矢量化字图进行分析与矢量化之前,还通过对已有字库的字形矢量数据的字形特征规律进行统计,并且对已有的字形矢量数据进行训练生成对应的神经网络模型。
其中,本申请对于对已有的字形矢量数据训练的方式不做限制,示例性的,可以使用深度学习模型对数据进行训练。
在一种可选的实施方式中,将待矢量化字图的轮廓输入第一神经网络模型,并获取第一神经网络输出的待矢量化字图的直线,第一神经网络模型是通过标注有直线像素点的样本字图训练后生成的;将待矢量化字图的轮廓输入第二神经网络模型,并获取第二神经网络输出的待矢量化字图的曲线的平滑端点,第二神经网络模型是通过标注有曲线的平滑端点像素点的样本字图训练后生成的;将待矢量化字图的轮廓输入第三神经网络模型,并获取第三神经网络输出的待矢量化字图的曲线的非平滑端点,第三神经网络模型是通过标注有曲线的非平滑端点像素点的样本字图训练后生成的。
其中,样本字图是由已有字库的中的字图组成的。
下面将结合图5a-5c对如何生成第一神经网络模型、第二神经网络模型和第三神经网络模型的情况进行说明,图5a-5c为本申请实施例提供一种如何训练生成第一神经网络模型、第二神经网络模型和第三神经网络模型的示意图,其中,图5a为生成第一神经网络模型的示意图,图5b为生成第二神经网络模型的示意图,图5c为生成第三神经网络模型的示意图。
具体过程为,首先将已有矢量数据(OriVectorSet)渲染为图像(OriImageSet),标注图像中属于直线的像素点,得到直曲线训练数据(TrainSet_Line),然后利用深度神经网络进行训练,输入为字形图像,输出为像素分类结果,对应模型为第一神经网络模型(Model_Line),如图5a所示。然后,标注图像(OriImageSet)中属于平滑端点的像素点,得到平滑端点训练数据(TrainSet_Smooth),然后利用深度神经网络进行训练,输入为字形图像,输出为像素分类结果,对应模型为第二神经网络模型(Model_Smooth),如图5b所示。随后标注图像(OriImageSet)中属于非平滑端点的像素点,得到非平滑端点训练数据(TrainSet_Corner),然后利用深度神经网络进行训练,输入为字形图像,输出为像素分类结果,对应模型为第三神经网络模型(Model_Corner),如图5c所示。
示例性的,图6为本申请实施例提供的一种矢量数据特征统计分析的组成示意图,如图6所示,矢量数据特征统计包括直曲线检测、端点检测和矢量曲线库的建立,其中,端点检测包括平滑端点检测和非平滑端点检测两部分。通过对已有字库中的样本字图进行直曲线检测、端点检测训练生成对应的神经网络模型。
第一神经网络模型是通过对已有矢量数据统计分析字形中直线分布规律训练生成的。选取已有矢量数据(OriVectorSet)中的全集或子集字形(VectorSetTrain),将所有字形转换为字符图像,并根据矢量数据自动标注直线位置对应的像素点,得到直曲线检测训练数据(TrainSet_Line),如图5a所示。
其中,将该数据输入到直线检测模型进行训练,此处采用的为Unet网络,其它网络亦可。训练过程中进行平移、缩放及联通域随机丢失等增广方式,训练收敛得到第一神经网络模型(Model_Line)。
进一步的,端点检测是对已有矢量数据统计分析字形中曲线端点(即轮廓断裂点)的分布规律,包括平滑端点与非平滑端点。
第二神经网络模型的训练生成过程为,选取已有矢量数据(OriVectorSet)中的全集或子集字形(VectorSetTrain),将所有字形转换为字符图像,并根据矢量数据自动标注平滑端点位置对应的像素点,得到平滑端点检测训练数据(TrainSet_Smooth),如图5b所示。
其中,将该数据输入到平滑端点检测模型进行训练,此处采用的为Unet网络,其它网络亦可。训练过程中进行平移、缩放及联通域随机丢失等增广方式,训练收敛得到第二神经网络模型(Model_Smooth)。
第三神经网络模型的训练生成过程为,选取已有矢量数据(OriVectorSet)中的全集或子集字形(VectorSetTrain),将所有字形转换为字符图像,并根据矢量数据自动标注非平滑端点对应的像素点,得到非平滑端点检测训练数据(TrainSet_Corner),如图5c所示。
其中,将该数据输入到非平滑端点检测模型进行训练,此处采用的为Unet网络,其它网络亦可。训练过程中进行平移、缩放及联通域随机丢失等增广方式,训练收敛得到第三神经网络模型(Model_Corner)。
此外,在第一神经网络模型、第二神经网络模型和第三神经网络模型训练完成后,矢量数据特征统计还包括矢量曲线库的建立。图7为本申请实施例提供的一种矢量数据特征分析中矢量曲线库建立的示意图,如图7所示,对字库文件进行解析,提取已有字库矢量字形中的所有曲线,得到曲线数据,依据曲线端点相对位置建立矢量曲线库(CurveSet),这里的曲线可以为任意贝塞尔曲线类型。
S103、根据曲线的平滑端点和曲线的非平滑端点,对待矢量化字图的轮廓进行分段,获取至少一个轮廓段。
在本步骤中,当从待矢量化字图的轮廓中确定出待矢量化字图的直线、待矢量化字图的曲线的平滑端点以及待矢量化字图的曲线的非平滑端点后,根据曲线的平滑端点和曲线的非平滑端点,对待矢量化字图的轮廓进行分段,获取至少一个轮廓段。
具体的,根据平滑端点、非平滑端点和轮廓点序列将轮廓点切分为若干轮廓段。
S104、根据矢量曲线库对至少一个轮廓段中的曲线轮廓段进行矢量化。
在本步骤中,当根据曲线的平滑端点和曲线的非平滑端点,对待矢量化字图的轮廓进行分段,获取至少一个轮廓段后,根据矢量曲线库对至少一个轮廓段中的曲线轮廓段进行矢量化。
在一种可选的实施方式中,对样本字图的曲线进行聚类,获取矢量曲线库。
下面将结合图7对本申请中矢量曲线库的建立进行说明,如图7所示,分析获取字库文件中的所有曲线,然后将曲线进行聚类,得到特定字体风格特征的矢量曲线库(CurveSet)。可以理解为,矢量曲线库(CurveSet)是基于已有字库的字形矢量数据特征统计模块在统计矢量字形数据特征完成后分析获取字库文件中的所有曲线,然后将曲线进行聚类,得到的特定字体风格特征的矢量曲线库(CurveSet)。
其中,本申请对于曲线聚类的算法不做限制,可以根据具体情况进行说明。示例性的,可以采取K均值(K-Means)聚类算法、图团体检测算法等。
在一种可选的实施方式中,确定矢量曲线库中是否存在与曲线轮廓段匹配的矢量曲线;若是,则使用与曲线轮廓段匹配的矢量曲线替换曲线轮廓段;若否,则使用最小二乘法对曲线轮廓段进行拟合,获取曲线轮廓段的矢量化数据。
其中,根据聚类算法中提取的曲线特征确定矢量曲线库中是否存在与曲线轮廓段匹配的矢量曲线。
具体的,对轮廓段(ContourSegSet)中的每个轮廓段(ContourSegSet_i)进行分析,首先判断该轮廓段是否为直线,若为直线,则不需要进行拟合,直接连接轮廓段端点即可;否则首先利用轮廓点与矢量曲线库(CurveSet)中的曲线进行匹配,选择最优的贝塞尔曲线进行替换,得到初步矢量化数据(NewVectorSetPre)。
若矢量曲线库(CurveSet)中找不到合适的曲线,则利用最小二乘法对轮廓段进行拟合,得到初步矢量化数据(NewVectorSetPre)。
S105、根据矢量化后的曲线轮廓段以及至少一个轮廓段中的直线轮廓段,确定字图的矢量化数据。
在本步骤中,当根据矢量曲线库对至少一个轮廓段中的曲线轮廓段进行矢量化后,根据矢量化后的曲线轮廓段以及至少一个轮廓段中的直线轮廓段,确定字图的矢量化数据。
此外,在得到初步矢量化数据(NewVectorSetPre)后需要对字图的矢量化数据进行平滑处理。
具体的,调整平滑端点左右曲线不平滑的情况,整合平滑处理后的矢量数据。
在本申请中,将所有待矢量字图对应的矢量数据集合(NewVectorSet)写入字库文件。
其中,在字库制作过程中,图像大小设置为长宽相等。
本申请实施例提供的字图的矢量化方法,方法包括:首先提取待矢量化字图的轮廓,然后从待矢量化字图的轮廓中确定出待矢量化字图的直线、待矢量化字图的曲线的平滑端点以及待矢量化字图的曲线的非平滑端点,随后根据曲线的平滑端点和曲线的非平滑端点,对待矢量化字图的轮廓进行分段,获取至少一个轮廓段,根据矢量曲线库对至少一个轮廓段中的曲线轮廓段进行矢量化,最后根据矢量化后的曲线轮廓段以及至少一个轮廓段中的直线轮廓段,确定字图的矢量化数据。与现有技术相比,通过对已有字库矢量数据进行统计分析,然后自动处理具有相同字体风格的字形图像,所得矢量化效果完全基于当前字体风格,能够最大限度保证矢量数据的直曲线分类、端点与控制点摆放得合理性,大幅提升高质量精品字库在设计开发与字符集扩充的工作效率。
本申请提供一种字图的矢量化方法,包括矢量数据特征统计、字形图像分析矢量化两部分,图8为本申请实施例提供的一种字图的矢量化方法的示意图,如图8所示,根据原始矢量数据统计矢量特征,然后根据统计规律对待矢量化字图进行分析,得到与待矢量化对应的矢量数据结果。其中矢量数据特征统计根据原始矢量数据确定矢量数据的直曲线、端点及控制点的分布规律,包括直曲线检测、端点检测及矢量曲线库建立三方面。字形图像分析及矢量化首先提取待矢量化图像的轮廓点集合,并检测图像中的直线、平滑端点与非平滑端点,然后根据端点位置对轮廓点集合进行分段,继而对每个轮廓段进行曲线替换或拟合,最后将平滑端点位置对应的曲线进行平滑并写入字库文件。
在上述实施例的基础上,下面对字图的矢量化方法进行详细说明。图9为本申请实施例提供的另一种字图矢量化方法的流程示意图,如图9所示,该方法包括:
S201、获取待矢量化字图的轮廓。
在本步骤中,对于待矢量化字形图像(Image),提取其对应的图像轮廓(Image_Contour)。提取轮廓图像后,提取轮廓图像中的轮廓点(Contour)并进行序列化,得到有序的轮廓点序列(ContourPointSet)。
本申请对于图像轮廓的提取的方法不做限制,示例性的,可以采用传统的索贝尔(Sobel operator,Sobel)算子、Canny算子、自定义滤波器及深度神经网络等方法。
S202、从待矢量化字图的轮廓中确定出待矢量化字图的直线、待矢量化字图的曲线的平滑端点以及待矢量化字图的曲线的非平滑端点。
具体的,将待矢量化字形图像(Image)输入到第一神经网络模型(Model_Line),第二神经网络模型(Model_Smooth)和第三神经网络模型(Model_Corner)中,分别得到直线检测结果(Set_Line),平滑端点检测结果(Set_Smooth)及非平滑端点检测结果(Set_Corner)。
S203、根据曲线的平滑端点和曲线的非平滑端点,对待矢量化字图的轮廓进行分段,获取至少一个轮廓段。
具体的,平滑端点检测结果(Set_Smooth)和非平滑端点检测结果(Set_Corner)组成端点集合(EndingPointSet),根据端点集合(EndingPointSet)与轮廓点序列(ContourPointSet)将轮廓点切分为若干轮廓段,组成轮廓段集合(ContourSegSet)。
S204、确定矢量曲线库中是否存在与曲线轮廓段匹配的矢量曲线;若是,则使用与曲线轮廓段匹配的矢量曲线替换曲线轮廓段。
具体的,统计轮廓段集合(ContourSegSet)中每个轮廓段(ContourSeg_i)中所有轮廓点在直线检测结果(Set_line)中的比例,若整体比例大于阈值,则该轮廓段为直线,用经过端点的线段作为该轮廓段对应矢量直线;若整体比例不大于阈值,则该轮廓段为曲线,依据轮廓端点相对位置在矢量曲线库(CurveSet)中选取误差最小的曲线。
本申请对于阈值的设置不做限制,可以根据具体情况进行设置,示例性的,可以设置为0.5。
S205、若否,则使用最小二乘法对曲线轮廓段进行拟合,获取曲线轮廓段的矢量化数据
在本步骤中,当确定矢量曲线库中是否存在与曲线轮廓段匹配的矢量曲线后,用于若否,则使用最小二乘法对曲线轮廓段进行拟合,获取曲线轮廓段的矢量化数据。
具体的,若在矢量曲线库中找不到合适曲线,则直接用最小二乘法进行拟合。至此得到每个轮廓段(ContourSeg_i)对应的曲线(CurveSeg_i),将所有曲线连接闭合,得到待矢量化字形图像(Image)对应的矢量数据(CharVectorData)。
S206、根据矢量化后的曲线轮廓段以及至少一个轮廓段中的直线轮廓段,确定字图的矢量化数据。
S207、对矢量化数据进行平滑处理。
具体的,统计所有连接的曲线对,两条曲线的连接点为非平滑端点,则保持矢量字形不变;若两条曲线的连接点为平滑端点,则根据实际情况调整端点或控制点位置,保证该位置曲线平滑连接。
S208、将矢量数据写入字库文件。
图10为本申请实施例提供的一种对字图进行矢量化的示意图,如图10所示,字形图像分析及矢量化首先提取待矢量化图像的轮廓点集合,并检测图像中的直线、平滑端点与非平滑端点,然后根据端点位置对轮廓点集合进行分段,继而对每个轮廓段进行曲线替换或拟合,最后将平滑端点位置对应的曲线进行平滑并写入字库文件。
本申请实施例提供的字图的矢量化方法,通过统计已有矢量字库数据的特征规律,对与其风格相同的图像数据进行矢量化操作,最终的到与原始字库曲线端点规律一致的矢量字库文件,能够最大限度保证矢量数据的直曲线分类、端点与控制点摆放得合理性,大幅提升高质量精品字库在设计开发与字符集扩充的工作效率。
图11a-11e为本申请实施例提供的一种字图的矢量化的对比示意图,其中,图11a为风格迁移方法生成的字形图像,图11b为位图矢量化方法(Potrace)矢量化效果图,11c为本发明提供方法对字形图像进行矢量化的效果,图11d为矢量数据填充渲染的到的效果图,图11e为已有矢量数据的展示效果,图11中所有轮廓上的实心方块点表示直线或曲线的端点位置。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
本申请实施例还提供的一种字图的矢量化装置,图12为本申请提供的一种字图的矢量化装置的结构示意图,该字图的矢量化装置可以通过软件、硬件或者两者的结合实现。如图12所示,该字图的矢量化装置300包括:提取模块301、检测模块302和处理模块303。
提取模块301,用于提取待矢量化字图的轮廓;
检测模块302,用于从待矢量化字图的轮廓中确定出待矢量化字图的直线、待矢量化字图的曲线的平滑端点以及待矢量化字图的曲线的非平滑端点;
处理模块303,用于根据曲线的平滑端点和曲线的非平滑端点,对待矢量化字图的轮廓进行分段,获取至少一个轮廓段;根据矢量曲线库对至少一个轮廓段中的曲线轮廓段进行矢量化;根据矢量化后的曲线轮廓段以及至少一个轮廓段中的直线轮廓段,确定字图的矢量化数据。
在一种可选的实施方式中,检测模块302,还用于将待矢量化字图的轮廓输入第一神经网络模型,并获取第一神经网络输出的待矢量化字图的直线,第一神经网络模型是通过标注有直线像素点的样本字图训练后生成的;将待矢量化字图的轮廓输入第二神经网络模型,并获取第二神经网络输出的待矢量化字图的曲线的平滑端点,第二神经网络模型是通过标注有曲线的平滑端点像素点的样本字图训练后生成的;将待矢量化字图的轮廓输入第三神经网络模型,并获取第三神经网络输出的待矢量化字图的曲线的非平滑端点,第三神经网络模型是通过标注有曲线的非平滑端点像素点的样本字图训练后生成的。
在一种可选的实施方式中,处理模块303,还用于确定矢量曲线库中是否存在与曲线轮廓段匹配的矢量曲线;若是,则使用与曲线轮廓段匹配的矢量曲线替换曲线轮廓段。
在一种可选的实施方式中,处理模块303,还用于若否,则使用最小二乘法对曲线轮廓段进行拟合,获取曲线轮廓段的矢量化数据。
在一种可选的实施方式中,处理模块303,还用于对样本字图的曲线进行聚类,获取矢量曲线库。
在一种可选的实施方式中,处理模块303,还用于对字图的矢量化数据进行平滑处理。
需要说明的,本申请实施例提供的字图的矢量化装置,可用于执行上述任意实施例所提供的方法,具体实现方式和技术效果类似,这里不再进行赘述。
图13为本申请实施例提供的一种电子设备的结构示意图。如图13所示,该电子设备可以包括:至少一个处理器401和存储器402。图13示出的是以一个处理器为例的电子设备。
存储器402,用于存放程序。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。
存储器402可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
处理器401用于执行存储器402存储的计算机执行指令,以实现上述字图的矢量化方法;
其中,处理器401可能是一个中央处理器(Central Processing Unit,简称为CPU),或者是特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路。
可选的,在具体实现上,如果通信接口、存储器402和处理器401独立实现,则通信接口、存储器402和处理器401可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(Industry Standard Architecture,简称为ISA)总线、外部设备互连(Peripheral Component,简称为PCI)总线或扩展工业标准体系结构(Extended IndustryStandard Architecture,简称为EISA)总线等。总线可以分为地址总线、数据总线、控制总线等,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果通信接口、存储器402和处理器401集成在一块芯片上实现,则通信接口、存储器402和处理器401可以通过内部接口完成通信。
本申请实施例还提供了一种芯片,包括处理器和接口。其中接口用于输入输出处理器所处理的数据或指令。处理器用于执行以上方法实施例中提供的方法。该芯片可以应用于字图的矢量化装置中。
本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁盘或者光盘等各种可以存储程序代码的介质,具体的,该计算机可读存储介质中存储有程序信息,程序信息用于上述字图的矢量化方法。
本申请实施例还提供一种程序,该程序在被处理器执行时用于执行以上方法实施例提供的字图的矢量化方法。
本申请实施例还提供一种程序产品,例如计算机可读存储介质,该程序产品中存储有指令,当其在计算机上运行时,使得计算机执行上述方法实施例提供的字图的矢量化方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本发明实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (12)
1.一种字图的矢量化方法,其特征在于,所述方法包括:
提取待矢量化字图的轮廓;
从所述待矢量化字图的轮廓中确定出所述待矢量化字图的直线、所述待矢量化字图的曲线的平滑端点以及所述待矢量化字图的曲线的非平滑端点;
根据所述曲线的平滑端点和所述曲线的非平滑端点,对所述待矢量化字图的轮廓进行分段,获取至少一个轮廓段;
根据矢量曲线库对所述至少一个轮廓段中的曲线轮廓段进行矢量化;
根据矢量化后的曲线轮廓段以及所述至少一个轮廓段中的直线轮廓段,确定所述字图的矢量化数据;
所述从所述待矢量化字图的轮廓中确定出所述待矢量化字图的直线、所述待矢量化字图的曲线的平滑端点以及所述待矢量化字图的曲线的非平滑端点,包括:
将所述待矢量化字图的轮廓输入第一神经网络模型,并获取所述第一神经网络输出的所述待矢量化字图的直线,所述第一神经网络模型是通过标注有直线像素点的样本字图训练后生成的;
将所述待矢量化字图的轮廓输入第二神经网络模型,并获取所述第二神经网络输出的所述待矢量化字图的曲线的平滑端点,所述第二神经网络模型是通过标注有曲线的平滑端点像素点的样本字图训练后生成的;
将所述待矢量化字图的轮廓输入第三神经网络模型,并获取所述第三神经网络输出的所述待矢量化字图的曲线的非平滑端点,所述第三神经网络模型是通过标注有曲线的非平滑端点像素点的样本字图训练后生成的。
2.根据权利要求1所述的方法,其特征在于,所述根据矢量曲线库对所述至少一个轮廓段中的曲线轮廓段进行矢量化,包括:
确定所述矢量曲线库中是否存在与所述曲线轮廓段匹配的矢量曲线;
若是,则使用所述与所述曲线轮廓段匹配的矢量曲线替换所述曲线轮廓段。
3.根据权利要求2所述的方法,其特征在于,在所述确定所述矢量曲线库中是否存在与所述曲线轮廓段匹配的矢量曲线之后,所述方法还包括:
若否,则使用最小二乘法对所述曲线轮廓段进行拟合,获取所述曲线轮廓段的矢量化数据。
4.根据权利要求1-3任一项所述的方法,其特征在于,在所述根据矢量曲线库对所述至少一个轮廓段中的曲线轮廓段进行矢量化之前,所述方法还包括:
对样本字图的曲线进行聚类,获取矢量曲线库。
5.根据权利要求1-3任一项所述的方法,其特征在于,在所述确定所述字图的矢量化数据之后,所述方法还包括:
对所述字图的矢量化数据进行平滑处理。
6.一种字图的矢量化装置,其特征在于,所述装置包括:
提取模块,用于提取待矢量化字图的轮廓;
检测模块,用于从所述待矢量化字图的轮廓中确定出所述待矢量化字图的直线、所述待矢量化字图的曲线的平滑端点以及所述待矢量化字图的曲线的非平滑端点;
处理模块,用于根据所述曲线的平滑端点和所述曲线的非平滑端点,对所述待矢量化字图的轮廓进行分段,获取至少一个轮廓段;根据矢量曲线库对所述至少一个轮廓段中的曲线轮廓段进行矢量化;根据矢量化后的曲线轮廓段以及所述至少一个轮廓段中的直线轮廓段,确定所述字图的矢量化数据;
所述检测模块,还用于将所述待矢量化字图的轮廓输入第一神经网络模型,并获取所述第一神经网络输出的所述待矢量化字图的直线,所述第一神经网络模型是通过标注有直线像素点的样本字图训练后生成的;将所述待矢量化字图的轮廓输入第二神经网络模型,并获取所述第二神经网络输出的所述待矢量化字图的曲线的平滑端点,所述第二神经网络模型是通过标注有曲线的平滑端点像素点的样本字图训练后生成的;将所述待矢量化字图的轮廓输入第三神经网络模型,并获取所述第三神经网络输出的所述待矢量化字图的曲线的非平滑端点,所述第三神经网络模型是通过标注有曲线的非平滑端点像素点的样本字图训练后生成的。
7.根据权利要求6所述的装置,其特征在于,所述处理模块,还用于确定所述矢量曲线库中是否存在与所述曲线轮廓段匹配的矢量曲线;若是,则使用所述与所述曲线轮廓段匹配的矢量曲线替换所述曲线轮廓段。
8.根据权利要求7所述的装置,其特征在于,所述处理模块,还用于若否,则使用最小二乘法对所述曲线轮廓段进行拟合,获取所述曲线轮廓段的矢量化数据。
9.根据权利要求6-8任一项所述的装置,其特征在于,所述处理模块,还用于对样本字图的曲线进行聚类,获取矢量曲线库。
10.根据权利要求6-8任一项所述的装置,其特征在于,所述处理模块,还用于对所述字图的矢量化数据进行平滑处理。
11.一种电子设备,其特征在于,包括:存储器与处理器;
所述存储器,用于存储所述处理器的可执行指令;
所述处理器配置为经由执行所述可执行指令来执行权利要求1-5任一所述的方法。
12.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011245375.6A CN112347288B (zh) | 2020-11-10 | 2020-11-10 | 一种字图的矢量化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011245375.6A CN112347288B (zh) | 2020-11-10 | 2020-11-10 | 一种字图的矢量化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112347288A CN112347288A (zh) | 2021-02-09 |
CN112347288B true CN112347288B (zh) | 2024-02-20 |
Family
ID=74362557
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011245375.6A Active CN112347288B (zh) | 2020-11-10 | 2020-11-10 | 一种字图的矢量化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112347288B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113658294B (zh) * | 2021-08-11 | 2023-08-01 | 维沃移动通信有限公司 | 图像处理方法、装置及存储介质 |
CN113705576B (zh) * | 2021-11-01 | 2022-03-25 | 江西中业智能科技有限公司 | 一种文本识别方法、装置、可读存储介质及设备 |
CN114820938A (zh) * | 2022-04-24 | 2022-07-29 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种元宇宙场景素材的建模方法及相关装置 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6992671B1 (en) * | 1999-12-09 | 2006-01-31 | Monotype Imaging, Inc. | Method and apparatus for compressing Bezier descriptions of letterforms in outline fonts using vector quantization techniques |
CN101082836A (zh) * | 2007-06-29 | 2007-12-05 | 华中科技大学 | 一种整合语音输入和手写输入功能的汉字输入系统 |
CN101197996A (zh) * | 2007-12-27 | 2008-06-11 | 广东拓思软件科学园有限公司 | 边缘矢量化与立方卷积相结合的数字图像插值放大方法 |
CN101894370A (zh) * | 2010-07-14 | 2010-11-24 | 苏州大学 | 具有形状参数自适应的甲骨文轮廓字形自动生成方法 |
CN102289349A (zh) * | 2011-07-15 | 2011-12-21 | 齐凡 | 中文手写字库制作方法 |
CN102881033A (zh) * | 2012-08-06 | 2013-01-16 | 孙计良 | 自适应曲线的生成方法及装置 |
CN103488711A (zh) * | 2013-09-09 | 2014-01-01 | 北京大学 | 一种快速制作矢量字库的方法及系统 |
CN103942552A (zh) * | 2014-02-11 | 2014-07-23 | 北京大学 | 一种基于骨架指导的文字图像矢量化方法及系统 |
CN105808665A (zh) * | 2015-12-17 | 2016-07-27 | 北京航空航天大学 | 一种新的基于手绘草图的图像检索方法 |
CN108062782A (zh) * | 2018-01-30 | 2018-05-22 | 哈尔滨福特威尔科技有限公司 | 一种鞋楦平面轮廓线自动生成装置及方法 |
CN108875720A (zh) * | 2017-05-12 | 2018-11-23 | 北大方正集团有限公司 | 矢量字体的骨架线提取方法及装置 |
CN109408826A (zh) * | 2018-11-07 | 2019-03-01 | 北京锐安科技有限公司 | 一种文本信息提取方法、装置、服务器及存储介质 |
CN109558624A (zh) * | 2017-09-26 | 2019-04-02 | 达索系统公司 | 生成代表机械部件的2d绘图 |
CN110009721A (zh) * | 2018-01-04 | 2019-07-12 | 奥多比公司 | 生成由曲线表示的图像的三角网格 |
CN110956678A (zh) * | 2019-12-16 | 2020-04-03 | 北大方正集团有限公司 | 字形的处理方法和装置 |
CN111462023A (zh) * | 2020-03-31 | 2020-07-28 | 上海大学 | 一种图像纹理线条矢量化系统和方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130227500A1 (en) * | 2009-03-31 | 2013-08-29 | Mentor Graphics Corporation | Calculation System For Inverse Masks |
US8538737B2 (en) * | 2010-09-17 | 2013-09-17 | Adobe Systems Incorporated | Curve editing with physical simulation of mass points and spring forces |
-
2020
- 2020-11-10 CN CN202011245375.6A patent/CN112347288B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6992671B1 (en) * | 1999-12-09 | 2006-01-31 | Monotype Imaging, Inc. | Method and apparatus for compressing Bezier descriptions of letterforms in outline fonts using vector quantization techniques |
CN101082836A (zh) * | 2007-06-29 | 2007-12-05 | 华中科技大学 | 一种整合语音输入和手写输入功能的汉字输入系统 |
CN101197996A (zh) * | 2007-12-27 | 2008-06-11 | 广东拓思软件科学园有限公司 | 边缘矢量化与立方卷积相结合的数字图像插值放大方法 |
CN101894370A (zh) * | 2010-07-14 | 2010-11-24 | 苏州大学 | 具有形状参数自适应的甲骨文轮廓字形自动生成方法 |
CN102289349A (zh) * | 2011-07-15 | 2011-12-21 | 齐凡 | 中文手写字库制作方法 |
CN102881033A (zh) * | 2012-08-06 | 2013-01-16 | 孙计良 | 自适应曲线的生成方法及装置 |
CN103488711A (zh) * | 2013-09-09 | 2014-01-01 | 北京大学 | 一种快速制作矢量字库的方法及系统 |
CN103942552A (zh) * | 2014-02-11 | 2014-07-23 | 北京大学 | 一种基于骨架指导的文字图像矢量化方法及系统 |
CN105808665A (zh) * | 2015-12-17 | 2016-07-27 | 北京航空航天大学 | 一种新的基于手绘草图的图像检索方法 |
CN108875720A (zh) * | 2017-05-12 | 2018-11-23 | 北大方正集团有限公司 | 矢量字体的骨架线提取方法及装置 |
CN109558624A (zh) * | 2017-09-26 | 2019-04-02 | 达索系统公司 | 生成代表机械部件的2d绘图 |
CN110009721A (zh) * | 2018-01-04 | 2019-07-12 | 奥多比公司 | 生成由曲线表示的图像的三角网格 |
CN108062782A (zh) * | 2018-01-30 | 2018-05-22 | 哈尔滨福特威尔科技有限公司 | 一种鞋楦平面轮廓线自动生成装置及方法 |
CN109408826A (zh) * | 2018-11-07 | 2019-03-01 | 北京锐安科技有限公司 | 一种文本信息提取方法、装置、服务器及存储介质 |
CN110956678A (zh) * | 2019-12-16 | 2020-04-03 | 北大方正集团有限公司 | 字形的处理方法和装置 |
CN111462023A (zh) * | 2020-03-31 | 2020-07-28 | 上海大学 | 一种图像纹理线条矢量化系统和方法 |
Non-Patent Citations (5)
Title |
---|
一种改进的边界轮廓矢量化算法;付丽琴,陈树越;测试技术学报(第04期);1-4页 * |
地图要素识别与提取研究现状;辛动军;史迎春;;中州大学学报(第04期);全文 * |
基于轮廓拟合的新风格书法字合成;石雷;韩德志;章夏芬;毕坤;;计算机应用与软件(第06期);全文 * |
石雷 ; 韩德志 ; 章夏芬 ; 毕坤 ; .基于轮廓拟合的新风格书法字合成.计算机应用与软件.2017,(第06期),全文. * |
辛动军 ; 史迎春 ; .地图要素识别与提取研究现状.中州大学学报.2009,(第04期),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN112347288A (zh) | 2021-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112347288B (zh) | 一种字图的矢量化方法 | |
CN109117713B (zh) | 一种全卷积神经网络的图纸版面分析与文字识别方法 | |
CN107610200B (zh) | 一种基于特征模板的字库快速生成方法 | |
CN107679466B (zh) | 信息输出方法和装置 | |
CN112580623A (zh) | 图像生成方法、模型训练方法、相关装置及电子设备 | |
CN114187633B (zh) | 图像处理方法及装置、图像生成模型的训练方法及装置 | |
AU2006252019A1 (en) | Method and Apparatus for Dynamic Connector Analysis | |
US8670615B2 (en) | Refinement of segmentation markup | |
CN110704649B (zh) | 一种用于构建流量图像数据集的方法及系统 | |
WO2024041032A1 (zh) | 基于不可编辑的图文类图像生成可编辑文档的方法及装置 | |
US11816908B2 (en) | Method of generating font database, and method of training neural network model | |
CN109409211B (zh) | 汉字骨架笔段的处理方法、处理装置及存储介质 | |
CN108241861A (zh) | 一种数据可视化方法及设备 | |
CN112308946A (zh) | 题目生成方法、装置、电子设备及可读存储介质 | |
WO2013097072A1 (zh) | 识别视频的字符的方法和装置 | |
CN115620321A (zh) | 表格识别方法及装置、电子设备和存储介质 | |
CN112395834A (zh) | 基于图片输入的脑图生成方法、装置、设备及存储介质 | |
CN109325483B (zh) | 内部短笔段的处理方法和装置 | |
CN113553428B (zh) | 文档分类方法、装置及电子设备 | |
CN114399782B (zh) | 文本图像处理方法、装置、设备、存储介质及程序产品 | |
WO2023284670A1 (zh) | 图形码提取模型构建方法、识别方法、装置、设备和介质 | |
CN116541912A (zh) | 一种基于cad图像识别生成接线图的方法及装置 | |
KR20230083971A (ko) | 이미지 내에 포함된 텍스트를 번역하고 편집하는 방법 및 이를 수행하는 장치 | |
CN113903071A (zh) | 人脸识别方法、装置、电子设备和存储介质 | |
CN112529988A (zh) | 一种头像的生成方法、装置、电子设备、介质及产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |