CN110196917B - 个性化logo版式定制方法、系统和存储介质 - Google Patents
个性化logo版式定制方法、系统和存储介质 Download PDFInfo
- Publication number
- CN110196917B CN110196917B CN201910461417.0A CN201910461417A CN110196917B CN 110196917 B CN110196917 B CN 110196917B CN 201910461417 A CN201910461417 A CN 201910461417A CN 110196917 B CN110196917 B CN 110196917B
- Authority
- CN
- China
- Prior art keywords
- logo
- logo image
- layout
- character
- extracting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/5866—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/63—Scene text, e.g. street names
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Library & Information Science (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明提供一种个性化LOGO版式定制方法、系统和存储介质。该个性化LOGO版式定制方法包括:LOGO图像获取步骤,其获取不同行业的多个品牌的LOGO图像;LOGO图像存储步骤,为每个LOGO图像分配版式ID,并将每个LOGO图像及其对应的版式ID和所属行业存储在数据库中;版式信息分析和提取步骤,其自动分析和提取LOGO图像的版式信息;版式参数存储步骤,将所提取的版式信息与对应的LOGO图像进行关联并作为版式参数存入数据库;版式应用步骤,其在生成LOGO时,基于用户输入的信息在数据库中调用相应的版式参数,并应用版式参数所定义的版式来生成LOGO。该个性化LOGO版式定制方法、系统和存储介质能够提供更多种类、更加丰富的LOGO板式选择,并且更加贴合用户的个性化定制需求。
Description
技术领域
本发明涉及LOGO设计领域,特别涉及一种个性化LOGO版式定制方法、系统和存储介质。
背景技术
LOGO(商标)作为一种识别和传达信息的视觉图形,体现着品牌的特点和企业的形象。聘请人工设计师进行LOGO设计需要企业投入大量的金钱和时间,因此,操作简单、耗时很短的在线智能LOGO设计产品应运而生。
然而,现有的智能LOGO设计产品在生成LOGO时,图标和文字大多都是随机组合,没有一定的规律和风格,不同元素间的搭配组合存在一定的不和谐性。现有产品生成的LOGO的图标的大小和文字的大小搭配不恰当,无法满足不同行业客户的具体需求。现有产品能够生成的LOGO的风格种类过少,样式太过单调,无法满足客户个性化LOGO生成的需求。另外,现有产品的LOGO版式固定单一,没有依据客户喜好选配最合适的搭配方案。因此,亟需一种能够根据用户的需求来定制个性化LOGO板式的方法。
发明内容
本发明的主要目的在于提出了一种个性化LOGO版式定制方法、系统和存储介质,其克服了以上技术问题。
根据本发明的一个方面,提供了一种个性化LOGO版式定制方法,其特征在于,所述个性化LOGO版式定制方法包括:LOGO图像获取步骤,其获取不同行业的多个品牌的LOGO图像;LOGO图像存储步骤,为每个LOGO图像分配版式ID,并将每个LOGO图像及其对应的版式ID和所属行业存储在数据库中;版式信息分析和提取步骤,其自动分析和提取所述LOGO图像的版式信息;版式参数存储步骤,将所提取的版式信息与对应的LOGO图像进行关联并作为版式参数存入数据库;版式应用步骤,其在生成LOGO时,基于用户输入的信息在数据库中调用相应的版式参数,并应用所述版式参数所定义的版式来生成LOGO。
进一步地,所述LOGO图像的版式信息包括:所述LOGO图像中的图标的位置和大小信息、所述LOGO图像中的文字的位置和大小信息以及所述文字的字体。
进一步地,自动分析和提取所述LOGO图像的版式信息包括:对所述LOGO图像进行预处理;通过K-means聚类算法和连通域分析从经预处理的LOGO图像中提取待识别的文字目标区块;利用CTPN对文字目标区块进行二次验证并提取文字的位置和大小信息;利用CRNN提取所述LOGO图像中的文字的特征并利用hash值比对来识别所述文字的字体;通过OpenCV将所述LOGO图像中的文字替换成与周围背景一样的颜色,并通过OpenCV提取图标的位置和大小信息。
进一步地,对所述LOGO图像进行预处理包括:对所述LOGO图像进行灰度化处理;对经灰度化处理的LOGO图像进行去躁处理;对经去躁处理的LOGO图像进行二值化处理;对经二值化处理的LOGO图像进行边缘检测。
进一步地,通过K-means聚类算法和连通域分析从经预处理的LOGO图像中提取待识别的文字目标区块包括:步骤S1321:确定聚类数量K,其中K为大于1的正整数;步骤S1322:在经预处理的LOGO图像的像素中随机选取K个像素作为聚类中心;步骤S1323:计算每个像素到每个聚类中心的欧式距离,并将每个像素划归到距其最近的聚类中心所在的聚类;步骤S1324:计算并更新每个聚类的聚类中心;步骤S1325:重复步骤S1323和步骤S1324,直到聚类中心不再发生变化,从而获得最终的聚类结果;步骤S1326:对所述聚类结果进行连通域分析,以确定文字目标区块。
进一步地,利用CTPN对文字目标区块进行二次验证并提取文字的位置和大小信息包括:通过VGG16卷积神经网络提取所述LOGO图像前五个卷积层的特征图;用滑动窗口提取所述特征图的特征;将所述特征输入到双向LSTM中以得到双向LSTM的输出结果;将双向LSTM的输出结果输入到全连接层,并将所得到的全连接层特征输入到分类或回归层,从而预测目标待选区域;通过文本构造算法,将所述目标待选区域合并成文本序列框;将所述文本序列框与所述文字目标区块进行比较,如果相同则提取所述文本序列框中的文字的位置和大小信息,如果不同则作为异常处理。
进一步地,利用CRNN提取所述LOGO图像中的文字的特征并利用hash值比对来识别所述文字的字体包括:获取字体文件集,生成多个字体图片;通过卷积神经网络提取所述字体图片的特征,得到特征向量序列;将所述特征向量序列输入到双向LSTM中,生成标签序列,标签序列中的每个标签表示字体;根据所提取出的文字的位置和大小信息,计算所述LOGO图像中每个文字的宽度,对文字进行二维映射,并截取其中一个待识别文字的轮廓图片;利用CRNN识别该待识别文字的轮廓图片中的文字并计算该文字的hash值,即第一hash值;将每个字体图片转换成与所述待识别文字的轮廓图片大小相同的图片,并计算每个转换后的字体图片的hash值,即第二hash值;将所述第一hash值与每个所述第二hash值进行比对,在hash值相等的情况下识别出该待识别文字的字体。
进一步地,所述版式应用步骤包括:基于用户输入的行业分类和标题数量在数据库中进行检索,返回行业匹配并具有对应标题数量的多个品牌的LOGO图像作为供用户选择的版式;根据用户选择的版式从数据库中检索该版式的版式参数;根据用户输入的行业分类和标题在图标数据库中检索匹配的图标;将所述版式参数应用到所述标题和所述图标以生成LOGO。
根据本发明的另一方面,提供了一种个性化LOGO版式定制系统,所述个性化LOGO版式定制系统包括:LOGO图像获取装置,其获取不同行业的多个品牌的LOGO图像;LOGO图像存储装置,为每个LOGO图像分配版式ID,并将每个LOGO图像及其对应的版式ID和所属行业存储在数据库中;版式信息分析和提取装置,其自动分析和提取所述LOGO图像的版式信息;版式参数存储装置,将所提取的版式信息与对应的LOGO图像进行关联并作为版式参数存入数据库;版式应用装置,其在生成LOGO时,基于用户输入的信息在数据库中调用相应的版式参数,并应用所述版式参数所定义的版式来生成LOGO。
根据本发明的再一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序能够被一个或者多个处理器执行,以实现上述的个性化LOGO版式定制方法。
根据本发明的个性化LOGO版式定制方法、系统和存储介质能够提供更多种类、更加丰富的LOGO板式选择,并且更加贴合用户的个性化定制需求。
通过以下结合附图对本发明的最佳实施例的详细说明,本发明的这些以及其他优点将更加明显。
附图说明
接下来将参照由所附附图所显示的本发明的某些示例性实施方案来详细地描述本发明的以上及其它特征,这些附图在下文中仅以说明的方式给出,因而对本发明是非限定性的,在这些附图中:
图1示出了根据本发明第一实施例的个性化LOGO版式定制方法的流程图。
图2示出了版式信息分析和提取步骤的一种具体实施方案的流程图。
图3示出了对所获取的LOGO图像进行预处理的一种具体实施方案的流程图。
图4示出了通过K-means聚类算法和连通域分析从经预处理的LOGO图像中提取待识别的文字目标区块的一种具体实施方案的流程图。
图5示出了利用CTPN对文字目标区块进行二次验证并提取文字的位置和大小信息的一种具体实施方案的流程图。
图6示出了版式应用步骤的一种具体实施方案的流程图。
图7示出了根据本发明第二实施例的个性化LOGO版式定制系统的示意性框图。
应当了解,附图并不必须是按比例的,其对说明本发明的基本原理的各种优选特征呈现了经过简化的表达。本文所公开的本发明的具体设计特征包括例如具体尺寸、方向、位置和外形将部分地由具体所要应用和使用的环境来确定。
在这些图中,贯穿附图的多幅图,相同的附图标记指代本发明的相同或等同的部分。
具体实施方式
为了便于理解本发明,下面通过具体实施例对本发明的实施过程进行详细的描述。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
在上下文中所称“计算机设备”,也称为“电脑”,是指可以通过运行预定程序或指令来执行数值计算和/或逻辑计算等预定处理过程的智能电子设备,其可以包括处理器与存储器,由处理器执行在存储器中预存的存续指令来执行预定处理过程,或是由ASIC、FPGA、DSP等硬件执行预定处理过程,或是由上述二者组合来实现。计算机设备包括但不限于服务器、个人电脑、笔记本电脑、平板电脑、智能手机等。
所述计算机设备包括用户设备与网络设备。其中,所述用户设备包括但不限于电脑、智能手机、PDA等;所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,所述计算机设备可单独运行来实现本发明,也可接入网络并通过与网络中的其他计算机设备的交互操作来实现本发明。其中,所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。
需要说明的是,所述用户设备、网络设备和网络等仅为举例,其他现有的或今后可能出现的计算机设备或网络如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
后面所讨论的方法(其中一些通过流程图示出)可以通过硬件、软件、固件、中间件、微代码、硬件描述语言或者其任意组合来实施。当用软件、固件、中间件或微代码来实施时,用以实施必要任务的程序代码或代码段可以被存储在机器或计算机可读介质(比如存储介质)中。处理器可以实施必要的任务。
这里所公开的具体结构和功能细节仅仅是代表性的,并且是用于描述本发明的示例性实施例的目的。但是本发明可以通过许多替换形式来具体实现,并且不应当被解释成仅仅受限于这里所阐述的实施例。
应当理解的是,虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元,但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元进行区分。举例来说,在不背离示例性实施例的范围的情况下,第一单元可以被称为第二单元,并且类似地第二单元可以被称为第一单元。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。
还应当提到的是,在一些替换实现方式中,所提到的功能/动作可以按照不同于附图中标示的顺序发生。举例来说,取决于所涉及的功能/动作,相继示出的两幅图实际上可以基本上同时执行或者有时可以按照相反的顺序来执行。
图1示出了根据本发明第一实施例的个性化LOGO版式定制方法的流程图。如图1所示,该个性化LOGO版式定制方法包括:LOGO图像获取步骤S110,其获取不同行业的多个品牌的LOGO图像;LOGO图像存储步骤S120,其为每个LOGO图像分配版式ID,并将每个LOGO图像及其对应的版式ID和所属行业存储在数据库中;版式信息分析和提取步骤S130,其自动分析和提取所述LOGO图像的版式信息;版式参数存储步骤S140,将所提取的版式信息与对应的LOGO图像进行关联并作为版式参数存入数据库;版式应用步骤S150,其在生成LOGO时,基于用户输入的信息在数据库中调用相应的版式参数,并应用所述版式参数所定义的版式来生成LOGO。
LOGO版式是指LOGO的排版方式。LOGO版式中可以限定LOGO中的图标和文字的位置、大小等。在本发明中,LOGO图像的版式信息包括LOGO图像中的图标的位置和大小信息、LOGO图像中的文字的位置和大小信息以及文字的字体等。
本发明的LOGO版式自动生成方法,通过自动识别、提取和存储优秀品牌的LOGO版式,能够丰富自己的版式库,通过在生成LOGO时调用这些版式,能够增加生成LOGO时的样式,提供更多美观合理的组合。另外,本发明根据用户输入的信息来调用合适的版式,因此能够满足客户的具体需求和喜好,实现个性化版式定制。
下面具体描述根据本发明的LOGO版式自动生成方法的各个步骤。
在LOGO图像获取步骤S110中,可以利用诸如scrapy等工具自动获取不同行业的多个品牌的LOGO图像,例如不同行业的前500名知名品牌的LOGO图像。
在LOGO图像存储步骤S120中,为每个所获取的LOGO图像分配版式ID,并将每个LOGO图像及其对应的版式ID和所属行业存储在数据库中。
在版式信息分析和提取步骤S130中,自动分析和提取所获取的LOGO图像的版式信息。图2示出了版式信息分析和提取步骤S130的一种具体实施方案,在该实施方案中,版式信息分析和提取步骤S130包括以下子步骤:
S131:对所获取的LOGO图像进行预处理;
S132:通过K-means聚类算法和连通域分析从经预处理的LOGO图像中提取待识别的文字目标区块;
S133:利用CTPN对文字目标区块进行二次验证并提取文字的位置和大小信息;
S134:利用CRNN提取LOGO图像中的文字的特征并利用hash值比对来识别文字的字体;
S135:通过OpenCV将所述LOGO图像中的文字替换成与周围背景一样的颜色,并通过OpenCV提取图标的位置和大小信息。
在步骤S131中对所获取的LOGO图像进行预处理的主要目的是消除图像中无关的信息,恢复有用的真实信息,增强有关信息的可检测性和最大限度地简化数据,从而改进图像分割、匹配和识别的可靠性。
图3示出了对所获取的LOGO图像进行预处理(子步骤S131)的一种具体实施方案。在该实施方案中,对所获取的LOGO图像进行预处理(子步骤S131)包括:
S1311:对所获取的LOGO图像进行灰度化处理;
S1312:对经灰度化处理的LOGO图像进行去躁处理;
S1313:对经去躁处理的LOGO图像进行二值化处理;
S1314:对经二值化处理的LOGO图像进行边缘检测。
在S1311中,灰度化处理将彩色LOGO图像转换为仅包含像素亮度信息的灰度图像。灰度化处理可采用现有技术中的公知方法来实现,在此不再赘述。
在S1312中,去躁处理将LOGO图像中的噪声去除。优选地,可以采用平均滤波法和中位值滤波法等滤波方式去除LOGO图像像素中的噪声(例如背景冗余信息和其他噪声)。
在S1313中,二值化处理将灰度图像转化为二值图像(黑白图像)。对LOGO图像进行二值化处理的目的是将LOGO图像中的目标与前景分开。在本发明中,优选通过局部最优阈值分离法对LOGO图像进行二值化处理,通过计算图像不同区块中像素的灰度梯度值变化来对像素进行分离。局部最优阈值分离法为现有技术中的公知算法,在此不再赘述。
在S1314中,边缘检测处理将二值化后的LOGO图像进行特征区域的划分。边缘检测的目的是将提取的目标区域和背景区域分开。在本发明中,可以通过一阶及二阶微分算子进行像素灰度导数值的计算。优选地,利用罗伯特边缘算子来检测LOGO图像灰度变化、颜色变化及纹理特征的变化差异,实现文字块和图片与背景的分离和不同区域的边缘检测。
通过以上描述的子步骤S131,对所获取的LOGO图像进行了预处理,消除了LOGO图像中无关的信息,增强了有关文字和图标的可检测性并简化了数据,最终将目标区域与背景区域分开。
接下来,在子步骤中S132中,通过K-means聚类算法和连通域分析从经预处理的LOGO图像中提取待识别的文字目标区块的目的是对LOGO图像进行分割并提取出其中的文字目标区块。K-means聚类算法是一种迭代求解的聚类分析算法,其步骤是随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个对象,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类、没有(或最小数目)聚类中心再发生变化、或者误差平方和局部最小等等。
图4示出了通过K-means聚类算法和连通域分析从经预处理的LOGO图像中提取待识别的文字目标区块(子步骤S132)的一种具体实施方案。根据该实施方案,通过K-means聚类算法和连通域分析从经预处理的LOGO图像中提取待识别的文字目标区块(子步骤S132)包括:
S1321:确定聚类数量K,其中K为大于1的正整数;
S1322:在经预处理的LOGO图像的像素中随机选取K个像素作为聚类中心;
S1323:计算每个像素到每个聚类中心的欧式距离,并将每个像素划归到距其最近的聚类中心所在的聚类;
S1324:计算并更新每个聚类的聚类中心;
S1325:重复步骤S1323和步骤S1324,直到聚类中心不再发生变化,从而获得最终的聚类结果;
S1326:对所述聚类结果进行连通域分析,以确定文字目标区块。
通过子步骤S132,能够对LOGO图像进行分割并成功提取出文字目标区块。
接下来,在子步骤S133中,利用CTPN对文字目标区块进行二次验证并提取文字的位置和大小信息。CTPN(Connectionist Text Proposal Network)在诸如“Tian Z,HuangW,He T,et al.Detecting text in natural image with connectionist text proposalnetwork[C]//European Conference on Computer Vision.Springer InternationalPublishing,2016:56-72”的文献中记载有所记载。CTPN模型结构包括VGG16(卷积神经网络)、LSTM、全连接层等,其中,VGG是在从Alex-net发展而来的网络,LSTM(Long Short-TermMemory)是长短期记忆网络,是一种时间递归神经网络。
图5示出了利用CTPN对文字目标区块进行二次验证并提取文字的位置和大小信息(子步骤S133)的一种具体实施方案。根据该实施方案,利用CTPN对文字目标区块进行二次验证并提取文字的位置和大小信息(子步骤S133)包括:
S1331:通过VGG16卷积神经网络提取所述LOGO图像前五个卷积层的特征图;
S1332:用滑动窗口提取所述特征图的特征;
S1333:将所述特征输入到双向LSTM中以得到双向LSTM的输出结果;
S1334:将双向LSTM的输出结果输入到全连接层,并将所得到的全连接层特征输入到分类或回归层,从而预测目标待选区域;
S1335:通过文本构造算法,将所述目标待选区域合并成文本序列框;
S1336:将所述文本序列框与所述文字目标区块进行比较,如果相同则提取所述文本序列框中的文字的位置和大小信息,如不同则作为异常处理。
下面将通过示例更详细地描述子步骤S133。
CTPN通过在卷积特征图上滑动小窗口并输出细长的目标待选区域。目标待选区域的宽度是固定的(例如16像素宽),而高度不固定,每个目标待选区域的y坐标通过n个细长矩形来预测。n个细长矩形具有相同的水平位置和固定宽度(例如16个像素),但是它们的垂直位置在n个不同的高度变化。在该示例中,对于每个目标待选区域,使用10个细长矩形(n=10),其高度在11-273像素变化。垂直坐标通过目标待选区域的边界框的高度和y轴中心来测量。
首先,在S1331中,对所获取的彩色LOGO图像,用VGG16前五个卷积层(conv5)提取得到特征图,大小是W×H×C,其中C是特征图或通道的数量,W×H为空间排列。
然后,在S1332中,用大小为3×3的滑动窗口对该特征图提取特征,每个滑动窗口提取3×3×C的特征用于进行预测。
在S1333中,将每一行的所有窗口对应的3×3×C的特征(W×3×3×C)输入到RNN(双向LSTM)中,输出W×256的特征。
在S1334中,将上述W×256的特征输入到512维的全连接层,再将全连接层特征输入到三个分类或回归层中,预测出10个细长矩形的文字/非文字得分(类别信息)和位置信息。
在S1335中,通过文本线构造算法,把类别为文字的细长矩形合并成文本序列框。
在S1336中,将所得到的文本序列框与子步骤S132中通过K-means聚类算法和连通域分析提取的文字目标区块进行比较,如果相同则基于S1334中预测到的细长矩形的位置信息来确定文字的位置和大小信息。
通过使用CTPN进行二次验证,能够充分利用文本行具有上下文连接的特点,其结合了RNN与CNN,提升了文字检测的精度,因此能够提高最终预测出的文字位置和大小信息的准确度。
接下来,在S134中,利用CRNN提取LOGO图像中的文字的特征并利用hash值比对来识别文字的字体。
CRNN是一种卷积循环神经网络结构,用于解决基于图像的序列识别问题,特别是场景文字识别问题。在此描述本发明利用CRNN提取LOGO图像中的文字的特征并利用hash值比对来识别文字的字体(S134)的一种具体实施方案。在该实施方案中,利用CRNN提取LOGO图像中的文字的特征并利用hash值比对来识别文字的字体(S134)包括:
S1341:获取已有的字体文件集,生成多个字体图片;
S1342:通过卷积神经网络提取所述字体图片的特征,得到特征向量序列;
S1343:将所述特征向量序列输入到双向LSTM中,生成标签序列,标签序列中的每个标签表示字体;
S1344:根据步骤S133中提取出的LOGO图像的文字的位置和大小信息,计算所述LOGO图像中每个文字的宽度,对文字进行二维映射,并截取其中一个待识别文字的轮廓图片;
S1345:利用CRNN识别该待识别文字的轮廓图片中的文字并计算该文字的hash值,即第一hash值,
S1346:将每个字体图片转换成与所述待识别文字的轮廓图片大小相同的图片,并计算每个转换后的字体图片的hash值,即第二hash值;
S1347:将所述第一hash值与每个所述第二hash值进行比对,在hash值相等的情况下识别出该待识别文字的字体。
CRNN网络直接从图像数据学习信息表示,不需要手工特征也不需要预处理步骤,对类序列对象的长度无约束,只需要在训练阶段和测试阶段对高度进行归一化,使本发明的技术方案能够进一步脱离人工干预,而适用于实时的真实环境下。
在识别出LOGO图像中的文字的位置和大小信息以及文字的字体之后,在S135中,通过OpenCV将所述LOGO图像中的文字替换成与周围背景一样的颜色,并通过OpenCV提取图标的位置和大小信息。
通过以上描述的S131-S135,实现了版式信息分析和提取步骤S130。
在版式信息分析和提取步骤S130之后,执行版式参数存储步骤S140,将所提取的版式信息与对应的LOGO图像进行关联并作为版式参数存入数据库。
在数据库中,版式参数中的文字参数例如可以包括以下一种或多种参数并可以通过版式信息中的文字的位置和大小信息计算得到:
1)LOGO文字的字体以及字体的大小;
2)LOGO文字的排列方式,有横排,竖排,上圆弧,下圆弧,田字;
3)LOGO文字的对齐方式,分为两段对齐,左对齐,右对齐,居中对齐;
4)LOGO文字的起始坐标和文字的长度;
5)LOGO文字的倾斜角度,文字在某个方向上的缩放;
版式参数中的图标参数例如可以包括以下一种或多种参数并可以通过版式信息中的图标的位置和大小信息计算得到:
1)LOGO图标的大小信息,在X,Y轴方向上的缩放;
2)LOGO图标的位置和对齐方式。
之后,在版式应用步骤S150中,在生成LOGO时,基于用户输入的信息在数据库中调用相应的版式参数,并应用所述版式参数所定义的版式来生成LOGO。
图6示出了版式应用步骤S150的一种具体实施方案。在该实施方案中,版式应用步骤S150包括:
S151:基于用户输入的行业分类和标题数量在数据库中进行检索,返回行业匹配并具有对应标题数量的多个品牌的LOGO图像作为供用户选择的版式,从而向用户展示不同风格的版式。
S152:根据用户选择的版式从数据库中检索该版式的版式参数。可以通过用户选择的指定版型的ID,从数据库查找对应的文字参数以及图标参数。
S153:根据用户输入的行业分类和标题在数据库中检索匹配的图标。所述图标预先存储在数据库中。可以通过jieba分词提取标题数据的关键词作为图标的检索条件,从而检索出最符合该版型风格的图标。
S154:将所述版式参数应用到所述标题和所述图标以生成LOGO。根据S152中检索到的版式参数,根据对应的字体、文字的排列方式、文字的对齐方式和文字的大小以及图标的大小、位置和对齐方式等参数将标题(即文字)与图标进行组合,使LOGO搭配更加的融合。文字和图标的颜色可以随机组合;也可以预先设计好存储到数据库中,与对应的其他版式参数一并调用并组合应用;或者也可以由用户来指定。在生成LOGO时,优选地,可以同时生成png文件和svg文件,并把png图片展示给用户。
以上详细描述了根据本发明的第一实施例的个性化LOGO版式定制方法。通过该方法,能够提供更多种类、更加丰富的LOGO板式选择,并且更加贴合用户的个性化定制需求。
图7示出了根据本发明第二实施例的个性化LOGO版式定制系统的示意性框图。如图7所示,本发明第二实施例提供了一种个性化LOGO版式定制系统,该个性化LOGO版式定制系统包括:LOGO图像获取装置210,其获取不同行业的多个品牌的LOGO图像;LOGO图像存储装置220,其为每个LOGO图像分配版式ID,并将每个LOGO图像及其对应的版式ID和所属行业存储在数据库中;版式信息分析和提取装置230,其自动分析和提取所述LOGO图像的版式信息;版式参数存储装置240,将所提取的版式信息与对应的LOGO图像进行关联并作为版式参数存入数据库;版式应用装置250,其在生成LOGO时,基于用户输入的信息在数据库中调用相应的版式参数,并应用所述版式参数所定义的版式来生成LOGO。
本发明第二实施例中所涉及的名词及实现原理具体可以参照本发明第一实施例,在此不再赘述。
本发明第三实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述的个性化LOGO版式定制方法。
本发明第三实施例中所涉及的名词及实现原理具体可以参照本发明第一实施例,在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。
Claims (8)
1.一种个性化LOGO版式定制方法,其特征在于,所述个性化LOGO版式定制方法包括:
LOGO图像获取步骤,其获取不同行业的多个品牌的LOGO图像;
LOGO图像存储步骤,其为每个LOGO图像分配版式ID,并将每个LOGO图像及其对应的版式ID和所属行业存储在数据库中;
版式信息分析和提取步骤,其自动分析和提取所述LOGO图像的版式信息;
版式参数存储步骤,将所提取的版式信息与相应的所述LOGO图像进行关联并作为版式参数存入数据库;
版式应用步骤,其在生成LOGO时,基于用户输入的信息在数据库中调用相应的版式参数,并应用所述版式参数所定义的版式来生成LOGO;
其中,所述LOGO图像的版式信息包括:所述LOGO图像中的图标的位置和大小信息、所述LOGO图像中的文字的位置和大小信息以及所述文字的字体;
其中,自动分析和提取所述LOGO图像的版式信息包括:
对所述LOGO图像进行预处理;
通过K-means聚类算法和连通域分析从经预处理的LOGO图像中提取待识别的文字目标区块;
利用CTPN对文字目标区块进行二次验证并提取文字的位置和大小信息;
利用CRNN提取所述LOGO图像中的文字的特征并利用hash值比对来识别所述文字的字体;
通过OpenCV将所述LOGO图像中的文字替换成与周围背景一样的颜色,并通过OpenCV提取图标的位置和大小信息。
2.根据权利要求1所述的个性化LOGO版式定制方法,其特征在于,对所述LOGO图像进行预处理包括:
对所述LOGO图像进行灰度化处理;
对经灰度化处理的LOGO图像进行去躁处理;
对经去躁处理的LOGO图像进行二值化处理;
对经二值化处理的LOGO图像进行边缘检测。
3.根据权利要求2所述的个性化LOGO版式定制方法,其特征在于,通过K-means聚类算法和连通域分析从经预处理的LOGO图像中提取待识别的文字目标区块包括:
步骤S1321:确定聚类数量K,其中K为大于1的正整数;
步骤S1322:在经预处理的LOGO图像的像素中随机选取K个像素作为聚类中心;
步骤S1323:计算每个像素到每个聚类中心的欧式距离,并将每个像素划归到距其最近的聚类中心所在的聚类;
步骤S1324:计算并更新每个聚类的聚类中心;
步骤S1325:重复步骤S1323和步骤S1324,直到聚类中心不再发生变化,从而获得最终的聚类结果;
步骤S1326:对所述聚类结果进行连通域分析,以确定文字目标区块。
4.根据权利要求3所述的个性化LOGO版式定制方法,其特征在于,利用CTPN对文字目标区块进行二次验证并提取文字的位置和大小信息包括:
通过VGG16卷积神经网络提取所述LOGO图像前五个卷积层的特征图;
用滑动窗口提取所述特征图的特征;
将所述特征输入到双向LSTM中以得到双向LSTM的输出结果;
将双向LSTM的输出结果输入到全连接层,并将所得到的全连接层特征输入到分类或回归层,从而预测目标待选区域;
通过文本构造算法,将所述目标待选区域合并成文本序列框;
将所述文本序列框与所述文字目标区块进行比较,如果相同则提取所述文本序列框中的文字的位置和大小信息,如果不同则作为异常处理。
5.根据权利要求4所述的个性化LOGO版式定制方法,其特征在于,利用CRNN提取所述LOGO图像中的文字的特征并利用hash值比对来识别所述文字的字体包括:
获取字体文件集,生成多个字体图片;
通过卷积神经网络提取所述字体图片的特征,得到特征向量序列;
将所述特征向量序列输入到双向LSTM中,生成标签序列,标签序列中的每个标签表示字体;
根据所提取出的文字的位置和大小信息,计算所述LOGO图像中每个文字的宽度,对文字进行二维映射,并截取其中一个待识别文字的轮廓图片;
利用CRNN识别该待识别文字的轮廓图片中的文字并计算该文字的hash值,即第一hash值;
将每个字体图片转换成与所述待识别文字的轮廓图片大小相同的图片,并计算每个转换后的字体图片的hash值,即第二hash值;
将所述第一hash值与每个所述第二hash值进行比对,在hash值相等的情况下识别出该待识别文字的字体。
6.根据权利要求1所述的个性化LOGO版式定制方法,其特征在于,所述版式应用步骤包括:
基于用户输入的行业分类和标题数量在数据库中进行检索,返回行业匹配并具有对应标题数量的多个品牌的LOGO图像作为供用户选择的版式;
根据用户选择的版式从数据库中检索该版式的版式参数;
根据用户输入的行业分类和标题在图标数据库中检索匹配的图标;
将所述版式参数应用到所述标题和所述图标以生成LOGO。
7.一种个性化LOGO版式定制系统,其特征在于,所述个性化LOGO版式定制系统包括:
LOGO图像获取装置,其获取不同行业的多个品牌的LOGO图像;
LOGO图像存储装置,其为每个LOGO图像分配版式ID,并将每个LOGO图像及其对应的版式ID和所属行业存储在数据库中;
版式信息分析和提取装置,其自动分析和提取所述LOGO图像的版式信息;
版式参数存储装置,将所提取的版式信息与对应的LOGO图像进行关联并作为版式参数存入数据库;
版式应用装置,其在生成LOGO时,基于用户输入的信息在数据库中调用相应的版式参数,并应用所述版式参数所定义的版式来生成LOGO;
其中,所述LOGO图像的版式信息包括:所述LOGO图像中的图标的位置和大小信息、所述LOGO图像中的文字的位置和大小信息以及所述文字的字体;
其中,自动分析和提取所述LOGO图像的版式信息包括:
对所述LOGO图像进行预处理;
通过K-means聚类算法和连通域分析从经预处理的LOGO图像中提取待识别的文字目标区块;
利用CTPN对文字目标区块进行二次验证并提取文字的位置和大小信息;
利用CRNN提取所述LOGO图像中的文字的特征并利用hash值比对来识别所述文字的字体;
通过OpenCV将所述LOGO图像中的文字替换成与周围背景一样的颜色,并通过OpenCV提取图标的位置和大小信息。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序能够被一个或者多个处理器执行,以实现权利要求1至6中任一项所述的个性化LOGO版式定制方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910461417.0A CN110196917B (zh) | 2019-05-30 | 2019-05-30 | 个性化logo版式定制方法、系统和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910461417.0A CN110196917B (zh) | 2019-05-30 | 2019-05-30 | 个性化logo版式定制方法、系统和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110196917A CN110196917A (zh) | 2019-09-03 |
CN110196917B true CN110196917B (zh) | 2021-04-06 |
Family
ID=67753503
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910461417.0A Active CN110196917B (zh) | 2019-05-30 | 2019-05-30 | 个性化logo版式定制方法、系统和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110196917B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110767292A (zh) * | 2019-10-12 | 2020-02-07 | 腾讯科技(深圳)有限公司 | 病理编号识别方法、信息识别方法、装置及信息识别系统 |
CN112837332B (zh) * | 2021-01-13 | 2024-01-19 | 杭州水母智能科技有限公司 | 创意设计的生成方法、装置、终端、存储介质 |
CN113792735A (zh) * | 2021-09-26 | 2021-12-14 | 上海航空工业(集团)有限公司 | 一种企业标识的识别方法、识别装置、设备和介质 |
CN114219875A (zh) * | 2021-12-03 | 2022-03-22 | 北京艺源酷科技有限公司 | 一种基于StyleGAN的智能LOGO生成方法 |
CN114998631B (zh) * | 2022-08-08 | 2022-11-11 | 成都薯片科技有限公司 | 企业logo生成方法、装置及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW200737063A (en) * | 2006-03-30 | 2007-10-01 | Chi Kuo | Participation-involving advertising method via an Internet terminal |
CN103106430A (zh) * | 2013-01-22 | 2013-05-15 | 北京印刷学院 | 单参数双变量多元加密防伪信息存储商标 |
CN105260727A (zh) * | 2015-11-12 | 2016-01-20 | 武汉大学 | 基于图像处理与序列标注的学术文献语义再结构化方法 |
CN106055371A (zh) * | 2016-06-21 | 2016-10-26 | 联想(北京)有限公司 | Bios的logo更新的方法、bios和系统 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060129417A1 (en) * | 2004-12-14 | 2006-06-15 | Design Logic, Inc. | Systems and methods for logo design |
US20070214415A1 (en) * | 2004-12-14 | 2007-09-13 | Williams John M | Systems and Methods for Logo Design |
CN104462380A (zh) * | 2014-12-11 | 2015-03-25 | 北京中细软移动互联科技有限公司 | 商标检索方法 |
CN105786784B (zh) * | 2014-12-23 | 2018-10-16 | 珠海金山办公软件有限公司 | 一种演示文稿模板更换方法及装置 |
US10007863B1 (en) * | 2015-06-05 | 2018-06-26 | Gracenote, Inc. | Logo recognition in images and videos |
CN107609057B (zh) * | 2017-08-25 | 2020-12-22 | 百度在线网络技术(北京)有限公司 | 一种获取商标图像的文字数据的方法与装置 |
CN107832469B (zh) * | 2017-11-29 | 2019-04-09 | 北京洪泰同创信息技术有限公司 | 一种企业logo图像的生成方法及装置 |
CN108764245B (zh) * | 2018-04-03 | 2022-04-29 | 南昌奇眸科技有限公司 | 一种提高商标图形相似度判定准确性的方法 |
CN109102844B (zh) * | 2018-08-24 | 2022-02-15 | 北京锐客科技有限公司 | 一种临床试验源数据自动校验方法 |
-
2019
- 2019-05-30 CN CN201910461417.0A patent/CN110196917B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW200737063A (en) * | 2006-03-30 | 2007-10-01 | Chi Kuo | Participation-involving advertising method via an Internet terminal |
CN103106430A (zh) * | 2013-01-22 | 2013-05-15 | 北京印刷学院 | 单参数双变量多元加密防伪信息存储商标 |
CN105260727A (zh) * | 2015-11-12 | 2016-01-20 | 武汉大学 | 基于图像处理与序列标注的学术文献语义再结构化方法 |
CN106055371A (zh) * | 2016-06-21 | 2016-10-26 | 联想(北京)有限公司 | Bios的logo更新的方法、bios和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110196917A (zh) | 2019-09-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110196917B (zh) | 个性化logo版式定制方法、系统和存储介质 | |
US11288823B2 (en) | Logo recognition in images and videos | |
WO2019192397A1 (zh) | 一种任意形状的场景文本端到端识别方法 | |
US10032072B1 (en) | Text recognition and localization with deep learning | |
US10643094B2 (en) | Method for line and word segmentation for handwritten text images | |
JP5713790B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
CN109343920B (zh) | 一种图像处理方法及其装置、设备和存储介质 | |
KR101611895B1 (ko) | 감정 기반의 자동 문구 디자인 장치 및 그 방법 | |
CN111488826A (zh) | 一种文本识别方法、装置、电子设备和存储介质 | |
CN107273895B (zh) | 用于头戴式智能设备的视频流实时文本识别及翻译的方法 | |
JP2003515230A (ja) | ビデオストリームの分類可能な記号の分離方法及びシステム | |
JP2013125322A (ja) | 学習装置、プログラム及び学習方法 | |
CN111626027B (zh) | 表格结构还原方法、装置、设备、系统和可读存储介质 | |
US11600088B2 (en) | Utilizing machine learning and image filtering techniques to detect and analyze handwritten text | |
CN111738252B (zh) | 图像中的文本行检测方法、装置及计算机系统 | |
CN110413825B (zh) | 面向时尚电商的街拍推荐系统 | |
CN109508716B (zh) | 一种图像文字的定位方法及装置 | |
US20210217160A1 (en) | Commodity Identification Device, Non-Transitory Computer-Readable Storage Medium, and Learning Method | |
CN112016545A (zh) | 一种包含文本的图像生成方法及装置 | |
CN108647703B (zh) | 一种基于显著性的分类图像库的类型判断方法 | |
KR102285269B1 (ko) | 빅데이터 기반 Geo AI를 활용한 이미지 분석 장치 및 방법 | |
CN111967490A (zh) | 用于地图检测的模型训练方法和地图检测方法 | |
CN114463767A (zh) | 信用证识别方法、装置、计算机设备和存储介质 | |
CN113762257A (zh) | 一种美妆品牌图像中标志的识别方法及装置 | |
CN112052352A (zh) | 视频排序方法、装置、服务器及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |