CN116798053B - 图标生成方法及装置 - Google Patents

图标生成方法及装置 Download PDF

Info

Publication number
CN116798053B
CN116798053B CN202310898179.6A CN202310898179A CN116798053B CN 116798053 B CN116798053 B CN 116798053B CN 202310898179 A CN202310898179 A CN 202310898179A CN 116798053 B CN116798053 B CN 116798053B
Authority
CN
China
Prior art keywords
code
icon
sequence
data
code data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310898179.6A
Other languages
English (en)
Other versions
CN116798053A (zh
Inventor
周倩鑫
李华庆
施晓明
王宁
王雪峰
张剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hexin Technology Co ltd
Shanghai Hexin Digital Technology Co ltd
Original Assignee
Hexin Technology Co ltd
Shanghai Hexin Digital Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hexin Technology Co ltd, Shanghai Hexin Digital Technology Co ltd filed Critical Hexin Technology Co ltd
Priority to CN202310898179.6A priority Critical patent/CN116798053B/zh
Publication of CN116798053A publication Critical patent/CN116798053A/zh
Application granted granted Critical
Publication of CN116798053B publication Critical patent/CN116798053B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/19007Matching; Proximity measures
    • G06V30/19093Proximity measures, i.e. similarity or distance measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19107Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19147Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明涉及图标生成技术领域,具体涉及一种图标生成方法及装置,其中,方法,获取待生成图标的目标属性信息;获取目标属性信息对应的待识别代码序列,将待识别代码序列输入训练好的代码识别模型,根据代码识别模型的代码识别结果,确定待识别代码序列对应的图标代码;代码识别模型基于携带有图标代码标签的多个样本图标代码的代码数据序列训练而成,图标代码标签基于代码数据序列的图标属性信息确定;将图标代码发送至用户端生成待生成图标。基于代码识别模型识别目标属性信息对应的待识别代码序列,对待识别代码序列进行识别训练得到具体的图标代码并发送至用户端,有利于用户端快速生成批量的图标代码,最终保证了用户端的图标生成效率。

Description

图标生成方法及装置
技术领域
本发明涉及图标生成技术领域,具体涉及一种图标生成方法及装置。
背景技术
在技术文档写作中生成图标是文档创建过程中必不可少的操作。相关技术中,将图标作为截图或图片插入到文档中,然后通过人为根据需要修改图标大小或图标颜色或图标格式等,并且在后续图标调用过程中,若直接调整图标大小会导致图标分辨率降低,所以需要调整原图标的大小,另存为图片后再次插入文档,当需要改变图标颜色时,则需要重新作图,改变图标颜色并另存为图片,然后插入到文档中。因此,该方式对于技术文档写作有一定的限制,非常影响写作效率。
发明内容
有鉴于此,本发明提供了一种图标生成方法及装置,以解决相关技术中通过人工插入图标的方式费时费力以及在文档插入图标影响写作效率的问题。
第一方面,本发明提供了一种图标生成方法,方法包括:
获取待生成图标的目标属性信息;
获取目标属性信息对应的待识别代码序列,待识别代码序列为待生成图标在预设时间段内按照时间顺序排列的代码文本数据;
将待识别代码序列输入训练好的代码识别模型中,根据代码识别模型的代码识别结果,确定待识别代码序列对应的图标代码;代码识别模型基于携带有图标代码标签的多个样本图标代码的代码数据序列训练而成,图标代码标签基于代码数据序列的图标属性信息确定;
将图标代码发送至用户端生成待生成图标。
通过执行上述实施方式,基于代码识别模型识别目标属性信息对应的待识别代码序列,对待识别代码序列进行识别训练得到具体的图标代码,并将生成的图标代码发送至用户端生成待生成图标,进而有利于用户端可以快速生成批量的图标代码,最终保证了用户端的图标生成效率。
在一种可选的实施方式中,获取目标特征代码对应的代码数据序列,包括:
对至少一个周期的原始代码数据序列进行过滤;
对过滤后的原始代码数据序列进行剪裁和数据填充处理,得到样本图标代码的数据序列。
通过执行上述实施方式,通过过滤、剪裁和填充原始代码数据序列有利于精确训练代码识别模型。
在一种可选的实施方式中,对过滤后的原始代码数据序列进行剪裁和数据填充处理,得到样本图标代码的数据序列,包括:
将过滤后的原始代码数据序列剪裁为预设长度,得到剪裁后的代码数据序列;
若剪裁后的代码数据序列中存在缺失代码数据的时间点,根据样本代码的历史代码数据补充时间点的代码数据,得到样本图标代码的代码数据序列。
通过执行上述实施方式,进一步通过具体的过滤、剪裁和填充原始代码数据序列有利于精确训练代码识别模型。
在一种可选的实施方式中,根据样本图标代码的历史代码数据补充时间点的代码数据,得到样本图标代码的代码数据序列,包括:
获取剪裁后的代码数据序列中残失数据的待补充时间点;
获取样本代码对应的历史周期中与待补充时间点相同的历史时间点,并获取历史时间点中存在代码数据的目标历史时间点;
补充目标历史时间点的代码数据至待补充时间点中,得到样本图标代码的代码数据序列。
通过执行上述实施方式,对样本图标代码的原始代码数据序列进行包括过滤和补充缺失值等预处理,得到时长一致且数据完整的代码数据序列,基于这些代码数据序列训练代码识别模型,并基于训练好的代码识别模型识别待识别代码,提高了识别代码的准确度。
在一种可选的实施方式中,基于预设聚类算法对多个样本图标代码的代码数据序列进行聚类,得到不同的多个序列集合;包括:
获取代码数据序列中各个时间点的数据值,根据各个时间点的数据值确定代码数据序列的分布曲线;
基于分布曲线的曲线相似度对多个代码数据序列进行聚类,得到不同的多个序列集合。
通过执行上述实施方式,对多个代码数据序列进行聚类,可以得到不同代码的多个序列集合,最终有利于识别待识别代码序列对应的图标代码。
在一种可选的实施方式中,基于分布曲线的曲线相似度对多个代码数据序列进行聚类,得到不同的多个序列集合,包括:
将每个序列集合中的代码数据序列分割为均匀分布的多个子时间段;若序列集合中代码数据序列的第一子时间段的数据值大于剩余子时间段的数据值,确定序列集合的代码属性为初期代码偏好;
若序列集合中数据序列的第二子时间段的数据值大于剩余子时间段的数据值,确定该聚合后的数据序列的代码属性为末期代码偏好;
第一子时间段为代码数据序列中开头预设时间内的时间段,第二子时间段为代码数据序列中结尾预设时间内的时间段。
通过执行上述实施方式,终端可以基于曲线相似度对代码数据序列进行聚类,并且终端还可以基于分布曲线的形状确定各个序列集合的类型,进而确定不同图标代码标签,基于带有图标代码标签的代码数据序列训练得到代码识别模型,从而提高了对代码进行基于时间敏感度识别的准确度。
第二方面,本发明提供了一种图标生成装置,装置包括:
图标代码获取模块,用于获取待生成图标的目标属性信息;
数据序列确定模块,用于获取目标属性信息对应的待识别代码序列,待识别代码序列为待生成图标在预设时间段内按照时间顺序排列的代码文本数据;
图标代码训练模块,用于将待识别代码序列输入训练好的代码识别模型中,根据代码识别模型的代码识别结果,确定待识别代码序列对应的图标代码;代码识别模型基于携带有图标代码标签的多个样本图标代码的代码数据序列训练而成,图标代码标签基于代码数据序列的图标属性信息确定;
待生成图标生成模块,用于将图标代码发送至用户端生成待生成图标。
第三方面,本发明提供了一种计算机设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面或其对应的任一实施方式的图标生成方法。
第四方面,本发明提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的图标生成方法。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的图标生成方法的流程示意图;
图2是根据本发明实施例的另一图标生成方法的流程示意图;
图3是根据本发明实施例的又一图标生成方法的流程示意图;
图4是根据本发明实施例的图标生成装置的结构框图;
图5是本发明实施例的计算机设备的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
根据本发明实施例,提供了一种图标生成方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在本实施例中提供了一种图标生成方法,可用于上述的移动终端,如手机、平板电脑等,图1是根据本发明实施例的图标生成方法的流程图,如图1所示,该流程包括如下步骤:
步骤S101,获取待生成图标的目标属性信息。
例如:待生成图标为红色的汽车,其对应的待生成图标代码为<iclass=”fafa-car”style=”color:red”></i>,其中,该待生成图标的目标属性信息为colorred。
具体地,可以利用Web应用程序来提供用户界面,通过用户在该用户界面输入关键字,即输入上述中的目标属性信息,以使得终端获取该目标属性信息。
步骤S102,获取目标属性信息对应的待识别代码序列,待识别代码序列为待生成图标在预设时间段内按照时间顺序排列的代码文本数据。
示例性地,基于上述目标属性信息,可以使用搜索算法查找与该目标属性信息匹配的待识别代码序列,以便识别该待识别代码序列对应的图标代码。
具体地,图标代码的待识别代码序列在一段时间内不同时间段的属性信息可能不同,从而终端可以将其按照不同时间段的数据序列进行分类,例如基于代码属性可以分为初期代码偏好、中期代码偏好和末期代码偏好等。所谓代码属性即颜色、尺寸、大小、格式等信息。需要说明的是,目标属性信息对应的待识别代码序列也可以不局限于上述的各个。待识别代码序列具有相应的属性信息,例如:携带有图标尺寸、图标颜色的属性信息。当用户准备调用图标时,会在本实施例中的终端输入关键字,即当用户输入关键的目标属性信息时,执行本实施例的终端会搜索到相应的待识别代码序列,终端可以获取待识别代码序列在预设时间段内按照时间顺序排列的代码文本数据。具体地,待识别代码序列中包括用户每次输入目标属性信息的时间点以及属性数据。其中,一个待识别代码序列中的各个属性数据可以是同一种属性,例如都是相同颜色的属性信息。从而终端可以基于用户输入的目标属性信息,对待识别代码序列基于时间敏感度分类最终得到对应的图标代码。
步骤S103,将待识别代码序列输入训练好的代码识别模型中,根据代码识别模型的代码识别结果,确定待识别代码序列对应的图标代码;代码识别模型基于携带有图标代码标签的多个样本图标代码的代码数据序列训练而成,图标代码标签基于代码数据序列的图标属性信息确定。
示例性地,代码识别模型可以是用于对待识别代码序列进行识别的模型,该代码识别模型可以基于图标代码标签的多个样本图标代码的代码数据序列训练而成。其中,图标代码标签可以是图标代码对应的属性标签,不同的图标代码可以对应不同的属性标签。多个样本图标代码的代码数据序列可以是已经确定其图标代码的代码数据序列,终端可以基于多个样本图标代码的代码数据序列对待识别代码序列进行训练。其中,在对上述待识别代码序列进行识别时,终端可以将待识别代码序列输入到上述训练好的代码识别模型中,并获取代码识别模型输出的识别结果,从而终端可以基于上述识别结果确定待识别代码序列对应的图标代码。例如,以待生成图标为红色的汽车,其对应的待生成图标的代码为<iclass=”fafa-car”style=”color:red”></i>举例,该图标代码的图标属性信息可以包括初期的<iclass=”fafa-car”style=”color:red”></i>、中期的<iclass=”fafa-car”style=”color:red”></i>、末期<iclass=”fafa-car”style=”color:red”></i>,待生成图标对应的图标代码可以是[图标代码:末期的<iclass=”fafa-car”style=”color:red”></i>]的形式。
具体地,在具体的训练过程中,建立好待识别模型后,就可以开始训练了。将上述的待识别代码序列输入到待识别模型中,数据会经过以下过程得到输出:
待识别代码序列会被输入到输入层(LTSM层)中,其中每个LTSM单元都会根据当前输入和前一个时间步的状态来计算当前时间步的状态和输出。在每个时间步中,LTSM单元内部的计算过程可以分为以下几个步骤:
A1:计算遗忘门:根据当前输入和前一个时间步的状态,计算一个遗忘门向量,用于控制前一个时间步的状态对当前状态的影响。
A2:计算输入门:根据当前输入和前一个时间步的状态,计算一个输入门向量,用于控制当前输入对当前状态的影响。
A3:计算候选状态:根据当前输入和前一个时间步的状态,计算一个候选状态向量,用于更新当前状态。
A4:计算输出门:根据当前输入和前一个时间步的状态,计算一个输出门向量,用于控制当前状态对输出的影响。
A5:计算当前状态和输出:根据遗忘门、输入门、候选状态和输出门,计算当前时间步的状态和输出。
在LTSM层之后,可以通过添加一些全连接层或者其他的层来进一步处理输出,最终得到我们需要的结果。需要注意的是,在训练的过程中,需要根据实时的结果进行模型相应参数的调节,以达到最佳的训练效果。
当完成一次训练后,训练的效果并不是完美的。可以通过将上一次训练的结果当成下一次训练的输入,通过这种反馈调节机制,经过不停的训练,得到一个比较完美的训练数据。
在上述图标代码识别过程中,获取待识别代码序列在预设时间段内按照时间顺序排列的代码文本数据,并将待识别代码的代码数据序列输入训练好的待识别模型,基于待识别模型输出的识别结果确定待识别代码序列的图标代码,能够准确把握图标代码随用户输入目标属性信息的时间变化的影响,以提高图标代码识别的准确度。
步骤S104,将图标代码发送至用户端生成待生成图标。
示例性地,训练模型成熟后,本实施例可以通过输入一个或多个关键词生成不同属性的HTML代码。例如:用户输入camera,本实施例中的终端即可生成以下代码:例如:<iclass=”fafa-camera”</i>;
<i class=”fafa-camera”style=”font-size:48px”></i>
<i class=”fafa-camera”style=”font-size:48px;color:red”></i>
<i class=”fafa-camera”style=”font-size:48px;color:blue”></i>
例如:用户输入camera和yellow,本实施例中的终端即可生成以下代码:
<i class=”fafa-camera”style=”color:yellow”</i>
<i class=”fafa-camera”style=”font-size:48px;color:yellow”></i>
例如:以10000个图标为例,相关现有技术,每调用一个图标需要先去开源库查找图标,拷贝图标对应的代码,增加css来定义样式,至少费时5分钟。那么10000个图标则需要10000x 5=50000分钟。
而使用训练好的模型能自动创建或更新图标代码,在写作工具中输入图标关键字即可自动定位且调用想要使用的代码,用时1秒。10000个图标用时10000秒,即166.67分钟即可完成。
因此,本实施例基于代码识别模型识别目标属性信息对应的待识别代码序列,对待识别代码序列进行识别训练得到具体的图标代码,并将生成的图标代码发送至用户端生成待生成图标,有利于用户端可以快速生成批量的图标代码,最终保证了用户端图标生成效率。并且,当撰写技术文档时,在该技术文档中通过本实施例中的图标生成方式插入图标,有利于提升技术文档的撰写效率。
本实施例中提供了一种图标生成方法,可用于上述的移动终端,如手机、平板电脑等,图2是根据本发明实施例的图标生成方法的流程图,如图2所示,该流程包括如下步骤:
步骤S201,获取多个样本图标代码的代码数据序列,多个样本图标代码的代码数据序列为代码在预设时间段内按照时间顺序排列的代码文本数据。
步骤S202,基于预设聚类算法对多个样本图标代码的代码数据序列进行聚类,得到不同代码的多个序列集合;每个序列集合中包括带有相同图标代码标签的代码数据序列。
步骤S203,根据携带有图标代码标签的多个样本图标代码的代码数据序列训练代码识别模型,得到训练完成的代码识别模型,以基于代码识别模型确定待识别代码序列对应的图标代码。
示例性地,终端可以预先对待训练的待识别模型进行训练,在训练时,终端可以获取样本图标代码的代码数据序列,其中,样本图标代码的代码数据序列可以是经过预处理的数据。其中,样本图标代码可以是用于训练的图标代码,样本图标代码的代码数据序列可以包括样本图标代码在预设时间段内按照时间顺序排列的代码文本数据。终端可以首先确定样本图标代码的代码数据序列对应的代码,并添加对应的属性标签。例如,终端可以由预设聚类算法基于代码数据序列的数据分布,对上述多个代码数据序列进行聚类,得到不同的多个序列集合,每个序列集合中包括带有相同代码属性标签的代码数据序列。即上述预设聚类算法可以对各个样本代码的代码数据序列进行聚类,形成多个序列集合,并且终端可以对这些序列集合进行标签的添加,以确定序列集合中代码数据序列的,每个序列集合的标签可以基于该序列集合中的代码数据序列的数据分布确定。标签的添加方式可以是通过打标签的方式实现。
终端得到带有图标代码标签的多个序列集合后,可以基于携带有上述图标代码标签的多个代码数据序列对代码识别模型进行训练,得到训练完成的代码识别模型,从而终端可以基于代码识别模型确定待生成图标的图标代码。其中训练完的待识别模型训练可以在待识别模型满足预设训练条件时得到。其中预设训练条件可以是基于待识别模型的模型精度或训练次数确定。例如,终端可以获取序列集合中的代码数据序列,作为样本代码数据序列,并将样本代码数据序列输入代码识别模型,获取代码识别模型基于残差网络算法输出的预测识别结果,终端可以根据预测识别结果与样本代码数据序列的图标代码标签对应的相似度,调整待识别模型的模型参数,将样本代码数据序列输入待识别模型,获取代码识别模型基于残差网络算法输出的预测识别结果的步骤,直至满足预设训练条件时,得到训练完成的代码识别模型。
在一种可选的实施方式中,如图3所示,上述步骤S102,获取目标特征代码对应的代码数据序列,包括:
步骤S301,对至少一个周期的原始代码数据序列进行过滤。
步骤S302,对过滤后的原始代码数据序列进行剪裁和数据填充处理,得到样本图标代码的数据序列。
在一种可选的实施方式中,上述步骤S302,对过滤后的原始代码数据序列进行剪裁和数据填充处理,得到所述样本图标代码的数据序列,包括:
步骤a1:将过滤后的原始代码数据序列剪裁为预设长度,得到剪裁后的所述代码数据序列;
步骤a2:若剪裁后的所述代码数据序列中存在缺失代码数据的时间点,根据所述样本代码的历史代码数据补充所述时间点的代码数据,得到所述样本图标代码的代码数据序列。
示例性地,获取样本图标代码的代码数据序列,并对该代码数据进行预处理。例如:待生成图标代码及代码数据序列均为HTML代码,可以将其分割为成对应的标签序列,并将标签序列划分为多个时间步。并对标签序列进行向量化,将标签序列中的每个标签映射到独立的数字编号。例如:待生成图标代码为<iclass=”fafa-car”style=”color:red”></i>,将上述HTML代码分割成对应的标签序列,并将标签序列划分为多个时间步。[<i>,<class>,<fa>,<fa-car>,<style>,<color>,<red>,</i>]。对标签序列进行向量化,将标签序列中的每个标签映射到独立的数字编号。比如<i>为1,<class>为2,<fa>为3,<fa-car>为4,<style>为5,<color>为6,<red>为7,</i>为8。同时为了使模型能够区分出开始标记<START>和结束标记<END>,我们需要将开始标记和结束标记分别编码为不同的数字,比如<START>会被编码为0,<END>被编码为9,则生成的数字序列为:0 1 2 3 4 5 6 7 8 9,将该数字序列以预设长度填充或截断。基于预设长度和没有重复词项的数量生成一个数字序列矩阵,这个矩阵中的每个元素都是0或者1,分别表示该时间步中是否存在该单词。
假如存在有10000个图标,那么我们就可以得到10000个图标对应的HTML代码的文本库。比如:(创建不同类型图标代码的文库)
<i class=”fafa-car”</i>
<i class=”fafa-car”style=”color:red”></i>
<i class=”fafa-car”style=”font-size:48px”></i>
<i class=”fafa-car”style=”font-size:48px;color:red”></i>
<i class=”fafa-car”style=”font-size:48px;color:blue”></i>
<i class=”fafa-plane”</i>
<i class=”fafa-plane”style=”font-size:48px”</i>
<i class=”fafa-plane”style=”font-size:48px;color:red”></i>
<i class=”fafa-plane”style=”font-size:48px;color:blue”></i>
<i class=”fafa-shield”></i>
<i class=”fafa-shieldfa-rotate-90”></i>
<i class=”fafa-shieldfa-rotate-180”></i>
<i class=”fafa-shieldfa-rotate-270”></i>
则对该10000个图标进行预处理,对应10000个样本图标代码的代码数据序列,并对该10000个代码数据序列进行预处理。
具体地,终端可以通过对样本图标代码的代码数据序列进行过滤,得到样本图标代码的代码数据序列,通过该方式终端可以得到多个原始代码数据序列,并对多个原始代码数据序列进行过滤,以得到过滤后的预处理后的代码数据序列。其中,原始代码数据序列包括长度过短的或缺失较严重的序列,具体可以是序列长度小于或等于预设长度阈值、代码数据数量小于预设数量阈值的原始代码数据序列中的至少一种。并且,终端在将原始代码数据序列进行过滤后,剩余的原始代码数据序列中仍可能存在缺失数据的部分,因此终端可以对过滤后的原始代码数据序列进行裁剪和数据填充处理,从而得到上述经过最终预处理的图标样本代码的代码数据序列。
在一种可选的实施方式,上述步骤a2,根据样本图标代码的历史代码数据补充时间点的代码数据,得到样本图标代码的代码数据序列,包括:
步骤b1,获取剪裁后的代码数据序列中残失数据的待补充时间点。
步骤b2,获取样本代码对应的历史周期中与待补充时间点相同的历史时间点,并获取历史时间点中存在代码数据的目标历史时间点。
步骤b3,补充目标历史时间点的代码数据至待补充时间点中,得到样本图标代码的代码数据序列。
示例性地,对过滤后的原始代码数据序列进行裁剪和数据填充处理,得到样本代码的代码数据序列,包括:将过滤后的原始代码数据序列裁剪为预设长度,得到裁剪后的代码数据序列;若裁剪后的代码数据序列中存在缺失代码数据的时间点,根据样本代码的历史代码数据补充时间点的代码数据,得到样本代码的代码数据序列。例如:终端得到过滤后的原始数据序列后,由于原始数据序列的时间跨度可能不一致,因此终端可以将过滤后的原始代码数据序列裁剪为预设长度,预设长度可以根据实际情况设定,从而终端可以得到裁剪后的代码数据序列。其中裁剪后的代码数据序列可以是时长一致且序列中每个时间点也一致的序列。终端可以检测裁剪后的代码数据序列中是否存在缺失代码数据的时间点,若是,则终端可以根据样本代码的历史代码数据补充上述缺失代码数据的时间点的代码数据,从而终端可以得到样本代码的代码数据序列。其中,历史代码数据可以是样本代码的历史代码数据中与缺失代码数据的时间点为同一时间的数据。
通过上述实施方式,终端可以通过对样本图标代码的原始代码数据序列进行包括过滤和补充缺失值等预处理,得到时长一致且数据完整的代码数据序列,终端基于这些代码数据序列训练代码识别模型,基于训练好的代码识别模型识别待识别代码,提高了识别代码的准确度。
在一种可选的实施方式中,上述步骤S202,基于预设聚类算法对多个样本图标代码的代码数据序列进行聚类,得到不同的多个序列集合;包括:
步骤c1,获取代码数据序列中各个时间点的数据值,根据各个时间点的数据值确定代码数据序列的分布曲线;
步骤c2,基于分布曲线的曲线相似度对多个代码数据序列进行聚类,得到不同的多个序列集合。
本实施例中,代码数据序列中可以包括多个时间点,每个时间点可以有对应的属性数据及其数值,例如代码被用户插入属性关键字的次数或插入属性关键字而产生的数值等。终端可以获取代码数据序列中各个时间点的数据值,由于每个时间点的数据值可能不同,因此终端可以根据各个时间点的数据值确定代码数据序列的分布曲线,例如,代码数据序列中各个时间点的数据值可以以柱状图呈现,终端可以将代码数据序列中各个时间点的数据值的柱形图的最高点相连,形成该代码数据序列对应的分布曲线。终端可以获取多个代码数据序列的分布曲线,当两个不同代码的属性相似时,产生的代码数据序列也会相似,因此终端可以由预设聚类算法基于上述分布曲线的曲线相似度,对多个代码数据序列进行聚类,得到多个序列集合,每个序列集合中均可以有至少一个代码对应的代码数据序列,每个聚类形成的序列集合可以代表一种代码,从而终端可以通过聚类得到不同代码的多个序列集合。
在另一种可选的实施方式中,步骤c2,基于分布曲线的曲线相似度对多个代码数据序列进行聚类,得到不同的多个序列集合,包括:
步骤d1,将每个序列集合中的代码数据序列分割为均匀分布的多个子时间段;若序列集合中代码数据序列的第一子时间段的数据值大于剩余子时间段的数据值,确定序列集合的代码属性为初期代码偏好;
步骤d2,若序列集合中数据序列的第二子时间段的数据值大于剩余子时间段的数据值,确定该聚合后的数据序列的代码属性为末期代码偏好;
步骤d3,第一子时间段为代码数据序列中开头预设时间内的时间段,第二子时间段为代码数据序列中结尾预设时间内的时间段。
示例性地,终端可以通过预设聚类算法将多个代码数据序列进行聚类,并且聚类得到的每个序列集合代表一种类型的代码。其中,在同一个序列集合中的代码数据序列可以代表同一种类型,因此,其中的代码数据序列的分布曲线相似,终端可以基于分布曲线的形状确定各个序列集合代表的类型。终端首先通过预设聚类算法基于分布曲线的曲线相似度,对多个代码数据序列进行聚类,得到多个序列集合。终端可以基于不同时间段中代码数据的数据值大小确定曲线相似度,终端还可以将每个序列集合中的代码数据序列分割为均匀分布的多个子时间段,例如分割为三个子时间段,分别代表早期、中期和末期,终端也可以将代码数据序列切分为其他数量的子时间段。终端可以检测序列集合中代码数据序列的第一子时间段的数据值是否大于剩余子时间段中的数据值,若是,则终端确定序列集合的类型为初期代码偏好类型,即代表该偏好类型的用户在周期的初期插入代码的属性关键字;终端还可以检测序列集合中代码数据序列的第二子时间段的数据值是否大于剩余子时间段的数据值,若是,则终端确定序列集合的类型为末期代码偏好类型,即代表该类型的代码偏好在周期的末期执行了包含对应的属性代码。其中第一子时间段为代码数据序列中开头预设时间内的时间段,例如在子时间段为三个时的早期时间段;第二时间段为代码数据序列中结尾预设时间内的时间段,例如在子时间段为三个时的末期时间段。终端还可以在其他子时间段的数据值较大时确定相应的属性代码,例如在子时间段为三个时,终端在检测到中间子时间段的数据值大于其他子时间段的数据值时,确定序列集合的类型是中期代码偏好,即代表该类型的代码偏好在周期的中期执行包含相应的属性代码。
通过执行上述实施方式,终端可以基于曲线相似度对代码数据序列进行聚类,并且终端还可以基于分布曲线的形状确定各个序列集合的类型,进而确定不同图标代码标签,基于带有图标代码标签的代码数据序列训练得到代码识别模型,从而提高了对代码进行基于时间敏感度识别的准确度。
在本实施例中还提供了一种图标生成装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。如图4所示,该装置包括:
图标代码获取模块41,用于获取待生成图标的目标属性信息;
数据序列确定模块42,用于获取目标属性信息对应的待识别代码序列,待识别代码序列为待生成图标在预设时间段内按照时间顺序排列的代码文本数据;
图标代码训练模块43,用于将待识别代码序列输入训练好的代码识别模型中,根据代码识别模型的代码识别结果,确定待识别代码序列对应的图标代码;代码识别模型基于携带有图标代码标签的多个样本图标代码的代码数据序列训练而成,图标代码标签基于代码数据序列的图标属性信息确定;
待生成图标生成模块44,用于将图标代码发送至用户端生成待生成图标。
上述各个模块和单元的更进一步的功能描述与上述对应实施例相同,在此不再赘述。
本实施例中的图标生成装置是以功能单元的形式来呈现,这里的单元是指ASIC(Application Specific Integrated Circuit,专用集成电路)电路,执行一个或多个软件或固定程序的处理器和存储器,和/或其他可以提供上述功能的器件。
本发明实施例还提供一种计算机设备,具有上述中的图标生成装置。
请参阅图5,图5是本发明可选实施例提供的一种计算机设备的结构示意图,如图5所示,该计算机设备包括:一个或多个处理器10、存储器20,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相通信连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在计算机设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在一些可选的实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个计算机设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图5中以一个处理器10为例。
处理器10可以是中央处理器,网络处理器或其组合。其中,处理器10还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路,可编程逻辑器件或其组合。上述可编程逻辑器件可以是复杂可编程逻辑器件,现场可编程逻辑门阵列,通用阵列逻辑或其任意组合。
其中,所述存储器20存储有可由至少一个处理器10执行的指令,以使所述至少一个处理器10执行实现上述实施例示出的方法。
存储器20可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器20可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些可选的实施方式中,存储器20可选包括相对于处理器10远程设置的存储器,这些远程存储器可以通过网络连接至该计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
存储器20可以包括易失性存储器,例如,随机存取存储器;存储器也可以包括非易失性存储器,例如,快闪存储器,硬盘或固态硬盘;存储器20还可以包括上述种类的存储器的组合。
该计算机设备还包括通信接口30,用于该计算机设备与其他设备或通信网络通信。
本发明实施例还提供了一种计算机可读存储介质,上述根据本发明实施例的方法可在硬件、固件中实现,或者被实现为可记录在存储介质,或者被实现通过网络下载的原始存储在远程存储介质或非暂时机器可读存储介质中并将被存储在本地存储介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件的存储介质上的这样的软件处理。其中,存储介质可为磁碟、光盘、只读存储记忆体、随机存储记忆体、快闪存储器、硬盘或固态硬盘等;进一步地,存储介质还可以包括上述种类的存储器的组合。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件,当软件或计算机代码被计算机、处理器或硬件访问且执行时,实现上述实施例示出的方法。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (9)

1.一种图标生成方法,其特征在于,所述方法包括:
获取待生成图标的目标属性信息;
获取所述目标属性信息对应的待识别代码序列,所述待识别代码序列为所述待生成图标在预设时间段内按照时间顺序排列的代码文本数据;
将所述待识别代码序列输入训练好的代码识别模型中,根据所述代码识别模型的代码识别结果,确定所述待识别代码序列对应的图标代码;所述代码识别模型基于携带有图标代码标签的多个样本图标代码的代码数据序列训练而成,所述图标代码标签基于所述代码数据序列的图标属性信息确定;
将所述图标代码发送至用户端生成所述待生成图标;
所述代码识别模型基于携带有图标代码标签的多个样本图标代码的代码数据序列训练而成,包括:
获取所述多个样本图标代码的代码数据序列,所述多个样本图标代码的代码数据序列为代码在预设时间段内按照时间顺序排列的代码文本数据;
基于预设聚类算法对所述多个样本图标代码的代码数据序列进行聚类,得到不同代码的多个序列集合;每个序列集合中包括带有相同图标代码标签的代码数据序列;该预设聚类算法基于代码数据序列的数据分布,对上述多个代码数据序列进行聚类,得到不同的多个序列集合,每个序列集合中包括带有相同代码属性标签的代码数据序列;
根据携带有所述图标代码标签的多个样本图标代码的代码数据序列训练所述代码识别模型,得到训练完成的所述代码识别模型,以基于所述代码识别模型确定待识别代码序列对应的图标代码。
2.根据权利要求1所述的图标生成方法,其特征在于,获取所述多个样本图标代码对应的代码数据序列,包括:
对至少一个周期的原始代码数据序列进行过滤;
对过滤后的原始代码数据序列进行剪裁和数据填充处理,得到所述样本图标代码的数据序列。
3.根据权利要求2所述的图标生成方法,其特征在于,对过滤后的原始代码数据序列进行剪裁和数据填充处理,得到所述样本图标代码的数据序列,包括:
将过滤后的原始代码数据序列剪裁为预设长度,得到剪裁后的所述代码数据序列;
若剪裁后的所述代码数据序列中存在缺失代码数据的时间点,根据样本代码的历史代码数据补充所述时间点的代码数据,得到所述样本图标代码的代码数据序列。
4.根据权利要求3所述的图标生成方法,其特征在于,所述根据所述样本图标代码的历史代码数据补充所述时间点的代码数据,得到所述样本图标代码的代码数据序列,包括:
获取剪裁后的所述代码数据序列中残失数据的待补充时间点;
获取所述样本代码对应的历史周期中与所述待补充时间点相同的历史时间点,并获取所述历史时间点中存在代码数据的目标历史时间点;
补充所述目标历史时间点的代码数据至所述待补充时间点中,得到所述样本图标代码的代码数据序列。
5.根据权利要求3所述的图标生成方法,其特征在于,所述基于预设聚类算法对所述多个样本图标代码的代码数据序列进行聚类,得到不同的多个序列集合;包括:
获取所述代码数据序列中各个时间点的数据值,根据所述各个时间点的数据值确定所述代码数据序列的分布曲线;
基于所述分布曲线的曲线相似度对所述多个代码数据序列进行聚类,得到不同的多个序列集合。
6.根据权利要求5所述的图标生成方法,其特征在于,所述基于所述分布曲线的曲线相似度对所述多个代码数据序列进行聚类,得到不同的多个序列集合,包括:
将每个所述序列集合中的代码数据序列分割为均匀分布的多个子时间段;若所述序列集合中代码数据序列的第一子时间段的数据值大于剩余子时间段的数据值,确定所述序列集合的代码属性为初期代码偏好;
若所述序列集合中数据序列的第二子时间段的数据值大于剩余子时间段的数据值,确定聚合后的数据序列的代码属性为末期代码偏好;
所述第一子时间段为所述代码数据序列中开头预设时间内的时间段,所述第二子时间段为所述代码数据序列中结尾预设时间内的时间段。
7.一种图标生成装置,其特征在于,所述装置包括:
图标代码获取模块,用于获取待生成图标的目标属性信息;
数据序列确定模块,用于获取所述目标属性信息对应的待识别代码序列,所述待识别代码序列为所述待生成图标在预设时间段内按照时间顺序排列的代码文本数据;
图标代码训练模块,用于将所述待识别代码序列输入训练好的代码识别模型中,根据所述代码识别模型的代码识别结果,确定所述待识别代码序列对应的图标代码;所述代码识别模型基于携带有图标代码标签的多个样本图标代码的代码数据序列训练而成,所述图标代码标签基于所述代码数据序列的图标属性信息确定;
待生成图标生成模块,用于将所述图标代码发送至用户端生成待生成图标;
所述代码识别模型基于携带有图标代码标签的多个样本图标代码的代码数据序列训练而成,包括:
获取所述多个样本图标代码的代码数据序列,所述多个样本图标代码的代码数据序列为代码在预设时间段内按照时间顺序排列的代码文本数据;
基于预设聚类算法对所述多个样本图标代码的代码数据序列进行聚类,得到不同代码的多个序列集合;每个序列集合中包括带有相同图标代码标签的代码数据序列;该预设聚类算法基于代码数据序列的数据分布,对上述多个代码数据序列进行聚类,得到不同的多个序列集合,每个序列集合中包括带有相同代码属性标签的代码数据序列;
根据携带有所述图标代码标签的多个样本图标代码的代码数据序列训练所述代码识别模型,得到训练完成的所述代码识别模型,以基于所述代码识别模型确定待识别代码序列对应的图标代码。
8.一种计算机设备,其特征在于,包括:
存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1至6中任一项所述的图标生成方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机指令,所述计算机指令用于使计算机执行权利要求1至6中任一项所述的图标生成方法。
CN202310898179.6A 2023-07-20 2023-07-20 图标生成方法及装置 Active CN116798053B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310898179.6A CN116798053B (zh) 2023-07-20 2023-07-20 图标生成方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310898179.6A CN116798053B (zh) 2023-07-20 2023-07-20 图标生成方法及装置

Publications (2)

Publication Number Publication Date
CN116798053A CN116798053A (zh) 2023-09-22
CN116798053B true CN116798053B (zh) 2024-04-26

Family

ID=88037544

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310898179.6A Active CN116798053B (zh) 2023-07-20 2023-07-20 图标生成方法及装置

Country Status (1)

Country Link
CN (1) CN116798053B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117648079B (zh) * 2024-01-29 2024-05-14 浙江阿里巴巴机器人有限公司 任务处理、代码补全、代码问答及任务处理模型训练方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109857388A (zh) * 2019-01-10 2019-06-07 北京城市网邻信息技术有限公司 代码生成方法、装置、服务器及计算机可读介质
CN110120059A (zh) * 2019-05-15 2019-08-13 京东方科技集团股份有限公司 一种图标生成方法及装置
CN110569924A (zh) * 2019-09-18 2019-12-13 南京雷鲨信息科技有限公司 图标处理方法、装置、可读存储介质及计算机设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109857388A (zh) * 2019-01-10 2019-06-07 北京城市网邻信息技术有限公司 代码生成方法、装置、服务器及计算机可读介质
CN110120059A (zh) * 2019-05-15 2019-08-13 京东方科技集团股份有限公司 一种图标生成方法及装置
CN110569924A (zh) * 2019-09-18 2019-12-13 南京雷鲨信息科技有限公司 图标处理方法、装置、可读存储介质及计算机设备

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
《Auto-Icon+: An Automated End-to-End Code Generation Tool for Icon Designs in UI Development》;SIDONG FENG 等;《ACM Transactions on Interactive Intelligent Systems》;第12卷(第04期);1-26 *
《基于Bi-LSTM的Pix2code模型在软件开发中的应用研究》;李军丹 等;《信息与电脑(理论版)》;第35卷(第09期);第49-51页 *
《基于深度学习的Web用户界面代码生成技术研究》;张玮;《科学技术创新》(14);87-88 *
Tony Beltramelli 等.《pix2code: Generating Code from a Graphical User Interface Screenshot》.《EICS '18: Proceedings of the ACM SIGCHI Symposium on Engineering Interactive Computing Systems》.2018,1-6. *

Also Published As

Publication number Publication date
CN116798053A (zh) 2023-09-22

Similar Documents

Publication Publication Date Title
CN111062495B (zh) 机器学习方法及相关装置
CN111858843B (zh) 一种文本分类方法及装置
CN111695439A (zh) 图像结构化数据提取方法、电子装置及存储介质
CN116798053B (zh) 图标生成方法及装置
CN116049397B (zh) 基于多模态融合的敏感信息发现并自动分类分级方法
CN112182406A (zh) 机械设计方案推荐方法及装置
CN113205047A (zh) 药名识别方法、装置、计算机设备和存储介质
CN110909768B (zh) 一种标注数据获取方法及装置
CN111125177A (zh) 生成数据标签的方法、装置、电子设备及可读存储介质
US20210390802A1 (en) Method, Computer Program And Device For Processing Signals
CN111859862B (zh) 文本的数据标注方法和装置、存储介质及电子装置
CN114531334A (zh) 意图处理方法、装置、电子设备和可读存储介质
US11921713B2 (en) Systems and methods for automating mapping of repair procedures to repair information
CN113886520B (zh) 一种基于图神经网络的代码检索方法、系统及计算机可读存储介质
CN112699908B (zh) 标注图片的方法、电子终端、计算机可读存储介质及设备
CN110674342B (zh) 查询目标图像的方法和装置
CN113628077A (zh) 生成不重复考题的方法、终端及可读存储介质
CN113469237A (zh) 用户意图识别方法、装置、电子设备及存储介质
CN112287005A (zh) 一种数据处理方法、装置、服务器及介质
CN111881171A (zh) 一种基于数据分析的图纸识别推荐方法及系统
US20230071291A1 (en) System and method for a precise semantic segmentation
CN112988986B (zh) 人机交互方法、装置与设备
US20240127510A1 (en) Stylized glyphs using generative ai
CN117350380A (zh) 异常行为监测系统及方法
CN117710763A (zh) 图像噪声识别模型训练方法、图像噪声识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant