CN114283429A

CN114283429A - 素材工单数据处理方法、装置、设备及存储介质

Info

Publication number: CN114283429A
Application number: CN202111348749.1A
Authority: CN
Inventors: 金培银; 刘杨
Original assignee: Donson Times Information Technology Co ltd
Current assignee: Donson Times Information Technology Co ltd
Priority date: 2021-11-15
Filing date: 2021-11-15
Publication date: 2022-04-05

Abstract

本发明涉及数据处理技术领域，本发明公开了一种素材工单数据处理方法、装置、设备及存储介质，所述方法包括：获取与素材工单对应的需求文件和参考素材；对需求文件进行文本识别及需求提取，得到素材需求结果，以及对参考素材进行素材风格识别，得到风格识别结果；得到最终需求结果；基于分发规则，将最终需求结果分发至匹配的素材设计者所对应的任务队列中；接收任务队列返回的素材文档；对素材文档进行传送格式的转换处理，将转换处理后的素材文档推送至与素材工单对应的需求方。因此，本发明实现了自动识别出最终需求结果，自动分发任务和自动转换给需求方，提高了推送的素材文档的客户满意度，保证设计的素材文档的高匹配性。

Description

素材工单数据处理方法、装置、设备及存储介质

技术领域

本发明涉及数据处理技术领域，尤其涉及一种素材工单数据处理方法、装置、设备及存储介质。

背景技术

目前，随着传媒技术的发展，我们能够随处看得到广告，广告会以多种形式散发出去，而大部分广告是基于图像或/和视频为素材进行投放的，而针对素材投放的策略，不同的客户有不同的需求，随着广告的增多，素材的需求随之增多，并且素材投放的策略也随之增多，在现有的技术方案中，素材的需求和素材投放的策略大部分是通过广告优化师与客户沟通，由广告优化师人工解读出素材的需求和素材投放的策略，再传达广告设计者进行设计，由于不同广告优化师解读的内容各式各样，并且一个广告优化师对接众多客户，容易相互干扰，出现素材混乱的情况，以及会出现解读有误以致传达信息缺失等主观因素的影响，造成每一个广告的素材开发及素材投放策略的管理混乱，准确率和正确率低，导致制作的素材和素材投放的策略不全符合客户的需求，导致客户的满意度低。

发明内容

本发明提供一种素材工单数据处理方法、装置、计算机设备及存储介质，实现了自动识别出最终需求结果，并自动分发相匹配的素材设计者对应的任务队列中，自动转换接收的素材文档，大大减少了人工工作量，提高了推送的素材文档的客户满意度。

一种素材工单数据处理方法，包括：

获取与素材工单对应的需求文件和参考素材；

对所述需求文件进行文本识别及需求提取，得到素材需求结果，以及对所述参考素材进行素材风格识别，得到风格识别结果；

将所述素材需求结果和所述风格识别结果记录为最终需求结果；

基于分发规则，将所述最终需求结果分发至与所述最终需求结果匹配的素材设计者所对应的任务队列中；

接收所述任务队列返回的素材文档；所述素材文档为所述素材设计者根据所述最终需求结果创建的文档；

对所述素材文档进行与所述素材工单对应的传送格式的转换处理，将转换处理后的素材文档推送至与所述素材工单对应的需求方。

一种素材工单数据处理装置，包括：

获取模块，用于获取与素材工单对应的需求文件和参考素材；

识别模块，用于对所述需求文件进行文本识别及需求提取，得到素材需求结果，以及对所述参考素材进行素材风格识别，得到风格识别结果；

记录模块，用于将所述素材需求结果和所述风格识别结果记录为最终需求结果；

分发模块，用于基于分发规则，将所述最终需求结果分发至与所述最终需求结果匹配的素材设计者所对应的任务队列中；

接收模块，用于接收所述任务队列返回的素材文档；所述素材文档为所述素材设计者根据所述最终需求结果创建的文档；

转换模块，用于对所述素材文档进行与所述素材工单对应的传送格式的转换处理，将转换处理后的素材文档推送至与所述素材工单对应的需求方。

一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述素材工单数据处理方法的步骤。

一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述素材工单数据处理方法的步骤。

本发明提供的素材工单数据处理方法、装置、计算机设备及存储介质，通过获取与素材工单对应的需求文件和参考素材；对所述需求文件进行文本识别及需求提取，得到素材需求结果，以及对所述参考素材进行素材风格识别，得到风格识别结果；将所述素材需求结果和所述风格识别结果记录为最终需求结果；基于分发规则，将所述最终需求结果分发至与所述最终需求结果匹配的素材设计者所对应的任务队列中；接收所述任务队列返回的素材文档；所述素材文档为所述素材设计者根据所述最终需求结果创建的文档；对所述素材文档进行与所述素材工单对应的传送格式的转换处理，将转换处理后的素材文档推送至与所述素材工单对应的需求方，因此，实现了运用文本识别、需求提取以及素材风格识别，自动识别出最终需求结果，并自动分发相匹配的素材设计者对应的任务队列中，自动转换接收的素材文档，以发送至需求方，因此，大大减少了人工工作量，提高了推送的素材文档的客户满意度，保证设计的素材文档的高匹配性。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例中素材工单数据处理方法的应用环境示意图；

图2是本发明一实施例中素材工单数据处理方法的流程图；

图3是本发明一实施例中素材工单数据处理方法的步骤S20的流程图；

图4是本发明一实施例中素材工单数据处理装置的原理框图；

图5是本发明一实施例中素材工单数据处理装置的识别模块的原理框图；

图6是本发明一实施例中计算机设备的示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供的素材工单数据处理方法，可应用在如图1的应用环境中，其中，客户端(计算机设备或终端)通过网络与服务器进行通信。其中，客户端(计算机设备或终端)包括但不限于为各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一实施例中，如图2所示，提供一种素材工单数据处理方法，其技术方案主要包括以下步骤S10-S60：

S10，获取与素材工单对应的需求文件和参考素材。

可理解地，在创作一个广告投放的时候，需要创建该广告投放所对应的一系列的素材，所述素材为展现与该广告投放的需求文件和参考素材相符合的图像或/和视频等可展现的媒体文件，所述素材工单为广告投放下的一系列素材所赋予的唯一工单编号，一个所述素材工单对应一个投放广告的所述需求文件，以及一个所述参考素材，所述需求文件为该投放广告所提出的涉及需求的相关文件，所述需求文件为图像、文本、视频等可展现需求的文件，所述需求文件的格式可以根据收集需求的方式进行确定，如果收集需求的时候为通过录音的方式获得，则需求文件的格式为音频文件；如果收集需求的时候为通过文本记录的方式获得，则需求文件的格式为文本文件；如果收集需求的时候为通过拍摄视频的方式获得，则需求文件的格式为视频文件。

其中，所述参考素材为需参考风格的素材，所述参考素材提供了生成符合需求提供风格相似的素材。

S20，对所述需求文件进行文本识别及需求提取，得到素材需求结果，以及对所述参考素材进行素材风格识别，得到风格识别结果。

可理解地，所述文本识别为对输入的文件识别出文本内容的过程，所述需求提取为提取出文本识别后获得的文本内容中的与需求相关的关键字的提取过程，所述对所述需求文件进行文本识别及需求提取的过程包括：首先，对所述需求文件进行相应格式的文本转换，转换成文字格式的文本内容；然后，运用训练完成的素材关键字检测模型对该文本内容进行与需求要素相关的关键词提取，其中，所述素材关键字检测模型的网络结构可以为基于Bi-LSTM(又称：Bi-directional Long Short-Term Memory，双向长短时记忆算法)的网络结构，所述双向长短时记忆算法为在LSTM(Long short-termmemory，长短期记忆)的基础上，结合了输入序列在前向和后向两个方向上的信息的算法；最后，通过关键字检测模型对识别出关键词进行分类，将不同维度的类别进行聚合，得到各个维度的关键词的集合，从而得到所述素材需求结果。

可理解地，所述素材风格识别为对素材进行风格特征的提取，并根据提取的风格特征进行聚类，从而识别出素材具有的风格的识别过程，所述对所述参考素材进行素材风格识别的过程可以通过训练完成的图像风格检测模型实现，所述图像风格检测模型的训练过程为通过历史收集的标有风格标签的样本进行识别，得到识别结果，再根据风格标签和识别结果之间的损失值，迭代更新图像风格检测模型的参数，直至损失值达到收敛的条件，停止训练，所述图像风格检测模型的网络结构可以根据需求设定，比如图像风格检测模型的网络结构为CNN的网络结构，或者为VGG16的网络结构，其对所述参考素材进行素材风格识别的过程可以为：首先，通过图像风格检测模型对所述参考素材进行图像预处理，通过图像预处理可以将参考素材中的线条的纹理特征进行增强，所述图像预处理为运用图像增强算法对所述参考素材进行处理的过程，所述图像增强算法包括图像去燥、增加清晰度(对比度)、灰度化或者获取图像边缘特征或者对图像进行卷积、二值化、直方图均衡化、拉普拉斯变换和伽马变换等算法，从而得到预处理图像；其次，对所述预处理图像进行风格特征提取，所述风格特征提取可以为基于统计分布的参数化纹理特征提取方法，也可以为基于马尔科夫随机场的非参数化纹理特征提取方法，其中，所述基于统计分布的参数化纹理特征提取方法为通过统计学的方式对提取的纹理进行参数化向量体现的统计方法，所述基于马尔科夫随机场的非参数化纹理特征提取方法为运用马尔科夫网络提取纹理特征；最后，对提取的纹理特征进行分类，以及预测各素材风格的类别的概率分布，将超过预设阈值的素材风格的类别进行汇总，从而得到风格识别结果。

其中，LSTM算法为通过对细胞状态中信息遗忘和记忆新的信息使得对后续时刻计算有用的信息得以传递，而无用的信息被丢弃，并在每个时间步都会输出隐层状态，其中遗忘、记忆与输出是由通过上个时刻的隐层状态和当前输入计算出的遗忘门，记忆门，输出门进行综合控制获得，所述风格特征为图像中的线条或者区域呈现的与纹理的风格相关的特征。

在一实施例中，如图3所示，所述步骤S20中，即所述对所述需求文件进行文本识别及需求提取，得到素材需求结果，包括：

S201，对所述需求文件进行文本转换，得到需求文本。

可理解地，所述文本转换的过程为识别输入的需求文件的文件格式，再通过与该文件格式相应的文本转换算法对需求文件进行转换的过程，将转换后的文本内容记录为所述需求文本，所述需求文本体现了需求文件中包含的文本内容。

在一实施例中，所述步骤S201中，即所述对所述需求文件进行文本转换，得到需求文本，包括：

对所述需求文件进行文件格式识别，识别出所述需求文件的文件格式。

可理解地，所述文件格式识别为识别出输入的需求文件的格式类型的识别过程，所述文件格式识别的过程为获取所述需求文件的扩展名，根据获取的扩展名进行区分文件格式，即不同的扩展名对应不同的文件格式，一种文件格式可以对应多种扩展名，所述文件格式包括文本格式、音频格式、视频格式和图像格式等等，例如：jpg的扩展名对应图像格式、txt的扩展名对应文本格式，从而识别出需求文件的文件格式的过程，在一实施例中，在检测到所述文件格式为文本格式时，打开所述需求文件，并提取所述需求文件中的文本内容，将提取的文本内容记录为需求文本。

对所述需求文件进行与所述文件格式相应的文本转换，得到所述需求文本。

可理解地，不同的文件格式对应不同的文本转换的算法，即音频格式对应语音识别技术中的算法，视频格式对应音频提取技术中的算法和语音识别技术中的算法，图像格式对应光学字符识别技术(OCR技术)中的算法，在检测到所述文件格式为音频格式时，运用语音识别技术中的算法，对所述需求文件进行语音文本转换，得到所述需求文本；在检测到所述文件格式为视频格式时，运用音频提取技术中的算法，对所述需求文件进行音频流的提取，以及运用语音识别技术，识别出音频流中的文本内容，得到所述需求文本；在检测到所述文件格式为图像格式时，运用OCR技术中算法，对需求文件进行文本提取，得到所述需求文本。

其中，所述语音识别技术(Automatic Speech Recognition，ASR)是一种将人的语音转换为文本的技术，也即对输入的音频格式的文件进行声纹特征提取，即提取出该文件中的具有梅尔倒谱系数(MFCC)的声纹特征，通过声纹特征识别出与该声纹特征相对应的发音的字，从而能够转换出相应的文本内容的技术，所述音频提取技术为通过音频提取器播放输入的视频格式的文件，在播放过程中采集音频流的内容，并对采集音频流的内容进行噪音过滤的技术，所述光学字符识别技术，也称Optical Character Recognition(OCR)技术，采用光学的方式将抄写在纸质文档中的文字拍摄成为黑白点阵的图像文件，并通过训练完成的文字识别网络将图像中的文字转换成文本的技术。

本发明实现了通过对所述需求文件进行文件格式识别，识别出所述需求文件的文件格式；对所述需求文件进行与所述文件格式相应的文本转换，得到所述需求文本，如此，能够自动识别出需求文件的文件格式，并做相应文本转换，得到需求文本，无需人工转换成文本，满足需求文件的文件格式多样性的需求，大大减少了人工转换的工作量，以及提高了需求文件转换的效率，保证了转换的正确性和准确性。

在一实施例中，所述对所述需求文件进行与所述文件格式相应的文本转换，得到所述需求文本，包括：

在检测到所述文件格式为音频格式时，运用语音识别技术，对所述需求文件进行语音文本转换，得到所述需求文本。

可理解地，所述语音识别技术(Automatic Speech Recognition，ASR)是一种将人的语音转换为文本的技术，也即对输入的音频格式的文件进行声纹特征提取，即提取出该文件中的具有梅尔倒谱系数(MFCC)的声纹特征，通过声纹特征识别出与该声纹特征相对应的发音的字，从而能够转换出相应的文本内容的技术，所述语音文本转换的过程为运用所述语音识别技术中的算法进行转换的过程。

在检测到所述文件格式为视频格式时，运用音频提取技术和语音识别技术，对所述需求文件进行视频转换，得到所述需求文本。

可理解地，所述音频提取技术为通过音频提取器播放输入的视频格式的文件，在播放过程中采集音频流的内容，并对采集音频流的内容进行噪音过滤的技术，所述视频转换的过程为先运用所述音频提取技术提取出所述需求文件中的音频流内容，再运用所述语音识别技术，将音频流内容转换成文本的过程，最终得到需求文本。

在检测到所述文件格式为图像格式时，运用OCR技术，对所述需求文件进行文本提取，得到所述需求文本。

可理解地，所述光学字符识别技术，也称Optical Character Recognition(OCR)技术，采用光学的方式将抄写在纸质文档中的文字拍摄成为黑白点阵的图像文件，并通过训练完成的文字识别网络将图像中的文字转换成文本的技术，所述文本提取的过程为运用光学字符识别技术识别出需求文件中的文字的过程。

如此，能够通过检测到不同格式的需求文件，自动选择相应的技术，做相应的转换，得到需求文本，无需人工一个个识别及人工转换，提高了需求文本转换的效率和准确性。

S202，对所述需求文本进行素材需求识别，得到需求识别结果，以及对所述需求文本进行素材策略识别，得到策略识别结果。

可理解地，所述素材需求识别可以通过所述素材关键字检测模型中的素材因素提取子网络进行识别，所述素材因素提取子网络为基于Bi-LSTM的网络结构的神经网络，所述素材因素提取子网络为通过历史包含与各个因素相关的文字的句子进行训练的网络，即通过将句子样本和与该句子样本关联的素材因素关键字输入子网络中，通过Bi-LSTM的语义识别方法识别出句子样本中的关键字，将该关键字和相应的素材因素关键字进行比对，计算两者之间差异，并根据该差异进行迭代更新子网络的参数，不断训练完成素材因素提取子网络，所述素材因素提取子网络可以为多任务学习的神经网络，即所述素材因素提取子网络中包含有多个分支网络，每个所述分支网络通过深度学习方式，学习一种素材因素的类别或者特征提取，其中，所述素材因素的特征提取包括平台实体特征、地点实体特征、时间特征、投放模式实体特征、规格特征、布局特征、时长特征等与素材因素相关的特征，通过每个所述分支网络提取的特征进行各自全连接层的分类，从而得到每个所述分支网络输出的类别结果，最终，将所有所述分支网络输出的类别结果进行汇总得到所述需求识别结果，所述需求识别结果包括广告投放平台的类别、广告投放的位置、广告投放的时间、广告投放的模式、素材尺寸、素材布局、素材时长等与广告投放或素材的需求相关的类别结果。

其中，所述素材策略识别可以通过所述素材关键字检测模型中的素材策略识别子网络进行识别，所述素材策略识别子网络为基于Bi-LSTM的网络结构的神经网络，所述素材策略识别子网络为通过历史包含与素材策略相关的广告投放平台的类别、广告投放的位置、广告投放的时间、广告投放的模式等语句，通过对该语句中的广告投放平台的类别、广告投放的位置、广告投放的时间、广告投放的模式之间的语义关联程度进行学习，预测出广告投放平台的类别、广告投放的位置、广告投放的时间、广告投放的模式之间组合的概率分布，从而得到概率最高的组合，将该组合与语句中真实的广告投放平台的类别、广告投放的位置、广告投放的时间、广告投放的模式的组合进行比较，不断收敛靠近，直至收敛完成以得到训练完成的素材策略识别子网络，所述素材策略识别的过程为对输入的所述需求文本进行广告投放平台的类别、广告投放的位置、广告投放的时间、广告投放的模式之间各种组合的概率预测，从而获取概率最高所对应的组合，将其记录为所述策略识别结果，所述策略识别结果体现了广告投放平台的类别、广告投放的位置、广告投放的时间和广告投放的模式组合概率最高的结果，所述策略识别结果包括广告投放平台的类别、广告投放的位置、广告投放的时间和广告投放的模式。

在一实施例中，所述步骤S202中，即所述对所述需求文本进行素材需求识别，得到需求识别结果，包括：

对所述需求文本进行素材因素提取，得到素材因素结果。

可理解地，所述素材因素提取的过程为：首先，对所述需求文本进行分词处理，将所述需求文本拆分成最小单元的字或者词语，得到多个单元词；其次，将拆分出的单元词进行词嵌入向量转换，通过从预设的与素材因素相关的语料库中查找与单元词匹配的词向量，将查找到的词向量作为该单元词转换后的词向量；最后，对各单元词转换后的词向量进行过滤，将与素材因素相关的关键词所对应的词向量进行保留，去除助词、与素材因素不相关的实体，最终将剩余的词向量所对应的实体或者关键词作为所述素材因素结果。

基于所述素材因素结果，对所述需求文本进行需求语义的识别，得到与所述素材因素结果对应的需求识别结果。

可理解地，所述需求语义的识别为运用Bi-LSTM算法也称为双向长短时记忆网络算法，通过正向和逆向两个方向进行共同编码以进行嵌入词向量转换的校验方法，以确保转换成最符合语义的编码的识别过程，即对所述素材因素结果中的各个单元词的上下文进行正向和逆向两个方向的预测，从而预测出各个单元词所对应的最符合的语义的编码，将各最符合的语义的编码所对应的字或词语作为所述需求识别结果中的一个素材因素的类别结果。

本发明实现了通过对所述需求文本进行素材因素提取，得到素材因素结果；基于所述素材因素结果，对所述需求文本进行需求语义的识别，得到与所述素材因素结果对应的需求识别结果，如此，能够通过上下文的需求语义识别，自动提取出各个素材因素的需求识别结果，减少了人工识别的成本，提高了素材因素识别的准确性和效率。

S203，根据所述策略识别结果，对所述需求识别结果进行校验，得到素材需求结果。

可理解地，所述校验为将所述策略识别结果中的广告投放平台的类别、广告投放的位置、广告投放的时间和广告投放的模式对所述需求识别结果中的多个广告投放平台的类别、多个广告投放的位置、多个广告投放的时间以及多个广告投放的模式进行加权评分，从而根据各个评分值确定出一个广告投放平台的类别、一个广告投放的位置、一个广告投放的时间以及一个广告投放的模式，将确定出的一个广告投放平台的类别、一个广告投放的位置、一个广告投放的时间以及一个广告投放的模式和所述需求识别结果中的素材尺寸、素材布局、素材时长等与广告投放或素材的需求相关的类别结果进行合并，从而得到所述素材需求结果，所述素材需求结果体现了所述需求文本中最终识别出的各个素材因素的类别结果。

本发明实现了通过对所述需求文件进行文本转换，得到需求文本；对所述需求文本进行素材需求识别，得到需求识别结果，以及对所述需求文本进行素材策略识别，得到策略识别结果；根据所述策略识别结果，对所述需求识别结果进行校验，得到素材需求结果，如此，能够运用文本转换，自动转换出文本内容的需求文本，并运用素材需求识别和素材策略识别，以及自校验，获得准确地、真正的素材需求结果，保证了素材需求解读的正确性，而且提高了解读的效率。

在一实施例中，所述步骤S20中，即所述对所述参考素材进行素材风格识别，得到风格识别结果，包括：

对所述参考素材进行图像预处理，得到预处理图像。

可理解地，所述图像预处理为运用图像增强算法对所述参考素材进行处理的过程，所述图像增强算法包括图像去燥、增加清晰度(对比度)、灰度化或者获取图像边缘特征或者对图像进行卷积、二值化、直方图均衡化、拉普拉斯变换和伽马变换等算法，根据需求选择图像增强算法，例如：对所述参考素材进行拉普拉斯变换，以增强纹理特征，从而得到所述预处理图像，所述预处理图像为增强了纹理特征的所述参考素材的图像。

对所述预处理图像进行风格特征提取，得到特征图。

可理解地，所述风格特征提取可以为基于统计分布的参数化纹理特征提取方法，也可以为基于马尔科夫随机场的非参数化纹理特征提取方法，其中，所述基于统计分布的参数化纹理特征提取方法为通过统计学的方式对提取的纹理进行参数化向量体现的统计方法，即将纹理特征提取的建模为N阶统计量，N阶的纹理特征学习的建模方式得到的模型，所述基于马尔科夫随机场的非参数化纹理特征提取方法为运用马尔科夫网络提取纹理特征，所述马尔科夫网络为用图像中的一预设尺寸的小块像素点矩阵与各种风格矩阵相似度匹配程度进行逐点合成，逐渐学习相似的纹理特征的网络，将提取的纹理特征进行矩阵化，得到所述特征图，所述特征图体现了所述预处理图像中的纹理特征。

对所述特征图进行多任务的素材风格识别，识别出所述风格识别结果。

可理解地，所述多任务的素材风格识别为通过各个风格学习的分支网络对所述特征图进行各个风格类别的概率预测的识别过程，即通过各个风格类别学习的全连接层对所述特征图进行相应的softmax处理，得到各个所述分支网络所对应的概率值，将超出预设阈值的概率值所对应的风格类别记录为所述风格识别结果，所述风格识别结果体现了所述参考素材的图像风格类别，例如：图像风格类别包括唯美、复古、现代、深沉等风格分类。

本发明实现了通过对所述参考素材进行图像预处理，得到预处理图像；对所述预处理图像进行风格特征提取，得到特征图；对所述特征图进行多任务的素材风格识别，识别出所述风格识别结果，如此，能够自动识别出参考素材的风格，减少了人工识别的工作量，为后续的素材文档的生成提供了准确地风格标签。

S30，将所述素材需求结果和所述风格识别结果记录为最终需求结果。

可理解地，将所述需求检验结果和所述风格识别结果构成一维数组，将该一维数组记录为所述最终需求结果，所述最终需求结果体现了所述素材工单所要求的需求。

S40，基于分发规则，将所述最终需求结果分发至与所述最终需求结果匹配的素材设计者所对应的任务队列中。

可理解地，所述分发规则为根据各素材设计者所对应的各项素材因素的历史评分的综合评分值进行分发的规则，所述分发规则通过一个评分模型进行构建，所述评分模型包含了各个所述素材设计者在各项素材因素的历史评分的平均值，而且对各个所述素材设计者的各项素材因素的历史评分进行聚类，运用聚类方法进行聚类处理，分类及标识出各个素材设计者的画像标签，通过所述评分模型将所述最终需求结果与各所述素材设计者的各项素材因素的平均值进行匹配，以及将所述最终需求结果与各所述素材设计者所对应的画像标签进行匹配，综合两者的匹配结果，确定出所述最终需求结果中的各项素材因素的匹配度，例如：获取与所述最终需求结果中的各项一致的素材因素所对应的平均值，并将各获取的平均值进行加权重，例如每一项素材因素的权重为所有素材因素的总数分之一，以及增加与所述画像标签所对应出的素材因素的权重，例如在原权重的基础上增加2倍的增加权重方法进行处理，一个所述画像标签包含多种素材设计者擅长的素材因素，最后，将增加权重后的各项素材因素所对应的平均值进行相加，计算出每个所述素材设计者与所述最终需求结果的匹配度，获取最大匹配度所对应的所述素材设计者，将其记录为与所述最终需求结果匹配的素材设计者，并将所述最终需求结果分发至该素材设计者所对应的所述任务队列。

其中，所述素材设计者为设计素材的工作人员，所述任务队列为所述素材设计者的任务清单的集合，所述运用聚类方法进行分类为将所述素材设计者所对应的各项素材因素的历史评分大于预设评分值的历史评分作为数据集，从数据集中进行描点，根据描点的聚集程度，将该素材设计者确定为相应的画像标签的类别，一个画像标签的类别映射多个擅长的素材因素，说明该画像标签的类别的素材设计者擅长映射的素材因素，所述预设评分值可以根据需求设定，比如7分。

S50，接收所述任务队列返回的素材文档；所述素材文档为所述素材设计者根据所述最终需求结果创建的文档。

可理解地，所述素材文档为所述素材设计者根据所述最终需求结果创建的文档，即为所述素材设计者根据所述最终需求结果创作出的素材，所述素材文档按照所述任务队列的序号返回，跟所述任务队列的序号与所述素材文档关联。

S60，对所述素材文档进行与所述素材工单对应的传送格式的转换处理，将转换处理后的素材文档推送至与所述素材工单对应的需求方。

可理解地，所述转换处理为按照不同的素材工单所对应的需求方关联的传送格式进行相应尺寸转换及加密的处理过程，所述尺寸转换为将素材文档的图像或/视频的尺寸调整成相应需求方所关联的传送格式的尺寸大小的转换过程，所述尺寸转换为运用图像尺寸调整技术，将每帧图像进行等比例放大或者缩小的方式达到传送格式的尺寸大小的要求，所述加密的算法可以根据需求方的要求进行选择，比如加密算法为对称加密算法或者非对称加密算法等等，将转换处理后的素材文档推送至与所述素材工单对应的需求方所对应的终端，展示所述素材工单返回的广告投放相关的素材文档。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

在一实施例中，提供一种素材工单数据处理装置，该素材工单数据处理装置与上述实施例中素材工单数据处理方法一一对应。如图4所示，该素材工单数据处理装置包括获取模块11、识别模块12、记录模块13、分发模块14、接收模块15和转换模块16。各功能模块详细说明如下：

获取模块11，用于获取与素材工单对应的需求文件和参考素材；

识别模块12，用于对所述需求文件进行文本识别及需求提取，得到素材需求结果，以及对所述参考素材进行素材风格识别，得到风格识别结果；

记录模块13，用于将所述素材需求结果和所述风格识别结果记录为最终需求结果；

分发模块14，用于基于分发规则，将所述最终需求结果分发至与所述最终需求结果匹配的素材设计者所对应的任务队列中；

接收模块15，用于接收所述任务队列返回的素材文档；所述素材文档为所述素材设计者根据所述最终需求结果创建的文档；

转换模块16，用于对所述素材文档进行与所述素材工单对应的传送格式的转换处理，将转换处理后的素材文档推送至与所述素材工单对应的需求方。

在一实施例中，如图5所示，所述识别模块12包括：

预处理单元21，用于对所述参考素材进行图像预处理，得到预处理图像；

提取单元22，用于对所述预处理图像进行风格特征提取，得到特征图；

识别单元23，用于对所述特征图进行多任务的素材风格识别，识别出所述风格识别结果。

关于素材工单数据处理装置的具体限定可以参见上文中对于素材工单数据处理方法的限定，在此不再赘述。上述素材工单数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是客户端或者服务端，其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括可读存储介质、内存储器。该可读存储介质存储有操作系统、计算机程序和数据库。该内存储器为可读存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种素材工单数据处理方法。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述实施例中素材工单数据处理方法。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述实施例中素材工单数据处理方法。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.一种素材工单数据处理方法，其特征在于，包括：

获取与素材工单对应的需求文件和参考素材；

2.如权利要求1所述的素材工单数据处理方法，其特征在于，所述对所述需求文件进行文本识别及需求提取，得到素材需求结果，包括：

对所述需求文件进行文本转换，得到需求文本；

对所述需求文本进行素材需求识别，得到需求识别结果，以及对所述需求文本进行素材策略识别，得到策略识别结果；

根据所述策略识别结果，对所述需求识别结果进行校验，得到素材需求结果。

3.如权利要求2所述的素材工单数据处理方法，其特征在于，所述对所述需求文件进行文本转换，得到需求文本，包括：

对所述需求文件进行文件格式识别，识别出所述需求文件的文件格式；

4.如权利要求3所述的素材工单数据处理方法，其特征在于，所述对所述需求文件进行与所述文件格式相应的文本转换，得到所述需求文本，包括：

在检测到所述文件格式为音频格式时，运用语音识别技术，对所述需求文件进行语音文本转换，得到所述需求文本；

在检测到所述文件格式为视频格式时，运用音频提取技术和语音识别技术，对所述需求文件进行视频转换，得到所述需求文本；

5.如权利要求2所述的素材工单数据处理方法，其特征在于，所述对所述需求文本进行素材需求识别，得到需求识别结果，包括：

对所述需求文本进行素材因素提取，得到素材因素结果；

6.如权利要求1所述的素材工单数据处理方法，其特征在于，所述对所述参考素材进行素材风格识别，得到风格识别结果，包括：

对所述参考素材进行图像预处理，得到预处理图像；

对所述预处理图像进行风格特征提取，得到特征图；

7.一种素材工单数据处理装置，其特征在于，包括：

8.如权利要求7所述的素材工单数据处理装置，其特征在于，所述识别模块包括：

预处理单元，用于对所述参考素材进行图像预处理，得到预处理图像；

提取单元，用于对所述预处理图像进行风格特征提取，得到特征图；

识别单元，用于对所述特征图进行多任务的素材风格识别，识别出所述风格识别结果。

9.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述素材工单数据处理方法。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述素材工单数据处理方法。